Grin logo
de en es fr
Shop
GRIN Website
Texte veröffentlichen, Rundum-Service genießen
Zur Shop-Startseite › Informatik - Internet, neue Technologien

Auswertung zeitlicher und räumlicher Aspekte der Informationsausbreitung in der Blogosphäre

Titel: Auswertung zeitlicher und räumlicher Aspekte der Informationsausbreitung in der Blogosphäre

Diplomarbeit , 2008 , 100 Seiten , Note: 1,0

Autor:in: Oliver Gepp (Autor:in)

Informatik - Internet, neue Technologien
Leseprobe & Details   Blick ins Buch
Zusammenfassung Leseprobe Details

Derzeit existierende Suchmöglichkeiten innerhalb der Blogosphäre schöpfen das für Anfragen zur Ver-
fügung stehende Potential nicht aus. Durch diese Arbeit sollen die Grundlagen für weiterführende Un-
tersuchungen und Systeme erforscht werden, mit denen durch ein besseres Verständnis des Zusammen-
wirkens innerhalb der Blogosphäre sehr tiefgreifende Analysen ermöglicht werden. Hierzu werden zu-
nächst Möglichkeiten analysiert, wie zeitliche und räumliche Aspekte der Informationsausbreitung in
der Blogosphäre automatisiert gewonnen und ausgewertet werden können. Im Anschluss daran werden
mit Verfahren der Analyse Sozialer Netzwerke Untergruppen in der Blogosphäre detektiert, um daraus
hochqualitative Aussagen ableiten zu können. Durch die Implementierung einer auf der Ausarbeitung
basierenden Anwendung wurde die Funktionsfähigkeit überprüft und eine besonders hohe Aktivität der
Blogosphäre innerhalb der Arbeitszeit anWerktagen festgestellt. Zudem konnte durch die Anzahl gefun-
dener Kommentare registriert werden, dass es sich bei der Blogosphäre um ein Kommunikationsmedium
handelt, in dem innerhalb weniger Stunden und Tage reagiert wird. Etwa zwei fünftel aller ausgewer-
teten Blogs enthielt verwertbare Ortsangaben, wodurch regional differenzierbare Aussagen ermöglicht
werden. Durch das Erkennen der verwendeten Sprache von Blogs wurde festgestellt, dass innerhalb von
Untergruppen überwiegend eine gemeinsam verwendete Sprache gebraucht wird - die einzelnen Mit-
glieder jedoch in 43% der Fälle aus unterschiedlichen Ländern stammen. Mit der Übersetzung und Aus-
wertung der von den Blog-Autoren vergebenen Kategorie-Bezeichnern lassen sich Blogs und gefundene
Untergruppen performanzschonend klassifizieren und somit die durch statistische Analysen gewonnen
Daten weiter anreichern.

Leseprobe


Inhaltsverzeichnis

1 Einleitung

1.1 Motivation

1.2 Erläuterung des Problemfeldes

1.3 Ziel und Aufbau der Arbeit

2 Grundlagen und Stand der Forschung

2.1 Bestandteile der Blogosphäre

2.2 Analyse sozialer Netzwerke

2.3 Verwandte Arbeiten

3 Vorüberlegung

3.1 Möglichkeiten der Auswertung von Blogs

3.1.1 Zeitliche Aspekte

3.1.2 Räumliche Aspekte

3.1.3 Community-Extraktion

3.2 Einbindung zusätzlicher Informationsquellen

3.3 Zusammenfassung

4 Umsetzung

4.1 Übersicht

4.2 Web-Crawler

4.3 Datenhaltung

4.4 Auswertungskomponente

4.5 Präsentationskomponente

4.6 Vorstellung des implementierten Systems

4.7 Funktionsweise zentraler Algorithmen

4.8 Zusammenfassung

5 Validierung und Verbesserungsansätze

6 Auswertung gewonnener Informationen

6.1 Einleitung

6.2 Zeitliche Aspekte

6.3 Räumliche Aspekte

6.4 Allgemeine Aspekte

6.5 Zusammenfassung

7 Zusammenfassung und Ausblick

7.1 Zusammenfassung

7.2 Ausblick

Zielsetzung & Themen

Die Arbeit verfolgt das Ziel, Möglichkeiten zur automatisierten Auswertung zeitlicher und räumlicher Aspekte der Informationsausbreitung in der Blogosphäre zu untersuchen, um tiefergehende Analysen als bei aktuellen Suchmaschinen zu ermöglichen und die Qualität von Weblogs sowie deren Communities zu bewerten.

  • Automatisierte Erhebung von Daten zur zeitlichen und räumlichen Ausbreitung von Informationen in Weblogs.
  • Entwicklung und Implementierung eines Web-Crawlers zur effizienten Datengewinnung.
  • Analyse von Communities mittels Verfahren der Analyse sozialer Netzwerke.
  • Klassifizierung von Blogs und Untergruppen durch die Auswertung von Kategorie-Bezeichnern und Sprachinformationen.

Auszug aus dem Buch

1.1 Motivation

Durch Werbebanner auf seinem Blog http://www.basicthinking.de erwirtschaftet Robert Basic, als einer der bekanntesten deutschen Blogger, mit circa 3.500€ pro Monat mittlerweile seinen Lebensunterhalt. Unlängst wurde ihm jedoch ein weiterer Vorteil durch die Einladung eines Automobilherstellers bewusst, die er umgehend auf seinem Blog veröffentlichte:

“Dear Robert, To present Alfa Romeo’s new small sports car, the MiTo we’ve decided to invite a team of international bloggers who are outstanding figures for their intelligent and innovative use of social media. We’re particularly impressed with the excellent work you’re doing, and the success of Basic Thinking. So we’d be extremely pleased if you would like to take part in the presentation of the MiTo. It will take place in Varano, Italy on July 9th and 10th, 2008; your visit would of course be at our expense, including your travel arrangements.[...]”

Anhand dieses Beispiels werden verschiedene Aspekte deutlich: Für viele Blogger strahlt es eine hohe Attraktivität aus, als Journalisten wahrgenommen zu werden und entsprechende Privilegien, wie die exklusive Einladung zu Produktpräsentationen auf fremde Kosten zu erfahren. Auf der anderen Seite werden sie dafür zugleich von anderen Bloggern kritisiert, dadurch ihre Unabhängigkeit zu verlieren und käuflich zu werden. Diese Unabhängigkeit wurde lange Zeit als zentrales Charakteristikum der Blogosphäre gesehen. Aber auch die Werbewirtschaft erkennt die Blogosphäre mittlerweile als Plattform für virales Marketing und spricht gezielt die Autoren von populären Blogs an, um diese von ihren Produkten zu überzeugen und somit die als überwiegend glaubwürdig eingestufte Berichterstattung auf Blogs anzustoßen.

Zusammenfassung der Kapitel

1 Einleitung: Beschreibt die Motivation hinter der Analyse der Blogosphäre, beleuchtet das Problemfeld unzureichender Suchmöglichkeiten und definiert das Ziel sowie den Aufbau der Arbeit.

2 Grundlagen und Stand der Forschung: Definiert zentrale Begriffe wie Blog und Blogosphäre, erläutert Konzepte der sozialen Netzwerkanalyse und diskutiert verwandte Arbeiten.

3 Vorüberlegung: Analysiert verschiedene Schichten der Datenhaltung in Blogs und evaluiert Methoden zur Gewinnung von zeitlichen und räumlichen Informationen sowie zur Community-Extraktion.

4 Umsetzung: Stellt das modulare Konzept der entwickelten Anwendung vor, einschließlich der Module für Web-Crawling, Datenhaltung, Auswertung und Präsentation, sowie deren technische Implementierung in C#.

5 Validierung und Verbesserungsansätze: Reflektiert kritisch über die Leistungsfähigkeit des Systems, beleuchtet Problemfelder bei der Datenextraktion und schlägt Optimierungen vor.

6 Auswertung gewonnener Informationen: Präsentiert die empirischen Ergebnisse der Analyse bezüglich zeitlicher Aktivitätsmuster, räumlicher Verteilung und der Struktur von Communities.

7 Zusammenfassung und Ausblick: Fasst die erbrachten Ergebnisse der Arbeit zusammen und gibt einen Ausblick auf mögliche weiterführende Forschungsarbeiten und kommerzielle Anwendungen.

Schlüsselwörter

Blogosphäre, Web-Crawler, soziale Netzwerkanalyse, Community-Extraktion, Informationsextraktion, RSS-Feeds, Atom-Feeds, zeitliche Aspekte, räumliche Aspekte, n-Clans, Topic-Comment-Ratio, Web 2.0, Datenbankschema, Blog-Analyse, Netzwerkgraph.

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Diplomarbeit befasst sich mit der automatisierten Auswertung der Blogosphäre, insbesondere unter Berücksichtigung von zeitlichen und räumlichen Aspekten sowie der Identifikation von sozialen Strukturen.

Was sind die zentralen Themenfelder?

Zentrale Themen sind das Web-Crawling zur Datengewinnung, die Analyse sozialer Netzwerke innerhalb der Blogosphäre, die Verarbeitung von semi-strukturierten Daten (Feeds) und die räumlich-zeitliche Verortung von Bloggern.

Was ist das primäre Ziel der Arbeit?

Das primäre Ziel ist es, Grundlagen zu schaffen, um durch ein besseres Verständnis des Zusammenwirkens in der Blogosphäre tiefgreifende Analysen zu ermöglichen und Möglichkeiten zur automatisierten Auswertung zu implementieren.

Welche wissenschaftliche Methode wird verwendet?

Es werden Methoden aus der sozialen Netzwerkanalyse (z.B. Graphentheorie, n-Clans, Dyaden) mit Information-Retrieval-Verfahren und statistischen Analysen von XML-basierten Feeds kombiniert.

Was wird im Hauptteil behandelt?

Der Hauptteil umfasst die theoretische Fundierung, die Vorüberlegungen zur Datenextraktion, die detaillierte Beschreibung der Software-Implementierung (Crawler, Datenbank, Auswertung) sowie die Präsentation und Validierung der gewonnenen Daten.

Welche Schlüsselwörter charakterisieren die Arbeit?

Schlüsselwörter sind Blogosphäre, Web-Crawler, soziale Netzwerkanalyse, Community-Extraktion, n-Clans und räumlich-zeitliche Analyse.

Wie werden Communities innerhalb der Blogosphäre identifiziert?

Communities werden durch die Analyse struktureller Informationen und die gegenseitige Kenntnis der Akteure (Dyaden) identifiziert, wobei n-Clans genutzt werden, um stark zusammenhängende Untergruppen zu detektieren.

Welchen Einfluss hat das Blog-Hosting-System auf die Datengewinnung?

Das Hosting-System beeinflusst die Wahl der Methode (z.B. Nutzung der Google Data API bei Blogspot vs. Feed-Analyse bei anderen Systemen), da die technische Struktur der Blogs und deren Feed-Publikation variieren.

Ende der Leseprobe aus 100 Seiten  - nach oben

Details

Titel
Auswertung zeitlicher und räumlicher Aspekte der Informationsausbreitung in der Blogosphäre
Hochschule
Technische Universität Dresden  (Institut für Systemarchitektur)
Note
1,0
Autor
Oliver Gepp (Autor:in)
Erscheinungsjahr
2008
Seiten
100
Katalognummer
V188911
ISBN (eBook)
9783656127512
ISBN (Buch)
9783656128564
Sprache
Deutsch
Schlagworte
auswertung aspekte informationsausbreitung blogosphäre
Produktsicherheit
GRIN Publishing GmbH
Arbeit zitieren
Oliver Gepp (Autor:in), 2008, Auswertung zeitlicher und räumlicher Aspekte der Informationsausbreitung in der Blogosphäre, München, GRIN Verlag, https://www.grin.com/document/188911
Blick ins Buch
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
Leseprobe aus  100  Seiten
Grin logo
  • Grin.com
  • Versand
  • Kontakt
  • Datenschutz
  • AGB
  • Impressum