Derzeit existierende Suchmöglichkeiten innerhalb der Blogosphäre schöpfen das für Anfragen zur Ver-
fügung stehende Potential nicht aus. Durch diese Arbeit sollen die Grundlagen für weiterführende Un-
tersuchungen und Systeme erforscht werden, mit denen durch ein besseres Verständnis des Zusammen-
wirkens innerhalb der Blogosphäre sehr tiefgreifende Analysen ermöglicht werden. Hierzu werden zu-
nächst Möglichkeiten analysiert, wie zeitliche und räumliche Aspekte der Informationsausbreitung in
der Blogosphäre automatisiert gewonnen und ausgewertet werden können. Im Anschluss daran werden
mit Verfahren der Analyse Sozialer Netzwerke Untergruppen in der Blogosphäre detektiert, um daraus
hochqualitative Aussagen ableiten zu können. Durch die Implementierung einer auf der Ausarbeitung
basierenden Anwendung wurde die Funktionsfähigkeit überprüft und eine besonders hohe Aktivität der
Blogosphäre innerhalb der Arbeitszeit anWerktagen festgestellt. Zudem konnte durch die Anzahl gefun-
dener Kommentare registriert werden, dass es sich bei der Blogosphäre um ein Kommunikationsmedium
handelt, in dem innerhalb weniger Stunden und Tage reagiert wird. Etwa zwei fünftel aller ausgewer-
teten Blogs enthielt verwertbare Ortsangaben, wodurch regional differenzierbare Aussagen ermöglicht
werden. Durch das Erkennen der verwendeten Sprache von Blogs wurde festgestellt, dass innerhalb von
Untergruppen überwiegend eine gemeinsam verwendete Sprache gebraucht wird - die einzelnen Mit-
glieder jedoch in 43% der Fälle aus unterschiedlichen Ländern stammen. Mit der Übersetzung und Aus-
wertung der von den Blog-Autoren vergebenen Kategorie-Bezeichnern lassen sich Blogs und gefundene
Untergruppen performanzschonend klassifizieren und somit die durch statistische Analysen gewonnen
Daten weiter anreichern.
Inhaltsverzeichnis
- 1 Einleitung
- 1.1 Motivation
- 1.2 Erläuterung des Problemfeldes
- 1.3 Ziel und Aufbau der Arbeit
- 2 Grundlagen und Stand der Forschung
- 2.1 Bestandteile der Blogosphäre
- 2.2 Analyse sozialer Netzwerke
- 2.3 Verwandte Arbeiten
- 3 Vorüberlegung
- 3.1 Möglichkeiten der Auswertung von Blogs
- 3.1.1 Zeitliche Aspekte
- 3.1.2 Räumliche Aspekte
- 3.1.3 Community-Extraktion
- 3.2 Einbindung zusätzlicher Informationsquellen
- 3.3 Zusammenfassung
- 3.1 Möglichkeiten der Auswertung von Blogs
- 4 Umsetzung
- 4.1 Übersicht
- 4.2 Web-Crawler
- 4.3 Datenhaltung
- 4.4 Auswertungskomponente
- 4.5 Präsentationskomponente
- 4.6 Vorstellung des implementierten Systems
- 4.7 Funktionsweise zentraler Algorithmen
- 4.8 Zusammenfassung
- 5 Validierung und Verbesserungsansätze
- 6 Auswertung gewonnener Informationen
- 6.1 Einleitung
- 6.2 Zeitliche Aspekte
- 6.3 Räumliche Aspekte
- 6.4 Allgemeine Aspekte
- 6.5 Zusammenfassung
- 7 Zusammenfassung und Ausblick
- 7.1 Zusammenfassung
- 7.2 Ausblick
Zielsetzung und Themenschwerpunkte
Die vorliegende Diplomarbeit untersucht die zeitlichen und räumlichen Aspekte der Informationsausbreitung in der Blogosphäre. Ziel ist es, ein tieferes Verständnis für die Dynamik und Struktur der Blogosphäre zu entwickeln und auf dieser Grundlage innovative Methoden zur Analyse von Blog-Daten zu erforschen.
- Automatisierung der Datengewinnung aus Blogs
- Identifizierung räumlicher und zeitlicher Muster der Informationsausbreitung
- Analyse von Community-Strukturen in der Blogosphäre
- Entwicklung eines Webcrawlers zur Datenerhebung und -verarbeitung
- Bewertung der gewonnenen Erkenntnisse und Ableitung von Schlussfolgerungen
Zusammenfassung der Kapitel
Die Einleitung führt in das Thema der Informationsausbreitung in der Blogosphäre ein, erläutert die Motivation der Arbeit und stellt das Ziel und den Aufbau der Arbeit vor. Kapitel 2 beleuchtet die relevanten Grundlagen und den Stand der Forschung, insbesondere die Bestandteile der Blogosphäre, die Analyse sozialer Netzwerke und verwandte Arbeiten. Kapitel 3 beschäftigt sich mit den Möglichkeiten der Auswertung von Blogs, wobei sowohl zeitliche als auch räumliche Aspekte sowie die Extraktion von Community-Strukturen im Fokus stehen. Zusätzlich wird die Einbindung zusätzlicher Informationsquellen diskutiert. Kapitel 4 präsentiert die Umsetzung eines Webcrawlers zur automatisierten Datengewinnung, die Datenhaltung und die Auswertungskomponente. Die Funktionsweise des implementierten Systems und der zentralen Algorithmen wird im Detail beschrieben. Kapitel 5 befasst sich mit der Validierung der Ergebnisse und möglichen Verbesserungsansätzen. Das Kapitel 6 analysiert die gewonnenen Daten hinsichtlich zeitlicher, räumlicher und allgemeiner Aspekte und fasst die Ergebnisse zusammen. Schließlich bietet Kapitel 7 eine Zusammenfassung der Arbeit und einen Ausblick auf zukünftige Forschungsrichtungen.
Schlüsselwörter
Blogosphäre, Informationsausbreitung, zeitliche Aspekte, räumliche Aspekte, Community-Extraktion, Webcrawler, Datengewinnung, Datenanalyse, soziale Netzwerke, Informationsverbreitung, Online-Kommunikation.
- Quote paper
- Oliver Gepp (Author), 2008, Auswertung zeitlicher und räumlicher Aspekte der Informationsausbreitung in der Blogosphäre, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/188911