"Data is the new oil". So lautet der Titel eines Blog-Eintrags des Werbefachmanns Michael Palmer, den er im November 2006 geschrieben hat. Im Bild dieser Metapher behauptet Palmer, dass unbearbeitete Daten wertlos seien. Erst nachdem man sie bearbeitet habe, entstünden aus ihnen nützliche Produkte, so wie aus Öl Benzin oder Kunststoff hergestellt wird.
Mit der Aufdeckung des Spesenskandals im Mai 2009 sorgte der britische "Guardian" für Aufsehen: Die Zeitung stellte 458.832 Seiten Spesenabrechnungen von Parlamentsabgeordneten auf ihre Internetseite und bat um die Hilfe ihrer Leser. Per Zufallsgenerator konnte man sich eine Abrechnung anzeigen lassen, um sie im Anschluss zu bewerten. Fand der Leser Ungereimtheiten oder war er der Meinung, eine solche gefunden zu haben, konnte er die Abrechnung per Klick auf den "Investigate this!"-Button zur Prüfung der Redaktion des Guardian vorlegen. Das Ergebnis der Kooperation: Die Resonanz war beeindruckend und die Journalisten fanden – dank der Hinweise der Leser – zahlreiche überhöhte Spesenabrechnungen. Mehrere Abgeordnete und Minister traten daraufhin zurück; der Abgeordnete David Chaytor wurde im Januar 2011 von einem Londoner Gericht zu einer Haftstrafe von 18 Monaten verurteilt.
Mit dem Spesenskandal wurde erstmals deutlich, wie Daten den Journalismus verändern können. Dank der globalen Vernetzung sowie der zunehmenden Menge an numerischen Daten in Produktion und Verarbeitung von Informationen und Technologien wie GPS und mobilem Internet, rücken Daten immer mehr in den Fokus.
So ist es auch im Fall des Datenartikels "Verräterisches Handy", der aus der Zusammenarbeit von "Zeit Online" und "OpenDataCity" entstand und 2011 mit dem „Grimme Online Award“ ausgezeichnet wurde.
Für das Projekt hat Politiker Malte Spitz bei der Deutschen Telekom sechs Monate seiner Vorratsdaten eingeklagt und sie Zeit Online zur Verfügung gestellt. Auf Basis dieser Daten entstand eine interaktive Karte, auf der man alle Aufenthaltsorte, Telefonate und SMS von Malte Spitz einsehen kann.
Wie man anhand der zwei Beispiele sehen kann, sind Daten bereits dabei, den Journalismus zu verändern. Der Guardian hat sogar eine eigene Rubrik in seinem Onlineauftritt eingerichtet, den Datablog samt Datastore.
Dank des wachsenden Aufkommens an Daten dürfte das allerdings erst der Anfang sein. Daten rücken zunehmend in den Fokus und werden ein zentraler Gegenstand der journalistischen Geschichte.
Inhaltsverzeichnis
Abbildungsverzeichnis
Abkurzungsverzeichnis
1 Einleitung
1.1 Thema
1.2 Forschungsfrage und Zielsetzung
1.3 Stand der Forschung
1.4 Begriffserklarungen
2 Theorie
2.1 Aktueller Einsatz von Daten im Journalismus
2.1.1 Datenjournalismus in Online-Medien
2.1.2 Datenjournalismus in Printmedien
2.1.3 Datenjournalismus im Fernsehen
2.2 Aus Datenartikel wird Datenanwendungen
2.3 Daten-Quellen und -verarbeitung
2.3.1 Datenbeschaffung (Offene Daten und Datascraping)
2.3.2 Datenfilterung
2.3.3 Datenvisualisierung
2.3.4 Storytelling
2.3.5 Crowdsourcing
3 Empirische Untersuchung
3.1 Methodik
3.2 Methodenkritik
3.3 Grenzen der angewandten Methode
3.4 Planung und Auswahl der Experten
3.5 Methodische Ausnahme
3.6 Der Interviewleitfaden
4 Auswertung und Erkenntnisse der Interviews
4.1 Wie Daten die journalistische Berichterstattung verandern werden
4.2 Perspektiven
4.2.1 Funktioniert Datenjournalismus nur online?
4.2.2 Open Data braucht noch Zeit
4.2.3 Redaktionsarchive sind mit Daten gefullt
4.3 Moglichkeiten
4.4 Wasist zu tun?
5 Zusammenfassung
5.1 Ergebnisse und Fazit
5.2 Ausblick: Roboterjournalismus, APIs und Mediennutzungszeit
6 Literatur- und Quellenverzeichnis
Anhang
Abbildungsverzeichnis
Abbildung 1: Verraterisches Handy
Abbildung 2: Polar-Area-Diagram: Causes of Motality
Abbildung 3: How Much Data Will Humans Create & Store This Year?
Abbildung 4: Zugmonitor: So punktlich ist die Bahn
Abbildung 5: Less wind, lots of damage
Abbildung 6: Major team's performance compare to Beijing 2008?
Abbildung 7: Bundeshaushalt 2011 visualisiert mit Hilfe offener Daten
Abbildung 8: Drei Visualisierung (Schemaball, Balkendiagramm, Weltkarte)
Abbildung 9: Der Prozess des Datenjournalismus
Abkurzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
1 Einleitung
„Data is the new oil".[1] So lautet der Titel eines Blog-Eintrags des Werbefachmanns Michael Palmer, den er im November 2006 geschrieben hat. Im Bild dieser Metapher be- hauptet Palmer, dass unbearbeitete Daten wertlos seien. Erst nachdem man sie bear- beitet habe, entstunden aus ihnen nutzliche Produkte, so wie aus Ol Benzin oder Kunststoff hergestellt wird.[2]
1.1 Thema
Mit der Aufdeckung des Spesenskandals im Mai 2009 sorgte der britische „Guardian"[3] fur Aufsehen: Die Zeitung stellte 458.832 Seiten Spesenabrechnungen von Parlaments- abgeordneten auf ihre Internetseite[4] und bat um die Hilfe ihrer Leser. Per Zufallsgene- rator konnte man sich eine Abrechnung anzeigen lassen, um sie im Anschluss zu bewer- ten. Fand der Leser Ungereimtheiten oder war er der Meinung, eine solche gefunden zu haben, konnte er die Abrechnung per Klick auf den „Investigate this!"-Button zur Prufung der Redaktion des Guardian vorlegen. Das Ergebnis der Kooperation: Die Reso- nanz war beeindruckend und die Journalisten fanden - dank der Hinweise der Leser - zahlreiche uberhohte Spesenabrechnungen. Mehrere Abgeordnete und Minister traten daraufhin zuruck; der Abgeordnete David Chaytor wurde im Januar 2011 von einem Londoner Gericht zu einer Haftstrafe von 18 Monaten verurteilt.[5]
Mit dem Spesenskandal wurde erstmals deutlich, wie Daten den Journalismus veran- dern konnen. Dank der globalen Vernetzung sowie der zunehmenden Menge an nume- rischen Daten in Produktion undVerarbeitung von Informationen und Technologien wie GPS und mobilem Internet, rucken Daten immer mehr in den Fokus.
So ist es auch im Fall des Datenartikels „Verraterisches Handy"[6] (siehe Abb. 1), der aus der Zusammenarbeit von „Zeit Online" und „OpenDataCity" entstand und 2011 mit dem „Grimme Online Award"[7] ausgezeichnet wurde.
Fur das Projekt hat Politiker Malte Spitz bei der Deutschen Telekom sechs Monate seiner Vorratsdaten eingeklagt und sie Zeit Online zur Verfugung gestellt. Auf Basis dieser Daten entstand eine interaktive Karte, auf der man alle Aufenthaltsorte, Telefonate und SMS von Malte Spitz einsehen kann. Neben dem umfangreichen Tabellen-Dokument[8], das uber 35.000 Zeilen enthalt und das Zeit Online zum kostenlosen Download fur seine Rezipienten bereithalt, wurde die Visualisierung mit frei im Internet verfugbaren Informationen wie Tweets und Blogbeitragen des Politikers angereichert.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Auf Basis von Vorratsdaten erstellte Zeit Online die interaktive Anwendung ,,Verraterisches Handy". Quelle: Zeit Online, Verraterisches Handy.
Die Visualisierung verdeutlicht, wie sich mit Hilfe von Vorratsdatenspeicherung ein indi- viduelles Profil anlegen lasst und zeigt die negativen Folgen des 2007 verabschiedeten Gesetzes zurVorratsdatenspeicherung, durch das „Telefon- und Internetverbindungsda- ten [...] ein halbes Jahr lang gespeichert"[9] werden durfen.
Erganzt wurde die Berichterstattung mit dem Artikel von Kai Biermann „Was Vorratsda- ten uber uns verraten" [10] . In dem Artikel wurden derthematische Hintergrund und die Erkenntnisse aus der Datenvisualisierung erlautert und aufweitere Moglichkeiten der Oberwachung durch die Verwendung gespeicherter SMS- und Telefondaten eingegan- gen, da diese Daten zum Schutz der Privatsphare von Malte Spitz nicht mit in das Pro- jekt eingebunden wurden.
Durch die Visualisierung und die Verknupfung klassischer und datengestuzter Berichterstattung machte Zeit Online die Brisanz der Vorratsdatenspeicherung deutlich starker sichtbar, als das durch eine Berichterstattung allein auf Textbasis moglich gewesen ware.
Immer ofter entstehen solche mit Daten angereicherten journalistischen Geschichten, die von einigen auch Datenartikel genannt werden. Im Mittelpunkt der Recherche und Verarbeitung der Informationen stehen aber nicht Presseagenturen oder Augenzeugen, sondern Datenbanken, Tabellen und Quellcodes. Die Aufgabe des Journalisten besteht darin, Daten zu besorgen, sie zu filtern und zu visualisieren, um sie anschlieRend in eine Story zu verpacken. Zudem wird immer wieder die Transparenz im Hinblick auf die Herkunft der Daten diskutiert und ob man die in einem Datenartikel verwendeten Daten dem Rezipienten in Rohform anbieten soll.
Wie man anhand der zwei Beispiele sehen kann, sind Daten bereits dabei, den Journa- lismus zu verandern. Der Guardian hat sogar eine eigene Rubrik in seinem Onlineauf- tritt eingerichtet, den Datablog samt Datastore.
Dank des wachsenden Aufkommens an Daten durfte das allerdings erst der Anfang sein. Daten rucken zunehmend in den Fokus und werden ein zentraler Gegenstand der journalistischen Geschichte.
1.2 Forschungsfrage und Zielsetzung
Die vorliegende Bachelor-Thesis soll die Frage beantworten, wie Daten die journalisti- sche Berichterstattung verandern werden. Einleitend soll geklart werden, welchen Ein- fluss Daten bereits jetzt schon auf den Journalismus haben. Des Weiteren wird unter- sucht, welche Perspektiven der Datenjournalismus bietet und wie weitreichend seine Moglichkeiten sind.
Die Fragen, wann und wie der Datenjournalismus entstanden ist und ob oder welchen Zuspruch er bei den Rezipienten findet, konnen in der vorliegenden Thesis nicht behan- delt werden, da dies uber den Rahmen einer Bachelorarbeit hinausgehen wurde.
Ebenfallswird es nicht moglich sein, den Datenjournalismus und dessenjournalisti- sches Potenzial als Gesamtheit darzustellen. Die Tiefe der Betrachtung beschrankt sich eher aufallgemeine Erlauterungen und versucht, trotz des hohen Aufkommens an technischen Aspekten, abstrakte Details unerwahnt zu lassen.
Daruber hinaus kann auch dergesamtheitliche Aufgabenbereich eines Datenjournalis- ten nicht dargestellt werden. Dieses Thema eignet sich fur eine gesonderte Untersu- chung im Rahmen einer eigenstandigen Arbeit.
1.3 Stand der Forschung
Wahrend einflussreiche US-amerikanische und britische Medien bereits seit einigen Jahren Datenkompetenz durch die Realisierung komplexer und umfangreicher Projekte aufbauen; in Verbindung damit ein eigenes Berufsfeld geschaffen haben und Daten- journalisten fest in Redaktionen einbetten, spielt Datenjournalismus in deutschen Leit- medien bishereine untergeordnete Rolle.
Zur Bearbeitung des Themas standen aber nicht nur englischsprachige Quellen zur Ver- fugung, die sich mit Datenjournalismus auseinandersetzen. Auch in Deutschland ge- winnt das Thema zunehmend an Interesse, wodurch auch Einzelpublikationen oder Pu- blikationen in Fachmagazinen als Quelle zur Verfugung standen. Literatur hingegen, die sich mit den Moglichkeiten des datengetriebenen Journalismus beschaftigt, war zum Zeitpunkt der Entstehung dieser Arbeit nicht verfugbar.
Lediglich zum Bereich der Datenvisualisierungen stand einige Literatur aus dem Infor- mationsdesign zurVerfugung. Diese istjedoch nurteilweise zu gebrauchen, da sie auf- grund zum Teil umfangreicher und komplexer Datensatze und den damit verbundenen Anforderungen dem Datenjournalismus kaum gerechtwird.
1.4 Begriffserklarungen
Leser/Nutzer/Rezipient
Werden als Synonym fur alle Personen verwendet, die mediale Inhalte konsumieren.
Crowdsourcing
Als „Crowdsourcing" wird die Auslagerung gewisser redaktioneller Aufgaben an freiwil- lige Arbeitskrafte in Form von einerVielzahl von Internetnutzern bezeichnet.
Storytelling
Mit „Storytelling" ist das „Geschichten erzahlen" gemeint; es steht im Datenjournalis- mus fur die Methode der Wissensvermittlung.
Daten
Sind Ansammlungen von Zeichen, die einen Informationsgehalt haben und elektronisch verarbeitet werden konnen.
Datensatz
Ist eine Ansammlung strukturierter Daten mit mindestens einem Datenfeld (Zelle).
Datenbank
Ist eine Ansammlung von Datensatzen.
Scraping/scrapen
Beschreibt das Verfahren zum Auslesen von Texten und Daten von Webseiten.
Tools
Als „Tools" werden Werkzeuge im Sinne von Anwendungssoftware respektive Apps bezeichnet, mit denen Visualisierungen und Grafiken generiert werden.
Data-Mining
Automatische Auswertung grower Datenmengen zur Bestimmung bestimmter Regel- maRigkeiten, Muster und verborgener Zusammenhange.
Hyperlokal
Hyperlokalitat steht fur Lokaljournalismus in einem geographisch eng begrenzten Raum.
API
Die Programmierschnittstelle (Application Programming Interface kurz: API) ist ein Pro- grammteil, der von einem Softwaresystem anderen Programmen zur Anbindung an das System zurVerfugung gestellt wird.
CSV
In CSV-Dateien konnen Tabellen oder eine Liste unterschiedlich langer Datenzeilen ab- gebildet werden, die durch verschiedene Zeichen wie Kommata getrennt werden.
OCR
Automatisierte Texterkennung in Bildern oder eingescannten Dokumenten.
2 Theorie
2.1 Aktueller Einsatz von Daten im Journalismus
Datenjournalismus gibt es, seitdem es Daten gibt - zumindest aber seit den Grafiken derenglischen Krankenschwester Florence Nightingale und den dazugehorigen Berich- ten uberdie Bedingungen und Missstande britischer Soldaten in Lazaretten im Krim- krieg (1853 bis 1856). Diesen Zeitpunkt nehmen zumindest viele Datenjournalisten als Startschuss fur datengetriebenen Journalismus wahr.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Polar-Area-Diagram zeigt Todesursachen von Soldaten wahrend des Krimkrieges.
Quelle: Notes on Matters Affecting the Health, Efficiency, and Hospital Administration of the British Army (1858)
In der Grafik (siehe Abb. 2) zeichnete Nightingale die verschiedenen Todesursachen der Soldaten wahrend des Krimkrieges auf. Blau dargestellt sind alle Todesfalle durch Infek- tionskrankheiten. Die roten Flachen zeigen die Anzahl der Soldaten, die an Verwundun- gen gestorben sind. Die schwarzen Areale beziehen sich auf Soldaten, die aus anderen Grunden ihr Leben gelassen haben.
Damals hatte wohl niemand Florence Nightingale als Journalistin bezeichnet, geschwei- ge denn als Datenjournalistin. Erst 2010 charakterisierte der britische Guardian[11] Nightingale als Wegbereiterin der visuellen Darstellungen von Statistiken in diesem Bereich. Heutzutage machen Datenjournalisten jedoch nichts anderes als Nightingale schon vor uber 150Jahren: Sie sammeln Daten und visualisieren diese. Der Unterschied zu damals ist: Fruher waren solche Grafiken nahezu ausschlieRlich in Buchern zu finden, die sehrteuerwaren. Mittlerweilearbeiten Datenjournalisten mitTabellen und Dateien, die maschinenlesbar sind und von Computern auf einfache Art bearbeitet und als Gra- fik herausgegeben werden konnen.
Das ist zum einen unumganglich, da der Fortschritt kaum aufzuhalten ist. Zum anderen aber auch erforderlich, da die Datenmengen kontinuierlich und stetig wachsen. Nach einer Studie der University of Southern California wurden 2002 erstmals mehr digitale als analoge Daten gespeichert. Funf Jahre spater wurden fast 94 Prozent aller Informa- tionen in digitaler Form aufbewahrt, was 295 Exabyte entspricht[12]. Im vergangenen Jahr produzierte die Weltbevolkerung laut einer aktuellen Studie des Marktforschungs- institutes IDC im Auftrag der EMC Corporation ein Datenvolumen von 1,8 Zettabyte[13] (siehe Abb. 3). Allein das mobile Datenvolumen soll laut Netzwerkausruster Cisco Systems bis zum Jahr 2016 um das Achtzehnfache auf 130 Exabyte ansteigen[14].
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Die Grafikzeigt, wie viel eine Person twittern bzw. wie vieleJahre eine Person 120 Minuten lange Filme in HD-Auflosung schauen musste, um 1,8 Zettabyte Daten zu verbrauchen.
Quelle: Catone, Josh: How Much Data Will Humans Create & Store This Year?
Genau hier liegt die Chance fur den Datenjournalisten, der als Schnittstelle zwischen den immens hohen Datenbergen und dem Rezipienten fungiert. Erfindet eine Ge- schichte im Informationschaos, in dem er die Daten sortiert und filtert.
Datenjournalismus wird aktuell in nahezu jedem Beitrag uber die Zukunft des Journalis- mus erwahnt. Er ist weit mehr als nur eine Modeerscheinung. Auch Lorenz Matzat, ei- ner der wenigen fuhrenden Datenjournalisten in Deutschland, sieht hier groRes Poten- zial:
„Naturlich ist Datenjournalismus zur Zeit schon auch ein Modethema. Aber er wird nicht wieder verschwinden: Er eroffnet neue Perspektiven, gleichzeitig nehmen Datensatze immer mehr zu und damit auch der Bedarf, diese zu erklaren."[15]
Vor allem im Bereich des Online-Journalismus werden aktuell viele Datenprojekte reali- siert. Immer wieder trifft man im Internet auf Visualisierungen von banalen bis hin zu komplexen Themen. Die Verfasser dieser Datenartikel sind hierzulande aber bislang stets dieselben. Nur langsam wagen Redaktionen den Schritt in die Welt von Statisti- ken, Datenbergen und Programmiersprachen.
2.1.1 Datenjournalismus in Online-Medien
Redaktionen von Suddeutsche.de, taz.de und Zeit Online sind in Deutschland eine Art Vorreiter in Sachen Datenjournalismus. Hier entstehen groRe Projekte wie „der Zugmo- nitor", das bereits angesprochene „verraterische Handy" oder„die Fluglarmkarte". Bei alien drei Projekten waren es aber weniger die Redaktionen der groRen Verlage, die hinter der Realisierung steckten. Stattdessen taucht ein Name immer wieder in Verbin- dung mit aufwendig produzierten Datenartikeln auf: OpenDataCity.
Wenn man so mochte, ist OpenDataCity momentan die Agentur in Deutschland, die Datenjournalismus in Perfektion betreibt - zumindest im Online-Bereich.
Ein Beispiel dafur ist der Zugmonitor (siehe Abb. 4), der auf Suddeutsche.de erschienen ist. In dieser Anwendung werden Zuge der Deutschen Bahn live auf einer Karte darge- stellt. Der Leser respektive Nutzer dieser Anwendung sieht, ob Zuge punktlich in den Bahnhof einlaufen oder um wie viele Minuten sie sich verspaten. Zudem lassen sich dank integrierter Suche auch Bahnhofe, Zeitraume und Zugnummern anzeigen, die in der Vergangenheit liegen. Suddeutsche.de und OpenDataCity geben dem Nutzer sogar die Moglichkeit, die Daten perApplication Programming Interface (API) in eine eigene Anwendung zu integrieren.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 4: Zugmonitor: So punktlich ist die Bahn
Quelle: http://zugmonitor.sueddeutsche.de [Abruf06.08.2012]
So etwas ware laut Stefan Plochinger, Leiter der Onlineredaktion von Suddeutsche.de, vor einigen Jahren noch nicht moglich gewesen[16]:
„Der jetzt in Betrieb genommene SZ-Zugmonitor leistet auf ungekannte Art eine Ubersetzungsarbeit, die in einem sehrtraditionellen Sinnejournalistisch ist: Ein kompliziertes Geschehen wird vereinfacht und der Offentlichkeit nahe gebracht. Gigantische, komplexe Datenmengen werden aus bis dato nicht erschlieRbaren Quellen gesammelt, sortiert, gefiltert, neu verpackt und in plotzlich verstandlicher Form ausgespuckt."[17]
Im Internet findet man immer mehr solcher interaktiver Datenanwendungen, die in Printmedien schwer bis gar nicht realisierbar sind. Nur hin und wieder tauchen in Zei- tungen oder Zeitschriften Landkarten auf, die auf Basis zahlreicher Daten etwas darstel- len und als Erganzung zum Artikel stark verdeutlichen konnen. Die Interaktivitat bleibt jedoch auf der Strecke.
Seit einiger Zeit haufen sich Infografiken (siehe Abb. 3), die dem Leser auf spielerische und bildliche Weise viele Zahlen und Fakten prasentieren. Meist jedoch sind es nur aus dem Text ubertragene Daten in eine Grafik, die zwar hubscher aussieht, aber von vielen nicht als Datenartikel angesehen wird. Zudem erwahnt Lorenz Matzat immer wieder: „Datenjournalismus funktioniert nur online."[18]
Fur ihn sind Klickstrecken, Bewegtbild oder Podcasts nur Remixe althergebrachter Me- dienformate. Datenjournalismus dagegen setze auf Datenbanken und Interaktivitat, die nur im Browser oder einer Applikation (App) funktionieren konne.[19] „Eine klickbare Karte ist zwar interaktiv, aber noch lange kein wirklicher Datenjournalis- mus, genauso wenig wie ein Balken- oder Tortendiagramm."[20]
Fur Matzat ist es von hoher Bedeutung, ob einer oder mehrere Datensatze eine zentra- le Rolle spielen, ob das Angebot interaktiv, fur den Rezipienten durchsuchbar und die einzelnen Parameter festlegbar sind und ob der Datensatz, der zur Erstellung der Da- tenanwendung benutzt wurde, einsehbar ist oder sogar vom Nutzer heruntergeladen und womoglich unter einer freien Lizenz weiterverwendet werden kann.[21]
2.1.2 Datenjournalismus in den Printmedien
Dem halten viele Journalisten entgegen und versuchen, den Datenjournalismus auch im Printbereich zu etablieren. Bereits im Jahr 1993 gewann „The Miami Herald" den Pu- litzer-Preis fur die Berichterstattung (siehe Abb. 5) uber den im August 1992 wutenden Hurrikan Andrew, der als der Wirbelsturm gilt, der im 20. Jahrhundert in den USA und der Karibik die groRten Zerstorungen angerichtet hat. Nachdem die Zeitung 50.000 Be- richte ausgewertet, Katasterplane angefordert, Bauherren befragt und insgesamt vier Datenbanken aufgebaut, gefiltert und letztendlich visualisiert hat, kamen uberraschen- de Details ans Licht: In Gebieten, in denen der Wind schwacher war, wurden mehr Hauser zerstort als in der Schneise, die der Wirbelsturm hinterlieR. Daruber hinaus hatten Hauser, die nach 1980 gebaut wurden, eine dreifach hohere Wahrscheinlichkeit unbe- wohnbar zu sein als jene, die vor 1980 errichtet wurden.[22]
Datenjournalismus funktioniert also nicht nur online, sondern auch auf Papier. Der Un- terschied: Online funktioniert er anders, die Schnittstelle zum Leser ist auf einmal da - Interaktion wird moglich und ist auch gewollt; im Printmedium ist dies nicht moglich.
Ein weiterer Aspekt ist, dass Datenjournalismus nicht unbedingt etwas Neues ist, wie der Zeitungsbericht des Miami Herald verdeutlicht. Es ist durch den technischen Fort- schritt nur einfacher geworden, Daten zu sammeln und weiterzuverwerten.
Abbildung in dieser Leseprobe nicht enthalten
2.1.3 Datenjournalismus im Fernsehen
Auch im Fernsehen gibt es Datenjournalismus. Angefangen bei den Lotto-Zahlen, die ohne Visualisierung leben und in Form von Rohdaten prasentiert werden, uber die Wetterkarte, fur die unzahlige Daten uber zahlreiche Wetterstationen gesammelt, an- schlieRend zusammengefuhrt und schlussendlich auf einer Karte visualisiert und fur den Zuschauer verstandlich aufbereitet werden, bis hin zu Sportberichterstattung wie dem FuRball. Nicht nur die Bundesliga-Tabelle ist gespickt mit zahlreichen Daten in strukturierter Form; mittlerweile ist es auch moglich zu sagen, wie viele Kilometer ein Spieler wahrend des Spiels gelaufen ist und wie schnell er dabei im Durchschnitt war. Sogar die Wege lassen sich auf einer Karte visuell darstellen. Eine Erganzung dazu sind Daten wie Ballbesitz, Fehlpasse und Schusse auf das Tor. Samt dieser Daten, die oft noch per Hand gemessen werden, dem Kommentar des Moderators sowie Zeitlupen aus diversen Perspektiven wird der FuRball zu einer Art Live-Datenjournalismus.
Ein schones Beispiel fur Datenjournalismus im FuRball liefert die Dokumentation Rested to the Limit"[23], in der die Fahigkeiten, Kraft und Intensitat von Christiano Ronaldo im Umgang mit dem Ball unter die Lupe genommen werden. Ein ebenfalls erwahnens- wertes Beispiel ist eines der zahlreichen Videos der US-Zeitung „The New York Times", „Speed and Spin: Nadal's Lethal Forehand"[24]. In weniger als drei Minuten wird dem Re- zipienten auf Basis von Daten visuell erklart, was Nadals Schlagkraft und Technik beim Tennis ausmachen. Die Zeitung geht dabei ins Detail und zeigt dem Zuschauer, was er wahrend des Tennis-Matches nicht erfahrt. So eine mit Daten unterfutterte Dokumentation oder Visualisierung funktioniert nicht nur online, sondern auch im Fernsehen.
Einen Grund zur Freude fur Datenjournalisten lieferten in diesem Sommer die Olympi- schen Spiele in London. So hat beispielsweise der Guardian in seinen Datablog ein Olympia-Special[25] integriert und bringt den Medaillenspiegel in Zusammenhang mit dem Bruttoinlandsprodukt und der Einwohnerzahlen der einzelnen Lander oder ver- gleicht die Medaillenvergabe derTop-Teams der einzelnen Lander mit den Olympischen Spielen vor vierJahren in Peking (siehe Abb. 6).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 6: London Olympics 2012: How does each major team's performance compare to Beijing 2008? Quelle: Blight, Garry und Rogers, Simon und Aked, Hilary: http://www.auardian.co.uk/sport/databloa/interactive/2012/aua/02/london-olvmpic-medals-2008- 2012-comoared [Abruf 07.08.2012]
Ein weiteres Beispiel also, wie so ein Datenartikel im Internet aussehen kann. Die Onli- neausgabe der New York Times befasst sich ebenfalls mit den Olympischen Spielen und zeigt, wie man Datenjournalismus auch ins Fernsehen bringen konnte. In einem Video[26] wird das Finale des 100-Meter-Laufes analysiert, aufbereitet und die Zeiten derTop- Sprinter mit denen von Ex-Olympia-Siegern verglichen. Bringt man die Daten der vielen Veranstaltungen in Zusammenhang, entdeckt man einige uberraschende Details. Nicht nur, dass Goldmedaillen-Gewinner Usain Bolt schneller war als bei seinem Finallauf in Peking, sondern auch, dass die Zeit des aktuell schnellsten 15-jahrigen US-amerikani- schen 100-Meter-Laufers im Jahr 1980 fur die Silber-Medaille gereicht hatte.
Bereits seit 1992 strahlt der franzosische Sender Arte wochentlich die Sendereihe „Mit offenen Karten"[27] aus, in der fast ausschlieRlich anhand von Landkarten aktuelle wirt- schaftliche, historische oder geopolitische Sachverhalte dargestellt werden. Ahnliche interaktive Anwendungen werden online immer ofter umgesetzt, siehe Fluglarmkarte[28] oder Zugmonitor.
2.2 Aus Datenartikel wird Datenanwendung
Am Beispiel des Zugmonitors von Suddeutsche.de (siehe Abb. 4) wird deutlich, dass Datenartikel zu einem aktuellen Thema zu Datenanwendungen werden konnen, die dem Rezipienten auch nachhaltig von Nutzen sein konnen. So auch im Fall der interaktiven Anwendung „ls Better to Buy or Rent?"[29], die in der Onlineausgabe der New York Times zu finden ist. Mittels einiger Angaben wie der monatlichen Miete, dem Kaufpreis sowie Zinssatzen fur Hypotheken und der jahrlich anfallenden Grundsteuer kann der Nutzer ermitteln, ob und wann sich der Kauf eines Hauses beziehungsweise einer Wohnung lohnt oder ob es sinnvoller ist, zu mieten.
Mit „Dollars for Docs"[30] veroffentlichte der spendenfinanzierte US-amerikanische „Non- Profit-Newsdesk Pro Publica" im Herbst 2011 eine ahnliche News-App. Nutzer konnen in der Nachrichtenanwendung uberprufen, ob ihr Arzt fur Medikamententests oder Vortrage Honorare von der Pharmaindustrie annimmt. „Die riesige Datenbank hinter der Anwendung hilft Nutzern dabei, ihre personliche Geschichte in einer allgemeinen Geschichte zu entdecken".[31]
Datenanwendungen dieser Art bringen dem Nutzer also einen deutlichen Mehrwert. Werden sie zudem von den Redaktionen in Hinsicht auf Daten und Datensatze stets auf dem neuesten Stand gehalten, konnen solche Anwendungen unendliche Gultigkeit be- sitzen. Dabei kann das Aktualisieren solcher Datensatze auch automatisch uber APIs passieren, wie es etwa beim Zugmonitor der Fall ist. OpenDataCity bietet Nutzern sogar die kostenlose Nutzung der API des Zugmonitors[32] an, vorausgesetzt, man erstellt damit keine kostenpflichtigen Anwendungen.
Die Erstellung des Zugmonitors seitens OpenDataCity war sehr aufwandig. Aktualisie- rungen wie etwa das Einpflegen neuer Bahnhofe oder Zugverbindungen erfordert indes kaum Eingriffe. Hier stellt die Deutsche Bahn jedoch keine Informationen in Form von beispielsweise einer API zur Verfugung - OpenDataCity muss sich die benotigten Daten durch Scrapen von der Bahn-Website also selbst besorgen.
Eine weitere Moglichkeit, die Reichweite solcher Datenanwendungen zu erhohen, ist, daraus mobile Apps fur Smartphones und Tablets zu generieren. Theoretisch wurde das auch mit der Zugmonitor-API funktionieren und ergabe durchaus Sinn, da man so auch von unterwegs sehen konnte, wann welcher Zug verspatet eintrifft. Leider stellt die Bahn selbst aber keine Daten zur Verfugung, wodurch dem Entwickler viele Umwege entstehen und schnelle Wege zu nutzlichen Apps verhindert werden.
2.3 Datenquellen und -verarbeitung
Daten sind allgegenwartig. Adrian Holovaty, ein US-amerikanische Web-Entwickler und Journalist, machte in seinem Text „A fundamental way newspaper sites need to change"[33] bereits im September 2006 deutlich, dass Redaktionen bereits voll von struk- turierten Daten sind, die nicht genutzt werden. Seine Feststellung erklart Holovaty an einem Beispiel:
Bei einer typischen Lokalberichterstattung uber einen Brand sind gewisse Arten von Daten wie Tag, Zeitpunkt und Ort des Brandes sowie Angaben uber Unfallopfer, Brand- ursache oder die Hohe des entstandenen Schadens immer vorhanden. Sortiert nach ih- ren Charakteristika und zusammengefasst in einem fur Maschinen lesbaren Format, wurden die nach Holovaty entstehenden Datensatze von Branden es ermoglichen, dass die Daten vorangegangener und folgender Brande schnell miteinander verglichen werden konnten. Eingepflegt in eine Datenbank konnten die Daten auRerdem auf einer in- teraktiven Karte mit verschiedenen Filteroptionen ausgegeben werden und offenlegen, in welchen Regionen es beispielsweise haufiger brennt[34]. Holovaty ist der Meinung, dass Zeitungen sich nicht ausschlieRlich auf Geschichten konzentrieren sollten, sondern auch auf Informationen, die in Form von strukturierten Daten vorliegen. Diese in Da- tenbanken abzulegen und nachhaltig fur weitere Berichterstattung zu nutzen ware demnach ein deutlicher Mehrwert.
Das funktioniert aber nicht nur im lokalen Bereich, sondern ebenso gut bei Sport- oder Wirtschaftsjournalismus, wo Artikel uber die Entwicklung von Aktien und Unterneh- men oder uber FuRballstatistiken sehr stark auf Zahlen basieren.
Der erste Schritt konnte also sein, die vielen bereits gesammelten Daten nicht auszu- drucken und in Archiven einzulagern, sondern in Datenbanken maschinenlesbareinzu- lesen und zuganglich zu machen. Die dabei entstehenden Datensatze konnten so fur die weitere Berichterstattung hinzugezogen werden, womoglich mit weiteren Datensat- zen aus anderen Quellen angereichert und als Paket einen umfassenderen oder ande- ren Blick auf das aktuelle Geschehen werfen. Durch solches „Datenrecycling" konnten weitere und vor allem kostengunstige Quellen fur Medien entstehen.
2.3.1 Datenbeschaffung (Open Data und Datascraping)
Daten liegen aber nicht nur in den Redaktionen und Verlagen versteckt in den Archiven. Auch Verwaltungen, Lander und Gemeinden lagern Unmengen von Daten, die sie oftmals nicht herausgeben. Haufig ist hierbei die Rede von offenen Daten oder Open Data, womit die freie Verfugbar- und Nutzbarkeit von meist offentlichen Daten bezeich- net wird.
„Offene Daten sind samtliche Datenbestande, die im Interesse derAllgemeinheit der Gesellschaftohnejedwede Einschrankung zurfreien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zuganglich gemacht werden."[35]
Dabei handelt es sich beispielsweise um Lehrmaterial, Geodaten, Statistiken, Verkehrs- informationen, wissenschaftliche Publikationen, medizinische Forschungsergebnisse oder Horfunk- und Fernsehsendungen.[36]
Das Konzept hinter Open Data ist nicht neu, nur mit der Definition tun sich Experten schwer. Wenn jemand von Open Data spricht, meint er oder sie meistens Informatio- nen, die auRerhalb des Textes liegen, wie beispielsweise Wetterdaten, Karten oder me- dizinische Daten.
Offene Daten mussen strukturiert und maschinenlesbar zur Verfugung stehen, so dass sie sich filtern, durchsuchen und weiterverarbeiten lassen konnen. Regierungsstellen hingegen veroffentlichen meist Daten, die im PDF-Format vorliegen und damit nicht einfach weiterverarbeitet werden konnen.
Zum einen fordert die Open-Data-Bewegung den freien Zugang zu Daten. Zum anderen generiert sie diese aber auch selbst. Ein Beispiel dafur ist die „OpenStreetMap"[37]. Be- furwortervon Open Data behaupten, dass dadurch eine demokratischere Gesellschaft moglich sei. Die englische Internetseite TheyWorkForYou.com[38] erlaubt beispielsweise, das Abstimmungsverhalten der britischen Abgeordneten nachzuverfolgen. Werden Daten in Verbindung mit der Regierung gebracht, ist oft von „Open Government" die Rede. Rob McKinnon sagte bei einem Vortrag auf der „re:publica 2012", dass,,[...] der Verlust des Datenprivilegs zu neuen Machtstrukturen innerhalb einer Gesellschaft fuh- ren kann."[39]
Die Entwicklergruppe „Tactical Tools" zeigt auf der Webseite OffenerHaushalt.de[40], wie viel Geld der Staat im Detail wofur ausgibt und visualisiert den Bundeshaushalt (siehe Abb. 7) in einer einfachen und ubersichtlichen Anwendung. Die komplexen Daten des Bundeshaushalts werden erschlossen und in offenen und wiederverwendbaren Daten- formaten zuganglich gemacht. So konnen Informationen ausgewertet, visualisiert und vom Nutzer ins Verhaltnis mit anderen Daten gesetzt und zum Beispiel Vergleiche zu anderen Ressort gezogen werden.
[...]
[1] Daten sind das neue Ol.
[2] Vgl.: Palmer, Michael: Data is the new oil. Ana.blogs.com, 3. November 2006. Online unter: http://ana.bloes.com/maestros/2006/11/data is the new.html [Abruf 01.07.2012].
[3] http://www.guardian.co.uk/ [Abruf 01.07.2012]
[4] http://mps-expenses.guardian.co.uk/ [Abruf 01.07.2012]
[5] Vgl.: o.V.: Erstmals Haftstrafe im Zusammenhang mit britischem Spesenskandal. Stern.de, 7. Januar 2011. Online unter: http://www.stern.de/news2/aktuell/erstmals-haftstrafe-im-zusammenhang-mit- britischem-spesenskandal-1641178.html [Abruf 01.07.2012].
[8] https://docs.eooele.com/spreadsheet/ccc? kev=0An0YnoiCbFHGdGp3WnJkbE4xWTdDTVV0ZDlQeWZmSXc&authkev=CQCiw- kG&hl=en GB&authkev=COCiw-kG#gid=Q [Abruf 02.07.2012]
[9] Vgl.: o.V.: Gesetz zur Vorratsdatenspeicherung unterzeichnet. Suddeutsche.de, 26. Dezember 2007. Online unter: http://www.sueddeutsche.de/politik/bundespraesident-koehler-eesetz-zur- vorratsdatenspeicherung-unterzeichnet-1.270166 [Abruf 11.08.2012]
[10] Vgl.: Biermann, Kai: Was Vorratsdaten uber uns verraten. Zeit Online, 24. Februar 2011. Online unter: http://www.zeit.de/digital/datenschutz/2011-02/vorratsdaten-malte-spitz [Abruf 11.08.2011]
[11] Vgl.: Rogers, Simon: Florence Nightingale, datajournalist: Information has always been beautiful. Guardian.co.uk, 13. August 2010. Online unter: http://www.guardian.co.uk/news/datablog/2010/aug/13/florence-niehtingale-graphics [Abruf 06.07.2012]
[12] Vgl.: Wu, Suzanne: How Much Information Is There in the World? USC News, 10. Februar 2011. Online unter: http://news.usc.edu/#!/article/29360/How-Much-Information-Is-There-in-the-World [Abruf 07.07.2012].
[13] Vgl.: Gantz, John und Reinsel, David: Extracting Value from Chaos. IDC View, Juni 2011. Online unter: http://germanv.emc.com/collateral/analvst-reports/idc-extracting-value-from-chaos-ar.pdf [Abruf
[14] Vgl.: von Voithenberg, Stephan: Studie: Mobiler Datenverkehr steigt rasant an. Telecom-Handel.de, 15. Februar 2012. Online unter: http://www.telecom-handel.de/News/Markt-Analyse/Studie- Mobiler-Datenverkehr-steigt-rasant-an [Abruf 11.07.2012].
[15] Siehe: Horbach, Kim: Die Zukunft kommt - lasst sich aber Zeit. Online unter: http://www.dateniournal.de/dossier/einstieg#zukunft [Abruf 20.07.2012].
[16] Vgl.: Plochinger, Stefan: Wir speichern, Sie stobern. Sueddeutsche.de, 10. Marz 2012. Online unter: http://www.sueddeutsche.de/kolumne/dateniournalismus-proiekt-zuemonitor-wir-speichern-sie- stoebern-1.1304376 [Abruf06.08.2012].
[17] Plochinger, Stefan: Wir speichern, Sie stobern. Sueddeutsche.de, 10. Marz 2012. Online unter: http://www.sueddeutsche.de/kolumne/dateniournalismus-proiekt-zugmonitor-wir-speichern-sie- stoebern-1.1304376 [Abruf06.08.2012].
[18] Matzat, Lorenz: Auf der DJV-Fachtagung „Besser Online", 17. September 2011. Online unter: https://twitter.com/basilioskawa/status/115001268245762048 [Abruf06.08.2012].
[19] Vgl.: Matzat, Lorenz: Datenjournalismus. Bundeszentrale fur politische Bildung, 26. Oktober 2011. Online unter: http://www.bpb.de/gesellschaft/medien/opendata/64069/dateniournalismus?p=all
[20] Matzat, Lorenz: Datenjournalismus. Bundeszentrale fur politische Bildung, 26. Oktober 2011. Online unter: http://www.bpb.de/gesellschaft/medien/opendata/64069/dateniournalismus?p=all [Abruf 07.08.2012].
[21] Vgl.: Matzat, Lorenz: Datenjournalismus. Bundeszentrale fur politische Bildung, 26. Oktober 2011. Online unter: http://www.bpb.de/gesellschaft/medien/opendata/64069/dateniournalismus?p=all [Abruf 07.08.2012].
[22] Vgl.: Clifford, Dan und Leen, Jeff und Doig, Stephen K.: Less wind, lots of damage. The Miami Herald, 20. Dezember 1992.
[23] http://castroledge.de/football/ronaldo-bis-zur-perfektion-eetestet/ [Abruf 07.08.20121
[24] http://www.nvtimes.com/interactive/2011/09/Q1/sports/tennis/Speed-and-Spin-Nadals-Lethal- Forehand.html [Abruf 07.08.20121
[25] http://www.guardian.co.uk/sport/series/london-2012-olvmpics-data [Abruf07.08.20121
[26] http://www.nvtimes.com/interactive/2012/08/05/sports/olvmpics/the-100-meter-dash-one-race- every-medalist-ever.html [Abruf 07.08.2012]
[27] http://ddc.arte.tv/de [Abruf 07.08.20121
[28] http://www.taz.de/Fluelaerm-BBI/lt195/ [Abruf 11.08.20121
[29] http://www.nvtimes.com/interactive/business/buv-rent-calculator.html [Abruf 07.08.20121
[30] http://proiects.propublica.org/docdollars/ [Abruf 12.08.20121
[31] Klein, Scott in Langer, Ulrike: Wozu Datenjournalismus? Quergewebt, 24. Mai 2012. Online unter: http://blog.grimme-online-award.de/2012/05/wozu-dateniournalismus/ [Abruf 12.08.20121.
[32] http://www.opendatacitv.de/zugmonitor-api/ [Abruf 17.08.20121
[33] Vgl.: Holovaty, Adrian: A fundamental way newspaper sites need to change, 6. September 2006. Online unter: http://www.holovatv.com/writing/fundamental-chanee/ [Abruf 18.08.2012]
[34] Vgl.: ebd.
[35] Lucke, Jorn und Geiger, Christian: Open Government Data, 3. Dezember 2010. Online unter: http://www.zu.de/deutsch/lehrstuehle/ticc/TICC-101203-OpenGovernmentData-Vl.pdf [Abruf 20.08.2012]
[36] Vgl.: ebd.
[37] http://www.openstreetmap.de/
[38] http://www.thevworkforvou.com/
[39] Vgl.: McKinnon, Rob in Klopp, Tina: Mit alten Daten neues Wissen schaffen, 16. April 2010. Online un- ter: http://www.zeit.de/digital/internet/2010-04/open-data-republica/seite-1 [Abruf 20.08.2012]
[40] http://www.offenerhaushalt.de
- Arbeit zitieren
- Blasius Kawalkowski (Autor:in), 2012, Trend oder Zukunft: Daten als zentraler Gegenstand der journalistischen Berichterstattung., München, GRIN Verlag, https://www.hausarbeiten.de/document/206648