Big Data beschreibt ein verhältnismäßig junges Themengebiet, welches seit einiger Zeit flächendeckendes Interesse auslöst. So befand sich die Technologie im Jahr 2013 auf dem Höhepunkt des Gartner Hype Cycle. Es handelt es sich jedoch um mehr als nur einen Hype, da sich Big Data längst in zahlreichen Bereichen des Lebens manifestiert hat, von der alltäglichen Nutzung sozialer Plattformen bis hin zur Forschung an Zukunftstechnologien. Die dementsprechend große Spannweite des Themas lässt eine genaue Eingrenzung des Einflussbereichs kaum noch zu. Aus eben diesem Grund wurde Big Data trotz seiner Neuheit seit 2015 nicht weiter als aufkommende Technologie im Gartner Hype Cycle aufgeführt. Die wachsende Bedeutung der Thematik wurde vor allem durch Faktoren wie steigende Prozessorleistung und sinkende Kosten von Speicherkapazität, welche durch Moore’s Gesetz beschrieben werden, begünstigt. Ebenso gilt die Durchdringung nahezu aller Bevölkerungsschichten von Geräten wie Smartphones, Smartwatches oder digitaler Assistenten, welche als Sensoren vieler Arten fungieren, als Katalysator von Big Data. Sowohl Unternehmen, private Institutionen als auch Regierungen sehen gleichermaßen ein enormes Potential in der Nutzung dieser Technologie als Werkzeug zur Datensammlung und -analyse. Die jeweiligen Ziele und die damit verbundenen Auswirkungen unterscheiden sich hingegen deutlich.
Trotz des hohen Bekanntheitsgrads dieser Technologie variiert das Verständnis des Terminus Big Data innerhalb der Bevölkerung teilweise stark. Aus diesem Grund werden im folgenden Kapitel drei unterschiedliche Begriffsdefinitionen erläutert.
Inhaltsverzeichnis
1 Einleitung
2 Definition: Big Data
3 Behandlung der Forschungsfrage
3.1 Konsumverhalten
3.2 Social Profiling
3.3 Privatsphäre & Sicherheit
3.4 Algorithmic Decision Making
3.5 Behavioral Manipulation
4 Zusammenfassung und Ausblick
5 Literaturverzeichnis
1 Einleitung
Big Data beschreibt ein verhältnismäßig junges Themengebiet, welches seit einiger Zeit flächendeckendes Interesse auslöst. So befand sich die Technologie im Jahr 2013 auf dem Höhepunkt des Gartner Hype Cycle [Gar13]. Es handelt es sich jedoch um mehr als nur einen Hype, da sich Big Data längst in zahlreichen Bereichen des Lebens mani- festiert hat, von der alltäglichen Nutzung sozialer Plattformen bis hin zur Forschung an Zukunftstechnologien. Die dementsprechend große Spannweite des Themas lässt eine genaue Eingrenzung des Einflussbereichs kaum noch zu. Aus eben diesem Grund wurde Big Data trotz seiner Neuheit seit 2015 nicht weiter als aufkommende Technologie im Gartner Hype Cycle aufgeführt [Gar14]. Die wachsende Bedeutung der Thematik wurde vor allem durch Faktoren wie steigende Prozessorleistung und sinkende Kosten von Speicherkapazität, welche durch Moore’s Gesetz beschrieben werden, begünstigt [Esp14]. Ebenso gilt die Durchdringung nahezu aller Bevölkerungsschichten von Gerä- ten wie Smartphones, Smartwatches oder digitaler Assistenten, welche als Sensoren vieler Arten fungieren, als Katalysator von Big Data. Sowohl Unternehmen, private Insti- tutionen als auch Regierungen sehen gleichermaßen ein enormes Potential in der Nut- zung dieser Technologie als Werkzeug zur Datensammlung und -analyse. Die jeweiligen Ziele und die damit verbundenen Auswirkungen unterscheiden sich hingegen deutlich.
Trotz des hohen Bekanntheitsgrads dieser Technologie variiert das Verständnis des Ter- minus Big Data innerhalb der Bevölkerung teilweise stark. Aus diesem Grund werden im folgenden Kapitel drei unterschiedliche Begriffsdefinitionen erläutert.
2 Definition: Big Data
Um eine zielgerichtete Erörterung der Auswirkungen von Big Data zu ermöglichen, müs- sen zunächst der Begriff selbst und der damit verbundene Einflussbereich möglichst tref- fend gefasst und eingeordnet werden. Zu diesem Zweck werden im Folgenenden drei verschiedenartige Definitionen präsentiert und kurz diskutiert.
1) Big Data is the Information asset characterized by such a High Volume, Velocity and Variety to require specific Technology and Analytical Methods for its transformation into Value.
DE MAURO et al.: A formal definition of Big Data based on its essential features [DGG16]
In der oben gezeigten Begriffsdefinition nach DE MAURO et al. wird Bezug auf das Modell der Three V‘s [GH14] genommen, welches erstmals im Gartner IT Glossar publiziert wurde. In diesem wird Big Data durch seine drei Kernattribute Volume, Velocity und Va- riety beschrieben. Während mit Volume die Menge der aufgenommenen und zu verar- beitenden Daten gemeint ist, bezeichnet Velocity die Geschwindigkeit, mit welcher diese erfasst und analysiert werden. Variety weist auf die strukturelle Heterogenität innerhalb der Datensätze hin, welche sowohl in geordneter als auch vollkommen ungeordneter Form vorliegen können [GH14]. Weiterhin sprechen DE MAURO et al. die spezielle Me- thodik und Technologie an, welche zum Umgang mit Big Data benötigt werden. Erst mithilfe dieser kann aus den verarbeiteten Daten ein Wert (Value) generiert werden. Die- ser stellt ein weiteres Attribut dar, welches den Three V durch Oracle hinzugefügt wurde und bezeichnet die verhältnismäßig geringe Wertdichte der Daten. Um eine substantielle Wertschöpfung zu erreichen, ist demnach die Analyse vieler Datensätze nötig [GH14]. Eine Konkretisierung des Begriffs Value wird hier allerdings nicht vorgenommen, wes- halb dieser sowohl monetärer, wissenschaftlicher, als auch soziokultureller Natur sein kann.
2) Mit "Big Data" werden große Mengen an Daten bezeichnet, die u.a. aus Bereichen wie Internet und Mobilfunk, Finanzindustrie, Energiewirtschaft, Gesundheitswesen und Verkehr und aus Quel- len wie intelligenten Agenten, sozialen Medien, Kredit- und Kundenkarten, Smart-Metering-Syste- men, Assistenzgeräten, Überwachungskameras sowie Flug- und Fahrzeugen stammen und die mit speziellen Lösungen gespeichert, verarbeitet und ausgewertet werden.
Prof. Dr. BENDEL, Hochschule für Wirtschaft & Wirtschaftsinformatik [Ben18]
Eine weitere Definition des Begriffs Big Data stammt von Prof. Dr. BENDEL, dessen Fach- bereich in der Wirtschaftsinformatik liegt. Auch er thematisiert die Menge der Daten, im Gegensatz zu DE MAURO et al. nennt er jedoch zusätzlich konkrete Bereiche sowie Quel- len, aus denen die jeweiligen Daten gewonnen werden. Auf diese Weise lenkt er den Fokus auf die Vielfältigkeit und Verschiedenartigkeit dieser, wodurch die hohe Spann- weite von Big Data aufgezeigt wird. Weiterhin zählt BENDEL Speicherung, Verarbeitung und Auswertung als zentrale Schritte in der Anwendung der Technologie auf und bezieht somit neben der Erfassung der Daten auch notwendige nachgelagerte Vorgänge mit ein.
3) Big data is a combination of Volume, Variety, Velocity and Veracity that creates an opportunity for organizations to gain competitive advantage in today's digitized marketplace.
SCHROECK et al.: Analytics - The real-world use of big data [SSS+12]
Die Begriffsdefinition nach SCHROECK et al. greift ebenfalls die Attribute Volume, Variety und Velocity auf und fügt diesen als vierte Eigenschaft Veracity hinzu. Ursprünglich ge- prägt von IBM bezeichnet diese die mangelnde Verlässlichkeit der vorhandenen Daten und den damit einhergehenden eingeschränkten Grad der Richtigkeit [GH14]. Da be- stimmte Quellen durch möglicherweise fehlerhafte Messung oder Einflüsse durch sub- jektive Bewertung und Interpretation von Natur aus nur bedingt verlässlich sind, können aus diesen entnommene Daten fehlerbehaftet und verzerrt sein. Diese Eigenschaft, wel- che von MAYER-SCHÖNBERGER und CUKIER als „Unschärfe“ [MC13] betitelt wird, muss bei anschließender Analyse berücksichtigt werden. SCHROECK et al. stellen Big Data in ihrer Definition in den Kontext der allgemeinen Digitalisierung und legen den Schwer- punkt auf die Nutzung dieser Technologie als Werkzeug zur finanziellen Gewinnmaxi- mierung von Unternehmen. Die Definition kann somit als indirekte Vorhersage eines Wettlaufs digital orientierter Unternehmen in der Adaption von Big Data interpretiert wer- den.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2.1: Definitionen zu Big Data [GH14]
Abbildung 2.1 zeigt eine Darstellung der Inhalte von weiteren Definitionen des Begriffs Big Data, welche aus einer Online-Umfrage von 154 globalen Führungskräften im April 2012 gewonnen wurden [GH14]. An dieser ist abzulesen, dass sich ein Großteil der De- finitionen in vier Kernthemen ähneln: Es werden sowohl der Anstieg des Volumens auf- kommender Daten (28%), deren Verschiedenartigkeit und Geschwindigkeit (24%) als auch die wachsende Notwendigkeit der Speicherung von Daten (19%) aus zunehmend neu entstehenden Quellen (18%) thematisiert. Diese können somit als zentrale Attribute der Technologie Big Data bezeichnet werden.
Im weiteren Verlauf dieses Portfolios wird daher diskutiert, welche Auswirkungen auf Individuen und die Gesellschaft an sich durch Big Data hervorgerufen werden.
3 Behandlung der Forschungsfrage
Wie bereits in Kapitel 1 und 2 angesprochen, hat die Revolution im Kontext von Big Data weitreichende Auswirkungen auf verschiedenste Aspekte des Lebens. Die Zielsetzun- gen der jeweiligen Akteure variieren dabei von rein monetär orientierter Gewinnmaximie- rung über politische Machtzunahme bis hin zu Überwachung und Kontrolle von ganzen Bevölkerungsgruppen. Zur Erreichung dieser werden verschiedenste Instrumente ver- wendet, die direkt oder indirekt Einfluss auf Menschen und insbesondere ihr Verhalten haben. Welche Folgen aus dem Einsatz dieser Instrumente resultieren, soll in diesem Kapitel anhand von ausgewählten Themenbereichen im Detail erörtert werden. Als zent- rale Forschungsfrage dieses Portfolios ergibt sich somit folgende:
Wie wird menschliches Verhalten durch Big Data unbewusst beeinflusst?
Zur Beantwortung dieser Frage werden in den folgenden Unterkapiteln fünf Aspekte der
Thematik ausgewählt und näher beleuchtet.
3.1 Konsumverhalten
Entsprechend der Definition nach SCHROECK et al. bietet Big Data eine Möglichkeit für Organisationen, in der zunehmend digitalen Welt einen Wettbewerbsvorteil zu erlangen [SSS+12]. Für Unternehmen bedeutet dies speziell die Gewinnmaximierung durch ge- zielte Beeinflussung des Konsumverhaltens bestehender sowie vor allem potenzieller Kunden. Da im Rahmen von Big Data immer mehr Daten gesammelt, gespeichert und analysiert werden können, sind digital orientierte Dienstleistungsanbieter wie beispiels- weise Betreiber sozialer Netzwerke in der Lage, Wissen über ihre Nutzer zu generieren. Im Fokus stehen dabei besonders deren Interessen und Vorlieben, da sich aus diesen ableiten lässt, welche Produkte und Dienstleistungen auf den jeweiligen Nutzer attraktiv wirken könnten. Auf diese Weise ist es möglich, auf das jeweilige Profil zugeschnittene Werbung einzublenden. Auch vor der Verbreitung des Phänomens Big Data war dieses Vorgehen eine Option, die Profitabilität stieg jedoch erst durch die konstant sinkenden Kosten der Datenverarbeitung (siehe MOORE’s Gesetz) ausreichend an, um ein relevan- tes Geschäftsmodell darzustellen. [Esp14]
Das Ziel vieler Unternehmen besteht somit darin, das aus dem wachsenden Datenpool gewonnene Wissen über Nutzer mithilfe von personalisierten Werbeanzeigen und indi- viduell zugeschnittenen Produktvorschlägen in Profit zu transformieren. Durch die da- tengestützte Analyse des bisherigen Kaufverhaltens wird bestimmt, welches Produkt be- ziehungsweise welche Dienstleistung mit der höchsten Wahrscheinlichkeit von dem je- weiligen Nutzer in Anspruch genommen wird. Im Zentrum dieser Praktik steht dement- sprechend die Vorhersage des Nutzerverhaltens und dessen gezielte Steuerung.
Auch wenn die Verwendung von personalisierter Werbung zur Umsatzsteigerung ein weitestgehend bekanntes Verfahren ist, sind die Effekte es nicht zwingend. Inwiefern das Konsumverhalten beeinflusst wird hängt stark von dem jeweiligen Konsumenten ab. Bei besonders anfälligen Personen reichen die Auswirkungen bis hin zur Unterstützung der Entwicklung kompulsiven Verhaltens oder im Extremfall sogar ausgeprägten Formen von Kaufsucht [Esp14]. Durch die stetige Präsenz von Produktvorschlägen, die das In- teresse des potenziellen Käufers treffen, ist eine generelle Anregung dessen Konsums naheliegend. Dabei steht jedoch häufig die simple Erhöhung des Umsatzes des Werbe- treibenden deutlich mehr im Fokus als die Schaffung eines Nutzenzuwachses des Kun- den. Es kann daher argumentiert werden, dass auf diese Weise mehr Produkte und Dienstleistungen verkauft werden, die der jeweilige Käufer ohne die entsprechende Wer- bung nie erworben hätte. [TP13]
Eine weitere Auswirkung von Big Data auf den Handel im digitalen Raum ist die wach- sende Informationsasymmetrie zwischen Anbieter und potenziellem Kunden. Während Ersterer durch die Analyse umfangreicher Nutzerdaten über ein Profil der Präferenzen des Letzteren verfügt, stehen diesem nur begrenzte Informationen offen. Diese Asym- metrie führt dazu, dass das Unternehmen eine Einschätzung des Reservationspreises des jeweiligen Nutzers durchführen und seinen Güter- oder Dienstleistungspreis ent- sprechend anpassen kann, um seine Produzentenrente zu maximieren [TP13]. TENE et al. vergleichen diese Situation treffend mit einem Pokerspiel, in dem ein Spieler mit of- fener und ein anderer mit verdeckter Hand spielt [TP13, S. 255].
Die durch Gewinnmaximierung angetriebene Umwandlung von Kundeninformationen in Konsum führt weiterhin zur Einbettung von Konsummöglichkeiten in zahlreiche techni- sche Geräte (z.B. Smartwatches, Digital Assistants). Dies wird bereits in der Design- phase von technischen Produkten berücksichtigt und formt somit die Art und Weise, wie Nutzer mit diesen interagieren, was zwangsläufig Rückwirkungen auf die Nutzer selbst hat. [Esp14]
Diese Veränderungen gilt es zukünftig sowohl empirisch als auch ethisch bezüglich ihres Effekts auf das Nutzerverhalten zu überprüfen, um ungewollte Auswirkungen zu vermei- den. Zu welchen Effekten die Bildung von sozialen Persönlichkeitsprofilen aus Nutzer- daten, welche personalisierter Werbung zugrunde liegt, führt, wird in Kapitel 3.2 näher betrachtet.
3.2 Social Profiling
Die Akkumulation personenbezogener Daten und Aggregation zu individuellen Profilen durch Big Data (speziell Dataveillance & Big Data Analytics) wird allgemein als Social Profiling bezeichnet. Diese Profile werden vor allem von Marketing-Agenturen verwen- det, um Konsumenten mit bestimmten Eigenschaften zu identifizieren, damit werbetrei- bende Unternehmen mehr Informationen über ihre potenziellen Kunden erlangen.
Ein Schritt in der daten-basierten Profilierung von Konsumenten ist die Segregation in waste und targets [Tur11]. Diese bezeichnen Kundengruppen, die für den jeweiligen Werbetreibenden entweder irrelevant sind (waste) oder seiner Zielgruppe entsprechen (targets). Auf diese Weise sortierende Vermarktende die Konsumenten und filtern die potenziellen Kunden heraus, welche für den Werbetreibenden als besonders wertvoll einzustufen sind. Basierend auf besuchten Internetseiten, online geführten Konversatio- nen und Beziehungen zu anderen Verbrauchern werden den Kunden somit systematisch „marketing labels“ [Tur11, S.14] angehängt, die es ermöglichen, sie nach ihrem jeweili- gen Wert für das Unternehmen zu klassifizieren. Die individuellen Profile enthalten dabei neben der genannten Segregation in waste und targets zahlreiche weitere Informationen über beispielweise Geschlecht, Alter, Einkommensniveau, Konsumverhalten, Interessen und persönliche Eigenschaften. Die Implikationen dieser Profilierung auf die Betroffenen gehen dabei weit über personalisierte Werbeanzeigen hinaus. [One16]
„Being poor […] is getting more and more dangerous and expensive.“
– Cathy O’NEIL [One16, S. 159]
Eine der Auswirkungen von personenbezogener Profilbildung auf Basis digital akkumu- lierter Daten ist die Erzeugung von Folgereaktionen aufgrund spezieller Eigenschaften, die einem Konsumenten zugeordnet wurden. Als prägnantes Beispiel lässt sich hier die Profilierung einer Person als einkommensschwach und finanziell instabil sehen. Diese kann zu einer geminderten Einstufung der Kreditwürdigkeit und dementsprechend höhe- ren Zinsen auf Finanzprodukte (z.B. Kredite) führen, welche die finanzielle Situation der betroffenen Person weiter erschweren [One16]. Ebenfalls anzuwenden ist diese Proble- matik auf das Beispiel einer Person, die durch eine Präferenz für Werbungen, welche Fast Food oder ähnliche Produkte beinhalten, als diesen gegenüber positiv eingestellt eingestuft wurde. Entsprechend des Profils würden zunehmend mehr Produktvorschläge angezeigt, die Fast Food oder andere nicht gesundheitsförderliche Konsumprodukte ent- halten. Dies kann verhaltensverstärkend wirken und die Person so unbewusst dazu be- wegen, sich Übergewicht oder anderen körperlichen Problemen auszusetzen. [One16]
Diese Unterstützung bereits vorhandenen Verhaltens wird als „Labelling approach“ be- schrieben und bezeichnet das Phänomen, in dem die Stigmatisierung einer Person mit bestimmten Eigenschaften zur realen Übernahme dieser Eigenschaften führen kann. Die Aneignung von Attributen des Profils einer Person zum Beispiel durch zunehmende Selbstidentifizierung mit jenen wird ebenfalls als „self-fulfilling prophecy“ bezeichnet und ist thematisch im Thomas-Theorem wiederzufinden. [One16]
Die Ausrichtung der angezeigten Inhalte anhand vorhandener Informationen über den Betrachter kann weiterhin zur Bildung sogenannter „filter bubbles“ [Par13, S. 1] bzw. „echo chambers“ [LS18, S. 18] führen. Pariser nennt an dieser Stelle drei neuartige Dy- namiken, die dieses Phänomen von anderen Formen der Inhaltsfilterung differenziert:
„ F i r st, you’re alone in it.“ [Par13, S. 10] – Im Gegensatz zu z.B. Fernsehsendern, die ihr Programm an einem bestimmten Publikum ausrichten, bildet sich für jedes Individuum eine eigene Filterblase. Dies führt dazu, dass Informationsgrundlagen sich zwischen Personen teilweise deutlich unterscheiden und Diskussionen so behindern
„ S econd, the filter bubble is invisible.“ [Par13, S. 10] – Da dem Konsumenten die Ziel- setzung der Partei, die für die Inhaltsfilterung verantwortlich ist, nicht hinreichend be- kannt ist, ist es ihm nahezu unmöglich, die entstehende Verzerrung bewusst zu korrigie- ren. Die getroffenen Annahmen, die zu dem jeweiligen Filter führen, treffen nicht zwangs- läufig mit den realen Eigenschaften der Person überein. PARISER argumentiert somit, dass es von innerhalb der Filterblase nahezu unmöglich ist, das Ausmaß des Bias zu erkennen.
„ F i nally, you don’t choose to enter the bubble.“ [Par13, S. 11] – Statt sich die Art der Weltansicht des gewählten Informationsmediums auszusuchen, wird diese dem Konsu- menten durch personalisierte Filter unbewusst auferlegt. Da diese, wie bereits in Kapitel 3.1 behandelt, als Instrument zur Umsatzsteigerung des betreibenden Unternehmens eingesetzt werden, wird es zunehmend komplizierter, sie zu umgehen. Auch MAYERSCHÖNBERGER sieht es als immer schwieriger werdend an, „sich als Individuum in der Masse der Daten erfolgreich zu verstecken“ [MC13, S. 242]. Erschwerend kommt hinzu, dass die Berechenbarkeit der Reaktionen von Konsumenten von Vorteil für diese Unternehmen ist. Demnach liegt es in ihrem Interesse, ein möglichst eingeschränktes und somit kalkulierbares Sichtfeld für den jeweiligen Betrachter zu erzeugen, welches ihn mit Meinungen und Ansichten konfrontiert, die seine eigenen Werte reflektieren. [Par13]
[...]