Grundlage der vorliegenden Arbeit ist die Auseinandersetzung von Walter Hehl mit der Thematik in seinem Buchkapitel „Wissen, Verstehen und Intelligenz mit Software“, in dem er auf die verschiedenen Fähigkeiten zur Beantwortung von Fragen durch IT-Systeme eingeht und vor allem die Methodik von Watson anhand der Quizshow Jeopardy! genauer erläutert. Um einen geeigneten Rahmen dafür zu bilden, wird zunächst erläutert, wie kognitive Systeme definiert werden können und prägnant deren historische Entwicklung betrachtet. Im Hauptteil wird auf die Beantwortung von Fragestellungen durch IT-Systeme und dabei aufkommende Problemstellungen; sowie im Speziellen auf die Methoden des Watson-Systems am Jeopardy!- Beispiel eingegangen und mögliche Anwendungsbereiche von kognitiven Systemen aufgezeigt. Abschließend werden die wichtigsten Ergebnisse der Arbeit zusammengefasst, die Arbeit und Vorgehensweise kritisch reflektiert und ein Ausblick in die Zukunft gegeben. Aufgrund des Rahmens der vorliegenden Arbeit und der Thematisierung von IBM Watson in dem zugrundeliegenden Artikel; bezieht sich der Oberbegriff von kognitiven Systemen bzw. Cognitive Computing insbesondere auf die Watson-Technologie des Unternehmens IBM.
Zur genauen Betrachtung der Historie von kognitiven Systemen eignet sich deren historische Einordnung in die drei möglichen Ären der Rechensysteme. In der ersten, tabellarisierenden Ära von ca. 1900 bis 1940 wurden mit mechanischen Maschinen die funktionalen Grundzüge von Computern ergründet. Lochkarten dienten u.A. der ersten Umsetzung des EDV-Prinzips. Die folgende programmierende Ära, welche von 1950 bis heute anhält, beschreibt den Wandel von den mechanischen zu den elektronischen Systemen und umfasst somit alle programmierbaren Systeme, welche noch heutzutage unseren Alltag bestimmen wie Laptops, Tablets und Smartphones. Die letzte Ära, welche 2011 begann, ist die kognitive Ära und beschreibt den Entwicklungsverlauf von programmierbaren Systemen mit Funktionen, die sich an menschliche Fähigkeiten anlehnen wie die Erkenntnisgewinnung durch „Lernen“ und welche den Menschen damit in komplexen Situationen unterstützen können. Die erste Begriffsformulierung zu AI wurde bereits im Jahr 1955 durch John McCarthy angestellt als „the science and engineering of making intelligent machines“. Um 1980 stieg die Forschung um die künstliche Intelligenz erheblich an, bis diese im KI-Winter wieder zurückging
Inhaltsverzeichnis
Abkürzungsverzeichnis
Abbildungsverzeichnis
1 Einleitung ¡ท die Thematik
2 Begriffserläuterung Cognitive Computing
2.1 Definition Cognitive Computing
2.2 Die Entwicklung von kognitiven Systemen
3 Das Verstehen von Fragen durch kognitive Systeme
3.1 Die Beantwortung von Fragestellungen durch IT-Systeme
3.2 Herausforderung bei dem Verständnis von Fragen
3.3 Die Methodik des kognitiven Systems Watson
4 Anwendungsbereiche kognitiver Systeme
5 Schlussbetrachtung
Literaturverzeichnis
Anhang
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Abbildungsverzeichnis
Abb. 1: Unterschied zwischen Watson und Web-Suchmaschinen
Abb. 2: Beweisbasierte Architektur nach Watson DeepQA
Abb. 3: Beziehungsermittlung zwischen Wörtern
Abb. 4: Beweis durch Keywords (links) und tiefes Beweisen (rechts)
Abb. 5: Evidenzbestimmung der Hypothesen
Abb. 6: Screenshot der beantworteten Frage von Wolfram|alpha am 29.05.2016
Abb. 7: Screenshot der beantworteten Frage (A) von Wolfram|alpha am 29.05.2016
Abb. 8: Stichwortsuche über unstrukturierte Datenbestände (exemplarisch: Wikipedia)
1 Einleitung เท die Thematik
Bereits ¡ทา März 1960 schrieb der Informatiker J. c. R. Licklider ¡ท einer seiner Abhandlung: „Man-computer symbiosis ¡ร an expected development ¡ท cooperative interaction between men and electronic computers“ (Licklider 1960: 4). Rund 56 Jahre später und konfrontiert mit einem 800 prozentigen Anstieg der Datenmenge bis 2017, wovon 80 Prozent unstrukturierte Daten sind (Gartner Inc. 2012), ist die Unterstützung des Menschen durch Maschinen mit künstlicher Intelligenz (Kl) eine ubiquitäre Thematik. So überführt Apples Siri automatisch Termine aus Emails ¡ท den Kalender und zeigt ortspezifisch Kontakte an, die zuvor häufiger an diesem Ort angerufen wurden (vgl. Volker 2015: 130 f.). Das Assistenz-Tool Cortaría der Microsoft Cor- peration lernt Präferenzen und schlägt u.a. ortabhängige, auf den Nutzer passende Veranstaltungen vor (vgl. Microsoft Corporation 2016). Auch Google präsentiert kognitive Ansätze ¡ท Google Now, bei dem durch die Kombination von Google-Diensten dem Nutzer bestimmte Informationen wie der Status der Paketsendung, die Fahrzeit zur Arbeit mit aktueller Verkehrslage oder die Boardkarte zur Eincheckzeit angezeigt werden (vgl. Volker 2015: 128 f.). Ende 2015 kündigte das Marktforschungsunternehmen Gartner Inc. (2015: 6 f.) die intelligenten Maschinen als strategischen Technologie-Trend für 2016 an. Als zentrale Voraussetzung wurde dabei die Interaktion von Mensch und Maschine und das damit verbundene Verstehen natürlicher Sprache dargestellt. Ein bedeutender Meilenstein ¡ท dem Zusammenhang war der Sieg von IBM’s Watson ¡ท Jeopardy! und dessen eingesetzte Technologie zum Verstehen natürlicher Sprache (vgl. New York Times 2016; May 2013). In Assoziation mit der technologischen Nachahmung kognitiver Fähigkeiten des Menschen resultiert die folgende Forschungsfrage: Inwiefern kann ein IT-System eine Fragestellung verstehen und beantworten?
Grundlage der vorliegenden Arbeit ist die Auseinandersetzung von Walter Hehl mit der Thematik ¡ท seinem Buchkapitel „Wissen, Verstehen und Intelligenz mit Software“, ¡ท dem er auf die verschiedenen Fähigkeiten zur Beantwortung von Fragen durch IT-Systeme eingeht und vor allem die Methodik von Watson anhand der Quizshow Jeopardy! genauer erläutert.
Um einen geeigneten Rahmen dafür zu bilden, wird zunächst erläutert, wie kognitive Systeme definiert werden können und prägnant deren historische Entwicklung betrachtet. Im Hauptteil wird auf die Beantwortung von Fragestellungen durch IT-Systeme und dabei aufkommende Problemstellungen sowie im Speziellen auf die Methoden des Watson-Systems am Jeopardy!- Beispiel eingegangen und mögliche Anwendungsbereiche von kognitiven Systemen aufgezeigt. Abschließend werden die wichtigsten Ergebnisse der Arbeit zusammengefasst, die Arbeit und Vorgehensweise kritisch reflektiert und ein Ausblick ¡ท die Zukunft gegeben.
Aufgrund des Rahmens der vorliegenden Arbeit und der Thematisierung von IBM Watson ¡ท dem zugrundeliegenden Artikel bezieht sich der Oberbegriff von kognitiven Systemen bzw. Cognitive Computing insbesondere auf die Watson-Technologie des Unternehmens IBM.
2 Begriffserläuterung Cognitive Computing
2.1 Definition Cognitive Computing
„เทา Allgemeinen soll unter [Cognitive Computing] die Orchestrierung von Erkenntnissen aus den unterschiedlichen Disziplinen, wie beispielsweise Philosophie, Psychologie, Informatik, Linguistik, Mathematik und Kognitionswissenschaften verstanden werden. Im Besonderen umfasst Cognitive Computing die Kombination unterschiedlicher wissenschaftlicher Modelle aus den Kognitionswissenschaften und Technologien aus dem Bereich der Künstlichen Intelligenz (Artificial Intelligence) und des Künstlichen Lebens (Artificial Life).“ (Haun 2014: 122)
Diese Definition beschreibt ¡ท umfassender Form, was unter dem Begriff Cognitive Computing (CC) zu verstehen ist und ordnet diesen als ein Teilgebiet von Artificial Intelligence (AI) ein, wie auch Seth Earley (2015: 1). Mit einem derartigen kognitiven System soll die Funktionsweise des menschlichen Gehirns simuliert oder gar nachstellt werden mit dem Ziel, ein universelles, kohärentes und einheitliches System zu entwickeln (vgl. Modha et al. 2011: 62; IBM Corporation 0. J. (a)). Dies wird mit Hilfe selbstlernender Algorithmen realisiert, welche Techniken wie data mining, pattern recognition und natural language processing anwenden. Während Computer seit Jahren schneller kalkulieren und strukturierte Daten verarbeiten, soll CC eine Möglichkeit bieten, Aufgaben zu übernehmen, was mit den Systemen zuvor unmöglich war wie bspw. das Erkennen von Objekten ¡ท einem Bild oder das Verstehen natürlicher Sprache. Die Ausgaben sind dabei nicht nur Antworten auf numerische Probleme, sondern Hypothesen, begründete Argumente und Empfehlungen (vgl. Kelly 2015: 2). Kognitive Systeme, wie Watson von der International Business Machines Corperation (IBM), nutzen dabei sogenannte Deep Learning Algorithmen[1] und neuronale Netzwerke[2], um die zu verarbeitenden Informationen mit bereits erlernten Daten-Sets zu vergleichen. Daraus lässt sich schlussfolgern, dass mit zunehmender Größe der Daten-Sets des kognitiven Systems der Lernprozess besser wird und Daten akkurater verarbeitet werden können (vgl. Marr 2016).
Neben dem Lernen mit vergrößernden Daten-Sets und über die Interaktion mit Mensch und Umfeld zeichnen sich kognitive Systeme dadurch aus, dass sie begründete Entscheidungen anhand der „gelernten“ Daten treffen, also kein menschliches, emotional geleitetes „Bauchgefühl“ besitzen (vgl. Kelly 2015: 2). über die Zielsetzung von kognitiven System besteht derzeit kein Konsens. Einerseits wird postuliert, dass kognitive Systeme Probleme ohne jegliche menschliche Hilfe lösen sollen, andererseits wird die Ansicht vertreten, der Mensch soll mit seiner Intelligenz nicht ersetzt, sondern unterstützt werden (vgl. Rouse 2016; IBM Corporation 0. J. (a)). Von führenden IT-Unternehmen, so Weber (vgl. 2015: 14 f.), wurden vier definierende Kriterien von kognitiven Systemen festgelegt: Adaptivität als Anpassung an die Umwelt, Interaktivität als Einbezug von Nutzerfeedback, Iterativität als Präzisierung eines Problems über Interaktionsstufen und Kontextualität als inhaltliche Einordnung ¡ท Syntax- und Semantik.
2.2 Die Entwicklung von kognitiven Systemen
Zur genauen Betrachtung der Historie von kognitiven Systemen eignet sich deren historische Einordnung ¡ท die drei möglichen Ären der Rechensysteme. เท der ersten, tabellarisierenden Ära von ca. 1900 bis 1940 wurden mit mechanischen Maschinen die funktionalen Grundzüge von Computern ergründet. Lochkarten dienten u.a. der ersten Umsetzung des EDV-Prinzips. Die folgende programmierende Ära, welche von 1950 bis heute anhält, beschreibt den Wandel von den mechanischen zu den elektronischen Systemen und umfasst somit alle programmierbaren Systeme, welche noch heutzutage unseren Alltag bestimmen wie Laptops, Tablets und Smartphones. Die letzte Ära, welche 2011 begann, ist die kognitive Ära und beschreibt den Entwicklungsverlauf von programmierbaren Systemen mit Funktionen, die sich an menschliche Fähigkeiten anlehnen wie die Erkenntnisgewinnung durch „Lernen“ und welche den Menschen damit ¡ท komplexen Situationen unterstützen können (vgl. Kelly 2015: 3 f.; Cognitive Computing Consortium 2014). Die erste Begriffsformulierung zu AI wurde bereits im Jahr 1955 durch John McCarthy angestellt als „the science and engineering of making intelligent machines“ (McCarthy 2007: 2, Erstauflage 1955). Urn 1980 stieg die Forschung um die künstliche Intelligenz erheblich an, bis diese im Kl-Wmter wieder zurückging (vgl. Weber 2015: 14).
Um die Jahrtausendwende waren erste Erfolge ¡ท diesem Bereich zu verzeichnen, als IBM‘s Computer Deep Blue den amtierenden Schachweltmeister Garrí Kasparow schlug (vgl. Hehl 2016: 164 f.). 2005 gewann nach gescheiterten Versuchen im Jahr zuvor das autonome Roboterauto Stanley die 142 Milen lange DARPRA Grand Challenge (vgl. Buehler et al. 2007: 2 f.). Ein einschneidender Meilenstein zur Einläutung der derzeitigen Computing-Ära war jedoch der Sieg des kognitiven Systems Watson der IBM über die amtierenden Weltmeister (Ken Jennings und Brad Rutter) bei der amerikanischen Quizshow Jeopardy! im Februar 2011. เท Jeopardy! geht es um das Finden einer exakten Fragestellung zu einer vorgegebenen Antwort aus dem erweiterten Allgemeinwissen, was nicht nur Wissen, sondern auch die Fähigkeit zur logischen Kombination erfordert (vgl. Hehl 2016: 165). Neben der IBM zeichnen auch andere große Technologie-Unternehmen Erfolge ab. So schlug kürzlich Googles Deepmind mit der Software AlphaGo den bisherigen Weltmeister Lee Sedol im Spiel Go, welches ein komplexes chinesisches Brettspiel mit mehr als 10 hoch 170 möglichen Spielpositionen darstellt (vgl. Has- sabis 2016).
3 Das Verstehen von Fragen durch kognitive Systeme
3.1 Die Beantwortung von Fragestellungen durch IT-Systeme
„Ein gebildeter Mensch kennt wohl einige Zehntausend Wörter [...], aber dazu kommen Millionen von intellektuellen Konstrukten wie ,der Rubikon ist überschritten1 [...] die ein Gebildeter verstehen und verwenden kann und ihren Ursprung kennt“. (Hehl 2016: 162) Demnach legt Hehl (2016: 162 f.) als beispielhaften Wissenstest von Mensch und Computersystem Fragestellungen zugrunde und zeigt so den Unterschied zu kognitiven Systemen.
Tab. 1: เท Anlehnung an die Fragestellungen nach Hehl (2016: 163).
Abbildung in dieser Leseprobe nicht enthalten
Die Fragestellung Typ в ist eine Abfrage anhand von Pattern, die vom Nutzer selbst gegeben werden und von Web-Suchmaschinen wie Google oder Bing ausgeführt werden können. Die Abfrage erfolgt dabei über Assoziationen des Suchbegriffs ¡ท der jeweiligen Datenbank der Suchmaschine; so gesehen stellt die Abfrage schon ein Teil der Antwort dar. Sogenannte „Crawler“ sammeln Informationen zu dem Text inklusive Links und Text-Speicherort der Webseiten und fügen diese der Suchmaschinen-Datenbank hinzu, wo eine Indizierung der Daten erfolgt (vgl. Microsoft Corporation 0. J.). Einzig die Scaling-Problematik[3] [4] der Information stellt bei deren Ranking eine Herausforderung dar, welche jedoch mit einem guten Mechanismus gelöst werden kann, was am Beispiel von Google zu sehen ist (vgl. Hehl 2016: 164).
Die Websoftware Wolfram|alpha stellt eine Weiterentwicklung ¡ท die kognitive Richtung dar. Die Software findet nicht nur Dokumente auf, sondern beantwortet konkret Fragen. Zum Beispiel beantwortet Wolfram|alpha What was the distance between Pluto and Saturn on 07/16/1992? (Typ C) mit 4.521x109 km, weiteren Entfernungseinheiten und Details zu Planeten und dem abgefragten Datum (Abb. 6, siehe Anhang). Die „Suchmaschine“ erkennt demnach Semantik, bspw., dass es sich nicht um Götter handelt, da diese nicht über Distanz ¡ท Beziehung stehen können (Ontologie). Hinzu kommt die Erkenntnis zur Planetenposition und der Distanzberechnung an dem bestimmten Datum. Das Wissen von Wolfram|alpha stammt von Mitarbeitern und sogenannten Kuratoren (vgl. Tacke 2007: 21 f.; Hehl 2016: 169 f.).
Bei einer Kenntnisfrage wie nach der Hauptstadt der Schweiz (Typ A) handelt es sich um keine reine Suchabfrage, daher wird es bei einigen Suchmaschinen-Ergebnissen schwierig, die richtige Antwort im Kontext der Frage zu finden. Teilweise resultiert, wie bei Wolfram|alpha, das inkorrekte Ergebnis Bern (Abb. 7, ร. Anhang). Daraus schlussfolgert Hehl, dass „der intelligente Umgang mit unsicherer Information [...] zu einer zentralen Aufgabe“ (Hehl 2016: 164) wird. Im Gegenteil dazu analysiert das kognitive System Watson die Frage, sucht mögliche Antworten ¡ท strukturierten und unstrukturierten Daten und erzeugt Evidenzen zu den Antworten, um dem Nutzer die treffendste Antwort zu präsentieren, wie ¡ท der Abbildung 1 verdeutlicht wird (vgl. IBM Research 2012: 2).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1 : Unterschied zwischen Watson und Web-Suchmaschinen (i. A. a. IBM Research 2012: 2).
3.2 Herausforderung bei dem Verständnis von Fragen
เท Bezug auf die Beantwortung von Fragestellungen am Beispiel von Watson erläutert Hehl (2016: 164-169) einige Herausforderungen. Zum einen stellt das Scaling ein Problem dar, da mit der heutigen Zeit von Big Data[5] eine enorm hohe Datenmenge und -Vielfalt und teilweise auch widersprüchliche Daten vorzufinden sind, was das Finden der Lösungsdaten innerhalb des vorhandenen Datenpools erschwert. Somit wird die Einschätzung der Verazität[6] einer Information für Mensch sowie Maschine stets schwieriger.
Zum anderen ist die natürliche Sprache, welche voller Zweideutigkeiten, Anspielungen, Idiosynkrasien und idiomatischen Ausdrücke ist, eine Herausforderung. Das Verständnis von Ausdrücken im Kontext stellt vor allem für eine Software eine Schwierigkeit aufgrund des Umfangs und der Vielfältigkeit von Wissensobjekten und deren Beziehungen untereinander dar. Selbst der Mensch weißt nur ein assoziatives Netzwerk von Wissen mit Lücken auf, jedoch reicht dies, um für das Gefühl zu sorgen, dass „wir verstehen“ (vgl. Anderson 2012: 223 f.).
Eine weitere Herausforderung sieht Hehl (2016: 167 f.) ¡ท dem Symbol Grounding Problem, also der Problematik, wie die Maschine die Bedeutung eines bestimmten Objektes und dessen Zusammenhang mit anderen Objekten verstehen kann. Letztlich bezieht sich dies auf die grundlegenden Fragen von stevan Harnad, wie einem Objekt eine Bedeutung zugeschrieben wird und wie die Bedeutung selbst deklariert ist (vgl. Lercher 2009: 11 f.).
Schlussendlich nennt Hehl (2016: 168 f.) logische Herausforderungen ¡ท Verbindung mit der indexikalischen Semantik, also dem Verständnis deiktischer Ausdrücke als Bezugnahme. Dies betrifft Fälle, bei denen die Aussage Z.B. einer Textpassage ¡ท Raum, Zeit oder im Zusammenhang mit dem jeweiligen Umfeld bestimmt werden muss, um diese sinnvoll interpretieren zu können, wie beispielweise die Ausdrücke „¡ท unserer Zeit“ oder „dort“.
3.3 Die Methodik des kognitiven Systems Watson
Die Funktionsweise zum Verstehen und anschließendem Beantworten einer Frage durch das kognitive System IBM Watson ist wesentlich komplexer, als ¡ท der Abbildung 1 dargestellt und wird folgend an dem gewählten Beispiel von Hehl, Jeopardy!, erläutert. Watson arbeitete bei der Show Jeopardy! mit 15 Terabyte RAM, 2880 Prozessorkernen und einer Größe mehrerer Kühlschränke. Heute hat das System circa eine Größe von drei Pizzaschachteln, ist 2.400% leistungsstärker und ist 24 Mal so schnell (vgl. Deedrick 2011 ; IBM Corporation 2014).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2: Beweisbasierte Architektur nach Watson DeepQA (i. A. an IBM Corporation 2011a).
Der mit der Abbildung 2 beschriebene Algorithmus wurde über einhundertmal ¡ท Watson integriert, sodass jede Komponente des Systems eine Bedeutung zu der Frage und eine hypothetische Antwort hinzufügen kann. Die im Folgenden zur Erklärung verwendete Jeopardy! - Frage lautet: Im Jahre 1897 hat der schweizer Kletterer Matthias Zurbriggen als erster diesen argentinischen Gipfel bestiegen.
Der sogenannte Clue wird ¡ทา ersten Schritt durch Watson ¡ท Teilstücke (Tokens) zerlegt, um die Bedeutung der Frage zu identifizieren. Bei der Zerlegung werden gleichzeitig Beziehungen zwischen Wörtern ermittelt, um den Fokus des Clues zu bestimmen wie beispielsweise „diesen argentinischen Gipfel“ (vgl. Nimführ2011: 15). เท Bezug auf das Symbol Grounding Problem hat Watson mit Hilfe des Menschenfeedbacks grundsätzlich die Bedeutung einiger Worte der natürlichen Sprache mit der von dem Menschen verwendeten Bedeutungszuschreibung „verstanden“ und kann dies ทนท auf weitere Fälle anwenden. Watson imitiert so gesehen das assoziative Netzwerk des Menschen, indem Watson „ausgehend von einem Wissensknoten die Umgebung ausbau[t] mit Fakten, Fähigkeiten und Verbindungen zu anderen Knoten“ (Hehl 2016: 167). Die Abbildung 3 zeigt hierzu die kontextbezogene Zerlegung der Frage durch das Watson-System.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 3: Beziehungsermittlung zwischen Wörtern (i. A. a. Nimführ 2011: 15).
Im zweiten Schritt durchsucht das System seine Datenbanken, den sogenannten Korpus, mit hunderten Quellen nach den signifikanten Tokens bzw. Token-Kombinationen, um relevante Passagen zum Clue zu finden. Die mehrere Millionen Dokumente umfassende Suche der Passagen beinhaltet dabei sowohl strukturierte als auch unstrukturierte Daten (Abb. 8, siehe Anhang). Neben der Datenbank von Watson kann dessen Suche auch das World Wide Web mit aktuellen Nachrichten, Social Media Posts sowie Sensor- und Unternehmensdaten inkludieren. Bei Jeopardy! wurden jedoch nur zuvor integrierte Daten ohne WWW-Anschluss verwendet (vgl. IBM Corporation 0. J. (b); Hehl 2016: 166).
Durch Analyse der gefundenen Dokumente, Daten bzw. Textpassagen werden mögliche Entitäten (Hypothesen) im dritten Schritt generiert und vorstellbar ¡ท einer Liste extrahiert. Dabei gilt es, eine größtmögliche Abdeckung zur erhalten, d.h. alle möglichen Hypothesen aufzunehmen. เท dem Kontext wären das u.a. Berge, Personen und Orte (vgl. Nimführ2011; 17).
เท hochparallelisierter Arbeitsweise wendet Watson im vierten Schritt über 100 Deep Evidence Scoring Algorithmen an, um diese Hypothesen hinsichtlich ihrer Wahrscheinlichkeit als passende Antwort zu identifizieren. Diese Algorithmen gehören zu der eingesetzten Watson-Tech- nologie DeepQA, die entwickelt wurde, um Fragen ¡ท entsprechender Qualität und Zeit liefern zu können und die nach dem probabilistischen Nachweisprinzip arbeitet (vgl. IBM Corporation 2011b: 3 f.). Der Hauptansatz von DeepQA ist die Ansicht und Nachverfolgung mehrerer Interpretationsmöglichkeiten einer Frage und somit verschiedenen zutreffenden Antworten, was das Problem der Mehrdeutigkeit und kontextsensitiven Bedeutung natürlicher Sprache adressiert. Bei einem einfachen Ansatz zum Hypothesenbeweis besteht die Gefahr, dass Eigenschaften nicht berücksichtigt werden und die Interpretation zum falschen Ergebnis gelangt.
Exemplarisch wird ¡ท der Abbildung 4 der Unterschied eines einfachen Schlüsselwortvergleichs und eines beispielhaften Vergleichs durch die Methode von DeepQA präsentiert. เท beiden Varianten ist die Frage ¡ท blauer und die mögliche Information aus Watsons Datenbasis ¡ท grüner Farbe dargestellt (vgl. Nimführ2011: 12).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 4: Beweis durch Keywords (links) und tiefes Beweisen (rechts) (i. A. a. Nimführ 2011: 12 f.).
Gesuchte Schlüsselwörter werden folglich nicht direkt verglichen, sondern zumeist ¡ท einer zusätzlich (tieferen) Schicht betrachtet mit beispielsweise dem Einbezug von Synonymen oder der Betrachtung der indexikalischen Semantik von Ort und Zeit (vgl. Nimführ 2011: 13). Nur so kann Watson ein tiefergehendes „Verständnis“ für Fragen wie „Auch solch ein kaputtes Ding an der Wand hat zweimal am Tag recht“ entwickeln (vgl. Hehl 2016: 169 f.). เท Bezug auf die Evidence Scoring Algorithmen von DeepQA nennt Nimführ (2011: 18) drei als besonders entscheidende Methoden.
- Type coercion: Es erfolgt eine Prüfung, mit welcher Wahrscheinlichkeit die Hypothese vom richtigen Typ ist. Demnach ist die Wahrscheinlichkeit, dass es sich bei dem Ausdruck Everest um den gesuchten Typ „Gipfel“ handelt höher als bei Stuart Vines.
- Temporal match: Diese Evidenz-Prüfung ist eine der wichtigsten Faktoren und stellt die Prüfung dar, ob die Frage eine zeitliche oder datierte Referenz besitzt. Dabei werden Ausdrücke wie „Im Jahr 1897“ oder „der 400. Jahrestag“ ¡ท konkrete, vom System verarbeitbare Größen umgewandelt, um einen zeitliches „Denken“ zu ermöglichen.
- Passage Scorer: Die Abschnittsbewertungsmethode ist eine der wichtigsten und validiert mit komplexen Bewertungsalgorithmen die Evidenz einer Passage.
Im letzten Schritt werden die Ergebnisse ¡ท bedeutungsgleichen Gruppen (evidence dimensions) zusammengefasst und es entsteht ein Evidenz-Profil. Dies wird letztlich durch Watson statistisch konsolidiert, um eine Konfidenz der Antworten zu erhalten. เท Jeopardy! hat Watson die Konfidenz zusätzlich u.a. mit der Wahrscheinlichkeit abgeglichen, dass dessen Konkurrenten das Spiel gewinnen mit den Punkten, die diese bekommen würden, wenn Watson nicht antwortet (vgl. Hehl 2016: 169; Nimführ 2011: 19).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 5: Evidenzbestimmung der Hypothesen (i. A. a. Nimführ 2011: 19).
4 Anwendungsbereiche kognitiver Systeme
Das „tiefe Verständnis“, das beispielhaft Watson น. a. mit der vorgestellten DeepQA-Techno- logie erreichen kann, sieht Hehl (2016: 170) als eine „Weiterentwicklung des Verstehens natürlicher Sprache hin zur Interaktion und schliesslich zur Problemlösung und zum Handeln“. IBM’s Senior Vice President des Cognitive Solutions Teams John Kelly (2015: 7 f.) beschreibt dahingehend die Anwendungsvielfalt kognitiver Systemen ¡ท folgenden Kernkompetenzen:
1.) Erhöhung der Personalisierung: Durch die Auswertung von bspw. Webinteraktionen,
Kaufhistorien und Wearable-Daten und die Kombination mit den Stimmungen/Beziehungen einer Person kann ein personalisiertes Profil einer Person erstellt und eine bessere Kommunikation zu dem Kunden geschaffen werden, z. B. im Einzelhandel.
2.) Skalieren und Erhöhung von Expertise: Mittels Bündelung und Analyse wichtiger
Informationen kann Fachkräften Expertenwissen zur Verfügung gestellt werden, was sonst aufgrund von Umfang/Komplexität unmöglich wäre Z.B. im Gesundheitsbereich.
3.) Erweiterung um kognitive Komponenten: Durch die Erweiterung um kognitive Kom
ponenten kann mit Dienstleistungen/Produkten auf Nutzerverhalten und -feedback ¡ท Echtzeit reagiert und Verbesserungsprozesse verwirklicht werden Z.B. Auto-Industrie.
4.) Verbesserung von Betriebsprozessen: Durch präzise Analysen interner und exter ner Betriebsprozesse und weiterer Daten wie des Wetters können Z.B. Personenstunden zur Fehlersuche eingespart oder Entscheidungsempfehlungen gegeben werden.
5.) Erhöhung des Explorationspotenzials: Das Erkennen von Verhaltensmustern und Trends verhilft zu absehbaren Zukunftserkenntnissen, wodurch bspw. Unternehmen Entscheidungshilfen bei Investitionen oder Neuausrichtung erlangen können durch regelbasierte und Datenquellen und abteilungsübergreifende kognitive Fähigkeiten.
Mit der ersichtlich großen Anwendungsvielfalt lassen sich auch die vielseitigen Anwendungsbereiche erklären mit möglichen Einsätzen ¡ท: Rat- und Auskunftgebern, autonomen Fahr- und Flugzeugen, Produktions- und Dienstrobotern, Diagnostik, Senioren- und Krankenpflege und Sicherheits- und Finanzwesen (vgl. Weber: 9). Das Potenzial von Watson als medizinischer kognitiver Assistent, das Hehl (2016:170 f.) sah, u.a. durch Kausalkettenbildung mit Hilfe eines enormen Expertenwissens und darauf basierende Diagnose, ist bereits umgesetzt (vgl. Mo- negain 2016). Der kognitive Assistent Amelia von IPsoft versteht mehrere Sprachen und Emotionen und antwortet bezugnehmend. Im Mai 2015 gab es ¡ท diversen Unternehmen Pilotprojekte wie bei Accenture zur Unterstützung von Remote-Arbeitern (vgl. Ankeny 2015). Ein Jahr später führten Accenture und IPsoft einen Accelerator ein, um Kunden ins Al-Business zu begleiten (vgl. Accenture Plc 2016).
5 Schlussbetrachtung
Angesichts des durch Gartner Inc. 2015 prognostizierten Anstiegs von v.a. unstrukturierten Daten, welche mit den vorhandenen analytischen Techniken nicht zu bewältigen sind und des Fortschrittes von intelligenten Maschinen, der unmittelbar nach dem Sieg von IBM’s Watson ¡ท der Quizshow Jeopardy! angestoßen wurde, sind kognitive Systeme heutzutage ein omni- präsentes Thema und als ein strategischer IT-Trend seit 2016 zu sehen. Eine zentrale Voraussetzung bei diesen Systemen ist die Kommunikation mit dem Menschen und damit das Verstehen und Verarbeiten natürlicher Sprache. Ziel dieser Arbeit bildete daher folgende Forschungsfrage, welche anhand des kognitiven Systems Watson beantwortet wurde: Inwiefern kann ein IT-System eine Fragestellung verstehen und beantworten?
Bei der Beantwortung von Fragestellungen durch verschiedene IT-Systeme wurden unterschiedliche Arbeitsweisen identifiziert. Dabei gibt es sowohl Pattern-basierte Suchalgorithmen, welche Fragen mit gerankten Antwortmöglichkeiten ausgeben wie Google, Suchalgorithmen, die Semantik erkennen und so Verknüpfungen zwischen den Suchbegriffen herstellen können, um auf konkrete Fragen zu antworten wie Wolfram|alpha sowie IT-Systeme, welche die Fragen bis ins Detail „verstehen“ und ihre Antwort nach einem probabilistischen Nachweisprinzip ähnlich dem menschlichen Denkmuster auswählen wie bspw. Watson. Diese Systeme können dadurch u.a. mit der Symbol Grounding Problematik und unsicheren Informationen umgehen.
Schlussfolgernd werden durch komplexe Synthese fortschrittlicher Technologien und Algorithmen, wie es an Watson aufgezeigt wurde, einem neuronalen Netzwerk des Menschen ähnliche, technische Strukturen aufbaut. Bei Watson erfolgt das Verstehen einer Frage und das „Lernen“ demnach wie bei den Menschen ausgehend von einem Wissensknoten durch das Schaffen von Verbindung zu anderen Wissensknoten. Basis dafür ist eine dem System beigebrachte grundsätzliche Bedeutungszuschreibung. Die Beantwortung einer Frage geschieht folglich über einen Abwägungsprozess der möglichen Antworten der Wissensbasis des Systems, wobei jede Antwort auf ihre Evidenz überprüft wird und die Geeignetste ausgewählt wird.
Reflektierend ist anzumerken, dass Cognitive Computing einen stetig wachsenden Bereich darstellt und im Rahmen dieser Arbeit lediglich ein Teilaspekt ¡ท eingeschränkter Tiefe betrachtet werden konnte. Weiterhin wurde festgestellt, dass das Buchkapitel trotz dessen datierbarer Aktualität den aktuellen Fortschritt nicht wiederspiegeln kann, wodurch viele Quellen hinzugezogen wurden, um dem heutigen Stand gerecht zu werden. เท zukünftiger Forschung könnten bereits umgesetzte Anwendungsszenarien kognitiver Systeme mit wirtschaftlichen Kenngrößen betrachtet werden, wie eingesparte monetäre Aufwände von Firmen durch verminderte Personenstunden oder gezieltes Agieren auf Empfehlungen basierend auf kognitiven Prognosen. Des Weiteren sind Untersuchungen bzgl. der Grenzen kognitiver Systeme bzw. der moralischen Frage nach dem Ende der Maschinenautonomie möglich.
Literaturverzeichnis
Accenture Plc (2016): Accenture Amelia Practice to Help Organizations Accelerate Adoption of Artificial Intelligence, [online] https://newsroom.accenture.com/news/accenture-and- ipsoft-launch-accenture-amelia-practice-to-help-organizations-accelerate-adoption-of- artificial-intelligence.htm [28.05.2016].
Anderson, John R. (2012): Kognitive Psychologie, Berlin: Springer Berlin Heidelberg.
Ankeny, Jason (2015): Meet Amelia, the Al Platform That Could Change the Future of IT, [online] https://www.entrepreneur.com/article/245827 [28.05.2016].
Buehler, Martin, Karl lagnemma und Sanjiv Singh (2007): The 2005 DARPA Grand Challenge.The Great Robot Race, Berlin: Springer Berlin Heidelberg.
Cognitive Computing Consortium (2014): Cognitive Computing Definition, [online] https://cog- nitivecomputingconsortium.com/definition-of-cognitive-computing [24.05.2016].
Deedrick, Tami (2011): It’s Technical, Dear Watson, [online] http://www.ibmsystems- mag.com/ibmi/trends/whatsnew/lt%E2%80%99s-Technical,-Dear-Watson/ [30.05.2016].
Deng, Li und Dong Yu (2013): Deep Learning. Methods and Applications, ¡ท: Eldar Yonina (Hrsg.), Foundations and Trends® เท Signal Processing, Voi. 7, Nos 3-4, ร. 197-387.
Earley, Seth (2015): Executive Roundtable Series. Machine Learning and Cognitive Computing”, ¡ท: IEEE IT Professional, Voi. 17, No. 4, ร. 56-60.
Gartner Inc. (2012): Predicts 2013: Business Intelligence and Analytics Need to Scale Up to Support Explosive Growth ¡ท Data Sources, [online] https://www.gart- ner.com/doc/2269516/predicts—business-intelligence-analytics [28.05.2016].
Gartner Inc. (2015): Top 10 strategic Technology Trends for 2016: At a Glance, [online] https://www.t-systems.de/news-media/gartner-top-10-strategic-technology-trends-for- 2016-at-a-glance/1406184_1/blobBinary/gartner_top10.pdf [01.06.2016].
Hassabi, Demis (2016): AlphaGo: using machine learning to master the ancient game of Go, [online] httpsd4.05.2016] .
Haun, Matthias (2014): Cognitive Computing, Berlin: Springer Berlin Heidelberg.
Hehl, Walter (2016): Wechselwirkung. Wie Prinzipien der Software die Philosophie verändern, Berlin: Springer Berlin Heidelberg.
IBM Corporation (2011a): The DeepQA Research Team, [online] http://researcher.wat- son.ibm.com/researcher/view_group_subpage.php?id=2159 [30.05.2016].
IBM Corporation (2011 b): Watson - Antworten mit System. Die Zukunft des workloadopti- mierten Systemdesigns, о. о.: IBM Corporation.
IBM Research (2012): Building Watson: A Brief Overview of the DeepQA, New York: IBM Corporation.
IBM Corporation (2014): Neue Watson Services aus der Cloud, [online] http://www- 03.ibm.com/press/de/de/pressrelease/42900.wss [30.05.2016].
IBM Corporation (o. J.(a)): What ¡ร Watson?, [Intranet] http://www.ibm.com/smarter- planet/us/en/ibmwatson/what-is-watson.html [26.05.2016].
IBM Corporation (o. J. (b)): Is Watson artificial intelligence?, [online] https://w3-work- place.ibm.com/ibm/thinkacademy/?cache=4-23-17#/one-question/is-watson-artificial-in- telligence [23.05.2016].
Kelly, John E. 2015: Computing, cognition and the future of knowing. How humans and machines are forging a new age of understanding, [online] http://www.research.ibm.com/software/IBMResearch/multimedia/Computing_Cognition_ WhitePaper.pdf [23.05.2016].
Klein, Dominik, Phuoc Tran-Gia und Matthias Hartmann (2013): Big Data, [online] https://www.gi.de/service/informatiklexikon/detailansicht/article/big-data.html [25.05.2016] .
Lercher, Silvia und Alexandra Heinisch (2009): The Symbol Grounding Problem, [online] https://www.uibk.ac.at/psychologie/mitarbeiter/leidlmair/the_symbol_grounding_prob- lem_seminararbeit.pdf [25.05.2016].
Licklider, J. c. R. (1960): Man-Computer Symbiosis, ¡ท: IRE Transactions on Human Factors in Electronics, Voi. HFE-1, ร. 4-11.
Marr, Bernard (2016): What Everyone Should Know About Cognitive Computing, [online] http://www.forbes.com/sites/berriardmarr/2016/03/23/what-everyone-should-know-about- cognitive-computing/#2837de165d6e [23.05.2016].
May, Kate T. (2016): How did supercomputer Watson beat Jeopardy champion Ken Jennings?.Experts discuss., [online] http://blog.ted.com/how-did-supercomputer-watson- beat-jeopardy-champion-ken-jennings-experts-discuss/ [28.05.2016].
McCarthy, John (2007): What ¡ร artificial intelligence?, Standford, CA: Standford University.
Microsoft Corporation (o. J.): Grundlegendes zur Funktionsweise von Suchmaschinen, [online] https://msdn.microsoft.com/de-de/library/ff724041 %28v=expression.40%29.aspx [24.05.2016] .
Microsoft Corporation (2016): Grundlegendes zur Funktionsweise von Suchmaschinen, [online] https://support.microsoft.eom/en-us/help/11694/windows-phone-cortana-on-your- windows-phone [27.05.2016].
Modha, Dharmendra ร., Rajagopal Ananthanarayanan, Steven K. Esser, Anthony Ndirango, Anthony J. Sherbondy und Raghavendra Singh (2011): Cognitive Computing, ¡ท: Communications of the ACM, Vol. 54, Nr. 8, ร. 62-71.
Moriegairi, Berme (2016): IBM Watson teams up with American Cancer Society to pit cognitive computing against cancer, [online] http://www.healthcareitnews.com/news/ibm-wat- son-teams-american-cancer-society-pit-cognitive-computing-against-cancer [02.06.2016] .
New York Times (2016): The Promise of Artificial Intelligence Unfolds ¡ท Small Steps, [online] http://www. nytimes. com/2016/02/29/technology/the-promise-of-artificial-intelligence-un- folds-in-small-steps.html?_r=0 [28.05.2016].
Nimführ, Wolfgang (2011): Watson - Ein lernendes Computersystem, Zürich: IBM Corporation.
Rouse, Margaret (2016): Cognitive Computing, [online] http://whatis.techtarget.com/defini- tion/cognitive-computing [23.05.2016].
Tacke, Oliver (2007): Wissensmaschine zweckentfremndet: Business Intelligence mit Wolf- ram|alpha, ¡ท: Wirtschaft und Management, Voi. 1, Nr. 4, ร. 20-23.
Volker, Zota (2015): Digitale Assistenten, ¡ท: c’t magazine für computer technik, Nr. 16/2015, ร. 122-142.
Weber, Mathias (2015): Kognitive Maschinen - Meilenstein in der Wissenschaft. Leitfaden, Berlin: Bundesverband Informationswirtschaft, Telekommunikation und neue Medien e.v.
Anhang
Abbildung in dieser Leseprobe nicht enthalten
Abb. 6: Screenshot der beantworteten Frage von Wolfram|alpha am 29.05.2016.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 7: Screenshot der beantworteten Frage (A) von Wolfram|alpha am 29.05.2016.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 8: Stichwortsuche über unstrukturierte Datenbestände (exemplarisch: Wikipedia).
[1] Deep Learning ist eine Klasse von Machine Learning Techniken, die auf multiplen Ebenen von nichtlinearen Information arbeiten und eine Methode zum bewachten oder unbewachten Lernen von abstrakteren Schichten darstellen (vgl. Deng 2014).
[2] Das neuronale Netzwerk beschreibt dabei einen komplexen Daten-Entscheidungsbaum, den das Computer-System durchläuft, um letztlich die passende Antwort zu verifizieren (vgl. Marr 2016).
[3] Die Scaling-Problematik bei der Begriffssuche zielt heute auf die Masse an Informationen ab, aus denen die passendsten Ergebnisse der Suchbegriffe auswählt werden sollen (vgl. Hehl 2016: 164).
[5] Big Data ist ein abstrakter Begriff für die bestehende Menge und Art von Daten und deren Anstieg, der mit traditioneller Datenanalyseverfahren nicht mehr zu bewältigen ist (vgl. Klein et al. 2013).
Häufig gestellte Fragen
Was ist Cognitive Computing (CC) und wie wird es definiert?
Cognitive Computing (CC) ist die Orchestrierung von Erkenntnissen aus verschiedenen Disziplinen wie Philosophie, Psychologie, Informatik, Linguistik, Mathematik und Kognitionswissenschaften. Es umfasst die Kombination unterschiedlicher wissenschaftlicher Modelle aus den Kognitionswissenschaften und Technologien aus den Bereichen Künstliche Intelligenz (AI) und Künstliches Leben.
Wie hat sich Cognitive Computing entwickelt?
Die Entwicklung von Rechensystemen lässt sich in drei Ären einteilen: die tabellarisierende Ära (ca. 1900-1940), die programmierende Ära (1950-heute) und die kognitive Ära (ab 2011). In der kognitiven Ära werden programmierbare Systeme mit Funktionen entwickelt, die sich an menschlichen Fähigkeiten orientieren, wie z.B. die Erkenntnisgewinnung durch "Lernen".
Was ist das Symbol Grounding Problem und welche Herausforderungen gibt es beim Verständnis von Fragen durch kognitive Systeme?
Das Symbol Grounding Problem beschreibt die Problematik, wie Maschinen die Bedeutung eines bestimmten Objektes und dessen Zusammenhang mit anderen Objekten verstehen können. Weitere Herausforderungen sind das Scaling (Verarbeitung großer Datenmengen), die natürliche Sprache (Zweideutigkeiten, Anspielungen) und logische Herausforderungen in Verbindung mit indexikalischer Semantik.
Wie funktioniert das kognitive System Watson beim Verstehen und Beantworten von Fragen?
Watson zerlegt die Frage in Teilstücke (Tokens), ermittelt Beziehungen zwischen Wörtern, durchsucht Datenbanken nach relevanten Passagen, generiert Hypothesen und wendet Deep Evidence Scoring Algorithmen an, um die Wahrscheinlichkeit der Hypothesen als passende Antwort zu identifizieren. Die Ergebnisse werden in Evidenz-Profilen zusammengefasst und statistisch konsolidiert.
Welche Anwendungsbereiche gibt es für kognitive Systeme?
Kognitive Systeme können in verschiedenen Bereichen eingesetzt werden, wie z.B. zur Erhöhung der Personalisierung, zur Skalierung und Erhöhung von Expertise, zur Erweiterung um kognitive Komponenten, zur Verbesserung von Betriebsprozessen und zur Erhöhung des Explorationspotenzials. Konkrete Anwendungen gibt es z.B. in Rat- und Auskunftgebern, autonomen Fahrzeugen, Produktions- und Dienstrobotern, Diagnostik, Senioren- und Krankenpflege sowie Sicherheits- und Finanzwesen.
Was ist DeepQA?
DeepQA ist die von IBM entwickelte Technologie, die Watson verwendet. Sie wurde entwickelt, um Fragen in entsprechender Qualität und Zeit zu liefern und arbeitet nach dem probabilistischen Nachweisprinzip.
Was sind die wichtigsten Evidence Scoring Algorithmen in DeepQA?
Einige der wichtigsten Evidence Scoring Algorithmen sind: Type coercion (Prüfung, ob die Hypothese vom richtigen Typ ist), Temporal match (Prüfung, ob die Frage eine zeitliche Referenz besitzt) und Passage Scorer (Validierung der Evidenz einer Passage).
- Arbeit zitieren
- Hannes Ueberschär (Autor:in), 2016, Das „Denken“ von kognitiven Systemen, München, GRIN Verlag, https://www.hausarbeiten.de/document/373383