Durch die Informationsflut haben die Datenmengen in den letzten Jahren rasant zugenommen. Diese Datenberge können wertvolle Informationen enthalten, die zum Verständnis von wichtigen Zusammenhängen beitragen oder die Entscheidungsträger innerhalb eines Unternehmens bei wichtigen Entscheidungen unterstützen. Nicht zu unrecht wird Wissen oftmals als vierter Produktionsfaktor oder als entscheidender Wettbewerbsfaktor bezeichnet. Doch dieses Wissen in den Datenbergen kann oft nicht oder nur unzureichend genutzt werden. Denn Daten sind nicht gleich Information, bzw. Wissen. Im Gegensatz zu den herkömmlichen Verfahren, die auf einfachen statistischen Methoden und Datenbankmanagementsystemen basieren, verbinden Data-Mining Verfahren Methoden aus den Bereichen Statistik, Maschinelles Lernen, Datenbanken und Visualisierung. Diese unterstützen den Benutzer dabei, in großen Datenbeständen verborgene und für das Unternehmen wertvolle Daten aufzufinden. Mithilfe von Data Mining können die Unternehmen quasi einen Blick in die Zukunft werfen und Ereignisse mit einer gewissen Wahrscheinlichkeit voraussagen.
In der nachfolgenden Arbeit wird zuerst in einer Einführung dargestellt, was man unter Data-Mining versteht und der Data-Mining Prozess anhand des CRISP- DM Modells erklärt. Anschließend werden die Data Mining Aufgaben und ihnen zugeordnete Methoden anhand von Beispielen veranschaulicht.
Um die große Bedeutung für die Praxis zu verdeutlichen wird danach ein Überblick der wichtigsten Anwendungsfelder gegeben. Da ein Data Mining ohne Daten unmöglich ist, muss der Zielkonflikt zwischen Data Mining und dem Datenschutz diskutiert werden, bevor in einem Fazit auf die zukünftige Bedeutung des Data Mining eingegangen wird.
Inhaltsverzeichnis
- Einführung und Inhalt der Arbeit
- Data-Mining
- Der CRISP Data Mining Prozess
- Business Understanding
- Data Understanding
- Data Preperation
- Modeling
- Evaluation
- Deployment
- Phasen des Data Mining
- Aufgaben und geeignete Methoden des Data Mining
- Segmentierung
- Clusteranalyse als Methode der Segmentierung
- Beispiel: Single- Linkage Verfahren
- Klassifikation
- Entscheidungsbäume als Methode der Klassifikation
- Fallbeispiel Werbeaktion einer Autoversicherung
- Prognose
- Abhängigkeitsanalyse
- Abhängigkeitsanalyse mit Assoziationsregeln
- Beispiel Getränketransaktionen
- Abweichungsanalyse
- Anwendungsfelder
- Data Mining Werkzeuge
- IBM Intelligent Miner
- SPSS Clementine
- SAS Enterprise Miner
- Zielkonflikt Data Mining und Datenschutz
- Fazit
Zielsetzung und Themenschwerpunkte
Die vorliegende Studienarbeit befasst sich mit dem Thema Data Mining. Ziel der Arbeit ist es, die grundlegenden Prinzipien und Methoden des Data Mining sowie dessen Einsatzmöglichkeiten und Herausforderungen darzustellen.
- Der CRISP-DM-Prozess als Standardmodell für Data Mining Projekte
- Wichtige Aufgaben und Methoden des Data Mining, wie Segmentierung, Klassifikation und Prognose
- Anwendungsfelder des Data Mining in verschiedenen Bereichen
- Beliebte Data Mining Werkzeuge und deren Funktionsweise
- Der Konflikt zwischen Data Mining und Datenschutz
Zusammenfassung der Kapitel
Das erste Kapitel bietet eine Einführung in das Thema Data Mining und skizziert den Inhalt der vorliegenden Arbeit. Kapitel 2 beschäftigt sich mit dem Data Mining Prozess und erklärt das CRISP-DM Modell mit seinen sechs Phasen. Kapitel 3 erläutert verschiedene Aufgaben und Methoden des Data Mining, darunter Segmentierung, Klassifikation, Prognose und Abhängigkeitsanalyse. Anwendungsfelder des Data Mining werden in Kapitel 4 vorgestellt. Kapitel 5 präsentiert verschiedene Data Mining Werkzeuge, wie IBM Intelligent Miner, SPSS Clementine und SAS Enterprise Miner. Das sechste Kapitel beleuchtet den Konflikt zwischen Data Mining und Datenschutz. Die Arbeit schließt mit einem Fazit in Kapitel 7.
Schlüsselwörter
Data Mining, CRISP-DM-Prozess, Segmentierung, Klassifikation, Prognose, Abhängigkeitsanalyse, Anwendungsfelder, Data Mining Werkzeuge, Datenschutz
- Arbeit zitieren
- Diplom-Betriebswirtin (FH) Sandra Feist (Autor:in), 2005, Data Mining als Hilfsmittel für gezielte Datensuche, München, GRIN Verlag, https://www.hausarbeiten.de/document/70663