Diese Arbeit soll eine Einführung in den Einsatz von Data Mining bei der Störungsbeseitigung geben. Als Testobjekt wurde die Störungsdatenbank der SOLVAY Deutschland GmbH in Bernburg gewählt. Es soll geprüft werden, ob diese die Voraussetzungen für Data Mining – Analysen erfüllt und welche Ergebnisse erzielt werden können. Des Weiteren soll ein Ausblick auf weitere Möglichkeiten des Data Mining – Einsatzes gegeben werden. Das Interesse an Data Mining wurde durch ständig auftauchende Berichte, abgehaltene Konferenzen und Wettbewerbe geweckt. Wie z.B. durch den Artikel von Michael Gonzales, dem Geschäftsführer der „Focus Group, Ltd „ einer Unternehmensberatung, die sich auf Data Mining spezialisiert hat. In seinem Artikel beschreibt er die Notwendigkeit der Nutzung von Data Mining für die Bewältigung der Informationsflut und den daraus entstehenden Informationsvorsprung gegenüber anderen Unternehmen. Seiner Meinung ist die Bereitstellung der Daten durch ein Data Warehouse die wichtigste Voraussetzung für die Durchführung von Data Mining – Projekten, da 80% der benötigten Zeit für die Datenaufbereitung benötigt werden. Durch die richtige Vorbereitung der Daten können schneller Ergebnisse erzielt werden und diese für die Entscheidungsfindung genutzt werden.
Inhaltsverzeichnis
- Zielstellung und Vorgehensweise
- Grundlagen des Data Mining
- Daten und Skalen
- Die Entwicklung der Datensammlung und -Auswertung
- Historische Entwicklung
- Das Data Warehouse Konzept
- Definition von Data Mining und KDD
- Vorgehensweise beim Data Mining
- Analyse des Anwendungsgebietes
- Datenaufbereitung
- Methoden der Datenanalyse
- Datenpräsentation
- Basismethoden des Data Mining
- Software
- Weka
- SPSS 10 für Windows
- Clementine 7.0
- Solvay Soda Deutschland GmbH
- Allgemeines
- Die Störungsdatenbank
- Durchführung des Data Mining
- Vermutete Zusammenhänge
- Auswahl der Analysemethoden und der Software
- Übernahme der Daten
- Die Attribute
- Vorbereitung der Daten
- Anwendung der Analysemethoden
- Deskriptive Statistiken
- Vergleich der Zeitdauer mit anderen Attributen
- Kreuztabellen wichtiger Attribute
- Diskriminanzanalyse
- Fazit
Zielsetzung und Themenschwerpunkte
Die Diplomarbeit befasst sich mit der Einführung von Data Mining-Methoden zur Störungsbeseitigung im Unternehmen Solvay Soda Deutschland GmbH. Das Ziel ist es, die Effizienz der Störungsanalyse zu verbessern und die Ursachen für Störungen besser zu verstehen.
- Data Mining-Methoden und deren Anwendung in der Praxis
- Analyse von Störungsdaten zur Identifizierung von Mustern und Trends
- Bewertung der Effizienz von Data Mining-Methoden für die Störungsbeseitigung
- Entwicklung von Handlungsempfehlungen für die Verbesserung der Störungsmanagement-Prozesse
Zusammenfassung der Kapitel
Das erste Kapitel legt die Zielsetzung der Arbeit dar und beschreibt den Vorgehensansatz. Das zweite Kapitel bietet eine Einführung in die Grundlagen des Data Mining, einschließlich der Definition von Daten, Skalen, Data Warehousing und Knowledge Discovery in Databases (KDD). Das dritte Kapitel befasst sich mit der konkreten Vorgehensweise beim Data Mining, einschließlich der Analyse des Anwendungsgebietes, der Datenaufbereitung, der Methoden der Datenanalyse, der Datenpräsentation, der Basismethoden des Data Mining und der verwendeten Software. Das vierte Kapitel gibt einen Überblick über Solvay Soda Deutschland GmbH, mit einem Fokus auf die Störungsdatenbank. Das fünfte Kapitel beschreibt die Durchführung des Data Mining-Prozesses, einschließlich der Auswahl der Analysemethoden, der Datenübernahme, der Attribute und der Vorbereitung der Daten. Schließlich werden die Ergebnisse der Datenanalysen in den Kapiteln 5.7.1 bis 5.7.4 präsentiert, die sich auf deskriptive Statistiken, den Vergleich der Zeitdauer mit anderen Attributen, Kreuztabellen wichtiger Attribute und die Diskriminanzanalyse konzentrieren.
Schlüsselwörter
Data Mining, Störungsbeseitigung, Störungsdatenbank, Datenanalyse, Data Warehousing, KDD, Deskriptive Statistiken, Kreuztabellen, Diskriminanzanalyse, Solvay Soda Deutschland GmbH.
- Arbeit zitieren
- Diplom-Betriebswirt Andre Hiller (Autor:in), 2003, Einführung in den Einsatz von Data Mining, München, GRIN Verlag, https://www.hausarbeiten.de/document/75722