Diese Arbeit soll eine Einführung in den Einsatz von Data Mining bei der Störungsbeseitigung geben. Als Testobjekt wurde die Störungsdatenbank der SOLVAY Deutschland GmbH in Bernburg gewählt. Es soll geprüft werden, ob diese die Voraussetzungen für Data Mining – Analysen erfüllt und welche Ergebnisse erzielt werden können. Des Weiteren soll ein Ausblick auf weitere Möglichkeiten des Data Mining – Einsatzes gegeben werden. Das Interesse an Data Mining wurde durch ständig auftauchende Berichte, abgehaltene Konferenzen und Wettbewerbe geweckt. Wie z.B. durch den Artikel von Michael Gonzales, dem Geschäftsführer der „Focus Group, Ltd „ einer Unternehmensberatung, die sich auf Data Mining spezialisiert hat. In seinem Artikel beschreibt er die Notwendigkeit der Nutzung von Data Mining für die Bewältigung der Informationsflut und den daraus entstehenden Informationsvorsprung gegenüber anderen Unternehmen. Seiner Meinung ist die Bereitstellung der Daten durch ein Data Warehouse die wichtigste Voraussetzung für die Durchführung von Data Mining – Projekten, da 80% der benötigten Zeit für die Datenaufbereitung benötigt werden. Durch die richtige Vorbereitung der Daten können schneller Ergebnisse erzielt werden und diese für die Entscheidungsfindung genutzt werden.
Inhaltsverzeichnis
- 1. Zielstellung und Vorgehensweise
- 2. Grundlagen des Data Mining
- 2.1 Daten und Skalen
- 2.2 Die Entwicklung der Datensammlung und -Auswertung
- 2.2.1 Historische Entwicklung
- 2.2.2 Das Data Warehouse Konzept
- 2.2.3 Definition von Data Mining und KDD
- 3. Vorgehensweise beim Data Mining
- 3.1 Analyse des Anwendungsgebietes
- 3.2 Datenaufbereitung
- 3.3 Methoden der Datenanalyse
- 3.4 Datenpräsentation
- 3.5 Basismethoden des Data Mining
- 3.6 Software
- 3.6.1 Weka
- 3.6.2 SPSS 10 für Windows
- 3.6.3 Clementine 7.0
- 4. Solvay Soda Deutschland GmbH
- 4.1 Allgemeines
- 4.2 Die Störungsdatenbank
- 5. Durchführung des Data Mining
- 5.1 Vermutete Zusammenhänge
- 5.2 Auswahl der Analysemethoden und der Software
- 5.4 Übernahme der Daten
- 5.5 Die Attribute
- 5.6 Vorbereitung der Daten
- 5.7 Anwendung der Analysemethoden
- 5.7.1 Deskriptive Statistiken
- 5.7.2 Vergleich der Zeitdauer mit anderen Attributen
- 5.7.3 Kreuztabellen wichtiger Attribute
- 5.7.4 Diskriminanzanalyse
Zielsetzung und Themenschwerpunkte
Diese Arbeit untersucht den Einsatz von Data-Mining-Methoden zur Störungsbeseitigung bei der Solvay Soda Deutschland GmbH. Ziel ist es, potentielle Zusammenhänge zwischen verschiedenen Attributen (z.B. Zeitaufwand, Temperatur, Produktionswerte) und dem Auftreten von Störungen aufzudecken und so die Effizienz der Störungsbeseitigung zu verbessern.
- Anwendung von Data-Mining-Techniken zur Analyse von Störungsdaten
- Identifizierung von Mustern und Zusammenhängen zwischen verschiedenen Parametern und Störfällen
- Bewertung verschiedener Data-Mining-Methoden hinsichtlich ihrer Eignung für die Problemlösung
- Entwicklung eines optimierten Vorgehensmodells für die Störungsbeseitigung
- Verbesserung der Effizienz der Störungsbeseitigung bei Solvay
Zusammenfassung der Kapitel
1. Zielstellung und Vorgehensweise: Dieses Kapitel beschreibt die Zielsetzung der Arbeit, nämlich die Anwendung von Data-Mining-Methoden zur Verbesserung der Störungsbeseitigung bei Solvay. Es wird die Vorgehensweise skizziert, die von der Analyse des Anwendungsgebietes über die Datenaufbereitung und die Auswahl geeigneter Methoden bis hin zur Datenpräsentation reicht. Das Kapitel legt den methodischen Rahmen für die gesamte Untersuchung fest und definiert die zentralen Forschungsfragen.
2. Grundlagen des Data Mining: Dieses Kapitel liefert die theoretischen Grundlagen für das Verständnis des Data Mining. Es beginnt mit einer Einführung in Daten und Skalen und beleuchtet die historische Entwicklung des Data Mining und des Data-Warehouse-Konzepts. Die Definition von Data Mining und Knowledge Discovery in Databases (KDD) wird detailliert erläutert, um den Kontext der angewandten Methoden zu klären. Dieser Abschnitt legt den notwendigen theoretischen Hintergrund für die spätere praktische Anwendung im Unternehmenskontext dar.
3. Vorgehensweise beim Data Mining: In diesem Kapitel wird die praktische Vorgehensweise beim Data Mining detailliert beschrieben. Es umfasst die Analyse des Anwendungsgebietes bei Solvay, die Aufbereitung der Störungsdaten, die Auswahl und Anwendung geeigneter Datenanalysemethoden sowie die Präsentation der Ergebnisse. Es werden verschiedene Basismethoden des Data Mining vorgestellt und die verwendete Software (Weka, SPSS, Clementine) erläutert. Das Kapitel beschreibt den Schritt-für-Schritt-Prozess der Datenanalyse.
4. Solvay Soda Deutschland GmbH: Dieses Kapitel präsentiert die Solvay Soda Deutschland GmbH als Untersuchungsgegenstand. Es bietet allgemeine Informationen über das Unternehmen und beschreibt detailliert die vorhandene Störungsdatenbank, die als Grundlage für die Data-Mining-Analyse dient. Der Abschnitt liefert den notwendigen Kontext über das Unternehmen und seine Datenstruktur.
5. Durchführung des Data Mining: Dieses Kapitel dokumentiert die praktische Anwendung der Data-Mining-Methoden auf die Störungsdaten von Solvay. Es beginnt mit der Beschreibung vermuteter Zusammenhänge zwischen verschiedenen Attributen und der Auswahl der Analysemethoden und Software. Die Datenübernahme, -aufbereitung und -transformation werden detailliert beschrieben. Schließlich werden die Ergebnisse der angewandten Methoden (deskriptive Statistiken, Kreuztabellen, Diskriminanzanalyse) präsentiert und interpretiert. Dieses Kapitel bildet den Kern der Arbeit, indem es die konkreten Ergebnisse der Analyse darstellt.
Schlüsselwörter
Data Mining, Störungsbeseitigung, Solvay, Datenanalyse, Datenaufbereitung, Methodenvergleich, SPSS, Weka, Clementine, Deskriptive Statistik, Kreuztabellen, Diskriminanzanalyse, Effizienzsteigerung.
Häufig gestellte Fragen (FAQ) zur Data-Mining-Arbeit bei Solvay
Was ist der Gegenstand dieser Arbeit?
Diese Arbeit untersucht den Einsatz von Data-Mining-Methoden zur Verbesserung der Störungsbeseitigung bei der Solvay Soda Deutschland GmbH. Das Ziel ist es, Zusammenhänge zwischen verschiedenen Attributen (z.B. Zeitaufwand, Temperatur, Produktionswerte) und dem Auftreten von Störungen aufzudecken und die Effizienz der Störungsbeseitigung zu steigern.
Welche Methoden wurden verwendet?
Die Arbeit verwendet verschiedene Data-Mining-Methoden, darunter deskriptive Statistiken, Kreuztabellen und die Diskriminanzanalyse. Es werden die Softwarepakete Weka, SPSS 10 für Windows und Clementine 7.0 eingesetzt.
Welche Daten wurden analysiert?
Die Analyse basiert auf Störungsdaten der Solvay Soda Deutschland GmbH, die in einer firmeneigenen Störungsdatenbank gespeichert sind. Die Daten wurden aufbereitet und verschiedenen Analysen unterzogen.
Welche Ergebnisse wurden erzielt?
Die Arbeit präsentiert die Ergebnisse der angewandten Data-Mining-Methoden, einschließlich deskriptiver Statistiken, Kreuztabellen und der Diskriminanzanalyse. Diese Ergebnisse werden interpretiert, um potenzielle Zusammenhänge zwischen Attributen und Störungen aufzuzeigen und Verbesserungsvorschläge für die Störungsbeseitigung zu formulieren. Die konkreten Ergebnisse sind im Kapitel 5 detailliert beschrieben.
Welche Kapitel umfasst die Arbeit?
Die Arbeit gliedert sich in fünf Kapitel: 1. Zielstellung und Vorgehensweise, 2. Grundlagen des Data Mining, 3. Vorgehensweise beim Data Mining, 4. Solvay Soda Deutschland GmbH und 5. Durchführung des Data Mining. Jedes Kapitel behandelt einen spezifischen Aspekt der Untersuchung, von der theoretischen Einführung bis zur praktischen Anwendung und Ergebnispräsentation.
Welche Software wurde verwendet?
Die Analyse wurde mit Hilfe der Softwarepakete Weka, SPSS 10 für Windows und Clementine 7.0 durchgeführt. Diese Software bietet die notwendigen Werkzeuge zur Durchführung der verschiedenen Data-Mining-Methoden.
Welche Schlüsselwörter beschreiben die Arbeit?
Schlüsselwörter, die die Arbeit beschreiben, sind: Data Mining, Störungsbeseitigung, Solvay, Datenanalyse, Datenaufbereitung, Methodenvergleich, SPSS, Weka, Clementine, Deskriptive Statistik, Kreuztabellen, Diskriminanzanalyse, Effizienzsteigerung.
Was ist die Zielsetzung der Arbeit?
Die Hauptzielsetzung ist die Verbesserung der Effizienz der Störungsbeseitigung bei Solvay durch die Anwendung von Data-Mining-Techniken. Dies beinhaltet die Identifizierung von Mustern und Zusammenhängen in den Störungsdaten und die Entwicklung eines optimierten Vorgehensmodells.
Wie ist der Aufbau der Arbeit?
Die Arbeit beginnt mit der Definition der Zielsetzung und der Beschreibung der Vorgehensweise. Es folgt ein Kapitel zu den Grundlagen des Data Mining, bevor die praktische Vorgehensweise und die Anwendung auf die Daten von Solvay detailliert beschrieben werden. Die Arbeit schließt mit der Präsentation und Interpretation der Ergebnisse.
Welche Themenschwerpunkte werden behandelt?
Die Arbeit konzentriert sich auf die Anwendung von Data-Mining-Techniken zur Analyse von Störungsdaten, die Identifizierung von Mustern und Zusammenhängen, den Vergleich verschiedener Methoden und die Entwicklung eines optimierten Vorgehensmodells zur Störungsbeseitigung bei Solvay.
- Arbeit zitieren
- Diplom-Betriebswirt Andre Hiller (Autor:in), 2003, Einführung in den Einsatz von Data Mining, München, GRIN Verlag, https://www.hausarbeiten.de/document/75722