Die vorliegende Hausarbeit beschäftigt sich mit der Vorstellung des Themas Schrifterkennung und dem Vergleich von zwei Algorithmen zur Schrifterkennung in der Performance. Die hier untersuchte Forschungsfrage ist, welche zwei Algorithmen für diese Aufgabe geeignet sind und wie sie im direkten Vergleich auf einem Datensatz abschneiden. Um die Forschungsfrage zu beantworten, werden zuerst die Hintergründe und Funktionsweisen von zwei Algorithmen vorgestellt, die für diese Klassifizierungsaufgabe geeignet sind. Anschließend wurden Modelle am MNIST-Datensatz trainiert und verglichen. Hierbei werden neben der Trainingszeit insbesondere die Metriken Precision, Recall und F1-Score berücksichtigt. Zudem in der Online-Bibliothek der IU nach den Schlagworten „Minst“, „Support-Vector-Maschine“, „Text-Recognition“, „Text-Erkennung“, „Convolutional Neuronal Network“ und „Mustererkennung“ recherchiert.
Der Hauptteil gliedert sich in drei Teile. Im ersten Teil wird erörtert, was man Schrifterkennung versteht und welche Herausforderungen hierbei auftreten. Als konkretes Beispiel wird der MNIST-Datensatz vorgestellt, der später auch als Referenzdatensatz zum Vergleich der Algorithmen verwendet wird. Im zweiten Teil des Hauptteils werden zwei Algorithmen vorgestellt, die zur Schrifterkennung genutzt werden können: die Support Vector Machine (SVM) und ein Convolutional Neuronal Network (CNN). Konkret wird zudem für jeden Algorithmus gezeigt, wie mit der Programmiersprache Python ein Model erstellt und trainiert werden kann. Im vierten Kapitel werden schließlich die Metriken der Modelle gegenübergestellt. Die Arbeit endet mit einer Zusammen und einem Fazit.
Inhaltsverzeichnis
1 Einleitung
1.1 Geschichte der automatisierten Schrifterkennung
1.2 Zielsetzung und Herangehenweise
1.3 Aufbau der Seminararbeit
2 Grundlagen
2.1 Schrifterkennung: Definitionen und Herausforderungen
2.2 Überblick über den MNIST-Datensatz
3 Algorithmen zur Schrifterkennung
3.1 Support Vector Machine
3.1.1 Grundprinzipien und Funktionsweise
3.1.2 Anwendung auf dem MNIST-Datensatz
3.2 Convolutional Neural Network (CNN)
3.2.1 Grundprinzipien und Architektur
3.2.2 Layer
3.2.3 Anwendung auf den MNIST-Datensatz
4 Evaluation der Testergebnisse
4.1 Konfusion-Matrizen der Algorithmen
4.2 Metriken
5 Schluß
5.1 Zusammenfassung
5.2 Fazit
Zielsetzung und thematische Schwerpunkte
Die vorliegende Arbeit zielt darauf ab, die Leistung von Support Vector Machines (SVM) und Convolutional Neural Networks (CNN) bei der automatisierten Schrifterkennung anhand des MNIST-Datensatzes zu vergleichen und die Eignung der Algorithmen zu evaluieren.
- Grundlagen der automatisierten Schrifterkennung und Herausforderungen
- Funktionsweise und Architektur von Support Vector Machines
- Aufbau und Eigenschaften von Convolutional Neural Networks
- Praktische Implementierung von Klassifizierungsmodellen mittels Python
- Vergleichende Analyse der Modellperformance anhand von Precision, Recall und F1-Score
Auszug aus dem Buch
3.1.1 Grundprinzipien und Funktionsweise
Eine Support Vector Machine (SVM) ist ein maschinelles Lernmodell aus dem Supervised Learning, dass grundsätzlich für die binäre Klassifizierung verwendet werden kann, indem es den Abstand zwischen zwei Klassen maximiert (Harrington, 2012, Seite 103). Während des Trainings lernt die SVM, Klassen anhand numerischer Merkmale zu klassifizieren, indem sie eine Trennlinie (oder Hyperebene) zwischen den Klassen findet. Diese Trennlinie wird so gewählt, dass sie den größtmöglichen Abstand zwischen den Support-Vektoren der Klassen aufweist. Als Support-Vektoren werden die Punkte bezeichnet, die der trennenden Hyperebene am nächsten liegen (Harrington, 2012, S. 103).
Um nicht-lineare trennbare Daten zu klassifizieren, können sogenannte Kernel-Transformationen (Kernel-Trick) auf den Daten angewandt werden, die die Daten vom ursprünglichen Raum in einen höherdimensionalen Merkmalsraum abbilden (Harrington, 2012, S. 118). Ziel ist es, dass die Klassen nach der Transformation in den höherdimensionalen Raum nun linear trennbar sind.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung führt in die automatisierte Schrifterkennung ein und definiert Zielsetzung sowie Aufbau der Seminararbeit.
2 Grundlagen: Hier werden die Herausforderungen der Schrifterkennung erläutert und der für die Arbeit verwendete MNIST-Datensatz vorgestellt.
3 Algorithmen zur Schrifterkennung: Dieser Abschnitt beschreibt die theoretischen Prinzipien von Support Vector Machines sowie Convolutional Neural Networks und zeigt deren praktische Implementierung.
4 Evaluation der Testergebnisse: Die Ergebnisse der trainierten Modelle werden anhand von Konfusion-Matrizen und spezifischen Leistungskennzahlen wie Precision und Recall ausgewertet.
5 Schluß: Das abschließende Kapitel fasst die Erkenntnisse der vergleichenden Analyse zusammen und zieht ein Fazit bezüglich der Modellperformanz.
Schlüsselwörter
Schrifterkennung, Mustererkennung, MNIST-Datensatz, Support Vector Machine, Convolutional Neural Network, Supervised Learning, Klassifizierung, Bildverarbeitung, Machine Learning, Künstliche Intelligenz, Modellperformance, Precision, Recall, F1-Score, Python.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit untersucht und vergleicht die Effektivität zweier gängiger Algorithmen zur automatisierten Erkennung handgeschriebener Ziffern.
Welche zentralen Themenfelder werden behandelt?
Die zentralen Themen umfassen die Grundlagen der Schrifterkennung, die Funktionsweise von Support Vector Machines und Deep Learning mittels Convolutional Neural Networks sowie deren Evaluation.
Was ist das primäre Ziel oder die Forschungsfrage?
Das primäre Ziel ist es, zu ermitteln, wie sich SVM und CNN bei einer konkreten Klassifizierungsaufgabe (MNIST) in Bezug auf ihre Performance unterscheiden.
Welche wissenschaftliche Methode wird verwendet?
Es wird ein quantitativer Vergleich basierend auf einem praktischen Laborexperiment durchgeführt, bei dem die Modelle trainiert und anhand standardisierter Metriken bewertet werden.
Was wird im Hauptteil der Arbeit behandelt?
Im Hauptteil werden sowohl theoretische Hintergründe als auch die technische Implementierung beider Algorithmen mittels Python demonstriert und anschließend evaluiert.
Welche Schlüsselwörter charakterisieren die Arbeit?
Schlüsselwörter sind unter anderem Schrifterkennung, MNIST, SVM, CNN, Klassifizierung und Machine Learning.
Warum wird der MNIST-Datensatz für diese Untersuchung verwendet?
Der MNIST-Datensatz dient als standardisierter Referenzdatensatz der Bildverarbeitung, der sich aufgrund seiner klar definierten Struktur ideal für den Vergleich von ML-Algorithmen eignet.
Warum schneidet das CNN im Vergleich zur SVM besser ab?
Obwohl beide Modelle hohe Ergebnisse erzielen, zeigt das CNN durch seine spezifische Architektur für Bilddaten bessere Klassifizierungswerte bei gleichzeitig deutlich effizienterer Trainingszeit.
- Quote paper
- Heribert Tellerfink (Author), 2024, Vergleichende Analyse zwischen Support Vector Machines und Convolutional Neural Networks zur Texterkennung im MNIST-Datensatz, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/1477855