Die vorliegende Hausarbeit beschäftigt sich mit der Vorstellung des Themas Schrifterkennung und dem Vergleich von zwei Algorithmen zur Schrifterkennung in der Performance. Die hier untersuchte Forschungsfrage ist, welche zwei Algorithmen für diese Aufgabe geeignet sind und wie sie im direkten Vergleich auf einem Datensatz abschneiden. Um die Forschungsfrage zu beantworten, werden zuerst die Hintergründe und Funktionsweisen von zwei Algorithmen vorgestellt, die für diese Klassifizierungsaufgabe geeignet sind. Anschließend wurden Modelle am MNIST-Datensatz trainiert und verglichen. Hierbei werden neben der Trainingszeit insbesondere die Metriken Precision, Recall und F1-Score berücksichtigt. Zudem in der Online-Bibliothek der IU nach den Schlagworten „Minst“, „Support-Vector-Maschine“, „Text-Recognition“, „Text-Erkennung“, „Convolutional Neuronal Network“ und „Mustererkennung“ recherchiert.
Der Hauptteil gliedert sich in drei Teile. Im ersten Teil wird erörtert, was man Schrifterkennung versteht und welche Herausforderungen hierbei auftreten. Als konkretes Beispiel wird der MNIST-Datensatz vorgestellt, der später auch als Referenzdatensatz zum Vergleich der Algorithmen verwendet wird. Im zweiten Teil des Hauptteils werden zwei Algorithmen vorgestellt, die zur Schrifterkennung genutzt werden können: die Support Vector Machine (SVM) und ein Convolutional Neuronal Network (CNN). Konkret wird zudem für jeden Algorithmus gezeigt, wie mit der Programmiersprache Python ein Model erstellt und trainiert werden kann. Im vierten Kapitel werden schließlich die Metriken der Modelle gegenübergestellt. Die Arbeit endet mit einer Zusammen und einem Fazit.
Inhaltsverzeichnis
- Einleitung
- Geschichte der automatisierten Schrifterkennung
- Zielsetzung und Herangehensweise
- Aufbau der Seminararbeit
- Grundlagen
- Schrifterkennung: Definitionen und Herausforderungen
- Überblick über den MNIST-Datensatz
- Algorithmen zur Schrifterkennung
- Support Vector Machine
- Grundprinzipien und Funktionsweise
- Anwendung auf dem MNIST-Datensatz
- Convolutional Neural Network (CNN)
- Grundprinzipien und Architektur
- Layer
- Anwendung auf dem MNIST-Datensatz
- Support Vector Machine
- Evaluation der Testergebnisse
- Konfusion-Matrizen der Algorithmen
- Metriken
- Schluß
- Zusammenfassung
Zielsetzung und Themenschwerpunkte
Die vorliegende Hausarbeit beschäftigt sich mit der Vorstellung des Themas Schrifterkennung und dem Vergleich von zwei Algorithmen zur Schrifterkennung in der Performance. Die Forschungsfrage lautet, welche zwei Algorithmen für diese Aufgabe geeignet sind und wie sie im direkten Vergleich auf einem Datensatz abschneiden.
- Die Funktionsweise von Support Vector Machines und Convolutional Neural Networks
- Die Anwendung der Algorithmen auf den MNIST-Datensatz
- Der Vergleich der Performance der Modelle anhand von Metriken wie Precision, Recall und F1-Score
- Die Trainingszeit der Modelle
- Die Herausforderungen der automatisierten Schrifterkennung
Zusammenfassung der Kapitel
Im ersten Kapitel wird die Geschichte der automatisierten Schrifterkennung beleuchtet und die Zielsetzung der Hausarbeit erläutert. Das zweite Kapitel führt in die Grundlagen der Schrifterkennung ein und stellt den MNIST-Datensatz vor. Das dritte Kapitel beschreibt die Funktionsweise von Support Vector Machines und Convolutional Neural Networks und zeigt deren Anwendung auf dem MNIST-Datensatz. Das vierte Kapitel evaluiert die Testergebnisse der Modelle und vergleicht die Metriken.
Schlüsselwörter
Schrifterkennung, Mustererkennung, Support Vector Machine, Convolutional Neural Network, MNIST-Datensatz, Machine Learning, Künstliche Intelligenz, Precision, Recall, F1-Score, Trainingszeit, Konfusion-Matrix.
- Quote paper
- Heribert Tellerfink (Author), 2024, Vergleichende Analyse zwischen Support Vector Machines und Convolutional Neural Networks zur Texterkennung im MNIST-Datensatz, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/1477855