Diese Arbeit gliedert sich in zwei Abschnitte: Zunächst wird die Theorie der Clusteranalyse dargestellt, wobei der Fokus auf die hierarchischen Verfahren gelegt wird. Im zweiten Teil wird eine computergestützte Anwendung einer solchen Analyse auf einen selbst erstellten Rohdatensatz dargestellt. Das Ziel dieses Abschnittes ist es eine sinnvoll interpretierbare Klassifikation der vorliegenden Daten aufzudecken.
Das Problem mühsamer und zeitaufwendiger Informationsbeschaffung gehört schon seit vielen Jahren der Vergangenheit an. Durch das Internet, elektronische Datenbanken und Massenspeicher ist die Informationsbeschaffung preiswert und schnell geworden. In Zeiten von „Big-Data“ stellt sich viel mehr die Frage, wie sich die Massen an verfügbaren Informationen systematisch auswerten lassen. Ein mögliches Instrumentarium, um Strukturen in großen Datenmengen zu erkennen, ist die Clusteranalyse.
Aus betriebswirtschaftlicher Sicht ist die Anwendungsbandbreite riesig. Im Marketing ist die Clusteranalyse ein beliebtes Instrument zur Abgrenzung und Beschreibung von Käufersegmenten oder Absatzmärkten. In der Logistikbranche lässt sich die Clusteranalyse im Rahmen der Standortplanung einsetzten, um eine Menge von Standortalternativen auf der Grundlage verschiedener Faktoren zu gruppieren. Im Anschluss kann durch die Interpretation der Analyseergebnisse jenes Cluster herausgestellt werden, das für das Unternehmen hinsichtlich der festgelegten Standortfaktoren die günstigsten Voraussetzungen bietet.
Inhaltsverzeichnis
- 1 Einleitung
- 2 Grundlagen der Clusteranalyse
- 2.1 Ausgangssituation und Anforderungen
- 2.2 Ähnlichkeits- und Distanzbestimmung in Abhängigkeit des Skalenniveaus
- 2.3 Verfahren der Clusteranalyse
- 2.3.1 Agglomerative-hierarchische Verfahren
- 2.3.2 Ausgewählte Clusteralgorithmen
- 3 Computergestützte Clusteranalyse eines Testdatensatzes
- 4 Schluss
Zielsetzung und Themenschwerpunkte
Die vorliegende Arbeit befasst sich mit der Clusteranalyse und ihrer Anwendung in der Praxis. Ziel ist es, die grundlegenden Prinzipien und Verfahren der Clusteranalyse zu erläutern und diese anhand eines Testdatensatzes zu veranschaulichen.
- Grundlagen der Clusteranalyse
- Ähnlichkeits- und Distanzbestimmung
- Verfahren der Clusteranalyse
- Computergestützte Clusteranalyse
- Anwendung in der Praxis
Zusammenfassung der Kapitel
Kapitel 1 führt in die Thematik der Clusteranalyse ein und erläutert die Relevanz dieser Methode für die Analyse von Datensätzen. Kapitel 2 befasst sich mit den Grundlagen der Clusteranalyse, einschließlich der Ähnlichkeits- und Distanzbestimmung sowie verschiedener Verfahren. Kapitel 3 präsentiert eine computergestützte Clusteranalyse eines Testdatensatzes, um die praktische Anwendung der Methode zu demonstrieren.
Schlüsselwörter
Clusteranalyse, Datensatz, Ähnlichkeit, Distanz, Verfahren, Algorithmen, Computergestützte Analyse, Testdatensatz.
- Arbeit zitieren
- Luca Müller (Autor:in), 2017, Eine statistische Clusteranalyse zur Analyse von Datensätzen. Theorie und Praxis, München, GRIN Verlag, https://www.hausarbeiten.de/document/541372