Bestand noch vor 30 bis 50 Jahren das Problem, dass die Informationsbeschaffung relativ mühsam und zeitaufwendig war, und so eher ein Datendefizit auftrat, ist heute genau das Gegenteil der Fall. Durch das Internet, elektronische Datenbanken, Archivsysteme sowie Massenspeicher ist die Informationsbeschaffung preiswert und schnell geworden. Dabei ist es leicht möglich, den Überblick zu verlieren. Um Strukturen in großen Datenmengen zu erkennen und die wesentlichen Charakteristika herauszufiltern, stellt die Clusteranalyse mit anschließender Typenbildung ein geeignetes Instrumentarium dar. Die folgende Arbeit gliedert sich in zwei Abschnitte: Zunächst wird in einem theoretischen Teil eine Einordnung der Clusteranalyse vorgenommen, um dann darauf insbesondere die hierarchische Clusteranalyse darzustellen. Im zweiten Teil wird dann anhand einer Auswahl von Unternehmen eine solche Analyse mit Typisierung durchgeführt.
Inhaltsverzeichnis
1 Einleitung
2 Einordnung der Clusteranalyse
2.1 Definition
2.2 Arten der Clusteranalyse
2.3 Anwendung der Clusteranalyse
3 Deterministische Clusteranalyse
3.1 Grundlagen
3.2 Agglomerative-hierarchische Verfahren
3.2.1 Allgemeiner Ablauf und Varianten
3.2.2 Ähnlichkeitsbestimmung bei nominalen Skalenniveau
3.2.3 Ähnlichkeits- und Distanzbestimmung bei metrischen Skalenniveau
3.2.4 Ausgewählte Clusteralgorithmen
4 Durchführung einer Clusteranalyse
4.1 Historie der ersten Clusteranalyse von Unternehmen
4.2 Datenbasis und Auswahl des Verfahrens
4.3 Ergebnis der beiden Vorgehensweisen
4.4 Typenbildung von Unternehmen
5 Schlussbetrachtung
Zielsetzung & Themen
Die vorliegende Arbeit verfolgt das Ziel, die Clusteranalyse als quantitatives Instrument zur Strukturierung großer Datenmengen und zur Typenbildung von Unternehmen darzustellen. Dabei steht die Untersuchung von Unternehmensstrukturen mittels hierarchisch-agglomerativer Algorithmen im Mittelpunkt, um auf Basis ökonomischer Kennzahlen eine fundierte Klassifizierung vorzunehmen.
- Grundlagen und Einordnung multivariater Analysemethoden
- Mathematische Verfahren der Distanz- und Ähnlichkeitsbestimmung
- Vergleich verschiedener agglomerativer Clusteralgorithmen (Single-Linkage, Ward-Verfahren)
- Praktische Anwendung der Clusteranalyse auf europäische Unternehmenskennzahlen
- Entwicklung einer Typologie zur Charakterisierung von Unternehmensgruppen
Auszug aus dem Buch
3.2.4 Ausgewählte Clusteralgorithmen
Die agglomerative-hierarchische Clusteranalyse unterscheidet zahlreiche Verfahren, die jeweils einen anderen Prozessablauf der Gruppenfusionierung aufweisen. Das Ward-Verfahren und mehrere Linkage-Verfahren sind bekannte Clusteralgorithmen, wobei bei dem ersten die Vereinigung der Gruppen durch den Wert eines Varianzkoeffizienten (Fehlerquadratsumme) und beim zweiten aufgrund von Ähnlichkeiten bzw. Distanzen vorgenommen wird.
Linkage-Verfahren: Dieses Verfahren ist nicht festgelegt auf ein Proximitätsmaß oder Skalenniveau. Nach der ersten Aufstellung einer Distanz- bzw. Ähnlichkeitsmatrix (im Weiteren wird nur von Distanz gesprochen) beginnt der Vereinigungsprozess. In der ersten Stufe werden die beiden Objekte mit der geringsten Distanz zu einem Cluster vereinigt. Als nächstes muss der Abstand der neuen Gruppe zu den übrigen Objekten festgelegt werden, wodurch sich dann die Linkage-Verfahren unterscheiden lassen. Beim Single-Linkage (auch Nächster-Nachbar-Verfahren), wird jeweils die Distanz der beiden vereinigten Objekte zu den anderen Objekten bestimmt und davon der kleinste Abstand ausgewählt. Das entsprechende Cluster vergrößert sich dann um diesen Wert.
Zusammenfassung der Kapitel
1 Einleitung: Die Einleitung motiviert die Relevanz der Clusteranalyse zur Bewältigung großer Datenmengen und skizziert den zweigeteilten Aufbau der Arbeit in einen theoretischen und einen praktischen Anwendungsteil.
2 Einordnung der Clusteranalyse: Dieses Kapitel definiert die Clusteranalyse als struktur-entdeckendes Verfahren und differenziert zwischen unvollständigen, deterministischen und probabilistischen Ansätzen.
3 Deterministische Clusteranalyse: Hier werden die mathematischen Grundlagen, insbesondere die Distanzbestimmung auf verschiedenen Skalenniveaus und die Funktionsweise hierarchischer Algorithmen, detailliert erläutert.
4 Durchführung einer Clusteranalyse: Das Kapitel beschreibt den praktischen Prozess der Analyse anhand europäischer Unternehmen, von der Datenaufbereitung über die Algorithmenwahl bis hin zur finalen Typenbildung.
5 Schlussbetrachtung: Das Fazit fasst die Ergebnisse zusammen und kritisiert den bestehenden Interpretationsspielraum bei der Anwendung statistischer Verfahren in der Praxis.
Schlüsselwörter
Clusteranalyse, Typenbildung, Agglomerative Verfahren, Hierarchische Clusteranalyse, Ward-Verfahren, Single-Linkage, Proximitätsmaß, Distanzmatrix, Multivariate Analysemethoden, Unternehmensanalyse, Kennzahlen, Datenreduktion, Euklidische Distanz, Wirtschaftsstatistik, Klassifikation
Häufig gestellte Fragen
Worum geht es in dieser wissenschaftlichen Arbeit grundlegend?
Die Arbeit behandelt die Clusteranalyse als ein quantitatives Instrument, um komplexe Unternehmensdaten zu strukturieren und diese in homogene Gruppen oder Typen einzuteilen.
Welche zentralen Themenfelder werden abgedeckt?
Die zentralen Felder umfassen die mathematischen Grundlagen der Ähnlichkeits- und Distanzmessung, die methodische Vorgehensweise bei der hierarchischen Clusterbildung sowie die praktische Anwendung auf europäische Unternehmenskennzahlen.
Was ist das primäre Ziel der Untersuchung?
Das Ziel besteht darin, Strukturen innerhalb von Unternehmensdaten zu identifizieren und eine empirisch begründete Typisierung von Unternehmen vorzunehmen.
Welche wissenschaftliche Methode wird schwerpunktmäßig verwendet?
Es werden primär deterministische, hierarchisch-agglomerative Clusteralgorithmen, insbesondere das Single-Linkage-Verfahren zur Ausreißeridentifikation und das Ward-Verfahren zur Clusterbildung, angewandt.
Welche Inhalte bilden den Hauptteil?
Der Hauptteil gliedert sich in die theoretische Herleitung der mathematischen Distanzmaße für verschiedene Skalenniveaus und die konkrete Durchführung einer Clusteranalyse anhand eines Datensatzes der 500 größten europäischen Unternehmen.
Durch welche Schlüsselwörter lässt sich die Arbeit charakterisieren?
Die Arbeit lässt sich durch Begriffe wie Clusteranalyse, Typenbildung, Agglomerative Verfahren, Multivariate Statistik und Unternehmensklassifikation charakterisieren.
Warum wird im praktischen Teil das Ward-Verfahren dem Single-Linkage vorgezogen?
Das Single-Linkage-Verfahren neigt zu Kettenbildung und wird hier primär zur Identifikation und Eliminierung von Ausreißern genutzt, während das Ward-Verfahren eine kompaktere und homogenere Clusterbildung ermöglicht.
Welche Schlussfolgerung zieht der Autor bezüglich der Datenreduktion?
Der Autor betont, dass bei jeder Datenreduktion ein Informationsverlust entsteht und der Prozess einen gewissen Manipulationsspielraum bietet, weshalb eine kritische Interpretation der Ergebnisse unerlässlich ist.
- Quote paper
- Jens-Oliver Schünzel (Author), 2004, Clusteranalyse zur Typenbildung von Unternehmen, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/49069