Das Finalziel der vorliegenden Arbeit besteht darin eine hierarchische Clusteranalyse in R im Rahmen eines Praxisbeispiels, und den dazugehörigen Daten, durchzuführen. In der modernen Wirtschaft spielt die Analyse von Daten bei der Bewältigung von gegenwärtigen Aufgabenstellungen eine immer größere Rolle. Die Gewinnung von relevanten Erkenntnissen aus den weltweit stetig wachsenden Datenbeständen ist für Wirtschaftsunternehmen in Hinsicht auf die Sicherung der Wettbewerbsfähigkeit von zentraler Bedeutung. Während 2022 lediglich ein Volumen 103,66 Zettabyte an Daten global generiert, beziehungsweise repliziert wurde, sollen es laut Prognose bereits 284,3 Zettabyte im Jahr 2027 sein. Weiterhin ermöglichen die heutzutage zur Verfügung stehenden Rechenkapazitäten zur Unterstützung von Entscheidungsprozessen eine Quantifizierbarkeit und Auswertung von Daten nahezu ohne Einschränkungen.
Zur Analyse von Daten stehen unterschiedlichste statistische Verfahren bereit. Im Zuge der Bearbeitung des Laborberichts wird eine hierarchische Clusteranalyse in R zu bestehenden Daten durchgeführt. Bei der statistischen Programmiersprache R handelt es sich um eine freie Sprache für statistische Berechnungen und Darstellungen. Dessen Beliebtheit zeigt sich vor allem im PYPL-Index, in welchem R mit 4,6% im August 2024 als sechst beliebteste Programmiersprache aufgeführt wird. Nach einer eintägigen Einführung in die Umgebung von R folgt in dieser Arbeit die praktische Umsetzung einer Clusteranalyse. Dabei wird im Produktivumfeld die R-Konsole eingesetzt.
- Arbeit zitieren
- Fabian Schnabel (Autor:in), 2024, Clusteranalyse mit R, München, GRIN Verlag, https://www.hausarbeiten.de/document/1683772