Diese Arbeit ist eine Analyse des Datensatz "Airbag And Other Influences On Accident Fatalities". Diese wurde mithilfe des Statistikprogramms R durchgeführt. Den zu untersuchenden Sekundärdatensatz beinhaltet Daten, welche aus polizeilichen Berichten von Autounfällen erhoben wurden. Diese Daten wurden in den USA vom Jahr 1997-2002 erfasst und zeigen die Unfallergebnisse von Personen und deren Eigentum auf. Die Daten sind darauf beschränkt, dass mindestens eins der im Unfall verwickelten Autos abgeschleppt worden ist und es sich nur um die Personen der vorderen Sitzplätze handelt. Die Erhebung der Daten erfolgte durch einen mehrstufigen probabilischen Stichprobenplan und enthält zudem Daten einer Teilmenge von Variablen aus einem "NASS" Datensatz.
Inhaltsverzeichnis
- 1. Sekundärdatensatz
- 1.1 Kurzbeschreibung des Sekundärdatensatzes
- 1.2 Variablen im Sekundärdatensatz
- 1.2.1 Variablen kategorisch Skaliert
- 1.2.2 Variablen metrisch Skaliert
- 2. Datenanalyse mit grafischer Darstellung
- 2.1 Kategorische Variablen
- 2.1.1 Variablen Nominalskaliert
- 2.1.2 Variablen Ordinalskaliert
- 2.2 Metrische Variablen
- 2.2.1 Variablen Intervallskaliert
- 2.2.2 Variable Verhältnisskaliert
- 3. Deskriptive Datenanalyse & Statistische Analysen
- 3.1 Lagemaße der Sekundärdaten
- 3.2 Streuungsmaße der Sekundärdaten
- 3.3 Zusammenhangsmaße der Sekundärdaten
- 3.3.1 Pearsons Korrelationskoeffizient
- 3.3.2 Chi-Quadrat-Test der Sekundärdaten
- 3.4 Signifikanztest der Sekundärdaten
- 3.4.1 Varianzanalyse der Sekundärdaten
- 3.4.2 Regressionsanalyse der Sekundärdaten
- 3.4.3 T-Test der Sekundärdaten
- 4. Interpretation & Diskussion des Datensatzes
Zielsetzung und Themenschwerpunkte
Diese Arbeit analysiert einen Sekundärdatensatz zu Autounfällen in den USA (1997-2002), um Zusammenhänge zwischen verschiedenen Faktoren wie Airbag, Sicherheitsgurt und Unfallschwere zu untersuchen. Die Analyse verwendet Methoden der deskriptiven und inferentiellen Statistik mit dem Statistikprogramm R.
- Beschreibung und Exploration des Datensatzes „Airbag and other influences on accident fatalities“
- Grafische Darstellung und Interpretation der Daten
- Anwendung deskriptiver statistischer Verfahren (Lagemaße, Streuungsmaße)
- Durchführung von statistischen Tests zur Überprüfung von Zusammenhängen zwischen Variablen (z.B. Korrelation, Chi-Quadrat-Test, Varianzanalyse, Regression, t-Test)
- Interpretation der Ergebnisse und Diskussion der gefundenen Zusammenhänge
Zusammenfassung der Kapitel
1. Sekundärdatensatz: Dieses Kapitel beschreibt den verwendeten Sekundärdatensatz "Airbag and other influences on accident fatalities". Der Datensatz basiert auf polizeilichen Unfallberichten aus den USA (1997-2002) und beinhaltet Daten zu Unfällen, bei denen mindestens ein Fahrzeug abgeschleppt wurde und sich die Daten auf die Insassen der Vordersitze beziehen. Die Daten wurden mittels eines mehrstufigen probabilischen Stichprobenplans erhoben und umfassen eine Teilmenge von Variablen aus einem "NASS" Datensatz. Die Autoren des Datensatzes werden genannt und der Link zum Datensatz wird bereitgestellt. Der Datensatz enthält 26.217 Zeilen und 15 Variablen, die im Detail im weiteren Verlauf der Arbeit vorgestellt werden. Die detaillierte Beschreibung des Datensatzes legt den Grundstein für die anschließende Datenanalyse und Interpretation.
2. Datenanalyse mit grafischer Darstellung: In diesem Kapitel werden die Daten mithilfe von grafischen Darstellungen analysiert. Es werden sowohl kategoriale als auch metrische Variablen betrachtet und mittels verschiedener Diagramme (Balkendiagramme, Histogramme, Streudiagramme, Boxplots) visualisiert. Diese Visualisierungen dienen dazu, erste Einblicke in die Daten zu gewinnen, Zusammenhänge zwischen Variablen zu identifizieren und die Verteilung der Daten zu untersuchen. Die Auswahl der geeigneten Diagramme hängt dabei von der Skalenart der jeweiligen Variablen ab (Nominal, Ordinal, Intervall, Verhältnis).
3. Deskriptive Datenanalyse & Statistische Analysen: Dieses Kapitel befasst sich mit der deskriptiven Datenanalyse und der Anwendung statistischer Verfahren. Es werden Lagemaße (z.B. Mittelwert, Median) und Streuungsmaße (z.B. Standardabweichung, Varianz) berechnet, um die Verteilung der Daten genauer zu beschreiben. Darüber hinaus werden Zusammenhangsmaße wie der Pearsonsche Korrelationskoeffizient und der Chi-Quadrat-Test angewendet, um Zusammenhänge zwischen verschiedenen Variablen zu untersuchen. Schließlich werden Signifikanztests wie die Varianzanalyse, die Regressionsanalyse und der t-Test durchgeführt, um die statistische Signifikanz der gefundenen Zusammenhänge zu prüfen. Die Ergebnisse dieser Analysen liefern wichtige Informationen über die Beziehungen zwischen den untersuchten Variablen.
Schlüsselwörter
Airbag, Autounfall, Unfallschwere, Sicherheitsgurt, Sekundärdatensatz, Datenanalyse, Deskriptive Statistik, Inferentielle Statistik, R, Korrelation, Varianzanalyse, Regressionsanalyse, t-Test, Chi-Quadrat-Test, USA.
Häufig gestellte Fragen (FAQ) zur Analyse von Autounfällen in den USA (1997-2002)
Was ist der Gegenstand dieser Arbeit?
Diese Arbeit analysiert einen Sekundärdatensatz zu Autounfällen in den USA (1997-2002), um Zusammenhänge zwischen verschiedenen Faktoren wie Airbag, Sicherheitsgurt und Unfallschwere zu untersuchen. Die Analyse verwendet Methoden der deskriptiven und inferentiellen Statistik mit dem Statistikprogramm R.
Welche Daten werden verwendet?
Die Analyse basiert auf dem Sekundärdatensatz "Airbag and other influences on accident fatalities", der auf polizeilichen Unfallberichten aus den USA (1997-2002) beruht. Der Datensatz enthält Daten zu Unfällen, bei denen mindestens ein Fahrzeug abgeschleppt wurde und die Daten sich auf die Insassen der Vordersitze beziehen. Es handelt sich um eine Teilmenge von Variablen aus einem "NASS" Datensatz, erhoben mittels eines mehrstufigen probabilischen Stichprobenplans. Der Datensatz umfasst 26.217 Zeilen und 15 Variablen.
Welche Variablen werden untersucht?
Der Datensatz enthält sowohl kategoriale als auch metrische Variablen. Die genaue Auflistung der Variablen ist im Kapitel 1.2 des Inhaltsverzeichnisses detailliert beschrieben (inkl. Unterscheidung nach Skalenniveau: nominal, ordinal, intervall, verhältnisskaliert).
Welche Methoden der Datenanalyse werden angewendet?
Die Arbeit verwendet sowohl deskriptive als auch inferentielle statistische Methoden. Zu den deskriptiven Methoden gehören die Berechnung von Lagemaßen (Mittelwert, Median) und Streuungsmaßen (Standardabweichung, Varianz). Inferentielle Methoden umfassen den Pearsonschen Korrelationskoeffizienten, den Chi-Quadrat-Test, die Varianzanalyse, die Regressionsanalyse und den t-Test. Die Ergebnisse werden grafisch (Balkendiagramme, Histogramme, Streudiagramme, Boxplots) dargestellt.
Welche statistischen Programme werden verwendet?
Die Datenanalyse wird mit dem Statistikprogramm R durchgeführt.
Welche Ziele werden verfolgt?
Die Arbeit zielt darauf ab, Zusammenhänge zwischen verschiedenen Faktoren (Airbag, Sicherheitsgurt etc.) und der Unfallschwere zu untersuchen und diese statistisch zu überprüfen. Die Ergebnisse werden interpretiert und diskutiert.
Wie ist die Arbeit strukturiert?
Die Arbeit gliedert sich in vier Kapitel: 1. Sekundärdatensatz (Beschreibung des Datensatzes), 2. Datenanalyse mit grafischer Darstellung (Visualisierung der Daten), 3. Deskriptive Datenanalyse & Statistische Analysen (Anwendung statistischer Verfahren), 4. Interpretation & Diskussion des Datensatzes (Interpretation und Diskussion der Ergebnisse).
Welche Schlüsselwörter beschreiben die Arbeit?
Airbag, Autounfall, Unfallschwere, Sicherheitsgurt, Sekundärdatensatz, Datenanalyse, Deskriptive Statistik, Inferentielle Statistik, R, Korrelation, Varianzanalyse, Regressionsanalyse, t-Test, Chi-Quadrat-Test, USA.
- Quote paper
- Marco Gastel (Author), 2018, Datenerhebung und Statistik. Analyse des Datensatzes "Airbag And Other Influences On Accident Fatalities" mithilfe des Statistikprogramms R, Munich, GRIN Verlag, https://www.hausarbeiten.de/document/593442