In dieser Seminararbeit wird der zur Verfügung gestellte Datensatz "beauty" unter Verwendung des Statistikprogramms RStudio analysiert. Diese Seminararbeit dient dazu, erste praktische Erfahrungen im Bereich der quantitativen Datenanalyse zu sammeln und die Statistiksoftware RStudio anzuwenden. Das untersuchte Thema lautet: Hat die Hautfarbe eine Auswirkung auf das Gehalt?
Inhaltsverzeichnis
- Einleitung
- Vorstellung des Datensatzes
- Vorgehensweise
- Explorative Datenanalyse
- Hypothesen
- T-Test
- Permutationstest
- Lineare Regression
- Zusammenfassung
Zielsetzung und Themenschwerpunkte
Diese Seminararbeit analysiert den Datensatz „beauty“ mithilfe von RStudio, um praktische Erfahrungen in der quantitativen Datenanalyse zu sammeln und die Software anzuwenden. Die Arbeit untersucht den Einfluss der Hautfarbe auf das Gehalt.
- Quantitative Datenanalyse mit RStudio
- Explorative Datenanalyse des Datensatzes „beauty“
- Hypothesentestung zum Einfluss der Hautfarbe auf das Gehalt
- Anwendung statistischer Methoden (T-Test, Permutationstest, lineare Regression)
- Interpretation der Ergebnisse
Zusammenfassung der Kapitel
Einleitung: Die Einleitung beschreibt den Zweck der Seminararbeit: die Analyse des Datensatzes „beauty“ mit RStudio zur praktischen Anwendung quantitativer Datenanalysemethoden. Es wird die Verwendung des Statistikprogramms RStudio betont und der Fokus auf die Gewinnung erster praktischer Erfahrungen in diesem Bereich gelegt.
Vorstellung des Datensatzes: Dieses Kapitel beschreibt den Datensatz „beauty“, seine Herkunft aus dem R-Paket „wooldridge“, erstellt von Jeffrey M. Wooldridge. Es wird die Quelle der Daten, „Beauty and the Labor Market“ von Hamermesh und Biddle (1994), genannt, sowie die Reduktion des Datensatzes auf einen Teil seiner ursprünglichen Größe. Die Angaben zur ursprünglichen Quelle dienen der Transparenz und Nachvollziehbarkeit der Daten.
Explorative Datenanalyse: Dieses Kapitel beschreibt die explorative Datenanalyse des Datensatzes "beauty". Es werden die angewandten Methoden und ersten Visualisierungen, beispielsweise Histogramme und Balkendiagramme, vorgestellt. Durch die Visualisierung sollen erste Einblicke in die Datenstruktur und -verteilung gewonnen und mögliche Zusammenhänge zwischen Variablen, insbesondere Hautfarbe und Gehalt, aufgezeigt werden. Die Bedeutung dieser Phase für die Formulierung von Hypothesen wird hervorgehoben.
Hypothesen: In diesem Kapitel werden die im Rahmen der explorativen Datenanalyse formulierten Hypothesen zum Zusammenhang zwischen Hautfarbe und Gehalt detailliert dargestellt. Die Kapitel beschreiben die angewandten Testmethoden (T-Test und Permutationstest), die zur Überprüfung dieser Hypothesen eingesetzt wurden. Die Auswahl der Methoden und deren jeweilige Eignung für die Fragestellung werden begründet.
Lineare Regression: Dieses Kapitel befasst sich mit der Anwendung der linearen Regression zur Modellierung des Zusammenhangs zwischen Hautfarbe und Gehalt. Es werden die Ergebnisse der Regression detailliert dargestellt und interpretiert, wobei der Fokus auf den Einfluss der Hautfarbe auf das Gehalt gelegt wird. Mögliche Störvariablen und deren Berücksichtigung im Modell werden diskutiert. Die Güte des Modells wird anhand relevanter Kennzahlen beurteilt.
Schlüsselwörter
Quantitative Datenanalyse, RStudio, Datensatz „beauty“, Hautfarbe, Gehalt, T-Test, Permutationstest, Lineare Regression, Explorative Datenanalyse, Wooldridge, Hamermesh & Biddle.
Häufig gestellte Fragen (FAQ) zur Seminararbeit: Analyse des Datensatzes „beauty“
Was ist das Thema der Seminararbeit?
Die Seminararbeit analysiert den Datensatz „beauty“ mithilfe von RStudio, um den Einfluss der Hautfarbe auf das Gehalt zu untersuchen. Sie dient der praktischen Anwendung quantitativer Datenanalysemethoden und der Einarbeitung in RStudio.
Welche Methoden werden in der Arbeit angewendet?
Die Arbeit verwendet verschiedene Methoden der quantitativen Datenanalyse, darunter explorative Datenanalyse (mit Histogrammen und Balkendiagrammen), Hypothesentests (T-Test und Permutationstest) und lineare Regression. RStudio wird als Software zur Durchführung der Analysen eingesetzt.
Welche Hypothesen werden getestet?
Die Seminararbeit formuliert Hypothesen zum Zusammenhang zwischen Hautfarbe und Gehalt, basierend auf den Ergebnissen der explorativen Datenanalyse. Diese Hypothesen werden dann mit den genannten statistischen Tests überprüft.
Welche Daten werden verwendet?
Der Datensatz „beauty“ aus dem R-Paket „wooldridge“ von Jeffrey M. Wooldridge dient als Grundlage. Die Daten stammen ursprünglich aus der Studie „Beauty and the Labor Market“ von Hamermesh und Biddle (1994) und wurden für die Seminararbeit möglicherweise reduziert.
Welche Kapitel umfasst die Arbeit?
Die Arbeit gliedert sich in eine Einleitung, die Vorstellung des Datensatzes, die explorative Datenanalyse, die Hypothesenformulierung und -prüfung, die lineare Regression und eine Zusammenfassung. Jedes Kapitel beschreibt die durchgeführten Schritte und Ergebnisse detailliert.
Welche Ergebnisse werden präsentiert?
Die Ergebnisse der explorativen Datenanalyse, der Hypothesentests und der linearen Regression werden präsentiert und interpretiert. Der Fokus liegt auf dem Einfluss der Hautfarbe auf das Gehalt und der Berücksichtigung möglicher Störvariablen.
Welche Software wird verwendet?
Die gesamte Datenanalyse wird mit der Statistiksoftware RStudio durchgeführt.
Welche Schlüsselwörter beschreiben die Arbeit?
Schlüsselwörter sind: Quantitative Datenanalyse, RStudio, Datensatz „beauty“, Hautfarbe, Gehalt, T-Test, Permutationstest, Lineare Regression, Explorative Datenanalyse, Wooldridge, Hamermesh & Biddle.
Wo finde ich die ursprünglichen Daten?
Die Daten stammen aus dem R-Paket "wooldridge" und der Studie "Beauty and the Labor Market" von Hamermesh und Biddle (1994).
Welche Zielsetzung verfolgt die Seminararbeit?
Die Zielsetzung besteht darin, praktische Erfahrungen in der quantitativen Datenanalyse mit RStudio zu sammeln und den Einfluss der Hautfarbe auf das Gehalt anhand des Datensatzes „beauty“ zu untersuchen.
- Arbeit zitieren
- Sophie Schürmann (Autor:in), 2019, Hat die Hautfarbe eine Auswirkung auf das Gehalt? Eine quantitative Datenanalyse mit dem Statistikprogramm RStudio, München, GRIN Verlag, https://www.hausarbeiten.de/document/1252257