Aufgabe 1b)
Als ich meiner Kollegin Frau Mayer meinen Fall schilderte wies sie mich auf die Möglichkeit einer Scheinkorrelation/Intervention hin , die durch die Einbeziehung einer Drittvariable aufzudecken wäre .Eine mögliche Drittvariable könnte laut Frau Mayer die Berufstätigkeit sein.
Wir betrachten nun zuerst dir Korrelation zwischen der Mitgliedschaft und der Berufstätigkeit
(Tab 2) Tabelle der Variablen „Berufstätigkeit“ und „Gewerkschaftszugehörigkeit“
mitglied in |
einer | gewerkschaft | beruf ? | ganztags halbtags nichterwe | Total
-------------+---------------------------------+---------ja | 453 39 169 | 661 | 26.44 18.22 11.14 | 19.19
-------------+---------------------------------+---------nein | 1260 175 1348 | 2783 | 73.56 81.78 88.86 | 80.81
-------------+---------------------------------+----------Total | 1713 214 1517 | 3444
Des weiteren weist Frau Mayer darauf hin, dassmehr Männer als Frauen berufstätig sind. (Tab 3) Tabelle der Variablen „Berufstätigkeit“ und „Geschlecht“
beruf | mann frau | Total
------------+----------------------+---------ganztags | 1170 545 | 1715 | 67.28 31.89 | 49.74
------------+----------------------+---------halbtags | 19 195 | 214 | 1.09 11.41 | 6.21
------------+----------------------+---------nichterwerb | 550 969 | 1519 | 31.63 56.70 | 44.05
------------+----------------------+----------
Total | 1739 1709 | 3448 | 100.00 100.00 | 100.00
Man geht davon aus, dass das Geschlecht Einfluss auf die Berufstätigkeit hat, und diese
wiederum auf die Mitgliedschaft in Gewerkschaften.
Man überprüft nun, ob eine Interaktion oder eine Intervention vorliegt. Dies läßt sich durch
eine Drittvariablenkontrolle prüfen.
Anhand dieser Tabellen kann man die Mitgliedschaft in einer Gewerkschaft in Abhängigkeit
von der Berufstätigkeit und dem Geschlecht ablesen.
Frau Mayers Vermutung würde sich bestätigen, wenn für alle drei Tabellen Cramers V gegen
null tendiert.
(Tab 4) Tabelle zur Drittvariablenkontrolle nach „Berufstätigkeit“ für ganztags
Arbeitende
mitglied in |
einer | geschlecht,
gewerkschaft | befragte
? | mann frau | Total
-------------+----------------------+----------ja | 323 130 | 453
| 27.65 23.85 | 26.44
-------------+----------------------+----------nein | 845 415 | 1260
| 72.35 76.15 | 73.56
-------------+----------------------+----------
Total | (Tab 5) Kontrolltabelle für halbtags Arbeitende
mitglied in |
einer | geschlecht,
gewerkschaft | befragte
? | mann frau | Total
-------------+----------------------+----------ja | 2 37 | 39
| 10.53 18.97 | 18.22
-------------+----------------------+----------nein | 17 158 | 175
| 89.47 81.03 | 81.78
-------------+----------------------+----------Total | 19 195 | 214
| 100.00 100.00 | 100.00 Cramer’s V = -0.0622
(Tab 6) Kontrolltabelle für nicht Erwerbstätige
mitglied in |
einer | geschlecht,
gewerkschaft | befragte
? | mann frau | Total
-------------+----------------------+----------ja | 106 63 | 169
| 19.31 6.51 | 11.14
-------------+----------------------+----------nein | 443 905 | 1348
| 80.69 93.49 | 88.86
-------------+----------------------+----------
Total | (Tab 7) Tabelle der Variablen „Mitglied in einer Gewerkschaft“ und „Geschlecht“ ohne Berücksichtigung von nicht Erwerbstätigen
mitglied in |
einer | geschlecht, gewerkschaft | befragte
-------------+----------------------+---------ja | 325 167 | 492 | 27.38 22.57 | 25.53
-------------+----------------------+---------nein | 862 573 | 1435 | 72.62 77.43 | 74.47
-------------+----------------------+----------Total | 1187 740 | 1927
Abschließend kann man sagen, dass Frau Mayer mit ihrer Hypothese, dass der Faktor
Berufstätigkeit eine Rolle spiele, Recht hatte. Der Zusammenhang zwischen Berufstätigkeit
und Mitgliedschaft ist sogar noch größer als der Einfluss des Faktors Geschlecht auf dieselbe
(siehe Kausaldiagramm). Dies lässt sich direkt aus der Tabelle (Tabelle 7) ableiten, welche
zeigt, dass sich bei Auslassen von nicht-Erwerbstätigen der Prozentsatz von nicht in
Gewerkschaften vertretenen Männern nur unerheblich von dem der Frauen unterscheidet.
Dies liegt an dem enormen Anteil der nicht erwerbstätigen Frauen.
Frau Mayers Argument lautet folgendermaßen: Die geringe Präsenz von Frauen in
Gewerkschaften erklärt sich durch den niedrigen Prozentsatz erwerbstätiger Frauen. Aufgrund
der Tatsache, dass nicht alle drei konditionalen Korellationskoeffizienten gegen null steben
handelt es sich um eine Interaktion anstelle einer Intervention.
Kausaldiagramm mit Korrelationskoeffizienten
Zu Aufgabe 2 :
Die Darstellung der beiden Variablen beruht auf der Hypothese das Einkommen durch Schulbildung beeinflußt wird, wobei nur die ganztags Erwerbstätigen berücksichtigt werden. Um dies zu prüfen steht das Einkommen
Ganztagserwerbstätiger als abhängige Variable am linken Rand der Tabelle und stellt die Zeilenhäufigkeit dar.
Die unabhängige Variable Schulbildung ist spaltenweise dargestellt Nun wird geprüft, ob sich ein Zusammenhang zwischen den beiden Häufigkeiten feststellen läßt.
(Tab 8) Tabelle der Variablen „Nettoeinkommen“ und „Schulbildung“
| bildung income | Kein/Volk Real Fach/Abi | Total
-----------+---------------------------------+----------0-1800 | 147 180 35 | 362 | 25.43 32.67 10.23 | 24.61
-----------+---------------------------------+----------1801-2500 | 199 166 80 | 445 | 34.43 30.13 23.39 | 30.25
-----------+---------------------------------+----------2501-3500 | 160 120 91 | 371 | 27.68 21.78 26.61 | 25.22
-----------+---------------------------------+---------->3500 | 72 85 136 | 293 | 12.46 15.43 39.77 | 19.92
-----------+---------------------------------+----------Total | 578 551 342 | 1471 | 100.00 100.00 100.00 | 100.00 Pearson chi2(6) = 145.6888 Pr = 0.000 gamma = 0.2409 ASE = 0.030 Kendall’s tau-b = 0.1702 ASE = 0.022
Die Tabelle zeigt, dass 34,43% der Befragten die entweder keinen oder lediglich Volksschulabschluss haben, sich in der gleichen Einkommensklasse bewegen wie 30,13% der Personen mit Realschulabschluss (1801-2500 DM)
Diese Werte widerlegen die Annahme niedriges Bildungsniveau führe zwangsläufig zu niedrigerem Nettoeinkommen.
Des weiteren stellt man fest, dass sich in der niedrigsten Einkommensklasse (0- 1800 DM) überwiegend Realschulabsolventen befinden(32,67%).In der oberen Einkommensklasse (über 3000 DM)finden sich in erster Linie Abiturienten (39,77%).Dieser Wert bestätigt zwar, dass Absolventen einer höheren Schule in der Regel mehr verdienen , bezieht man allerdings die Ergebnisse von Gamma (0,24) und Tau -b (0.17) in die Antwortfindung mit ein ,so stellt man fest, dass der Zusammenhang zwischen Schulbildung und Einkommen im Allgemeinen relativ schwach ist. Schulbildung hat also Einfluß auf das Nettoeinkommen ist aber nicht der einzige prägende Faktor.
Zu Aufgabe 3:
3a)
Um die Vermutung der Grauen Panterzu untersuchen ,ob ältere Berufstätige tatsächlich mehr verdienen als jüngere, berechnet man eine Regression auf das Einkommen in Abhängigkeit vom Alter. Das Alter soll die unabhängige Variable sein von dem das Einkommen abhängt. Die Betrachtung beschränkt sich auf ganztags Erwerbstätige, da Halbtagsbeschäftigte oder Arbeitslose das Ergebnis verfälschen würden. (Tab 9) Regressionstabelle der Variablen „Alter“ und „Einkommen“
---------+------------------------------Model |
Residual | 3.9887e+09 1473 2707866.69
---------+------------------------------Total | 4.3619e+09 1474 2959211.52
------------------------------------------------------------------------------v423 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------v247 | 43.63147 3.716622 11.740 0.000 36.34103 50.9219
_cons | 1125.189 148.4538 7.579 0.000 833.9854 1416.392
------------------------------------------------------------------------------ Ausdieser Tabelle erschließen sich folgende Werte: SQT=4,3619*10 9
SQR= 3,9887 * 10 9 (nicht erklärte Streuung) SQE= 373190152 (nicht erklärte Streuung) Alpha-Dach= 1125,2 Beta-Dach= 43,6
Daraus ergibt sich: R²=0,0856 bzw. ein Bravais-Pearson r von 0,293.
Bei der Betrachtung von R² 0, 0865 ist zu erkennen, dass sich 8,56% der Streuung des Einkommens durch das Alter erklären. Das bedeutet, dass sich der weitaus größere Teil der Streuung nämlich 91,44% durch andere Faktoren erklären lassen muß. Der Wert für Beta-Dach liegt bei 43,631 woraus sich schließen läßt, dass sich der Nettoverdienst pro Lebensjahr um 43,63 DM erhöht.
Es trifft also zu, dass ein tendenzieller Anstieg des Nettoeinkommens vorliegt, allerdings sind Faktoren wie zum Beispiel das Umfeld der sozialen Herkunft von weitaus größerer Relevanz.
3b)
Streudiagramm mit Regressionsgerade der Variablen „Einkommen“ und „Alter“
20000
15000
Einkommen in DM
10000
5000
Das Streudiagramm weist einige Ausreißer auf. Das Einkommen dieser Ausreißer liegt weit über dem Einkommen das die Regressionsgerade erwarten lies.Besonders auffällig sind die Einkommen dreier Personen im Alter zwischen 49 und 62 Jahren. Sie liegen mit ihrem Verdienst von etwa 17000 DM monatlich weit über dem für sie vorausgesagten Einkommen, welches laut Regressionsgerade etwa 3309 DM (1124 DM + 43,7 * Alter) betragen sollte. Einige weitere Ausreißer verdienen etwa 13000 DM und liegen damit ca. 10000 DM über dem für ihr Alter zu erwartenden Einkommen. Letztendlich wird zumindest deutlich das die wirklichen Großverdiener zu den über 30-Jährigen gehören.
Codeplan zur Bearbeitung der Hausarbeit
V12 Allgemeiner Schulabschluss
range:(1, 7) units: 1
unique Values: 7 coded missing: 5 / 3450
Tabulation: Freq. Numeric Label
V25 Befragte Berufstätigkeit
range:(1, 5) units: 1
unique values: 5 coded missing: 2 / 3450
Tabulation: Freq. Numeric Label
v247 Befragte Alter
range: (18, 93) units: 1
unique Values: 75 coded missing: 4 / 3450
Examples: 29
v324 Mitglied in einer Gewerkschaft
range: (1, 2) units: 1
unique Values: 2 coded missing: 4 / 3450
Tabulation: Freq. Numeric Label
661 1 Ja
2785 2 Nein
v330 Befragte Geschlecht
range: (1, 2) units: 1
unique Values: 2 coded missing: 0 / 3450
Tabulation: Freq. Numeric Label
v423 Nettoeinkommen, offene Liste
range: (0, 17500) units: 1
unique Values: 283 coded missing: 358 / 3450
Examples: 900
.
. * STATA-OUTPUT (LOG-FILE) .
. * AUFGABE 1
. * 1a)
. tab v324 mitglied in | einer | gewerkschaf | t? | Freq. Percent Cum.
------------+----------------------------------ja | 661 19.18 19.18 nein | 2785 80.82 100.00
------------+-----------------------------------Total | 3446 100.00
. tab v330 geschlecht, | befragte
------------+----------------------------------mann | 1741 50.46 50.46 frau | 1709 49.54 100.00
------------+-----------------------------------Total | 3450 100.00 .
. tab v324 v330, col V mitglied in | einer | geschlecht, gewerkschaft | befragte
-------------+----------------------+---------ja | 431 230 | 661 | 24.80 13.47 | 19.18
-------------+----------------------+---------nein | 1307 1478 | 2785 | 75.20 86.53 | 80.82
-------------+----------------------+----------Total | 1738 1708 | 3446
.
. * 1b)
. tab v25 befragte
--------------------+----------------------------------ganztags erwerbstae | 1699 49.27 49.27 halbtags erwerbstae | 214 6.21 55.48 in kurzarbeit | 16 0.46 55.95 nebenher erwerbstae | 134 3.89 59.83 nichterwerbstaetig | 1385 40.17 100.00
--------------------+-----------------------------------Total | 3448 100.00
. gen beruf = v25 (2 missing values generated)
. recode beruf 3=1 4=3 5=3 (1535 changes made)
. lab def berufl 1"ganztags" 2"halbtags" 3"nichterwerb"
. lab val beruf berufl
. tab beruf beruf | Freq. Percent Cum.
------------+----------------------------------ganztags | 1715 49.74 49.74 halbtags | 214 6.21 55.95 nichterwerb | 1519 44.05 100.00
------------+-----------------------------------Total | 3448 100.00
. tab v324 beruf, col V mitglied in | einer | gewerkschaft | beruf ? | ganztags halbtags nichterwe | Total
-------------+---------------------------------+---------ja | 453 39 169 | 661 | 26.44 18.22 11.14 | 19.19
-------------+---------------------------------+---------nein | 1260 175 1348 | 2783 | 73.56 81.78 88.86 | 80.81
-------------+---------------------------------+----------Total | 1713 214 1517 | 3444
. tab beruf v330, col
beruf | mann frau | Total
------------+----------------------+---------ganztags | 1170 545 | 1715 | 67.28 31.89 | 49.74
------------+----------------------+---------halbtags | 19 195 | 214 | 1.09 11.41 | 6.21
------------+----------------------+---------nichterwerb | 550 969 | 1519 | 31.63 56.70 | 44.05
------------+----------------------+----------Total | 1739 1709 | 3448 | 100.00 100.00 | 100.00
.
. * Tabelle ganztags
. tab v324 v330 if beruf==1, col V mitglied in | einer | geschlecht, gewerkschaft | befragte
-------------+----------------------+---------ja | 323 130 | 453 | 27.65 23.85 | 26.44
-------------+----------------------+---------nein | 845 415 | 1260 | 72.35 76.15 | 73.56
-------------+----------------------+----------Total | 1168 545 | 1713
. * Tabelle halbtags
. tab v324 v330 if beruf==2, col V mitglied in | einer | geschlecht, gewerkschaft | befragte
-------------+----------------------+---------ja | 2 37 | 39 | 10.53 18.97 | 18.22
-------------+----------------------+---------nein | 17 158 | 175 | 89.47 81.03 | 81.78
-------------+----------------------+----------Total | 19 195 | 214
. * Tabelle nichterwerb
. tab v324 v330 if beruf==3, col V mitglied in | einer | geschlecht, gewerkschaft | befragte
-------------+----------------------+---------ja | 106 63 | 169 | 19.31 6.51 | 11.14
-------------+----------------------+---------nein | 443 905 | 1348 | 80.69 93.49 | 88.86
-------------+----------------------+----------Total | 549 968 | 1517
.
. * AUFGABE 2 .
. gen income = v423 (358 missing values generated)
. recode income 0/1800=1 1801/2500=2 2501/3500=3 3501/20000=4 (3092 changes made)
. lab def incomel 1"0-1800" 2"1801-2500" 3"2501-3500" 4">3500"
. lab val income incomel
.
. * Tabelle Einkommensverteilung
. tab income income | Freq. Percent Cum.
------------+-----------------------------------0-1800 | 1652 53.43 53.43 1801-2500 | 652 21.09 74.51 2501-3500 | 462 14.94 89.46 >3500 | 326 10.54 100.00
------------+-----------------------------------Total | 3092 100.00
. gen bildung = v12 (5 missing values generated)
. recode bildung 1=1 2=1 3=2 4=3 5=3 6=4 7=4 (3371 changes made)
. lab def bildungl 1"Kein/Volks" 2"Real" 3"Fach/Abi" 4"Andere=Missing"
. lab val bildung bildungl .
. * Tabelle Schulabschluß
. tab bildung bildung | Freq. Percent Cum.
--------------+-----------------------------------Kein/Volks | 1724 50.04 50.04 Real | 1017 29.52 79.56 Fach/Abi | 654 18.98 98.55 Andere=Missin | 50 1.45 100.00
--------------+-----------------------------------Total | 3445 100.00
. * Tabelle Schulabschluß/Einkommen
. tab income bildung if v25==1 & bildung<=3, col chi2 g t | bildung income | Kein/Volk Real Fach/Abi | Total
-----------+---------------------------------+----------0-1800 | 147 180 35 | 362 | 25.43 32.67 10.23 | 24.61
-----------+---------------------------------+----------1801-2500 | 199 166 80 | 445 | 34.43 30.13 23.39 | 30.25
-----------+---------------------------------+----------2501-3500 | 160 120 91 | 371
| 27.68 21.78 26.61 | 25.22
-----------+---------------------------------+---------->3500 | 72 85 136 | 293 | 12.46 15.43 39.77 | 19.92
-----------+---------------------------------+----------Total | 578 551 342 | 1471 | 100.00 100.00 100.00 | 100.00 Pearson chi2(6) = 145.6888 Pr = 0.000 gamma = 0.2409 ASE = 0.030 Kendall’s tau-b = 0.1702 ASE = 0.022 . . .
. * AUFGABE 3
. * 3a)
. regress v423 v247 if v25==1 & v247>=18 & v247<=65 Source | SS df MS Number of obs = 1475
---------+------------------------------F( 1, 1473) = 137.82 Model | 373190152 1 373190152 Prob > F = 0.0000
Residual | 3.9887e+09 1473 2707866.69 R-squared = 0.0856
---------+------------------------------Adj R-squared = 0.0849 Total | 4.3619e+09 1474 2959211.52 Root MSE = 1645.6
------------------------------------------------------------------------------v423 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------v247 | 43.63147 3.716622 11.740 0.000 36.34103 50.9219 _cons | 1125.189 148.4538 7.579 0.000 833.9854 1416.392
-----------------------------------------------------------------------------.
. * 3b)
. predict eink (option xb assumed; fitted values) (4 missing values generated)
. graph v423 eink v247 if v25==1 & v247>=18 & v247<=65, c(.s) s(oi) t1title(" > Regression von Alter auf Einkommen") b2title("Alter der Befragten (von 18-65) > ") l2title("Einkommen in DM") ylabel l1title(" ") .
. end of do-file
Arbeit zitieren:
Melanie Mayer, 2001, Hausarbeit Statistik I, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Melanie Mayer hat den Text Hausarbeit Statistik I veröffentlicht
Melanie Mayer hat einen neuen Text hochgeladen
0 Kommentare