Bitte warten
Bitte installieren Sie den Flash Player, wenn kein E-Book erscheint.
Autor: Melanie Mayer
Fach: Statistik
Details
Tags: Hausarbeit, Statistik
Jahr: 2001
Seiten: 18
Note: 1
Sprache: Deutsch
Dateigröße: 110 KB
ISBN (E-Book): 978-3-638-99798-0
Volltext (computergeneriert)
Universität Mannheim
Lehrstuhl für Methoden der empirischen
Sozialforschung und angewandte Statistik
Hausarbeit Statistik I
Wintersemester 2000/01
Sarah Bastgen
Claudia Frank
Johannes Kerzel Melanie Mayer
Anna C. Senft
Mat.-Nr. :
Mat.-Nr :
Mat.-Nr. :
Mat.-Nr. :
Mat.-Nr. :
0880920
0880624
0839358
0875227
0880282
Aufgabe 1a) :
(Tab 1) Tabelle der Variablen ,,Mitgliedschaft in einer Gewerkschaft" und
,,Geschlecht"
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 431 230 | 661
| 24.80 13.47 | 19.18
-------------+----------------------+----------
nein | 1307 1478 | 2785
| 75.20 86.53 | 80.82
-------------+----------------------+----------
Total | 1738 1708 | 3446
| 100.00 100.00 | 100.00
Cramer′s V = 0.1439
Aus dem Vergleich der Gewerkschaftszugehörigkeit von Männern und Frauen geht
hervor , daß prozentual wesentlich mehr Männer (24.8%) als Frauen (13.5%) Mitglied
einer Gewerkschaft sind .
Dies führt zu einer Analyse der Prozentsatzdifferenz , welche zeigt , daß die Zahl der
männlichen Gewerkschaftsmitglieder die der weiblichen um ca.11% übersteigt.
Diese 11% beziehen sich allerdings auf die Gesamtmenge der Befragten. Beachtet
Man nur die Mitglieder der Gewerkschaften erhöht sich diese Zahl auf 30%. Dies läßt
Auf die Hypothese schließen, daß Männer eher dazu neigen, sich zu organisieren und
sich in Gewerkschaften integrieren.
Betrachtet man allerdings einen dazugehörigen Korrelationskoeffizienten ( wir haben
uns hier für Cramers V entschieden , da es sich bei beiden Variablen um
Nominalskalierte handelt ) so relativieren sich die Unterschiede . Dies ergibt
sich aus dem hohen Anteil der Nicht-gewerkschaftsmitglieder bei beiden Geschlechtern.
Cramers V beträgt 0.1439 , was einen schwachen Zusammenhang impliziert .
Dieses Ergebnis legt die Vermutung nahe das es noch andere Faktoren gibt die die
Mitgliedschaft in einer Gewerkschaft beeinflussen
Aufgabe 1b)
Als ich meiner Kollegin Frau Mayer meinen Fall schilderte wies sie mich auf die
Möglichkeit einer Scheinkorrelation/Intervention hin , die durch die Einbeziehung einer
Drittvariable aufzudecken wäre .Eine mögliche Drittvariable könnte laut Frau Mayer die
Berufstätigkeit sein.
Wir betrachten nun zuerst dir Korrelation zwischen der Mitgliedschaft und der Berufstätigkeit
(Tab 2) Tabelle der Variablen ,,Berufstätigkeit" und ,,Gewerkschaftszugehörigkeit"
mitglied in |
einer |
gewerkschaft | beruf
? | ganztags halbtags nichterwe | Total
-------------+---------------------------------+----------
ja | 453 39 169 | 661
| 26.44 18.22 11.14 | 19.19
-------------+---------------------------------+----------
nein | 1260 175 1348 | 2783
| 73.56 81.78 88.86 | 80.81
-------------+---------------------------------+----------
Total | 1713 214 1517 | 3444
| 100.00 100.00 100.00 | 100.00
Cramer′s V = 0.1879
Des weiteren weist Frau Mayer darauf hin, dassmehr Männer als Frauen berufstätig sind.
(Tab 3) Tabelle der Variablen ,,Berufstätigkeit" und ,,Geschlecht"
| geschlecht,
| befragte<r>
beruf | mann frau | Total
------------+----------------------+----------
ganztags | 1170 545 | 1715
| 67.28 31.89 | 49.74
------------+----------------------+----------
halbtags | 19 195 | 214
| 1.09 11.41 | 6.21
------------+----------------------+----------
nichterwerb | 550 969 | 1519
| 31.63 56.70 | 44.05
------------+----------------------+----------
Total | 1739 1709 | 3448
| 100.00 100.00 | 100.00
Man geht davon aus, dass das Geschlecht Einfluss auf die Berufstätigkeit hat, und diese
wiederum auf die Mitgliedschaft in Gewerkschaften.
Geschlecht Gewerkschaftsmitglied
0,1439
Berufstätigkeit
Man überprüft nun, ob eine Interaktion oder eine Intervention vorliegt. Dies läßt sich durch
eine Drittvariablenkontrolle prüfen.
Anhand dieser Tabellen kann man die Mitgliedschaft in einer Gewerkschaft in Abhängigkeit
von der Berufstätigkeit und dem Geschlecht ablesen.
Frau Mayers Vermutung würde sich bestätigen, wenn für alle drei Tabellen Cramers V gegen
null tendiert.
(Tab 4) Tabelle zur Drittvariablenkontrolle nach ,,Berufstätigkeit" für ganztags
Arbeitende
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 323 130 | 453
| 27.65 23.85 | 26.44
-------------+----------------------+----------
nein | 845 415 | 1260
| 72.35 76.15 | 73.56
-------------+----------------------+----------
Total | 1168 545 | 1713
| 100.00 100.00 | 100.00
Cramer′s V = 0.0401
(Tab 5) Kontrolltabelle für halbtags Arbeitende
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 2 37 | 39
| 10.53 18.97 | 18.22
-------------+----------------------+----------
nein | 17 158 | 175
| 89.47 81.03 | 81.78
-------------+----------------------+----------
Total | 19 195 | 214
| 100.00 100.00 | 100.00 Cramer′s V = -0.0622
(Tab 6) Kontrolltabelle für nicht Erwerbstätige
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 106 63 | 169
| 19.31 6.51 | 11.14
-------------+----------------------+----------
nein | 443 905 | 1348
| 80.69 93.49 | 88.86
-------------+----------------------+----------
Total | 549 968 | 1517
| 100.00 100.00 | 100.00
Cramer′s V = 0.1955
(Tab 7) Tabelle der Variablen ,,Mitglied in einer Gewerkschaft" und ,,Geschlecht" ohne Berücksichtigung von
nicht Erwerbstätigen
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 325 167 | 492
| 27.38 22.57 | 25.53
-------------+----------------------+----------
nein | 862 573 | 1435
| 72.62 77.43 | 74.47
-------------+----------------------+----------
Total | 1187 740 | 1927
| 100.00 100.00 | 100.00
Cramer′s V = 0.0537
Abschließend kann man sagen, dass Frau Mayer mit ihrer Hypothese, dass der Faktor
Berufstätigkeit eine Rolle spiele, Recht hatte. Der Zusammenhang zwischen Berufstätigkeit
und Mitgliedschaft ist sogar noch größer als der Einfluss des Faktors Geschlecht auf dieselbe
(siehe Kausaldiagramm). Dies lässt sich direkt aus der Tabelle (Tabelle 7) ableiten, welche
zeigt, dass sich bei Auslassen von nicht-Erwerbstätigen der Prozentsatz von nicht in
Gewerkschaften vertretenen Männern nur unerheblich von dem der Frauen unterscheidet.
Dies liegt an dem enormen Anteil der nicht erwerbstätigen Frauen.
Frau Mayers Argument lautet folgendermaßen: Die geringe Präsenz von Frauen in
Gewerkschaften erklärt sich durch den niedrigen Prozentsatz erwerbstätiger Frauen. Aufgrund
der Tatsache, dass nicht alle drei konditionalen Korellationskoeffizienten gegen null steben
handelt es sich um eine Interaktion anstelle einer Intervention.
Kausaldiagramm mit Korrelationskoeffizienten
0,14
Geschlecht Gewerkschaftsmitglied
0,38 0,04/-0.06/0,2
Berufstätigkeit 0,19
Zu Aufgabe 2 :
Die Darstellung der beiden Variablen beruht auf der Hypothese das Einkommen durch
Schulbildung beeinflußt wird, wobei nur die ganztags Erwerbstätigen berücksichtigt werden.
Um dies zu prüfen steht das Einkommen
Ganztagserwerbstätiger als abhängige Variable am linken Rand der Tabelle und stellt die
Zeilenhäufigkeit dar.
Die unabhängige Variable Schulbildung ist spaltenweise dargestellt Nun wird geprüft, ob sich
ein Zusammenhang zwischen den beiden Häufigkeiten feststellen läßt.
(Tab 8) Tabelle der Variablen ,,Nettoeinkommen" und ,,Schulbildung"
| bildung
income | Kein/Volk Real Fach/Abi | Total
-----------+---------------------------------+----------
0-1800 | 147 180 35 | 362
| 25.43 32.67 10.23 | 24.61
-----------+---------------------------------+----------
1801-2500 | 199 166 80 | 445
| 34.43 30.13 23.39 | 30.25
-----------+---------------------------------+----------
2501-3500 | 160 120 91 | 371
| 27.68 21.78 26.61 | 25.22
-----------+---------------------------------+----------
>3500 | 72 85 136 | 293
| 12.46 15.43 39.77 | 19.92
-----------+---------------------------------+----------
Total | 578 551 342 | 1471
| 100.00 100.00 100.00 | 100.00
Pearson chi2(6) = 145.6888 Pr = 0.000
gamma = 0.2409 ASE = 0.030
Kendall′s tau-b = 0.1702 ASE = 0.022
Die Tabelle zeigt, dass 34,43% der Befragten die entweder keinen oder lediglich
Volksschulabschluss haben, sich in der gleichen Einkommensklasse bewegen wie 30,13% der
Personen mit Realschulabschluss (1801-2500 DM)
Diese Werte widerlegen die Annahme niedriges Bildungsniveau führe zwangsläufig zu
niedrigerem Nettoeinkommen.
Des weiteren stellt man fest, dass sich in der niedrigsten Einkommensklasse (0- 1800 DM)
überwiegend Realschulabsolventen befinden(32,67%).In der oberen Einkommensklasse (über
3000 DM)finden sich in erster Linie Abiturienten (39,77%).Dieser Wert bestätigt zwar, dass
Absolventen einer höheren Schule in der Regel mehr verdienen , bezieht man allerdings die
Ergebnisse von Gamma (0,24) und Tau b (0.17) in die Antwortfindung mit ein ,so stellt man
fest, dass der Zusammenhang zwischen Schulbildung und Einkommen im Allgemeinen relativ
schwach ist. Schulbildung hat also Einfluß auf das Nettoeinkommen ist aber nicht der einzige
prägende Faktor.
Zu Aufgabe 3:
3a)
Um die Vermutung der Grauen Panterzu untersuchen ,ob ältere Berufstätige tatsächlich mehr
verdienen als jüngere, berechnet man eine Regression auf das Einkommen in Abhängigkeit
vom Alter. Das Alter soll die unabhängige Variable sein von dem das Einkommen abhängt.
Die Betrachtung beschränkt sich auf ganztags Erwerbstätige, da Halbtagsbeschäftigte oder
Arbeitslose das Ergebnis verfälschen würden.
(Tab 9) Regressionstabelle der Variablen ,,Alter" und ,,Einkommen"
Source | SS df MS Number of obs = 1475
---------+------------------------------ F( 1, 1473) = 137.82
Model | 373190152 1 373190152 Prob > F = 0.0000
Residual | 3.9887e+09 1473 2707866.69 R-squared = 0.0856
---------+------------------------------ Adj R-squared = 0.0849
Total | 4.3619e+09 1474 2959211.52 Root MSE = 1645.6
------------------------------------------------------------------------------
v423 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
v247 | 43.63147 3.716622 11.740 0.000 36.34103 50.9219
_cons | 1125.189 148.4538 7.579 0.000 833.9854 1416.392
------------------------------------------------------------------------------
Aus dieser Tabelle erschließen sich folgende Werte:
SQT=4,3619*109
SQR= 3,9887 * 109 (nicht erklärte Streuung)
SQE= 373190152 (nicht erklärte Streuung)
Alpha-Dach= 1125,2
Beta-Dach= 43,6
Daraus ergibt sich: R²=0,0856
bzw. ein Bravais-Pearson r von 0,293.
Bei der Betrachtung von R² 0, 0865
ist zu erkennen, dass sich 8,56% der Streuung des
Einkommens durch das Alter erklären. Das bedeutet, dass sich der weitaus größere Teil der
Streuung nämlich 91,44% durch andere Faktoren erklären lassen muß.
Der Wert für Beta-Dach liegt bei 43,631 woraus sich schließen läßt, dass sich der
Nettoverdienst pro Lebensjahr um 43,63 DM erhöht.
Es trifft also zu, dass ein tendenzieller Anstieg des Nettoeinkommens vorliegt, allerdings sind
Faktoren wie zum Beispiel das Umfeld der sozialen Herkunft von weitaus größerer Relevanz.
3b)
Streudiagramm mit Regressionsgerade der Variablen ,,Einkommen" und ,,Alter"
Regression von Alter auf Einkommen
20000
15000
M
10000
Einkommen in D
5000
0
18
65
Alter der Befragten (von 18-65)
Das Streudiagramm weist einige Ausreißer auf. Das Einkommen dieser Ausreißer liegt weit
über dem Einkommen das die Regressionsgerade erwarten lies.Besonders auffällig sind die
Einkommen dreier Personen im Alter zwischen 49 und 62 Jahren. Sie liegen mit ihrem
Verdienst von etwa 17000 DM monatlich weit über dem für sie vorausgesagten Einkommen,
welches laut Regressionsgerade etwa 3309 DM (1124 DM + 43,7 * Alter) betragen sollte.
Einige weitere Ausreißer verdienen etwa 13000 DM und liegen damit ca. 10000 DM über
dem für ihr Alter zu erwartenden Einkommen. Letztendlich wird zumindest deutlich das die
wirklichen Großverdiener zu den über 30-Jährigen gehören.
Codeplan zur Bearbeitung der Hausarbeit
V12 Allgemeiner Schulabschluss
range:(1, 7) units: 1
unique Values: 7 coded missing: 5 / 3450
Tabulation: Freq. Numeric Label
74 1 Kein Abschluss
1650 2 Volksschulabschl.
1017 3 Mittlere Reife
164 4 Fachhochschulabschl.
490 5 Abitur, Hochschulabschl.
24 6 Anderer
26 7 Noch Schüler
V25 Befragte Berufstätigkeit
range:(1, 5) units: 1
unique values: 5 coded missing: 2 / 3450
Tabulation: Freq. Numeric Label
1699 1 Ganztags
214 2 Halbtags
16 3 in Kurzarbeit
134 4 Nebenher
1385 5 Nichterwerb
v247 Befragte Alter
range: (18, 93) units: 1
unique Values: 75 coded missing: 4 / 3450
Examples: 29
39
51
62
v324 Mitglied in einer Gewerkschaft
range: (1, 2) units: 1
unique Values: 2 coded missing: 4 / 3450
Tabulation: Freq. Numeric Label
661 1 Ja
2785 2 Nein
v330 Befragte Geschlecht
range: (1, 2) units: 1
unique Values: 2 coded missing: 0 / 3450
Tabulation: Freq. Numeric Label
1741 1 Mann
1709 2 Frau
v423 Nettoeinkommen, offene Liste
range: (0, 17500) units: 1
unique Values: 283 coded missing: 358 / 3450
Examples: 900
1550
2250
3500
.
. * STATA-OUTPUT (LOG-FILE)
.
. * AUFGABE 1
. * 1a)
. tab v324
mitglied in |
einer |
gewerkschaf |
t? | Freq. Percent Cum.
------------+-----------------------------------
ja | 661 19.18 19.18
nein | 2785 80.82 100.00
------------+-----------------------------------
Total | 3446 100.00
. tab v330
geschlecht, |
befragte<r> | Freq. Percent Cum.
------------+-----------------------------------
mann | 1741 50.46 50.46
frau | 1709 49.54 100.00
------------+-----------------------------------
Total | 3450 100.00
.
. tab v324 v330, col V
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 431 230 | 661
| 24.80 13.47 | 19.18
-------------+----------------------+----------
nein | 1307 1478 | 2785
| 75.20 86.53 | 80.82
-------------+----------------------+----------
Total | 1738 1708 | 3446
| 100.00 100.00 | 100.00
Cramer′s V = 0.1439
.
. * 1b)
. tab v25
befragte<r> |
berufstaetig? | Freq. Percent Cum.
--------------------+-----------------------------------
ganztags erwerbstae | 1699 49.27 49.27
halbtags erwerbstae | 214 6.21 55.48
in kurzarbeit | 16 0.46 55.95
nebenher erwerbstae | 134 3.89 59.83
nichterwerbstaetig | 1385 40.17 100.00
--------------------+-----------------------------------
Total | 3448 100.00
. gen beruf = v25
(2 missing values generated)
. recode beruf 3=1 4=3 5=3
(1535 changes made)
. lab def berufl 1"ganztags" 2"halbtags" 3"nichterwerb"
. lab val beruf berufl
. tab beruf
beruf | Freq. Percent Cum.
------------+-----------------------------------
ganztags | 1715 49.74 49.74
halbtags | 214 6.21 55.95
nichterwerb | 1519 44.05 100.00
------------+-----------------------------------
Total | 3448 100.00
. tab v324 beruf, col V
mitglied in |
einer |
gewerkschaft | beruf
? | ganztags halbtags nichterwe | Total
-------------+---------------------------------+----------
ja | 453 39 169 | 661
| 26.44 18.22 11.14 | 19.19
-------------+---------------------------------+----------
nein | 1260 175 1348 | 2783
| 73.56 81.78 88.86 | 80.81
-------------+---------------------------------+----------
Total | 1713 214 1517 | 3444
| 100.00 100.00 100.00 | 100.00
Cramer′s V = 0.1879
. tab beruf v330, col
| geschlecht,
| befragte<r>
beruf | mann frau | Total
------------+----------------------+----------
ganztags | 1170 545 | 1715
| 67.28 31.89 | 49.74
------------+----------------------+----------
halbtags | 19 195 | 214
| 1.09 11.41 | 6.21
------------+----------------------+----------
nichterwerb | 550 969 | 1519
| 31.63 56.70 | 44.05
------------+----------------------+----------
Total | 1739 1709 | 3448
| 100.00 100.00 | 100.00
.
. * Tabelle ganztags
. tab v324 v330 if beruf==1, col V
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 323 130 | 453
| 27.65 23.85 | 26.44
-------------+----------------------+----------
nein | 845 415 | 1260
| 72.35 76.15 | 73.56
-------------+----------------------+----------
Total | 1168 545 | 1713
| 100.00 100.00 | 100.00
Cramer′s V = 0.0401
. * Tabelle halbtags
. tab v324 v330 if beruf==2, col V
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 2 37 | 39
| 10.53 18.97 | 18.22
-------------+----------------------+----------
nein | 17 158 | 175
| 89.47 81.03 | 81.78
-------------+----------------------+----------
Total | 19 195 | 214
| 100.00 100.00 | 100.00
Cramer′s V = -0.0622
. * Tabelle nichterwerb
. tab v324 v330 if beruf==3, col V
mitglied in |
einer | geschlecht,
gewerkschaft | befragte<r>
? | mann frau | Total
-------------+----------------------+----------
ja | 106 63 | 169
| 19.31 6.51 | 11.14
-------------+----------------------+----------
nein | 443 905 | 1348
| 80.69 93.49 | 88.86
-------------+----------------------+----------
Total | 549 968 | 1517
| 100.00 100.00 | 100.00
Cramer′s V = 0.1955
.
. * AUFGABE 2
.
. gen income = v423
(358 missing values generated)
. recode income 0/1800=1 1801/2500=2 2501/3500=3 3501/20000=4
(3092 changes made)
. lab def incomel 1"0-1800" 2"1801-2500" 3"2501-3500" 4">3500"
. lab val income incomel
.
. * Tabelle Einkommensverteilung
. tab income
income | Freq. Percent Cum.
------------+-----------------------------------
0-1800 | 1652 53.43 53.43
1801-2500 | 652 21.09 74.51
2501-3500 | 462 14.94 89.46
>3500 | 326 10.54 100.00
------------+-----------------------------------
Total | 3092 100.00
. gen bildung = v12
(5 missing values generated)
. recode bildung 1=1 2=1 3=2 4=3 5=3 6=4 7=4
(3371 changes made)
. lab def bildungl 1"Kein/Volks" 2"Real" 3"Fach/Abi" 4"Andere=Missing"
. lab val bildung bildungl
.
. * Tabelle Schulabschluß
. tab bildung
bildung | Freq. Percent Cum.
--------------+-----------------------------------
Kein/Volks | 1724 50.04 50.04
Real | 1017 29.52 79.56
Fach/Abi | 654 18.98 98.55
Andere=Missin | 50 1.45 100.00
--------------+-----------------------------------
Total | 3445 100.00
. * Tabelle Schulabschluß/Einkommen
. tab income bildung if v25==1 & bildung<=3, col chi2 g t
| bildung
income | Kein/Volk Real Fach/Abi | Total
-----------+---------------------------------+----------
0-1800 | 147 180 35 | 362
| 25.43 32.67 10.23 | 24.61
-----------+---------------------------------+----------
1801-2500 | 199 166 80 | 445
| 34.43 30.13 23.39 | 30.25
-----------+---------------------------------+----------
2501-3500 | 160 120 91 | 371
| 27.68 21.78 26.61 | 25.22
-----------+---------------------------------+----------
>3500 | 72 85 136 | 293
| 12.46 15.43 39.77 | 19.92
-----------+---------------------------------+----------
Total | 578 551 342 | 1471
| 100.00 100.00 100.00 | 100.00
Pearson chi2(6) = 145.6888 Pr = 0.000
gamma = 0.2409 ASE = 0.030
Kendall′s tau-b = 0.1702 ASE = 0.022
.
.
.
. * AUFGABE 3
. * 3a)
. regress v423 v247 if v25==1 & v247>=18 & v247<=65
Source | SS df MS Number of obs = 1475
---------+------------------------------ F( 1, 1473) = 137.82
Model | 373190152 1 373190152 Prob > F = 0.0000
Residual | 3.9887e+09 1473 2707866.69 R-squared = 0.0856
---------+------------------------------ Adj R-squared = 0.0849
Total | 4.3619e+09 1474 2959211.52 Root MSE = 1645.6
------------------------------------------------------------------------------
v423 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
---------+--------------------------------------------------------------------
v247 | 43.63147 3.716622 11.740 0.000 36.34103 50.9219
_cons | 1125.189 148.4538 7.579 0.000 833.9854 1416.392
------------------------------------------------------------------------------
.
. * 3b)
. predict eink
(option xb assumed; fitted values)
(4 missing values generated)
. graph v423 eink v247 if v25==1 & v247>=18 & v247<=65, c(.s) s(oi) t1title("
> Regression von Alter auf Einkommen") b2title("Alter der Befragten (von 18-65)
> ") l2title("Einkommen in DM") ylabel l1title(" ")
.
. end of do-file
Kommentare
Dieser Text kann über folgende URL aufgerufen und zitiert werden: