Ein quantitative Datenanalyse des "wage2"-Datensatzes von Blackburn und Neumark

Zusammenhang von Region, Jahren der Betriebszugehörigkeit und monatlichem Gehalt von Männern in Amerika 1980


Hausarbeit, 2019

15 Seiten, Note: 1,3

Anonym


Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

1. Forschungsfrage und Hypothesen

2. Methoden
2.1 Beschreibung des Datensatzes
2.2 Angewandte statistische Verfahren

3. Deskriptive Statistik
3.1 Deskriptive Statistik zu der Variabel "wage"
3.2 Deskriptive Statistik zu der Variabel "south"
3.3 Deskriptive Statistik zu der Variabel "tenure"

4. Inferenzstatistik
4.1 Untersuchung der HI
4.2 Untersuchung der H2
4.3 Untersuchung der H3

5. Diskussion

Abbildungsverzeichnis

Abbildung 1: Histogram iiber die Haufigkeitsverteilung der abhangigen Variable "wage" mit erkennbarer Rechtsschiefe

Abbildung 2: Boxplot von dem logarithmierten monatlichen Gehalt

Abbildung 3: Boxplot far eine Zusammenhangsanalyse zwischen der abhangigen logarithmierten Variable „lwage" und der unabhangigen Variable „south"

Abbildung 4: Histogram iiber die Haufigkeitsverteilung der Betriebszugehorigkeitsjahre mit erkennbaren Ausreifsern

Abbildung 5: Streudiagramm iiber den Zusammenhang zwischen dem logarithmieren monatlichen Gehalt und der Betriebszugehorigkeitsjahren mit weniger Uberschneidungen bei mehr Jahren

Abbildung 6: Histogram der Mittelwertsdifferenz in einer Nullverteilung

Abbildung 7: Die Darstellung der Normalverteilungsannahme aller Variablen zeigtbeinahe eine Normalverteilung

Abbildung 8: Residualplot der multiplen linearen Regression

1. Forschungsfrage und Hypothesen

Das monatliche Gehalt eines Arbeitnehmers kann von verschiedenen Kriterien abhangig sein. In dem Datensatz "wage2" sind diesbeziiglich einige einflussreiche Kriterien zu finden. Daher wurden fur diese Hausarbeit zwei Einflussgrofsen naher betrachtet, um festzustellen, ob diese signifikante Auswirkungen auf das monatliche Gehalt haben. Ausgehend davon und dem Datensatz „wage2" wurde folgende Forschungsfrage hergeleitet: Gibtes ein Zusammenhang zwischen der Region, der Jahre der Betriebszugehorigkeitund dem monatlichen Gehalt von in Amerika lebenden Mannern im Jahr 1980? Daraus ergibtsich folgende Nullhypothese: Es gibt kein Zusammenhang zwischen der Region, der Jahre der Betriebszugehorigkeitund dem monatlichen Gehalt von in Amerika lebenden Mannern im Jahr 1980.

Genauer konzentriert sich die vorliegende Arbeit auf die Wohnregion der Arbeitnehmer, ob diese im Siiden von Amerika leben oder nicht. Dies wird mit dem Pradikator „south" untersucht und stellt folgende erste Hypothese dar: Es gibt einen Zusammenhang zwischen der Wohnregion und dem monatlichen Gehalt der in Amerika lebenden Mannern im Jahr 1980.

Zudem wurden die Jahre der Betriebszugehorigkeit mithilfe der unabhangigen Variablen „tenure" untersucht. Diese Variable bezieht sich auf die Anzahl der Jahre, welche ein Arbeitnehmer bei demselben Arbeitgeber ununterbrochen angestellt ist. Daraus ergibtsich folgende Hypothese, H2: Es gibt einen Zusammenhang zwischen der Betriebszugehorigkeitsjahren und dem monatlichen Gehalt der in Amerika lebenden Mannern im Jahr 1980.

Letztendlich wurden die eben genannten Variablen auf einen Zusammenhang untereinander untersucht, wodurch folgende dritte Hypothese uberpriift wird: Es gibt einen Zusammenhang zwischen der Region, der Jahre der Betriebszugehorigkeitund dem monatlichen Gehalt der in Amerika lebenden Mannern im Jahr 1980.

Grundsatzlich beeinflussen alle eben aufgezahlten unabhangigen Variablen das Kriterium „wage", welches als monatliches Gehalt beschrieben wird. Alle aufgefuhrten Hypothesen sind ungerichtete Hypothesen, weshalb ein zweiseitiger Hypothesentest durchzufuhren ist.

2. Methoden

2.1 Beschreibung des Datensatzes

Der angewandte Datensatz „wage2" stammtaus dem Dataset„wooldridge". Der Urheber dieses Packages ist J. M. Wooldridge, welcher erstmals im Jahr 2000 unter anderem diesen Datensatz in seinem Buch veroffentlichte. Die urspriingliche Datenquelle gehtaufvon M. Blackburn und F. Neumark (1992) zuriick Hauptsachlich behandelt der Datensatz die Hohe des monatlichen Gehalts der in Amerika lebenden Mannern im Jahr 1980.

„Wage2" beinhaltet935 Beobachtungen bzw. Zeilen aus 17 Variablen bzw. Spalten. Diese sind: wage, hours, IQ, KWW, educ, exper, tenure, age, married, black, south, urban, sibs, brthord, meduc, feduc und lwage. Alle eben genannten Variabeln werden an dieser Stelle nicht we iter beschrieben, da dies fur die Datenanalyse nicht von Relevanz ist. Auffallig sind jedoch die fehlenden Werte bei den Variabel „brthord" (83), „meduc" (78) und „feduc" (194). Insgesamt sind alle Werte integer, bis auf den numerischen Wert von "lwage". Zudem sind die Werte manifest, wodurch keine weitere Operationalisierung notwendig ist.

2.2 Angewandte statistische Verfahren

Die vorliegende Hausarbeit wurde mit Rmarkdown erstellt, wobei die Pakete mosaic, dyplr und wooldridge benotigt wurden. Den Hauptkern umfasst die quantitative Datenanalyse, sowie die statistische Methodik. Die bereits in dem ersten Gliederungspunkt genannten Variabeln werden zunachst einzeln und dann im Zusammenhang miteinander untersucht, um eventuell auftretende Auffalligkeiten zu erkennen und ein generellen Uberblick der Daten zu erhalten. Dies wurde zum einen mit Hilfe von grafischen Darstellungen wie Histogramme, Boxplotoder Streudiagramme und zum anderen durch die Ermittlung von Lage- und Streumafse, sowie Proportionen und einzelne Kennzahlen wie die Korrelation getan. Die anschliefsende Interenzstatistik ermoglicht durch verschiedene Test einen Schluss der Daten auf die Grundgesamtheit. Hierzu wurde fur die HI der Permutationstest, fur die H2 die Varianzanalyse (Anova) und fur die H3 die multiple lineare Regression angewendet. Fur diese Analysen wurde das Signifikanzniveau auf 0,05 festgesetzt.

3. Deskriptive Statistik

Um eine Ubersicht und ein Verstandnis der behandelten Variabeln zu erhalten, werden diese nun nacheinander untersucht, dargestellt und beschrieben.

3.1 Deskriptive Statistik zu der Variabel “ wage ”

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Histogram iiber die Haufigkeitsverteilung der abhangigen Variable "wage" mit erkennbarer Rechtsschiefe (eigene Darstellung).

Das Histogram aus der dargestellten Abbildung fur das monatliche Gehalt (wage) deutet auf eine rechtsschiefe und linkssteile Verteilung hin und hat den haufigsten Wertbei ca. 950 Dollar. Mit Hilfe dessen kann gesagt werden, dass das durchschnittliche monatliche Einkommen der Manner etwa bei diesem Wert liegt. Sehr wenige Manner verdienen mehr als 2000 Dollar im Monat, wobei viele etwa 800 Dollar verdienen. Um diese Interpretationen genauer zu definieren, helfen die anschliefsend berechneten Lage und Streumafse.

Lage- und Streuma ß e des monatlichen Gehalts

Abbildung in dieser Leseprobe nicht enthalten

Die Auspragungen der abhangigen, metrisch stetigen Variablen „wage" reicht von dem Minimum 115 Dollar bis zum Maximum 3078 Dollar Verdienst pro Monat. Der Mittelwert liegt bei gerundet 958 Dollar. Die Standardabweichung betragt circa 404 Dollar, wahrend der Median bei 905 Dollar ist. Das erste Quantil befindet sich bei 669 Dollar, wodurch zu erkennen ist, dass 75 % der Manner mehr als 669 Dollar pro Monat verdienen. Das dritte Quantil befindet sich bei 1160 Dollar. Aufserdem fehlen von 935 Beobachtungen keine Werte bei der Variabeln „wage". Der Interquartisabstand liegt bei 736,5 Dollar. Eine Veranschaulichung eben aufgezahlter Lagemafse ermoglicht nachfolgender Boxplot.

Boxplott zum logarithmierten monatlichen Gehalt

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Boxplott von dem logarithmierten monatlichen Gehalt (eigene Darstellung).

Der Boxplotzeigtbei dem logarithmierten monatlichen Gehalt Ausreiser nach oben und nach unten, wobei im unteren Bereich mehr Ausreifser zu verzeichnen sind. Tipp- oder Messfehler sind auszuschliefsen, wodurch die Ausreifser beibehalten werden. Eine leichte Streuung nach unten ist durch den Boxplot ebenfalls zu erkennen, somit sind etwas mehr Werte im unteren Bereich zu finden.

3.2 Deskriptive Statistik zu der Variabel “ south ”

Die Variable „south" beschreibt die Manner, die im Siiden von Amerika leben. Sie wurde nach 1 und 0 kodiert. Das lasstsich folgendermafsen interpretieren: wenn 1, dann leben die Manner im Siiden, wenn 0, dann leben die Manner nicht im Siiden. Daher ist diese Variable nicht nur kategorial und nominal, sondern auch binar.

Proportionaler Anteil nach Region

Abbildung in dieser Leseprobe nicht enthalten

Durch den proportionalen Anteil lasst sich feststellen, wie viele der Manner im Siiden leben oder nicht. Bei dieser Statistik betragt der Wert der Manner, die im Siiden leben, 34 %.

Boxplott von dem logarithmierten monatlichen Gehalt und der Region

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Boxplot fiir eine Zusammenhangsanalyse zwischen der abhangigen logarithmierten Variablen „lwage" und der unabhangige Variable „south" (eigene Darstellung).

Die Darstellung zeigt ein Boxplot iiber den Zusammenhang zwischen dem logarithmierten monatlichen Gehalt und der Region. Der Boxplott istnach 0 und 1 gruppiert, wodurch ersichtlich ist, dass bei der Aufteilung nach 1 (im Siiden lebend) weniger Ausreifser vorhanden sind, als bei 0 (nicht im Siiden lebend). Im Vergleich dazu steht die Aufteilung nach 1, bei dieser nur wenige Ausreifser zu verzeichnen sind. Anhand der Darstellung gibt es vermutlich ein Unterschied zwischen den Wohnregionen und es kann gesagt werden, dass ein paar Manner (=Ausreifser), die nicht im Siiden leben, ein anderes monatliches Gehalt verdienen als die Grundgesamtheit der nicht im Siiden lebenden Mannern im Jahr 1980.

[...]

Ende der Leseprobe aus 15 Seiten

Details

Titel
Ein quantitative Datenanalyse des "wage2"-Datensatzes von Blackburn und Neumark
Untertitel
Zusammenhang von Region, Jahren der Betriebszugehörigkeit und monatlichem Gehalt von Männern in Amerika 1980
Hochschule
FOM Hochschule für Oekonomie & Management gemeinnützige GmbH, München früher Fachhochschule
Note
1,3
Jahr
2019
Seiten
15
Katalognummer
V910063
ISBN (eBook)
9783346218636
ISBN (Buch)
9783346218643
Sprache
Deutsch
Schlagworte
amerika, region, neumark, männern, jahren, gehalt, datenanalyse, blackburn, betriebszugehörigkeit, zusammenhang
Arbeit zitieren
Anonym, 2019, Ein quantitative Datenanalyse des "wage2"-Datensatzes von Blackburn und Neumark, München, GRIN Verlag, https://www.grin.com/document/910063

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Ein quantitative Datenanalyse des "wage2"-Datensatzes von Blackburn und Neumark



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden