Auswirkungen von Einkommen und Wohnort auf die Gesundheit

Analyse des Datensatzes „ALLBUScompact 2016“


Hausarbeit, 2019

15 Seiten, Note: 1,0


Leseprobe

Inhaltsverzeichnis

1. Einleitung und Datenaufbereitung

2. Überblick der Daten (Deskriptive Statistik)

3. Analyse der Hypothesen

4. Diskussion

5. Literaturverzeichnis

Abstract

Viele Menschen klagen über gesundheitliche Probleme, beispielsweise durch Stress oder körperlich anstrengende Arbeit. Im Zuge dieser Analyse wird ein Teil dieser Thematik untersucht, nämlich die Auswirkungen von Einkommen und Wohnort auf die Gesundheit. Zur Analyse der Auswirkungen wird der Datensatz „ALLBUScompact 2016 - Variable Report“ genutzt, der für diese Untersuchung auf einige relevante Variablen reduziert wird. Betrachtet werden zwei Hypothesen:

H1: Es gibt einen Unterschied im Einkommen je nach Gesundheitszustand

H2: Der Wohnort hat eine Auswirkung auf die Gesundheit.

Mittels einer Varianzanalyse (ANOVA) kann auf Basis des oben beschriebenen Datensatzes gezeigt werden, dass es einen Unterschied im Einkommen je nach Gesundheitszustand gibt. Hingegen zeigt ein Chi-Quadrat-Unabhängigkeitstest, dass zwischen dem Gesundheitszustand und dem Wohnort kein Zusammenhang besteht. Für genauere Untersuchungen ist jedoch eine gezielte Umfrage nötig, da der Datensatz und die Qualität der Daten nicht auf diese Forschungsfrage ausgelegt sind.

1 Einleitung und Datenaufbereitung

1.1 Einleitung und Definition der Forschungsfrage und Hypothesen

In dieser Analyse wird ein Teilaspekt der Gesundheit untersucht, nämlich die Auswirkung von Einkommen und Wohnort auf die Gesundheit. Dazu werden zwei Hypothesen aufgestellt, die mithilfe des Allbus Datensatzes statistisch untersucht werden.

Forschungsfrage:

Welche Auswirkungen haben Einkommen und Wohnort auf die Gesundheit?

Hypothesen:

H1: Es gibt einen Unterschied im Einkommen je nach Gesundheitszustand.

H2: Der Wohnort hat eine Auswirkung auf die Gesundheit.

Die Hypothesen werden im Folgendem unter der Prämisse von a = .05 getestet.

1.2 Vorstellung des Datensatzes „Allbus“

Zur Untersuchung der Hypothesen wird der Datensatz „ALLBUScompact 2016 - Variable Report“ genutzt (Studien-Nr. 5251), bereitgestellt von GESIS Datenarchiv für Sozialwissenschaften (Gesis, 2020). Allbus steht für „Allgemeine Bevölkerungsumfrage der Sozialwissenschaften“. Diese Studie wird alle zwei Jahre mit einer repräsentativen Stichprobe von Bewohnern der Bundesrepublik Deutschland durchgeführt.

Der Datensatz besteht aus 3490 Zeilen und 590 Variablen. Aufgrund des Umfangs des Datensatzes wird dieser für die folgende Analyse limitiert. Betrachtet werden die in Tabelle 1 genannten Variablen, die dazu als reduzierter Datensatz allbus_gew.csv abgelegt werden.

Tabelle 1

Abbildung in dieser Leseprobe nicht enthalten

1.3 Datenaufbereitung

Zur besseren Weiterverarbeitung werden die Inhalte der Variablen hs01 und gs01 vor dem Import in RStudio umbenannt, siehe Tabelle 2.

Tabelle 2

Abbildung in dieser Leseprobe nicht enthalten

1.4 Datenimport und Pakete

Für die Analyse wird die Entwicklungsumgebung RStudio (Version 1.1.463) verwendet, dessen grafische Benutzeroberfläche das Arbeiten mit dem Datensatz erleichtert. Zur weiteren Verarbeitung der Daten wird das Paket mosaic benötigt, welches zunächst installiert und anschließend einmal pro Sitzung gestartet werden muss.

Abbildung in dieser Leseprobe nicht enthalten

2 Überblick der Daten (Deskriptive Statistik)

2.1 Datensatz „allbus_gew“

Betrachtet wird zunächst der gesamte Datensatz allbus_gew. Der Befehl head() zeigt beispielhaft die ersten 6 Zeilen des Datensatzes an und dient zur Kontrolle des korrekten Importes des Datensatzes.

Abbildung in dieser Leseprobe nicht enthalten

Der Befehl inspect() gibt die von RStudio interpretierten Skalenniveaus der Daten aus.

Abbildung in dieser Leseprobe nicht enthalten

Der Datensatz besteht aus 3490 Zeilen (n) und drei Variablen, zwei Kategoriale (hs01 und gs01) sowie eine Metrische (inc). Der Datensatz wurde korrekt importiert und interpretiert. Im Folgenden wird auf die einzelnen Variablen näher eingegangen.

2.2 Gesundheitszustand (hs01)

Die Variable hs01 beschreibt den Gesundheitszustand der befragten Person basierend auf einer subjektiven Selbsteinschätzung. Es handelt sich um ordinalskalierte Daten (kategorial). Die vorgegebenen Antwortmöglichkeiten reichen von 1 (sehr gut) bis 5 (schlecht).

Abbildung in dieser Leseprobe nicht enthalten

Eine Person hat ihren Gesundheitszustand nicht angegeben, der Rest verteilt sich auf die gegebenen Antwortmöglichkeiten. Ein Balkendiagramm eignet sich zur visuellen Darstellung, siebe Abbildung 1.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1. Balkendiagramm Gesundheitszustand.

Das Balkendiagramm zeigt eine rechtsschiefe Verteilung der Daten, die meisten befragten Personen bewerten ihren Gesundheitszustand mit 1 (Sehr gut) und 2 (Gut). Von 3 (Zufriedenstellend) bis 5 (schlecht) fallen die Häufigkeiten der Antworten ab. Der Gesundheitszustand 2 (Gut) hat die meisten Nennungen (1451, gleichzeitig der Modus), der Gesundheitszustand 5 (Schlecht) die Wenigsten (109).

2.3 Nettoeinkommen (inc)

Die Variable inc beschreibt das zusammengefasste monatliche Nettoeinkommen der befragten Person. Es handelt sich um verhältnisskalierte Daten (metrisch), die befragten Personen können den Wert frei angeben. Der Befehl favstats() gibt einen Überblick über die wichtigsten deskriptiven Kennzahlen.

Abbildung in dieser Leseprobe nicht enthalten

Das geringste genannte Nettoeinkommen liegt bei 1, das Höchste bei 9500. Der Mittelwert liegt bei 1681.22, die Standardabweichung bei 1204.704. Insgesamt beantworten 3097 Personen die Frage nach dem Nettoeinkommen, 393 Personen geben kein Nettoeinkommen an. Als visuelle Darstellung eignet sich der Boxplot (siehe Abbildung 2), der sowohl die Verteilung der Daten als auch mögliche Ausreißer visualisiert.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2. Boxplot des Nettoeinkommens.

Der Boxplot zeigt eine rechtsschiefe Verteilung der Daten, Ausreißer sind besonders bei einem hohen Nettoeinkommen (ab 3900) zu erkennen.

2.4 Selbstbeschreibung des Wohnortes (gs01)

Die Variable gs01 enthält die Selbstbeschreibung des Wohnortes, wobei die befragten Personen hier aus einer von fünf vorgegeben Antwortmöglichkeiten auswählen. Es handelt sich um nominalskalierte Daten (kategorial) die in dieser Analyse als ordinalskalierte Daten (kategorial) angesehen werden, sortiert nach Personenaufkommen in der Region (Großstadt > Rand oder Vororte einer Großstadt > Mittel- oder Kleinstadt > Ländliches Dorf > Alleinstehendes Haus).

[...]

Ende der Leseprobe aus 15 Seiten

Details

Titel
Auswirkungen von Einkommen und Wohnort auf die Gesundheit
Untertitel
Analyse des Datensatzes „ALLBUScompact 2016“
Hochschule
FOM Hochschule für Oekonomie & Management gemeinnützige GmbH, Düsseldorf früher Fachhochschule
Veranstaltung
Datenerhebung & Statistik
Note
1,0
Autor
Jahr
2019
Seiten
15
Katalognummer
V911754
ISBN (eBook)
9783346264312
ISBN (Buch)
9783346264329
Sprache
Deutsch
Schlagworte
R-Studio, R Studio, Statistik, Allbus Datensatz, Allbus, Einkommen, Wohnort, Gesundheit
Arbeit zitieren
Maik Raffelsiefen (Autor), 2019, Auswirkungen von Einkommen und Wohnort auf die Gesundheit, München, GRIN Verlag, https://www.grin.com/document/911754

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Auswirkungen von Einkommen und Wohnort auf die Gesundheit



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden