Ziel dieser wissenschaftlichen Arbeit ist es, eine quantitative Datenanalyse der Zusammenhänge zwischen dem pro Kopf Alkohol Konsum (Wein) und den damit verbundenen Toten mit Herz und Lebererkrankungen je Land durchzuführen. Im Fokus steht dabei die Untersuchung, in wie fern sich der Alkoholkonsum - in Form von Wein - auf die Todesursache auswirkt. Durch die Anwendung geeigneter Testverfahren wird mittels der Statistiksoftware RStudio eruiert, ob die zuvor erstellten Alternativ- und Nullhpothesen Bestand haben oder verworfen werden müssen.
Inhaltsverzeichnis
1 Einleitung
2 Zielsetzung
3 Datensatz Auswertung
4 Hypothesenprüfung
4.1 Hypothesenformulierung
4.2 Korrelationsanalyse
4.3 Regressionsanalyse
5 Fazit
Zielsetzung und Themen der Arbeit
Diese wissenschaftliche Arbeit führt eine quantitative Datenanalyse auf Basis des Wooldridge-Datensatzes „Wine“ durch, um den Zusammenhang zwischen dem pro Kopf Alkoholkonsum (Wein) und der Sterblichkeitsrate durch Herz- und Lebererkrankungen in verschiedenen Ländern zu untersuchen.
- Analyse der Datenstruktur des „Wine“-Datensatzes in RStudio
- Formulierung und statistische Überprüfung von Forschungshypothesen
- Einsatz von Korrelationsanalysen zur Bestimmung von Zusammenhangsstärken
- Durchführung von Regressionsanalysen zur Quantifizierung von Effekten
- Visualisierung der Ergebnisse mittels ggplot2
Auszug aus dem Buch
4.1 Hypothesenformulierung
Der oft diskutierte Fakt, dass sich mit erhöhtem Alkoholkonsum (in dieser Arbeit wird der Alkoholkonsum in Form von Wein gleichgesetzt) die Rate an Todesfällen durch Herz - und Lebererkrankungen steigt, wird im darauf folgenden analysiert und geprüft.
Es werden folgende zwei Forschungshypothesen formuliert:
Forschungshypothese 1
H0: Der Alkoholkonsum wirkt sich nicht auf die Rate an Todesfällen durch Herzerkrankungen aus.
H1: Mit steigendem Alkohlkonsum erhöht sich die Anzahl/Rate der Todesfälle durch Herzerkrankungen.
Forschungshypothese 2
H0: Der Alkoholkonsum wirkt sich nicht auf die Rate an Todesfällen durch Lebererkrankungen aus.
H1: Mit steigendem Alkohlkonsum erhöht sich die Anzahl/Rate der Todesfälle durch Lebererkrankungen.
Als Signifikanz wird 99% gewählt bzw. der Fehler I. Art (auch Signifikanzniveau oder alpha Fehler genannt) auf 1% oder 0,01 gesetzt.
In der Hypothese 1 ist die unabhängige X-Variable „alcohol“, und die abhängige oder Y-Zielvariable „heart“. In der Hypothese 2 ist die unabhängige X-Variable „alcohol“ und die abhängige oder auch Y-Zielvariable „liver“.
Als ersten Schritt werden beide Hypothesen in einem Streudiagramm visualisiert, wobei auf der X-Achse die unabhängige und auf der Y-Achse die abhängige Varbiable abgebildet wird. Daraufhin wird in in ggplot2 die automatisch realisierte Regressionsgerade mit 95% Konfidenzintervall dargestellt.
Zusammenfassung der Kapitel
1 Einleitung: Vorstellung des „Wine“-Datensatzes aus dem Wooldridge-Datenpaket sowie dessen Einbindung in das Statistikprogramm RStudio.
2 Zielsetzung: Definition des Ziels, mittels statistischer Testverfahren den Einfluss des Weinkonsums auf herz- und leberbedingte Todesfälle zu analysieren.
3 Datensatz Auswertung: Beschreibung der Variablen des Datensatzes und Durchführung einer ersten explorativen Datenanalyse inklusive Häufigkeits- und Verteilungsdarstellungen.
4 Hypothesenprüfung: Aufstellung, Visualisierung und statistische Überprüfung der Forschungshypothesen mittels Korrelations- und Regressionsanalyse.
5 Fazit: Zusammenfassende Auswertung der statistischen Ergebnisse, wobei eine Hypothese verworfen und die andere bestätigt wurde.
Schlüsselwörter
Quantitative Datenanalyse, RStudio, Wooldridge, Alkoholkonsum, Wein, Herzerkrankungen, Lebererkrankungen, Korrelationsanalyse, Regressionsanalyse, Signifikanzniveau, Statistik, Todesrate, Hypothesenprüfung, Datensatz, ggplot2
Häufig gestellte Fragen
Worum geht es in dieser wissenschaftlichen Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit einer quantitativen Analyse des „Wine“-Datensatzes, um Zusammenhänge zwischen Alkoholkonsum und verschiedenen Todesursachen zu untersuchen.
Was sind die zentralen Themenfelder der Analyse?
Die zentralen Felder sind die ökonometrische Auswertung von Datensätzen in RStudio, die statistische Signifikanzprüfung sowie die Untersuchung von Korrelationen zwischen Alkoholkonsum und Mortalität.
Was ist das primäre Ziel der Studie?
Das Ziel ist es, mithilfe statistischer Testverfahren zu eruieren, ob der Weinkonsum einen signifikanten Einfluss auf die Todesraten durch Herz- oder Lebererkrankungen hat.
Welche wissenschaftliche Methode wird verwendet?
Es werden deskriptive Datenanalysen (Boxplots, Häufigkeitstabellen), Korrelationsanalysen sowie lineare Regressionsmodelle in der Statistiksoftware RStudio angewandt.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil umfasst die detaillierte Beschreibung der Variablen, die Visualisierung der Zusammenhänge mittels Streudiagrammen und die Durchführung inferenzstatistischer Tests.
Welche Schlüsselwörter charakterisieren die Arbeit?
Wichtige Begriffe sind quantitative Analyse, RStudio, Alkoholkonsum, Mortalität, Korrelation und Regressionsanalyse.
Warum wurde für die Herzerkrankungen ein negativer Zusammenhang festgestellt?
Die Analyse ergab einen statistisch signifikant negativen Zusammenhang, was darauf hindeutet, dass moderater Weinkonsum in diesem Datensatz mit niedrigeren Todesraten durch Herzerkrankungen assoziiert ist.
Was bedeutet der ermittelte Koeffizient bei der Regressionsanalyse der Lebererkrankungen?
Ein positiver Koeffizient von 10,8548 bedeutet, dass bei einem Anstieg des Alkoholkonsums um eine Einheit die Todesrate durch Lebererkrankungen um etwa 10,85 Einheiten ansteigt.
- Arbeit zitieren
- M. Frank (Autor:in), 2019, Auswertung des Wooldridge Datensatzes "Wine". Quantitative Datenanalyse. Auswirkung des Alkoholkonsums (Wein) auf die Todesursache, München, GRIN Verlag, https://www.grin.com/document/584870