Gibt es einen Zusammenhang zwischen dem höheren Alter der Passagiere und der Überlebenschance auf der Titanic?
Mithilfe eines Datensatzes aus der Statistiksoftware R-Studio wird zu dem oben genannten Thema eine Datenanalyse vorgenommen.
Die Hausarbeit wird in einzelne Kapitel aufgeteilt. Das zweite Kapitel beschäftigt sich mit der Entwicklung der Forschungsfrage. Die Empirische Analyse wird in drei Teilbereiche aufgeteilt: Datensatz, Explorative Datenanalyse und Regressionsanalyse und ist somit das dritte Kapitel. Abschließend wird ein Fazit erstellt, welches auf den Ergebnissen der Datenanalyse basiert.
Inhaltsverzeichnis
- 1. Einleitung
- 2. Theorie- Ableiten der Forschungsfrage
- 3. Empirische Analysen
- 3.1 Datensatz
- 3.2 Explorative Datenanalyse
- 3.2.1 str(TitanicSurvival_neu)
- 3.2.2 inspect(TitanicSurvival_neu)
- 3.2.3 View(TitanicSurvival_neu)
- 3.2.4 hist(survived)
- 3.2.5 hist(age)
- 3.2.6 boxplot(survived)
- 3.2.7 boxplot(age)
- 3.2.8 favstats(age)
- 3.2.9 favstats(survived)
- 3.3 Regressionsanalyse
- 3.3.1 Regressionsmodell
- 3.3.2 Regressionsgerade
- 3.3.3 Lösung Schritt für Schritt
- 3.3.4 Berechnung Ordinatenabschnitt
- 3.3.5 Lineare Regression
- 4. Fazit
Zielsetzung und Themenschwerpunkte
Diese Arbeit befasst sich mit der Frage, ob es einen Zusammenhang zwischen dem Alter der Passagiere und der Überlebenschance auf der Titanic gibt. Ziel ist es, mittels einer Datenanalyse in der Statistiksoftware R-Studio, diese Frage zu beantworten. Dabei wird der Datensatz "TitanicSurvival" herangezogen, um anhand verschiedener statistischer Methoden, wie der explorativen Datenanalyse und der Regressionsanalyse, Erkenntnisse zu gewinnen.
- Zusammenhang zwischen Alter und Überlebenschance auf der Titanic
- Analyse von Daten aus dem Datensatz "TitanicSurvival"
- Anwendung statistischer Methoden (explorative Datenanalyse, Regressionsanalyse)
- Interpretation der Ergebnisse der Datenanalyse
- Beantwortung der Forschungsfrage
Zusammenfassung der Kapitel
Das erste Kapitel führt in die Thematik der Schiffsunglücke ein, wobei das Titanic-Unglück als Beispiel herangezogen wird. Es werden die relevanten Faktoren, die Anzahl der Passagiere und die Kapazität der Rettungsboote, sowie die Forschungsfrage nach einem Zusammenhang zwischen Alter und Überlebenschance, vorgestellt. Das zweite Kapitel beschäftigt sich mit der Entwicklung der Forschungsfrage und der Formulierung der Null- und Alternativhypothese.
Das dritte Kapitel beinhaltet die empirische Analyse. Im ersten Abschnitt wird der Datensatz "TitanicSurvival" genauer erläutert. Der zweite Abschnitt befasst sich mit der explorativen Datenanalyse, in der verschiedene statistische Methoden zur Visualisierung und Analyse der Daten eingesetzt werden. Der dritte Abschnitt widmet sich der Regressionsanalyse, die den Zusammenhang zwischen Alter und Überlebenschance quantifiziert.
Schlüsselwörter
Titanic, Schiffsunglück, Überlebenschance, Alter, Datenanalyse, R-Studio, Datensatz, Explorative Datenanalyse, Regressionsanalyse, Nullhypothese, Alternativhypothese, Dummy Variable
- Citation du texte
- Anonym (Auteur), 2020, Statistik. Höhere Überlebenswahrscheinlichkeit für Ältere beim Titanic-Unglück?, Munich, GRIN Verlag, https://www.grin.com/document/1170599