In dieser Hausarbeit wird der Datensatz „Sommerumfrage 2017“ analysiert. Die Daten wurden von den Studierenden der FOM im Jahr 2017 im 1. Semester erhoben, um das Einkaufsverhalten und die Lebenseinstellung der weiblichen und männlichen Probanden zu untersuchen.
Zur Analyse des Datensatzes wird mit der Software R Studio gearbeitet.
Inhaltsverzeichnis
1. Beschreibung des Datensatzes
2. Explorative Analyse zur Generierung der Hypothesen
3. Deduktive Analyse
3.1. Inferenz eines kategorialen Anteilswertes
3.2. t-Test für unabhängige Stichprobe
3.3. Lineare Regression
3.4. t-Test
4. Fazit
4.1. Zentrale Ergebnisse und Interpretation
4.2. Grenzen der Analysen
Zielsetzung & Themen
Die vorliegende Seminararbeit verfolgt das Ziel, den Datensatz „Sommerumfrage 2017“ der FOM Hochschule mithilfe quantitativer Methoden statistisch zu analysieren, um verschiedene Forschungsfragen zu Einkaufsverhalten, Lebenseinstellungen und demografischen Zusammenhängen zu untersuchen.
- Explorative Analyse von Datensätzen mittels R Studio
- Überprüfung von Hypothesen zu Informationsverhalten und Einkommensunterschieden
- Anwendung von statistischen Tests wie Chi-Quadrat und t-Tests
- Durchführung linearer Regressionsanalysen
Auszug aus dem Buch
2. Explorative Analyse zur Generierung der Hypothesen
Um potenziell interessante Beobachtungen bzw. Zusammenhänge zu finden, die aus dem Datensatz augenscheinlich hervorgehen und später in Form konkreter Hypothesen mittels Analysen untersucht werden, wird der vorliegende Datensatz zielführend explorativ analysiert. Für ein möglichst effizientes Vorgehen werden hierbei Variablen genauer untersucht, die intuitiv miteinander im Zusammenhang stehen könnten oder deren Zusammenhänge auf Trends basieren, die in der Vergangenheit durch die Medien publik gemacht wurden.
Zunächst hatten wir die Vermutung, dass ältere Menschen bzw. Rentner aufgrund der angenommenen geringeren Vertrautheit mit Computern mehr „offline“ informieren und auch weniger auf Online-Shopping setzen als jüngere Menschen. Da aus dem Datensatz Variablen hervorgehen, die das Online-Informationsverhalten sowie den Rentnerstatus erfassen, wollen wir die Häufigkeiten der Kategorien der Status-Variable (für beruflichen Status) und der Info-Variable (für das Online-Verhalten) tabellarisch auszählen und vergleichen:
> table(daten$Status, daten$Info)
Zusammenfassung der Kapitel
1. Beschreibung des Datensatzes: Einführung in den Datensatz, die verwendete Software R Studio sowie die notwendige Datenaufbereitung durch das Herausfiltern unvollständiger Datensätze.
2. Explorative Analyse zur Generierung der Hypothesen: Erste statistische Auswertungen und Visualisierungen von Variablenkombinationen, um fundierte Hypothesen für die anschließende deduktive Analyse abzuleiten.
3. Deduktive Analyse: Statistische Überprüfung der aufgestellten Hypothesen mittels Chi-Quadrat-Tests, t-Tests und linearer Regression, inklusive der Berechnung von Konfidenzintervallen.
4. Fazit: Zusammenfassende Darstellung der gewonnenen Forschungsergebnisse, Interpretation der Hypothesentests sowie kritische Reflexion der Grenzen der durchgeführten Analysen.
Schlüsselwörter
Datenanalyse, Sommerumfrage 2017, R Studio, Quantitative Methoden, Hypothesentest, Chi-Quadrat-Test, t-Test, Lineare Regression, Einkaufsverhalten, Demografie, Signifikanz, Konfidenzintervall, Explorative Analyse, Datensatz, FOM Hochschule
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit analysiert den Datensatz „Sommerumfrage 2017“, der von Studierenden der FOM erhoben wurde, um Muster im Einkaufsverhalten und bei Lebenseinstellungen zu identifizieren.
Welche zentralen Themenfelder werden behandelt?
Zu den Schwerpunkten zählen das Online- versus Offline-Informationsverhalten, Einkommensunterschiede zwischen Geschlechtern sowie Zusammenhänge zwischen Alter, Wohnort und Sicherheitsbedürfnis.
Was ist das primäre Ziel der Untersuchung?
Das Ziel ist die Anwendung quantitativer Methoden in R, um aus explorativen Beobachtungen konkrete Hypothesen abzuleiten und diese statistisch auf ihre Signifikanz hin zu prüfen.
Welche wissenschaftlichen Methoden kommen zum Einsatz?
Die Verfasser nutzen deskriptive Statistik, Chi-Quadrat-Tests, t-Tests für unabhängige Stichproben sowie lineare Regressionsmodelle.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die explorative Datenaufbereitung und die deduktive Prüfung von vier spezifischen Hypothesen anhand der R-Syntax und statistischer Ausgaben.
Welche Schlüsselwörter charakterisieren die Untersuchung?
Wesentliche Begriffe sind quantitative Datenanalyse, Signifikanz, R Studio, Hypothesenbildung und statistische Modellierung.
Welche Erkenntnis ergab sich zum Sicherheitsbedürfnis?
Die lineare Regression konnte bestätigen, dass mit steigendem Alter das Bedürfnis nach einem sicheren Umfeld signifikant zunimmt.
Wie unterscheidet sich das Informationsverhalten von Rentnern?
Der Chi-Quadrat-Test belegte signifikant, dass Rentner im Vergleich zur übrigen Stichprobe deutlich häufiger offline Informationen beziehen.
- Arbeit zitieren
- Katharina Galayev (Autor:in), 2018, Quantitative Datenanalyse. Datenanalyse des Datensatzes "Sommerumfrage 2017", München, GRIN Verlag, https://www.grin.com/document/470941