In dieser Hausarbeit steht der Umgang mit dem Programmierprogramm "R" im Fokus. Mit "R" lassen sich Datenmengen nach verschiedensten Gesichtspunkten analysieren um Erkenntnisse aus diesen Daten zu ziehen. Hauptmethode ist dabei die Lineare Regression. Aufgebaut ist die Datenanalyse folgendermaßen: Nachdem die relevanten Daten ausgewählt und Ausreißer entfernt wurden, werden die Null- und die Alternativhypothesen formuliert. Daraufhin folgen deskriptive Statistiken und grafische Verfahren. Danach beginnt die eigentliche Modellierung, in welcher auch auf die formulierten Hypothesen Bezug genommen und zu einem Ergebnis gekommen wird. Selbstverständlich sind alle Befehle aus "R" sichtbar, sodass die Eingaben und damit die Analyse nachvollziehbar ist.
Inhaltsverzeichnis
1. Einleitung
2. Methode
3. Datenanalyse
4. Deskriptive Statistiken
5. Grafische Verfahren
6. Hypothesen/ Modellierung
7. Diskussion
Zielsetzung und Themen
Die vorliegende Arbeit untersucht den Zusammenhang zwischen der Mathenote und dem Geschlecht von Studierenden und deren subjektiv erwartetem Aufwand für das Modul Statistik, um zu eruieren, ob diese Faktoren einen signifikanten Einfluss auf die Einschätzung der Arbeitsbelastung haben.
- Analyse der subjektiven Lernaufwandseinschätzung im Modul Statistik
- Einfluss der Mathenote als Leistungsvariable auf den erwarteten Aufwand
- Geschlechtsspezifische Unterschiede bei der Bewertung der Modulschwierigkeit
- Anwendung der multiplen linearen Regression zur Modellierung der Zusammenhänge
- Empirische Untersuchung auf Basis einer Online-Umfrage unter Studierenden
Auszug aus dem Buch
Methode
Die in dem Analyseteil verwendete Kernmethode ist die Lineare Regression. Regression im statistischem Sinne bedeutet "zurückführen", das heißt es soll überprüft werden, ob eine abhängige Variable Y auf eine oder mehrere unabhängige Variablen X zurückgeführt werden kann. Andere Lehrbücher sprechen vom Zielmerkmal Y und erklärendem Merkmal X. Bei nur unabhängigen Variable X wird von einer einfachen linearen Regression gesprochen, bei mehreren unabhängigen Variablen handelt es sich um eine multiple lineare Regression.
Dabei soll ein linearer Zusammenhang untersucht werden. Es wird angenommen, dass f() eine lineare Funktion ist. Für die multiple lineare Regression dieser Hausarbeit sein, die beiden unabhängigen Variablen "Mathenote" und "Geschlecht" bilden die Steigung der Geraden. Im Idealfall würden im Streudiagramm alle Punkte auf einer Geraden liegen. Je näher die Punkte an der Geraden liegen, desto stärker ist ein linearer Zusammenhang zu vermuten. Außerdem werden p-Werte und ein R² ermittelt. Der p-Wert für die unabhängigen Variablen zeigt einem an, inwieweit diese Variable signifikant ist. Um eine für jede Analyse Aussage treffen zu können, wird das Signifikanzniveau alpha auf 5% festgelegt. Es kann zum Signifikanzniveau von alpha = 5% entweder die Nullhypothese H_0 ("Da ist nichts") verworfen werden - oder eben nicht. Außerdem wird das Bestimmtheitsmaß R² ermittelt, das den Anteil der im Modell erklärten Variation des erwarteten Aufwands im Modul Statistik angibt. R² wird eine Zahl zwischen 0 und 1 sein. Je größer R² dabei ist, desto besser ist das Modell.
Zusammenfassung der Kapitel
1. Einleitung: Dieses Kapitel führt in die Thematik der wahrgenommenen Schwierigkeit des Moduls Statistik ein und definiert die zentralen Forschungsfragen bezüglich Mathenote und Geschlecht.
2. Methode: Hier werden die wissenschaftlichen Grundlagen, insbesondere die multiple lineare Regression und deren statistische Kennwerte wie Signifikanzniveau und R², erläutert.
3. Datenanalyse: Dieses Kapitel beschreibt die Datenbasis der Online-Umfrage, die Datenaufbereitung sowie die Definition der Variablen und Hypothesen.
4. Deskriptive Statistiken: Hier werden die grundlegenden Kennzahlen der erhobenen Daten präsentiert, um ein erstes Bild der Verteilungen und potenzieller Ausreißer zu erhalten.
5. Grafische Verfahren: Dieses Kapitel visualisiert die Verteilungen und Zusammenhänge mittels Histogrammen und Boxplots, um die statistischen Ergebnisse anschaulich zu machen.
6. Hypothesen/ Modellierung: Hier erfolgt die Durchführung der multiplen linearen Regressionsanalyse und die Auswertung der Modellkoeffizienten.
7. Diskussion: Das abschließende Kapitel interpretiert die Ergebnisse im Kontext der Forschungsfragen und reflektiert die Grenzen der durchgeführten Analyse.
Schlüsselwörter
Statistik, Modul Statistik, Mathenote, Geschlecht, lineare Regression, R-Quadrat, p-Wert, Signifikanzniveau, Lernaufwand, Datenauswertung, Online-Umfrage, Studentische Befragung, multivariate Analyse, Hypothesentest, Streudiagramm
Häufig gestellte Fragen
Worum geht es in dieser wissenschaftlichen Arbeit grundsätzlich?
Die Arbeit analysiert, inwieweit die individuelle Mathenote und das Geschlecht von Studierenden den subjektiv erwarteten Aufwand für das Modul Statistik beeinflussen.
Was sind die zentralen Themenfelder der Untersuchung?
Die Schwerpunkte liegen auf der statistischen Modellierung von Lernaufwand, der Analyse geschlechtsspezifischer Unterschiede und dem Einfluss vorangegangener mathematischer Leistungen.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist die Beantwortung der Frage, ob sich ein signifikanter Zusammenhang zwischen Mathenote, Geschlecht und dem erwarteten Aufwand für das Modul Statistik nachweisen lässt.
Welche wissenschaftliche Methode wurde für die Analyse verwendet?
Es wurde eine multiple lineare Regression angewandt, um die Einflussfaktoren auf den erwarteten Aufwand mathematisch zu modellieren.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil umfasst die methodische Herleitung, die statistische Vorbereitung der Umfragedaten, die deskriptive Analyse sowie die Regressionsmodellierung.
Welche Schlüsselwörter charakterisieren die Untersuchung am besten?
Zu den wichtigsten Begriffen gehören lineare Regression, Statistik-Modul, Mathenote, Signifikanzanalyse und Lernaufwandseinschätzung.
Wie groß ist der Einfluss des Geschlechts auf den erwarteten Aufwand?
Die Daten zeigen, dass das Geschlecht einen signifikanten Einfluss hat, wobei weibliche Studierende einen tendenziell höheren Aufwand für das Statistik-Modul erwarten.
Welche Rolle spielt die Mathenote bei der Einschätzung des Aufwands?
Überraschenderweise ergab die Analyse, dass die Mathenote kaum einen signifikanten Einfluss auf die Aufwandseinschätzung für Statistik hat.
Was ist das Bestimmtheitsmaß R² in dieser Arbeit?
Das R² gibt an, dass durch Mathenote und Geschlecht nur etwa 7,7% der Variation im erwarteten Aufwand erklärt werden können, was auf weitere Einflussfaktoren hindeutet.
Warum wurde eine Online-Umfrage als Datengrundlage gewählt?
Die Umfrage diente dazu, reale Selbsteinschätzungen der Studierenden zu erhalten, um eine datengestützte quantitative Analyse durchführen zu können.
- Citar trabajo
- Anonym (Autor), 2018, Quantitative Analyse einer Datenbasis mit Hilfe von "R", Múnich, GRIN Verlag, https://www.grin.com/document/501853