Leseprobe
Inhaltsverzeichnis
Inhaltsverzeichnis
Abbildungsverzeichnis
1 Anwendung des t-Tests
2 Chi-Quadrat-Test
3 Deskriptive und inferenzstatistische Analyse mit SPSS
3.1 Deskriptive Beschreibung der Stichprobe
3.2 Zweifaktorielle Varianzanalyse
3.3 Hauptkomponentenanalyse
Literaturverzeichnis
Abbildungsverzeichnis
Abbildung 1: Darstellung von Mittelwertunterschieden
Abbildung 2: Prüfung auf Normalverteilung
Abbildung 3: Screenshot zur Ausführung des t-Tests für unabhängige Stichproben
Abbildung 4: Screenshot zum Vergleich der Mittelwerte zwischen Männern und Frauen
Abbildung 5: Screenshot des Levene-Tests zur Prüfung der Varianzgleichheit
Abbildung 6: Screenshot des signifikanten Ergebnisses des t-Tests
Abbildung 7: Screenshot des Mann-Whitney-U-Tests
Abbildung 8: Screenshot der Rangbildung
Abbildung 9: Signifikantes Ergebnis des Mann-Whitney-U-Tests
Abbildung 10: Screenshot zur Ausführung des Chi-Quadrat-Tests
Abbildung 11: Screenshot der Kreuztabelle des Chi-Quadrat-Tests
Abbildung 12: Screenshot des signifikanten Ergebnisses des Chi-Quadrat-Tests
Abbildung 13: Screenshot zur deskriptiven Verteilung der Geschlechter und Studienfächer
Abbildung 14: Balkendiagramm zum Mittelwert "Extraversion" und Männern
Abbildung 15: Balkendiagramm zum Mittelwert "Extraversion" und Frauen
Abbildung 16: Balkendiagramm zum Mittelwert "Extraversion" und dem Studienfach Psychologie
Abbildung 17: Balkendiagramm zum Mittelwert "Extraversion" und dem Studienfach Mathematik
Abbildung 18: Balkendiagramm zum Mittelwert "Extraversion" und dem Studienfach Sport
Abbildung 19: Balkendiagramm zum Mittelwert von "Extraversion" und den sonstigen Studienfächern
Abbildung 20: Screenshot der kleinesten und größten Spannweite
Abbildung 21: Screenshot des Levene-Tests auf Varianzgleichheit
Abbildung 22: Screenshot des Tests der Zwischensubjekteffekte
Abbildung 23: Screenshot der paarweisen Vergleiche
Abbildung 24: Geschätztes Randmittel mit Haupteffekt
Abbildung 26: Screenshot der Kommunalitäten
Abbildung 27: Erklärte Gesamtvarianz
Abbildung 28: Screeplot
Abbildung 29: Rotierte Komponentenmatrix
1 Anwendung des t-Tests
Die Berechnung des t-Tests dient dem Vergleich von Mittelwerten. Es wird dabei eruiert, ob sich zwei Mittelwerte signifikant (bedeutsam) oder nicht signifikant voneinander unterscheiden (Budischewski, Ornau, 2016, S. 61). Die beobachtete Mittelwertdifferenz einer Stichprobe wird am Standardfehler der Mittelwerte relativiert (Leonhart, 2014, S. 69).
Die Voraussetzung zur Anwendung des t-Tests ist ein Intervallskalenniveau der Daten und die Annahme, dass das betroffene Merkmal in der Population einer Normalverteilung folgt (Bortz, Schuster, 2010, S. 118). Zudem sollten die Varianzen homogen sein. Infolge dessen handelt es sich um ein parametrisches Verfahren, das Populationsparameter aufgrund statistischer Kennwerte, wie dem arithmetischen Mittel oder der Varianz, schätzt (Rasch, Friese, Hofmann, Naumann, 2010, S. 44).
Ziel des t-Tests ist es, die statistische Wahrscheinlichkeit zu berechnen, mit der ein Unterschied von Mittelwerten zufällig entstanden ist oder ob bedeutsame Unterschiede zwischen den untersuchten Gruppen bestehen (v. d. Assen, 2019, S. 94). Die linke Seite der folgenden Abbildung veranschaulicht, dass die Mittelwerte der Stichproben A und B zwar nicht identisch sind, jedoch nah beieinander liegen. Es liegt kein signifikanter Unterschied vor. Die rechte Seite der Abbildung zeigt hingegen, dass die Mittelwerte der Stichproben signifikant auseinanderfallen.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Darstellung von Mittelwertunterschieden (Quelle: Budischewski, Ornau, 2016, S. 62.)
Eine Signifikanz, d. h. ein bedeutsamer (nicht zufälliger) Mittelwertunterschied, liegt vor, wenn die Auftretenswahrscheinlichkeit eines zufälligen Auseinanderfallens der Mittelwerte kleiner als p = 0,05 ist (Budischewski, Ornau, 2016, S. 61). Man unterscheidet den t-Test für unabhängige Stichproben (homoskedastischer t-Test) und den t-Test für abhängige Stichproben bzw. für Beobachtungspaare.
Der t-Test für unabhängige Stichproben wird eingesetzt, wenn die Mittelwerte zweier einfacher, voneinander unabhängiger Stichproben mit einem Umfang n1 und n2 verglichen werden sollen. Die Nullhypothese (H0) lautet dann, dass kein Unterschied der Mittelwerte vorliegt .
Die Alternativhypothese (H1) besagt, dass der Unterschied der Mittelwerte voneinander signifikant, also nicht zufällig, entstanden ist und ein bedeutsamer Unterschied zwischen den Gruppen besteht. Dabei kann die Hypothese ungerichtet bzw. beidseitig sein oder gerichtet bzw. einseitig sein .
Bei einem t-Test für unabhängige Stichproben muss geprüft werden, ob gleiche (homogene) oder ungleiche (heterogene) Varianzen vorliegen (Budischewski, Ornau, 2016, S. 62). Dies erfolgt mit einem F-Test, für den folgende Hypothesen aufgestellt werden:
Abbildung in dieser Leseprobe nicht enthalten
Stellt sich heraus, dass Femp< Fkrit ist, so wird die Nullhypothese beibehalten und es wird der t-Test für unabhängige Stichproben mit homogenen Varianzen angewendet.
Die Berechnung des t-Wertes ergibt sich zum einen aus der Differenz der beobachteten Mittelwerte und ihrer Varianz innerhalb der Gruppen. Zum anderen wird die zwischen den Gruppen vorliegende Varianz relativiert.
Abbildung in dieser Leseprobe nicht enthalten
Die Freiheitsgrade werden definiert mit df = n1 + n2 2. Sie geben an, welche Werte bei der Berechnung rei variieren können.
Für den Fall, dass der F-Test signifikant ausfällt, muss statt des t-Tests ein U-Test angewendet werden (Budischewski, Ornau, 2016, S. 65).
Das Programm SPSS eruiert mittels des Levene-Tests (dieser entspricht einem F-Test) die Varianzgleichheit, prüft also ob die Merkmalsstreuung in den Stichproben homogen ist. Die Nullhypothese des Levene-Tests besagt, dass die Varianzen gleich sind, d. h. der Wert muss größer p = 0,05 sein. Die Varianz gibt an, wie dicht sich die einzelnen Werte um den Mittelwert herum verteilen.
Beispiel für einen unabhängigen t-Test: Eine Gruppe von 60 Patienten mit Erschöpfungssyndrom wird zufällig in zwei Gruppen (n1 und n2) aufgeteilt. Die Gruppe n1 (Experimentalgruppe) nimmt an einem speziellen Kurs für Entspannungsverfahren teil, die Gruppe n2 (Kontrollgruppe) nicht. Nach einem Zeitraum von vier Wochen wird mit einem Fragebogen erhoben, ob sich die Symptomatik aller 60 Patienten verändert hat. Mit Hilfe eins t-Tests für unabhängige Stichproben kann ermittelt werden, mit welcher Auftretenswahrscheinlichkeit das Entspannungsverfahren eine positive Wirkung hatte oder nicht.
H0: Die Mittelwerte der beiden Stichproben (Experimental- und Kontrollgruppe) unterscheiden sich nicht signifikant. D. h., das Entspannungstraining hat keinen Effekt erzielt.
H1 (ungerichtet): Die Mittelwerte der beiden Grundgesamtheiten unterscheiden sich signifikant voneinander. Das Entspannungstraining hat einen Effekt erzielt. (Die ungerichtete Hypothese lässt offen, ob sich die Symptomatik verbessert oder verschlechtert hat.)
H1 (gerichtet): Das Entspannungstraining hat die Symptomatik des Stresssyndroms reduziert, d. h., es besteht ein bedeutsamer Zusammenhang zwischen dem Entspannungstraining und der Symptomreduktion.
Der t-Test für abhängige bzw. verbundene Stichproben findet dann Anwendung, wenn die Mittelwerte von zwei Messungen oder Beobachtungspaaren miteinander verglichen werden sollen (Bortz, Schuster, 2010, S. 124). Anders als bei unabhängigen Stichproben müssen die abhängigen Stichproben gleich groß sein. Dies ergibt sich daraus, dass die Objekte entweder paarweise einander zugeordnet werden oder bspw. ein „Vorher-Nachher-Wert“ verglichen werden soll. Bei einem t-Test für abhängige Stichproben muss nicht auf die Varianzhomogenität geachtet werden (v. d. Assen, 2019, S. 95).
Das methodische Rechenvorgehen kann folgendermaßen beschrieben werden: Zu den jeweiligen Beobachtungspaaren müssen die Mittelwertdifferenzen gebildet werden:
Abbildung in dieser Leseprobe nicht enthalten
Wenn die Voraussetzungen (Normalverteilung, intervallskalierte Daten, gleich große Stichproben) erfüllt sind, muss die Standardabweichung der Stichprobe berechnet werden:
Abbildung in dieser Leseprobe nicht enthalten
Schließlich erfolgt die Berechnung des t-Wertes:
Abbildung in dieser Leseprobe nicht enthalten
Zuletzt werden die Freiheitsgrade bestimmt. Sie geben an, welche Werte bei der Berechnung frei variieren können. Im Fall von abhängigen Stichproben gilt: df = .
In einer Tabelle der t-Verteilung kann der entsprechende t-Wert abgelesen werden. Daraufhin erfolgt entweder die Annahme der Alternativ- oder die Beibehaltung der Nullhypothese.
Beispiel für einen abhängigen t-Test Eine Gruppe von 60 Patienten mit Erschöpfungssyndrom wird zufällig ausgewählt und erhält einen Fragebogen zu ihrer Symptomatik. Anschließend nehmen die identischen 60 Patienten an einem speziellen Entspannungsverfahren teil. Abschließend füllen die Patienten den gleichen Fragebogen wie vor Therapiebeginn erneut aus.
H0: Es besteht kein signifikanter Unterschied zwischen den Mittelwerten der abgefragten Items vor dem Therapieverfahren und nach dem Therapieverfahren.
H1 (ungerichtet): Die Mittelwerte der vor der Behandlung abgefragten Items unterscheiden sich signifikant von den Mittelwerten der Erhebung nach der Behandlung. Die Symptomatik hat sich verändert, d. h., das Entspannungstraining hatte einen Effekt (offen bleibt, ob sich die Symptomatik verbessert oder verschlechtert hat.)
H1 (gerichtet): Die Mittelwerte der Vorabbefragung weisen signifikant geringere Werte auf als die der Nachbefragung. Die Symptomatik ist zurückgegangen, das Entspannungstraining hatte einen positiven Effekt.
Nicht-parametrische Tests werden v. a. bei kleineren Stichprobenumfängen eingesetzt, wenn die Voraussetzungen wie Normalverteilung und Varianzhomogenität nicht gegeben sind (Bortz, Schuster, 2010, S. 130).
Zum Vergleich zweier unabhängiger Stichproben kann hierzu der U-Test von Mann-Whitney (bzw. der Wilcoxon-Mann-Whitney-Test) genutzt werden. Sollen hingegen zwei verbundene, also abhängige, Stichproben untersucht werden, so muss der Wilcoxon-Test angewendet werden (Bortz, Schuster, 2010, S. 133).
Anhand des beigefügten Datensatzes soll geprüft werden, ob zwischen Männern und Frauen ein Unterschied bezüglich des Items „Ich bin jemand, der leicht nervös wird.“, beobachtbar ist. Es fällt auf, dass die Versuchsperson mit der Nummer 60 viele Antworten ausgelassen hat, weswegen sie aus dem Datensatz gelöscht wird. Die Voraussetzungen, dass die Daten zufällig erhoben wurden und einer Normalverteilung entsprechen, sind gegeben. Ob eine Normalverteilung vorliegt, kann mit SPSS grafisch veranschaulicht werden: Hierfür ist folgende Befehlskette erforderlich: „Analysieren“, „deskriptive Statistiken“ und „Häufigkeiten“. Nachdem die betreffende Variable gewählt ist, wird unter „Diagramme“ der Befehl für ein „Histogramm“ gegeben. Anhand der Darstellung ist ersichtlich, dass es sich in etwa um eine Normalverteilung handelt:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Prüfung auf Normalverteilung
Für die vorliegende Analyse könnten beispielhaft folgende Hypothesen untersucht werden. Es handelt sich dabei um eine unabhängige Stichprobe, weil Männer und Frauen selbstverständlich nie der gleichen Gruppe angehören.
H0: Der Mittelwert des Items „Ich bin jemand, der leicht nervös wird.“ weist keinen signifikanten Unterschied zwischen Männern und Frauen auf.
H1: Der Mittelwert des Items „Ich bin jemand der leicht nervös wird.“ unterscheidet sich bedeutsam zwischen Männern und Frauen.
Hierfür erfolgt in SPSS der Befehl „Analysieren“, „Mittelwerte vergleichen“ und „t-Test bei unabhängigen Stichproben“. Für die „Testvariable“ wird die Eigenschaft „Emotionale Expressivität“ ausgewählt. Unter der Gruppierungsvariablen erfolgt die Auswahl „Geschlecht“. Die Variable „Geschlecht“ wurde kodiert und dem Merkmal „männlich“ die Zahl 1 und dem Merkmal „weiblich“ die Zahl 2 zugeordnet.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Screenshot zur Ausführung des t-Tests für unabhängige Stichproben
Von SPSS erscheint folgende erste Angabe, bei der ersichtlich ist, dass 28 männliche und 71 weibliche Personen Angaben zu dem betreffenden Item gemacht haben.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 4: Screenshot zum Vergleich der Mittelwerte zwischen Männern und Frauen
Das Ergebnis des Levene-Tests von 0,196 zeigt, dass eine Varianzhomogenität vorliegt. Die Nullhypothese bleibt aufrechterhalten, da zwischen den Varianzen kein signifikanter Unterschied besteht.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 5: Screenshot des Levene-Tests zur Prüfung der Varianzgleichheit
Das Ergebnis des t-Tests zeigt, dass mit p=0,007 das Alpha-Niveau von 0,025 unterschritten wurde, sodass die Nullhypothese falsifiziert werden kann. Es liegt also ein signifikanter Mittelwertunterschied vor. Die Auftretenswahrscheinlichkeit für rein zufällig auseinanderfallende Mittelwertunterschiede ist so gering, dass es sich im Grunde nicht mehr um einen Zufall handeln kann. Folglich besteht zwischen der emotionalen Expressivität und dem Geschlecht ein Zusammenhang.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 6: Screenshot des signifikanten Ergebnisses des t-Tests
Alternativ kann der Mann-Whitney-U-Test durchgeführt werden. Hierfür bedarf es folgender Befehle an SPSS: „Analysieren“, „nicht parametrische Tests“, „klassische Dialogfelder“ und „zwei unabhängige Stichproben“.
[...]