Leseprobe
Inhaltsverzeichnis
Abkürzungsverzeichnis
Abbildungsverzeichnis
Tabellenverzeichnis
Aufgabe 1
1. Methodische Grundlagen des t-Tests
1.1 Der t-Test für unabhängige Stichproben
1.2 Der t-Test für abhängige Stichproben
1.3 Durchführung des t-Tests für unabhängige Stichproben
1.4 Fazit
Aufgabe 2
2. Der Chi2-Test
2.1 Methodische Grundlagen
2.2 Testhypothesen und Testdurchführung
Aufgabe 3
3. Analyse des Datensatzes
3.1 Deskriptive Beschreibung der Stichprobe
3.2 Exploratorische Datenanalyse
3.3 Zweifaktorielle Varianzanalyse
3.4 Faktorenanalyse
Literaturverzeichnis
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Abbildungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Tabellenverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Aufgabe 1
1. Methodische Grundlagen des t-Tests
Der t-Test ist ein statistisches Verfahren, das eine Differenz zwischen den empirisch erfassten Mittelwerten zweier Gruppen analysiert. Dieses Testverfahren operiert mit den Parametern der Streuung und des arithmetischen Mittels, die mit der Stichprobe geschätzt werden. Der t-Test wird zu den parametrischen Verfahren gezählt, da er reliable Informationen zu den intervallskalierten Daten liefert, mit dessen Hilfe ein Unterschied zwischen gefundenen Mittelwerten zweier Gruppen näher analysiert werden kann.1 Grundsätzlich können drei verschiedene Formen des t-Tests unterschieden werden.2 Der t-Test untersucht, ob der gefundene Mittelwertsunterschied zufällig entstand, oder tatsächlich bedeutsame Unterschiede zwischen den untersuchten Gruppen bestehen.3 Mit Hilfe von t-Tests können unterschiedliche Fragestellungen untersucht werden. Für unabhängige Stichproben testet er, ob die Mittelwerte aus zwei unabhängigen Stichproben verschieden sind. So kann bspw. die Lebenszufriedenheit zwischen Männern und Frauen untersucht werden. Ein t-Test für abhängige Stichproben stellt sich so dar, dass zwei Mittelwerte aus abhängigen Stichproben miteinander verglichen werden. Zum Beispiel kann so ermittelt werden, ob Zwillinge unterschiedlich auf visuelle Reize reagieren.4
Die linke Seite der nachfolgenden Abbildung zeigt, dass die Mittelwerte der Stichproben A und B zwar nicht identisch sind, jedoch nah beieinander liegen. Folglich liegt kein signifikanter Unterschied vor. Auf der rechten Seite der Abbildung ist zu erkennen, dass die Mittelwerte der Stichproben signifikant auseinander fallen:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Darstellung von Mittelwertunterschieden
Somit beinhaltet jeder t-Test die essentielle Frage, wie wahrscheinlich sich die empirisch gefundene oder eine größere Mittelwertsdifferenz unter sämtlichen potentiellen, rein theoretisch denkbaren Differenzen darstellt.5 6
1.1 Der t-Test für unabhängige Stichproben
Anhand des t-Tests für unabhängige Stichproben kann überprüft werden, ob sich die Mittelwerte zweier unabhängiger Versuchsgruppen signifikant voneinander unterscheiden. Der t-Test für unabhängige Stichproben wird auch als ungepaarter t-Test oder Zweistichproben-t-Test bezeichnet und definiert die stochastische Unabhängigkeit dieser Stichproben, was bedeutet, dass die Werte der einen Stichprobe keine Vorhersage bezüglich der Werte der anderen erlau- ben.7
Die Durchführungsvoraussetzung eines t-Tests für unabhängige Stichproben sind zum einen die Varianzhomogenität (beide Teilpopulationen müssen homogen sein) sowie die Normalverteilung des jeweiligen Merkmals und die Unabhängigkeit der Stichproben. Zum anderen sollte die abhängige Variable, die Zielvariable, intervallskaliert sein. Die Überprüfung des Intervallskalenniveaus der abhängigen Variable kann sich jedoch aufwändig zeigen.8 Laut Simulations- studien liefert der t-Test auch bei einer Verletzung dieser Voraussetzungen noch brauchbare Informationen, wenn die Stichproben der beiden Gruppen nicht zu klein (n ~ 30) sowie annähernd gleich groß sind. Soll eine non-parametrische Alternative genutzt werden, kann auch der Mann-Whitney-U-Test herangezogen werden.9
Wird der t-Test für unabhängige Stichproben eingesetzt, werden die Mittelwerte zweier einfacher, voneinander unabhängiger Stichproben mit einem Umfang ni und n2 verglichen. Die Nullhypothese (H0) lautet dann, dass kein Unterschied der Mittelwerte vorliegt. Die Alternativhypothese (Hi) besagt, dass der Unterschied der Mittelwerte signifikant ist und somit ein bedeutsamer Unterschied zwischen den beiden Gruppen zu erkennen ist. Die Hypothese kann hier ungerichtet (bzw. beidseitig)
Abbildung in dieser Leseprobe nicht enthalten
oder gerichtet (bzw. einseitig)
Abbildung in dieser Leseprobe nicht enthalten
sein.
Bei einem t-Test für unabhängige Stichproben muss geprüft werden, ob gleiche (homogene) oder ungleiche (heterogene) Varianzen vorliegen.10 Diese Prüfung erfolgt mittels dem F-Test. Hierfür werden folgende Hypothesen aufgestellt:
Abbildung in dieser Leseprobe nicht enthalten
Die Nullhypothese wird beibehalten, wenn Femp < Fkrit ist. Daher wird der t-Test für unabhängige Stichproben mit homogenen Varianzen angewendet. Fällt der F-Test signifikant aus, muss statt des t-Tests der Mann-Whitney-U-Test angewendet werden.11
Beispiel:
28 Patienten mit der Diagnose „generalisierte Angststörung“ werden zufällig in zwei Gruppen (n1 und n2) aufgeteilt.
Die Gruppe n1 (Experimentalgruppe) nimmt an einem speziellen Kurs für Entspannungsverfahren teil. Gruppe n2 (Kontrollgruppe) nicht. Nach einem Zeitraum von 3 Monaten wird mithilfe eines Fragebogens erhoben, ob sich Veränderungen in der Symptomatik der Patienten zeigen. Hierbei kann der t-Test für unabhängige Stichproben ermitteln, mit welcher Auftretenswahrscheinlichkeit das Entspannungsverfahren eine positive Wirkung hatte oder nicht.
H0: Die Mittelwerte der beiden Stichproben (Experimental- und Kontrollgruppe) unterscheiden sich nicht signifikant: Das bedeutet, dass das Entspannungstraining keinen Effekt hat.
H1 (ungerichtet): Die Mittelwerte der beiden Grundgesamtheiten unterscheiden sich signifikant voneinander: Das bedeutet, dass das Entspannungstraining einen Effekt erzielt hat.
(Hierbei lässt die ungerichtete Hypothese jedoch offen, ob sich die Symptomatik verbessert oder verschlechtert hat.)
H1 (gerichtet): Das Entspannungstraining hat die Symptomatik der generalisierten Angststörung reduziert: Das bedeutet, es besteht ein bedeutsamer Zusammenhang zwischen dem Entspannungstraining und der Symptomreduktion.
1.2 Der t-Test für abhängige Stichproben
Sollen die Mittelwerte von zwei Messungen oder Beobachtungspaaren miteinander verglichen werden, wird der t-Test für abhängige Stichproben angewen- det.12 Hierbei müssen im Gegensatz zu den unabhängige Stichproben die ab- hängigen Stichproben gleich groß sein, da die Objekte entweder paarweise einander zugeordnet oder „Vorher-Nachher-Werte“ verglichen werden. Auf die Varianzhomogenität muss nicht geachtet werden.13
Nach Cleff (2019) erfolgt das Vorgehen bei einem t-Test für abhängige Stichproben in denselben Schritten wie bei einem t-Test für unabhängige Stichpro- ben:14
1.) Formulierung der Hypothesen
2.) Festlegung des Signifikanzniveaus
3.) Ziehung der Stichprobe
4.) Überprüfung der Testvoraussetzungen
5.) Bestimmung des kritischen Testwerts
6.) Bestimmung des empirischen Testwerts
7.) Testentscheidung.
Letztlich gelten für den t-Test für abhängige Stichproben die gleichen Voraussetzungen wie für unabhängige Stichproben.
Beispiel:
Eine zufällig ausgewählte Gruppe von 25 Patienten mit der Diagnose „generalisierte Angstsstörung“ erhält einen Fragebogen zu ihrer Symptomatik. Anschließend nehmen dieselben 25 Patienten an einem speziellen Entspannungsverfahren teil. Nach Abschluss füllen die Patienten denselben Fragebogen wie vor dem Entspannungsverfahren erneut aus.
Abbildung in dieser Leseprobe nicht enthalten
Die Mittelwerte der beiden Stichproben (Experimental- und Kontrollgruppe) unterscheiden sich nicht signifikant: Das bedeutet, dass das Entspannungstraining keinen Effekt hat.
Abbildung in dieser Leseprobe nicht enthalten
Die Mittelwerte der beiden Grundgesamtheiten unterscheiden sich signifikant voneinander: Das bedeutet, dass einen Effekt erzielt wurde. (Hierbei lässt die ungerichtete Hypothese jedoch offen, ob sich die Symptomatik verbessert oder verschlechtert hat.)
Abbildung in dieser Leseprobe nicht enthalten
Das Entspannungstraining hat die Symptomatik der generalisierten Angststörung reduziert: das bedeutet, es besteht ein bedeutsamer Zusammenhang.
Zum Vergleich zweier verbundener, also abhängiger, Stichproben kann der Wilcoxon-Test angewendet werden. Dieser Test ist ein nichtparametrischer statistischer Test, der anhand zweier gepaarter Stichproben die Gleichheit der zentralen Tendenzen der zugrundeliegenden (verbundenen) Grundgesamtheiten prüft. Im Anwendungsbereich berücksichtigt er nicht nur die Richtung (d. h. das Vorzeichen) der Differenzen, sondern auch die Höhe der Differenzen zwischen zwei gepaarten Stichproben berücksichtig.15
1.3 Durchführung des t-Tests für unabhängige Stichproben
Nachfolgend wird anhand des beigefügten Datensatzes geprüft, ob zwischen Männern und Frauen ein Unterschied bezüglich des Items „Ich bin jemand, der Emotionen ausdrücken kann.“, beobachtbar ist.
Folgende Hypothesen werden untersucht:
H0: Der Mittelwert des Items „Ich kann meine Emotionen ausdrücken“ weist keinen signifikanten Unterschied zwischen Männern und Frauen auf.
Hi: Der Mittelwert des Items „Ich kann meine Emotionen ausdrücken“ unterscheidet sich bedeutsam zwischen Männern und Frauen.
Folgende Befehlskette ist erforderlich: <Analysieren>, <Mittelwerte vergleichen>, <t-Test bei unabhängigen Stichproben>. Als Testvariable wird „Zahnarztbesuche“ eingesetzt. In die Gruppierungsvariable wird das „Geschlecht“ eingesetzt, und dem Merkmal „männlich“ die Zahl i und dem Merkmal „weiblich“ die Zahl 2 zugeordnet.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: t-Test bei unabhängigen Stichproben (Eigene Darstellung).
Wird anschließend mit <OK> bestätigt, zeigt SPSS folgende Gruppenstatistik:
Gruppenstatistiken
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 1: Mittelwerte zwischen Männern und Frauen (Eigene Darstellung).
Aus den Gruppenstatistiken ist zu entnehmen, dass 28 Männer und 71 Frauen Angaben zum Item gemacht haben.
Der Levene-Test auf Varianzgleichheit prüft, ob die Varianzen innerhalb der beiden Teilpopulationen homogen sind. Es zeigt sich, dass mit einem F-Wert von 1,695 eine Varianzhomogenität vorliegt. Die Nullhypothese bleibt aufrechterhalten, da zwischen den Varianzen kein signifikanter Unterschied besteht. Daher sind ausschließlich die Daten in der oberen Zeile („Varianzen sind gleich“) von Bedeutung.
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 2: Levene-Test zur Prüfung der Varianzgleichheit (Eigene Darstellung).
Die Ergebnisse zeigen, dass mit p=0,007 das Alpha-Niveau überschritten wurde. Das bedeutet, dass ein signifikanter Mittelwertunterschied vorliegt und zwischen der emotionalen Expressivität und dem Geschlecht ein Zusammenhang besteht.
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 3: Signifikante Ergebnisse des t-Tests (Eigene Darstellung).
Als Alternative kann ebenso der Mann-Whitney-U-Test durchgeführt werden, da er keine strengen Voraussetzungen besitzt und die beiden Vergleichsgruppen lediglich eine ähnliche Verteilungsform aufweisen sollen. Der U-Test untersucht, wie die zentralen Tendenzen zweier unabhängiger Stichproben sich voneinander unterscheiden, das bedeutet, dass der U-Test im Gegensatz zum t-Test nicht die Mittelwerte vergleicht, sondern die Variablen als Rangplätze interpretiert. Daher wird nicht mit den Messwerten selbst, sondern mit gebildeten Rängen der erhobenen Daten gerechnet.16
Wie zuvor müssen im darauffolgenden Fenster die Testvariable sowie die Gruppierungsvariable bestimmt werden. In SPSS wird der Test durch die Befehlsfolge <Analysieren> <Nicht parametrische Tests> <klassische Dialogfelder> und <zwei unabhängige Stichproben> aufgerufen.
In einem separaten Fenster öffnen sich anschließend die Ergebnisse des Mann-Whitney-U-Tests:
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 4: Mann-Whitney-U-Test (Eigene Darstellung).
Das Ergebnis des Mann-Whitney-U-Tests mit p=0,007 ist ebenfalls signifikant, das bedeutet, dass die Ergebnisse des t-Tests und des U-Tests identisch sind.
1.4 Fazit
Mithilfe des t-Tests wurde überprüft, ob eine empirische Mittelwertsdifferenz signifikant oder zufällig ist. Der t-Test hat sich hierfür als ein für die Beantwortung der Forschungsfrage hinreichendes statistisches Verfahren erwiesen. Anhand des Datensatzes wurde untersucht, ob sich die empirisch gefundenen Mittelwerte der beiden Gruppen „Männer“ und „Frauen“ im Hinblick auf die „Emotionale Expressivität“ („Ich kann meine Emotionen ausdrücken“) voneinander unterscheiden. Dabei konnte gezeigt werden, dass die beiden Gruppen einen signifikanten Unterschied aufweisen.
Obwohl bezüglich des bereitgestellten Datensatzes der U-Test primär ein identisches Ergebnis lieferte, zeichnet sich der t-Test durch eine weitaus höhere Teststärke aus. Da mehr Informationen aus den Daten genutzt werden können, 13
werden tatsächlich vorhandene Unterschiede verlässlicher nachgewiesen.
Aufgabe 2
2. Der Chi2-Test
Forschende der empirischen Sozialforschung stehen häufig vor der Fragestellung, ob wenige voneinander differenzierte Erscheinungsformen zweier (oder mehrerer) klassifizierter Merkmale in Abhängigkeit zueinanderstehen oder nicht und ob diese sich bzgl. ihrer Häufigkeit voneinander unterscheiden. Um diese Fragestellung einer statistischen Überprüfung unterziehen zu können, wird der Chi2-Test eingesetzt.17 Der Chi2-Test ist ein interferenzstatistisches Verfahren, wird für Variablen mit nominalem oder ordinärem Skalenniveau angewendet und vergleicht beobachtete und erwartete Häufigkeiten. Ziel ist, ausgehend von einer Stichprobe Schlussfolgerungen über die Gesamtpopulation zu ziehen.18 Chi2-Tests werden für verschiedene Problemstellungen herangezogen. So kann bspw. mit dem Chi2-Homogenitätstest ermittelt werden, ob zwei Zufallsvariablen X und Y derselben Verteilung folgen. Der Chi2-Unabhängigkeitstest gibt Aufschluss darüber, ob zwei Zufallsvariablen X und Y unabhängig verteilt sind. Durch den Chi2-Anpassungstest kann ermittelt werden, ob die Zufallsvariable X einer bestimmten Verteilung folgt.19
[...]
1 Vgl. von der Assen (2019), S. 94.
2 Vgl. Rasch/Friese/Hofmann/Naumann (2014a), S. 34ff.
3 Vgl. Rasch/Friese/Hofmann/Naumann (2010) S. 44.
4 Vgl. Janczyk/Pfister (2013), S. 43.
5 Vgl. Budischewski/Ornau (2016), S. 62.
6 Vgl. Rasch/Friese/Hofmann/Naumann (2014a), S. 34.
7 Vgl. Sedlmeier/Renkewitz (2013) S. 397.
8 Vgl. Rasch/Friese/Hofmann/Naumann (2014a), S. 43f.
9 Vgl. Eid/Gollwitzer/Schmitt (2015), S. 309ff.
10 Vgl. Budischewski/Ornau (2016), S. 62.
11 Vgl. Budischewski/Ornau (2016), S. 65.
12 Vgl. Bortz/Schuster (2010), S. 124.
13 Vgl. v. d. Assen (2019), S. 95
14 Vgl. Cleff (2019), S. 157ff.
15 Vgl. Bortz/Schuster (2010), S. 133.
16 Vgl. v. d. Assen (2019), S. 96.
17 Vgl. Kuhlmei (2018), S. 94.
18 Vgl. Cleff (2019), S. 210.
19 Vgl. Christensen/Christensen/Missong (2019) S. 158.