Statistik II - Auswertung eines Fragebogens


Studienarbeit, 2010

35 Seiten, Note: 2,3

Alexander von Hohenberg (Autor)


Leseprobe

Inhaltsverzeichnis

1. Einführung

2. Zentralmaßvergleiche für intervallskalierte Daten
2.1. Der T-Test für eine Stichprobe
2.2. Der T-Test für zwei abhängige Stichproben
2.3. Der T-Test für zwei unabhängige Stichproben

3. Die Varianzanalyse
3.1. Die einfaktorielle Varianzanalyse ohne Messwiederholung
3.2. Die einfaktorielle Varianzanalyse mit Messwiederholung
3.3. Die Kruskall-Wallis Rangvarianzanalyse
3.4. Der Mann-Whitney-U Test

4. Die Korrelationsanalyse
4.1. Die Korrelationsanalyse nach Pearson
4.2. Die Rangkorrelationsanalyse nach Spearman

5. Die multiple Regressionsanalyse

6. Der Chi²-Test
6.1. Der Chi²-Test für eine Variable
6.2. Der Chi²-Test für zwei Variablen

7. Die Reliabilitätsanalyse

8. Eidesstattliche Versicherung

9. Literaturverzeichnis

1. Einführung

Der verwendete Beispieldatensatz ist das Ergebnis einer Umfrage unter 48 Probanden bezüglich der Nutzung von Versandhandel. Dabei soll neben den Fragen zum Versandhandel auch die persönliche Lebenssituation der Befragten erörtert werden. Alle Daten sind fiktiv; zur Berechnung wurde „PASW Statistics 18“ von „SPSS Inc.“ genutzt, wobei die Variablen nach den Fragen im Fragebogen geordnet wurden. (Also Frage 1 = Variable 1 usw.)

2. Zentralmaßvergleiche für intervallskalierte Daten

2.1. Der T-Test für eine Stichprobe

Bei diesem Test wird das arithmetische Mittel einer Gruppe mit einem Wert verglichen, der bereits zuvor (z. B. im Rahmen einer anderen Studie) erhoben worden ist. Wichtig ist dabei, dass beide Daten überhaupt vergleichbar sind, also nicht in einer Befragung auf einer Skala von 1-3 und bei der anderen auf einer Skala von 1-8 geantwortet wurde. Der Test bietet damit eine Antwort auf die Frage: Ist der Unterschied zwischen dem Mittelwert in „meiner“ Stichprobe und dem Mittelwert, der bereits vorlag, signifikant, also überzufällig? Dazu muss erst einmal festgestellt werden, ob in der zu untersuchenden Befragung eine Normalverteilung vorliegt. Dafür benutzt man die deskriptive Statistik und zieht zunächst vom Schiefe-/Kurtosiswert den doppelten Standardfehler ab bzw. addiert diesen.

- Schiefe: 0,624 + (2x0,343) = 1,31

0,624 – (2x0,343) = -0,062

- Kurtosis: -0,248 + (2x0,674) = 1,046

-0,248 - (2x0,674) = -1,542

Dann überprüft man, ob in dem angegebenen Intervall die „Null“ enthalten ist.

[Abbildung in dieser Leseprobe nicht enthalten]Intervall Schiefe: [-0,062 ; 1,31] => „Null“ ist enthalten.

Intervall Kurtosis: [-1,542 ; 1,046] => „Null“ ist enthalten.

Aus diesen Daten lässt sich ablesen, dass die Abweichung der Werte von der Normalverteilung nicht statistisch signifikant ist. Dies ist gleichzeitig die Bedingung für einen T-Test. Da diese erbracht wurde, kann man nun einen T-Test durchführen.

Abbildung in dieser Leseprobe nicht enthalten

Hier wir also der Mittelwert der Anzahl an Käufen über den Versandhandel in den letzten 6 Monaten der 48 Befragten der Studie mit einem Bevölkerungsdurchschnitt von 3 Käufen in den letzten 6 Monaten verglichen.

Der Mittelwert dieser Studie liegt mit 1,83 deutlich unter dem Bevölkerungsdurchschnitt. Der Test kann als signifikant bezeichnet werden, das heißt er ist nicht mehr durch Zufall zu erklären, da der Wert Sig.<0,05 ist. Es ist also statistisch erwiesen, dass die Probanden dieser Umfrage im Schnitt rund 1,17 Produkte weniger gekauft haben, als die Teilnehmer der Vergleichsgruppe.

Liegen der Studie Mittelwerte vor, welche relativ nah beieinander liegen, kann man davon ausgehen, dass die Werte nicht signifikant sein werden. Es wird nun daher davon ausgegangen, dass der Studie ein Vergleichswert von durchschnittlich 2 Käufen in den letzten 6 Monaten zugrunde liegt:

Abbildung in dieser Leseprobe nicht enthalten

Wie erwartet erhält man eine Signifikanz von 0,455 welche deutlich größer als die geforderten 0,05 ist. Das heißt, dass der Wert statistisch nicht signifikant ist und daher noch durch Zufall erklärt werden kann.

2.2. Der T-Test für zwei abhängige Stichproben

Hier wird das arithmetische Mittel einer Gruppe wird mit dem einer zweiten Gruppe verglichen. Es werden Daten von beiden Gruppen gewonnen. Die beiden Gruppen sind jedoch voneinander abhängig. Das bedeutet, dass die Werte der einen Gruppe in irgendeiner Form mit den Werten der anderen Gruppe verbunden sind. Beispielsweise kann man untersuchen, ob im nächsten Jahr durchschnittlich mehr Artikel über den Versandhandel gekauft werden, als in diesem Jahr. Diese Werte sind voneinander abhängig, da man nächstes Jahr vielleicht nicht mehr so viel kauft, wenn man dieses Jahr schon viel gekauft hat. Oder ein anderer Effekt tritt ein, falls die Befragten so überzeugt von den Produkten waren, dass sie planen im nächsten Jahr noch mehr zu kaufen.

Zunächst muss aber erst einmal wieder der Beweis erbracht werden, dass die Werte nicht statistisch signifikant von der Normalverteilung abweichen.

Abbildung in dieser Leseprobe nicht enthalten

Intervall Schiefe: [-0,807 ; 0,565] => „Null“ ist enthalten.

Intervall Kurtosis: [-2,326 ; 0,37] => „Null“ ist enthalten.

Nun muss man auch für Frage 4 zum Versandhandel die Abweichung von der Normalverteilung prüfen.

Abbildung in dieser Leseprobe nicht enthalten

Wiederum kann nachgewiesen werden, dass die „Null“ innerhalb der entsprechenden Intervalle liegt.

Der T-Test für abhängige Stichproben darf nun also durchgeführt werden:

Abbildung in dieser Leseprobe nicht enthalten

Vergleicht man die Mittelwerte der beiden oben angegebenen Spalten, so stellt man genau den oben beschriebenen Effekt fest. Der Mittelwert steigert sich im Zeitverlauf von 1,96 auf 2,83. Während der „Durchschnittsbefragte“ 2007 auf die Frage ob er/sie etwas im Versandhandel bestellen will, noch mit „vielleicht“ antwortete, antwortet er/sie 2008 mit „sehr wahrscheinlich“.

Liegen nun aber andere Ergebnisse vor, bei welchen der Mittelwert näher beieinander liegt, kann man davon ausgehen, dass diese nicht signifikant sein werden.

Abbildung in dieser Leseprobe nicht enthalten

Zuerst muss wieder die Normalverteilung geprüft werden:

Abbildung in dieser Leseprobe nicht enthalten

Auch hier liegt die „Null“ innerhalb der entsprechenden Intervalle von Schiefe und Kurtosis, der T-Test für gepaarte Stichproben darf also durchgeführt werden.

Bei den hier vorliegenden Zahlen kommt man zu einem Mittelwert von 1,96 bzw. 2,10. Allerdings muss man davon ausgehen, dass diese Daten zufällig zustande gekommen sind und daher keine statistische Aussagekraft haben, da die Signifikanz mit 0,564 größer als 0,05 ist. Die Mittelwerte liegen auch viel zu nah beieinander um nicht durch Zufall erklärt werden zu können.

2.3. Der T-Test für zwei unabhängige Stichproben

Das arithmetische Mittel einer Gruppe wird mit dem einer zweiten Gruppe verglichen. Wiederum werden also Daten von beiden Gruppen gewonnen. Die beiden Gruppen sind jedoch voneinander unabhängig. Das bedeutet, dass die Werte der einen Gruppe in keiner Form mit den Werten der anderen Gruppe verbunden sind. Ein Beispiel hierfür wäre ein Vergleich zwischen zwei unabhängig voneinander befragten Gruppen und der Menge der über den Versandhandel bestellten Artikel in den letzten 6 Monaten.

Um den Test durchführen zu können, müssen wiederum einige Voraussetzungen erfüllt werden.

Zuerst einmal müssen die Gruppen in etwa gleich groß sein. Hierfür sieht man sich die Häufigkeiten innerhalb der Gruppe an.

Abbildung in dieser Leseprobe nicht enthalten

Die Gruppen sind also alle gleich groß und haben eine Teilnehmerzahl von 16 Befragten pro Gruppe. Da es drei Gruppen sind, kommt man auf eine Gesamtteilnehmerzahl von 48.

Als nächstes werden sowohl der Kolmogorov-Smirnov Test, als auch der Shapiro-Wilk Test durchgeführt. Diese prüfen die Abweichung von der Normalverteilung, das heißt der Test sollte nicht signifikant ausfallen, da Normalverteilung eine Voraussetzung für den T-Test ist. Diese Voraussetzung sollte nicht verworfen werden. Also müssen diese Tests nicht signifikant ausfallen, um den T-Test durchführen zu können.[Abbildung in dieser Leseprobe nicht enthalten]

Wir sehen hier bei beiden Tests in Gruppen 1 und 2 eine Signifikanz >0,05. Die Voraussetzung einer Normalverteilungsannahme muss also nicht verworfen werden. Dies gilt nicht für Gruppe 3, da ihr Signifikanzniveau über 0,05 liegt.

Nun muss nur noch auf eine Nicht-Signifikanz der Varianzen der Stichproben getestet werden, um sicherzustellen, dass sich Gruppen 1 und 2 signifikant voneinander unterscheiden. Die Antwort auf diese Frage liefert der Levene-Test.

Abbildung in dieser Leseprobe nicht enthalten

Der Levene-Test fällt hier nicht signifikant aus, was bedeutet, dass sich Gruppe 1 und 2 signifikant voneinander unterscheiden. Da nun alle Voraussetzungen erfüllt sind, darf man sich den Wert der Signifikanz beim T-Test für unabhängige Stichproben ansehen und stellt fest, dass dieser kleiner als 0,05 ist. Das heißt, dass ein Zusammenhang zwischen den befragten Gruppen und der Anzahl der Käufe im Versandhandel nachgewiesen werden kann.

Ändert man nun die Gruppen so, dass der T-Test nicht signifikant sein soll, kommt man für den Shapiro-Wilk bzw. Kolmogorov-Smirnov Test auf folgende Daten:

Abbildung in dieser Leseprobe nicht enthalten

Wiederum sind die Voraussetzungen für einen T-Test gegeben, da die Signifikanz in allen Gruppen größer als 0,05 ist und daher die Annahme auf eine Normalverteilung nicht verworfen werden muss.[Abbildung in dieser Leseprobe nicht enthalten]

[...]

Ende der Leseprobe aus 35 Seiten

Details

Titel
Statistik II - Auswertung eines Fragebogens
Hochschule
Hochschule für angewandtes Management GmbH
Note
2,3
Autor
Jahr
2010
Seiten
35
Katalognummer
V169882
ISBN (eBook)
9783640898121
Dateigröße
2024 KB
Sprache
Deutsch
Anmerkungen
Die Studienarbeit wurde mit SPSS erstellt, dem besten derzeit erhältlichen Statistikprogramm. Von diesem kann eine Testversion gratis unter http://spss.softonic.de/universaldownloader-launch heruntergeladen werden.
Schlagworte
Kruskal-Wallis, Rangvarianzanalyse, varianz, analyse, statistik, zentralmaßvergleiche, intervallskaliert, daten, einfaktoriell, varianzanalyse, messwiederholung, mann-whitney-u test, test, pearson, spearman, rangkorrelationsanalyse, korrelation, korrelationsanalyse, regression, regressionsanalyse, chi²-test, chi, variable, reliabilitätsanalyse, reliabilität, spss, stichprobe, signifikant, arithmetisches mittel
Arbeit zitieren
Alexander von Hohenberg (Autor), 2010, Statistik II - Auswertung eines Fragebogens, München, GRIN Verlag, https://www.grin.com/document/169882

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Statistik II - Auswertung eines Fragebogens



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden