Register or log in at GRIN

Your e-mail-address or password is wrong
Register now
For new authors: free, easy and fast
This will be used as your user name, please specify a valid e-mail address

Lost password

Your e-mail-address or password is wrong

Request a new password
Varianz- und Regressionsanalysen als wichtige Datenanalyseverfahren: Dargestellt... close

Please wait

Please install the Adobe Flash Player if no e-book is displayed.

Varianz- und Regressionsanalysen als wichtige Datenanalyseverfahren: Dargestellt anhand von Beispielen aus einem Datensatz der "Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften" (ALLBUS) 1996

Termpaper, 2004, 71 Pages
Author: Joachim Schmidt
Subject: Sociology - Methodology and Methods

Details

Category: Termpaper
Year: 2004
Pages: 71
Grade: Sehr gut
Bibliography: ~ 14  Entries
Language: German
Archive No.: V78282
ISBN (E-book): 978-3-638-83087-4
ISBN (Book): 978-3-638-83242-7
File size: 436 KB
Notes :
Schriftlicher Kommentar der Dozentin: Sehr gute Methodenarbeit, weiter so! (40 Seiten Anlagen - SPSS-Output)


Abstract

Varianz- und Regressionsanalyse sind zwei wichtige und häufig angewandte statistische Verfahren in der quantitativen empirischen Sozialforschung. Diese werden als multivariate Analyseverfahren bezeichnet, weil die statistischen Zusammenhänge zwischen mindestens drei Merkmalen bzw. Variablen untersucht werden. Beide Verfahren sind strukturen-prüfend und dienen damit dazu, vorher aufgestellte Hypothesen zu testen. Im Unterschied zu strukturen-entdeckenden bzw. datenreduzierenden Analyseverfahren wie der Faktoren- oder Clusteranalyse besitzt der Anwender bei der Varianz- oder Regressionsanalyse bereits eine auf sachlogischen oder theoretischen Überlegungen basierende Vorstellung über mögliche Zusammenhänge zwischen den Variablen und kann diese dann empirisch anhand eines Datensatzes überprüfen. In dieser Arbeit geht es in erster Linie darum, die Anwendung der statistischen Verfahren von Varianz- und Regressionsanalyse als solche zu demonstrieren und ihre zugrunde liegende Logik nachvollziehbar und verständlich herauszuarbeiten. Als Beispielsdatensatz wird ein reduzierter Datensatz der „Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften“ (ALLBUS) 1996 verwendet. Auf der Internet-Seite der „Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen e.V. (GESIS) können Codebuch (pdf Format), SPSS file (sav Format) und Methodenbericht (pdf Format) der verwendeten Studie kostenlos unter der Bezeichnung „ALLBUScompact-1996 ZA Nr. 3718“ für wissenschaftliche Zwecke herunter geladen werden (http://www.gesis.org/Datenservice/ALLBUS/Bestellen/download.htm). Als Software wurde das in der Soziologie sehr gebräuchliche Datenverarbeitungsprogramm SPSS (Statistical Package for Social Sciences) verwendet. Alle angewandten SPSS-Prozeduren sind im Anhang als SPSS-Output im Einzelnen dokumentiert.


Excerpt (computer-generated)

Universität Bielefeld
Datenanalyse
Studiengang: Diplomsoziologie
Hausarbeit
Wintersemester 2004/2005

Varianz- und Regressionsanalysen als wichtige multivariate Datenanalyseverfahren:
Dargestellt anhand von Beispielen aus einem Datensatz der „Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften“ (ALLBUS) 1996.

von Joachim Schmidt

 

1 EINLEITUNG 2

2 VARIANZANALYSE 4
2.1 Die Logik der Varianzanalyse 5
2.1.1 Gruppenmittelwerte in Stichprobe und Grundgesamtheit 6
2.1.2 Die eigentliche Varianzanalyse 7
2.1.3 Voraussetzungen 8
2.1.4 Die Stärke des Zusammenhangs 10
2.2 Multifaktorielle Varianzanalyse 11
2.2.1 Varianzanalyse mit einem Faktor 11
2.2.2 Varianzanalyse mit zwei Faktoren 12
2.2.3 Varianzanalyse mit drei Faktoren 15

3 REGRESSIONSANALYSE 19
3.1 Einfache Regressionsanalyse 22
3.1.1 Regressionskoeffizient und Konfidenzintervall 23
3.1.2 Fit der Regressionsgleichung und PRE-Logik 23
3.1.3 Überprüfung der Residuen 24
3.2 Multiple Regressionsanalyse 24
3.2.1 Die einbezogenen Variablen 25
3.2.2 Prüfung auf Multikollinearität 26
3.2.3 Die multiple Regressionsanalyse 26
3.2.4 Überprüfung der Residuen 28
3.2.5 Zusammenfassung 28

4 LITERATURVERZEICHNIS 30

5 ANLAGEN 32

 

1 Einleitung

Meine Hausarbeit beschäftigt sich mit multivariaten Analyseverfahren. So werden Verfahren bezeichnet, in denen mindestens drei Merkmale bzw. Variablen statistisch analysiert werden (Ludwig-Mayerhofer 1999a).1 Ich stelle hier nur Modelle mit einer abhängigen und mehreren unabhängigen Variablen vor.

Man kann allgemein zwischen strukturen-entdeckenden bzw. datenreduzierenden Verfahren einerseits und strukturen-prüfenden bzw. hypothesentestenden Verfahren andererseits unterscheiden (Ludwig-Mayerhofer 1999a u. Backhaus u.a. 1990: XIVf). Faktoren- und Clusteranalysen sind Beispiele für strukturen-entdeckende Verfahren. Ziel dieser Verfahren ist es in erster Linie, Zusammenhänge zwischen Variablen zu entdecken. Und zwar ohne, dass theoretische oder sachlogische Vorstellungen über Beziehungszusammenhänge zwischen den Variablen bereits vorher vorliegen. (Backhaus u.a. 1990: XIVf).

Strukturen-prüfende Verfahren dienen dazu, Hypothesen zu testen. Der Anwender besitzt damit bereits eine auf sachlogischen oder theoretischen Überlegungen basierende Vorstellung über mögliche Zusammenhänge zwischen den Variablen und möchte diese Zusammenhänge empirisch anhand eines Datensatzes überprüfen (Backhaus u.a. 1990: XV). Regressionsanalysen, Varianzanalysen, Diskriminanzanalysen und Kausalanalysen sind Beispiele für hypothesentestende statistische Verfahren.

In meiner Hausarbeit beschränke ich mich auf die Darstellung von Varianz- und Regressionsanalysen als zwei wichtige und häufig in der empirischen Sozialforschung angewandte statistische Verfahren. Mir geht es in erster Linie darum, die Anwendung der statistischen Verfahren als solche zu demonstrieren und ihre zu Grunde liegende Logik herauszuarbeiten. Es kommt mir hier also weder auf die sachlogische oder theoretische Fundierung der zu testenden Hypothesen noch auf die Aktualität des Datensatzes an.

Als Beispiel-Datensatz dient mir die „Allgemeine Bevölkerungsumfrage der Sozialwissenschaften“ (ALLBUS) 1996. Seit 1980 wird im Rahmen von ALLBUS alle 2 Jahre ein repräsentativer Bevölkerungsquerschnitt der Bundesrepublik Deutschland mit einem teils sich wiederholenden, teils aber auch variablen Fragenprogramm befragt. Den entsprechenden Datensatz*, den Methodenbericht, den Codeplan und den Fragenkatalog habe ich auf der Internet-Seite der „Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen e.V. (GESIS)“ herunter geladen (http://www.gesis.org/Datenservice/ALLBUS/index.htm). Als Software habe ich das in der Soziologie sehr gebräuchliche Datenverarbeitungsprogramms SPSS (Statistical Package for Social Sciences) in der Version „SPSS for windows. Release 6.0“ verwendet.

2 Varianzanalyse

Ein wichtiges Verfahren der multivariaten Datenanalyse ist die Varianzanalyse. Für die unabhängigen Variablen wird dabei mindestens Nominalskalierung, für die abhängigen Variablen mindestens Intervallskalierung vorausgesetzt (Backhaus u.a.1990: 43). Die unabhängigen Variablen werden dabei auch als „Gruppierungsvariablen“ oder „Faktoren“ bezeichnet.

Der Grundgedanke der Varianzanalyse besteht darin, die gesamte Varianz (Streuung) des zu erklärenden Merkmals der abhängigen Variablen (oder mehrerer solcher Variablen) aufzuteilen (zu "zerlegen"): In die Varianz zwischen den einzelnen Gruppen - die Abweichung der Gruppenmittelwerte vom Gesamtmittelwert über alle Gruppen bzw. Untersuchungseinheiten - und in die Varianz innerhalb der Gruppen3 (Ludwig-Mayerhofer 1999b). Voraussetzung für die Anwendung der Varianzanalyse ist eine theoretisch begründete Vermutung über die Wirkungsrichtung der zu untersuchenden Variablen (Backhaus u.a.1990: 44 u. 64). Mit anderen Worten: Der Ursache-Wirkungszusammenhang muss sich sachlogisch oder theoretisch begründen lassen und die als unabhängig bezeichneten Variablen müssen den (der) abhängigen Variablen zeitlich vorausgehen.

Man spricht von einfaktorieller univariater Varianzanalyse, wenn die Untersuchungsobjekte lediglich hinsichtlich eines Merkmals (Faktors) in Gruppen eingeteilt werden und nur eine abhängige Variable in die Untersuchung einbezogen wird. In SPSS steht dafür die Prozedur „Compare means//One-Way ANOVA“ zur Verfügung.4

Werden mehrere Gruppierungsmerkmale (Faktoren) und eine abhängige Variable untersucht, wird dies als mehrfaktorielle univariate Varianzanalyse bezeichnet. Bei der mehrfaktoriellen Varianzanlyse können auch Interaktionseffekte geprüft werden, d.h. unterschiedliche Wirkungen eines Faktors in Abhängigkeit von den Ausprägungen eines anderen Faktors oder mehrerer anderer Faktoren. In SPSS lässt sich die mehrfaktorielle univariate Varianzanalyse über „ANOVA Models//Simple Factorial“ berechnen.

Werden mehrere Gruppierungsmerkmale und mehrere abhängige Variable simultan geprüft, wird von einer multivariaten bzw. mehrdimensionalen Varianzanalyse gesprochen. SPSS berechnet diese über die Prozedur „ANOVA Models//Multivariate“. (Ludwig-Mayerhofer 1999b; Backhaus u.a. 1990: 45).

Ich beschränke mich in meiner Hausarbeit auf Berechnung und Interpretation einer mehrfaktoriellen univariaten Varianzanalyse. Zunächst arbeite ich aber im folgenden Abschnitt die Logik der Varianzanalyse im einzelnen anhand eines einfaktoriellen Beispiels heraus.

2.1 Die Logik der Varianzanalyse

In dem mir zur Verfügung stehenden Datensatz „allbus96“ habe ich eine Variable „eink_k“ erzeugt, die das in einem Haushalt pro Kopf zur Verfügung stehende monatliche Einkommen in DM angibt.5 In „eink_k“ sind sowohl Ein- als auch Mehrpersonenhaushalte erfasst. In meinem Anwendungsbeispiel soll es sich bei „eink_k“ um die abhängige Variable handeln. Bei „eink_k“ handelt es sich um eine Ratioskala: Die Einkommensangaben in DM informieren über die Abstände zwischen den gemessenen Ausprägungen6 und es ist gleichzeitig ein sinnvoll interpretierbarer Nullpunkt vorhanden. Die Bedingung eines mindestens intervallskalierten Messniveaus für die abhängige Variable ist damit erfüllt.

Es lässt sich theoretisch begründbar die Hypothese aufstellen, dass der erreichte allgemeinbildende Schulabschluss zumindest teilweise die Unterschiede bzw. die Varianz des pro Kopf zur Verfügung stehenden Einkommens erklärt. Mit Hilfe der Variablen „schule“ und „eink_k“ soll diese Hypothese überprüft werden.7 Da die Befragten aus den neuen Bundesländern in der Allbus-Studie aus statistischen Gründen deutlich überrepräsentiert sind (Gabler u.a. 1996: 61), gewichte die Fälle mit Hilfe der Variablen „gewicht“, so dass sich sämtliche Ergebnisse im Kapitel über die Varianzanalyse auf Gesamtdeutschland beziehen.8

[...]


1 Manchmal werden nur solche Verfahren als „multivariat“ bezeichnet, in denen mehrere abhängige Variablen simultan analysiert werden. Modelle mit nur einer abhängigen Variablen werden in diesem Sprachgebrauch dann als „multiple“ bezeichnet (Ludwig-Mayerhofer 1999a).
2 Der ALLBUS-Datensatz von 1996 liegt mir nur in reduzierter Form als ALLBUScompact-Datensatz vor.
3 Die Abweichung der einzelnen Messwerte innerhalb der Gruppen vom Gruppenmittelwert wird dabei auch als „Residualvarianz“ oder „Fehlervarianz“ bezeicnet.
4 „ANOVA“ steht dabei für “ANalysis Of VAriance“.
5 In Anlage 1 findet sich die entsprechende SPSS-Syntax, mit der ich die neue Variable „eink_k“ erzeugt habe.
6 Es ist allerdings zu bedenken, dass ich die Werte von „eink_k“ bei „von-bis“-Angaben“ über die Bildung arithmetischer Mittel erzeugt habe. Dies soll hier allerdings vernachlässigt werden.
7 Eine Variable wie „Schicht der Eltern“ liegt mir leider nicht vor. Es geht mir in dieser Hausarbeit allerdings in erster Linie darum, das Prinzip von multivariaten Verfahren zu demonstrieren.
8 Im Kapitel über die Regressionsanalyse rechne ich im Unterschied dazu ausschließlich mit den Fällen der alten Bundesländer.


Comments

No comments yet

Add Comment
Your comment is reviewed before being published

Other users also were interested in the following titles:

Erstellen einer schriftlichen Hausarbeit

Author: Claudia Nickel
Presentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR

Grundtechniken wissenschaftlichen Arbeitens

Author: Maik Philipp
Presentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR

This text can be quoted and accessed from this url:

http://www.grin.com/e-book/78282/varianz-und-regressionsanalysen-als-wichtige-datenanalyseverfahren-dargestellt
please wait Please wait