Multivariate Verfahren. Überblick und wichtigste Merkmale


Lecture Notes, 2013
13 Pages, Grade: 1

Excerpt

Multivariate Verfahren

Vorteile multivariaten Denkens

- interessierende Phänomene können realitätsnäher untersucht werden, da mehrere Variablen in Abhängigkeiten von mehreren Faktoren gleichzeitig analysiert werden können
- typische Nachteile univariater Forschung können vermieden werden

- alpha-Fehler-Kummulierung, Nicht-Berücksichtigung des Zusammenhangs mehrere AVs

- Fit-Maße im Makro- und Mikrobereich

- Makro-Fit-Maß evaluiert das getestete Modell in seiner Gesamtheit (Globalprüfung)
- Mikro-Fit-Maße testen Teile des Modells (Lokalprüfung)

- Forschungskonsum: Kritikfähigkeit gegenüber univariater Forschung wird erhöht

Nachteile multivariaten Denkens

- Voraussetzungen für den Einsatz multivariater Verfahren i. A. schwer zu erfüllen
- Stichprobenbedarf ist höher

- n = 5-10 pro Variable bzw. pro Parameter; wenn Verletzungen der Voraussetzungen vorliegen: n = 20-50 pro Variable bzw. pro Parameter
- Stichprobenmindestgröße: N = 250-500

- Interpretation von multivariaten Analysen komplexer, da mehrere Ebenen zu berücksichtigen sind

- Makro-Fit: Signifikanz des Gesamtmodells
- UVs, AVs, Verhältnis zwischen UVs und AVs

- Lernaufwand höher

Faktorenanalyse

a.

Grundidee: Erkundung/Exploration von Strukturen in größeren Variablensets (Dimensionen); Erklärung der Zusammenhänge zwischen den Variablen durch zugrundeliegende Faktoren; Reduktion der Info in den Variablensets auf wesentliche Info (Faktorwerte) à Testergebnis ist bedingt durch Linearkombination von Faktoren, die dem Testverhalten zugrunde liegen. Diese Faktoren stellen die Ursache für die Korrelation der Testverfahren untereinander dar

b.

Wesentliche Schritte einer Faktorenanalyse:

- Berechnung der Interkorrelationsmatrix
- Extraktion der Faktoren
- Bestimmung der Anzahl zu interpretierenden Faktoren
- Interpretation der Faktorstruktur & Faktorladungen
- Berechnen der Faktorwerte

c.

Wie prüft man die Eignung einer Interkorrelationsmatrix?

- Signifikanzniveau der Korrelationen
- Bartlett Test (Spherizitätsüberprüfung) Variablen in Erhebungsgrundgesamtheit unkorreliert
- Anti­Image­Kovarianz­Matrix
- Kaiser­Meyer­Olkin­Kriterium

d.

Was ist ein Eigenwert? Aufgeklärte Varianzbeiträge pro Faktor über alle Variablen

Clusteranalyse

a. Modelltests: • Bestimmung der optimalen Clusteranzahl: Test von Mojena, Scree Test 2

Wahl des Proximitätsmaßes:

- Ähnlichkeit (metrisch): Pearson Korrelationskoeffizient
- Ähnlichkeit (dichotom): Jaccard Koeffizient, MKoeffizient, Russel & Rao Koeffizient, Dice Koeffizient, Kulczynski Koeffizient
- Distanz (metrisch): Minkowski Metriken (Euklidische, City­Block)
- Distanz (nominal): Chi² Maß, Phi² Maß 6.

Unterschiede und Gemeinsamkeiten der Clusteranalyse und der

explorativen Faktorenanalyse

- Ähnlichkeitsmaß: Korrelation vs. Diverse (Pearson/Jaccard/Dice Koeffizienten)
- Ziel: Maximierung der Varianzaufklärung bei Minimierung der Komponenten, Maximierung der Varianz der Ladungen vs. Unterschied zwischen den Objekten einer Gruppe wird minimiert und zwischen den Clustern maximiert
- … wird erreicht über: Algorithmus vs. Heuristiken
- Verfahren: parametrisch vs. non parametrisch
- Gruppierung ist: Nebenresultat (Suche nach kausalem Zusammenhang zwischen AV und UV) vs. Hauptziel (Suche nach empirischer Klassifikation)
- Gemeinsamkeit: Klassifikation hinsichtlich Homogenität (Homogenität/Heterogenität von Variablen vs. Objekten/Personen)

Lineare Regression

a. Welche Modelltests gibt es?

- Globalprüfung: Bestimmheitsmaß R², F Statistik
- Lokalprüfung: Höhe des Regressionskoeffizienten B, t­Test, Konfidenzintervall von B b. Was ist der variance inflation factor? à Genauigkeit der Schätzwerte; jener Faktor. um die sich die Varianzen der Regressionskoeffizienten mit zunehmender Multikollinearität vergrößern (Genauigkeit der Schätzwerte nimmt mit zunehmender Multikollinearität ab).

Logistische Regression: Globalprüfung des Modells

- Likelihood-Ratio-Test (LRT)

- Maximal mögliche Likelihood=1, Log-Likelihood daher =0
- -2*ln*Likelihood = asymptotisch Chi^2-verteilt

- Differenz des Nullmodells (LL0) mit vollständigem Modell (LLV)
- Wenn Chi^2 signifikant wird, H0 verwerfen => Modell global gültig

- Pseudo-R^2

- Ebenfalls Betrachtung des Verhältnisses von LL0 und LLV
- Unterschiedliche Pseudo-R^2-Statistiken

- Werte ≥ .50 = sehr guter Fit

- Hälfte der Varianz durch UV erklärt

- Klassifikationsmatrix: Beurteilung der Klassifikationsergebnisse anhand von

- Sensitivität: Anteil richtig Positiver an Positiven
- Spezifität: Anteil richtig Negativer an Negativen
- Hosmer-Lemeshow-Test

Logistische Regression: Inwiefern ist diese linear?

Logistische Funktion stellt als Linking-Funktion eine Verbindung zwischen dem Ergebnis y=1 und den unabhängigen Prädiktoren indirekt her. Der wahrscheinlichkeitsfunktionale Zusammenhang ist nicht-linear, das Zustandekommen der latenten Variable Z im Exponenten der Linking-Funktion hingegen schon.

Binär/ Multinominale logistische Regression

Modelltests: - Globalprüfung: Likelihood Ratio Test, Pseudo­R², Klassifikationsmatrix, Hosmer­Lemeshow­Test - Lokalprüfung: Wald­Statistik

Unterschiede/Gemeinsamkeiten der linearen und der logistischen Regressionsanalyse

- Messniveau AV: metrisch vs. nominal
- Interesse: linearer Zusammenhang zwischen x und y vs. Wahrscheinlichkeitsverhältnisse der Zugehörigkeit zur Kategorie 1
- Schätzung: direkter linearer Einfluss der UV auf die AV vs. Einfluss der UV auf die Wsk., dass AV den Wert 1 annimmt
- Optimierungsmethode: kleinste Quadrate Kriterium vs. Maximum Likelihood Einschätzung - Interpretation: F­Test, t­Test, R² vs. Global Likelihood Ratio Test, Pseudo R², Hosmer Lemeshow Test
- AV bei logistischer Regressionsanalyse dichotom
- Bei logistische Regressionsanalyse werden keine Schätzungen für Beobachtunsgwerte, sondern Schätzungen der Höhen von Eintrittswahrscheinlichkeiten für Beobachtungswerte vorgenommen à latente Variable Z wird angenommen

[...]

Excerpt out of 13 pages

Details

Title
Multivariate Verfahren. Überblick und wichtigste Merkmale
College
University of Graz
Grade
1
Author
Year
2013
Pages
13
Catalog Number
V485182
ISBN (eBook)
9783346073877
Language
German
Tags
multivariate, verfahren, überblick, merkmale
Quote paper
Gloria Schmarda (Author), 2013, Multivariate Verfahren. Überblick und wichtigste Merkmale, Munich, GRIN Verlag, https://www.grin.com/document/485182

Comments

  • No comments yet.
Read the ebook
Title: Multivariate Verfahren. Überblick und wichtigste Merkmale


Upload papers

Your term paper / thesis:

- Publication as eBook and book
- High royalties for the sales
- Completely free - with ISBN
- It only takes five minutes
- Every paper finds readers

Publish now - it's free