Multivariate Verfahren. Überblick und wichtigste Merkmale


Note de Cours Magistral, 2013
13 Pages, Note: 1

Extrait

Multivariate Verfahren

Vorteile multivariaten Denkens

- interessierende Phänomene können realitätsnäher untersucht werden, da mehrere Variablen in Abhängigkeiten von mehreren Faktoren gleichzeitig analysiert werden können
- typische Nachteile univariater Forschung können vermieden werden

- alpha-Fehler-Kummulierung, Nicht-Berücksichtigung des Zusammenhangs mehrere AVs

- Fit-Maße im Makro- und Mikrobereich

- Makro-Fit-Maß evaluiert das getestete Modell in seiner Gesamtheit (Globalprüfung)
- Mikro-Fit-Maße testen Teile des Modells (Lokalprüfung)

- Forschungskonsum: Kritikfähigkeit gegenüber univariater Forschung wird erhöht

Nachteile multivariaten Denkens

- Voraussetzungen für den Einsatz multivariater Verfahren i. A. schwer zu erfüllen
- Stichprobenbedarf ist höher

- n = 5-10 pro Variable bzw. pro Parameter; wenn Verletzungen der Voraussetzungen vorliegen: n = 20-50 pro Variable bzw. pro Parameter
- Stichprobenmindestgröße: N = 250-500

- Interpretation von multivariaten Analysen komplexer, da mehrere Ebenen zu berücksichtigen sind

- Makro-Fit: Signifikanz des Gesamtmodells
- UVs, AVs, Verhältnis zwischen UVs und AVs

- Lernaufwand höher

Faktorenanalyse

a.

Grundidee: Erkundung/Exploration von Strukturen in größeren Variablensets (Dimensionen); Erklärung der Zusammenhänge zwischen den Variablen durch zugrundeliegende Faktoren; Reduktion der Info in den Variablensets auf wesentliche Info (Faktorwerte) à Testergebnis ist bedingt durch Linearkombination von Faktoren, die dem Testverhalten zugrunde liegen. Diese Faktoren stellen die Ursache für die Korrelation der Testverfahren untereinander dar

b.

Wesentliche Schritte einer Faktorenanalyse:

- Berechnung der Interkorrelationsmatrix
- Extraktion der Faktoren
- Bestimmung der Anzahl zu interpretierenden Faktoren
- Interpretation der Faktorstruktur & Faktorladungen
- Berechnen der Faktorwerte

c.

Wie prüft man die Eignung einer Interkorrelationsmatrix?

- Signifikanzniveau der Korrelationen
- Bartlett Test (Spherizitätsüberprüfung) Variablen in Erhebungsgrundgesamtheit unkorreliert
- Anti­Image­Kovarianz­Matrix
- Kaiser­Meyer­Olkin­Kriterium

d.

Was ist ein Eigenwert? Aufgeklärte Varianzbeiträge pro Faktor über alle Variablen

Clusteranalyse

a. Modelltests: • Bestimmung der optimalen Clusteranzahl: Test von Mojena, Scree Test 2

Wahl des Proximitätsmaßes:

- Ähnlichkeit (metrisch): Pearson Korrelationskoeffizient
- Ähnlichkeit (dichotom): Jaccard Koeffizient, MKoeffizient, Russel & Rao Koeffizient, Dice Koeffizient, Kulczynski Koeffizient
- Distanz (metrisch): Minkowski Metriken (Euklidische, City­Block)
- Distanz (nominal): Chi² Maß, Phi² Maß 6.

Unterschiede und Gemeinsamkeiten der Clusteranalyse und der

explorativen Faktorenanalyse

- Ähnlichkeitsmaß: Korrelation vs. Diverse (Pearson/Jaccard/Dice Koeffizienten)
- Ziel: Maximierung der Varianzaufklärung bei Minimierung der Komponenten, Maximierung der Varianz der Ladungen vs. Unterschied zwischen den Objekten einer Gruppe wird minimiert und zwischen den Clustern maximiert
- … wird erreicht über: Algorithmus vs. Heuristiken
- Verfahren: parametrisch vs. non parametrisch
- Gruppierung ist: Nebenresultat (Suche nach kausalem Zusammenhang zwischen AV und UV) vs. Hauptziel (Suche nach empirischer Klassifikation)
- Gemeinsamkeit: Klassifikation hinsichtlich Homogenität (Homogenität/Heterogenität von Variablen vs. Objekten/Personen)

Lineare Regression

a. Welche Modelltests gibt es?

- Globalprüfung: Bestimmheitsmaß R², F Statistik
- Lokalprüfung: Höhe des Regressionskoeffizienten B, t­Test, Konfidenzintervall von B b. Was ist der variance inflation factor? à Genauigkeit der Schätzwerte; jener Faktor. um die sich die Varianzen der Regressionskoeffizienten mit zunehmender Multikollinearität vergrößern (Genauigkeit der Schätzwerte nimmt mit zunehmender Multikollinearität ab).

Logistische Regression: Globalprüfung des Modells

- Likelihood-Ratio-Test (LRT)

- Maximal mögliche Likelihood=1, Log-Likelihood daher =0
- -2*ln*Likelihood = asymptotisch Chi^2-verteilt

- Differenz des Nullmodells (LL0) mit vollständigem Modell (LLV)
- Wenn Chi^2 signifikant wird, H0 verwerfen => Modell global gültig

- Pseudo-R^2

- Ebenfalls Betrachtung des Verhältnisses von LL0 und LLV
- Unterschiedliche Pseudo-R^2-Statistiken

- Werte ≥ .50 = sehr guter Fit

- Hälfte der Varianz durch UV erklärt

- Klassifikationsmatrix: Beurteilung der Klassifikationsergebnisse anhand von

- Sensitivität: Anteil richtig Positiver an Positiven
- Spezifität: Anteil richtig Negativer an Negativen
- Hosmer-Lemeshow-Test

Logistische Regression: Inwiefern ist diese linear?

Logistische Funktion stellt als Linking-Funktion eine Verbindung zwischen dem Ergebnis y=1 und den unabhängigen Prädiktoren indirekt her. Der wahrscheinlichkeitsfunktionale Zusammenhang ist nicht-linear, das Zustandekommen der latenten Variable Z im Exponenten der Linking-Funktion hingegen schon.

Binär/ Multinominale logistische Regression

Modelltests: - Globalprüfung: Likelihood Ratio Test, Pseudo­R², Klassifikationsmatrix, Hosmer­Lemeshow­Test - Lokalprüfung: Wald­Statistik

Unterschiede/Gemeinsamkeiten der linearen und der logistischen Regressionsanalyse

- Messniveau AV: metrisch vs. nominal
- Interesse: linearer Zusammenhang zwischen x und y vs. Wahrscheinlichkeitsverhältnisse der Zugehörigkeit zur Kategorie 1
- Schätzung: direkter linearer Einfluss der UV auf die AV vs. Einfluss der UV auf die Wsk., dass AV den Wert 1 annimmt
- Optimierungsmethode: kleinste Quadrate Kriterium vs. Maximum Likelihood Einschätzung - Interpretation: F­Test, t­Test, R² vs. Global Likelihood Ratio Test, Pseudo R², Hosmer Lemeshow Test
- AV bei logistischer Regressionsanalyse dichotom
- Bei logistische Regressionsanalyse werden keine Schätzungen für Beobachtunsgwerte, sondern Schätzungen der Höhen von Eintrittswahrscheinlichkeiten für Beobachtungswerte vorgenommen à latente Variable Z wird angenommen

[...]

Fin de l'extrait de 13 pages

Résumé des informations

Titre
Multivariate Verfahren. Überblick und wichtigste Merkmale
Université
University of Graz
Note
1
Auteur
Année
2013
Pages
13
N° de catalogue
V485182
ISBN (ebook)
9783346073877
Langue
Allemand
mots-clé
multivariate, verfahren, überblick, merkmale
Citation du texte
Gloria Schmarda (Auteur), 2013, Multivariate Verfahren. Überblick und wichtigste Merkmale, Munich, GRIN Verlag, https://www.grin.com/document/485182

Commentaires

  • Pas encore de commentaires.
Lire l'ebook
Titre: Multivariate Verfahren. Überblick und wichtigste Merkmale


Télécharger textes

Votre devoir / mémoire:

- Publication en tant qu'eBook et livre
- Honoraires élevés sur les ventes
- Pour vous complètement gratuit - avec ISBN
- Cela dure que 5 minutes
- Chaque œuvre trouve des lecteurs

Devenir un auteur