Multivariate Verfahren. Überblick und wichtigste Merkmale


Apunte de Clase, 2013
13 Páginas, Calificación: 1

Extracto

Multivariate Verfahren

Vorteile multivariaten Denkens

- interessierende Phänomene können realitätsnäher untersucht werden, da mehrere Variablen in Abhängigkeiten von mehreren Faktoren gleichzeitig analysiert werden können
- typische Nachteile univariater Forschung können vermieden werden

- alpha-Fehler-Kummulierung, Nicht-Berücksichtigung des Zusammenhangs mehrere AVs

- Fit-Maße im Makro- und Mikrobereich

- Makro-Fit-Maß evaluiert das getestete Modell in seiner Gesamtheit (Globalprüfung)
- Mikro-Fit-Maße testen Teile des Modells (Lokalprüfung)

- Forschungskonsum: Kritikfähigkeit gegenüber univariater Forschung wird erhöht

Nachteile multivariaten Denkens

- Voraussetzungen für den Einsatz multivariater Verfahren i. A. schwer zu erfüllen
- Stichprobenbedarf ist höher

- n = 5-10 pro Variable bzw. pro Parameter; wenn Verletzungen der Voraussetzungen vorliegen: n = 20-50 pro Variable bzw. pro Parameter
- Stichprobenmindestgröße: N = 250-500

- Interpretation von multivariaten Analysen komplexer, da mehrere Ebenen zu berücksichtigen sind

- Makro-Fit: Signifikanz des Gesamtmodells
- UVs, AVs, Verhältnis zwischen UVs und AVs

- Lernaufwand höher

Faktorenanalyse

a.

Grundidee: Erkundung/Exploration von Strukturen in größeren Variablensets (Dimensionen); Erklärung der Zusammenhänge zwischen den Variablen durch zugrundeliegende Faktoren; Reduktion der Info in den Variablensets auf wesentliche Info (Faktorwerte) à Testergebnis ist bedingt durch Linearkombination von Faktoren, die dem Testverhalten zugrunde liegen. Diese Faktoren stellen die Ursache für die Korrelation der Testverfahren untereinander dar

b.

Wesentliche Schritte einer Faktorenanalyse:

- Berechnung der Interkorrelationsmatrix
- Extraktion der Faktoren
- Bestimmung der Anzahl zu interpretierenden Faktoren
- Interpretation der Faktorstruktur & Faktorladungen
- Berechnen der Faktorwerte

c.

Wie prüft man die Eignung einer Interkorrelationsmatrix?

- Signifikanzniveau der Korrelationen
- Bartlett Test (Spherizitätsüberprüfung) Variablen in Erhebungsgrundgesamtheit unkorreliert
- Anti­Image­Kovarianz­Matrix
- Kaiser­Meyer­Olkin­Kriterium

d.

Was ist ein Eigenwert? Aufgeklärte Varianzbeiträge pro Faktor über alle Variablen

Clusteranalyse

a. Modelltests: • Bestimmung der optimalen Clusteranzahl: Test von Mojena, Scree Test 2

Wahl des Proximitätsmaßes:

- Ähnlichkeit (metrisch): Pearson Korrelationskoeffizient
- Ähnlichkeit (dichotom): Jaccard Koeffizient, MKoeffizient, Russel & Rao Koeffizient, Dice Koeffizient, Kulczynski Koeffizient
- Distanz (metrisch): Minkowski Metriken (Euklidische, City­Block)
- Distanz (nominal): Chi² Maß, Phi² Maß 6.

Unterschiede und Gemeinsamkeiten der Clusteranalyse und der

explorativen Faktorenanalyse

- Ähnlichkeitsmaß: Korrelation vs. Diverse (Pearson/Jaccard/Dice Koeffizienten)
- Ziel: Maximierung der Varianzaufklärung bei Minimierung der Komponenten, Maximierung der Varianz der Ladungen vs. Unterschied zwischen den Objekten einer Gruppe wird minimiert und zwischen den Clustern maximiert
- … wird erreicht über: Algorithmus vs. Heuristiken
- Verfahren: parametrisch vs. non parametrisch
- Gruppierung ist: Nebenresultat (Suche nach kausalem Zusammenhang zwischen AV und UV) vs. Hauptziel (Suche nach empirischer Klassifikation)
- Gemeinsamkeit: Klassifikation hinsichtlich Homogenität (Homogenität/Heterogenität von Variablen vs. Objekten/Personen)

Lineare Regression

a. Welche Modelltests gibt es?

- Globalprüfung: Bestimmheitsmaß R², F Statistik
- Lokalprüfung: Höhe des Regressionskoeffizienten B, t­Test, Konfidenzintervall von B b. Was ist der variance inflation factor? à Genauigkeit der Schätzwerte; jener Faktor. um die sich die Varianzen der Regressionskoeffizienten mit zunehmender Multikollinearität vergrößern (Genauigkeit der Schätzwerte nimmt mit zunehmender Multikollinearität ab).

Logistische Regression: Globalprüfung des Modells

- Likelihood-Ratio-Test (LRT)

- Maximal mögliche Likelihood=1, Log-Likelihood daher =0
- -2*ln*Likelihood = asymptotisch Chi^2-verteilt

- Differenz des Nullmodells (LL0) mit vollständigem Modell (LLV)
- Wenn Chi^2 signifikant wird, H0 verwerfen => Modell global gültig

- Pseudo-R^2

- Ebenfalls Betrachtung des Verhältnisses von LL0 und LLV
- Unterschiedliche Pseudo-R^2-Statistiken

- Werte ≥ .50 = sehr guter Fit

- Hälfte der Varianz durch UV erklärt

- Klassifikationsmatrix: Beurteilung der Klassifikationsergebnisse anhand von

- Sensitivität: Anteil richtig Positiver an Positiven
- Spezifität: Anteil richtig Negativer an Negativen
- Hosmer-Lemeshow-Test

Logistische Regression: Inwiefern ist diese linear?

Logistische Funktion stellt als Linking-Funktion eine Verbindung zwischen dem Ergebnis y=1 und den unabhängigen Prädiktoren indirekt her. Der wahrscheinlichkeitsfunktionale Zusammenhang ist nicht-linear, das Zustandekommen der latenten Variable Z im Exponenten der Linking-Funktion hingegen schon.

Binär/ Multinominale logistische Regression

Modelltests: - Globalprüfung: Likelihood Ratio Test, Pseudo­R², Klassifikationsmatrix, Hosmer­Lemeshow­Test - Lokalprüfung: Wald­Statistik

Unterschiede/Gemeinsamkeiten der linearen und der logistischen Regressionsanalyse

- Messniveau AV: metrisch vs. nominal
- Interesse: linearer Zusammenhang zwischen x und y vs. Wahrscheinlichkeitsverhältnisse der Zugehörigkeit zur Kategorie 1
- Schätzung: direkter linearer Einfluss der UV auf die AV vs. Einfluss der UV auf die Wsk., dass AV den Wert 1 annimmt
- Optimierungsmethode: kleinste Quadrate Kriterium vs. Maximum Likelihood Einschätzung - Interpretation: F­Test, t­Test, R² vs. Global Likelihood Ratio Test, Pseudo R², Hosmer Lemeshow Test
- AV bei logistischer Regressionsanalyse dichotom
- Bei logistische Regressionsanalyse werden keine Schätzungen für Beobachtunsgwerte, sondern Schätzungen der Höhen von Eintrittswahrscheinlichkeiten für Beobachtungswerte vorgenommen à latente Variable Z wird angenommen

[...]

Final del extracto de 13 páginas

Detalles

Título
Multivariate Verfahren. Überblick und wichtigste Merkmale
Universidad
University of Graz
Calificación
1
Autor
Año
2013
Páginas
13
No. de catálogo
V485182
ISBN (Ebook)
9783346073877
Idioma
Alemán
Etiqueta
multivariate, verfahren, überblick, merkmale
Citar trabajo
Gloria Schmarda (Autor), 2013, Multivariate Verfahren. Überblick und wichtigste Merkmale, Múnich, GRIN Verlag, https://www.grin.com/document/485182

Comentarios

  • No hay comentarios todavía.
Leer eBook
Título: Multivariate Verfahren. Überblick und wichtigste Merkmale


Cargar textos

Sus trabajos académicos / tesis:

- Publicación como eBook y libro impreso
- Honorarios altos para las ventas
- Totalmente gratuito y con ISBN
- Le llevará solo 5 minutos
- Cada trabajo encuentra lectores

Así es como funciona