Logistische Regression - Die Anwendung des Logit- und Probit-Modells


Seminararbeit, 2006

14 Seiten, Note: 2


Leseprobe

Inhaltsverzeichnis

1. Einleitung und Anwendungsfelder der logistischen Regression

2. Unterschiede zur linearen Regression
2.1 Exkurs: Binomialverteilung

3. Formulierung des Regressionsmodells
3.1 Dummy-Variablen
3.2 Schätzung der logistischen Regressionsfunktion
3.3 Interpretation der Regressionskoeffizienten
3.4 Prüfung des Regressionsmodells

4. Logit- und Probit-Modelle
4.1 Modellgüte

Literaturverzeichnis

1. Einleitung und Anwendungsfelder der logistischen Regression

In vielen Bereichen der Wissenschaft wie auch der Praxis in Wirtschaft, Politik usw. geht es darum, die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses zu ermitteln. Im Bereich des Marketing etwa ist es interessant zu wissen, welche Einflussgrößen die Kaufwahrscheinlichkeit erhöhen, im Bereich der Medizin geht es darum, welche Faktoren das Risiko einer Erkrankung erhöhen und in der Politik wird es von Interesse sein, die Auswirkungen bestimmter Größen auf die Wahrscheinlichkeit gewählt zu werden zu bestimmen. Alle diese Ereignisse lassen sich als dichotome (binäre) Variablen betrachten (Kauf – Nichtkauf, Erkrankung – Nichterkrankung, Wahl – Nichtwahl, usw.). Im Folgenden wird das Eintreten eines solchen Ereignisses als 1 und das Nichteintreten als 0 gekennzeichnet (vgl. Backhaus u. a.; Litz; Hamilton; Hartung/Elpelt; Andreß/Hagenaars/Kühnel; Tutz; Voß). Die Beziehung zwischen den Eintrittswahrscheinlichkeiten lassen sich folgendermaßen darstellen (vgl. Backhaus, S. 418):

Abbildung in dieser Leseprobe nicht enthalten (1)

Die Wahrscheinlichkeit für das Eintreten des Ereignisses (abhängige/endogene/erklärte Variable bzw. Regressand oder auch Prognosevariable genannt) beträgt also 1 minus die Wahrscheinlichkeit für das Nichteintreten des Ereignisses. Mit Hilfe der logistischen Regression lassen sich nun die Wahrscheinlichkeiten für das Eintreten eines Ereignisses berechnen. Dieses Verfahren weist einerseits Ähnlichkeiten mit der Diskriminanzanalyse auf, indem es sich um einen Zwei-Gruppen-Fall handelt. Andererseits bestehen Ähnlichkeiten zur linearen Regressionsanalyse, da über einen Regressionsansatz die Einflussgrößen (unabhängige/exogene/erklärende Variablen bzw. Regressor oder auch Prädiktorvariable genannt) gewichtet werden (vgl. Backhaus, S. 418). Wie bei der linearen Regression kann es sich dabei um dichotome oder metrische Einflussgrößen handeln. Die wesentlichen Unterschiede zur linearen Regression werden im folgenden Abschnitt aufgezeigt. Kapitel drei geht dann vertiefend auf die logistische Regression ein und Kap. 4 widmet sich schließlich dem Logit- und dem Probit-Modell. Da, wie im Verlauf dieser Arbeit festgestellt, die Logit- und Probit-Analyse in SPSS (dem Standardprogramm für Sozial- und Wirtschaftswissenschaftler) nur mangelhaft implementiert ist, beziehen sich die meisten Ausführungen dieser Arbeit auf die logistische Regression (die im Gegensatz zum Logit- und Probit-Modell Einzelfalldaten untersucht).

2. Unterschiede zur linearen Regression

Während es sich beim linearen Ansatz um metrisch skalierte abhängige Variablen handelt, deren Wert durch die Regressionsgerade vorausgesagt werden soll, geht es beim logistischen Ansatz darum, die Eintrittswahrscheinlichkeit eines bestimmten Ereignisses zu ermitteln (vgl. Backhaus, S. 419). Wie dies zu Problemen führt, sei nachfolgend veranschaulicht. In diesem fiktiven Beispiel soll der Einfluss des Lernaufwandes in Stunden auf das Bestehen einer Prüfung untersucht werden. Abb. 1 zeigt ein Streudiagramm mit den Werten von zehn Personen (Prüfung bestanden = 1, nicht bestanden = 0). Die aufgrund der linearen Regressionsfunktion gezeichnete Gerade geht klar ersichtlich über den zulässigen Wertebereich hinaus, d. h., sie nimmt Werte unter 0 bzw. über 1 an.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Lineare Regression

Die Eintrittswahrscheinlichkeit eines Ereignisses kann somit mit einer linearen Regression nicht geschätzt werden (vgl. Backhaus, S. 421-422). Der lineare Regressionsansatz

Abbildung in dieser Leseprobe nicht enthalten

unterstellt eine Streuung von [Abbildung in dieser Leseprobe nicht enthalten] und nicht von 0 bis 1. Weiters wird die Normalverteilung der Residualgröße [Abbildung in dieser Leseprobe nicht enthaltenan] genommen. Dies ist bei binären Variablen nicht der Fall. Drittens entstehen bei Anwendung der linearen Regression unplausible Schätzwerte, wie oben bereits gezeigt wurde. Die logistische Regression versucht nun, durch Unterstellung der latenten Variable Z, die Eintrittswahrscheinlichkeit eines beobachtbaren Ereignisses zu schätzen (vgl. Backhaus, S. 422-423).

Abbildung in dieser Leseprobe nicht enthalten

Z wird dabei als aggregierte Einflussstärke bezeichnet, von welcher die Eintrittswahrscheinlichkeit abgeleitet wird. Diese Funktion ist noch immer linear. Um nun Werte zwischen 0 und 1 zu erreichen, wird auf die logistische Funktion als Wahrscheinlichkeitsfunktion zurückgegriffen (vgl. Backhaus, S. 423):

Abbildung in dieser Leseprobe nicht enthalten

Unter Einsetzen des jeweiligen Z-Wertes erhält man sodann die logistische Regressionsgleichung (vgl. Backhaus, S. 423):

Abbildung in dieser Leseprobe nicht enthalten

Die Z-Werte bezeichnet man auch als Logits (vgl. Backhaus, S. 423). Daraus lassen sich nun die Wahrscheinlichkeiten für das Bestehen der Prüfung in Abhängigkeit des Lernaufwandes in Stunden (vgl. obiges Beispiel) berechnen und in folgender Abb. 2. darstellen.

[...]

Ende der Leseprobe aus 14 Seiten

Details

Titel
Logistische Regression - Die Anwendung des Logit- und Probit-Modells
Hochschule
Karl-Franzens-Universität Graz  (Institut für Statistik und Operations Research)
Veranstaltung
Konversatorium Statistik
Note
2
Autor
Jahr
2006
Seiten
14
Katalognummer
V94286
ISBN (eBook)
9783640100934
Dateigröße
397 KB
Sprache
Deutsch
Anmerkungen
Die Note (2) ist wohl nur darauf zurückzuführen, dass ich das Hauptaugenmerk auf die log. Regression gelegt habe und nicht, wie eigentlich verlangt, auf Logit- und Probit-Modell. Somit gab es wohl Punkteabzüge...
Schlagworte
Statistik, Logistische Regression, Logit Modell, Probit Modell, Regression, multivariate Methoden
Arbeit zitieren
Bakk. Mag. Manfred Hammerl (Autor), 2006, Logistische Regression - Die Anwendung des Logit- und Probit-Modells, München, GRIN Verlag, https://www.grin.com/document/94286

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Logistische Regression - Die Anwendung des Logit- und Probit-Modells



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden