Bei GRIN registrieren oder einloggen

Your e-mail-address or password is wrong
Jetzt registrieren
Für neue Autoren: kostenlos, einfach und schnell
Dies wird Ihr Benutzername, bitte geben Sie eine gültige E-Mail-Adresse an

Passwort vergessen

Your e-mail-address or password is wrong

Neues Passwort anfordern
Logistische Regression - Die Anwendung des Logit- und Probit-Modells close

Bitte warten

Bitte installieren Sie den Flash Player, wenn kein E-Book erscheint.

Logistische Regression - Die Anwendung des Logit- und Probit-Modells

Seminararbeit, 2006, 15 Seiten
Autor: Bakk. Mag. Manfred Hammerl
Fach: Statistik

Details

Kategorie: Seminararbeit
Jahr: 2006
Seiten: 15
Note: 2
Literaturverzeichnis: ~ 7  Einträge
Sprache: Deutsch
Archivnummer: V94286
ISBN (E-Book): 978-3-640-10093-4

Dateigröße: 107 KB
Anmerkungen :
Die Note (2) ist wohl nur darauf zurückzuführen, dass ich das Hauptaugenmerk auf die log. Regression gelegt habe und nicht, wie eigentlich verlangt, auf Logit- und Probit-Modell. Somit gab es wohl Punkteabzüge...


Zusammenfassung / Abstract

In vielen Bereichen der Wissenschaft wie auch der Praxis in Wirtschaft, Politik usw. geht es darum, die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses zu ermitteln. Im Bereich des Marketing etwa ist es interessant zu wissen, welche Einflussgrößen die Kauf-wahrscheinlichkeit erhöhen, im Bereich der Medizin geht es darum, welche Faktoren das Ri-siko einer Erkrankung erhöhen und in der Politik wird es von Interesse sein, die Auswirkun-gen bestimmter Größen auf die Wahrscheinlichkeit gewählt zu werden zu bestimmen. Alle diese Ereignisse lassen sich als dichotome (binäre) Variablen betrachten (Kauf – Nichtkauf, Erkrankung – Nichterkrankung, Wahl – Nichtwahl, usw.). Im Folgenden wird das Eintreten eines solchen Ereignisses als 1 und das Nichteintreten als 0 gekennzeichnet (vgl. Backhaus u. a.; Litz; Hamilton; Hartung/Elpelt; Andreß/Hagenaars/Kühnel; Tutz; Voß). Die Beziehung zwischen den Eintrittswahrscheinlichkeiten lassen sich folgendermaßen darstellen


Textauszug (computergeneriert)

Inhaltsverzeichnis

1. Einleitung und Anwendungsfelder der logistischen Regression 3

2. Unterschiede zur linearen Regression 4

2.1 Exkurs: Binomialverteilung 6

3. Formulierung des Regressionsmodells 7

3.1 Dummy-Variablen 7

3.2 Schätzung der logistischen Regressionsfunktion 7

3.3 Interpretation der Regressionskoeffizienten 9

3.4 Prüfung des Regressionsmodells 10

4. Logit- und Probit-Modelle 12

4.1 Modellgüte 13

Literaturverzeichnis 15

2


1. Einleitung und Anwendungsfelder der logistischen Regression

In vielen Bereichen der Wissenschaft wie auch der Praxis in Wirtschaft, Politik usw. geht es

darum, die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses zu ermitteln.

Im Bereich des Marketing etwa ist es interessant zu wissen, welche Einflussgrößen die Kauf-

wahrscheinlichkeit erhöhen, im Bereich der Medizin geht es darum, welche Faktoren das Ri-

siko einer Erkrankung erhöhen und in der Politik wird es von Interesse sein, die Auswirkun-

gen bestimmter Größen auf die Wahrscheinlichkeit gewählt zu werden zu bestimmen. Alle

diese Ereignisse lassen sich als dichotome (binäre) Variablen betrachten (Kauf ­ Nichtkauf,

Erkrankung ­ Nichterkrankung, Wahl ­ Nichtwahl, usw.). Im Folgenden wird das Eintreten

eines solchen Ereignisses als 1 und das Nichteintreten als 0 gekennzeichnet (vgl. Backhaus u.

a.; Litz; Hamilton; Hartung/Elpelt; Andreß/Hagenaars/Kühnel; Tutz; Voß). Die Beziehung

zwischen den Eintrittswahrscheinlichkeiten lassen sich folgendermaßen darstellen (vgl. Back-

haus, S. 418):

P

(

y

= )

0 +

P

(

y

= )

1 = 1

(1)

P

(

y

= )

0

= 1-

P

(

y

= )

1

Die Wahrscheinlichkeit für das Eintreten des Ereignisses (abhängige/endogene/erklärte Vari-

able bzw. Regressand oder auch Prognosevariable genannt) beträgt also 1 minus die Wahr-

scheinlichkeit für das Nichteintreten des Ereignisses. Mit Hilfe der logistischen Regression

lassen sich nun die Wahrscheinlichkeiten für das Eintreten eines Ereignisses berechnen. Die-

ses Verfahren weist einerseits Ähnlichkeiten mit der Diskriminanzanalyse auf, indem es sich

um einen Zwei-Gruppen-Fall handelt. Andererseits bestehen Ähnlichkeiten zur linearen Reg-

ressionsanalyse, da über einen Regressionsansatz die Einflussgrößen (unabhängi-

ge/exogene/erklärende Variablen bzw. Regressor oder auch Prädiktorvariable genannt) ge-

wichtet werden (vgl. Backhaus, S. 418). Wie bei der linearen Regression kann es sich dabei

um dichotome oder metrische Einflussgrößen handeln. Die wesentlichen Unterschiede zur

linearen Regression werden im folgenden Abschnitt aufgezeigt. Kapitel drei geht dann vertie-

fend auf die logistische Regression ein und Kap. 4 widmet sich schließlich dem Logit- und

dem Probit-Modell. Da, wie im Verlauf dieser Arbeit festgestellt, die Logit- und Probit-

Analyse in SPSS (dem Standardprogramm für Sozial- und Wirtschaftswissenschaftler) nur

mangelhaft implementiert ist, beziehen sich die meisten Ausführungen dieser Arbeit auf die

logistische Regression (die im Gegensatz zum Logit- und Probit-Modell Einzelfalldaten un-

tersucht).

3


2. Unterschiede zur linearen Regression

Während es sich beim linearen Ansatz um metrisch skalierte abhängige Variablen handelt,

deren Wert durch die Regressionsgerade vorausgesagt werden soll, geht es beim logistischen

Ansatz darum, die Eintrittswahrscheinlichkeit eines bestimmten Ereignisses zu ermitteln (vgl.

Backhaus, S. 419). Wie dies zu Problemen führt, sei nachfolgend veranschaulicht. In diesem

fiktiven Beispiel soll der Einfluss des Lernaufwandes in Stunden auf das Bestehen einer Prü-

fung untersucht werden. Abb. 1 zeigt ein Streudiagramm mit den Werten von zehn Personen

(Prüfung bestanden = 1, nicht bestanden = 0). Die aufgrund der linearen Regressionsfunktion

gezeichnete Gerade geht klar ersichtlich über den zulässigen Wertebereich hinaus, d. h., sie

nimmt Werte unter 0 bzw. über 1 an.

1,5

1,0

,5

prüfung bestanden

0,0

-,5

0

1

2

3

4

5

6

7

8

9

10

11

12

lernaufwand in stunden

Abbildung 1: Lineare Regression

Die Eintrittswahrscheinlichkeit eines Ereignisses kann somit mit einer linearen Regression

nicht geschätzt werden (vgl. Backhaus, S. 421-422). Der lineare Regressionsansatz

J

y

= +

x

u

(2)

k

0

+

j

jk

k

j

=1

unterstellt eine Streuung von [- ;+] und nicht von 0 bis 1. Weiters wird die Normalvertei-

lung der Residualgröße

u

angenommen. Dies ist bei binären Variablen nicht der Fall. Drit-

k

tens entstehen bei Anwendung der linearen Regression unplausible Schätzwerte, wie oben

4


bereits gezeigt wurde. Die logistische Regression versucht nun, durch Unterstellung der laten-

ten Variable Z, die Eintrittswahrscheinlichkeit eines beobachtbaren Ereignisses zu schätzen

(vgl. Backhaus, S. 422-423).

1

falls z

> 0

y

=

k

(3)

k

0

falls z

0

k

J

z

= +

x

u

(4)

k

0

+

j

jk

k

j

=1

Z wird dabei als aggregierte Einflussstärke bezeichnet, von welcher die Eintrittswahrschein-

lichkeit abgeleitet wird. Diese Funktion ist noch immer linear. Um nun Werte zwischen 0 und

1 zu erreichen, wird auf die logistische Funktion als Wahrscheinlichkeitsfunktion zurückge-

griffen (vgl. Backhaus, S. 423):

1

p

=

(5)

-

z

1 +

e

Unter Einsetzen des jeweiligen Z-Wertes erhält man sodann die logistische Regressionsglei-

chung (vgl. Backhaus, S. 423):

1

p

(

y

= )

1 =

(6)

k

-

zk

1 +

e

J

z

= +

x

u

(4)

k

0

+

j

jk

k

j

=1

Die Z-Werte bezeichnet man auch als Logits (vgl. Backhaus, S. 423). Daraus lassen sich nun

die Wahrscheinlichkeiten für das Bestehen der Prüfung in Abhängigkeit des Lernaufwandes

in Stunden (vgl. obiges Beispiel) berechnen und in folgender Abb. 2. darstellen.

5



Kommentare

Bisher keine Kommentare

Kommentar hinzufügen
Ihr Kommentar wird redaktionell geprüft und dann freigeschaltet

Andere Nutzer haben sich auch für folgende Titel interessiert:


Dieser Text kann über folgende URL aufgerufen und zitiert werden:

http://www.grin.com/e-book/94286/logistische-regression-die-anwendung-des-logit-und-probit-modells
please wait Bitte warten