Bitte warten
Bitte installieren Sie den Flash Player, wenn kein E-Book erscheint.
Seminararbeit, 2006, 15 Seiten
Autor: Bakk. Mag. Manfred Hammerl
Fach: Statistik
Details
Institution/Hochschule: Karl-Franzens-Universität Graz (Institut für Statistik und Operations Research)
Tags: Statistik, Logistische Regression, Logit Modell, Probit Modell, Regression, multivariate Methoden
Jahr: 2006
Seiten: 15
Note: 2
Literaturverzeichnis: ~ 7 Einträge
Sprache: Deutsch
ISBN (E-Book): 978-3-640-10093-4
Dateigröße: 107 KB
Die Note (2) ist wohl nur darauf zurückzuführen, dass ich das Hauptaugenmerk auf die log. Regression gelegt habe und nicht, wie eigentlich verlangt, auf Logit- und Probit-Modell. Somit gab es wohl Punkteabzüge...
Andere Nutzer haben sich auch für folgende Titel interessiert:
Zusammenfassung / Abstract
In vielen Bereichen der Wissenschaft wie auch der Praxis in Wirtschaft, Politik usw. geht es darum, die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses zu ermitteln. Im Bereich des Marketing etwa ist es interessant zu wissen, welche Einflussgrößen die Kauf-wahrscheinlichkeit erhöhen, im Bereich der Medizin geht es darum, welche Faktoren das Ri-siko einer Erkrankung erhöhen und in der Politik wird es von Interesse sein, die Auswirkun-gen bestimmter Größen auf die Wahrscheinlichkeit gewählt zu werden zu bestimmen. Alle diese Ereignisse lassen sich als dichotome (binäre) Variablen betrachten (Kauf – Nichtkauf, Erkrankung – Nichterkrankung, Wahl – Nichtwahl, usw.). Im Folgenden wird das Eintreten eines solchen Ereignisses als 1 und das Nichteintreten als 0 gekennzeichnet (vgl. Backhaus u. a.; Litz; Hamilton; Hartung/Elpelt; Andreß/Hagenaars/Kühnel; Tutz; Voß). Die Beziehung zwischen den Eintrittswahrscheinlichkeiten lassen sich folgendermaßen darstellen
Textauszug (computergeneriert)
Inhaltsverzeichnis
1. Einleitung und Anwendungsfelder der logistischen Regression 3
2. Unterschiede zur linearen Regression 4
2.1 Exkurs: Binomialverteilung 6
3. Formulierung des Regressionsmodells 7
3.1 Dummy-Variablen 7
3.2 Schätzung der logistischen Regressionsfunktion 7
3.3 Interpretation der Regressionskoeffizienten 9
3.4 Prüfung des Regressionsmodells 10
4. Logit- und Probit-Modelle 12
4.1 Modellgüte 13
Literaturverzeichnis 15
2
1. Einleitung und Anwendungsfelder der logistischen Regression
In vielen Bereichen der Wissenschaft wie auch der Praxis in Wirtschaft, Politik usw. geht es
darum, die Wahrscheinlichkeit für das Eintreten eines bestimmten Ereignisses zu ermitteln.
Im Bereich des Marketing etwa ist es interessant zu wissen, welche Einflussgrößen die Kauf-
wahrscheinlichkeit erhöhen, im Bereich der Medizin geht es darum, welche Faktoren das Ri-
siko einer Erkrankung erhöhen und in der Politik wird es von Interesse sein, die Auswirkun-
gen bestimmter Größen auf die Wahrscheinlichkeit gewählt zu werden zu bestimmen. Alle
diese Ereignisse lassen sich als dichotome (binäre) Variablen betrachten (Kauf Nichtkauf,
Erkrankung Nichterkrankung, Wahl Nichtwahl, usw.). Im Folgenden wird das Eintreten
eines solchen Ereignisses als 1 und das Nichteintreten als 0 gekennzeichnet (vgl. Backhaus u.
a.; Litz; Hamilton; Hartung/Elpelt; Andreß/Hagenaars/Kühnel; Tutz; Voß). Die Beziehung
zwischen den Eintrittswahrscheinlichkeiten lassen sich folgendermaßen darstellen (vgl. Back-
haus, S. 418):
P
(
y
= )
0 +
P
(
y
= )
1 = 1
(1)
P
(
y
= )
0
= 1-
P
(
y
= )
1
Die Wahrscheinlichkeit für das Eintreten des Ereignisses (abhängige/endogene/erklärte Vari-
able bzw. Regressand oder auch Prognosevariable genannt) beträgt also 1 minus die Wahr-
scheinlichkeit für das Nichteintreten des Ereignisses. Mit Hilfe der logistischen Regression
lassen sich nun die Wahrscheinlichkeiten für das Eintreten eines Ereignisses berechnen. Die-
ses Verfahren weist einerseits Ähnlichkeiten mit der Diskriminanzanalyse auf, indem es sich
um einen Zwei-Gruppen-Fall handelt. Andererseits bestehen Ähnlichkeiten zur linearen Reg-
ressionsanalyse, da über einen Regressionsansatz die Einflussgrößen (unabhängi-
ge/exogene/erklärende Variablen bzw. Regressor oder auch Prädiktorvariable genannt) ge-
wichtet werden (vgl. Backhaus, S. 418). Wie bei der linearen Regression kann es sich dabei
um dichotome oder metrische Einflussgrößen handeln. Die wesentlichen Unterschiede zur
linearen Regression werden im folgenden Abschnitt aufgezeigt. Kapitel drei geht dann vertie-
fend auf die logistische Regression ein und Kap. 4 widmet sich schließlich dem Logit- und
dem Probit-Modell. Da, wie im Verlauf dieser Arbeit festgestellt, die Logit- und Probit-
Analyse in SPSS (dem Standardprogramm für Sozial- und Wirtschaftswissenschaftler) nur
mangelhaft implementiert ist, beziehen sich die meisten Ausführungen dieser Arbeit auf die
logistische Regression (die im Gegensatz zum Logit- und Probit-Modell Einzelfalldaten un-
tersucht).
3
2. Unterschiede zur linearen Regression
Während es sich beim linearen Ansatz um metrisch skalierte abhängige Variablen handelt,
deren Wert durch die Regressionsgerade vorausgesagt werden soll, geht es beim logistischen
Ansatz darum, die Eintrittswahrscheinlichkeit eines bestimmten Ereignisses zu ermitteln (vgl.
Backhaus, S. 419). Wie dies zu Problemen führt, sei nachfolgend veranschaulicht. In diesem
fiktiven Beispiel soll der Einfluss des Lernaufwandes in Stunden auf das Bestehen einer Prü-
fung untersucht werden. Abb. 1 zeigt ein Streudiagramm mit den Werten von zehn Personen
(Prüfung bestanden = 1, nicht bestanden = 0). Die aufgrund der linearen Regressionsfunktion
gezeichnete Gerade geht klar ersichtlich über den zulässigen Wertebereich hinaus, d. h., sie
nimmt Werte unter 0 bzw. über 1 an.
1,5
1,0
,5
prüfung bestanden
0,0
-,5
0
1
2
3
4
5
6
7
8
9
10
11
12
lernaufwand in stunden
Abbildung 1: Lineare Regression
Die Eintrittswahrscheinlichkeit eines Ereignisses kann somit mit einer linearen Regression
nicht geschätzt werden (vgl. Backhaus, S. 421-422). Der lineare Regressionsansatz
J
y
= +
x
u
(2)
k
0
+
j
jk
k
j
=1
unterstellt eine Streuung von [- ;+] und nicht von 0 bis 1. Weiters wird die Normalvertei-
lung der Residualgröße
u
angenommen. Dies ist bei binären Variablen nicht der Fall. Drit-
k
tens entstehen bei Anwendung der linearen Regression unplausible Schätzwerte, wie oben
4
bereits gezeigt wurde. Die logistische Regression versucht nun, durch Unterstellung der laten-
ten Variable Z, die Eintrittswahrscheinlichkeit eines beobachtbaren Ereignisses zu schätzen
(vgl. Backhaus, S. 422-423).
1
falls z
> 0
y
=
k
(3)
k
0
falls z
0
k
J
z
= +
x
u
(4)
k
0
+
j
jk
k
j
=1
Z wird dabei als aggregierte Einflussstärke bezeichnet, von welcher die Eintrittswahrschein-
lichkeit abgeleitet wird. Diese Funktion ist noch immer linear. Um nun Werte zwischen 0 und
1 zu erreichen, wird auf die logistische Funktion als Wahrscheinlichkeitsfunktion zurückge-
griffen (vgl. Backhaus, S. 423):
1
p
=
(5)
-
z
1 +
e
Unter Einsetzen des jeweiligen Z-Wertes erhält man sodann die logistische Regressionsglei-
chung (vgl. Backhaus, S. 423):
1
p
(
y
= )
1 =
(6)
k
-
zk
1 +
e
J
z
= +
x
u
(4)
k
0
+
j
jk
k
j
=1
Die Z-Werte bezeichnet man auch als Logits (vgl. Backhaus, S. 423). Daraus lassen sich nun
die Wahrscheinlichkeiten für das Bestehen der Prüfung in Abhängigkeit des Lernaufwandes
in Stunden (vgl. obiges Beispiel) berechnen und in folgender Abb. 2. darstellen.
5
Kommentare
Bisher keine Kommentare
Andere Nutzer haben sich auch für folgende Titel interessiert:
Trends bei und Standortanalyse für Seniorenimmobilien
Autor: Stefan EberhardtWirtschaft - Sonstiges, 2007 Als PDF-Datei downloaden für 7,99 EUR
Quantitative und qualitative Prognosemethoden in der Übersicht
Autor: Tanja KrauseWirtschaft - Unternehmensführung, Management, Organisation, 2003 Als PDF-Datei downloaden für 9,99 EUR
Dokumentenmanagementsysteme - Optimierung von Dokumenten und Workflows
Autor: Arne LinnemüllerInformatik - Internet, neue Technologien, 2005 Als PDF-Datei downloaden für 8,99 EUR
Methoden zur Analyse von Marktpotenzialen und Planung von Marktanteilen
Autor: Dirk GöllerWirtschaftsingenieurwesen, 2007 Als PDF-Datei downloaden für 5,99 EUR
Dokumentenmanagementsysteme - Das papierarme Büro
Autor: Mario NeumannInformatik - Angewandte Informatik, 2004 Als PDF-Datei downloaden für 9,99 EUR
Neuronale Netze für Clustern und Vorhersage - Methodenvergleich und Tools
Autor: Dr. Thomas ZabelInformatik - Wirtschaftsinformatik, 2001 Als PDF-Datei downloaden für 29,90 EUR
Regressionsanalyse zur Optimierung von künstlichen neuronalen Netzen bei der DAX-Prognose
Autor: B. Sc. Philipp von der BornInformatik - Wirtschaftsinformatik, 2007 Als PDF-Datei downloaden für 29,90 EUR
Verfahren der kurz- und mittelfristigen Wirtschaftsprognose: Ein Überblick
Autor: Dipl. Betriebswirt (FH) Sebastian MaaßWirtschaft - Volkswirtschaftslehre, 2006 Als PDF-Datei downloaden für 8,99 EUR
Dieser Text kann über folgende URL aufgerufen und zitiert werden: