Inhaltsverzeichnis
1 Einleitung 1
2 Das Problem ausgelassener Variablen:
Der Omitted Variable Bias 1
3 Proxy-Variablen 4
3.1 Proxy-Variablen f ur ausgelassene Variablen -
Die Plug-In Solution 5
3.2 Lagged-Dependent Variablen als Proxy-Variablen 8
4 Schluss 10
A Allgemeines 11
A.1 Die klassischen Annahmen des linearen Modells 11
A.2 Der asymptotische Omitted Variable Bias 12
B Tabellen 13
B.1 Tabelle 1: Richtung des Bias 13
B.2 Tabelle 2: Earnings-Function 13
B.3 Tabelle 3: City Crime Rates 14
C Stata-Log-Files 15
C.1 Beispiel 1: Earnings-Function 15
C.2 Beispiel 2: City Crime Rates 19
i
1 Einleitung
1 Der Versuch, ¨ okonomische Theorien mit empirischen Erkenntnissen zu konfrontieren, scheitert oftmals an der mangelnden Verf¨ ugbarkeit entsprechender Daten bzw. der ” Nicht-Erfassbarkeit“ gewisser Konzepte. 2 Auch ist die Versuchung groß, solche Variablen aus der Sch¨ atzung ¨ okonometrischer Modelle auszuschließen, insbesondere, wenn eine Vielzahl an anderen erkl¨ arenden Variablen im Modell enthalten und der vermutete Einfluss der latenten Gr¨ oße gering ist. Jedoch wird diese Arbeit zeigen, dass ein solches Vorgehen unter bestimmten Bedingungen dazu f¨ uhrt, dass die erhaltenen Parametersch¨ atzer verzerrt und inkonsistent sind. In Kapitel 3 wird anschließend auf zwei M¨ oglichkeiten eingegangen, wie mit Hilfe von Proxy Variablen der ” Omitted Variable Bias“ ausgeschlossen oder zumindest verkleinert werden kann.
2 Das Problem ausgelassener Variablen:
Der Omitted Variable Bias
In der Grundgesamtheit bestehe der folgende Zusammenhang (1) zwischen einer abh¨ angigen Variable y und x 1 , . . . , x k , q erkl¨ arenden Variablen. Der St¨ orterm u trage allen sonstigen Einflussgr¨ ossen auf y Rechnung. Die gesch¨ atzte OLS Gleichung ist in (2) dargestellt.
Es wird angenommen, dass das Modell die klassischen Annahmen, insbesondere MLR.1 bis MLR.4, erf¨ ullt. Folglich gilt E(v|x j , q) = 0 sowie Cov(x j , q; v) = 0 mit j = 1, . . . , k; die OLS Parametersch¨ atzer sind BLUE.
Im Folgenden wird davon ausgegangen, dass die im Modell enthaltene Variable q latent ist. 1 Das Vorgehen dieser Arbeit orientiert sich an Wooldridge(2009), Kapitel 9
2 vgl. Krasker, Pratt(1986)
1
Somit wird statt (1) der nachfolgende, unterspezifizierte, Zusammenhang betrachtet.
Ist die ausgelassene Variable q mit mindestens einem der x j korreliert, liegt im betrachteten Modell Endogenit¨ at vor; die OLS Sch¨ atzer sind nicht nur verzerrt, sondern auch
inkonsistent. Im Folgenden wird die Eigenschaft der Erwartungstreue 3 n¨ aher betrachtet und aufbauend auf einem Vergleich der Parametersch¨ atzer des vollst¨ andigen mit denen des
unterspezifizierten Modells ( ˆ β j und ˜ β j ) eine Formel des Omitted Variable Bias hergeleitet.
Erwartungstreue
Unter MLR.1 bis MLR.4 ist die OLS Sch¨ atzung erwartungstreu.
E( ˆ β j ) = β j ∀ β j mit j = 1, . . . , n
Jedoch ist in (3) die Annahme der strikten Exogenit¨ at verletzt, und die Parametersch¨ atzung somit verzerrt und inkonsistent. Um Aufschluss ¨ uber Art und Gr¨ oße der Verzerrung zu
erhalten, ist es sinnvoll auf den Zusammenhang zwischen ˜ β j und ˆ β j einzugehen.
˜ β j = ˆ γ ˜ β j + ˆ δ j mit j = 1, . . . , k (5)
Hierbei entspricht ˜ δ j mit j = 0, 1, . . . , k dem Parametersch¨ atzer einer Regression von q auf x j mit j = 1, . . . , k und ˆ γ dem gesch¨ atzten partiellen Zusammenhang zwischen q und
y einer Regression von y auf x 1 , . . . , x k , q. Dies zeigt dass ˜ β j ˆ β j zuz¨ uglich dem partiellen
y (ˆ γ) multipliziert mit der partiellen Beziehung zwischen q und x j ( ˜ Effekt von q auf ˆ δ j )
entspricht. Folglich gilt f¨ ur die Verzerrung in ˜ β j oder den Omitted Variable Bias:
Bias( ˜ β j ) = E( ˜ β j |X) − β j = E( ˆ β j |X) + E(ˆ γ|X) ˜ δ j − β j = γ ˜ δ j (6)
Beziehungsweise f¨ ur eine bestimmte Variable x k :
Bias( ˜ β k ) = γ ˜ δ k = γ[Cov(x k , q)/V ar(x k )] (7)
3 Eine Herleitung der Formel des asymptotischen Bias findet sich in Kapitel A.2 des Anhangs
2
(7) verdeutlicht, dass der Parametersch¨ atzer des unterspezifizierten Modells genau dann dem des vollst¨ andigen Modells entspricht, wenn q mit keinem der x j korreliert ist und/oder
q keinen partiellen Effekt auf y hat. Die Gr¨ oße des Bias bestimmt sich durch γ und ˜ δ k .
Folglich kann die Verzerrung in ˜ β k klein sein, sofern γ, also der partielle Einfluss von q auf
y, klein, die Korrelation zwischen x k und der ausgelassenen Variable q gering, und/oder die Streuung der x k groß ist.
uber die Richtung der Verzerrung in β k . 4 Es zeigt sich, dass in Tabelle 1 gibt Aufschluss ¨
β k ein upward-bias vorliegt, wenn sowohl die Korrelation zwischen x k und q als auch der partielle Einfluss von q auf y positiv ist. Die ¨ ubrigen Konstellationen k¨ onnen Tabelle 1 des Anhangs entnommen werden.
Das theoretische Vorgehen soll nun an einem Beispiel verdeutlicht werden. Gesch¨ atzt wird
eine Lohnfunktion (earnings-function) mit Erfahrung (exper), Erfahrung 2 (exper 2 ), Ausbildung (educ) und F¨ ahigkeit (ability) als erkl¨ arenden Variablen. Die Variablen Erfahrung und Ausbildung lassen sich relativ einfach ¨ uber die Anzahl an Jahren erfassen, welche ein Merkmalstr¨ ager in Beruf und Ausbildungsst¨ atten verbracht hat. Die Einflussgr¨ oße F¨ ahigkeit jedoch ist nicht direkt beobachtbar, so dass folgendes unterspezifiziertes Modell betrachtet werden muss:
log(wage) = β 0 + β 1 exper + β 2 exper 2 + β 3 educ + u
Es wird angenommen, dass abil mit exper, exper 2 unkorreliert ist, nachdem f¨ ur den Einfluss von educ kontrolliert wurde. Gem¨ aß (5) besteht zwischen beiden Modellen ein Zusammen-
hang der Form: ˜ β 3 = ˆ γ ˆ δ 3 . Der Bias in ˜ β 3 + ˆ β 3 aufgrund der Nichterfassung von abil betr¨ agt somit:
Bias( ˜ β 3 ) = γ ˜ δ 3 = γ[Cov(educ, abil)/V ar(educ)] uber dessen Richtung treffen zu k¨ onnen, muss γ ˜ Um Aussagen ¨ δ 3 ¨ okonomisch interpretiert
werden. Es kann angenommen werden, dass sowohl der Einfluss von abil auf den Logarith-mus des Lohnes als auch ˜ δ 3 positiv sind, und somit in β 3 ein upward bias vorliegt.
4 s. Anhang S.13
3
3 Proxy-Variablen
Im vorangegangen Kapitel wurde ausf¨ uhrlich auf die Verzerrung eingegangen, welche sich
f¨ ur die Parametersch¨ atzer ˆ β j ergibt wenn eine Schl¨ usselvariable q des Grundgesamtheitsmodells unbeobachtbar und mit den betrachteten x j korreliert ist. Mit dem Problem des
Omitted Variable Bias kann auf verschiedene Arten umgegangen werden: 5
• Das Problem der Endogenit¨ at wird ignoriert und seine Konsequenzen in Form verzerrter und inkonsistenter Sch¨ atzer werden in Kauf genommen.
• Verwendung der ” fixed effects“ oder ” first-differencing“ Methoden (unter der Annahme, dass q ¨ uber die Zeit konstant ist).
• Einsatz einer oder mehrerer Instrument Variablen f¨ ur diejenigen x k , welche mit q -und somit dem St¨ orterm - korreliert sind.
• Verwendung einer oder mehrerer Proxy Variablen f¨ ur die latente Variable.
Wie der Titel der Arbeit vermuten l¨ asst, wird sich dieses Kapitel mit der zuletzt genannten Vorgehensweise befassen. Im Folgenden werden zwei Ans¨ atze vorgestellt, welche zeigen sollen wie mit Hilfe von Proxy Variablen der Omitted Variable Bias eliminiert oder zumindest verkleinert werden kann. Eine Proxy Variable wird hierbei als ” an observed variable that is related but not identical
to an unobserved explanatory variable in multiple regression analysis“ 6 verstanden. Anders als bei der Instrument Methode wird somit nicht bei der beobachtbaren Variable angesetzt, welche mit q korreliert ist, sondern es wird versucht, eine ” Ersatzvariable“ f¨ ur die latente
Gr¨ oße zu finden, um in der Regression f¨ ur diese kontrollieren zu k¨ onnen.
5 vgl. Wooldridge(2009), S.507
6 Wooldridge(2009), S.844
4
3.1 Proxy-Variablen f¨ ur ausgelassene Variablen -Die Plug-In Solution
In der Grundgesamtheit bestehe der bekannte Zusammenhang zwischen einer abh¨ angigen Variable y und x j , q mit j = 1, . . . , k erkl¨ arenden Variablen.
y = β 0 + β 1 x 1 + . . . + β k x k + γ q + u (8)
Die Gr¨ oße q sei unbeobachtbar und mit x 1 korreliert. W¨ urde nun ein unterspezifiziertes
Modell wie in (3) betrachtet, w¨ are der Parametersch¨ atzer ˆ β 1 verzerrt und inkonsistent.
Um dennoch f¨ ur den Einfluss von q kontrollieren, und so den Omitted Variable Bias zumindest verringern zu k¨ onnen, wird eine Variable ben¨ otigt, welche mit q korreliert ist und somit als Proxy Variable z anstelle dieser verwendet werden kann. Zwischen Proxy Variable und unbeobachtbarer Variable muss folglich ein Zusammenhang der Form
q = δ 0 + δ 1 z + r mit δ 1 = 0. (9)
bestehen. Eine g¨ angige Annahme stellt δ 1 > 0 dar.
Bevor die Parameter gesch¨ atzt werden, wird q in der Ausgangsgleichung (8) durch z ersetzt. Damit diese ” Plug-In“ L¨ osung konsistente Sch¨ atzer f¨ ur β 1 und β 2 liefert, m¨ ussen insbesondere zwei Annahmen erf¨ ullt sein:
1. Redundanz
Nachdem f¨ ur den Einfluß von x und q kontrolliert wurde, ist z irrelevant um y zu erkl¨ aren: E(y|x, q, z) = E(y|x, q)
2. Cov(x j , r) = 0 mit j = 1, . . . , k
Nachdem f¨ ur z kontrolliert wurde, besteht keinerlei Korrelation zwischen q und x: q = δ 0 + δ 1 z + r mit E(r) = 0, Cov(z, r) = 0 und δ 1 > 0
Aus Gleichung (8) und (9) folgt f¨ ur die reduzierte Form 7 :
y = α 0 + β 1 x 1 + . . . + β k x k + α 1 z + e (10)
7 vgl. Greene(2002)
5
mit α 0 = β 0 + γδ 0 als neuem Achsenabschnitt, α 1 = γδ 1 als neuem Steigungsparameter f¨ ur z und e = γ r + v als neuem St¨ orterm.
(10) liefert keine unverzerrten oder konsistenten Sch¨ atzer f¨ ur β 0 und γ, sondern stattdessen f¨ ur α 0 , α 1 und β j mit j = 1, . . . , k. Krasker und Pratt (1986) f¨ uhren an, dass ” though the
coefficients in the proxy regression will not coincide with those in the regression of the dependent variable on the ” true“ explanatory variables, it is clear by continuity that the differences will be small if each proxy is sufficiently highly correlated with the unobser-
ved true variable for which it substitutes [...].“ 8 Des Weiteren machen die Autoren darauf aufmerksam, dass die Vorzeichen der Parametersch¨ atzer des Modells, welches die Proxy Variable beinhaltet, selbst in großen Stichproben nicht zwangsl¨ aufig mit denen des ” wahren“ Modells ¨ ubereinstimmen m¨ ussen. Um Aufschluss ¨ uber die Bedingungen zu erhalten,
unter denen die Vorzeichen der Parametersch¨ atzer sich ¨ andern, entwickelten sie eine For-
mel f¨ ur dasjenige r ∗ , welches die kleinste Zahl darstellt, welche die Korrelation zwischen der unbeobachtbaren Variable q und dessen Proxy ¨ ubersteigen muss, damit die Vorzeichen
unver¨ andert bleiben, wenn q durch z ersetzt wird. F¨ ur den Fall, dass die unbeobachtbare
Gr¨ oße eine unabh¨ angige Variable ist, kommen sie zu dem Ergebnis dass f¨ ur r ∗ gilt:
max r 2 = R 2 + 1 − R 2 mit j = 1, . . . , k. (11) z,x j z,y,x j
(mit R 2 als Anteil der Varianz der Proxy Variable, der durch die x j mit j = 1, . . . , k.und x 1 ,y,x 2
y erkl¨ art wird). Zwar kann in der Praxis nicht ¨ uberpr¨ uft werden, ob die Korrelation zwi-
schen den betrachteten Variablen tats¨ achlich diese H¨ ohe erreicht, jedoch gibt sie Aufschluss uber die Qualit¨ at, welche die Proxy Variable erreichen muss, um zumindest die Richtung ¨
des Einflusses auf y korrekt wiederzugeben.
Als Abschluss dieses Kapitels soll eine Lohnfunktion mit log(wage) als abh¨ angiger sowie
educ, exper, exper 2 und abil als erkl¨ arenden Variablen gesch¨ atzt werden.
lwage = β 0 + β 1 educ + β 2 exper + β 3 exper 2 + γ abil + u
8 Krasker, Pratt (1986), S.641
6
Der verwendete Datensatz (WAGE.RAW von Blackburn und Neumark (1992)) liefert die ben¨ otigten Informationen ¨ uber monatliche Eink¨ unfte, Ausbildung und verschiedene demo-
graphische Faktoren f¨ ur 935 M¨ anner f¨ ur das Jahr 1980. Des Weiteren sind die Gr¨ oß en IQ und KW W (Knowledge of the World of Work) enthalten, welche als Proxy Variable z f¨ ur die latente Einflussgr¨ oße abil verwendet werden k¨ onnen.
Dem Vorgehen von Krasker und Pratt (1986) folgend, muss die Korrelation zwischen ability und IQ sowie ability und KW W einen Wert von 0.48674 und 0.48799 respektive ¨ ubersteigen, damit die Vorzeichen der betroffenen Paramtersch¨ atzer mit denen des wahren“ Modells ¨ ubereinstimmen. ”
Im Folgenden werden vier Modelle (I, II, III, IV) gesch¨ atzt. I bezeichnet die Sch¨ atzung eines unterspezifizierten Modells, welches die Variable abil ausl¨ asst. II und III stehen jeweils f¨ ur eine Regression, welche IQ bzw. KW W als Proxy Variable f¨ ur die latente Gr¨ oß e verwendet. In IV nehmen sowohl IQ als auch KW W die Rolle von z ein. Tabelle 2 zeigt die Werte der unabh¨ angigen Variablen und deren Standartabweichung f¨ ur
die verschiedenen Modelle. 9 Es zeigt sich, dass der partielle Einfluss von Ausbildung auf den Lohn von ca. 7.8% im unterspezifizierten Modell auf bis zu 4.8% abnimmt, wenn sowohl IQ als auch KW W als Proxy Variablen aufgenommen werden. Der Einfluss von educ auf lwage in II ist statistisch nicht signifikant von III verschieden; der Einsatz von KWW als Proxy Variable anstelle von IQ bringt keine neuen Erkenntnisse bzgl. des Einflusses von educ auf y. Jedoch zeigt sich ein signifikanter Unterschied zwischen den Sch¨ atzwerten f¨ ur educ zwischen I und II bzw. I und III. Der Einfluss von IQ und KWW ist statistisch signifikant, wenn auch eher gering: ein Anstieg in IQ um eins f¨ uhrt zu einem Ansteig des Lohnes um ca. 0.6% bzw. 0.5%, ein Anstieg in KW W um eins zu einem Anstieg um 1%
bzw. 0.8%. Auch das ¯ R 2 steigt von anf¨ anglichen 12.8% auf ca. 17.8%. In Modell IV werden somit ca. 17.8% der Varianz in y durch die unabh¨ angigen Variablen erkl¨ art.
9 s. Anhang S.13
7
Bevor in Kapitel 2.2 eine weitere M¨ oglichkeit, wie f¨ ur den Einfluss von unbeobachtbaren Gr¨ oßen kontrolliert werden kann, vorgestellt wird, soll zuvor noch auf eine Entscheidungsproblematik bez¨ uglich der Verwendung von Proxy Variablen eingegangen werden. Trenkler und Stahlecker (1996) merken an, dass ” frequently one or more of the variables in a linear
regression model are unobservable, but proxies for them are at hand“ 10 ; dies stellt einen vor die Frage ob bzw. wann die Sch¨ atzung eines unterspezifizierten Modells der Verwendung von Proxy Variablen vorgezogen werden sollte. Das Kriterium der asymptotischen Verzerrung w¨ ahlend, kommen McCallum und Wickens (1972) zu dem Schluss, dass selbst die Verwendung eines schlechten Proxys immer dem Ausschluss einer Variable aus dem zu sch¨ atzenden Modell vorzuziehen ist. Trenkler und Stahlecker (1992) betrachten dieses Problem unter dem Kriterium der MSE-Matrix und stellen eine Reihe an F¨ allen vor, in welchen der Ausschluss einer Variable dem Einsatz von Proxy Variablen vorzuziehen ist. In ihrer Arbeit von 1993 stellen sie in Anlehnung an Ohtani (1981) den ” weighted average
predictor“ als Kompromiss zwischen den zwei eben vorgestellten M¨ oglichkeiten vor und diskutieren die Bedingungen, unter welchen einer der beiden Extremf¨ alle bzw. die Verwendung des ” weighted average predictor“ vorteilhafter f¨ ur die Qualit¨ at der Parametersch¨ atzer ist. Festzuhalten bleibt, dass auch die Verwendung von Proxy Variablen zu verzerrten und inkonsistenten Parametersch¨ atzern f¨ uhren kann.
3.2 Lagged-Dependent Variablen als Proxy-Variablen
In Kapitel 3.1 wurde angenommen, dass eine oder mehrere unabh¨ angige Variablen mit einer latenten Einflussgr¨ oße korreliert sind. Da diese Gr¨ oße zumindest ihrer Art nach bekannt war, konnte explizit nach einer Proxy Variable f¨ ur die ausgelassene Variable gesucht werden. Jedoch ist nicht immer offensichtlich, um welche Gr¨ oßen es sich bei den unbeobachtbaren Variablen handelt. In diesen F¨ allen ist es folglich nicht m¨ oglich, dem Vorgehen des vorangegangenen Kapitels zu folgen. Stattdessen wird als Kontrollwert der Wert der
10 Trenkler, Stahlecker(1996), S.65
8
abh¨ angigen Variable aus einer vergangenen Periode in das Modell aufgenommen. Auf diesem Weg kann latenten Faktoren, welche in der aktuellen Periode einen Einfluss auf y haben und mit x j mit j = 1, . . . , k korreliert sind, Rechnung getragen werden. Es wird angenommen, dass der Grundgesamtheitszusammenhang ¨ uber folgendes Modell erfasst werden kann: y = β 0 + β 1 x 1 + . . . + β k x k + u (12)
mit y als abh¨ angiger und x j mit j = 1, . . . , k erkl¨ arenden Variablen. Des Weiteren wird vermutet, dass x 1 mit einer oder mehreren ausgelassenen Einflussgr¨ oßen korreliert ist. Um dem
Einfluss dieser Faktoren Rechnung zu tragen, wird der Wert von y in t − 1 als unabh¨ angige Variable in Gleichung (12) mit aufgenommen.
y t = β 0 + β 1 x 1,t + . . . + β k x k,t + y t−1 + u (13)
Ein Fall, in welchem sich die eben erl¨ auterte Vorgehensweise anbietet, ist die Sch¨ atzung einer Funktion, welche versucht die Verbrechensrate in St¨ adten ( ” City Crime Rates“) zu erkl¨ aren.
lcrmrte = β 0 + β 1 unem + β 2 llawexpc + β 3 loffic + β 4 lpcinc + u
Wie das obige Modell verdeutlicht, soll untersucht werden welchen Einfluss die Rate der Arbeitslosigkeit (unem) sowie der Logarithmus der Ausgaben f¨ ur Strafverfolgung (llawexpc), der Anzahl an Polizisten(loffic) und des Pro-Kopf-Einkommens(lpcinc) auf den Logarithmus der Verbrechensrate (lcrmrte) in 46 St¨ adten, im Jahr 1987 haben. Jedoch ist es wahrscheinlich, dass auch andere, unbeobachtbare Faktoren einen Einfluss auf lcrmrte haben. Sind diese mit zumindest einer der unabh¨ angigen Gr¨ oßen des Modells korreliert, liefert eine OLS-Sch¨ atzung verzerrte und inkonsistente Parametersch¨ atzer. Um dennoch f¨ ur diese Gr¨ oßen kontrollieren zu k¨ onnen, wird die Verbrechensrate des Jahres 1982 (lcrmrt 1 ) als erkl¨ arende Variable in das Modell mit aufgenommen. Da angenommen werden kann, dass
hohe Verbrechensraten in t − 1 einen positiven Einfluss auf die Ausgaben f¨ ur Strafverfolgung sowie die Anzahl an Polizisten haben, ist lcrmrt 1 sowohl mit llawexp als auch loffic positiv korreliert. Tabelle des Anhangs gibt Aufschluss ¨ uber die gesch¨ atzten Werte
9
einer Regression eines unterspezifizierten Modells (I) sowie ¨ uber die eines Modells, welches lcrmrt 1 als ” lagged-dependent Variable“ enth¨ alt. Es zeigt sich, dass die Aufnahme von lcrmrt 1 die Sch¨ atzung erheblich verbessert; statt 8,86% werden nunmehr fast 70% der Streuung in lcrmrte durch das Modell erkl¨ art. Bei zwei Variablen (unem und llawexp) ¨ andert sich in (II) die Richtung ihres Einflusses auf lcrmrt. Dieser ist nun ¨ okonomisch sinnvoll erkl¨ arbar; ein Anstieg der Arbeitslosenrate um eins, f¨ uhrt in (II) zu einem Anstieg der Verbrechensrate um ca. 1,2% - ein Anstieg der Ausgaben f¨ ur Strafverfolgung um 1% resultiert in einem R¨ uckgang der Verbrechensrate von ca. 15%. Jedoch muss auch angemerkt werden, dass in beiden Sch¨ atzungen keine der unabh¨ angigen Variablen statistisch signifikant von Null verschieden ist.
4 Schluss
In dieser Arbeit wurde zun¨ achst eine Formel f¨ ur den ” Omitted Variable Bias“ hergeleitet
und gezeigt, dass seine Gr¨ oße und Richtung sowohl von dem partiellen Einfluss der ausgelassenen auf die abh¨ angige Variable als auch von der partiellen Beziehung der ausgelassenen zu den unabh¨ angigen Variablen abh¨ angt. Im Weiteren Verlauf wurden zwei M¨ oglichkeiten vorgestellt wie mit Hilfe von Proxy Variablen diese Verzerrung eliminiert bzw. zumindest verkleinert werden kann.
In conclusion we can say that proxy variables can be, and undoubteldly habe been used to ”
reduce the specification bias that arises when data are not available for one or more of the variables. However proxy variables should not be used indiscriminately. there are definite
risks involved.“ 11
11 Frost(1979), S.324
10
A Allgemeines
A.1 Die klassischen Annahmen des linearen Modells
12 Annahme MLR.1 (Linearit¨ at in den Parametern)
In der Grundgesamtheit bestehe der folgende Zusammenhang:
y = β 0 + β 1 x 1 + β 2 x 2 + ... + β k x k + u
Hierbei stellen die β j mit j = 1, . . . , k die unbekannten Grundgesamtheitsparameter dar. u repr¨ asentiert den Zufallsfehler oder St¨ orterm. Annahme MLR.2 (Zufallsstichprobe)
Die Daten liegen in Form einer Zufallsstichprobe vom Umfang n Beobachtungen, (x i1 , x i2 , ..., x ik , y i ) : i = 1, ..., n vor. Annahme MLR.3 (Keine perfekte Kolinearit¨ at)
In der Stichprobe (und somit auch in der Grundgesamtheit) ist keine der unabh¨ angigen Variablen konstant. Des Weiteren gibt es keinen exakt linearen Zusammenhang zwischen den erkl¨ arenden Variablen. Annahme MLR.4 (zero conditional mean) Der St¨ orterm u hat einen bedingten Erwartungswert von Null.
E(u|x j ) = 0 mit j = 1, . . . , k
Annahme MLR.5 (Homoskedastizit¨ at)
Die bedingte Varianz des St¨ orterms u ist konstant.
V ar(u|x j ) = σ 2 mit j = 1, . . . , k
Annahme MLR.6 (Normalverteilung)
Der St¨ orterm u der Grundgesamtheit ist unabh¨ angig von den x j mit j = 1, . . . , k er-
kl¨ arenden Variablen und normalverteilt mit Erwartungswert Null und Varianz σ 2 .
u ∼ Normal(0, σ 2 )
12 vgl. Wooldridge(2009)
11
A.2 Der asymptotische Omitted Variable Bias
13 Inkonsistenz
Ist die OLS Sch¨ atzung inkonsistent, bedeutet dies, dass ” the estimator soes not converge
(in probability) to the correct population parameter as the sample size grows“. 14 Um Aufschluss ¨ uber den asymptotischen Bias zu erhalten, wird im Folgenden der plim der OLS Sch¨ atzer des unterspezifizierten Modells, also derjenige Wert, dem sich der Sch¨ atzer
f¨ ur n → ∞ ann¨ ahert, gesucht. Anschliessend soll dieser Wert mit demjenigen verglichen werden, welcher sich im vollst¨ andigen Modell ergibt, um eine Formel f¨ ur den asymptotischen Omitted Variable Bias abzuleiten. Aus
q = δ 0 + δ 1 x 1 + . . . + δ k x k + r
mit E(r) = 0 und Cov(x j , r) = 0 mit j = 1, . . . , k und (1) folgt
y = (β 0 + γδ 0 ) + (β 1 + γδ 1 )x 1 + . . . + (β k + γδ k )x k + v + γ r
mit E(v + γ r) = 0 und Cov(x j , (v + γ r)) = 0 mit j = 1, . . . , k.
Folglich gilt:
plim ˜ β j = β j + γδ j
beziehungsweise f¨ ur die Variable x k :
plim ˜ β k = β k + γ[Cov(x k , q)/V ar(x k )]
13 vgl. Wooldridge(2002)
14 Wooldridge(2009), S.840
12
B Tabellen
B.1 Tabelle 1: Richtung des Bias
Tabelle 1 - eigene Darstellung in Anlehnung an Wooldridge (2009)
B.2 Tabelle 2: Earnings-Function
Tabelle 2 - eigene Darstellung in Anlehnung an Wooldridge (2009)
13
C Stata-Log-Files
C.1 Beispiel 1: Earnings-Function
1 .
2 . use WAGE2.DTA, clear
3 . describe
4 . generate expersq = exper^2
C.2 Beispiel 2: City Crime Rates
3 . describe
6 . ****************************OLS-Schätzungen*********************************
19
Literatur
[1] Adkins and Hill(2008) - Using stata for principles of econometrics, John Wiley & Sons, Inc., 2008.
[2] Alesina et al.(1996) - Political instability and economic growth, Journal of Economic Growth 1, S. 189-211.
[3] Fair(1992) - Estimates of the bias of lagged dependent variable coefficient estimates in macroeconomic equations, Tech. report, Cowles Foundation.
[4] Frost(1979) - Proxy variables and specification bias, The Review of Economics and Statistics 61(2), S. 323-325.
[5] Greene(2002) - Econometric analysis, 5th ed., Prentice Hall.
[6] Griliches(1977) - Estimating the returns to schooling: Some econometric problems, Econometrica 45(1), S. 1-22.
[7] Hanushek et al.(2003) - Does peer ability affect student achievement, Journal of Applied Econometrics 18(5), S. 527-544.
[8] Kohler and Kreuter(2008) - Datenanalyse mit stata, Oldenbourg.
[9] Krasker and Pratt(1986) - Bounding the effects of proxy variables on regression coefficient, Econometrica 54(3), S. 641-655.
[10] Nair-Reichert and Weinhold(2000) - Causality tests for cross-country panels: New look at fdi and economic growth in developing countries, Tech. report, London School of Economics, Georgia Institute of Technology.
[11] Stahlecker and Trenkler(1993) - Some further results on the use of proxy variables in prediction, The Review of Economics and Statistics 75(4), S. 707-711.
[12] Stahlecker and Trenkler(1996) - Dropping variables versus use of proxy variables in linear regression, Journal of Statistical Planning and Inference 50, S. 65-75.
21
[13] Wickens(1972) - A note on the use of proxy variables, Econometrica 40(4) ,S. 759-761.
[14] Wooldridge(2002) - Econometric analysis of cross section and panal data, Massachusetts Institute of Technology.
[15] Wooldridge(2002) - Solutions manual and supplementary materials for econometric analysis of cross section and panal data, Massachusetts Institute of Technology.
[16] Wooldridge(2009) - Introductory econometrics, South-Western.
22
Arbeit zitieren:
Eva-Maria Scholz, 2010, Ausgelassene Variablen und Proxy-Variablen, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
BWL - Sonstiges: neuer Titel erschienen: Ausgelassene Variablen und Proxy-Variablen
Eva-Maria Scholz hat einen neuen Text hochgeladen
Lernzirkel: Gleichungen 1. Grades mit einer Variablen
Hans J. Schmidt, Marlis Marre, B. Rainjogger
Variablenverständnis und Variablen verstehen
Empirische Untersuchungen zum ...
Birte Julia Specht
Vertrauen als Input-/Output-Variable in elektronischen Verhandlungen
Eine empirische Untersuchung v...
Katrin Stiglbauer
0 Kommentare