Spurious Regression


Hausarbeit (Hauptseminar), 2005
26 Seiten, Note: 1,7

Leseprobe

Inhaltsverzeichnis

1 Einleitung

2 Spurious Correlation / Spurious Regression

3 Spurious Regression in der Zeitreihenanalyse
3.1 Spurious Regression in Zeitreihen mit deterministischem Trend
3.2 Spurious Regression in Zeitreihen mit stochastischem Trend
3.2.1 Forschungen zu Spurious Regression: Monte Carlo Simulation vs. analytische Untersuchungen
3.2.1.1 Die t-Statistik
3.2.1.2 Das Bestimmtheitsmaß
3.2.1.3 Die Durbin-Watson Statistik
3.2.2 Spurious Regression in Zeitreihen mit verschiedenem Integrationsgrad

4 Vermeidung von Spurious Regression
4.1 Differenzenbildung
4.1.1 Definition und Beschreibung des Konzepts
4.1.2 Dickey-Fuller-Test und Augmented Dickey-Fuller-Test
4.1.2.1 Dickey-Fuller-Test
4.1.2.2 Augmented Dickey-Fuller-Test
4.2 Kointegration
4.2.1 Definition und Beschreibung des Konzepts
4.2.2 Test auf Kointegration: Engle-Granger Verfahren
4.2.3 Test auf Kointegration: Verfahren von Johansen

5 Zusammenfassung

Literaturverzeichnis

1 Einleitung

„Die überwiegende Zahl ökonomischer Daten, die im Zeitablauf anfallen, ist anerkanntermaßen instationär, und zwar trendbehaftet.“[1] Weiterhin setzte sich in den achtziger Jahren des 20. Jahrhunderts die Erkenntnis durch, dass viele ökonomische Zeitreihen einem stochastischen Trend folgen.[2] Daraus ergibt sich bei der Untersuchung unabhängiger, instationärer Zeitreihen das Problem, dass oft Scheinregressionen (Spurious Regression) geschätzt werden, da die Variablen von nichtstationären Zeitreihen einen durch den Trend vorgegebenen, ähnlichen Verlauf haben. Dieser Zusammenhang ist in der Realität jedoch nicht nachweisbar.

Spurious Regression wurde bereits 1926 von G. U. Yule in seiner Abhandlung ‚ Why Do We Sometimes Get Nonsense Correlations between Time-series? ’ beschrieben und später von Granger und Newbold in ihrer Arbeit ‚ Spurious Regressions in Econometrics’ wieder aufgegriffen.

Im Rahmen dieser Arbeit wird das Auftreten von Spurious Regression in der Zeitreihenanalyse behandelt. Im zweiten Kapitel werden relevante Begriffe erklärt. Kapitel drei beschäftigt sich mit dem Auftreten von Spurious Regression in Zeitreihen mit deterministischem und stochastischem Trend, wobei der Fall des stochastischen Trends der bedeutsamere und ausführlicher behandelte ist. Hier wird ein Einblick in die Erforschung des Spurious Regression Problems gegeben. Des Weiteren werden die Folgen von Spurious Regression für die Maßzahlen der Regression dargestellt. Das vierte Kapitel der Arbeit beinhaltet Verfahren zur Vermeidung von Spurious Regression. Es werden zwei Verfahren mit ihren Vor- und Nachteilen vorgestellt und Testverfahren zu deren Anwendung erläutert.

Abschließend wird im fünften Kapitel eine Zusammenfassung dargeboten.

2 Spurious Correlation / Spurious Regression

Ein aufgestelltes Regressionsmodell Y = α + βX + u impliziert, dass Y durch X erklärt werden kann. Wenn X einen hohen Erklärungsgehalt hat, weist der Korrelationskoeffizient rxy Werte nahe ±1 auf. Die Regressionsbeziehung wird über eine hohe Güte verfügen, also einen hohen Wert für das Bestimmtheitsmaß (R2=r2xy) besitzen. Dieses gibt an, wie viel der Gesamtvariation der Variable Y durch das Modell erklärt werden kann. Des Weiteren wird in diesem Fall ein t-Test auf Signifikanz des Regressionsparameters β einen Wert ausweisen, der die Ablehnung der Nullhypothese H0: β=0 zur Folge hat.

Bei diesen Ergebnissen kann es sich neben wahren Zusammenhängen auch um scheinbare Zusammenhänge handeln, im letzten Fall spricht man von Scheinkorrelationen, bzw. Spurious Correlation. Bei Spurious Correlation liegt zwar ein stochastischer Zusammenhang vor, eine Kausalität ist jedoch nicht gegeben. Ein bekanntes Beispiel ist ein festgestellter Zusammenhang zwischen der Abnahme der Storchpopulation und der Abnahme der Neugeborenen während eines bestimmten Zeitraumes in einer Region. Dieser beruht allerdings nicht auf einem kausalen Zusammenhang, sondern auf anderen Faktoren, die sowohl die Abnahme von Storchennestern als auch die Abnahme der Geburten bedingen.[3] Werden zwei Variablen, die einem Scheinzusammenhang unterliegen, aufeinander regressiert, erhält man eine Scheinregression (Spurious Regression) mit den aufgeführten Symptomen.[4] Diese können leicht dazu veranlassen, die Regression ohne zusätzliche Prüfung als ‚gutes’ Modell zu betrachten und für Analysen oder Schlussfolgerungen herzunehmen.

Es werden verschiedene Arten von korrelativen Zusammenhängen unterschieden. „Eine Korrelation kann durch direkte kausale Zusammenhänge zwischen X und Y, durch eine gemeinsame Abhängigkeit von dritten Größen oder durch Heterogenität des Materials oder rein formal bedingt sein.“[5] Um richtige Schlussfolgerungen aus einem Modell treffen zu können, muss dieses eine kausale Korrelation aufweisen: Der Datensatz X muss ursächlich mit dem Datensatz Y verbunden sein.

Korrelationen zwischen Zeitreihen werden meist der Gruppe der Gemeinsamkeitskorrelationen zugeordnet.

3 Spurious Regression in der Zeitreihenanalyse

3.1 Spurious Regression in Zeitreihen mit deterministischem Trend

Zwei voneinander unabhängige Zeitreihen [Xt] und [Yt] mit deterministischem Trend, für die folgende datengenerierende Prozesse angenommen werden

Xt = a + bt + ut bzw. Yt = c + dt + vt,

werden nach der Vorschrift

Yt = α + βXt + εt

aufeinander regressiert. Die residualen Komponenten ut und vt sollen unabhängig identisch verteilt[6] sein. Aus der Regression ergibt sich mit hoher Wahrscheinlichkeit ein großes Bestimmtheitsmaß und ein Wert der t-Statistik, der auf Signifikanz des Parameters β schließen lässt. Durch diese Ergebnisse wird dem Betrachter eine Beziehung zwischen [Xt] und [Yt] nahe gelegt, die nicht existiert, da die Prozesse als voneinander vollkommen unabhängig angenommen werden.

Die Begründung liegt darin, dass die Zeit (t) als erklärende Variable in der Gleichung nicht aufgenommen wurde. Die Signifikanz von β wird durch die daraus resultierende Verzerrung verursacht. Die Gleichung ist richtig spezifiziert, wenn die Zeit als Regressor aufgenommen wird:

Yt = α + βXt + γt + εt

Beim Überprüfen der Regression dieser Form weist die t-Statistik keine Signifikanzen für den Parameter β auf, dafür ist der Test für γ hochsignifikant. Das Bestimmtheitsmaß ist nach wie vor hoch. Die Ursache dafür ist, dass im vorher falsch aufgestellten Modell ein Fall von Spurious Regression vorlag und in der korrekten Regression ein wirklicher Zusammenhang zwischen dem Prozess [Yt] und der Zeit (t) besteht.

3.2 Spurious Regression in Zeitreihen mit stochastischem Trend

Zeitreihen mit stochastischem Trend werden auch als integrierte Zeitreihen bezeichnet. Integrierte Zeitreihen der Ordnung d können durch d-malige Differenzenbildung (d є N) zu einem stationären[7] Prozess umgeformt werden. Ein Random Walk Prozess Yt = Yt-1 + ut, mit einem ut, das die White Noise-Eigenschaften[8] erfüllt, ist ein I(1)-Prozess. Seine erste Differenz folgt einem White Noise Prozess und ist stationär: ∆Yt = Yt - Yt-1 = ut.

Als datengenerierender Prozess (DGP) für zwei Random Walk Prozesse ohne Drift wird folgende Vorschrift angenommen:

Yt = Yt-1 + ut, wobei ut ~ IID (0,δ2) (1)

Xt = Xt-1 + vt, wobei vt ~ IID (0,δ2) (2)

Die beiden Prozesse, die voneinander völlig unabhängig sind, werden nun aufeinander regressiert. Die Regressionsgleichung lautet:

Yt = α + βXt + εt (3)

Aufgrund der Unabhängigkeit der beiden Prozesse, würde man bei einer Schätzung des Parameters β einen Wert erwarten, der nicht signifikant von Null verschieden ist. Ebenfalls wird erwartet, dass ein t-Test der Nullhypothese H0: β=0 gegen die Alternativhypothese der Signifikanz (H1: β≠0) einen so geringen Wert aufweist, dass die Nullhypothese nicht abgelehnt werden kann.

Dies ist häufig nicht der Fall. Bei der Schätzung ergibt sich sehr oft ein von Null verschiedener Schätzer für den Steigungsparameter β und beim Signifikanztest erhält man mit großer Wahrscheinlichkeit einen hohen t-Wert, sodass die Nullhypothese abgelehnt werden muss. Weiterhin ist ein hoher Wert für das Bestimmtheitsmaß in der Regression zu beobachten. All dies lässt darauf schließen, dass die beiden Prozesse [Xt] und [Yt] miteinander verbunden sind und ein Zusammenhang zwischen ihnen besteht, der durch die obige Regressionsbeziehung beschrieben wird. Aufgrund der getroffenen Annahme der Unabhängigkeit der Prozesse sind die erhaltenen Ergebnisse nicht mit der Realität vereinbar. Durch die Regressionsbeziehung wird ein Zusammenhang postuliert, der nicht existiert.

Diese Resultate werden als Spurious Regression bezeichnet.

3.2.1 Forschungen zu Spurious Regression: Monte Carlo Simulation vs. analytische Untersuchungen

In ihrer Arbeit ‚ Spurious Regressions in Econometrics ’ (1974) weisen Granger und Newbold mit Nachdruck auf das Phänomen des Spurious Regression hin, da zu damaliger Zeit, trotz der Warnungen in vielen Lehrbüchern, in zu vielen angewandten ökonometrischen Arbeiten Scheinregressionen zu finden waren.[9] Als Extrembeispiel führen sie folgenden Fall an: „… Sheppard (1971) regressed U.K. consumption on autonomous expenditure and mid-year money stock, both for levels and changes for the time period 1947-1962.”[10] Die Ergebnisse der Regression sind in der folgenden Tabelle dargestellt.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle1: Ergebnisse der Regression

Quelle: Granger, C. W. J. / Newbold, P.: Forecasting Economic Time Series, New York, 1977

Es ist zu sehen, dass die Regression der Differenzen aufeinander zu einem gravierend anderen Ergebnis kommt, als die Regression der Niveaudaten. Das korrigierte Bestimmtheitsmaß ist nahe null und der Wert der Durbin-Watson Statistik ist nahe zwei. Der festgestellte Zusammenhang in der Regression der Niveaudaten ist ein Scheinzusammenhang. Zur Verdeutlichung der Auswirkungen von Spurious Regression setzten Granger und Newbold in ihrer Arbeit von 1974 Monte Carlo Simulationen[11] ein. Sie verwendeten zwei unabhängige Random Walk Prozesse, [Xt] und [Yt][12], die nach der Vorschrift: Yt = β0 + β1Xt aufeinander regressiert wurden.

Dieser Vorgang wurde 100 Mal mit jeweils neu generierten Random Walk Prozessen wiederholt.[13]

[...]


[1] Hassler, U.: Zeitabhängige Volatilität und instationäre Zeitreihen in: Wirtschaftsdienst, 2003, S.1.

[2] Vgl. Hassler, U.: Zeitabhängige Volatilität und instationäre Zeitreihen in: Wirtschaftsdienst, 2003, S.1.

[3] Vgl. Sachs, L.: Angewandte Statistik, 2002, S.509.

[4] Vgl. Ramanathan, R.: Introductory Econometrics, 1989, S.123.

[5] Sachs, L.: Angewandte Statistik, 2002, S.509.

[6] IID-Eigenschaft; IID (oder i.i.d.) = idependently and identically distributed.

[7] Hier ist, wie auch im Folgenden schwache Stationarität gemeint. Ein schwach stationärer Prozess ist definiert, als ein Prozess mit über die Zeit hinweg konstanten Erwartungswert und Varianz. Seine Kovarianz darf nur von der Lag-Größe, nicht jedoch von der Zeit abhängen.

[8] White Noise (=Weißes Rauschen) ε ~IID (0,δ2).

[9] Vgl. Granger, C. W. J., Newbold, P.: Spurious Regression in Econometrics in: Journal of Econometrics, 1974, S.111.

[10] Vgl. Granger, C. W. J., Newbold, P.: Spurious Regression in Econometrics in: Journal of Econometrics, 1974, S.118 zitiert nach Sheppard, D.K.: The Growth and role of U.K. financial institutions 1880-1962 in: Methuen, 1971.

[11] Monte Carlo Simulation: Eine spezielle Art der Tabellensimulation, bei der Zufallswerte für unsichere Variablen generiert werden, um ein Modell aufzustellen. (http://www.decisioneering.com/monte-carlo-simulation.html vom 29.08.2005).

[12] Wie (1) und (2).

[13] Vgl. Granger, C. W. J., Newbold, P.: Spurious Regression in Econometrics in: Journal of Econometrics, 1974, S.115.

Ende der Leseprobe aus 26 Seiten

Details

Titel
Spurious Regression
Hochschule
Bayerische Julius-Maximilians-Universität Würzburg  (Volkswirtschaftliches Institut)
Note
1,7
Autor
Jahr
2005
Seiten
26
Katalognummer
V64209
ISBN (eBook)
9783638570855
Dateigröße
561 KB
Sprache
Deutsch
Schlagworte
Spurious, Regression
Arbeit zitieren
Franziska Zander (Autor), 2005, Spurious Regression, München, GRIN Verlag, https://www.grin.com/document/64209

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Spurious Regression


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden