Inhaltsverzeichnis
INHALTSVERZEICHNIS I
1. EINLEITUNG 1
2. SPURIOUS CORRELATION / SPURIOUS REGRESSION 2
3. SPURIOUS REGRESSION IN DER ZEITREIHENANALYSE 4
3.1 SPURIOUS REGRESSION IN ZEITREIHEN MIT DETERMINISTISCHEM TREND 4
3.2 SPURIOUS REGRESSION IN ZEITREIHEN MIT STOCHASTISCHEM TREND 5
3.2.1.1 FORSCHUNGEN ZU SPURIOUS REGRESSION: MONTE CARLO SIMULATION VS. ANALYTISCHE
UNTERSUCHUNGEN 6
3.2.1.2 DIE T-STATISTIK 7
3.2.1.3 DAS BESTIMMTHEITSMAß 9
3.2.1.4 DIE DURBIN-WATSON STATISTIK 10
3.2.2 SPURIOUS REGRESSION IN ZEITREIHEN MIT VERSCHIEDENEM INTEGRATIONSGRAD 10
4. VERMEIDUNG VON SPURIOUS REGRESSION 12
4.3.1 DIFFERENZENBILDUNG 12
4.3.2 Definition und Beschreibung des Konzepts 12
4.3.3 Dickey-Fuller Test und Augmented Dickey-Fuller Test 14
4.3.3.1 Dickey-Fuller Test 14
4.3.3.2 Augmented Dickey-Fuller Test 15
4.4 KOINTEGRATION 15
4.4.1 Definition und Beschreibung des Konzepts 15
4.4.2 Test auf Kointegration: Engle-Granger Verfahren 17
4.4.3 Test auf Kointegration: Verfahren von Johansen 18
5. ZUSAMMENFASSUNG 21
6. LITERATURVERZEICHNIS 23
I
1. Einleitung
„Die überwiegende Zahl ökonomischer Daten, die im Zeitablauf anfallen, ist anerkanntermaßen instationär, und zwar trendbehaftet.“ 1 Weiterhin setzte sich in den achtziger Jahren des 20. Jahrhunderts die Erkenntnis durch, dass viele ökonomische Zeitreihen einem stochastischen Trend folgen. 2 Daraus ergibt sich bei der Untersuchung unabhängiger, instationärer Zeitreihen das Problem, dass oft Scheinregressionen (Spurious Regression) geschätzt werden, da die Variablen von nichtstationären Zeitreihen einen durch den Trend vorgegebenen, ähnlichen Verlauf haben. Dieser Zusammenhang ist in der Realität jedoch nicht nachweisbar.
Spurious Regression wurde bereits 1926 von G. U. Yule in seiner Abhandlung ‚Why Do We Sometimes Get Nonsense Correlations between Time-series?’ beschrieben und später von Granger und Newbold in ihrer Arbeit ‚Spurious Regressions in Econometrics’ wieder aufgegriffen.
Im Rahmen dieser Arbeit wird das Auftreten von Spurious Regression in der Zeitreihenanalyse behandelt. Im zweiten Kapitel werden relevante Begriffe erklärt. Kapitel drei beschäftigt sich mit dem Auftreten von Spurious Regression in Zeitreihen mit deterministischem und stochastischem Trend, wobei der Fall des stochastischen Trends der bedeutsamere und ausführlicher behandelte ist. Hier wird ein Einblick in die Erforschung des Spurious Regression Problems gegeben. Des Weiteren werden die Folgen von Spurious Regression für die Maßzahlen der Regression dargestellt. Das vierte Kapitel der Arbeit beinhaltet Verfahren zur Vermeidung von Spurious Regression. Es werden zwei Verfahren mit ihren Vor- und Nachteilen vorgestellt und Testverfahren zu deren Anwendung erläutert.
Abschließend wird im fünften Kapitel eine Zusammenfassung dargeboten.
1 Hassler, U.: Zeitabhängige Volatilität und instationäre Zeitreihen in: Wirtschaftsdienst, 2003, S.1.
2 Vgl. Hassler, U.: Zeitabhängige Volatilität und instationäre Zeitreihen in: Wirtschaftsdienst, 2003, S.1.
1
2. Spurious Correlation / Spurious Regression
Ein aufgestelltes Regressionsmodell Y = α + βX + u impliziert, dass Y durch X erklärt werden kann. Wenn X einen hohen Erklärungsgehalt hat, weist der Korrelationskoeffizient r xy Werte nahe ±1 auf. Die Regressionsbeziehung wird über eine hohe Güte verfügen, also einen hohen Wert für das Bestimmtheitsmaß (R 2 =r 2 xy ) besitzen. Dieses gibt an, wie viel der Gesamtvariation der Variable Y durch das Modell erklärt werden kann. Des Weiteren wird in diesem Fall ein t-Test auf Signifikanz des Regressionsparameters β einen Wert ausweisen, der die Ablehnung der Nullhypothese H 0 : β=0 zur Folge hat.
Bei diesen Ergebnissen kann es sich neben wahren Zusammenhängen auch um scheinbare Zusammenhänge handeln, im letzten Fall spricht man von Scheinkorrelationen, bzw. Spurious Correlation. Bei Spurious Correlation liegt zwar ein stochastischer Zusammenhang vor, eine Kausalität ist jedoch nicht gegeben. Ein bekanntes Beispiel ist ein festgestellter Zusammenhang zwischen der Abnahme der Storchpopulation und der Abnahme der Neugeborenen während eines bestimmten Zeitraumes in einer Region. Dieser beruht allerdings nicht auf einem kausalen Zusammenhang, sondern auf anderen Faktoren, die sowohl die Abnahme von Storchennestern als auch die Abnahme der Geburten bedingen. 3 Werden zwei Variablen, die einem Scheinzusammenhang unterliegen, aufeinander regressiert, erhält man eine Scheinregression (Spurious Regression) mit den aufgeführten Symptomen. 4 Diese können leicht dazu veranlassen, die Regression ohne zusätzliche Prüfung als ‚gutes’ Modell zu betrachten und für Analysen oder Schlussfolgerungen herzunehmen.
3 Vgl. Sachs, L.: Angewandte Statistik, 2002, S.509.
4 Vgl. Ramanathan, R.: Introductory Econometrics, 1989, S.123.
2
Es werden verschiedene Arten von korrelativen Zusammenhängen unterschieden. „Eine Korrelation kann durch direkte kausale Zusammenhänge zwischen X und Y, durch eine gemeinsame Abhängigkeit von dritten Größen oder durch Heterogenität des Materials oder rein formal bedingt sein.“ 5 Um richtige Schlussfolgerungen aus einem Modell treffen zu können, muss dieses eine kausale Korrelation aufweisen: Der Datensatz X muss ursächlich mit dem Datensatz Y verbunden sein. Korrelationen zwischen Zeitreihen werden meist der Gruppe der Gemeinsamkeits-korrelationen zugeordnet.
5 Sachs, L.: Angewandte Statistik, 2002, S.509.
3
3. Spurious Regression in der Zeitreihenanalyse
3.1 Spurious Regression in Zeitreihen mit deterministischem Trend
Zwei voneinander unabhängige Zeitreihen [X t ] und [Y t ] mit deterministischem Trend, für die folgende datengenerierende Prozesse angenommen werden
X t = a + bt + u t bzw. Y t = c + dt + v t ,
werden nach der Vorschrift
Y t = α + βX t + ε t
aufeinander regressiert. Die residualen Komponenten u t und v t sollen unabhängig identisch verteilt 6 sein. Aus der Regression ergibt sich mit hoher Wahrscheinlichkeit ein großes Bestimmtheitsmaß und ein Wert der t-Statistik, der auf Signifikanz des Parameters β schließen lässt. Durch diese Ergebnisse wird dem Betrachter eine Beziehung zwischen [X t ] und [Y t ] nahe gelegt, die nicht existiert, da die Prozesse als voneinander vollkommen unabhängig angenommen werden.
Die Begründung liegt darin, dass die Zeit (t) als erklärende Variable in der Gleichung nicht aufgenommen wurde. Die Signifikanz von β wird durch die daraus resultierende Verzerrung verursacht. Die Gleichung ist richtig spezifiziert, wenn die Zeit als Regressor aufgenommen wird:
Y t = α + βX t + γt + ε t
Beim Überprüfen der Regression dieser Form weist die t-Statistik keine Signifikanzen für den Parameter β auf, dafür ist der Test für γ hochsignifikant. Das Bestimmtheitsmaß ist nach wie vor hoch. Die Ursache dafür ist, dass im vorher falsch aufgestellten Modell ein Fall von Spurious Regression vorlag und in der korrekten Regression ein wirklicher Zusammenhang zwischen dem Prozess [Y t ] und der Zeit (t) besteht.
6 IID-Eigenschaft; IID (oder i.i.d.) = idependently and identically distributed.
4
3.2 Spurious Regression in Zeitreihen mit stochastischem Trend
Zeitreihen mit stochastischem Trend werden auch als integrierte Zeitreihen bezeichnet. Integrierte Zeitreihen der Ordnung d können durch d-malige Differenzenbildung (d є N) zu einem stationären 7 Prozess umgeformt werden. Ein Random Walk Prozess Y t = Y t-1 + u t , mit einem u t , das die White Noise-Eigenschaften 8 erfüllt, ist ein I(1)-Prozess. Seine erste Differenz folgt einem White Noise Prozess und ist stationär: ∆Y t = Y t - Y t-1 = u t .
Als datengenerierender Prozess (DGP) für zwei Random Walk Prozesse ohne Drift wird folgende Vorschrift angenommen:
Die beiden Prozesse, die voneinander völlig unabhängig sind, werden nun aufeinander regressiert. Die Regressionsgleichung lautet:
Y t = α + βX t + ε t (3)
Aufgrund der Unabhängigkeit der beiden Prozesse, würde man bei einer Schätzung des Parameters β einen Wert erwarten, der nicht signifikant von Null verschieden ist. Ebenfalls wird erwartet, dass ein t-Test der Nullhypothese H 0 : β=0 gegen die Alternativhypothese der Signifikanz (H 1 : β≠0) einen so geringen Wert aufweist, dass die Nullhypothese nicht abgelehnt werden kann.
Dies ist häufig nicht der Fall. Bei der Schätzung ergibt sich sehr oft ein von Null verschiedener Schätzer für den Steigungsparameter β und beim Signifikanztest erhält man mit großer Wahrscheinlichkeit einen hohen t-Wert, sodass die Nullhypothese abgelehnt werden muss. Weiterhin ist ein hoher Wert für das Bestimmtheitsmaß in der Regression zu beobachten. All dies lässt darauf schließen, dass die beiden Prozesse [X t ] und [Y t ] miteinander verbunden sind und ein Zusammenhang zwischen
7 Hier ist, wie auch im Folgenden schwache Stationarität gemeint. Ein schwach stationärer Prozess ist definiert, als ein Prozess mit über die Zeit hinweg konstanten Erwartungswert und Varianz. Seine Kovarianz darf nur von der Lag-Größe, nicht jedoch von der Zeit abhängen.
8 White Noise (=Weißes Rauschen) ε ~IID (0,δ 2 ).
5
Arbeit zitieren:
Franziska Zander, 2005, Spurious Regression, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Mindestlohn als arbeitsmarktpo...
Seminararbeit, 20 Seiten
Entstehung und Auswirkungen der US-Hypothekenkrise im Subprime-Segment
BWL - Bank, Börse, Versicherung
Seminararbeit, 35 Seiten
Konvergenz oder Divergenz - Die Zukunft der Varieties of Capitalism
VWL - Mikroökonomie, allgemein
Seminararbeit, 27 Seiten
Ist Staatsverschuldung aus heutiger Sicht noch zu rechtfertigen?
Seminararbeit, 32 Seiten
Franziska Zander hat den Text Spurious Regression veröffentlicht
Franziska Zander hat einen neuen Text hochgeladen
The Spurious Texts of Philo of Alexandria: A Study of Textual Transmis...
James Ronald Royse, J. R. Royse
Blaming the Victims: Spurious Scholarship and the Palestinian Question
Edward W. Said, Christopher Hitchens
Notes of a Study of the Preliminary Chapters of the Mahabharata. Being...
V. Venkatachellam Iyer
Minimizing Spurious Tones in Digital Delta-Sigma Modulators
Kaveh Hosseini, Michael Peter Kennedy
0 Kommentare