Analyse jähriger und unterjähriger Zeitreihen


Hausarbeit, 2011
55 Seiten, Note: 1,0

Leseprobe

Inhalt

1. Motivation und Zielstellung
1.1 Quellenangaben

2. Theoretische Grundlagen
2.1 Glättung von Zeitreihen
2.2 Trendanalyse
2.3 Saisonanalyse
2.4 Analyse der Restkomponente
2.4.1 MA(q)-Modelle
2.4.2 AR(p)-Modelle
2.4.3 ARMA(p,q)-Modelle und ARIMA
2.5 Prognose

3. Analyse und Prognose der Jahresreihen
3.1 Datenbeschreibung
3.2 Glättung und Ausreißerdiskussion
3.3 Bestimmung des Funktionstyps und der Trendformel
3.4 Polynomiale und logarithmische Prognoseverfahren
3.4.1 Logarithmische Punkt- und Intervallprognose
3.4.2 Quadratische Punkt- und Intervallprognose
3.4.3 Kubische Punkt- und Intervallprognose
3.4.4 Vergleichsprognose
3.4.5 Gesamtprognose
3.5 Weitere Prognoseverfahren anhand ausgewählter Techniken
3.5.1 Johnson-Funktion
3.5.2 Prognose mit Hilfe des AR(1)-Modells
3.5.3 Prognose mit Hilfe der heuristischen Einschachtelung
3.6 Kapitelzusammenfassung

4. Analyse und Prognose der unterjährigen Reihen
4.1 Datenbeschreibung
4.2 Kalenderbereinigung
4.3 Box-Cox-Transformation
4.3.1 Transformation der Monatsreihe Bayerns
4.3.2 Transformation der Monatsreihe Schleswig-Holsteins
4.4 Trend- und Saisonfilterung
4.4.1 Trend- und Saisonfilterung der Monatsreihe Bayerns
4.4.2 Trend- und Saisonfilterung der Monatsreihe Schleswig-Holsteins
4.5 Test auf Normalverteilung
4.6 Modelfindung
4.7 Modellprüfung
4.7.1 Sichtprüfung
4.7.2 Durbin-Watson-Test
4.7.3 Modifizierte Box-Pierce-Statistik
4.7.4 Kumulierte Periodogramme
4.7.5 Interptation der Testergebnisse
4.8 Prognose
4.8.1 Vergleichsprognose
4.8.2 Modelupdating
4.9 Kapitelzusammenfassung

5. Abschließende Interptation

6. Anhang
6.1 Abbildungsverzeichnis
6.2 Tabellenverzeichnis
6.3 Literaturverzeichnis
6.3.1 Internet
6.3.2 Bücher

1. Motivation und Zielstellung

Der Tourismus ist in Deutschland zweifellos ein ökonomischer und gesellschaftlicher Faktor von höchster Bedeutung. In keiner anderen Branche finden so viele Menschen Arbeit und Beschäftigung. Nirgendwo stehen mehr Arbeitsplätze zur Verfügung als in der Tourismuswirtschaft. Die wirtschaftliche Bedeutung des Tourismus ist in den seltensten Fällen eindeutig bestimmbar und unterliegt in erster Linie regionalen Einflüssen. Diese Hausarbeit widmet sich der Analyse und Prognose der Touristenströme der beiden Bundesländer Schleswig-Holstein und Bayern. Dabei sollen mögliche Unterschiede herausgestellt werden, die sich aus der gegensätzlichen geografischen Lage ergeben könnten.

Dazu werden einmal monatliche und einmal jährige Zeitreihen der beiden Bundesländer miteinander verglichen und bezüglich ihrer Unterschiede analysiert. Ziel dieser Untersuchungen ist es möglichst genaue Prognosen für den Tourismus beider Bundesländer aufstellen zu können.

Folgende Zeitreihen sind Gegenstand der Untersuchungen.

Jährige Zeitreihen:

Angebotene Schlafgelegenheiten für die Bundesländer Schleswig-Holstein und Bayern im Zeitraum von 1995-2009

Monatliche Zeitreihen:

Übernachtungen in Beherbergungsbetrieben für die Bundesländer Schleswig-Holstein und Bayern im Zeitraum von 2000-2009

Zunächst werden in der Hausarbeit die theoretischen Grundlagen der Zeitreihenanalyse erläutert. Im Anschluss daran werden die jährigen Zeitreihen untersucht. Dazu werden Funktionstypen und Trendformeln berechnet. Danach werden Punkt-, Intervall-, Vergleichs- und Alternativprognosen aufgestellt und interptiert. Neben den Jahresreihen werden auch die Monatsreihen mit diversen Verfahren untersucht. Dazu müssen die Daten transformiert und kalenderbereinigt werden. Über eine Filterung werden saisonale Einflüsse und Trendfaktoren entfernt damit letztendlich für die Restkomponente ein geeignetes Modell gefunden werden kann, welches mittels verschiedener Verfahren geprüft wird. Nach Aufstellung der Modellgleichung werden Prognoseformeln berechnet. Außerdem wird eine Vergleichsprognose erstellt. Gegebenenfalls wird das Modell aktualisiert. Die Ergebnisse werden interptiert.

Am Ende der Arbeit werden alle Ergebnisse durch eine zusammenfassende Interptation dargestellt.

1.1 Quellenangaben

Sowohl die monatlichen, als auch die jährlichen Zeitreihen entstammen der GENESIS (Gemeinsames Neues Statistisches Informations-System)-Datenbank des Statistischen Bundesamtes.

2. Theoretische Grundlagen

Die Zeitreihenanalyse beschäftigt sich mit der zeitlichen Veränderung eines Merkmals X. Dabei wird die Zeit als Verursacher einer Entwicklung angesehen. Allerdings haben noch viele weitere Sachmerkmale einen Einfluss auf die Entwicklung des Merkmals X. Auf den Tourismus bezogen können solche Merkmale durch das Wetter, Wochen- und Feiertage repräsentiert werden. Bei einer Zeitreihe liegen werden die Merkmale durch diskrete Werte beschrieben. Dabei werden die Daten zu verschiedenen Zeitpunkten erhoben. Dadurch entsteht eine zeitliche Folge von xt Beobachtungen vor.

In der Zeitreihenanalyse werden Gesetzmäßigkeiten, die die zeitliche Veränderung eines Merkmales darstellen, untersucht und bestimmt. Dabei wird diese zeitliche Veränderung in ihrer kategorialen Bestimmung als gleichartig angesehen. Ergebnis dieser Analyse ist ein Zeitreihenmodell, welches zur Prognose verwendet wird. Bei der Deskription des Zeitreihenverlaufs nimmt man an, dass sich die erfassten Daten in bestimmte Komponenten zerlegen lassen. Dabei handelt es sich um eine Trend-, Saison-, Zyklus- und Restkomponente. Die allgemeine Formel lautet wie folgt:

Die Trendkomponente gibt an, wie sich das beobachtete Merkmal über einen längeren Zeitraum entwickelt. Man geht davon aus, dass diese Entwicklung sich nur langsam ändert, weil die bestimmenden Einflussfaktoren sich ebenfalls nur langsam ändern. Der Trend beschreibt also den Hauptverlauf der Zeitreihe. Unterjährige Schwankungen werden durch die Saisonkomponente beschrieben und werden, wie anfangs erwähnt, von Einflüssen wie Feiertagen geprägt. Sie können von überjährigen Zyklen begleitet werden. Zyklen können mit Hilfe von Perioden und Frequenzen beschrieben werden. Die Periode ist die Zeitdauer eines Zyklus und die Frequenz gibt an, wie viele Zyklen pro Zeiteinheit verstreichen. Als Restkomponente bezeichnet man Schwankungen in Zeitreihen, denen keine erkennbare Regelmäßigkeit zu Grunde liegt, die also zufällig auftreten. Solche Schwankungen können beispielsweise durch politische Veränderungen oder auch Umweltkatastrophen verursacht werden.

2.1 Glättung von Zeitreihen

Unter Umständen sind die Saison- oder auch Zufallsschwankungen in einer Zeitreihe so schwerwiegend, dass der Trendtyp erst nach einer Glättung der Zeitreihe erkennbar wird. Hierbei unterscheidet man zwischen nicht robusten und robusten Glättungsverfahren.

Robuste Glättungsverfahren werden angewendet, wenn in der Datenbasis viele Ausreißer und Extrema zu finden sind. Einzelne Ausreißer werden durch Bildung zentrierter gleitender Mediane geglättet. Wenn mit einer extremem Häufung von Ausreißerwerten zu rechnen ist, sollten die gleitenden Mediane mehrstufig eingesetzt werden (T4253H Verfahren).

Bei nur vereinzeltem Auftreten von Extremwerten werden jedoch nicht robuste Glättungsverfahren eingesetzt. Dabei beschränkt man sich auf einen simplen Glättungsalgorithmus, welcher den Mittelwert zeitlich aufeinanderfolgender Werte berechnet. Man ordnet dieses arithmetische Mittel dem mittleren Zeitpunkt der bei der Durchschnittsbildung verwendeten Zeiten zu. Damit werden periodische Schwankungen aus der Zeitreihe entfernt. Bei einem gleitenden Mittel der Spanne 3 ergibt sich aus je drei Werten xt-1, xt und xt+1 folgender Wert:

2.2 Trendanalyse

Längerfristige Zeitreihenentwicklungen werden durch die Trendanalyse bestimmt. Die mehrere Perioden umfassende Niveauveränderung eines Merkmals X wird durch den Trend beschrieben und für den gesamten Beobachtungszeitraum angegeben. Bei Jahresreihen kann durch Regression des Merkmals X die Trendanalyse auf die Zeit t modelliert werden. Dies ist möglich, da Jahresreihen im Gegensatz zu Monatsreihen keinen saisonalen Einflüssen unterliegen. Um den Trend als Funktion in Abhängigkeit der Zeit darstellen zu können, wird ähnlich zur Regressionsanalyse die Methode der kleinsten Quadrate genutzt.

Dabei muss untersucht werden was für ein Wachstum (quadratisch, kubisch, …) vorliegt. Ein Maß für die Beurteilung der Funktion ist das Bestimmtheitsmaß R2. Der Wert von R² liegt zwischen null und eins. Falls die Erklärungsgüte gleich eins ist, liegen alle Werte genau auf der Regressionskurve. Hat man sich schließlich für eine Trendfunktion entschieden, kann eine erste Prognose für die Jahresreihen abgegeben werden.

Widrigenfalls ist auch eine Differenzenfilterung möglich. Dadurch wird der lineare Trend entfernt:

Aus folgt

Durch mehrfache Ausführung der einfachen Differenzenbildung kann auch ein quadratischer Trend eliminiert werden. Nach der zweimaligen Differenzenbildung sie die Formel für den Trend wie folgt aus:

Zur allgemeinen Anwendung anhand des vermuteten Verlauftyps der Zeitreihe wird der Backshift-Operator B eingeführt.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Differenzenfilter ausgewählter Trendfunktionen

Die Differenzbildung zur Trendbereinigung kann jedoch nicht eingesetzt werden, wenn die Transformation der Zeitreihe nicht auf einem polynomialen Trend beruht. Hier muss die Zeitreihe linearisiert werden.

2.3 Saisonanalyse

Nach Durchführung der Trendbereinigung ist es mit Hilfe der saisonalen Analyse möglich, den Einfluss an Jahreszeiten gebundener Indikatoren auf das zu untersuchende Merkmal zu identifizieren. Die Zeitreihe setzt sich nur noch aus Saison- und Restkomponente zusammen:

Mit der Saisonanalyse lassen sich erwartete Jahreszyklen bestätigen. Zudem können weitere verborgene Zyklen bestimmt werden. Ziel ist es dann die Länge dieser herausgefilterten Zyklen zu berechnen um unter Anderem durchschnittliche Saisonmuster zu ermitteln. Die Dynamik der Saison wird also ausgewertet. Mit diesen Ergebnissen lassen sich dann bei Bedarf die Saisoneinflüsse aus der Zeitreihe herausfiltern. Auch können eventuelle Lücken im Saisonmodell geschlossen werden bis letztendlich eine Saisonprognose angefertigt werden kann.

Mittels der Periodogrammanalyse wird die Länge der Saisonzyklen bestimmt. Dazu werden gewichtete Sinus- und Kosinusschwingungen mit Hilfe der Methode der kleinsten Quadrate an die Zeitreihe angepasst.

Wenn sich Zyklen innerhalb der Zeitreihe überlagern, ist es ratsam den Monatszyklus mittels der zugehörigen Saisondifferenzen zu eliminieren. Wurde die Zykluslänge bestimmt, wird die tatsächliche Saisonbereinigung durchgeführt. Dabei wird zwischen starren und variablen Saisonmustern unterschieden.

Starre Saisonmuster beschreiben Saisoneinflüsse, die über längere Zeiträume wirken und dabei unveränderlich sind. Saison und Trend addieren sich in diesem Fall. Im Gegensatz dazu sind variable Saisonmuster in der Intensität und Abfolge veränderlich. Trend und Saison sind hier multiplikativ miteinander verknüpft. Analog zur Trendbereinigung werden bei der Saisonanalyse wiederum Differenzenfilter angewendet. Diese richten sich nach der Art der Saisonmuster wie folgender Tabelle zu entnehmen ist.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2: Differenzenfilter für Saisonbereinigung

2.4 Analyse der Restkomponente

Nach Durchführung der Trend- und Saisonbereinigung wurde die Ausgangszeitreihe nun bis auf die Restkomponente reduziert. Die Restkomponentenanalyse untersucht dabei wie zeitlich aufeinander folgende Beobachtungen kurzfristig in Beziehung stehen. Solche die Zeitreihe wesentlich prägenden Ereignisse werden Schocks genannt. Dabei werden die Abhängigkeiten dieser Schocks auf zwei Weisen untersucht:

- Auswirkungen des Schocks auf zukünftige Beobachtungen/Autoregression einer Beobachtung auf Vorgänger
- nicht erklärbare, unstrukturierbare Anteile (weißes Rauschen)

Um solche Abhängigkeiten zu untersuchen, nutzt man die Autokorrelationsanalyse. Mit ihr wird die Wechselwirkung zwischen der Zeitreihe ( und der um τ Perioden verschobenen Zeitreihe ( untersucht.

Die Autokovarianz des Lag τ berechnet sich über folgende Formel.

Unter Berücksichtigung der Varianz für die Zeitreihe

Sodass sich der Autokorrelationskoeffizient wie folgt berechnet:

Relativ große Werte des Autokorrelationskoeffizienten weisen auf einen relativ engen Zusammenhang bei der entspchenden zeitlichen Verschiebung hin. Je näher sich der Wert der Null nähert, desto geringer ist der jeweilige zeitliche Zusammenhang. Negative Werte von beschreiben im Mittel eine entgegengesetzte Wirkung von auf .

2.4.1 MA(q)-Modelle

Durch das Korrelogramm ist es möglich, sowohl ein Modell für die Zeitreihen zu bestimmen, als auch die Schockfortwirkung abzulesen. Durch MA(q)-Modelle lässt sich der Einfluss von Zufallschocks auf die Zeitreihen bestimmen. stellt die Schockfortwirkung dar und ist die dazu passende Gewichtung.

Die Ordnung q zeigt auf, wie lange, also über wie viele Perioden, der Schock stattfindet und ab welcher Periode die Schockfortwirkung beendet ist. Dies lässt sich durch Ausschläge an den Lags im Korrelogramm ablesen. Die 2-Sigma-Grenzen stellen das Intervall dar, welches angibt, welche ermittelten Werte der Autokorrelation nicht signifikant sind. Somit gelten Werte als auffallend, die über diese Grenzen gehen. Als Cut bezeichnet man das Lag, welches das erste Lag nach dem Eintauchen in die 2-Sigma-Grenzen ist. Dieser Cut bestimmt die Ordnung des Modells.

2.4.2 AR(p)-Modelle

Im Gegensatz zu dem oben erwähnten MA(q)-Modell hört bei dem autoregressiven Modell der Ordnung p (AR(p)-Modell) die Wirkung des Schocks nie ganz auf. Dies liegt daran, dass die Schockfortwirkung aus den vorherigen Perioden immer wieder eingebunden wird. Auch hier sind Lags Aufsehen erregend, die über die 2-Sigma-Grenzen hinausragen. Durch ein partielles Autokorrelogramm werden AR(p)-Modelle visualisiert. Dieses Modell wird durch folgende Gleichung dargestellt:

stellt hier eine unabhängige und identisch verteilte Zufallsvariable dar.

2.4.3 ARMA(p,q)-Modelle und ARIMA

Wenn eine Überlagerung von kurz- und langfristigen Schockfortwirkungen vorhanden ist, werden die MA(q)-Modelle mit den AR(p)-Modellen kombiniert. Dadurch entsteht das ARMA(p,q)-Modell. Dieses wird ebenfalls durch eine Gleichung dargestellt:

+ +…+ + + +…+

Durch eine ARIMA-Schätzung kann allerdings erst ein geeignetes und dadurch ein vorerst endgültiges Modell gefunden werden. Dies wird durch den Zusammenhang des ARMA- und ARIMA-Prozesses anhand von Differenzen realisiert. Für Prognosen kann dieser Zusammenhang später ebenfalls genützt werden. Sobald ein Modell gefunden worden ist, muss dieses allerdings noch überprüft werden. Als erstes wird die Irrtumswahrscheinlichkeit berechnet. Liegen die geschätzten Werte über 5%, ist das Modell nicht geeignet. Weitere Größen zur Beschreibung der Modellgüte sind das Akaike-Informations- und. das Schartz-Bayes-Kriterium. Dabei spchen in beiden Fällen niedrige Werte für ein optimales Modell.

Durch die ARIMA-Schätzung mit anderen Modellparametern, kann man herausfinden, ob ein optimales Modell vorliegt. Danach erhält man die Kurzform für das Modell, aus welcher dann die ausführliche Modellgleichung entwickelt wird.

Die Modellfehler müssen unbedingt konstant und unkorreliert in Erwartungswert und Varianz sein. Dies wird durch eine Sichtprüfung des Residuenkorrelogramms erprobt. In den 2-Sigma-Grenzen sollten alle Werte liegen. Allerdings kann man das auch durch den Durbin-Watson-Test oder durch die modifizierte Box-Pierce Statistik ermitteln.

2.5 Prognose

Eine Prognose sagt zukünftige Ergebnisse vorher. Diese wird anhand von Vergangenheitsinformationen getroffen. Für die Extrapolation von einer Zeitreihe vom Beobachtungszeitraum in den Prognosezeitraum hinein benötigt man folgende Punkte. Das Zeitintervall 1 für eine Periode und den Beobachtungszeitraum, also die Anzahl n der verfügbaren Beobachtungen. Desweiteren den Prognose-Horizont, also die Anzahl h der Perioden des Prognosezeitraums. Die Zeitdauer 1-h des Prognose Horizonts wird genauso benötigt wie die jüngste Beobachtung t vor Beginn der Prognose. Diese nennt man auch Prognose-Ursprung. Die Anzahl v steht für die problemrelevanten Prognosewerte. Der Prognose-Rhythmus wird durch den Periodenabstand r zwischen zwei Prognosen bestimmt. Als letztes wird das Prognose-Modell M benötigt. Dieses benennt die Vorschrift zur Berechnung der Prognose.

Es können kurz-, mittel- und langfristige Prognosen erstellt werden. All diese Prognosen können durch wiederholte Einschritt-, mehrmalige Mehrschritt- oder gemischte Prognosen ausgeführt werden. Die kurzfristige Prognose hat eine sehr kleine Erfassungsperiode bis zu maximal einem Monat. Aufgrund der Tatsache, dass der Horizont nur selten über einen Zyklus hinaus geht, wird in dieser Arbeit die Einschrittprognose gewählt. Die mittelfristige Prognose erstreckt sich über einen Zeitraum von einem Monat bis zu maximal einem Jahr. Sobald eine Prognose für fünf oder mehr Jahre erstellt wird, nennt man diese langfristige Prognose. Sowohl für die mittelfristige als auch für die langfristige Prognose eignen sich Mehrschritt- und gemischte Prognosen.

Durch die Punktprognose kann eine Erstellung der Vorhersage getroffen werden, die die geschätzten Werte der Prognose wiedergibt. Da diese prognostizierten Werte nur selten mit den tatsächlichen Werten übereinstimmen, werden zusätzlich zu der Punktprognose auch Intervallprognosen erzeugt. Diese bilden ein positives und negatives Intervall um die Punktprognose mit einer Irrtumswahrscheinlichkeit von fünf Prozent.

mit

Um die Prognose auf ihre Güte zu prüfen, gibt es verschiedene Verfahren. Der absolute Maximalfehler (MAX), der relative Maximalfehler (MAX%) und die Wurzel aus der quadratischen Prognosefehler (RMSE) mit der Relativzahl (RMSE%) sollten bei der Kontrolle des Modells minimal werden.

3. Analyse und Prognose der Jahresreihen

3.1 Datenbeschreibung

Die Tourismusbranche stellt ein sehr großes Geschäft dar. So beträgt der Bruttoumsatz in Bayern[1] pro Jahr über 24 Milliarden Euro - damit sichert der Tourismus mehr als 560.000 (rund 8,4 % der Erwerbstätigen) Einwohnern das Einkommen. Mit insgesamt rund 75,2 Millionen Übernachtungen im Jahr 2009 ist und bleibt der Tourismus im Süden der Bundesrepublik ein wichtiger Wirtschaftsfaktor.

Auch Schleswig-Holstein[2] konnte 2009 inklusive Tourismuscamping 24,3 Millionen Übernachtungen verzeichnen. Mit 160.000 Beschäftigten arbeiten nunmehr 12,5 % der Erwerbstätigen in der Tourismusbranche. Damit ist der Tourismussektor dort fast so groß wie das verarbeitende Gewerbe. Nach derzeitigem Stand erwirtschaftet die Tourismusbranche in Schleswig Holstein rund 7,3 Milliarden Euro Jahresumsatz.

Die in dieser Belegarbeit untersuchten Jahresreihen beschäftigen sich nun mit der Tourismusbranche dieser beiden Bundesländer Bayern und Schleswig-Holstein. Dabei werden die angebotenen Schlafgelegenheiten im Zeitraum von 1995-2009 in den beiden Bundesländern untersucht und am Ende Trendprognosen für die künftige Entwicklung des Fremdenverkehrs abgegeben.

In den Abbildungen 1 und 2 sind die beiden Jahresreihen vergleichsweise dargestellt:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Sequenzdiagramm Anzahl Schlafgelegenheiten Bayern

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Sequenzdiagramm Anzahl Schlafgelegenheiten Schleswig-Holstein

Es ist deutlich zu erkennen, dass sich die Graphen in beiden Sequenzdiagrammen sehr ähnlich sind. Bis zum Jahr 2003 ist ein kontinuierlicher Anstieg der angebotenen Gästebetten zu verzeichnen. Danach erfolgt ein kurzzeitiger Rückgang der angebotenen Schlafgelegenheiten. Resultieren aus der größeren Fläche und Bevölkerungszahl Bayerns werden in Bayern ungefähr drei Mal so viele Schlafgelegenheiten angeboten als in Schleswig-Holstein. Äußerst auffallend ist der starke Anstieg der Daten im Jahr 2009. So wurden in Bayern im Jahr 2009 im Vergleich zum Vorjahr rund 27% und in Schleswig-Holstein sogar knapp 45% mehr Betten zur Verfügung gestellt.

Dies könnte eine Folge der allgemeinen Weltwirtschaftskrise sein. Viele Deutsche waren aufgrund der angespannten Finanzlage dazu gezwungen ihre Ferien im Inland zu verbringen, da Auslandsreisen erheblich teurer sind.

Die vertikale Linie in beiden Sequenzdiagrammen kennzeichnet das Jahr 2006. Die am rechten Rand folgenden zwei Jahre werden dabei in Vergleichsprognosen zur Bestimmung von Trendformeln einfließen. Dabei wird der 2009er-Wert nicht in die Modellerstellung einbezogen, da es sich bei ihm um einen äußerst signifikanten Ausreißer handelt. Es ist noch nicht bekannt, ob es sich um ein einmaliges auslösendes Ereignis handelt, oder ob in den Folgejahren wieder eine Abschwächung der Daten zu erwarten ist, da Deutschland die Weltwirtschaftskrise einigermaßen gut überstanden hat und ein neuerlicher Konjunkturaufschwung von 3,9 % zu erwarten ist[3].

3.2 Glättung und Ausreißerdiskussion

Zur Bestimmung eines geeigneten Glättungsverfahrens, sollen an dieser Stelle die beiden Boxplots der Jahresreihen untersucht werden.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Boxplot Anzahl Schlafgelegenheiten Bayern

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: Boxplot Anzahl Schlafgelegenheiten Schleswig-Holstein

In den beiden Abbildungen sind die eingangs erwähnten Ausreißer für die Jahre 2009 deutlich zu erkennen. Bei den erfassten Anzahlen für die Jahre 1995 und 1996 am linken Rand handelt es sich um Extremwerte. Ausnahme ist der Wert des Jahres 1995 aus Schleswig-Holstein, welcher einen Ausreißer darstellt.

Würde man angesichts dieser Ausreißer durchweg mit geglätteten Werten arbeiten, dann müssten alle Daten wegen dieser Beobachtungen verändert werden. Dies wäre in diesem Falle aber nicht ratsam, da zur Erstellung aussagekräftiger Prognosen so wenig wie möglich transformiert werden sollte. Die Glättung soll hier aber noch einmal an dieser Stelle exemplarisch durchgeführt werden, um die Methodik zu verdeutlichen.

Da nur vereinzelte Extremwerte auftreten, wird an dieser Stelle ein nicht robustes Glättungsverfahren, der gleitende Mittelwert der Spanne 3, eingesetzt.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: Geglättete Jahresreihe Bayern

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 6: Geglättete Jahresreihe Schleswig-Holstein

Wegen der eben genannten Gründe werden für alle weiteren Untersuchungen die Originaldaten verwendet.

3.3 Bestimmung des Funktionstyps und der Trendformel

Um eine geeignete Trendformel und den Funktionstyp zu ermitteln, wird eine Regressionsanalyse durchgeführt. Dabei verschafft das Bestimmtheitsmaß R² einen Eindruck über die Erklärungsgüte des jeweiligen Funktionstyps. Eine exponentielle Entwicklung der angebotenen Schlafgelegenheiten ist von vorneherein nicht zu erwarten und wird deshalb in den Untersuchungen ausgeschlossen.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3: Bestimmtheitsmaße der Trendfunktionen

In der obigen Tabelle sind die Bestimmtheitsmaße für die möglichen Trendfunktionstypen für beide Jahresreihen einmal mit, und einmal ohne Konstante, abgebildet. Alle Kurvenanpassungen bis auf die lineare Trendfunktion mit Konstante für Schleswig-Holstein erklären die beobachteten Werte auf einem Signifikanzniveau von 95 %. In den Abbildungen 7 bis 10 sind die durchgeführten Kurvenanpassungen visualisiert. In die Regressionsanalyse sind jeweils nur die beobachteten Jahre bis einschließlich 2006 eingeflossen.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 7: Funktionstypen mit Konstante Bayern

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 8: Funktionstypen mit Konstante Schleswig-Holstein

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 9: Funktionstypen ohne Konstante Bayern

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 10: Funktionstypen ohne Konstante Schleswig-Holstein

Bei beiden Jahresreihen sind die Bestimmtheitsmaße bei den Trendfunktionen ohne Konstante in den meisten Fällen höher, als bei denen mit Konstante. Daraus könnte man schließen, dass die Entscheidung für Funktionsmodelle ohne Konstante sinnvoll wäre. Betrachtet man allerdings die Kurvenanpassungsdiagramme, so erkennt man, dass die Funktionsgraphen ohne Konstante nicht wirklich dem Verlauf der beobachteten Werte folgen. Daher scheiden alle Trendfunktionsmodelle ohne Konstante in den weiteren Betrachtungen aus. Für die weiteren Analysen werden jeweils die drei besten (logarithmisch, quadratisch und kubisch) Kurvenanpassungen mit Konstante ausgewählt. Gänzlich Ausscheiden tut ein lineares Regressionsmodell bei der Datenbeschreibung für Entwicklung des Tourismus in Schleswig-Holstein, da das Bestimmtheitsmaß nur 27,1 % beträgt. Bei den angebotenen Schlafplätzen Bayerns sind die quadratische und kubische Kurvenanpassung nahezu identisch, was auch das Bestimmtheitsmaß bestätigt. Die logarithmische Kurvenanpassung gibt im Gegensatz zu den beiden erwähnten Kurvenanpassungen eine optimistischere Prognose aus.

Für Schleswig-Holstein stellen die logarithmische und kubische Trendfunktion eine optimistische Entwicklung für die Zukunft dar. Dabei ist deutlich sichtbar, dass die kubische Funktion bedeutend steiler ist, als die logarithmische Funktion. Die quadratische Funktion sagt dagegen eine negative Entwicklung voraus. Die kubische Kurvenanpassung scheint sich am besten an die beobachteten Werte anzuschmiegen.

Auffällig ist, dass sowohl für Bayern, als auch für Schleswig-Holstein ein kubisches Modell die beobachteten Werte am besten beschreibt. Die Bestimmtheitsmaße betragen hier 94,9% bzw. 87,9%.

[...]


[1] http://daby.bayern.by/de/entwicklung-des-tourismus-in-bayern-2

[2] http://www.schleswig-holstein.de/Portal/DE/LandLeute/ZahlenFakten/Wirtschaftsstandort/Kompetenzfelder/kompetenzfelder_node.html

[3] http://www.focus.de/politik/weitere-meldungen/konjunktur-aufschwung-in-deutschland-setzt-sich-fort_aid_571263.html

Ende der Leseprobe aus 55 Seiten

Details

Titel
Analyse jähriger und unterjähriger Zeitreihen
Hochschule
Fachhochschule Stralsund
Note
1,0
Autoren
Jahr
2011
Seiten
55
Katalognummer
V172407
ISBN (eBook)
9783640923410
ISBN (Buch)
9783640923021
Dateigröße
2385 KB
Sprache
Deutsch
Schlagworte
analyse, zeitreihen
Arbeit zitieren
Markus Krauß (Autor)Johannes Raithel (Autor), 2011, Analyse jähriger und unterjähriger Zeitreihen, München, GRIN Verlag, https://www.grin.com/document/172407

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Analyse jähriger und unterjähriger Zeitreihen


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden