Multiple Korrelations- und Regressionsanalyse am Beispiel des Wanderungssaldo auf Basis der Kreise und kreisfreien Städte differenziert nach Ost- und Westdeutschland


Hausarbeit, 2003
27 Seiten, Note: 1,3

Leseprobe

Inhalt

Einleitung

1. Betrachtung der bivariaten Korrelationskoeffizienten

2. Die Regressionsanalyse

Quellenverzeichnis

Einleitung

Ziel dieser Hausarbeit im Rahmen der Veranstaltung „Statistik 3“ ist es, beruhend auf den Untersuchungselementen der 440 Kreise und kreisfreien Städte in Deutschland, die statistischen Erklärungsansätze für das Binnenwanderungssaldo[1] zu Beginn der 1980er Jahre, bezüglich ihres Erklärungsgehaltes zu Beginn des 21. Jahrhunderts, für Ost- und Westdeutschland zu untersuchen. Das Binnenwanderungssaldo beschreibt dabei die abhängige Variable und wird im Folgenden mit Y bezeichnet. Folgende unabhängige Variablen X1,, X7 wurden (zu Beginn der 1980er Jahre) und werden zur Erklärung des Binnenwanderungssaldos herangezogen[2]:

X1 = Zahl sozialversicherungspflichtig Beschäftigter in 1.000 (2000)

X2 = Entwicklung der Anzahl sozialversicherungspflichtig Beschäftigter 1990-2000 in %

X3 = Arbeitslose je 100 Arbeitnehmer (2001)

X4 = Einwohner je qkm (2000)

X5 = sozialversicherungspflichtig Beschäftigte je 100 Einwohner (2000)

X6 = Ärzte je 100.000 Einwohner (2000)

X7 = Verhältnis bebauter Fläche zu Freifläche (2000)

Ziel der Untersuchung ist es, grundsätzlich Variablen auszuwählen, die das Binnenwanderungssaldo Y möglichst gut beschreiben, so dass sich die Variationen der Y -Werte so weit wie möglich auf die X -Werte zurückführen lassen.

Bahrenberg/Giese/Nipper [2003], beziehen sich im Buch „Statistische Methoden der Geographie 2“ auf diese Variablen für eine Untersuchung des Binnenwanderungssaldo in den norddeutschen Kreisen und den kreisfreien Städten zu Beginn der 1980er Jahre.[3] Ziel ist es von daher auch, zu untersuchen, ob die Analyse basierend auf diesen Variablen, die dort auf Basis von 65 Kreisen durchgeführt wurde, zwanzig Jahre später noch einen guten Erklärungsansatz für das dortige Binnenwanderungssaldo bietet und ob eine Übertragung dieses Modells auf das gesamte Bundesgebiet möglich ist.

Möchte man eine Hypothese über das Wanderungsverhalten aufstellen, spielen in erster Linie die Umzüge eine gewichtige Rolle. Diese sind zum einen arbeitsplatzorientiert (der Arbeitsstandort ist außerhalb des individuell hinnehmbaren Pendlerradius), zum anderen wohnungsorientiert (obwohl der Arbeitsplatz beibehalten wird, wird aus individuellen, sozioökonomischen und raumspezifischen Gründen der Wohnstandort gewechselt). In der Wissenschaft wird davon ausgegangen, dass das erste Motiv häufig mit der interregionalen Wanderung in Zusammenhang steht (Stadt-Stadt-Wanderung, Land-Land-Wanderung[4]), das zweite hingegen mit der intraregionalen (Land-Stadt-Wanderung, Stadt-Land-Wanderung[5]), die vor allem in Zusammenhang mit der „Suburbanisierung des Wohnens“ gebracht wird. In dieser Wechselbeziehung ist der Maßstab der Betrachtungsebene von großer Wichtigkeit. Mit den Binnenwanderungssalden auf der Kreisebene werden grundsätzlich nur die Wanderungen über die Kreisgrenzen erfasst, deren größerer Anteil nach den aufgezeigten Annahmen den arbeitsorientierten Wanderern, zum Teil auch den Stadt-Umland-Wanderern, zugeschrieben werden kann.

Bähr verweist in seinem neusten Aufsatz in der „Geographischen Rundschau“ 6/2003 zum Thema „Binnenwanderungen“ darauf, dass push-pull -Modelle, die vor allem auf abhängigen wirtschaftlichen Indikatoren in der Regressionsanalyse basieren, „selbst bei Wanderungen über große Distanzen zur Erklärung nicht ausreichen“[6]. Er begründet dies mit den wenig mobilen Arbeitslosen (die Wanderungen werden in der Regel durch höherqualifizierte Kräfte getragen, während Arbeitslose durch die ausgebauten sozialen Sicherungssysteme einem geringen Mobilitätszwang unterliegen) und dem steigenden Einfluss der „weichen Faktoren“ (Wohn-, Freizeit-, Umweltqualität) in der postfordistischen Gesellschaft.[7] Bei den kleinräumigen Wanderungen greift das sogenannte Lebenszyklus-Konzept von Rossi, einen „abgesicherten Erklärungsansatz“[8] Demnach ist ein Wechsel in der demographischen Struktur ausschlaggebend für eine Wanderungsentscheidung, mit der den gewandelten Wohnungs- und Wohnumfeldansprüchen Rechnung getragen wird.

Ich werde als erklärende (unabhängige) Variablen einerseits arbeitsmarktorientierte (X1, X2, X3, X5), wie auch auf den Verstädterungsgrad abzielende Größen (X4, X6, X7) in die Analyse einbeziehen – über die vorwärtsgerichtete und die schrittweise Auswahl unabhängiger Variablen.

Folgende Zusammenhänge und erwarteten Beziehungen der Variablen X1 – X7 zum Binnenwanderungssaldo werden vermutet:

Tab. A:

Abbildung in dieser Leseprobe nicht enthalten

Bei der Analyse wird zwischen ost- und westdeutschen Kreisen differenziert und somit bei allen Ansätzen eine gesamtdeutsche Betrachtung (440 Kreise), eine ostdeutsche (112 Kreise) (unter Ausschluss von Berlin) und eine westdeutsche (327 Kreise) vorgenommen.

1. Betrachtung der bivariaten Korrelationskoeffizienten

Zunächst werden nach dem Modell der vorwärtsgerichteten Auswahl unabhängiger Variablen die Korrelationskoeffizienten zwischen dem Binnenwanderungssaldo und den ausgewählten unabhängigen Variablen auf Basis der Kreise untersucht.

Abbildung in dieser Leseprobe nicht enthalten

Abb.1 nach 05_Stat3ForwardBackward.pdf (Nils Mevenkamp)

Folgende Koeffizienten wurden ermittelt:

Tab. 1a: Gesamtdeutschland:

Abbildung in dieser Leseprobe nicht enthalten

* Diese Koeffizienten sind beim zweiseitigen Test auf dem 1% Niveau signifikant von 0 verschieden

Tab. 1b: Ostdeutschland:

Abbildung in dieser Leseprobe nicht enthalten

* Diese Koeffizienten sind beim zweiseitigen Test auf dem 1% Niveau signifikant von 0 verschieden

Tab. 1c: Westdeutschland:

Abbildung in dieser Leseprobe nicht enthalten

* Diese Koeffizienten sind beim zweiseitigen Test auf dem 1% Niveau signifikant von 0 verschieden

Zunächst einmal fällt auf, dass außer der Variablen X2 (=Entwicklung der sozialversicherungspflichtig Beschäftigten 1990-2000 in %), die für den Osten nicht vorliegt, alle Korrelationskoeffizienten negativ sind (Mit steigendem Binnenwanderungssaldo ergibt sich nahezu überall ein negativer Zusammenhang zu den ausgewählten Variablen.), und sich dabei enorme Unterschiede zwischen Ost- und Westdeutschland bemerkbar machen. Die auf den Verstädterungsgrad abzielenden Größen (X4, X6, X7) haben im Osten (absolut betrachtet) einen wesentlich größeren Einfluss auf das Binnenwanderungssaldo als im Westen, wo den arbeitsmarktorientierten Variablen (X1, X2, X3, X5) ein bedeutsameres Gewicht zukommt als im Osten. In einer gesamtdeutschen Betrachtung sind diese Unterschiede kaum nachzuvollziehen, wobei aber eine leichte Dominanz der westlichen Einflüsse v.a. bei X3 = Arbeitslose je 100 Arbeitnehmer (2001) ausgemacht werden kann. Wohnungsbezogene Umzüge scheinen im Osten, arbeitsplatzbezogene Umzüge im Westen zu dominieren. Durchgängig gering scheint der Einfluss von X1 = Zahl sozialversicherungspflichtig Beschäftigter in 1.000 (2000) zu sein, die noch nicht einmal auf dem 5%-Niveau bei zweiseitiger Fragestellung signifikant ist.

Ziel der nun folgenden Regressionsanalyse ist es, einen möglichst großen Teil der Varianzen von Y durch die unabhängigen Variablen aufzudecken, wobei ich mich zunächst gemäß der obigen Tabellen (Tab.1a-c) an den jeweils intensivsten Einflussvariablen aller drei Untersuchungsgebiete orientieren werde.

Ich beginne mit der Variable X3 = Arbeitslose je 100 Arbeitnehmer (2001), die bezogen auf Gesamtdeutschland den höchsten Korrelationskoeffizienten aufweist und führe eine Regression von Y nach X3 durch, wobei sich bezogen auf die drei Teilgebiete folgende Regressionsgleichungen und Bestimmtheitsmaße einstellen:

Gesamtdeutschland: Ŷ = 6,616 -0,617X3, BYX3 = r2 YX3 = 9,2%

Ostdeutschland: Ŷ = 16,824 -1,093X3, BYX3 = r2 YX3 = 8,8%

Westdeutschland: Ŷ= 9,530 -1,067 X3, BYX3 = r2 YX3 = 7,3%

Gemäß den absolut gesehen recht geringen Korrelationskoeffizienten fallen die Varianzen von Y auf X3 ebenso recht dürftig aus. Mit der Arbeitslosenquote kann also bundesweit nur ein sehr geringer Anteil des Binnenwanderungssaldo erklärt werden.

Zu Erhöhung des beschreibenden Varianzanteils von Y werde ich im Folgenden die Variable X6 in die Analyse einbeziehen, die zumindest bezogen auf den Osten, absolut betrachtet, den höchsten Korrelationskoeffizienten mit Y aufweist. Korreliert man die Variable X6 mit der abhängigen Variable Y so kommt man zu folgenden Bestimmtheitsmaßen:

Gesamtdeutschland: BYX6 = r2 YX6 = 3,0%

Ostdeutschland: BYX6 = r2 YX6 = 16,2%

Westdeutschland: BYX6 = r2 YX6 = 3,1%

Diese Bestimmtheitsmaße können nicht, wie möglicherweise zu erwarten gewesen wäre, einfach zusätzlich zum bereits erklärten Varianzanteil der Teilgebiete von Y durch X3 hinzugezogen werde (z.B. für Ostdeutschland: 8,8% + 16,2% = 25%).

Berechnet man nämlich für Ostdeutschland die Regression von Y nach X3 und X6, so errechnet sich ein Bestimmtheitsmaß von BYX3X6 = 26,58%, das sogar über dem der Addition der einzelnen Bestimmtheitsmaße liegt. Offensichtlich beeinflussen sich die beiden unabhängigen Variablen gegenseitig, sind stochastisch abhängig voneinander und die Informationen, die X3 und X6 separat über Y geben, sind nicht die gleichen, wie sie diese gemeinsam hinterlassen.

Man hat es hier mit der sogenannten Multikollinearität zu tun, die grundsätzlich dann auftritt, wenn der Einfluss sozusagen unrein dargestellt ist. Um diese gegenseitige Beeinflussung der Variablen aufeinander auszuschließen, muss bei der Betrachtung zweier Variablen eine dritte Variable konstant gehalten werden, so dass deren Einfluss, bezogen auf die Untersuchung der anderen Einflussgrößen, ausgeschlossen werden kann.

Diese Möglichkeit bietet die partielle Regression.

[...]


[1] Das Binnenwanderungssaldo beschreibt die Differenz zwischen den Zu- und Fortzügen in einem Gebiet (in diesem Fall bezogen auf den jeweiligen Kreis). Die Ausländermigration bleibt dabei unberücksichtigt. (Bahrenberg/Giese/Nipper [2003], S.16)

[2] Die Daten sind den „Aktuellen Daten zur Entwicklung der Städte, Kreise und Gemeinden“ [Ausgabe 2002] entnommen.

[3] Bahrenberg/Giese/Nipper [2003], S.16ff

[4] Bähr, J., [2003], S. 5

[5] Bähr, J., [2003], S. 5

[6] Bähr, J., [2003], S. 6

[7] Bähr, J., [2003], S. 6

[8] Bähr, J., [2003], S. 5

Ende der Leseprobe aus 27 Seiten

Details

Titel
Multiple Korrelations- und Regressionsanalyse am Beispiel des Wanderungssaldo auf Basis der Kreise und kreisfreien Städte differenziert nach Ost- und Westdeutschland
Hochschule
Universität Bremen  (Institut für Geographie)
Note
1,3
Autor
Jahr
2003
Seiten
27
Katalognummer
V18968
ISBN (eBook)
9783638232074
Dateigröße
2042 KB
Sprache
Deutsch
Anmerkungen
Diese Arbeit befasst sich sowohl analytisch wie auch methodisch mit der multiplen Regessionsanalyse bezüglich der Erklärung und Beschreibung migrativer Vorgänge in Deutschland in den 1980er Jahren im Vergleich zur heutigen Situation. Im Anhang befindet sich zudem Kartenmaterial.
Schlagworte
Multiple, Korrelations-, Regressionsanalyse, Beispiel, Wanderungssaldo, Basis, Kreise, Städte, Ost-, Westdeutschland
Arbeit zitieren
Martin Runkel (Autor), 2003, Multiple Korrelations- und Regressionsanalyse am Beispiel des Wanderungssaldo auf Basis der Kreise und kreisfreien Städte differenziert nach Ost- und Westdeutschland, München, GRIN Verlag, https://www.grin.com/document/18968

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Multiple Korrelations- und Regressionsanalyse am Beispiel des Wanderungssaldo auf Basis der Kreise und kreisfreien Städte differenziert nach Ost- und Westdeutschland


Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden