Einleitung
1.1 Vorbemerkungen
In den letzten Jahren gewinnen Städte und Regionalvergleiche immer mehr an Beliebtheit. Dadurch gewannen solche Vergleiche auch in der öffentlichen Wahrnehmung zunehmend an Bedeutung. Dabei besteht die Gefahr, dass sich durch diese Vergleiche in der öffentlichen Meinung eine vorschnelle Einschätzung über die Attraktivität von verschiedenen Regionen verfestigt,
” die als wissenschaftlich fundiert angesehen werden und
zu problematischen Einstufungen führen, die auch Standortentscheidungen von Investoren und privaten Haushalten zu beeinflussen vermögen“(1). Eine weitere Funktion von
Regionalvergleichen kann die Bestimmung und Legitimation von Fördergebieten sein, beispielsweise im Rahmen der Definition von Fördergebieten in der Europäischen Union.
Die Ergebnisse, die aus solchen Regionalvergleichen resultieren, haben deswegen auch praktisch-politische Folgen mit ganz konkreten Auswirkungen in der Realität. Schon aus diesem Grund ist es notwendig, sich explizit mit den Anforderungen und Vorgehensweisen
solcher Regionalvergleiche auseinanderzusetzten.
Die vorliegende Arbeit ist konzipiert als empirischer Beitrag zur Diskussion der Anwendbarkeit komplexer statistischer Verfahren im regionalökonomischen Bereich der Raumtypisierung.
Darauf aufbauend soll in einem weiteren Schritt die ökonomische Leistungsfähigkeit von Regionen herausgearbeitet werden.
[...]
______
1Klemmer (1995) S. 7
Inhaltsverzeichnis
1 Einleitung
1.1 Vorbemerkungen
1.2 Problemstellung
1.3 Vorgehensweise
2 Konzeptioneller Rahmen zur Bestimmung a¨ hnlicher Regionen
2.1 Die Auswahl von Analyseregionen
2.2 Bestimmung von a¨hnlichen Regionen anhand ihres Standortpotentials
3 Statistische Verfahren der Raumtypisierung
3.1 Datenstruktur
3.2 Clusteranalyse
3.2.1 Hierarchische Verfahren
3.2.2 Partionierungsmethoden
3.2.2.1 Hartigan’s k-means Algorithmus
3.2.2.2 Partitioning Around Medoids
4 Klassifikation von Raumordnungsregionen anhand ihres Standortpotentials
4.1 Datenauswahl - Korrelationsanalyse
4.2 Die Klassifikationsverfahren und ihre Ergebnisse
4.2.1 Hierarchisches agglomeratives Clustering
4.2.2 Hierarchisches agglomeratives Clustering mit vorgeschalteter Fak- torenanalyse
4.2.3 Partionierung mit Hartigans k-means
4.2.4 Partionierung mit PAM
4.3 Vergleich der Ergebnisse der Klassifikationsverfahren
5 Konzeptioneller Rahmen zur Beurteilung der Standortqualita¨ t von Regionen
5.1 Indikatoren in der Regionalforschung
5.2 Bildung eines Indikatorenkatalogs
5.2.1 Lage und Erreichbarkeit
5.2.2 Bevo¨ lkerung und Siedlungsstruktur
5.2.3 Wirtschaft
5.2.4 Arbeitsmarktbedingungen
5.2.5 Bildung und Qualifikation
5.2.6 Innovation
5.2.7 Lebensqualita¨t
5.3 Zusammenfassung und Kritik
6 Regionaler Vergleich der wirtschaftlichen Leistungsfa¨ higkeit
6.1 Auswahl der zur Verfu¨ gung stehenden Indikatoren
6.2 Bildung von Standortfaktoren
6.3 Ranking der Standortqualita¨t
6.3.1 Gesamtranking
6.3.2 Ranking der einzelnen Standortfaktoren
6.3.2.1 Wirtschaft
6.3.2.2 Arbeitsmarkt
6.3.2.3 Zukunftspotential
6.3.2.4 Lebensqualita¨t
7 Vergleich der Standortfaktoren auf der Basis des Standortpotentials
7.1 Die Standortfaktoren zwischen den Clustern
7.2 Ost-West-Vergleich der Standortfaktoren innerhalb der Cluster
7.3 Die Standortfaktoren in den Verdichtungsregionen
8 Vergleich des Standortpotentials mit der Wirtschaftsstruktur
8.1 Darstellung der Ergebnisse zwischen den Clustern
8.2 Ost-West Vergleich innerhalb der Cluster
8.3 Die Wirtschaftstruktur der Verdichtungsregionen
9 Schlußbemerkung
Anhang
A Distanzmaße
B Hierarchisch divisives Clusterverfahren mit DIANA
C Bildung und ausfu¨ hrliches Ranking der Standortfaktoren
C.1 Vollsta¨ndige Ergebnisse der Hauptkomponetenanylse bei der Bildung der Standortfaktoren
C.2 Ausfu¨ hrliches Ranking der Standortfaktoren
D Zusa¨ tzliche Tabellen
D.1 Beispiel Kapitel 2: Bruttowertscho¨ pfung je Einwohner auf Kreisebene
D.2 Raumordnugnsregionen und ihre Bevo¨ lkerungs- und Siedlungsvariablen
E Quellenangaben der verwendeten Indikatoren
Literaturverzeichnis
Abbildungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
1 Einleitung
1.1 Vorbemerkungen
In den letzten Jahren gewinnen Sta¨dte und Regionalvergleiche immer mehr an Beliebt- heit. Dadurch gewannen solche Vergleiche auch in der o¨ ffentlichen Wahrnehmung zu- nehmend an Bedeutung. Dabei besteht die Gefahr, dass sich durch diese Vergleiche in der o¨ ffentlichen Meinung eine vorschnelle Einscha¨tzung u¨ ber die Attraktivita¨t von ver-
schiedenen Regionen verfestigt, die als wissenschaftlich fundiert angesehen werden und
”
zu problematischen Einstufungen fu¨ hren, die auch Standortentscheidungen von Investo-
ren und privaten Haushalten zu beeinflussen vermo¨ gen“ 1. Eine weitere Funktion von Regionalvergleichen kann die Bestimmung und Legitimation von Fo¨ rdergebieten sein, beispielsweise im Rahmen der Definition von Fo¨ rdergebieten in der Europa¨ischen Union. Die Ergebnisse, die aus solchen Regionalvergleichen resultieren, haben deswegen auch praktisch-politische Folgen mit ganz konkreten Auswirkungen in der Realita¨t. Schon aus diesem Grund ist es notwendig, sich explizit mit den Anforderungen und Vorgehenswei- sen solcher Regionalvergleiche auseinanderzusetzten.
Die vorliegende Arbeit ist konzipiert als empirischer Beitrag zur Diskussion der Anwend- barkeit komplexer statistischer Verfahren im regionalo¨ konomischen Bereich der Raumty- pisierung. Darauf aufbauend soll in einem weiteren Schritt die o¨konomische Leistungsfa¨higkeit von Regionen herausgearbeitet werden.
1.2 Problemstellung
Die Bestimmung der Standortqualita¨t von Regionen bezu¨ glich ihrer wirtschaftlichen Lei- stungsfa¨higkeit erfolgt in der Regel durch die Einbeziehung einer Vielzahl von Indikato- ren, die in der Lage sind, die Standortqualita¨t ada¨quat zu beschreiben.
In vielen empirischen Regionalvergleichen werden auf Basis dieser Vorgehensweise alle betrachteten Regionen in ein Gesamtranking gebracht.
Als eines der gro¨ ßten methodischen Defizite bei solchen Regionalvergleichen sehen die Autoren das Versa¨umnis an, dass oftmals Regionen miteinander in Beziehung gesetzt werden, die bezu¨ glich ihrer Ausgangssituation nur bedingt miteinander vergleichbar sind. Die Ergebnisse eines solchen Rankings ko¨ nnen nur dann Aufschlu¨ sse u¨ber die Sta¨rken und Schwa¨chen von Regionen geben, wenn andere Regionen zu Vergleichszwecken her- angezogen werden, die auch prinzipiell miteinander vergleichbar sind. So scheint es aus naheliegenden Gru¨ nden nicht sinnvoll zu sein, Berlin mit der Region Altmark zu verglei- chen.
Eine solches Gesamtranking befriedigt zwar die menschliche Neugier, ist aber aus wis- senschaftlicher Sicht problematisch, da jede Region charakteristische Eigenschaften hin- sichtlich ihrer Ausgangssituation besitzt.
Insofern sollte man den Vergleich der Standortqualita¨t von Regionen um sogenannte Po- tentialanalysen erweitern, die die Ausgangssituation von Regionen beru¨ cksichtigen.
Dabei stellt sich die Frage, wie Regionen hinsichtlich bestimmter Merkmale und Eigen- schaften kategorisiert werden ko¨ nnen.
In der Praxis wird dazu meist auf die sogenannten Schwellenwertmethode zuru¨ ckge- griffen. Dabei werden bezu¨ glich geeigneten Kriterien Schwellen festgelegt, nach denen eine Region einer Gruppe zugeordnet wird oder nicht. Daraus resultiert ein grobes, tabel- lenartiges Klassfikationsschema, in das die Regionen je nach Auspra¨gung der Merkmale eingeordnet werden. Die Festlegung der Schwellenwerte hat den Vorteil, dass die Ty- pisierungsergebnisse leicht nachvollziehbar sind. Andererseits unterliegt diese Art der Einteilng einem stark normativen Element, da eine solche Einteilung auf Erfahrungswer- ten basiert und willku¨ rliche Elemente nicht ausgeschlossen werden ko¨ nnen. Zudem ist bei dieser Methode die Anzahl der Merkmale meist auf zwei oder drei beschra¨nkt.
Im Gegensatz zur Schwellenwertmethode stellt die Stastitik Methoden zur Verfu¨ gung, die die Einbeziehung vieler Merkmale erlauben und einen automatisierten Prozeß der
Dadurch scheint eine Objektivierung der Kategorisie- ”
rung mo¨ glich und eine willku¨ rliche Grenzziehung wie bei der Schwellenwertmethode entfa¨llt“2.
Daher stehen folgende Fragen stehen im Vordergrund des wissenschaftlichen Erkenntnis- interesses der Autoren:
- Ist es mo¨ glich, eine Typisierung und Kategorisierung von a¨hnlichen Regionen mit Hilfe von multivariaten statistischen Verfahren vorzunehmen?
- Wie und mit welchen Indikatoren kann man die Standortqualita¨t hinsichtlich der wirtschaftlichen Leistungsfa¨higkeit von Regionen messen?
- Wie ist der regionale Vergleich der Standortqualita¨t mit a¨hnlich typisierten Regio- nen im konkreten Falle durchzufu¨ hren?
Folgende Ziele dieser Arbeit ko¨ nnen formuliert werden:
- Auswahl geeigneter statistischer Verfahren durch den theoretischen und empiri- schen Vergleich verschiedener komplexer multivariater statistischer Verfahren, die in der Lage sind, vorgegebene Analyseregionen bezu¨ glich ihrer Ausgangssituation zu klassifizieren.
- Bestimmung einer konkreten empirischen Lo¨ sung hinsichtlich der genannten Pro- blemstellung.
- Beurteilung der Vor- und Nachteile dieser Verfahren und deren Klassifikationser- gebnisse untereinander.
- Bildung eines geeigneten Indikatorenmodells zur Analyse der Standortqualita¨t zur Beurteilung der wirtschaftlichen Leistungsfa¨higkeit.
- Empirische Durchfu¨ hrung und Interpretation eines Regionalvergleichs anhand der erzielten Ergebnisse.
1.3 Vorgehensweise
In Kapitel 2 werden theoretische U¨ berlegen angestellt, nach welchen Kriterien die Be- stimmung a¨hnlicher Regionen erfolgen kann.
Kapitel 3 dieser Arbeit entha¨lt eine theoretische Darstellung der in Kapitel 4 verwendeten statistischen Verfahren, die zum Zwecke zur Raumtypisierung geeignet sind. Dabei wer- den die vorgestellten Methoden jeweils anhand eines Beispiels verdeutlicht.
In Kapitel 4 wird die Typisierung der Raumordnungsregionen mit vier unterschiedlichen statistischen Verfahren durchgefu¨ hrt und deren Ergebnisse miteinander verglichen. Dabei wird ein geeignetes Klassfikations- und Typisierungsergebnis ausgewa¨hlt.
Die Bestimmung der Standortqualita¨t zur Beurteilung der wirtschaftlichen Leistungsfa¨higkeit von Regionen erfolgt in der Regel durch Indikatoren. In Kapitel 5 wird deshalb auf theo- retischer Basis ein idealtypisches Modell erarbeitet, das die Standortqualita¨t mit Hilfe von Indikatoren beschreibt.
In Kapitel 6 werden die zur Verfu¨ gung stehenden Indikatoren zu Standortfaktoren ver- dichtet, auf deren Basis ein Vergleich der Standortqualita¨t durchgefu¨ hrt wird. Dazu wird fu¨ r jede Region ein Wert bestimmt, so dass sie bezu¨ glich der betrachteten Standortfakto- ren in eine Rangordnung gebracht werden ko¨ nnen.
Die Aussagekraft einer solchen Rangordnung ha¨lt sich allerdings in Grenzen, da sich die Regionen bezu¨ glich ihres Ausgangssituation erheblich voneinander unterscheiden. Da- her sollen die Standortfaktoren (in Kapitel 7) und die Wirtschaftsstruktur (in Kapitel 8) der jeweiligen Regionen hinsichtlich ihrer charakteristischen Ausgangssituation analy- siert werden.
2 Konzeptioneller Rahmen zur Bestimmung a ¨ hnliche r Regionen
I n der Wissenschaft gilt der Grundsatz, dass nur Vergleichbares miteinan- ”
der verglichen werden sollte; um so mehr u¨ berrascht es, dass diese Anforde- rung immer wieder ausgeblendet wird oder sogar bewußt gegen sie verstoßen wird.“3
In vielen Studien, die sich mit der Analyse und Vergleichen von Regionen oder Sta¨dten bescha¨ftigen, wird nicht oder nur in ungenu¨ gendem Maße auf das Regionalisierungspro- blem eingegangen.
Hinter dem Regionalisierungsproblem verbirgt sich die Fragestellung, welche Art der Ab- grenzung von Regionen bezu¨ glich einer gegebenen Problemstellung vorzunehmen ist.
Im Gegensatz zum Diagnoseproblem im Bereich der Naturwissenschaften, in dem fest definierte Normen bestehen, sind bei raumwirtschaftlichen Diagnosen die zu analysie- renden Raumeinheiten nicht von vornerein fest definiert, sondern mu¨ ssen vielmehr erst abgegrenzt werden.
Im Prinzip handelt es sich bei Regionen lediglich um eine Zusammenfassung von Raum- punkten (basierend auf Gemeinden oder Kreisen). Man kann viele Arten von Regionsty- pen nennen, die in der Raumwissenschaft eine Rolle spielen. Neben den kleinsten Ana- lyseregionen, den Gemeinden, wird in empirischen Arbeiten oft auf Kreise und kreisfreie Sta¨dte oder auf die gro¨ ßeren Regierungsbezirke zuru¨ ckgegriffen, welche im europa¨ischen Kontext den NUTS-II4 Regionen entsprechen. Andere Regionstypen, wie Arbeitsmarkt-
oder Raumordnungsregionen, sind nicht nur nach rein institutionellen Gesichtspunkten definiert, sondern zeichnen sich durch ihren funktionalen Charakter aus.5
In vielen empirischen Arbeiten wird die Problematik der Abgrenzung von Regionen oft nicht explizit beru¨ cksichtigt, obwohl diese das Bewertungsergebnis selbst erheblich zu beeinflussen vermag.6
Als Beispiel kann die Bruttowertscho¨ pfung zu Marktpreisen je Einwohner herangezogen werden.7 Dazu werden die Werte dieses Leistungsindikators auf der Ebene aller kreisfrei- en Sta¨dte und Kreise erfaßt. Beispielsweise weist die kreisfreie Stadt Bayreuth dabei eine sehr hohe Bruttowertscho¨ pfung auf und liegt sogar noch vor der Stadt Stuttgart auf Rang 7 der 413 in die Betrachtung eingehenden Kreise und kreisfreien Sta¨dte. Der diese Stadt umgebende Landkreis Bayreuth dagegen liegt mit Rang 331 am unteren Tabellenende. Hieraus darf nun nicht geschlossen werden, dass die Stadt Bayreuth zwar ein Spitzenrei- ter in der Bruttowertscho¨ pfung ist, der Landkreis Bayreuth aber ein fo¨ rderungswu¨ rdiges
Problemgebiet. Die Betrachtung macht erst Sinn, wenn beru¨ cksichtigt wird, dass die Pendlerstro¨ me der im Landkreis Bayreuth wohnenden Bevo¨ lkerung das gute Abschneiden der Stadt Bayreuth durch ihre Mitwirkung erst ermo¨ glichen. Die Stadt und ihr Umland bilden also letzlich eine funktionale Einheit, die im Vergleich von Leistungserbringung,
Einkommenserzielung und auch bezu¨ glich aller anderen relevanten Versorgungseinrich- tungen stets zusammen betrachtet werden muß.8
Die Notwendigkeit der Lo¨ sung des Regionalisierungsproblems ”
wertungsbereichen, insbesondere bei Wertscho¨ pfungs- und Produktivita¨tsvergleichen, der
Analyse regionaler Wirtschaftsdynamik, Arbeitsmarktanalysen, der vergleichenden Be- urteilung der Dienstleistungsversorgung, aber auch bei Einscha¨tzungen der Freizeit- und Umweltqualita¨t.“9
Wenn entsprechend der Problemstellung das Regionalisierungsproblem zufriedenstellend gelo¨ st ist und geeignete Analyseregionen definiert sind, ergibt sich ein weiteres Problem. Die Bedeutung von Regionalvergleichen oder Standortrankings besteht vor allem dar- in, dass die politisch Verantwortlichen Hinweise darauf erhalten, wo die Sta¨rken und Schwa¨chen einer Region liegen. Es ist allerdings schwierig diese Sta¨rken und Schwa¨chen
grundlegend die Problematik. Im Anhang sind exemplarisch die unterschiedlichen Werte der Brutto- wertscho¨ pfung je Einwohner fu¨ r die Sta¨dte Erlangen und Schweinfurt und deren umliegende Landkreise aufgefu¨ hrt. Man ko¨ nnte aber auch beliebig viele andere Beispiele finden.
zu erkennen, wenn Regionen miteinander in Beziehung gesetzt werden, die eigentlich nicht miteinander zu vergleichen sind.
Problematisch ist z.B. die vergleichende Beurteilung der Kultur- und Freizeitmo¨ glich- keiten der Regionen Berlin und Altmark, da sich diese Regionen bezu¨ glich ihrer Ein- wohnerzahl und Bevo¨ lkerungsdichte wesentlich voneinander unterscheiden. Ein mit Ber- lin vergleichbares Versorungsangebot ist in der Region Altmark also schon aufgrund ihrer gegebenen Siedlungsstruktur nicht zu realisieren. Die Tatsache, dass jede Region u¨ber ih- re spezifischen Eigenschaften und Vor- und Nachteile verfu¨ gt, wird in vielen anderen Regionalvergleichen nicht ausreichend beru¨ cksichtigt.
Der Vergleich vieler Merkmale, wie etwa der Vergleich des Kultur- und Freizeitangebots, u¨ber ein Ranking ohne Beru¨ cksichtigung der speziellen Eigenschaften von Regionen, ist aus wissenschaftlicher Sicht problematisch. Daraus resultiert die Gefahr, dass durch die immer popula¨rer werdenden Stadt- und Regionalvergleiche10 ein falscher Eindruck u¨ ber das Attraktivita¨tsgefa¨lle von Sta¨dten und Regionen vermittelt wird, der sich bei den Wirt- schaftssubjekten bewußt oder unbewußt festsetzen kann. Durch die wachsende Flexibi-
lita¨t von Unternehmen und Arbeitnehmern ko¨ nnen sich die Ergebnisse solcher Rankings in Standortentscheidungen und Arbeitsplatzwahl negativ auf die jeweilige Region auswir- ken.11
Insofern mu¨ ssen Regionalvergleiche, die einen wissenschaftlichen Anspruch erheben wol- len, dieser Problematik Rechnung tragen. Aus diesem Grund nimmt der Versuch der Schaffung und Definition vergleichbarer Regionen in dieser Arbeit bewußt einen bedeu- tenden Teil ein.
“ vero¨ ffentlicht beispielsweise ja¨hrlich eine Besten-Liste mit 83 deutschen
FOCUS
Sta¨dten im Vergleich. Dabei wird ein Ranking erstellt, das die sie spezifischen Ausgangsbedingungen der Sta¨dte nicht beru¨ cksichtigt. Vgl. Focus Nr. 50, 11.12.2000, S. 270-282
2.1 Die Auswahl von Analyseregionen
Wa¨ hrend man fru¨ her der Auffassung war, daß Regionen quasi natu¨ rliche, ”
vorgegebene Einheiten seien, die es aufzufinden und zu identifizieren gilt, hat sich heute die Meinung durchgesetzt, daß Raumgliederungen immer zweck- bestimmt sind.“12
Will man Teilra¨ume einer Volkswirtschaft analysieren, mu¨ ssen solche Teilra¨ume zuna¨chst definiert werden.13 Es gibt praktisch unendlich viele Mo¨ glichkeiten, kleinste ra¨umliche Bausteine, wie etwa Gemeinden, zu Wirtschaftsra¨umen zusammenzufassen. Regionen sind also keine natu¨ rlich vorgegebene Raumeinheiten, sondern die Einteilung in Regionen soll immer dem Zwecke einer wissenschaftlichen Untersuchung untergeordnet sein. Die
thematische Einteilung in Regionen dient zuna¨chst vor allem der U¨ bersichtlichkeit, der
”
Informationsverdichtung und damit der leichteren Orientierung in der ra¨umlichen Umwelt“14.
Wie in dem Beispiel aus dem vorausgegangenen Abschnitt deutlich geworden ist, hat die Art der Abgrenzung der Aggregation von Teilra¨umen erheblichen Einfluss auf das endgu¨ ltige Klassifikationsergebnis.15 Aus diesem Grund soll im folgenden beispielhaft auf verschiedene Abgrenzungsmo¨ glichkeiten von Analyseregionen eingegangen werden.
Mit dem Begriff Region“ werden in den unterschiedlichsten Zusammenha¨ngen verschie- ”
dene Vorstellungen verbunden. Der Begriff der Region ergibt sich prima¨r aus der indivi- duellen Perspektive des Betrachters, wobei die Identifizierung einer regionalen Ebene in ho¨ chstem Maße von der spezifischen Fragestellung einer Untersuchung abha¨ngt. Auch wenn keine genaue Definition des Regionenbegriffs existiert und im tatsa¨chlichen Sprach- gebrauch recht fahrla¨ssig mit ihm umgegangen wird, empfiehlt es sich dennoch, zwischen deskriptiven und normativen Regionalbegriffen zu unterscheiden.16
Im deskriptiven Versta¨ndnis hat sich in der Wissenschaft und in der Praxis ”
des Aggregationsprinzips die Unterscheidung zwischen homogenen und funktionalen
D.1 im Anhang
gionen durchgesetzt“17. Dabei werden die Gebiete auf der Basis einer Bestandsanalyse so bestimmt, dass sie entweder nach ihren homogenen Strukturen oder nach funktiona-
len Verflechtungen charakterisiert werden ko¨ nnen. Wa¨hrend homogene Regionen sich
”
grundsa¨tzlich auf eine beliebige Sachdimension beziehen ko¨ nnen – diese wird in disjunkte
Klassen unterteilt und auf bestimmte Gebiete projiziert –, stellen funktionale Abgrenzun- gen zumeist auf o¨ konomische Gesichtspunkte (Bezugs-, Absatzverflechtungen) oder auf Daseinsgrundfunktionen (Wohnen, Arbeit, Bildung, Versorgung und Erholung) ab.“ 18 Normative Regionen basieren hingegen auf den Ergebnissen politischer Entscheidungen und zeichnen sich eher durch ihren planerischen und administrativen Charakter aus. Als Beispiel fu¨ r solche Planungsregionen ko¨ nnen die Regierungsbezirke genannt werden.
Versucht man bezu¨ glich einer gegebenen Problemstellung eine geeigneten Regionsebe- ne zu bestimmen, bietet sich als Orientierungshilfe fu¨ r viele Fragestellungen an, auf die im Raumordnungsgesetz definierten Zielvorgaben zuru¨ ckzugreifen. Ziel der Abgrenzung soll es demnach sein, die Raumordnungspolitik effizient zu unterstu¨ tzen19. Diese Bedin- gung ist dann erfu¨ llt, wenn die abgegrenzten ra¨umlichen Beobachtungseinheiten
1. eine zuverla¨ssige Diagnose und Prognose des regionalen Entwicklungsstandes er- lauben und
2. ra¨umliche Ausstrahlungseffekte regionalpolitischer Maßnahmen zum Ausdruck brin- gen.20
Abbildung in dieser Leseprobe nicht enthalten
Aus beiden genannten Anforderung resultiert das Ergebnis, dass Zentren zusammen mit ihrem Umland zu funktionalen Beobachtungseinheiten zusammengefaßt werden mu¨ ssen. Auch in der Literatur werden Analyseregionen mit funktionalem Charakter pra¨feriert.
den Regionsbegriff nicht als physischen Aus- ”
schnitt der Erdoberfla¨che (miss)zu verstehen, sondern als sozio-o¨ konomischen Verflech- tungsraum zu betrachten, der sich als lose verbundenes Netzwerk durch die gegenseitige Wahrnehmung der in ihm agierenden Akteure definiert“ 21.
2. Schutz, Pflege und Entwicklung der natu¨ rlichen Lebensgrundlagen sichert, 3. Gestaltungsmo¨ glichkeiten der Raumnutzung langfristig offenha¨lt und 4. gleichwertige Lebensbedingungen der Menschen in allen Teilra¨umen bietet oder dazu fu¨ hrt.
Bei der Auswahl geeigneter Analyseregionen muss jedoch ha¨ufig auf diese funktiona- le und der Problemstellung angepasste Einteilung der Untersuchungseinheiten verzichtet werden, weil Daten in der Regel nur auf administrativer Raumebene erhoben werden und nicht den funktional abgegrenzten Raumeinheiten angepasst werden ko¨ nnen. Als Bei- spiel dafu¨ r sei das regionale Bezugssystem der Europa¨ischen Union (NUTS) genannt. Es
wurde von Eurostat mit dem Ziel eingerichtet, ein einheitliches, koha¨rentes regionales
”
Raster fu¨ r eine Regionalstatistik der Europa¨ischen Union zu schaffen“ 22, auf dessen Basis
die sozio-o¨ konomische Analyse und die Festlegung der Regionalpolitik der Gemeinschaft erfolgen soll. Aus diesen Gru¨ nden und vor allem aus praktischen Gru¨ nden hinsichtlich
”
der Verfu¨ gbarkeit der Daten basiert die NUTS-Nomenklatur auf einer institutionellen Ein-
teilung der Mitgliedsla¨nder“23. Gerade diese Einteilung birgt die Problematik, dass sich die Analyseregionen in den unterschiedlichen La¨ndern hinsichtlich ihrer Gro¨ ße und an- derer grundlegender Merkmale stark voneinander unterscheiden ko¨ nnen. Betrachtet man
die NUTS-II-Ebene der Regionalnomenklatur von Eurostat, so umfaßt diese Ebene in
”
vielen Mitgliedsla¨ndern sehr große Beobachtungseinheiten mit Ausdehnungswerten von
u¨ber 70 km, in anderen La¨ndern - etwa den Benelux-Staaten - hingegen kleine Raumein- heiten mit Ausdehnungen unter 40 km Durchmesser“ 24. Somit ergeben sich zwangsla¨ufig
Nivellierungs- und Differenzierungseffekte, die einen Regionalvergleich gravierend ver- ”
zerren“25. An diesem Beispiel wird deutlich, dass eine wu¨ nschenswerte Abgrenzung von
Analyseregionen oft an praktischen Problemen, vor allem an der Datenlage und den insti- tutionellen Voraussetzungen, scheitert.
Um dieser Problematik entgegenzuwirken, wa¨re es wu¨ nschenswert, auf funktionale Be- obachtungseinheiten zuru¨ ckgreifen zu ko¨ nnen, die auch den Anforderungen der Raum- ordnungspolitik entgegenkommen. Eine problemada¨quate Regionalisierung ist beispiels- weise im Bereich der Wirtschaftsfo¨ rderung oder zur Beschreibung der regionalen Arbeitsmarktsituation unverzichtbar. Als geeignet werden in diesem Zusammenhang ”
u¨bereinstimmender Auffassung in der Literatur regionale Arbeitsma¨rkte, d.h. die Zusam-
menfassung von Arbeitsmarktzentren und ihrem Umland, angesehen“ 26. Die Abgrenzung von Arbeitsmarktregionen schla¨gt sich durch die funktionale Beziehung der Berufspend- lerverflechtungen zwischen sta¨dtischen Arbeitsmarktzentren und deren Umland nieder.
Nach Eckey gestatten derartige Regionen ”
setzma¨ßigkeiten und erlauben somit auch eine Regionalbewertung unter dem Aspekt in- terregionaler Wettbewerbsfa¨higkeit“27. Arbeitsmarktregionen sind ein gutes Beispiel fu¨ r eine funktionale Abgrenzung von Raumeinheiten.
Eine andere funktionale Gliederungsebene ist die der Raumordnungsregion, die in der Bundesrepublik seit 1982 fu¨ r die Zwecke der raumordnerischen Berichterstattung ver-
wendet wird. Es handelt sich hierbei um funktionale Regionen, die aus Kreisen zu- ”
sammengesetzt sind und leistungsfa¨hige zentrale Orte der obersten Stufe (Oberzentren) als Arbeitsmarkt- und Versorgungszentren aufweisen“.28 Die Tatsache, dass Raumord- nungsregionen aus Kreisen beziehungsweise kreisfreien Sta¨dten zusammengesetzt wer- den ko¨ nnen, ist nicht zuletzt in Bezug auf die Aggregation von Daten von Bedeutung. Raumordnungsregionen weisen zudem oft ra¨umliche U¨ bereinstimmungen mit Planungs- regionen auf. Da sie die funktionellen Verflechtungen nicht nur bezu¨ glich des Arbeits-
marktes, sondern auch hinsichtlich ihrer Funktion als Versorgungszentrum, beispielswei- se fu¨ r Dienstleistungen und Kultur und Freizeit, wahrnehmen sollen, sind Raumordnungs- regionen in der Regel weiter gefaßt als Arbeitsmarktregionen. Sie stellen von ihrer Gro¨ ße her eine Zwischenstufe funktionellen Charakters zwischen den Regierungsbezirken und
den Stadt- und Landkreisen dar, die in der empirischen Regionalforschung breite Verwen- dung gefunden hat.29
Aufgrund ihrer Beru¨ cksichtigung der funktionalen Verflechtungen halten wir Raumord- nungsregionen fu¨ r eine geeignete Abgrenzung zur Analyse der Standortqualita¨ten von Regionen. Daher soll im Folgenden auf das Zustandekommen und die Zusammensetzung von Raumordnungsregionen eingegangen werden.
In den 70er Jahren wurde an einem Konzept von ausgeglichenen Funktionsra¨umen gear- beitet30, die in U¨ bereinstimmung mit den Zielen der Raumordnungspolitik stehen sollten.
hat unter den Verfechtern des Konzepts der ausgeglichenen Funk- ”
tionsra¨ume zu der U¨ berzeugung gefu¨ hrt, dass ein großra¨umiger Disparita¨tenausgleich
verha¨ltnisma¨ßig großgeschnittene Ra¨ume, und zwar im Prinzip oberzentrale Regionen, erfordere“31. Im Rahmen der Neuordnung der Raumordnungsregionen, die durch die
Einbeziehung der Neuen La¨nder notwendig wurde, sind auch einige Vera¨nderungen in den Alten La¨ndern vorgenommen worden. Diese A¨ nderung tra¨gt der Tatsache Rechnung, dass gerade die funktionale Raumgliederung keine feste Struktur darstellt, sondern sich im
Laufe der Zeit unter sich vera¨ndernden Rahmenbedingungen entwickeln kann. Will man allerdings Raumordnungsregionen u¨ber die Zeit hinweg analysieren, treten zwangsla¨ufig Probleme auf.
Die aus der Diskussion resultierenden 75 Raumordnungsregionen der alten Bundesla¨nder
wurden als geeignetes Bezugssystem angesehen, da sie nahezu alle u¨ ber ein leistungsfa¨higes
”
Oberzentrum und in jedem Falle u¨ ber ein Netz von Mittelzentren verfu¨ gen“ 32. Die Raum-
ordnungsregionen stellen zwar nicht fu¨ r alle Fragestellungen das ideale Bezugssystem dar, doch bilden sie ein fla¨chendeckendes System von akzeptablem Kompromißcha-
”
rakter, so dass die Frage nach einer praktikablen Dimension der ausgeglichenen Funkti-
onsra¨ume vorerst befriedigend beantwortet ist“ 33. Unter Einbeziehung der Neuen La¨nder gibt es seit dem 1.6.1996 in Deutschland 97 Raumordnungsregionen.34
2.2 Bestimmung von
a ¨ hnlichen Regionen anhand ihres
Standortpotentials
Nach der Auswahl der Analyseregionen stellt sich die Frage, wie diese Regionen bezu¨ glich der Aufgabenstellung miteinander verglichen werden ko¨ nnen. Ziel ist es, die Standort- qualita¨t unter besonderer Beru¨ cksichtigung der wirtschaftlichen Leistungsfa¨higkeit von Regionen zu beurteilen. Wie wir in der Einleitung des Kapitels bereits festgestellt haben, ist eine ada¨quate Beschreibung und der Vergleich der wirtschaftlichen Leistungsfa¨higkeit von Regionen nur dann sinnvoll, wenn auf die spezifischen Strukturen der jeweiligen Re- gionen Ru¨ cksicht genommen wird.
Ein Regionalvergleich, der ausschließlich ergebnisorientiert ist, gibt wenig Auskunft u¨ ber
die hinter diesen Ergebnissen stehenden Ursachen des aufgezeigten Entwicklungsstands.
Man muss von der Mo¨ glichkeit ausgehen, dass eine Region durchaus u¨ ber attraktive ”
Entwicklungspotentiale verfu¨ gt, die sich aber aufgrund noch stattfindender struktureller Anpassungsprozesse bislang nicht in den Ergebnissen niederschlagen“ 35.
Es wird also gefordert, dass nur a¨hnliche Regionen miteinander verglichen werden sol- len. Ausgehend von dieser Forderung stellt sich die Frage, nach welchen Ansa¨tzen und Kriterien die A¨ hnlichkeit einer Region mit anderen Regionen definiert oder beschrieben werden kann.
Aus der regionalo¨ konomischen Literatur werden exemplarisch zwei Ansa¨tze ausgewa¨hlt, in denen versucht wird, das Entwicklungspotential von Regionen durch geeignete Poten- tialfaktoren zu beschreiben. Dem Jahresgutachten des Sachversta¨ndigenrats zur Begut- achtung der gesamtwirtschaftlichen Entwicklung (1999) zufolge ist, nach theoretischen
und empirischen Ansa¨tzen der Regionalo¨ konomie, die Ausstattung mit Potentialfakto-
”
ren Grundlage fu¨ r das Wachstum sowie fu¨ r die qualtitative Entwicklung einer Region“ 36.
Charakteristisch fu¨ r diese Potentialfaktoren ist, dass sie in einer Region gebunden sind und sich demnach durch einen hohen Grad an Immobilita¨t auszeichnen. Damit einherge-
”
hend charakterisieren sich Potentialfaktoren durch ein relativ hohes Maß an Unteilbarkeit;
sie passen sich bei Vera¨nderungen, so bei Nachfrageverschiebungen, nicht gleich an. Al- lerdings nehmen mit gro¨ ßer werdendem Beobachtungszeitraum die Immobilita¨t und die Unteilbarkeit der meisten Potentialfaktoren ab“ 37.
Als Potentialfaktoren werden anhand dieser Eigenschaften die Produktionsfaktoren Ar- beit und Kapital, die sektorale Wirtschaftsstruktur, die geographische Lage und Agglo- merationseffekte genannt. Eine ungenu¨ gende Ausstattung einer Region mit einzelnen Potentialfaktoren kann zum Engpaß fu¨ r die Entwicklung dieser Region werden.38
Eckey macht einen a¨hnlichen Vorschlag, indem er versucht, die o¨ konomische Leistungsfa¨higkeit von Regionen durch die Wirtschaftsstruktur, die Infrastruktur, die geographische Lage
und die Siedlungsstruktur zu beschreiben.39
Unter Infrastruktur versteht Eckey neben der kleinra¨umigen Ausstattung der Verkehrsin- frastruktur auch Elemente wie Kommunikation, Forschung und Entwicklung, Aus- und Weiterbildung, Ver- und Entsorgung sowie die Verfu¨ gbarkeit von Industrie- und Gewer- befla¨chen.40 41
Abbildung in dieser Leseprobe nicht enthalten
Dabei stellt er fest, dass einige von diesen Faktoren unvera¨nderbar sind (z.B. die Zen- tralita¨t der Lage innerhalb einer Volkswirtschaft) oder zumindest nur sehr langfristig zu a¨ndern sind (etwa die Gro¨ ße des Zentrums oder die Einwohnerdichte einer Region), wa¨hrend andere Faktoren wie die Infrastruktur mittelfristig durch die Politik beeinflussbar
Erstere ”
dru¨ cken das Standortpotential von Wirtschaftsra¨umen aus und heißen
deswegen Potentialfaktoren“42.
Sowohl das Jahresgutachten als auch Eckey betonen die Immobiltita¨t und Unteilbarkeit als wichtige Eigenschaften von Potentialfaktoren.
Es bietet sich daher grundlegend an, zur Identifikation von a¨hnlichen Regionen auf Fakto- ren zuru¨ ckzugreifen, die mittel- oder langfristig nicht oder nur bedingt vera¨nderbar sind. In Anlehnung an Eckey werden von den Autoren als geeignete Merkmale die Siedlungs- struktur und geographische Lage angesehen, die zur Beschreibung der Ausgangssituati- on der Raumordnungsregionen im Sinne eines Potentialansatzes herangezogen werden ko¨ nnen. Im weiteren Verlauf der Arbeit sollen unter dem Begriff Standortpotential die geographische Lage sowie die Siedlungsstruktur von Regionen zusammengefasst wer- den. Die Beschra¨nkung auf rein geographische und demographische Gesichtspunkte bei der Beschreibung des Standortpotentials ist sicher nicht unumstritten und kann in anderen Zusammenha¨ngen noch durch weitere geeignete Indikatoren erga¨nzt werden. Allerdings ist, wie auch schon bei der Auswahl einer geeigneten Analyseregion, der Problemstel-
lung Rechnung zu tragen. Gerade im Hinblick auf die Einbeziehung der Raumordnungs- regionen der Neuen La¨nder ist es sinnvoll, bei der Bestimmung des Standortpotentials mit der Anzahl der miteinzubeziehenden Einflußfaktoren vorsichtig umzugehen. Da die Regionen in den Neuen Bundesla¨ndern nach der Wiedervereinigung bezu¨ glich ihrer wirt- schaftlichen Leistungsfa¨higkeit sicher immer noch nicht das Niveau der Alten La¨nder erreicht haben, ka¨me es schon bei der Bestimmung von potentiell a¨hnlichen Regionen zu gravierenden Unterschieden zwischen Ost- und Westdeutschland. Deswegen erscheint es sinnvoller als Potentialfaktoren ausschließlich solche Gro¨ ßen zu verwenden, die auch langfristig kaum vera¨nderbar sind und nicht oder zumindest nicht kurz- oder mittelfristig den Mo¨ glichkeiten der politischen Einflußnahme unterliegen.
Mit diesen Potentialfaktoren bietet es sich an, eine Clusteranalyse durchzufu¨ hren, die all jene Raumordnungsregionen in Klassen vereinigt, deren Standortpotential vergleich- bar ist. In einem zweiten Schritt ko¨ nnen dann alle Regionen, die dem gleichen Clu- ster angeho¨ ren, also unter Beru¨ cksichtigung des ermittelten Standortpotentials, bezu¨ glich anderer Merkmalsauspra¨gungen von Regionen na¨her untersucht werden. In unserem Fall sind dies ausgewa¨hlte Standortfaktoren zur Beschreibung der wirtschaftlichen Lei- stungsfa¨higkeit der Regionen.
In den folgenden zwei Kapiteln werden die statistischen Clusterverfahren vorgestellt und angewendet, mit denen a¨hnliche Regionen bestimmt werden ko¨ nnen.
Kapitel 3
Statistische Verfahren der Raumtypisierung
In diesem Kapitel werden die multivariaten statistischen Verfahren erla¨utert, die in Kapi- tel 4 zur Bestimmung von a¨hnlichen Raumordnungsregionen zum Einsatz kommen, und anhand von einfachen Beispielen veranschaulicht.
Bei diesen Verfahren handelt es sich um verschiedene Methoden der Clusteranalyse. Ne- ben hierarchischen Methoden, die in Regional- und Sta¨dtevergleichen in der Regel zur Anwendung kommen, werden auch Partionierungsmethoden vorgestellt. Fu¨ r die partio- nierende Verfahren haben die Autoren in den Regionalvergleichen kein konkretes An- wendungsbeispiel gefunden. Lediglich das Jahresgutachten des Sachversta¨ndigenrats43
verwendet letztere zur Validierung der Klassifikationsergebnisse der hierarchischen Clu- stermethode.
Die Einbeziehung eines theoretischen Methodenteils scheint sinnvoll, da auch multivaria- te Methoden Anwendung finden, die in den ga¨ngigen Lehrbu¨ chern nur vereinzelt erwa¨hnt werden. Dies trifft vor allem auf die Partitionierungsmethoden zu. Ein besonderes In- teresse wird darauf gelegt, welche Kriterien bei den verschiedenen Verfahren existieren, die die Anzahl der zu bildenden Cluster bestimmen. Eine solche automatisierte Fest- legung der Anzahl der Klassen kann als konkrete Empfehlung interpretiert werden und stellt einen Schritt in die Richtung einer Objektivierung der Raumtypisierung dar.
3.1 Datenstruktur
Nachdem die Auswahl geeigneter Daten bezu¨ glich einer gegebenen Problemstellung er- folgt ist, ko¨ nnen die Rohdaten zuna¨chst nicht in ihrem urspru¨ nglichen Zustand in die Analyse eingehen. Da die Daten meistens in unterschiedlichen Dimensionen vorliegen, ist es notwendig, die Rohdatenmatrix zu standardisieren, um die einzelnen Daten auf das gleiche Niveau zu bringen. Durch die Subtraktion des Mittelwerts a j eines Merkmals von dem jeweiligen Einzelwert a i j und der anschließenden Division mit der Standardabwei- chung s j des Merkmals j erha¨lt man die Datenmatrix Z mit den einzelnen standardisierten
Beobachtungswerten z i j:44
z i j
a i j a j
Abbildung in dieser Leseprobe nicht enthalten
(3.1)
Damit erhalten alle Merkmale einen Mittelwert von Null und eine Standardabweichung von Eins.
Um auszuschließen, dass mehrere Variablen die gleichen Aussagen beinhalten, sollten die Variablen vorab auf Korrelationen untersucht werden. Die einfache Korrelationsanalyse misst die Richtung und die Sta¨rke des Zusammenhangs von zwei Variablen. Dabei wird die direkte Beziehung zwischen den Variablen betrachtet. Es werden Korrealtionskoeffi- zienten ermittelt, die die gemeinsame Variation von zwei Merkmalen messen und sie in einem linearen Zusammenhang charakterisieren.
Die Einfachkorrelation deckt die lineare Abha¨ngigkeit zwischen zwei beliebigen Merk- malen auf. Dieser Zusammenhang wird durch den Korrelationskoeffizienten r xy gemes- sen, wobei x und y jeweils fu¨ r eine Spalte der Ausgangsdatenmatrix und somit fu¨ r ein Merkmal stehen:45
Abbildung in dieser Leseprobe nicht enthalten
Diese auch Bravais-Pearson-Korrealtionskoeffizient genannte Gro¨ ße ist definiert als nor- mierte Produktsumme von standardisierten Messungen und somit eine dimensionslose Gro¨ ße.
Fu¨ r empirische Analysen ist es ausreichend, nur eines von zwei stark miteinander korre- lierten Merkmalen zu verwenden. Bei der Auswahl ist die Festlegung des Grenzwertes fu¨ r den Korrelationskoeffizienten meist normativ, ha¨ufig wird ein Grenzwert zwischen 0,80 und 0,90 angesetzt.46 Dies fu¨ hrt automatisch zu einer Reduktion der Daten, was gerade bei großen Datensa¨tzen von Vorteil sein kann.
Im Rahmen der Bereitstellung und Aufbereitung von Daten zur weiteren Verwendung mit statistischen Verfahren ist darauf zu achten, dass zum einen die Datenmatrix stan- dardisiert ist und, dass die Rohdatenmatrix auf mo¨ gliche Korrelationen gepru¨ ft worden ist. Erst nach diesen Schritten ko¨ nnen die verschiedenen clusteranalytischen Verfahren angewendet werden.
3.2 Clusteranalyse
Als ein statistisches Instrument zur Kategorisierung umfangreicher Datenmengen kann die Clusteranalyse u¨berall dort Anwendung finden, wo es no¨ tig ist, gro¨ ßere Mengen von
”
Objekten unterschiedlicher Auspra¨gung in relativ homogene Untergruppen zusammenzu-
fassen“47. In der Regionalo¨ konomie stehen bestimmte Objekte, meist Regionen, Sta¨dte oder Gemeinden, zur Verfu¨ gung, die durch o¨konomische Indikatoren (Merkmale) charak- terisiert werden sollen.48
Ziel der Clusteranalyse ist es nun, die einzelnen Objekte, die durch die Auspra¨gung einer
”
Anzahl von Indikatoren beschrieben sind, so in Klassen zu gruppieren, dass sich die in
einer Klasse befindlichen Objekte mo¨ glichst a¨hnlich, die Klassen untereinander jedoch mo¨ glichst heterogen sind“49.
Die Anzahl der mo¨ glicher Klassifikationsverfahren, die im Rahmen einer Clusteranalyse durchgefu¨ hrt werden ko¨ nnen, ist sehr umfangreich.
Fu¨ r die Zwecke dieser Untersuchung werden zum einen Verfahren mit hierarchischer An- ordnung der Gruppen und zum anderen partitionierende Verfahren verwendet. Die metho- dische Vorgehensweise beider Verfahrenstypen soll im Folgenden vorgestellt und anhand einfacher Beispiele veranschaulicht werden.
3.2.1 Hierarchische Verfahren
Man unterscheidet zwei Gruppen von hierarchischen Verfahren:
- Agglomerative Verfahren und
- Divisive Verfahren
Agglomerative Verfahren starten mit N Gruppen, d.h. es bildet zuna¨chst jedes Objekt eine eigene Gruppe. Es wird nun schrittweise die Anzahl der Gruppen durch Vereinigung der zwei jeweils a¨hnlichsten Gruppen solange reduziert, bis nur noch eine einzige Gruppe exi- stiert. Divisive Verfahren starten dagegen mit einer Gruppe, in der alle Objekte vereinigt sind. Schrittweise werden nun Gruppen abgesplittet, so dass die Heterogenita¨t innerhalb der neuen Gruppen reduziert wird.
In der Praxis finden divisive Verfahren allerdings keine Anwendung. Dies la¨ßt sich durch die Tatsache erkla¨ren, dass bei divisiven Verfahren grundsa¨tzlich alle Teilmengen einer Gruppe untersucht werden mu¨ ssen. Der daraus resultierende u¨ berdurchschnittliche Re- chenaufwand war in der Vergangenheit aufgrund begrenzter Speicherkapazita¨ten mit Pro- blemen verbunden.50
Daher werden im Weiteren nur die agglomerativen Verfahren betrachtet.
Der Ablauf agglomerativer Verfahren kann durch folgenden Algorithmus beschrieben werden:
1. SCHRITT: Berechnung der Distanzen nach einer geeigneten Definition. Jedes Ob- jekt bildet eine eigene Klasse. Dazu wird im folgenden auf die einfache unquadrier- te euklidische Distanz zuru¨ ckgegriffen:51
1 2 (3.3)
2. SCHRITT: Festlegung der Klassen mit der minimalen Distanz zueinander. Diese Klassen werden miteinander verschmolzen.
3. SCHRITT: Wenn nur noch eine Klasse vorhanden ist, wird der Algorithmus beendet.
4. SCHRITT: Die oben verschmolzenen Klassen werden als neue Klasse betrachtet. Nun wird der Abstand der neu gewonnen Klasse mit den anderen Klassen bestimmt.
5. SCHRITT: Gehe solange zuru¨ ck zu Schritt 2 bis das Abbruchkriterium in Schritt 3 erreicht ist.
Die beiden Klassen mit der geringsten Distanz werden also zu einer neuen Klasse zusam- mengefaßt. Die einzelnen agglomerativen Verfahren unterscheiden sich nun dadurch, wie der zu bildende Abstand der jeweils verschmolzenen Klassen zu den den u¨ brigen Klassen definiert werden soll. In der Literatur stehen viele solcher Verfahren zur Auswahl. In der folgenden Tabelle sind die ga¨ngigsten hierarchisch agglomerativen Verfahren mit ihren spezifischen Eigenschaften aufgefu¨ hrt:52
Abbildung in dieser Leseprobe nicht enthalten
Beim Median Verfahren und beim Zentroid Verfahren werden die Distanzen unter Beru¨ cksichtigung
von Klassenschwerpunkten gebildet. Beide neigen zum Reversal-Pha¨nomen“, das
”
” die
Tatsache bezeichnet, dass eine im i-ten Schritt aus zwei Klassen gebildete neue Klasse
homogener ist als zumindest eine der beiden Klassen vor der Vereinigung“ 53.
Beim Single-Linkage Verfahren ist der kleinste Abstand die charakteristische Distanz zwischen den Gruppen. Dadurch ist es auch geeignet, Ausreißer in einer Datenmenge zu erkennen. Der große Nachteil des Single-Linkage Verfahrens ist seine Neigung zur
Abbildung in dieser Leseprobe nicht enthalten
Kettenbildung. Solche Verkettungen fu¨ hren ”
cher Gruppen (gemessen an der Zahl der Mitglieder), wa¨hrend andere Cluster nur wenige
Raumeinheiten enthalten“54.
Das Complete-Linkage Verfahren berechnet die Distanz der jeweils am entferntesten lie-
genden Klassenelemente. Im Gegensatz zum Single-Linkage Verfahren tendiert es ” Bildung sehr kompakter, in sich homogener Typen, da es die A¨ hnlichkeit der una¨hnlichsten
Paare maximiert“55.
Bei allen Verfahren wird implizit erreicht, dass die gebildeten Cluster mo¨ glichst homogen sind, wa¨hrend die Una¨hnlichkeit zwischen verschiedenen Clustern mo¨ glichst groß ist.
In der Literatur findet oft das WARD-Verfahren Anwendung. Da dieses Verfahren aber nicht in S-Plus integriert ist, wird im folgenden das Complete-Linkage-Verfahren vor- gezogen, da es genauso wie das WARD-Verfahren zur Klassenbildung mit gleicher Ob- jektanzahl neigt und im Gegensatz zum Single-Linkage-Verfahren nicht zu sogenannten Verkettungen fu¨ hrt.
Um die Unterschiede des Single-Linkage- und des Complete-Linkage-Verfahrens zu ver-
deutlichen, sollen beide Verfahren exemplarisch an einem kleinen Beispiel dargestellt werden. Dazu wurden sechs aussagekra¨ftige“ Regionen aus dem folgenden empirischen
”
Teil der Arbeit ausgewa¨hlt. Diese sind die Regionen Mu¨ nster (1), Bielefeld (2), Duis-
burg/Essen (3), Bonn (4), Rhein-Main (5) und Du¨ sseldorf (6). Die Verfahren werden anhand demographischer und geographischer Variablen durchgefu¨ hrt, die auch spa¨ter bei der endgu¨ ltigen Klassifizierung Anwendung finden werden. Es handelt sich dabei um die absolute Bevo¨ lkerungszahl (Bev.), die Bevo¨ lkerungszahl im Oberzentrum (Bev. OZ) und die Bevo¨ lkerungsdichte im Umland (Bev. Umland), sowie um die Erreichbarkeit al- ler europa¨ischen Agglomerationen im Luftverkehr (Luft), die Erreichbarkeit der na¨chsten drei Agglomerationen im PKW-Verkehr (PKW) und die Erreichbarkeit von Inter-City-
Einstiegspunkten des Bahnverkehrs (IC).56
Die Originaldaten der exemplarisch ausgewa¨hlten Regionen sind in folgender Tabelle dar- gestellt:
Abbildung in dieser Leseprobe nicht enthalten
Nach der Standardisierung der Daten wird die Distanzmatrix mit Hilfe der einfachen eu- klidischen Distanz berechnet:
Das Ergebnis der Analyse ist die Darstellung im Dendrogramm. Auf Basis der in der Di- stanzmatrix ermittelten Werte erfolgt die Trennung der einzelnen Klassen. Je kleiner der Wert zweier Objekte in der Distanzmatrix ist, desto a¨hnlicher sind sich die zugeho¨ rigen Objekte und werden zu einer neuen Klasse verschmolzen. Das folgende Dendrogramm wurde nach dem Single-Linkage Verfahren erstellt:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3.1: Dendrogramm; Clustering mit Single-Linkage
Betrachtet man die Distanzmatrix, so werden die Regionen zuerst miteinander verschmol- zen, die die geringste Distanz zueinander aufweisen. Man kann deutlich die Bildung eines Clusters erkennen, in dem sich Bielefeld (1) und Mu¨ nster (2) befinden, die in der Distanz- matrix mit 0,243 den kleinsten Wert aufweisen.
Nach dem Complete-Linkage Verfahren erha¨lt man folgendes Dendrogramm:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3.2: Dendrogramm; Clustering mit Complete-Linkage
Vergleicht man das Dendrogramm nach dem Single-Linkage Verfahren mit dem des Complete- Linkage Verfahrens, so la¨ßt sich gut die Neigung zur Kettenbildung beim ersteren und andererseits die Neigung des Complete-Linkage Verfahrens zur Bildung gleich großer Klassen erkennen.
Um die Anzahl der zu bildenden Cluster bestimmen zu ko¨ nnen, empfiehlt sich die Be- trachtung eines Struktogramms:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3.3: Struktogramm; Clustering mit Complete Linkage
Das Struktogramm zeigt die Gro¨ ße des minimalen Distanzmaßes bei jedem Fusionsschritt auf. Die ansteigende Kurve weist ha¨ufig einen Knick nach oben auf, der darauf hindeutet, dass durch die Vergro¨ ßerung der Distanz immer heterogenere Klassen zusammengefaßt werden. Da dies nicht gewu¨ nscht wird, sollten ab dieser Stelle keine weitere Fusionierung vorgenommen werden, womit sich die Anzahl der zu bildenden Cluster ergibt. Natu¨ rlich ha¨ngt die Anzahl der Cluster auch von der Interpretation des Struktogramms ab. In diesem Fall erkennt man an der Stelle des vierten Fusionsschrittes einen deutlichen Knick nach
oben, der auf eine Wahl von vier Clustern hindeutet, und so einen deutlichen U¨ bergang
von homogeneren und heterogeneren Klassen beschreibt.
Mit Hilfe der kophenetischen Matrix kann die Gu¨ te einer hierarchischen Clusteranalyse bestimmt werden. Die kophenetische Matrix ist die Distanzmatrix, die sich aus dem Den- drogramm ergibt. Dabei wird der Korrelationskoeffizient zwischen den Elementen der kophenetischen Matrix und den Elementen der verwendeten Distanzmatrix bestimmt. Je gro¨ ßer der Korrelationskoeffizient dieser Pru¨ fgro¨ ße ausfa¨llt, desto besser wird die Aus- gangslage nach der Anwendung des Clusteralgorithmus beschrieben. Fu¨ r unser Beispiel ergeben sich fu¨ r die einzelnen Verfahren folgende Korrelationskoeffizienten:
- Single- Linkage: 0,7602992
- Complete- Linkage: 0,8089639
Das Complete-Linkage Verfahren spiegelt die Ausgangslage nach der erfolgten Cluste- rung also besser wieder als das die Clusteranalyse nach dem Single-Linkage Verfahren, so dass man sich in diesem Fall fu¨ r das Complete-Linkage Verfahren entscheidet. Da ge- rade bei einer Betrachtung einer gro¨ ßeren Anzahl von Objekten die Neigung des Single- Linkage Verfahrens zur Kettenbildung von großem Nachteil ist, wird im empirischen Teil auf das Complete-Linkage Verfahren zuru¨ ckgegriffen.
3.2.2 Partionierungsmethoden
Neben den hierarchischen existieren in der Klassifikationstherorie partionierende Cluster- methoden.
Partionierungsmethoden teilen die m Objekte auf eine vorher festgelegte Anzahl von k Klassen beziehungsweise Cluster auf.57 Dazu muß jede Klasse mindestens ein Objekt enthalten, und jedes Objekt muß zu genau einer Klasse geho¨ ren.58 Zur Aufteilung der
Objekte wa¨hlen die Partionierungsmethoden ein Clusterzentrum fu¨ r jede Gruppe mit dem Ziel aus, die Summe der quadrierten Distanzen zu jedem Objekt zu minimieren.59 Par- titionierende Verfahren versuchen durch Verlagerung der Objekte in ein anderes Cluster zu einer besseren Lo¨ sung zu gelangen. Die Verbesserung einer solchen Gruppenbildung wird durch das Varianzkriterium gemessen.60
Partionierungsmethoden verlangen – im Gegensatz zu den hierarchischen Clustermetho-
den –, dass die gewu¨ nschte Anzahl der k Klassen vorgegeben wird. Dadurch kann es vorkommen, dass die gewu¨ nschte Anzahl Klassen nicht zu sinnvollen“ Clustern fu¨ hrt,
”
und die Interpretation des Ergebnisses schwerfa¨llt. Aus diesem Grund sollten die Al-
gorithmen mit verschiedenen Werten von k durchlaufen werden, und diejenige Anzahl Klassen gewa¨hlt werden, deren Ergebnis sinnvolle Interpretation ermo¨ glicht. Die von uns
betrachteten Algorithmen bieten allerdings auch mathematische Kriterien fu¨ r die opti-
”
male“ Wahl der Klassenanzahl.
Fu¨ r die Typisierung und Klassifikation der Raumordnungsregionen kommen in Kapitel 4 zwei Partionierungsalgorithmen zur Anwendung. Dies ist zum einen Hartigan’s k-means- Algorithmus61 und zum anderen Kaufman’s und Rousseuw’s Partitioning Around Medo- ids (PAM) – auch k-medoid-Technik genannt62 –, die sich in der Wahl des Klassenzen- trums unterscheiden. Wa¨hrend k-mean s als Klassenzentrum den Mittelwert eines jeden Clusters berechnet, wa¨hlt P AM ein repra¨sentatives Objekt aus dem Datensatz als Zentrum fu¨ r jedes Cluster, das medoid genannt wird.
Beide Methoden sind in S-Plus integeriert63 und werden hier vorgestellt.
3.2.2.1 Hartigan’s k-means Algorithmus
Erste Referenzen zur k-means -Methode sind Forgy (1965) und MacQueen (1967). Beide Algorithmen starten mit einer vorgegeben Klasseneinteilung und verringern die Summe der quadrierten Distanzen.64 In Forgy’s Algorithmus werden alle Objekte simultan dem ihnen am na¨chsten liegenden Clusterzentrum zugeordnet, das Clusterzentrum wird neu berechnet und der Prozeß wiederholt. Dabei ko¨ nnen leere Cluster entstehen, also weni- ger als die vorher angegebene Anzahl von k Klassen vom Algorithmus gewa¨hlt werden. MacQueen’s Algorithmus unterscheidet sich von Forgy’s, indem er die Objekte einzeln nacheinander betrachtet und einer Gruppe zuweist. Dabei wird das Clusterzentrum jedes- mal neu berechnet, wenn ein Objekt einer Gruppe zugeordnet wird.
Ein bestimmter Algorithmus von Hartigan fu¨ r k-mean s ist in S-Plus integriert. Er ba- siert a¨hnlich wie Forgy’s Algorithmus auf der Verschiebung einzelner Objekte von einer Gruppe zu einer anderen.65
Ausgangspunkt fu¨ r Hartigan’s k-mean s -Algorithumus ist eine Initialpartition. Diese In- tialpartition kann beispielsweise aus einer vorgeschalteten hierarchischen Clusteranalyse resultieren.66 Fu¨ r jede Partition wird nun ein Fehler e berechnet, der definiert ist durch die Summe der quadrierten Distanzen von ihrem jeweiligen Clustermittelwert:67
[...]
1Klemmer (1995) S. 7
2Schmidt (1995a) S. 2
3nach Klemmer (1995) S. 19
4Nomenclature des Unites Statistiques
5siehe dazu Kapitel 2.1 Analyseregionen
6Klemmer (1995) S. 19f
7siehe Tabelle D.1 im Anhang, Quelle: Statistik Regional 1999, eigene Berechnungen, BWS je Einwoh- ner 1994
8Diese Unterschiede sind nicht nur auf das gewa¨hlte Beispiel begrenzt, sondern charakterisieren
9Klemmer (1995) S. 19
10Die Zeitschrift ”
11Vgl. auch Klemmer (1995) S. 7
12Bahrenberg (1988) S. 2 13Vgl. Eckey (1991b) S. 42 14Bahrenberg (1988) S. 2
15Die unterschiedlichen Auspra¨gungen der BWS je Einwohner in kreisfreien Sta¨dten und deren direkt umliegenden Landkreisen wu¨ rden sich bei einer großra¨umigeren Betrachtung relativieren. Siehe Tabelle
16Vgl. Wiechmann (2000) S. 174f
17Klemmer (1983) S. 19ff
18Wiechmann (2000) S. 174
19Nach §1 Raumordnungsgesetz ist die Struktur des Gesamtraumes der Bundesrepublik Deutschland so zu entwickeln, dass sie 1. der freien Entfaltung der Perso¨ nlichkeit in der Gemeinschaft am besten dient,
20Eckey (1991b) S. 42
21Wiechmann (2000) S. 1; zur Vertiefung siehe auch Kraemer (1975) S. 42-65
22Schmidt (1995b) S. 2 23Schmidt (1995b) S. 2 24Klemmer (1995) S. 20f 25Klemmer (1995) S. 21 26Eckey (1991b) S. 45
27Klemmer (1995) S. 51
28Sinz (1995) S. 807
29Vgl. dazu beispielsweise Irmen und Sinz (1991)
30bezu¨ glich den angestrebten Zielvorstellungen und Hintergru¨ nde des Konzepts vgl. Becker und Hunke (1975)
31Becker und Hunke (1975) S. 237
32Becker und Hunke (1975) S. 237
33Becker und Hunke (1975) S. 237
34Siehe Karte der Raumordnungsre gionen im Anhang
35Klemmer (1995) S. 49
36Sachversta¨ndigenrat (1999) S. 119
37Sachversta¨ndigenrat (1999) S. 119
38Vgl. Sachversta¨ndigenrat (1999) 120f
39Vgl. Eckey (1991a) S. 707
40Vgl. Eckey (1991a)
41Vgl. Eckey (1991a) S. 706
42Eckey (1991a) S. 706
43Sachversta¨ndigenrat (1999)
44Vgl. Backhaus, Erichson, Plinke und Schuchard-Ficher (1997) S. 73
45Vgl. Backhaus u. a. (1997) S. 87
46Vgl. Schmidt (1995a) S. 39
47Schmidt (1995a) S. 9
48Vgl. Ja¨necke (1975) S. 145f
49Schmidt (1995a) S. 10
50Da die Speicherkapazita¨ten heute kaum noch Probleme bereiten, kann man vermuten, dass divisive Verfahren in der Zukunft eine echte Alternative sein ko¨ nnen.
51Vgl. Backhaus u. a. (1997) S. 126f; na¨here Erla¨uterungen zu Distanzmaßen siehe Anhang A
52Nach Schmidt (1995a) S. 15f
53Schmidt (1995a) S. 15
54Bahrenberg, Giese und Nipper (1992) S. 285
55 Bahrenberg u. a. (1992) S. 286
56 Zur genaueren Beschreibung der Variablen vgl. Kapitel 4 und die Quellenangaben im Anhang.
57Vgl. Ripley (1996) S. 312
58Kaufman und Rousseuw (1990) S. 39; zusa¨tzlich gilt: k m und alle Objekte mu¨ ssen aufgeteilt werden
59Vgl. Ripley (1996) S. 312
60Vgl. Backhaus u. a. (1997) S. 152f
61Vgl. Hartigan (1975) S. 84ff
62Kaufman und Rousseuw (1990) S. 68ff
63in SPlus 3.0 und 4.0 durch den Aufruf der Cluster-Library
64Vgl. Ripley (1996) S. 312
65Vgl. Ripley (1996) S. 312
66Ripley (1996) S. 313
67Vgl. Hartigan (1975) S. 92
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.