Inhaltsverzeichnis
1 Einleitung 1
1.1 Vorbemerkungen 1
1.2 Problemstellung 2
1.3 Vorgehensweise 4
2 Konzeptioneller Rahmen zur Bestimmung ahnlicher Regionen 5
2.1 Die Auswahl von Analyseregionen 8
2.2 Bestimmung von ahnlichen Regionen anhand ihres Standortpotentials 13
3 Statistische Verfahren der Raumtypisierung 16
3.1 Datenstruktur 17
3.2 Clusteranalyse 19
3.2.1 Hierarchische Verfahren 19
3.2.2 Partionierungsmethoden 25
3.2.2.1 Hartigan’s k-means Algorithmus 26
3.2.2.2 Partitioning Around Medoids 32
4 Klassifikation von Raumordnungsregionen anhand ihres Standortpotentials 39
4.1 Datenauswahl Korrelationsanalyse 42
4.2 Die Klassifikationsverfahren und ihre Ergebnisse 46
4.2.1 Hierarchisches agglomeratives Clustering 46
4.2.2 Hierarchisches agglomeratives Clustering mit vorgeschalteter Fak-
torenanalyse 55
4.2.3 Partionierung mit Hartigans k-means 65
4.2.4 Partionierung mit PAM 70
4.3 Vergleich der Ergebnisse der Klassifikationsverfahren 77
5 Konzeptioneller Rahmen zur Beurteilung der Standortqualit at von Regionen 83
5.1 Indikatoren in der Regionalforschung 85
i
INHALTSVERZEICHNIS
5.2 Bildung eines Indikatorenkatalogs 88
5.2.1 Lage und Erreichbarkeit 89
5.2.2 Bev olkerung und Siedlungsstruktur 91
5.2.3 Wirtschaft 92
5.2.4 Arbeitsmarktbedingungen 94
5.2.5 Bildung und Qualifikation 95
5.2.6 Innovation 97
5.2.7 Lebensqualit at 100
5.3 Zusammenfassung und Kritik 103
6 Regionaler Vergleich der wirtschaftlichen Leistungsf ahigkeit 104
6.1 Auswahl der zur Verf ugung stehenden Indikatoren 105
6.2 Bildung von Standortfaktoren 108
6.3 Ranking der Standortqualit at 116
6.3.1 Gesamtranking 116
6.3.2 Ranking der einzelnen Standortfaktoren 120
6.3.2.1 Wirtschaft 121
6.3.2.2 Arbeitsmarkt 122
6.3.2.3 Zukunftspotential 123
6.3.2.4 Lebensqualit at 125
7 Vergleich der Standortfaktoren auf der Basis des Standortpotentials 127
7.1 Die Standortfaktoren zwischen den Clustern 129
7.2 Ost-West-Vergleich der Standortfaktoren innerhalb der Cluster 133
7.3 Die Standortfaktoren in den Verdichtungsregionen 135
8 Vergleich des Standortpotentials mit der Wirtschaftsstruktur 139
8.1 Darstellung der Ergebnisse zwischen den Clustern 142
8.2 Ost-West Vergleich innerhalb der Cluster 146
8.3 Die Wirtschaftstruktur der Verdichtungsregionen 149
9 Schlußbemerkung 158
Anhang 160
A Distanzmaße 160
B Hierarchisch divisives Clusterverfahren mit DIANA 162
ii
INHALTSVERZEICHNIS
C Bildung und ausf uhrliches Ranking der Standortfaktoren 165
C 1 Vollst andige Ergebnisse der Hauptkomponetenanylse bei der Bildung der
Standortfaktoren 165
C 2 Ausf uhrliches Ranking der Standortfaktoren 168
D Zus atzliche Tabellen 176
D 1 Beispiel Kapitel 2: Bruttowertsch opfung je Einwohner auf Kreisebene 177
D 2 Raumordnugnsregionen und ihre Bev olkerungs- und Siedlungsvariablen 177
E Quellenangaben der verwendeten Indikatoren 180
Literaturverzeichnis 186
iii
Abbildungsverzeichnis
3.1 Dendrogramm; Clustering mit Single-Linkage . . . . . . . . . . . . . . . 23 3.2 Dendrogramm; Clustering mit Complete-Linkage . . . . . . . . . . . . . 24 3.3 Struktogramm; Clustering mit Complete Linkage . . . . . . . . . . . . . 24 3.4 Darstellung des Klassfikationsergebnisses des k-means-Alogrithmus mit Hilfe von Hauptkomponenten . . . . . . . . . . . . . . . . . . . . . . . . 30 3.5 silhouette plot f¨ ur die Beispielrechnung mit PAM und 2 Klassen . . . . . 37
4.1 ¨ Uberblick ¨ uber M¨ oglichkeiten zur methodischen Vorgehensweise bei der Raumordnungsregion-Typisierung unter Verwendung multivariater statistischer Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.2 Pairsplot der Lage- und Siedlungsvariablen . . . . . . . . . . . . . . . . 43 4.3 Dendrogramm der hierarchisch agglomerativen Clusteranalyse . . . . . . 47 4.4 Struktogramm der hierarchisch agglomerativen Clusteranalyse . . . . . . 48 4.5 Biplot der Faktorladungen . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.6 Dendrogramm der hierarchisch agglomerativen Clusteranalyse mit vorgeschalteter Faktorenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.7 Struktogramm der hierarchisch agglomerativen Clusteranalyse mit vorgeschalteter Faktorenanalyse . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.8 Biplot der Klassifikation mit dem k-means-Algorithmus . . . . . . . . . . 68 4.9 silhouette plot der Klassifikation nach PAM mit 9 Klassen . . . . . . . . 72
7.1 Die Indikatoren in den Clustern (nach PAM) . . . . . . . . . . . . . . . . 130 7.2 Die Indikatoren in den Clustern (nach PAM) im Ost-West-Vergleich . . . 134 7.3 Regionalprofil: Die Indikatoren in den Clustern 6 und 9 (nach PAM) . . . 137
8.1 Die Standortquotienten der Wirtschaftsstruktur zwischen den einzelnen Clustern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 8.2 Die Standortquotienten in den Clustern im Ost-West-Vergleich . . . . . . 147 8.3 Besch¨ aftigtenentwicklung 1993-1997 in den westdeutschen verdichteten Regionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
iv
ABBILDUNGSVERZEICHNIS
8.4 Shift-Share-Analyse: Standort- und Strukturfaktoren . . . . . . . . . . . 156
B.1 Dendrogramm: Klassifizierung nach hierarchisch diversivsem Clustering mit DIANA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
v
Tabellenverzeichnis
4.1 Korrelationsmatrix der Lage- und Siedlungsvariablen . . . . . . . . . . . 44 4.2 Klassfikationsergebnis der hierarchisch agglomerativen Clusteranalyse . . 50 4.3 Charakterisierung des Klassifikationsergebnisses nach dem hierarchischen Clusterverfaren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.4 Der Anteil der erkl¨ arten Varianz bei unterschiedlicher Faktorenanzahl . . 56 4.5 Klassifikationsergebnis der hierarchisch agglomerativen Clusteranalyse mit vorgeschalteter Faktorenanalyse . . . . . . . . . . . . . . . . . . . . 61 4.6 Charakterisierung des Klassifikationsergebnisses nach dem hierarchischen Clusterverfaren mit vorgeschalteter Faktorenanalyse . . . . . . . . . . . . 63 4.7 Pr¨ ufgr¨ oße R zur Bestimmung der Anzahl Klassen beim k-means-Algorithmus 66 4.8 Klassifikationsergebnis mit k-means und 10 Klassen . . . . . . . . . . . . 67 4.9 Charakterisierung des Klassifikationsergebnisses nach dem k-means-Algorithmus 69 4.10 Klassifikationsergebnis und silhouette widths von PAM . . . . . . . . . . 73 4.11 Charaktiersierung der Klassfikation nach PAM . . . . . . . . . . . . . . . 75 4.12 Vergleich der Klassifikationsergebnisse . . . . . . . . . . . . . . . . . . 79 4.13 Ergebnis der Klassfikation mit PAM . . . . . . . . . . . . . . . . . . . . 82
6.1 Gesamtranking der Standortqualit¨ at . . . . . . . . . . . . . . . . . . . . 117
7.1 Das Ranking der Standortfaktoren in den Verdichtungsregionen . . . . . . 135
8.1 Besch¨ aftigtenentwicklung 1993-1997 . . . . . . . . . . . . . . . . . . . 140 8.2 Strukturelle Kennzahlen f¨ ur die Cluster . . . . . . . . . . . . . . . . . . 144 8.3 Strukturelle Kennzahlen f¨ ur die Neuen und Alten Bundesl¨ ander 1997 . . . 146 8.4 Besch¨ aftigtenentwicklung 1993-1997 in den Verdichtungsr¨ aumen und dem fr¨ uheren Bundesgebiet . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 8.5 Sektorale Besch¨ aftigtenanteile 1997 in den Verdichtungsr¨ aumen . . . . . 150 8.6 Ergebnisse der Shift-Share-Analyse f¨ ur die verdichteten Regionen . . . . 155
B.1 Klassfikationsergebnis mit hierarchisch divisiven Verfahren Diana . . . . 164
vi
TABELLENVERZEICHNIS
C.1 Ranking der Wirtschaft . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 C.2 Ranking des Zukunftpotentials . . . . . . . . . . . . . . . . . . . . . . . 170 C.3 Ranking der Arbeitsmarktbedingungen . . . . . . . . . . . . . . . . . . . 172 C.4 Ranking der Lebensqualit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . 174
D.1 Bruttowertsch¨ opfung je Einwohner 1994 auf der Ebene von Kreisen und kreisfreien St¨ adten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 D.2 Raumordnugnsregionen und ihre Bev¨ olkerungs- und Siedlungsvariablen . 178
vii
Kapitel 1
Einleitung
1.1 Vorbemerkungen
In den letzten Jahren gewinnen St¨ adte und Regionalvergleiche immer mehr an Beliebtheit. Dadurch gewannen solche Vergleiche auch in der ¨ offentlichen Wahrnehmung zunehmend an Bedeutung. Dabei besteht die Gefahr, dass sich durch diese Vergleiche in der ¨ offentlichen Meinung eine vorschnelle Einsch¨ atzung ¨ uber die Attraktivit¨ at von verschiedenen Regionen verfestigt, ” die als wissenschaftlich fundiert angesehen werden und
zu problematischen Einstufungen f¨ uhren, die auch Standortentscheidungen von Investoren und privaten Haushalten zu beeinflussen verm¨ ogen“ 1 . Eine weitere Funktion von Regionalvergleichen kann die Bestimmung und Legitimation von F¨ ordergebieten sein, beispielsweise im Rahmen der Definition von F¨ ordergebieten in der Europ¨ aischen Union. Die Ergebnisse, die aus solchen Regionalvergleichen resultieren, haben deswegen auch praktisch-politische Folgen mit ganz konkreten Auswirkungen in der Realit¨ at. Schon aus diesem Grund ist es notwendig, sich explizit mit den Anforderungen und Vorgehensweisen solcher Regionalvergleiche auseinanderzusetzten.
Die vorliegende Arbeit ist konzipiert als empirischer Beitrag zur Diskussion der Anwendbarkeit komplexer statistischer Verfahren im regional¨ okonomischen Bereich der Raumtypisierung. Darauf aufbauend soll in einem weiteren Schritt die ¨ okonomische Leistungsf¨ ahigkeit von Regionen herausgearbeitet werden.
1 Klemmer (1995) S. 7
1
KAPITEL 1. EINLEITUNG
1.2 Problemstellung
Die Bestimmung der Standortqualit¨ at von Regionen bez¨ uglich ihrer wirtschaftlichen Leistungsf¨ ahigkeit erfolgt in der Regel durch die Einbeziehung einer Vielzahl von Indikatoren, die in der Lage sind, die Standortqualit¨ at ad¨ aquat zu beschreiben. In vielen empirischen Regionalvergleichen werden auf Basis dieser Vorgehensweise alle betrachteten Regionen in ein Gesamtranking gebracht.
Als eines der gr¨ oßten methodischen Defizite bei solchen Regionalvergleichen sehen die Autoren das Vers¨ aumnis an, dass oftmals Regionen miteinander in Beziehung gesetzt werden, die bez¨ uglich ihrer Ausgangssituation nur bedingt miteinander vergleichbar sind. Die Ergebnisse eines solchen Rankings k¨ onnen nur dann Aufschl¨ usse ¨ uber die St¨ arken
und Schw¨ achen von Regionen geben, wenn andere Regionen zu Vergleichszwecken herangezogen werden, die auch prinzipiell miteinander vergleichbar sind. So scheint es aus naheliegenden Gr¨ unden nicht sinnvoll zu sein, Berlin mit der Region Altmark zu vergleichen.
Eine solches Gesamtranking befriedigt zwar die menschliche Neugier, ist aber aus wissenschaftlicher Sicht problematisch, da jede Region charakteristische Eigenschaften hinsichtlich ihrer Ausgangssituation besitzt.
Insofern sollte man den Vergleich der Standortqualit¨ at von Regionen um sogenannte Potentialanalysen erweitern, die die Ausgangssituation von Regionen ber¨ ucksichtigen. Dabei stellt sich die Frage, wie Regionen hinsichtlich bestimmter Merkmale und Eigenschaften kategorisiert werden k¨ onnen.
In der Praxis wird dazu meist auf die sogenannten Schwellenwertmethode zur¨ uckgegriffen. Dabei werden bez¨ uglich geeigneten Kriterien Schwellen festgelegt, nach denen eine Region einer Gruppe zugeordnet wird oder nicht. Daraus resultiert ein grobes, tabellenartiges Klassfikationsschema, in das die Regionen je nach Auspr¨ agung der Merkmale eingeordnet werden. Die Festlegung der Schwellenwerte hat den Vorteil, dass die Typisierungsergebnisse leicht nachvollziehbar sind. Andererseits unterliegt diese Art der Einteilng einem stark normativen Element, da eine solche Einteilung auf Erfahrungswerten basiert und willk¨ urliche Elemente nicht ausgeschlossen werden k¨ onnen. Zudem ist bei dieser Methode die Anzahl der Merkmale meist auf zwei oder drei beschr¨ ankt. Im Gegensatz zur Schwellenwertmethode stellt die Stastitik Methoden zur Verf¨ ugung, die die Einbeziehung vieler Merkmale erlauben und einen automatisierten Prozeß der Regionstypisierung erm¨ oglichen. ” Dadurch scheint eine Objektivierung der Kategorisie-
rung m¨ oglich und eine willk¨ urliche Grenzziehung wie bei der Schwellenwertmethode
2
KAPITEL 1. EINLEITUNG
entf¨ allt“ 2 .
Daher stehen folgende Fragen stehen im Vordergrund des wissenschaftlichen Erkenntnisinteresses der Autoren:
• Ist es m¨ oglich, eine Typisierung und Kategorisierung von ¨ ahnlichen Regionen mit
Hilfe von multivariaten statistischen Verfahren vorzunehmen?
• Wie und mit welchen Indikatoren kann man die Standortqualit¨ at hinsichtlich der wirtschaftlichen Leistungsf¨ ahigkeit von Regionen messen?
• Wie ist der regionale Vergleich der Standortqualit¨ at mit ¨ ahnlich typisierten Regionen im konkreten Falle durchzuf¨ uhren?
Folgende Ziele dieser Arbeit k¨ onnen formuliert werden:
• Auswahl geeigneter statistischer Verfahren durch den theoretischen und empirischen Vergleich verschiedener komplexer multivariater statistischer Verfahren, die in der Lage sind, vorgegebene Analyseregionen bez¨ uglich ihrer Ausgangssituation zu klassifizieren.
• Bestimmung einer konkreten empirischen L¨ osung hinsichtlich der genannten Problemstellung.
• Beurteilung der Vor- und Nachteile dieser Verfahren und deren Klassifikationsergebnisse untereinander.
• Bildung eines geeigneten Indikatorenmodells zur Analyse der Standortqualit¨ at zur Beurteilung der wirtschaftlichen Leistungsf¨ ahigkeit.
• Empirische Durchf¨ uhrung und Interpretation eines Regionalvergleichs anhand der erzielten Ergebnisse.
2 Schmidt (1995a) S. 2
3
KAPITEL 1. EINLEITUNG
1.3 Vorgehensweise
In Kapitel 2 werden theoretische ¨ Uberlegen angestellt, nach welchen Kriterien die Bestimmung ¨ ahnlicher Regionen erfolgen kann.
Kapitel 3 dieser Arbeit enth¨ alt eine theoretische Darstellung der in Kapitel 4 verwendeten statistischen Verfahren, die zum Zwecke zur Raumtypisierung geeignet sind. Dabei werden die vorgestellten Methoden jeweils anhand eines Beispiels verdeutlicht.
In Kapitel 4 wird die Typisierung der Raumordnungsregionen mit vier unterschiedlichen statistischen Verfahren durchgef¨ uhrt und deren Ergebnisse miteinander verglichen. Dabei wird ein geeignetes Klassfikations- und Typisierungsergebnis ausgew¨ ahlt.
Die Bestimmung der Standortqualit¨ at zur Beurteilung der wirtschaftlichen Leistungsf¨ ahigkeit von Regionen erfolgt in der Regel durch Indikatoren. In Kapitel 5 wird deshalb auf theoretischer Basis ein idealtypisches Modell erarbeitet, das die Standortqualit¨ at mit Hilfe von Indikatoren beschreibt.
In Kapitel 6 werden die zur Verf¨ ugung stehenden Indikatoren zu Standortfaktoren verdichtet, auf deren Basis ein Vergleich der Standortqualit¨ at durchgef¨ uhrt wird. Dazu wird f¨ ur jede Region ein Wert bestimmt, so dass sie bez¨ uglich der betrachteten Standortfaktoren in eine Rangordnung gebracht werden k¨ onnen.
Die Aussagekraft einer solchen Rangordnung h¨ alt sich allerdings in Grenzen, da sich die Regionen bez¨ uglich ihres Ausgangssituation erheblich voneinander unterscheiden. Daher sollen die Standortfaktoren (in Kapitel 7) und die Wirtschaftsstruktur (in Kapitel 8) der jeweiligen Regionen hinsichtlich ihrer charakteristischen Ausgangssituation analysiert werden.
4
Kapitel 2
Konzeptioneller Rahmen zur
Bestimmung ¨ ahnlicher Regionen
In der Wissenschaft gilt der Grundsatz, dass nur Vergleichbares miteinan-
”
der verglichen werden sollte; um so mehr ¨ uberrascht es, dass diese Anforde-
rung immer wieder ausgeblendet wird oder sogar bewußt gegen sie verstoßen wird.“ 3
In vielen Studien, die sich mit der Analyse und Vergleichen von Regionen oder St¨ adten besch¨ aftigen, wird nicht oder nur in ungen¨ ugendem Maße auf das Regionalisierungsproblem eingegangen.
Hinter dem Regionalisierungsproblem verbirgt sich die Fragestellung, welche Art der Abgrenzung von Regionen bez¨ uglich einer gegebenen Problemstellung vorzunehmen ist. Im Gegensatz zum Diagnoseproblem im Bereich der Naturwissenschaften, in dem fest definierte Normen bestehen, sind bei raumwirtschaftlichen Diagnosen die zu analysierenden Raumeinheiten nicht von vornerein fest definiert, sondern m¨ ussen vielmehr erst abgegrenzt werden.
Im Prinzip handelt es sich bei Regionen lediglich um eine Zusammenfassung von Raumpunkten (basierend auf Gemeinden oder Kreisen). Man kann viele Arten von Regionstypen nennen, die in der Raumwissenschaft eine Rolle spielen. Neben den kleinsten Analyseregionen, den Gemeinden, wird in empirischen Arbeiten oft auf Kreise und kreisfreie St¨ adte oder auf die gr¨ oßeren Regierungsbezirke zur¨ uckgegriffen, welche im europ¨ aischen Kontext den NUTS-II 4 Regionen entsprechen. Andere Regionstypen, wie Arbeitsmarkt-
3 nachKlemmer (1995) S. 19
4 Nomenclature des Unites Statistiques
5
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
oder Raumordnungsregionen, sind nicht nur nach rein institutionellen Gesichtspunkten definiert, sondern zeichnen sich durch ihren funktionalen Charakter aus. 5 In vielen empirischen Arbeiten wird die Problematik der Abgrenzung von Regionen oft nicht explizit ber¨ ucksichtigt, obwohl diese das Bewertungsergebnis selbst erheblich zu beeinflussen vermag. 6
Als Beispiel kann die Bruttowertsch¨ opfung zu Marktpreisen je Einwohner herangezogen werden. 7 Dazu werden die Werte dieses Leistungsindikators auf der Ebene aller kreisfreien St¨ adte und Kreise erfaßt. Beispielsweise weist die kreisfreie Stadt Bayreuth dabei eine sehr hohe Bruttowertsch¨ opfung auf und liegt sogar noch vor der Stadt Stuttgart auf Rang 7 der 413 in die Betrachtung eingehenden Kreise und kreisfreien St¨ adte. Der diese Stadt umgebende Landkreis Bayreuth dagegen liegt mit Rang 331 am unteren Tabellenende. Hieraus darf nun nicht geschlossen werden, dass die Stadt Bayreuth zwar ein Spitzenreiter in der Bruttowertsch¨ opfung ist, der Landkreis Bayreuth aber ein f¨ orderungsw¨ urdiges Problemgebiet. Die Betrachtung macht erst Sinn, wenn ber¨ ucksichtigt wird, dass die Pendlerstr¨ ome der im Landkreis Bayreuth wohnenden Bev¨ olkerung das gute Abschneiden der Stadt Bayreuth durch ihre Mitwirkung erst erm¨ oglichen. Die Stadt und ihr Umland bilden also letzlich eine funktionale Einheit, die im Vergleich von Leistungserbringung, Einkommenserzielung und auch bez¨ uglich aller anderen relevanten Versorgungseinrichtungen stets zusammen betrachtet werden muß. 8 Die Notwendigkeit der L¨ osung des Regionalisierungsproblems ” besteht bei vielen Bewertungsbereichen, insbesondere bei Wertsch¨ opfungs- und Produktivit¨ atsvergleichen, der Analyse regionaler Wirtschaftsdynamik, Arbeitsmarktanalysen, der vergleichenden Beurteilung der Dienstleistungsversorgung, aber auch bei Einsch¨ atzungen der Freizeit- und Umweltqualit¨ at.“ 9
Wenn entsprechend der Problemstellung das Regionalisierungsproblem zufriedenstellend gel¨ ost ist und geeignete Analyseregionen definiert sind, ergibt sich ein weiteres Problem. Die Bedeutung von Regionalvergleichen oder Standortrankings besteht vor allem darin, dass die politisch Verantwortlichen Hinweise darauf erhalten, wo die St¨ arken und Schw¨ achen einer Region liegen. Es ist allerdings schwierig diese St¨ arken und Schw¨ achen
5 siehe dazu Kapitel 2.1 Analyseregionen
6 Klemmer (1995) S. 19f
7 siehe Tabelle D.1 im Anhang, Quelle: Statistik Regional 1999, eigene Berechnungen, BWS je Einwohner 1994
8 Diese Unterschiede sind nicht nur auf das gew¨ ahlte Beispiel begrenzt, sondern charakterisieren grundlegend die Problematik. Im Anhang sind exemplarisch die unterschiedlichen Werte der Brutto-
wertsch¨ opfung je Einwohner f¨ ur die St¨ adte Erlangen und Schweinfurt und deren umliegende Landkreise
aufgef¨ uhrt. Man k¨ onnte aber auch beliebig viele andere Beispiele finden.
9 Klemmer (1995) S. 19
6
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
zu erkennen, wenn Regionen miteinander in Beziehung gesetzt werden, die eigentlich nicht miteinander zu vergleichen sind.
Problematisch ist z.B. die vergleichende Beurteilung der Kultur- und Freizeitm¨ oglichkeiten der Regionen Berlin und Altmark, da sich diese Regionen bez¨ uglich ihrer Einwohnerzahl und Bev¨ olkerungsdichte wesentlich voneinander unterscheiden. Ein mit Berlin vergleichbares Versorungsangebot ist in der Region Altmark also schon aufgrund ihrer gegebenen Siedlungsstruktur nicht zu realisieren. Die Tatsache, dass jede Region ¨ uber ihre spezifischen Eigenschaften und Vor- und Nachteile verf¨ ugt, wird in vielen anderen Regionalvergleichen nicht ausreichend ber¨ ucksichtigt.
Der Vergleich vieler Merkmale, wie etwa der Vergleich des Kultur- und Freizeitangebots, ¨ uber ein Ranking ohne Ber¨ ucksichtigung der speziellen Eigenschaften von Regionen, ist aus wissenschaftlicher Sicht problematisch. Daraus resultiert die Gefahr, dass durch die immer popul¨ arer werdenden Stadt- und Regionalvergleiche 10 ein falscher Eindruck ¨ uber
das Attraktivit¨ atsgef¨ alle von St¨ adten und Regionen vermittelt wird, der sich bei den Wirtschaftssubjekten bewußt oder unbewußt festsetzen kann. Durch die wachsende Flexibilit¨ at von Unternehmen und Arbeitnehmern k¨ onnen sich die Ergebnisse solcher Rankings in Standortentscheidungen und Arbeitsplatzwahl negativ auf die jeweilige Region auswirken. 11
Insofern m¨ ussen Regionalvergleiche, die einen wissenschaftlichen Anspruch erheben wollen, dieser Problematik Rechnung tragen. Aus diesem Grund nimmt der Versuch der Schaffung und Definition vergleichbarer Regionen in dieser Arbeit bewußt einen bedeutenden Teil ein.
10 Die Zeitschrift ” FOCUS“ ver¨ offentlicht beispielsweise j¨ ahrlich eine Besten-Liste mit 83 deutschen
St¨ adten im Vergleich. Dabei wird ein Ranking erstellt, das die sie spezifischen Ausgangsbedingungen der
St¨ adte nicht ber¨ ucksichtigt. Vgl. Focus Nr. 50, 11.12.2000, S. 270-282
11 Vgl. auch Klemmer (1995) S. 7
7
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
2.1 Die Auswahl von Analyseregionen
W¨ ahrend man fr¨ uher der Auffassung war, daß Regionen quasi nat ¨ urliche,
”
vorgegebene Einheiten seien, die es aufzufinden und zu identifizieren gilt, hat sich heute die Meinung durchgesetzt, daß Raumgliederungen immer zweckbestimmt sind.“ 12
Will man Teilr¨ aume einer Volkswirtschaft analysieren, m¨ ussen solche Teilr¨ aume zun¨ achst definiert werden. 13 Es gibt praktisch unendlich viele M¨ oglichkeiten, kleinste r¨ aumliche Bausteine, wie etwa Gemeinden, zu Wirtschaftsr¨ aumen zusammenzufassen. Regionen sind also keine nat¨ urlich vorgegebene Raumeinheiten, sondern die Einteilung in Regionen soll immer dem Zwecke einer wissenschaftlichen Untersuchung untergeordnet sein. Die dient zun¨ achst vor allem der ¨ thematische Einteilung in Regionen ” Ubersichtlichkeit, der
Informationsverdichtung und damit der leichteren Orientierung in der r¨ aumlichen Umwelt“ 14 .
Wie in dem Beispiel aus dem vorausgegangenen Abschnitt deutlich geworden ist, hat die Art der Abgrenzung der Aggregation von Teilr¨ aumen erheblichen Einfluss auf das endg¨ ultige Klassifikationsergebnis. 15 Aus diesem Grund soll im folgenden beispielhaft auf verschiedene Abgrenzungsm¨ oglichkeiten von Analyseregionen eingegangen werden.
Mit dem Begriff ” Region“ werden in den unterschiedlichsten Zusammenh¨ angen verschiedene Vorstellungen verbunden. Der Begriff der Region ergibt sich prim¨ ar aus der individuellen Perspektive des Betrachters, wobei die Identifizierung einer regionalen Ebene in h¨ ochstem Maße von der spezifischen Fragestellung einer Untersuchung abh¨ angt. Auch wenn keine genaue Definition des Regionenbegriffs existiert und im tats¨ achlichen Sprachgebrauch recht fahrl¨ assig mit ihm umgegangen wird, empfiehlt es sich dennoch, zwischen deskriptiven und normativen Regionalbegriffen zu unterscheiden. 16
Im deskriptiven Verst¨ andnis hat sich in der Wissenschaft und in der Praxis ” hinsichtlich
des Aggregationsprinzips die Unterscheidung zwischen homogenen und funktionalen Re-
12 Bahrenberg(1988) S. 2
13 Vgl. Eckey (1991b) S. 42
14 Bahrenberg (1988) S. 2
15 Die unterschiedlichen Auspr¨ agungen der BWS je Einwohner in kreisfreien St¨ adten und deren direkt umliegenden Landkreisen w¨ urden sich bei einer großr¨ aumigeren Betrachtung relativieren. Siehe Tabelle
D.1 im Anhang
16 Vgl. Wiechmann (2000) S. 174f
8
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
gionen durchgesetzt“ 17 . Dabei werden die Gebiete auf der Basis einer Bestandsanalyse so bestimmt, dass sie entweder nach ihren homogenen Strukturen oder nach funktionalen Verflechtungen charakterisiert werden k¨ onnen. ” W¨ ahrend homogene Regionen sich
grunds¨ atzlich auf eine beliebige Sachdimension beziehen k¨ onnen - diese wird in disjunkte Klassen unterteilt und auf bestimmte Gebiete projiziert -, stellen funktionale Abgrenzungen zumeist auf ¨ okonomische Gesichtspunkte (Bezugs-, Absatzverflechtungen) oder auf Daseinsgrundfunktionen (Wohnen, Arbeit, Bildung, Versorgung und Erholung) ab.“ 18 Normative Regionen basieren hingegen auf den Ergebnissen politischer Entscheidungen und zeichnen sich eher durch ihren planerischen und administrativen Charakter aus. Als Beispiel f¨ ur solche Planungsregionen k¨ onnen die Regierungsbezirke genannt werden.
Versucht man bez¨ uglich einer gegebenen Problemstellung eine geeigneten Regionsebene zu bestimmen, bietet sich als Orientierungshilfe f¨ ur viele Fragestellungen an, auf die im Raumordnungsgesetz definierten Zielvorgaben zur¨ uckzugreifen. Ziel der Abgrenzung soll es demnach sein, die Raumordnungspolitik effizient zu unterst¨ utzen 19 . Diese Bedingung ist dann erf¨ ullt, wenn die abgegrenzten r¨ aumlichen Beobachtungseinheiten
1. eine zuverl¨ assige Diagnose und Prognose des regionalen Entwicklungsstandes erlauben und
2. r¨ aumliche Ausstrahlungseffekte regionalpolitischer Maßnahmen zum Ausdruck bringen. 20
Aus beiden genannten Anforderung resultiert das Ergebnis, dass Zentren zusammen mit ihrem Umland zu funktionalen Beobachtungseinheiten zusammengefaßt werden m¨ ussen. Auch in der Literatur werden Analyseregionen mit funktionalem Charakter pr¨ aferiert. So vertritt Wiechmann die Auffassung, ” den Regionsbegriff nicht als physischen Ausschnitt der Erdoberfl¨ ache (miss)zu verstehen, sondern als sozio-¨ okonomischen Verflechtungsraum zu betrachten, der sich als lose verbundenes Netzwerk durch die gegenseitige Wahrnehmung der in ihm agierenden Akteure definiert“ 21 .
17 Klemmer (1983) S. 19ff
18 Wiechmann (2000) S. 174
19 Nach §1 Raumordnungsgesetz ist die Struktur des Gesamtraumes der Bundesrepublik Deutschland so zu entwickeln, dass sie 1. der freien Entfaltung der Pers¨ onlichkeit in der Gemeinschaft am besten dient,
2. Schutz, Pflege und Entwicklung der nat¨ urlichen Lebensgrundlagen sichert, 3. Gestaltungsm¨ oglichkeiten
der Raumnutzung langfristig offenh¨ alt und 4. gleichwertige Lebensbedingungen der Menschen in allen
Teilr¨ aumen bietet oder dazu f¨ uhrt.
20 Eckey (1991b) S. 42
21 Wiechmann (2000) S. 1; zur Vertiefung siehe auch Kraemer (1975) S. 42-65
9
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
Bei der Auswahl geeigneter Analyseregionen muss jedoch h¨ aufig auf diese funktionale und der Problemstellung angepasste Einteilung der Untersuchungseinheiten verzichtet werden, weil Daten in der Regel nur auf administrativer Raumebene erhoben werden und nicht den funktional abgegrenzten Raumeinheiten angepasst werden k¨ onnen. Als Beispiel daf¨ ur sei das regionale Bezugssystem der Europ¨ aischen Union (NUTS) genannt. Es wurde von Eurostat mit dem Ziel eingerichtet, ” ein einheitliches, koh¨ arentes regionales
Raster f¨ ur eine Regionalstatistik der Europ¨ aischen Union zu schaffen“ 22 , auf dessen Basis die sozio-¨ okonomische Analyse und die Festlegung der Regionalpolitik der Gemeinschaft erfolgen soll. Aus diesen Gr¨ unden und vor allem ” aus praktischen Gr¨ unden hinsichtlich
der Verf¨ ugbarkeit der Daten basiert die NUTS-Nomenklatur auf einer institutionellen Einteilung der Mitgliedsl¨ ander“ 23 . Gerade diese Einteilung birgt die Problematik, dass sich die Analyseregionen in den unterschiedlichen L¨ andern hinsichtlich ihrer Gr¨ oße und anderer grundlegender Merkmale stark voneinander unterscheiden k¨ onnen. Betrachtet man die NUTS-II-Ebene der Regionalnomenklatur von Eurostat, so umfaßt diese Ebene ” in
vielen Mitgliedsl¨ andern sehr große Beobachtungseinheiten mit Ausdehnungswerten von ¨ uber 70 km, in anderen L¨ andern - etwa den Benelux-Staaten - hingegen kleine Raumeinheiten mit Ausdehnungen unter 40 km Durchmesser“ 24 . Somit ergeben sich zwangsl¨ aufig Nivellierungs- und Differenzierungseffekte, die einen Regionalvergleich gravierend ver-
”
zerren“ 25 . An diesem Beispiel wird deutlich, dass eine w¨ unschenswerte Abgrenzung von Analyseregionen oft an praktischen Problemen, vor allem an der Datenlage und den institutionellen Voraussetzungen, scheitert.
Um dieser Problematik entgegenzuwirken, w¨ are es w¨ unschenswert, auf funktionale Beobachtungseinheiten zur¨ uckgreifen zu k¨ onnen, die auch den Anforderungen der Raum-ordnungspolitik entgegenkommen. Eine problemad¨ aquate Regionalisierung ist beispielsweise im Bereich der Wirtschaftsf¨ orderung oder zur Beschreibung der regionalen Arbeitsmarktsituation unverzichtbar. Als geeignet werden in diesem Zusammenhang ” nach ¨ ubereinstimmender Auffassung in der Literatur regionale Arbeitsm¨ arkte, d.h. die Zusammenfassung von Arbeitsmarktzentren und ihrem Umland, angesehen“ 26 . Die Abgrenzung von Arbeitsmarktregionen schl¨ agt sich durch die funktionale Beziehung der Berufspendlerverflechtungen zwischen st¨ adtischen Arbeitsmarktzentren und deren Umland nieder. Nach Eckey gestatten derartige Regionen ” gleichzeitig die Analyse von Produktionsge- 22 Schmidt(1995b) S. 2
23 Schmidt (1995b) S. 2
24 Klemmer (1995) S. 20f
25 Klemmer (1995) S. 21
26 Eckey (1991b) S. 45
10
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
setzm¨ aßigkeiten und erlauben somit auch eine Regionalbewertung unter dem Aspekt interregionaler Wettbewerbsf¨ ahigkeit“ 27 . Arbeitsmarktregionen sind ein gutes Beispiel f¨ ur eine funktionale Abgrenzung von Raumeinheiten.
Eine andere funktionale Gliederungsebene ist die der Raumordnungsregion, die in der Bundesrepublik seit 1982 f¨ ur die Zwecke der raumordnerischen Berichterstattung verwendet wird. ” Es handelt sich hierbei um funktionale Regionen, die aus Kreisen zusammengesetzt sind und leistungsf¨ ahige zentrale Orte der obersten Stufe (Oberzentren) als Arbeitsmarkt- und Versorgungszentren aufweisen“. 28 Die Tatsache, dass Raumordnungsregionen aus Kreisen beziehungsweise kreisfreien St¨ adten zusammengesetzt werden k¨ onnen, ist nicht zuletzt in Bezug auf die Aggregation von Daten von Bedeutung. Raumordnungsregionen weisen zudem oft r¨ aumliche ¨ Ubereinstimmungen mit Planungsregionen auf. Da sie die funktionellen Verflechtungen nicht nur bez¨ uglich des Arbeitsmarktes, sondern auch hinsichtlich ihrer Funktion als Versorgungszentrum, beispielsweise f¨ ur Dienstleistungen und Kultur und Freizeit, wahrnehmen sollen, sind Raumordnungsregionen in der Regel weiter gefaßt als Arbeitsmarktregionen. Sie stellen von ihrer Gr¨ oße her eine Zwischenstufe funktionellen Charakters zwischen den Regierungsbezirken und den Stadt- und Landkreisen dar, die in der empirischen Regionalforschung breite Verwendung gefunden hat. 29
Aufgrund ihrer Ber¨ ucksichtigung der funktionalen Verflechtungen halten wir Raumordnungsregionen f¨ ur eine geeignete Abgrenzung zur Analyse der Standortqualit¨ aten von Regionen. Daher soll im Folgenden auf das Zustandekommen und die Zusammensetzung von Raumordnungsregionen eingegangen werden.
In den 70er Jahren wurde an einem Konzept von ausgeglichenen Funktionsr¨ aumen gearbeitet 30 , die in ¨ Ubereinstimmung mit den Zielen der Raumordnungspolitik stehen sollten. Diese Diskussion ” hat unter den Verfechtern des Konzepts der ausgeglichenen Funktionsr¨ aume zu der ¨ Uberzeugung gef¨ uhrt, dass ein großr¨ aumiger Disparit¨ atenausgleich verh¨ altnism¨ aßig großgeschnittene R¨ aume, und zwar im Prinzip oberzentrale Regionen, erfordere“ 31 . Im Rahmen der Neuordnung der Raumordnungsregionen, die durch die
27 Klemmer (1995) S. 51
28 Sinz (1995) S. 807
29 Vgl. dazu beispielsweise Irmen und Sinz (1991)
30 bez¨ uglich den angestrebten Zielvorstellungen und Hintergr¨ unde des Konzepts vgl. Becker und Hunke (1975)
31 Becker und Hunke (1975) S. 237
11
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
Einbeziehung der Neuen L¨ ander notwendig wurde, sind auch einige Ver¨ anderungen in den Alten L¨ andern vorgenommen worden. Diese ¨ Anderung tr¨ agt der Tatsache Rechnung,
dass gerade die funktionale Raumgliederung keine feste Struktur darstellt, sondern sich im Laufe der Zeit unter sich ver¨ andernden Rahmenbedingungen entwickeln kann. Will man allerdings Raumordnungsregionen ¨ uber die Zeit hinweg analysieren, treten zwangsl¨ aufig Probleme auf.
Die aus der Diskussion resultierenden 75 Raumordnungsregionen der alten Bundesl¨ ander wurden als geeignetes Bezugssystem angesehen, ”
uber ein Netz von Mittelzentren verf¨ ugen“ 32 . Die Raum-Oberzentrum und in jedem Falle ¨
ordnungsregionen stellen zwar nicht f¨ ur alle Fragestellungen das ideale Bezugssystem dar, doch ” bilden sie ein fl¨ achendeckendes System von akzeptablem Kompromißcharakter, so dass die Frage nach einer praktikablen Dimension der ausgeglichenen Funktionsr¨ aume vorerst befriedigend beantwortet ist“ 33 . Unter Einbeziehung der Neuen L¨ ander gibt es seit dem 1.6.1996 in Deutschland 97 Raumordnungsregionen. 34
32 Becker und Hunke (1975) S. 237
33 Becker und Hunke (1975) S. 237
34 Siehe Karte der Raumordnungsregionen im Anhang
12
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN 2.2 Bestimmung von ¨ ahnlichen Regionen anhand ihres
Standortpotentials
Nach der Auswahl der Analyseregionen stellt sich die Frage, wie diese Regionen bez¨ uglich der Aufgabenstellung miteinander verglichen werden k¨ onnen. Ziel ist es, die Standortqualit¨ at unter besonderer Ber¨ ucksichtigung der wirtschaftlichen Leistungsf¨ ahigkeit von Regionen zu beurteilen. Wie wir in der Einleitung des Kapitels bereits festgestellt haben, ist eine ad¨ aquate Beschreibung und der Vergleich der wirtschaftlichen Leistungsf¨ ahigkeit von Regionen nur dann sinnvoll, wenn auf die spezifischen Strukturen der jeweiligen Regionen R¨ ucksicht genommen wird.
Ein Regionalvergleich, der ausschließlich ergebnisorientiert ist, gibt wenig Auskunft ¨ uber
die hinter diesen Ergebnissen stehenden Ursachen des aufgezeigten Entwicklungsstands. Man muss von der M¨ oglichkeit ausgehen, ” dass eine Region durchaus ¨ uber attraktive
Entwicklungspotentiale verf¨ ugt, die sich aber aufgrund noch stattfindender struktureller Anpassungsprozesse bislang nicht in den Ergebnissen niederschlagen“ 35 . Es wird also gefordert, dass nur ¨ ahnliche Regionen miteinander verglichen werden sol-
len. Ausgehend von dieser Forderung stellt sich die Frage, nach welchen Ans¨ atzen und Kriterien die ¨ Ahnlichkeit einer Region mit anderen Regionen definiert oder beschrieben werden kann.
Aus der regional¨ okonomischen Literatur werden exemplarisch zwei Ans¨ atze ausgew¨ ahlt, in denen versucht wird, das Entwicklungspotential von Regionen durch geeignete Poten-tialfaktoren zu beschreiben. Dem Jahresgutachten des Sachverst¨ andigenrats zur Begutachtung der gesamtwirtschaftlichen Entwicklung (1999) zufolge ist, nach theoretischen und empirischen Ans¨ atzen der Regional¨ okonomie, ” die Ausstattung mit Potentialfaktoren Grundlage f¨ ur das Wachstum sowie f¨ ur die qualtitative Entwicklung einer Region“ 36 . Charakteristisch f¨ ur diese Potentialfaktoren ist, dass sie in einer Region gebunden sind und sich demnach durch einen hohen Grad an Immobilit¨ at auszeichnen. ” Damit einhergehend charakterisieren sich Potentialfaktoren durch ein relativ hohes Maß an Unteilbarkeit; sie passen sich bei Ver¨ anderungen, so bei Nachfrageverschiebungen, nicht gleich an. Allerdings nehmen mit gr¨ oßer werdendem Beobachtungszeitraum die Immobilit¨ at und die Unteilbarkeit der meisten Potentialfaktoren ab“ 37 .
35 Klemmer (1995) S. 49
36 Sachverst¨ andigenrat (1999) S. 119
37 Sachverst¨ andigenrat (1999) S. 119
13
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
Als Potentialfaktoren werden anhand dieser Eigenschaften die Produktionsfaktoren Arbeit und Kapital, die sektorale Wirtschaftsstruktur, die geographische Lage und Agglomerationseffekte genannt. Eine ungen¨ ugende Ausstattung einer Region mit einzelnen Potentialfaktoren kann zum Engpaß f¨ ur die Entwicklung dieser Region werden. 38
Eckey macht einen ¨ ahnlichen Vorschlag, indem er versucht, die ¨ okonomische Leistungsf¨ ahigkeit
von Regionen durch die Wirtschaftsstruktur, die Infrastruktur, die geographische Lage und die Siedlungsstruktur zu beschreiben. 39
Unter Infrastruktur versteht Eckey neben der kleinr¨ aumigen Ausstattung der Verkehrsinfrastruktur auch Elemente wie Kommunikation, Forschung und Entwicklung, Aus- und Weiterbildung, Ver- und Entsorgung sowie die Verf¨ ugbarkeit von Industrie- und Gewerbefl¨ achen. 40
Dabei stellt er fest, dass einige von diesen Faktoren unver¨ anderbar sind (z.B. die Zentralit¨ at der Lage innerhalb einer Volkswirtschaft) oder zumindest nur sehr langfristig zu ¨ andern sind (etwa die Gr¨ oße des Zentrums oder die Einwohnerdichte einer Region), w¨ ahrend andere Faktoren wie die Infrastruktur mittelfristig durch die Politik beeinflussbar sind 41 : ” Erstere dr¨ ucken das Standortpotential von Wirtschaftsr¨ aumen aus und heißen deswegen Potentialfaktoren“ 42 .
Sowohl das Jahresgutachten als auch Eckey betonen die Immobiltit¨ at und Unteilbarkeit als wichtige Eigenschaften von Potentialfaktoren. Es bietet sich daher grundlegend an, zur Identifikation von ¨ ahnlichen Regionen auf Faktoren zur¨ uckzugreifen, die mittel- oder langfristig nicht oder nur bedingt ver¨ anderbar sind. In Anlehnung an Eckey werden von den Autoren als geeignete Merkmale die Siedlungsstruktur und geographische Lage angesehen, die zur Beschreibung der Ausgangssituation der Raumordnungsregionen im Sinne eines Potentialansatzes herangezogen werden k¨ onnen. Im weiteren Verlauf der Arbeit sollen unter dem Begriff Standortpotential die geographische Lage sowie die Siedlungsstruktur von Regionen zusammengefasst werden. Die Beschr¨ ankung auf rein geographische und demographische Gesichtspunkte bei der Beschreibung des Standortpotentials ist sicher nicht unumstritten und kann in anderen Zusammenh¨ angen noch durch weitere geeignete Indikatoren erg¨ anzt werden. Allerdings ist, wie auch schon bei der Auswahl einer geeigneten Analyseregion, der Problemstel- 38 Vgl.Sachverst¨ andigenrat (1999) 120f
39 Vgl. Eckey (1991a) S. 707
40 Vgl. Eckey (1991a)
41 Vgl. Eckey (1991a) S. 706
42 Eckey (1991a) S. 706
14
KAPITEL 2. KONZEPTIONELLER RAHMEN ZUR BESTIMMUNG ¨ AHNLICHER REGIONEN
lung Rechnung zu tragen. Gerade im Hinblick auf die Einbeziehung der Raumordnungsregionen der Neuen L¨ ander ist es sinnvoll, bei der Bestimmung des Standortpotentials mit der Anzahl der miteinzubeziehenden Einflußfaktoren vorsichtig umzugehen. Da die Regionen in den Neuen Bundesl¨ andern nach der Wiedervereinigung bez¨ uglich ihrer wirtschaftlichen Leistungsf¨ ahigkeit sicher immer noch nicht das Niveau der Alten L¨ ander erreicht haben, k¨ ame es schon bei der Bestimmung von potentiell ¨ ahnlichen Regionen
zu gravierenden Unterschieden zwischen Ost- und Westdeutschland. Deswegen erscheint es sinnvoller als Potentialfaktoren ausschließlich solche Gr¨ oßen zu verwenden, die auch langfristig kaum ver¨ anderbar sind und nicht oder zumindest nicht kurz- oder mittelfristig den M¨ oglichkeiten der politischen Einflußnahme unterliegen.
Mit diesen Potentialfaktoren bietet es sich an, eine Clusteranalyse durchzuf¨ uhren, die all jene Raumordnungsregionen in Klassen vereinigt, deren Standortpotential vergleichbar ist. In einem zweiten Schritt k¨ onnen dann alle Regionen, die dem gleichen Cluster angeh¨ oren, also unter Ber¨ ucksichtigung des ermittelten Standortpotentials, bez¨ uglich anderer Merkmalsauspr¨ agungen von Regionen n¨ aher untersucht werden. In unserem Fall sind dies ausgew¨ ahlte Standortfaktoren zur Beschreibung der wirtschaftlichen Leistungsf¨ ahigkeit der Regionen.
In den folgenden zwei Kapiteln werden die statistischen Clusterverfahren vorgestellt und angewendet, mit denen ¨ ahnliche Regionen bestimmt werden k¨ onnen.
15
Kapitel 3
Statistische Verfahren der
Raumtypisierung
In diesem Kapitel werden die multivariaten statistischen Verfahren erl¨ autert, die in Kapitel 4 zur Bestimmung von ¨ ahnlichen Raumordnungsregionen zum Einsatz kommen, und anhand von einfachen Beispielen veranschaulicht.
Bei diesen Verfahren handelt es sich um verschiedene Methoden der Clusteranalyse. Neben hierarchischen Methoden, die in Regional- und St¨ adtevergleichen in der Regel zur Anwendung kommen, werden auch Partionierungsmethoden vorgestellt. F¨ ur die partionierende Verfahren haben die Autoren in den Regionalvergleichen kein konkretes Anwendungsbeispiel gefunden. Lediglich das Jahresgutachten des Sachverst¨ andigenrats 43 verwendet letztere zur Validierung der Klassifikationsergebnisse der hierarchischen Clustermethode.
Die Einbeziehung eines theoretischen Methodenteils scheint sinnvoll, da auch multivariate Methoden Anwendung finden, die in den g¨ angigen Lehrb¨ uchern nur vereinzelt erw¨ ahnt werden. Dies trifft vor allem auf die Partitionierungsmethoden zu. Ein besonderes Interesse wird darauf gelegt, welche Kriterien bei den verschiedenen Verfahren existieren, die die Anzahl der zu bildenden Cluster bestimmen. Eine solche automatisierte Festlegung der Anzahl der Klassen kann als konkrete Empfehlung interpretiert werden und stellt einen Schritt in die Richtung einer Objektivierung der Raumtypisierung dar.
43 Sachverst¨ andigenrat (1999)
16
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
3.1 Datenstruktur
Nachdem die Auswahl geeigneter Daten bez¨ uglich einer gegebenen Problemstellung erfolgt ist, k¨ onnen die Rohdaten zun¨ achst nicht in ihrem urspr¨ unglichen Zustand in die Analyse eingehen. Da die Daten meistens in unterschiedlichen Dimensionen vorliegen, ist es notwendig, die Rohdatenmatrix zu standardisieren, um die einzelnen Daten auf das gleiche Niveau zu bringen. Durch die Subtraktion des Mittelwerts a j eines Merkmals von dem jeweiligen Einzelwert a i j und der anschließenden Division mit der Standardabweichung s j des Merkmals j erh¨ alt man die Datenmatrix Z mit den einzelnen standardisierten Beobachtungswerten z i j : 44
z i j
Damit erhalten alle Merkmale einen Mittelwert von Null und eine Standardabweichung von Eins.
Um auszuschließen, dass mehrere Variablen die gleichen Aussagen beinhalten, sollten die Variablen vorab auf Korrelationen untersucht werden. Die einfache Korrelationsanalyse misst die Richtung und die St¨ arke des Zusammenhangs von zwei Variablen. Dabei wird die direkte Beziehung zwischen den Variablen betrachtet. Es werden Korrealtionskoeffizienten ermittelt, die die gemeinsame Variation von zwei Merkmalen messen und sie in einem linearen Zusammenhang charakterisieren.
Die Einfachkorrelation deckt die lineare Abh¨ angigkeit zwischen zwei beliebigen Merkmalen auf. Dieser Zusammenhang wird durch den Korrelationskoeffizienten r xy gemessen, wobei x und y jeweils f¨ ur eine Spalte der Ausgangsdatenmatrix und somit f¨ ur ein Merkmal stehen: 45
n
Diese auch Bravais-Pearson-Korrealtionskoeffizient genannte Gr¨ oße ist definiert als normierte Produktsumme von standardisierten Messungen und somit eine dimensionslose Gr¨ oße.
F¨ ur empirische Analysen ist es ausreichend, nur eines von zwei stark miteinander korrelierten Merkmalen zu verwenden. Bei der Auswahl ist die Festlegung des Grenzwertes f¨ ur den Korrelationskoeffizienten meist normativ, h¨ aufig wird ein Grenzwert zwischen 0,80
44 Vgl. Backhaus, Erichson, Plinke und Schuchard-Ficher (1997) S. 73
45 Vgl. Backhaus u. a. (1997) S. 87
17
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
und 0,90 angesetzt. 46 Dies f¨ uhrt automatisch zu einer Reduktion der Daten, was gerade bei großen Datens¨ atzen von Vorteil sein kann.
Im Rahmen der Bereitstellung und Aufbereitung von Daten zur weiteren Verwendung mit statistischen Verfahren ist darauf zu achten, dass zum einen die Datenmatrix standardisiert ist und, dass die Rohdatenmatrix auf m¨ ogliche Korrelationen gepr¨ uft worden ist. Erst nach diesen Schritten k¨ onnen die verschiedenen clusteranalytischen Verfahren angewendet werden.
46 Vgl. Schmidt (1995a) S. 39
18
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
3.2 Clusteranalyse
Als ein statistisches Instrument zur Kategorisierung umfangreicher Datenmengen kann die Clusteranalyse ” ¨ uberall dort Anwendung finden, wo es n¨ otig ist, gr¨ oßere Mengen von Objekten unterschiedlicher Auspr¨ agung in relativ homogene Untergruppen zusammenzufassen“ 47 . In der Regional¨ okonomie stehen bestimmte Objekte, meist Regionen, St¨ adte oder Gemeinden, zur Verf¨ ugung, die durch ¨ okonomische Indikatoren (Merkmale) charakterisiert werden sollen. 48 Ziel der Clusteranalyse ist es nun, ” die einzelnen Objekte, die durch die Auspr¨ agung einer
Anzahl von Indikatoren beschrieben sind, so in Klassen zu gruppieren, dass sich die in einer Klasse befindlichen Objekte m¨ oglichst ¨ ahnlich, die Klassen untereinander jedoch m¨ oglichst heterogen sind“ 49 .
Die Anzahl der m¨ oglicher Klassifikationsverfahren, die im Rahmen einer Clusteranalyse durchgef¨ uhrt werden k¨ onnen, ist sehr umfangreich.
F¨ ur die Zwecke dieser Untersuchung werden zum einen Verfahren mit hierarchischer An-ordnung der Gruppen und zum anderen partitionierende Verfahren verwendet. Die methodische Vorgehensweise beider Verfahrenstypen soll im Folgenden vorgestellt und anhand einfacher Beispiele veranschaulicht werden.
3.2.1 Hierarchische Verfahren
Man unterscheidet zwei Gruppen von hierarchischen Verfahren:
• Agglomerative Verfahren und
• Divisive Verfahren
Agglomerative Verfahren starten mit N Gruppen, d.h. es bildet zun¨ achst jedes Objekt eine eigene Gruppe. Es wird nun schrittweise die Anzahl der Gruppen durch Vereinigung der zwei jeweils ¨ ahnlichsten Gruppen solange reduziert, bis nur noch eine einzige Gruppe existiert. Divisive Verfahren starten dagegen mit einer Gruppe, in der alle Objekte vereinigt sind. Schrittweise werden nun Gruppen abgesplittet, so dass die Heterogenit¨ at innerhalb der neuen Gruppen reduziert wird.
47 Schmidt (1995a) S. 9
48 Vgl. J¨ anecke (1975) S. 145f
49 Schmidt (1995a) S. 10
19
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
In der Praxis finden divisive Verfahren allerdings keine Anwendung. Dies l¨ aßt sich durch die Tatsache erkl¨ aren, dass bei divisiven Verfahren grunds¨ atzlich alle Teilmengen einer Gruppe untersucht werden m¨ ussen. Der daraus resultierende ¨ uberdurchschnittliche Re-chenaufwand war in der Vergangenheit aufgrund begrenzter Speicherkapazit¨ aten mit Problemen verbunden. 50
Daher werden im Weiteren nur die agglomerativen Verfahren betrachtet.
Der Ablauf agglomerativer Verfahren kann durch folgenden Algorithmus beschrieben werden:
1. SCHRITT: Berechnung der Distanzen nach einer geeigneten Definition. Jedes Objekt bildet eine eigene Klasse. Dazu wird im folgenden auf die einfache unquadrierte euklidische Distanz zur¨ uckgegriffen: 51
2. SCHRITT: Festlegung der Klassen mit der minimalen Distanz zueinander. Diese Klassen werden miteinander verschmolzen.
3. SCHRITT: Wenn nur noch eine Klasse vorhanden ist, wird der Algorithmus beendet.
4. SCHRITT: Die oben verschmolzenen Klassen werden als neue Klasse betrachtet. Nun wird der Abstand der neu gewonnen Klasse mit den anderen Klassen bestimmt.
5. SCHRITT: Gehe solange zur¨ uck zu Schritt 2 bis das Abbruchkriterium in Schritt 3 erreicht ist.
Die beiden Klassen mit der geringsten Distanz werden also zu einer neuen Klasse zusammengefaßt. Die einzelnen agglomerativen Verfahren unterscheiden sich nun dadurch, wie der zu bildende Abstand der jeweils verschmolzenen Klassen zu den den ¨ ubrigen Klassen
definiert werden soll. In der Literatur stehen viele solcher Verfahren zur Auswahl. In der folgenden Tabelle sind die g¨ angigsten hierarchisch agglomerativen Verfahren mit ihren spezifischen Eigenschaften aufgef¨ uhrt: 52
50 Da die Speicherkapazit¨ aten heute kaum noch Probleme bereiten, kann man vermuten, dass divisive Verfahren in der Zukunft eine echte Alternative sein k¨ onnen.
51 Vgl. Backhaus u. a. (1997) S. 126f; n¨ ahere Erl¨ auterungen zu Distanzmaßen siehe Anhang A
52 Nach Schmidt (1995a) S. 15f
20
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
Beim Median Verfahren und beim Zentroid Verfahren werden die Distanzen unter Ber¨ ucksichtigung von Klassenschwerpunkten gebildet. Beide neigen zum ” Reversal-Ph¨ anomen“, das ” die
Tatsache bezeichnet, dass eine im i-ten Schritt aus zwei Klassen gebildete neue Klasse homogener ist als zumindest eine der beiden Klassen vor der Vereinigung“ 53 . Beim Single-Linkage Verfahren ist der kleinste Abstand die charakteristische Distanz zwischen den Gruppen. Dadurch ist es auch geeignet, Ausreißer in einer Datenmenge zu erkennen. Der große Nachteil des Single-Linkage Verfahrens ist seine Neigung zur Kettenbildung. Solche Verkettungen f¨ uhren ” zur Bildung einiger weniger sehr umfangreicher Gruppen (gemessen an der Zahl der Mitglieder), w¨ ahrend andere Cluster nur wenige Raumeinheiten enthalten“ 54 .
Das Complete-Linkage Verfahren berechnet die Distanz der jeweils am entferntesten liegenden Klassenelemente. Im Gegensatz zum Single-Linkage Verfahren tendiert es ” zur
Bildung sehr kompakter, in sich homogener Typen, da es die ¨ Ahnlichkeit der un¨ ahnlichsten
53 Schmidt (1995a) S. 15
54 Bahrenberg, Giese und Nipper (1992) S. 285
21
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
Paare maximiert“ 55 .
Bei allen Verfahren wird implizit erreicht, dass die gebildeten Cluster m¨ oglichst homogen sind, w¨ ahrend die Un¨ ahnlichkeit zwischen verschiedenen Clustern m¨ oglichst groß ist. In der Literatur findet oft das WARD-Verfahren Anwendung. Da dieses Verfahren aber nicht in S-Plus integriert ist, wird im folgenden das Complete-Linkage-Verfahren vorgezogen, da es genauso wie das WARD-Verfahren zur Klassenbildung mit gleicher Objektanzahl neigt und im Gegensatz zum Single-Linkage-Verfahren nicht zu sogenannten Verkettungen f¨ uhrt.
Um die Unterschiede des Single-Linkage- und des Complete-Linkage-Verfahrens zu verdeutlichen, sollen beide Verfahren exemplarisch an einem kleinen Beispiel dargestellt werden. Dazu wurden sechs ” aussagekr¨ aftige“ Regionen aus dem folgenden empirischen
Teil der Arbeit ausgew¨ ahlt. Diese sind die Regionen M¨ unster (1), Bielefeld (2), Duisburg/Essen (3), Bonn (4), Rhein-Main (5) und D¨ usseldorf (6). Die Verfahren werden anhand demographischer und geographischer Variablen durchgef¨ uhrt, die auch sp¨ ater bei der endg¨ ultigen Klassifizierung Anwendung finden werden. Es handelt sich dabei um die absolute Bev¨ olkerungszahl (Bev.), die Bev¨ olkerungszahl im Oberzentrum (Bev. OZ) und die Bev¨ olkerungsdichte im Umland (Bev. Umland), sowie um die Erreichbarkeit aller europ¨ aischen Agglomerationen im Luftverkehr (Luft), die Erreichbarkeit der n¨ achsten drei Agglomerationen im PKW-Verkehr (PKW) und die Erreichbarkeit von Inter-City-Einstiegspunkten des Bahnverkehrs (IC). 56
Die Originaldaten der exemplarisch ausgew¨ ahlten Regionen sind in folgender Tabelle dargestellt:
Bev. Bev. OZ Luft PKW IC Bev. Umland
2. Bielefeld 3. Duisburg/Essen 2299,7 4. Bonn 5. Rhein-Main 6. D¨ usseldorf Nach der Standardisierung der Daten wird die Distanzmatrix mit Hilfe der einfachen euklidischen Distanz berechnet:
55 Bahrenberg u. a. (1992) S. 286
56 Zur genaueren Beschreibung der Variablen vgl. Kapitel 4 und die Quellenangaben im Anhang.
22
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
6. D¨ usseldorf
Das Ergebnis der Analyse ist die Darstellung im Dendrogramm. Auf Basis der in der Distanzmatrix ermittelten Werte erfolgt die Trennung der einzelnen Klassen. Je kleiner der Wert zweier Objekte in der Distanzmatrix ist, desto ¨ ahnlicher sind sich die zugeh¨ origen
Objekte und werden zu einer neuen Klasse verschmolzen. Das folgende Dendrogramm wurde nach dem Single-Linkage Verfahren erstellt:
Betrachtet man die Distanzmatrix, so werden die Regionen zuerst miteinander verschmolzen, die die geringste Distanz zueinander aufweisen. Man kann deutlich die Bildung eines Clusters erkennen, in dem sich Bielefeld (1) und M¨ unster (2) befinden, die in der Distanzmatrix mit 0,243 den kleinsten Wert aufweisen. Nach dem Complete-Linkage Verfahren erh¨ alt man folgendes Dendrogramm:
23
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
Abbildung 3.2: Dendrogramm; Clustering mit Complete-Linkage
Vergleicht man das Dendrogramm nach dem Single-Linkage Verfahren mit dem des Complete-Linkage Verfahrens, so l¨ aßt sich gut die Neigung zur Kettenbildung beim ersteren und andererseits die Neigung des Complete-Linkage Verfahrens zur Bildung gleich großer Klassen erkennen.
Um die Anzahl der zu bildenden Cluster bestimmen zu k¨ onnen, empfiehlt sich die Betrachtung eines Struktogramms:
euklidische Distanz
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
Das Struktogramm zeigt die Gr¨ oße des minimalen Distanzmaßes bei jedem Fusionsschritt auf. Die ansteigende Kurve weist h¨ aufig einen Knick nach oben auf, der darauf hindeutet, dass durch die Vergr¨ oßerung der Distanz immer heterogenere Klassen zusammengefaßt werden. Da dies nicht gew¨ unscht wird, sollten ab dieser Stelle keine weitere Fusionierung vorgenommen werden, womit sich die Anzahl der zu bildenden Cluster ergibt. Nat¨ urlich h¨ angt die Anzahl der Cluster auch von der Interpretation des Struktogramms ab. In diesem Fall erkennt man an der Stelle des vierten Fusionsschrittes einen deutlichen Knick nach oben, der auf eine Wahl von vier Clustern hindeutet, und so einen deutlichen ¨ Ubergang
von homogeneren und heterogeneren Klassen beschreibt.
Mit Hilfe der kophenetischen Matrix kann die G¨ ute einer hierarchischen Clusteranalyse bestimmt werden. Die kophenetische Matrix ist die Distanzmatrix, die sich aus dem Dendrogramm ergibt. Dabei wird der Korrelationskoeffizient zwischen den Elementen der kophenetischen Matrix und den Elementen der verwendeten Distanzmatrix bestimmt. Je gr¨ oßer der Korrelationskoeffizient dieser Pr¨ ufgr¨ oße ausf¨ allt, desto besser wird die Ausgangslage nach der Anwendung des Clusteralgorithmus beschrieben. F¨ ur unser Beispiel ergeben sich f¨ ur die einzelnen Verfahren folgende Korrelationskoeffizienten:
• Single- Linkage: 0,7602992
• Complete- Linkage: 0,8089639
Das Complete-Linkage Verfahren spiegelt die Ausgangslage nach der erfolgten Clusterung also besser wieder als das die Clusteranalyse nach dem Single-Linkage Verfahren, so dass man sich in diesem Fall f¨ ur das Complete-Linkage Verfahren entscheidet. Da gerade bei einer Betrachtung einer gr¨ oßeren Anzahl von Objekten die Neigung des Single-Linkage Verfahrens zur Kettenbildung von großem Nachteil ist, wird im empirischen Teil auf das Complete-Linkage Verfahren zur¨ uckgegriffen.
3.2.2 Partionierungsmethoden
Neben den hierarchischen existieren in der Klassifikationstherorie partionierende Clustermethoden.
Partionierungsmethoden teilen die m Objekte auf eine vorher festgelegte Anzahl von k Klassen beziehungsweise Cluster auf. 57 Dazu muß jede Klasse mindestens ein Objekt enthalten, und jedes Objekt muß zu genau einer Klasse geh¨ oren. 58 Zur Aufteilung der
57 Vgl. Ripley (1996) S. 312
58 Kaufman und Rousseuw (1990) S. 39; zus¨ atzlich gilt: k m und alle Objekte m¨ ussen aufgeteilt werden
25
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
Objekte w¨ ahlen die Partionierungsmethoden ein Clusterzentrum f¨ ur jede Gruppe mit dem Ziel aus, die Summe der quadrierten Distanzen zu jedem Objekt zu minimieren. 59 Partitionierende Verfahren versuchen durch Verlagerung der Objekte in ein anderes Cluster zu einer besseren L¨ osung zu gelangen. Die Verbesserung einer solchen Gruppenbildung wird durch das Varianzkriterium gemessen. 60
Partionierungsmethoden verlangen - im Gegensatz zu den hierarchischen Clustermethoden -, dass die gew¨ unschte Anzahl der k Klassen vorgegeben wird. Dadurch kann es vorkommen, dass die gew¨ unschte Anzahl Klassen nicht zu ” sinnvollen“ Clustern f¨ uhrt,
und die Interpretation des Ergebnisses schwerf¨ allt. Aus diesem Grund sollten die Al-gorithmen mit verschiedenen Werten von k durchlaufen werden, und diejenige Anzahl Klassen gew¨ ahlt werden, deren Ergebnis sinnvolle Interpretation erm¨ oglicht. Die von uns betrachteten Algorithmen bieten allerdings auch mathematische Kriterien f¨ ur die ” optimale“ Wahl der Klassenanzahl.
F¨ ur die Typisierung und Klassifikation der Raumordnungsregionen kommen in Kapitel 4 zwei Partionierungsalgorithmen zur Anwendung. Dies ist zum einen Hartigan’s k-means-Algorithmus 61 und zum anderen Kaufman’s und Rousseuw’s Partitioning Around Medoids (PAM) - auch k-medoid-Technik genannt 62 -, die sich in der Wahl des Klassenzentrums unterscheiden. W¨ ahrend k-means als Klassenzentrum den Mittelwert eines jeden Clusters berechnet, w¨ ahlt PAM ein repr¨ asentatives Objekt aus dem Datensatz als Zentrum f¨ ur jedes Cluster, das medoid genannt wird.
Beide Methoden sind in S-Plus integeriert 63 und werden hier vorgestellt.
3.2.2.1 Hartigan’s k-means Algorithmus
Erste Referenzen zur k-means-Methode sind Forgy (1965) und MacQueen (1967). Beide Algorithmen starten mit einer vorgegeben Klasseneinteilung und verringern die Summe der quadrierten Distanzen. 64 In Forgy’s Algorithmus werden alle Objekte simultan dem ihnen am n¨ achsten liegenden Clusterzentrum zugeordnet, das Clusterzentrum wird neu berechnet und der Prozeß wiederholt. Dabei k¨ onnen leere Cluster entstehen, also weniger als die vorher angegebene Anzahl von k Klassen vom Algorithmus gew¨ ahlt werden. MacQueen’s Algorithmus unterscheidet sich von Forgy’s, indem er die Objekte einzeln
59 Vgl. Ripley (1996) S. 312
60 Vgl. Backhaus u. a. (1997) S. 152f
61 Vgl. Hartigan (1975) S. 84ff
62 Kaufman und Rousseuw (1990) S. 68ff
63 in SPlus 3.0 und 4.0 durch den Aufruf der Cluster-Library
64 Vgl. Ripley (1996) S. 312
26
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
nacheinander betrachtet und einer Gruppe zuweist. Dabei wird das Clusterzentrum jedesmal neu berechnet, wenn ein Objekt einer Gruppe zugeordnet wird. Ein bestimmter Algorithmus von Hartigan f¨ ur k-means ist in S-Plus integriert. Er basiert ¨ ahnlich wie Forgy’s Algorithmus auf der Verschiebung einzelner Objekte von einer Gruppe zu einer anderen. 65
Ausgangspunkt f¨ ur Hartigan’s k-means-Algorithumus ist eine Initialpartition. Diese Intialpartition kann beispielsweise aus einer vorgeschalteten hierarchischen Clusteranalyse resultieren. 66 F¨ ur jede Partition wird nun ein Fehler e berechnet, der definiert ist durch die Summe der quadrierten Distanzen von ihrem jeweiligen Clustermittelwert: 67
∑¤ 1 2 £ £ e P m¡ k¤ i m¦ d i¡ l i¤ (3.4) £ ¢ ¥ ¥ £ ¢ mit:
• 1 . . . m der Anzahl Objekte,
£ • l i¤ dem Cluster, das das ite Objekt enth¨ alt und
£ • d i¡ l i¤ die unquadrierte euklidische Distanz zwischen Objekt i und dem Mittelwert
£ ¢ £ des Clusters l i¤ , in dem Objekt i aufgrund der Initialisierung liegt.
Ziel des Algorithmus ist es, eine Partition mit einem kleinen e zu suchen, indem er solange die Objekte von einem Cluster zum n¨ achsten verschiebt, bis der Fehler e nicht mehr verkleinert werden kann.
Im Folgenden werden die einzelnen Schritte des k-means-Algorithmus vorgestellt. F¨ ur das erste Objekt i gilt:
1. SCHRITT: Berechne die Klassen-Mittelwerte f¨ ur alle k, und den Initialfehler e mit Gleichung (3.4)
2. SCHRITT: F¨ ur das erste Objekt i, berechne f¨ ur jedes Cluster l
2 2 £ £ £ £ n l d 1¡ l n l 1¤ d 1¡ l 1¤
£ ¢ £ ¢ (3.5) ¤ ¤
¡ ¡ £ £ n l 1 n l 1¤ 1
¡ ¨ § £ ¢ ¤
£ die Ver¨ anderung des Fehlers, wenn man das erste Objekt i von Cluster l 1¤ , in
dem das erste Objekt momentan liegt, nach Cluster l verschoben wird. 68 Dabei
65 Vgl. Ripley (1996) S. 312
66 Ripley (1996) S. 313
67 Vgl. Hartigan (1975) S. 92
68 Vgl. Hartigan (1975) S. 85
27
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
£ ist n l die Anzahl von Objekten in Cluster l. Wenn (3.5) das Minimum ¨ uber alle
¤ £ l l 1¤ und negativ ist, transferiere das Objekt in dieses Cluster l min . Berechne die £ Mittelwerte des Cluster von l 1¤ und l min neu und addiere die Zunahme im Fehler £ e in e P m¡ k¤ hinzu.
£ ¢
£ 3. SCHRITT: Wiederhole den 2. Schritt f¨ ur alle Objekte i mit 2 i m¤ .
¥ ¥
4. SCHRITT: Wenn keine weitere Verschiebung f¨ ur ein Objekt i stattfindet, breche ab. Andernfalls, gehe zu Schritt 2.
Zur Verdeutlichung des k-means-Algorithmus wird im Folgenden das Beispiel aus der hierarchischen Clusteranalyse (siehe Abschnitt 3.2.1) verwendet. Zur Initialisierung wird, wie von Ripley 69 vorgeschlagen, eine hierarchische Clusteranalyse nach dem Complete-Linkage Verfahren verwendet. Dabei wird aus didaktischen Gr¨ unden auf eine Einteilung von zwei Klassen zur¨ uckgegriffen, die folgende Regionen beinhalten:
1. CLUSTER: Duisburg/Essen, Bonn, Rhein-Main und D¨ usseldorf
2. CLUSTER: M¨ unster und Bielefeld.
Die standardisierten Werte 70 der sechs Lage- und Siedlungsvariablen sind:
0,66 1 M¨ unster 0,50 1,02 1,13 1,27 0,34
2 Bielefeld 3 Dusiburg/Essen 0,99 4 Bonn 5 Rhein-Main 6 D¨ usseldorf
Die Initial-Mittelwerte der beiden Cluster lauten:
69 Vgl. Ripley (1996) S. 313
70 ¨ Ubersichtshalber auf zwei Stellen gerundet
28
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
F¨ ur diese Inititalpartition betr¨ agt der Fehler e nach Gleichung (3.4) als Summe der quadrierten Abst¨ ande
0¡ 67¤ 2 0¡ 56¤ 2 1¡ 05¤ 2 £ £ £ £ e P 6¡ 2¤ 0¡ 66 0¡ 5 1¡ 02 ¡ ¡ ¡ £ ¢ § § §
Die Distanzen der Region 1 (M¨ unster) zu den zwei Mittelwerten der Cluster betragen:
1¡ 1¤ 2 0¡ 95¤ 2 1¡ 01¤ 2 1¤ 2 £ £ £ £ d 0¡ 66 0¡ 5 1¡ 13 1¡ 33 ¡ ¡ ¡ ¡ ¡ § § §
1¡ 2¤ 2 0¡ 67¤ 2 0¡ 56¤ 2 1¡ 19¤ 2 £ £ £ £ d 0¡ 66 0¡ 5 1¡ 13 0¡ 01 ¡ ¡ ¡ ¡ ¡ § § § £ Entsprechend Gleichung (3.5) ist die Zunahme im Fehler e P 6¡ 2¤
£ ¢
wenn die Region M¨ unster in das erste Cluster verschoben werden w¨ urde. Ebenso w¨ urden £ die Regionen 2 (Bielefeld) und 3 (Duisburg/Essen) eine Erh¨ ohung von e P 6¡ 2¤ bewir- £¢
ken. Eine Verschiebung dieser Regionen w¨ urde also den Fehler e und damit die Varianz erh¨ ohen. Von einer Umordnung dieser Regionen wird daher abgesehen. Bei Region 4 (Bonn) verh¨ alt es sich anders; die Distanzen zu den Mittelwerten der zwei Cluster betragen:
4¡ 2¤ 2 4¡ 1¤ 2 £ £ d 0¡ 86 und d 0¡ 61
Die ¨ Anderung in e betr¨ agt
Eine Verschiebung der Region 4 nach Cluster 2 vermindert in diesem Fall den Fehler von 1,55 um 0,24 auf 1,31. Im Anschluß werden die Mittelwerte der beiden Cluster neu berechnet.
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
Eine Verringerung von e wird auch durch die Betrachtung der Regionen 5 und 6 nicht erreicht, so dass der Algorithmus abbricht und das Endergebnis die Klassifikation mit den zwei Clustern (Rhein-Main, Duisburg/Essen, D¨ usseldorf) und (Bielefeld, M¨ unster, Bonn) ist.
F¨ ur den k-means-Algorithmus gibt es leider keine eigene grafische Darstellung, die die Lage der Objekte zueinander mit ihren Distanzen wiedergibt. Daher werden wir zur Darstellung des Klassifikationsergebnisses die ersten beiden Hauptkomponenten der Lage-und Siedlungsvariablen berechnen und gegeneinander abtragen, um einen Eindruck ¨ uber
die Lage der Regionen zueinander zu erhalten.
Zweite Hauptkomponente
Abbildung 3.4: Darstellung des Klassfikationsergebnisses des k-means-Alogrithmus mit Hilfe von Hauptkomponenten
Die Zahlen kennzeichnen die Cluster, in die die Regionen von k-means klassifiziert wurden, die Kreuze symbolisieren die Clustermittelwerte.
In Cluster 2 mit den Regionen Bonn, M¨ unster und Bielefeld ist zu beobachten, dass Bonn weit abseits von M¨ unster und Bielefeld liegt. Aufgrund der Verschiebung von Bonn in dieses Cluster, zeichnet sich Cluster 2 durch einen hohen Heterogenit¨ atsgrad aus. Deswegen muss gepr¨ uft werden, ob sich das Ergebnis durch eine Ver¨ anderung der Klassenanzahl verbessert.
Zur Auswahl der Klassenanzahl empfiehlt Hartigan die verschiedenen Varianzen zu be-Daumenregel“ als Pr¨ ufgr¨ oße an: 71 trachten. Daf¨ ur gibt er folgende ”
71 Hartigan (1975) S. 90f
30
KAPITEL 3. STATISTISCHE VERFAHREN DER RAUMTYPISIERUNG
R setzt die Fehler e f¨ ur k und k 1 Klassen ins Verh¨ altnis und berechnet die Ver¨ anderung
§
des Fehlers e, wenn man sich f¨ ur die Aufnahme einer zus¨ atzlichen Klasse, also k 1, ent-
§
scheiden w¨ urde. Wenn R gr¨ oßer als 10 ist, w¨ are nach Hartigan die Aufnahme einer weiteren Klasse gerechtfertigt, da der Fehler e sich gen¨ ugend verkleinert. Im Umkehrschluß bedeutet dies, dass bei einem Wert von R 10 die Aufnahme einer zus¨ atzlichen Klasse
¡ nicht gerechtfertigt ist.
In der nachfolgenden Tabelle sind die Werte von R, dem Fehler e sowie die within-Cluster Quadratsumme angegeben, deren Aufsummierung e ergibt, f¨ ur die F¨ alle k 2¡ 3¡ 4 aufge-
listet:
3 6,491 4 4,896 Max n“ gibt die Anzahl von Objekten an, die sich im gr¨ oßten Cluster befinden.
”
In diesem Beispiel erreicht die Pr¨ ufgr¨ oße R keine Werte nahe bei 10. Sie kann also nicht eindeutig zur Wahl der Klassenanzahl beitragen. Da bei der Wahl von zwei Klassen des R am niedrigsten ist, sollte diese Alternative in Betracht gezogen werden.
Vergleicht man die agglomerativen hierarchischen Clusterverfahren und den k-means- Algorithmus,so ergibt sich ein zentraler Unterschied: W¨ ahrend bei den erstgenannten Verfahren ein einmal konstruiertes Cluster durch die Verschmelzung von Objekten nicht mehr aufgel¨ ost werden kann, kann beim k-means-Algorithmus jedes Element von Cluster zu Cluster beliebig verschoben werden. Der k-means-Algorithmus zeichnet sich somit durch einen gr¨ oßere Variabilit¨ at aus.
In den Regionalwissenschaften haben die Autoren keine konkrete Anwendung des k-means-Algorithmus zur Klassfikation von Regionen oder St¨ adten gefunden. Das Ergebnis der Klassifikation h¨ angt stark von einer geeigneten Wahl der Initialpartition ab. 72 Außerdem reagiert k-means sensibel gegen¨ uber Ausreißern, die im Vergleich zu den ¨ ubrigen Objekten im gleichen Cluster weit entfernt liegen, und die den Mittelwert dieses Clusters beeinflussen.
72 Vgl. Backhaus u. a. (1997) S. 154
31
Arbeit zitieren:
Kahn Thomas, Olaf Brühl, 2001, Analyse der Standortqualität zur Beurteilung der wirtschaftlichen Leistungsfähigkeit im interregionalen Vergleich, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Gemeinschaftsaufgabe: "Verbesserung der regionalen Wirtschaftsstr...
Geowissenschaften / Geographie - Wirtschaftsgeographie
Seminararbeit, 12 Seiten
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Kahn Thomas hat den Text Analyse der Standortqualität zur Beurteilung der wirtschaftlichen Leistungsfähigkeit im interregionalen Vergleich veröffentlicht
Kahn Thomas hat einen neuen Text hochgeladen
0 Kommentare