Integration geographischer Daten in unternehmensweite Wissensinfrastrukturen

Diskussion, Konzeptualisierung und Anwendungsbeispiele


Diplomarbeit, 2006

124 Seiten, Note: 1.7


Leseprobe


Inhaltsverzeichnis

Anhangsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einführung
1.1 Historische Entwicklung
1.2 Gegenwärtige Entwicklung
1.3 Motivation
1.4 Zielstellung
1.5 Vorgehen und Struktur der Arbeit

2 Geographische Daten
2.1 Begriffsbestimmung geographische Daten
2.2 Raumbezogene Daten
2.2.1 Geometriedaten
2.2.2 Topologische Daten
2.2.3 Graphikdaten
2.3 Thematische Daten
2.3.1 Attributdaten
2.3.2 Multimediale Daten
2.3.3 Metadaten
2.4 Einordnung von Geodaten
2.5 Geodatenmarkt
2.5.1 Anbieter von Geodaten
2.5.2 V erwender von Geodaten
2.5.3 Datenwert und Datenqualität

3 Grundlagen geographischer Informationssysteme und unternehmensweiter Wissensinfrastrukturen
3.1 Definition von geographischen Informationssystemen
3.2 Funktionalität eines geographischen Informationssystems
3.2.1 Datenbeschaffung
3.2.2 Datenverwaltung
3.2.3 Datenmodellierung und Datenanalyse
3.2.4 Datenpräsentation und Dateninteraktion
3.3 Bedeutung der unternehmensweiten Wissensinfrastruktur
3.4 Schichten der unternehmensweiten Wissensinfrastruktur
3.4.1 Infrastrukturschicht
3.4.2 Integrationsschicht
3.4.3 Wissensschicht
3.4.4 Zugriffsschicht
3.5 Fazit

4 Konzept für die Integration geographischer Daten in die unternehmensweite Wissensinfrastruktur
4.1 EKI-Anbieter
4.1.1 V orstellung ausgewählter EKI-Anbieter
4.1.2 Auswahl geeigneter Bewertungskriterien
4.2 Infrastrukturschicht
4.2.1 Netzwerktechnologien
4.2.2 Infrastrukturdienste
4.2.3 Anwendungsinfrastruktur
4.2.4 Ergebnisse der Evaluation
4.3 Integrationsschicht
4.3.1 Definition Integration
4.3.2 Datenintegration
4.3.3 Semantische Integration
4.3.4 Nutzerintegration
4.3.5 Funktions- und Prozessintegration
4.3.6 Ergebnisse der Evaluation
4.4 Wissensschicht
4.4.1 Suchdienste
4.4.2 Kollaboration
4.4.3 Ergebnisse der Evaluation
4.5 Zugriffsschicht
4.5.1 Servertechnologien
4.5.2 Clienttechnologien
4.5.3 Mobiler Zugriff
4.5.4 Ergebnisse der Evaluation
4.6 Fazit und Konzeptvorschlag

5 Anwendungsszenario: Geographische Daten für das Wissensretrieval

6 Zusammenfassung und Ausblick

Literaturverzeichnis

Anhang

Anhangsverzeichnis

Anhang A. Beispiele für Vektor- und Rasterdaten

Anhang B. EKI-Dienste und Technologiebeispiele

Anhang C. Beispiel für ein GML-Dokument

Abbildung 1: Einordnung geographischer Daten in Datenkategorien

Abbildung 2: Architektur von Wissensinfrastrukturen

Abbildung 3: Geographisches Wissensretrieval in Dokumentenbeständen

Abbildung 4: Integrationskonzept für Geodaten und Wissensinfrastrukturen

Abbildung A.1: Vektordaten: ATKIS

Abbildung A.2: Vektordaten: Leitungskataster

Abbildung A.3: Vektordaten: Automatisierte Liegenschaftskarte

Abbildung A.4: Rasterdaten: Digitales Geländemodell

Abbildung A.5: Rasterdaten: Satellitenbild

Abbildung A.6: Rasterdaten: Luftbild

Tabellenverzeichnis

Tabelle 1: Erfassungstechniken für Vektor-, Raster- und Attributdaten

Tabelle 2: Kategorisierung der EKI-Anbieter

Tabelle 3: Empirische Ergebnisse der Infrastrukturschicht

Tabelle 4: Empirische Ergebnisse der Integrationsschicht

Tabelle 5: Empirische Ergebnisse der Wissensschicht

Tabelle 6: Verfahren für die Positionsbestimmung

Tabelle 7: Kategorisierung von Location Based Services

Tabelle 8: Empirische Ergebnisse der Zugriffsschicht

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einführung

In diesem Kapitel wird zunächst die Entwicklung geographischer Daten und Informationssysteme aufgezeigt. Anschließend werden Motivation, Zielstellung, Vorgehen und Struktur der Arbeit vorgestellt.

1.1 Historische Entwicklung

Die Herstellung und Verwendung geographischer Daten haben ihren Ursprung in der Kartographie. Die älteste erhaltene Karte ist ein Plan der mesopotamischen Stadt Nippur, der vor ca. 5000 Jahren auf eine Tontafel eingeritzt wurde (vgl. Bartelme, 2000, S. 7). Seit mehr als zweitausend Jahren erforschen Mathematiker, Astronomen, Physiker, Geographen und Ingenieure die Gestalt und Dimension der Erde, um kartographische Grundlagen für die Navigation und Orientierung auf dem Land und dem Meer anzufertigen (vgl. Buhmann/Wiesel, 2004, S. 175).

Gegen Ende des 15. Jahrhunderts wurde die Erstellung von Karten zunehmend wissenschaftlich. Die ersten topographischen Karten[1] entstanden im 18. Jahrhundert. Diese ermöglichten dem Staat und der Gesellschaft die Abgrenzung von politischen Zuständigkeiten und Privatbesitz, sie dienten aber auch zur Durchführung von Planungsmaßnahmen für Landnutzung und Verkehr, sowie für innere und äußere Sicherheit (vgl. BMI, 2006).

Mit dem Aufkommen von Computern Mitte des 20. Jahrhunderts entwickelte sich die Geoinformatik als Wissenschaft von der Verarbeitung von geographischen Daten und Informationen sowie der Anwendung von geographischen Informationssystemen (kurz GIS). Ab 1970 erfolgten erste Bestrebungen geographische Daten digital zu führen, um somit die Verwaltung der Daten in den Behörden zu erleichtern. Seit 1982 entwickeln Hard- und Softwarehersteller Technologien für den GIS-Markt (vgl. Bartelme, 2000, S. 8). Durch den Einsatz von GIS können Karten dynamisch generiert werden und somit die bisher klassischen Kartenwerke und Methoden der Kartennutzung ergänzen bzw. ablösen (vgl. Buhmann/Wiesel, 2004, S. 175).

1.2 Gegenwärtige Entwicklung

Der gesellschaftliche Wandel zur Informations- und Wissensgesellschaft und damit einhergehend die technische Entwicklung und Verbreitung des Internets ab 1995 machen die ehemals Spezialisten vorbehaltenen geographischen Daten, Informationen und Analysewerkzeuge auch für Privatanwender nutzbar. Neue Anwendungen wie Google Earth und Google Maps, persönliche Navigationssysteme, Location Based Services oder Routenplaner bestätigen den derzeitigen Trend zur Nutzung von geographischen Daten und Technologien.

Auch Unternehmen erkennen immer stärker die Bedeutung geographischer Daten. So stieg 2004 die Anzahl der in Deutschland gemeldeten GIS-Lizenzen gegenüber dem Vorjahr um 58 % auf ca. 592.000 Arbeitsplätze (vgl. Buhmann/Wiesel, 2004, S. 20).

In der Literatur wird häufig der Begriff „Geo“ anstatt „Geographisch“ verwendet. Das wurde für den weiteren Verlauf der Arbeit übernommen.

1.3 Motivation

Der Trend zu immer komplexeren Produkten und Dienstleistungen in einer durch kurze Produktlebenszyklen, ständigen Wandel, Globalisierung und Internationalisierung geprägten Umwelt, veranlasst Unternehmen schnelle und fundierte Analysen und Entscheidungen zu treffen und sich den Marktgegebenheiten anzupassen. Grundlage für Unternehmensentscheidungen sind dabei Daten, Informationen und Wissen.[2] Um wettbewerbsfähig zu bleiben, muss eine Organisation die wertvolle Ressource Wissen auf der Basis von Daten und Informationen effizient und effektiv erzeugen, lokalisieren, bewahren, austauschen und anwenden. Dies erfordert eine Wissensmanagementstrategie und die Entwicklung einer Wissensinfrastruktur, in der Wissensmanagementprozesse und -technologien implementiert werden (vgl. Zack, 1999, S. 45). Daten und Informationen bilden somit wichtige Bausteine für die Wissensgenerierung und die Entscheidungsunterstützung. Der Umgang mit Geodaten und -informationen sowie die Entwicklung und der Einsatz von Geo-Technologien, sind darüber hinaus von herausragender Bedeutung. Wendt (1997) stellt fest, dass fast 80 % der Unternehmensdaten einen Raumbezug haben und somit wirtschaftliche Entscheidungen maßgebend beeinflussen (vgl. Wendt, 1997, S. 1). So bieten raumbezogene Unternehmensdaten wie die Adressdaten eines Kunden, Standortdaten und Logistikdaten verknüpft mit Koordinaten, Satellitenbildern oder komplexen Karten ein großes Auswertungspotential, u.a. für Umsatzanalysen, optimale Standortplanung, Tour- und Routenplanung, Positionsermittlung und mobile ortsbezogene Dienste. Zudem ist der Einsatz von Geodaten als interaktive Karte für die Suche und Navigation in verteilten Wissensbeständen bedeutsam (vgl. Tochtermann/Schwartz-Gläsker, 2001, S. 1).

1.4 Zielstellung

Vor dem beschriebenem Hintergrund ist es sinnvoll, geographische Daten in die organisationale Wissensinfrastruktur zu integrieren. Ziel dieser Arbeit ist, ein Konzept für die Integration von geographischen Daten in die unternehmensweite Wissens­infrastruktur zu entwickeln. Hierzu sind verschiedene Fragestellungen notwendig. Grundlegend ist zu eruieren, welche Geodatenarten zu unterscheiden sind, welche Anbieter und Verwender von Geodaten existieren und wie die Qualität und der Wert von Geodaten eingeschätzt werden kann. Des weiteren bedarf es einer Betrachtung der Funktionalitäten eines GIS sowie der Bedeutung und Architektur einer unternehmensweiten Wissensinfrastruktur. Dabei ist die Auswahl einer geeigneten Architektur für eine Wissensinfrastruktur essentiell Zur Entwicklung eines Konzeptes sind die Architekturbestandteile in Bezug auf Geodaten zu analysieren. Hierbei müssen Aspekte der Interoperabilität zwischen verschiedenen Daten und Anwendungskomponenten, die Nutzung von Geodaten im Rahmen von Wissensmanagement sowie Zugriffsmöglichkeiten auf Geodaten berücksichtigt werden. Für eine Konzeptentwicklung sind zudem empirische Erkenntnisse über den gegenwärtigen Stand und die Umsetzung der Integration von GIS in Wissensinfrastrukturen bedeutsam. Ein abschließendes Szenario zeigt exemplarisch die Einsatzmöglichkeiten von Geodaten und GIS im Unternehmen auf.

1.5 Vorgehen und Struktur der Arbeit

Die vorliegende Arbeit gliedert sich in 6 Kapitel. Im Anschluss an die Einleitung, erfolgt in Kapitel 2 eine Begriffsbestimmung. Dazu werden die Geodaten in verschiedene Datenarten kategorisiert und in die organisationale Datenbasis eingeordnet. Es werden außerdem verschiedene Anbieter und Verwender von Geodaten vorgestellt. Dabei spielt die Qualität von Geodaten eine Rolle. Kapitel 3 vermittelt ein Grundverständnis zu Funktionen von GIS sowie zur Bedeutung und Architektur einer unternehmensweiten Wissensinfrastruktur. Darauf aufbauend erfolgt in Kapitel 4 die Analyse der einzelnen Schichten der Wissensinfrastruktur in Bezug auf die Integration von Geodaten und GIS. Hierzu werden Besonderheiten und Herausforderungen analysiert. Anhand dieser Erkenntnisse werden empirische Untersuchungen von einigen verbreiteten Lösungen für Wissensinfrastrukturen durchgeführt. Die Ergebnisse über den gegenwärtigen Stand zur Integration fließen in das Integrationskonzept ein. Kapitel 5 stellt dann beispielhaft ein Szenario zur Umsetzung und Nutzung im Unternehmen vor. Abschließend erfolgt in Kapitel 6 eine Zusammenfassung der gewonnenen Erkenntnisse und ein Ausblick auf zukünftige Entwicklungen.

2 Geographische Daten

In diesem Kapitel erfolgt zunächst die Bestimmung des geographischen Datenbegriffs. Daraus abgeleitet werden zwei Kategorien unterschieden: raumbezogene und thematische Daten. Die darin aufgeführten Datenarten werden für ein besseres Verständnis in ein allgemeingültiges Klassifikationsschema eingeordnet. Anschließend wird die aktuelle Situation des Geodatenmarktes diskutiert.

2.1 Begriffsbestimmung geographische Daten

Der DIN (Deutsches Institut für Normung e.V.) Standard 44300 bezeichnet Daten als Zeichen oder kontinuierliche Funktionen, die aufgrund von bekannten oder unterstellten Abmachungen und zum Zweck der maschinellen Verarbeitung, Information darstellen (vgl. Lehner et al., 1995, S. 200). Daten werden somit verwendet, um Informationen mittels computerinterner Abbildung zu übertragen und zu speichern. Abstrakt lässt sich der Datenbegriff wie folgt definieren: „Daten sind Abbildungen der Realität oder der Vorstellungswelt des Menschen“ (Lehner et al., 1995, S. 200). Die Daten sagen jedoch nichts über die Bedeutung der übertragenen Information aus. Erst durch die Verknüpfung von Daten und die Anreicherung mit zusätzlichem Kontext, wird den Daten eine Bedeutung zugewiesen (vgl. Krcmar, 2003, S. 14).

Daten, die eine geographische bzw. räumliche Realität abbilden, werden als geographische Daten bzw. Geodaten bezeichnet. Der Begriff Geo entstammt vom griechischen Wort ge oder gäa und wird mit „Erde“ übersetzt. Bezugsobjekt geographischer Daten ist somit die Erde bzw. regionale oder lokale Teilgebiete (vgl. Bill/Fritsch, 1997, S. 6).

Dementsprechend werden geographische Daten wie folgt definiert:

„ Geographische Daten sind Daten über Gegenstände, Geländeformen und Infrastrukturen an der Erdoberfläche, wobei als wesentliches Element ein Raumbezug vorliegen muss“ (Bill/Zehner, 2001, S. 106).

Geographische Daten bestehen dabei aus geometrischen, topologischen, graphischen und Attributdaten. Die ersten drei Eigenschaften lassen sich nach Bill und Zehner (2001) als raumbezogene Daten bezeichnen. Attributdaten sind thematische Daten, da sie Geoobjekte thematisch beschreiben (vgl. Bill/Zehner, 2001, S. 106f). Weitere

Datenarten wie Multimedia- und Metadaten sind ebenfalls für die Beschreibung von Geodäten sinnvoll und demnach in diese Kategorie einzuordnen.

Analog Krcmar’s (2003) Daten- und Informationsbegriff, stellt somit die Gesamtheit von geometrischen, topologischen, graphischen und Attributdaten, eine durch Zeichen codierte und maschinell verarbeitbare, geographische Information dar.

2.2 Raumbezogene Daten

Raumbezogene Daten beschreiben räumliche Eigenschaften eines Objektes. Dazu zählen Geometriedaten, topologische Daten und Graphikdaten.

2.2.1 Geometriedaten

Geometriedaten ermöglichen die geometrische Definition eines räumlichen Objektes, auch Geoobjekt genannt. Dazu beschreiben sie Lage und Form der Daten unter Bezugnahme auf ein Referenzsystem. Dabei können bis zu vier Dimensionen spezifiziert werden. 0-dimensionale Geometriedaten stellen einen Punkt, 1- dimensionale eine Linie, 2-dimensionale eine Fläche und 3-dimensionale einen Körper dar. Die vierte Dimension ermöglicht darüber hinaus die Angabe einer Zeit, z.B. Kalenderangabe oder Normzeit. Mittels Koordinatenangaben können dann die beschriebenen Objekte direkt referenziert werden. Ein Referenzsystem bestimmt die Koordinatenangaben durch das Festlegen eines geodätischen Datums und eines Koordinatensystems. Geodätische Daten legen zunächst den Koordinatenursprung, die Anordnung und Ausrichtung der Koordinatenachsen und die Maßstäbe der Achsen fest. Dabei spielt die zugrunde gelegte Gestalt der Erde eine Rolle. Diese kann als Ebene, Kugel bzw. Ellipsoid oder Geoid[3] definiert werden. Ein wichtiges geodätisches Datum ist das World Geodetic System 1984.

Die Definition eines Koordinatensystems erfolgt geodätisch oder kartesisch. Kartesische Koordinatensysteme bestimmen Lage und Höhe, basierend auf dem geodätischen Datum, als x,y,z - Koordinaten. Geodätische Koordinatensysteme geben Längen- und Breitengrade sowie Höhenmeter an. Beispiele für geodätische Koordinatensysteme sind Gauss-Krüger und Universal Transverse Mercator. Aufgrund unterschiedlicher geodätischer Daten und Koordinatensysteme, kann eine Position auf der Erde somit verschiedene Koordinaten haben.

Im Gegensatz zu den Koordinaten-basierten Geodaten, wird in Rasterstrukturen die Referenz durch die Zeilen- und Spaltennummern hergestellt (vgl. Bartelme, 2000, S. 198-206 und Seeger, 1999, S. 427-434). Dieser Unterschied basiert auf der rechnerinternen Darstellung von Geometriedaten. Diese werden entweder als Vektordaten oder Rasterdaten erfasst und verwaltet. Aus beiden Strukturen können dann geographische Karten erzeugt werden (vgl. Delaney, 1999, S. 15ff).

Vektordaten

Vektordaten beschreiben räumliche Strukturen durch Punkte, Linien und Flächen. Punkte entsprechen bspw. einer genauen Adresse, Linien z.B. einer Straße und Flächen oder Polygone z.B. einem Bezirk. Punkte stützen sich dabei auf Koordinatenwerte. Linien und Flächen werden ebenfalls aus Koordinaten erzeugt. Eine Linie kann dazu aus zwei oder mehreren Punkten bestehen. Durch die Kombination der elementaren Strukturen entstehen komplexe Linien- und Flächennetze (vgl. Bartelme, 2000, S. 54f). Je nach Skalierung der späteren Karte, werden unterschiedliche Strukturen für die Darstellung eines Objektes verwendet werden. Eine Stadt kann auf einer Karte mit kleinem Maßstab durch einen Punkt dargestellt werden, während sie bei einem größeren Maßstab durch eine Fläche repräsentiert wird (vgl. Delaney, 1999, S. 17f). Beispiele für Vektordaten sind Ländergrenzen, Verkehrsnetze, Grundstückspläne oder Leitungsnetze (vgl. Anhang A, Abbildung A.1-A.3). Vektordaten werden hauptsächlich im großmaßstäblichen Bereich von 1:100 bis 1:10.000 verwendet. Anwendungsgebiete sind somit beispielsweise im Liegenschaftskataster, zur Flurbereinigung sowie für Leitungsdokumentationen und Planungen zu sehen (vgl. Bill/Fritsch, 1997, S. 22f). Vektorbasierte Geodaten definieren den Raumbezug aufgrund von Koordinatenangaben genauer als Rasterdaten, jedoch ist der Aufwand für die Datenbeschaffung und zur Datenverarbeitung in einem GIS größer (vgl. Delaney, 1999, S. 17f).

Rasterdaten

Rasterdaten beziehen sich im Gegensatz zu Vektordaten direkt auf Flächenabbildungen. Das Grundelement ist das Pixel, welches in Form einer Matrix aus gleichförmigen quadratischen oder rechteckigen Elementen angeordnet ist. Jedes Pixel enthält eine Bildinformation. Dies können Grauwerte, Farbwerte als auch andere numerische

Informationen, wie Messwerte, Emissionswerte oder Höhen sein. Es können auch 3- dimensionale Matrixzellen, sogenannte Voxel oder Quader abgebildet werden. Rasterdaten stellen somit einen Raumbezug mittels eines Rasternetzes dar. Es wird nicht nach Punkten, Linien und Flächen unterschieden. Dadurch existieren keine direkten Beziehungen zwischen den einzelnen Pixeln (vgl. Bartelme, 2000, S. 53f und Delaney, 1999, S. 18 und Bill/Fritsch, 1997, S. 25). Die Hauptanwendung von Rasterdaten liegt im mittleren Maßstabsbereich, z.B. 1:10.000 bis 1:1.000.000. Rasterdaten werden vor allem in der Photogrammetrie, Fernerkundung sowie Kartographie erzeugt und verarbeitet. Sie finden jedoch auch bei der Erstellung digitaler Geländemodelle Verwendung (vgl. Bill/Zehner, 2001, S. 219 und Anhang A, Abbildung A.4-A.6). Ein Vorteil von Rasterdaten ist die einfache und schnelle Datenerfassung. Allerdings steht diesem die große Datenmenge und der dadurch erhöhte Rechenaufwand gegenüber. Ferner bieten Rasterdaten eine geringere räumliche Genauigkeit, da lediglich Flächen und keine Koordinaten repräsentiert werden können. Außerdem können keine präzisen Attributangaben gemacht werden, da einer Zelle lediglich eine Schattierung oder ein Wert zugewiesen wird (vgl. Delaney, 1999, S. 18). Insgesamt sind Rasterdaten für die Abbildung von Flächen besser geeignet, während Vektordaten für Punkt- und Liniendarstellungen geeignet sind. Beide Geometriestrukturen werden je nach Verwendungszweck genutzt und somit parallel in einem GIS geführt. Beide Geometriestrukturen werden für die Erzeugung von Karten benötigt. Dabei können die Strukturen auch zu einer gemeinsamen, komplexen Karte verschnitten werden (vgl. Bill/Fritsch, 1997, S. 23). Dies wird in Abschnitt 3.2.3 vertieft.

2.2.2 Topologische Daten

Topologische Daten zeigen räumliche Beziehungen zwischen Geoobjekten an. Punkte, Linien und Flächen können zueinander in Beziehung stehen. Das wird beispielsweise durch die Angabe von Anfangs- und Endpunkten einer Linie und daran angrenzender Flächen definiert (vgl. Bill/Fritsch, 1997, S. 22ff). In Vektordaten können topologische Verbindungselemente zusätzlich und explizit angegeben werden, bspw. wird einer Linie ein Kreisbogen mit einem bestimmten Radius zugewiesen. Topologische Beziehungen bei Rasterdaten sind implizit durch die zeilen- und spaltenweise Anordnung in der Matrix vorgegeben (vgl. Delaney, 1999, S. 17f).

2.2.3 Graphikdaten

Graphikdaten bestimmen wie Geoobjekte in Bezug zu einer Thematik oder einem Ausgabegerät dargestellt werden. Zu den graphischen Ausprägungen gehören Signatur, Farbe, Linienstil, Flächenstil, Schraffur, Symbol oder Grauwert. Die Ausprägungen werden dazu durch Attributangaben abgeleitet. Geometriedaten, topologische Daten, Attributdaten und graphische Ausprägungen erzeugen dann in ihrer Gesamtheit Vektor­oder Rastergraphiken (vgl. Bill/Fritsch, 1997, S. 26).

2.3 Thematische Daten

Thematische Daten sind anwendungsspezifische, nichtgeometrische Daten eines Fachanwenders, die den thematischen Inhalt eines raumbezogenen Objekts wiedergeben, indem verschiedene thematische Zuordnungen vorgenommen werden. Beispielsweise kann ein Flurstück durch die Lage, den Eigentümernachweis und eine Bodenschätzung beschrieben werden. Zu den thematischen Daten, auch Sachdaten oder beschreibende Daten genannt, werden in erster Linie Attributdaten gezählt. Multimediale Daten und Metadaten verknüpfen die raumbezogenen Daten mit weiteren Beschreibungen und können somit dieser Kategorie zugeordnet werden (vgl. Bill/Zehner, 2001, S. 228).

2.3.1 Attributdaten

Attributdaten ermöglichen eine eindeutige Identifizierung, Klassifizierung und Charakterisierung von raumbezogenen Objekten, indem sie den Objekten Namen, Zahlen, Messwerte, Eigenschaften etc. zuweisen. Beispielsweise erhält eine Straße die Identifikationsnummer B22, die Klassifizierung Bundesstraße und verschiedene Charaktereigenschaften wie zweispurig und Höchstgeschwindigkeit: 100km/h. Einer Stadt kann z.B. ein Name und die Einwohnerzahl zugewiesen werden. Diese Attributdaten werden dann direkt mit einem dargestellten Objekt verknüpft. Die Speicherung und Verwaltung von Attributdaten erfolgt zusammen mit den geometrischen, topologischen und graphischen Daten in einem Datenbank­managementsystem (kurz DBMS) (vgl. Behr, 2000, S. 29).

2.3.2 Multimediale Daten

Klassische GIS verwalten in der Regel Attributdaten. Es existieren jedoch in Unternehmen auch weitere Datenarten, sogenannte Hypermedia- oder multimediale Daten. Diese können ebenso mit den raumbezogenen Daten verknüpft werden. Multimediale Daten sind beispielsweise Text, Graphik, gescannte, bildliche Information, Audio, Video, Animation und Simulation. Die Verwaltung in Standard- DBMS ist jedoch aufgrund der schlechten Strukturierbarkeit der Daten schwierig (vgl. Behr, 2000, S. 29f). Der Einsatz von Dokumentenmanagement- und

Contentmanagementsystemen ist hier geeignet. Abschnitt 4.2.2 behandelt die Verknüpfung von raumbezogenen mit multimedialen Daten.

2.3.3 Metadaten

Zu den thematischen Daten gehören auch Metadaten. Allerdings sind diese allgemein für die Beschreibung von Daten, sowohl strukturierten als auch semi-strukturierten Daten, vorgesehen. „Metadaten sind Daten über Daten. Der Begriff bezeichnet alle Fakten zur Beschreibung und Spezifikation eines Informationssystems“ (Schwinn et al., 1998, S. 98). Durch Metadaten werden physische Strukturen und die Semantik aller Komponenten des Informationssystems beschrieben. Physische Datenmodelle legen die Datenstrukturen zur Speicherung der Daten in einer Datenbank fest. Semantische Datenmodelle beschreiben die Bedeutung der Daten im realen Kontext, z.B. Namen, Eigenschaften, Herkunft, Datum und Autor (vgl. Schwinn et al., 1998, S. 99). Metadaten, die zur Beschreibung von Geodaten genutzt werden, enthalten Informationen über Inhalt, Herkunft, Positionsgenauigkeit, Attributgenauigkeit, Aktualität, Konsistenz und Vollständigkeit (vgl. Behr, 2000, S. 151). Dies verlangt die Bereitstellung geo-spezifischer Metadatenstandards. Eine ausführliche Betrachtung erfolgt in Abschnitt 4.3.2.

2.4 Einordnung von Geodäten

Zum besseren Verständnis und zur Integration von Geodaten, sollen diese in die Datenbasis einer Organisation eingeordnet werden. Dazu wird eine Übersicht der verschiedenen Datenarten in Anlehnung an Hansen (1998) gewählt. Diese kategorisiert Daten nach Erscheinungsform, also Schrift, Ton oder Bild, nach Repräsentationsform,
also analog oder digital, und nach der Aufgabe im Verarbeitungsprozess, sogenannte Steuer- oder Nutzdaten. Nutzdaten sind in Stammdaten, Änderungsdaten, Bestandsdaten und Bewegungsdaten zu untergliedern (vgl. Hansen, 1998, S. 7f).

Die Besonderheit von Geodaten liegt in der bereits erwähnten Verknüpfung von raumbezogenen und thematischen Daten. (vgl. Bill/Zehner, 2001, S. 106). Abbildung 1 ordnet die vorgestellten Datenarten anhand von Beispieldaten in das Schema nach Hansen (1998) ein.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Einordnung geographischer Daten in Datenkategorien
(Quelle: in Anlehnung an Hansen, 1998, S. 8)

Vektordaten und -graphiken, topologische Daten, Attributdaten sowie Metadaten können als strukturierbare Daten eingeordnet werden, die in DBMS verwaltet werden. Zu den semi-strukturierten Daten zählen Rasterdaten und -graphiken sowie Multimediadaten, deren Verwaltung vorwiegend durch Dokumentenmanagement- oder Contentmanagementsysteme gehandhabt wird. Auf die Unterscheidung zwischen strukturierten und semi-strukturierten Daten wird im weiteren Verlauf der Arbeit eingegangen. Geodaten existieren in analoger und digitaler Form. Analoge Geodaten, wie Landkarten und Rasterbilder in Papierform, sind für die maschinelle Verarbeitung
in einem GIS mittels verschiedener Techniken zu digitalisieren (vgl. Abschnitt 3.2.1). Geodäten werden hinsichtlich ihrer Aufgabe im Verarbeitungsprozess den Nutzdaten zugeordnet. Dazu ist zwischen eher statischen Daten, sogenannten Stammdaten, und dynamischen Daten, sogenannten Bestandsdaten, zu unterscheiden. Stammdaten ändern sich über einen längeren Zeitraum wenig. Daten die häufigen Änderungen unterlegen sind, werden als Bestandsdaten bezeichnet. Eine Liegenschaftskarte wird beispielsweise für einen längeren Zeitraum angelegt und ist eine Kombination aus den genannten raumbezogenen und thematischen Daten. Diese sind demnach auch als Änderungsdaten zu sehen. Geographische Bestandsdaten sind beispielsweise Routen- und Navigationspläne, die sich relativ häufig durch aktuelle Positionsdaten oder Verkehrsdaten ändern.

2.5 Geodatenmarkt

Der deutsche Geodatenmarkt ist aufgrund der verschiedenen Anbieter und Verwender von Geodaten sehr undurchsichtig. Bernhardt (2002) beklagt die unbefriedigende Bereitstellung und den Umgang mit Geodaten. Viele Quellen sind nicht verfügbar oder sind von schlechter Qualität, Aktualität und Genauigkeit. Darüber hinaus sind hohe Preise und unterschiedliche Preismodelle üblich (vgl. Bernhardt, 2002, S. 129f). Aktuelle Bestrebungen liegen daher in der Entwicklung einheitlicher organisationaler, regionaler, nationaler und internationaler Infrastrukturen für Geodaten und damit verbundene Dienstleistungen. Eine Geodateninfrastruktur hat die Aufgabe, Geodaten und Dienste zu gewinnen, zu verwalten und effizient bereitzustellen sowie die kooperative Nutzung verteilter Dienste zu ermöglichen. Durch den Aufbau eines Netzwerks sowie der Nutzung und Einhaltung von Regeln und Standards, können Geodaten effizienter erstellt, bereitgestellt, ausgetauscht und genutzt werden. Zudem kann die Qualität der Geodaten verbessert werden. Dabei bietet sich an, Angebot und Nachfrage von Geodaten und -diensten über ein Portal zu verwalten (vgl. Bernard et al., 2005, S. 3).[4]

Bei der Nutzung von Standards spielt das Open Geospatial Consortium (kurz OGC) eine wesentliche Rolle. Dieses entwickelt seit 1994 internationale Schnittstellenspezifi­kationen und Standards, welche den einheitlichen Zugriff, die Austauschbarkeit und Interoperabilität von Geodaten und -diensten ermöglichen (vgl. Pichler/Klopfer, 2005, S. 9). Weitere Standardisierungsgremien sind die International Organization of Standardization (kurz ISO), welche auch eng mit dem OGC zusammenarbeitet und das Federal Geographic Data Committee (kurz FGDC), welches sich mit der Entwicklung von Location Based Services auseinandersetzt.

2.5.1 Anbieter von Geodäten

Generell lassen sich die angebotenen Geodaten in die Bereiche Geobasisdaten und Geofachdaten unterteilen. Geobasisdaten sind grundlegende Geodaten, welche topo­graphische bzw. landschaftliche Geoobjekte, Grundstücke und Gebäude mit einem einheitlichen Bezugssystem anwendungsneutral beschreiben. Dazu zählen unter anderem die automatisierte Liegenschaftskarte und das Liegenschaftsbuch für Liegenschaftskataster, ATKIS-Vektordaten, digitale Geländemodelle, Höhenmodelle, topographische Karten, Bezugsysteme, Grundlagennetze, nationale, regionale und lokale Verwaltungsgrenzen, Bilddaten wie Orthophotos, Luft- und Satellitenbilder. Geobasisdaten werden von öffentlichen Stellen als Auftrag erstellt. Dafür wird das Amtliche topographische kartographische Informationssystem (ATKIS) in deutschen Vermessungsämtern eingesetzt, welches digitale Landschaftsmodelle und kartographische Modelle für private und öffentliche Anwender zur Verfügung stellt. (vgl. Imagi, 2006).

Geofachdaten nutzen die Geobasisdaten als Grundlage und ergänzen diese um einen Fachbezug, bspw. aus Umwelt- und Naturschutz, Raumplanung, Innere Sicherheit, Landesverteidigung, Zivil- und Katastrophenschutz, Versorgung und Entsorgung, Wasserwirtschaft, Land- und Forstwirtschaft, Wetterdienst, Klimaforschung, Verkehr oder Statistik (vgl. Buhmann/Wiesel, 2004, S. 176).

Geobasisdaten und Geofachdaten werden von verschiedenen Anbietern bereitgestellt. Dies umfasst amtliche Daten vom Land, kommerzielle Daten aus der Wirtschaft sowie amtliche und kommerzielle Daten aus den Kommunen[5] (vgl. Bernhardt, 2002, S. 133).

Amtliche Geodäten

Zu den amtlichen Geodaten zählen die bereits genannten Geobasisdaten. Kleinmaßstäbige Geobasisdaten, im Maßstabsbereich 1:200.000 bis 1:1.000.000, werden zentral vom Bundesamt für Kartographie und Geodäsie bereitgestellt[6]. Groß- bis mittelmaßstäbige Geobasisdaten werden im Maßstabsbereich 1:25.000 bis 1:100.000, sofern sie nicht länderübergreifend sind, von den Landesvermessungsämtern der jeweiligen Bundesländer erzeugt und verwaltet.[7] Neben den Vermessungsämtern bieten auch das Landesamt für Umwelt und Geologie, das Statistisches Landesamt und das Deutsche Fernerkundungs-Datenzentrum, angesiedelt am Deutschen Zentrum für Luft- und Raumfahrt e.V.[8], Geodaten an. Letzteres stellt Satellitendaten zur Verfügung. Eine Liste über alle derzeitig in Bundeszuständigkeit befindlichen Anbieter von Geodaten wird vom interministeriellen Ausschuss für Geoinformationswesen (IMAGI)[9] bereitgestellt (vgl. Bernhardt, 2002, S. 133ff und Buhmann/Wiesel, 2004, S. 176).

Kommerzielle Geodaten

Die privatwirtschaftlichen Unternehmen bieten Geodaten aus eigenen Erhebungen an, führen im Auftrag von Verwaltungsämtern Geodatenerfassungen durch und veredeln Geodaten der Verwaltungsämter, um diese kommerziell zu nutzen. Die amtlichen Geodaten werden so mit umfangreichen Zusatzinformationen der Wirtschaft ange­reichert (vgl. Buhmann/Wiesel, 2004, S. 177). Kommerzielle Geodaten sind vorwiegend Geofachdaten aus den Bereichen Industrie, Verwaltung, Vermessung, Befliegung und Dienstleistung. Dementsprechend sind ihre Anbieter Energie­versorgungsunternehmen, Immobilienunternehmen, Investoren, Banken, Ver­sicherungen, Tourismus- und Verkehrsunternehmen (vgl. Bernhardt, 2002, S. 136ff).

Kommunale Geodaten

Amtliche und kommerzielle Geodaten werden auch durch Kommunen bereitgestellt. Dazu zählen Geodaten der Grundstücksverwaltung, Kommunalstatistiken, Daten zum Denkmalschutz, Daten aus dem öffentlichen Personennahverkehr, soziodemographische Daten sowie Kunden- oder Adressdaten (vgl. Bernhardt, 2002, S. 145f).

2.5.2 Verwender von Geodäten

Traditionelle Bereiche der Nutzung von Geodäten sind öffentliche Verwaltung, Kataster- und Vermessungswesen, Raumordnung und Städteplanung, Ver- und Entsorgung, Verteidigung, Umwelt, Klima, Katastrophenschutz und Logistik und Transport. Dabei können die genannten Anbieter gleichzeitig auch Verwender sein. Die gestiegene Nachfrage nach Geodaten und Geoinformationen ist vor allem im Zusammenhang mit der Weiterentwicklung von Internettechnologien zu sehen. Neuere Anwendungen finden sich im Bereich Geo-Marketing und Business Intelligence, in der Tourismus- und Reisebranche sowie zur Nutzung von ortsbezogenen Diensten (Location based Services). Das sind u.a. Dienste für mobiles Marketing, Positionsfinder und Suche nach Points-of-Interests, Navigationsdienste und ortsbezogene Billing- bzw. Bezahlungsdienste (vgl. Bernhardt, 2002, S. 170). Das steigende Interesse von Privatnutzern an Geodaten wird auch durch das zunehmende Angebot solcher Dienste im Internet deutlich. Beispielsweise bieten Map24, GoYellow, Google Maps oder Windows Live Local Möglichkeiten für die Routenplanung, zur Adress- und Ortfindung und für die Branchensuche an. Google Earth und NASA World Wind[10] verbinden im Gegensatz dazu die wirklichkeitsgetreue Abbildung der Erde mit verschiedenen Such- und Informationsdiensten, das sind u.a. Branchensuche, aktuelle Staumeldungen, Radarfallen oder Wetterberichte. Interessant im Rahmen dieser Arbeit ist insbesondere die Möglichkeit der Integration solcher Dienste in eigene Anwendungen und Dienstleistungen. Eine Vertiefung in die Thematik erfolgt in Abschnitt 4.5.3.

2.5.3 Datenwert und Datenqualität

Geodaten und Geoinformationen werden in allen Bereichen der Verwaltung, Wirtschaft, Wissenschaft und von privaten Nutzern benötigt, um die Entscheidungsfindung zu unterstützen. Die aus den Geodaten gewonnenen Geoinformationen und das daraus generierte Wissen sind somit Wirtschaftsgüter von hohem immateriellem Wert, den es verfügbar zu machen gilt. Dazu muss vor allem die Qualität der Daten gewährleistet werden (vgl. Bernhardt, 2002, S. 129ff).

Qualität wird als Gesamtheit aller charakteristischen Eigenschaften eines Produktes, die das Erfüllen von definierten oder implizierten Anforderungen ermöglichen, beschrieben (vgl. Bartelme, 2000, S. 228). Die Qualität des Produktes „Daten“ wird nach Schwinn (1998) durch den Datenqualitätsprozess sichergestellt. Dieser sorgt dafür, dass auf allen Stufen, von der Datenerzeugung über die Datenverarbeitung bis zur Datennutzung, bestimmte Qualitätseigenschaften anhand vorher festgelegter Kriterien und auf Basis von ISO-Standards oder bspw. dem Total-Quality-Management-Ansatz eingehalten werden. Die Daten werden somit innerhalb des gesamten Lebenszyklus dem Qualitätsmanagement unterzogen. Die geforderte Qualität ist dabei immer von einem Anwendungszweck bzw. einer Benutzergruppe abhängig (vgl. Schwinn et al., 1998, S. 230). Neben der Produktqualität ist auch die Qualität des Prozesses der Datenmodellierung zu beachten. Hierzu müssen verschiedene organisatorische Aspekte, u.a. Zielstellung, Organisationsstruktur und Projektorganisation, einbezogen werden (vgl. Maier et al., 2001, S. 7f). Dieser Aspekt soll jedoch im Rahmen der Arbeit nicht weiter vertieft werden. Für die Qualität von Geodaten ist er jedoch zu berücksichtigen.

Angesichts der langen Lebensdauer von Geodaten wird der Qualitätssicherung eine besonders große Bedeutung beigemessen. Geodaten unterliegen innerhalb ihres Lebenszyklus Transformationsprozessen. Daten werden verbessert, aktualisiert, modifiziert und kontrolliert. Beispielsweise kann sich die Lage eines Punktes durch eine neue oder exakte Messung verändern und damit einhergehend alle geometrischen Aussagen, die mit dem Punkt verknüpft sind wie Länge, Winkel oder Fläche. Auch thematische Daten können durch Verfeinerung und Vervollständigung verändert werden. Problematisch ist, dass die Daten von unterschiedlichen Personen interpretiert und verändert werden. Mit jeder Nutzung, Interpretation und Umstrukturierung der Daten steigt somit die Gefahr eines Qualitätsverlustes (vgl. Bartelme, 2000, S. 23 und S. 228f).

Für die Qualitätssicherung von Geodaten und Geoinformationen werden durch die ISO internationale Standards angeboten: ISO 19113 - Qualitätsprinzipien, ISO 19114 - Prozeduren zur Qualitätsbewertung und ISO 19115 - Metadaten. Zu den Qualitätsprinzipien in ISO 19113 zählen:

- Vollständigkeit, beschreibt die Differenz zwischen Realität und

Datenbestand. Die Art und Anzahl der zugrundeliegenden Geoobjekte, Attribute und topologischen Beziehungen entspricht nicht der Realität, wenn Daten fehlen oder aufgrund von Redundanzen mehrfach vorkommen (vgl.

Bill/Zehner, 2001, S. 260 und Bartelme, 2000, S. 230f und Behr, 2000, S. 286).

- Konsistenz, prüft die geometrische und sachlogische Widerspruchsfreiheit der Daten. Fragestellungen sind hierbei, in wie weit Wertebereiche für Attribute, Formatregeln oder topologische Bedingungen eingehalten werden, beispielsweise ob Flurstücke von geschlossenen Linien umrahmt werden, Häuser sich nicht überlappen oder Straßen nicht durch Häuser führen. Datenkonsistenz ist die wichtigste Forderung an ein Informationssystem und wird vom jeweiligen DBMS realisiert (vgl. Bill/Zehner, 2001, S. 157 und Bartelme, 2000, S. 231 und Kresse/Fadaie, 2004, S. 93ff).

- Präzision/Genauigkeit, unterscheidet zwischen Positionsgenauigkeit, Zeit­genauigkeit und thematische Genauigkeit. Positionsgenauigkeit bestimmt die Nähe der Koordinaten zur realen Position. Zeitgenauigkeit trifft Aussagen zur Zeitangabe, Aktualität und Einhaltung der zeitlichen Ordnung. Thematische Genauigkeit beschreibt die qualitative Richtigkeit von Attributen, die quantitative Genauigkeit von Attributen und die Klassifi­kationsgüte (vgl. Bartelme, 2000, S. 231).

- Herkunft, trifft Angaben zu Zeit, Person, Hardware, Software und Modellierungsannahmen mit welchen die Daten erfasst wurden (vgl. Bartelme, 2000, S. 230).

- Zweck, legt den Bestimmungszweck der Daten fest (vgl. Bartelme, 2000, S. 230).

Darüber hinaus sind weitere Kriterien für die Qualitätsbewertung wichtig, dazu zählen u.a. die räumliche Auflösung, die Zuverlässigkeit, die Zugänglichkeit und die Identifizierbarkeit. Die räumliche Auflösung betrachtet bspw. die millimetergenaue Angabe von Vektorkoordinaten. Die Zugänglichkeit wird durch Zugriffsberechtigungen und den technischen Zugriff beschrieben. Die Identifizierbarkeit ermöglicht die genaue Unterscheidung von Objekten einer Kategorie (vgl. Bartelme, 2000, S. 230). Geometrische, graphische, topologische und thematische Daten sind hinsichtlich dieser Kriterien zu bewerten. Der ISO 19114 definiert eine Vorlage zur Dokumentation der Datenqualität auf Basis der in ISO 19115 beschriebenen Metadaten. Dadurch können Annahmen und Einschränkungen, die während der Datenerstellung getroffen wurden, genau dokumentiert werden. Anwender von Geodaten können diese leichter finden, auswählen und verwenden (vgl. Bartelme, 2000, S. 230f und Behr, 2000, S. 286). Genauere Angaben zum ISO 19115 Metadatenstandard erfolgen in Abschnitt 4.3.2. Basierend auf diesen Standards, stellt der Dachverband für Geoinformation e.V. (kurz DDGI) ein Qualitätsmodell zur Verfügung, welches die Beschreibung der Qualität und die Beurteilung der Eignung von Geodaten erlaubt. Das DDGI-Qualitätsmodell bietet ein Regelwerk für die standardisierte Beschreibung von Geodaten. Nachfrager von Geodaten können die Produktbeschreibung auf Basis des DDGI-Qualitätsmodells aufrufen und mit den gewünschten Anforderungen bzw. mit anderen Anbietern vergleichen. Der Nachfrager kann das DDGI-Qualitätsmodell auch nutzen, um eine bestimmte Leistungsanforderung festzulegen. Der Anbieter muss sich dann an diese Qualitätsangaben halten (vgl. DDGI, 2000, S. 1-2 und 10-11).

Neben der geforderten Qualität der Geodaten, wurde bereits der Kostenfaktor als Hindernis für die Nutzung von Geodaten genannt. Buhmann und Wiesel bemerken, dass viele Geodaten, vor allem Höhenmodelle, überteuert sind und es keine einheitlichen Preismodelle gibt. Ziel einer Geodateninfrastruktur muss demnach ein einheitlicher, einfacher und qualitativer Zugang zu den Geodaten und -diensten bei gleichzeitig angemessenen Kosten sein (vgl. Buhmann/Wiesel, 2004, S. 180).

3 Grundlagen geographischer Informationssysteme und unternehmensweiter Wissensinfrastrukturen

Dieses Kapitel gibt zunächst eine Einführung in geographische Informationssysteme und deren Funktionen. Des Weiteren wird die Bedeutung integrierter Wissensinfrastrukturen vorgestellt. Das beinhaltet die Auswahl und Vorstellung einer geeigneten Architektur für Wissensinfrastrukturen.

3.1 Definition von geographischen Informationssystemen

In der Literatur findet sich keine eindeutige Definition für ein geographisches Informationssystem. Dies hängt zum einen mit der Fülle an Einsatzmöglichkeiten und zum anderen mit der historischen Entwicklung zusammen. So existieren je nach Anwendungsszenario weitere Begriffe, wie Umweltinformationssystem, Kommunales Informationssystem, Landinformationssystem oder Rauminformationssystem.

Einige allgemeine Definitionen für den Begriff GIS lauten:

- nach Bartelme: „Ein geographisches Informationssystem dient der Erfassung, Speicherung, Analyse und Darstellung aller Daten, die einen Teil der Erdoberfläche und die darauf befindlichen technischen und administrativen Einrichtungen sowie geowissenschaftliche, ökonomische und ökologische Gegebenheiten beschreiben“ (Bartelme, 2000, S. 13).
- nach Bill: „Ein geographisches Informationssystem ist ein rechnergestütztes System, das aus Hardware, Software, Daten und Anwendungen besteht. Mit ihm können raumbezogene Daten digital erfasst und redigiert, gespeichert und reorganisiert, modelliert und analysiert sowie alphanumerisch und graphisch präsentiert werden“ (Bill/Zehner, 2001, S. 105).
- nach Burrough und McDonnell: Ein GIS ist eine umfassende Sammlung von Werkzeugen für die Erfassung, Speicherung, bedarfsgerechte Bereitstellung, Transformation und Darstellung raumbezogener Daten der realen Welt für bestimmte Anwendungszwecke.[11]
- nach Longley et al.: GIS ist ein allgemeiner Begriff, der die Verwendung von Computern zur Erstellung und Beschreibung digitaler Darstellungen der Erdoberfläche andeutet.[12]
- nach Maguire et al.: Ein GIS ist eine integrierte Sammlung von Hardware, Software, Daten und Nutzern, die innerhalb eines institutionellen Kontextes agieren. Schlüsselfunktionen um GIS gegenüber anderen Informationssystemen abzugrenzen sind der allgemeine Fokus auf räumliche Objekte und Beziehungen und die spezifische Ausrichtung auf räumliche, analytische und modellierende Funktionen.[13]

Die genannten Definitionen haben den Nachteil, dass sie zu abstrakt (Longley, Burrough, Maguire) oder zu einschränkend (Bartelme, Bill) sind. So treffen Longley, Burrough und Maguire keine genauen Angaben über die Funktionsweise eines GIS. Bartelme und Bill gehen in ihrer Begriffsdefinition nicht auf den Nutzeraspekt ein.

Im Rahmen dieser Arbeit ist neben der technischen Infrastruktur die Nutzerkomponente bedeutsam, denn die optimale Unterstützung des Nutzers im Entscheidungsprozess ist ein kritischer Erfolgsfaktor. Zusammenfassend ist ein geographisches Informationssystem wie folgt zu definieren:

Ein geographisches Informationssystem ist ein rechnerbasiertes System aus Hardware, Software und digitalisierten, raumbezogenen Daten zur Unterstützung von Entscheidungsträgern. Dazu werden verschiedene Werkzeuge für die Erfassung, Speicherung, Modellierung, Analyse, Bereitstellung und Präsentation geographischer Daten zur Verfügung gestellt. Die Abgrenzung zu anderen Informationssystemen erfolgt durch geographische Objekte und deren Beziehungen und Möglichkeiten zur Durchführung räumlicher Analysen.

3.2 Funktionalität eines geographischen Informationssystems

Die meisten geographischen Informationssysteme stellen Funktionen zur Verfügung, die sich in die vier Kategorien Datenbeschaffung, Datenverwaltung, Datenmodellierung und -analyse, sowie Datenpräsentation und -interaktion einteilen lassen. Dabei variieren die GIS verschiedener Hersteller in ihrem Funktionsumfang und verfügen über unterschiedliche Stärken und Schwächen sowie Techniken zur Implementierung der Funktionen (vgl. Jones, 1997, S. 39).

3.2.1 Datenbeschaffung

Den Prozess der Datenbeschaffung unterteilen Maguire und Dangermond (1992) in die Eigenerfassung bzw. Datenerzeugung und die Datenübernahme durch Fremdbezug (vgl. Abschnitt 2.4.1). Die Datenerzeugung erfolgt durch primäre oder sekundäre Erfassungstechniken, die in Tabelle 1 zusammengefasst dargestellt werden. Bei der primären Erfassung werden die Geodaten direkt erfasst. Dabei entstehen analoge oder digitale Daten. Während digitale Daten mit einem Handheld Computer, z.B. Personal Digital Assistent (PDA), einem Messdatenerfassungsgerät oder durch Satellit erfasst werden, liegen analoge Daten wie Karten, Berichte, Pläne oder Photographien in Papierform vor und müssen in einem weiteren, sekundären Prozess digitalisiert werden. Der Prozess der sekundären Datenerfassung beinhaltet verschiedene Techniken zur Digitalisierung analoger Geodaten. Die manuelle Digitalisierung erfolgt durch das Nachzeichnen von analogen Karten mit Hilfe eines Pucks (Handheld mit Digitalisierungstafel). Automatisierte Digitalisierungen werden mit Hilfe eines Scanners durchgeführt. Rasterscanner produzieren dazu ein komplettes digitales 2D Bild der Karte aus Pixelwerten. Für eine genaue, digitale Repräsentation der realen Kartenobjekte, wie Punkte, Linien, Flächen und Textmerkmale, muss jedoch zusätzlich eine Vektorisierung[14] der Daten vorgenommen werden. Sogenannte

Mustererkennungs[15] -Werkzeuge transformieren dazu die Rasterlinien automatisch in vektorbasierte Linien (vgl. Jones, 1997, S. 40f).

Wie in Tabelle 1 aufgezeigt, existieren auch für die Erfassung von Attributdaten mehrere Techniken. Die Attributdaten werden parallel zu den raumbezogenen Daten erfasst und dann mit diesen verknüpft, beispielsweise primär durch Tastatureingaben, Audiodaten sowie durch Selektion aus einem Auswahlmenü. Als sekundäre Technik wird Optical Character Recognition (OCR) und Spracherkennung eingesetzt. OCR analysiert Rasterdaten und erzeugt mittels Texterkennung vektorbasierte Buchstaben und editierbaren Text (vgl. Maguire/Dangermond, 1992, S. 324f).

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Erfassungstechniken für Vektor-, Raster- und Attributdaten (Quelle: Eigene Darstellung)

Die Datenbeschaffung durch Datenübernahme umfasst die Interpretation des Datenformats digitaler externer Geodaten. Die Effektivität hängt dabei von der Kenntnis allgemeiner Standards zum Datenaustausch und den Exportformaten gängiger GIS ab (vgl. Maguire/Dangermond, 1992, S. 325). Standards und Konzepte für die Austauschbarkeit und Interoperabilität von Geodaten werden in Abschnitt 4.3.2 vorgestellt.

Im Rahmen der Datenbeschaffung ist es wichtig sowohl bei Datenerzeugung als auch bei der Datenübernahme die digitalen Daten zu validieren und gegebenenfalls zu korrigieren, damit keine Inkonsistenzen entstehen. Durch Verifikationsfunktionen werden die digitalisierten Daten mit den Ausgangsdaten verglichen und auf ungewöhnliche Werte geprüft. Dabei ist zu beachten, dass alle benötigten Geoobjekte mit einem bestimmten Genauigkeitsgrad digitalisiert wurden (vgl. Jones, 1997, S. 40f und Maguire/Dangermond, 1992, S. 325).

Die Eigenerfassung und Konvertierung von Geodaten in ein digitales Format kann hohe Kosten und einen enormen Zeitaufwand innerhalb eines GIS-Projektes verursachen. Deswegen sollte vorher geprüft werden, ob die Daten bereits in einem nutzbaren und qualitativen Format vorhanden sind (vgl. Delaney, 1999, S. 23-27). Ferner hängt die Entscheidung für eine Datenübernahme von den Kosten und der Verfügbarkeit der Daten ab (vgl. Maguire/Dangermond, 1992, S. 324f und Abschnitt 2.5.3). Aufgrund der hohen Kosten wird die Datenbeschaffung und -erfassung auch ausgelagert. Viele Unternehmen nutzen zudem die Möglichkeit, bereits erstellte digitale Daten zu verkaufen, um die Kosten zu amortisieren (vgl. Delaney, 1999, S. 23-27).

3.2.2 Datenverwaltung

Um Geodaten zu speichern, organisieren und verwalten ist der Einsatz eines DBMS sinnvoll. Hauptzweck eines DBMS ist dabei die Sicherstellung von Stabilität, Konsistenz und Zuverlässigkeit der Daten. Für die Nutzung in GIS können sowohl relationale, objektrelationale oder objektorientierte DBMS eingesetzt werden. Allerdings müssen diese um geo-spezifische Funktionalitäten erweitert werden. Das betrifft zunächst die Sprachsyntax. Hier müssen raumbezogene Datentypen für Punkte, Linien, Knoten, Flächen, raumbezogene Beziehungen wie links, rechts, neben, oberhalb, unterhalb etc. sowie gängige Graphikformate unterstützt werden. Die raumbezogenen Beziehungen erlauben Abfragen wie Länge, Entfernung, Fläche, enthält, oder innerhalb. Weiterhin sind geo-spezifische Zugriffstrukturen,

Anfragesprachen und -operatoren sowie Möglichkeiten zur Ergebnisvisualisierung und zur graphischen Interaktion zu integrieren (vgl. Behr, 2000, S. 43f).

Speicherung und Zugriffsstrukturen

Im Rahmen der Datenspeicherung ist es empfehlenswert, die Daten in einer einfachen Form als Ebene zu speichern. Dies ermöglicht die schnelle Verknüpfung zu komplexeren Formen, da umgekehrt die Umwandlung von komplexen Abbildungen in einfache Ebenen zeitaufwendiger ist. Durch die einfachen Ebenen ist der Umgang mit den Daten flexibler. Eine Ebene besteht bspw. aus dem Datentyp Punkt, Linie oder Fläche. Beispiele für Ebenen sind:

- Punkteebene: Gebäude, Höhenpunkte
- Linienebene: Straßen, Flüsse
- Flächenebene: Seen, Regierungsbezirke

Rasterdaten bilden im Gegensatz dazu Rasterebenen aus. Diese bestehen aus einer Menge gleichgroßer Zellen mit unterschiedlichen Grauwerten. Jeder Zellwert kann durch eine Nummer codiert werden, die sich auf das darzustellende Geoobjekt bezieht. Beispielsweise wird eine grün gefärbte Zelle, die das Geoobjekt Wald symbolisiert, durch die Nummer 3 codiert. Einzelne, gleiche Zellwerte können dann zu größeren Zellen generalisiert werden. Die Wahl einer geeigneten Zellgröße wirkt sich auf die Analyse- und die Visualisierungsqualität der Rasterdaten aus (vgl. Delaney, 1999, S. 55ff).

Die Speicherung und Verwaltung geographischer Daten erfolgt in DBMS. Dabei sind Objektorientierte DBMS besser geeignet, da die Geodaten als Geoobjekte mit den zugehörigen Attributen und Methoden gespeichert werden können. Die Attribute umfassen neben den einfachen Datentypen auch raumbezogene Datentypen, Verknüpfungen zu multimedialen Daten und graphische Darstellungen. Durch diese gekapselte Speicherung entsteht eine höhere Konsistenz (vgl. Behr, 2000, S. 45).

Für den schnellen Zugriff auf Geodaten sind effiziente Zugriffsstrukturen besonders wichtig. Diese sind in eindimensionale, punktbezogene und mehrdimensionale, flächenbezogene Zugriffsstrukturen zu unterscheiden. Punktbezogene Methoden teilen die Punkte im Raum disjunkt auf, während flächenbezogene Zugriffsmethoden Überlappungen von Punkten in Flächen und topologische Beziehungen behandeln. Die Verwaltung von punktbezogenen Zugriffsstrukturen ist aufgrund der disjunkten Trennung der Punkte einfacher. Allerdings ist es nur wenig sinnvoll für Punkte eine eigene Zugriffsstruktur zu definieren, da sich der Aufwand kaum rentiert. Flächenbezogene Methoden teilen den Raum meist in rechteckige Regionen auf und ordnen die Geoobjekte den Regionen zu. Dies erfolgt häufig in Form einer hierarchischen Struktur. Dadurch können Überlappungen von Geoobjekten und den zugeordneten Regionen entstehen, so dass bei einer Datenanfrage der Zugriff auf ein Geoobjekt schwieriger ist. Es kann nicht eindeutig identifiziert werden, wo das Geoobjekt gespeichert ist. Durch redundante Speicherung des Geoobjekts oder durch Speicherung der Referenz auf das Objekt in den jeweiligen Regionen kann dieses Problem vermieden werden (vgl. Friebe, 2001, S. 22-26).[16] Spezifische räumliche Zugriffsstrukturen, die auf den punkt- und flächenbezogenen Zugriffsstrukturen aufsetzen, sind hierarchische bzw. Baumzugriffsstrukturen und dynamische Zugriffsstrukturen. Beispielhaft sollen zwei Zugriffsstrukturen kurz vorgestellt werden. Weitere Zugriffsstrukturen und Erläuterungen nennen Bill/Fritsch und Friebe (vgl. Bill/Fritsch, 1997, S. 303ff und Friebe, 2001, S. 26-29).

PM-Quadtrees bilden Baumstrukturen aus Knoten und Kanten, wobei jedem Knoten vier Nachfolgeknoten zugeordnet werden. Der Quadtree dient zur Verwaltung von Rasterdaten. Diese werden in quadratische Flächen zerlegt und jedes Quadrat wird wiederum rekursiv in vier neue Teilgebiete bzw. Quadrate unterteilt bis jedem Pixelwert des Rasterbildes ein Knoten zugeordnet ist. Der Quadtree orientiert sich somit an einer Punkteverteilung. Existieren mehrere Punkte an einer Stelle, wird der Baum mehr verschachtelt. Dadurch entsteht eine unterschiedliche Höhe des Baumes, die zu unterschiedlichen Zugriffszeiten führen kann (vgl. Bill/Fritsch, 1997, S. 308).

R-Bäume sind dynamische Methoden, bei welchen der Speicherraum nach Einfüge- und Löschoperationen nicht neu organisiert werden muss. Diese Zugriffsstrukturen sind für mehrdimensionale Räume geeignet und benutzen überlappende, rechteckige Regionen für die Bestimmung der Geoobjekte im Raum. Der Zeiger auf ein Geoobjekt wird nur in den Blättern des Baums gespeichert. Die Lage der Geoobjekte wird durch eine sogenannte „Bounding Box“ angenähert. Die rechteckigen Regionen werden dabei so unterteilt, dass ein Geoobjekt vollständig umschlossen wird. Die Suche in R-Bäumen ist effizient, da nur eine kleine Anzahl an Knoten analysiert werden muss (vgl. Bill/Fritsch, 1997, S. 315ff und Friebe, 2001, S. 26).

Geo-Operatoren

Für die Durchführung von räumlichen Analysen und die Selektion der Geodaten sind neben den allgemeinen arithmetischen und logischen Operatoren sogenannte Geo- Operatoren zu definieren. Im Folgenden werden wichtige Geo-Operatoren vorgestellt:

- Topologische Geo-Operatoren überprüfen, ob zwei Geoobjekte bezüglich einer angegebenen Relation (z.B. Gleichheit, Schnittfreiheit, Enthaltensein) richtig zueinander stehen.
- Mengenorientierte Geo-Operatoren dienen zur Verschneidung von Geodaten, insbesondere aus verschiedenen Quellen. Dazu werden Geoobjekte mittels einer Vorschrift wie Vereinigung, Schnitt oder Differenz zusammengeführt
- Richtungsorientierte Geo-Operatoren untersuchen den Winkel der Punktmengen zweier Objekte. Beispielsweise kann überprüft werden, ob sich ein Geoobjekt südlich von einem anderen Geoobjekt befindet.
- Metrische Geo-Operatoren berechnen z.B. die Länge eines Linien-Geoobjektes, den Flächeninhalt eines Flächen-Geoobjektes oder den Abstand zwischen zwei Geoobjekten. Flächeninhaltsberechnungen werden im Katasterwesen für die Größe von Flurstücke benötigt.
- Konstruktive Geo-Operatoren erzeugen Geoobjekte für Vergleiche in Anfragen oder zum Einfügen in die Datenbasis. Für jede Geoobjektklasse, also Punkt, Linie und Fläche steht ein Operator zur Verfügung.
- Dekompositions- und Approximations-Operatoren erlauben Ersteres den Zugriff auf einzelne Datenelemente des Geoobjekts durch Operatoren wie StartPunkt, Endpunkt, AnzahlPunkte etc. und Letzteres die Berechnung von Annäherungen an Geoobjekte für den Einsatz in Zugriffsstrukturen (vgl. Friebe, 2001, S. 29-35).

Anfragesprachen

Aufgrund der komplexen Struktur und der räumlichen Beziehungen zwischen den Geodaten, sind Standardanfragesprachen wie SQL (Structured Query Language) oder QBE (Query By Example) nicht hinreichend geeignet, um auf Geodaten zuzugreifen und diese zu analysieren. Jedoch können diese Standardanfragesprachen als Basis für die Entwicklung GIS-spezifischer Anfragesprachen dienen. Eine geo-spezifische SQL- Erweiterung für relationale DBMS ist QL/G (Query Language for Geometric Databases). Objektorientierte DBMS nutzen OOGQL (Object Oriented Geo Query Language). Die geo-spezifischen Anfragesprachen unterstützen neben der Standard- SQL- Syntax, die bereits erwähnten raumbezogenen Datentypen und Geo-Operatoren. Das Open Geospatial Consortium bietet für den standardisierten Zugriff auf objektori enti erte Geodaten eine Schnittstellenspezifikation, die Simple Features

Spezifikation, an. Simple Features ist im Gegensatz zu den Ersteren keine neue Anfragesprache, sondern eine einheitliche Schnittstelle für den Zugriff auf einfache, zweidimensionale Geoobjekte, sogenannte Features. Die Spezifikation definiert dazu die Geometrieklassen Punkt, Linie und Fläche sowie Geometriemengen mit den Klassen Punktmenge, Linienmenge und Flächenmenge. Topologien, komplexe Geoobjekte, Metadaten und eine dritte Koordinatendimension sind nicht Gegenstand des Standards (vgl. OGC, 2005a, S. 10f). Die Spezifikation existiert für die Zielplattformen SQL, ActiveX (Active Extension) und CORBA (Common Object Request Broker Architecture). Durch die standardisierten Datenbankschnittstellen können die geo- spezifischen Erweiterungen in jeglichen DBMS nachgerüstet werden. Dazu wird die Syntax und Semantik der Geo-Operatoren nicht im GIS implementiert, sondern in der Spezifikation festgelegt. Die dadurch geschaffene Interoperabilität ermöglicht einem GIS die Integration und Nutzung verschiedener Datenquellen (vgl. Friebe, 2001, S. 38f).

3.2.3 Datenmodellierung und Datenanalyse

Für die Analyse und Auswertung der Geodaten ist es unabdingbar, die erfassten Geodaten in ein einheitliches Format zu bringen. Da die Geodaten aus unterschiedlichen Quellen stammen können, liegen sie demnach in unterschiedlichen Formaten vor. Beispielsweise gibt es Karten im Maßstab 1:5.000 aber auch im Maßstab 1:10.000. Bevor diese Karten durch Verschneidung zusammengeführt werden können, muss ihr Maßstab vereinheitlicht werden. Dies geschieht durch sogenannte „data-processing“- Funktionen, welche die Geodaten transformieren, generalisieren und restrukturieren (vgl. Jones, 1997, S. 39).

Bei der Restrukturierung wird die Datenstruktur der Geodaten geändert. Das bedeutet die Umwandlung von Vektor- in Rasterformat oder umgekehrt. Dadurch sind die beiden Datenstrukturen kompatibel. Jedoch sind Verfahren für die Restrukturierung sehr fehleranfällig und sollten wenn möglich vermieden werden. Ein GIS implementiert meistens nur eines der beiden Verfahren. Generalisierungsverfahren dienen zur Aggregation von Vektor- und Rasterdaten, um unterschiedlich skalierte Karten darstellen zu können. Transformationsverfahren für Geodaten beinhalten die Änderungen der Kartenprojektion, die Vereinheitlichung unterschiedlicher Koordinatensysteme und Klassifizierungen von Geodaten.

[...]


[1] Topographische Karten sind Landkarten, welche die sichtbaren Erscheinungen der Erdoberfläche wie Konturen, Straßen, Flüsse etc. mit großer Genauigkeit und Detailliertheit, in Relation zur verwendeten Skalierung, lagegetreu abbilden (vgl. Burrough/McDonnell, 1998, S. 306).

[2] Siehe Hierarchie Daten, Informationen und Wissen (vgl. Rehäuser/Krcmar, 1996, S. 3).

[3] Geoid ist eine Äquipotentialfläche des Erdschwerefeldes, also befreit von Einflüssen wie Gezeiten, Luft­druckschwankungen, in Höhe des mittleren Meeresniveaus (vgl. Seeger, 1999, S. 428).

[4] Für aktuelle Entwicklungen und Projektstatus der Geodateninfrastruktur siehe http://www.gdi-de.org

[5] Vgl. Buhmann/Wiesel, 2004, S. 204 und http://www.gis-report.de für einen Überblick über Geodatenanbieter

[6] http://www.bkg.bund.de oder http://www.geodatenzentrum.de

[7] http://www.atkis.de informiert über Verfügbarkeit, Qualität, Bezugsmöglichkeiten von Geobasisdaten.

[8] http://www.dfd.dlr.de

[9] http://www.imagi.de/de/gdi_de/f_gdi_de.html

[10] http://www.de.map24.com , http://www.goyellow.de, http://maps.google.de, http://local.live.com, http://google.earth.de, http://worldwind.arc.nasa.gov

[11] „GIS is a powerful set of tools for collecting, storing, retrieving at will, transforming and displaying spatial data from the real world for a particular set of purposes” (Burrough/McDonnell, 1998, S. 11).

[12] „GIS is a generic term denoting the use of computers to create and depict digital representations of the Earth’s surface“ (Longley et al., 1999, S. 1).

[13] „A Geographical Information System is best described as an integrated collection of hardware, software, data and liveware which operates in an institutional context. [...] The key features which differentiate GIS from other information systems are the general focus on spatial entities and relationships, together with specific attention to spatial analytical and modelling operations” (Maguire et al., 1992, S. 17).

[14] Umwandlung vom Rasterformat in ein Vektorformat (vgl. Jones, 1997, S. 42).

[15] Im Englischen als Pattern-Recognition bezeichnet.

[16] Vgl. Friebe, 2001, S. 25f für weitere Möglichkeiten

Ende der Leseprobe aus 124 Seiten

Details

Titel
Integration geographischer Daten in unternehmensweite Wissensinfrastrukturen
Untertitel
Diskussion, Konzeptualisierung und Anwendungsbeispiele
Hochschule
Martin-Luther-Universität Halle-Wittenberg
Note
1.7
Autor
Jahr
2006
Seiten
124
Katalognummer
V186405
ISBN (eBook)
9783869437255
ISBN (Buch)
9783869431635
Dateigröße
2886 KB
Sprache
Deutsch
Schlagworte
integration, daten, wissensinfrastrukturen, diskussion, konzeptualisierung, anwendungsbeispiele
Arbeit zitieren
Diplom-Wirtschaftsinformatikerin Nadine Amende (Autor:in), 2006, Integration geographischer Daten in unternehmensweite Wissensinfrastrukturen, München, GRIN Verlag, https://www.grin.com/document/186405

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Integration geographischer Daten in unternehmensweite Wissensinfrastrukturen



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden