Reengineering eines Informationswarehousesystems zur adäquaten Bereitstellung personenbezogener Daten

E-Book Cover: ()
Flash Player und JavaScript werden für eine verbesserte Ansicht des Dokuments benötigt. Bitte installieren Sie den Flash Player und aktivieren Sie Javascript.

Install Flash Player

Details

Titel: Reengineering eines Informationswarehousesystems zur adäquaten Bereitstellung personenbezogener Daten
Autor: Matthias Isenburg
Fach: Informatik - Wirtschaftsinformatik
Institution/Hochschule: Berufsakademie Lörrach (Wirtschaftsinformatik)
Kategorie: Diplomarbeit
Jahr: 2002
Seiten: 90
Note: 1,5
Sprache: Deutsch
Dateigröße: 1017 KB
Archivnummer: V6778
ISBN (E-Book): 978-3-638-14276-2

Textauszug (computergeneriert)

BERUFSAKADEMIE LÖRRACH
– STAATLICHE STUDIENAKADEMIE –
UNIVERSITY OF COOPERATIVE EDUCATION

Reengineering eines Informationswarehousesystems zur
adäquaten Bereitstellung personenbezogener Daten

Verfasser: Matthias Isenburg

Fach: Wirtschaftsinformatik
Firma: Johnson Controls IFM

Abgabetermin: 26. August 2002

Inhaltsverzeichnis

Vorwort ... 5

Abbildungsverzeichnis ... 6

Abkürzungsverzeichnis ... 7

Anlagenverzeichnis ... 8

0 Einleitung ... 9
   
0.1 Johnson Controls IFM: Unternehmensprofil ... 9
    0.2 Das Kundenverhältnis im Industriepark ... 9
    0.3 Motivation dieser Arbeit ... 10
    0.4 Problemstellung ... 11
    0.5 Zielsetzung ... 12
    0.6 Business Case zum Projekt ... 12
    0.7 Abgrenzung (Theorie & Praxis) ... 13
    0.8 Aufbau dieser Arbeit ... 13

1 Grundlagen ... 15
   
1.1 Konzept eines Datawarehouse ... 15
        1.1.1 Definition und Abgrenzung zum „Infowarehouse“ ... 16
        1.1.2 Architektur und Prozesse eines Data Warehouse ... 17
            1.1.2.1 Aufbereitung ... 18
            1.1.2.2 Integration ... 19
            1.1.2.3 Aggregation ... 19
            1.1.2.4 Anpassung ... 20
        1.1.3 Schema und Modellierung ... 20
            1.1.3.1 Relationales Datenbankmodell (physikalisches Modell) ... 20
            1.1.3.2 Star Schema (semantisches Modell) ... 21
            1.1.3.3 Snow Flake Schema (semantisches Modell) ... 23
    1.2 MS SQL 2000 Server Umgebung ... 24
        1.2.1 MS Enterprise Manager als Administrationstool ... 24
            1.2.1.1 Data Transformation Service ... 25
            1.2.1.2 Linked Server ... 25
        1.2.2 Nutzung der Daten ... 26
            1.2.2.1 Direkter Zugriff (SQL) ... 26
            1.2.2.2 Views ... 27
            1.2.2.3 Sicherheitsaspekte ... 27
    1.3 Zusammenfassung ... 30

2 Problemanalyse ... 32
   
2.1 Problematik des bestehenden DWH ... 32
    2.2 Analyse des Datenimports ... 33
        2.2.1 Vorgehensmodelle für die Datenintegration ... 33
            2.2.1.1 Werkzeuge der Datenintegration ... 35
            2.2.1.2 Firmenspezifische Datenbereitstellung ... 36
        2.2.2 Datenimport am Beispiel der Firma: Aprentas ... 36
        2.2.3 Interne Datenverteilung ... 36
            2.2.3.1 Stored Procedures als Instrument der Datenintegration ... 37
            2.2.3.2 Datenflussmodell ... 38
        2.2.4 Fehlerbehandlungen ... 39
    2.3 Analyse der Datennutzung ... 40
        2.3.1 Anforderungen der Applikationen ... 40
        2.3.2 Analyse der Datenzugriffe ... 40
        2.3.3 Datennutzung durch die Applikation Bauzuständigkeit ... 41
        2.3.4 Sicherheitsaspekte ... 43
    2.4 Zusammenfassung ... 43

3 Lösungskonzept ... 45
   
3.1 Reengineering des DWH ... 45
    3.2 Datenmodell für das DWH ... 45
        3.2.1 Inhaltliche Darstellung des Datenmodells ... 47
    3.3 Strategien für den Datenimport ... 47
        3.3.1 Homogenisierung der Daten ... 47
            3.3.1.1 Schemavergleich ... 48
            3.3.1.2 Auflösung von Konflikten durch Heterogenität auf 
            Schemaebene ... 49
            3.3.1.3 Zusammenfassung ... 55
        3.3.2 Datenimport für die Firma Aprentas ... 56
    3.4 Strategien für die Datennutzung ... 57
        3.4.1 Sichten & Datenschutz ... 57
        3.4.2 Datenbereitstellung für die Applikation Bauzuständigkeit ... 58
    3.5 Zusammenfassung ... 58

4 Zusammenfassung ... 60
   
4.1 Erreichte Ergebnisse ... 60
    4.2 Ausblick ... 61

Literaturverzeichnis ... 62

Ehrenwörtliche Erklärung ... 64

Anlagen ... 66

Vorwort
[...]

Abbildungsverzeichnis
Abb.1-1: Beispielarchitektur eines Data Warehouse Seite 18
Abb.1-2: Tabelle eines relationalen Datenbanksystems Seite 21
Abb.1-3: Beispiel für Datenmodellierung nach dem Star-Schema Seite 22
Abb.1-4: Beispiel für Datenmodellierung nach dem Snowflake-Schema Seite 23
Abb.1-5: Das Filtern von Zeilen mit Hilfe einer SQL Server-Sicht Seite 27
Abb.1-6: Serverrollen Seite 29
Abb.1-7: standardmäßige DB-Rollen Seite 30
Abb.2-1: Datenintegration im DWH Seite 34
Abb.2-2: Controllingdaten im DWH Seite 35
Abb.2-3: Interne Datenverteilung im DWH Seite 39
Abb.2-4: Datennutzung der Applikationen Seite 41
Abb.2-5: Die Intranetanwendung der Applikation: Bauzuständigkeit Seite 42
Abb.3-1: Datenmodell des DWH nach dem Reengineering Seite 46
Abb.3-2: Synonyme bei der Benennung von Tabellen Seite 50
Abb.3-3: Homonyme bei der Benennung von Tabellen Seite 51
Abb.3-4: Fehlende Attribute Seite 51
Abb.3-5: Fehlende, aber implizite Attribute Seite 52
Abb.3-6: Integritätsbedingungskonflikte auf Tabellenebene Seite 53
Abb.3-7: Übersicht über strukturelle Konflikte Seite 55
Abb.3-8: Prozesskette des Datenimports Seite 56

Abkürzungsverzeichnis
[...]

Anlagenverzeichnis
Anlage 1: Business Case zum Projekt „Reengineering des DWH“ Seite 66
Anlage 2: Schnittstellen Seite 68
Anlage 3: Datenflussmodell der Stored Procedure „All_UpdatePers“ Seite 86
Anlage 4: DWH: Tabellenanalyse Seite 90

0 Einleitung
Im ersten Kapitel der Diplomarbeit möchte ich das DWH von JCI vorstellen. Das Umfeld im Industriepark sowie ein Unternehmensprofil sollen die Problematik des DWH dem Leser leichter übermitteln. Zudem wird der Bedarf, das Reengineering durchzuführen, und die Zweckmäßigkeit des Projektes begründet. Die Ziele und der Aufbau sollen die weiteren Inhalte meiner Diplomarbeit vorstellen.

0.1 Johnson Controls IFM: Unternehmensprofil
Seit seiner Gründung 1885 hat sich Johnson Controls zu einem Multimilliardenunternehmen entwickelt, das in zwei Bereichen weltweit führend ist: Kraftfahrzeugsysteme und Gebäudekontrollsysteme. Die Grundlage für den Erfolg von JCI ist die Zielsetzung, die ständig steigenden Erwartungen der Kunden nicht nur zu erfüllen, sondern zu übertreffen. Das Unternehmen erzielte im Jahr 2001 18,4 Milliarden Dollar Umsatz und beschäftigte über 112.000 Arbeiter in über 500 Standorten weltweit. JCI ist der weltweit führende Zulieferer für die Automobilindustrie. In Basel hat sich die Gruppe Gebäudemanagement aus den früheren Abteilungen der Novartis Services (Technical Services & Facility Management) niedergelassen. Mit über 1000 Mitarbeitern gehört der Standort zu den größten Johnson Controls Integrated Facility Management Standorten weltweit. Die Aufgabe ist primär, die Gebäude der Kunden optimal zu bewirtschaften und alle Aspekte der Gebäudebetreuung in einem Gesamtkonzept zu integrieren, um den Gebäudenutzwert zu steigern. Dies gewährleistet eine optimale Nutzung der vorhandenen Gebäudeflächen und Anlagen, deren energiesparende Klimatisierung und eine sichere und produktive Bewirtschaftung.
Damit diese Services kundengerecht angeboten werden können, besitzt Johnson Controls Basel eine eigene IT Abteilung, welche die Betriebsabläufe und Prozesse unterstützt und zusätzlich durch den Verkauf von Services zum Betriebsergebnis beiträgt.

0.2 Das Kundenverhältnis im Industriepark
Aus der Fusion der damaligen Basler Chemiekonzerne Ciba und Sandoz entstand 1995 die neue Life Science Firma Novartis und die Ciba Spezialitätenchemie. Der in den darauf folgenden Jahren weiter anhaltende Globalisierungstrend verlangte auch von den neuen Konzernen weitere Neuausrichtungen und Fokussierungen auf die Kerngeschäfte. Im Jahr 2000 spaltete deshalb die Novartis AG ihr Agrogeschäft ab, welches mit dem Agrochemikaliengeschäft der schwedischen Firma AstraZeneca zum neuen, weltweit führenden Agrokonzern Syngenta mit Geschäftssitz in Basel fusionierte. Weiterhin wurden zum Jahresende von Novartis auch die Infrastruktur-Dienstleistungen aus der bisherigen Tochterorganisation Novartis Services AG an Drittfirmen verkauft (Spinoff) bzw. aufgeteilt. Letzteres betrifft einige firmenspezifische Dienstleistungen der bisherigen Novartis Services AG, wie Patente, Markenschutz, Einkauf, Informationstechnologie, Telekommunikation und Personalwesen. Diese wurden in die neue Syngenta und den Novartis Pharmasektor integriert. Die restlichen nicht firmenspezifischen Dienstleistungen wurden durch einen Spinoff an andere Unternehmen verkauft. In den Basler Werkarealen sollen diese Firmen die Dienstleistungen kompetent erbringen. Energieerzeugung und -verteilung sowie die Entsorgung und Tanklagerbetriebe wurden an den französischen Weltkonzern Vivendi vergeben. Technical Services, Facility Management, Sicherheits- und Notfalldienste, Gesundheits-, Sicherheits- und Umweltschutzberatung an den amerikanischen Konzern Johnson Controls (JCI). Beide Konzerne, Vivendi wie auch JCI, haben sich in den letzten Jahren weltweit auf die Erbringung von Infrastruktur- Dienstleistungen spezialisiert. Sie haben diese Marktnische entdeckt und sind seit dem auf diesem Gebiet sehr erfolgreich. Diese Neustrukturierung erfolgte per 1.1.2001 und führte zu Änderungen der bestehenden Systeme der früheren Novartis Services AG.
Durch das permanente Outsourcing der Firmen entstanden einzelne, organisatorisch separate Organisationen, welche untereinander auf verschiedene Dienstleistungen angewiesen sind. Betrachtet man jedoch die Firmen auf der informationstechnischen Seite, so erkennt man, dass beispielsweise noch ganze Netzwerke über Firmen hinweg miteinander verbunden sind. Diese und weitere Beziehungen sorgten für gesonderte firmenspezifische Verträge, in welchen das Geschäftsverhältnis klar definiert ist. Einerseits sichert diese Tatsache das tägliche Geschäft, andererseits besitzen die Firmen wie Johnson Controls IFM einen eingeschränkten Spielraum für Dienstleistungen, Preise und Konditionen.

0.3 Motivation dieser Arbeit
Diese Arbeit beschäftigt sich mit dem Reengineering eines Informationswarehousesystems. Unter dem Begriff Reengineering verstehe ich eine „Wiedererstellung“ und keine Überarbeitung der bestehenden Lösung. Das als DWH definierte Infowarehouse, ist eine Datenbank auf einem SQL Server 2000, die Daten aus unterschiedlichen Vorsystemen sammelt, verifiziert und verschiebt. Inhaltlich besteht das Infowarehouse aus personenbezogenen Daten verschiedener Firmen. Der Datenimport ist dabei teilweise automatisiert. Kleinere Firmen wie Aprentas senden ihre Daten per Email als .txt Datei. Die Novartis bzw. die Syngenta liefern ihre Daten über ein Tool (Infopumpe), welches die Daten in Hilfstabellen ablegt. Diese enthalten aktuelle Daten, welche in die Core Tabellen des DWH importiert werden müssen. Die dafür geschriebenen Stored Procedures sind dabei für die interne Datenverteilung zuständig. Die Stored Procedures ersetzen die zuvor gelöschten Daten der Core Tabellen und stellen diese somit den Transaktionssystemen bereit. Durch unterschiedlich definierte Feldinhalte, komplizierte Datenänderungen und der unterschiedlichen Handhabung von Nullwerten kommt es fast täglich zu Problemen bei der automatisierten Integration der Daten in das DWH. Die Kontrolle verlangt deshalb einen beträchtlichen Zeitaufwand, um aktuelle Daten garantieren zu können. Da Transaktionssysteme die Daten benötigen, ist die Richtigkeit der Daten und eine Ausfallsicherheit der Datenbank wichtig. Aufgrund dieser Problematik sowie weiteren Verbesserungsmöglichkeiten bei der Datenhaltung und der Bereitstellung ist es offensichtlich, dass für ein Reengineering ein deutlicher Handlungsbedarf besteht.

0.4 Problemstellung
Johnson Controls IFM ist eine Firma, die auf Dienstleistungen ausgerichtet ist. Damit diese kundengerecht erbracht werden können, unterstützen Applikationen ihre Services. Beispielsweise wird die Ausweis- oder Parkplatzverwaltung von Johnson Controls an alle Firmen im Industriepark erbracht und benötigt aufgrund dessen aktuelle personenbezogene Daten, welche in einem sogenannten „Infowarehouse“ aufbereitet werden. Es muss in der Lage sein, große Datenmengen zwischen unterschiedlichen Systemen innerhalb festgelegter Verarbeitungszeitfenster zu sammeln und zu verschieben. Bei der Verschiebung von Daten sind oftmals komplizierte Datenänderungen notwendig. Die Anzahl der Möglichkeiten, Daten zu sammeln und zu analysieren, nimmt ständig zu. Applikationen auf einem Fileserver greifen auf die Informationen des Infowarehouses mit einer Leseberechtigung zu. Jedoch zeigen sich bereits bei der Datenübertragung sowie der Integration der Daten Probleme, die auf eine nicht einheitlich organisierte, redundante und unvollständige Datenbankstruktur zurückzuführen sind.
Das von der Novartis Services AG entwickelte DWH ist für die heutigen Anforderungen von Johnson Controls IFM veraltet und verdeutlicht durch ständige Anpassungen firmen- und applikationsspezifische Insellösungen bei der Datenübertragung, -haltung und – bereitstellung. Das DWH besteht aus 43 Tabellen, die ohne jegliche Dokumentation bzw. ohne semantische Beschreibung nicht genau identifizierbar sind. Es umfasst redundante Daten, keine erkennbar festen Beziehungen sowie teilweise Schlüssel. Inhaltlich füllen neben den personenbezogenen Core Tabellen, Hilfstabellen und aus SAP generierte Tabellen das DWH. Die Kontrolle über den Datenimport und die ständigen Anpassungen am „Infowarehouse“ verursachen einen Zeitaufwand von bis zu 1,5 Stunden pro Tag. Dementsprechend äußerte sich der Leiter der Business Application Provision wie folgt: “Wir ersaufen in Maintenance“.
Aufgrund des täglichen Pflegeaufwandes ist es offensichtlich, dass für ein Reengineering der Datenbank ein deutlicher Handlungsbedarf besteht. Applikationen sollen mit akkuraten Informationen versorgt, die Datenbank neu modelliert und der Datenfluss einheitlich abgebildet werden. Dabei existieren für den Datenimport sowie bei der Bereitstellung der Daten statische Faktoren, an welche sich das DWH anpassen muss. Diese zu  identifizieren, Lösungsalternativen zu finden und den geeignetsten Ansatz zu realisieren, ist die herausfordernde Problematik dieser Arbeit.

0.5 Zielsetzung
Generell ist das Ziel dieses Projektes, den täglichen und manuellen Aufwand durch die Schaffung einer redundanzfreien, schlankeren Datenbank und einer entsprechenden Datentransformationsstrategie, die performantere Abfragen und die Richtigkeit der Daten garantiert sowie Informationen applikationsspezifisch aufbereitet, zu reduzieren. Es soll eine für die oben beschriebenen Anforderungen geeignete Strategie für das „Infowarehouse“ entwickelt werden, damit eine automatische und fehlerfreie Arbeit mit der Datenbank garantiert wird. Der Zweck meiner Diplomarbeit ist es, ein Konzept für den Datenimport einer Firma, sowie für die Datenbereitstellung einer exquisiten Applikation zu erstellen. Dies erfordert eine neu strukturierte und vollständige Datenbasis, welche für die Modellierung die gesamten Anforderungen des Datenimportes, sowie der Applikationsseite berücksichtigen muss.
Die dadurch gewonnenen Strategien sollen anschließend diplomarbeitsunabhängig in Teilprojekten weitergeführt werden, so dass sich der Pflegeaufwand, wie im Business Case beschrieben, erheblich reduziert und somit Kosten für das Unternehmen eingespart werden.

0.6 Business Case zum Projekt
Um die bereits definierten Problematiken zu lösen, musste ich die Zweckmäßigkeit des Projektes begründen. Für eine Wirtschaftlichkeitsrechnung diente mir dabei ein Business Case1. Der Business- Case enthält Informationen, die den Start und die Fortsetzung eines Projekts rechtfertigen. Es definiert die Gründe für die Ausführung des Projekts und beantwortet die Frage nach dem Warum. Im Laufe des Projekts wird er an bestimmten Schlüsselpunkten aktualisiert. Der Business Case ist messbar und ist die Voraussetzung für das Ergebniscontrolling. Indem von mir angefertigten Business Case rechnen sich die Kosten des Projektes nach 0,8 Jahren.2 Diese Kennzahl erhält man durch das Gegenüberstellen der Kosten und des Benefit des Projektes. Die detaillierte Aufstellung ist in den Anlagen ersichtlich (Anlage 1).

0.7 Abgrenzung (Theorie & Praxis)
Diese Arbeit beschäftigt sich mit dem Reengineering eines bestehenden DWH. Dabei sollen speziell der Datenimport einer Firma, die Datenmodellierung sowie eine applikationsspezifische Bereitstellung der Daten behandelt werden. Für diese Tätigkeiten muss ich das bestehende DWH einer detaillierten Prüfung unterziehen, um alle Anforderungen zu sammeln und Strategien zu entwickeln. Im wissenschaftlichen Teilmöchte ich dabei zunächst einige Grundlagen über das Konzept des DWH aufzeigen.Anschließend sollen problembezogene Werkzeuge dargestellt werden, welche zur Lösung der Fragen beitragen. Die Intention dieser Diplomarbeit ist es, das existierende DWH-Konzept zu verstehen und auf Anforderungen der Umgebung anzupassen. Dafür soll ein Reengineering durchgeführt werden.

0.8 Aufbau dieser Arbeit
Nach der Klärung der wichtigsten Begriffe und Konzepte zum Thema Data Warehouse (Kapitel 1.1.) steht die Etablierung des Schemas zur Integration von heterogenen Personendaten im Mittelpunkt. Dabei sollen semantische Modelle untersucht werden und das geeignetste Physikalische im Fokus umschrieben werden.
Aufbauend auf die Instanziierung des Schemas wird die MS SQL 2000 Server Umgebung (Kapitel 1.2.) dargestellt, mit welcher Datenbanken erstellt und verwaltet werden können. Möglichkeiten der Datenintegration und der Datennutzung mit dem MS SQL 2000 Server sollen abschließend in diesem Kapitel behandelt werden.
Die Problemanalyse (Kapitel 2) beschreibt die Aufgaben und Grenzen des bestehenden Data Warehouse. Nach einer detaillierten Problemstellung werden die Schwierigkeiten auf der Seite der Datennutzung und des Datenimports ermittelt.

Im Kapitel 3 werden Strategien und Lösungskonzepte untersucht. Hierbei stellt das Datenmodell den Unterbau des DWH dar. Aufbauend auf das Datenmodell werden die Strategien für den Datenimport einer Firma sowie für die Datennutzung einer Applikation beschrieben.
Im abschließenden Kapitel (Kapitel 4) möchte ich die Ergebnisse zusammenfassen und einen Ausblick über das weitere Vorgehen bezüglich des DWH erwähnen.

[...]

1 vgl. [SU]
2 Die Kosten des Business Case wurden entsprechend einem gewöhnlichen Projekt kalkuliert. Aus diesem Grund wurde der Durchschnittsstundensatz von 150 CHF pro Stunde benutzt.

Kommentare

Kommentar hinzufügen

Dieser Text kann über folgende URL aufgerufen und zitiert werden:

http://www.grin.com/e-book/6778/