Die immer kürzeren Veränderungszyklen unterworfenen Märkte stellen alle Marktteilnehmer vor neue Herausforderung. Die Fähigkeit eines Unternehmens, schnelle und richtige Entscheidungen treffen zu können, wird zu einem immer stärkeren Kriterium für seine Wettbewerbsfähigkeit. Der Prozess der Entscheidungsfindung muss daher durch fundierte, umfassende und aktuelle Marktinformation sowie die problemadäquate Aufbereitung dieser Daten unterstützt werden. Eine Aufgabe, die nur mit Hilfe von Informationssystemen – bestehend aus modernster Hard- und Software – bewältigt werden kann. Data Warehouses liefern heute geschäftsrelevante Informationen über Unternehmen, Kunden, Märkte, Lieferanten und anderes mehr. Im Data Warehouse werden Daten aus allen Unternehmensbereichen sowie externen Quellen in einer einzigen Datenbank zusammengetragen, bereinigt und zu Informationen verdichtet.
In diesem Buch gibt einen Überblick über den Aufbau, den Fokus der Anwendungen, die zugrunde liegende Datenmodellierung – aber auch die Gefahren, mit denen der geplante Einsatz eines Data Warehouses verbunden sein kann.
Inhaltsverzeichnis
1 EINLEITUNG
2 DEFINITION DES BEGRIFF „DATA WAREHOUSE“
3 FOKUS DER ANWENDUNG
3.1 OPERATIVE SYSTEME
3.2 ANALYSE SYSTEME
3.3 VERGLEICH DER SYSTEMTYPEN UND EINORDNUNG DES DATA WAREHOUSE
4 AUFBAU EINES DATA WAREHOUSE
4.1 DATEN
4.1.1 Metadaten
4.1.2 Nutzdaten
4.2 ARCHITEKTUR
4.2.1 Datenimporttool
4.2.2 Datenspeicher
4.2.3 Managementsystem
4.2.4 Datenexporttools
4.3 PROZESSE
4.3.1 Datenimport
4.3.2 Datentransformation
4.3.3 Sicherung & Archivierung
4.3.4 Datenexport
5 DATENMODELLIERUNG
5.1 DAS RELATIONALE DATENMODELL
5.1.1 Struktur
5.1.2 Vorteile
5.1.3 Nachteile
5.2 DAS MULTIDIMENSIONALE DATENMODELL
5.2.1 Struktur
6 DATENANALYSE
6.1 OLAP
6.1.1 Was ist OLAP?
6.1.2 Die Regeln von Codd
6.1.3 Varianten der Realisierung
6.2 DATA MINING
6.2.1 Was ist Data Mining?
6.2.2 Methoden des Data Mining
7 GEFAHREN UND MISSERFOLGSFAKTOREN BEI DEM AUFBAU EINES DATA WAREHOUSES
7.1 MOTTO DER FACHABTEILUNG: BUY & PLAY
7.2 MOTTO DER IT-ABTEILUNG: „WIR STELLEN NUR DIE DATEN BEREIT“
Zielsetzung & Themen
Das Hauptziel dieser Arbeit ist es, das Data Warehouse-Konzept als Werkzeug zur Entscheidungsunterstützung in Unternehmen zu erläutern und die Herausforderungen sowie Methoden der multidimensionalen Datenmodellierung und Datenanalyse zu untersuchen. Die zentrale Forschungsfrage befasst sich damit, wie Daten aus operativen Systemen in ein Data Warehouse integriert und mittels OLAP-Technologien sowie Data Mining-Verfahren für qualitative Analysen aufbereitet werden können, um eine fundierte Grundlage für unternehmerische Entscheidungen zu schaffen.
- Grundlagen und Architektur von Data Warehouses
- Gegenüberstellung von operativen Systemen und Analysesystemen
- Vergleichende Analyse relationaler und multidimensionaler Datenmodelle
- Techniken der Datenanalyse: OLAP und Data Mining
- Identifikation kritischer Misserfolgsfaktoren bei der Implementierung
Auszug aus dem Buch
4.3.2 Datentransformation
Die von dem Datenimport eingeladenen Daten weisen in der Regel für jede Datenquelle eine andere Datenstruktur auf. Dass dies bei den externen Datenquellen der Fall ist, ist direkt einsichtig. Häufig trifft diese Aussage jedoch auch auf die internen Datenquellen – die operativen Systeme – zu. In einem Unternehmen werden für unterschiedliche Anwendungen unterschiedliche operative System genutzt, deren Datenstrukturen nicht aufeinander abgestimmt sind. Diese heterogenen Daten müssen nun so verändert werden, dass sie in die Datenstruktur des Data Warehouses übernommen werden können.
Aus den importierten Daten können nur dann entscheidungsrelevante Informationen extrahiert werden, wenn ihr Kontext bekannt ist und entsprechend der Datenstruktur des Data Warehouses homogenisiert wurde. Kontext bedeutet in diesem Zusammenhang: 1. der Bezug auf das Objekt, welches durch die Daten beschrieben wird; 2. die Bedeutung, der einzelnen Datenfelder.
Zusammenfassung der Kapitel
1 EINLEITUNG: Führt in die Notwendigkeit von Data Warehouse-Systemen zur effizienten Entscheidungsfindung in einem volatilen Marktumfeld ein.
2 DEFINITION DES BEGRIFF „DATA WAREHOUSE“: Definiert das Data Warehouse als umfassendes Konzept zur Bereitstellung entscheidungsrelevanter, konsistenter Daten für Endbenutzer.
3 FOKUS DER ANWENDUNG: Unterscheidet zwischen operativen Systemen zur Transaktionsabwicklung und Analysesystemen zur strategischen Datenauswertung.
4 AUFBAU EINES DATA WAREHOUSE: Erläutert die notwendige Architektur, die Rollen von Metadaten und Nutzdaten sowie die zentralen Prozesse wie Import, Transformation und Export.
5 DATENMODELLIERUNG: Vergleicht das klassische relationale Datenmodell mit dem für Analysen besser geeigneten multidimensionalen Datenmodell.
6 DATENANALYSE: Stellt OLAP als interaktives Analysewerkzeug und Data Mining zur Identifikation unbekannter Zusammenhänge in großen Datenbeständen vor.
7 GEFAHREN UND MISSERFOLGSFAKTOREN BEI DEM AUFBAU EINES DATA WAREHOUSES: Diskutiert organisatorische Hürden und Missverständnisse, wie die unterschätzte Komplexität der Bedarfsdefinition durch Fachabteilungen.
Schlüsselwörter
Data Warehouse, multidimensionale Datenmodellierung, OLAP, Data Mining, Entscheidungsunterstützung, operatives System, Datenimport, Transformation, Metadaten, Datenintegrität, ROLAP, Star-Schema, Snowflake-Schema, Abfrageoptimierung, Warenkorbanalyse
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit behandelt die konzeptionellen Grundlagen, den technischen Aufbau und die Analysemethoden von Data Warehouse-Systemen zur Unterstützung unternehmerischer Entscheidungsprozesse.
Was sind die zentralen Themenfelder?
Die Schwerpunkte liegen auf der Datenmodellierung (relational vs. multidimensional), der Systemarchitektur, den ETL-Prozessen (Import, Transformation, Export) sowie fortgeschrittenen Analysemethoden wie OLAP und Data Mining.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, den Nutzen von Data Warehouses aufzuzeigen, indem technische Lösungsansätze für die Datenintegration und -analyse präsentiert und gleichzeitig die organisatorischen Herausforderungen bei deren Einführung kritisch beleuchtet werden.
Welche wissenschaftlichen Methoden werden verwendet?
Die Arbeit basiert auf einer Literaturanalyse und einer systematischen Strukturierung der Konzepte, unterstützt durch zahlreiche Prozess-Mindmaps und grafische Gegenüberstellungen von Datenbankstrukturen.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die Architektur des Data Warehouse, die verschiedenen Ansätze der Datenmodellierung und die Vorstellung von OLAP- sowie Data Mining-Techniken zur effektiven Datennutzung.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die wichtigsten Schlagworte sind Data Warehouse, OLAP, Data Mining, multidimensionale Datenmodellierung, Entscheidungsunterstützung und Datenkonsistenz.
Warum ist die Trennung zwischen operativen Systemen und einem Data Warehouse so wichtig?
Operative Systeme sind für Transaktionsschnelligkeit optimiert, während ein Data Warehouse für analytische Abfragen strukturiert ist; eine Vermischung würde die Performance und die Aussagekraft der Analysen gefährden.
Warum ist die "Buy & Play"-Mentalität in Fachabteilungen ein Misserfolgsfaktor?
Diese Haltung unterschätzt, dass die fachliche Spezifikation der Informationsbedarfe durch den Anwender selbst erfolgen muss und externe Tools ohne ein fundiertes Datenmodell keinen Mehrwert bieten.
- Quote paper
- Ute Nast-Linke (Author), 2003, Das Data Warehouse-Konzept und mulitdimensionale Datenmodellierung, Munich, GRIN Verlag, https://www.grin.com/document/14459