Inhaltsverzeichnis II
Inhaltsverzeichnis
Inhaltsverzeichnis. II
Abbildungsverzeichnis III
Abk ürzungsverzeichnis IV
1. Einleitung. 1
2. Einführung in das multidimensionale Datenmodell. 3
3. Konzeptuelle Modellierung. 5
3.1. ME/R Modell. 7
3.2. Multidimensional UML (mUML) 10
3.3. Objektorientierter multidimensionaler Modellrahmen. 14
4. Logische Modellierung 18
4.1. Struktur des multidimensionalen Datenmodells. 19
4.1.1. Dimensionen 20
4.1.2. Klassifikationsschema. 20
4.1.3. Klassifikationshierarchie 21
4.1.4. Würfel, Würfelschema. 22
4.2. Multidimensionale Datenmanipulationskonzepte 24
4.2.1. Projektions- und Selektionsoperation 24
4.2.2. Klassifikationsbasierte Bereichsrestriktionen 24
4.2.3. Multidimensionale Verbundoperationen. 26
4.2.4. Multidimensionale Aggregationsoperationen 26
4.2.5. Multidimensionale Navigationsoperatoren 28
4.3. Anfragen in einem Data Warehouse 29
5. Unterstützungen von Veränderungen. 31
5.1. Temporale Datenbanken. 31
5.2. Veränderungen von Klassifikationshierarchien. 32
5.3. Gültigkeitszeitmatrix. 34
5.4. Veränderungen von Datenbankschemata. 37
6. Zusammenfassung 40
Literaturverzeichnis 41
Abbildungsverzeichnis
Abbildungsverzeichnis
Abb. 1-1 Vorgehensweise beim Entwurf von Datenbanken
Abb. 2-1 Multidimensionaler Datenwürfel.
Abb. 3-1 Auszug eines E/R Modells
Abb. 3-2 Die graphische Notation der ME/R - Elemente
Abb. 3-3 Beispielszenario in ME/R-Notation
Abb. 3-4 Ausschnitt des MML-Metamodells.
Abb. 3-5 mUML - Schema Produktverkauf.
Abb. 3-6 Basiselemente des objektorientierten multidimensionalen
Abb. 3-7 Gültigkeitszuordnungen für eine Kenngröße
Abb. 4-1 Beispiel eines multidimensionalen Schemas
Abb. 4-2 Ausschnitt aus der Klassifikationshierarchie der Produktdimension
Abb. 4-3 Slice-Operationen
Abb. 4-4 Dice-Operation
Abb.4 -5 Beispiel einer multidimensionalen Aggregation.
Abb. 4-6 Multidimensionale Navigation
Abb. 5-1 Ausschnitt der Klassifikationshierarchie der Dimension Produkt am 2000-
03-01
Abb. 5-2 Ausschnitt der Klassifikationshierarchie der Dimension Produkt am 2001-
05-07
Abb. 5-3 Ausschnitt der Klassifikationshierarchie der Dimension Produkt am 2004-
08-09
Abb. 5-4 Zeitstempelung der Klassifikationshierarchie der Produktdimension
Abb. 5-5 Gültigkeitszeitmatrix der Klassifikationshierarchie der Produktdimension.
Abb 5-6 Alternativen beim Einfügen einer Dimension
Abkürzungsverzeichnis IV
Abkürzungsverzeichnis
FN Fußnote OLAP Online Analytical Processing M/ER Multidimensional Entity Relationship ER Entity Relationship UML Unified Modeling Language mUML Multidimensional Unified Modeling Language MML Multidimensional Modeling Language SQL Structured Query Language MDX Multidimensional Expressions OLE DB Object Linking and Embedding Database
Einleitung 1
1. Einleitung
In den letzten Jahren haben Data Warehouse Systeme ein reges Interesse im Bereich des Controllings geweckt. Die stark wachsende Integration der Märkte und die stetig fortschreitende Globalisierung führen zu einem enorm steigenden Wettbewerbsdruck. Aus dieser Situa tion heraus haben Data Warehouse Systeme immer mehr an Bedeutung erlangt um eine entscheidende Aufgabe des Controllings, die Schaffung von
Informationskongruenz 1 , zu realisieren. Die Basis des Data Warehouses, die zentrale Komponente des Data Warehouse Systems, bildet dabei die Sammlung von operativen Daten aus unterschiedlichen Quellsystemen, aus denen durch analytische Operationen entscheidungsunterstützende Informationen für ein Unternehmen gewo nnen werden.
Eine zentrale Aufgabe des Data Warehouses ist es, einen adäquaten Modellierungsansatz der Datenstrukturen zur Verwirklichung der physischen Integration und dem Analyseaspekt bereitzustellen. Der Ansatz des multidimensionalen Datenmodells hat sich als besonders adäquat durchgesetzt.
Dieser Beitrag beschäftigt sich mit dem Entwurf einer Datenbank für ein Data Warehouse System unter den Aspekten der konzeptionellen und logischen Modellierung unter Berücksichtigung der Unterstützung von Veränderungen. Der Fokus liegt dabei auf dem Konzept des multidimensionalen Datenmodells.
In Analogie zu dem Entwurf von konventionellen Datenbanken soll die Vorgehensweise anhand der Abbildung 1 -1 näher spezifiziert werden. Abbildung 1-1 zeigt den typischen Verlauf für den Entwurf einer klassischen
1 Totok, Andreas,2000: Modelierung von OLAP- und Data-Warehouse-Systemen, S.14f.
Einleitung 2
Datenbank 2 . Nach der Anforderungsanalyse erfolgt unabhängig vom konkret verwendeten Datenmodell die Erstellung des konzeptionellen Schemas.
3 Abb. 1-1 Vorgehensweise beim Entwurf von Datenbanken Das logische Schema wird dann aus dem konzeptionellen Schema abgeleitet und beschreibt im Allgemeinen die Daten in einem konkreten Datenmodell. Am Ende dieser Ableitung setzt ein Datenbankentwicklungssystem das logische Schema direkt in das interne Schema eines konkreten Datenbanksystems um 4 .
Zur Darstellung der konzeptionellen Modellierung soll ein Überblick über verschiedene graphische Designnotationen vorgestellt w erden, mit den Schwerpunkten das ME/R-Modell, mUML und der objektorientierte multidimensionale Modellrahmen von Totok. Alle drei Ansätze setzen sich mit der Modellierung multidimensionaler Datenmodelle auseinander. Im logischen Datenmodell wird das multidimensionale Modell anhand von Gegenüberstellungen mit dem relationalen Modell formal näher erläutert. Eine weitere Umsetzung des logischen Modells soll nicht Gegensta nd dieser Arbeit sein. Abschließend wird der Aspekt von Veränderungen im Rahmen des Data Warehouses näher diskutiert.
2 Vgl. Lehner, Wolfgang, 2003: Datenbanktechnologie für Data Warehouse Systeme - Konzepte und
Methoden, S.53f.
3 Quelle: Lehner, Wolfgang, 2003: (FN2), S.54
4 Vgl. o.V., Datenbanksysteme: Konzepte und Architekturen: Internet
http://cheese.geo.unizh.ch:9000/student/all/de/basic/DBSysConcept/view-pdf
Einführung in das multidimensionale Datenmodell 3
2. Einführung in das multidimensionale Datenmodell
Data Warehouse Systeme orientieren sich anhand der Analyse operativer Daten an der G ewinnung entscheidungsunterstützender Informationen. Diese Informationen sind von Natur aus multidimensional 5 . Eine typische Beispielanfrage an ein analytisches Datenmodell wäre „Wie hoch war der Umsatz des Produktes A in der Region B i n der Zeit C“. Abbildung 2-1 veranschaulicht in Form eines Würfels den Umsatz als Kenngröße der betrieblichen Leistung, die sich nach den Dimensionen Zeit, Produkt und Geographie ermitteln lässt. Die Kenngrößen entsprechen den einzelnen Zellen des Würfels und enthalten, sofern vorhanden, diskrete Werte, wie im Beispiel die Umsätze.
6 Abb. 2-1 Multidimensionaler Datenwürfel
5 Vgl. Totok, Andreas, 2000: (FN1), S.75
6 Vgl. Bauer, Andreas, 2004: Data Warehouse Systeme - Architektur, Entwicklung, Anwendung S. 103
Einführung in das multidimensionale Datenmodell 4
Die Achsen bzw. die Kanten des Würfels repräsentieren die einzelnen Dimensionen. Eine Dimension lässt sich in mehrere Hierarchieebenen aufteilen, wobei eine höhere Hierarchieebene die aggregierten Werte der jeweils niedrigeren Hierarchiestufe enthält. Somit kann jede Dimension mittels einer Baumstruktur visualisiert werden (vgl. Abbildung 2-1). Auf eine formale Beschreibung des Datenmodells soll an dieser Stelle verzichtet werden, da sie Gegenstand von Kapitel 4 ist.
Das Beispiel zeigt, dass eine grundlegende Anforderung an ein betriebliches Informationssystem die Möglichkeit nach multidimensionaler Auswertung ist. Um diesen Anspruch zu erfüllen, ist eine entscheidungsorientierte, multidimensionale Strukturierung der zugrunde liegenden Datenbasis
zwingend erforderlich. Dazu wird ein neues Datenmodell, das multidimensionale Datenmodell, eingeführ t, welches sich für die Modellierungen von Data Warehouse Systemen als besonders geeignet erwiesen hat. Dabei sollen die Daten eines multidimensionalen Datenmodells möglichst so abgebildet werden, wie sie auch von den Anwendern in der Realität gesehen werden. Der Zugriff auf Daten erfolgt dabei in einer intuitiven Form, die keine Formulierung von komplexen Abfragen mit speziellen Fragen mehr erforderlich macht 7 .
7 Vgl. Hoffman/Kusterer: Handelscontrolling auf Basis eines Data Warehouse und OLAP , in Controlling
1/97 S.57
Konzeptuelle Modellierung 5
3. Konzeptuelle Modellierung
Für den Entwurf eines Data Warehouse Systems hat sich wie auch schon bei konventionellen Datenbanksystemen das konzeptuelle Datenmodell erwiesen. Mit H ilfe von speziellen Designnotationen ermöglicht d ie konzeptionelle Modellierung eine einfache Darstellung der konkreten Anwendungsproblematik. Im Vordergrund steht die Abbildung der betrieblichen Situation in Form von Beziehungen und Daten möglichst ohne Informationsverlust 8 . Hierbei dürfen allerdings nur die relevanten Aspekte berücksichtigt werden, da die Abbildung sonst zu komplex werden würde. Darauf aufbauend hat sich b ei dem Entwurf von konventionellen Datenbanksystemen das Entity Relationship Diagramm und die UML durchgesetzt. Diese Entwurfstechniken sind jedoch für den Aufbau eines Data Warehouse insofern inadäquat, da sie keine für das multidimensionale Datenmodell a usdrucksfähige Semantik besitzen 9 .
10 Abb. 3-1 Auszug eines E/R Modells
8 Vgl. Gerhardt, Hans -Detlef, 2003:Einführung in die Datenbanktechnologie, Folie 5-3
9 Vgl. Bauer, Andreas,2004: (FN6), S.162f.
10 Quelle Bauer, Andreas, 2004: (FN6), S.163
Arbeit zitieren:
Nicolas Schwiedeps, 2005, Data Warehouse Systeme - Das multidimensionale Datenmodell, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
BWL - Marketing, Unternehmenskommunikation, CRM, Marktforschung
Projektarbeit, 54 Seiten
Das Data warehouse-Konzept und mulitdimensionale Datenmodellierung
Informatik - Wirtschaftsinformatik
Seminararbeit, 54 Seiten
Data Warehouse - Anforderungen an ein Unternehmen
Definition, Aufbau und Vorteil...
Informatik - Wirtschaftsinformatik
Hausarbeit, 28 Seiten
Beschreibung des Lebenslagenprinzips und Bewertung der Internetseite M...
BWL - Unternehmensführung, Management, Organisation
Hausarbeit, 16 Seiten
Unscharfe Dublettensuche in Unternehmens-Adressbeständen
Konzept für Evaluierung, Einfü...
Informationswissenschaften, Informationsmanagement
Diplomarbeit, 98 Seiten
BASEL II - Anforderungen beim Basis IRB-Ansatz - Ausfallwahrscheinlich...
BWL - Bank, Börse, Versicherung
Praktikumsbericht / -arbeit, 82 Seiten
Zugriffsmöglichkeiten auf das Data Warehouse durch das Analysekonzept ...
Informatik - Wirtschaftsinformatik
Seminararbeit, 32 Seiten
Nicolas Schwiedeps hat den Text Data Warehouse Systeme - Das multidimensionale Datenmodell veröffentlicht
Nicolas Schwiedeps hat einen neuen Text hochgeladen
Data Warehouses and OLAP: Concepts, Architectures and Solutions
Robert Wrembel, Christian Koncilia
Vom Data Warehouse zum Corporate Knowledge Center
Proceedings der Data Warehousi...
Robert Winter, Eitel von Maur
Fundamentals of Data Warehouses
0 Kommentare