Ziel der Arbeit ist die Darstellung der Data Vault Modellierungstechnik am Beispiel der Warenkorbanalyse mithilfe des Kassenbons. Der Schwerpunkt liegt in der Entwicklung der Datenmodelle. Zunächst mithilfe des bekannten „Star-Schema“, anschließend mit der Modellierungstechnik „Data Vault“. Hierzu gilt es zunächst die Grundlagen der Data Vault Modellierung zu recherchieren.
Abschließend sind die Vor- und Nachteile der eingesetzten Techniken darzustellen.
Aus der Aufgabenstellung ergeben sich diese vier Teilziele:
- Entwicklung eines Datenmodells für einen Kassen-Bon nach dem Star-Schema mit einer Fakt- (Bon- bzw. Bonposition) und drei Dimensionstabellen (Produkt, Zeit, Ort);
- Recherche der Grundlagen von Data Vault;
- Entwicklung eines Datenmodells für einen Kassen-Bon mit Data Vault;
- Dartstellen der Vor- und Nachteile von Star-Schema und Data Vault
Inhaltsverzeichnis
1 Projektziele und Vorbereitungen
2 Projektgrundlage Beispiel-Kassen-Bon und Begriffsdefinition Warenkorbanalyse
3 Vorbereitende Aktivitäten und Projektplanung
4 Star-Schema
4.1 Das Star-Schema
4.2 Modellierung der Aufgabenstellung im Star-Schema
4.3 Faktentabelle Bon_Bonposition
4.4 Dimensionstabellen
4.4.1 Dimensionstabelle DimOrt
4.4.2 Dimensionstabelle DimProdukt
4.4.3 Dimensionstabelle DimZeit
5 Data Vault
5.1 Begriffsklärung Data Vault – Data Vault 2.0
5.2 Was ist Data Vault?
5.3 Hubs
5.4 Links
5.5 Satelliten
5.6 Zusammenfassung Data Vault
5.7 Modellierung eines Kassen-Bon Data Vault Modells
5.7.1 Vorgehensweise
5.7.2 Datenmodell
5.7.3 Hubs
5.7.4 Link
5.7.5 Satelliten und Referenztabelle
6 Vor- und Nachteile der eingesetzten Modellierungstechniken und Fazit
6.1 Vor- und Nachteile Star-Schema
6.2 Vor- und Nachteile Data Vault
6.3 Fazit
Zielsetzung & Themen
Das primäre Ziel dieser Arbeit ist die praktische Gegenüberstellung der Modellierungstechniken Star-Schema und Data Vault anhand eines konkreten Anwendungsfalls – der Warenkorbanalyse basierend auf einem realen Kassenbon. Dabei wird untersucht, wie sich die Datenstrukturen in beiden Ansätzen gestalten und welche Vor- und Nachteile sich für die Wartbarkeit und Erweiterbarkeit ergeben.
- Entwicklung von Datenmodellen für Kassenbons im Star-Schema.
- Erforschung der theoretischen Grundlagen und Entitäts-Typen von Data Vault.
- Implementierung eines Data Vault Modells für den gewählten Anwendungsfall.
- Vergleichende Bewertung der Modellierungstechniken hinsichtlich Komplexität und Aufwand.
- Analyse der Historisierungs- und Erweiterungsmöglichkeiten beider Ansätze.
Auszug aus dem Buch
5.5 Satelliten
Die Satelliten enthalten beschreibende Informationen zu einem Business Key oder Link. Es kann mehrere Satelliten geben, um ein und denselben Hub oder Link zu beschreiben. Jedoch kann ein Satellit selbst nur einen Hub oder Link beschrieben. Die Pflichtfelder von Satelliten sind der künstliche Schlüssel des Hubs oder Links, den er beschreibt, der Zeitstempel des Ladezeitpunkts sowie die Datenquelle. Zudem enthält der Satellit die betreffenden beschreibenden Informationen des Hubs oder Links. (Hultgren 2015, S. 6)
Die Satelliten werden nur mit neuen Daten beschrieben, wenn es in den Daten mindestens eine Änderung gab. Der zusammengesetzte Primärschlüssel eines Satelliten ergibt sich aus dem Primärschlüssel des Links oder Hubs, den er beschreibt, zusammen mit dem Load Date Timestamp, also dem Zeitstempel des Ladezeitpunkts. (Linstedt und Graziano 2011)
Weitere Regeln für einen Satelliten sind nach Linstedt (Auszug):
Ein Satellit kann niemals eigene Primärschlüssel, künstliche Schlüssel oder eigene Hash-Keys generieren.
Ein Satellit muss mindestens ein beschreibendes Element über den Hub oder Link enthalten, dem er zugeordnet ist.
Ein Satellit kann aggregierte oder systemseitig erstellte Attribute enthalten.
Der Zweck eines Satelliten ist, Daten im Zeitverlauf zu speichern.
(Linstedt 2018, S. 14–15)
Zusammenfassung der Kapitel
1 Projektziele und Vorbereitungen: Einleitung in die Aufgabenstellung und Definition der vier Teilziele zur Modellierung eines Kassenbons.
2 Projektgrundlage Beispiel-Kassen-Bon und Begriffsdefinition Warenkorbanalyse: Vorstellung des Aldi-Süd Kassenbons als Datenquelle und Erläuterung der zu modellierenden Merkmale für die Warenkorbanalyse.
3 Vorbereitende Aktivitäten und Projektplanung: Dokumentation der organisatorischen Schritte, von der Literaturrecherche bis zur Tool-Auswahl für die Datenmodellierung.
4 Star-Schema: Theoretische Einführung in das Star-Schema und praktische Umsetzung der Kassenbon-Modellierung mit Faktentabelle und Dimensionstabellen.
5 Data Vault: Detaillierte Erläuterung der Data Vault Methodik mit Fokus auf Hubs, Links und Satelliten sowie deren Anwendung auf das Kassenbon-Beispiel.
6 Vor- und Nachteile der eingesetzten Modellierungstechniken und Fazit: Kritische Gegenüberstellung beider Ansätze hinsichtlich Aufwand, Flexibilität und Eignung für verschiedene Anforderungsszenarien.
Schlüsselwörter
Business Intelligence, Data Vault, Star-Schema, Warenkorbanalyse, Datenmodellierung, Hub, Link, Satellit, ETL-Prozess, Faktentabelle, Dimensionstabelle, Historisierung, Normalisierung, IT-Architektur, Kassenbon
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit der vergleichenden Datenmodellierung im Bereich Business Intelligence am Beispiel eines realen Kassenbons.
Was sind die zentralen Themenfelder?
Die Schwerpunkte liegen auf dem klassischen Star-Schema nach Ralph Kimball und der agilen Data Vault Modellierungsmethode nach Dan Linstedt.
Was ist das primäre Ziel der Untersuchung?
Ziel ist es, die Unterschiede in der Modellierungsweise sowie den Aufwand und Nutzen beider Ansätze für eine Warenkorbanalyse zu evaluieren.
Welche wissenschaftlichen Methoden werden verwendet?
Es erfolgt eine fundierte Literaturrecherche zu den Modellierungskonzepten, gefolgt von einer praktischen Anwendungsentwicklung in Visual Paradigm.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die Modellierung nach dem Star-Schema, die tiefgehende theoretische und praktische Analyse von Data Vault Komponenten sowie eine abschließende Bewertung beider Techniken.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zu den wichtigsten Begriffen zählen Business Intelligence, Data Vault, Star-Schema, Warenkorbanalyse und Datenmodellierung.
Warum wurde für die Modellierung ein Aldi-Süd Kassenbon gewählt?
Dieser dient als standardisiertes, leicht verständliches Beispiel für einen realen Kaufvorgang mit typischen Attributen wie Datum, Filiale und Artikelpositionen.
Was ist das Hauptergebnis des Vergleichs zwischen Star-Schema und Data Vault?
Die Arbeit kommt zu einem "Unentschieden": Während das Star-Schema bei einfachen, stabilen Anforderungen effizienter ist, bietet Data Vault klare Vorteile bei komplexen, sich ändernden Datenstrukturen und der Anforderung nach Historisierung.
- Arbeit zitieren
- Monika Arbter-Hubrich (Autor:in), 2018, Data Vault Modellierung anhand eines Kassenbons, München, GRIN Verlag, https://www.grin.com/document/974189