Data-Warehouses stellen eine wichtige Grundlage für die Analyse von betrieblichen Daten dar. Sie liefern zeitnahe Entscheidungsgrundlagen und befreien damit den Entscheidungsträger von der Notwendigkeit zur intuitiven Entscheidung. Abgesehen von der strategischen Bedeutung für ein Unternehmen, ist ein Data-Warehouse-Projekt normalerweise zeitaufwendig und kostspielig. „Unzählige Beispiele aus der betrieblichen Praxis belegen, dass Informationssysteme zwar meist technisch funktionieren, von den Anwendern jedoch nicht angenommen werden und deshalb bereits nach kurzer Zeit scheitern.“1 Die Anwenderakzeptanz bei einem Data-Warehouse ist neben verschiedenen anderen Aspekten besonders von der Datenqualität abhängig. Dabei ist nicht die objektive Datenqualität das ausschlaggebende Kriterium, sondern die subjektive Qualität, die der einzelne Benutzer den Daten zumisst.
Die Arbeit untersucht, welche Möglichkeiten es gibt, die Datenqualität aus Benutzersicht zu steigern. Eine besondere Stellung nehmen hier Metadaten ein, da sie Informationen enthalten, die es dem Benutzer ermöglichen, die vorhandenen Daten besser verstehen und einschätzen zu können. Es scheint möglich, die Datenqualität für den Endbenutzer dadurch zu steigern, dass man ihm Zugriff auf diese Metadaten verschafft, so dass er die Bedeutung der Daten besser einschätzen kann und ihnen auf Grund seiner genaueren Kenntnisse über Herkunft und Aggregation mehr Vertrauen schenkt.
Inhaltsverzeichnis
- 1 EINLEITUNG
- 2 GRUNDLAGEN UND DEFINITIONEN
- 2.1 DATA WAREHOUSES
- 2.2 METADATEN
- 2.2.1 Definition Metadaten
- 2.2.2 Arten von Metadaten
- 2.2.3 Einsatzzwecke von Metadaten
- 2.2.4 Metadatenspeicherung
- 2.2.5 Metadatenaustausch
- 2.3 QUALITÄT UND DATENQUALITÄT
- 2.3.1 Definition Datenqualität
- 2.3.2 Kriterien für Datenqualität
- 2.3.3 Datenqualität von Informationssystemen
- 2.3.4 Allgemeine Methoden zur Verbesserung von Datenqualität
- 3 QUALITÄT VON DATA-WAREHOUSES
- 3.1 QUALITÄTSKRITERIEN VON DATA-WAREHOUSES
- 3.2 RISIKEN FÜR DIE QUALITÄT VON DATA-WAREHOUSES
- 3.3 BEDEUTUNG VON METADATEN FÜR DATA-WAREHOUSE QUALITÄT
- 3.3.1 Bedeutung von Metadaten im Data-Warehouse
- 3.3.2 Speicherung und Verarbeitung der Metadaten im Data-Warehouse
- 3.4 KONZEPTE ZUR STEIGERUNG VON DATA-WAREHOUSE QUALITÄT
- 3.4.1 Doppelte Entwicklung - Stockhammer und Kennel
- 3.4.2 Qualitätssteigerung als Optimierungsproblem - Ballou / Tayi
- 3.4.3 CLIQ-Der Ansatz von Hinrichs
- 3.4.4 Terminologiemanagement - Der Ansatz von Lehmann/Jaszewski
- 3.4.5 Alles in einem - Der Ansatz des DWQ
- 4 UMSETZUNG DER KONZEPTE AM PRAKTISCHEN BEISPIEL
- 4.1 BESCHREIBUNG DER AUSGANGSSITUATION
- 4.2 BESCHREIBUNG DER UMSETZUNGSMAẞNAHMEN
- 4.2.1 Metadata-Services - Das Repository
- 4.2.1.1 Aufbau der Metadata-Services
- 4.2.1.2 Füllen der Metadata-Services
- 4.2.2 Analysis Services - Der OLAP-Server
- 4.2.2.1 Metadaten in den Analysis Services
- 4.2.2.2 Analysis Manager als Anwendungsoberfläche
- 4.2.3 Arcplans inSight/dynaSight - Das Front-End
- 4.2.3.1 Zugriff auf das Data-Warehouse und die Metadaten
- 4.2.3.2 Implementierung von Metadaten
- 4.2.1 Metadata-Services - Das Repository
- 5 SCHLUSSBEURTEILUNG
- 5.1 BEURTEILUNG DER MAẞNAHMEN
- 5.2 ZUKÜNFTIGER ENTWICKLUNGSBEDARF
Zielsetzung und Themenschwerpunkte
Die Diplomarbeit beschäftigt sich mit der Bedeutung von Metadaten für die Datenqualität in Data-Warehouse-Systemen. Ziel ist es, die Rolle von Metadaten für die Qualität von Data Warehouses zu analysieren und konkrete Konzepte zur Steigerung der Datenqualität mithilfe von Metadaten vorzustellen.
- Definition und Bedeutung von Metadaten in Data-Warehouse-Systemen
- Kriterien und Risiken für die Datenqualität in Data Warehouses
- Konzepte zur Steigerung der Datenqualität durch den Einsatz von Metadaten
- Praktische Umsetzung der Konzepte anhand eines Beispiels
- Bewertung der Maßnahmen und zukünftige Entwicklungsmöglichkeiten
Zusammenfassung der Kapitel
Kapitel 1 gibt eine Einleitung in die Thematik der Diplomarbeit und erläutert die Relevanz von Data Warehouses und Datenqualität. Kapitel 2 definiert die zentralen Begriffe "Data Warehouse" und "Metadaten" und beleuchtet die verschiedenen Arten und Einsatzmöglichkeiten von Metadaten. Es werden außerdem die verschiedenen Aspekte der Datenqualität und deren Bedeutung für Informationssysteme beleuchtet. Kapitel 3 analysiert die Qualitätskriterien von Data Warehouses und identifiziert potentielle Risiken für die Datenqualität. Es wird die Bedeutung von Metadaten für die Data-Warehouse-Qualität im Detail erörtert und die verschiedenen Konzepte zur Steigerung der Datenqualität durch den Einsatz von Metadaten werden vorgestellt. Kapitel 4 zeigt die praktische Umsetzung dieser Konzepte anhand eines Beispiels auf. Kapitel 5 bietet eine abschließende Beurteilung der durchgeführten Maßnahmen und diskutiert den zukünftigen Entwicklungsbedarf im Bereich der Data-Warehouse-Qualität.
Schlüsselwörter
Data Warehouse, Metadaten, Datenqualität, Data-Warehouse-Qualität, Data-Transformation-Services, OLAP, Metadata-Services, Data-Quality-Framework, Terminologiemanagement, DWQ.
- Citation du texte
- Andreas Huthmann (Auteur), 2003, Metadaten und Datenqualität in Data Warehouses, Munich, GRIN Verlag, https://www.grin.com/document/21064