Data-Warehouses stellen eine wichtige Grundlage für die Analyse von betrieblichen Daten dar. Sie liefern zeitnahe Entscheidungsgrundlagen und befreien damit den Entscheidungsträger von der Notwendigkeit zur intuitiven Entscheidung. Abgesehen von der strategischen Bedeutung für ein Unternehmen, ist ein Data-Warehouse-Projekt normalerweise zeitaufwendig und kostspielig. „Unzählige Beispiele aus der betrieblichen Praxis belegen, dass Informationssysteme zwar meist technisch funktionieren, von den Anwendern jedoch nicht angenommen werden und deshalb bereits nach kurzer Zeit scheitern.“1 Die Anwenderakzeptanz bei einem Data-Warehouse ist neben verschiedenen anderen Aspekten besonders von der Datenqualität abhängig. Dabei ist nicht die objektive Datenqualität das ausschlaggebende Kriterium, sondern die subjektive Qualität, die der einzelne Benutzer den Daten zumisst.

Die Arbeit untersucht, welche Möglichkeiten es gibt, die Datenqualität aus Benutzersicht zu steigern. Eine besondere Stellung nehmen hier Metadaten ein, da sie Informationen enthalten, die es dem Benutzer ermöglichen, die vorhandenen Daten besser verstehen und einschätzen zu können. Es scheint möglich, die Datenqualität für den Endbenutzer dadurch zu steigern, dass man ihm Zugriff auf diese Metadaten verschafft, so dass er die Bedeutung der Daten besser einschätzen kann und ihnen auf Grund seiner genaueren Kenntnisse über Herkunft und Aggregation mehr Vertrauen schenkt.

Excerpt

Inhaltsverzeichnis

1 EINLEITUNG
2 GRUNDLAGEN UND DEFINITIONEN
- 2.1 DATA WAREHOUSES
- 2.2 METADATEN
  - 2.2.1 Definition Metadaten
  - 2.2.2 Arten von Metadaten
  - 2.2.3 Einsatzzwecke von Metadaten
  - 2.2.4 Metadatenspeicherung
  - 2.2.5 Metadatenaustausch
- 2.3 QUALITÄT UND DATENQUALITÄT
  - 2.3.1 Definition Datenqualität
  - 2.3.2 Kriterien für Datenqualität
  - 2.3.3 Datenqualität von Informationssystemen
  - 2.3.4 Allgemeine Methoden zur Verbesserung von Datenqualität
3 QUALITÄT VON DATA-WAREHOUSES
- 3.1 QUALITÄTSKRITERIEN VON DATA-WAREHOUSES
- 3.2 RISIKEN FÜR DIE QUALITÄT VON DATA-WAREHOUSES
- 3.3 BEDEUTUNG VON METADATEN FÜR DATA-WAREHOUSE QUALITÄT
  - 3.3.1 Bedeutung von Metadaten im Data-Warehouse
  - 3.3.2 Speicherung und Verarbeitung der Metadaten im Data-Warehouse
- 3.4 KONZEPTE ZUR STEIGERUNG VON DATA-WAREHOUSE QUALITÄT
  - 3.4.1 Doppelte Entwicklung - Stockhammer und Kennel
  - 3.4.2 Qualitätssteigerung als Optimierungsproblem - Ballou / Tayi
  - 3.4.3 CLIQ-Der Ansatz von Hinrichs
  - 3.4.4 Terminologiemanagement - Der Ansatz von Lehmann/Jaszewski
  - 3.4.5 Alles in einem - Der Ansatz des DWQ
4 UMSETZUNG DER KONZEPTE AM PRAKTISCHEN BEISPIEL
- 4.1 BESCHREIBUNG DER AUSGANGSSITUATION
- 4.2 BESCHREIBUNG DER UMSETZUNGSMAẞNAHMEN
  - 4.2.1 Metadata-Services - Das Repository
    - 4.2.1.1 Aufbau der Metadata-Services
    - 4.2.1.2 Füllen der Metadata-Services
  - 4.2.2 Analysis Services - Der OLAP-Server
    - 4.2.2.1 Metadaten in den Analysis Services
    - 4.2.2.2 Analysis Manager als Anwendungsoberfläche
  - 4.2.3 Arcplans inSight/dynaSight - Das Front-End
    - 4.2.3.1 Zugriff auf das Data-Warehouse und die Metadaten
    - 4.2.3.2 Implementierung von Metadaten
5 SCHLUSSBEURTEILUNG
- 5.1 BEURTEILUNG DER MAẞNAHMEN
- 5.2 ZUKÜNFTIGER ENTWICKLUNGSBEDARF

Zielsetzung und Themenschwerpunkte

Die Diplomarbeit beschäftigt sich mit der Bedeutung von Metadaten für die Datenqualität in Data-Warehouse-Systemen. Ziel ist es, die Rolle von Metadaten für die Qualität von Data Warehouses zu analysieren und konkrete Konzepte zur Steigerung der Datenqualität mithilfe von Metadaten vorzustellen.

Definition und Bedeutung von Metadaten in Data-Warehouse-Systemen
Kriterien und Risiken für die Datenqualität in Data Warehouses
Konzepte zur Steigerung der Datenqualität durch den Einsatz von Metadaten
Praktische Umsetzung der Konzepte anhand eines Beispiels
Bewertung der Maßnahmen und zukünftige Entwicklungsmöglichkeiten

Zusammenfassung der Kapitel

Kapitel 1 gibt eine Einleitung in die Thematik der Diplomarbeit und erläutert die Relevanz von Data Warehouses und Datenqualität. Kapitel 2 definiert die zentralen Begriffe "Data Warehouse" und "Metadaten" und beleuchtet die verschiedenen Arten und Einsatzmöglichkeiten von Metadaten. Es werden außerdem die verschiedenen Aspekte der Datenqualität und deren Bedeutung für Informationssysteme beleuchtet. Kapitel 3 analysiert die Qualitätskriterien von Data Warehouses und identifiziert potentielle Risiken für die Datenqualität. Es wird die Bedeutung von Metadaten für die Data-Warehouse-Qualität im Detail erörtert und die verschiedenen Konzepte zur Steigerung der Datenqualität durch den Einsatz von Metadaten werden vorgestellt. Kapitel 4 zeigt die praktische Umsetzung dieser Konzepte anhand eines Beispiels auf. Kapitel 5 bietet eine abschließende Beurteilung der durchgeführten Maßnahmen und diskutiert den zukünftigen Entwicklungsbedarf im Bereich der Data-Warehouse-Qualität.

Schlüsselwörter

Data Warehouse, Metadaten, Datenqualität, Data-Warehouse-Qualität, Data-Transformation-Services, OLAP, Metadata-Services, Data-Quality-Framework, Terminologiemanagement, DWQ.

Häufig gestellte Fragen

Warum ist Datenqualität für Data Warehouses so wichtig?

Die Akzeptanz eines Data Warehouses durch die Benutzer hängt stark von der subjektiven Datenqualität ab. Nur wenn Nutzer den Daten vertrauen, nutzen sie das System für strategische Entscheidungen.

Was sind Metadaten in einem Data Warehouse?

Metadaten sind „Daten über Daten“. Sie beschreiben die Herkunft, Struktur, Bedeutung und Aggregationsregeln der im Data Warehouse gespeicherten Informationen.

Wie steigern Metadaten die subjektive Datenqualität?

Indem Nutzer Zugriff auf Metadaten erhalten, können sie die Herkunft und Berechnung von Kennzahlen besser nachvollziehen, was das Vertrauen in die Korrektheit der Daten erhöht.

Was ist Terminologiemanagement?

Terminologiemanagement stellt sicher, dass Begriffe unternehmensweit einheitlich definiert und verstanden werden, um Missverständnisse bei der Datenanalyse zu vermeiden.

Welche Risiken bestehen für die Qualität von Data Warehouses?

Risiken entstehen durch fehlerhafte Quellsysteme, mangelhafte Transformationsprozesse (ETL) oder fehlende Dokumentation der Datenflüsse.

Was ist ein OLAP-Server im Kontext von Metadaten?

Ein OLAP-Server (z. B. Analysis Services) verarbeitet multidimensionale Daten und nutzt Metadaten, um dem Benutzer flexible Analyseoberflächen bereitzustellen.

Excerpt out of 79 pages - scroll top

Details

Title: Metadaten und Datenqualität in Data Warehouses
College: University of Marburg (Institut für Wirtschaftsinformatik)
Grade: 2,0
Author: Andreas Huthmann (Author)
Publication Year: 2003
Pages: 79
Catalog Number: V21064
ISBN (eBook): 9783638247702
ISBN (Book): 9783638700979
Language: German
Tags: Metadaten Datenqualität Data Warehouses
Product Safety: GRIN Publishing GmbH

Quote paper: Andreas Huthmann (Author), 2003, Metadaten und Datenqualität in Data Warehouses, Munich, GRIN Verlag, https://www.grin.com/document/21064

Metadaten und Datenqualität in Data Warehouses