Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Computer Science - Commercial Information Technology

Metadaten und Datenqualität in Data Warehouses

Title: Metadaten und Datenqualität in Data Warehouses

Diploma Thesis , 2003 , 79 Pages , Grade: 2,0

Autor:in: Andreas Huthmann (Author)

Computer Science - Commercial Information Technology
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Data-Warehouses stellen eine wichtige Grundlage für die Analyse von betrieblichen Daten dar. Sie liefern zeitnahe Entscheidungsgrundlagen und befreien damit den Entscheidungsträger von der Notwendigkeit zur intuitiven Entscheidung. Abgesehen von der strategischen Bedeutung für ein Unternehmen, ist ein Data-Warehouse-Projekt normalerweise zeitaufwendig und kostspielig. „Unzählige Beispiele aus der betrieblichen Praxis belegen, dass Informationssysteme zwar meist technisch funktionieren, von den Anwendern jedoch nicht angenommen werden und deshalb bereits nach kurzer Zeit scheitern.“1 Die Anwenderakzeptanz bei einem Data-Warehouse ist neben verschiedenen anderen Aspekten besonders von der Datenqualität abhängig. Dabei ist nicht die objektive Datenqualität das ausschlaggebende Kriterium, sondern die subjektive Qualität, die der einzelne Benutzer den Daten zumisst.

Die Arbeit untersucht, welche Möglichkeiten es gibt, die Datenqualität aus Benutzersicht zu steigern. Eine besondere Stellung nehmen hier Metadaten ein, da sie Informationen enthalten, die es dem Benutzer ermöglichen, die vorhandenen Daten besser verstehen und einschätzen zu können. Es scheint möglich, die Datenqualität für den Endbenutzer dadurch zu steigern, dass man ihm Zugriff auf diese Metadaten verschafft, so dass er die Bedeutung der Daten besser einschätzen kann und ihnen auf Grund seiner genaueren Kenntnisse über Herkunft und Aggregation mehr Vertrauen schenkt.

Excerpt


Inhaltsverzeichnis

1 EINLEITUNG

2 GRUNDLAGEN UND DEFINITIONEN

2.1 DATA WAREHOUSES

2.2 METADATEN

2.2.1 Definition Metadaten

2.2.2 Arten von Metadaten

2.2.3 Einsatzzwecke von Metadaten

2.2.4 Metadatenspeicherung

2.2.5 Metadatenaustausch

2.3 QUALITÄT UND DATENQUALITÄT

2.3.1 Definition Datenqualität

2.3.2 Kriterien für Datenqualität

2.3.3 Datenqualität von Informationssystemen

2.3.4 Allgemeine Methoden zur Verbesserung von Datenqualität

3 QUALITÄT VON DATA-WAREHOUSES

3.1 QUALITÄTSKRITERIEN VON DATA-WAREHOUSES

3.2 RISIKEN FÜR DIE QUALITÄT VON DATA-WAREHOUSES

3.3 BEDEUTUNG VON METADATEN FÜR DATA-WAREHOUSE QUALITÄT

3.3.1 Bedeutung von Metadaten im Data-Warehouse

3.3.2 Speicherung und Verarbeitung der Metadaten im Data-Warehouse

3.4 KONZEPTE ZUR STEIGERUNG VON DATA-WAREHOUSE QUALITÄT

3.4.1 Doppelte Entwicklung - Stockhammer und Kennel

3.4.2 Qualitätssteigerung als Optimierungsproblem - Ballou / Tayi

3.4.3 CLIQ – Der Ansatz von Hinrichs

3.4.4 Terminologiemanagement – Der Ansatz von Lehmann / Jaszewski

3.4.5 Alles in einem – Der Ansatz des DWQ

4 UMSETZUNG DER KONZEPTE AM PRAKTISCHEN BEISPIEL

4.1 BESCHREIBUNG DER AUSGANGSSITUATION

4.2 BESCHREIBUNG DER UMSETZUNGSMAßNAHMEN

4.2.1 Metadata-Services – Das Repository

4.2.1.1 Aufbau der Metadata-Services

4.2.1.2 Füllen der Metadata-Services

4.2.2 Analysis Services – Der OLAP-Server

4.2.2.1 Metadaten in den Analysis Services

4.2.2.2 Analysis Manager als Anwendungsoberfläche

4.2.3 Arcplans inSight/dynaSight – Das Front-End

4.2.3.1 Zugriff auf das Data-Warehouse und die Metadaten

4.2.3.2 Implementierung von Metadaten

5 SCHLUSSBEURTEILUNG

5.1 BEURTEILUNG DER MAßNAHMEN

5.2 ZUKÜNFTIGER ENTWICKLUNGSBEDARF

Zielsetzung & Themen

Die Arbeit untersucht, wie die Datenqualität in Data-Warehouse-Systemen aus Benutzersicht durch den gezielten Einsatz und die Verwaltung von Metadaten gesteigert werden kann, um Anwendern ein besseres Verständnis und Vertrauen in die Daten zu ermöglichen.

  • Grundlagen von Data-Warehouses, Metadaten und Datenqualität
  • Qualitätsrisiken und Bedeutung von Metadaten in Data-Warehouse-Umgebungen
  • Analyse bestehender Forschungskonzepte zur Qualitätssteigerung
  • Praktische Umsetzung der Metadaten-Nutzung an einem Anwendungsbeispiel

Auszug aus dem Buch

3.4.1 Doppelte Entwicklung - Stockhammer und Kennel

Stockhammer und Kennel stellen einen Ansatz zur Aufdeckung von Fehlern in Data Warehouses dar. Ein solcher Ansatz trägt insofern zur Qualitätssteigerung bei, als das die Aufdeckung von Fehlern der erste und oftmals schwierigste Schritt ist, um Fehler zu beheben. Der Ansatz konzentriert sich in erster Linie auf den Entwicklungszeitraum, ist jedoch auch bei späteren Anpassungen und Wartungen einsetzbar.

Das Konzept sieht vor, dass für die Entwicklung des Data-Warehouse drei Teams gebildet werden; ein Team, das durch Entwickler besetzt wird, ein Team, das durch die Endanwender gebildet wird und ein Team, das sowohl durch fachliche als auch technische Experten besetzt wird. Die Aufgabe des dritten Teams ist die Vermittlung zwischen den beiden anderen Teams. Weiter ist dieses Team dafür verantwortlich Systemtest durchzuführen und zu organisieren. Als eigentliches Problem stellt sich nun die Frage, mit welchen Werten die Testergebnisse verglichen werden sollen. Eine individuelle Berechnung der einzelnen Ergebnisse ist oft zu komplex. Eine einfache Plausibilitätsprüfung deckt nur extreme Abweichungen auf; unauffällige Fehler bleiben unentdeckt. Als Lösung wird der Entwurf eines Testsystems vorgeschlagen. Ein solches System würde jedoch, wenn es durch die Entwickler des eigentlichen Data-Warehouse geschaffen würde, wahrscheinlich die gleichen Fehler wie das Data-Warehouse aufweisen.

Daher muss das Testsystem durch firmenexterne bzw. zumindest durch projektexterne Entwickler geschaffen werden. Da das Test-System als Prototyp entwickelt werden kann und auf viele aufwändige Aspekte, wie z. B. eine Benutzeroberfläche oder eine hohe Performance, verzichtet werden kann, ist es wesentlich einfacher und günstiger zu realisieren als das produktive Data-Warehouse-System. Die Ergebnisse des Testsystems können nun mit den Daten des produktiven Data-Warehouse verglichen werden. Wenn Abweichungen auftreten, ist zu klären, ob diese auf einem Fehler im Test-System, im produktiven System oder nur auf einem Rundungsfehler beruhen.

Zusammenfassung der Kapitel

1 EINLEITUNG: Darstellung der Bedeutung von Datenqualität für die Benutzerakzeptanz und Einführung in die Thematik der Metadaten zur Qualitätssteigerung.

2 GRUNDLAGEN UND DEFINITIONEN: Erläuterung der Grundbegriffe Data-Warehouse, Metadaten und Datenqualität sowie ihrer Zusammenhänge.

3 QUALITÄT VON DATA-WAREHOUSES: Analyse der qualitätskritischen Aspekte in Data-Warehouses und Vorstellung verschiedener Konzepte zur Steigerung der Datenqualität.

4 UMSETZUNG DER KONZEPTE AM PRAKTISCHEN BEISPIEL: Anwendung der theoretischen Ansätze zur Metadaten-Implementierung anhand eines Data-Warehouse der Philipps-Universität Marburg.

5 SCHLUSSBEURTEILUNG: Zusammenfassende Bewertung der durchgeführten Maßnahmen und Aufzeigen von weiterem Entwicklungsbedarf.

Schlüsselwörter

Data-Warehouse, Metadaten, Datenqualität, Informationsqualität, Datenherkunft, Repository, OLAP, ETL-Prozess, Qualitätsmanagement, Anwenderakzeptanz, Metadatenspeicherung, Metadatenaustausch, Unternehmensmodell, Datenmodellierung

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit analysiert, wie die Qualität von Daten in Data-Warehouse-Systemen verbessert werden kann, indem Anwendern durch den Einsatz von Metadaten ein tieferes Verständnis für Herkunft und Bedeutung der Daten vermittelt wird.

Was sind die zentralen Themenfelder?

Die zentralen Themen sind die Definition und Einordnung von Metadaten, die Messung und Sicherung der Datenqualität in Data-Warehouses sowie die praktische Implementierung dieser Ansätze.

Was ist das primäre Ziel der Untersuchung?

Das Hauptziel ist es, Möglichkeiten aufzuzeigen, wie die Datenqualität speziell aus Sicht des Endbenutzers durch besseren Zugriff auf Metadaten gesteigert werden kann.

Welche wissenschaftlichen Methoden werden verwendet?

Es werden Literaturanalysen bestehender Modelle und Ansätze zur Datenqualität durchgeführt, ergänzt durch eine Fallstudie, in der die praktische Umsetzbarkeit an einem konkreten Data-Warehouse-Beispiel getestet wird.

Was wird im Hauptteil behandelt?

Im Hauptteil werden zunächst theoretische Grundlagen gelegt, gefolgt von einer detaillierten Analyse verschiedener Forschungsansätze (z.B. Stockhammer/Kennel, DWQ, Hinrichs) zur Qualitätssteigerung und deren praktischer Erprobung.

Welche Schlüsselwörter charakterisieren die Arbeit?

Die Arbeit lässt sich durch Begriffe wie Data-Warehouse, Metadaten, Datenqualität, ETL-Prozess, Metadatenmanagement und Anwenderakzeptanz charakterisieren.

Wie unterscheidet sich der Ansatz des DWQ von anderen?

Das DWQ-Projekt verfolgt einen sehr umfassenden Ansatz, der den aus dem Software-Qualitätsmanagement bekannten Goal-Question-Metric-Ansatz direkt auf Data-Warehouses überträgt und Messgrößen für Qualitätsziele definiert.

Warum ist die praktische Umsetzung bei der Philipps-Universität Marburg relevant?

Sie dient als reales Praxisbeispiel, um zu demonstrieren, wie bestehende Microsoft-Werkzeuge (SQL-Server, Analysis Services, dynaSight) zur Metadatenverwaltung genutzt werden können und auf welche technischen Hürden man dabei in der Realität stößt.

Excerpt out of 79 pages  - scroll top

Details

Title
Metadaten und Datenqualität in Data Warehouses
College
University of Marburg  (Institut für Wirtschaftsinformatik)
Grade
2,0
Author
Andreas Huthmann (Author)
Publication Year
2003
Pages
79
Catalog Number
V21064
ISBN (eBook)
9783638247702
ISBN (Book)
9783638700979
Language
German
Tags
Metadaten Datenqualität Data Warehouses
Product Safety
GRIN Publishing GmbH
Quote paper
Andreas Huthmann (Author), 2003, Metadaten und Datenqualität in Data Warehouses, Munich, GRIN Verlag, https://www.grin.com/document/21064
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  79  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint