Innerhalb dieser wissenschaftlichen Arbeit sollen alle wesentlichen Aspekte der Architektur eines Data Warehouse Systems betrachtet werden.

Zu Beginn und zum gemeinsamen Verständnis werden daher zuerst die grundlegenden Begrifflichkeiten weiter definiert und beschrieben.Daraufhin wird der Grundstein gelegt und es werden zuerst die wesentlichen Anforderungen an die Architektur eines Data Warehouse Systems beschrieben, um dann eine Referenzarchitektur mit der Beschreibung seiner wichtigsten Architekturkomponenten vorzunehmen. Während an dieser Stelle eine funktionsorientierte Beschreibung der Komponenten vorgesehen wird, steht anschließend die Dynamik der Komponenten und deren Zusammenspiel im sogenannten Data Warehouse Prozess im Vordergrund. Die zuvor erarbeiteten Grundlagen bilden nun im Folgenden die Basis für einen Transfer der Theorie in die Praxis. Hier soll an einem selbstgewählten fiktiven Unternehmen die beschriebene Architektur mit seinen Komponenten praxisnah erprobt werden. Letztendlich rundet eine kritische Betrachtung und ein Fazit die wissenschaftliche Arbeit ab. Aufgrund der Komplexität und des Umfangs des Themenbereiches soll der Fokus primär auf der Architektur eines Data Warehouse Systems liegen.

Der enorme Zuwachs an Daten unterstützt den Bedarf einer strukturierten Datenspeicherung, Datenverarbeitung und vor allem Datenanalyse. In jedem Unternehmen werden Personaldaten eingegeben oder Daten zu Verkäufen erfasst. Die Verarbeitung und Verwaltung dieser Daten geschieht aber im Großteil autonom in Verantwortung des jeweiligen Bereiches / Abteilung. Schwierig wird es nun, wenn Entscheidungen getroffen werden müssen, die mehrere Unternehmensbereiche gleichzeitig tangieren und dadurch aus diesen betroffenen Bereichen unterschiedlich gespeicherte Daten herangezogen werden müssen. Es wird daher eine Plattform benötigt, welche die bestehenden Daten unterschiedlicher Quellen integriert und durch eine integrierte Sicht auf beliebige Daten Analysezwecke ermöglicht. Das Data Warehouse.

Excerpt

Inhaltsverzeichnis

1. Einleitung

1.1 Relevanz des Themas

1.2 Zielsetzung der Arbeit

2. Begriffliche und inhaltliche Einordnung

2.1 Data Warehouse

2.2 Data Warehouse System

2.3 Data Warehousing

2.4 Architektur

2.5 Differenzierung operativer und informativer Systeme

3. Aufbau und Architektur eines Data Warehouse Systems

3.1 Anforderungen

3.2 Referenzarchitektur

3.3 Beschreibung der einzelnen Ebenen und Komponenten

3.3.1 Datenquellen

3.3.2 Datenbeschaffungsebene

3.3.3 Datenhaltungs- und Datensteuerungsebene

3.3.4 Datenbereitstellungsebene

3.3.5 Analyseebene

3.4 Verteilung des Data Warehouse

3.4.1 Data Marts

4. Phasen des Data Warehouse Prozess

4.1 Monitoring

4.2 Extraktionsphase

4.3 Transformationsphase

4.4 Ladephase

4.5 Analysephase

5. Praxisbeispiel Data Warehouse Architektur

5.1 Steckbrief

5.2 Anforderungen und Motivation

5.3 Architekturmodell

6. Fazit und kritische Betrachtung

Zielsetzung & Themen

Die vorliegende Arbeit verfolgt das Ziel, die wesentlichen Aspekte der Architektur eines Data Warehouse Systems wissenschaftlich zu betrachten und deren Zusammenspiel anhand eines fiktiven Praxisbeispiels zu veranschaulichen. Dabei liegt der Fokus primär auf dem strukturellen Aufbau sowie den dynamischen Prozessen der Datenintegration und -bereitstellung zur Unterstützung betriebswirtschaftlicher Entscheidungsprozesse.

Grundlagen der Architektur von Data Warehouse Systemen
Differenzierung zwischen operativen und informativen Datenbanksystemen
Anforderungen an eine robuste Data Warehouse Architektur
Prozessschritte des Data Warehousing (Monitoring, Extraktion, Transformation, Laden, Analyse)
Anwendung des Referenzmodells in einem praxisnahen Szenario

Auszug aus dem Buch

3.3.1 Datenquellen

Die Betrachtung eines Data Warehouse Systems geht von seinen Datenquellen aus. Diese sind allerdings selbst kein Bestandteil des Data Warehouse Systems. Dennoch stellen die Datenquellen den Ausgangspunkt und die elementare Grundlage für jedes Data Warehouse System dar. Die zu integrierenden, meist sehr heterogenen Datenquellen können entweder aus operativen Systemen, externen Quellen oder sonstigen Datenquellen (z.B. Flat Files, Tabellenkalkulationsprogramme, Batchdaten, etc.) stammen. Der Auswahl geeigneter Datenquellen kommt eine ganz besondere Bedeutung zu, da das resultierende Analyseergebnis eines jeden Data Warehouse nur so gut wie die Beschaffenheit der Quelldaten sein kann (vgl. WREMBEL, KONCILIA 2007, S. 77ff; FAKRISCH 2011, S. 58). Bei der Auswahl der Datenquellen sollte daher der Fokus auf nachfolgende Faktoren gelegt werden (vgl. BAUER, GÜNZEL 2009, S. 41ff):

1. Zweck des Data Warehouse Systems: Die Auswahl der Datenquellen ist unmittelbar von dem angestrebten Verwendungszweck des Data Warehouse Systems abhängig. So kann beispielsweise die einmalige Aufstellung aller wichtigen betriebswirtschaftlichen Kennzahlen, aufgrund der Bewertung für den Börsengang eines Unternehmens, nicht als Datenquellen für ein Data Warehouse im Controlling genutzt werden. Grund hierfür ist, dass die Aufstellung nicht fortgeschrieben wurde, wäre dies der Fall, könnte diese Quelle auch als Datenquelle für oben genanntes Beispiel dienen.

2. Qualität der Quelldaten: Alle Datenquellen sollten die wohldefinierte Datenqualität bereitstellen können. Hierbei kann es zu massiven Qualitätsmängel kommen, welche sich in unterschiedlichen Bereichen widerspiegeln können:

Inkorrekte Daten (z.B. durch Fehleingabe)

Uneinheitliche/Widersprüchliche Daten

Duplikate und Redundanzen im Datenbestand

Unvollständige Daten

Inkonsistente Daten

Zusammenfassung der Kapitel

1. Einleitung: Dieses Kapitel erläutert die Relevanz von Informationen als Produktionsfaktor und definiert die Zielsetzung der Arbeit, die sich auf die Architektur von Data Warehouse Systemen konzentriert.

2. Begriffliche und inhaltliche Einordnung: Hier werden grundlegende Definitionen wie Data Warehouse, Data Warehouse System und Data Warehousing eingeführt sowie die Unterschiede zwischen operativen und informativen Systemen dargestellt.

3. Aufbau und Architektur eines Data Warehouse Systems: Dieses Kapitel behandelt die Anforderungen an eine Data Warehouse Architektur sowie eine Referenzarchitektur mit detaillierter Beschreibung der verschiedenen Ebenen und Komponenten.

4. Phasen des Data Warehouse Prozess: Der Fokus liegt hier auf der dynamischen Sicht des Systems und den einzelnen Prozessschritten, von der Datenüberwachung bis zur Analyse.

5. Praxisbeispiel Data Warehouse Architektur: Die theoretischen Ansätze werden hier auf ein fiktives Unternehmen übertragen, um die Implementierung und das Zusammenspiel der Komponenten praxisnah zu verdeutlichen.

6. Fazit und kritische Betrachtung: Abschließend wird die Bedeutung der Architektur betont und die Wichtigkeit einer anwenderorientierten Planung unterstrichen.

Schlüsselwörter

Data Warehouse, Architektur, Datenbeschaffung, Referenzarchitektur, ETL, OLAP, Datenqualität, Data Marts, Datenbankmanagement, Wirtschaftsinformatik, Datenintegration, Entscheidungsunterstützung, Datenquellen, Repositorium, Transformationsphase

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit behandelt die Architektur von Data Warehouse Systemen, deren strukturelle Komponenten und die dynamischen Prozesse, die für eine effiziente Datenanalyse in Unternehmen erforderlich sind.

Welche zentralen Themenfelder werden abgedeckt?

Zentrale Themen sind die Einordnung von Begriffen des Datenbankmanagements, der Aufbau einer Referenzarchitektur, die Beschreibung von Prozessphasen wie ETL sowie die praktische Umsetzung an einem Fallbeispiel.

Was ist das primäre Ziel der Untersuchung?

Das Ziel ist eine umfassende, wissenschaftliche Betrachtung der Architektur von Data Warehouse Systemen und deren praktische Anwendbarkeit zur Unterstützung von Entscheidungsprozessen.

Welche wissenschaftliche Methode kommt zum Einsatz?

Die Arbeit nutzt eine literaturbasierte Analyse zur Definition der Grundlagen und Referenzmodelle, ergänzt durch eine modellhafte Übertragung der Theorie auf ein fiktives Praxisbeispiel (Kaufwelt Kaiser AG).

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil gliedert sich in die theoretische Architektur- und Prozessbeschreibung (Kapitel 3 und 4) sowie deren praktische Anwendung im Unternehmenskontext (Kapitel 5).

Welche Schlüsselbegriffe charakterisieren die Arbeit?

Kernbegriffe sind Data Warehouse Architektur, ETL-Prozesse, Datenintegration, Datenqualität und Entscheidungsunterstützung.

Warum ist die Architektur für Data Warehouse Systeme so entscheidend?

Die Architektur bildet das Fundament für die Funktionalität und Effizienz des Systems; sie bestimmt, wie Daten aus heterogenen Quellen integriert, bereinigt und für Analysen bereitgestellt werden.

Welche Rolle spielen Data Marts in diesem Modell?

Data Marts dienen der regions- oder abteilungsspezifischen Aggregation von Daten, um die Performance des Gesamtsystems zu erhöhen und spezifische Analyseanforderungen effizienter zu bedienen.

Excerpt out of 29 pages - scroll top

Details

Title: Architektur eines Data Warehouse (Datenbankmanagement)
Subtitle: Architekturkomponenten von Data Warehouse Systemen und deren Zusammenspiel
College: University of Applied Sciences Essen (Wirtschaftsinformatik)
Course: Datenbanken, Datenbankmanagement, Data Warehouse
Grade: 1,0
Author: Dennis Schindeldecker (Author)
Publication Year: 2013
Pages: 29
Catalog Number: V426793
ISBN (eBook): 9783668721838
ISBN (Book): 9783668721845
Language: German
Tags: ETL Data Data Warehouse Architektur Datenbank multidimensionale OLTP Business Analytics OLAP Analytisch Datenquelle Datenanalyse Data Mart Extraktion Transformation Praxisbeispiel
Product Safety: GRIN Publishing GmbH

Quote paper: Dennis Schindeldecker (Author), 2013, Architektur eines Data Warehouse (Datenbankmanagement), Munich, GRIN Verlag, https://www.grin.com/document/426793

Architektur eines Data Warehouse (Datenbankmanagement)

Architekturkomponenten von Data Warehouse Systemen und deren Zusammenspiel