Data Warehouse. Definitionen, Architektur und Funktionen


Forschungsarbeit, 2013

28 Seiten, Note: 1,7


Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Abkürzungsverzeichnis

1. Einleitung

2. Grundlagen des Data Warehouses
2.1 Management Support Systeme
2.2 Daten, Information und Wissen
2.3 Data Warehouse - Konzept
2.3.1Definition und Einordnung
2.3.2 Anforderungen an ein Data-Warehouse-System
2.4 Architektur eines Data Warehouse
2.5 Phasen des ETL-Prozess
2.6 On-Line Analytical Processing (OLAP)
2.6.1 Definition OLAP
2.6.2 OLAP Architektur und Anforderung an System
2.6.3 Einsatzbereiche für OLAP-Systeme
2.7 Data Mining
2.7.1 Konzept und Definition Data Mining

3.Betriebswirtschaftliche Bedeutung von Data Warehouse
3.1 Einsatzbereiche von Data Warehouse
3.2 Wirtschaftlichkeitsüberlegungen beim Aufbau und Einsatz
3.3 Strategische Bedeutung: Vorteile und Nachteile
3.4.Sicherheitsziele bei der Nutzung von Data Warehouse Systemen

4.Zusammenfassung und Ausblick

Literaturverzeichnis

Abbildungsverzeichnis

Abb. 1: Management Support Systeme in der Systempyramide

Abb. 2: Daten, Information und Wissen

Abb. 3: Vernetzungs- und Verstehensmodell von Ackoff

Abb. 4: Architektur des Data Warehouse

Abb. 5: ETL-Prozess

Abb. 6: Idealtypische Architektur von OLAP-Systemen

Abb. 7: Einsatz von OLAP Systemen nach Funktionsbereich

Abb. 8: R-OLAP, M-OLAP, H-OLAP

Abb. 9: Der Prozess der Knowledge Discovery in Database

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1.Einleitung

Heutzutage werden die Business Analyse Technologien in der ganzen Welt als einer der viel versprechenden Bereiche des IT-Marktes betrachtet. Die Entwicklung von analytischen Systemen sind in allen Geschäftsprozessen integriert die ein direkten oder indirekten Einfluss auf die Leistung des Unternehmens haben, stärkt Wettbewerbsvorteile des Business auf dem schnell wachsenden Markt.

Die wichtigste Rolle, in der Führung des Unternehmens als Ganzes und die Durchführung von einzelnen Aufgaben, spielt Information. Steigendes Interesse an analytischen IT-Systemen bedingt durch wachsende Anforderungen der modernen Geschäftswelt an Unternehmen. Insbesondere die Erhöhung der online Geschäfte, die Globalisierung, und Outsourcing des Geschäfts und Abhängigkeit von vielen anderen schnell verändernden Faktoren.

Ein informations-analytisches System muss komplexe und vielfältige Funktionen durchführen können z.B. Extraktion von Daten aus verschiedenen Quellen, Koordination von extrahierten Daten, Transformieren, Speichern analytischer Informati o- nen, Unterstützung für Ad-hoc-Abfragen, multidimensionale Analyse etc. Normale Datenbanken helfen den Benutzern tägliche Aktivitäten auszuführen, während ein Data Warehouse für die langfristige Entscheidungsunterstützung entwickelt wurde. Der Anwender kann Grafiken und Diagramme erstellen sowie Übersichtstabellen auf der Basis der Daten. Darüber hinaus einfache Bearbeitung von Diagrammen, Graphiken und Tabellen in geeignete Darstellungsweise.

In der vorliegende Belegarbeit wird die Definition von Data Warehouse näher be- trachtet, sowie ihrer Architektur und Funktionen, die Grundphasen des Data Wa- rehauses.

2. Grundlagen des Data Warehousing

2.1 Management Support Systeme

Am Anfang der 80er Jahre entstanden erste Analysesysteme die auf operativen D a- tenbanken zugreifen könnten. Die Nachteile bestanden darin dass sie unflexible wa- ren, die Abfragen langsam durchgeführt wurden und das Ausführen dieser wurde durch Mehrbenutzerfähigkeit verzögert. Diese ersten Systeme wurden als „Manage- ment Information Systems" (MIS) oder "Executive Information Systems" (EIS)“ be- zeichnet .1

Die Information für die Verwendung in einem analytischen System lässt sich in drei Arten unterscheidet und zwar aus entscheidungsorientierte, daten- und informationsorientierte Sicht.2 Die Abgrenzungen ist in der Abb. 1 dargestellt.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1 Management Support Systeme in der Systempyramide3

Als Basis dienen Management-Informationssysteme (englisch Management Informa- tion Systems, MIS), das sind berichtsorientierte Analysesysteme. Sie verwenden sei- nerseits operative, interne Daten für den Planungs-, Steuerungs- und Kontrollpha- sen der operativen Wertschöpfungskette. MIS erlauben den Managern auf allen Hie- rarchieebenen detaillierte Information aus operativen Datenbanken zu extrahieren. 4 Entscheidungsunterstützungssysteme (englisch Decision Support Systems, DSS) sind wiederum spezifisch für jedes Unternehmen, sind in alle Bereiche integriert. DSS sind interaktive, dynamische Systeme, welche funktional nur eine Teilaufgabe bzw. eine Aufgabenklasse ausführen können. Analysen und Problemlösungen können von Endbenutzer auf der Basis einer existierenden eigenständig entwickelten Methode ausgeführt werden.5 DDS dienen zur Unterstützung von Planungs- und Entscheidungsprozessen. Die Manager verwenden DDS in einer komplexen Entscheidungssituation bei der Lösung einer Teilaufgabe.6

Führungsinformationssysteme (englisch Executive Information Systems, EIS) sind vor allem auf die oberen Führungsebenen ausgerichtet. Sie sind einfach in der Verwendung und bieten intuitiv benutzbarem und individuell anpassbarem Interface. Sie ermöglichen den Fach- und Führungskräften auch ohne tiefe EDV Kenntnisse Informationsanalyse und Berichtswesen durchzuführen und die Ergebnisse mit Hilfe von neuartigen Präsentationsmöglichkeiten darzustellen.7

Alle drei Systemkategorien gehören auch zu den Management Support Systemen (englisch Management Support Systems, MSS). Das Ziel des System ist, jedem Bereich eines Unternehmens die hochwertige Information zum Zweck der Analyse und zur Unterstützung von Entscheidungen zu liefern.8 MSS dient zur Unterstützung alle unternehmerischen Aufgaben durch den Einsatz von Datenverarbeitungs-, Informations - und Kommunikationstechnologien. Sie bieten eine individuelle und konzeptuelle Lösungen zur Steuerung, Planung und Kontrolle alle Geschäftsprozesse innerhalb von Unternehmen dank moderne Informationstechnologie.9

Die Faktoren die den tatsächlichen Wert der gewonnen Information beeinflussen können sind folgende10:

- Entscheidungsrelevanz: der Entscheidungsträger soll zu jedem Zeitpunkt die relevanten Daten als Informationsgrundlage erhalten
- Zeitliche Relevanz: die inhaltliche Aktualität ist für einen Entscheidungsträger maßgeblich , Information mit hoher Qualität spielen eine große Rolle
- Informationsgehalt: je mehr zuverlässige Informationen , je mehr sie der Reali- tät entspricht desto mehr Aussagekraft hat sie für den Entscheidungsträger
- Informationsaufbereitung: Durch Integration, Aggregation und Strukturierung liefern die Daten dem Entscheidungsträger die Information die er aus dem operationalen Datenquellen so nicht erhalten kann .Die Grundhypothese der Entscheidungstheorie besagt: Die Qualität der Entscheidungen steigt mit der Höhe des Wissenstands.

2.2 Daten , Information und Wissen

Die Daten in einem Unternehmen werden in einer integrierten Form gespeichert. Ein Anwendungssystem bzw. ein Benutzer bekommt Information in Datenform und aktualisiert gleichzeitig gespeicherte Daten. Datenorganisation und Datenintegration sind in diesem Fall mit einander verbunden. Die zentrale Datenintegration hat seine Vorteile im Gegensatz zu isolierten und mehrfachen Datenspeicherung:

- Minimierung der Datenerfassungsaufwand
- Verringerung von Datensfluktualität
- Verbesserung der Datenintegrität
- Optimierung von Arbeitsabläufen
- Erfüllung der Voraussetzungen für eine Prozessintegration
- verbesserte Informationsbereitstellung für den Entscheidungsträger11

Um alle diese Ziele umzusetzen müssen bestimmte technische Voraussetzungen erfüllt werden. Die Erfassung der Daten an den Datenquellen, dabei sind Vollautomatisierung und Frühzeitigkeit von Bedeutung, sowie Unterstützung des Datenflusses über geeignete Rechnernetze. Der Nachteile besteht darin, dass die Eingabe des falsches Datums führt zu Falschen Ergebnissen und aufgrund dessen wird viel Zeit investiert um alle Eingaben nachzuprüfen und zu korrigieren.12

Folgende Abbildung zeigt die Relationsgrad zwischen den Daten, Information und Wissen:

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2 Daten, Information und Wissen13

Um die Struktur zu verstehen, müssen folgende Definiitionen näher betrachtet wer- den:

Definition Wissen: Ist für Daten bekannt, was sie beschreiben oder welche Eigenschaften eines Objekts sie repräsentieren, ist also eine semantische Struktur gegeben, spricht man von Wissen.

Definition Information: Information ist die Teilmenge von Wissen, die von jemandem in einer konkreten Situation zur Lösung von Problemen benötigt wird.“14 Die Begriffe Daten, Information und Wissen haben sehr unterschiedliche Bedeutung, da der Sinn der hinter den Begriffen steckt kann ganz anderes sein. In der Wis- senshierarchie wird die Weisheit zu den drei anderen Begriffen hinzugefügt. Die nächste höhere Stufe von den einzelnen Ebenen wird erreicht durch die Steigerung des Vernetzungsgrades und dem Verstehen. Die Daten bilden dabei die unterste Schicht. Die Informationen wird genutzt, um die einfachste Fragen wie „wer“, „was“, „wo“ und „wann“ auf der Basis der Daten zu beantworten. Wissen gibt auf Grundlage von Daten und Informationen eine Beschreibung für einen Sachverhalt. Daten wer- den hier über Information in einer bestimmten Form gebracht. Dieser dreistufige Prozess kann auch als Lernen verstanden werden. Die Verarbeitung, Übertragung, Strukturierung und Erfassung des Wissens sind komplex. Die ersten drei Schritte beziehen sich auf die Vergangenheit, und nur die letzte, die Weisheit, erlaubt uns eine Sicht in die Zukunft..15 Der Zusammenhang zwischen Vernetzungsgrad und Verständnis wird in der Abb. 2 dargestellt:

Abbildung in dieser Leseprobe nicht enthalten

Abb. 3 Vernetzungs- und Verstehensmodell von Ackoff16

Zusammengefasst: je höher der Grad der Informationen, die in den Entscheidungs- prozess einbezogen wird, desto mehr begründete Entscheidung getroffen werden kann. Die Informationen, die als Grundlage für eine Entscheidung dienen müssen über folgende Eigenschaften verfügen und zwar: Richtigkeit, Vollständigkeit, Konsistenz und Aktualität. Daher der Aufbau eines Data Warehouses bezieht sich auf die Frage: Was für eine Information muss als Basis sein?

Wissen die sich aus der Information ergeben werden für folgende Prozesse innerhalb von Unternehmen verwendet: erstens Im Laufe des Geschäftsprozess. „ Geschäfts- prozess ist die Bereitstellung eines die Daten des Unternehmens integrierenden Sys- tems (DWH, ODS).“17 Man kann es als Entwicklungsprozess darstellen, der aus der Analyse, Entwurf, Implementation, Test und Verteilungsphasen besteht. Bei den Un- terstützungsprozessen, über spricht man von allen Maßnahmen, die der Geschäfts- prozess beschleunigen können. Vor allem, aller die Beiträge, die zur Kostenredukti- on bei der Integration und Evaluation führen. Und bei den Managementprozessen die Erreichung strategischer Ziele im Geschäftsprozess gewährleisten.18

2.3 Data Warehouse-Konzept

Der Schwerpunkt aller Data Warehouse Systeme und Business Intelligence Systeme liegt an der Informationsbereitstellung. Unternehmensübergreifende Datenhaltung ermöglicht die Sammlung, Konsolidierung, Verdichtung und Selektion der Information die für den Entscheidungsträger relevant sein kann.19

Ein Data Warehouse-Konzept fordert den Aufbau einer Datenbank. Die entschei- dungsrelevanten Inhalte der Datenbank dienen zur Unterstützung selbständigen Auf- gaben und zukunftsorientierten Geschäftsprozessen. Die Datenbank soll alle Infor- mationsbedürfnisse der Anwendungsgruppen abdecken. Der Anwender hat Zugriff auf alle Informationsarten innerhalb der Unternehmung, unabhängig davon wo die Daten ursprünglich abgespeichert wurden und in welcher Form. Entscheidend bei der Implementierung eines Data Warehouse System dass die Daten sowohl unter- schiedlichen externen Datenquellen (Nachrichten, Internet, Online-Dienste) als auch internen betrieblichen Bereichen (Einkauf, Vertrieb, Finanzen etc.) stammen. Die gesammelte Information wird laut Data Warehouse Konzept erst aufbereitet. Das heißt DWH hat keinen direkter Zugriff auf operationalen Originaldaten. Es operiert mit selektierten Daten.20

Das Ziel des Einsatzes eines Data Warehouse ist es, aus den operativen Datenquellen des Unternehmens und externen Datenquellen,“ Informationen zu extrahi eren und in geeigneter Form bereitzustellen, die für eine individuelle Entscheidungs- findung erforderlich sind.“21 Genauer gesagt :„ die Informationsversorgung im Unternehmen zu verbessern.“22

2.3.1 Definition und Einordnung

Unter dem Begriff Data Warehouse System versteht „ die Anwendungen zur Zusam- menführung und Haltung von personalwirtschaftlichen (und weiteren) Daten aus ver- schiedenen anderen Quellsystemen für Zwecke der Informationsversorgung und Entscheidungsunterstützung des Personalmanagements (sowie weiterer Berei- che).“23 Im Data Warehouse-Systeme sind Daten für Business Intelligence Systeme (BI), d.h. Online Analytical Processing-Systeme und Data Mining-Systeme speziell gespeichert.24 Besonders wichtig das Data Warehouse gewährleistet „eine integrier- te, strukturierte und historische Sammlung aller in einem Unternehmen oder Unter- nehmensbereich vorhandenen Daten“.25 Alle interne und externe Daten fließen in diesen Datenpool ein. Im DWH werden die Daten konsolidiert, verdichtet und analy- siert. Die Kenntnisse und Erfahrungen der Mitarbeiter zählt auch hierzu.26

Trotz unterschiedlichen Definitionen gibt es Eigenschaften die für alle Data Warehouse Systemen relevant sind27:

- Ein Data Warehouse erlaubt den Mitarbeitern eine globale Sicht auf Datenbe- stände
- Der Inhalt des Data Warehouse entsteht durch Kopieren, Aufbereiten und Analyse von Daten aus unterschiedlichen externen und internen Quellen
- Ein Data Warehouse liefert die Daten für die Berechnung der betrieblichen Kennzahlen und Durchführung der Analysen innerhalb mehrdimensionaler Matrizen
- Ein DWH stellt ein Ausgangsbasis für Data Mining dar

Um ein Struktur des Data Warenhauses nachzuvollziehen lass uns auf den folgenden Begriffen eingehen:

„Datenbank: Als Datenbank bezeichnet man eine Sammlung logisch zusammengehörender Dateien, die auf einem geeigneten Trägermedium gespeichert sind. Datenbanksystem: Ein Datenbanksystem besteht aus einer Datenbank und den zugehörigen Routinen zu ihrer Verwaltung, dem sog. Datenbankmanagementsystem. Data Warehouse: Ein Data Warehouse ist ein komplexes Datenbanksystem, dessen Datenbank mit Daten aus unterschiedlichen unternehmensinternen und -externen Datenbanken gespeist wird und das Daten archiviert und zudem über verschiedene Werkzeuge zur Datenaufbereitung verfüg“.28

Man kann zusammenschließen: ein Datenbank bildet der Fundament für einen Da- tenbanksystem, das wiederrum der Grundlage für einen Data Warehouse System dient. Also Data Warehouse Systeme sind strukturiert. Die behalten einfache Daten- banken, die als Datenquellen für Datenverarbeitung dienen. Die elementare Daten, die im Data Warehouse vorhanden, können in sehr unterschiedlichen Formen darge- stellt werden. Data Warehouse Systeme sind außerordentlich groß, da die operative

und integrierte Daten beinhalten. Diese Eigenschaften sind allgemein für alle Data Warehouse Systeme.

2.3.2 Anforderungen an ein Data-Warehouse-System

Die wichtigsten Anforderungen an ein Data-Warehouse-System sind folgende29:

- Das operative System ( Datenquellen ) und Analysesystem (Data WarehouseSystem) sind unabhängig voneinander. Dank Schnittstellen zwischen Datenquellen und Data-Datawarehouse werden die Daten an das Data-Warehouse- System geliefert. Diese Unabhängigkeit betrifft nur die laufende Änderung in den Datenlieferantensystemen. Die Analyse und Auswertung soll unabhängig von den Datenlieferantensystemen sein
- Durch ein Data-Warehouse-System wird eine dauerhafte Datenhaltung ermöglicht. Die Daten sind nicht nur konsolidiert, strukturiert und abgeleitet sondern auch sinngemäß eindeutig.
- Ein Data-Warehouse-System dient zur Unterstützung vieler individueller Sichten bezüglich der Struktur der Daten und Zeithorizonte
- Die Daten eines Data-Warehouse-Systems müssen oft verwendet werden können und dauerhaft verfügbar sein
- Auswertungsszenarien und Analyseverfahren innerhalb von Unternehmen werden mit DWH unterstützt. Ein DWH stellt hierfür auch geeignete Werkzeuge zur Verfügung
- Ein Data-Warehouse-System dient zur Erweiterung der Geschäftsprozesse innerhalb des Unternehmens durch Integration von neuen Datenquellen, Erstellung von neuen Reporten und Berichten
- Alle Prozesse und Abläufe innerhalb eines Data-Warehouse-Systems sollen automatisiert sein, beispielsweise eine automatisierte Report- und Berichtstel- lung

2.4 Architektur eines Data Warehouse

Ein Data Warehouse System ermöglicht eine multidimensionale Analyse der Daten innerhalb der Unternehmensbereiche. Die Information ist häufig nicht in den Quell- systemen vorhanden, deshalb werden die Daten aus unterschiedlichen Quellen ge- sammelt und fehlende Information vervollständigt. Data Warehouse Technologien, eröffnen die Möglichkeiten der Gewinnung und Weiternutzung von Informationen. Aus dem gesammelten Wissen und Kenntnissen können benötigte Information ex- trahiert und weiter verwendet werden. Ein Data Warehouse System verbessert dadurch die Bereitstellung der Information für die Entscheidungsträger (Fach- und Führungskraft) in qualitativer, quantitativer und zeitlicher Form.30

Bei der Entwickelung eines Data Warehouse sind folgende Merkmale zu beachten:

- Fachorientirung - DWH modelliert ein spezifisches Anwendungsziel

[...]


1 Vgl.Datenbanken für Wirtschaftsinformatiker, S. Cordts, et al., 2011,s. 406

2 Vgl. Betriebswirtschaftliche Analyse auf operationalen Daten, P. Schmidt-Volkmar, 2008, S. 6

3 Datawarehousing & Data Mining, Gabriel, 2009

4 Vgl. Betriebswirtschaftliche Analyse auf operationalen Daten, P. Schmidt -Volkmar, 2008, S. 6

5 Vgl.Betriebswirtschaftliche Analyse auf operationalen Daten, P. Schmidt-Volkmar, 2008, S. 5-6

6 Datawarehousein & Data Mining, Gabriel, 2009 , S.25

7 Vgl. Betriebswirtschaftliche Analyse auf operationalen Daten, P. Schmidt -Volkmar, 2008, S. 6

8 Vgl. Betriebswirtschaftliche Analyse auf operationalen Daten, P. Schmidt-Volkmar, 2008, S. 6

9 DWH & Data Mining,R. Gabriel, 2009, S.19

10 Betriebswirtschaftliche Analyse auf operationalen Daten, Pascal Schmidt-Volkmar,2008, S. 6

11 Vgl.Grundzüge der Wirtschaftsinformatik, Mertens P.et al., 2012, s. 37

12 Vgl. Grundzüge der Wirtschaftsinformatik,Mertens P. et al.,2012, S.37

13 Risiko-Assessments für Datenqualität, H. Harrach, 2010 S. 11-12

Definition Daten: Als Daten werden demnach Einträge bezeichnet, deren Typ oder syntaktische Struktur bekannt ist. Das kann z.B. eine Bitfolge sein, die als Liste von Integerzahlen zu interpretieren ist, oder ein Record aus verschiedenen Datentypen.

14 Risiko-Assessments für Datenqualität, H.Harrach, 2010,S. 11-12

15 Vgl.Betriebswirtschaftliche Analyse auf operationalen Daten, Pascal Schmidt-Volkmar,2008, S. 7-8

16 In Anlehnung: Betriebswirtschaftliche Analyse auf operationalen Daten, Pascal Schmidt-Volkmar,2008, S.7 8

17 Active Enterprise Intelligence™, J. Töpfer, et.al., 2008, S.184

18 Vgl.Active Enterprise Intelligence™, J. Töpfer, et.al., 2008, S.184

19 Vgl. Management Support Systeme und Business Intelligence, Peter Gluchowski et al., 2008, s. 117

20 Vgl.Management Support Systeme und Business Intelligence, Peter Gluchowski et al., 2008, S. 118

21 Grundkurs Geschäftsprozess-Management, A. Gadatsch, 2013,S. 282

22 Grundkurs Geschäftsprozess-Management, A. Gadatsch, 2013,S. 282

23 Informationssysteme im Personalmanagement, S. Strohmeier, 2008, S.69

24 Vgl. Informationssysteme im Personalmanagement, S. Strohmeier, 2008, S.69

25 http://www.4managers.de/management/themen/data -warehouse/ , Stand 28.04.2013

26 Vgl. http://www.4managers.de/management/themen/ data -warehouse/, Stand 28.04.2013

27 Vgl.Betriebswirtschaftliche Analyse auf operationalen Daten, P.Schmidt-Volkmar, 2008,S. 52-53

28 Grundzüge der Wirtschaftsinformatik, Mertens P., et al., 2012, S. 40

29 Vgl.Data-Warehouse-Systeme kompakt ,K.Farkisch, 2011,S. 56

30 Vgl. Betriebswirtschaftliche Analyse auf operationalen Daten, P. Schmidt-Volkmar,2008, S. 12

Ende der Leseprobe aus 28 Seiten

Details

Titel
Data Warehouse. Definitionen, Architektur und Funktionen
Hochschule
Technische Hochschule Wildau, ehem. Technische Fachhochschule Wildau
Note
1,7
Autoren
Jahr
2013
Seiten
28
Katalognummer
V274453
ISBN (eBook)
9783656674399
ISBN (Buch)
9783656674382
Dateigröße
1449 KB
Sprache
Deutsch
Schlagworte
data, warehouse
Arbeit zitieren
Zhandos Amantayev (Autor)Maria Belyakova (Autor), 2013, Data Warehouse. Definitionen, Architektur und Funktionen, München, GRIN Verlag, https://www.grin.com/document/274453

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Data Warehouse. Definitionen, Architektur und Funktionen



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden