Leseprobe
Inhaltsverzeichnis
Abkürzungsverzeichnis
Abbildungsverzeichnis
1 Einleitung
2 Data Warehouse und Komponenten
2.1 ERP Systeme
2.2 Data Warehouse
2.3 Data Mart
3 Business Intelligence
3.1 Data Mining
3.2 OLAP
4 Denormalisierung von Tabellen - Voraussetzung für Abfragen
5 ETL-Prozess
6 SAP Business Information Warehouse
6.1 Die Firma SAP
6.2 SAP Business Suite 7 und Ablösung durch SAP HANA
6.3 SAP NetWeaver
6.4 Werkzeuge des SAP BW
6.5 Schichten des SAP BW
6.5.1 Datenschicht
6.5.2 Administrationsschicht
6.5.3 Analyseschicht
6.6 SAP Business Explorer
6.7 SAP BW on HANA
7 Fazit
8 Literaturverzeichnis
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Abbildungsverzeichnis
Abbildung 1 Datenbankbeispiel in 3. Normalform
Abbildung 2 Denormalisiert - Starschema mit Faktenund Dimensionstabellen
Abbildung 3: Beispiel Galaxy Schema
Abbildung 4 Umsatz von SAP weltweit in den Jahren von 2001 bis 2016
Abbildung 5: Marktanteile der führenden Anbieter am Umsatz an ERP-Anwendungen weltweit im Jahr 2015
Abbildung 6: Beispiel einer NetWeaver Oberfläche mit einer Auswertung
Abbildung 7: SAP BW Architektur
1 Einleitung
Durch die wachsende Menge an Daten, die in einem Unternehmen anfallen, stellt sich die Frage, wie diese gewinnbringend weiterverwendet werden können. An dieser Stelle greifen Data Warehouse Systeme ein, die aus den vorliegenden Daten einen Mehrwert schaffen sollen. Dadurch das die Auswertungen computergestützt sind, kann eine Betrachtung über eine größere Datenmenge hinweg erreicht werden. Diese Seminararbeit soll einen Überblick darüber schaffen, wie Data Warehouse Systeme arbeiten und welchen Mehrwert diese schaffen. Aufgrund der Größe des Softwareunternehmens SAP wird dessen SAP Business Information Warehouse in einem extra Kapitel beschrieben.
2 Data Warehouse und Komponenten
Innerhalb dieses Kapitels wird das Data Warehouse und die voraussetzende Komponente des ERP-Systems sowie die optionale Komponente Data Mart erläutert. Der Schwerpunkt liegt in der Beschreibung der Funktion eines Data Warehouse und der Unterscheidung zwischen Data Warehouse und Data Mart.
2.1 ERP Systeme
ERP Systeme dienen der Ressourcenplanung anhand der gesamten Wertschöpfungskette. Sie betrachten jegliche Wareneingänge und Warenausgänge und helfen bei der Kalkulation, so dass die benötigten Ressourcen zum richtigen Zeitpunkt am richtigen Ort verfügbar sind.
2.2 Data Warehouse
Bei einem Data Warehouse handelt es sich um die Momentaufnahme des Datenbestandes mehrerer operativer Systeme. Dieser zusammengefasste Datenbestand dient für spätere Analysen. Der Vorteil des Data Warehouses im Gegensatz zu dem Zugriff auf operative Systeme ist, dass sich Analysen bei gleichen Abfragen immer reproduzieren und Ergebnisse nachvollziehen lassen, da sich der Datenbestand nicht ändert (vgl. Hahne, 2005, pp. 7-8). Während ein operatives System zusätzlich nach seiner Funktion ausgerichtet ist, orientiert sich der Data Warehouse Aufbau nach betriebswirtschaftlichen Themen, bei dem die operativen Datenbanken zusammengefasst werden (vgl. Benander and Benander, 2000, p. 75).
Laut Kollmann besteht das Data Warehouse zusammengefasst aus den drei Elementen Datenmanagement, Datenorganisation und Datenauswertung. Letzteres beinhaltet die Analyse und Aufbereitung der Daten. Auf die dabei verwendeten Verfahren OLAP und Data Mining wird im Kapitel 3 Business Intelligence eingegangen. Unter Datenmanagement wird die Transformation der operativen Daten in ein Data Warehouse kompatibles Format verstanden, während sich die Datenorganisation mit der physikalischen und logischen Ablage der Daten befasst (vgl. Kollmann, 2013, p. 356-357). Die analog dazu vorhandenen Schichten des SAP Business Information Warehouse (SAP BW) werden im Kapitel 6.5 Schichten des SAP BW
2.3 Data Mart
Bei einem Data Mart handelt es sich um eine kleinere Version eines Data Warehouse. Während das Data Warehouse eine quasi zentrale Ablagestelle aller Unternehmensdaten ist, enthält ein Data Mart nur die Daten eines Teilbereiches oder einer Abteilung. Dadurch das Data Marts durch die Teilbereich Abdeckung klein sind, ist eine Einführung vergleichsweise einfach. Der Funktionsumfang verhält sich analog zum Data Warehouse. Ein Anwendungsfall von Data Marts ist, die Bildung mehrere Data Marts für unterschiedliche Abteilungen, die dann in einem späteren Step zu einem Data Warehouse zusammengefasst werden. Die Summe aller Data Marts bilden dann das Data Warehouse (vgl. DATACOM Buchverlag GmbH, 2017).
3 Business Intelligence
Business Intelligence (BI) bezeichnet eine Kategorie von Anwendungen und Technologien, die dazu dienen, Daten zu erfassen zu speichern und diese zu analysieren. Das Ziel ist es Informationen zu beschaffen auf deren Basis sich Entscheidungen eines Unternehmens stützen können. Die Datenanalysemethoden Data Mining und OLAP sind Bestandteil von BI. Beides dient zur Analyse eines vorhandenen Datenpools. Im Folgenden werden beide Begriffe genauer erläutert und gleichzeitig deren Unterschiede herausgearbeitet (vgl. Gómez, Rautenstrauch and Cissek, 2009, pp. 9-11).
3.1 Data Mining
Dank großer Datenbestände ist es möglich, mithilfe von Algorithmen teils unbekannte Werte aus Datenbestände zu schürfen. Diese Anwendung wird allgemein unter dem Begriff Data Mining zusammengefasst. Dabei unterteilt Fayyad&Uthurusamy Data Mining in die zwei Kategorien Verification und Discovery. Letzteres wird unterteilt in Prediciton und Discription. Verification dient dazu Annahmen zu überprüfen, bei denen der Anwender recht genau weiß, was er überprüfen möchte. Discovery dient, wie der Name Entdeckung bereits andeutet, der Suche neuer Erkenntnisse. Im Data Mining wird dagegen nach unbekannten Mustern im Datenbestand gesucht. Die Unterteilung Prediciton beschäftigt sich damit, wie sich der Datenbestand in der Zukunft voraussichtlich verändern wird und prognostiziert, welche Auswirkungen bestimmte Veränderungen mit sich bringen. Discription wiederum ist der Blick in die Vergangenheit. Es soll ermittelt werden, was zu einem in der Vergangenheit liegenden Ergebnis geführt hat. Die Ergebnisse dienen zum Erkenntnisgewinn, der zukünftige Entscheidungen beeinflussen soll (vgl. Fayyad, Piatetsky-Shapiro and Smyth, 1996, pp. 43-44).
Eine Erweiterung hierzu ist „Prescriptive“, zu deutsch „Verordnend“. Hierbei soll durch das Data Mining System vorgeschlagen werden, welche Entscheidungen in der Zukunft zu treffen sind und gleichzeitig angegeben werden, welche Auswirkungen bestimmte Aktionen auf die Zukunft haben. Gekoppelt mit der Supply Chain kann dies beispielsweise dazu führen, dass „der Computer“ entscheidet, an welchem Standort welche Ressourcen benötigt werden (vgl. Intelligence Halo Business, 2017).
3.2 OLAP
Ein weiteres Instrument neben dem Data Mining ist „On-Line Analytical Processing“, abgekürzt OLAP. Während beim Data Mining Algorithmen zum Einsatz kommen, muss der Anwender bei OLAP gezielte Anfragen an das System stellen. Er stellt Hypothesen auf und versucht diese mittels gezielter Abfragen zu bestätigen oder zu widerlegen. In diesem Zusammenhang wird auch von sogenannten OLAP Würfeln gesprochen, welche eine mehrdimensionale Betrachtung der Daten erlauben. Die Ergebnisse werden, gleich die dem Data Mining, in menschenlesbarer Form dargestellt und dienen der Unterstützung bei Unternehmensentscheidungen. Da bei einer OLAP Lösung ein größerer Datenbestand analysiert wird, ist die Nutzung von Tabellen der 3. Normalform nur wenig sinnvoll. Diese sind zu komplex, was die Erstellung von Abfragen unnötig verkompliziert und die Abfragedauer erhöht. Um diese Probleme zu lösen werden die Daten für die Nutzung im Zusammenhang mit OLAP im Data Warehouse entsprechend aufbereitet. Die notwendendige Datenmodellierung für die Nutzung von OLAP wird im Kapitel 4 Denormalisierung von Tabellen - Voraussetzung für Abfragen beschrieben. Man kann Data Mining als Ergänzung zu OLAP betrachten. Durch Data Mining aufgestellte Hypothesen lassen sich beispielsweise über gezielte OLAP Anfragen verifizieren (vgl. Knobloch and Weidner, 2000).
4 Denormalisierung von Tabellen - Voraussetzung für Abfragen
Für eine bessere, weniger komplexe und schnelle Auswertung, werden die Tabellen eines ERP-Systems denormalisiert in ein Data Warehouse übernommen. In einem ERP-System werden die Daten oft in Datenbank Tabellen der 3. Normalform gespeichert, welches den Vorteil mit sich bringt, dass die Daten redundanzfrei gespeichert werden. Hierfür werden viele Teilinformationen in Tabellen ausgelagert. Entsprechende Abfragen sind durch die unterschiedlichen Tabellen und den zu beachtenden Beziehungen vergleichsweise komplex und der Zeitaufwand für eine analytische Abfrage zu hoch (Schön, 2016, p. 251).
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1 Datenbankbeispiel in 3. Normalform
Quelle: Schön, 2016, p. 251
Da OLAP-Abfragen in der Regel wenige Sekunden bis maximal 20 Sekunden bei großen Abfragen dauern ist dies nicht praktikabel. Aus diesem Grund werden die Tabellen im Data Warehouse denormalisiert gespeichert. Dies vereinfacht die OLAP Abfragen erheblich. Eine Form der denormalisierten Tabelle ist ein Starschema mit Dimensionstabellen die „sternförmig“ um eine zentrale Faktentabelle gebildet werden. Zwischen den einzelnen Dimensionstabellen gibt es keinerlei Beziehungen. Die Faktentabelle enthält dabei nur Werte und Kennzahlen, welche den Primärschlüsseln der Dimensionstabelle entsprechen. Diese wiederum beinhalten Attribute die den Datensatz genauer beschreiben (vgl. Schön, 2016, pp. 250-252). Eine Umwandlung einer Beispieltabelle von einem relationalem Datenmodell in der 3. Normalform in eine Starschema basierende Datenbank mit Faktenund Dimensionstabellen ist in Abbildung 2 Denormalisiert - Starschema mit Fakten- und Dimensionstabellen zu sehen. Solche Würfel, mit Faktentabelle im Zentrum und mehreren umgebenen Dimensionstabellen werden beim SAP BW InfoCubes genannt.
[...]