Die Integration von Data Warehäusern in Unternehmensportale erhält in den meisten Unternehmen eine immer größere Bedeutung. Die Akzeptanz bei den Endanwendern steht und fällt jedoch mit der Antwortzeit, welche leider oft über 6 Sekunden und in einzelnen Fällen bis zu 5 Minuten beträgt. Es gibt verschiedene Möglichkeiten Performanceoptimierungen durchzuführen, wobei es keinen Königsweg gibt.
Diese Diplomarbeit zeigt eine Vorgehensweise, für die Reportingperformanceoptimierung im SAP Business Warehouse, auf.
Es werden dabei die theoretischen Grundlagen der Performanceoptimierung aufgezeigt, eine Berechnungsmethodik für die Verteilung der Merkmale in InfoCubes entwickelt und auf die verschiedenen Einflussfaktoren der Reportingperformance eingegangen.
Um die verschiedenen Möglichkeiten der Performanceoptimierung im System zu Testen, wurden Referenzmodelle aufgebaut und Performancetests in einem SAP Business Warehouse 7.0 durchgeführt.
Inhaltsverzeichnis
1 Einleitung
1.1 Vorstellung des Unternehmens
1.1.1 Hubert Burda Media
1.1.2 Burda Digital Systems
1.2 Problemstellung / Zielsetzung der Diplomarbeit
1.3 Stand der Forschung
2 Grundlagen
2.1 Business Warehouse als Bestandteil von SAP NetWeaver
2.2 Architektur des Business Warehouse
2.3 Hardware und Datenbanken
2.4 Warehousing-Prozess
2.4.1 Funktionen für den ETL-Prozess
2.4.1.1 Extraktionsschicht
2.4.1.2 Der ETL-Prozess
2.4.1.3 Performancerelevanz
2.4.2 Komponenten für die Datenablage
2.4.2.1 InfoObjects
2.4.2.2 InfoProvider
2.4.2.3 Performancerelevanz
2.4.3 Weitere Möglichkeiten der Performanceverbesserung
2.4.3.1 Komprimierung und Partitionierung
2.4.3.2 Aggregation
2.4.3.3 Indizierung
2.4.3.4 Queries
2.4.4 Werkzeuge für Analysen und Berichte
2.5 Werkzeuge der Performanceanalyse
2.5.1 Analyse von Datenbank, Speicher und Hardware
2.5.1.1 Datenbank
2.5.1.2 Speicher
2.5.1.3 Hardware
2.5.2 Analyse der Systemlast
2.5.3 Einflussfaktoren auf die einzelnen Laufzeitanteile einer Query
2.5.3.1 OLAP-Zeit
2.5.3.2 Datenbanklaufzeit
2.5.3.3 Frontend-Laufzeit
2.6 Zusammenfassung
3 Performanceanalyse
3.1 Rahmenbedingungen
3.1.1 Systemumgebung
3.1.2 Definition der Referenzmodelle
3.1.2.1 Referenzmodell Cube-Modellierung
3.1.2.2 Referenzmodell Query-Aufbau
3.2 Messreihen
3.2.1 Performancemessung InfoCube-Modellierung
3.2.1.1 InfoCube als Kennzahlenmodell
3.2.1.2 InfoCube als Kontenmodell
3.2.1.3 InfoCube mit MultiProvider
3.2.1.4 Komprimierter InfoCube
3.2.1.5 Partitionierung des InfoCubes auf Datenbankebene
3.2.1.6 Partitionierung des InfoCubes auf Applikationsebene
3.2.1.7 InfoCube mit LineItem-Dimension
3.2.1.8 InfoCube mit 3 Dimensionen
3.2.1.9 InfoCube mit 5 Dimensionen
3.2.1.10 InfoCube mit hoher Kardinalität
3.2.1.11 InfoCube mit Navigationsattributen
3.2.1.12 Optimierungsmatrix
3.2.2 Performancemessung Query-Aufbau
3.2.2.1 Kennzahlenberechnung beim Datenladen mit inaktivem Query-Cache
3.2.2.2 Kennzahlenberechnung beim Datenladen mit aktivem Query-Cache
3.2.2.3 Kennzahlenberechnung im Query-Designer mit inaktivem Query-Cache
3.2.2.4 Kennzahlenberechnung im Query-Designer mit aktivem Query-Cache
3.2.2.5 InfoCube mit Aggregat
3.2.2.6 Optimierungsmatrix
3.2.2.7 Weitere Einflussfaktoren
3.3 Zusammenfassung
4 Methodik der Performanceoptimierung
4.1 Hauptprozess
4.1.1 Analyseprozess
4.1.1.1 Zeitmessung Query
4.1.1.2 Zeiten der Testausführung übertragen
4.1.1.3 Anzahl der Datensätze im Datenmodell prüfen
4.1.1.4 Verschiedene Prüfungen
4.1.2 Adjustment
4.1.2.1 Adjustment OLAP-Zeit
4.1.2.2 Adjustment DB-Zeit
4.1.2.3 Adjustment Frontend-Zeit
4.1.3 Performancetest
5 Evaluierung
5.1 Analyse
5.2 Adjustment
5.3 Performancetest
5.4 Zusammenfassung
6 Zusammenfassung und Ausblick
Zielsetzung & Themen
Das Hauptziel dieser Diplomarbeit besteht darin, eine standardisierte Methodik zur Performanceoptimierung in SAP Business Warehouse-Umgebungen zu entwickeln, um der Problematik langer Antwortzeiten bei der Integration von Data Warehäusern in Unternehmensportale zu begegnen und eine systematisierte Vorgehensweise für Performance-Verbesserungen in der Konzeptionsphase bereitzustellen.
- Entwicklung einer standardisierten Methodik zur Performanceoptimierung im SAP BW.
- Aufbau von Referenzmodellen für die Evaluierung von Modellierungsstrategien und Query-Aufbau.
- Identifikation und Analyse von Einflussfaktoren auf die Reportingperformance (OLAP-Zeit, Datenbanklaufzeit, Frontend-Zeit).
- Entwicklung einer Matrix zur Auswahl geeigneter Optimierungsmethoden basierend auf Anforderungen und Datenbasis.
- Validierung der Methodik durch Performancetests am Beispiel von SAP BW.
Auszug aus dem Buch
1.2 Problemstellung / Zielsetzung der Diplomarbeit
Die Integration von Data Warehäusern in Unternehmensportale erhält in den meisten Unternehmen eine immer größere Bedeutung. Die Akzeptanz bei den Endanwendern steht und fällt jedoch mit der Antwortzeit, welche leider oft über 6 Sekunden und in einzelnen Fällen bis zu 5 Minuten beträgt. Es gibt verschiedene Möglichkeiten Performanceoptimierungen durchzuführen, wobei es keinen Königsweg gibt. In vielen Data Warehouse Projekten wird oft entwickelt und erst im Nachhinein eine Optimierung der Performance durchgeführt. Die richtige Vorgehensweise wäre jedoch, das Thema bereits in der Konzeptionsphase anzugehen. Das Problem ist hier, dass es bisher keine geeignete Methodik für eine solche Vorgehensweise gibt.
Eine solche Methodik soll im Rahmen dieser Diplomarbeit entwickelt werden. Ziel dieser Arbeit ist:
1. Beschreibung der Problemstellung, wobei die für diese Arbeit notwendigen Definitionen aufgestellt und Rahmenbedingungen festgelegt werden sollen.
2. Recherche und Bewertung des „Stand der Technik“. Untersucht werden sollen hierbei Methoden und Werkzeuge zur Optimierung von Datenbanksystemen und Data Warehäusern.
3. Definition eines Referenzmodells, anhand dessen die unterschiedlichen Methodenansätze definiert bzw. am Ende getestet werden können.
4. Entwicklung der Optimierungsmethoden. Dabei sollen verschiedene Kategorien gebildet werden (z.B. Hardware, Software, Prozess). Der Schwerpunkt soll hierbei auf den Bereichen Software (Datenbankmodellierung, Queryaufbau, Caching, usw.) sowie dem Prozess (Vorberechnung, Information Broadcasting, usw.) liegen. Als Ergebnis soll eine Matrix entstehen, durch welche man in Abhängigkeit der Anforderungen, Datenbasis u.a. die geeignetste Optimierungsmethode findet.
5. Evaluation: Die Ergebnisse sollen mit Hilfe des Referenzmodells getestet und evaluiert werden.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung stellt die Motivation dar, insbesondere die Notwendigkeit kürzerer Antwortzeiten bei der Data-Warehouse-Integration in Portale, und definiert das Ziel der Arbeit, eine Methodik zur Performanceoptimierung zu entwickeln.
2 Grundlagen: Das Grundlagenkapitel erläutert die Einordnung des Business Warehouse in SAP NetWeaver, beschreibt die Architektur sowie die wesentlichen Performance-Einflussfaktoren wie Extraktion, Datenablage und Werkzeuge zur Analyse.
3 Performanceanalyse: Dieses Kapitel definiert Referenzmodelle für InfoCube-Modellierung und Query-Aufbau und evaluiert mittels systematischer Messreihen deren Performance, um die Basis für die Optimierungsmatrix zu schaffen.
4 Methodik der Performanceoptimierung: Hier wird der standardisierte Analyse- und Optimierungsprozess als ereignisgesteuerte Prozesskette beschrieben, um Probleme systematisch zu identifizieren, zu beheben und deren Erfolg zu prüfen.
5 Evaluierung: Die entwickelte Methodik wird an einem konkreten Fallbeispiel (VIS4) angewendet und evaluiert, wobei durch ein Re-Design des Datenmodells eine deutliche Verbesserung der Performance nachgewiesen wird.
6 Zusammenfassung und Ausblick: Das Fazit fasst die Ergebnisse zusammen, unterstreicht die Notwendigkeit, Performance-Aspekte bereits in der Konzeptionsphase zu berücksichtigen, und gibt einen Ausblick auf ergänzende Technologien wie den BI-Accelerator.
Schlüsselwörter
SAP Business Warehouse, Performanceoptimierung, Data Warehouse, Reportingperformance, ETL-Prozess, InfoCube-Modellierung, OLAP-Zeit, Datenbanklaufzeit, Systemlastmonitor, Query-Aufbau, Partitionierung, Aggregation, Indizierung, Modellierungsstrategie, Business Explorer.
Häufig gestellte Fragen
Worum geht es in dieser Diplomarbeit?
Die Arbeit beschäftigt sich mit der systematischen Performanceoptimierung in SAP Business Warehouse-Systemen, da hohe Antwortzeiten die Akzeptanz bei Endanwendern stark gefährden.
Welche Themenfelder werden abgedeckt?
Die zentralen Themenfelder sind die Architektur des SAP BW, Modellierungsstrategien für InfoCubes, Einflussfaktoren auf die Query-Laufzeit (OLAP, DB, Frontend) sowie konkrete Methoden der Performanceanalyse und -optimierung.
Was ist das primäre Ziel der Untersuchung?
Das Hauptziel ist die Entwicklung einer standardisierten, prozessorientierten Methodik, die Performance-Probleme bereits in der Konzeptionsphase adressiert und minimiert.
Welche wissenschaftliche Methode kommt zum Einsatz?
Die Arbeit nutzt experimentelle Performancemessungen anhand definierter Referenzmodelle (InfoCube-Modellierung und Query-Aufbau), um mathematische Zusammenhänge mit realen Systemlastdaten zu validieren.
Was wird im Hauptteil behandelt?
Der Hauptteil analysiert die Abhängigkeiten zwischen Datenmodell-Architektur, Indizierungsstrategien, Partitionierung und Query-Einstellungen und leitet daraus eine Entscheidungshilfe für IT-Architekten ab.
Welche Schlüsselbegriffe charakterisieren die Arbeit?
Die Arbeit fokussiert sich maßgeblich auf Begriffe wie "Business Warehouse", "Reportingperformance", "InfoCube-Modellierung" sowie "Cost-Based Optimizer".
Warum ist das "erweiterte Star-Schema" für die Performance relevant?
Das erweiterte Star-Schema ermöglicht durch die Verwendung von SID-Schlüsseln (Surrogate-IDs) eine flexiblere und performantere Modellierung von Beziehungen, die direkt in die Berechnungslogik der Laufzeiten einfließt.
Warum wird im Rahmen der Evaluierung der BI-Accelerator ausgeschlossen?
Der Autor verzichtet auf den Einsatz des BI-Accelerators, um die Performance-Verbesserungen exklusiv durch eine optimierte Datenmodellierung und Prozessanpassung im SAP BW selbst zu demonstrieren.
- Quote paper
- Dipl. Wirtschaftsingenieur Nils Gröer (Author), 2007, Entwicklung einer Methodik zur Performanceoptimierung am Beispiel von SAP BW, Munich, GRIN Verlag, https://www.grin.com/document/74704