Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb


Bachelorarbeit, 2020

107 Seiten, Note: 1,7


Leseprobe

Inhaltsverzeichnis

Abstract

Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung
1.1 Motivation und Ziel dieser Arbeit
1.2 Aufbau der Arbeit

2 Überblick SAP HANA
2.1 Historie von SAP HANA
2.2 Architektonische Merkmale
2.3 SAP HANA Express-Edition
2.3.1 Datenauswertungsfunktionalität
2.3.2 Application Function Library (AFL)
2.3.3 Predictive Analysis Library (PAL)
2.3.4 Application Function Modeler (AFM)

3 Demo - Reporting und Datenaufbereitung mit SAP HANA -Express Edition
3.1 Umgebung und Einrichtung der Systeme
3.1.1 Installation von SAP HANA Express-Edition
3.1.2 Test der Installation
3.1.3 Konfiguration von SAP HANA Tools für Eclipse
3.1.4 Einbindung der Datenbank und Konfiguration
3.2 Datengrundlage
3.3 Versuch Algorithmen und Datenauswertung
3.3.1 PAL: Time-Series Analysis Auto Arima und Arima Forecast
3.3.2 PAL: K-Means Clustering

4 Lessons Learned
4.1 Einarbeitung
4.2 Komplexität
4.3 Möglichkeiten
4.4 Einschränkungen
4.5 Laufzeitbeobachtungen
4.5.1 Rechnerkapazitätsauslastung
4.5.2 Vergleich von lokaler und verteilter Architektur
4.5.3 Laufzeitmessungen bei unterschiedlich großen Datenmengen
4.6 Ergebnisse der Laufzeitmessungen und Interpretation

5 Fazit
5.1 Zusammenfassung
5.2 Beantwortung der Forschungsfrage
5.3 Erschaffener Mehrwert
5.4 Limitationen
5.5 Weitere Forschung

Literaturverzeichnis

A. [Anhang]

6 Inhalt Anhang
6.1 AFM JOIN Operation Business Case BRAVO
6.1.1 Snowflake-Schema
6.1.2 Datenimport und Aufbereitung
6.2 Details zu den Laufzeitmessungen
6.3 Zugriffsrecht-Management

7 Danksagung

Abstract

The SAP HANA - Express Edition is a free option for limited use of SAP HANA. SAP promises a wide range of functions and high performance in data processing and analysis, which includes the area of predictive analytics. The documentation around SAP HANA is very comprehensi­ve, but there is no source that provides information on how the SAP HANA Express-Edition can be used in education according to selected criteria. The documentation around SAP HANA is very comprehensive, but there is no source that provides information on how the SAP HANA Express-Edition can be used in education according to selected crite­ria. In this paper, the usability of the system is investigated using vari­ous criteria from education as well as runtime measurements. In order to evaluate the system, besides some installation and configuration steps, the application of algorithms from the field of predictive analytics was carried out. Thereby the necessary induction, the occurring com­plexity, the possibilities within the system as well as limitations were considered. Furthermore, various findings were determined by explicit runtime tests. Amongst other things, it was found that the induction requires some experience in information technology, the complexity is characterized by alternative paths and object connections, the possibi­lities with regard to handling and functional scope are very extensive and there are limitations in the transparency of error searches. The run­time measurements show how outsourcing the front-end affects per­formance, how the system behaves when processing 150 data sets step-by-step up to one million data sets and where the Hardware limits are. The SAP HANA - Express Edition is a very suitable system for use in advanced education of data processing.

Die SAP HANA - Express Edition ist eine kostenlose Möglichkeit, SAP HANA in eingeschränktem Umfang zu verwenden. SAP verspricht einen großen Funktionsumfang und eine hohe Performanz innerhalb der Da­tenverarbeitung und bei der Analyse, was den Bereich von Predictive Analytics miteinschließt. Die Dokumentation rund um das System ist sehr ausführlich, jedoch gibt es keine Quelle, die darüber informiert, in wie fern sich die SAP HANA Express - Edition in der Lehre anhand ausgewählter Kriterien verwenden lässt. In der vorliegenden Arbeit wird die Verwendbarkeit des Systems anhand verschiedener Kriterien aus der Lehre sowie durch Laufzeitmessungen erforscht. Um das System zu bewerten, wurde neben einigen Installations- und Konfigurations­schritten, die Anwendung von Algorithmen aus dem Bereich Predictive Analytics durchgeführt. Dabei wurde auf die notwendige Einarbeitung, die auftretende Komplexität, die Möglichkeiten innerhalb des Systems sowie auf Beschränkungen geachtet. Weiterhin wurden durch explizite Laufzeittests verschiedene Erkenntnisse ermittelt. Es kam unter Ande­rem heraus, dass die Einarbeitung einiger Informationstechnologischer Vorerfahrung bedarf, die Komplexität durch Alternativpfade und Objekt­Zusammenhänge gekennzeichnet ist, die Möglichkeiten hinsichtlich des Handlings und des Funktionsumfangs sehr weitläufig sind und es Ein­schränkungen bei der Transparenz von Fehlersuchen gibt. Die Lauf­zeitmessungen zeigen, wie sich die Auslagerung des Front-Ends auf die Performanz auswirkt, wie sich das System bei der Verarbeitung von 150 Datensätzen schrittweise bis zu einer Million Datensätze verhält und wo die Grenzen der Hardware liegen. Die SAP HANA - Express Edi­tion ist ein sehr geeignetes System für den Einsatz in der fortgeschrit­tenen Lehre der Datenverarbeitung.

Abbildungsverzeichnis

Abbildung 1: SAP HANA Plattform

Abbildung 2: SAP HANA Architektur

Abbildung 3: Leistungsengpässe Hauptspeicher- und Festplattenzugriff (Angepasste Darstellung in Anlehnung an Prassol)

Abbildung 4: CSV-Importdialog

Abbildung 5: Umwandlung der Tabellen am Beispiel von BRAVO Product Attr. (Angepasste Darstellung in Anlehnung Prassol)

Abbildung 6: SAP HANA Architektur, Application Function Library

Abbildung 7: Flowgraph Model, Application Function Modeler

Abbildung 8: Funktionsansicht mit General, BFL und PAL

Abbildung 9: SAP HANA HXE Download Manager

Abbildung 10: Hostsdatei

Abbildung 11: XSEngine Erfolgsmeldung

Abbildung 12: VM Ansicht: XSA Authentifizierung

Abbildung 13: VM: Test WEB IDE

Abbildung 14: WEB IDE

Abbildung 15: Test Cockpit

Abbildung 16: Cockpit

Abbildung 17: System-Database Connection

Abbildung 18: VM: Output HDB Info

Abbildung 19: SystemDB: Administration

Abbildung 20: PAL Installations-Überprüfung

Abbildung 21: Ausschnitt aus Tabelle für Laufzeitmessungen

Abbildung 22: PAL: Stocks-Tabelle

Abbildung 23: Tabellenauswahldialog für Inputdaten

Abbildung 24: Ergebnistabelle des Auto-Arima Algorithmus Spaltenansicht

Abbildung 25: AFM: Auto Arima und Arima Forecast

Abbildung 26: Job Log Erfolgsmeldungen

Abbildung 27: ARIMA RESULTS: Timestamp 0-5

Abbildung 28: ARIMA RESULTS: Timestamp 195-199

Abbildung 29: ARIMA: Analysis Ansicht RESULTS Tabelle

Abbildung 30: PAL: CUSTOMERS

Abbildung 31: K-Means: Standard-Parameter Spaltenansicht

Abbildung 32: K-Means: Angepasste Parameter Spaltenansicht

Abbildung 33: AFM: K-Means

Abbildung 34: Results-Tabelle Spaltenansicht

Abbildung 35: CENTER POINTS Tabelle Spaltenansicht

Abbildung 36: Generiertes SQL-Script aus K-Means-Versuch

Abbildung 37: K-Means RESULT Tabelle

Abbildung 38: K-Means CENTER POINTS Tabelle

Abbildung 39: AFM: CUSTOMERSCLUSTEREDJOIN

Abbildung 40: SQL-Script aus Join-Operation

Abbildung 41: Resultstabelle Raw Data Ansicht

Abbildung 42: Balkendiagramm mit 3 Gruppierungen von Kunden

Abbildung 43: Blasendiagramm mit 3 Gruppierungen

Abbildung 44: Blasendiagramm mit 4 Gruppierungen

Abbildung 45: Streudiagramm mit 4 Gruppierungen für Individuelle Datenpunkte der Kunden

Abbildung 46: Streudiagramm mit Positionen der Center-Points

Abbildung 47: Streudiagramm mit 2 Gruppierungen für individuellen Datenpunkten der Kunden

Abbildung 48: Leistungsübersicht Arbeitsspeicher bei laufender VM

Abbildung 49: Leistungsabfall Arbeitsspeicher nach Beenden der VM

Abbildung 50: BRAVO Dataset - Store-Attr Editoransicht

Abbildung 51: BRAVO Dataset - Store-Text Editoransicht

Abbildung 52: BRAVO Dataset - Region-Attr Editoransicht

Abbildung 53: BRAVO Dataset - Store-Text Editoransicht

Abbildung 54: BRAVO Dataset - Promotion-Attr Editoransicht

Abbildung 55: BRAVO Dataset - Promotion-Text Editoransicht

Abbildung 56: BRAVO Dataset - Product-Attr Editoransicht

Abbildung 57: BRAVO Dataset - Product-Text Editoransicht

Abbildung 58: BRAVO Dataset - Face-Table Verkauf Editoransicht

Abbildung 59: BRAVO Dataset - Fact-Table Kosten-Kampagnen Editoransicht

Abbildung 60: BRAVO Dataset - Slowly-Changing-Dimensions1

Abbildung 61: BRAVO Dataset - Slowly-Changing-Dimensions2

Abbildung 62: Snowflake Schema BRAVO Data

Abbildung 63: Import Properties CSV-File

Abbildung 64: Import CSV-File Manage Table Definition

Abbildung 65: JOIN-Operation Mapping

Abbildung 66: AFM Bravo-Data-Report-JOIN-Operationen

Abbildung 67: Aussschnitt aus generiertem SQL-Script Code

Abbildung 68: Error-Meldung für Zugriffrechte

Tabellenverzeichnis

Tabelle 1: Vergleich der Laufzeiten lokal und verteilt

Tabelle 2: Laufzeiten für K-Means Vorbereitung

Tabelle 3: Laufzeiten für K-Means Auswertungen

Tabelle 4: Laufzeiten Import BRAVO CSV Dateien

Tabelle 5: Laufzeiten K-Means

Tabelle 6: Laufzeiten in Sekunden bei Datenpunktvisualisierungen von unterschiedlich großen Inputmengen

Tabelle 7: Laufzeiten in Sekunden bei Zentroiden-Visualisierungen bei unterschiedlich großen Inputmengen

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

1.1 Motivation und Ziel dieser Arbeit

„Information is the oil of the 21st Century, and analytics is the combustion engine.“1 Dieser Satz von Peter Sondergaard, einem Wissenschaftler der Gartner Gruppe, erweitert prägnant, das im Jahr 2009 von Meglena Kuneva ins Leben gerufene, berühmte Statement, worin Daten als das neue Öl be­zeichnet werden.2 Wenn Daten, die das Fundament einer Digitalisierung sind, als Öl für den Verbrennungsmotor der Analyse - wie von Peter Sonder- gaard - betrachtet werden, liegt es nahe, dass die Datenauswertung eine zentrale Rolle für eine erfolgreiche Digitalisierung bedeutet. 44% der deut­schen Unternehmen, konnten ihren Umsatz durch die Digitalisierung stei- gern.3 Wird der Gedanke Sondergaards darum erweitert, dass die ganze Di­gitalisierung das Auto ist, in dem die Menschen durch das 21. Jahrhundert rasen, lässt sich die Wichtigkeit der Analyse von Daten durch ihre Rolle des Verbrennungsmotor als die primäre Funktion eines Autos, ohne Weiteres einordnen. Ein Anbieter für die Datenanalyse ist die SAP SE. Mit einem Marktanteil von 8,6% am Umsatz im Bereich Business Intelligence- und Ana­lytics-Software, gehört die SAP SE aus Walddorf in Deutschland zu den um­satzstärksten Unternehmen in diesem Bereich. Im Jahr 2018 beläuft sich der weltweite Gesamt-Umsatz hierbei auf 24,09 Milliarden US-Dollar.4 Im selben Jahr, so wie in den Jahren 2016 und 2017, belegt die SAP SE jeweils Platz 3 weltweit, für den Gesamtanteil am Umsatz mit Big-Data und Analytics­Software, wo ihr Umsatz jeweils zwischen 5 und 7 Milliarden US-Dollar liegt.5 SAP hat mit der HANA Lösung im Jahr 2011 eine Datenbank verfügbar ge­macht, wovon sie versprechen, eine High-Performance Analytical Appliance für Echtzeit-Datenanalysen anzubieten, da das System ausnahmslos alle Daten im Arbeitsspeicher hält.6 Weiterhin wird mit vielen Funktionen und An­wendungsszenarien geworben. Ein Funktionsumfeld davon ist Predictive Analytics, welche auf Basis vorhandener Datenbestände zukünftige Trends vorhersagen kann.7 Laut einer Umfrage, sind 40% der Befragten der Mei­nung, dass Predictive Analytics im Bereich des Online-Handels in der Zu­kunft helfen wird, bessere Entscheidungen zu treffen.8 SAP stellt mit der SAP HANA Express-Edition eine kostenfreie, beschränkte Version von SAP HA­NA zur Verfügung.9 Das Ziel dieser Arbeit liegt darin, die SAP HANA Ex­press-Edition auf ihre Potenziale hinsichtlich der Kriterien Einarbeitung, Komplexität, Möglichkeiten und Einschränkungen für die Lehre zu erproben. Weiterhin wird in dieser Arbeit erforscht, wie performant die Software bei ei­ner für Studierende verfügbaren Hardware-Umgebung ist. Hierfür werden für unterschiedliche Szenarien Laufzeitenmessungen erhoben, verglichen und interpretiert. Der hohe Stellenwert, den die SAP und Predictive Analytics ha­ben, die Versprechen von SAP bezüglich HANA, sowie mein grundlegendes Interesse für das Thema Business Analytics, begründet meine Aufmerksam­keit für dieses Thema. Das Interesse der Hochschule Furtwangen für diese wissenschaftliche Untersuchung bestärkt meine Forschungsmotivation, wel­che sich letztlich in den folgenden Forschungsfragen zusammenfassen lässt.

Wie geeignet ist die SAP HANA-Express Edition für die Lehre hinsichtlich der Kriterien Einarbeitung, Komplexität, Möglichkeiten und Einschränken und wie performant ist das System beim Betrieb auf einem für Studierende verfügba­ren Computer bei exemplarisch ausgewählten Anwendungen aus dem Be­reich Predictive Analytics?

1.2 Aufbau der Arbeit

Die hier vorliegende Arbeit besteht aus sechs Kapiteln. Nach dieser Einlei­tung werden zunächst werden im Kapitel Überblick HANA eine Reihe theore­tischer Grundlagen rund um SAP HANA und im Speziellen um die SAP HA­NA Express Edition beschrieben, welche für das Verständnis dieser Arbeit notwendig sind. Kapitel drei ist eine Demo, worin der Prozess über die we­sentlichen Schritte bei der Arbeit mit dem System im Umgang mit Algorith­men aus dem Predictive-Analytics-Bereich, beschrieben ist. Hierbei werden vereinzelt Schritte dargestellt, welche im Umgang mit der SAP HANA- Express Edition über den Prozess unter anderem von der Installation bis zu verwendbaren Ergebnissen, angewandt werden. Im Kapitel Lessons Learned, werden die Ergebnisse, welcher bei der Recherche und der Demo entstanden sind, festgehalten. Hierbei fließen Erkenntnisse aus dem gesam­ten Prozess, der Vorbereitung und der Anwendung mit ein. Neben den Er­kenntnissen, welche sich auf die beschriebenen Kriterien der Beobachtung beziehen, sind im Kapitel Lessons Learned auch die Ergebnisse und Herlei­tungsbeschreibungen der Laufzeitmessungen, festgehalten. Anhand dessen wird im fünften Kapitel ein Fazit gezogen, worin diese Arbeit zusammenge­fasst wird und die Forschungsfragen beantwortet werden. Nachfolgend wer­den die Limitationen beim Erstellen dieser Arbeit beschrieben sowie Anre­gungen für weitere Forschungen in diesem Bereich geäußert. Das sechste Kapitel ist der Anhang, auf den in dieser Arbeit wiederholt verwiesen wird.

2 Überblick SAP HANA

SAP beschreibt den Namen des Unternehmens, welches die Software entwi­ckelt und zur Verfügung stellt. Die Abkürzung SAP steht für die Begriffe Sys­teme, Anwendungen und Produkte. Die offizielle Firmenbezeichnung wird um das Akronym SE erweitert, welche die spezifische Rechtsform für Aktienge­sellschaften in der Europäischen Union und im Europäischen Wirtschafts­raum bezeichnet.10 HANA wird als High Performance Analytical Appliance beschrieben, was in Hochleistungsanalyseanwendung übersetzt werden kann.11 SAP HANA ist eine auf Arbeitsspeicher-orientierte Datenbank­Plattform, die es ermöglicht, große Datenmengen in Echtzeit zu verarbei- ten.12 Der Arbeitsspeicher ist verglichen mit der Festplatte ein Medium für die temporäre Speicherung, in dem Daten nicht persistent gehalten werden. Ne­ben dem Begriff Arbeitsspeicher werden in der Literatur auch die Begriffe Hauptspeicher und Random Access Memory (RAM) als Synonyme verwen- det.13 Alle Anwendungsfälle, die sich durch das System abbilden lassen, sind auf diese Datenbank-Architektur ausgerichtet, welche Performanzsteigerun­gen in Big Data Aktivitäten wie Speicherung, Auslesung und Auswertung großer Datenbestände in Echtzeit erreicht. SAP HANA beschleunigt den Ge­schäftsbetrieb und vereinfacht die IT-Infrastruktur.14 In vielen verschiedenen Fällen findet das System in der Geschäftswelt Anwendung. Das liegt unter anderem an den Stärken von HANA hinsichtlich Big Data, Internet of Things und Predictive Analytics. Nicht nur der Funktionsumfang macht SAP HANA in der Unternehmenswelt zu einer angesehenen Lösung für die Datenverarbei­tung. Auch andere Gründe sprechen für den Einsatz. Das Programm bringt beispielsweise im Vergleich zu anderen Lösungen einen geringeren Total Cost of Ownership (TCO) mit sich. Das macht sich nicht nur bei der anfängli­chen Investition bemerkbar, auch die langfristigen Kosten sind vergleichs­weise geringer. Die Erneuerung der Hardware ist günstiger, Speicherres- sourcen werden entlastet und der Wartungsaufwand ist sehr gering. Ein wei­terer Grund ist, dass das Programm die Gestaltung der IT-Landschaft verein­facht. HANA verwendet dieselbe Datenkopie für mehrere Anwendungen und reduziert so Komplexität und Redundanz. Aus konzeptioneller Sicht vereinigt es Systeme für die Online-Transaktionsverarbeitung (OLTP) und die analyti­sche Online-Verarbeitung (OLAP). Um den Nutzen zu erhöhen, können zu­sätzliche und neue Anwendungen einfach und schnell eingeführt werden und kann der Time-to-Market-Zyklus verkürzt werden. Einige Firmen sind auf schnelle und fortschrittliche Analysefunktionen angewiesen, welche einfache Änderungen in den Geschäftsprozessen mit der Geschwindigkeit ermöglicht, mit der sie auf dem Markt auftreten. Unternehmen, die HANA nutzen sind dadurch in der Lage, sich von ihren Mitbewerbern abzuheben. Das Pro­gramm unterstützt auch die Minderung von Risiken, da Unternehmen, die schneller auf Änderungen in der Umwelt reagieren können, was in einer im­mer höher werdenden Frequenz geschieht, zukünftig eine sichere Stellung genießen, da die Anpassung hierbei durch die Potenziale von HANA einfa­cher gestaltet werden kann.15 Durch den Einsatz von Integrationsservices bietet das Programm die Verwendung und Verarbeitung diverser Datenquel­len, welche sich in ihrem Ursprung und Struktur deutlich unterscheiden kön­nen. Ebenso vielseitig sind die Anwendungen, die auf die HANA Datenbank zugreifen können. Die nachfolgende Abbildung verdeutlicht den Anwen­dungsbezogenen Plattform-Charakter von SAP HANA.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: SAP HANA Plattform

Wie in den beiden untersten Schichten von Abbildung 1 zu sehen ist, decken die Integrationsservices innerhalb der HANA-Architektur die Verarbeitung von Transaktionsdaten, Maschinendaten, Textdaten, HADOP-Daten, Echt­zeitdaten, Ortungsdaten und Anwendungsdaten ab. Die beiden Schichten in der Mitte des Models zeigen einen Überblick über die Möglichkeiten, die das System bietet, um mit den importierten Datenbeständen umzugehen. Diese Möglichkeiten setzen sich aus integrierten Engines, Logiken und Algorithmen zusammen, welche nahezu keine moderne Datenverarbeitungsform vernach­lässigen. Beispielsweise bietet die Bibliothek für Predictive Analysis Proze­duren viele verschiedene Algorithmen, welche in dieser Arbeit teilweise ver­tieft erläutert werden. Der Zugriff auf die verarbeiteten Daten erfolgt durch die Datenbanksprachen SQL, SQL-Script und Java-Script, wie in der obersten Schicht des Modells zu sehen ist. Die Plattform stellt ein voll-umfängliches System für den Zugriff, die Verarbeitung und die Bereitstellung unterschied­lichster Arten da.

2.1 Historie von SAP HANA

Früher waren Analysen auf Basis historischer Daten ausreichend. Doch in­zwischen ist die Bereitstellung von Analyseergebnissen in Echtzeit ein wich­tiger Faktor für die Entscheidungsfindung in Unternehmen. Mit vielen vor­handenen Data-Warehouse-Systemen kann dies jedoch nicht erfüllt werden, da die Zeitspanne, bis die Daten im Data Warehouse und anschließend aus­gewertet sind, zu groß ist. Die Auslöser für die Entwicklung von SAP HANA sind die Themen Big Data und In-Memory-Computing.16 17 Mit der Verarbeitung immer größer werdender Datenmengen, steigt auch gleichzeitig die Priorität der Herausforderung, die Leistungsfähigkeit auf den Datenzugriff zu erhöhen. Hierbei wurden primär Optimierungspotenziale für die Geschwindigkeit des Zugriffs auf die Festplatten gesucht. Beispiele für diese Optimierungen sind die Verringerung der Anzahl der Disk Pages, das Einsetzen von Pufferungen, sowie das Bereitstellen angepasster Datenobjekte, für häufig wiederkehren­de Abfragen.18 Die direkte Datenverarbeitung aus dem Hauptspeicher ist keine neue Technologie. Der Hauptspeicher ist ein unentbehrlicher Bestand­teil aller bisherigen Rechner-Architekturen. Ohne Hauptspeicher läuft kein Betriebssystem und der Bildschirm bleibt schwarz. Die Funktionalität des Hauptspeichers als notwenige Komponente für das Betreiben eines Rech­ners wird durch die Verbesserung der Hardware und durch die Entwicklun­gen von Architekturen von Systemen wie SAP HANA dahingehend erweitert, dass der Hauptspeicher nun große Datenmengen in Bereichen von Tera­bytes effizient nutzen kann.19

2.2 Architektonische Merkmale

Laufende HANA-Systeme bestehen aus mehreren, miteinander kommunizie­renden Services, welche sich als Schichten in einem Model beschreiben las­sen. Die folgende Abbildung zeigt die Datenbankdienste im Anwendungskon­text. große Iterationsschleifen sehr schnell verarbeitet werden. Während klassi­sche Anwendungen dazu neigen, mit SQL nur sehr begrenzte Funktionalitä­ten in die Datenbank auszulagern, ist durch den Einsatz von SQL-Script auch bei großen Anwendungen der Einsatz von viel Logik innerhalb der Daten­bank möglich. SQL und SQL-Script werden unter Verwendung einer gemein­samen Infrastruktur aus integrierten Daten-Engine-Funktionen implementiert, die Zugriff auf verschiedene Meta-Definitionen haben, z. B. Definitionen von relationalen Tabellen, Spalten, Views und Indizes sowie Definitionen von SQL-Script-Prozeduren. Diese Metadaten werden in einem gemeinsamen Katalog gespeichert. Die Datenbank-Persistenzschicht ist für die Dauerhaf­tigkeit und Atomarität der Transaktionen verantwortlich. Sie stellt sicher, dass die Datenbank nach einem Neustart in den zuletzt festgeschriebenen Zu­stand wiederhergestellt werden kann und dass Transaktionen entweder voll­ständig ausgeführt oder vollständig rückgängig gemacht werden. Der Index­Server verwendet den Präprozessor-Server zur Analyse von Textdaten und zur Extraktion der Informationen, auf denen die Textsuchfunktionen basieren. Der Name-Server ist im Besitz der Informationen über die Topologie des SAP-HANA-Systems. In einem verteilten System speichert und verarbeitet der Name-Server Daten darüber, wo die Komponenten laufen und welche Daten sich auf welchem Server befinden. SAP HANA unterstützt ein Frame­work, welches die Installation spezialisierter und optimierter Funktionsbiblio­theken unterstützt, welche eng mit unterschiedlichen Daten-Engines des In­dex-Servers integriert sind. Drei dieser Funktionsbibliotheken sind die Busi­ness Function Library (BFL) die Predictive Analysis Library (PAL) und die Automated Predictive Library (APL). BFL, PAL und APL Funktionen können direkt aus SQL-Script heraus aufgerufen werden. Sie werden im Kapitel Da­tenauswertung vertieft beleuchtet. SAP HANA unterstützt auch die Entwick­lung von Programmen, die in der Sprache R geschrieben sind. 20 21

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: SAP HANA Architektur

Bei SAP HANA handelt es sich wie zu vor beschrieben um eine In-Memory- Plattform. Der wesentliche Unterschied zu anderen Plattformen oder Daten­bankmanagementsystemen liegt hierbei darin, dass die Daten in einer für die Verarbeitung optimierten Form in den Hauptspeicher geladen werden, so­dass auf redundante Datenhaltung oder Caching-Mechanismen bei Analysen von Daten, die nicht zu lange in der Vergangenheit liegen, verzichtet werden kann. Bei der Hauptspeicherorientierung der Daten wird eine deutlich schnel­lere Durchsuchung, Aggregierung und Analyse von Daten erreicht, als das bei der Datenhaltung auf gängigen Festplattenspeichern möglich ist. Regulä­re Ansätze von Festplatten werden innerhalb dieser Architektur ausschließ­lich für die Datensicherung und -wiederherstellung verwendet. Es gibt zwar eine ganze Reihe an Datenbankseitigen Optimierungsmaßnahmen mit dem Zweck der Performanz-Steigerung, jedoch gibt es gegenwärtig ebenso weit­läufige Konfigurationen des Arbeitsspeichers. Ein Aspekt hierbei ist die wachsende Orientierung der Hersteller von Computerchips auf Multicore CPU’s und die Realität von Server-Architekturen, welche auf große Haupt­speicher ausgerichtet sind. Der Leistungsengpass liegt bei den In-Memory Architekturen beim Ladevorgang der Daten aus dem Hauptspeicher in den CPU-Cache, und weniger, bei der Durchführung des Zugriffs auf die Festplat- te.22 Die folgende Abbildung zeigt den Aufbau und die gegebenen Leistungs­engpässe Neben der Orientierung auf die Nutzung des Hauptspeichers finden sich in der Architektur eine Reihe weiterer technischer Innovationen, die intelligent miteinander verknüpft sind, sodass eine hohe Performanz hinsichtlich vieler Nutzungspotenziale erreicht wird. Hierzu gehört die Auswahl einer Dimension von Daten bei der Verarbeitung in HANA. Datentabellen sind zweidimensional. Sie besitzen Zeilen und Spalten. Weil der Datenfluss in den Arbeitsspeicher auf lineare, eindimensionale Datenstrukturen ausgerichtet ist, werden die Daten im Integrationsprozess entweder in eine Zeilenorientierte Form oder in eine Spaltenorientierte Form umgewandelt. Der Benutzer hat beim Datenimport die Möglichkeit, seine Präferenz der Datenspeicherung festzulegen. Die folgende Abbildung zeigt den Importdialog mit der Auswahlmög lichkeit der Datenhaltung einer CSV-Datei aus dem BRAVO-Data Business- Case, welcher im Anhang beschrieben ist.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Leistungsengpässe Hauptspeicher- und Festplattenzugriff (Angepasste Darstellung in Anlehnung an Prassol)

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: CSV-Importdialog

Die Auswahl der Art der Speicherung in Spalten- oder Zeilenorientierter Form muss nicht zwangsläufig beim Importieren der Daten wie im Fenster von Abbildung 4 passieren. Es lassen sich auch Einstellungen über bereits vorhandene Datenbestände zwecks der Speicherart vornehmen. Auch lassen durch SQL-Befehle Tabellen erstellen, welche gezielt eine Auswahl treffen, wo nach dem Create Befehl noch die Worte Coloumn Store oder Row Store vor dem Tabellenname gemäß SQL eingefügt werden. Wenn keine Einstellungen vorgenommen werden, sind die Daten standardmäßig in der spaltenorientieren Form abgelegt.

Die nachfolgende Abbildung zeigt exemplarisch, wie eine zweidimensionale Tabelle in eine eindimensionale Tabelle umgewandelt wird.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: Umwandlung der Tabellen am Beispiel von BRAVO Product Attr. (Angepasste Darstellung in Anlehnung Prassol)

Bei der zeilenorientierten Form der Datenlagerung übertragen sich die Daten sequenziell. Hierbei hat jeder Eintrag eine Information aus jeder Spalte. Bei der spaltenorientierten Form der Datenlagerung wird jede Spalte nacheinan­der und vollständig in aufeinanderfolgenden Einheiten im Computerspeicher abgelegt. In gewöhnlichen DBMS wird die Datenablage zeilenorientiert orga­nisiert. Klassische, Festplattenspeicher-orientierte Datenbanken profitieren von der zeilenorientierten Datenablage, da die Performanz hier im Wesentli­chen von der Geschwindigkeit der Verarbeitung innerhalb der CPU liegt, wo die zeilenorientierte Form gegenüber der spaltenorientierten Form Vorteile hat. Die Spaltenorientierte Form bringt eine Reihe von Vorteilen hinsichtlich der Laufzeit gegenüber der zeilenorientierten Form, insofern es sich um eine Arbeitsspeicher-orientierte Datenbank handelt.

- Die Beschränkung der für Berechnungen notwendigen Spalten lässt sich vornehmen.
- Die Tabellen werden basierend auf Ausprägungswerten weniger Spal­ten durchsucht.
- Daten können bei geeigneter Struktur stärker komprimiert werden, da der Faktor für Komprimierungen steigt, wenn die Ausprägungswerte der Spalten geringere Unterschiede haben.
- Die implizite Erstellung eines Indexes für jede Spalte macht eine zu­sätzliche Indexbildung überflüssig.

Diese Vorteile der spaltenorientierten Datenablage resultieren in einer hohen Performanz für die Durchsuchung von Anwendungen.25 Nicht nur hinsichtlich des Arbeitsspeichers, weist das System gegenüber anderen Datenbankmanagementsystemen einen Performanz-Vorteil auf. Auch die Verarbeitung im Prozessor hat in der HANA-Architektur einen Vorteil. HANA wurde konzipiert, um grundlegende Berechnungen wie analytische Joins, Scans und Aggregationen parallel durchzuführen. Das System nutzt für diese Form der parallelen Verarbeitung auch bei verteilten Sys­temen die Rechenleistung aus, sodass Gegebenheiten wie viel Arbeits­speicher und eine große Menge an CPU-Kernen für die Datenauswertung einen vernehmbaren Effekt auf die Geschwindigkeit haben. Bei Verwen­dung der Spaltenorientierung können die Operationen auf Daten der ein­zelnen Spalten angewendet werden, wie beispielsweise Suchen, Aggre- gationen oder als Schleife über ein Array, das in zusammenhängenden Speicherplätzen gespeichert ist. Derartige Operationen sind bei gegebe­ner Spaltenorientierung sehr effizient in der Verarbeitung innerhalb des CPU-Caches. Bei zeilenorientierter Speicherung sind dieselben Operatio­nen deutlich langsamer, da die Daten derselben Spalte über den Spei­cher verteilt sind und die CPU durch Cache-Misses verlangsamt wird. Bei der Spaltenorientierung sind die Daten vertikal partitioniert, was zur Folge hat, dass Operationen auf verschiedenen Spalten leicht parallel verarbei­tet werden. Wenn mehrere Spalten durchsucht oder aggregiert werden müssen, kann jede dieser Operationen einem anderen Prozessorkern zu­geordnet werden. Darüber hinaus können Operationen auf einer Spalte parallelisiert werden, indem die Spalte in mehrere Abschnitte unterteilt wird, die von verschiedenen Prozessorkernen verarbeitet werden kön- nen.23 24 25 26

2.3 SAP HANA Express-Edition

Die SAP HANA Express-Edition (HXE) ist eine in seiner Verwendbarkeit be­schränkte Einstiegsversion von SAP HANA, die für die Ausführung auf einem persönlichen Laptop oder Desktop-Computer, auf einem Server oder in der Cloud optimiert ist. Die HXE lässt sich als Installationspaket auf einem Com­puter mit Linux-Betriebssystem oder als virtuelle Maschine in allen Compu­tern, welche einen Hypervisor ausführen können, installieren und ausführen. Weiterhin sind die grundlegenden Hardware-Ressourcen des Computers oder des Servers, auf dem die HXE laufen soll, ein Kriterium für die Ver­wendbarkeit, welche in Kapitel drei im Abschnitt der Installation vertieft wer­den. Es können mit der HXE Anwendungen im Bereich von bis zu 32GB Speichervolumen kostenlos entwickelt werden. Bei Bedarf ist es möglich, schrittweise, entgeltlich mehr Speichervolumen bis zu 128 GB Speichervo­lumen zu buchen. Die HXE ist in ihrem Funktionsumfang zwar sehr vielfältig, verglichen mit der Vollversion jedoch begrenzt. Bei Bedarf von Funktionen, welcher nur in der Vollversion verfügbar sind, lässt sich eine Lizenz erwer­ben, welche einen fließenden Übergang von der HXE zur Vollversion ermög­licht. Ein Beispiel für eine ergänzende Funktion der Vollversion ist das intelli­gente Datenstreaming bzw. Smart Data Integration.27

2.3.1 Datenauswertungsfunktionalität

SAP HANA bietet eine Plattform für viele Anwendungen der Datenauswer­tung. Die HXE ermöglicht die Durchführung für alle Prozeduren innerhalb der limitierten Rahmenbedingungen. Die Datenauswertungsfunktionalität lässt sich in die folgenden Domänen untergliedern:

Data Modeling and Analytics Die Möglichkeiten, welche dieser Domäne zugeordnet sind, lassen sich als analytische Verarbeitungsmodule und erweiterte Datenscheiben, beschrei­ben, die innerhalb der HANA-DB verwendbar sind. Es lassen sich Ansichten definieren, welche Informationen über die Kombination von vorhandenen At­tributen und Kennzahlen aus Transaktions- und Analysedaten beinhalten. Es können hierbei auch bekannte Datenbankspezifische Operationen wie Joins, Aggregationen und Filter getätigt werden mit dem Ergebnis einer neuen Be­rechnung. Die Daten lassen sich in der Verwendung unter der Visual-Ansicht in graphische Darstellungen anzeigen.

Microservices innerhalb SAP HANA XS Advanced Applications Die Domäne Microservices beschreibt eine Schnittstelle, welche es ermög­licht, nach dem Ansatz von Micro-Services Code an das Programm einzu­binden, welcher spezielle, selbsterstellte Funktionalität erfüllt. Hierbei decken die Sprachen Python, Node.js und Java die Standardsprachen für die Micro­services ab. Je nach Konfiguration, der von der SAP bereitgestellten Build­Packs lassen sich auch Programme, die in anderen Sprachen programmiert sind, implementieren.

Machine Learning Innerhalb der Machine Learning Domäne können Anwendungen erstellt wer­den, welche regelbasierte und sich wiederholende Prozesse automatisieren und sich fortlaufend optimieren lassen. Die Machine-Learning-Anwendungen lassen sich hierbei mithilfe XS Advanced und SQL entwickeln.

Geospatial Dieser Domäne sind die Speicherung, Verarbeitung und Visualisierung von speziellen Geodaten, zugeordnet. Hierbei können die erfassten Geodaten mit anderen Daten integriert, gespeichert und weiterverarbeitet werden.

Text Analytics Innerhalb dieser Domäne befinden sich Such-, Textanalyse- und Text-Mining Funktionen für unstrukturierte Textquellen.

Predictive Analytics Innerhalb dieser Domäne befindet sich die Anwendungsbibliothek für Predic­tive Analytics Algorithmen. Hierbei gibt es durch den Import der Predictive Analysis Library (PAL) eine Verfügbarkeit von einigen unterschiedlichen Al­gorithmen für vorhersagende Werte für Daten. Dazu gehören Algorithmen der Klassifizierungskategorien Regression, Zeitreihen für die Vorhersage und Erkennung von Ausreißern sowie Datenaufbereitung.

SAP HANA Sreaming Analytics Die Domäne Streaming Analytics erweitert die Plattform um hochleistungsfä­hige Ereignisstromverarbeitung und Complex Event Processing (CEP). Diese Integration ermöglicht smart-stream-capture und aktive Ereignisüberwa­chung. Ein weiteres Feature ist die Echtzeit-Streaming-Analyse, mit der die Erstellung von IoT-Anwendungen möglich wird.

Hibernate Diese Domäne ermöglicht die multimodale Analyse. Der Funktionsumfang reicht unter dieser Domäne von Text- und Raumdaten über Hibernate Dialek­te, Abstraktionsschichten, Dokumentenspeicher und Grafiken bis zu XML­Mapping. Hierbei gibt es für relationale Datenbanken die Bibliothek Hibernate ORM und für nicht-relationale Ansätze die Bibliothek Hibernate OGM.28

Damit die Funktionen unterhalb der Domänen innerhalb der HXE verwendet werden können, sind unterschiedliche Schritte für die Installation, Konfigura­tion und Einbindung von Schnittstellen und Bibliotheken notwendig.

2.3.2 Application Function Library (AFL)

Die Application Function Library beschreibt ein Archiv, welche mehrere Funk­tionsbibliotheken beinhaltet. Dazu gehören beispielsweise die Automated Predictive Library (APL), die Business Function Library (BFL) oder die Pre­dictive Analysis Library (PAL). Die Application Function Library ist nach der Installation kein Teil der HANA Appliance, wenn die AFL nicht explizit instal­liert wird. Eine proaktive Möglichkeit ist die Auswahl der Installation von Ser­ver + Application. Die AFL kann auch seperat vom Administrator bezie­hungsweise vom angemeldeten Datenbank-Master User installiert werden.29 30 Die nachfolgende Abbildung beschreibt den Sachverhalt der Application Function Library und die Zugehörigkeit der Funktionsbibliotheken.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 6: SAP HANA Architektur, Application Function Library

2.3.3 Predictive Analysis Library (PAL)

SAP liefert entsprechend den beschriebenen Domänen verschiedene Biblio­theken für die Datenauswertung. Darunter fällt die Predictive Analysis Libra­ry, welche Funktionen definiert, die aus SQL-Script-Prozeduren heraus auf­gerufen werden können, um vorhersagende, analytische Algorithmen auszu­führen. Die Prozeduren können auch aus dem Application Function Modeler heraus aufgerufen werden, was nachfolgend theoretisch beschrieben, und im Kapitel drei dieser Arbeit anhand mehrerer Anwendungsbeispiele praktisch nachvollziehbar ist. Die Auswahl der Algorithmen für die PAL wird auf Basis verschiedener Kriterien entschieden. Hierzu zählen beispielsweise die Not­wendigkeit für Anwendungen, Verbreitung in der Verwendung sowie die Ver­wendung in anderen Datenbankprodukten von beispielsweise anderen Her­stellern. Die in der PAL enthaltenen Algorithmen werden in unterschiedliche Kategorien aufgeteilt, welche einige Algorithmen der gleichen Domäne bein­halten. Hierzu zählen aktuell die Kategorien Clustering, Classification /Regression, Association Rules, Time Series Analysis, Preprocessing, Statis­tics, Social Network Analysis und Miscellaneous.

2.3.4 Application Function Modeler (AFM)

Der SAP HANA Application Function Modeller (AFM) oder ist ein grafischer Editor, mit dem Anwendungsfunktionen erstellt werden können. Mit dem AFM können auf benutzerfreundliche Weise Funktionen der importierten Bibliothe­ken zur AFM-Modelldatei hinzugefügt werden, Parameter- sowie Ein- und Ausgabetabellen durch Textfelder der Funktion zugeordnet werden. Aus den angegebenen Daten und Funktionen lassen sich Prozeduren generieren, ohne SQL-Script oder SQL-Abfragen manuell schreiben zu müssen. Der AFM ist nach der Installation, welche im folgenden Kapitel erläutert wird, in der SAP HANA Entwicklungsperspektive aufrufbar. Es gibt im AFM drei An­sichten. Ein grafischer Bearbeitungsbereich zum Hinzufügen und Verbinden von Anwendungsfunktionen für die gewollten Verfahren. Hierin können Ele­mente per Drag & Drop eingefügt und miteinander verbunden werden. Eine weitere Ansicht ist ein Textfenster, in dem der SQL-Script Code der vorge­nommenen Einstellungen der Anwendungsfunktionen automatisch generiert wird. Für spezielle Änderungen kann hierin der Code angepasst werden. Der Code kann in diesem Fenster auch kopiert werden und beispielsweise für andere Programme verwendet werden, welche die SQL-Script Sprache un­terstützen. Des Weiteren gibt es eine Funktionsansicht oder auch Palette genannt, welche die SAP HANA Anwendungsfunktionen innerhalb ihrer Ka­tegorien auflistet. Diese lassen sich mit Drag & Drop in der grafischen Bear­beitungsansicht in das Modell ziehen und hinsichtlich ihrer Daten, Datenty­pen und Parameter bearbeiten. Je nach Benutzeroberfläche wird der Appli­cation Function Modeler auch als Flowgraph Modeller bezeichnet, wie bei der SAP HANA WEB IDE. 31

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 7: Flowgraph Model, Application Function Modeler

Im Rechten Teil der Abbildung ist zu sehen, dass unter Palette neben der Sparte General, welche die generellen Datenmodell und Datenverbindungsoperationen wie beispielsweise Join, Filter und Union beinhaltet, auch die Predictive Analysis Library zu sehen ist. Der hervorgehenden Importschritte durch die nachfolgend beschriebenen SQL-Befehle, haben dies zur Folge. Die folgenden Abbildungen zeigen die Übersicht über die verfügbaren Funktionen der Importieren Bibliotheken.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 8: Funktionsansicht mit General, BFL und PAL

3 Demo - Reporting und Datenaufbereitung mit SAP HANA - Express Edition

In dieser Demo wird der Prozess von der Installation der HXE, über die Ver­bindung zum Front-End, den Import von Daten bis zu vorhandenen Ergeb­nissen von ausgewählten Algorithmen aus der Predictive Analysis Library, beschrieben. Hierbei werden verschiedene Aspekte aufgegriffen, welche für die im späteren Kapitel der Ergebnisse von Relevanz bezüglich der For­schungsfrage sind. Beschrieben wird nachfolgend die Systemumgebung, welche bei Fragen hinsichtlich der Performanz gemessen in Laufzeit eine zentrale Rolle spielt, da eine andere Hardware auch andere Ergebnisse er­zielen kann. Weiterhin wird in diesem Kapitel die Installation und Einrichtung der Systeme beschrieben, sodass dieser Prozess ebenfalls auf die beschrie­benen Bewertungskriterien untersucht werden kann. Es werden nachfolgend die Vorgehensweisen bei der Verwendung und Ausführung der ausgewähl­ten Algorithmen Auto Arima in Verbindung mit Arima Forecast und K-Means beschrieben, woraus sich die Erkenntnisse zur Beantwortung der For­schungsfrage ableiten.

3.1 Umgebung und Einrichtung der Systeme

Damit die SAP HANA Express-Edition in der VM auf einem Rechner instal­liert und betrieben werden kann, werden für die Server-only-VM 8 GB, und für die Server+Application VM 16 GB Arbeitsspeicher als Mindestvorausset­zung benötigt. Es wird JRE 8 (64-bit for Windows/Linux) benötigt, welche den Download-Manager unterstützt. Damit das funktioniert, muss die Systemvari­able JAVA_HOME mit dem Path für das JRE hinterlegt werden. Eine korrek­te Path-Angabe sowie die Auswahl der richtigen Java-Version zum Zeitpunkt der Installation ist hierbei von entscheidender Bedeutung, damit der Down­load Manager der SAP HXE gestartet werden kann. Es werden für beide In­stallationsvarianten mindestens 120 GB HDD Speicher sowie 2 reale Cores mit 4 logischen Cores in der CPU benötigt.

3.1.1 Installation von SAP HANA Express-Edition

Die Installationsdatei, mit der Bezeichnung SAP HANA, Express Edition Download Manager wird von SAP auf der entsprechenden Webseite kosten­los zur Verfügung gestellt.31 32

Wenn die Systemumgebung gemäß den Spezifikationen für die Installation eingestellt wurde, lässt sich der SAP HANA, Express Edition Download Ma­nager starten. Nach dem Doppelklick auf den Download Manager öffnet sich das folgende Fenster.

[...]


1 Vgl. Haupt unter: https://medium.com/project-2030/data-is-the-new-oil-a-ludicrous- proposition-1d91bba4f294 Zugriff am 10.08.2020

2 Vgl.https://www.wirtschaftsdienst.eu/pdf- download/jahr/2018/heft/7/beitrag/datenkapitalismus-eine-oekonomische-betrachtung.html Zugriff am: 10.08.2020

3 Vgl. https://de.statista.com/statistik/daten/studie/814982/umfrage/umfrage-zur-auswirkung- der-digitalisierung-auf-den-umsatz-deutscher-untemehmen/_Zugriff am: 10.08.2020

4 Vgl. https://de.statista.com/statistik/daten/studie/259969/umfrage/umsatz-mit-business- intelligence-und-analytics-software-weltweit/ Zugriff am: 10.08.2020

5 Vgl. https://de.statista.com/statistik/daten/studie/780780/umfrage/umsatz-mit-big-data-und- analytics-software-weltweit/ Zugriff am: 26.08.2020

6 Vgl. https://news.sap.com/germany/2015/09/ist-eigentlich-sap-hana/_Zugriff am: 10.08.2020

7 https://de.wikipedia.org/wiki/Predictive_analytics_Zugriff am: 10.08.2020

8 Vgl. https://de.statista.com/statistik/daten/studie/529006/umfrage/bedeutung-von- predicitve-analytics-fuer-den-online-handel-in-deutschland/_Zugriff am: 10.08.2020

9 https://www.sap.com/cmp/td/sap-hana-express-edition.html Zugriff am: 16.08.2020

10 Vgl. Aschermann: Über SAP - was heißt das?: Unter https://praxistipps.chip.de/sap-was- heisst-das-die-abkuerzung-einfach-erklaert_50511 Zugriff am 16.05.2020

11 Vgl. https://de.wikipedia.org/wiki/SAP_HANA Zugriff am 26.08.2020

12 Vgl. Fröschle et al. 2016, S.200

13 Vgl. Preuss 2017, S.133

14 Vgl. Preuss 2017, S.2

15 Vgl. Preuss 2017, S.7

16 Vgl. Prassol 2015, S.362

17 Vgl. Preuss, 2017, S.133

18 Vgl. Fasel et. al, 2016, S.199

19 Vgl. Fasel et. al, 2016, S.201

20 Vgl. SAP SE, 2014, S.14

21 Vgl. SAP SE, 2014, S.14

22 Vgl. Prassol, 2015, S. 363

23 Vgl. Prassol, 2015, S. 363

24 Vgl. Prassol, 2015, S.65

25 Vgl. Prassol, 2015, S.365

26 Vgl. SAP SE, 2014, S.12

27 Vgl. SAP SE, 2016, S 1ff.

28 Vgl. SAP: SAP HANA unter: https://www.sap.com/germany/products/hana/features/app- development.html Zugriff am 15.06.2020

29 Vgl. SAP: https://help.sap.com/viewer/aa94b47610d545f28dd90711580350d6/2.0.00/en- US/1075a25a03c349d18b36be9ab6de02cc.html: Zugriff am 20.06.2020

30 Vgl. SAP SE unter: https://blogs.sap.com/2015/03/02/what-is-the-sap-automated-

31 predictive-library-apl-for-sap-hana/ Zugriff am 15.08.2020

32 Vgl. SAP SE unter: https://www.sap.com/cmp/td/sap-hana-express-edition.html Zugriff am: 19.08.2020

Ende der Leseprobe aus 107 Seiten

Details

Titel
Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb
Hochschule
Hochschule Furtwangen
Note
1,7
Autor
Jahr
2020
Seiten
107
Katalognummer
V961362
ISBN (eBook)
9783346331762
Sprache
Deutsch
Schlagworte
Predictive Analytics, Big Data, SAP HANA, SAP HANA Express Edition
Arbeit zitieren
Julius Dold (Autor), 2020, Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb, München, GRIN Verlag, https://www.grin.com/document/961362

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden