Die SAP HANA – Express Edition ist eine kostenlose Möglichkeit, SAP HANA in eingeschränktem Umfang zu verwenden. SAP verspricht einen großen Funktionsumfang und eine hohe Performanz innerhalb der Datenverarbeitung und bei der Analyse, was den Bereich von Predictive Analytics miteinschließt. Die Dokumentation rund um das System ist sehr ausführlich, jedoch gibt es keine Quelle, die darüber informiert, inwiefern sich die SAP HANA Express – Edition in der Lehre anhand ausgewählter Kriterien verwenden lässt. In der vorliegenden Arbeit wird die Verwendbarkeit des Systems anhand verschiedener Kriterien aus der Lehre sowie durch Laufzeitmessungen erforscht. Um das System zu bewerten, wurde neben einigen Installations- und Konfigurations-schritten, die Anwendung von Algorithmen aus dem Bereich Predictive Analytics durchgeführt. Dabei wurde auf die notwendige Einarbeitung, die auftretende Komplexität, die Möglichkeiten innerhalb des Systems sowie auf Beschränkungen geachtet. Weiterhin wurden durch explizite Laufzeittests verschiedene Erkenntnisse ermittelt. Es kam unter anderem heraus, dass die Einarbeitung einiger Informationstechnologischer Vorerfahrung bedarf, die Komplexität durch Alternativpfade und Objekt-Zusammenhänge gekennzeichnet ist, die Möglichkeiten hinsichtlich des Handlings und des Funktionsumfangs sehr weitläufig sind und es Einschränkungen bei der Transparenz von Fehlersuchen gibt. Die Laufzeitmessungen zeigen, wie sich die Auslagerung des Front-Ends auf die Performanz auswirkt, wie sich das System bei der Verarbeitung von 150 Datensätzen schrittweise bis zu einer Million Datensätze verhält und wo die Grenzen der Hardware liegen. Die SAP HANA – Express Edition ist ein sehr geeignetes System für den Einsatz in der fortgeschrittenen Lehre der Datenverarbeitung.

Excerpt

Inhaltsverzeichnis

1 Einleitung

1.1 Motivation und Ziel dieser Arbeit

1.2 Aufbau der Arbeit

2 Überblick SAP HANA

2.1 Historie von SAP HANA

2.2 Architektonische Merkmale

2.3 SAP HANA Express-Edition

2.3.1 Datenauswertungsfunktionalität

2.3.2 Application Function Library (AFL)

2.3.3 Predictive Analysis Library (PAL)

2.3.4 Application Function Modeler (AFM)

3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition

3.1 Umgebung und Einrichtung der Systeme

3.1.1 Installation von SAP HANA Express-Edition

3.1.2 Test der Installation

3.1.3 Konfiguration von SAP HANA Tools für Eclipse

3.1.4 Einbindung der Datenbank und Konfiguration

3.2 Datengrundlage

3.3 Versuch Algorithmen und Datenauswertung

3.3.1 PAL: Time-Series Analysis Auto Arima und Arima Forecast

3.3.2 PAL: K-Means Clustering

4 Lessons Learned

4.1 Einarbeitung

4.2 Komplexität

4.3 Möglichkeiten

4.4 Einschränkungen

4.5 Laufzeitbeobachtungen

4.5.1 Rechnerkapazitätsauslastung

4.5.2 Vergleich von lokaler und verteilter Architektur

4.5.3 Laufzeitmessungen bei unterschiedlich großen Datenmengen

4.6 Ergebnisse der Laufzeitmessungen und Interpretation

5 Fazit

5.1 Zusammenfassung

5.2 Beantwortung der Forschungsfrage

5.3 Erschaffener Mehrwert

5.4 Limitationen

5.5 Weitere Forschung

6 Inhalt Anhang

6.1 AFM JOIN Operation Business Case BRAVO

6.1.1 Snowflake-Schema

6.1.2 Datenimport und Aufbereitung

6.1.3 Datenverbindung

6.2 Details zu den Laufzeitmessungen

6.3 Zugriffsrecht-Management

Zielsetzung & Themen

Die vorliegende Arbeit untersucht die Eignung der SAP HANA Express-Edition für den Einsatz in der Hochschullehre im Bereich Predictive Analytics. Dabei liegt der Fokus auf der praktischen Verwendbarkeit des Systems, der erforderlichen Einarbeitung sowie der Performance unter realitätsnahen Hardwarebedingungen für Studierende.

Installation und Konfiguration der SAP HANA Express-Edition
Anwendung von Predictive Analytics Algorithmen (Auto-Arima, K-Means)
Evaluierung der Systemkomplexität und technischer Hürden
Laufzeitanalyse bei variierenden Datenmengen

Auszug aus dem Buch

3.3 Versuch Algorithmen und Datenauswertung

Damit die Express Edition von SAP HANA auf Ihre Potenziale für die Datenanalyse erprobt werden kann, werden in den folgenden Abschnitten drei Algorithmen aus der Predictive Analysis Library entlang des Prozesses im AFM durchlaufen und beschrieben. Es wird zunächst der Auto-Arima Algorithmus durchgeführt, was zwar keine Vorhersage im Sinne von Predictive Analytics nach sich zieht, allerdings für weitere Zeitreihenvorhersagen hilfreich ist, da es bei Arima-Prozeduren schwierig ist, geeignete Ordnungen zu finden. Die Ergebnistabelle des Auto-Arima-Algorithmus wird anschließend als Inputtabelle für den Arima-Forecast-Algorithmus verwendet, welcher Logiken und Parameter beinhaltet, die eine Zeitreihenvorhersage für manuell veränderbar viele Zeitpunkte errechnet. Anschließend wird aus der PAL Kategorie Clustering der K-Means Algorithmus ebenfalls entlang des Prozesses im AFM durchlaufen und beschrieben.

Zusammenfassung der Kapitel

1 Einleitung: Diese Einleitung führt in die Bedeutung der Datenanalyse für die Digitalisierung ein, definiert das Ziel der Arbeit zur Untersuchung der SAP HANA Express-Edition in der Lehre und gibt einen Überblick über den Aufbau der Arbeit.

2 Überblick SAP HANA: Dieses Kapitel liefert die theoretischen Grundlagen zu SAP HANA, der Systemarchitektur, den Integrationsmöglichkeiten und den spezifischen Komponenten wie der Express-Edition, PAL und dem Application Function Modeler.

3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition: Hier wird der gesamte praktische Prozess von der Systemeinrichtung über den Import der Datengrundlage bis zur Durchführung von Predictive-Analytics-Algorithmen und der Ergebnisvisualisierung dokumentiert.

4 Lessons Learned: Dieses Kapitel fasst die praktischen Erfahrungen zusammen, beleuchtet Aspekte wie Einarbeitung, Systemkomplexität und Einschränkungen und präsentiert die erhobenen Laufzeitmessungen für verschiedene Szenarien.

5 Fazit: Das Fazit fasst die Ergebnisse zusammen, beantwortet die zentrale Forschungsfrage hinsichtlich der Eignung für die Lehre und diskutiert Limitationen sowie Ansatzpunkte für weitere Forschung.

6 Inhalt Anhang: Der Anhang enthält detaillierte Prozessbeschreibungen zum Business Case BRAVO, das zugrunde liegende Snowflake-Schema sowie tabellarische Dokumentationen der durchgeführten Laufzeitmessungen.

Schlüsselwörter

SAP HANA Express-Edition, Predictive Analytics, Datenanalyse, In-Memory-Datenbank, Hochschullehre, Application Function Modeler, Algorithmen, Laufzeitmessung, Performance, Big Data, Zeitreihenanalyse, K-Means Clustering, Systemarchitektur, Datenimport, IT-Infrastruktur

Häufig gestellte Fragen

Worum geht es in der vorliegenden Bachelorarbeit?

Die Arbeit untersucht die Eignung und Performance der SAP HANA Express-Edition für den Einsatz in der fortgeschrittenen Lehre, insbesondere im Bereich der Datenverarbeitung und Predictive Analytics.

Welche zentralen Themenfelder behandelt der Autor?

Die zentralen Themen umfassen die SAP HANA-Architektur, die Nutzung der Application Function Library (AFL), die praktische Konfiguration sowie die Durchführung von Predictive-Algorithmen wie Arima und K-Means.

Was ist das primäre Ziel der Untersuchung?

Das Ziel ist die Erprobung der Software auf Potenziale hinsichtlich Einarbeitung, Komplexität, Möglichkeiten und Einschränkungen sowie die Messung der Performance auf Hardware, die für Studierende zugänglich ist.

Welche wissenschaftlichen Methoden wurden angewandt?

Der Autor führt eine theoretische Analyse der HANA-Architektur durch, kombiniert mit einer praktischen Demo-Reihe, die Konfigurationsschritte und explizite Laufzeitmessungen bei unterschiedlichen Datenmengen umfasst.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil konzentriert sich auf die detaillierte Einrichtung des Systems (Server, Web IDE, Eclipse-Integration) und die praktische Anwendung der Predictive Analysis Library mittels des grafischen Application Function Modelers.

Welche Schlagworte charakterisieren diese Arbeit?

Die Arbeit lässt sich am besten mit Begriffen wie SAP HANA Express-Edition, Predictive Analytics, Performance, Systemarchitektur und Hochschullehre zusammenfassen.

Wie performant erwies sich das System laut den Messungen?

Das System erwies sich bei der Verarbeitung von Datensätzen bis zu 250.000 Zeilen als sehr performant, stieß jedoch bei größeren Mengen an die Hardware-Grenzen des verfügbaren Java-Heap-Space.

Welche Hindernisse bei der Fehlersuche identifizierte der Autor?

Ein wesentliches Hindernis ist die mangelnde Transparenz der Express-Edition bei komplexen Fehlern, da der Zugriff auf detaillierte System-Logs (wie den Indexserver-Trace) in der kostenlosen Version eingeschränkt ist.

Excerpt out of 107 pages - scroll top

Details

Title: Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb
College: Furtwangen University
Grade: 1,7
Author: Julius Dold (Author)
Publication Year: 2020
Pages: 107
Catalog Number: V961362
ISBN (eBook): 9783346331762
Language: German
Tags: Predictive Analytics Big Data SAP HANA SAP HANA Express Edition
Product Safety: GRIN Publishing GmbH

Quote paper: Julius Dold (Author), 2020, Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb, Munich, GRIN Verlag, https://www.grin.com/document/961362

Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb