Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb

Bachelorarbeit, 2020
107 Seiten, Note: 1,7

Informatik - Wirtschaftsinformatik

Leseprobe

Inhaltsverzeichnis

1 Einleitung

1.1 Motivation und Ziel dieser Arbeit

1.2 Aufbau der Arbeit

2 Überblick SAP HANA

2.1 Historie von SAP HANA

2.2 Architektonische Merkmale

2.3 SAP HANA Express-Edition

2.3.1 Datenauswertungsfunktionalität

2.3.2 Application Function Library (AFL)

2.3.3 Predictive Analysis Library (PAL)

2.3.4 Application Function Modeler (AFM)

3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition

3.1 Umgebung und Einrichtung der Systeme

3.1.1 Installation von SAP HANA Express-Edition

3.1.2 Test der Installation

3.1.3 Konfiguration von SAP HANA Tools für Eclipse

3.1.4 Einbindung der Datenbank und Konfiguration

3.2 Datengrundlage

3.3 Versuch Algorithmen und Datenauswertung

3.3.1 PAL: Time-Series Analysis Auto Arima und Arima Forecast

3.3.2 PAL: K-Means Clustering

4 Lessons Learned

4.1 Einarbeitung

4.2 Komplexität

4.3 Möglichkeiten

4.4 Einschränkungen

4.5 Laufzeitbeobachtungen

4.5.1 Rechnerkapazitätsauslastung

4.5.2 Vergleich von lokaler und verteilter Architektur

4.5.3 Laufzeitmessungen bei unterschiedlich großen Datenmengen

4.6 Ergebnisse der Laufzeitmessungen und Interpretation

5 Fazit

5.1 Zusammenfassung

5.2 Beantwortung der Forschungsfrage

5.3 Erschaffener Mehrwert

5.4 Limitationen

5.5 Weitere Forschung

6 Inhalt Anhang

6.1 AFM JOIN Operation Business Case BRAVO

6.1.1 Snowflake-Schema

6.1.2 Datenimport und Aufbereitung

6.1.3 Datenverbindung

6.2 Details zu den Laufzeitmessungen

6.3 Zugriffsrecht-Management

Zielsetzung & Themen

Die vorliegende Arbeit untersucht die Eignung der SAP HANA Express-Edition für den Einsatz in der Hochschullehre im Bereich Predictive Analytics. Dabei liegt der Fokus auf der praktischen Verwendbarkeit des Systems, der erforderlichen Einarbeitung sowie der Performance unter realitätsnahen Hardwarebedingungen für Studierende.

Installation und Konfiguration der SAP HANA Express-Edition
Anwendung von Predictive Analytics Algorithmen (Auto-Arima, K-Means)
Evaluierung der Systemkomplexität und technischer Hürden
Laufzeitanalyse bei variierenden Datenmengen

Auszug aus dem Buch

3.3 Versuch Algorithmen und Datenauswertung

Damit die Express Edition von SAP HANA auf Ihre Potenziale für die Datenanalyse erprobt werden kann, werden in den folgenden Abschnitten drei Algorithmen aus der Predictive Analysis Library entlang des Prozesses im AFM durchlaufen und beschrieben. Es wird zunächst der Auto-Arima Algorithmus durchgeführt, was zwar keine Vorhersage im Sinne von Predictive Analytics nach sich zieht, allerdings für weitere Zeitreihenvorhersagen hilfreich ist, da es bei Arima-Prozeduren schwierig ist, geeignete Ordnungen zu finden. Die Ergebnistabelle des Auto-Arima-Algorithmus wird anschließend als Inputtabelle für den Arima-Forecast-Algorithmus verwendet, welcher Logiken und Parameter beinhaltet, die eine Zeitreihenvorhersage für manuell veränderbar viele Zeitpunkte errechnet. Anschließend wird aus der PAL Kategorie Clustering der K-Means Algorithmus ebenfalls entlang des Prozesses im AFM durchlaufen und beschrieben.

Zusammenfassung der Kapitel

1 Einleitung: Diese Einleitung führt in die Bedeutung der Datenanalyse für die Digitalisierung ein, definiert das Ziel der Arbeit zur Untersuchung der SAP HANA Express-Edition in der Lehre und gibt einen Überblick über den Aufbau der Arbeit.

2 Überblick SAP HANA: Dieses Kapitel liefert die theoretischen Grundlagen zu SAP HANA, der Systemarchitektur, den Integrationsmöglichkeiten und den spezifischen Komponenten wie der Express-Edition, PAL und dem Application Function Modeler.

3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition: Hier wird der gesamte praktische Prozess von der Systemeinrichtung über den Import der Datengrundlage bis zur Durchführung von Predictive-Analytics-Algorithmen und der Ergebnisvisualisierung dokumentiert.

4 Lessons Learned: Dieses Kapitel fasst die praktischen Erfahrungen zusammen, beleuchtet Aspekte wie Einarbeitung, Systemkomplexität und Einschränkungen und präsentiert die erhobenen Laufzeitmessungen für verschiedene Szenarien.

5 Fazit: Das Fazit fasst die Ergebnisse zusammen, beantwortet die zentrale Forschungsfrage hinsichtlich der Eignung für die Lehre und diskutiert Limitationen sowie Ansatzpunkte für weitere Forschung.

6 Inhalt Anhang: Der Anhang enthält detaillierte Prozessbeschreibungen zum Business Case BRAVO, das zugrunde liegende Snowflake-Schema sowie tabellarische Dokumentationen der durchgeführten Laufzeitmessungen.

Schlüsselwörter

SAP HANA Express-Edition, Predictive Analytics, Datenanalyse, In-Memory-Datenbank, Hochschullehre, Application Function Modeler, Algorithmen, Laufzeitmessung, Performance, Big Data, Zeitreihenanalyse, K-Means Clustering, Systemarchitektur, Datenimport, IT-Infrastruktur

Häufig gestellte Fragen

Worum geht es in der vorliegenden Bachelorarbeit?

Die Arbeit untersucht die Eignung und Performance der SAP HANA Express-Edition für den Einsatz in der fortgeschrittenen Lehre, insbesondere im Bereich der Datenverarbeitung und Predictive Analytics.

Welche zentralen Themenfelder behandelt der Autor?

Die zentralen Themen umfassen die SAP HANA-Architektur, die Nutzung der Application Function Library (AFL), die praktische Konfiguration sowie die Durchführung von Predictive-Algorithmen wie Arima und K-Means.

Was ist das primäre Ziel der Untersuchung?

Das Ziel ist die Erprobung der Software auf Potenziale hinsichtlich Einarbeitung, Komplexität, Möglichkeiten und Einschränkungen sowie die Messung der Performance auf Hardware, die für Studierende zugänglich ist.

Welche wissenschaftlichen Methoden wurden angewandt?

Der Autor führt eine theoretische Analyse der HANA-Architektur durch, kombiniert mit einer praktischen Demo-Reihe, die Konfigurationsschritte und explizite Laufzeitmessungen bei unterschiedlichen Datenmengen umfasst.

Was wird im Hauptteil der Arbeit behandelt?

Der Hauptteil konzentriert sich auf die detaillierte Einrichtung des Systems (Server, Web IDE, Eclipse-Integration) und die praktische Anwendung der Predictive Analysis Library mittels des grafischen Application Function Modelers.

Welche Schlagworte charakterisieren diese Arbeit?

Die Arbeit lässt sich am besten mit Begriffen wie SAP HANA Express-Edition, Predictive Analytics, Performance, Systemarchitektur und Hochschullehre zusammenfassen.

Wie performant erwies sich das System laut den Messungen?

Das System erwies sich bei der Verarbeitung von Datensätzen bis zu 250.000 Zeilen als sehr performant, stieß jedoch bei größeren Mengen an die Hardware-Grenzen des verfügbaren Java-Heap-Space.

Welche Hindernisse bei der Fehlersuche identifizierte der Autor?

Ein wesentliches Hindernis ist die mangelnde Transparenz der Express-Edition bei komplexen Fehlern, da der Zugriff auf detaillierte System-Logs (wie den Indexserver-Trace) in der kostenlosen Version eingeschränkt ist.

Ende der Leseprobe aus 107 Seiten - nach oben

Details

Titel: Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb
Hochschule: Hochschule Furtwangen
Note: 1,7
Autor: Julius Dold (Autor:in)
Erscheinungsjahr: 2020
Seiten: 107
Katalognummer: V961362
ISBN (eBook): 9783346331762
Sprache: Deutsch
Schlagworte: Predictive Analytics Big Data SAP HANA SAP HANA Express Edition
Produktsicherheit: GRIN Publishing GmbH
Preis (Ebook): US$ 42,99

Arbeit zitieren: Julius Dold (Autor:in), 2020, Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb, München, Page::Imprint:: GRINVerlagOHG, https://www.diplomarbeiten24.de/document/961362