Bachelorarbeit, 2020
107 Seiten, Note: 1,7
1 Einleitung
1.1 Motivation und Ziel dieser Arbeit
1.2 Aufbau der Arbeit
2 Überblick SAP HANA
2.1 Historie von SAP HANA
2.2 Architektonische Merkmale
2.3 SAP HANA Express-Edition
2.3.1 Datenauswertungsfunktionalität
2.3.2 Application Function Library (AFL)
2.3.3 Predictive Analysis Library (PAL)
2.3.4 Application Function Modeler (AFM)
3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition
3.1 Umgebung und Einrichtung der Systeme
3.1.1 Installation von SAP HANA Express-Edition
3.1.2 Test der Installation
3.1.3 Konfiguration von SAP HANA Tools für Eclipse
3.1.4 Einbindung der Datenbank und Konfiguration
3.2 Datengrundlage
3.3 Versuch Algorithmen und Datenauswertung
3.3.1 PAL: Time-Series Analysis Auto Arima und Arima Forecast
3.3.2 PAL: K-Means Clustering
4 Lessons Learned
4.1 Einarbeitung
4.2 Komplexität
4.3 Möglichkeiten
4.4 Einschränkungen
4.5 Laufzeitbeobachtungen
4.5.1 Rechnerkapazitätsauslastung
4.5.2 Vergleich von lokaler und verteilter Architektur
4.5.3 Laufzeitmessungen bei unterschiedlich großen Datenmengen
4.6 Ergebnisse der Laufzeitmessungen und Interpretation
5 Fazit
5.1 Zusammenfassung
5.2 Beantwortung der Forschungsfrage
5.3 Erschaffener Mehrwert
5.4 Limitationen
5.5 Weitere Forschung
6 Inhalt Anhang
6.1 AFM JOIN Operation Business Case BRAVO
6.1.1 Snowflake-Schema
6.1.2 Datenimport und Aufbereitung
6.1.3 Datenverbindung
6.2 Details zu den Laufzeitmessungen
6.3 Zugriffsrecht-Management
Die vorliegende Arbeit untersucht die Eignung der SAP HANA Express-Edition für den Einsatz in der Hochschullehre im Bereich Predictive Analytics. Dabei liegt der Fokus auf der praktischen Verwendbarkeit des Systems, der erforderlichen Einarbeitung sowie der Performance unter realitätsnahen Hardwarebedingungen für Studierende.
3.3 Versuch Algorithmen und Datenauswertung
Damit die Express Edition von SAP HANA auf Ihre Potenziale für die Datenanalyse erprobt werden kann, werden in den folgenden Abschnitten drei Algorithmen aus der Predictive Analysis Library entlang des Prozesses im AFM durchlaufen und beschrieben. Es wird zunächst der Auto-Arima Algorithmus durchgeführt, was zwar keine Vorhersage im Sinne von Predictive Analytics nach sich zieht, allerdings für weitere Zeitreihenvorhersagen hilfreich ist, da es bei Arima-Prozeduren schwierig ist, geeignete Ordnungen zu finden. Die Ergebnistabelle des Auto-Arima-Algorithmus wird anschließend als Inputtabelle für den Arima-Forecast-Algorithmus verwendet, welcher Logiken und Parameter beinhaltet, die eine Zeitreihenvorhersage für manuell veränderbar viele Zeitpunkte errechnet. Anschließend wird aus der PAL Kategorie Clustering der K-Means Algorithmus ebenfalls entlang des Prozesses im AFM durchlaufen und beschrieben.
1 Einleitung: Diese Einleitung führt in die Bedeutung der Datenanalyse für die Digitalisierung ein, definiert das Ziel der Arbeit zur Untersuchung der SAP HANA Express-Edition in der Lehre und gibt einen Überblick über den Aufbau der Arbeit.
2 Überblick SAP HANA: Dieses Kapitel liefert die theoretischen Grundlagen zu SAP HANA, der Systemarchitektur, den Integrationsmöglichkeiten und den spezifischen Komponenten wie der Express-Edition, PAL und dem Application Function Modeler.
3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition: Hier wird der gesamte praktische Prozess von der Systemeinrichtung über den Import der Datengrundlage bis zur Durchführung von Predictive-Analytics-Algorithmen und der Ergebnisvisualisierung dokumentiert.
4 Lessons Learned: Dieses Kapitel fasst die praktischen Erfahrungen zusammen, beleuchtet Aspekte wie Einarbeitung, Systemkomplexität und Einschränkungen und präsentiert die erhobenen Laufzeitmessungen für verschiedene Szenarien.
5 Fazit: Das Fazit fasst die Ergebnisse zusammen, beantwortet die zentrale Forschungsfrage hinsichtlich der Eignung für die Lehre und diskutiert Limitationen sowie Ansatzpunkte für weitere Forschung.
6 Inhalt Anhang: Der Anhang enthält detaillierte Prozessbeschreibungen zum Business Case BRAVO, das zugrunde liegende Snowflake-Schema sowie tabellarische Dokumentationen der durchgeführten Laufzeitmessungen.
SAP HANA Express-Edition, Predictive Analytics, Datenanalyse, In-Memory-Datenbank, Hochschullehre, Application Function Modeler, Algorithmen, Laufzeitmessung, Performance, Big Data, Zeitreihenanalyse, K-Means Clustering, Systemarchitektur, Datenimport, IT-Infrastruktur
Die Arbeit untersucht die Eignung und Performance der SAP HANA Express-Edition für den Einsatz in der fortgeschrittenen Lehre, insbesondere im Bereich der Datenverarbeitung und Predictive Analytics.
Die zentralen Themen umfassen die SAP HANA-Architektur, die Nutzung der Application Function Library (AFL), die praktische Konfiguration sowie die Durchführung von Predictive-Algorithmen wie Arima und K-Means.
Das Ziel ist die Erprobung der Software auf Potenziale hinsichtlich Einarbeitung, Komplexität, Möglichkeiten und Einschränkungen sowie die Messung der Performance auf Hardware, die für Studierende zugänglich ist.
Der Autor führt eine theoretische Analyse der HANA-Architektur durch, kombiniert mit einer praktischen Demo-Reihe, die Konfigurationsschritte und explizite Laufzeitmessungen bei unterschiedlichen Datenmengen umfasst.
Der Hauptteil konzentriert sich auf die detaillierte Einrichtung des Systems (Server, Web IDE, Eclipse-Integration) und die praktische Anwendung der Predictive Analysis Library mittels des grafischen Application Function Modelers.
Die Arbeit lässt sich am besten mit Begriffen wie SAP HANA Express-Edition, Predictive Analytics, Performance, Systemarchitektur und Hochschullehre zusammenfassen.
Das System erwies sich bei der Verarbeitung von Datensätzen bis zu 250.000 Zeilen als sehr performant, stieß jedoch bei größeren Mengen an die Hardware-Grenzen des verfügbaren Java-Heap-Space.
Ein wesentliches Hindernis ist die mangelnde Transparenz der Express-Edition bei komplexen Fehlern, da der Zugriff auf detaillierte System-Logs (wie den Indexserver-Trace) in der kostenlosen Version eingeschränkt ist.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

