Fachbuch, 2014
27 Seiten, Note: 1.0
1. Einleitung
2. Was ist SAP HANA?
2.1 SAP HANA Architektur
2.1.1 Hardware
2.1.2 Software
2.2 In-Memory-Technologie
3. SAP HANA Studio
3.1 Voraussetzungen
3.2 Installation
3.3 Eclipse-Konfiguration
3.4 Amazon Cloud Konfiguration
3.5 Arbeiten mit SAP HANA Studio
4. Entwicklung einer ersten Applikation
4.1 Verbinden mit SAP HANA
4.2 Tabellen und Testdaten
4.3 Package
4.4 Attribute View
4.5 Auswertungen – Data Preview
5. Zusammenfassung
Literaturverzeichnis
Glossar
A Anhang
a. SQL Scripts
Abbildung 1: SAP HANA Architektur [SAP13]
Abbildung 2: Zeilenorientierte Speicherung (row-based)
Abbildung 3: Spaltenorientierte Speicherung (column-based)
Abbildung 4: Komprimierung von Daten
Abbildung 5: SAP HANA Datenbank, Client und Studio
Abbildung 6: Download von SAP HANA Client und Studio
Abbildung 7: Installation des SAP HANA Clients
Abbildung 8: Installation SAP HANA Cloud Tools
Abbildung 9: Konfiguration des SAP HANA Cloud Trial Accounts
Abbildung 10: Informationen zur SAP HANA Instanz in der Amazon Cloud
Abbildung 11: Konfigurieren der SAP HANA Instanz im HANA Studio
Abbildung 12: Schema "shop" erstellen
Abbildung 13: Startseite der Modeler Perspektive
Abbildung 14: Neues Package erstellen
Abbildung 15: Erstellen eines Attribute Views
Abbildung 16: Verknüpfung von "users"- und "invoices"-Tabelle
Abbildung 17: Attribute View AV01
Abbildung 18: Auswertung der Umsätze, gruppiert nach Kunde
Abbildung 19: Umsatzentwicklung über alle Rechnungen
II. Tabellenverzeichnis
Tabelle 1: Vergleich SAP ERP und SAP BW
Tabelle 2: Amazon Cloud-System m2.xlarge [AMA13]
Tabelle 3: Erstellen der "users"- und „invoices“-Tabellen
Tabelle 4: Einfügen von Testdaten
Tabelle 5: SQL-Script zum Anlegen und Befüllen der Tabellen
In der heutigen Zeit ist das größte und wichtigste Kapital eines Unternehmens sein Wissen, auf dessen Grundlage oft wichtige Entscheidungen der Unternehmensspitze getroffen werden. Dieses Wissen ist in Form von Daten in meist unzähligen Datenbanken abgelegt. Gerade bei großen Konzernen häuft sich über die Jahre eine sehr große Datenmenge an, wodurch es immer schwieriger und kostenintensiver wird, auf diese Daten gezielt zuzugreifen. Bei noch mehr Daten, die für die nahe Zukunft erwartet werden, wird dieses Problem noch gravierender und somit eine immer größere Herausforderung für die Unternehmen.
Die bisherigen Verfahren um diese Datenmengen sinnvoll und zielgerichtet aufzuarbeiten, basieren meist auf unterschiedlichen Systemen. So werden operative und analytische Daten in unterschiedlichen Datenbanken gespeichert. Sollen diese Daten nun ausgewertet werden, um z.B. zukünftige Unternehmensstrategien festzulegen, werden die Daten in einem aufwendigen Verfahren in ein Data-Warehouse (DWH) importiert. Dieser Prozess kann je nach Datenmenge mehrere Tage in Anspruch nehmen, wodurch die Daten schon wieder „veraltet“ sein könnten und somit für den Entscheidungsträger nur noch bedingt von Nutzen sind.
Dieses Problem wurde von IT-Unternehmen erkannt und so wurden verschiedene Systeme entwickelt, um derartige Analysen sehr viel schneller bzw. im Idealfall in sogar Echtzeit durchzuführen. Eines dieser Systeme ist das von der SAP AG[1] entwickelte HANA[2] System, welches auf einer In-Memory-Technologie basiert, um komplexe Analysen von großen Datenmengen zu beschleunigen.
In dieser Arbeit soll die HANA Technologie evaluiert werden. Dabei werden die Konzepte, die zur Beschleunigung von daten- und rechenintensiven Analysen notwendig sind beschrieben und mögliche Einsatzgebiete erörtert. Des Weiteren soll eine Applikation mit der HANA Technologie in der Amazon Cloud entwickelt werden, um somit die Einsatzmöglichkeiten besser definieren zu können.
Die Hauptprodukte der SAP AG ist SAP ERP (Enterprise Resource Planning) und SAP BW (Business Warehouse). Beide sind sehr stark miteinander verbunden, nutzen jedoch im Backend nicht die gleichen Datenbanken. Das ERP System wird benutzt, um Kundendaten zu speichern, Bestellungen zu verwalten, Lieferungen zu verfolgen und Rechnungen zu überprüfen. Es werden damit also „Live-Daten“ verwaltet.
Ganz anders beim BW System. Dieses System wird für Reports und Analysen benutzt. Hierzu werden Daten aus dem ERP System geladen und aufwendig aufbereitet, um sie dann auswerten zu können. Diese Trennung der Daten wird deshalb vorgenommen, um das Live-System nicht mit aufwendigen Auswertungen zu belasten, was jedoch zu langsamen oder verspäteten Reports führen kann. Diese Probleme sollen mit SAP HANA beseitigt werden.
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 1 : Vergleich SAP ERP und SAP BW
SAP HANA wird als Appliance vermarktet, d.h. das Produkt wird als kombiniertes System aus Soft- und Hardware geliefert. Dadurch soll sichergestellt werden, dass nur von der SAP AG geprüfte Systemteile benutzt werden und somit das bestmögliche Ergebnis erzielt werden kann.
HANA arbeitet mit einer speziellen In-Memory-Technologie, wodurch die gesamte Datenbank im Arbeitsspeicher gehalten wird. Dies ist gegenüber normalen Festplatten deutlich schneller.
Wie bereits erwähnt, wird SAP HANA als Appliance vermarktet. Die Hauptbestandteile des HANA Server-System besteht also zum einen Teil aus der Hardware und zum anderen aus der Software, welche im Folgenden näher beschrieben werden.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1 : SAP HANA Architektur [SAP13]
Eine komplette Übersicht über die die HANA Architektur und die zur Verfügung gestellten Schnittstellen ist in Abbildung 1 zu sehen.
Da HANA sehr auf parallele Verarbeitung setzt, gibt SAP vor, dass Server eingesetzt werden, die möglichst viele CPU´s haben, die jeweils mehrere Kerne besitzen.
Die meisten Datenbanken (wie z.B. Oracle Database) legen möglichst viele Daten im Hauptspeicher ab, um schnell darauf zugreifen zu können. Dies sind vor allem Tabellen, auf die häufig zugegriffen wird. SAP HANA geht hier einen Schritt weiter und legt die komplette Datenbank in den Hauptspeicher. Aus diesem Grund muss der Hauptspeicher möglichst groß dimensioniert sein. So hat z.B. IBM – einer der Partner im SAP HANA Bereich – 2012 einen Server entwickelt, der insgesamt 100TB Hauptspeicher zur Verfügung hat. Diese Kapazitäten würden ausreichen, um die Daten der weltweit acht größten SAP Kunden zu verarbeiten [IBM12].
Die SAP HANA Datenbank Software, die auf einem Server installiert wird, vereint mehrere Technologien, die SAP bereits seit längerem im Einsatz hat und die sich im Einsatz bewährt haben:
- MaxDB
MaxDB ist ein Relationales Datenbankmanagementsystem (RDBMS), welche bis 2004 unter der Bezeichnung SAP DB bekannt war. MaxDB ist im Vergleich zu anderen großen RDBMS, wie z.B. von Oracle, relativ simpel aufgebaut und hat geringe Systemvoraussetzungen. Die Das Datenbanksystem kann zum Betrieb für SAP ERP, aber auch SAP BW eingesetzt werden. Es hat eine „hohe Zuverlässigkeit und Verfügbarkeit sowie Skalierbarkeit und ein sehr umfangreiches Set von Features“ [MA09, 29].
- TREX
TREX ist eine von SAP entwickelte Search-Engine, die seit 2000 eine Komponente der NetWeaver Plattform ist. TREX arbeitet bereits mit der In-Memory-Technologie und benutzt optimierte Datenstrukturen, wie die spaltenorientierte Speicherung von Datenbankinformationen, wodurch auch der Speicherplatz reduziert werden kann.
- P*Time
P*Time ist eine Technologie der Firma Transact in Memory und wurde im Jahr 2005 von SAP akquiriert. P*Time ist ein leichtgewichtiges Relationales Datenbankmanagementsystem, welches als OLTP System eingesetzt werden kann. Das System arbeitet dabei mit einer In-Memory-Technologie mit einer zeilenorientierten Speicherung von Datenbankinformationen.
Diese drei Technologien sind die Hauptbestandteile von SAP HANA und bilden das Rückgrat der In-Memory-Technologie, die von SAP NewDB genannt wird.
Ein weiterer wichtiger Bestandteil von SAP HANA ist die spaltenorientierte Speicherung der Daten (column-based). Üblicherweise speichert ein RDBMS die Daten zeilenweise (row-based) in einer Tabelle ab, ähnlich wie in einem Microsoft Excel-Sheet, was jedoch gerade bei großen Datenbanken ein Nachteil der der Geschwindigkeit sein kann. Um dies zu verdeutlichen, wird im folgendem der Aufbau einer zeilenorientierten und einer spaltenorientierten Speicherung verglichen.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2 : Zeilenorientierte Speicherung (row-based)
Im Gegensatz zur zeilenorientierten Speicherung, speichert eine spaltenorientierte Datenbank die Daten genau umgekehrt, wie in Abbildung 3 zu sehen ist.
[...]
[1] http://www.sap.com
[2] http://www.saphana.com
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!
Kommentare