Diplomarbeit, 2007
103 Seiten, Note: 1,0
1 Einleitung
1.1 Vorstellung des Unternehmens
1.1.1 Hubert Burda Media
1.1.2 Burda Digital Systems
1.2 Problemstellung / Zielsetzung der Diplomarbeit
1.3 Stand der Forschung
2 Grundlagen
2.1 Business Warehouse als Bestandteil von SAP NetWeaver
2.2 Architektur des Business Warehouse
2.3 Hardware und Datenbanken
2.4 Warehousing-Prozess
2.4.1 Funktionen für den ETL-Prozess
2.4.1.1 Extraktionsschicht
2.4.1.2 Der ETL-Prozess
2.4.1.3 Performancerelevanz
2.4.2 Komponenten für die Datenablage
2.4.2.1 InfoObjects
2.4.2.2 InfoProvider
2.4.2.3 Performancerelevanz
2.4.3 Weitere Möglichkeiten der Performanceverbesserung
2.4.3.1 Komprimierung und Partitionierung
2.4.3.2 Aggregation
2.4.3.3 Indizierung
2.4.3.4 Queries
2.4.4 Werkzeuge für Analysen und Berichte
2.5 Werkzeuge der Performanceanalyse
2.5.1 Analyse von Datenbank, Speicher und Hardware
2.5.1.1 Datenbank
2.5.1.2 Speicher
2.5.1.3 Hardware
2.5.2 Analyse der Systemlast
2.5.3 Einflussfaktoren auf die einzelnen Laufzeitanteile einer Query
2.5.3.1 OLAP-Zeit
2.5.3.2 Datenbanklaufzeit
2.5.3.3 Frontend-Laufzeit
2.6 Zusammenfassung
3 Performanceanalyse
3.1 Rahmenbedingungen
3.1.1 Systemumgebung
3.1.2 Definition der Referenzmodelle
3.1.2.1 Referenzmodell Cube-Modellierung
3.1.2.2 Referenzmodell Query-Aufbau
3.2 Messreihen
3.2.1 Performancemessung InfoCube-Modellierung
3.2.1.1 InfoCube als Kennzahlenmodell
3.2.1.2 InfoCube als Kontenmodell
3.2.1.3 InfoCube mit MultiProvider
3.2.1.4 Komprimierter InfoCube
3.2.1.5 Partitionierung des InfoCubes auf Datenbankebene
3.2.1.6 Partitionierung des InfoCubes auf Applikationsebene
3.2.1.7 InfoCube mit LineItem-Dimension
3.2.1.8 InfoCube mit 3 Dimensionen
3.2.1.9 InfoCube mit 5 Dimensionen
3.2.1.10 InfoCube mit hoher Kardinalität
3.2.1.11 InfoCube mit Navigationsattributen
3.2.1.12 Optimierungsmatrix
3.2.2 Performancemessung Query-Aufbau
3.2.2.1 Kennzahlenberechnung beim Datenladen mit inaktivem Query-Cache
3.2.2.2 Kennzahlenberechnung beim Datenladen mit aktivem Query-Cache
3.2.2.3 Kennzahlenberechnung im Query-Designer mit inaktivem Query-Cache
3.2.2.4 Kennzahlenberechnung im Query-Designer mit aktivem Query-Cache
3.2.2.5 InfoCube mit Aggregat
3.2.2.6 Optimierungsmatrix
3.2.2.7 Weitere Einflussfaktoren
3.3 Zusammenfassung
4 Methodik der Performanceoptimierung
4.1 Hauptprozess
4.1.1 Analyseprozess
4.1.1.1 Zeitmessung Query
4.1.1.2 Zeiten der Testausführung übertragen
4.1.1.3 Anzahl der Datensätze im Datenmodell prüfen
4.1.1.4 Verschiedene Prüfungen
4.1.2 Adjustment
4.1.2.1 Adjustment OLAP-Zeit
4.1.2.2 Adjustment DB-Zeit
4.1.2.3 Adjustment Frontend-Zeit
4.1.3 Performancetest
5 Evaluierung
5.1 Analyse
5.2 Adjustment
5.3 Performancetest
5.4 Zusammenfassung
6 Zusammenfassung und Ausblick
Das Hauptziel dieser Diplomarbeit besteht darin, eine standardisierte Methodik zur Performanceoptimierung in SAP Business Warehouse-Umgebungen zu entwickeln, um der Problematik langer Antwortzeiten bei der Integration von Data Warehäusern in Unternehmensportale zu begegnen und eine systematisierte Vorgehensweise für Performance-Verbesserungen in der Konzeptionsphase bereitzustellen.
1.2 Problemstellung / Zielsetzung der Diplomarbeit
Die Integration von Data Warehäusern in Unternehmensportale erhält in den meisten Unternehmen eine immer größere Bedeutung. Die Akzeptanz bei den Endanwendern steht und fällt jedoch mit der Antwortzeit, welche leider oft über 6 Sekunden und in einzelnen Fällen bis zu 5 Minuten beträgt. Es gibt verschiedene Möglichkeiten Performanceoptimierungen durchzuführen, wobei es keinen Königsweg gibt. In vielen Data Warehouse Projekten wird oft entwickelt und erst im Nachhinein eine Optimierung der Performance durchgeführt. Die richtige Vorgehensweise wäre jedoch, das Thema bereits in der Konzeptionsphase anzugehen. Das Problem ist hier, dass es bisher keine geeignete Methodik für eine solche Vorgehensweise gibt.
Eine solche Methodik soll im Rahmen dieser Diplomarbeit entwickelt werden. Ziel dieser Arbeit ist:
1. Beschreibung der Problemstellung, wobei die für diese Arbeit notwendigen Definitionen aufgestellt und Rahmenbedingungen festgelegt werden sollen.
2. Recherche und Bewertung des „Stand der Technik“. Untersucht werden sollen hierbei Methoden und Werkzeuge zur Optimierung von Datenbanksystemen und Data Warehäusern.
3. Definition eines Referenzmodells, anhand dessen die unterschiedlichen Methodenansätze definiert bzw. am Ende getestet werden können.
4. Entwicklung der Optimierungsmethoden. Dabei sollen verschiedene Kategorien gebildet werden (z.B. Hardware, Software, Prozess). Der Schwerpunkt soll hierbei auf den Bereichen Software (Datenbankmodellierung, Queryaufbau, Caching, usw.) sowie dem Prozess (Vorberechnung, Information Broadcasting, usw.) liegen. Als Ergebnis soll eine Matrix entstehen, durch welche man in Abhängigkeit der Anforderungen, Datenbasis u.a. die geeignetste Optimierungsmethode findet.
5. Evaluation: Die Ergebnisse sollen mit Hilfe des Referenzmodells getestet und evaluiert werden.
1 Einleitung: Diese Einleitung stellt die Motivation dar, insbesondere die Notwendigkeit kürzerer Antwortzeiten bei der Data-Warehouse-Integration in Portale, und definiert das Ziel der Arbeit, eine Methodik zur Performanceoptimierung zu entwickeln.
2 Grundlagen: Das Grundlagenkapitel erläutert die Einordnung des Business Warehouse in SAP NetWeaver, beschreibt die Architektur sowie die wesentlichen Performance-Einflussfaktoren wie Extraktion, Datenablage und Werkzeuge zur Analyse.
3 Performanceanalyse: Dieses Kapitel definiert Referenzmodelle für InfoCube-Modellierung und Query-Aufbau und evaluiert mittels systematischer Messreihen deren Performance, um die Basis für die Optimierungsmatrix zu schaffen.
4 Methodik der Performanceoptimierung: Hier wird der standardisierte Analyse- und Optimierungsprozess als ereignisgesteuerte Prozesskette beschrieben, um Probleme systematisch zu identifizieren, zu beheben und deren Erfolg zu prüfen.
5 Evaluierung: Die entwickelte Methodik wird an einem konkreten Fallbeispiel (VIS4) angewendet und evaluiert, wobei durch ein Re-Design des Datenmodells eine deutliche Verbesserung der Performance nachgewiesen wird.
6 Zusammenfassung und Ausblick: Das Fazit fasst die Ergebnisse zusammen, unterstreicht die Notwendigkeit, Performance-Aspekte bereits in der Konzeptionsphase zu berücksichtigen, und gibt einen Ausblick auf ergänzende Technologien wie den BI-Accelerator.
SAP Business Warehouse, Performanceoptimierung, Data Warehouse, Reportingperformance, ETL-Prozess, InfoCube-Modellierung, OLAP-Zeit, Datenbanklaufzeit, Systemlastmonitor, Query-Aufbau, Partitionierung, Aggregation, Indizierung, Modellierungsstrategie, Business Explorer.
Die Arbeit beschäftigt sich mit der systematischen Performanceoptimierung in SAP Business Warehouse-Systemen, da hohe Antwortzeiten die Akzeptanz bei Endanwendern stark gefährden.
Die zentralen Themenfelder sind die Architektur des SAP BW, Modellierungsstrategien für InfoCubes, Einflussfaktoren auf die Query-Laufzeit (OLAP, DB, Frontend) sowie konkrete Methoden der Performanceanalyse und -optimierung.
Das Hauptziel ist die Entwicklung einer standardisierten, prozessorientierten Methodik, die Performance-Probleme bereits in der Konzeptionsphase adressiert und minimiert.
Die Arbeit nutzt experimentelle Performancemessungen anhand definierter Referenzmodelle (InfoCube-Modellierung und Query-Aufbau), um mathematische Zusammenhänge mit realen Systemlastdaten zu validieren.
Der Hauptteil analysiert die Abhängigkeiten zwischen Datenmodell-Architektur, Indizierungsstrategien, Partitionierung und Query-Einstellungen und leitet daraus eine Entscheidungshilfe für IT-Architekten ab.
Die Arbeit fokussiert sich maßgeblich auf Begriffe wie "Business Warehouse", "Reportingperformance", "InfoCube-Modellierung" sowie "Cost-Based Optimizer".
Das erweiterte Star-Schema ermöglicht durch die Verwendung von SID-Schlüsseln (Surrogate-IDs) eine flexiblere und performantere Modellierung von Beziehungen, die direkt in die Berechnungslogik der Laufzeiten einfließt.
Der Autor verzichtet auf den Einsatz des BI-Accelerators, um die Performance-Verbesserungen exklusiv durch eine optimierte Datenmodellierung und Prozessanpassung im SAP BW selbst zu demonstrieren.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

