Bachelorarbeit, 2008
51 Seiten, Note: 1
1 Einleitung
1.1 Notwendigkeit von Indizes
1.2 OLAP vs. OLTP
2 B-Tree Indizes
2.1 B-Tree
2.2 B+-Tree und B*-Tree
2.3 Kombination mehrerer Dimensionen
3 Bitmap Indizes
3.1 Funktionsweise
3.2 Kombination mehrerer Dimensionen
3.3 Komprimierung
3.3.1. Byte basierte Komprimierung
3.3.2. Wort basierte Komprimierung
3.4 Kodierung
4 Query Optimizer
5 Fallstudie
5.1 Befüllung und Indizierung
5.2 Abfragen
5.2.1. Zählen aller Bürger
5.2.2. Zählen mit zwei Dimensionen
5.2.3. Personen pro Bundesland
5.2.4. Durschnittseinkommen mit 5 Dimensionen
5.2.5. Durschnittseinkommen und NULL-Wert
5.2.6. Range Query
5.3 Updates
5.4 Inserts
5.5 Deletes
6 Zusammenfassung der Ergebnisse
6.1 Speicherplatz
6.2 Abfragen
6.3 Inserts, Updates und Deletes
7 Fazit
A Anhang
A.1 Erstellen der Tabelle buerger
A.2 Prozedur: Füllen mit Zufallswerten
A.3 Befüllen und vervielfältigen der Tabelle
A.4 Erzeugen von Statistiken
A.5 Abfrage: Zählen mit zwei Dimensionen
A.6 Prozedur: zufällige Updates
A.7 Prozedur: zufällige Deletes
Das Hauptziel dieser Arbeit besteht darin, Bitmap Indizes detailliert zu untersuchen und sie mit herkömmlichen B-Tree Indizes zu vergleichen, um ihre Einsatzmöglichkeiten und Vorteile bei der Abfrage großer Datenmengen aufzuzeigen.
3.1 Funktionsweise
Bei der Bitmap Indizierung wird für jede Ausprägung eines Attributes ein Bitmuster (engl. Bitmap) angelegt, welches signalisiert ob der korrespondierende Datensatz diesem Wert entspricht. Die Anzahl der unterschiedlichen Ausprägungen eines Attributes wird Kardinalität genannt. Je höher also die Kardinalität desto mehr Bitmaps müssen für ein Attribut angelegt werden. Im Gegensatz zur B-Tree Indizierung werden bei der Bitmap Indizierung auch NULL Werte in einer eigenen Bitmap indiziert.
Tabelle 2 zeigt den Ausschnitt einer Personendatenbank, welche neben dem Namen der Person zusätzlich die zwei indizierten Attribute Geschlecht (M, W) und den Familienstand (ledig, verheiratet, geschieden) enthält. Der Übersichtlichkeit halber werden die Bitmap Indizes direkt neben den Attributen angedeutet.
1 Einleitung: Einführung in die Problematik des schnellen Datenauffindens und die Relevanz von Bitmap Indizes im Kontext von Data Warehouses.
2 B-Tree Indizes: Erläuterung der klassischen B-Tree Struktur sowie deren Varianten B+-Tree und B*-Tree.
3 Bitmap Indizes: Detaillierte Darstellung der Funktionsweise, Komprimierungsverfahren und Kodierungsmöglichkeiten von Bitmap Indizes.
4 Query Optimizer: Überblick über die Funktionsweise des Query Optimizers und die Bedeutung von Statistiken für die Abfrageausführung.
5 Fallstudie: Praktische Untersuchung und Vergleich von B-Tree und Bitmap Indizes anhand einer Oracle-Datenbank mit 8 Millionen Datensätzen.
6 Zusammenfassung der Ergebnisse: Synthese der theoretischen Erkenntnisse und der praktischen Ergebnisse aus der Fallstudie hinsichtlich Speicherplatz und Performance.
7 Fazit: Zusammenfassende Bewertung der Eignung von Bitmap Indizes für spezifische Anwendungsszenarien.
A Anhang: Bereitstellung der PL/SQL-Skripte zur Umsetzung der Fallstudie.
Bitmap Indizes, B-Tree Indizes, Data Warehouse, OLAP, OLTP, Oracle, Datenbankperformance, Indexierung, Kardinalität, Komprimierung, Query Optimizer, Full Table Scan, Fallstudie, Abfrageoptimierung, SQL
Die Arbeit beschäftigt sich mit der Analyse und dem praktischen Vergleich von Bitmap Indizes gegenüber traditionellen B-Tree Indizes in Datenbanken.
Neben den technischen Grundlagen der Indizierungsarten werden insbesondere Komprimierung, Kodierung, die Rolle des Query Optimizers sowie die Auswirkungen auf die Performance bei verschiedenen Datenbankoperationen thematisiert.
Das Ziel ist herauszuarbeiten, unter welchen Umständen der Einsatz von Bitmap Indizes gegenüber B-Tree Indizes Vorteile bietet und wann von deren Verwendung abzuraten ist.
Die Autor führt eine umfassende Literaturrecherche durch und stellt die theoretischen Erkenntnisse in einer praktischen Fallstudie an einer mit Oracle 10g implementierten Beispieldatenbank gegenüber.
Der Hauptteil gliedert sich in die theoretische Vorstellung der Indexstrukturen, die Funktionsweise des Query Optimizers und den zentralen Teil der Fallstudie mit diversen Leistungstests.
Kernbegriffe sind Bitmap Indizes, B-Tree Indizes, OLAP, Data Warehouse, Abfrageperformance und Kardinalität.
Aufgrund des spezifischen Aufbaus verursachen Bitmap Indizes bei konkurrierenden Datenmanipulationen (insbesondere bei vielen Inserts, Updates und Deletes) einen hohen Sperraufwand, der zu Performance-Einbrüchen führt.
Im Gegensatz zu B-Tree Indizes, die NULL-Werte ignorieren, können Bitmap Indizes diese in einer eigenen speziellen Bitmap erfassen.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

