Bachelorarbeit, 2011
16 Seiten, Note: 1
Die Arbeit befasst sich mit Wide Column Stores, einer Unterkategorie der NoSQL Datenbanken, die für die Verarbeitung großer Datenmengen des Web 2.0 Zeitalters im Tera- bzw. Petabyte-Bereich entwickelt wurden. Sie beleuchtet die Einordnung dieser Systeme in die Datenbanklandschaft, analysiert deren grundlegende Eigenschaften und betrachtet Google's Bigtable als ein konkretes Beispiel eines Wide Column Store Systems.
Das erste Kapitel dient als Einleitung und skizziert die Herausforderungen, denen Datenbanken im Web 2.0 Zeitalter gegenüberstehen. Es führt das Konzept der NoSQL Datenbanken ein und erläutert die Notwendigkeit von Skalierbarkeit und Verfügbarkeit in verteilten Systemen.
Kapitel II bietet eine Einordnung der NoSQL Datenbanken in die Datenbanklandschaft und differenziert zwischen verschiedenen Kategorien wie Key/Value Stores, Document Stores, Graphdatenbanken und Wide Column Stores. Es beleuchtet die charakteristischen Merkmale jeder Kategorie und nennt wichtige Vertreter.
Das dritte Kapitel befasst sich mit dem Datenmodell von spaltenorientierten Datenbanken, auf dem Wide Column Stores basieren. Es stellt das Decomposed Storage Model (DSM) vor und diskutiert seine Vorteile bei der Verarbeitung von Attributen mit mehreren Werten, heterogenen Einträgen und mehreren Beziehungen.
Die Arbeit behandelt die Themen NoSQL, Datenbanken, Wide Column Stores, Bigtable, BASE, Map/Reduce Framework, CAP, spaltenorientierte Datenorganisation, DSM, Paxos, Bloomfilter.
Das Ziel ist die Verwaltung von "Web-Scale"-Datenmengen im Tera- und Petabyte-Bereich bei hoher Skalierbarkeit und Verfügbarkeit in verteilten Systemen.
Sie nutzen eine spaltenorientierte Datenorganisation (Decomposed Storage Model), was Vorteile bei der Verarbeitung heterogener Einträge und komplexer Beziehungen bietet.
Bigtable ist ein bekanntes Wide Column Store System von Google, das als Grundlage für viele Web-Anwendungen dient und in der Arbeit detailliert analysiert wird.
Das CAP-Theorem besagt, dass in einem verteilten System nur zwei der drei Eigenschaften Konsistenz (Consistency), Verfügbarkeit (Availability) und Partitionstoleranz (Partition Tolerance) gleichzeitig garantiert werden können.
Während ACID auf strikte Konsistenz setzt, steht BASE für "Basically Available, Soft state, Eventual consistency" – ein Modell, das für hochverfügbare NoSQL-Systeme optimiert ist.
Neben Wide Column Stores gibt es Key/Value Stores, Document Stores und Graphdatenbanken.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

