Das Kernziel der neueren NoSQL Bewegung besteht darin, Web-Scale-Datenbanken, also Datenbanken für die ungeheuren Datenmengen des Web 2.0 Zeitalters im Tera- bzw. Petabyte Bereich, zu entwickeln. Wenn solch große Datenmengen verarbeitet werden müssen, ist es von Vorteil wenn die Datenbank im Vornhinein auf Skalierung ausgerichtet ist. Eine weitere Anforderung bezieht sich auf die Verfügbarkeit der Daten in einem verteilten System. Es muss gewährleistet werden, dass bei Teilausfällen von einigen Knoten, das System als Ganzes noch lauffähig bleibt.
Das zweite Kapitel des Artikels soll eine Einordnung und Kategorisierung der unterschiedlichen Datenbankmodelle ermöglichen. In der dritten Sektion werden die grundlegenden Eigenschaften des Datenmodells von spaltenorientierten Datenbanken, die die Grundlage von Wide Column Stores bilden, behandelt. Im vierten Kapitel wird Google’s Bigtable, ein bestehendes Wide Column Store System analysiert. Im Speziellen werden das Datenmodell, die Infrastruktur und die Implementierung von Bigtable behandelt. Eingebettet in dieses Kapitel ist auch ein Performancevergleich zwischen verteilten Datenbanken. Im letzten Kapitel werden die Kernaussagen des Artikels zusammengefasst und offene Problemstellungen bzw. zukünftige Entwicklungen behandelt.
Inhaltsverzeichnis
- I. EINLEITUNG
- II. NOSQL DATENBANKEN
- A. Einordnung in die Datenbankwelt
- B. Kategorien der Kernsysteme
- 1) Key/Value Stores
- 2) Document Stores
- 3) Graphdatenbanken
- 4) Wide Column Stores
- C. Theoretische Konzepte
- 1) CAP Theorem
- 2) ACID vs. BASE
- 3) Multiversion-Concurrency-Control
- III. SPALTENORIENTIERTE DATENBANKEN
- A. Datenmodell
Zielsetzung und Themenschwerpunkte
Die Arbeit befasst sich mit Wide Column Stores, einer Unterkategorie der NoSQL Datenbanken, die für die Verarbeitung großer Datenmengen des Web 2.0 Zeitalters im Tera- bzw. Petabyte-Bereich entwickelt wurden. Sie beleuchtet die Einordnung dieser Systeme in die Datenbanklandschaft, analysiert deren grundlegende Eigenschaften und betrachtet Google's Bigtable als ein konkretes Beispiel eines Wide Column Store Systems.
- Einordnung von Wide Column Stores in die NoSQL Datenbanken
- Grundlegende Eigenschaften von spaltenorientierten Datenbanken
- Analyse von Google's Bigtable als Wide Column Store System
- Vergleich der Performance von verteilten Datenbanken
- Theoretische Konzepte wie das CAP Theorem und das ACID vs. BASE Konsistenzmodell
Zusammenfassung der Kapitel
Das erste Kapitel dient als Einleitung und skizziert die Herausforderungen, denen Datenbanken im Web 2.0 Zeitalter gegenüberstehen. Es führt das Konzept der NoSQL Datenbanken ein und erläutert die Notwendigkeit von Skalierbarkeit und Verfügbarkeit in verteilten Systemen.
Kapitel II bietet eine Einordnung der NoSQL Datenbanken in die Datenbanklandschaft und differenziert zwischen verschiedenen Kategorien wie Key/Value Stores, Document Stores, Graphdatenbanken und Wide Column Stores. Es beleuchtet die charakteristischen Merkmale jeder Kategorie und nennt wichtige Vertreter.
Das dritte Kapitel befasst sich mit dem Datenmodell von spaltenorientierten Datenbanken, auf dem Wide Column Stores basieren. Es stellt das Decomposed Storage Model (DSM) vor und diskutiert seine Vorteile bei der Verarbeitung von Attributen mit mehreren Werten, heterogenen Einträgen und mehreren Beziehungen.
Schlüsselwörter
Die Arbeit behandelt die Themen NoSQL, Datenbanken, Wide Column Stores, Bigtable, BASE, Map/Reduce Framework, CAP, spaltenorientierte Datenorganisation, DSM, Paxos, Bloomfilter.
- Quote paper
- Mario Götzner (Author), 2011, NoSQL Datenbanken. Wide Column Stores, Munich, GRIN Verlag, https://www.grin.com/document/460798