In Unternehmen sind große Mengen an Daten heutzutage nicht mehr wegzudenken. Daten über Warenbestände, Rechnungen, Mitarbeiter etc. werden klassischerweise von Datenbanksystemen (DBS) verwaltet. Zentrale DBS stoßen allerdings schnell an ihre Grenzen, wenn es darum geht große Volumen zu speichern, die Ausfallsicherheit zu stärken oder die Anzahl der Anwender zu groß ist. Auch wenn Unternehmen von mehreren Orten mit demselben Datenbestand arbeiten möchten oder Daten aus Sicherheitsgründen nicht nur auf einem Server gespeichert werden sollen, genügen einfache DBS oft nicht.
Um diesen Herausforderungen entgegenzuwirken, werden Verteilte Datenbanksysteme (VDBS) eingesetzt. In dieser Arbeit soll aufgezeigt werden, welche Vor- und Nachteile der Einsatz einer verteilten Datenbank hat und für welchen Bereich sie somit eingesetzt werden kann. Die Grundfunktionen der Verteilten Datenbanken werden beschrieben und die Qualitätsanforderungen an einer Datenbank bestimmt. Zum Schluss wird auf das Ergebnis eingegangen und eine Bewertung vorgenommen.
Inhaltsverzeichnis
1 Einleitung
2 Ziele und Problemstellung
3 Verteilte Datenbanken
3.1 Anforderungen
3.2 Architektur
3.3 Datenverteilung und Katalogverwaltung
3.3.1 Fragmentierung
3.3.2 Allokation und Replikation
3.4 Synchronisationsverfahren
3.4.1 Sperrverfahren
3.4.2 Zeitmarkenverfahren
3.5 Konsistenzsicherung
3.5.1 ACID
3.5.2 BASE und CAP Theorem
4 Bewertung
4.1 Chancen
4.2 Risiken
5 Schlussbetrachtung
5.1 Fazit
5.2 Ausblick
Zielsetzung & Themen
Die Arbeit untersucht die Grundlagen und die praktische Relevanz von verteilten Datenbanksystemen, um herauszufinden, wie diese zur Bewältigung großer Datenmengen und zur Steigerung der Ausfallsicherheit in standortverteilten Unternehmen beitragen können.
- Architekturmodelle und Anforderungskataloge für verteilte Systeme
- Methoden der Datenverteilung, Fragmentierung und Replikation
- Synchronisationsverfahren zur Vermeidung von Konflikten und Deadlocks
- Analyse der Konsistenzkonzepte wie ACID, BASE und des CAP-Theorems
Auszug aus dem Buch
3.2 Architektur
Grundsätzlich wird zwischen homogenen und heterogenen Datenbanksystemen unterschieden. Bei homogen DBS läuft auf jedem Knoten der gleiche Typ des DBMS, wobei bei heterogen DBS auf verschiedenen Knoten verschiedene DBMS laufen. Eine wichtige Aufgabe von DBS ist das Erreichen eines möglichst hohen Grades an Datenunabhängigkeit.7 Bei verteilten Datenbanksystemen vom Typ Shared-Disk- und Shared-Nothing-Systemen erfolgt die DB-Verarbeitung jeweils auf mehreren unabhängigen, lose oder nahe gekoppelten Sites mit einer eigenen Instanz des DBMS.8 Entscheidet man sich für ein “Shared-Disk System“ (Abb. 2a), haben alle laufenden DBMS-Prozesse direkten Zugriff auf den gesamten Datenbestand. Dieses System dient einer großen Flexibilität bei der Auswahl eines Verarbeitungsrechners für anstehende Anfragen und Transaktionen und haben daher ein hohes Potenzial zur Lastbalancierung. Bei diesem System kommen meist Externspeicheranbindungen wie Storage Area Networks (SAN) zum Einsatz, die über ein schnelles Verarbeitungsnetzwerk angebunden werden. Dabei sind Bandbreiten von mehreren GB pro Sekunde und eine Anbindung zahlreicher Rechner und damit eine gute Skalierbarkeit möglich. In einem “Shared-Nothing-System“ (Abb. 2b) dagegen werden keine Systemkomponenten, bis auf das Verbindungsnetzwerk genutzt. Die Speicher sind unter den lose gekoppelten Rechnern partitioniert, sodass jeder Knoten nur auf Daten der lokalen Partition zugreifen kann.
Zusammenfassung der Kapitel
1 Einleitung: Diese Einleitung beschreibt die Grenzen zentraler Datenbanksysteme und führt Verteilte Datenbanksysteme als Lösung für steigende Datenmengen und hohe Verfügbarkeitsanforderungen ein.
2 Ziele und Problemstellung: Dieses Kapitel erläutert die Anforderungen standortverteilter Unternehmen und die Herausforderungen bei der Synchronisation und Konsistenzhaltung verteilter Daten.
3 Verteilte Datenbanken: Dieser Abschnitt behandelt die grundlegende Architektur, Methoden der Datenverteilung wie Fragmentierung sowie Strategien zur Synchronisation und Konsistenzsicherung.
4 Bewertung: Das Kapitel analysiert die Chancen einer verteilten Datenhaltung, wie Skalierbarkeit und Ausfallsicherheit, sowie die Risiken durch erhöhte Komplexität und Verwaltungsaufwand.
5 Schlussbetrachtung: Dieses Kapitel fasst die Ergebnisse zusammen und gibt einen Ausblick auf die wachsende Bedeutung verteilter Systeme und paralleler Verarbeitung für zukünftige Webanwendungen.
Schlüsselwörter
Verteilte Datenbanksysteme, VDBS, Datenbankmanagementsysteme, Datenverteilung, Fragmentierung, Allokation, Replikation, Synchronisation, ACID-Prinzip, BASE, CAP-Theorem, Konsistenzsicherung, Ausfallsicherheit, Shared-Disk, Shared-Nothing.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit den Grundlagen, Anforderungen und der Funktionsweise von verteilten Datenbanksystemen in modernen Unternehmen.
Was sind die zentralen Themenfelder der Publikation?
Zentrale Themen sind die Architektur von verteilten Datenbanken, Strategien zur Datenverteilung sowie Verfahren zur Synchronisation und Konsistenzsicherung von Transaktionen.
Welches primäre Ziel verfolgt die Arbeit?
Das Ziel ist es, aufzuzeigen, unter welchen Bedingungen und mit welchen Vor- und Nachteilen der Einsatz einer verteilten Datenbank zur Optimierung von Unternehmensprozessen sinnvoll ist.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit basiert auf einer theoretischen Analyse und literaturbasierten Zusammenfassung der Konzepte von verteilten Datenbanksystemen.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die Vorstellung der Architektur (Shared-Disk/Shared-Nothing), Techniken wie Fragmentierung und Allokation sowie die detaillierte Betrachtung von Synchronisationsmethoden und Konsistenzmodellen (ACID vs. BASE).
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit wird maßgeblich durch Begriffe wie VDBS, Datenverteilung, Replikation, Konsistenz, ACID, BASE und CAP-Theorem geprägt.
Wie unterscheiden sich Shared-Disk und Shared-Nothing Architekturen?
Während bei Shared-Disk alle DBMS-Prozesse auf einen gemeinsamen Datenbestand zugreifen, ist bei Shared-Nothing der Speicher unter den Knoten partitioniert, sodass jeder Knoten nur lokal arbeitet.
Welches Problem löst das CAP-Theorem bei der Systemauslegung?
Das CAP-Theorem verdeutlicht, dass in einem verteilten System bei einem Netzwerkausfall nur zwei von drei Eigenschaften – Konsistenz, Verfügbarkeit und Ausfalltoleranz – gleichzeitig vollständig erfüllt werden können.
- Arbeit zitieren
- Andre Kreutzer (Autor:in), 2016, Verteilte Datenbanken, München, GRIN Verlag, https://www.grin.com/document/366988