In dieser Hausarbeit wird die Bedeutung dieses neuen Typs von Datenbanken vorgestellt und die theoretischen Grundlagen dazu erläutert.
In der heutigen Zeit und mit der immer weiter voranschreitenden Entwicklung des Internets gewinnen Informationen und die damit verbundenen Daten immer mehr an Bedeutung und Größe. Gleichzeitig steigt, dank der Möglichkeit der Individualisierung, auch die Vielschichtigkeit der einzelnen Daten. Diese Entwicklung bedarf einer Veränderung der relationalen Ansätze, welche lange Zeit hauptsächlich für die Datenspeicherung verwendet wurden. Die hierfür hinzugezogenen Ansätze, sogenannte nicht relationale Datenbanken, gab es bereits vor der Entdeckung des relationalen Modells durch Ted Codd in Form von hierarchischen oder netzwerkartigen Datenbanken. Weitere Datenbanktypen werden bspw. für die Speicherung von CAD-Daten verwendet, da sich die Verarbeitung von technischen Objekten in Echtzeit als problematisch herausstellte.
Inhaltsverzeichnis
1 Einleitung
1.1 Relevanz und Problemstellung
1.2 Ziel und Aufbau der Arbeit
2 Theoretische Grundlagen zu dokumentorientierten Datenbanken
2.1 NoSQL
2.2 Big Data
2.3 CAP-Theorem
2.4 REST
2.5 Map/Reduce
3 Entstehung und Anwendungsfelder der dokumentenorientierten Datenbanken
3.1 Datenstruktur
3.2 Skalierbarkeit
3.3 Performance
3.4 Vor- und Nachteile des Datenbanktyps
3.5 Vertreter der dokumentenorientierten Datenbanken
3.5.1 CouchDB
3.5.2 MongoDB
4 Zusammenfassung und Kritische Reflexion
Zielsetzung & Themen
Das primäre Ziel dieser Arbeit ist die fundierte Vorstellung dokumentenorientierter Datenbanken sowie die Hervorhebung ihrer Bedeutung im Kontext moderner datenintensiver Anwendungen. Dabei wird untersucht, wie dieser Datenbanktyp durch eine flexible Datenstruktur, horizontale Skalierbarkeit und performante Verarbeitungsmechanismen auf die Anforderungen von Big Data und dem Internet der Dinge reagiert.
- Grundlagen von NoSQL und Big Data
- Architektonische Prinzipien wie das CAP-Theorem und REST
- Effiziente Datenverarbeitung durch das Map/Reduce-Verfahren
- Praxisnahe Analyse von MongoDB und CouchDB
Auszug aus dem Buch
2.5 Map/Reduce
Aus dem vorherigen Kapitel Big Data ist nun die Betrachtung des V´s – Volume äußerst ausschlaggebend. Die Datenmengen wachsen immer weiter an und die damit verbundene Verarbeitung und Analyse wird immer langsamer. Um hier eine geeignete Lösung zu finden, wurden neue alternative Algorithmen, Frameworks und Datenbankmanagementsysteme entwickelt. Als effizienter Ansatz zeichnet sich hierbei die Parallelisierung von Berechnungen aus. Google Inc. entwickelte hierfür 2004 das Map/Reduce Framework. Als Suchmaschine im Webbereich ist dieser Ansatz besonders attraktiv, da Webseiten effizienter bzw. in Echtzeit auf Schlagworte durchsucht werden können. In der folgenden Abbildung ist dieses Verfahren anhand vier Beispielsätze abgebildet. Bevor dies näher erläutert wird, soll hervorgehoben werden, dass dieses Framework normalerweise im Bereich von Terabyte und aufwärts seinen Anwendungsbereich hat. Hierbei kann die Auslagerung der einzelnen Aufgaben auf verteilte Computerknoten seine Effizienz entfalten.
Zusammenfassung der Kapitel
1 Einleitung: Die Einleitung erläutert die wachsende Bedeutung von unstrukturierten Daten und leitet die Notwendigkeit für alternative Datenbankmodelle zu relationalen Systemen her.
2 Theoretische Grundlagen zu dokumentorientierten Datenbanken: Dieses Kapitel definiert NoSQL, Big Data und erläutert technische Kernkonzepte wie das CAP-Theorem, REST und Map/Reduce.
3 Entstehung und Anwendungsfelder der dokumentenorientierten Datenbanken: Hier werden die Vorteile der Schemafreiheit, Skalierbarkeit und Performance sowie die konkreten Vertreter CouchDB und MongoDB analysiert.
4 Zusammenfassung und Kritische Reflexion: Der Autor resümiert die Erkenntnisse und reflektiert den Lernprozess sowie die Relevanz der untersuchten Technologien in der Praxis.
Schlüsselwörter
Dokumentenorientierte Datenbanken, NoSQL, Big Data, JSON, Skalierbarkeit, Map/Reduce, MongoDB, CouchDB, REST, CAP-Theorem, Schemafreiheit, Internet of Things, Datenmanagement, Datenbankarchitektur, Performance
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Architektur und den Vorteilen dokumentenorientierter Datenbanken als Antwort auf die Grenzen traditioneller relationaler Datenbanken bei wachsenden, komplexen Datenmengen.
Welche zentralen Themenfelder werden abgedeckt?
Zentrale Themen sind die theoretischen Grundlagen wie NoSQL und Big Data, das Konzept der Schemafreiheit, die horizontale Skalierbarkeit sowie praktische Einblicke in die Datenbanksysteme CouchDB und MongoDB.
Was ist das primäre Ziel der Forschungsarbeit?
Ziel ist es, den Typ der dokumentenorientierten Datenbanken vorzustellen und zu verdeutlichen, warum dieser bei modernen Internetanwendungen und im Big-Data-Umfeld zunehmend an Bedeutung gewinnt.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit basiert auf einer fundierten Literaturrecherche zu den theoretischen Grundlagen, ergänzt durch eine vergleichende Analyse von Datenbankeigenschaften und deren praktischer Einordnung.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in eine theoretische Fundierung der NoSQL-Konzepte (CAP, REST, Map/Reduce) und eine anschließende detaillierte Untersuchung der Anwendungsfelder, Vor- und Nachteile sowie der technischen Spezifikationen von MongoDB und CouchDB.
Welche Schlüsselwörter charakterisieren die Publikation?
Die Arbeit wird maßgeblich durch Begriffe wie NoSQL, Schemafreiheit, Skalierbarkeit, JSON, MongoDB, CouchDB und Big Data charakterisiert.
Wie unterscheidet sich die horizontale Skalierung bei dokumentorientierten Datenbanken von relationalen Systemen?
Während relationale Datenbanken primär auf vertikale Skalierung (stärkere Server-Hardware) setzen, unterstützen dokumentorientierte Datenbanken durch ihre Architektur effizient die horizontale Skalierung, indem sie Lasten auf mehrere Knoten verteilen.
Warum spielt das JSON-Format eine zentrale Rolle bei dieser Datenbankklasse?
JSON ermöglicht eine flexible, schemafreie Speicherung von heterogenen Daten, was es erlaubt, individuelle Attributstrukturen für einzelne Dokumente ohne aufwendige Datenbank-Migrationen abzubilden.
- Arbeit zitieren
- Anonym (Autor:in), 2020, Dokumentenorientierte Datenbanken, München, GRIN Verlag, https://www.grin.com/document/1362523