Die vorliegende Hausarbeit soll einen Einblick in die Multidatenbanksprache SchemaSQL geben. Dabei wird ein gewisses Vorwissen zu Datenbanksystemen, insbesondere zu föderierten Datenbanksystemen, sowie SQL-Kenntnisse vorausgesetzt. Zunächst wird ein Einblick in die Multidatenbank-Architektur gegeben und die Notwendigkeit von Multidatenbanksprachen herausgestellt. Da es neben SchemaSQL auch noch MSQL, eine etwas ältere Form von Multidatenbanksprachen gibt, wird auch diese kurz beschrieben. Der Hauptteil dieser Arbeit setzt sich dann mit SchemaSQL auseinander, einer Erweiterung von SQL zur Verarbeitung von Informationen aus Multidatenbanksystemen. SchemaSQL wurde 1996 durch den indischen Wissenschaftler Laks Lakshmanan entwickelt. Im letzten Gliederungspunkt wird auch auf die SchemaSQL – Implementierungs – Architektur und den zugrunde liegenden Algorithmus, ebenfalls von Lakshmanan entwickelt, eingegangen.
Multidatenbank-Architektur
Unter einem Multidatenbanksystem versteht man den Verbund eines oder mehrerer DBS. Dabei unterscheidet man föderierte und nicht föderierte DBS. Eine von mehreren Architekturformen föderierter DBS ist die Multidatenbank-Architektur nach Litwin. Die Hauptidee hinter der Multidatenbank-Architektur steckt darin, dass ein Benutzer auf eine Föderation zugreifen kann, ohne dass ein globales Schema existiert. Er muss also direkt, mittels einer speziellen Multidatenbanksprache auf verschiedene Komponenten zugreifen können. Allerdings muss der Benutzer sich auch um die Integration der Komponentendatenbanksysteme und die Auflösung der Konflikte (semantische Heterogenität) kümmern.
Inhaltsverzeichnis
1. Einleitung
2. Multidatenbank-Architektur
3. Multidatenbanksprachen
3.1 Allgemein
3.2 MSQL
4. SchemaSQL
4.1 Allgemeine Einführung
4.2 SchemaSQL – Eine Erweiterung zum SQL-Standard
4.3 Aufbau von SchemaSQL-Anweisungen
4.4 Sichten in SchemaSQL
5. Implementation Architecture von Lakshmanan
5.1 Lakshmanan Architektur
5.2 Lakshmanan Algorithmus
5.3 Abfrage-Optimierung
5.4 Redundanz und Inkonsistenz
6. Schlusswort
Zielsetzung und thematische Schwerpunkte
Die vorliegende Arbeit gibt einen fundierten Einblick in die Multidatenbanksprache SchemaSQL. Ziel ist es, die Notwendigkeit von Spracherweiterungen für föderierte Datenbanksysteme aufzuzeigen und die Funktionsweise sowie die Implementierungs-Architektur von SchemaSQL anhand praxisnaher Beispiele zu erläutern.
- Multidatenbank-Architekturen und deren Herausforderungen bei der Datenintegration.
- Vergleich und Einordnung von MSQL und SchemaSQL als spezialisierte Abfragesprachen.
- Detaillierte Syntax und Semantik von SchemaSQL inklusive horizontaler Aggregationen.
- Die Lakshmanan-Architektur zur effizienten Abfrageverarbeitung in Multidatenbanksystemen.
Auszug aus dem Buch
4.2 SchemaSQL – Eine Erweiterung zum SQL-Standard
SchemaSQL wird grundsätzlich als Erweiterung zu SQL angesehen. Es bietet einige Gemeinsamkeiten, sowie einige Unterschiede auf die wir nun im Detail etwas genauer eingehen werden. Um die Erklärungen etwas zu veranschaulichen, möchten wir alle praktischen Übungen in dieser Arbeit an einem ausgewählten Beispiel demonstrieren. Das Beispiel besteht aus vier Datenbank, in denen jeweils die Preise für Benzin und Diesel der Tankstellenketten Aral und Shell, in den Städten Hamburg, Berlin, München und Dortmund hinterlegt sind. Die Datenbanknamen sind gleich der Städtenamen der Daten die in ihnen gespeichert sind. (siehe Abb. 2)
Wie unschwer zu erkennen ist, sind in allen Datenbanken identische Informationen hinterlegt, jede Datenbank ist aber unterschiedlich aufgebaut.
Allgemein lässt sich sagen, dass SchemaSQL Standard SQL erweitert. Es bietet somit alle Funktionalitäten, die auch im „einfachen“ SQL vorhanden sind. Alle Anfragen welche in einem SQL Standard formuliert sind, lassen sich so auch in SchemaSQL umformen.
Zusammenfassung der Kapitel
1. Einleitung: Einführung in die Thematik der Multidatenbanksysteme sowie Vorstellung der Zielsetzung dieser Arbeit.
2. Multidatenbank-Architektur: Erläuterung der Architektur föderierter Datenbanksysteme nach Litwin und deren spezifischer Anforderungen.
3. Multidatenbanksprachen: Überblick über existierende Ansätze wie MSQL als Vorgänger für föderierte Abfragesprachen.
4. SchemaSQL: Ausführliche Darstellung der Sprache SchemaSQL, ihrer Syntax, der Erweiterungen gegenüber SQL und der Handhabung von Sichten.
5. Implementation Architecture von Lakshmanan: Beschreibung des technischen Aufbaus des SchemaSQL-Servers, der Algorithmen zur Abfrageoptimierung sowie des Umgangs mit Dateninkonsistenz.
6. Schlusswort: Fazit über die Bedeutung von SchemaSQL für komplexe Abfragen in modernen, föderierten Systemen.
Schlüsselwörter
Multidatenbanksystem, Föderierte Datenbanken, SchemaSQL, SQL-Erweiterung, Lakshmanan-Architektur, FST, Abfrageoptimierung, Datenintegration, Datenbank-Sichten, Metadaten, Interoperabilität, VIT, horizontale Aggregation, Dateninkonsistenz, föderierte Abfragesprachen
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Hausarbeit behandelt die Erweiterung von SQL für die Verarbeitung von Informationen in föderierten Multidatenbanksystemen, wobei der Fokus auf der Sprache SchemaSQL liegt.
Was sind die zentralen Themenfelder?
Zentrale Themen sind Datenbankarchitekturen für Föderationen, die Notwendigkeit spezieller Abfragesprachen, die Syntax von SchemaSQL sowie die zugrunde liegende Implementierungs-Architektur nach Lakshmanan.
Was ist das primäre Ziel der Arbeit?
Das primäre Ziel ist es, dem Leser die Konzepte und die praktische Anwendung von SchemaSQL näherzubringen, um Daten aus unterschiedlich strukturierten, aber inhaltlich verwandten Datenbanken abfragen zu können.
Welche wissenschaftliche Methode wird verwendet?
Es handelt sich um eine theoretische Analyse, bei der die Funktionsweise von SchemaSQL anhand eines durchgängigen Fallbeispiels – der Preisabfrage von Tankstellen in verschiedenen Städten – erläutert wird.
Was wird im Hauptteil behandelt?
Im Hauptteil werden der Sprachaufbau, die Deklaration von Variablen, die Unterschiede zu Standard-SQL, die Verwendung von Sichten sowie die technische Architektur und Optimierungsalgorithmen ausführlich besprochen.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die wichtigsten Begriffe sind Multidatenbanksystem, SchemaSQL, Föderation, Lakshmanan-Architektur, FST, Abfrageoptimierung und SQL-Erweiterung.
Was genau versteht man unter dem Begriff der horizontalen Aggregation in SchemaSQL?
Im Gegensatz zu Standard-SQL, das nur vertikale Aggregationen innerhalb einer Spalte erlaubt, ermöglicht SchemaSQL horizontale Aggregationen, bei denen Berechnungen über verschiedene Attribute (Spalten) eines Tupels hinweg durchgeführt werden können.
Wie löst SchemaSQL das Problem der Dateninkonsistenz?
SchemaSQL nutzt die „view facility“ (Sicht-Funktionalität) sowie die Lakshmanan-Architektur, um durch kontrollierte Sichtweisen auf die Daten Inkonsistenzen zu maskieren oder gezielt auf Primärexemplare zu verweisen.
- Quote paper
- Sebastian Behrens (Author), Sven Wollrabe (Author), 2002, SchemaSQL - eine Erweiterung von SQL zur Verarbeitung von Informationen aus Multidatenbanksymenste, Munich, GRIN Verlag, https://www.grin.com/document/8088