In der heutigen Informationswelt hat sich das XML-Format zum De-facto-Standard entwickelt für die Übertragung von Informationen. XML-Dokumente können unterschiedlichste Informationen beinhalten und entsprechend ihrem Inhalt unterschiedlich strukturiert sein. Sie können sehr vielseitig eingesetzt werden, bspw. als Format für Börsennachrichten für Handelsplattformen. Für Anwendungszwecke kann es notwendig sein XML-Dokumente für eine längere Nutzung aufzubewahren, bspw. für Recherchen. Relationale Datenbanken sind Verwalter große Datenmengen und dienen zugleich als Datenbasis für eine Vielzahl weiterer Anwendungen, entsprechend wichtig ist es über Speicherungsverfahren zu verfügen, die sowohl die Inhalte als auch die Struktur der XML-Dokumente in Relationen abbilden können. Derartige Speicherungstechniken werden hier vorgestellt.
Inhaltsverzeichnis
1. Einführung
Anforderungen an den Umwandlungsprozess
2 Beschaffenheit von XML-Dokumenten
3 Die verschiedenen Speicherungsverfahren
3.1 Textbasierte Speicherung
3.1.2 Volltextindex mit XML-Index
3.2 Modellbasierte Verfahren
3.2.1 Einfache Speicherung der Graphenstruktur
3.2.2 Speicherung mittels DOM
3.3 Mapping-Verfahren
3.3.1 Automatisches Mapping
3.3.2 Mapping-Templates
4. Vergleich und Beurteilung der Verfahren
Zielsetzung und Themen
Die Arbeit gibt einen umfassenden Überblick über verschiedene Verfahren zur Speicherung von XML-Dokumenten in relationalen Datenbanken, um die Herausforderungen bei der Abbildung von hierarchischen Datenstrukturen in tabellarische Formate zu analysieren und zu bewerten.
- Grundlegende Anforderungen an den Transformations- und Speicherungsprozess von XML.
- Unterscheidung verschiedener XML-Dokumententypen (datenzentriert, dokumentenzentriert, semistrukturiert).
- Detaillierte Vorstellung textbasierter, modellbasierter und Mapping-basierter Speicherverfahren.
- Vergleichende Analyse der Verfahren hinsichtlich Performance, Verlustfreiheit und Eignung für verschiedene Anwendungszwecke.
Auszug aus dem Buch
3.1 Textbasierte Speicherung
Die textbasierte Speicherung erfasst das XML-Dokument als ganzes Dokument und legt es als einzelnes Tupel in einer bestehenden oder eigens hierfür neu angelegten Tabelle ab. Das Besondere an dem Verfahren ist, dass das Dokument im Originalzustand erhalten bleibt. Für den Speicherungsvorgang werden die XML-Dokumente in Objekte gekapselt, zumeist in CLOB (Character Large Object), und vom DBMS als Zeichenkette einfügt. Da keine Umwandlungsprozesse stattfinden, ist keine Rekonstruktion notwendig und die Perfomance sehr hoch im Vergleich zu den anderen Verfahren. Da XML-Dokumente eine beträchtliche Größe erreichen können und als solche auch deklariert werden müssen um sie wiederzuerkennen, erweiterten mehrere Hersteller ihr Datenbanksystem um zusätzliche Datentypen. Dieses Verfahren hat den Vorteil, dass das Dokument unverändert und damit verlustfrei gespeichert wird. Eine DTD wird für diesen Prozess nicht benötigt. Nachteilig ist, dass dieses Verfahren prinzipiell keine Möglichkeiten bietet direkt auf bestimmte Elemente und Suchbegriffe zuzugreifen.
Zusammenfassung der Kapitel
1. Einführung: Es wird die Rolle von XML als Standardformat und die Notwendigkeit ihrer Speicherung in relationalen Datenbanken erläutert, wobei Anforderungen wie Verlustfreiheit und Performance im Fokus stehen.
2 Beschaffenheit von XML-Dokumenten: Die Klassifizierung von XML-Daten in datenzentrierte, dokumentenzentrierte und semistrukturierte Typen wird vorgenommen, um die Grundlage für die Wahl des geeigneten Speicherungsverfahrens zu bilden.
3 Die verschiedenen Speicherungsverfahren: Dieser Abschnitt bietet eine detaillierte technische Analyse von textbasierten Ansätzen, modellbasierten Graphen-Speicherungen und verschiedenen Mapping-Methoden für XML-Inhalte.
4. Vergleich und Beurteilung der Verfahren: Die verschiedenen Techniken werden anhand ihrer Kriterien wie DTD-Erfordernis, Performance und Flexibilität gegenübergestellt, um als Entscheidungshilfe für praktische Implementierungen zu dienen.
Schlüsselwörter
XML, Relationale Datenbanken, Datenspeicherung, XML-Dokumente, Verlustfreiheit, Dokumentenzentriert, Datenzentriert, Graphenstruktur, Mapping-Verfahren, DOM, Volltextindex, Performance, Transformation, Speichereffizienz, XML-Schema
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Herausforderung, XML-Dokumente, die eine hierarchische Struktur aufweisen, effizient in relationalen Datenbanken zu speichern, die auf tabellarischen Strukturen basieren.
Was sind die zentralen Themenfelder der Arbeit?
Die Schwerpunkte liegen auf der Klassifizierung von XML-Dokumententypen, den technischen Ansätzen der Speicherung (textbasiert, modellbasiert, Mapping) sowie dem Vergleich der verschiedenen Methoden.
Was ist das primäre Ziel der Untersuchung?
Das Ziel ist es, einen Überblick über existierende Speicherungsverfahren zu geben und diese basierend auf Kriterien wie Performance und Datenverlustfreiheit zu bewerten, um eine Entscheidungsgrundlage für Anwendungsentwickler zu schaffen.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit nutzt eine systematische Literaturanalyse und eine vergleichende methodische Untersuchung, bei der die Speicherungsverfahren anhand definierter Kriterien (z.B. Performance, Variabilität) tabellarisch gegenübergestellt werden.
Was wird im Hauptteil der Arbeit behandelt?
Im Hauptteil werden zunächst die Anforderungen an den Umwandlungsprozess definiert, gefolgt von einer detaillierten Vorstellung der drei Hauptkategorien für Speicherungsverfahren inklusive technischer Details zu Indizierung und Mapping.
Welche Schlüsselwörter charakterisieren die Arbeit am besten?
Die Arbeit wird durch Begriffe wie XML, relationale Datenbanken, Datentransformation, Graphenstruktur, Mapping-Templates und Performance-Analyse charakterisiert.
Warum ist die Unterscheidung zwischen datenzentrierten und dokumentenzentrierten XML-Daten so wichtig?
Diese Unterscheidung ist essenziell, da sie bestimmt, welches Speicherungsverfahren am effizientesten ist: Während datenzentrierte XML-Daten oft gut in Relationen abzubilden sind, erfordern dokumentenzentrierte Daten flexiblere Ansätze zur Bewahrung ihrer unstrukturierten Inhalte.
Was ist unter dem Begriff "Shreddern" im Kontext der Mapping-Verfahren zu verstehen?
Shreddern bezieht sich auf das Zerlegen eines XML-Dokuments in Fragmente, wobei mittels einer benutzerdefinierten Abbildungsvorschrift nur relevante Ausschnitte des Dokuments in tabellarische Relationen überführt werden.
- Quote paper
- Benjamin Belghith (Author), 2003, XML to Relation, Munich, GRIN Verlag, https://www.grin.com/document/20522