Im Zuge computerlinguistischer Forschung wird der Ruf nach einem universellen Format zur Speicherung großer Textkorpora laut. Die vom W3C entwickelte „Extensible Markup Language“ (XML) bietet die Möglichkeit, Informationen als Text in einem Datenformat zu speichern. Die Anwendung von XML erfreut sich großer Beliebtheit, wie im WWW anhand der Treffer in Google ersichtlich wird: Über 16,7 Millionen Treffer verzeichnete die Suchmaschine Google am 11. Februar 2003 zum Suchwort „XML“ (siehe Abb. 1). Die Verwaltung einer Vielzahl von
[Abb. in Downloaddatei enthalten.]
Abbildung 1: Screenshot von Google mit dem Suchwort „XML“
XML-Dokumenten wird durch XML-Datenbanksysteme erleichtert. Software AG bietet solch ein Datenbankmanagementsystem, das XML-Daten abspeichern und verwalten kann: Tamino1. Zu den Aufgaben eines XML-Datenbanksystems gehört nicht nur die Speicherung und Verwaltung der XML-Dokumente, sondern auch die Extraktion von Informationen durch eine intuitive Anfragesprache wie XPath, die in Tamino bereits in einer eigenen Form mit der Bezeichnung X-Query integriert ist. Die Spezifikation der Anfragesprache XPath ist auf den Seiten des W3C zu finden2. In dieser Seminararbeit zu der Veranstaltung „XML-Anfragesprachen“ im WS02/03 am Centrum für Informations- und Sprachverarbeitung der Ludwig-Maximillians-Universität München unter der Leitung von Prof. Dr. Klaus Schulz und Dr. Holger Meuss wird Tamino, ein XML Datenbankserver, vorgestellt. Die Hausarbeit basiert im Wesentlichen auf der Dokumentation der Tamino Software3. Hilfreich bei der Lektüre dieser Seminararbeit sind Grundkenntnisse in XML und von DTDs, Datenbanken und Query-Sprachen. Zur praktischen Übung kann auch ein laufendes Taminosystem von Nutzen sein4.
Inhaltsverzeichnis
- 1 Einleitung
- 2 XML und DTD
- 2.1 Musikpartitur
- 2.2 Baumstruktur
- 2.3 XML-Dokument
- 2.4 DTD
- 3 Aufbau der Tamino Module
- 3.1 Struktur der Tamino Datenbank
- 3.2 Tamino Manager
- 3.3 Tamino Schema Editor
- 3.4 Interactive Interface
- 3.5 Tamino X-Query
- 4 Join von Doctypes
- 4.1 Connecting Doctype
- 4.2 Zusammenfassung Joins
- 5 Zusammenfassung
Zielsetzung und Themenschwerpunkte
Diese Seminararbeit stellt Tamino, einen XML-Datenbankserver, vor und soll das Zusammenspiel von XML, DTD und Datenbanken verdeutlichen. Sie befasst sich mit der Speicherung und Verwaltung von XML-Dokumenten und der Extraktion von Informationen durch Anfragesprachen wie XPath und X-Query, die in Tamino integriert sind.
- Die Funktionsweise und Anwendung von XML-Datenbanksystemen
- Die Integration von XML-Dokumenten in Datenbanken
- Die Verwendung von Anfragesprachen (XPath, X-Query) zur Extraktion von Informationen aus XML-Dokumenten
- Die Architektur und Module des Tamino XML-Datenbankservers
- Die Bedeutung von DTDs für die Strukturierung und Validierung von XML-Dokumenten
Zusammenfassung der Kapitel
Kapitel 1 bietet eine Einleitung in das Thema der XML-Datenbanken und stellt die Bedeutung von XML im Kontext computerlinguistischer Forschung dar. Kapitel 2 behandelt die Grundlagen von XML und DTD am Beispiel einer Musikpartitur. Es werden die Baumstruktur, die XML-Kodierung und die Definition einer DTD für das Musikpartitur-Dokument erklärt. Kapitel 3 konzentriert sich auf den Aufbau der Tamino-Module, einschließlich der Struktur der Datenbank, dem Tamino Manager, dem Tamino Schema Editor, der interaktiven Schnittstelle und der Anfragesprache X-Query. Kapitel 4 behandelt die Join-Operation von Doctypes, die es ermöglicht, Informationen aus verschiedenen XML-Dokumenten zu verbinden. Kapitel 5 bietet eine Zusammenfassung der wichtigsten Erkenntnisse der Arbeit.
Schlüsselwörter
XML, DTD, Datenbanken, Anfragesprachen, XPath, X-Query, Tamino, XML-Datenbanksysteme, Musikpartitur, Baumstruktur, Doctypes, Join, Informations-Extraktion.
- Arbeit zitieren
- Ramon Schalleck (Autor:in), 2003, Tamino XML-Datenbankserver, München, GRIN Verlag, https://www.grin.com/document/11048