XML ist ein unabhängiges Datenformat, das sich in rasend schneller Zeit zum Standard einer übergreifenden Datenübertragung zwischen verschiedenen Datenbanken, Webbrowsern und Office-Anwendungen entwickelt. XML wurde vom World Wide Web Consortium (w3c) entwickelt und lizenzfrei zur Verfügung gestellt. Bekannte Softwareprodukte, die mit XML arbeiten, sind u.a.: Microsoft SQL Server, mySAP, Oracle und das neue Windows Vista samt Office 12.
Die Dokumenttyp-Definition (DTD) ist die Formulierung eines eigenen inhaltsbezogenen Regelwerks für XML-Dokumente. Mit DTD kann der XML-Experte festlegen, ob eine Anschrift wirklich „Anschrift“ oder aber „Adresse“ heißt, ob zuerst Vorname oder Nachname erscheint, ob ein Kunde ein oder mehrere Konten hat. Gerade wenn mehrere Web-Anwendungen oder Datenbanken gemeinsam mit XML-Dokumenten umgehen müssen, ist eine klare und vorher (!) festgelegte Benennung und Strukturierung der Dokumente unerlässlich. Schon bei Analyse und Entwurf sind diese Kenntnisse wertvoll. Manch eine zwar regelkonforme, aber ungeschickte Formulierung wird gar nicht erst aufkommen. Das w3c hält dieses Thema für so wichtig, dass es die DTD im selben Dokument wie XML selber formuliert hat!
Dieser Text ist eine leicht verständliche Schnelleinführung in DTD. Kurz und bündig wird alles Wissenswerte über die Dokumenttyp-Definition erklärt und eine praxisnahe Einführung in den fortgeschrittenen Entwurf von XML-Dokumenten geboten. Wie schon im Text über Wohlgeformtes XML wird das Verständnis durch viele konkrete Beispiele erleichtert. Der Text soll dem Leser besonders in zweierlei Hinsicht einen Mehrwert bieten: Als praxisbezogenes und leichtverständliches Lehrmaterial soll er den Leser in die Lage versetzen, schnell mit dem gelernten arbeiten zu können. Aus diesem Grund soll er auch „Übersetzer“ zwischen der sehr theoretischen und formalistischen Sprache der offiziellen Regelwerke des w3c und der täglichen Sprache des Praktikers sein. Insbesondere beim Verständnis des zumindest umständlich formulierten Konzepts des gemischten Element-Inhalts sowie zum Einsatz externer Parameter-Entitäten dürfte er zu deutlich mehr Klarheit beitragen. Zweitens war es dem Verfasser als Praktiker wichtig, nicht nur Syntaxregeln zu vermitteln, sondern von Anfang an Stilfragen und Modellierung zu erörtern. Denn nicht alles, was möglich ist, ist auch sinnvoll. Eine systematisch qualitätsvolle Formulierung verbreitert und erleichtert die Einsatzmöglichkeiten von XML-Dokumenten.
Inhaltsverzeichnis
1 Einleitung
1.1 Zu diesem Text
1.2 Was ist die Dokumenttyp-Definition?
2 Arbeitsvorbereitung
2.1 Software
2.2 Dokumente
3 Grundlagen von DTD
3.1 Allgemeines zur Syntax
3.2 Die Dokumenttyp-Deklaration
3.3 Prolog
4 Elementtyp-Deklarationen
4.1 Element-Inhalt
4.1.1 Inhaltsmodell: Leere Elemente
4.1.2 Inhaltsmodell: Kind-Elemente
4.1.3 Häufigkeit von Kind-Elementen
4.1.4 Inhaltsmodell: „Gemischter“ Inhalt
4.1.4.1 Reiner Textinhalt
4.1.4.2 Echt gemischter Inhalt aus Text und Kind-Elementen
4.1.5 Inhaltsmodell: Beliebiger Inhalt (ANY)
4.2 Weiterführende Aspekte zu Element-Inhalten
4.2.1 Präzisierung der Häufigkeit von Kind-Elementen
4.2.2 Kommentare und Verarbeitungsanweisungen in Element-Inhalten
5 Attributlisten-Deklarationen
5.1 Grundlagen
5.2 Attributvorgaben
5.3 Attributtypen
5.3.1 Attributtyp CDATA
5.3.2 Die Token – Gruppe: Namen und Name – Token
5.3.3 Attributtyp NMTOKEN
5.3.4 Attributtyp NMTOKENS
5.3.5 Attributtyp ID
5.3.6 Attributtyp IDREF
5.3.7 Attributtyp IDREFS
5.3.8 Aufzählungs-Attribute
6 Teilmengen der DTD
6.1 Interne Teilmenge der DTD
6.2 Externe Teilmenge der DTD
6.2.1 standalone – Dokumentdeklaration
6.2.2 Textdeklaration
6.3 Zusammenwirken von interner und externer Teilmenge der DTD
7 Entitäten
7.1 Grundlagen
7.2 Allgemeine Entitäten
7.2.1 Interne allgemeine Entitäten
7.2.2 Externe allgemeine Entitäten
7.3 Parameter-Entitäten
7.3.1 Zusammenarbeit der „drei“ Teilmengen
7.3.2 Entwurf und Anwendung
7.3.3 Interne Parameter-Entitäten
7.3.4 Externe Parameter-Entitäten
8 Bedingte Abschnitte
8.1 Idee und Konzept
8.2 Implementierung
Zielsetzung und Themen
Das Ziel dieser Arbeit ist es, eine praxisnahe und leicht verständliche Schnelleinführung in die Dokumenttyp-Definition (DTD) zu bieten. Die Forschungsfrage konzentriert sich darauf, wie Anwender, die bereits Grundlagen in wohlgeformtem XML erworben haben, effizient eigene Grammatiken zur Strukturierung von XML-Dokumenten entwerfen und validieren können.
- Grundlagen der DTD-Syntax und Dokumenttyp-Deklaration
- Strukturierung durch Elementtyp-Deklarationen und Inhaltsmodelle
- Präzise Definition von Attributen und deren Datentypen
- Modularisierung durch Teilmengen der DTD und externe Entitäten
- Fortgeschrittene Techniken wie bedingte Abschnitte und Parameter-Entitäten
Auszug aus dem Buch
4.1.2 Inhaltsmodell: Kind-Elemente
Das wichtigste Inhaltsmodell ist die Anordnung von Kind-Elementen, also weiteren, unmittelbar in einem Element enthaltenen Elementen. Im englischen Original heißt dieses Inhaltsmodell children.
In der Elementtyp-Deklaration setzt man hinter den deklarierten Elementtyp in runden Klammern den Namen des Kind-Elementes oder der Kind-Elemente. Das folgende Dokument gibt ein Beispiel:
<?xml version="1.0" encoding="ISO-8859-1" ?>
<!DOCTYPE Personal [
<!ELEMENT Personal (Mitarbeiter+)>
<!ELEMENT Mitarbeiter (Bild)>
<!ELEMENT Bild EMPTY>
]>
Zusammenfassung der Kapitel
1 Einleitung: Vermittelt die Bedeutung der DTD für XML und erläutert den Aufbau des Lehrmaterials.
2 Arbeitsvorbereitung: Gibt Empfehlungen für geeignete Software zur Erstellung und Prüfung von XML-Dokumenten.
3 Grundlagen von DTD: Erklärt die grundlegende Syntax und die Struktur der Dokumenttyp-Deklaration.
4 Elementtyp-Deklarationen: Behandelt detailliert die Definition von Elementen und die verschiedenen Inhaltsmodelle.
5 Attributlisten-Deklarationen: Beschreibt die Spezifikation von Attributen, deren Vorgaben und Datentypen.
6 Teilmengen der DTD: Erläutert die Unterscheidung und das Zusammenwirken von internen und externen DTD-Teilmengen.
7 Entitäten: Führt in die Nutzung allgemeiner Entitäten und Parameter-Entitäten zur Modularisierung ein.
8 Bedingte Abschnitte: Zeigt Techniken zum gezielten An- und Abschalten von Deklarationsblöcken in der DTD.
Schlüsselwörter
XML, Dokumenttyp-Definition, DTD, Parser, Elementtyp, Attribut, Inhaltsmodell, Entitäten, Parameter-Entitäten, Validierung, Syntax, Strukturierung, Wohlgeformtheit, Datenaustausch
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit behandelt die Erstellung und Anwendung von Dokumenttyp-Definitionen (DTD) zur Strukturierung von XML-Dokumenten.
Was sind die zentralen Themenfelder?
Im Fokus stehen der Entwurf von Grammatiken, die Modellierung von Elementen und Attributen sowie fortgeschrittene Techniken der Modularisierung.
Was ist das primäre Ziel der Arbeit?
Ziel ist eine praxisbezogene Schnelleinführung, die den Leser befähigt, XML-Dokumente sauber und strukturiert zu definieren.
Welche wissenschaftliche Methode wird verwendet?
Es wird ein praxisorientierter, lehrbuchartiger Ansatz verfolgt, der Syntaxregeln durch Beispiele und Modellierungshinweise vermittelt.
Was wird im Hauptteil behandelt?
Der Hauptteil umfasst Deklarationen für Elemente, Attribute, DTD-Teilmengen sowie den Einsatz von Entitäten und bedingten Abschnitten.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zu den wichtigsten Begriffen zählen DTD, XML-Parser, Inhaltsmodell, Attributvorgaben und Parameter-Entitäten.
Warum sollte man zwischen interner und externer DTD-Teilmenge unterscheiden?
Die Trennung ermöglicht die Wiederverwendbarkeit von Regelwerken über mehrere Dokumente hinweg und verbessert die Wartbarkeit von XML-Projekten.
Welchen Zweck erfüllen Parameter-Entitäten?
Sie dienen dazu, DTD-Code zu modularisieren und wiederkehrende Definitionen an einer zentralen Stelle zu pflegen.
- Citation du texte
- Stefan Kayser (Auteur), 2005, XML Dokumenttyp-Definition kurz und bündig, Munich, GRIN Verlag, https://www.grin.com/document/36098