Der Verfasser
Stefan Kayser ist selbständiger Dozent und Berater.
Seit über 15 Jahren hat er Erfahrung in der Vorbereitung und Durchführung von Schulungen. Zuletzt hatte er in einer Consulting als Dozent und Analyst in den Bereichen Webentwicklung, Programmierung, SAP uvm. gearbeitet. Ein Schwerpunkt seiner Arbeit ist seitdem XML. Kontakt: info@kayser-schulung.de
Copyright © Stefan Kayser 2004
WohlgeformtesXML V1.3.doc Inhalt
Wohlgeformtes XML - kurz und bündig
Inhalt
1 Einleitung 5
1.1 Zu diesem Text 5
1.2 Was ist XML? 5
1.3 Was heißt wohlgeformt? 7
2 Arbeitsvorbereitung 9
2.1 Software 9
2.2 Dokumente 11
3 Die XML-Syntax 12
3.1 Grundlagen. 12
3.1.1 Struktur. 12
3.1.2 Namen 12
3.2 Elemente 13
3.2.1 Wurzel-Ele ment. 14
3.2.2 Leere Elemente 14
3.3 Attribute 15
3.3.1 XML-Attribute. 16
3.4 Zeichendaten 19
3.4.1 Zulässige und unzulässige Zeichen. 19
3.4.2 Referenzen 19
3.4.3 CDATA-Abschnitte. 21
3.5 Kommentar 22
3.6 Verarbeitungsanweisungen 23
3.6.1 Allgemeines. 23
3.6.2 Praxisbeispiele 24
4 Stilfragen und Praxistips 25
4.1 Element-Inhalt 25
4.2 Elemente und Attribute 27
4.3 Aufzählungen. 28
4.4 Zahlen in XML-Dokumenten. 29
4.5 XML und CSS. 30
5 Namensräume 31
5.1 Einführung. 31
5.2 Formulierung. 31
5.3 Beispiele für angewandte Namensraum-Technik 34
6 Anhang 36
6.1 Checkliste Wohlgeformtheit 36
6.2 Zeichensätze 37
6.3 Namenserweiterungen für Dateien. 37
6.4 Abbildungsverzeichnis 38
6.5 Offizielle Quellen. 38
6.5.1 Zitierte Quellen 38
6.5.2 Weitere Links 38
Copyright Stefan Kayser 2004 Seite 4 von 38
WohlgeformtesXML_V1.3.doc Einleitung
1 Einleitung
1.1 Zu diesem Text
XML ist ein unabhängiges Datenformat, das sich in rasend schneller Zeit zum Standard einer übergreifenden Datenübertragung entwickelt. Insbesondere im Datenaustausch zwischen Datenbanken und Webbrowsern oder unter verschiedenen Datenbanken ist XML mittlerweile zu einem wichtigen Werkzeug geworden. Die beiden wichtigsten Datenbanken im professionellen Bereich, Oracle ® und der sich schnell verbreitende Microsoft SQL Server ® , haben ihre XML-Tools.
Die Literatur zu XML füllt mittlerweile Regalmeter: XML in diesem oder jenem Browser, XML bei dieser oder jener Datenbank, XML-Schema, XPath, XSL(T), usw. usf. Wie bei jeder Fachliteratur ist schnell der Punkt erreicht, daß sie zu einem Forum von Experten wird, die mit Fachbegriffen um sich werfen und sich mit Spezialproblemen befassen; der Laie aber bleibt außen vor oder muß sich mühselig durch Expertenliteratur kämpfen und selbständig auf die Grundlagen zurückschließen, mit den bekannten Gefahren von Mißverständnissen und Lücken.
Dabei ist XML im Kern ein recht einfaches Datenformat, das aus einer klaren, manchmal aber erst auf den zweiten Blick verständlichen Grammatik beruht.
Dieser Text ist eine leicht verständliche Schnelleinführung für Leser, die einfache oder vielleicht noch gar keine Kenntnisse in XML haben. Kurz und bündig wird alles Wissenswerte über wohlgeformtes XML erklärt und so die Grundlage für eine individuelle Weiterbeschäftigung mit dem Thema gelegt.
In diesem Text werden gelegentlich in Fußnoten oder B emerkungen Vergleiche zu relationalen Datenbanken gegenüber der XML-Modellierung gemacht. Diese Anmerkungen sollen zusätzliche Hilfen für Leser mit entsprechenden Vorkenntnissen sein. Leser ohne Erfahrungen mit Datenbanken können über diese Stellen ohne Informationsverlust bezüglich XML hinweglesen.
Hier erwähnte Softwareprodukte u.a. Produkte sind Marken oder eingetragene Marken der jeweiligen Firmen
1.2 Was ist XML?
XML heißt eXtensible Markup Language (= Erweiterbare Beschreibungs-Sprache). Die Sprache X ML ist eine sogenannte Dokumentbeschreibungssprache, denn sie dient dazu, Textdokumente zu verfassen, die neben den Daten als Textinhalt eine Beschreibung der Bedeutung oder Funktion dieser Daten enthalten ( deshalb „ Beschreibungssprache “). Die grundsätzliche XML-Grammatik besteht fast nur aus wenigen syntaktischen Regeln; es gibt (fast) keinen vorgegebenen Wortschatz, die Datenbeschreibung in XML ist frei formulierbar (deshalb „erweiterbar“).
Kurz: XML-Dokumente sind rein textliche, qualifizierte Datendokumente.
Copyright © Stefan Kayser 2004 Seite 5 von 38
WohlgeformtesXML_V1.3.doc Einleitung
Dokument 1 zeigt ein einfaches XML-Dokument. Das Element
Die Sprache XML wurde vom World Wide Web Consortium (w3c) als Standard formuliert und lizenzfrei zur Verfügung gestellt. Diesem Gremium gehören Vertreter verschiedener Unternehmen und Universitäten an, so daß von Anfang an eine breite Akzeptanz gegeben war. Unter den deutschen Mitgliedern befinden sich die Siemens AG, die SAP AG und die Fraunhofer-Gesellschaft.
Ein großer Vorteil von XML besteht darin, daß es plattformunabhängig ist, d.h. es ist nicht an bestimmte Betriebssysteme oder Programme gebunden. D aten können zwischen unterschiedlichen Systemen ausgetauscht werden. Insbesondere für dynamische Websites ist XML ideal. Daten werden aus der Datenbank ins webfähige XML übertragen und mit Hilfe einer Stylesheetsprache, z.B. dem ebenfalls XML-basierten XSLT, in HTML für Rechner oder WML für Mobiltelefone konvertiert. Positiver Nebeneffekt: Im Gegensatz zur statischen Websprache HTML bleiben qualifizierte Daten und Gestaltung (Wiedergabe als Tabelle in roter, kursiver Schrift) getrennt! Dies bedeutet eine saubere Webprogrammierung und die Wiederverwertbarkeit der Gestaltung (einheitliche Corporate Identity). Bekannte Softwareprodukte, die mit XML arbeiten, sind u.a.: Microsoft SQL Server ® , mySAP ® , Oracle ® , Borland Kylix 2 ® .
Der zweite große Vorteil von XML ist, daß es eine Syntax für Beschreibungssprachen ist, da es an keine bestimmten Themen oder Projekte gebunden ist. XML ist damit auch eine Metasprache zur Entwicklung weiterer plattformunabhängiger Sprachen, die einen vorgegebenen Wortschatz haben und auf bestimmte Bedürfnisse und Anwendungszwecke zugeschnitten sind. Zu den Sprachen der XML-Familie gehören: HTML
Hyper-Text Markup Language. Sprache zur Erstellung browserfähiger Webseiten. Unter dem Namen XHTML ist nun auch die strikte Einhaltung der XML-Syntax etabliert. WML
Wireless Markup Language. Sprache zur Erstellung von Webseiten für Mobiltelefone. MathML
Sprache zur Formulierung mathematischer Ausdrücke.
Copyright © Stefan Kayser 2004 Seite 6 von 38
WohlgeformtesXML_V1.3.doc Einleitung
SVG
Skalierbare Vektor-Graphik. Sprache zur Beschreibung von Bildern. Von übergreifender Bedeutung sind: XML-Schema
Grammatiksprache für XML-Dokumente oder sogar neuer XML-basierter Sprachen. Regelt u.a. Dokument-Gliederung, Element-Schachtelung (nesting) und Datentypen. Insbesondere bei der Zusammenarbeit mit Datenbanken geeignet. XSL
eXtensible Stylesheet Language. Sprache zur Konvertierung von Dokumenten. XSL gliedert sich in die beiden Teile XSL-FO und XSLT. Mit XSL-FO (Formatting Objects) können z.B. XML-Dokumente in pdf-Dokumente konvertiert werden. Mit XSLT (XSL Transformation) werden XML-Dokumente in andere XML-basierte Dokumente transformiert, z.B. XML-Bestellungen in XML-Rechnungen oder aber beliebige XML-Dokumente in XHTML- oder WML-Dokumente zur Webdarstellung. XLink
Methode zur Formulierung und Einbindung von Links, also direkten elektronischen Verknüpfungen von Ressourcen, in XML-Dokumente.
XML ist damit zur Grundlage für das sogenannte „semantische Web“ und das Resource Description Framework (RDF) geworden, eine zukunftsträchtige Entwicklung, die eine starke semantische Beschreibung von Daten im Netz und damit zu einer Anbindung der Ausdrucksweise der Informatik an die übliche menschliche Kommunikation anstrebt.
1.3 Was heißt wohlgeformt?
Wie erwähnt, ist XML eine Sprache zur Erstellung qualifizierter Textdokumente ohne thematische Beschränkung. Daraus folgt, daß XML (fast) keinen vorgegebenen Wortschatz hat. Die XML-Grammatik besteht also fast nur aus Vorschriften zur Formulierung. Weiterhin wurde erwähnt, daß das w3c XML als unabhängigen Standard formuliert hat, also eine Normierung im Kundeninteresse ans trebt. Weil sich Softwareproduzenten diesem Standard anschließen sollen, müssen für sie und ihre Kunden aber klare, verläßliche Regeln ge lten, auf deren Grundlage Software-Produkte entwickelt werden können. Die XML-Grammatik ist damit also strikt einzuhalten!
Wenn ein XML-Dokument alle Regeln der XML-Grammatik einhält, nennt man es wohlgeformt (engl. „ well-formed“). Ebenso können einzelne Bestandteile wie Textstücke oder Elemente zur Datenqualifizierung wohlgeformt genannt werden, wenn sie für sich genommen vollständig zum Regelwerk von XML passen. 1
1 Vgl. w3c: XML 1.0 (3), Abschnitt 2.1.
Copyright © Stefan Kayser 2004 Seite 7 von 38
WohlgeformtesXML_V1.3.doc Einleitung
Wenn ein XML-Dokument oder ein Bestandteil daraus wohlgeformt ist und darüber hinaus zu einem inhaltlichen Regelwerk, das z.B. im erwähnten XML-Schema formuliert ist, paßt, heißt es gültig (engl. „valid“). Gültigkeit ist aber nicht Thema dieses Textes.
Copyright © Stefan Kayser 2004 Seite 8 von 38
WohlgeformtesXML_V1.3.doc Arbeitsvorbereitung
2 Arbeitsvorbereitung
2.1 Software
Es gibt mittlerweile eine Reihe sogenannter XML-Parser. Das sind Programme, die die Erstellung von XML-Dokumenten durch fortgeschrittene Editor-Werkzeuge unterstützen sowie die Wohlgeformtheit und ggf. auch Gültigkeit von Dokumenten prüfen und durch Fehlermeldungen bei deren Korrektur helfen.
Da dieser Text aber eine einfache und schnelle Einführung darstellt und den Leser in die Lage versetzen will, zügig mit XML arbeiten zu können, wollen wir uns auf einfache und meist auf jedem handelsüblichen Rechner vorhandene Software beschränken. Zur Erstellung von XML-Dokumenten ist nahezu jeder beliebige Editor geeignet. Der Leser mag sich hier denjenigen aussuchen, der seinen Ansprüchen und Gewohnheiten am nächsten kommt.
Zur Darstellung der Dokumente und Prüfung ihrer Wohlgeformtheit genügt ein Internetbrowser. Hier wird der Microsoft Internet Explorer ® ab Version 5.x, besser ab Version 6.x empfohlen. Für diesen Browser sprechen mehrere Argumente: 1. Er hält sich ziemlich genau an die Vorgaben des w3c. 2. Er bietet eine sehr übersichtliche und komfortable Darstellung von XML-Dokumenten.
3. Verstöße gegen Wohlgeformtheitsregeln werden mit meist brauchbaren Fehlermeldungen angezeigt.
Abb. 1 zeigt das Dokument aus der Einführung im Browserfenster. Elemente und Textstücke sind durch verschiedene Schriftstärken und Farben leicht voneinander zu unterscheiden. Wenn man mit dem Mauszeiger auf das Minuszeichen vor dem Element
Copyright © Stefan Kayser 2004 Seite 9 von 38
Arbeit zitieren:
Stefan Kayser, 2004, Wohlgeformtes XML - kurz und bündig, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Informationsaustausch auf der Basis von XML
Welche Arten von Standards sin...
Informatik - Wirtschaftsinformatik
Seminararbeit, 34 Seiten
Alphabetismus und Analphabetismus - die psychologischen Aspekte des Le...
Psychologie - Lernpsychologie, Intelligenzforschung
Hausarbeit, 21 Seiten
Einsatz von XML Topic Maps im Wissensmanagement - Definition und Visua...
Informationswissenschaften, Informationsmanagement
Seminararbeit, 23 Seiten
Private Equity als Instrument der Unternehmensfinanzierung
BWL - Investition und Finanzierung
Hausarbeit, 20 Seiten
Stefan Kayser's Text Wohlgeformtes XML - kurz und bündig ist nun auf dem Buchmarkt erhältlich
Stefan Kayser hat den Text Wohlgeformtes XML - kurz und bündig veröffentlicht
Stefan Kayser hat einen neuen Text hochgeladen
0 Kommentare