• +49-(0)721-402485-12
Ihre Experten für XML, XQuery und XML-Datenbanken

XML-Dokumente

XML ist eine Metasprache, also eine Sprache zur Definition von Sprachen (Vokabularen) für Informationseinheiten, die so genannten XML-Dokumente. Das Wort "Dokument" weckt hier Assoziationen zu Dokumenten im herkömmlichen Sinn, wie etwa Verträgen oder Urkunden. Tatsächlich können diese mit XML dargestellt werden – man spricht dann von textorientierten XML-Dokumenten. Allerdings bietet XML auch die Möglichkeit, Daten darzustellen, die mit lesbaren Texten wenig gemein haben, wie z. B. die Inhalte relationaler Datenbanken. In diesen Fällen spricht man von datenorientierten XML-Dokumenten. Dank der Flexibilität von XML sind beliebige Zwischenstufen möglich.

XML gibt Syntaxregeln vor, nach denen ein XML-Dokument strukturiert sein muss. Wenn ein Dokument den Syntaxregeln genügt, heißt es wohlgeformt ("well-formed"). Wie bereits erwähnt, lässt sich mit XML eine Sprache definieren, nämlich eine Grammatik für die erlaubte Struktur des Dokumentes. Wenn ein Dokument der jeweils erlaubten Struktur genügt, heißt es gültig (valid). Eine solche Strukturvorgabe kann entweder mit einer in der XML-1.0-Spezifikation vorgegebenen Document Type Definition (DTD) geschehen oder mit einer anderen XML-Schemabeschreibungssprache, wie zum Beispiel dem beim W3C standardisierten XML Schema. Den Vorgang der Prüfung, ob ein XML-Dokument gültig ist, nennt man Validierung. Wir werden sehen, dass im Rahmen einer solchen Validierung auch der Informationsgehalt eines XML-Dokumentes zunehmen kann.

XML ist aus SGML ("Standard Generalized Markup Language") entstanden, welches ebenfalls eine Metasprache ist. Die bekannteste Sprache, die mit SGML definiert wurde, ist HTML. So erstaunt es nicht, dass XML-Dokumente Strukturelemente enthalten, die aus HTML-Dokumenten bekannt sind. Es gibt sogar unter dem Namen XHTML eine Redefinition von HTML als XML-Sprache. Alle XHTML-Dokumente sind auch HTML-Dokumente. Umgekehrt gilt dies nicht, da HTML in vielen Beziehungen freizügiger ist. So unterscheidet XML (und daher auch XHTML) im Gegensatz zu HTML Groß- und Kleinschreibung. An folgendem wohlgeformten XML-Dokument (siehe Beispielszenario) sieht man die Strukturähnlichkeit zu HTML.

<Klinik>
<Name>Hochwaldklinik</Name>
<Stationen>
<Station Leitung="Pfleger_01">
<Name>Notaufnahme</Name>
<Standort>Vorort</Standort>
</Station>
</Stationen>
</Klinik>

 

Quelle: "XQuery – Grundlagen und fortgeschrittene Methoden", dpunkt-Verlag, Heidelberg (2004)

<< zurückvor >>