Das Akronym XML steht für eXtensible Markup Language. Hierbei handelt es
sich um einen Metastandard für Dateiformate. Wie der Ausdruck „extensible“
im Namen bereits andeutet, ist XML erweiterbar und kann daher für diverse
Anforderungen im Bereich Daten- und Dokumentenhaltung eingesetzt werden. XML
ist zudem von grundlegender Bedeutung für die Planungen des
W3C
in Hinblick auf die weitere technologische Entwicklung des Internet
hin zum
Semantic Web.
Anwendungen
XML ist ein übergeordneter Standard, der es erlaubt, konkrete
Markup-Sprachen zu definieren. Bekannte XML-Standards sind:
-
XHTML, die XML-konforme Version von HTML,
-
MathML, eine Auszeichnungssprache für Mathematische Formeln sowie
-
SVG, ein Format zu Repräsentation von Vektorgrafiken,
-
RSS, ein Format zur Bereitstellung von aktuellen Informationen.
- ODF, ein offenes Austauschformat für (Office-)Dateien
RSS-Feeds sind eine XML-Anwendung, die sich zunehmender Beliebtheit
erfreut. Über den
Einsatz als Recherchemittel
informiert die Rubrik
Didaktisches Design. Wenn Sie selbst einen RSS-Feed anbieten möchten, finden
Sie Informationen in der
Vertiefung RSS.
Eine OpenDocument-Datei besteht, je nach Komplexität, aus einer gepackten
(ZIP) Sammlung von XML-Dateien und referenzierter Objekte wie Bildern. In
einfachen Fällen beläuft sich der Umfang auf eine einzelne XML-Datei.
Eigenschaften
Alle XML-basierten
Markup-Sprachen
haben bestimmte Eigenschaften gemeinsam, die sie von XML
übernehmen. XML-Dokumente bestehen aus
ASCII
-Text, der durch Elemente und Attribute strukturiert wird.
Elemente werden wie in HTML mit spitzen Klammern (Tags) ein- und
ausgeleitet. Ein Element besteht entweder aus einem Start- und einem End-Tag
oder kann in einer Kurzschreibweise notiert werden. Die Namen der Elemente
können innerhalb bestimmter Konventionen für jede Markup-Sprache frei
gewählt werden. Innerhalb eines Elementes darf entweder Text oder ein
weiteres Element bzw. eine Mischung aus Beidem stehen. Überdies kann jedes
Element mit einem oder mehreren Attributen versehen werden. Attribute
bestehen jeweils aus dem Attribut-Namen und einem Attribut-Wert.
Abb. Beispiel für eine XML-Datei
Für XML-Dokumente gelten einige allgemeine Formationsregeln. So muss
jedes XML-Dokument wenigstens ein so genanntes Wurzel-Element enthalten, das
alle anderen Elemente und allen Text umfasst. Zudem dürfen sich Elemente
nicht überschneiden. Genügt ein Dokument diesen und wenigen weiteren Regeln
so spricht man von einem „wohlgeformten“ XML-Dokument.
Um eine XML-konforme Markup-Sprache wie beispielsweise XHMTL zu
definieren, bedarf es neben diesen allgemeinen Regeln auch einer
spezifischen Grammatik, die in einer
Schemasprache
formuliert wird. Die derzeit wichtigsten Schemasprachen
sind
DTD,
XMLSchema
und
RelaxNG.
Schemasprachen unterscheiden sich in ihrer Ausdrucksmächtigkeit: In den
verschiedenen Sprachen können unterschiedlich komplexe Anwendungen definiert
werden. In allen Schemasprachen lassen sich die Namen und Inhaltsmodelle der
Elemente und Attribute für die jeweilige Markup-Sprache festlegen.
Entspricht ein Dokument den im Schema angegebenen Regeln, handelt es sich um
ein „valides“ XML-Dokument. Ein Dokument kann nur dann valide sein, wenn es
auch wohlgeformt ist.
Vor- und Nachteile
Ähnlich wie Datenbanken erlaubt XML die - in Grenzen - freie Modellierung
von Informationen und eignet sich damit zur strukturierten Speicherung von
Inhalten. Als text- und dateibasiertes Speichersystem ermöglicht XML die
Distribution von Inhalten und Informationen über das gesamte Internet. Diese
Eigenschaft ist ein Vorteil gegenüber Datenbanken, deren Inhalte von Außen –
zum Beispiel durch Suchmaschinen – meist nicht zugänglich sind. Gegenüber
den tabellarisch organisierten Datenbanken bietet XML Vorteile für die
Modellierung von gemischten Inhaltsmodellen, wie sie zur Abbildung von
Textstrukturen benötigt werden. Allerdings ist die Verarbeitung von Daten im
XML-Format in der Regel deutlich langsamer als bei in Datenbanken abgelegten
Informationen. Im Einzelfall müssen die Vorteile der jeweiligen
Speichermethode an Hand der Zielsetzung des Projektes gegeneinander
abgewogen werden.
Standards
XML selbst wird durch weitere Standards flankiert, die zur Verarbeitung,
Analyse und Ausgabe von XML-Daten dienen. Die wichtigsten sind:
- die Programmiersprache
XSLT
zur Umwandlung von XML-Dokumenten in verschiedene
Ausgabemodi,
- die Formatierungssprache
XSLFO
mit der Druckvorlagen erstellt werden können,
- die Abfragesprache
XQuery,
-
XPath
für die Lokalisierung von Informationen,
-
XLink
und
XPointer
zur Definition von Verknüpfungen und Sprungmarken.
Daneben existiert eine Reihe weiterführender XML-basierter Standards, die
insbesondere in Zusammenhang mit der Entwicklung des Semantic Web eine Rolle
spielen. Hier sind vor allem
RDF,
RDFS
und
OWL
von Bedeutung.
Erstellung
Da XML im Prinzip ein menschenlesbares Quelltext-Format ist, können
XML-Daten (wie auch HTML) mit einem einfachen Quelltext- oder ASCII-Editor
bearbeitet werden, wie er in jedem Betriebssystem kostenlos enthalten ist.
Für die regelmäßige Nutzung benötigen Sie allerdings relativ schnell einige
Funktionen, die ein einfacher Quelltexteditor nicht bieten kann. Viele
HTML-Editoren können auch als XML-Editor eingesetzt werden. Eine erste
Orientierung bietet unsere
Zusammenstellung von Editoren. XML ist inzwischen
auch in der Softwareentwicklung verbreitet. Daher bieten viele
spezialisierte Editoren zur Entwicklung von Programmen ebenfalls
XML-Support.
Für ein professionelles Dokumenten-Management mit XML benötigen Sie
spezielle Editoren, die beispielsweise die Programmiersprache XSLT zur
Verarbeitung von XML-Dokumenten unterstützen. Im Verlagswesen und in der
Forschung sind u. a. folgende Programme verbreitet:
Weitere Informationen