XML

Das Akronym XML steht für eXtensible Markup Language. Hierbei handelt es sich um einen Metastandard für Dateiformate. Wie der Ausdruck „extensible“ im Namen bereits andeutet, ist XML erweiterbar und kann daher für diverse Anforderungen im Bereich Daten- und Dokumentenhaltung eingesetzt werden.

XML ist von grundlegender Bedeutung für die Planungen des W3C in Hinblick auf die weitere technologische Entwicklung des Internet hin zum Semantic Web.

Anwendungen

XML ist ein übergeordneter Standard, der es erlaubt, konkrete Markup-Sprachen zu definieren. Bekannte XML-Standards sind:

  • XHTML, die XML-konforme Version von HTML,
  • MathML, eine Auszeichnungssprache für Mathematische Formeln sowie
  • SVG, ein Format zu Repräsentation von Vektorgrafiken,
  • RSS, ein Format zur Bereitstellung von aktuellen Informationen.
  • eLML, die eLesson Markup Language zur Erstellung von eLearning Inhalten.
  • ODF, ein offenes Austauschformat für (Office-)Dateien

RSS-Feeds werden über XML-Dateien bereitgestellt. Über den Einsatz als Recherchemittel informiert die Rubrik Didaktisches Design. Wenn Sie selbst einen RSS-Feed anbieten möchten, finden Sie Informationen in der Vertiefung RSS.

Eine OpenDocument-Datei besteht, je nach Komplexität, aus einer gepackten (ZIP) Sammlung von XML-Dateien und referenzierter Objekte wie Bildern. In einfachen Fällen beläuft sich der Umfang auf eine einzelne XML-Datei.

Eigenschaften

Alle XML-basierten Markup-Sprachen haben bestimmte Eigenschaften gemeinsam, die sie von XML übernehmen. XML-Dokumente bestehen aus Text, der durch Elemente und Attribute strukturiert wird. Elemente werden wie in HTML mit spitzen Klammern (Tags) ein- und ausgeleitet. Ein Element besteht entweder aus einem Start- und einem End-Element oder kann in einer Kurzschreibweise notiert werden. Die Namen der Elemente können innerhalb bestimmter Konventionen für jede Markup-Sprache frei gewählt werden. Innerhalb eines Elementes darf entweder Text oder ein weiteres Element bzw. eine Mischung aus Beidem stehen. Überdies kann jedes Element mit einem oder mehreren Attributen versehen werden. Attribute bestehen jeweils aus dem Attribut-Namen und einem Attribut-Wert.

Abb. Beispiel einer XML-Notation

Für XML-Dokumente gelten einige allgemeine Formationsregeln. So muss jedes XML-Dokument wenigstens ein so genanntes Wurzel-Element enthalten, das alle anderen Elemente und allen Text umfasst. Zudem dürfen sich Elemente nicht überschneiden. Genügt ein Dokument diesen und wenigen weiteren Regeln so spricht man von einem „wohlgeformten“ XML-Dokument.

Um eine XML-konforme Markup-Sprache wie beispielsweise XHMTL zu definieren, bedarf es neben diesen allgemeinen Regeln auch einer spezifischen Grammatik, die in einer Schemasprache formuliert wird. Die derzeit wichtigsten Schemasprachen sind DTD, XMLSchema und RelaxNG.

Schemasprachen unterscheiden sich in ihrer Ausdrucksmächtigkeit: In den verschiedenen Sprachen können unterschiedlich komplexe Anwendungen definiert werden. In allen Schemasprachen lassen sich die Namen und Inhaltsmodelle der Elemente und Attribute für die jeweilige Markup-Sprache festlegen. Entspricht ein Dokument den im Schema angegebenen Regeln, handelt es sich um ein „valides“ XML-Dokument. Ein Dokument kann nur dann valide sein, wenn es auch wohlgeformt ist.

Vor- und Nachteile

Ähnlich wie Datenbanken erlaubt XML die - in Grenzen - freie Modellierung von Informationen und eignet sich damit zur strukturierten Speicherung von Inhalten. Als text- und dateibasiertes Speichersystem ermöglicht XML die Distribution von Inhalten und Informationen über das gesamte Internet. Diese Eigenschaft ist ein Vorteil gegenüber Datenbanken, deren Inhalte von Außen – zum Beispiel durch Suchmaschinen – meist nicht zugänglich sind. Gegenüber den tabellarisch organisierten Datenbanken bietet XML Vorteile für die Modellierung von gemischten Inhaltsmodellen, wie sie zur Abbildung von Textstrukturen benötigt werden. Allerdings ist die Verarbeitung von Daten im XML-Format in der Regel deutlich langsamer als bei in Datenbanken abgelegten Informationen. Im Einzelfall müssen die Vorteile der jeweiligen Speichermethode an Hand der Zielsetzung des Projektes gegeneinander abgewogen werden.

Standards

XML selbst wird durch weitere Standards flankiert, die zur Verarbeitung, Analyse und Ausgabe von XML-Daten dienen. Die wichtigsten sind:

  • die Programmiersprache XSLT zur Umwandlung von XML-Dokumenten in verschiedene Ausgabemodi,
  • die Formatierungssprache XSLFO mit der Druckvorlagen erstellt werden können,
  • die Abfragesprache XQuery,
  • XPath für die Lokalisierung von Informationen,
  • XLink und XPointer zur Definition von Verknüpfungen und Sprungmarken.

Daneben existiert eine Reihe weiterführender XML-basierter Standards, die insbesondere in Zusammenhang mit der Entwicklung des Semantic Web eine Rolle spielen. Hier sind vor allem RDF, RDFS und OWL von Bedeutung.

Erstellung

Da XML im Prinzip ein menschenlesbares Quelltext-Format ist, können XML-Daten (wie auch HTML) mit einem einfachen Text-Editor bearbeitet werden. Solche Editoren stehen für alle gängigen Betriebssysteme bereits nach der Installation zur Verfügung. Für die regelmäßige Nutzung benötigen Sie allerdings relativ schnell einige Funktionen, die ein einfacher Quelltexteditor nicht bieten kann. Viele HTML-Editoren können auch als XML-Editor eingesetzt werden. Eine erste Orientierung bietet unsere Zusammenstellung von Editoren. XML ist inzwischen auch in der Softwareentwicklung verbreitet. Daher bieten viele spezialisierte Editoren zur Entwicklung von Programmen ebenfalls XML-Support.

Für ein professionelles Dokumenten-Management mit XML benötigen Sie spezielle Editoren, die beispielsweise die Programmiersprache XSLT zur Verarbeitung von XML-Dokumenten unterstützen. Im Verlagswesen und in der Forschung sind u. a. folgende Programme verbreitet:

  • XML-Spy
  • Oxygen
  • X-Metal

Weitere Informationen

Letzte Änderung: 21.07.2015