XML

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Wechseln zu: Navigation, Suche

XML (Extensible Markup Language – Erweiterbare Auszeichnungssprache) ist eine Metasprache zur Definition von (neuen) Auszeichnungssprachen bzw. Dokumenttypen, die dann XML-Derivate genannt werden. D.h. XML liefert die Regeln, die man für das Definieren der neuen Auszeichnungssprache bzw. des Dokumenttyps benötigt. So lässt sich XML auch wie HTML als eine SGML-basierte Sprache definieren, allerdings ist XML eine Stufe abstrakter.

Geschichte und Grundidee

XML wurde von der XML Working Group (bekannt auch als SGML Editorial Review Board) entwickelt, die unter der Schirmherrschaft von World Wide Web Consortium (W3C) in 1996 gegründet wurde. Die Grundidee und die Ziele von XML waren dabei, dass es Dokumente gibt, die alle in ihrem Aufbau bestimmten Grundmustern folgen. Das hat den Vorteil, dass man auf diese Weise mit den Dokumenten mehr anfangen kann (wie z.B. Entwickeln von Computerprogrammen für automatische Dokumentenverarbeitung), als wenn alle Dokumente sich in ihren Regeln voneinander unterscheiden.

Eigenschaften und Merkmale

DTD („Document Type Definition“)
XML ist das vorgeschriebene „Regelwerk“ (Schema), nach dem die Bestandteile der zu definierenden Auszeichnungssprache definiert werden. Mit Hilfe von XML werden also die Grundkonventionen der neuen Auszeichnungssprache festgelegt. Es wird also für jeden Dokumenttyp eine DTD („Document Type Definition“) festgelegt, in der festgelegt wird welche Strukturen bzw. Elementtypen in den Dokumenten eines bestimmten Dokumenttyps verwendet werden können. Beispiel für beschreibendes Markup:

 
         <BUCH>
     	    <TITEL> Die Blechtrommel </TITEL> 
      	    <AUTOR> Günter Grass </AUTOR> 
         </BUCH> 

Hier kann man am Beispiel erkennen, dass es sich um ein Buch mit dem Titel „Die Blechtrommel“ handelt, dessen Autor Günter Grass ist. Im Unterschied zu HTML, wo die Tags Formatierungsanweisungen angeben (z.B. Platz des Elementes innerhalb der Struktur oder kursive Schrift), geben die Tags in XML semantische Informationen über das Element an. D.h. sie beschreiben den Inhalt des Elementes. Deswegen spricht man hier von einem deskriptiven (beschreibenden) Markup.

XSL (Extensible Stylesheet Language)

Die durch XML neu erfundenen Auszeichnungssprachen definieren auch wie HTML Elemente und ihre Haupteigenschaften. Allerdings kann man nicht angeben, wie der Browser ein Element bei der Darstellung formatieren soll, da er keinen Zugriff auf die Voreinstellungen bei selbst erfundenen Elementen hat. Eine optische Darstellung von den Elementen der neuen Auszeichnungssprache wird durch die ergänzende Stylesheet-Sprache von XML namens XSL (Extensible Stylesheet Language - erweiterbare Formatsprache) ermöglicht. XSL ist für XML genauso wie CSS für HTML. Allerdings hat XSL außer den Formateigenschaften (Schriftgröße, Farbe, Zeilenabstand usw.) weitere Textverarbeitungsaufgaben (z.B. sortiertes Ausgeben von listenartigen Daten, automatische Nummerierung usw.).

XSLT (XSL Transformation)

XML bietet auch die Möglichkeit an, dass Daten von einer XML-basierten Auszeichnungssprache wiederum in eine andere konvertiert werden. Dafür braucht man XSLT, der die Rolle eines Universal-Konverters spielt. So kann man mit seiner Hilfe Daten, die in XML-basierter Auszeichnungssprache gespeichert sind, beim Präsentieren im Web in HTML übersetzen, bevor sie vom Browser aufgenommen werden.

Vorteile

Strukturiertheit

Im Gegensatz von HTML-Dokumenten, die nur unstrukturierte Daten liefern, zeichnen sich die XML-Dokumente durch ihre Strukturiertheit aus. Diese Strukturiertheit wird durch die semantischen Tags ermöglicht und gerade sie erlaubt eine Verarbeitung der Daten durch Computerprogramme. In dieser Hinsicht können die mit XML-Dokumenten gelieferten Daten auch als ein Kettenglied gesehen werden, der sich zwischen den strukturierten Datenbank-Daten und den unstrukturierten Textdaten befindet.

Anwendungsgebiete

Die Anwendungsgebiete von XML-Dokumenttypen bzw. XML-Auszeichnungssprachen sind zahlreich. Sie können überall dort eingesetzt werden, wo ein Bedarf für Datenaustausch existiert (z.B. Daten über finanzielle Transaktionen, Senden von Nachrichten und Wetter-Informationen, Krankendaten oder Daten aus juristischen Datenbanken). D.h. XML bietet den verschiedenen Firmen und Unternehmen die Möglichkeit an, an ihre Spezialbedürfnisse angepasste Auszeichnungssprachen zu entwickeln.

Einfachheit

XML vermeidet die Komplexität, die bei der Darstellung von Formeln, Hierarchien, mathematischen und wissenschaftlichen Anmerkungen und anderen Elementen mit wohldefinierten Parametern entsteht. Dazu gibt es die zwei XML-Derivate SVG (Scalable Vector Graphics) und MathML (Mathematical Markup Language). SVG ist eine Auszeichnungssprache zur Beschreibung 2-dimensionaler Vektorgrafik, mit der sich grafische Daten beschreiben lassen. MathML hat die Aufgabe, technisch-wissenschaftliche Inhalte, die mathematische Formelsprache zur Darstellung benötigen, abzubilden.

Literatur und Links

  • Phase 5, HTML-Editor (Hier kann man sich kostenlos den HTML-Editor Phase 5 herunterladen, der den Autor beim Erstellen von HTML-Dokumenten unterstützt.) (letzter Zugriff: 06.02.05)

Verwandte Begriffe

Fakten zu „XML
BroaderInternet-Datenstruktur +
DefinitionXML (Extensible Markup Language – Erweiterbare Auszeichnungssprache) ist eine Metasprache zur Definition von (neuen) Auszeichnungssprachen +
RelatedHTML +, WWW +, Internet Protocol + und URL +