Hypertext Markup Language: Unterschied zwischen den Versionen

Aus InfoWissWiki - Das Wiki der Informationswissenschaft
Zur Navigation springen Zur Suche springen
(Kategorie hinzugefügt)
Zeile 142: Zeile 142:
 
T-Rex: http://server02.is.uni-sb.de/trex/ (letzter Zugriff: 07.02.05) <br>
 
T-Rex: http://server02.is.uni-sb.de/trex/ (letzter Zugriff: 07.02.05) <br>
 
World Wide Web Consortium: http://www.w3.org (letzter Zugriff: 06.02.05)
 
World Wide Web Consortium: http://www.w3.org (letzter Zugriff: 06.02.05)
 +
 +
[[category:Internet]]

Version vom 19. Januar 2006, 22:05 Uhr

HTML

Definition

HTML (Hypertext Markup Language - Hypertext-Auszeichnungssprache) ist die Auszeichnungssprache (keine Programmiersprache), in der Hypertextdokumente für das WWW erstellt werden. Sie ermöglicht die Textstrukturierung sowie die Einbindung von Grafiken und multimedialen Inhalten in Form von Referenzen und deren Integration in den Text. HTML ist die universelle Sprache, die von allen Computern potentiell verstanden werden kann und die man braucht, um Informationen für globale Verbreitung zu veröffentlichen. In der Praxis gilt HTML als die Basis von dem Erstellen von Web-Seiten-Layouts.

Geschichte

Ursprünglich wurde HTML vom Web-Gründer Tim Berners-Lee am CERN (Europäisches Kernforschungszentrum in Genf) entwickelt. Die Grundidee beim Entwickeln von HTML war, dass Computer mit Bildschirmen mit unterschiedlicher Resolution und Anzahl der Farben in der Lage sein sollten, Informationen vom Web zu nutzen. In anderen Worten: Die Dokumente sollten bei verschiedenen Browsers und verschiedenen Plattformen gleich gut aussehen. HTML hat sich in den 1990er parallel mit dem raschen Wachstum des WWW sehr verbreitet und wurde zu einem der erfolgreichsten Dateiformate.

HTML-Versionen

HTML 1.0 enthielt Auszeichnungen für Standard-Elemente wie Überschriften, Textabsätze, für Grafikreferenzen und Verweise.
HTML 2.0 wurde 1995 offizieller Sprachstandard, enthielt aber Sprachelemente, die bis heute von den großen Browsern nicht oder nicht vollständig unterstützt werden.
HTML 3.2 wurde 1997 offizieller Standard. Diese Version hat versucht, HTML als Sprache für optisches Design zu etablieren, was dem Wesen von HTML widersprochen hat.
HTML 4.0 wurde 1998 offizieller Standard und ist die Version, die heute am meisten verwendet wird. Diese Version wurde mehrfach überarbeitet und zeichnet sich hauptsächlich durch den Versuch aus, den Schwerpunkt wieder auf die Kernaufgaben von HTML zu setzen. Hauptmerkmale dieser Version sind die Regelung der Einbindung von CSS Style Sheets und von Scriptsprachen wie JavaScript in HTML sowie die Internationalisierung. Zum ersten Mal wird in HTML dank dieser Version erlaubt, Texte in allen Sprachen der Welt zu notieren. Alle oben erwähnten HTML-Versionen sind SGML-basiert (Standard Generalized Markup Language). Neben ihnen existieren auch noch zwei XML-basierte HTML-Versionen (XHTML 1.0 und XHTML 1.1), die sich von HTML nur aufgrund XML-bedingter Gegebenheiten unterscheiden.


Grobstruktur eines HTML-Dokuments

Ein Beispiel von einem einfachen HTML-Dokument:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<HTML>

  <HEAD> 
<TITLE>My first HTML document</TITLE>
</HEAD>
<BODY>
<P>Hello world!
</BODY>

</HTML>
Als Auszeichnungssprache hat HTML die Aufgabe, die logischen Bestandteile eines textorientierten Dokuments zu beschreiben. Sie bietet die Möglichkeit an, typische Elemente eines textorientierten Dokuments, wie Überschriften, Textabsätze, Listen, Tabellen, Bilder oder Grafikreferenzen, als solche auszuzeichnen. Ursprünglich werden keine direkten Attribute (z.B. Schriftart, -größe oder –farbe) zugewiesen, sondern nur die Strukturanweisungen für den Seitenaufbau und die Funktion der Elemente.

Den Index von HTML 4.0-Elementen kann man sich unter http://www.w3.org/TR/REC-html40/index/elements.html ansehen.


Eigenschaften und Vorteile (von HTML 4)

Verweise

Die Grundeigenschaft von HTML ist die Möglichkeit, Verweise zu definieren. Verweise ("Hyperlinks") können zu anderen Stellen im eigenen Projekt führen, aber auch zu beliebigen anderen Adressen im World Wide Web und sogar zu Internet-Adressen, die nicht Teil des Web sind. Durch diese Eigenschaft von HTML geht eigentlich die Grundidee in Erfüllung, auf der das ganze World Wide Web beruht: die Möglichkeit, sich nur per einen Mausklick zwischen räumlich weit entfernten Rechnern zu bewegen.


Internationalisierung

HTML 4 erlaubt, dass Dokumente in allen Sprachen veröffentlicht und in der ganzen Welt leicht transportiert werden. Indem diese Unterstützung angeboten wird, wird eine effektivere Indexierung von Dokumenten für die Suchmaschinen und eine mehr qualitative Typographie gefördert.


Zugänglichkeit

Da die Web-Community wächst und sich ihre Mitglieder in ihren Fähigkeiten und Fertigkeiten unterscheiden, ist es entscheidend, dass die zugrunde liegenden Technologien angemessen ihrer spezifischen Bedürfnissen sind. HTML wurde dabei entwickelt, um die Webseiten zugänglicher für die Nutzer mit physischen Beschränkungen zu machen. Als der Hauptvorteil in dieser Hinsicht gilt die bessere Unterscheidung zwischen Dokumentenstruktur und -präsentation, die durch die Verwendung von Style-Sheets (s.u.) statt von Attributen ermöglicht wird.


Style Sheets

Style-Sheets vereinfachen das Erstellen von HTML-Dokumenten und „befreien“ HTML von der Verantwortung für die Präsentation. Stattdessen haben die Autoren und die Nutzer die Kontrolle darüber, wie die Dokumente aussehen ( font-, alignment- und color-Information). Style-Informationen können sowohl für einzelne Elemente als auch für Gruppen von Elementen festgelegt werden.


Einige Empfehlungen des W3-Konsortium beim Erstellen von HTML-Dokumenten

Trenne Struktur und Präsentation!

HTML wurde auf der Basis von SGML (Standard Generalized Markup Language), der plattformunabhägigen Auszeichnungssprache, die sich nur auf die Struktur konzentriert, entwickelt. Einer ähnlichen Entwicklung folgt auch HTML, bei der immer mehr Präsentationselemente und –attribute von den Style-Sheets ersetzt wurden. Auch die Praxis hat gezeigt, dass die Trennung der Strukturaspekte eines Dokuments von seinen Präsentationsaspekten zu einer Reduzierung der Kosten führt.


Beachte die allgemeine Zugänglichkeit zum Web!
Um das Web zugänglich zu jedem (besonders zu den Nutzern mit Behinderungen) zu machen, sollten Autoren beachten, wie ihre Dokumente auf verschiedenen Betriebssystemen aussehen würden (z.B. auf sprachbasierten Browsers oder Braille-Readers).

Literatur

Münz, Stefan: SELFHTML: http://www.teamone.de/selfaktuell/ (letzter Zugriff: 06.02.05)
T-Rex: http://server02.is.uni-sb.de/trex/ (letzter Zugriff: 06.02.05)
World Wide Web Consortium: http://www.w3.org (letzter Zugriff: 06.02.05)
HTML-Editor Phase 5: http://www.meybohm.de (Hier kann man sich kostenlos den HTML-Editor Phase 5 herunterladen, der den Autor beim Erstellen von HTML-Dokumenten unterstützt.) (letzter Zugriff: 06.02.05)


XML

Definition

XML (Extensible Markup Language – Erweiterbare Auszeichnungssprache) ist eine Metasprache zur Definition von (neuen) Auszeichnungssprachen bzw. Dokumenttypen, die dann XML-Derivate genannt werden. D.h. XML liefert die Regeln, die man für das Definieren der neuen Auszeichnungssprache bzw. des Dokumenttyps benötigt. So lässt sich XML auch wie HTML als eine SGML-basierte Sprache definieren, allerdings ist XML eine Stufe abstrakter.

Geschichte und Grundidee

XML wurde von der XML Working Group (bekannt auch als SGML Editorial Review Board) entwickelt, die unter der Schirmherrschaft von World Wide Web Consortium (W3C) in 1996 gegründet wurde. Die Grundidee und die Ziele von XML waren dabei, dass es Dokumente gibt, die alle in ihrem Aufbau bestimmten Grundmustern folgen. Das hat den Vorteil, dass man auf diese Weise mit den Dokumenten mehr anfangen kann (wie z.B. Entwickeln von Computerprogrammen für automatische Dokumentenverarbeitung), als wenn alle Dokumente sich in ihren Regeln voneinander unterscheiden.


Eigenschaften und Merkmale

DTD („Document Type Definition“)
XML ist das vorgeschriebene „Regelwerk“ (Schema), nach dem die Bestandteile der zu definierenden Auszeichnungssprache definiert werden. Mit Hilfe von XML werden also die Grundkonventionen der neuen Auszeichnungssprache festgelegt. Es wird also für jeden Dokumenttyp eine DTD („Document Type Definition“) festgelegt, in der festgelegt wird welche Strukturen bzw. Elementtypen in den Dokumenten eines bestimmten Dokumenttyps verwendet werden können. Beispiel für beschreibendes Markup:
<BUCH>

    	 <TITEL> Die Blechtrommel </TITEL> 
     	<AUTOR> Günter Grass </AUTOR> 

</BUCH>
Hier kann man am Beispiel erkennen, dass es sich um ein Buch mit dem Titel „Die Blechtrommel“ handelt, dessen Autor Günter Grass ist. Im Unterschied zu HTML, wo die Tags Formatierungsanweisungen angeben (z.B. Platz des Elementes innerhalb der Struktur oder kursive Schrift), geben die Tags in XML semantische Informationen über das Element an. D.h. sie beschreiben den Inhalt des Elementes. Deswegen spricht man hier von einem deskriptiven (beschreibenden) Markup.


XSL (Extensible Stylesheet Language)

Die durch XML neu erfundenen Auszeichnungssprachen definieren auch wie HTML Elemente und ihre Haupteigenschaften. Allerdings kann man nicht angeben, wie der Browser ein Element bei der Darstellung formatieren soll, da er keinen Zugriff auf die Voreinstellungen bei selbst erfundenen Elementen hat. Eine optische Darstellung von den Elementen der neuen Auszeichnungssprache wird durch die ergänzende Stylesheet-Sprache von XML namens XSL (Extensible Stylesheet Language - erweiterbare Formatsprache) ermöglicht. XSL ist für XML genauso wie CSS für HTML. Allerdings hat XSL außer den Formateigenschaften (Schriftgröße, Farbe, Zeilenabstand usw.) weitere Textverarbeitungsaufgaben (z.B. sortiertes Ausgeben von listenartigen Daten, automatische Nummerierung usw.).


XSLT (XSL Transformation)

XML bietet auch die Möglichkeit an, dass Daten von einer XML-basierten Auszeichnungssprache wiederum in eine andere konvertiert werden. Dafür braucht man XSLT, der die Rolle eines Universal-Konverters spielt. So kann man mit seiner Hilfe Daten, die in XML-basierter Auszeichnungssprache gespeichert sind, beim Präsentieren im Web in HTML übersetzen, bevor sie vom Browser aufgenommen werden.


Vorteile

Strukturiertheit

Im Gegensatz von HTML-Dokumenten, die nur unstrukturierte Daten liefern, zeichnen sich die XML-Dokumente durch ihre Strukturiertheit aus. Diese Strukturiertheit wird durch die semantischen Tags ermöglicht und gerade sie erlaubt eine Verarbeitung der Daten durch Computerprogramme. In dieser Hinsicht können die mit XML-Dokumenten gelieferten Daten auch als ein Kettenglied gesehen werden, der sich zwischen den strukturierten Datenbank-Daten und den unstrukturierten Textdaten befindet.


Anwendungsgebiete

Die Anwendungsgebiete von XML-Dokumenttypen bzw. XML-Auszeichnungssprachen sind zahlreich. Sie können überall dort eingesetzt werden, wo ein Bedarf für Datenaustausch existiert (z.B. Daten über finanzielle Transaktionen, Senden von Nachrichten und Wetter-Informationen, Krankendaten oder Daten aus juristischen Datenbanken). D.h. XML bietet den verschiedenen Firmen und Unternehmen die Möglichkeit an, an ihre Spezialbedürfnisse angepasste Auszeichnungssprachen zu entwickeln.


Einfachheit

XML vermeidet die Komplexität, die bei der Darstellung von Formeln, Hierarchien, mathematischen und wissenschaftlichen Anmerkungen und anderen Elementen mit wohldefinierten Parametern entsteht. Dazu gibt es die zwei XML-Derivate SVG (Scalable Vector Graphics) und MathML (Mathematical Markup Language). SVG ist eine Auszeichnungssprache zur Beschreibung 2-dimensionaler Vektorgrafik, mit der sich grafische Daten beschreiben lassen. MathML hat die Aufgabe, technisch-wissenschaftliche Inhalte, die mathematische Formelsprache zur Darstellung benötigen, abzubilden.


Literatur

Dünhölter, Kuno (1998): http://members.aol.com/xmldoku (letzter Zugriff: 07.02.05)
Münz, Stefan: SELFHTML: http://de.selfhtml.org/xml/intro.htm (letzter Zugriff: 06.02.05)
T-Rex: http://server02.is.uni-sb.de/trex/ (letzter Zugriff: 07.02.05)
World Wide Web Consortium: http://www.w3.org (letzter Zugriff: 06.02.05)

… weitere Daten zur Seite „Hypertext Markup Language
HTML (Hypertext Markup Language - Hypertext-Auszeichnungssprache) ist die Auszeichnungssprache (keine Programmiersprache), in der Hypertextdokumente für das WWW erstellt werden +