Document Object Model

Das Document Object Model (DOM) ist eine Programmierschnittstelle (API) für den Zugriff auf HTML- oder XML-Dokumente. Sie wird vom World Wide Web Consortium definiert.

Im Sinne der objektorientierten Programmierung besteht das DOM aus einem Satz von Klassen zusammen mit deren Methoden und Attributen. Es erlaubt Computerprogrammen, dynamisch den Inhalt, die Struktur und das Layout eines Dokuments zu verändern.

Geschichte

Das DOM ist ursprünglich unter dem Eindruck von mindestens zwei Entwicklungen entstanden, die die Computerwelt in der jüngsten Vergangenheit maßgeblich prägten. Beiden liegt die Notwendigkeit zugrunde, auf die strukturierten Daten in HTML- und XML-Dokumenten einfach und einheitlich zugreifen zu können.

Mitte der 1990er Jahre, als das World Wide Web immer populärer wurde, wurde die Programmiersprache JavaScript erfunden, und gängige Webbrowser enthielten seitdem Interpreter, die solche Scripte ausführen. JavaScript definierte rudimentäre Möglichkeiten zum Zugriff auf das HTML-Dokument und zur Ereignisbehandlung. Später erfanden verschiedene Browserhersteller unterschiedliche Modelle für dynamisches HTML (DHTML), die eine umfassendere Änderung der Struktur und des Aussehens des Dokuments ermöglichten, während das Dokument im Browser angezeigt wird. Die ersten DOM-Standards des W3C sind daher Versuche, die verschiedenen proprietären JavaScript- und DHTML-Techniken, die während der Zeit der Browserkriege entstanden, zusammenzuführen, zu standardisieren und letztlich abzulösen. Dies ist gelungen, so dass DOM heutzutage eine zentrale Bedeutung bei der JavaScript-Programmierung einnimmt.

Gleichzeitig entstand XML als allgemeines Austauschformat zur menschenlesbaren Darstellung von strukturierten Daten, das an den Erfolg von HTML anknüpfte. Zur Verarbeitung von XML-Dokumenten war eine verständliche, leistungsfähige und programmiersprachenübergreifende Schnittstelle nötig. Das DOM bietet eine solche und definiert darüber hinaus zusätzliche Schnittstellen für einen komfortablen Umgang mit XML-Dokumenten.

Grundlagen des DOM anhand eines Beispiels

Folgender HTML-Code definiert eine Tabelle mit dem Element table und verschiedenen Unterelementen:

<table>
  <thead>
    <tr>
      <th>Vorname</th>
      <th>Name</th>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td>Donald</td>
      <td>Duck</td>
    </tr>
  </tbody>
</table>

Das DOM repräsentiert das table-Element und dessen Unterelemente in der folgenden Baumstruktur:

Datei:Dom-beispielbaum.png

An diesem Beispiel lässt sich der prinzipielle Aufbau des Objektmodells diskutieren: Dokumente werden logisch wie ein Stammbaum dargestellt. Knoten (nodes) stehen über "Verwandtschaftsbeziehungen" zueinander in Verbindung.

Arten von Beziehungen

Die vorliegende Struktur wird im Objektmodell durch die folgenden Beziehungen charakterisiert:

Der Wurzelknoten table hat als Kinder (children) die Elementknoten thead und tbody.
Der table-Elementknoten ist umgekehrt ein Elternteil (parent) von thead und tbody.
Knoten mit gemeinsamem Elternteil (z.B. die beiden th-Elementknoten) werden Geschwister (siblings) genannt.

Ausgehend vom Wurzelknoten ist jeder andere Knoten über diese Verwandtschaftsbeziehungen erreichbar.

Arten von Knoten

Die wichtigsten Knotentypen im DOM sind:

Ein Dokumentknoten stellt die gesamte Baumstruktur dar.
Ein Dokumentfragmentknoten stellt einen Teil der Baumstruktur dar.
Ein Elementknoten entspricht exakt einem Element in HTML oder XML.
Ein Attributknoten entspricht exakt einem Attribut in HTML oder XML.
Ein Textknoten stellt den textuellen Inhalt eines Elements oder Attributs dar.

Attributknoten sind eine besondere Knotenart, denn sie kommen nicht als Knoten in der Baumstruktur vor, die vor allem durch Elementknoten gebildet wird. Attributknoten sind demnach keine „Kinder“ von Elementknoten, sondern Eigenschaften von ihnen.

Verarbeitung eines Dokuments

Im ersten Schritt wird ein bestehendes Dokument durch das Programm eingelesen und ein Dokument-Objekt erzeugt. Anhand dieses Objekts kann mittels der Methoden des API auf die Inhalte, Struktur und Darstellung zugegriffen werden.

Insbesondere erlaubt DOM

die Navigation zwischen den einzelnen Knoten eines Dokuments,
das Erzeugen, Verschieben und Löschen von Knoten sowie
das Auslesen, Ändern und Löschen von Textinhalten.

Am Ende der Verarbeitung kann aus dem Dokument-Objekt durch so genannte Serialisierung ein neues XML- oder HTML-Dokument generiert werden.

Standardisierung des DOM

Das DOM ist seit 1998 ein Standard des W3C und wurde seitdem mehrfach aktualisiert und erweitert. Es existieren mehrere Versionen (Levels) jeweils mit verschiedenen Modulen:

DOM Level 0

Dieses Level wurde nie formal spezifiziert. Level 0 bezeichnet die mittels JavaScript nutzbaren Techniken zum Zugriff auf HTML-Dokumente. Diese wurden von Webbrowsern wie Internet Explorer und Netscape Navigator vor der Standardisierung des DOMs eingeführt.

DOM Level 1

DOM Core (DOM-Kern) definiert das Bewegen im DOM-Baum, die Manipulation der Knoten, inklusive des Einfügens neuer Elemente und des Setzens von Attributen.
DOM HTML ist die Erweiterung zum Zugriff auf HTML-Dokumente. Es standardisiert und vervollständigt die bereits verbreitete Praxis, die auf den JavaScript-Spezifikationen von Netscape bzw. Microsoft JScript basiert.

DOM Level 2

DOM Core: u. a. Erweiterung um XML-Namensraum-Unterstützung
DOM HTML: u. a. Ausweitung auf XHTML-Dokumente, Anpassung an DOM 2 Core
DOM Style und DOM CSS ermöglichen das dynamische Auslesen, Hinzufügen und Ändern der Formatierung bzw. des Layouts des Dokuments über Stylesheets, insbesondere Cascading Style Sheets (CSS).
DOM Views erlaubt den Zugriff auf Informationen konkreter Wiedergabearten des Dokuments (z.B. der grafischen Darstellung im Webbrowser). Dies wird vor allem zusammen mit DOM CSS benutzt, um die tatsächlichen CSS-Eigenschaftswerte von gewissen Elementen in Erfahrung zu bringen (z.B. ‚Welche Hintergrundfarbe hat diese Überschrift?‘).
DOM Events standardisiert die Verarbeitung von Ereignissen im Dokument, z.B. Benutzeraktionen. Wird vor allem im Zusammenhang mit JavaScript bei der Darstellung von HTML-Dokumenten in Webbrowsern verwendet. Angelehnt an die Modelle der Ereignis-Behandlung des Netscape Navigators und des Internet Explorers für HTML-Dokumente.
DOM Traversal and Range: Durchlaufen des Knotenbaums anhand von bestimmten Auswahlkriterien, Arbeiten mit Bereichen im Dokument, die bestimmte Elemente und Textknoten umfassen

DOM Level 3

DOM 3 Core: umfassende Erweiterung, u. a. verbesserte Ausnahmebehandlung und Umgang mit Zeichenkodierungen
DOM 3 Load & Save ermöglicht die Serialisierung von Dokumenten oder Dokumentteilen sowie das Parsen von XML-Dokumenten in Zeichenketten in Dokument-Objekte. Zudem können XML-Dokumente über HTTP versendet und abgerufen werden, wie es mit der bekannteren XMLHttpRequest-Technik möglich ist.
DOM 3 XPath erlaubt das Auswählen von Knoten anhand von XPath-Ausdrücken.
DOM 3 Events erweitert DOM 2 Events u. a. um Tastatur-Ereignisse.
DOM 3 Validation
DOM 3 Views and Formatting
DOM 3 Abstract Schemas

Siehe auch: Simple API for XML (SAX), JDOM

Weblinks

Website beim W3C (englisch)
Skript zur Vorlesung XML: DOM von Mario Jeckle
Folienvortrag
Einführung in JavaScript und DOM von SELFHTML
Sammlung von Links zu Fachartikeln (englisch)
Praktisches Anwendungsbeispiel DOM mit PHP Erstellung eines validen RSS Feeds mit DOM und PHP

Empfehlungen	ActivityPub \| ARIA \| Canonical XML \| CDF \| CSS \| DOM \| Geolocation API \| HTML \| HTML5 \| InkML \| ITS \| JSON-LD \| MathML \| OWL \| P3P \| PLS \| PNG \| RDF \| RDF-Schema \| RIF \| SCXML \| SISR \| SKOS \| SMIL \| SOAP \| SRGS \| SSML \| SVG \| SPARQL \| Timed Text \| Turtle \| VoiceXML \| WSDL \| XForms \| XHTML \| XHTML+RDFa \| XInclude \| XLink \| XML \| XML Base \| XML-Encryption \| XML Events \| XML Information Set \| XML Namespace \| XML Schema \| XML Signature \| XPath \| XPointer \| XProc \| XQuery \| XSL \| XSL-FO \| XSLT (Elemente)
Arbeitsentwürfe und Kandidaten	CCXML \| CURIE \| SMIL Timesheets \| sXBL \| WICD \| XFrames \| XBL \| XHTML+MathML+SVG \| XMLHttpRequest
Anmerkungen	XAdES \| XFDL \| XHTML+SMIL \| XUP
Richtlinien	Web Content Accessibility Guidelines \| Multimodal Interaction Activity \| Markup Validation Service
Initiativen	Web Accessibility Initiative