Darwin Information Typing Architecture

Eine gesichtete Version dieser Seite, die am 2. Dezember 2015 freigegeben wurde, basiert auf dieser Version.

Die Darwin Information Typing Architecture (DITA) ist ein Dokumentenformat, ähnlich dem bekannten DocBook. DITA wird von der Firma IBM und der Organisation OASIS als freie Architektur entwickelt und steht als Dokumenttypdefinition (DTD) kostenlos zur Verfügung. DITA basiert auf XML: Im Gegensatz zu DocBook gibt es für DITA keine SGML-basierte DTD.

Nach der offiziellen Definition aus der Architekturspezifikation (nachstehend in deutscher Übersetzung) ist DITA

„… eine Architektur, um themenorientierten, informationstypisierten Inhalt in Form einer einzigen Quelle (single source) zu erstellen, der in vielfältiger Weise wiederbenutzt werden kann. DITA ist auch eine Architektur, um neue Informationstypen zu erstellen sowie neue Informationsdomänen — basierend auf vorhandenen Typen und Domänen — zu beschreiben. Dies ermöglicht es Gruppen von Benutzern, sehr spezifische, zielgerichtete Dokumenttypdefinitionen zu erstellen, indem ein Spezialisierung genannter Prozess verwendet wird, bei dem die gemeinsamen Ausgabetransformationen und Gestaltungsrichtlinien für allgemeinere Typen und Domänen dennoch beibehalten werden.“^[1]

Am 3. Mai 2005 wurde DITA 1.0 als OASIS-Standard verabschiedet.

Am 13. August 2007 wurde DITA 1.1 als OASIS-Standard verabschiedet.

Am 1. Dezember 2010 wurde die DITA-Spezifikation 1.2 als OASIS-Standard mit zahlreichen Neuerungen verabschiedet; sie enthält u. a. drei unterschiedliche Architekturen sowie neue „Domains“ und „Topics“ (s.u.).

Einführung

Der Name Darwin Information Typing Architecture kommt folgendermaßen zustande:

Darwin – Charles Darwin stand Pate für diese Architektur. Als Begründer der Evolutionstheorie hat er insbesondere die Vererbung untersucht. Erweiterung durch Vererbung ist eine der wichtigsten Eigenschaften von DITA.
Information Typing – Informationen werden in DITA typisiert. Somit ist ein hohes Maß an Wiederverwendung garantiert.
Architecture – DITA ist eine Architektur. Sie ist nicht nur einfach eine DTD, sondern beinhaltet auch Regeln für die Erstellung von Informationseinheiten. Zusätzlich wird sie ständig weiterentwickelt und kann in gewissen Grenzen erweitert werden.

DITA ist eine XML-basierte Architektur für die Erstellung, Verteilung und Wiederverwendung von technischen Informationen. Die Architektur besteht aus einer Menge an Designregeln, die es erlauben, „typisierte“ Informationsmodule auf der Ebene sogenannter „Topics“ zu erstellen.

Ziel von DITA ist es, den „unique transclusion mechanism“ (siehe auch „Transklusion“) zu unterstützen, der im Rahmen einer DTD Verarbeitungsregel angegeben wird: Ein Element

“can replace itself with the content of a like element elsewhere, either in the current topic or in a separate topic that shares the same content models. DITA’s conref ‚transclusion‘ mechanism is similar to the SGML conref mechanism, which uses an empty element as a reference to a complete element elsewhere. However, DITA requires that at least a minimal content model for the referencing element be present, and performs checks during processing to ensure that the replacement element is valid in its new context. This mechanism goes beyond standard XInclude, in that content can be incorporated only when it is equivalent: If there is a mismatch between the reusing and reused element types, the conref is not resolved. It also goes beyond standard entity reuse, in that it allows the reused content to be in a valid XML file with a DTD. The net result is that reused content gets validated at authoring time, rather than at reuse time, catching problems at their source.”

Geschichte

Das Unternehmen IBM erstellte in den 90er Jahren eigene komplexe SGML DTDs (u. a. IBMIDDoc) für die Dokumentation seiner zahlreichen Produkte. Während der Weiterentwicklung entstand die Aufgabe, einen neuen Standard für technischen Dokumentationen zu entwerfen, der vor allem ein hohes Maß an Wiederverwendung unterstützen sollte. Dabei wurden IBMIDDoc oder andere XML DTD wie DocBook, TEI oder XHTML untersucht. Als Resultat entschied man, mit DITA ein neues Dokumentenformat zu entwickeln.

Eigenschaften und Hintergründe

DITA zeichnet sich vor allem durch folgende Eigenschaften aus:

Themenzentrierung – Das höchste Abstraktionslevel von DITA ist das „Topic“ (dt. „Thema“). Weitere Strukturen, die oberhalb eines Topics angesiedelt sind, sind dann eher Informationen, die dem Prozess eines solchen Topics angehören. Beispielsweise könnte es sich dabei um die Navigation einer Hilfeseite handeln. Weiterhin sind Topics nicht mehr weiter geschachtelt. Für die Organisation von Topics bieten sich die „Sections“ (dt. „Abschnitte“) an, welche die Topics mit Inhalten versehen.
Wiederverwendung – Ein Ziel von DITA ist die Reduktion von Redundanz und damit des Kopieraufwands von Informationen. Dabei können Informationen an mehreren Stellen verwendet werden, der Inhalt existiert jedoch nur einmal.

Definitionen:^[1]

Topic: Ein Topic ist eine Informationseinheit, die durch Titel und Inhalt bestimmt wird. Diese Einheit muss knapp genug sein, um ein einzelnes Thema zu behandeln oder eine einzige Frage zu beantworten. Sie muss jedoch auch ausreichend genug sein, um allein sinnvoll stehen zu können und dabei allein weiterentwickelt zu werden.
Map: Maps sind Dokumente, in denen einzelne Referenzen zu Topics sinnvoll gesammelt und organisiert sind. Sie bilden damit die logische Einheit und Klammer über bestimmte Topics. Sie können damit auch als Gliederung oder Inhaltsverzeichnis für DITA-Ergebnisse und somit als „build manifests“ für vollständige DITA-Projekte dienen.
Spezialisierung: Die Spezialisierung erlaubt die Definition neuer „Informationstypen“ (“structural types” oder “new domains of information”). Dabei sollte jedoch der größte Anteil der Informationen wiederverwendet werden, damit die Kosten für Austausch, Migration und Wartung minimiert werden können.
Integration: Jede Spezialisierung besitzt ihr eigenes Designmodul. Diese Module können in kombinierter Form wiederum weitere Dokumententypen generieren. Der Prozess der Erstellung neuer Dokumententypen aus der Kombination verschiedener Module wird „Integration“ genannt.
Anpassung: Für den Fall, dass ausschließlich das Arbeitsergebnis (“output”) in unterschiedlicher Form benötigt wird, kann eine Anpassung von DITA verwendet werden. Damit wird die Ausgabe angepasst, ohne die Übertragbarkeit und den Austausch zu verschlechtern.

Vorteile gegenüber und Vergleich mit DocBook

Im Vergleich zu DocBook gilt DITA als einfacher zu erlernen. Während DocBook eher als Vorlage für komplexe Bücher und Dokumentationen im Buchformat gedacht ist, verfolgt DITA das Ziel, technische Informationen als „Topics“ abzubilden, die in verschiedenen Kontexten weiterverwendet werden können. DITA verwendet darüber hinaus viele Elemente aus HTML.

Nachfolgend ein Vergleich:^[2]

Vorteil von DITA gegenüber DocBook

DocBook ist primär für die Erstellung und Auslieferung von Büchern gedacht, während DITA dagegen auf die Erstellung und Auslieferung auf „Topics“ fokussiert. Diese Topics können jedoch danach als Sammlung in Bücher übergehen oder verlinkt werden und damit als Hilfe-Informationen, Webseiten oder etwa als Zusammenfassungen für PDAs dienen.
DocBook ist strikt hierarchisch und stellt keine Mechanismen zur Verfügung, um Inhalt vom Kontext zu trennen. Dabei ist DITA wesentlich flexibler und kann kontextabhängige Informationen in verschiedenen Dokumenten gruppieren. DITA kann Topics mit jedem Level von definierter Struktur ablegen.
DocBook ist eine feste Menge von Elementen und Attributen. DITA ist erweiterbar und kann auf die individuellen Bedürfnisse und Anforderungen angepasst werden: Spezialisierungsregeln definieren die Struktur von individuellen Informationstypen, die dabei auf die vorhandenen Standardelemente zurückgreifen können.

Vorteil von DocBook gegenüber DITA

DocBook wird seit mehr als zehn Jahren aktiv erweitert und ständig gepflegt.
DocBook ist ausführlich dokumentiert und in vielen Praxisfällen erfolgreich getestet. Hilfestellungen der großen DocBook-Community sind überall verfügbar.
DocBook unterstützt durch die „DocBook-Stylesheets“ bereits eine Vielzahl an Zielformaten wie Eclipse, EPUB, FO, HTML, HTMLHelp, Javahelp, Manpages, Webhelp und XHTML.
Ab Version 5 stellt DocBook ein topic-Element bereit.
Ab Version 5.1 (in Entwicklung) wird es ein assembly-Element geben (ähnlich einer Map in DITA), das die Wiederverwertung verbessert.

Beispiel

<topic id="maintaining" xml:lang="en-us">
   <title>Maintaining</title>
   <shortdesc>
      You maintain your solution to ensure that all components are operating at maximum efficiency.
   </shortdesc>
   <body>
      <p>
         Maintenance is a task that you perform along with configuration to get the most from your solution.
      </p>
   </body>
</topic>

Siehe auch

mumasy, ein VDMA-standardisiertes XML-Schema für technische Dokumentation

Literatur

Sissi Closs: Single Source Publishing. Topicorientierte Strukturierung und DITA. Entwickler-Press, 2007 ISBN 978-3-935042-98-7
Johannes Hentrich: DITA – Der neue Standard für technische Dokumentation. XLcontent-Verlag, 2008, ISBN 978-3-9811430-0-3
Jennifer Linton, Kylene Bruski: Introduction to DITA: A User Guide to the Darwin Information Typing Architecture. Comtech Services, Colorado 2006

Weblinks

OASIS Technical Committee (englisch, mit Links zu den Spezifikationen)
IBM DITA Spezifikation (englisch)
IBM DITA FAQ (englisch)
IBM DITA Download (englisch)
data2type - Ausführliche Einführung in DITA (deutsch)
DITA-Gruppe und Forum auf xing.com (deutsch)
DITA-Gruppe und Mailing-Liste auf yahoo.com (englisch)
DITA Open Toolkit (englisch)
Referenzen (englisch)

Einzelnachweise

↑ ^a ^b DITA Architectural Specification, Chapter 2, An Introduction to DITA.
↑ nach Namahn, 2001 (PDF)

[DITA.Architectural.Specification.2-1] DITA Architectural Specification, Chapter 2, An Introduction to DITA.

[2] Namahn, 2001 (PDF)

[1]

[2]