OpenDocument

Dokumentendateiformat
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 9. Oktober 2006 um 18:03 Uhr durch PhilippWeissenbacher (Diskussion | Beiträge) (Weitere Programme mit OpenDocument-Funktionen: Link korrigiert). Sie kann sich erheblich von der aktuellen Version unterscheiden.

OASIS Open Document Format for Office Applications (Kurzform: OpenDocument) bezeichnet die offenen Austauschformate für Dateien von Office-Programmen, welche durch die Organisation OASIS spezifiziert wurden und inzwischen als internationaler Normentwurf ISO/IEC DIS 26300 veröffentlicht worden sind. [1] [2]

Motivation und Überblick

Um ein standardisiertes Dateiformat – vor allem für Textverarbeitungen – zu etablieren, wurde bei OASIS eine Arbeitsgruppe gebildet, die das Dateiformat von OpenOffice.org als Basis für den neuen Standard ausgewählt hat. Das OpenDocument-Format wurde im Mai 2005 veröffentlicht.

Eine OpenDocument-Datei ist entweder eine einzelne XML-Datei oder eine Sammlung verschiedener XML-Dateien und anderer Objekte (z. B. eingebundene Bilder), die zu einer ZIP-Datei zusammengefasst werden, um Speicherplatz einzusparen. Durch das XML-Format können selbst mit einem einfachen Texteditor Veränderungen am Dokument durchgeführt werden, nachdem die Datei entpackt wurde.

Empfehlung der EU-Kommission

Die Europäische Kommission empfahl 2004 im Rahmen ihres IDA-Programms (Interchange of Data between Administrations) [3], OASIS OpenDocument einer offiziellen internationalen Standardisierungsbehörde wie etwa der ISO vozulegen[4].

Die OASIS hat ihr Format im Oktober 2005 eingereicht und das Joint Technical Commitee (JTC) der ISO wird über die Zulassung als gültigen Standard entscheiden. Die Notwendigkeit für OpenDocument wird darin gesehen, ein einheitliches, kompatibles Dokumentenformat einzuführen, dessen Zukunft nicht von einzelnen Anbietern abhängt und auf lange Zeit gesichert ist, um auch in Zukunft noch uneingeschränkt auf die Daten zugreifen zu können. Dies ist unter anderem relevant für die revisionssichere gesetzeskonforme Langzeitablage von Dokumenten. Außerdem soll durch den offenen Standard mehr Wettbewerb ermöglicht werden.

Eine offizielle Empfehlung für ein bestimmtes Format wurde seitens der Kommission jedoch nicht ausgesprochen.

Einsatz des OpenDocument-Formats bei öffentlichen Stellen

Belgien

Im Rahmen des BELgian Governement Interoperability Framework (BELGIF) strebt die belgische Regierung den ausschließlichen Einsatz von offenen Formaten und Standards im externen Datenaustausch an[5].

Für den Austausch von Office-Dokumenten wurde OpenDocument vorgeschlagen[6] und ab September 2007 muss im Rahmen eines Pilotbetriebes jede Bundesbehörde OpenDocument-Formate unterstützen. Falls diese Erprobungsphase positiv abgeschlossen wird, soll ODF ab September 2008 das Standardformat werden.

Allerdings hält sich die belgische Regierung die Möglichkeit einer Erweiterung der Liste der zugelassenen Dateiformate um konkurrierende Standards offen[7].

Massachusetts

Gemäß dem Enterprise Technical Reference Model (ETRM) Version 3.5 (PDF) des Commonwealth of Massachusetts (veröffentlicht: 2005-09-21) müssen alle offiziellen Akten des Commonwealths in einem offenen Dateiformat verfasst und gespeichert werden. Der Commonwealth definiert offene Dateiformate als Formate, die auf einem offenen Standard basieren, gemeinschaftlich entwickelt wurden, von einer Normungsorganisation verwaltet werden, vollständig dokumentiert sind und öffentlich einsehbar sind.[8]

Das ETRM 3.5 erlaubt folgende Dateiformate: OpenDocument, Plain Text, HTML und PDF, wobei ab 2007-01-01 alle Office-Dateien standardmäßig im OpenDocument-Format gespeichert werden müssen.[9]

In einem Interview meinte Staatssekretär Thomas Trimarco allerdings, dass auch Office Open XML den Vorgaben entsprechen und somit zum Einsatz gelangen könnte.[10]

Vereinigtes Königreich

Am 1. November 2005 veröffentlichte die BECTA (British Educational Communications and Technology Agency) eine technische Spezifikation in der neben einigen anderen Dateiformaten die Verwendung von OpenDocument für Office-Dateien empfohlen wird.[11]

Frankreich

Ein Bericht, der von der französischen Regierung in Auftrag gegeben wurde empfiehlt ODT als zu verwendendens Dokumentformat. Darüber hinaus wird auch allen anderen EU-Ländern eine Adoptierung dieser Entscheidung nahe gelegt, um den Dokumentenaustausch zwischen den einzelenen Mitgliedsländern zu vereinfachen.[12]

Open Document Format Alliance

Seit Anfang März 2006 existiert die Open Document Format Alliance zur Unterstützung des OpenDocument-Formates. Ziel der Allianz ist es, Entscheidern eine Unterstützung und Lobby für das ODF zu geben.

Wachsende Kompatibilität

Es sind bereits eine Reihe von Programmen erschienen, die das neue Dateiformat verwenden. OpenOffice.org 2.0 und StarOffice 8 verwenden es als Standardformat. KOffice kann das Format seit Version 1.4 lesen und schreiben, seit Version 1.5 wird es ebenfalls als Standardformat verwendet, für AbiWord gibt es Filter für Import (Lesen) und Export (Schreiben), und TextMaker 2006 kann es lesen. IBM Workplace, die Weiterentwicklung von Lotus Notes, wird ebenfalls den OASIS-Standard als Format nutzen. Die Softwarefirma Corel kündigte für zukünftige Versionen der Textverarbeitung WordPerfect Unterstützung für OpenDocument an und auch das OpenSource DTP-Programm Scribus verarbeitet ODF-Dateien. Schwierigkeiten könnten allerdings noch durch die Tatsache entstehen, dass ODF in seiner jetzigen Form eben nicht zertifiziert ist. Daher kann es zu Inkompatibilitäten zu den bisherigen Implementierungen kommen.

Standardisierung

Im Rahmen der internationalen Standardisierung ist die ISO/IEC DIS 26300 Open Document Format for Office Applications (OpenDocument) v1.0 derzeit als Normentwurf verfügbar.


Programme mit Unterstützung für OpenDocument

Textverarbeitung und integrierte Office-Anwendungen

  • OpenOffice.org Version 2.0 und StarOffice 8 benutzen OpenDocument als Standardformat.
  • OpenOffice.org ab Version 1.1.5 und StarOffice 7 mit Patch 5 beherrschen den Import von OpenDocument.
  • KOffice ab Version 1.5 vom 11. März 2006 ist OpenDocument Standardformat, ab Version 1.4 vom 21. Juni 2005 konnten die Formate bereits optional genutzt werden.
  • AbiWord ab Version 2.2.8, veröffentlicht am 6. Juni 2005. Ab Version 2.4.2 beinhaltet es neben einem Import-Filter auch einen Export-Filter für OpenDocument.
  • Scribus ab Version 1.2.2, veröffentlicht Anfang Juli 2005. Scribus importiert OpenDocument-Text und OpenDocument-Zeichnungen.
  • Textmaker ab der Version 2006 (derzeit nur Import)
  • Visioo Writer 0.6, ein Dokumentbetrachter für OpenDocument-Text
  • Writely, kostenfreie (erweiterte Features zukünftig eventuell kostenpflichtig) Online-Textverarbeitung
  • AjaxWrite, kostenfreie Online-Textverarbeitung
  • Zoho Writer, kostenfreie Online-Textverarbeitung[13]
  • NeoOffice, (native Mac Version von OpenOffice.org) ab Version 1.2, veröffentlicht am 1. Februar 2006 (derzeit nur Import). NeoOffice 2.0 alpha für PowerPC und Intel ist verfügbar und benutzt OpenDocument als Standardformat analog zu OpenOffice.org 2.x
  • Mobile Office, OpenDocument Suite für Symbian OS

Weitere Programme mit OpenDocument-Funktionen

Dateiformate

Technische Beschreibung

Die Speicherung der Dokumentinhalte erfolgt in dem Java-Archive-Format. Es handelt sich dabei um eine ZIP-Datei mit speziellen Einträgen in diesem Archiv. Die Dateiendung eines Java-Archivs ist .jar, jedoch werden für OpenDocument-Dateien die Dateiendungen .odt für Texte, .ods für Tabellen, .odp für Präsentationen und .odg für Zeichnungen verwendet.

Damit sich der Dateityp auch unabhängig von der Dateiendung und ohne Dekomprimierungsprogramm (siehe Datenkompression) ermitteln lässt, ist der erste Archiv-Eintrag der Mimetyp des Dateiinhaltes im Klartext und unkomprimiert.

Grundsätzlich enthält jede OpenDocument-Datei in dem Archiv den Ordner meta-inf mit der Datei manifest.xml. Die manifest.xml listet alle weiteren Dateien in der OpenDocument-Datei mit dem Mime-Typen auf. Alle weiteren Dateien in der OpenDocument-Datei sind üblicherweise komprimierte XML-Dateien, die eine Dokumentstruktur, den Dokumentinhalt, die Dokumentstile und Dokumenteinstellungen beschreiben. Weiterhin werden Multimediadateien, wie zum Beispiel Bilder, Filme und Musikdateien mit ihrem Binärformat, gegebenenfalls komprimiert, in der OpenDocument-Datei gespeichert.

Beispiel

Eine OpenDocument-Textdatei

Folgendes Beispiel zeigt die Struktur einer OpenDocument-Textdatei:

mimetype
Pictures\10000000000001E800000118B5A37F3F.png
layout-cache
content.xml
styles.xml
meta.xml
Thumbnails\thumbnail.png
settings.xml
meta-inf\manifest.xml

Dabei sind die Dateien mimetype und meta.xml immer unkomprimiert, alle anderen Dateien können komprimiert sein. Im Ordner Pictures befindet sich, in diesem Beispiel, ein Bild im PNG-Format. Die Datei layout-cache ist eine proprietäre Datei einer Textverarbeitung, um das Textdokument schnell darstellen zu können. Fremdprogramme können diese Datei ignorieren, die Daten in dieser Datei sind redundant. Die Datei content.xml enthält in diesem Fall die Textinhalte des Dokumentes. In styles.xml sind alle verwendeten Dokumentformate gespeichert. Die Datei meta.xml beschreibt eine Übersicht der Datei. Zum Beispiel, wie viele Seiten das Dokument enthält, wer der Autor ist und wann es angelegt und geändert wurde. Die Datei thumbnail.png im Ordner Thumbnails zeigt ein kleines Dokumentabbild der ersten Seite des Dokumentes. Dieses Abbild kann von einem Dateibetrachter als Vorschaubildchen verwendet werden. Die dokumentspezifischen Einstellungen finden sich in der settings.xml. Üblicherweise finden sich dort die Druckeinstellungen. Wie schon beschrieben, listet die manifest.xml alle Dateien in diesem Archivformat nochmals auf.

mimetype-Datei

In der mimetype-Datei steht der Typ der Datei (siehe Abschnitt Dateiendungen und Mime-Typ). In diesem Beispiel application/vnd.oasis.opendocument.text

manifest.xml-Datei

Die manifest.xml hat in diesem Beispiel folgenden Inhalt:

 <?xml version="1.0" encoding="UTF-8"?>
 <!DOCTYPE manifest:manifest PUBLIC "-//OpenOffice.org//DTD Manifest 1.0//EN" "Manifest.dtd">
 <manifest:manifest xmlns:manifest="urn:oasis:names:tc:opendocument:xmlns:manifest:1.0">
  <manifest:file-entry manifest:media-type="application/vnd.oasis.opendocument.text" manifest:full-path="/"/>
  <manifest:file-entry manifest:media-type="application/vnd.sun.xml.ui.configuration" manifest:full-path="Configurations2/"/>
  <manifest:file-entry manifest:media-type="image/png" manifest:full-path="Pictures/10000000000001E800000118B5A37F3F.png"/>
  <manifest:file-entry manifest:media-type="" manifest:full-path="Pictures/"/>
  <manifest:file-entry manifest:media-type="application/binary" manifest:full-path="layout-cache"/>
  <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="content.xml"/>
  <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="styles.xml"/>
  <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="meta.xml"/>
  <manifest:file-entry manifest:media-type="" manifest:full-path="Thumbnails/thumbnail.png"/>
  <manifest:file-entry manifest:media-type="" manifest:full-path="Thumbnails/"/>
  <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="settings.xml"/>
 </manifest:manifest>
 

meta.xml-Datei

An dem Beispiel der meta.xml Datei kann man sehen, welche Übersichtsinformationen in der OpenDocument-Datei gespeichert werden. Da auch diese Datei unkomprimiert ist, können Dateibetrachter ohne dekomprimieren zu müssen, die Informationen als Eigenschaften zum Dokument darstellen, ohne die komplette Datei lesen oder verstehen zu müssen. Sie folgen teilweise dem Metadaten-Schema Dublin Core (Elemente im Namensraum dc).

 <?xml version="1.0" encoding="UTF-8"?>
 <office:document-meta
        xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0"
        xmlns:meta="urn:oasis:names:tc:opendocument:xmlns:meta:1.0"
        xmlns:dc="http://purl.org/dc/elements/1.1/"
        xmlns:xlink="http://www.w3.org/1999/xlink">
	<office:meta>
		<meta:generator>OpenOffice.org/1.9.118$Win32 OpenOffice.org_project/680m118$Build-8936</meta:generator>
		<meta:initial-creator>Vorname Nachname</meta:initial-creator>
		<meta:creation-date>2005-09-27T16:53:48</meta:creation-date>
		<dc:creator>Vorname Nachname</dc:creator>
		<dc:date>2005-09-29T18:12:57</dc:date>
		<meta:printed-by>Vorname Nachname</meta:printed-by>
		<meta:print-date>2005-09-29T17:57:42</meta:print-date>
		<dc:language>de-DE</dc:language>
		<meta:editing-cycles>11</meta:editing-cycles>
		<meta:editing-duration>PT6H11M44S</meta:editing-duration>
		<meta:user-defined meta:name="Info 1"/>
		<meta:user-defined meta:name="Info 2"/>
		<meta:user-defined meta:name="Info 3"/>
		<meta:user-defined meta:name="Info 4"/>
		<meta:document-statistic
			meta:table-count="0"
			meta:image-count="4"
			meta:object-count="0"
			meta:page-count="5"
			meta:paragraph-count="92"
			meta:word-count="1460"
			meta:character-count="10405"/>
	</office:meta>
 </office:document-meta>
 

Thumbnails/thumbnail.png-Datei

Das folgende Bild zeigt die Miniaturansicht der ersten Seite des Beispieldokumentes.

 

Dateiendungen und Mime-Typ

Folgende Tabelle zeigt einige verwendete Dateiendungen für die unterschiedlichen OpenDocument-Dateien.

Dateiformat Dateiendung Mime-Typ
Dokumente
OpenDocument-Text .odt application/vnd.oasis.opendocument.text
OpenDocument-Tabellendokument .ods application/vnd.oasis.opendocument.spreadsheet
OpenDocument-Präsentation .odp application/vnd.oasis.opendocument.presentation
OpenDocument-Zeichnung .odg application/vnd.oasis.opendocument.graphics
OpenDocument-Diagramm .odc application/vnd.oasis.opendocument.chart
OpenDocument-Formel .odf application/vnd.oasis.opendocument.formula
OpenDocument-Bild .odi application/vnd.oasis.opendocument.image
OpenDocument-Globaldokument .odm application/vnd.oasis.opendocument.text-master
Vorlagen
OpenDocument-Textvorlage .ott application/vnd.oasis.opendocument.text-template
OpenDocument-Tabellenvorlage .ots application/vnd.oasis.opendocument.spreadsheet-template
OpenDocument-Präsentationsvorlage .otp application/vnd.oasis.opendocument.presentation-template
OpenDocument-Zeichnungsvorlage .otg application/vnd.oasis.opendocument.graphics-template

Weitere Dateiendungen werden in dem OASIS-Standard (Seite 697 f.) [24] aufgelistet.

Verwandte Formate

OpenOffice.org verwendet ein XML-basiertes Dateiformat (Dateiendung: .odb) zur Speicherung von HSQL-Datenbanken bzw. von Definitionen, wie und wo die Daten zu finden sind.

Dieser Dateityp ist nicht Bestandteil der OpenDocument-Spezifikation Version 1.0 (ISO/IEC 26300) und auch im Draft [25] zur neuen Version 1.1 der Spezifikation ist er bisher nicht enthalten.

Quellen

  1. ODF Alliance Pressemitteilung: ODF Alliance Hails Top International Standards Body's Approval of Open Document Format, 3. Mai 2006, englisch
  2. ISO-Dokument: ISO 26300, 3. Mai 2006, kostenpflichtig
  3. Europäische Kommission: Interoperable Delivery of European eGovernment Services to public Administrations, Businesses and Citizens (IDABC) Website, 2006, englisch
  4. Telematics between Administrations Committee: TAC approval on conclusions and recommendations on open document formats Website, 2004, englisch
  5. Belgique.be: Standards ouverts: publication d'une première liste de standards Website, 2006, französisch
  6. Belgif: File type and document formats Website, 2006, englisch
  7. Techworld.com: Belgium adopts OpenDocument Website, 2006, englisch
  8. Commonwealth of Massachusetts: Enterprise Technical Reference Model (ETRM) Version 3.5, Information Domain (PDF), Seite 16, 2005, englisch
  9. Commonwealth of Massachusetts: Enterprise Technical Reference Model (ETRM) Version 3.5, Information Domain (PDF), Seite 18ff, 2005, englisch
  10. Ars Technica: Massachusetts may go back to Microsoft after all, 2005, englisch
  11. BECTA: Technical specification - institutional infrastructure (PDF), Seite 27f, 2005, englisch
  12. derStandar.at: Frankreich: Bericht empfiehlt Open Document Format (ODF) in öffentlicher Verwaltung, 2006, deutsch
  13. Zoho Writer: Website von Zoho Writer
  14. Bibliographix: Website von Bibliographix, 2006
  15. B3: Website von B3, 2006, englisch
  16. JabRef reference manager: Website von JabRef, 2006, englisch
  17. Lars Behrmann: Website zu An OpenDocument Converter (AODC), 2006, englisch
  18. eZ Systems: Website zu OASIS Open Document extension, einer OpenDocument Im-/Export Erweiterung für eZ publish, 2006, englisch
  19. DocuPortal Deutschland: Teamarbeit mit Open Office 2.0, Artikel zu OpenDocument-Unterstützung in DocuPortal.NET, 2006
  20. Nathaniel S Borenstein, IBM: IBM Certifies OpenDocument Successful Implementation, E-Mail aus dem Archiv auf lists.oasis-open.org, 27. März 2005, englisch
  21. Studio Legale Sutti: Website zu Knomos, einem integrierten System für Rechtsanwaltskanzleien, 2005
  22. Copernic Desktop Search: Website von Copernic, 2006, englisch
  23. Alex Hudson: Website zum ODFReader, einer experimentellen Firefox-Erweiterung zum Anzeigen von OpenDocument-Dateien auf addons.mozilla.org, 20. Januar 2006, englisch
  24. OASIS: Open Document Format for Office Applications, OASIS-Standard auf docs.oasis-open.org, 1. Mai 2005, englisch
  25. OASIS OpenDocument TC: OpenDocument v1.1 Committee Draft 2 (tagged PDF), Juli 2006, englisch