OpenDocument
OpenDocument (Kurzform für OASIS Open Document Format for Office Applications) bezeichnet die offenen Austauschformate für Dateien von Office-Programmen, welche durch die Organisation OASIS spezifiziert wurden.
Motivation und Überblick
Um ein standardisiertes Dateiformat – vor allem für Textverarbeitungen – zu etablieren, wurde bei OASIS eine Arbeitsgruppe gebildet, die das Dateiformat von OpenOffice.org als Basis für den neuen Standard ausgewählt hat. Das OpenDocument-Format wurde im Mai 2005 veröffentlicht (siehe Weblink 1).
Eine OpenDocument-Datei ist eine Sammlung verschiedener XML-Dateien und anderer Objekte (z.B. eingebundene Bilder), die zu einem Java-Archiv (JAR) zusammengefasst werden, um Speicherplatz einzusparen. Durch das XML-Format können selbst mit einem einfachen Texteditor Veränderungen am Dokument durchgeführt werden, nachdem die Datei entpackt wurde.
Die Europäische Union schlägt im Rahmen ihres IDA-Programms (Interchange of Data between Administrations) vor, OASIS zum ISO-Standard zu machen. Die OASIS hat ihr Format im Oktober 2005 eingereicht und das Joint Technical Commitee (JTC) der ISO wird über die Zulassung als gültigen Standard entscheiden. Die Notwendigkeit für OASIS wird darin gesehen, ein einheitliches, kompatibles Dokumentenformat einzuführen, dessen Zukunft nicht von einzelnen Anbieter abhängt und auf lange Zeit gesichert ist, um auch in Zukunft noch uneingeschränkt auf die Dateien zugreifen zu können. Außerdem soll durch den offenen Standard mehr gerechter Wettbewerb ermöglicht werden. Aus ähnlichen Gründen beschloss der US-Bundesstaat Massachusetts im September 2005, ab 2007 Dokumente nur noch im PDF- oder OpenDocument-Format zu speichern.
Es sind bereits eine Reihe von Programmen erschienen, die das neue Dateiformat verwenden. OpenOffice.org 2.0 und StarOffice 8 verwenden es als Standardformat. Neben den bestehenden Implementationen der freien Produkte AbiWord und KOffice, kündigte auch der deutsche Hersteller SoftMaker die Unterstützung für TextMaker 2005 an, welches im Herbst 2005 erscheinen soll. IBM Workplace, die Weiterentwicklung von Lotus Notes, wird ebenfalls den OASIS-Standard als Format nutzen. Die Softwarefirma Corel kündigte für zukünftige Versionen der Textverarbeitung WordPerfect Unterstützung für OpenDocument an.
Microsofts Haltung zu OpenDocument
Microsoft hat erklärt, dass der Konzern das Format OpenDocument nicht unterstützen werde. Der Quasi-Industriestandard Word bietet daher auch weiterhin keine Importmöglichkeit für Dokumente auf Basis des OpenDocument-Formates. Die Haltung Microsofts ist insofern verständlich, als der weitere Markterfolg von Word sehr stark von der bleibenden Monopolstellung des .doc-Formats bei Industrie- und Endkunden verknüpft ist, welche andere Anbietern den Markteintritt von vornherein nahezu unmöglich macht.
Microsoft entwickelt für die kommende Microsoft Office Version 12 ein eigenes, wie OpenDocument auf XML und ZIP basierendes Dateiformat, das zwar offen und dokumentiert, aber nicht kompatibel zu OpenDocument sein wird. Das wird dadurch begründet, dass Office so viele XML-Eigenschaften besitzen werde, dass man nicht bereit sei, diese in ein bestehendes Format einzubetten, und man wolle den Import von Dokumenten aus älteren MS-Office-Versionen nicht durch eine verringerte Funktionalität des neuen Formats einschränken. Warum sich Microsoft dann aber nicht trotz Einladung an der Spezifizierung des ODF beteiligt hat, wurde von offizieller Seite nie begründet.
Nach der Bekanntgabe der Regierung des US-Bundesstaats Massachusetts, dass in Zukunft nur noch OpenDocument und PDF verwendet werden sollte, relativierte Microsoft einige vorherige Aussagen zum Thema ODF.
Eine australische Entwicklergruppe (Open Source Victoria) arbeitet an einem Plugin (OpenOpenOffice oder O3), das Microsoft Office das Bearbeiten von OpenDocument ermöglichen soll.
Programme mit Unterstützung für OpenDocument
- Textverarbeitung und integrierte Office-Anwendungen
- OpenOffice.org Version 2.0 und StarOffice 8 benutzen OpenDocument als Standardformat.
- OpenOffice.org ab Version 1.1.5 und StarOffice 7 mit Patch 5 beherrschen den Import von OpenDocument.
- KOffice ab Version 1.4, veröffentlicht am 21. Juni 2005. Die derzeitige Version 1.4.2 unterstützt zwar OpenDocument, verwendet das Format aber noch nicht, wie geplant, als Standardformat, da noch nicht alle Möglichkeiten des Formates genutzt werden (können).
- AbiWord ab Version 2.2.8, veröffentlicht am 6. Juni 2005. Die aktuelle Version 2.4.1 beinhaltet einen Import-Filter für OpenDocument. Einen Export-Filter haben die Entwickler für zukünftige Versionen der Reihe 2.4.x in Aussicht gestellt.
- Scribus ab Version 1.2.2, veröffentlicht Anfang Juli 2005. Scribus importiert OpenDocument-Text und OpenDocument-Zeichnungen.
- Textmaker ab der Version 2005 (zur Zeit nur als Beta verfügbar)
- WordPerfect Office wird OpenDocument in der Version 13 ab 2006 unterstützen.
- Visioo Writer 0.6, ein Dokumentbetrachter für OpenDocument-Text [1]
- Writely, kostenfreie (erweiterte Features zukünftig eventuell kostenpflichtig) Online-Textverarbeitung
- NeoOffice, ab Version 1.2 Alpha, veröffentlich am 23. November 2005
- Weitere Programme mit OpenDocument-Funktionen
- eZ publish, ein Content-Management-System mit einer OpenDocument-Erweiterung
- DocuPortal.NET 2005, ein Content-Management-System mit OpenDocument-Unterstützung
- IBM Workplace ab Version 2.5, Unternehmenssoftware von IBM beinhaltet eine OpenDocument-Unterstützung
- Knomos, integriertes System für Rechtsanwaltskanzleien, [2]
- Gnumeric Unterstützung für OpenDocument-Tabellenkalkulation
Dateiformate
Technische Beschreibung
Die Speicherung der Dokumentinhalte erfolgt in dem Java-Archive-Format. Es handelt sich dabei um eine ZIP-Datei mit speziellen Einträgen in diesem Archiv. Die Dateiendung eines Java-Archivs ist .jar, jedoch werden für OpenDocument-Dateien die Dateiendungen .odt für Texte, .ods für Tabellen, .odp für Präsentationen, .odg für Zeichnungen und .odb für Datenbanken verwendet.
Damit sich der Dateityp auch unabhängig von der Dateiendung und ohne Dekomprimierungsprogramm (siehe Datenkompression) ermitteln lässt, ist der erste Archiv-Eintrag der Mimetyp des Dateinhaltes im Klartext und unkomprimiert.
Grundsätzlich enthält jede OpenDocument-Datei in dem Archiv den Ordner meta-inf mit der Datei manifest.xml. Die manifest.xml listet alle weiteren Dateien in der OpenDocument-Datei mit dem Mime Typen auf. Alle weitere Dateien in der OpenDocument-Datei sind üblicherweise komprimierte XML-Dateien, die eine Dokumentstruktur, den Dokumentinhalt, die Dokumentstile und Dokumenteinstellungen beschreiben. Weiterhin werden Multimediadateien, wie zum Beispiel Bilder, Filme und Musikdateien mit ihrem Binärformat, gegebenenfalls komprimiert, in der OpenDocument-Datei gespeichert.
Beispiel
Eine OpenDocument-Textdatei
Folgendes Beispiel zeigt die Strukur einer OpenDocument-Textdatei:
mimetype Pictures\10000000000001E800000118B5A37F3F.png layout-cache content.xml styles.xml meta.xml Thumbnails\thumbnail.png settings.xml meta-inf\manifest.xml
Dabei sind die Dateien mimetype und meta.xml immer unkomprimiert, alle anderen Dateien können komprimiert sein. Im Ordner Pictures befindet sich, in diesem Beispiel, ein Bild im PNG-Format. Die Datei layout-cache ist eine proprietäre Datei einer Textverarbeitung, um das Textdokument schnell darstellen zu können. Fremdprogramme können diese Datei ignorieren, die Daten in dieser Datei sind redundant. Die Datei content.xml enthält in diesem Fall die Textinhalte des Dokumentes. In styles.xml sind alle verwendeten Dokumentformate gespeichert. Die Datei meta.xml beschreibt eine Übersicht der Datei. Zum Beispiel, wie viele Seiten das Dokument enthält, wer der Autor ist und wann es angelegt und geändert wurde. Die Datei thumbnail.png im Ordner Thumbnails zeigt ein kleines Dokumentabbild der ersten Seite des Dokumentes. Dieses Abbild kann von einem Dateibetrachter als Vorschaubildchen verwendet werden. Die dokumentspezifischen Einstellungen finden sich in der settings.xml. Üblicherweise finden sich dort die Druckeinstellungen. Wie schon beschrieben, listet die manifest.xml alle Dateien in diesem Archivformat nochmals auf.
mimetype-Datei
In der mimetype Datei steht der Typ der Datei. In diesem Beispiel application/vnd.oasis.opendocument.text
manifest.xml-Datei
Die manifest.xml hat in diesem Beispiel folgenden Inhalt:
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE manifest:manifest PUBLIC "-//OpenOffice.org//DTD Manifest 1.0//EN" "Manifest.dtd"> <manifest:manifest xmlns:manifest="urn:oasis:names:tc:opendocument:xmlns:manifest:1.0"> <manifest:file-entry manifest:media-type="application/vnd.oasis.opendocument.text" manifest:full-path="/"/> <manifest:file-entry manifest:media-type="application/vnd.sun.xml.ui.configuration" manifest:full-path="Configurations2/"/> <manifest:file-entry manifest:media-type="image/png" manifest:full-path="Pictures/10000000000001E800000118B5A37F3F.png"/> <manifest:file-entry manifest:media-type="" manifest:full-path="Pictures/"/> <manifest:file-entry manifest:media-type="application/binary" manifest:full-path="layout-cache"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="content.xml"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="styles.xml"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="meta.xml"/> <manifest:file-entry manifest:media-type="" manifest:full-path="Thumbnails/thumbnail.png"/> <manifest:file-entry manifest:media-type="" manifest:full-path="Thumbnails/"/> <manifest:file-entry manifest:media-type="text/xml" manifest:full-path="settings.xml"/> </manifest:manifest>
meta.xml-Datei
An dem Beispiel der meta.xml Datei kann man sehen, welche Übersichtsinformationen in der OpenDocument Datei gespeichert werden. Da auch diese Datei unkomprimiert ist, können Dateibetrachter ohne dekomprimieren zu müssen, die Informationen als Eigenschaften zum Dokument darstellen, ohne die komplette Datei lesen oder verstehen zu müssen.
<?xml version="1.0" encoding="UTF-8"?> <office:document-meta xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:meta="urn:oasis:names:tc:opendocument:xmlns:meta:1.0" xmlns:ooo="http://openoffice.org/2004/office" office:version="1.0"> <office:meta> <meta:generator>OpenOffice.org/1.9.118$Win32 OpenOffice.org_project/680m118$Build-8936</meta:generator> <meta:initial-creator>Vorname Nachname</meta:initial-creator> <meta:creation-date>2005-09-27T16:53:48</meta:creation-date> <dc:creator>Vorname Nachname</dc:creator> <dc:date>2005-09-29T18:12:57</dc:date> <meta:printed-by>Vorname Nachname</meta:printed-by> <meta:print-date>2005-09-29T17:57:42</meta:print-date> <dc:language>de-DE</dc:language> <meta:editing-cycles>11</meta:editing-cycles> <meta:editing-duration>PT6H11M44S</meta:editing-duration> <meta:user-defined meta:name="Info 1"/> <meta:user-defined meta:name="Info 2"/> <meta:user-defined meta:name="Info 3"/> <meta:user-defined meta:name="Info 4"/> <meta:document-statistic meta:table-count="0" meta:image-count="4" meta:object-count="0" meta:page-count="5" meta:paragraph-count="92" meta:word-count="1460" meta:character-count="10405"/> </office:meta> </office:document-meta>
Thumbnails/thumbnail.png-Datei
Das folgende Bild zeigt die Miniaturansicht der ersten Seite des Beispieldokumentes.
Dateiendungen und Mime Type
Folgende Tabelle zeigt einige verwendete Dateiendungen für die unterschiedlichen OpenDocument-Dateien.
| Dateiformat | Dateiendung | Mime Type |
|---|---|---|
| Dokumente | ||
| OpenDocument Text | .odt | application/vnd.oasis.opendocument.text |
| OpenDocument Tabellenkalkulation | .ods | application/vnd.oasis.opendocument.spreadsheet |
| OpenDocument Präsentation | .odp | application/vnd.oasis.opendocument.presentation |
| OpenDocument Zeichnung | .odg | application/vnd.oasis.opendocument.graphics |
| OpenDocument Diagramm | .odc | application/vnd.oasis.opendocument.chart |
| OpenDocument Formel | .odf | application/vnd.oasis.opendocument.formula |
| OpenDocument Datenbank | .odb | application/vnd.oasis.opendocument.database |
| OpenDocument Bild | .odi | application/vnd.oasis.opendocument.image |
| OpenDocument Globaldokument | .odm | application/vnd.oasis.opendocument.text-master |
| Vorlagen | ||
| OpenDocument Textvorlage | .ott | application/vnd.oasis.opendocument.text-template |
| OpenDocument Tabellenvorlage | .ots | application/vnd.oasis.opendocument.spreadsheet-template |
| OpenDocument Präsentationsvorlage | .otp | application/vnd.oasis.opendocument.presentation-template |
| OpenDocument Zeichnungsvorlage | .otg | application/vnd.oasis.opendocument.graphics-template |
Für weitere siehe: http://www.oasis-open.org/committees/download.php/12572/OpenDocument-v1.0-os.pdf (Seite 697 f.) (englisch)
Weblinks
- OASIS Open Document Format for Office Applications Technical Committee (englisch)
- Eisenberg, J. David, OASIS OpenDocument Essentials—Using OASIS OpenDocument XML (englisch)
- Spread OpenDocument – The truly open XML document file format (englisch)
- OpenDocument Fellowship (englisch)
- Friends of OpenDocument Inc (englisch)
- Bundestags-Petition zur Nutzung offener Dokumentenformate in der Verwaltung
- AODL - An OpenDocument Library, eine freie (LGPL) in C# geschriebene .net OpenDocument Library. (englisch)
- Linkkatalog zum Thema OpenOffice XML bei curlie.org (ehemals DMOZ) (englisch)