Office Open XML
Office OpenXML ist das Standard-Dateiformat von Microsoft Office 12. Dies wiederum ist der Nachfolger von Office 2003, einem Büroprogramm zum Erstellen von Textdokumenten, Tabellen und Präsentationen von der Firma Microsoft. Es wurde von dem Weltkonzern entwickelt und basiert, wie zum Beispiel auch das OpenDocument auf XML. Momentan liegt es bei der ECMA zur Standardisierung vor. Später soll es auch von der ISO zertifiziert werden. ECMA hat am 9. Dezember 2005 der Standardisierung zugestimmt und arbeitet bereits daran.
Vorgeschichte
Die Vorläufer diese Formates waren DOC, XLS und PPT. Wie diese Formate aufgebaut sind, welche Elemente was steuern, ist nicht offiziell von Microsoft dokumentiert. Dadurch kam es bei Konvertierungen häufig zu Fehlern in der Darstellung von Text und Bildern. Microsoft hat die Struktur bewusst geheim gehalten, um die Kunden an sich zu binden. Dies funktionierte auch mangels verbreiteter Alternativen fast problemlos. Es besteht inzwischen hoher Bedarf nach einem Format welches herstellerunabhängig einsetzbar ist.
Mit der Konkurrenz OpenOffice und dem dort vorherschenden OpenDocument Format zog Microsoft mit OpenXML nach. Kunden waren mit der Konkurrenz nicht mehr an Microsoft gebunden. Um dem entgegen zu wirken entwickelte MS das Office OpenXML-Format.
Aufbau / Struktur
Das Microsoft Format ist noch nicht standardisiert und kann sich noch ändern. Die momentane Beschreibung hier kann also von der endgültigen Fassung abweichen.
Die Dokumente beginnen grundsätzlich mit
<?xml version="1.0" encoding="UTF-8" standalone="yes"?> <?mso-application progid="Word.Document"?>
Danach folgen Formatdefinitionen. Diese beschreiben z.B. wie eine Überschrift aussehen soll (dick, Schriftart, Platz zwischen den Zeichen), wieviel Platz vor, nach, über, unter der Überschrift sein soll. Erst danach folgt der eigentliche Inhalt, wie Text und Grafiken.
<w:p> <w:r> <w:rPr><w:b /></w:rPr> <w:t>Achim Müller</w:t> </w:r> <w:r> <w:rPr><w:i /></w:rPr> <w:t>Handelsvertreter</w:t> </w:r> </w:p> |
Das Beispiel zeigt einen Textabschnitt, bei dem die ersten beiden Wörter dick (en: bold) und das dritte Wort kursiv (en: italic) dargestellt werden. In der Praxis sieht das dann so aus: Achim Müller Handelsvertreter |
Wie auch OpenDocument, setzt das MS-Format auf eine gepackte Datei, welche mit ZIP-Technologie komprimiert ist. Bei OpenXML ist jedoch der ganze Inhalt in einer XML-Datei, wärend OpenDocument Inhalt (Text, Struktur) und Format (Schriftgröße, allgemeine Darstellungsmittel) sowie Bilder getrennt in das ZIP-Archiv ablegt. Microsoft hat sich das Speichern in eine (1) XML-Datei, welches OpenXML praktiziert, patentieren lassen.