Zum Inhalt springen

„Office Open XML“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Ghw (Diskussion | Beiträge)
K Standardisierung: ISO/IEC CD 29500
Kritik: ein paar weitere der wichtigsten Kritikpunkte hinzugefügt.
Zeile 92: Zeile 92:
* '''Umfang:''' Kritiker bemängeln den Umfang der einige tausend Seiten umfassenden Spezifikation, der anderen Softwareherstellern erschwert das Dateiformat korrekt und vollständig in ihren Anwendungen zu implementieren <ref name="sutor">Bob Sutor: [http://www.sutor.com/newsite/blog-open/?p=1145 Is Open XML a one way specification for most people?]</ref>.
* '''Umfang:''' Kritiker bemängeln den Umfang der einige tausend Seiten umfassenden Spezifikation, der anderen Softwareherstellern erschwert das Dateiformat korrekt und vollständig in ihren Anwendungen zu implementieren <ref name="sutor">Bob Sutor: [http://www.sutor.com/newsite/blog-open/?p=1145 Is Open XML a one way specification for most people?]</ref>.


* '''Proprietäre Teile:''' Statt auf bewährte, offene Standards wie [[MathML]] für die Formeldarstellung oder [[SVG]] für die Darstellung von Vektorgrafiken zu verwenden, speichert Office Open XML diese Elemente in von Microsoft entwickelten Formaten. Das hat zur Folge, dass Entwickler von Konkurrenzanwendungen viele Funktionen unter Umständen mehrmals implementieren müssen: einmal für die offenen Standards und einmal für die Microsoftformate, die in OpenXML zum Einsatz kommen <ref name="sutor"/>.
* '''Proprietäre Teile:''' Statt auf bewährte, offene Standards wie [[MathML]] für die Formeldarstellung oder [[SVG]] für die Darstellung von Vektorgrafiken zu verwenden, speichert Office Open XML diese Elemente in von Microsoft entwickelten, undokumentierten Formaten. Das hat zur Folge, dass Entwickler von Konkurrenzanwendungen viele Funktionen unter Umständen mehrmals implementieren müssen: einmal für die offenen Standards und einmal für die Microsoftformate, die in OpenXML zum Einsatz kommen (falls eine Implementierung dieser undokumentierten Formate technisch und juristisch überhaupt möglich ist)<ref name="sutor"/>.


* '''Berücksichtigung von Fehlern aus MS Office:''' Das neue Format berücksichtigt einige alte technische Fehler von [[Microsoft Excel]]. Kritiker behaupten, Microsoft wolle so die Implementierung von Office Open XML durch Konkurrenzanwendungen bewusst erschweren indem es diese zwinge, dieselben Fehler zu implementieren <ref>Rob Weir: [http://www.robweir.com/blog/2006/10/leap-back.html A Leap Back]</ref>.
* '''Berücksichtigung von Fehlern aus MS Office:''' Das neue Format berücksichtigt einige alte technische Fehler von [[Microsoft Excel]]. Kritiker behaupten, Microsoft wolle so die Implementierung von Office Open XML durch Konkurrenzanwendungen bewusst erschweren indem es diese zwinge, dieselben Fehler zu implementieren <ref>Rob Weir: [http://www.robweir.com/blog/2006/10/leap-back.html A Leap Back]</ref>.

* '''Widerspruch zu bestehenden ISO-Standards:''' Office Open XML widerspricht zahlreichen bestehenden ISO-Standards, u.a. dem Standard für die Darstellung von Datum und Uhrzeit oder dem Standard für die Abküruzung von Bezeichnungen von Sprachen <ref>grokdoc: [http://www.grokdoc.net/index.php/EOOXML_objections#Ecma_376_contradicts_numerous_international_standards Ecma 376 contradicts numerous international standards]</ref>.

* '''Widerspruch zur grundlegenden Politik der ISO:''' Das erklärte Ziel der ISO ist es, für einen Zweck einen einzigen Standard festzulegen - das Vorhandensein mehrerer widersprüchlicher Standards führt die Idee der Standardisierung an sich ad absurdum <ref>ISO: [http://www.iso.org/iso/en/commcentre/pressreleases/archives/2001/Ref805.html one standard, one test and one conformity assessment procedure accepted everywhere]</ref>. ISO/IEC 26300:2006 (Open Document Format) ist bereits ein anerkannter ISO-Standard für Office-Dokumente.


== Quellen ==
== Quellen ==

Version vom 27. Januar 2007, 16:48 Uhr

Office Open XML ist ein auf XML basierendes Dateiformat für Büroanwendungspakete, das als offener, herstellerunabhängiger Standard den problemlosen Daten- und Dateienaustausch zwischen Büroanwendungspaketen ermöglichen soll. Ein weiterer Vorteil liegt in der automatisierbaren Erstellung und Verarbeitung entsprechender Dateien.

Office Open XML basiert auf dem Dateiformat von 2007 Microsoft Office System, das von Microsoft der Ecma International zur Standardisierung vorgelegt wurde. Die Standardisierung von Office Open XML erfolgt durch das technische Komitee 45 (TC45) der Ecma International.

Office Open XML wurde am 7. Dezember 2006 von der Ecma Hauptversammlung als Ecma Standard 376 genehmigt.

Vorgeschichte

Durch die große Verbreitung von Microsoft Office haben sich die dazugehörigen Dateiformate (DOC, XLS, PPT, etc.) als Industriestandard für den Dokumentenaustausch etabliert.

Der Aufbau dieser Office-Formate ist nicht offen dokumentiert, sondern muss von Microsoft lizenziert werden. Da die Kosten und vor allem die Lizenzbedingungen nicht für alle Anbieter akzeptabel sind, waren manche Konkurrenten (speziell OpenSource-Projekte) gezwungen den Aufbau der Dateiformate durch Reverse Engineering herauszufinden.

Aufgrund der dem Reverse Engineering inhärenten Probleme und dem Umstand, dass die Dateiformate eng mit der inneren Arbeitsweise der Microsoft Office-Applikationen verknüpft sind, kann es zu fehlerhafter Erzeugung und Darstellung der Dateiinhalte durch Konkurrenz-Applikationen kommen.

Um das automatisierte Erstellen und Verarbeiten von Microsoft Office-Tabellenkalkulationsdokumenten zu vereinfachen, wurde mit Microsoft Excel XP ein XML-basiertes Dateiformat eingeführt [1] (XML Spreadsheet[2]), das allerdings nur einen Teil der Excel-Funktionalität abspeichern kann.

Mit Microsoft Office 2003 wurde die XML-Unterstützung ausgeweitet und neue XML-basierte Dateiformate eingeführt, vor allem in Microsoft Word.[3]

Für Microsoft Office 2007 wurden die XML-basierten Dateiformate gründlich überarbeitet und zum neuen Standarddateiformat bestimmt. Dieses Dateiformat bildet die Basis von Office Open XML.

Standardisierung

Seit einiger Zeit wird – vor allem von Regierungen (beispielsweise des US Bundesstaates Massachusetts) oder der EU – gefordert, dass zukünftig nur noch offen dokumentierte, herstellerunabhängige, standardisierte Dateiformate benutzen werden sollen, um Lock-in-Effekte zu vermeiden und um die Interoperabilität und den langfristigen Zugriff auf Dateiinhalte sicherzustellen. Aufgrund dieser Forderungen hat Microsoft das Microsoft Office 2007-Dateiformat der Ecma International zur Standardisierung vorgelegt. Die Standardisierung erfolgt dort im Rahmen des technischen Komitees 45 (TC45).

Am Standardisierungsprozess sind Apple, Barclays Capital, BP, die British Library, Essilor, Intel, die The United States Library of Congress, Microsoft, NextPage, Novell, Statoil ASA und Toshiba beteiligt.[4]

Office Open XML wurde am 7. Dezember 2006 von der Ecma International-Hauptversammlung als Ecma Standard 376 genehmigt.[5]

Im Dezember 2006 wurde Office Open XML bei der ISO als ISO/IEC CD 29500 zur Standardisierung eingereicht.

Das ebenfalls auf XML basierende OASIS Open Document Format for Office Applications wird von Microsoft abgelehnt, da es unter anderem zu sehr auf dem Dateiformat – und damit der Arbeitsweise und dem Funktionsumfang – von OpenOffice.org basiere und nicht geeignet sei, alle bereits existierenden Microsoft Office-Dokumente abzubilden.[6][7]

Lizenzierung

Wie alle Ecma International-Standards wird auch der Office Open XML-Standard frei verfügbar und kopierbar sein[8].

In einem covenant not to sue hat Microsoft erklärt, dass es unwiderruflich auf eine Durchsetzung aller für eine konforme Umsetzung der Office 2003 XML Reference Schemas-Spezifikation notwendigen Patente gegenüber Programmteilen, die diese Spezifikation implementieren, verzichtet[9]. Die Rechtsanwaltskanzlei Baker & McKenzie hat im Auftrag von Microsoft unter anderem den Inhalt und die Gültigkeit dieses covenants überprüft und in einer Studie[10] festgestellt, dass keine Lizenz benötigt wird, um Office Open XML einsetzen zu können.[11]

Dies gilt nicht für Patentansprüche Dritter.

Aufbau / Struktur

Die Formatspezifikation befindet sich noch in der Entwicklungsphase, so dass die momentane Beschreibung von der endgültigen Fassung abweichen kann.

Office Open XML besteht aus einer Spezifikation für ein Containerformat, den Open Packaging Conventions, und einer Reihe von XML-basierten Auszeichnungssprachen für die einzelnen Komponenten eines Büroanwendungspaketes.

Auszeichnungssprachen

  • WordprocessingML (für Textverarbeitungsdokumente)
  • SpreadsheetML (für Tabellenkalkulationsdokumente)
  • PresentationML (für Präsentationsdokumente)
  • DrawingML (für Zeichnungsdokumente)
  • VML (für Zeichnungsobjekte innerhalb anderer Dokumente)
  • einer Reihe von Hilfs-Auszeichnungssprachen:
für Custom XML Data Properties (zum Speichern von beliebigen XML in einem Package), Dateieigenschaften, mathematische Formeln und bibliographischen Hinweisen

Packages

Office Open XML-Dokumente werden in Packages gespeichert, die den Open Packaging Conventions entsprechen. Ein Package ist eine ZIP-Datei, die alle Bestandteile (Parts und Items) eines Dokuments enthält.

Parts sind die einzelnen Bestandteile (Bausteine) des Inhalts des Dokuments (Text, Graphiken, Bilder, etc.), während Items beschreibende Metadaten sind, die festlegen wie die einzelnen Bestandteile des Dokuments zusammengestellt und dargestellt werden sollen. Items können in Relationship items und Content-Type items unterteilt werden. Relationship items beschreiben wie die einzelnen Parts zusammenhängen, d.h. wie die einzelnen Bestandteile des Dokuments zusammengefügt werden müssen, während Content-Type items den Content-Type der einzelnen Bestandteile festlegen, d.h. wie die einzelnen Bestandteile dargestellt werden müssen. Jedes Office Open XML-Dokument besteht aus einem main part (Hauptbestandteil) und evt. weiteren Bestandteilen, die vom main part über ein relationship item referenziert werden. Der Aufbau, Name und Pfad (innerhalb der ZIP-Datei) des main parts hängt vom Typ des Office Open XML-Dokuments (Textverarbeitungsdokument, Tabellenkalkulationsdokument, etc.) ab.

Ein minimales Office Open XML- Textverarbeitungsdokument enthält im Wurzelverzeichnis der ZIP-Datei eine XML-Datei namens /[Content_Types].xml, sowie drei Ordner /_rels, /docProps und einen Ordner mit den eigentlichen Dokumentdaten.

Inhalt eines minimalen Office Open XML-Textverarbeitungsdokuments
[Content_Types].xml-Datei
Diese Datei enthält eine Beschreibung des Inhaltes der ZIP-Datei
_rels-Ordner
In den _rels-Ordnern werden die Abhängigkeiten zwischen den einzelnen Parts gespeichert und zwar je Part in einer eigenen Datei mit der Erweiterung .rels. In einem Textverarbeitungsdokument mit Text und Bildern, ist der Text zum Beispiel in der Datei /word/document.xml gespeichert und in der Datei /word/_rels/document.xml.rels befinden sich dann die Verweise auf die eingebetteten Bilder. Es gibt immer eine Datei /_rels/.rels, in der die package relationships gespeichert sind und der main part festlegt wird. Diese Datei ist die erste Datei, die beim Öffnen gelesen wird.
docProps-Ordner
Der /docProps-Ordner enthält in den Dateien core.xml und app.xml diverse Dokumenteigenschaften (Metadaten), wie Autor, Speicherdatum, etc.
Dokumentdaten-Ordner
Der Dokumentdaten-Ordner (zum Beispiel /word) enthält die eigentlichen Dokumentdaten. Im Falle eines Textverarbeitungsdokuments zum Beispiel eine Datei document.xml, die gemäß WordprocessingML aufgebaut ist.

Applikationsunterstützung

  • Für ältere Microsoft Office-Versionen (ab Version 2000) bietet Microsoft einen „Compatibility Pack“[12], der es ermöglicht, das Format zu lesen und zu schreiben.
  • Die OpenSource-Tabellenkalkulation Gnumeric unterstützt eine veraltete Version des Office Open XML-Standard-Entwurfs[13].

Kritik

Gegner von Office Open XML werfen Microsoft vor, dass dem Konzern nicht an einer wirklichen Interoperabilität mit Konkurrenzprodukten gelegen sei, und er das neue Format daher absichtlich so angelegt habe, dass es von Konkurrenten in der Praxis kaum implementierbar sei [16]. Die Hauptkritikpunkte dabei sind:

  • Umfang: Kritiker bemängeln den Umfang der einige tausend Seiten umfassenden Spezifikation, der anderen Softwareherstellern erschwert das Dateiformat korrekt und vollständig in ihren Anwendungen zu implementieren [17].
  • Proprietäre Teile: Statt auf bewährte, offene Standards wie MathML für die Formeldarstellung oder SVG für die Darstellung von Vektorgrafiken zu verwenden, speichert Office Open XML diese Elemente in von Microsoft entwickelten, undokumentierten Formaten. Das hat zur Folge, dass Entwickler von Konkurrenzanwendungen viele Funktionen unter Umständen mehrmals implementieren müssen: einmal für die offenen Standards und einmal für die Microsoftformate, die in OpenXML zum Einsatz kommen (falls eine Implementierung dieser undokumentierten Formate technisch und juristisch überhaupt möglich ist)[17].
  • Berücksichtigung von Fehlern aus MS Office: Das neue Format berücksichtigt einige alte technische Fehler von Microsoft Excel. Kritiker behaupten, Microsoft wolle so die Implementierung von Office Open XML durch Konkurrenzanwendungen bewusst erschweren indem es diese zwinge, dieselben Fehler zu implementieren [18].
  • Widerspruch zu bestehenden ISO-Standards: Office Open XML widerspricht zahlreichen bestehenden ISO-Standards, u.a. dem Standard für die Darstellung von Datum und Uhrzeit oder dem Standard für die Abküruzung von Bezeichnungen von Sprachen [19].
  • Widerspruch zur grundlegenden Politik der ISO: Das erklärte Ziel der ISO ist es, für einen Zweck einen einzigen Standard festzulegen - das Vorhandensein mehrerer widersprüchlicher Standards führt die Idee der Standardisierung an sich ad absurdum [20]. ISO/IEC 26300:2006 (Open Document Format) ist bereits ein anerkannter ISO-Standard für Office-Dokumente.

Quellen

  1. Microsoft Knowledge Base: INFO: Microsoft Excel 2002 and XML (englisch)
  2. Microsoft Developer Network: XML Spreadsheet Reference (englisch)
  3. Microsoft: Bringing the XML Vision to the Desktop with Office 2003 (englisch)
  4. Ecma International: [http://www.ecma-international.org/memento/TC45-M.htm TC45 - Ecma Office Open XML File Formats Standard - Status Report - 17 August 2006 - Redmond, Washington, USA] (englisch)
  5. Ecma International: - Ecma Ecma International approves Office Open XML standard - Geneva, 7 December 2006 (englisch)
  6. Microsoft: Ecma International Standardization of OpenXML File Formats Frequently Asked Questions (englisch)
  7. Gary Edwards: Kommentar zu: "An Antic Disposition: Follow the Leader" (englisch)
  8. Ecma International: What is Ecma International (englisch)
  9. Microsoft: Microsoft Covenant Regarding Office 2003 XML Reference Schemas
  10. Baker & McKenzie: Standardisation and Licensing of Microsoft's Office Open XML Reference Schema (englisch)
  11. Brian Jones: No license needed to use the Office Open XML formats (englisch)
  12. Microsoft Download Center: Microsoft Office Compatibility Pack für Dateiformate von Word, Excel und PowerPoint 2007
  13. GNOME: Gnumeric 1.7.0 Release Notes (englisch): „Basic import and export for MS Office 12 (beta1) files“
  14. Personal Computer World: New Wordperfect will support Office 12 formats (englisch)
  15. Novell Pressemitteilung: Novell verbessert Interoperabilität zwischen OpenOffice.org und Microsoft Office
  16. Pro-Linux News: Free Software Foundation Europe kritisiert Novells OpenXML-Implementierung
  17. a b Bob Sutor: Is Open XML a one way specification for most people?
  18. Rob Weir: A Leap Back
  19. grokdoc: Ecma 376 contradicts numerous international standards
  20. ISO: one standard, one test and one conformity assessment procedure accepted everywhere

Siehe auch

OpenDocument (Konkurrenz)