PDF/A
PDF/A-1 ist ein als ISO-Norm verabschiedeter Standard zur Verwendung von PDF 1.4 für die Langzeitarchivierung elektronischer Dokumente. Veröffentlicht als ISO 19005-1:2005, legt PDF/A-1 Anforderungen an ein norm-konformes PDF fest und regelt die Verwendung von PDF/A unter anderem hinsichtlich der Bildschirm- und Druckausgabe.
Die Norm spezifiziert zwei Konformitätsebenen:
- PDF/A-1a - Level A conformance: sowohl eindeutige visuelle Reproduzierbarkeit wie auch Abbildbarkeit von Text nach Unicode und inhaltliche Strukturierung des Dokuments
- PDF/A-1b - Level B conformance: eindeutige visuelle Reproduzierbarkeit
PDF/A ist als Normreihe angelegt. Weitere Teile befinden sich derzeit in einer frühen Phase der Erarbeitung innerhalb des zuständigen ISO-Komitees (ISO TC 171 SC 2 WG 5). Es ist damit zu rechnen, dass voraussichtlich frühestens 2008 ein zweiter Normteil PDF/A-2 verabschiedet wird, der auf einer neueren Version des PDF-Formats aufsetzt und die dadurch eingeflossenen technischen Neuerungen wie beispielsweise JPEG2000 berücksichtigt.
Da mit PDF/X – für den Austausch von Druckvorlagen in der grafischen Industrie – bereits seit 2001 eine weitere auf PDF basierende Normenreihe existiert, wurde bei der Erarbeitung von PDF/A darauf geachtet, dass eine gültige PDF/X-Datei gleichzeitig auch eine gültige PDF/A-Datei sein kann.
Vollständigkeit der Daten
Untersagt sind Referenzen auf Ressourcen, die nicht in der Datei selbst enthalten sind und damit irgendwann nicht mehr zugänglich sein könnten. In einer PDF/A-1-Datei müssen in jedem Fall enthalten sein:
- alle benutzten Fonts (Untergruppen sind erlaubt),
- alle Bilder,
- Kennzeichnung als PDF/A-1 mittels Metadaten im XMP-Format
Eindeutigkeit
- Farben müssen, ähnlich wie in PDF/X, ausreichend definiert sein, um eine eindeutige Farbdarstellung zu gewährleisten. Hier kommen entweder Quellprofile oder ein „Output Intent“ (Beschreibung der typischen Art der Ausgabe mittels eines ICC-Profils, wie beispielsweise sRGB für bildschirmorientiert Dokumente) zur Anwendung
- Fonts dürfen nur eindeutige Kodierungsinformationen verwenden. So müssen beispielsweise die Angaben im PDF zu den Zeichenbreiten der Glyphen mit den Daten im eingebetteten Font selbst übereinstimmen.
- Alternative Bilder – beispielsweise eine niedrigaufgelöste Variante für die Bildschirmausgabe und eine hochaufgelöste Variante für die Druckausgabe – sind nicht zulässig.
Zugänglichkeit
- Verschlüsselungen (und damit auch teilweises Sperren von Funktionen der Datei wie Drucken und Daten herauskopieren) sind untersagt.
Keine kontextabhängigen oder dynamischen Funktionen
- Die Verwendung von JavaScript oder von Aktionen sind nicht zugelassen, da ihre Ausführung den Inhalt oder die Darstellung des PDFs verändern oder beeinflussen könnten.
- Audio- oder Videodaten dürfen nicht eingebettet sein
Patentrechtliche Aspekte
- Die LZW-Komprimerung ist untersagt. Obgleich davon auszugehen ist, dass der LZW-Kompressionsalgorithmus inzwischen mit keinem Patent mehr belastet ist, wurde durch die ISO dennoch sicherheitshalber die Verwendung von LZW ausgeschlossen – nicht zuletzt da mit ZIP eine ebenbürtige Kompression zur Verfügung steht, die frei von Patenten ist.
Erschließung
- Allgemein
- Sofern die PDF/A-1-Datei Metadaten enhält, müssen diese im XMP-Format kodiert sein.
- Nur für Level A conformance
- Sämtlicher Text muss nach Unicode abgebildet werden können.
- Die inhaltliche Struktur der PDF/A-Datei muss mittels „tagged PDF“ angegeben sein.
Überprüfung
- Eine Validierung von gültigem PDF/A ist über entsprechenden Prüfwerkzeuge möglich (z.B. mit der Preflight-Funktion in Adobe Acrobat 8 Professional)
Literatur
- ISO 19005-1:2005 - Document management — Electronic document file format for long-term preservation — Part 1: Use of PDF 1.4 (PDF/A-1), online gegen Gebühr erhältlich im ISO-Store
Siehe auch
- Elektronische Archivierung
- Langzeitarchivierung
- Dokumenten-Technologien
- Enterprise Content Management
Weblinks
- www.pdfa.org PDF/A Competence Center (deutsch und englisch)