Tagged Image File Format

Dateiformat zur Speicherung von Bilddaten
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 12. April 2005 um 13:57 Uhr durch FlaBot (Diskussion | Beiträge) (robot Ändere:it). Sie kann sich erheblich von der aktuellen Version unterscheiden.

TIFF (engl. Tagged Image File Format) ist ein Dateiformat zur Speicherung von Bilddaten.

Das TIF-Format wurde ursprünglich von Aldus (1994 von Adobe übernommen) und Microsoft für gescannte Rastergrafiken für die Farbseparation entwickelt.

Zusammen mit Encapsulated Postscript ist es das wichtigste Format zum Austausch von Daten in der Druckvorstufe.

Eigenschaften

Die Kodierung von Zahlen (Byte order) kann entweder Big Endian oder Little Endian sein. In einer Datei können mehrere Bilder abgelegt werden (Multipage-TIFF). Das können, müssen aber nicht, verschiedene Versionen desselben Bildes sein, z. B. ein Vorschaubild (Thumbnail) und das Originalbild. TIFF kennt verschiedene Farbräume und Algorithmen zur Datenkompression. Dabei unterstützt es sowohl verlustlose (z. B. LZW, Lauflängenkodierung) als auch verlustbehaftete Kompressionsverfahren (z. B. eines der JPEG-Verfahren). Es ist auch möglich, IPTC-Metadaten in der TIFF-Datei unterzubringen.

Einzelne Bildpunkte können bei TIFF aus beliebig vielen Einzelwerten (Samples) bestehen. Samples können neben dem Standardfall "ein Byte gleich ein Sample" auch Teile eines Bytes einnehmen (z. B. 1, 2 oder 4 Bits) oder aus mehreren Bytes bestehen. Neben Ganzzahlen können auch Fließkommazahlen als Bilddaten abgelegt werden. Die Möglichkeit zur Speicherung von Transparenzinformation (Alphakanal) existiert ebenfalls.

Bilddaten werden in Gruppen von Pixelzeilen, so genannten Stripes (Streifen) oder als rechteckige Tiles (Kacheln) abgelegt. Die Speicherung erfolgt dabei für jeden Streifen bzw. für jede Kachel unabhängig von den anderen, so dass Bildteile je nach Wahl der Größe der Streifen bzw. Kacheln relativ schnell geladen werden können. Andere Formate erfordern hier das Laden sämtlicher Bilddaten vor dem gewünschten Ausschnitt. Ziel der Unterteilung beim Entwurf war allerdings vor allem, dass Einzelteile komplett im Speicher gehalten werden können. Die 1992er Spezifikation empfiehlt dafür acht Kilobyte Maximalgröße.

Einschränkungen

Größter Nachteil von TIFF ist seine Komplexität. Die Vielfalt möglicher gültiger TIFF-Dateien kann von keinem einzelnen Programm unterstützt werden. In der Spezifikation des Dateiformats ist deswegen eine Untermenge gültiger TIFF-Dateien definiert, die jedes TIFF-fähige Programm verarbeiten können sollte, genannt Baseline TIFF.

Für Offset-Werte werden grundsätzlich 32 Bit verwendet. Das führt dazu, dass nur Stellen bis zu vier Gigabyte vom Dateianfang an referenziert werden können. Zur Zeit der Entwicklung von TIFF war dies keine realistische Einschränkung, in letzter Zeit fallen allerdings insbesondere in manchen wissenschaftlichen Disziplinen (z. B. Astronomie) sehr große Bilder an, die TIFF nicht zu speichern in der Lage ist.

Ein Streaming von TIFF-Dateien ist nicht in allen Fällen ohne Pufferung der kompletten Datei möglich. Da TIFF an vielen Stellen von Offset-Werten Gebrauch macht, die Daten referenzieren können, die vor der Stelle liegen, an der sie referenziert werden, ist wahlfreier Zugriff oder eben komplette Pufferung im Speicher eine Notwendigkeit. Aus diesem Grund ist TIFF auch für das WWW denkbar ungeeignet. Adobe hat bei TIFF anders als bei seinem Dokumentenformat PDF nie nachträglich ein Verfahren zur Linearisierung (englisch: linearization) hinzugefügt, das in der so konvertierten Datei eine Reihenfolge gewährleistet, die Rückgriffe unnötig macht.

Grundstruktur der Datei

Die ersten acht Bytes der TIFF-Datei enthalten eine Signatur, die die Byte order und TIFF-Version enthält (einzig gängiger Wert: 42), außerdem ein Offset zum ersten Image File Directory (IFD).

Ein solches IFD gibt Informationen zu einem Bild in der TIFF-Datei und besteht aus einer Liste von Tags, einzelnen Informationseinheiten. Ein solches Tag kann etwa die Breite des Bildes in Pixeln beschreiben, oder den Namen der Software enthalten, die die TIFF-Datei erzeugt hat.

Jedes Tag hat eine eigene Nummer, die es kennzeichnet (z. B. 256 für Bildbreite) und einen Typ (z. B. 16-Bit-Ganzzahlen, 32-Bit-Gleitkommazahlen, Zeichenketten u. v. m.). Manche Tags müssen vorhanden sein (z. B. die Bildbreite), andere sind optional (z. B. der Name der Software). Eine Reihe von Anwendungen verwendet proprietäre Tags. Der Aufbau der Daten, die in einem solchen Tag gespeichert oder referenziert werden, ist dann i. A. nicht dokumentiert. Eine Nummer für eigene proprietäre Tags kann man bei Adobe beantragen.

Am Ende des IFD steht ein Offset-Wert, der das nächste IFD in der Datei referenziert, oder aber 0, falls das aktuelle IFD das letzte war. Auf diese Art und Weise können beliebig viele Bilder in der Datei untergebracht werden, solange die Gesamtmenge der Daten vier Gigabytes nicht übersteigt (siehe auch Einschränkungen weiter oben).

Die IFD-Struktur wird im EXIF-Teil von JPEG-Dateien wiederverwendet.

Spezifikation

Eine genaue Beschreibung des Formats für Entwickler wird von Adobe kostenlos als PDF-Datei zur Verfügung gestellt: http://partners.adobe.com/public/developer/en/tiff/TIFF6.pdf (englisch). Die neueste Version ist 6.0 vom 3. Juni 1992. Sie wird ergänzt durch TIFF Technical Notes. Dabei handelt es sich um Texte, die TIFF einzelne Fähigkeiten hinzufügen, u. a. das Deflate-Verfahren zur verlustlosen Datenkompression, welches bereits in gzip und PNG verwendet wird.

Andere Bildformate

Siehe auch: JPEG, PNG, GIF, BMP, IFF

Verwendung

Siehe auch: Dokumenten-Technologien, Dokumentenmanagement, Retrodigitalisierung, ECM-Komponenten, Fax, Elektronische Archivierung, Scanner, Konverter, Faksimile, Datenkompression