Die Normenfamilie ISO 8859, genauer ISO/IEC 8859, der International Organization for Standardization definiert in zurzeit 15 verabschiedeten und einer verworfenen Teilnorm verschiedene 8-Bit-Zeichensätze für die Informationstechnik.
Eng verwandt sind die jeweils entsprechenden Teilnormen ISO-8859 (mit Bindestrich, ohne »/IEC«), die sich lediglich durch zusätzliche nicht darstellbare Steuerzeichen an den in ISO 8859 freien Positionen unterscheiden.
Zeichensätze
- Latin-1 -- Westeuropäisch,
- Latin-2 -- Osteuropäisch,
- Latin-3 -- Südeuropäisch und Esperanto,
- Latin-4 -- Baltisch,
- Kyrillisch,
- Arabisch,
- Griechisch,
- Hebräisch,
- Latin-5 -- Türkisch statt Isländisch, sonst wie Latin-1,
- Latin-6 -- Nordisch,
- Thai,
- Keltisch (nie verabschiedet),
- Latin-7 -- Baltisch (ersetzt Latin-4 und -6),
- Latin-8 -- Keltisch,
- Latin-9 -- Westeuropäisch mit Eurozeichen,
- Latin-10 -- Südosteuropäisch mit Eurozeichen.
Allgemeiner Aufbau der Zeichensätze
- Die ersten 128 Positionen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.
- 0x00 bis 0x1F und 0x7F enthalten Steuerzeichen.
- 0x20 bis 0x7E enthalten druckbare Zeichen (Buchstaben, Ziffern, Interpunktionszeichen ...)
- Es folgen 32 (unbenutzte) Steuerzeichen (0x80-9F).
- Die letzten 96 Positionen (0xA0-FF) enthalten regionale Sonderzeichen und machen den Unterschied zwischen den Teilnormen aus.
Bemerkungen
- Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.
- Der neuere Latin-9-Zeichensatz unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz, u.a. wurde das allgemeine Währungszeichen ¤ durch das Eurozeichen € ersetzt.
- Die deutschen Sonderzeichen (Umlaute und "ß") sind in allen Latin-x-Zeichensätzen unter jeweils demselben Code vorhanden.