Die Norm ISO 8859 definiert in zurzeit 15 Teilnormen verschiedene 8-Bit-Zeichensätze.
Zeichensätze
- ISO 8859-1 ("Latin-1"): westeuropäische Sprachen,
- ISO 8859-2 ("Latin-2"): osteuropäische Sprachen,
- ISO 8859-3 ("Latin-3"): Esperanto, Galizisch, Maltesisch, Türkisch,
- ISO 8859-4 ("Latin-4"): baltische Sprachen,
- ISO 8859-5: Kyrillisch,
- ISO 8859-6: Arabisch,
- ISO 8859-7: Neugriechisch,
- ISO 8859-8: Hebräisch,
- ISO 8859-9 ("Latin-5"): Türkisch statt Isländisch, sonst wie Latin-1,
- ISO 8859-10 ("Latin-6"): Grönländisch, Lappisch,
- ISO 8859-11: Thailändisch,
- ISO 8859-12: Keltische Sprachen, Gälisch, Irisch, Welsch,
- ISO 8859-13 ("Latin-7"): baltische Sprachen,
- ISO 8859-14 ("Latin-8"): Sami-Sprachen, Sprache der Lappen,
- ISO 8859-15 ("Latin-9"): westeuropäische Sprachen mit Eurozeichen.
Allgemeiner Aufbau der Zeichensätze
- Die ersten 128 Zeichen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.
- Die Hex-Codes 00 bis 1F und 7F enthalten Steuerzeichen.
- Die Codes 20 bis 7E enthalten druckbare Zeichen (Buchstaben, Ziffern, Interpunktionszeichen ...)
- Die nächsten 32 Zeichen (Codes 80 bis 9F) enthalten (unbenutzte) Steuerzeichen.
- Die letzten 96 Zeichen (Codes A0 bis FF) enthalten nationale Sonderzeichen und unterscheiden sich bei den verschiedenen Teilnormen.
Bemerkungen
- Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.
- Der neuere Latin-9-Zeichensatz unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz, u.a. wurde das allgemeine Währungszeichen ¤ durch das Eurozeichen € ersetzt.
- Die deutschen Sonderzeichen (Umlaute und "ß") sind in allen Latin-x-Zeichensätzen unter jeweils demselben Code vorhanden.