ISO 8859

Normenfamilie für Zeichensätze
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 12. Februar 2004 um 10:52 Uhr durch Crissov (Diskussion | Beiträge) (übersichtlichere Übersicht). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Normenfamilie ISO 8859, genauer ISO/IEC 8859, der International Organization for Standardization definiert in zurzeit 15 verabschiedeten und einer verworfenen Teilnorm verschiedene 8-Bit-Zeichensätze für die Informationstechnik.

Eng verwandt sind die jeweils entsprechenden Teilnormen ISO-8859 (mit Bindestrich, ohne »/IEC«), die sich lediglich durch zusätzliche nicht darstellbare Steuerzeichen an den in ISO 8859 freien Positionen unterscheiden.

Zeichensätze

  1. Latin-1 -- Westeuropäisch,
  2. Latin-2 -- Osteuropäisch,
  3. Latin-3 -- Südeuropäisch und Esperanto,
  4. Latin-4 -- Baltisch,
  5. Kyrillisch,
  6. Arabisch,
  7. Griechisch,
  8. Hebräisch,
  9. Latin-5 -- Türkisch statt Isländisch, sonst wie Latin-1,
  10. Latin-6 -- Nordisch,
  11. Thai,
  12. Keltisch (nie verabschiedet),
  13. Latin-7 -- Baltisch (ersetzt Latin-4 und -6),
  14. Latin-8 -- Keltisch,
  15. Latin-9 -- Westeuropäisch mit Eurozeichen,
  16. Latin-10 -- Südosteuropäisch mit Eurozeichen.

Allgemeiner Aufbau der Zeichensätze

  • Die ersten 128 Positionen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.
    • 0x00 bis 0x1F und 0x7F enthalten Steuerzeichen.
    • 0x20 bis 0x7E enthalten druckbare Zeichen (Buchstaben, Ziffern, Interpunktionszeichen ...)
  • Es folgen 32 (unbenutzte) Steuerzeichen (0x80-9F).
  • Die letzten 96 Positionen (0xA0-FF) enthalten regionale Sonderzeichen und machen den Unterschied zwischen den Teilnormen aus.

Bemerkungen

  • Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatzes.
  • Der neuere Latin-9-Zeichensatz unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz, u.a. wurde das allgemeine Währungszeichen ¤ durch das Eurozeichen € ersetzt.
  • Die deutschen Sonderzeichen (Umlaute und "ß") sind in allen Latin-x-Zeichensätzen unter jeweils demselben Code vorhanden.