Zum Inhalt springen

ISO 8859

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 24. August 2003 um 23:05 Uhr durch Wzwz (Diskussion | Beiträge). Sie kann sich erheblich von der aktuellen Version unterscheiden.

Die Norm ISO 8859 definiert in z.Z. 15 Teilnormen verschiedene 8-Bit-Zeichensätze.

Die Zeichensätze:

  • ISO 8859-1 ( "Latin-1" ): westeuropäische Sprachen
  • ISO 8859-2 ( "Latin-2" ): osteuropäische Sprachen
  • ISO 8859-3 ( "Latin-3" ): Esperanto, Galizisch, Maltesisch, Türkisch
  • ISO 8859-4 ( "Latin-4" ): baltische Sprachen
  • ISO 8859-5: kyrillische Schrift
  • ISO 8859-6: arabische Schrift
  • ISO 8859-7: neugriechische Schrift
  • ISO 8859-8: hebräische Schrift
  • ISO 8859-9 ( "Latin-5" ): Türkisch, ähnlich Latin-1
  • ISO 8859-10 ( "Latin-6" ): Grönländisch, Lappisch
  • ISO 8859-11: Thailändisch
  • ISO 8859-12: Keltische Sprachen, Gälisch, Irisch, Welsch
  • ISO 8859-13 ( "Latin-7" ): baltische Sprachen
  • ISO 8859-14 ( "Latin-8" ): Sami-Sprachen, Sprache der Lappen
  • ISO 8859-15 ( "Latin-9" ): westeuropäische Sprachen mit Euro-Zeichen €

Allgemeiner Aufbau der Zeichensätze:

  • Die ersten 128 Zeichen sind bei allen Teilnormen identisch und entsprechen den Zeichen des 7-Bit-Satzes US-ASCII.
    • Die Hex-Codes 00 bis 1F und 7F enthalten Steuerzeichen.
    • Die Codes 20 bis 7E enthalten druckbare Zeichen ( Buchstaben, Ziffern, Sonderzeichen wie Punkt, Komma, Plus, Minus, ...
  • Die nächsten 32 Zeichen ( Codes 80 bis 9F ) enthalten ( unbenutzte ) Steuerzeichen.
  • Die letzten 96 Zeichen ( Codes A0 bis FF ) enthalten nationale Sonderzeichen und unterscheiden sich bei den verschiedenen Teilnormen.

Bemerkungen:

  • Der häufig benutzte Latin-1-Zeichensatz ist identisch mit den ersten 256 Zeichen des Unicode-Zeichensatz.
  • Der neuere Latin-9-Zeichensatz unterscheidet sich nur an 8 Positionen vom Latin-1-Zeichensatz, u.a. wurde das allgemeine Währungszeichen ¤ durch das Euro-Zeichen € ersetzt.
  • Die deutschen Sonderzeichen ( Umlaute und "ß" ) sind in allen Latin-x-Zeichensätzen unter jeweils demselben Code vorhanden.

siehe auch: