Zum Inhalt springen

UTF-1

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 11. Juni 2013 um 18:57 Uhr durch ° (Diskussion | Beiträge) (Steuerzeichen). Sie kann sich erheblich von der aktuellen Version unterscheiden.

UTF-1 war das erste UCS Transformation Format für Unicode und ISO 10646 und wurde 1993 im Anhang G der ursprünglichen Version von ISO 10646 veröffentlicht, ist jedoch heute nicht mehr Teil dieser Norm. UTF-1 basiert auf ISO 2022 und hat sich nie durchgesetzt.

UTF-1 verwendet 8-bit-Bytes. ASCII-Zeichen, C0- und C1-Steuerzeichen werden wie in ISO 8859 unverändert kodiert. Andere Zeichen werden mit variabler Länge kodiert (MBCS), wobei auch ASCII-Zeichen Teil einer Kodierung sein können. UTF-1 hat verschiedene Nachteile, so ist zum Beispiel der Schrägstrich Teil von Kodierungen, die daher nicht für Dateinamen verwendet werden können.

Anstelle von UTF-1 hat sich UTF-8 allgemein durchgesetzt.