UTF-1

UTF-1 war das erste UCS Transformation Format für Unicode und ISO 10646 und wurde 1993 im Anhang G der ursprünglichen Version von ISO 10646 veröffentlicht, ist jedoch heute nicht mehr Teil dieser Norm. UTF-1 basiert auf ISO 2022 und hat sich nie durchgesetzt.

UTF-1 verwendet 8-bit-Bytes. ASCII-Zeichen, C0- und C1-Steuerzeichen werden wie in ISO 8859 unverändert kodiert. Andere Zeichen werden mit variabler Länge kodiert (MBCS), wobei auch ASCII-Zeichen Teil einer Kodierung sein können. UTF-1 hat verschiedene Nachteile, so ist zum Beispiel der Schrägstrich Teil von Kodierungen, die daher nicht für Dateinamen verwendet werden können.

Anstelle von UTF-1 hat sich UTF-8 allgemein durchgesetzt.

Weblinks