Zum Inhalt springen

UTF-32

aus Wikipedia, der freien Enzyklopädie
Dies ist eine alte Version dieser Seite, zuletzt bearbeitet am 11. Juni 2004 um 02:02 Uhr durch Head (Diskussion | Beiträge) (Kategorie:Zeichenkodierung). Sie kann sich erheblich von der aktuellen Version unterscheiden.

UTF-32 ist eine Kodierung für Unicode-Zeichen, bei der jedes Zeichen mit 4 Bytes kodiert wird. Eine andere Bezeichnung für UTF-32 ist deshalb auch UCS-4.

UTF-32 ermöglicht bis zu 4 Milliarden Kodierungen, von denen aber nur etwa eine Million verwendet werden. Daher bleibt das erste Byte und der obere Teil des zweiten Bytes immer auf dem Wert 0. UTF-32 ist eine sehr ineffiziente Speicherungsform, läßt sich aber sehr leicht implementieren. Ein weiterer Vorteil ist, dass man schon an der Länge einer Zeichenkette erkennen kann, wieviele Zeichen enthalten sind.

Andere gängige Kodierungen für Unicode sind UTF-8, UTF-16 und UTF-7.