UTF-32

UTF-32 ist eine Kodierung für Unicode-Zeichen, bei der jedes Zeichen mit 4 Bytes kodiert wird. Eine andere Bezeichnung für UTF-32 ist deshalb auch UCS-4.

UTF-32 ermöglicht bis zu 4 Milliarden Kodierungen, von denen aber nur etwa eine Million verwendet werden. Daher bleibt das erste Byte und der obere Teil des zweiten Bytes immer auf dem Wert 0. UTF-32 ist eine sehr ineffiziente Speicherungsform, läßt sich aber sehr leicht implementieren. Ein weiterer Vorteil ist, dass man schon an der Länge einer Zeichenkette erkennen kann, wieviele Zeichen enthalten sind.

Andere gängige Kodierungen für Unicode sind UTF-8, UTF-16 und UTF-7.