Naar inhoud springen

Overleg:Unicode

Pagina-inhoud wordt niet ondersteund in andere talen.
Uit Wikipedia, de vrije encyclopedie
Dit is een oude versie van deze pagina, bewerkt door Danielm~nlwiki (overleg | bijdragen) op 8 sep 2004 om 12:25. (Re: Hooft)
Deze versie kan sterk verschillen van de huidige versie van deze pagina.

Laatste reactie: 20 jaar geleden door Danielm

Er staat hier nu dat UCS-2 en UCS-4 coderingen zijn van unicode, maar eigenlijk zijn dat volgens mij alternatieve benamingen voor onderdelen van de ISO 10464 standaard. Misschien worden hier de "obvious" encoding technieken bedoeld, maar ik weet niet of je die zo mag noemen. Rob Hooft 8 sep 2004 12:17 (CEST)Reageren

In de zin van dat je een bestand in UCS-2 kunt coderen zijn het coderingen. Deze codering wordt vaak gebruikt in Windows; de NT varianten slaan veel tekstbestanden in UCS-2 formaat op (hetgeen tot enige ergenis lijdt als je ze naar een computer met Win9x of Linux kopiëert).

Er is zelf een afspraak voor een UCS-header:

Indien de eerste vier bytes $00, $00, $FE, $FF zijn dan is het UCS-4 big endian Indien de eerste vier bytes $FF, $FE, $00, $00 zijn dan is het UCS-4 little endian Indien de eerste twee bytes $FE, $FF zijn dan is het UCS-2 big endian Indien de eerste twee bytes $FF, $FE zijn dan is het UCS-2 little endian. In andere gevallen wordt de codering als onbekend beschouwd, aanbevolen is standaard ISO-8859-1aan te nemen.

Danielm 8 sep 2004 12:25 (CEST)Reageren