Siirry sisältöön

Unicode

Wikipediasta
Tämä on arkistoitu versio sivusta sellaisena, kuin se oli 4. joulukuuta 2003 kello 00.01 käyttäjän T42~fiwiki (keskustelu | muokkaukset) muokkauksen jälkeen. Sivu saattaa erota merkittävästi tuoreimmasta versiosta.
(ero) ← Vanhempi versio | Nykyinen versio (ero) | Uudempi versio → (ero)

Unicode on laaja merkistöstandardi, joka kattaa suurimman osan maailman kirjoitettujen kielten käyttämistä merkeistä. Useat vanhemmat merkistöt kuten ASCII ja ISO 8859-1 ovat 7- tai 8-bittisiä ja voivat näin määritellä enintään 128 tai 256 eri merkkiä. Unicodessa on yli miljoona mahdollista merkkipaikkaa.

Unicode-merkistön rakenne

Unicoden merkkiavaruus jakautuu 17 tasoon (engl. plane). Jokainen taso on kooltaan 65 536 merkkiä, joten mahdollisia merkkipaikkoja on 1 114 112.

Standardin tuorein versio (4.0) määrittelee yhteensä 96 513 merkkiä ja ohjauskoodia.

Unicoden merkistökoodaukset

UTF-7

UTF-8

UTF-16

UTF-32

Ulkopuoliset linkit

http://www.unicode.org