Mine sisu juurde

Unicode

Allikas: Vikipeedia
Redaktsioon seisuga 13. aprill 2015, kell 22:48 kasutajalt Anthrax11 (arutelu | kaastöö)

Unicode on rahvusvaheline standard arvutites kirjasüsteemide kodeerimiseks. See hõlmab suuremaid kirjasüsteeme. 2014. aasta juunis ilmus viimane versioon standardist 7.0.0 [1]

Unicode'is antakse igale märgile oma "koodipunkt" (ingl code point), mis on unikaalne kõikide märkide hulgas. Standardis märgitakse seda kujul "U+xxxx", kus xxxx on arv heksadetsimaalsüsteemis.

Koodipunkt on ainult abstraktne number, mille kodeerimiseks arvutis on mitu standardset viisi. Üldkasutatavana on levinuim UTF-8, mille ühikuks on üks bait; mida suurem on tähe kood, seda rohkem baite kulub. UTF-8 kasutab esimese 255 tähe kodeerimiseks ainult ühte baiti, seega on see ASCII-ga tagasiühilduv.

Standardiga paralleelne on standard ISO 10646, mida hoitakse vastavuses Unicode'iga, kuid ISO standard on ainult kirjeldav ega paku juhiseid ega soovitusi.

Viited

Välislingid