Vés al contingut

Usuari:Mcapdevila/Unicode

De la Viquipèdia, l'enciclopèdia lliure
Aquesta és una versió anterior d'aquesta pàgina, de data 07:10, 1 març 2012 amb l'última edició de Mcapdevila (discussió | contribucions). Pot tenir inexactituds o contingut no apropiat no present en la versió actual.

Unicode és un estàndard internacional de codificació de caràcters en suports informàtics. El seu objectiu és proporcionar el mitjà per a permetre emmagatzemar qualsevol text que es desitgi. Això inclou qualsevol mena de forma d'escriptura que es faci servir actualment, moltes formes d'escriptura conegudes només pels estudiosos i altra mena de símbols com ara els símbols matemàtics, lingüístics i APL.

Unicode és un projecte que pretén reemplaçar tota mena de conjunt de caràcters existent. Avui en dia, Unicode es considera el conjunt de caràcters més complet i ha esdevingut l'opció a triar en la internacionalització de programari en entorns multilingües. Molts estàndars recents i programari bàsic han adoptat Unicode per a representar text.

Repertori de caràcters

Tipus de caràcters

Diferents versions del caràcter Angstrom, com a caràcter (versió preferida), com a caràcter amb signe diacrític i com a símbol en forma de.

Els blocs de l'espai de codis contenen punts amb la informació següent: [1]

Caràcters gràfics : Lletres, signes diacrítics, xifres, caràcters de puntuació, símbols i espais.

Caràcters de format : Caràcters invisibles que afecten el procés del text proper. Exemples: U+2028 salt de línia , U+2029 salt de paràgraf , U+00A0 no break space , etc.

Codis de control : 65 codis definits per compatibilitat amb ISO/IEC 2022. Són els caràcters entre en els rangs [U+0000, U+001F], U+007F i [U+0080 .. U+009F]. Interpretar-és responsabilitat de protocols superiors.

Caràcters privats : Reservats per a l'ús fora de l'estàndard per fabricants de programari .

Caràcters reservats : Codis reservats per al seu ús per Unicode. Són posicions no assignades.

Punts de codi subrogats : Unicode reserva els punts de codi de U+D800 a U+DFFF per al seu ús com codis subrogats en UTF-16, en la representació de caràcters suplementaris.

No-caràcters : Són codis reservats permanentment per a ús intern per Unicode. Els dos últims punts de cada pla U+FFFE i U+FFFF.

Caràcters descartats : Són caràcters que es retenen per compatibilitat amb versions anteriors, però s'ha d'evitar el seu ús.

Formes d'escriptura suportades

Unicode contempla gairebé qualsevol mena de forma d'escriptura utilitzada avui:

i altres. També suporta símbols (matemàtics, lògics, musicals...), ornamentació i sistemes d'escriptura de l'antiguitat, com ara l'ogham, les runes, el lineal A i B o els diacrítics del grec clàssic.

Vegeu també

Enllaços externs

Plantilla:Enllaç AD

  1. The Unicode Consortium. «16. Special Àrees and Format Characters». A: Julie D. Allen, Joe Becker (et al.). (en anglès). Addisson-Wesley, octubre 2006. ISBN 0-321-48091-0.