Spring til indhold

Unicode

Fra Wikipedia, den frie encyklopædi
Version fra 9. aug. 2015, 00:51 af Dawikibot (diskussion | bidrag) Dawikibot (diskussion | bidrag) (Datomaerker kilde mangler-skabeloner)

Unicode er et tegnsæt, der har vundet stor udbredelse i computerverdenen.

Unicode har som formål at erstatte den store mængde af forskellige internationalt standardiserede eller proprietære tegnsæt på forskellige platforme med en proprietær standard ejet af det amerikanske konsortium Unicode Inc., der indeholder alle skrifttegn, der bruges til at skrive alle levende og de største af de uddøde sprog. Der findes et internationalt standardiseret tegnsæt, som i store træk er kompatibelt med Unicode, nemlig ISO/IEC 10646 – Universal Coded Character Set.

Grundlæggende beskæftiger computere sig udelukkende med binære tal. Arkiveringen af bogstaver og andre skrifttegn kommer som følge istand ved tildelingen af en numerisk kode. Før Unicode var - og den dag idag er - der hundredvis af forskellige indkodningssystemer beregnet allokeringen af disse tegn-tal. Unicode tilordner således et tal mellem 0 og 10FFFF(hexadecimal notation) til de forskellige skrifttegn. For at specificere denne indkoding har unicode publiceret to forskellige mapninger:

  • UTF (Unicode Transfer Format)
  • UCS (Universal Character Set)

Hver mapning findes i forskellige indkodninger, bl.a.:

  • UTF-7 — en ikke særligt brugt 7-bit variabel længde indkodning.
  • UTF-8 — en 8-bit variabel længde indkodning som maksimerer kompatibiliteten med ASCII.
  • UTF-EBCDIC — en 8-bit variabel længde indkodning som maksimerer kompatibiliteten med EBCDIC.
  • UCS-2 — en 16-bit fastlængde indkoding som kun understøtter en del af unicode.
  • UTF-16 — en 16-bit variabel længde indkodning
  • UCS-4 og UTF-32 — to funktionelt identiske 32-bit fastlængde indkoding

Windows bruger hovedsageligt UTF-16, mens det hos Unix-[kilde mangler] og GNU/Linux-systemer i højere grad er op til den enkelte applikation at kunne håndtere unicode - men Linux-kernen er også kompatibel med UTF-8.

I flere Windows programmer, bl.a. Word kan man skrive unicode tegnene, ved at taste koden og derefter Alt + x.

Se også

Wikimedia Commons har medier relateret til:

Eksterne henvisninger