Unicode
Vzhled
Unicode je 16 bitová tabulka znaků všech existujících abeced. Jeho authorem je Unicode Consorcium. Je součástí officiálního standardu ISO 10646. Pro češtinu je nejvhodnější jeho 8 bitová representace UTF-8.
Projekt Unicode začal v roce 1988 a byl dovršen v roce 1991 založením Unicode Consorcium. Od verse 97 Unicode používá pro vnitřní zápis znaků Microsoft Office; Windows od verse NT přes 2000 až po XP.
Na rozdíl od dřívějších 8 bitových tabulek znaků, např. bratří Kamenických, Latin 2, Windows-1250 či ISO-8859-2, mohou být všechny znaky zobrazeny zároveň, takže není problém v jednom textu mít zároveň češtinu a třeba ruštinu či řečtinu.
Některé poštovní programy dosud UTF-8 nezvládají, např. Pegasus Mail 4.
Tabulka českých znaků Unicode
znak | HTML | dec | hex | UTF-8 | znak | HTML | dec | hex | UTF-8 |
Á | Á | Á | Á | %C3%81 | á | á | á | á | %C3%A1 |
Č | Č | Č | Č | %C4%8C | č | č | č | č | %C4%8D |
Ď | Ď | Ď | Ď | %C4%8E | ď | ď | ď | ď | %C4%8F |
É | É | É | É | %C3%89 | é | é | é | é | %C3%A9 |
Ě | Ě | Ě | Ě | %C4%9A | ě | ě | ě | ě | %C4%9B |
Í | Í | Í | Í | %C3%8D | í | í | í | í | %C3%AD |
Ň | Ň | Ň | Ň | %C5%87 | ň | ň | ň | ň | %C5%88 |
Ó | Ó | Ó | Ó | %C3%93 | ó | ó | ó | ó | %C3%B3 |
Ř | Ř | Ř | Ř | %C5%98 | ř | ř | ř | ř | %C5%99 |
Š | Š | Š | Š | %C5%A0 | š | š | š | š | %C5%A1 |
Ť | Ť | Ť | Ť | %C5%A4 | ť | ť | ť | ť | %C5%A5 |
Ú | Ú | Ú | Ú | %C3%9A | ú | ú | ú | ú | %C3%BA |
Ů | Ů | Ů | Ů | %C5%AE | ů | ů | ů | ů | %C5%AF |
Ý | Ý | Ý | Ý | %C3%9D | ý | ý | ý | ý | %C3%BD |
Ž | Ž | Ž | Ž | %C5%BD | ž | ž | ž | ž | %C5%BE |
Externí odkazy
- Officiální stránka – anglicky
- Jaromír Doleček: Unicode – cesta z chaosu kódování znaků