Diskuse:Unicode
Připadá mi, že tu někde kdysi byly některé relevantní informace o unicode, např. zmínka o kódování GB18030 (oficiální kódování v Číně), které je součástí standardu. Taky není pravda, že Unicode je 32 bitový, v současnosti norma povoluje i pro budoucí rozšíření max. 21 bitů (asi 2 miliony kódových bodů). Je absurdní, že více o terminologii unicode se člověk dozví v článku znaková sada --Pteryx 09:21, 14. 1. 2008 (UTC)
Proč je pro češtinu nejvhodnější kódování UTF-8? Jaké kódování je nejvhodnější pro angličtinu? Co je obsah sdělění "Pro češtinu je nejvhodnější kódování UTF-8?"
- Pro angličtinu zřejmě také. Ta věta moc skutečného informačního obsahu asi nenese, ale imho vyjadřuje, že např. pro jazyky typu čeština je utf-8 vhodnější, než např. ucs-2, které je vhodné pro jazyky typu čínština. Mám dojem, že tam ta věta poměrně sedí, nevidím v tom moc problém. --Mormegil 19:21, 20. Čer 2004 (UTC)
- Formulace "UTF-8 je nejvhodnější kódování" není optimální, ale je přibližně správná - pro drtivou většinu jazyků založených na latince. Jeho zásadní výhoda je, že je jednoznačně určené, takže se na něm shodnou všichni napříč různými operačními systémy. U všech ostatních běžných kódování (mimo GB18030) není jasně dané pořadí bytů, což je znehodnocuje. Využití klasických 8-bitových kódování vede v současném globalizovaném světě k velkým problémům. UTF-8 pro jazyky založené na latince zvětší velikost řetězců jen nepatrně, přitom se získá obrovská výhoda v přenositelnosti a kompatibilitě. Z hlediska zpracování je zde ta úžasná výhoda, že řetězce kódované v UTF-8 lze kopírovat úplně stejně jako normální ASCII texty, takže UTF-8 nevede ke zhroucení nebo zaseknutí starších programů. Pro azbuku toto kódování tak výhodné není, protože proti 8-bitovým systémům natáhne velikost textů na dvojnásobek, ale z běžně rozšířených kódování Unicode je i pro tyto jazyky nejvýhodnější. --Pteryx 09:21, 14. 1. 2008 (UTC)
- Protože čeština má jen pár znaků navíc, takže je pro ni UTF-16 zbytečné.
- Pro angličtinu je nevhodnější 7-bit, neboť nemá žádnou diakritiku.
- -- Vít Zvánovec 09:21, 22. Čer 2004 (UTC)
- To je poněkud silné tvrzení. I v anglickém textu se občas hodí mít nějaké podivné znaky, i kdyby to mělo být jen pár řeckých písmenek či “trocha typografie”. Ale myslím, že je to samozřejmé, takže si rozumíme. :-) --Mormegil 10:47, 22. Čer 2004 (UTC)
- V případě podivných znaků už to není angličtina. -- Vít Zvánovec 14:25, 22. Čer 2004 (UTC)
Při přepisu článku jsem měl problémy se slovem "byte". Jak ho používat v češtině? Skloňovat? Když ano, jak? Nebo používat přepis "bajt", který se už dá skloňovat docela dobře? Poraďte. Mojža 15:25, 22. Čer 2004 (UTC)
- Po pravdě řečeno mi tohle taky dělá trochu problémy. Dokonce jsem zjistil, že to tak nějak občas míchám. Jakkoli se mi bajt nelíbí nijak výrazně, je to asi jediná použitelná verze v běžném textu. A už je to i docela zaběhnutý termín (viz např. časopis). Ale samostatný článek (na který se chystám cobydup) by měl být nejspíš Byte, s přesměrováním z Bajt. Asi. Takže já bych byl asi pro používání něčeho ve stylu: „Vejde se tam spousta bajtů.“. --Mormegil 15:34, 22. Čer 2004 (UTC)
- Byte je přeci jednotka. Máme snad nějaké džauly? Takže žádná další barbarisace. -- Vít Zvánovec 15:38, 22. Čer 2004 (UTC)
- S tím celkem souhlasím, "bajt" se mi taky moc nelíbí, ale jak ho tedy používat v textu? Mojža 16:01, 22. Čer 2004 (UTC)
- Souhlasit s tím, že bajt nezní moc hezky, jde snadno. Jenže co s tím? V současné podobě je např. článek UTF-8 prakticky nečitelný díky těm nesklonným byte (bajtům). Skloňovat byte, bytu, bytem, byte, ... je podle mě ještě horší než bajt, bajtu, bajtem, ... Apropos, už jsme tu měli i časopis Bajt. Takže co s tím? Nevím... --Mormegil 21:10, 22. Čer 2004 (UTC)
- O UTF-8 jsem tak psal vědomě, jak to bude vypadat. Nic moc, ale zatím nevím, co s tím. Asi počkám na další názory (nebo to někdo zedituje). Mojža 21:59, 22. Čer 2004 (UTC)
- Mně se nezdá tak hrozné. Také by bylo možné používat značku nebo přilepit českou koncovku. -- Vít Zvánovec 09:30, 23. Čer 2004 (UTC)
- Ano, přesně takhle (jak to uvádí Mormegil); viz Mluvnice češtiny, svazek 2 - Tvarosloví, pasáže o cizích slovech s odlišnou výslovností (mělo by to být i v jednosvazkové Příruční mluvnici češtiny). --Malýčtenář 10:36, 23. Čer 2004 (UTC)
- No tak OK, jde to. Jenom je potřeba poznat, že ten článek patří do informatiky a ne do stavebnictví. Značka se obecně používat nedá, protože narozdíl od oněch Joulů, kde se těžko setkáme se samostatným podstatným jménem Joule („Každý z Joulů má svůj význam.“), se se samostatným bytem setkáváme poměrně často („Každý z následujících bytů má nastavený horní bit.“). Byte totiž není jenom jednotka informace, ale i konkrétní entita té velikosti. To se u jiných jednotek obvykle nestává, tam není žádný Joule číslo 1 a Joule číslo 2. --Mormegil 11:12, 23. Čer 2004 (UTC)