Discussion:Unicode

Autres discussions [liste]

Admissibilité
Neutralité
Droit d'auteur
Article de qualité
Bon article
Lumière sur
À faire
Archives
Commons

Japonais et chinois

C'est n'importe quoi la partie sur le discussion sur la polémique des langues asiatiques.

non, unicode n'a jamais declare que les codes japonais et chinois etaient identiques lorsque le trace a ete change !

Je pense qu'il faudrait retirer cette "explication" et y consacrer une page à part pour expliquer vraiment le problème, et se contenter d'y faire référence.

Au fait, les seuls à avoir vraiment eu un problème avec cette histoire sont les japonais, et c'est très politique comme histoire. D'ailleurs, c'est uniquement politique d'avoir autant monté en épingle un problème qui quand on va jusqu'au fond des choses est relativement mineur, et surtout n'a pas vraiment de solution meilleure que celle d'unicode.

Article anglais

L'article anglais est bien plus clair.

-- Faut améliorer l'article en français alors en s'inspirant des articles dans d'autres langues.

Qu'en est-il de l'article en allemand, espagnol ? (Ne me dites pas que vous ne connaissez que l'anglais ? ;-))

Glyphes / oeils

Unicode ne code en revanche pas les descriptions des caractères, les glyphes? (le terme typographique français est il, pluriel ils)

"glyphes" est un anglicisme, ou un synonyme? -- Tarquin 15 déc 2003 à 12:18 (CET)

Universal Code

Et Unicode, ca ne veut pas dire Universal Code ? François Trazzi 2 aoû 2004 à 18:35 (CEST)

Pertinence

Dernier commentaire : il y a 20 ans1 commentaire1 participant à la discussion

Il y a beaucoup de grosses imprécisions et de petite erreurs dans cet article. Un peu trop pour que j'aie le temps de revoir maintenant, mais je laisse le bandeau pour avertir les visiteurs que ce n'est pas passé inaperçu, bien que non corrigé.:) Marc Mongenet 14 juillet 2005 à 01:10 (CEST)Répondre

UTF

Dernier commentaire : il y a 19 ans1 commentaire1 participant à la discussion

"Le chiffre après UTF représente le nombre de bits sur lequel le caractère est codé."

Ceci n'est vrai que pour l'UTF-16 et l'UTF-32 puisqu'en UTF-8 un caractère peut être représenté sur plusieurs octets. O ui, cette explication est absolument fausse. Dans UTF-8, le 8 signifie 8 bits, 1 octet. La transmision étant plus simple si ce sont des octets, UTF-8 permet d'encoder les valeurs Unicode (Code Point) sur un, deux, trois ou quatre octets selon les caractères. Par exemple, les caractères du code US-ASCII sont sur un octet, avec la même valeur. Les caractères arabes sont sur deux octets.

Je rajoute que ce n'est pas vrai non-plus pour UTF-16, pour les caractères situés en dehors du PMB, et qui font appel aux seizets d'indirection ("surrogates"). --Bortzmeyer 21 octobre 2005 à 14:45 (CEST)Répondre

Tout le monde est d'accord pour supprimer la phrase originelle, très maladroite ?

Les différents encodages

Dernier commentaire : il y a 19 ans1 commentaire1 participant à la discussion

Le texte actuel dit que "Unicode accepte trois formes de présentation pour représenter un caractère". Sans même mentionner UTF-9 et UTF-18 (RFC 4042, dont il faut vérifier la date), il existe UTF-7 (RFC 2152) et SCSU (Unicode TR #6). Même s'ils sont moins fréquents, il me semble donc que l'article est factuellement inexact. --Bortzmeyer 21 octobre 2005 à 14:55 (CEST)Répondre

Le bandeau de désaccord de pertinence

Dernier commentaire : il y a 19 ans3 commentaires3 participants à la discussion

Marc Mongenet a posé il y a quelques mois un bandeau de désaccord de pertinence, sans préciser les erreurs qui étaient contenues dans cet article. Depuis la pose de ce bandeau, des modifications ont été apportées au texte. Peut-être serait-il temps de supprimer ce bandeau ? Mandrak 2 novembre 2005 à 20:05 (CET)Répondre

Plusieurs erreurs signalées dans cette page de discussion sont toujours présentes et elles me semblent sérieuses... --Bortzmeyer 6 novembre 2005 à 23:26 (CET)Répondre

Mais c'est vous qui connaissez le mieux Unicode. :)

Parmi les formulations très maladroites (incompréhensibles pour qui ne sait pas de quoi ça parle, et 8859-1-centrée pour qui sait), il y a par exemple : « En UTF-8, par exemple, le « é » est codé « Ã© », et « GaÃ¯a » est une chaîne de quatre caractères (Gaïa).» Concernant la compatibilité avec la manipulation des chaînes latin-1, le sens n'est pas très clair, aussi mais je préférerai qu'on se cantonne à ASCII. Je change et retire le bandeau. Marc Mongenet 7 décembre 2005 à 04:24 (CET)Répondre