Table des caractères Unicode/U0080
Table des caractères Unicode U+0080 à U+00FF (128 à 255 en décimal).
Commandes C1 et latin étendu – 1 (Unicode 1.1)
Suppléments à l’alphabet latin basique, pour les langues européennes occidentales les plus courantes.
Comme les 256 premiers codes d’Unicode sont basés sur la norme ISO/CEI 8859-1, les caractères Unicode 128 à 159 (surlignés en rouge dans le tableau) ne sont pas utilisés comme caractères graphiques, car ils correspondent à des caractères de contrôle haut (du jeu de contrôle C1) ou de commandes (formalisés dans la norme ISO 6429) présents dans tous les jeux ISO/CEI 8859. Leur usage en tant que caractères Unicode est déconseillé, leur transcription n’étant pas normalisée (en dehors du caractère de contrôle nouvelle ligne (NEL, U+0085) pour préserver la compatibilité des textes transcodés de l’EBCDIC à ISO 8859 ou Unicode).
Note : le caractère U+00AD est un caractère de contrôle de format (indiquant une position possible de césure), normalement invisible dans une ligne de texte ou au milieu d'un mot (ce caractère n'a aucune valeur orthographique et devrait être ignoré lors de la recherche de mots). La césure pourra être rendue visible en cas de coupure de ligne, généralement au moyen d'un tiret ajouté en fin de ligne juste avant la position de césure (cependant le glyphe utilisé dans ce cas, et sa position peuvent dépendre de la langue utilisée).
Table des caractères
en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0080 | PAD |
HOP |
BPH |
NBH |
IND |
NEL |
SSA |
ESA |
HTS |
HTJ |
VTS |
PLD |
PLU |
RI |
SS2 |
SS3 |
U+0090 | DCS |
PU1 |
PU2 |
STS |
CCH |
MW |
SPA |
EPA |
SOS |
SGCI |
SCI |
CSI |
ST |
OSC |
PM |
APC |
U+00A0 | NBSP |
¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | - SHY |
® | ¯ |
U+00B0 | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
U+00C0 | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
U+00D0 | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
U+00E0 | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
U+00F0 | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Historique
Version initiale Unicode 1.1
C'est la version actuelle, qui n’a pas été modifiée depuis. Elle est basée sur la première variante latine de la norme ISO/CEI 8859 (étendu avec le jeu de contrôles C1 dont la plupart sont issus initialement du codage EBCDIC réencodés pour être compatibles avec les normes ISO 646 et ISO/CEI 8859), dont elle reprend le codage sur 8 bits avec une identité des valeurs numériques des points de code Unicode/ISO/IEC 10646 et des valeurs des codets des anciennes normes.
Voir aussi
Liens externes
- (en) [PDF] C1 Controls and Latin-1 Supplement, tableau sur le site Unicode.
- (fr) [PDF] Commandes C1 et supplément Latin-1, tableau sur le site Unicode.
Articles connexes
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Grec et copte
- Arménien
- Hébreu
- Arabe
- Syriaque
- N’ko
- Samaritain
- Mandéen
- Arabe étendu – B
- Dévanâgarî
- Bengalî
- Télougou
- Singhalais
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Géorgien – assomtavrouli et mkhédrouli
- Éthiopien
- Syllabaires autochtones canadiens
- Ogam
- Runes (ou futhark)
- Hanounóo
- Khmer
- Mongol (ou bitchig)
- Limbou
- Bougui (ou bouguinais, bugi, lontara)
- Taï tham (ou lanna)
- Balinais
- Batak
- Lepcha
- Ol tchiki
- Extensions védiques
- Ponctuation générale
- Exposants et indices
- Symboles techniques divers
- Casseau
- Symboles mathématiques divers – A
- Symboles mathématiques divers – B
- Copte
- Tifinaghe
- Ponctuation – supplément
- Symboles et ponctuation CJC
- Katakana
- Lissou (ou lisu, Fraser)
- Vaï
- Cyrillique étendu – B
- Bamoun (ou bamoum, shü-mom)
- ’Phags pa
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Rejang
- Javanais
- Cham
- Taï viêt
- Meitei mayek
- Formes de présentation arabes – A
- Formes verticales
- Formes de compatibilité CJC
- Petites variantes de forme
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Ougaritique
- Cunéiforme persépolitain (vieux perse)
- Araméen impérial
- Phénicien
- Lydien
- Kharochthî
- Sud-arabique antique
- Avestique
- Yézidi
- Brâhmî
- Kaïthî (ou kayathi)
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Multanais (ou multanî)
- Néwar (ou newari, prachalit népalais, nepalbhasha, nepāla lipi)
- Siddham
- Dévanagari étendu – A
- Cunéiforme – nombres et ponctuation
- Mrou
- Vah bassa
- Adlam
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- Arabe étendu – B
- Bengalî
- Goudjarâtî
- Tamoul
- Thaï
- Khmer (ou cambodgien)
- Symboles monétaires
- Formes numérales communes indiennes
- Arabe – formes de présentation – A (3e partie)
- Petites variantes de forme
- Formes de demi et pleine chasse
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Ponctuation générale
- Symboles de type lettre
- Flèches
- Opérateurs mathématiques
- Signes techniques divers
- Symboles mathématiques divers – A
- Flèches – supplément A
- Flèches – supplément B
- Symboles mathématiques divers – B
- Opérateurs mathématiques – supplément
- Petites variantes de forme
- Formes de demie et pleine chasse
- Arabe – symboles mathématiques alphabétiques
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Éthiopien
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Limbou
- Nouveau taï-lue
- Khmers (ou cambodgien) – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Grec – nombres antiques
- Copte – nombres épactes
- Vieil italique
- Gotique
- Cunéiforme persépolitain (vieux perse)
- Néwar (ou newari, prachalit népalais, nepalbhasha, nepāla lipi)
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Arabe – symboles numéraux rûmîs (chiffres de Fès)
- Brahmî
- Sora sompeng
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Singhalais – nombres archaïques
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Adlam
- Alphanumériques délimités – supplément
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Latin étendu – A
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Latin étendu – extensions phonétiques
- Latin étendu – extensions phonétiques – supplément
- Diacritiques – supplément
- Latin étendu – supplément
- Ponctuation générale
- Exposants et indices
- Symboles de type lettre
- Formes numérales
- Opérateurs mathématiques
- Alphanumériques cerclés
- Latin étendu – C
- Lettres modificatives de ton
- Latin étendu – D
- Latin étendu – E
- Formes de présentation alphabétiques
- Demi-signes combinatoires
- Formes de demi et pleine chasse
- Latin étendu – F
- Symboles antiques
- Supplément alphanumérique cerclé
- Latin étendu – G
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de compatibilité unifiés CJC
Caractères ajoutés dans des blocs existants :
Caractères supprimés dans des blocs existants :
- Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Notes et références
- ↑ DerivedAge.txt, base de données sur le site Unicode.