Normalisation Unicode
Apparence
La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
NFD
Les caractères sont décomposés par équivalence canonique et réordonnés.
chaîne | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | = | A + ◌̀ | À |
ẹ́ | e + ◌́ + ◌̣ | ? | e + ◌̣ + ◌́ | ẹ́ |
ñ | ñ | ? | n | ñ |
Ω (ohm) | Ω | ? | Ω | O (oméga) |
? (ligature) | fi | = | fi | ? (ligature) |
² (exposant) | ² | = | ² | ² (exposant) |
? | 한 | ? | ᄒ + ᅡ + ᆨ | 학 |
が | か + ◌゙ | = | か + ◌゙ | が |
? | ئ | ? | ي + ◌ٔ | ئ |
NFC
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
chaîne | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | ? | À | À |
ẹ́ | e + ◌́ + ◌̣ | ? | ẹ + ◌́ | ?´ |
ñ | ñ | = | ñ | ñ |
Ω (ohm) | Ω | ? | Ω | O (oméga) |
? (ligature) | fi | = | fi | ? (ligature) |
² (exposant) | ² | = | ² | ² (exposant) |
? | 한 | = | 한 | ? |
が | か + ◌゙ | ? | が | ? |
? | ئ | = | ئ | ? |
NFKD
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
chaîne | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | = | A + ◌̀ | À |
ẹ́ | e + ◌́ + ◌̣ | ? | e + ◌̣ + ◌́ | ẹ́ |
ñ | ñ | ? | n | ñ |
Ω (ohm) | Ω | ? | Ω | O (oméga) |
? (ligature) | fi | = | f + i | ? |
² (exposant) | ² | = | 2 | 2 |
? | 한 | ? | ᄒ + ᅡ + ᆨ | 학 |
が | か + ◌゙ | = | か + ◌゙ | が |
? | ئ | ? | ي + ◌ٔ | ئ |
NFKC
Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
chaîne | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | ? | À | À |
ẹ́ | e + ◌́ + ◌̣ | ? | ẹ + ◌́ | ?´ |
ñ | ñ | = | ñ | ñ |
? (ligature) | fi | = | f + i | ? |
Ω (ohm) | Ω | ? | Ω | O (oméga) |
² (exposant) | ² | = | 2 | 2 |
? | 한 | ? | 한 | ? |
が | か + ◌゙ | ? | が | ? |
? | ئ | = | ئ | ? |