Normalisation Unicode
Apparence
La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
NFD
Les caractères sont décomposés par équivalence canonique et réordonnés.
châine | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | = | A + ◌̀ | À |
ẹ́ | e + ◌́ + ◌̣ | → | e + ◌̣ + ◌́ | ẹ́ |
ñ | ñ | → | n | ñ |
Ω (ohm) | Ω | → | Ω | Ω (oméga) |
fi (ligature) | fi | = | fi | fi (ligature) |
² (exposant) | ² | = | ² | ² (exposant) |
한 | 한 | → | ᄒ + ᅡ + ᆨ | 학 |
が | か + ◌゙ | = | か + ◌゙ | が |
ئ | ئ | → | ي + ◌ٔ | ئ |
NFC
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
châine | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | → | À | À |
ẹ́ | e + ◌́ + ◌̣ | → | ẹ + ◌́ | ẹ́ |
ñ | ñ | = | ñ | ñ |
Ω (ohm) | Ω | → | Ω | Ω (oméga) |
fi (ligature) | fi | = | fi | fi (ligature) |
² (exposant) | ² | = | ² | ² (exposant) |
한 | 한 | = | 한 | 한 |
が | か + ◌゙ | → | が | が |
ئ | ئ | = | ئ | ئ |
NFKD
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
châine | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | = | A + ◌̀ | À |
ẹ́ | e + ◌́ + ◌̣ | → | e + ◌̣ + ◌́ | ẹ́ |
ñ | ñ | → | n | ñ |
Ω (ohm) | Ω | → | Ω | Ω (oméga) |
fi (ligature) | fi | = | f + i | fi |
² (exposant) | ² | = | 2 | 2 |
한 | 한 | → | ᄒ + ᅡ + ᆨ | 학 |
が | か + ◌゙ | = | か + ◌゙ | が |
ئ | ئ | → | ي + ◌ٔ | ئ |
NFKC
Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
châine | caractères | caractères normalisés |
chaîne normalisée | |
---|---|---|---|---|
À | A + ◌̀ | → | À | À |
ẹ́ | e + ◌́ + ◌̣ | → | ẹ + ◌́ | ẹ́ |
ñ | ñ | = | ñ | ñ |
fi (ligature) | fi | = | f + i | fi |
Ω (ohm) | Ω | → | Ω | Ω (oméga) |
² (exposant) | ² | = | 2 | 2 |
한 | 한 | → | 한 | 한 |
が | か + ◌゙ | → | が | が |
ئ | ئ | = | ئ | ئ |