Normalisation Unicode
Apparence
La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
NFD
Les caractères sont décomposés par équivalence canonique et réordonnés.
- Exemples
- e + ́ , inchangé
- e + ́ + ̣→ e + ̣ + ́
- ñ → n + ̃
- Ω → Ω
- fi, inchangé
- ², inchangé
NFC
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
- Exemples
- e + ́ → é
- e + ́ + ̣→ ẹ + ́
- n + ̃→ ñ
- Ω → Ω
- fi, inchangé
- ², inchangé
NFKD
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
- Exemples
- e + ́ , inchangé
- e + ́ + ̣→ e + ̣ + ́
- ñ → n + ̃
- Ω → Ω
- fi → f + i
- ² → 2
NFKC
Les caractèrs sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
- Exemples
- e + ́ → é
- e + ́ + ̣→ ẹ + ́
- n + ̃→ ñ
- Ω → Ω
- fi → f + i
- ² → 2