Normalisation Unicode

La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.

NFD

Les caractères sont décomposés par équivalence canonique et réordonnés.

Exemples

e + ́ , inchangé
e + ́ + ̣→ e + ̣ + ́
ñ → n + ̃
Ω → Ω
ﬁ, inchangé
², inchangé

NFC

Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.

Exemples

e + ́ → é
e + ́ + ̣→ ẹ + ́
n + ̃→ ñ
Ω → Ω
ﬁ, inchangé
², inchangé

NFKD

Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.

Exemples

e + ́ , inchangé
e + ́ + ̣→ e + ̣ + ́
ñ → n + ̃
Ω → Ω
ﬁ → f + i
² → 2

NFKC

Les caractèrs sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.

Exemples

e + ́ → é
e + ́ + ̣→ ẹ + ́
n + ̃→ ñ
Ω → Ω
ﬁ → f + i
² → 2

Voir aussi

Liens externes

Formes de normalisation