Unicode相容字符
外观
當講解和談論統一碼和 UCS 時,經常提到「相容字符」這個字眼。相容字符是指統一碼聯盟主張不要使用的圖像式字元,正如統一碼聯盟所說:
若不是為了與其他標準間相容和能夠雙向對應轉換,就不會在統一碼中編碼的字符。
然而,其定義實在遠比這話語有更深層和複雜的意味。每個字符都有一個分解或相容性分解的屬性,可是大部分字符這個屬性都是沒有指定內含值,惟統一碼聯盟替超過五千個字符指定了相容性分解項目內的值。這個值能將相容字符對映到一個或多個的其他字符,並藉由設定一個字符的分解屬性,表達了此字符為統一碼中的相容字符。指定某字符為相容字符的理由各異,下面有更詳細的說明。分解這個用語有時會令人感到困惑,因為有些字符分解後還是單個字符的形態,這時該字符的分解值就是另一個相等或近似相等的字符。
相容字符種類和關鍵字
在 5,402 個統一碼的相容分解屬性中,包含一個將這些相容字符分成 17 群的關鍵字。