跳转到内容

Unicode區段

维基百科,自由的百科全书

这是本页的一个历史版本,由TongcyDai留言 | 贡献2017年11月5日 (日) 08:36 (新條目)编辑。这可能和当前版本存在着巨大的差异。

(差异) ←上一修订 | 最后版本 (差异) | 下一修订→ (差异)

Unicode中,區段被定義為一組連續碼位的範圍。區段會被給予唯一的名稱,且區段與區段間不會重疊。通常一個最小的區段至少包含16個碼位,即 hhh0到hhhF。

一個區塊可以明確地包含未分配的碼位和非字符。[1] 不屬於任何以命名區段的碼位(例如尚未正式使用的第3-第13平面),上面碼位關於區塊的值會被設為 block="No_block".。相反地,每個分配的代碼點都有一個「區段名稱」的屬性,表示出這個文字所在的區段。這僅由代碼點確定,儘管區段名稱具有描述性質,如「藏語」或「追加箭頭-A」。所有已分配的碼位都有一個單獨的區段名稱。

某些名稱可能會被誤認為是區段名稱,例如收錄在U+2654到U+265F的西洋棋符號,即是收錄在雜項符號的一部份而已。「西洋棋符號」僅作為這個子群的信息編輯的補充。

截至 Unicode 10.0 已經定義了 280 個區段,其中:[2]

  • 有162個區段在0號平面,或稱基本多文種平面(the Basic Multilingual Plane, BMP
  • 有108個區段在1號平面,或稱第一輔助平面多文種補充平面(the Supplementary Multilingual Plane, SMP
  • 有6個區段在2號平面,或稱第二輔助平面表意文字補充平面(the Supplementary Ideographic Plane, SIP
  • 有2個區段在14號平面(在16進制為E),或稱第十四輔助平面特別用途補充平面Supplementary Special-purpose Plane, SSP
  • 各有1個區段在15號平面(Fhex)和16號平面(10hex),皆是私人使用區(Private Use Areas)。


參見