Unicode區段
外观
在Unicode中,區段被定義為一組連續碼位的範圍。區段會被給予唯一的名稱,且區段與區段間不會重疊。通常一個最小的區段至少包含16個碼位,即 hhh0到hhhF。
一個區塊可以明確地包含未分配的碼位和非字符。[1] 不屬於任何以命名區段的碼位(例如尚未正式使用的第3-第13平面),上面碼位關於區塊的值會被設為 block="No_block".。相反地,每個分配的代碼點都有一個「區段名稱」的屬性,表示出這個文字所在的區段。這僅由代碼點確定,儘管區段名稱具有描述性質,如「藏語」或「追加箭頭-A」。所有已分配的碼位都有一個單獨的區段名稱。
某些名稱可能會被誤認為是區段名稱,例如收錄在U+2654到U+265F的西洋棋符號,即是收錄在雜項符號的一部份而已。「西洋棋符號」僅作為這個子群的信息編輯的補充。
截至 Unicode 10.0 已經定義了 280 個區段,其中:[2]
- 有162個區段在0號平面,或稱基本多文種平面(the Basic Multilingual Plane, BMP)
- 有108個區段在1號平面,或稱第一輔助平面或多文種補充平面(the Supplementary Multilingual Plane, SMP)
- 有6個區段在2號平面,或稱第二輔助平面或表意文字補充平面(the Supplementary Ideographic Plane, SIP)
- 有2個區段在14號平面(在16進制為E),或稱第十四輔助平面或特別用途補充平面(Supplementary Special-purpose Plane, SSP)
- 各有1個區段在15號平面(Fhex)和16號平面(10hex),皆是私人使用區(Private Use Areas)。