作者:Владимир Лесной
Lastest update : 2014/11/13Unicode定義區開始位置 |
Unicode定義區結束位置 | 說明 |
U+0000 |
U+D7FF |
兩位元組。 |
U+D800 |
U+DFFF |
四位元組。 |
U+E000 |
U+FFFF |
兩位元組。 |
U+D800-U+DFFF區域的處理
作用 |
位置 |
編碼區開始位置 |
編碼區結尾位置 |
前置代理 | 高位代理 |
D800 |
DBFF |
後尾代理 | 低位代理 |
DC00 |
DFFF |
UTF-16解碼方式
DC00 |
DC01 |
… |
DFFF |
|
D800 |
00010000 |
00010001 |
… | 000103FF |
D801 |
00010400 |
00010401 |
… | 000107FF |
⋮ |
⋮ | ⋮ | ⋱ |
⋮ |
DBFF |
0010FC00 |
0010FC01 |
… | 0010FFFF |
原始Unicode值 |
減去0x00010000以後的值 |
0x00010000 | 0x00000000 |
0x0010FFFF | 0x000FFFFF |
位置 |
區域 |
代理碼 |
計算方式 |
高位代理 |
0x000FFC00 |
D800 |
D800 + ( UTF-16 >> 10 ) |
低位代理 | 0x000003FF |
DC00 |
DC00 + ( UTF-16 & 0x03FF ) |
語言方程碼 | 3 |
2 |
1 |
0 |
UTF-16 | 高位代理 | 低位代理 |
轉換到Unicode定義區
轉換到UTF-16定義區