作者:Владимир Лесной
Lastest update : 2014/11/13| Unicode定義區開始位置 |
Unicode定義區結束位置 | 說明 |
| U+0000 |
U+D7FF |
兩位元組。 |
| U+D800 |
U+DFFF |
四位元組。 |
| U+E000 |
U+FFFF |
兩位元組。 |
U+D800-U+DFFF區域的處理
| 作用 |
位置 |
編碼區開始位置 |
編碼區結尾位置 |
| 前置代理 | 高位代理 |
D800 |
DBFF |
| 後尾代理 | 低位代理 |
DC00 |
DFFF |
UTF-16解碼方式
| DC00 |
DC01 |
… |
DFFF |
|
| D800 |
00010000 |
00010001 |
… | 000103FF |
| D801 |
00010400 |
00010401 |
… | 000107FF |
| ⋮ |
⋮ | ⋮ | ⋱ |
⋮ |
| DBFF |
0010FC00 |
0010FC01 |
… | 0010FFFF |
| 原始Unicode值 |
減去0x00010000以後的值 |
| 0x00010000 | 0x00000000 |
| 0x0010FFFF | 0x000FFFFF |
| 位置 |
區域 |
代理碼 |
計算方式 |
| 高位代理 |
0x000FFC00 |
D800 |
D800 + ( UTF-16 >> 10 ) |
| 低位代理 | 0x000003FF |
DC00 |
DC00 + ( UTF-16 & 0x03FF ) |
| 語言方程碼 | 3 |
2 |
1 |
0 |
| UTF-16 | 高位代理 | 低位代理 | ||
轉換到Unicode定義區
轉換到UTF-16定義區