Unicode Plane 0當中的「字素樹」


作者:Владимир Лесной

Lastest update : 2014/11/09


「字素樹」亦可被稱為「筆劃樹」,CLF系統當中,必須至少一個字體具備完整的「字素樹」,原因是辨識功能與漢字排序必須使用這個數據。

以下是Unicode Plane 0 (U+0000 - U+FFFF)區域間的「字素樹」,一部分的字素來自於CLF(2), 用戶與研究者無需針對這個表格進行太多研究,因為字素表是可以透過編輯器自由變動的字群,不是絕對固定的。 而Unicode Plane 0並非完整的字素表,無法充分表達字素表的完整性與正確性。 中文語言方程當中有優化演算法去消除這些字群不同所造成的差異性。字素是否正確通常來自於某類觀點, 例如語源學等等一類的根源,中文語言方程採取讓用戶可以自行修改字群的方式處理這個問題,因此基本字群是否絕對正確, 技術上並不太重要。此表格主要顯示出整個分析的手段。


(*註) 請勿將Unicode修改或翻譯成中文「統一碼」,原作者拒絕此類不倫不類的翻譯,Unicode至多是一套「集成碼」,用戶或研究者應使用原文「Unicode」來表達。
基礎字
第一層
第二層
第三層
第四層
第五層
第六層
第七層


丿
广
西
巿
廿