中文語言方程的數學表達法建議


作者:Владимир Лесной

Lastest update : 2014/11/16

  1. 構形表達法
  2. 拆解
  3. 聚合
  4. 運算

構形表達法


在Unicode的Ideographic Description Sequence(IDS)當中,有下列的Ideographic Description Characters(IDC):

HEX
0
1
2
3
4
5
6
7
8
9
A
B
2FF0

中央研究院風格碼使用13種構形符號。


Sinica 01 Sinica 02 Sinica 03 Sinica 04 Sinica 05 Sinica 06 Sinica 07 Sinica 08 Sinica 09 Sinica 10 Sinica 11 Sinica 12 Sinica 13


由於在拆解及聚合的分野不同,中文語言方程構字式五十型、中央研究院風格碼與Unicode IDC之間,需要稍微對照一下。

例如:「什」這個字。

方法
原字
構形
A
B
表達法
IDS
⿰亻十
Sinica
Sinica 02
Sinica 02亻十
CLF
CLF-05
CLF-05亻十 , CLF ( 05 , 亻 , 十 ) , CLF ( CLF-05 , 亻 , 十 )


IDS與CLF的構形對照表
IDS
Sinica
CLF


CLF-01


CLF-02
Sinica 01 CLF-03
Sinica 01 CLF-04
Sinica 01 CLF-05
Sinica 01 CLF-06
Sinica 01 CLF-07
Sinica 01 CLF-08
Sinica 02 CLF-09
Sinica 02 CLF-10
Sinica 02 CLF-11
Sinica 02 CLF-12
Sinica 02
CLF-13
Sinica 02 CLF-14
Sinica 02 CLF-15
Sinica 03 CLF-16

CLF-17
Sinica 10 CLF-18

CLF-19
Sinica 13 CLF-20

CLF-21

CLF-22

CLF-23


CLF-24

CLF-25


CLF-26

CLF-27

CLF-28

CLF-29


CLF-30

CLF-31

CLF-32

CLF-33

CLF-34

CLF-35

CLF-36

CLF-37

CLF-38


CLF-39

CLF-40

CLF-41

CLF-42

CLF-44

CLF-45

CLF-47

CLF-48

CLF-49

CLF-50

拆解


在「什」的例子當中,過往的規則為「 什 = 亻 + 十  」,在CLF當中,我們將之表達為CLF ( 05 , 亻 , 十 )。

然而,在許多狀況下,正常的文書系統無法表達出某些編碼中不存在的字素,CLF原作者的建議為使用一個稱為CLFP的函式表達,如下:

CLFP ( 05 , A , 什 ) = 亻

例如:「龍」字,部件拆分的時候,經常有人打不出左右部件的字,我們可以用下列方式來表達:

CLF ( 02 , CLFP ( 02 , A , 龍 ) , CLFP ( 02 , B , 龍 ) ) = 龍

其中,「龍」的左部件,實際上是「立、肉」,下部件可能經常有人會打錯,此時我們採用下列方式來表達:

CLFP ( 11 , B , CLFP ( 02 , A , 龍 ) )

以這種方法而言,我們就可以表達出任意的拆解字素或部件。

拆解到筆劃的時候,建議使用以下表達式:

CLFS ( 龍 )

由於,中文語言方程本身具備計算筆劃的功能,因此,CLFS函式是內建的。

聚合


中文語言方程使用的漢字聚合法表達式即為CLF記號。

例如:

騜 = CLF ( 03 , 馬 , 皇 )

表達式可以遞迴:

騜 = CLF ( 03 , 馬 , CLF ( 09 , 白 , 王 ) )

如果我們覺得調侃的不夠,可以再為CLF(03,馬,皇)加上一頂帽子,不過,這就變成「自由部件組字」了。

CLF ( 15 , 宀 , CLF ( 03 , 馬 , CLF ( 09 , 白 , 王 ) ) )


FreeCLF-000001


你更可以發揮創意,用下面的方式來構字:

CLF ( 15 , 宀 , CLF ( 07 , 馬 , CLF ( 09 , 白 , 王 ) , CLFP ( 02 , B , 龍 ) ) )

FreeCLF-000002 註:這是直接製圖所產生的字,明顯地有筆劃寬度的問題。我們將在「筆劃技術」的部份,詳細解釋組 字時期所造成筆劃寬度不一致的解決方案。

中文語言方程會自動依據字群表來判斷是否為「自由部件組字」的漢字。


運算