語言方程碼定義

作者：Владимир Лесной

Lastest update : 2014/11/15

語言方程碼（Language Formula Encoding, LFE）並不被建議用來當做資訊交換碼，它是用來做「數理語言學」計算的演算用途編碼，用戶應視狀況採用其中一部分做為自己實際需求的實作方案編碼。編碼有主要三種用途，「形碼」、「音碼」及「意碼」，其他則有輔助作用的編碼。

LFE是另一個更大的64位元串流編碼系統CTE（CIOS Transactional Encoding, CTE）的一個子集合，前置碼為D9 CC 00 01（D9 CC 00 01 00 00 00 00 + LFE = CTE碼）。

純粹含意編碼（Pure Meaning Space）的前置碼為80 00 00 00（80 00 00 00 00 00 00 00 + PMS = CTE碼），區域為8000000000000000 - FFFFFFFFFFFFFFFF。

賦意域編碼（Semantic Field Encoding）的前置碼為7F 00 00 00 （7F 00 00 00 00 00 00 00 + SFE = CTE碼），區域為7F00000000000000 - 7FFFFFFFFFFFFFFF。

理性規則域編碼（Rational Rule Based Code）的前置碼為70 00 00 00（70 00 00 00 00 00 00 00 + RRC = CTE碼），區域為7000000000000000 - 70FFFFFFFFFFFFFF，例如：邏輯推論碼、模糊邏輯碼、遊戲理論碼及決策碼等等。

行動反應編碼（Action and Reaction Code）的前置碼為71 00 00 00（71 00 00 00 00 00 00 00 + ARC = CTE碼），區域為7100000000000000 - 71FFFFFFFFFFFFFF，例如：跑步、聽音樂、下載檔案及接收指令等等。

CTE編碼的用途是用來實際模擬人類智慧行為的交易碼（Machine Intelligence Transaction Code），採串流與封包的方式，將所有可能的數據皆封裝成一種通用格式，使得「擬人智能系統」能夠在沒有人類輔助的狀態下，將各類管道所獲取的數據，使用各種可能的技術及技巧轉換到「純粹含意空間」及「賦意域」，進而透過「理解系統」推論，最終以「決策系統」發出「行動反應編碼」，而執行實際行動。

處理的程式為LfChar。

定義	LFE碼開始位置	LFE碼結尾位置	辨識方式	演算方式	說明
Unicode	LF+00000000	LF+0010FFFFF	LFE & 0xFFFF0000 < 0x00110000	Mask	Unicode線性編碼位置。
預留區	LF+00110000	LF+001FFFFFF		無	不使用。
音素與符號區	LF+10000000	LF+1FFFFFFF			表音符號、文字與符號區
數字符號	LF+10000030	LF+10000039			0-9符號。
現代英文大寫	LF+10000041	LF+1000005A		線性與遮罩法	A-Z
現代英文小寫	LF+10000061	LF+1000007A			a-z
全形數字符號	LF+10000330	LF+10000339			全形０-９符號。
古今俄語大寫	LF+10001000	LF+1000107F			現代俄語字母及古俄語字母大寫。
古今俄語小寫	LF+10001080	LF+100010FF			現代俄語字母及古俄語字母小寫。
古今日語平假名	LF+10001100	LF+1000117F			現代日語及古日語平假名。
古今日語片假名	LF+10001180	LF+100011FF			現代日語及古日語片假名。


符號區	LF+10010000	LF+1001FFFF			數學符號以外的符號區。
數學符號	LF+10020000	LF+1002FFFF			數學符號區。
表音文字字素表	LF+10030000	LF+1003FFFF			表音文字所使用的字素。

國際音素表	LF+10040000	LF+1004FFFF			國際統一音素表。
國際音標字母	LF+10040000	LF+100407FF			國際音標字母表。

數學含意區	LF+11000000	LF+110FFFFF			數學含意區，可表達1048576個數學含意，用於理解系統及非符號型實際數學公式表達。定理一類的含意則使用「數學賦意域」（Mathematical Field）的方式表達，不使用LFE編碼表示。


構形與筆劃編號	LF+11110000	LF+1111FFFF			構形與筆劃編碼區。
中文語言方程構形區	LF+11110000	LF+1111007F			中文語言方程構形符號區，實際只使用77個記號，其餘由用戶自行定義。
中文語言方程構形區	LF+11110080	LF+111100FF			中文語言方程構形部件序列記號區，實際只使用77個記號，其餘由用戶自行定義。
中文語言方程組合區	LF+11111000	LF+111113FF			中文語言方程組合規則碼，用於自由組字。
中文語言方程筆劃區	LF+11114000	LF+11117FFF			中文語言方程筆劃區第一區，目前可編碼16384個筆劃，使用於字型編輯器上。
中文語言方程筆劃區	LF+11114000	LF+11114FFF			中文語言方程筆劃區第一區，前面的4096個筆劃由作者所寫的字型編輯器所佔用。

中文表音符號	LF+11112000	LF+11112FFF			中文表音符號（Phonograms）。
注音符號	LF+11112000	LF+1111207F			注音符號區，包含台語及其他語言的注音符號。
注音符號聲調記號	LF+11112180	LF+11112087			輕聲、陰平聲、陽平聲、上聲、去聲。
漢語音素	LF+11113000	LF+11113FFF			漢語音素（Phonemes）。

諺文構形區	LF+11120000	LF+1112000F			諺文構形符號區。



語素文字編碼區	LF+20000000	LF+2FFFFFFF			中文及特定編碼以外的「語素文字」編碼區（Logograms）。
規則諺文編碼區	LF+20000000	LF+20FFFFFF			韓語構字式編碼。


實驗碼區。	LF+30000000	LF+3FFFFFFF			其他種類的實驗碼區。

動物語言編碼區	LF+40000000	LF+4FFFFFFF			目前已經研究的動物語言編碼表，主要是「音素」。

鯨魚音素表	LF+40000000	LF+4000FFFF			鯨魚音素表。

狗語音素表	LF+40010000	LF+40017FFF			狗語音素表，主要是受過訓練的狗的「音素表」。
狗語自然反應音素表	LF+40010000	LF+400100FF			狗自然反應而發出的聲音「音素表」。

貓語音素表	LF+40018000	LF+4001FFFF			貓語音素表，主要是受過訓練的貓的「音素表」。
貓語自然反應音素表	LF+40018000	LF+400180FF			貓自然反應而發出的聲音「音素表」。

CLF單部件編碼區	LF+80000000	LF+8FFFFFFF			CLF數學碼當中，單部件（1,2,4,10,18,20）編碼區。
基本字編碼區	LF+80000000	LF+8000FFFF			CLF(1)編碼區，可供編碼區域為16位元。
複雜字編碼區	LF+80010000	LF+800FFFFF			CLF(2)編碼區，可供編碼區域為983040個位置，每區為4096個空間，分群區碼為 10-FF。
規範複雜字編碼區	LF+80010000	LF+80010FFF			內定的複雜字分群。
	LF+80011000	LF+800FFFFF			用戶指定的複雜字分群。
橫排單部件編碼區	LF+81000000	LF+81FFFFFF			CLF(4)編碼區，可供編碼區域為24位元，使用構形區碼做前置碼，後面跟著偏序集編號。

直排單部件編碼區	LF+82000000	LF+82FFFFFF			CLF(10)編碼區，可供編碼區域為24位元，使用構形區碼做前置碼，後面跟著偏序集編號。

品字單部件編碼區	LF+83000000	LF+83FFFFFF			CLF(18)編碼區，可供編碼區域為24位元。
品字規範單部件編碼區	LF+83000000	LF+8300FFFF			規範CLF(18)字群編碼區。

㗊字單部件編碼區	LF+84000000	LF+84FFFFFF			CLF(20)編碼區，可供編碼區域為24位元。
㗊字規範單部件編碼區	LF+8400000	LF+8400FFFF			規範CLF(20)字群編碼區。

CLF雙部件直排編碼區	LF+90000000	LF+9FFFFFFF			CLF數學碼當中，雙部件直排編碼區。





CLF雙部件橫排編碼區	LF+A0000000	LF+AFFFFFFF			CLF數學碼當中，雙部件橫排編碼區。





CLF雙部件編碼區	LF+B0000000	LF+BFFFFFFF			CLF數學碼當中，雙部件除去直排及橫排的編碼區。




CLF多部件編碼區	LF+C0000000	LF+CFFFFFFF			CLF數學碼當中，多於兩個部件（7,13,14,17,19,21,31,33...）的編碼區。



UTF-16編碼區	LF+D8000000	LF+DFFFFFFF			LFE碼當中為UTF-16預留的處理區域。
UTF-8 Marking(EF,BB,BF)	LF+EFBBBF00	LF+EFBBBFFF			UTF-8 Marking(EF,BB,BF)。UTF-8使用FE FF作為檔案表示記號，因此，此編碼實際保留給UTF-8使用。
賦意域區域	LF+FC000000	LF+FCFFFFFF			賦意域標記碼。
UTF-16BE BOM	LF+FEFF0000	LF+FEFFFFFF			由於UTF-16使用FF FE序列表示BOM，因此這個編碼是保留用於辨識大尾碼與小尾碼用途。UTF-8當中，則使用FE FF作為檔案辨識標頭，因此，這個編碼有雙重用途。
UTF-16LE BOM	LF+FFFE0000	LF+FFFEFFFF			由於UTF-16使用FF FE序列表示BOM，因此這個編碼是保留用於辨識大尾碼與小尾碼用途。
數值區	LF+FFFFFE00	LF+FFFFFEFF			數值區，表示這個LFE碼是個實際的數字。