語言方程碼定義



作者:Владимир Лесной

Lastest update : 2014/11/15


語言方程碼(Language Formula Encoding, LFE)並不被建議用來當做資訊交換碼,它是用來做「數理語言學」計算的演算用途編碼,用戶應視狀況採用其中一部分做為自己實際需求的實作方案編碼。編碼 有主要三種用途,「形碼」、「音碼」及「意碼」,其他則有輔助作用的編碼。

LFE是另一個更大的64位元串流編碼系統CTE(CIOS Transactional Encoding, CTE)的一個子集合,前置碼為D9 CC 00 01(D9 CC 00 01 00 00 00 00 + LFE = CTE碼)。

純粹含意編碼(Pure Meaning Space)的前置碼為80 00 00 00(80 00 00 00 00 00 00 00 + PMS = CTE碼),區域為8000000000000000 - FFFFFFFFFFFFFFFF。

賦意域編碼(Semantic Field Encoding)的前置碼為7F 00 00 00 (7F 00 00 00 00 00 00 00 + SFE = CTE碼),區域為7F00000000000000 - 7FFFFFFFFFFFFFFF。

理性規則域編碼(Rational Rule Based Code)的前置碼為70 00 00 00(70 00 00 00 00 00 00 00 + RRC = CTE碼),區域為7000000000000000 - 70FFFFFFFFFFFFFF,例如:邏輯推論碼、模糊邏輯碼、遊戲理論碼及決策碼等等。

行動反應編碼(Action and Reaction Code)的前置碼為71 00 00 00(71 00 00 00 00 00 00 00 + ARC = CTE碼),區域為7100000000000000 - 71FFFFFFFFFFFFFF,例如:跑步、聽音樂、下載檔案及接收指令等等。

CTE編碼的用途是用來實際模擬人類智慧行為的交易碼(Machine Intelligence Transaction Code),採串流與封包的方式,將所有可能的數據皆封裝成一種通用格式,使得「擬人智能系統」能夠在沒有人類輔助的狀態下,將各類管道所獲取的數據,使 用各種可能的技術及技巧轉換到「純粹含意空間」及「賦意域」,進而透過「理解系統」推論,最終以「決策系統」發出「行動反應編碼」,而執行實際行 動。

處理的程式為LfChar

定義
LFE碼
開始位置
LFE碼
結尾位置
辨識方式
演算方式
說明
Unicode
LF+00000000
LF+0010FFFFF
LFE & 0xFFFF0000 < 0x00110000
Mask
Unicode線性編碼位置。
預留區
LF+00110000
LF+001FFFFFF


不使用。
音素與符號區
LF+10000000
LF+1FFFFFFF


表音符號、文字與符號區
數字符號
LF+10000030
LF+10000039


0-9符號。
現代英文大寫
LF+10000041
LF+1000005A

線性與遮罩法
A-Z
現代英文小寫 LF+10000061
LF+1000007A


a-z
全形數字符號 LF+10000330 LF+10000339

全形0-9符號。
古今俄語大寫 LF+10001000
LF+1000107F


現代俄語字母及古俄語字母大寫。
古今俄語小寫 LF+10001080 LF+100010FF

現代俄語字母及古俄語字母小寫。
古今日語平假名 LF+10001100 LF+1000117F

現代日語及古日語平假名。
古今日語片假名 LF+10001180 LF+100011FF

現代日語及古日語片假名。












符號區
LF+10010000
LF+1001FFFF


數學符號以外的符號區。
數學符號
LF+10020000
LF+1002FFFF


數學符號區。
表音文字字素表
LF+10030000
LF+1003FFFF


表音文字所使用的字素。






國際音素表
LF+10040000
LF+1004FFFF


國際統一音素表。
國際音標字母
LF+10040000
LF+100407FF


國際音標字母表。






數學含意區 LF+11000000 LF+110FFFFF


數學含意區,可表達1048576個數學含意,用於理解系統及非符號型實際數學公式表達。定理一 類的含意則使用「數學賦意域」(Mathematical Field)的方式表達,不使用LFE編碼表示。












構形與筆劃編號
LF+11110000
LF+1111FFFF


構形與筆劃編碼區。
中文語言方程構形區
LF+11110000
LF+1111007F


中文語言方程構形符號區,實際只使用77個記號,其餘由用戶自行定義。
中文語言方程構形區 LF+11110080 LF+111100FF

中文語言方程構形部件序列記號區,實際只使用77個記號,其餘由用戶自行定義。
中文語言方程組合區 LF+11111000
LF+111113FF


中文語言方程組合規則碼,用於自由組字。
中文語言方程筆劃區 LF+11114000
LF+11117FFF


中文語言方程筆劃區第一區,目前可編碼16384個筆劃,使用於字型編輯器上。
中文語言方程筆劃區 LF+11114000 LF+11114FFF


中文語言方程筆劃區第一區,前面的4096個筆劃由作者所寫的字型編輯器所佔用。






中文表音符號 LF+11112000 LF+11112FFF

中文表音符號(Phonograms)。
注音符號
LF+11112000
LF+1111207F


注音符號區,包含台語及其他語言的注音符號。
注音符號聲調記號 LF+11112180
LF+11112087


輕聲、陰平聲、陽平聲、上聲、去聲。
漢語音素 LF+11113000 LF+11113FFF

漢語音素(Phonemes)。






諺文構形區 LF+11120000
LF+1112000F


諺文構形符號區。


















語素文字編碼區 LF+20000000
LF+2FFFFFFF


中文及特定編碼以外的「語素文字」編碼區(Logograms)。
規則諺文編碼區 LF+20000000
LF+20FFFFFF


韓語構字式編碼。












實驗碼區。 LF+30000000 LF+3FFFFFFF

其他種類的實驗碼區。






動物語言編碼區
LF+40000000
LF+4FFFFFFF


目前已經研究的動物語言編碼表,主要是「音素」。






鯨魚音素表
LF+40000000
LF+4000FFFF


鯨魚音素表。






狗語音素表 LF+40010000
LF+40017FFF


狗語音素表,主要是受過訓練的狗的「音素表」。
狗語自然反應音素表 LF+40010000
LF+400100FF


狗自然反應而發出的聲音「音素表」。






貓語音素表 LF+40018000
LF+4001FFFF


貓語音素表,主要是受過訓練的貓的「音素表」。 
貓語自然反應音素表 LF+40018000 LF+400180FF

貓自然反應而發出的聲音「音素表」。






CLF單部件編碼區
LF+80000000
LF+8FFFFFFF


CLF數學碼當中,單部件(1,2,4,10,18,20)編碼區。
基本字編碼區 LF+80000000
LF+8000FFFF


CLF(1)編碼區,可供編碼區域為16位元。
複雜字編碼區 LF+80010000
LF+800FFFFF


CLF(2)編碼區,可供編碼區域為983040個位置,每區為4096個空間,分群區碼為 10-FF。
規範複雜字編碼區 LF+80010000 LF+80010FFF

內定的複雜字分群。

LF+80011000
LF+800FFFFF


用戶指定的複雜字分群。
橫排單部件編碼區 LF+81000000 LF+81FFFFFF

CLF(4)編碼區,可供編碼區域為24位元,使用構形區碼做前置碼,後面跟著偏序集編號。






直排單部件編碼區 LF+82000000
LF+82FFFFFF


CLF(10)編碼區,可供編碼區域為24位元,使用構形區碼做前置碼,後面跟著偏序集編號。






品字單部件編碼區 LF+83000000
LF+83FFFFFF


CLF(18)編碼區,可供編碼區域為24位元。
品字規範單部件編碼區 LF+83000000 LF+8300FFFF

規範CLF(18)字群編碼區。






字單部件編碼區 LF+84000000
LF+84FFFFFF


CLF(20)編碼區,可供編碼區域為24位元。
字規範單部件編碼 區 LF+8400000
LF+8400FFFF


規範CLF(20)字群編碼區。






CLF雙部件直排編碼區
LF+90000000
LF+9FFFFFFF


CLF數學碼當中,雙部件直排編碼區。






























CLF雙部件橫排編碼區
LF+A0000000
LF+AFFFFFFF


CLF數學碼當中,雙部件橫排編碼區。






























CLF雙部件編碼區
LF+B0000000
LF+BFFFFFFF


CLF數學碼當中,雙部件除去直排及橫排的編碼區。
























CLF多部件編碼區
LF+C0000000
LF+CFFFFFFF


CLF數學碼當中,多於兩個部件(7,13,14,17,19,21,31,33...)的編碼 區。


















UTF-16編碼區
LF+D8000000
LF+DFFFFFFF


LFE碼當中為UTF-16預留的處理區域。
UTF-8 Marking(EF,BB,BF)
LF+EFBBBF00
LF+EFBBBFFF


UTF-8 Marking(EF,BB,BF)。UTF-8使用FE FF作為檔案表示記號,因 此,此編碼實際保留給UTF-8使用。
賦意域區域 LF+FC000000
LF+FCFFFFFF


賦意域標記碼。
UTF-16BE BOM
LF+FEFF0000
LF+FEFFFFFF


由於UTF-16使用FF FE序列表示BOM,因此這個編碼是保留用於辨識大尾碼與小尾碼用途。UTF-8當中,則使用FE FF作為檔案辨識標頭,因此, 這個編碼有雙重用途。
UTF-16LE BOM
LF+FFFE0000
LF+FFFEFFFF


由於UTF-16使用FF FE序列表示BOM,因此這個編碼是保留用於辨識大尾碼與小尾碼用途。
數值區 LF+FFFFFE00
LF+FFFFFEFF


數值區,表示這個LFE碼是個實際的數字。