金数码汉字输入法

发明人:陈钦梧

专利号:ZL 00 1 17182.8

简易编码方案

首先,将汉字的所有笔画按特征分为8类,并分别用1至8作为其代码。即用1代表“横”(一), 2代表“竖”(丨), 3代表“撇”( 丿), 4代表“点”(丶),5代表“捺”(乀),6代表“横折”(泛指所有起笔为横的“折”,如 乛、、⺄、ㄋ、乙、┐等),7代表“竖折”(泛指所有起笔为竖的“折”,如亅、乚、ㄣ、└ 等),8代表所有其它笔画(如ㄑ、ㄥ 、 等)。然后,按照汉字的笔顺次序,取每个汉字的前3笔画及末2笔画的代码,编排在一起作为该汉字的编码;当汉字的笔画数不足5时,有几笔就取几码。这样就得到一种简易编码方案。

例:【钦】字的前3笔画是“撇”( 丿)、“横”(一)、“横”(一),而末2笔画是“撇”( 丿)与“捺 ”( 乀),那么整个编码应是31135

【订】4617 【代】32184 【五】1261 【坤】12812 【七】17

高效编码方案

由于汉字同偏旁部首者相当多,上述简易编码方案,对于少数编码,其重码率仍较高。进一步的研究表明,增加少量几个高频部件,可明显降低重码率。故本方案以兼容并存的方式,将构成汉字的高频部件“氵、艹、扌、木”分别并入上述代码5、6、7、8,将构成汉字的高频部件“口”及“日、目、田”用9作为其代码。即5既代表“捺”(乀),又代表“氵”;6既代表“横折”,又代表“艹”;…。其取码规则类同上:即按照汉字的笔顺次序,取每个汉字的前3码及末2码,编排在一起作为该汉字的编码;当不足5码时,有几码就取几码。取码时,若有上述部件,则用部件代码;否则,仍用笔画代码。此方案称为“高效编码方案”。

例:【梧】字的前3笔画或部件分别为“木”代码是8,“一”代码是1,“丨”代码是2;末2笔画或部件分别为“一”代码是1,“口”代码是9,合起来是81219;也可用简易编码12361

容错码及优点

容错码: 汉字中有少数的字,对一般人来说,取其标准笔画有时会出错,则可依习惯来编码,称容错码,从而轻易找到这些字。
例:
【伦】字的标准编码:32337     容错码则为:32373

【义】标准:4350,容错:3540

优点:汉字中次常用字约3千,非常用字更多。对一般人来说,由于读不准其音,所以用拼音来查找这些字是极困难的。用上述 编码输入法却轻而易举。

例:【铎】31112 【戛】13934 【觞】36333 【趿】92165 【皲】46165

即使五笔“高手”,也常遇难字。其它输入法也存在类似问题。总之这些输入法虽重码率更低,但难记难学不易普及。而本编码输入法不但易学、易记,且易用、好用,根本不存在难字。即使作为上述其它输入法遇到难字时的补充也是极好的

词编码

本方案仍适合对GBK大字符集二万余汉字及对词组(包括词和短语)进行编码。对词组的编码仍由5码组成。其取码规则如下:

1)对2字词组,依次取首字前2笔画或高频部件代码加上后字前3笔画或高频部件代码组成;

2)对3字词组,依次取首字首笔画或高频部件代码加上后2字每字的前2笔画或高频部件代码组成;

3)对4字词组,依次取前3字的各字首笔画或高频部件代码加上末字的前2笔画或高频部件代码组成;

4)对5字以上的多字词组(包括自造词和短语),依次取前4字及末字的各字首笔画或高频部件代码组成。

由于对词组的编码其各键分布要比字均匀得多,所以编码空间有效利用率也大得多。相应的,其重码率也不会太高。

 有关参考文献

[1] 陈钦梧、郑文若、邱树业、朱诗生、陈永强:“汉字数字编码输入法研究”,《第七届联合国际计算机会议论文集》p1266~1269,ISBN 781036-435-9/TP.15

[2] 陈钦梧、邱树业:“汉字输入新技术研究,《2001国际中文电脑学术会议论文集》p271~273,ISBN 981-04-4637-3,Nov 27-29,2001 Singapore

[3] 陈钦梧:“本发明与现有技术之比较

发明专利及合作

项目名称:金数码汉字数字编码输入法
专利号00117182.8
发明人:汕头大学工学院计算机系 陈钦梧
联系方式:0754-2902773 13622584063 qwchen@stu.edu.cn
发明简介:
本发明提出一种易学、易记、易用的高效汉字数字编码输入法。即用1~8代表横、竖、撇、点、捺、横折、竖折、其它笔画,取每个汉字前三笔画和末二笔画作代码形成一种汉字的简易编码方案;此外,增加几个高频部件“氵、艹、扌、木”及“口、日、目、田”,也用5~8及9作代码,可有效降低重码率,这样就形成一种汉字的高效编码方案;并采用容错码以利于有不规范笔画习惯的人群;还定义了词编码,更提高输入速度。
本项目所提的汉字输入法,具有规则简单、歧义少、反应快,所以使用相当方便有效的特点。参加测试者反映效果良好、是目前最优秀的大众化汉字输入方法。
投资效益分析:
本发明成果不但在移动电话、掌上电脑等仅有10个数字小键盘的手持设备上具有空前的应用前景,更可在上亿部电脑上广泛应用,其市场规模是巨大的,社会效益也是明显的

合作方式欢迎合作开发或专利技术转让,费用面议。