CN101706682A - 利用字根笔画码输入汉字的方法 - Google Patents

利用字根笔画码输入汉字的方法 Download PDF

Info

Publication number
CN101706682A
CN101706682A CN200910166372A CN200910166372A CN101706682A CN 101706682 A CN101706682 A CN 101706682A CN 200910166372 A CN200910166372 A CN 200910166372A CN 200910166372 A CN200910166372 A CN 200910166372A CN 101706682 A CN101706682 A CN 101706682A
Authority
CN
China
Prior art keywords
radical
stroke
key
input
radicals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910166372A
Other languages
English (en)
Other versions
CN101706682B (zh
Inventor
杨春华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN200910166372.0A priority Critical patent/CN101706682B/zh
Publication of CN101706682A publication Critical patent/CN101706682A/zh
Application granted granted Critical
Publication of CN101706682B publication Critical patent/CN101706682B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种全新的汉字输入方法,即根据汉字的字根笔画码编码输入汉字。该方法包括如下的步骤:一种根据字根笔画码输入汉字的方法,其包括如下步骤:(1)拆分所需输入的汉字的字根;(2)从上述所拆分出来的字根中取不超过4个的字根作为选定字根;(3)确定每个选定字根的字根笔画码,其中,所述的字根笔画码是指复笔画字根的前两笔画以及单笔画字根的笔画;(4)输入每个每个选定字根的字根笔画码。本发明的方法可在电脑、手机等键盘上输入汉字,它既有笔画输入法的简单易学,又有五笔字型的打字顺手、低重码、快速高效,使“易学性”与“高效性”完美地统一,可称为“傻瓜五笔输入法”。

Description

利用字根笔画码输入汉字的方法
技术领域
本发明涉及一种利用字根笔画码输入汉字的方法。
背景技术
汉字编码的历史已有30多年,五笔字型等优秀形码解决了计算机输入的“效率”问题。但仍有许多难题未得解决,尤其是“低重码度”与“易记性”的矛盾依然突出,以及小键盘上输入效率仍非常低下(重码率太高,词组输入困难)。尽管五笔字型难学难记,却“独领风骚”20年,这除了证明它“明→日+月”等直观自然的取码方式和低重码、高速度等科学性的方面外,也反映了汉字字形编码技术的停滞不前。
汉字字形输入法主要有笔画类、字根拼形类两种。字根拼形类最有效率,其中最具代表的是五笔字型,其重码率低,速度快,不受读音限制。但它字根键位排布规律性不强,要强记200多个字根与键位的对位关系表,令许多人望而却步。由于键盘键帽上印制不下诸多字根,使用者常要查字根表,很不方便。有的字根拼形输入法,为了字根表易记,盲目地减少字根的数量,反而增加了字的拆分难度,使许多字的拆分变得“牵强”、“不直观”,得不偿失。有的重码率较低且字根表也不难记,但其拼形不自然、拆字取码不直观或因需计算等而产生较大的思维负担,也不好用。还有的采用象形法助记,把字根安排到与之形像的英文字母上输入,如用“F”输入“扌”、“0”输入“口”,但大部分字根都很牵强,也不好记。汉字与英文是两个完全不同的体系,这样不从汉字自身规律出发的硬凑是有欠科学的。
汉字最简单、最受大众认知的规律在于“横竖撇点(捺)折”5个书写笔画,它可以用12345五个数字来表示,简单而直接实现了数字化,相对于拉丁字母单词文字,这是一个巨大的优势。但许多字根拼形输入法没有利用到这一优势,使不能或不能方便地在数字小键盘上应用,那是非常遗憾的。因为我们已经或即将面临的是一个通信设备、家电设备、生产设备等智能化的时代,它们都面临着汉字输入的问题,且它们基本上只能通过键数不多小键盘输入。如果一款输入法不能数字化编码如何能适应这样的趋势?
现有的笔画类输入法可以用数字编码和输入,但仍有许多严重的缺陷:①重码字键选率高,速度慢,效率低。②编码容量低,不能输入大容量词组或不能字词混合编码。③使用不轻松。④在大键盘上一键输入双笔画中,有“跨构件取笔画”的麻烦,不直观、别扭。⑤国家语委按5个书写方向把笔画分为“横、竖、撇、点(捺)、折”5类,使笔画“最简单化”,有利于快速判断和反应。但一些笔画输入法为了降低重码,把“折”再细分成若干类,使笔画数增加到7、8、9或10个。这使“笔画”这一最基本的层面复杂化,增加了思维负担,使判断、反应速度变慢。也不利于大键盘上“一键两笔画输入”的设计,例如,当笔画个数为“7”时,大键盘上就需要安排7×7=49个键才能实现上一键输入双笔画,键数太多了。还有的对“笔画”等进行新定义,与人们对汉字的基本认知不符,不利于在中、小学生中推广学习。
其它的输入法还有拼音和音形结合两类.其中拼音要求懂得字的准确读音,且其重码率高,需反复屏上选字,感觉麻烦,影响效率,容易产生同音错别字,长期使用还容易导致“提笔忘字”.据统计,拼音输入的错字率是字形输入的9倍.现在的学生多用拼音输入,其“错字连编”和“提笔忘字”已是一个普遍的问题.音形结合输入法不仅同时有形码和音码两类的缺点,而且要思维音和形两个方面,这种“二次思维”增加了思维负担,使人感觉别扭、反应变慢.拼音和音形两类输入法编码必须依赖字母,不能“数字化”.
现行许多输入法在键盘表达上都受制于字母。电子词典、数码学习机、PDA等产品键盘上的字母基本是按QWERTY......无序排列的,因其尺寸太小,没有双手运行指法的空间,无法通过键盘指法输入,“字母→手指键盘移动”的条件反射用不上。在其上使用以字母编码的输入法,需要在无序排列的字母中“找字母”,使人感觉麻烦,容易疲劳。五笔字型的条件反射是“字根→手指键盘移动”,所以它还必须先想象字根键位图,把字根转化为字母后再找字母,这样就有“字根转化为字母”和“找字母”两个步骤,更大地影响了效率,思维负担大增,更易疲劳。使许多五笔字型用户,在“小号大键盘”上宁愿使用不熟练的拼音输入法。
于是,基于5个基本笔画进行编码,不受制于读音;拼形直观,取码轻松自然;重码字键选率低,效率高;不需要背繁杂的字根表,记忆负担小;在大键盘键帽上可以印制下所有的字根(或字根代表符)使便于查看、便于教学,更易于上手;键盘表达上不受制于字母,可以方便地在手机、机电设备等的数字小键盘上使用,在“小号大键盘”或屏幕软键盘上使用没有“字根转化为字母”和“找字母”的麻烦,可以更方便地找到键位;编码容量大,单字与词组可以混合编码输入,在数字键盘上也可以方便地输入大容量的常用词组;有如上全面性能的一种笔画输入法就成了现今社会普遍而迫切的需要。
发明内容
本发明的目的是提供一种全新的汉字输入方法,该方法采用一种字根笔画码而实现汉字输入,其可应用于计算机、通信设备、数码学习机、电子词典、PDA等掌上电子产品以及一些高级机电设备上的汉字输入。
为实现上述的发明目的,本发明提供了一种根据字根笔画码输入汉字的方法,其包括如下步骤:
(1)拆分所需输入的汉字的字根;字根可以是现有字根体系中的字根;
(2)从上述所拆分出来的字根中取不超过4个的字根作为选定字根;
(3)确定每个选定字根的字根笔画码,其中,字根笔画码是指复笔画字根的前两笔画以及单笔画字根的笔画;
(4)按选定字根的书写顺序依次输入每个选定字根的字根笔画码。
上述的方法是本发明人在对汉字的“字根”和“笔画”进行了大量的、深入的基础性统计研究,并全面深入地掌握其中的规律而得出的。
采用上述方法输入汉字时,屏幕上最终所显示的所需输入的汉字可以自动地被加入到相应文件的相应之处,也可以通过确认键或数字选择键而加入到相应文件的相应之处。
优选地,在上述方法的字根笔画码中,复笔画字根的前两笔画为“一一、一丨、一丿、一丶、一乙、丨一、丨丨、丨丿、丨丶、丨乙、丿一、丿丨、丿丿、丿丶、丿乙、丶一、丶丨、丶丿、丶丶、丶乙、乙一、乙丨、乙丿、乙丶、乙乙”,所述单笔画字根的笔画为“一、丨、丿、丶、乙”。
以下将复笔画字根的笔画码简称为复合笔画码,将单笔画字根的笔画码简称为单笔画笔画码。单笔画字根是指只有一个笔画的字根,即是
Figure G2009101663720D0000031
5个字根;其它至少有两个笔画的字根称为复笔画字根。本发明参考了《GE3001-1997信息处理用GB13000.1字符集汉字部件规范》的汉字基础部件表和新华字典部首表,综合考虑字根的组字频度、对重码率的影响度、拆分难易程度、识别反应速度等因素,优选了280多个字根建立了一个典型的具有代表性的字根体系,如图1字根表所示。实际应用时,具体字根的选择具有相当的灵活性,“口”、“日”、“木”、“土”、“十”、“氵”、“钅”、“艹”、“扌”、“勹”、“乂”、“目”、“虫”、“力”、“人”、......等基本字根是必然收入的,而如“夫”、“古”等既可以选入,也可以不选入而由更小的基本字根“二”“人”“十”“口”等拼合输入。所有字根按字根笔画码分成30个组,可以分别由30个键或30个组合键输入,其组代号(也称键代号)分别为11、12、13、14、15、21、22、23、24、25、31、32、33、34、35、41、42、43、44、45、51、52、53、54、55和61、62、63、64、65。五个单笔画字根也可以分别划归到五个不同的复笔画字根组中同键输入,此时字根组的组数变为25个。
在本发明的输入方法中,可按照下述的拆分字根原则,拆分所需输入的汉字的字根:
(A)按书写顺序取字根,先写的字根先取;所选取的字根应为字根表中有的字根。匚、囗、戊、戈、弋、
Figure G2009101663720D0000034
等字根的笔画有时不是连着一口气书写完的,而是先写其一部分笔画,然后转去写别的字根,完后再回来接着写余下部分的笔画。这类字根以其第一笔画作为排序依据。例如,<式>的字根选取顺序为:弋工(弋的第一笔“横”先写所以弋排在前面);
(B)字根总数少的拆法优先;在字根总数相同的情况下“散”的拆法比“连”优先,“连”的拆法比“交”优先;例如,<主>的字根拆为:丶王(不是“亠土”,能散不连);<矢>的字根拆为:大(不是“
Figure G2009101663720D0000035
人”,能连不交);
(C)前面的字根取大优先,即以“添加一个笔画便不能成为字根”为限,每次拆取一个笔画尽可能多的字根。
例如,<百>拆为:日,而不是“
Figure G2009101663720D0000037
白”,前面的字根取大优先;<失>的字根拆为:
Figure G2009101663720D0000038
人,而不是
Figure G2009101663720D0000039
因其字根总数太多;也不是大,字根总数同时,“散连交”相同,前面字根取大优先;但如果“夫”是字根,则应取
Figure G2009101663720D00000310
夫,能连不交。
另外,在拆分所需输入汉字的字根时,拆分字根的原则还包括兼顾直观原则,即在字根选取过程中,要考虑拆出的字根符合人们的直观判断和感觉以及汉字字根的完整性。这样,很少的个别字可能不符合取大优先原则。例如,<自>拆为:目(不是“白
Figure G2009101663720D0000042
”,其欠直观)。
本发明中,字根拆分原则与五笔字型相近,但拆分的歧义性更少。当然也可以采用与86版或98版五笔字型完全相同的拆分原则。
本发明的字根拆分原则也可处理繁体字,例如图1字根表中“車馬黽貝門糹
Figure G2009101663720D0000043
”就是专为输入繁体字而设置的繁体字根。其中
Figure G2009101663720D0000044
只用于繁体偏旁“飠”的组合.其中“車馬門貝”与相应简体字根“车马门贝”同键输入,其它繁体字根的字根笔画码为字根前两笔画.为了避免这四个字根造成的如“绿緑,键鍵,轼軾”等的繁简重码,可以设置一转换键换档输入.例如电脑大键盘上,可以设定大写字母状态时输入繁体字,小写字母状态时输入简体字.
在本发明的汉字输入方法中,如果按上述拆分原则所拆分出来的字根为4个时,则选定该4个字根作为选定字根;而当所拆分出来的字过4个时,则选定第一字根、第二字根、第三字根和最末字根作为选定字根。例如,<婉>拆字根为女,宀,夕,,其编码为乙丿,丶丶,丿乙,乙乙;<嫒>拆字根为女,爫,冖,又,其编码为乙丿,丿丶,丶乙,乙丶。
在本发明的汉字输入方法中,如果按上述拆分原则所拆分出来的字根少于4个时,例如两个或三个字根时,则在输入选定字根的笔画码之后加上一个笔画补码,该笔画补码是由所需输入汉字的末笔画和结构笔画组成;其中,末笔画是指所需输入汉字的末字根的末笔画,结构笔画是指反映所需输入汉字之结构的笔画。
作为一种具体的实施方案,上述的结构笔画中,可以用横“一”表示所需输入汉字为左右结构,用竖“丨”表示所需输入汉字为上下结构,用撇“丿”表示所需输入汉字为其它的结构,如独体、全包围、半包围、杂合等其它结构。例如,<怒>编码为乙丿(女),乙丶(又),丶乙(心),丶丨(笔画补码,末字根末笔画“丶”,结构笔画“丨”);<砼>编码为一丿(石),丿丶(人),一丨(工),一一(笔画补码,末字根末笔画“一”,结构笔画“一”);<困>其编码为丨乙(囗),一丨(木),丶丿(笔画补码,末字根末笔画为“丶”,结构笔画为“丿”)。
结构笔画是很容易理解和判断的,左右结构字是横向排列的,所以其结构笔画为“一”(横)。上下结构字是纵向排列的,所以其结构笔画为“丨”(竖),其它结构的字的排列不横也不纵,就像笔画撇的书写方向也是不横不纵一样,所以其结构笔画一律为“丿”撇。本发明创造性地提出了“结构笔画”这一概念,对提高汉字笔画分检能力有重要意义。它以简单形象的方式给汉字增添了一个“笔画”,使汉字笔画的分检功能更深入细致。
本发明的“笔画补码”与五笔字型的“末笔字型交叉识别码”有着本质的不同,本发明采用的是简单的形象思维,易于判断,反应速度快。而后者采用的是较复杂逻辑组合思维,难判断,反应速度慢,感觉别扭,是五笔字型学习的难点。手机键盘上,本发明的“笔画补码”是直接把“末笔画”和“结构笔画”两个笔画分别转化为数字分开输入,如“丶丿”用43输入,很简单,而五笔字型的识别码是转化成字母输入的,较复杂。
为了避免“巡迄遗遣迓迪遇......”、“廷延...”等包围部分为“辶、廴”的包围半包围结构字的末笔识别码都相同(都为“丶丿”)而起不到区分的作用,这类字作为笔画补码的“末笔画”不再取末字根末笔画,而是改为取被包围部分的末字根末笔画。例如:
<巡>其编码为:乙乙,丶乙,乙丿(被包围部分末字根末笔画为“乙”,结构笔画为“丿”)。
<廷>其编码为:一丨,乙丶,一丿(被包围部分末字根末笔画为“一”,结构笔画为“丿”)。
上述笔画补码的“末笔画”也可以定义为“整字的末笔画”,同时可以进一步规定包围部分为“辶、廴、匚、囗、
Figure G2009101663720D0000052
戊、戈、弋、
Figure G2009101663720D0000053
”的包围半包围结构字的“末笔画”为“被包围部分的末笔画”。与前面“末字根的末笔画”的相比,两者相差不大、效果相当,只是“末字根末笔画”表述更简单。
字根表上的字叫“字根字”,字根字可以拆分成更小的字根输入.字根字又有“成字”和“不成字”两种.成字的字根字拆分方法为:拆分后刚好四个字根的,依次取这四个字根的字根笔画码;拆分后超过四个字根的,只取第一、第二、第三和末一个字根的字根笔画码;拆分后不足四个字根的,末字根字根笔画码重复输入,直至满四码止.例如:
<鹿>拆字根为:广,
Figure G2009101663720D0000054
匕;其编码为:丶一,乙一,丨丨,丿乙。
<金>编码为:丿丶(人),一一(干),丶丿,丶丿(
Figure G2009101663720D0000055
的字根笔画码重复一次)。
<六>编码为:丶一(亠),丿丶,丿丶,丿丶(末字根“八”字根笔画码输入三次使满四码)。
字根字中不成字的偏旁部首,拆分后只有两个字根的,末字根字根笔画码重复键一次再加补一个在第四码位使用频次较小的字根笔画码“乙乙”;拆分后只有三个字根的,直接加补字根笔画码“乙乙”,使其可直接上屏;拆分后刚好四个字根的,依次取这四个字根的字根笔画码;例如:
<勹>编码为:
Figure G2009101663720D0000056
乙乙。<辶>编码为:
Figure G2009101663720D0000057
乙乙。
五个单笔画字根为其字根笔画码三次输入后加“乙乙”。例如:
<丿>编码为:乙乙。<乙>编码为:
Figure G2009101663720D0000059
乙乙。
“字根字”也可以像五笔字型那样不再拆分,先输入其字根笔画码(即前两笔画),称作“报户口”,再按其笔画书写顺序依次输入其首笔画、次笔画、末笔画,不足4码的加空格键。例如:<西>编码为:一丨(西的字根笔画码),
Figure G2009101663720D00000510
(首笔画),(次笔画),
Figure G2009101663720D00000512
(末笔画)。
“报户口”取笔画的方式更为简单,易学性好。但效率性差,因为人对细小的笔画反应较慢。而“拆分”的方式初学时相对稍难点,但学会后用起来明显更轻松、更快速,且重码也较少,是二者中的优选。无论是“拆分”还是“报户口”,都有部分常用字根字涉及重码。为了减少其重码,可以优选出其中部分常用字根字,其输入方法为其所在键连敲四次。例如可以优选出“一二土大七日口山气人儿文之已力又子乃”18个字根字按此规定方式取码输入。例如:<大>编码为:一丿,一丿,一丿,一丿(“大”的字根字根笔画码“一丿”四次重复)。这18个字根可以用一句话记住:七儿子已乃大人,文气又大力,一日,二口气之力(吹翻)土山。
词组的编码规则。如果是二字词组,每个字取其前两个字根的字根字根笔画码。例如:<统计>其编码为:乙乙(纟),丶一(亠),丶乙(讠),一丨(十)。
如果是三字词,取第一、第二个字的首个字根字根笔画码及第三个字的前两个字根字根笔画码。
例如:<国务院>其编码为:丨乙(囗),丿乙(夂),乙丨(阝),丶丶(宀)。
如果是四字或四字以上的词组,取第一、第二、第三和末一个字的首个字根字根笔画码。
例如:<进退维谷>其编码为:一一(二),乙一(艮),乙乙(纟),丿丶(八)。 
<知识产权局>其编码为:丿一(),丶乙(讠),丶一(
Figure G2009101663720D0000061
),乙一(尸)。
上述汉字编码方案中,如果:A、“字根字”按上述方法折分成更小的字根进行取码;B、“七儿子已乃文人气又大力一日二口之土山”这18个字根其编码为其字根字根笔画码的四次重复;C、包围部分为“辶、廴”的包围半包围结构的字作为补码的“末笔画”规定为“被包围部分”的末字根末笔画;同时具有上面A至C这三点,本发明则称为“优选编码方式”。采用“优选编码方式”具有更低的重码率,更高的输入效率。
本发明的方法中,根据每个字根的动态频次高低确定该字根所对应的键盘位置,使动态频次高的字根位于与高灵活手指相对应的键位。
在键盘上输入复笔画字根字根笔画码的方法。1.小键盘:首先指定小键盘上的1、2、3、4、5五个键分别表示“一”“丨”“丿”“丶”“乙”五个基本笔画,这五个基本笔画键两两组合形成25个组合键“11、12、13、14......55”分别输入25个字根字根笔画码“一一,一丨,一丿,一丶......乙乙”;2.大键盘:首先选出大键盘上的25个键分成“横、竖、撇、点、折”5个区,每个区5个键,分别用于输入5组25个字根字根笔画码“一一,一丨,一丿,一丶,一乙”、“丨一,丨丨,丨丿,丨丶,丨乙”、“丿一,丿丨,丿丿,丿丶,丿乙”、“丶一,丶丨,丶丿,丶丶,丶乙”、“乙一,乙丨,乙丿,乙丶,乙乙”;在键盘上输入单笔画字根字根笔画码的方法。1.在大键盘或小键盘上,五个单笔画字根可以由专门的键输入,所述的“键”是指大键盘上的单个键或者小键盘上由两个键形成的组合键,以下全文均同。一般地,在小键盘上可以指定另外一个键分别与五个基本笔画键两两组合输入;例如指定数字键“6”分别与1、2、3、4、5键组合形成五个组合键“61”“62”“63”“64”“65”分别输入五个单笔画字根的字根笔画码。大键盘上可以指定五区以外的五个键分别输入五个单笔画键。2.五个单笔画字根也可以分别划归到五个复笔画字根组中同键输入。一般,
Figure G2009101663720D0000063
可以与11或14字根组字根同键输入,
Figure G2009101663720D0000064
可以与21、22、23或24字根组字根同键输入,
Figure G2009101663720D0000065
可以与31或33字根组字根同键输入,
Figure G2009101663720D0000066
可以与42字根组字根同键输入,
Figure G2009101663720D0000067
可以与51或52字根组字根同键输入;本发明所述小键盘是指输入区键数在25以下的键盘,常见是10个数字键为主的数字键盘。一些机电设备有5个以上25个以下的按键,也称作小键盘。输入区键数在25以上的称作大键盘,常见的是电脑标准大键盘,而电子词典、数码学习机、PDA等掌上电子产品的键盘的输入区键数大于25,其尺寸太小无法运用电脑指法操作,也是大键盘,称其为“小号大键盘”。
具体地,例如在电脑标准键盘上,可以指定“GFDSA”“HJKLM”“TREWQ”“YUIOP”“NBVCX”为横为横、竖、撇、点、折五个区,分别输入“一一,一丨,一丿,一丶,一乙”、“丨一,丨丨,丨丿,丨丶,丨乙”、“丿一,丿丨,丿丿,丿丶,丿乙”、“丶一,丶丨,丶丿,丶丶,丶乙”、“乙一,乙丨,乙丿,乙丶,乙乙”五类复合字根笔画码,单笔画字根笔画码可以分别由“S、J、E、U、N”键输入,将上述字根笔画码印制在键盘键帽上,即形成中文输入键盘,也可以印制在键盘保护膜上,形成中文键盘保护膜,如图2所示。还可以印在贴纸上,成为中文输入键盘贴纸。单笔画字根指定五区以外的5个键独键输入的可以如图3所示。
在大键盘上,每一个键上都安排一个使用频率特别高的汉字,其输入码为所在键打一下加打空格,谓之一级简码;有600个以上汉字可以采用只输入其前两个字根字根笔画码加打空格键输入,谓之二级简码;有3000个以上汉字可以采用只输入其前三个字根字根笔画码加打空格键输入,谓之三级简码。同时,具有简码的汉字的全码输入方式仍然保留。
同样,在小键盘上,每一个键上都安排一个使用频率特别高的汉字,其输入码为所在键打一下加打空格,谓之一键简码;有25或30个字采用按两键加打空格键输入,谓之二键简码;同理,通常有120~170个三键简码、500~620个字为四键简码、超过2000个五键简码、3500个左右六键简码、4000个左右七键简码。其中二键简码、四键简码和六键简码分别相当于大键盘的一级简码、二级简码和三级简码。
与现有笔画输入法相比,本字根字根笔画码方案在以下几方面有了显著进步:①静态重码率大幅降低。按上述编码规则的“优选编码方式”对一级汉字(3755个)进行编码统计,与现有技术如申请号为00100002.0的“首部余部笔画输入法”6码方案进行比较,有了显著进步,如下表所示。(对比对象数据源于其专利申请文件)
  00100002.0(6码) 本发明方案(竖钩亅为竖)   本发明方案(亅为折)
  涉及重码字数及所占比例   2191个,58.3% 785个,20.9%   667个,17.8%
  二重码字数及所占比例   926个,24.7% 402个,10.7%   376个,10.0%
  三重码以上的字数及所占比例   1265个,33.7% 383个,10.2%   291个,7.75%
②全码和简码编码容量巨大,字词混合编码输入。“首部余部笔画输入法”6码方案编码容量为56=15625,而本方案为304=810000,是其51倍。前者因为编码容量太小,词组与单字的编码不能采用混合编码的方式,输入词组时要在前面加一个“引导键”,很不方便,使用时很容易忘记输入“引导键”而造成错误。本方案字词混合编码输入,就不存在这样的问题。同时,其有巨大的简码编码容量,二键简码编码容量为30,三键简码为30×6=180,四键简码为302=900,五键简码为302×6=5400,六键简码为303=27000,七键简码为303×6=162000,总计达19万多,比“首部余部笔画输入法”(6码)的简码编码容量5+52+53+54+55=4125大40多倍。简码编码容量对于提高效率,即降低字平均击键数、消除重码影响(即降低键选率)具有关键作用。本方案正是因为有巨大的简码编码空间,可以设置上万个一至七键简码字,可以使大多数一级字和绝大多数高频一级字可以实现一至六键无重码输入,输入效率大幅提升。具体效果统计请参考实施例1。“首部余部笔画输入法”虽然码长为6比本发明短,但有很多高频一级字输完6码后还要在屏上选字,效率反而更低。③本方案每字根只取前两笔画,不需取第3、第4等中间笔画,反应速度明显优于传统的按笔顺依次取笔画的方式。④没有“跨构件取笔画”的问题,在大键盘上双笔画输入时直观快速而不别扭。
复笔画字根字根笔画码也可以定义为“首笔和末笔”,例如字根“钅”的字根笔画码为“丿乙”,如此定义同样也具有上述四点显著进步。但其直观性比“前两笔画”差,以下均指“前两笔画”。
以上阐述的是本字根字根笔画码编码方案,以及通过小键盘和大键盘输入的方法。其虽已有了很大的进步,但仍可以进一步优化,并且正是由于有了上述良好的基础,其可以在只增加很少的记忆负担的前提下,稍作调整就可进一步使其重码率大幅降低、使输入效率进一步提高,使“低重码”与“易记性”更完美地统一。以下阐述其中复笔画字根字根笔画码为字根前两笔画的优化方案。
为了实现字根键位排布的最优设计,本发明不简单地采用传统的“反复试验法”,而是发明了“基因图谱法”。因其核心数据库“基因图谱数据库”的数据量达十几万个,每一个数据都是通过对字数为6763的一、二级国际字库(下面简称“6763字库”)的编码进行全面的修改、调整和统计而得,其工程巨繁,类似生物学基因图谱的基因测序,因而形象地比喻为“基因图谱法”。其通过专门设计的计算机程序对“基因数据库”进行分析、推演和计算,最终掌握了字根字根笔画码的内在规律,从而可使字根键位排布方案的“低重码”与“易记性”达到或接近达到最佳平衡点。用此方法,本发明分别设计出了适合小键盘或大键盘输入的达到或接近达到上述最佳平衡点的键位排布优化方案。下面是这些优化方案核心技术的归纳:
当笔画“亅”按一般习惯划归为竖时,在25字根组选出“口日虫目”,在12字根组字根“土艹木扌十”中选出至少包括“木土艹扌”之中三个字根的共三至五个字根,在44字根组中选出“氵”或“忄宀”,在31字根组中选出“钅”,在55字根组中选出“纟”或“马”(当笔画“亅”划归为折时,在25字根组选出“口日虫目”,在12字根组字根“土艹木十”中选出至少包括“木土艹”之中两个字根的共二至四个字根,在44字根组中选出“氵”或“忄宀”,在31字根组中选出“钅”,在15字根组中选出“扌”或“车”,在55字根组中选出“纟”或“马”);把选出的字根调到相容性好的字根组所在的键或“新增键”中输入,同时其调整不能违反“八点相容性规定”;其中所述的“键”可以是指大键盘上的单个键,也可以是指小键盘上由两个键形成的组合键,以下全文均同.所述的“调到相容性好的字根组所在的键”是指:(一)“口木土氵忄宀日虫艹钅十目扌车马纟”十六个字根之一可以调到14、21、22、23、24、33、42七个字根组之一,其中如果“艹”调到14字根组时,
Figure G2009101663720D0000081
必须调离14字根组;上述“口木土氵忄宀日虫艹钅十目扌车马纟”十六个字根称作“高重码字根”,14、21、22、23、24、33、42这七个字根组称作“一级接收组”。因为这七个字根组字根笔画码的频次都很低(见图30),上述高重码字根与其同键输入时只能产生很少的重码。所以把上述高重码字根之一调到这7个字根组之一中同键输入,就可以消除该高重码字根相关的重码,同时不会产生新的重码或新产生的重码数量很少。这一调整措施在本发明中称作“取密补稀”。(二)通过本发明的编码实践和统计获知,一些高重码字根与“一级接收组”之外的个别字根组之间也有很好的相容性,可以将其调到这些字根组中同键输入:其中“氵”可以调到34、51或54字根组,“忄宀”可以调到51或54字根组,“日”可以调到52字根组,“虫”可以调到34字根组、“月”调走后的35字根组或54字根组,“艹”可以调到“人”调走后的34字根组,“钅”可以调到51或54字根组,“十”可以调到15、31、32、43、45、51或55字根组,“目”可以调到15、34、41、51或52字根组,“马”可以调到34、51、54、“月”调走后的35字根组或“讠”调走后的45字根组,“扌”可以调到34、51、54字根组、“月”调走后的35字根组或“石”调走后的13字根组,“车”可以调到34、51、52、54字根组、“月”调走后的35字根组、“石”调走后的13字根组或“钅”调走后的31字根组;上述13、15、32、34、35、41、43、45、51、52、54十一个字根组称作“二级接收组”。其中的“调走”是指“月”可以调走到24、33、34、51或54字根组,“人”可以调走到24、32、33、52或55字根组,
Figure G2009101663720D0000091
可以调走到除了12、25、31、41四个字根组以外的字根组,“石”可以调走到33、34、51、53、54或“月”调走的35字根组,“讠”可以调走到34、51或54字根组;
通过把部分字根调到相容性好的字根组中输入,从而降低编码重码率,改善编码离散性的调整方法在本发明中称作“内部调整”。所述的“新增键”是指新增的一个、两个或多个键,把部分字根分别或分组安排到新增键上输入,从而消除或大幅减少这些字根相关的重码。新增键的调整方法称作“另键输入”。
所述的八点相容性规定是指:(一)高重码字根“口木土氵忄宀日虫艹钅十目扌车马纟”以及有关字根“月人
Figure G2009101663720D0000092
石”共20个字根的键位相容性规定。(1)“十”不能与“口或土”同键,可以与其它18个字根之一同键输入;(2)“宀”不能与“艹、木、口、日或氵”同键,可以与其它字根之一同键;(3)“车”不能与“石、木、土、扌、虫、口、钅、月、氵或纟”同键,可以与其它字根之一同键;(4)“石”不能与“车、木、土、扌、艹、虫、口、目、钅、月、氵、忄、马或纟”同键,可以与其它字根之一同键;(5)“人”不能与“艹、木、口或日”同键,可以与其它字根之一同键;(6)不能与“艹”同键,可以与其它字根之一同键;(7)“口木土氵忄日虫艹钅目扌马纟月”这14个字根之间,除了“马艹”、“艹目”、“日目”、“马日”、“马月”、“马忄”、“马目”、“虫日”这8对字根可以安排到同一键外,其它任两个字根都不可以安排到同一键输入;(二)上述20个字根与
Figure G2009101663720D0000094
之间的键位相容性规定:上述20个字根中,除了“宀木人十日土口”,另外的13个字根可以和
Figure G2009101663720D0000095
同键;除了“人”,其它字根可以和
Figure G2009101663720D0000096
同键,除了“十日土”,另外的字根可以和
Figure G2009101663720D0000097
同键;除了“土人口”,另外的字根可以和同键;除了“土日人口”,另外的字根可以和
Figure G2009101663720D0000099
同键。
上述的优化措施及有关相容性的规定,是对含有十多万数据量的“基因图谱数据库”分析而得,并且都经过了实际的编码实验和统计而最终证实的,其具有突出的效果。下面列举若干个例子并提供有关其效果的统计数据加以说明。统计表明笔画竖钩“亅”划归为竖或划归为折的差别并不大,因为现行应用中,普遍将竖钩定为竖,以下所述如无特别说明,均默认为竖钩为竖。
首先说明两个原始状态:以“优选编码方式”分别对3755字库和6763字库进行编码,如图31所示。当单笔画字根独自一键输入,3755字库和6763字库(“3755字库和6763字库”以下简称“两字库”)编码的重码字数分别为778个和1984个;当单笔画字根
Figure G2009101663720D00000910
Figure G2009101663720D00000911
分别划归到14、22、33、42、51字根组中同键输入,其重码字数分别为843个和2108个。这是字根未调整时的两个原始状态。下面就是字根的多个调整例子及其效果的统计数据,通过调整后重码字数下降的多少就可以说明其调整的效果。
Figure G2009101663720D0000101
Figure G2009101663720D0000102
Figure G2009101663720D0000111
上两表各举例方案都可用如图11所示数字键盘输入。其中“口23”是指把“口”调到23字根组同键输入,即在数字键盘上用“23”输入。其它的以此类推。关于电脑大键盘设计,例如第一个表的例14和例15及第二个表的例15和例21在电脑大键盘上的设计分别如图4、图5、图6、图7所示。
类如上两表的“内部调整”的还有很多种组合,只要把高重码字根按前面所述方法调到一、二级接收组,同时又不违反上述“八点相容性规定”就能使重码字数、编码离散性、编码空间的合理有效的利用、常用词组的重码数、简码字的数量及其分布的合理性、键选率等输入效率方面的性能大大提升。上面只列出了关于重码字数的效果,更详细的效果统计请参考实施例5。
下面是一例通过“另键输入”而达到的效果:
如图8所示,1、2、3、4、5两两组合输入复笔画字根字根笔画码,6分别与它们组合输入
Figure G2009101663720D0000112
口、日虫、木、土、氵、钅、目、扌、马分别由66、77、88、99、00、68、67、69、60另键输入。其两字库编码重码字数分别为222个和593个。
下面是一例“内部调整+另键输入”而达到的效果:
如图9所示,分别用61、62、63、64、65输入,日、氵、土、钅分别66、77、88、99另键输入,口、木、艹、
Figure G2009101663720D0000114
目、马、虫、扌、月
Figure G2009101663720D0000115
分别用组合键23、22、14、12、21、51、24、33、54内部调整输入,其两字库编码的重码字数分别为222个和591个.
上面两表列举的多个优化调整措施,这些措施在数字键盘上应用时,其重码字数已很低了,可获得较满意的应用效果,但在电脑大键盘上与五笔字型相比其重码字数就偏高了,因此有必要进一步调整以减少重码。编码研究表明,6763字库重码字数降到550左右时就可以达到与五笔字型(86版重码字数为531个)相当的低重码输入效果。为了使重码字数降到550左右,可以在35字根组字根“勹夕儿匕几夂九”中选出3至6个字根(当同时选有勹和匕时,“九”就不必再选);在41字根组中选出“广(或疒)”、“亠”、“广亠”或“疒亠”;在25字根组字根“田囗山由贝冂”中选出2至4个字根;在12字根组字根“古工五耳西丁寸”中选出3至5字根;在53字根组中选出“力”、“刀”或“力刀”;在34字根组中选出“人”、“乂”或“人乂”;在45字根组中选出“心”或“辶”;在52字根组中选出“子”;以上所选出的字根安排到相容性更好的字根组中同键输入;本发明称上述“勹儿匕几夕夂九广疒亠田囗山由贝冂古工五耳西丁寸力刀人乂心辶子”等为“次高重码字根”。
具体的调整方案有多种。例如,对如图6所示设计的基础上,对下面19个次高重码字根作进一步调整:勹→52,匕→23,几→24,用→24,夕→32,丁→31,古→42,广→43,田→34,囗→22,五→11,耳→13,寸→14,儿→14,子→55,西→54,力→43,乂→52,心→44。调整后排布如图12所示(图中,“叱困汁”分别表示“口匕”、“囗木”和“氵十”,印制时合成一字有助记作用,也节省空间),经此调整其6763字库重码字数由原824个下降为549个,达到了“550个”的标准。
对字根进行键位优化调整时,可以优先地调到与该字根的笔画特征相关联的字根组,也可以把两个或多个可以连成字、成词或成句的字根安排到同一个键中,以达到助记的效果。例如“日”、“虫”或“目”→21字根组(关联特征:“日虫目”的第一、第三笔画为“丨一”),又如“虫”、“门”和“五”分别→24、45、11字根组(关联特征:相当于取其首笔和末笔);又如把“口”和“匕”→23字根组(合起来成字“叱”),把“目”、“匚”和“乂”→52字根组(合起来成“眍”字)。“内部调整”时可以进行二次调整,例如“氵”→42字根组后与“门”会产生一些重码,可以再将“门”→45(45字根组与“门”相容性好),这就叫二次调整。前面所述的“艹”→14同时
Figure G2009101663720D0000121
→12,和“虫”→14同时“月”→24,实际也是二次调整。
“另键输入”具有进一步增大编码容量的作用,如图23所示,其将12个字根分三组安排在三个新增键上“另键输入”,形成28键方案,其编码容量为284=614656,比25键的254=390625大了许多。还有26键方案,如图24所示;
在小键盘上实施“内部调整+另键输入”有一种可以达到特别低重码、特别大编码容量的模式,就是“双区模式”。其是指定小键盘上1、2、3、4、5五键分别表示“一丨丿丶乙”,该区为一区,用于输入25个复笔画字根字根笔画码,“内部调整”在此区内完成;另指定7、8、9、6、0五个键分别表示“(一)、(丨)、(丿)、(丶)、(乙)”,为二区,其两两组合的组合键用于输入“另键输入”的字根。键盘设计如图10所示,实施例6就是这一模式的具体应用。
笔画是汉字最简单的信息,字根是汉字最具效率的因素,本发明编码按字根前两笔画取码就是“最简单”与“最具效率”的结合.它不仅使字根好记,同时使之具有“导向性”功能.即是键盘输入时,字根的“形”能不知不觉地把手指“牵引”到其所在的键位上.例如看到“禾毛长乍垂重缶”等字根时,手指就会自然而然地伸向撇区横键“T”,看到“纟幺巜母巛”,手指就会伸向折区折键“X”,看到“己巳彐
Figure G2009101663720D0000122
弓艮尸聿肃”,就会伸向折区横键“N”。这是因为前两笔画不同则字根的外形轮廓就不一样,所以字根的外形轮廓就直接显示了其键的位置信息。字根只有取前两笔画才具有明显的“导向性”功能,中间笔画外形不显眼、不直观所以没有这样的效果。显然字根“导向性”功能具有非常重要的意义。它使“字根→键位”的反应更自然更快速,电脑写作时不需要费力地去想某某字根在哪个键位上,大大减轻了“想打”时思维负担,大脑更轻松,从而可以把精力集中到构思上,进而提高了写作效率。初学者也不需要频繁地找字根表查键位,也没有了五笔那样的“学了不用就忘”的毛病。
字根取其前两笔画,还使字根体系成为一个开放性的系统。字根的“开放性”和上述“导向性”一样,也具有重大的意义,它使彻底解决汉字拆字难的难题成为可能。所述的字根的开放性是指一个编码方案的字根表中字根的设置、选择和数量不再受“好记”和“字根助记词好编写”的双重限制,可以根据需要自然地增加,具有大的弹性。传统字根拼形输入法拆字难的主要原因是,由于减少记忆负担和降低重码的需要,或为了便于字根助记词编写的需要,“垂禺曲聿牙肃半夹平......”等笔画交重错杂的部件没有设置为字根而须进一步拆分。有的字根由于不成字,不利于助记词的编写而被设计者弃用。许多部件因拆得过于细碎(拆成3个或3个以上的小字根)而牺牲了拆字的直观性和简易性,大大增加了拆字的难度;研究表明,在一个空间密集或笔画交重错杂的笔画团中,如果取码次数大于2次,即需细拆成3个或3个以上的小字根进行取码,人的反应就会明显迟顿,常要停下来看一看、想一想才能完成,且容易出错。另外,个别部件笔画虽简单,不难拆,但“个头”太小、太不显眼而使取码反应迟顿或容易漏取,例如“临”和“留”中的“丶”,“潦”和“墙”中的“丷”。字形输入法拆字难的问题在“想打”时显得尤其突出,写文章本来就极耗脑力,如果打字过程中还要分出很多精力来拆字,使思维断断续续,必然使人感觉难受,降低了工作效率。这在一定程度上抵消了字形输入法低重码的优势。
而本发明字根取码为其前两笔画,字根与键的对位关系不需要强记,也不需要编写字根助记词。所以可以根据需要新增“垂禺曲聿牙肃半夹平......”等字根,使字根数量达到400多个,消除其拆字难度或使其难度大幅降低,同时对大字库也有更好的适应性。字根的增加没有导致记忆负担的增加,颠覆了“字根越多越难记”的传统,也为科学合理地安排字根体系,从而为彻底解决汉字拆字难的难题提供了可能。
下面阐述其如何利用其字根“开放性”的特性,科学地为字根表扩容,从而解决汉字拆字难的难题,使“想打”更容易、更轻松、反应更快,使拆字更具规范性、更适合中小学生使用需要。其方案是把笔画密集或笔画交重错杂的难拆部件设为字根,使之不需要再拆分,把“个头”小、不显眼容易漏打的部件与其所依附的部件一起设为一个大字根,避免其漏拆漏打。具体措施可以是,在图1表基础上,增设下面135个字根:
Figure G2009101663720D0000131
耒专丰无未夫甘世丐臣束柬两兀丌夹平瓦牙屯戉夷
Figure G2009101663720D0000133
曲禺电里曳央冉串长乍垂重缶鬼禹自囟囱臾瓜爪册丹吂半
Figure G2009101663720D0000134
丫聿肃弗尹爿丑发矛予
Figure G2009101663720D0000135
Figure G2009101663720D0000136
Figure G2009101663720D0000137
Figure G2009101663720D0000138
Figure G2009101663720D0000139
Figure G2009101663720D00001310
Figure G2009101663720D00001311
这些字根的字根笔画码都为其前两笔画,新字根表如图32所示,本发明称之为“大字根方案”.图1字根系为“小字根方案”.以大字根方案进行拆字取码,6763字库中绝大部分字都很好拆了,其基本达到了最简单的“按块拆分”,直观、轻松而规范,眼睛不需要盯着密集的笔画团取码,大脑也不用费力地想象交重错杂的笔画细节,有效解决了拆字难、拆字反应慢、想打难的问题,特别是“想打”明显变得轻松顺畅了许多,大大降低了思维负担,显著提升了“想打”性能.例如:怎→乍+心,键→钅+聿+廴,潇→氵+艹+肃,属→尸+禹,锤→钅+垂,庸→广+
Figure G2009101663720D00001312
......等字的取码反应就和“李→木+子”、“明→日+月”一样那么简单快速了。如同“留”的“丶”,“潦”的“丷”,隔的
Figure G2009101663720D00001313
内的细小不显眼的部分也不需再拆,避免了漏打。
增加了上述125个字根后,使字根体系在整体上更有规律了,即6763字库汉字中,笔画交重错杂空间独立的“笔画团”基本上都成了字根,使用户对于哪些是字根哪些不是字根更易于判断了,所以不仅没有增加记忆负担,反而是减少了记忆负担。但是,其重码会不会大幅增加呢?以上字根的增设都是经过大规模统计、精巧设计而得,其重码字数比“小字根”只有小幅度的上升,影响不大。而且采用前面所述的针对高重码字根和次高重码字根的降重码调整措施后,其重码字数就可以达到更低重码的适于应用需要的水平。在电脑大键盘上甚至可以比五笔字型还低,具体请参考实施例4。
“大字根方案”字根的设置还可以更注重于汉字体系自身的科学性、规范性。例如,字根
Figure G2009101663720D0000141
为甲骨文字形,象一器物盛有玉,虽然其在6763字库中只能用于“酆”一个字,但面对更大字集,就可应用于“豐豑
Figure G2009101663720D0000142
Figure G2009101663720D0000143
”等字,可见设立该字根不仅能使“酆”的输入简单直观,而且符合汉字体系的整体需要,是科学的安排。
采用大字根方案还基本消除了歧义拆分、乱拆汉字,拆字字形信息不再损失或损失量大大减少。例如“藕→艹+耒+禺”、“魔→广+木+木+鬼”,相对比的,五笔字型是“藕→艹+三+小+丶”、“魔→广+木+木+厶”,后者的字形信息的损失量太大。其字形信息不损失或损失量小,使编码更直观,更利于提高拆字取码反应速度,也更利于编码的学习和记忆。加上它同时利用了字根和笔画两个方面的信息,所以能更有效地帮助记忆汉字的字形,克服“提笔忘字”。其笔画、汉字结构等内容与语文基础教育内容一致,因此其编码的学习和输入法的应用可以反过来辅助汉字的教学,使汉字也变得更容易学,使学生汉字基础知识扎实牢固。例如,字根“臣
Figure G2009101663720D0000144
”在12字根组,即是告诉我们这两个字根的前两笔画都为“横竖”,不是“横折”和“横点”,打字时输入“卧藏啬墙”等字时进一步得以牢记,而后用笔书写这些字的时候其笔画顺序也就不容易写错或得以纠正。它同时又是一个汉字基础知识的检询器,例如,如果我们不知道“酆”字是先写“丰”的首笔还是先写“山”的首笔,就可用两种方式试着打字,能打出字的就是正确答案。大字根方案产生了一系列的效果,使字形输入法的输入性能和汉字教学价值都获得了质的提升。
还可以在图32的基础上进一步增加“本巾中申斥丸农吏井内夬来末
Figure G2009101663720D0000145
东乐
Figure G2009101663720D0000146
”17个字根.虽然这些字根所涉及字数不多,而且既使拆分也不难,有的设为字根后还会产生较多的重码,但对于需要强调规范性和拆字简单的小学生,把它们设为字根是有必要的,重码多点也是值得的.增设这些字根后,6763字库中所有的笔画交重错杂的组字部件都成了字根,从而使哪些是字根,哪些不是字根,变得清晰可判,即交重的笔画团都是字根,都不需要拆分.本发明称之为“全字根方案”.也可以进一步采用“补码技术”实现既能使把这些部件设为字根,又能避免产生过多重码.所述的补码技术是指当一个常用部件由于直观性和易学性的需要理应不再拆分,又因编码空间的合理分配,或因加大码长的需要,又不得不拆分,有必要使该类部件变成两个码的时候,可以在编码序列中,在该整字部件的后边,紧跟上一个由该部件的特征笔形形成的附加码,即补码.补码的理论意义和重要作用,在于既保留了整字部件不被无理拆分成非规范部件,从而使本方案体系完全符合规范,又得以按照简单易行的规则,以加大码长,合理分布编码空间,使众多的整字部件在同一字根组上有良好的相容性.具体可以规定“本巾中申犭斥丸农吏礻
Figure G2009101663720D0000147
垂我牜
Figure G2009101663720D0000148
禺禹饣”等字根,在输入其字根字根笔画码后,要以该字根的末笔画作为补码再输入一次,“井内夬来末
Figure G2009101663720D0000149
东乐
Figure G2009101663720D00001410
序”等字根的补码则是该字根最后两笔画。例如:<坼>→土+斥,取码为:一丨,丿丿(斥),
Figure G2009101663720D0000151
(斥的补码),丶一(末字根末笔画+结构笔画);<侬>→亻+农,取码为:丿丨,丶乙(农),
Figure G2009101663720D0000152
(农的补码),丶一;<赉>→来+贝,取码为:一丶(来),丿丶(来的补码),丨乙,丶丨。这增加了一点记忆量,但打过一些字后很快就能记住。
可以在原有19个繁体字根的基础上再增设如下29个,使繁体专用字根达到48个,如图32所示,从而使繁体字也不难拆:
Figure G2009101663720D0000153
Figure G2009101663720D0000154
Figure G2009101663720D0000155
Figure G2009101663720D0000156
大字根方案使“字→字根”的拆字过程以最简单、最轻松的“按块拆分”方式实现,加上前面所述的字根的导向性又使“字根→键位”的击键过程更自然更快速。也就是说,打字的整个过程的反应都变得非常简单而轻松。
以上阐述了实现“低重码”与“易记性”平衡统一的优化方案,以及解决拆字难、想打难的优化方案。在电脑大键盘中,要达到最高效率,还要求打字顺手、协调、舒适,长时间操作而不易疲劳,即要符合人机工程学要求。以下阐述为达到这一更高要求的优化方案。
为此本发明对各字根在电脑大键盘上输入的动态频次进行了统计。图1字根体系字根动态频次为:5.56%,口 3.45%,3.28%,人 2.81%,亻2.44%,日 2.38%,土 2.27%,
Figure G2009101663720D0000159
2.24%,二 1.98%,
Figure G2009101663720D00001510
1.82%,
Figure G2009101663720D00001511
1.54%,木 1.45%......。图32字根体系字根动态频次为:
Figure G2009101663720D00001512
5.12%,口 3.34%,
Figure G2009101663720D00001513
2.72%,人 2.58%,亻 2.55%,日 2.23%,土 2.13%,
Figure G2009101663720D00001514
1.87%,二 1.87%,
Figure G2009101663720D00001515
1.72%,
Figure G2009101663720D00001516
1.69%,木 1.47%......。这些字根动态频次数据对字根的键位优化调整有重要意义。结合这一数据,电脑大键盘的字根排布优化调整时,可以优先把
Figure G2009101663720D00001517
口、
Figure G2009101663720D00001518
......等高频次的字根安排到由食指或中指负责的更易于击打的键位上;把难击打或易疲劳的Q、P、A、W等键位中动态频次高的字根调到更易击打的键位上,减轻其过重的负荷,使负荷分配更合理、更高效。例如,如图6的键盘排布中,可以把不灵活、力量小、易疲劳的S键的
Figure G2009101663720D00001519
调到由食指键G,再把11字根组中与
Figure G2009101663720D00001520
相容性不好的“二”和“三”分别调到V键和S键;还可以把在E键上的动态频次很高
Figure G2009101663720D00001521
调到T键,又可把较难击打的P键上动态频次较高的“讠”与易击打的N键上的“马”(“马”的动态频次较低)换位......等。调整后,重码字数可能会稍增,但舒适性、耐疲劳性的提高非常明显,其利远大于弊。例如图13、图14、图15、图16、图17是其中五款基于人机工程学的电脑大键盘25键排布优化设计例图。而实施例4是众多25键排布方案中舒适协调性特别突出的一款,具体请参考其所述。
以上阐述了本发明多层次的、逐层深入的优化方案。其笔画及笔画顺序的规定均按国家规范执行。本发明字根字根笔画码的编码方案也可以用于辞书领域的汉字检索。
采用“基因图谱”的方法进行编码研究,其实是一种“很笨”的方法,因为它要付出巨大的统计工作,本发明人就因此而患上了严重的眼疾.但它又是科学有效的,它揭示了“前三加末”这一经典选字根模式的“基因密码”,由此才可以设计出基于5个基本笔画进行编码的,拼形直观、取码自然、拆字容易、低重码、易记、舒适、顺手的字形输入法.
在五笔字型中,Z键用作学习键。但由于本发明取码较为简单,学习键的“需要度”较低。大键盘应用时可以把学习键定义为“?”键,把Z键定义为拼音输入的引导键。当使用者遇到不懂写的字时,无法用“字根字根笔画码”输入,可以先按一下Z键,再输入字的拼音即可。这样可以省去输入法转换的麻烦。
当复笔画字根的字根笔画码定义为“首末笔画”时,也可以通过其“基因图谱”统计获得其“低重码”、“易记”、“舒适顺手”等最佳平衡统一的优化方案。但由于“首末笔画”的取码直观性明显不如“前两笔画”,因此不再展开阐述。
附图说明
图1是本发明优选的字根总表之一。
图2是本发明字根字根笔画码在电脑大键盘的排列图之一。
图3是本发明字根字根笔画码在电脑大键盘的排列图之二。
图4是本发明“内部调整”电脑大键盘排布例图之一。
图5是本发明“内部调整”电脑大键盘排布例图之二。
图6是本发明“内部调整”电脑大键盘排布例图之三。
图7是本发明“内部调整”电脑大键盘排布例图之四。
图8是本发明“另键输入”数字小键盘排布例图之一。
图9是本发明“内部调整+另键输入”数字小键盘排布例图之一。
图10是本发明数字小键盘双区模式键盘设计示意图。
图11是本发明实施例1之数字小键盘设计图。
图12是本发明进一步降重码调整的电脑大键盘排布例图之一。
图13是本发明基于人机工程学的电脑大键盘25键排布优化设计例图之一。
图14是本发明基于人机工程学的电脑大键盘25键排布优化设计例图之二。
图15是本发明基于人机工程学的电脑大键盘25键排布优化设计例图之三。
图16是本发明基于人机工程学的电脑大键盘25键排布优化设计例图之四。
图17是本发明基于人机工程学的电脑大键盘25键排布优化设计例图之五。
图18是本发明实施例3之电脑大键盘设计图。
图19是本发明实施例4之电脑大键盘设计图。
图20是本发明实施例3之屏幕软键盘设计示意图。
图21是本发明实施例7之数字小键盘设计图。
图22是本发明实施例6之数字小键盘设计图。
图23是本发明实施例4之繁体键盘图。
图24是本发明基于人机工程学的电脑大键盘28键排布优化设计例图之一。
图25是本发明基于人机工程学的电脑大键盘26键排布优化设计例图之一。
图26是本发明实施例4之侧滑板全键盘手机中文键盘设计的示意图。
图27是本发明实施例5之大键盘设计示意图。
图28显示了本发明实施例5的屏幕软键盘之另一设计方式。
图29显示了本发明实施例6之手机屏幕提示。
图30是本发明字根组原始字根笔画码的频次统计图表。
图31显示了本发明优选编码方式编码示意图表。
图32是本发明优选的字根总表之二。
具体实施方式
上面已经列举了多款键盘设计的例子,下面进一步提供几款具有代表性的已在发明人计算机中生成输入法的实施例,并附有性能统计参数,以供参考。下面各实施例都是采用优选编码方式进行编码,笔画竖钩都归竖,所有统计数据都是6763字库范围内的统计结果。
实施例1
本实施例主要应用于数字键盘,其键盘设计如图11所示,其采用图1所示的字根体系,不对字根的键位进行任何的优化调整。其收录常用词组30000个,其单字重码字数为1980个,静态重码率为29.28%。
简码设置。6763字库中84.3%的字(5704个字)设了简码,共有简码10749个。其中一键简码6个:“1一2是3的4不5了6有”,二键简码30个:“11现12都13在14需15或21上22业23少24当25中31和32他33很34人35用41这42问43着44它45说51已52出53那54对55子61与62旧63我64为65以”,三键简码169个:“111环112理113无114违115云......654买655水656发”,四键简码622个,五键简码1976个,六键简码3594个,七键简码4352个。标点符号的输入方法:在12345680键上分别印有常用标点符号,其中逗号按“8”可以直接输入,“感叹号、问号、分号、顿号、冒号、双引号、句号”分别按“01、02、03、04、05、06、00”输入。
本实施例全码码长为8,单字静态重码率为29.28%,从表面看是“打一个字要按七八个键,取码次数太多,且常需屏上选字,因而效率不高”,但完成6763字库及30000词组的编码、制成软件后再试用,并非如此,其效果远远超出想象:①日常打字极少需屏上选字,单字输入时基本都可以用一至六键简码无重码输入。一级字中只有134字单字输入时是必须屏上键选的,且它们的字频都不特别高,其中有5个的字频排在700至1000之间,其余都排在1000之后。一级字中有3426个可以用一至六键简码无重码输入,其中字频排前300的全都可以用一至六键简码无重码输入,排前800的有790个、排前1000的有980个、排前2000的有1903个都可以用一至六键简码无重码输入。且其输入以“简码+词组”的高效输入方式为主,日常打字很少需要8键全码输入单字。②平均码长仅为3键/字,速度快,效率高。下面是用此已制成的软件对北京奥运闭幕式奥委会主席罗格的致辞结语的输入的过程演示,“-”表示空格键:“这(41-)是(2-)一(1-)届(51251-)真正(12256121-)的(3-)无与伦比(11613215)的(3-)奥运会(63113411),(8)现在(11251362),(8)遵照(43122553)惯例(44553261),(8)我(63-)宣布(44611325)第(3151-)29(29)届(51251-)奥林匹克(63121512)运动会(11113411)闭幕(42151225),(8)并(4313-)号召(25615325)全(341-)世界(12652534)青年(11253161)四(253535-)年(3161-)后(3361-)在(13-)伦敦(32344155)举办(44345344)的(3-)第(3151-)30(30)届(51251-)奥林匹克(63121512)运动会(11113411)上(21-)相聚(12251254-),(8)谢谢(45634563)!(01)”
全文77个字符,按了216次数字键,平均码长为2.81键/字.其是连续输入,其间无需停下来选字,8键全码输入字词可以自动上屏,主要标点符号也不需“换档”处理.如果以纯单字方式输入,需按310次数字键,平均码长为4.03键/字.考虑到平常打字词组有多有少,其平均码长为3键/字左右,即输入一个字平均只需按数字键3次.实践表明,以其“简码+词组”为主的高效输入方式可以轻松地实现每分钟20~40字的输入速度(未采用“联想输入”方式),只要平均每秒按键2次就可以达到.进一步熟练、提高按键速度,还有每分钟40~60字的前景.③上手容易,易学难忘.了解编码规则后,就可以直接上手打字,记忆负担很少.有五笔字型底子的更是可以迅速上手.④输入顺手,感觉轻松、舒适.数字化编码,不需要在数字键盘上找字母;输入连续无重码,不需要移动五向导向键在屏上找字;不需用力想字根的中间笔画,手、眼、脑都感觉轻松和舒适.⑤只需在6个键范围内取码,手指移动的距离小,平均每键的按键反应时间更短,更利于高速输入.⑥标点符号的输入简单而快速.
空格键的使用频率很高,在手机上应用时,优选地,可以把数字键7和9都定义为空格键,操作时把左右两个拇指定位到4键和6键上。两个空格键在俩拇指旁边,便于简码字快速上屏,使输入时按键速度尽可能跟得上思维的速度,更利于保持思维(取码)的连续性。
词组也不一定要输8个键,例如上面的“无与伦比”“奥运会”等分别只要输入“116132”“631134”就已经出现在第一位,按空格键即可上屏。
本实施例特别适用于手机,相对于现行手机输入法,其效果有了实质性的巨大进步。其数字键盘方案已在发明人电脑中制成软件使用中,可以提供效果演示或编码资料以证明上述统计的真实性、准确性。其也可以在大键盘上应用,其设计如图3所示。
本实施例中,如果笔画竖钩“亅”划归为“折”进行编码,其6763字库单字静态重码率更低,为26%,其它性能数据也都有小幅提升。
实施例2
本实施例是实施例1的进一步优化,即是采用了如图32所示的“大字根方案”,其它情况均与实施例1一样。其单字重码字数为1992个,静态重码率为29.45%,与实施例1相比重码增加的幅度很小,对性能基本无影响。由于其采用了“大字根方案”,使拆字容易、拆字反应快,想打更轻松,实际效率更高。
实施例3
本实施例主要应用于大键盘,其键盘设计如图18所示,其采用图1所示的字根体系。单笔画字根
Figure G2009101663720D0000181
分别与11、22、31、42、51字根组同键输入,同时把11字根组中与
Figure G2009101663720D0000182
相容性不好的“二”和“三”分别调到V键和S键。
本实施例优化调整采用纯“内部调整”方式,根据字根相容性特征及其动态频次的统计数据将部分高重码字根和次高重码字根调整到适宜的键位上,即动态频次越高就调到越易于击打的键位,使键盘字根排布实现低重码与舒适协调性更好地统一:
一、高重码字根调整:
①字根“口日虫目”:“口”的动态频次3.45%,排第二,把“口”调到K键(23字根组);“日”的动态频次2.38%,排第六,调到H键(21字根组);“虫”的动态频次很低,为0.06%,调到难击键Q,同时“月(包括
Figure G2009101663720D0000191
)用(包括
Figure G2009101663720D0000192
)”调到L键;“目”的动态频次不高不低,为0.58%,调到B键.②字根“土木扌艹十”:“土木扌艹十”的动态频次分别为2.26%、1.45%、1.16%、0.69%、0.82%,分别排第7、第12、第19、第33、第18位,把最高频的“土”留在F键不调整,而“木”调到J键,“扌”调到上行中指键E,“艹”动态频次相对“土”等较低,调到无名指键S,同时
Figure G2009101663720D0000193
调到F键,“十”调到食指键U;③“氵”动态频次较高,为1.18%,排第17位,调到食指键U,同时把“门”调到P键消除“氵”“门”之间的重码。④“钅”动态频次较低,为0.18%,排第104位,调到下行中指键C。
二、次高重码字根调整
下面选出17个次高重码字根“勹、匕、儿、几、夕、广、田、囗、耳、西、寸、古、丁、力、乂、心、子”根据动态频次数据调整到相应的键:“勹”动态频次0.28%,排第84位,调到键S;“匕”动态频次在上述13个字根中相对较高,为0.59%,排第40位,调到J键与“口”一起;“儿”动态频次较高,为0.58%,排第43位,调到S键与“艹”一起;“几”动态频次0.37%,排第66位,调到键L与“月用”一起,连成句“用几月”;“夕”动态频次较高,为0.61%,排第38位,调到食指键R;“广”动态频次为0.36%,排第68位,调到I键;“田”动态频次较低,为0.22%,排第97位,调到上行无名指键W;“囗”动态频次较高,为0.77%,排第28位,调到第二佳键K与“木”一起;“耳”动态频次0.20%,排第100位,调到D键;“西”动态频次较低,为0.20%,排第102位,调到下行中指键C;“力”动态频次较高,为0.65%,排第35位,调到上行中指键I;“乂”动态频次0.38%,排第62位,调到下行食指键B;“心”动态频次较低,为0.16%,排第114位,调到O键;“古”动态频次0.26%,排第85位,调到U键;“寸”动态频次0.59%,排第85位,调到S键;“丁”动态频次0.40%,调到T键;“子”、“了”动态频次分别为0.65%、0.04%,调到X键,避免X键的频次过低;
三、其它调整。把“匚”(动态频次0.19%)调到B键,与“目”“乂”一起,同时三个字根恰好合成一个“眍”字,同时减少小指键A的频次。
上述大部分的字根调整都有助记特征,其中:1.日马心门,四个字根都是取第一、第三笔画。2.叱、困、汁、眍,都同键连成字。3.“艹儿勹三寸”(草儿钩三寸)和“用几月”都同键连成句。其一级简码字的设置如下:Q我W人E有R的T和Y这U为I不O学P们A或S地D在F都G一H是J上K中L年X发C以V了B他N已M国。另外还可设置600多个二级简码字,4400多个三级简码字。
本例重码字数为541个,和五笔字型处同一档次。键盘键位负荷分配也较合理舒适:
实施例3键位动态负荷表(%)
Figure G2009101663720D0000201
如图18的键盘设计图中的字根笔画码和字根可以刻印在键盘键帽或键盘保护膜上形成字根字根笔画码键盘或者字根字根笔画码键盘保护膜;也可以设计成触屏软键盘,如图20所示.与电脑键盘的字母的无序排列不同,其字根笔画码是有序排列的,没有“字根转化为字母”和“找字母”的麻烦,可以更轻松、更快速地输入.同时也可以在手机等数字键盘上高效地输入,并以词组输入为主.只要用12345分别表示“一丨丿丶乙”输入各字根的字根笔画码即可.其中键位涉及调整的“口”、“日”、“氵”......等字根分别输入其所有键的字根笔画码对应的“22”、“21”、“42”.......另外单笔画字根
Figure G2009101663720D0000202
可以不按“11”、“23”、“33”、“42”、“51”输入,而改由“61”、“62”、“63”、“64”、“65”输入更顺手,重码字数还可进一步大幅降低。例如“生活”输入63114263、“艰苦卓绝”输入54142155即可无重码自动上屏,简单轻松快速。
实施例4
通过“内部调整”可以设计出多款性能出色的25键方案,本实施例是在实施例3的基础上进行了效果显著的优化,具有特别突出的舒适协调性、同时解决了拆字难的难题、利于想打而重码更低、可以高效地输入繁体字。本实施例采用图32的大字根体系,其大键盘设计如下图19所示。在实施例1的基础上,本例进一步其“扌人石田夂讠马三二寸匚乂十目夫”等字根的键位进行了调整,减少了QWPSBVC的负荷,增加了EDKO的负荷,同时把金、言分别调到与钅、讠同键,以利于繁体字输入,当用于繁体字输入时,键盘印制成如图23所示。还可以把“攵”从T调到U键与“夂”同键输入,以避免“攵”与“夂”之间的混淆出错,同时其重码也更少。
本实施例已在发明人电脑中生成输入法软件,其一级简码字的设置与实施例3相同,见实施例3。同时设置有615个二级简码字,4519个三级简码字,收录有45632个常用词组,单字重码字数仅为510个,比五笔86版还少21个,带词组统计重码率小于2%。键盘键位负荷分配更合理,舒适协调性特别突出,以下是其键位负荷分配表及其与高效性、舒适协调性突出的86版五笔字型的对比:
实施例4与86版五笔字型键位动态负荷对比表(%)
Figure G2009101663720D0000203
由上表可见,本实施例中键位动态频次超过4%的键全在易于击打的前13个键:J、F、H、G、K、D、U、R、N、T、Y、I、E。由灵活性、力量、耐疲劳性较差的无名指或小指负责的键:L、S、O、W、A、X、P、Q的动态频次均在3%以下。从字根的角度看,“
Figure G2009101663720D0000211
人亻日......”等动态频次排前30位的字根,除了排17位和19位的“宀、八”无名指输入外,其余28个字根全都由食指键和中指键输入。
由上表可以看出,五笔字型有几点不足:1、不太灵活的W键负荷达到了5.32%,明显过重,左手无名指容易疲劳,影响效率和舒适性。2、最“无能”的小指负责的Q和P键负荷也偏大。3、K键的频次偏低。因为五个手指中,中指的是最长的,在指法运行过程中是最贴合键位的,最能与其它手指配合,形成顺手的组合击键,右手中指的K键只占4.63%的负荷是偏低的。4、B键负荷偏高。B键在第三排左右手中间,击打时手指移动的距离较远,其负荷不应太高。本实施例键位击打难易程度与其负荷更成正比,键位负荷分配更合理,也就具有更完美的舒适协调性。
在电脑大键盘上与五笔字型相比,本方案在前三加末的选字根方式、键盘分区、低重码的效果、舒适顺手的手感等方面都相近。但两者字根排布完全不同,本方案不需要背繁杂的字根表,识别码容易理解,易学易上手。初学者了解编码规则后就可以看着印有字根和字根笔画码的键盘直接上手打字(不懂键盘指法也可以),渐打渐熟。从初学到高手,简单而自然,就像傻瓜相机使普通大众也能轻易学会照相一样,所以本方案又称作“傻瓜五笔输入法”。
如图26是本实施例应用于侧滑板全键盘手机的示意图。“一丨”键(F键)和“丨丨”键(J键)的设置成显眼的颜色,将两个拇指分别定位在这两个键上,撇区、横区和“乙丨、乙丿、乙丶、乙乙”上的键由F上的拇指输入,余下的键由J上的拇指输入,击完键后复位待命。它没有五笔字型的“字根转化为字母”再“找字母”的麻烦,可以大幅提高字形输入法在“小号大键盘”上的效率。与实施例3一样,本例也可以在数字小键盘上快速、轻松地、接近无重码地输入。其还可以高效地处理繁体字,图32中,[]内的就是繁体字根。对6763字库所对应的6841个繁体字进行编码统计,单字重码字数仅为524个,上述繁体大字根的设置使繁体字也很好拆分。
这是一款在学记难易度、效率速度、思维轻松度、手指舒适协调度、拆字难易度、“想打”流畅度、编码规范度、繁简字体适用度、各类尺寸键盘适用度等多方面均表现优异的实施例。它是通过大规模演算设计、多次试用调整而得。五笔字型的诸多不足之处:1、难学难记,长时间不用容易忘。2、拆字难。3、字根的键位容易健忘,“字根→键”的反应慢,“想打”思维负担过重、不顺畅。4、规范性不好,许多内容与汉字教学相抵触。5、末笔字型交叉识别码较难理解。6、个别键负荷过重,影响击键舒适度。7、数字键盘上难用。8、初学者要不断查字根表,麻烦。9、字根不能印在键盘上,不能在手机触屏软键盘上显示字根。10、字的拆分字形信息损失量太大。11、规则一致性不好,无理编码多。12、对指法的依赖过重,在小号大键盘和手机触屏键盘上应用效果差。以上五笔12点不足,在本例都得到了很好的解决,使纯形输入法不再有大的缺陷。尤其是由于字根的导向性功能及拆字的简单化,加上没有看屏选字、翻页找字等拼音输入法的通病,避免了思维中断,其“想打”的轻松度、流畅度与现有各种输入法相比有了相当大的提升。
其已在发明人电脑中装机使用,可以提供现场打字,演示性能。
本例如果采用“全字根方案”加补码技术,其重码仅530个。从而为中小学提供一款可轻松学会的,高效规范的,多场合适用的,可反辅汉字教学的纯形码。
实施例5
这是在实施例2的基础上,对11个高重氏码字根进行优化调整,目标是以尽可能少的记忆代价,取得尽可能大的性能提升,实现在数字键盘上“低重码高效快速”与“易记易学”的最佳平衡统一。其数字键盘设计如图11所示。其12个字根的调整为以取密补稀为主的“内部调整”:
1、口→23,木→22,艹→14,
Figure G2009101663720D0000221
→12,扌→33,钅→54,目→34,氵→42,十→42。
2、日→21,马→51,虫→24(笔画特征:日取第一、第三笔画,马虫取首末笔画)。在手机上应用时,可以在屏幕下方显示如下提示,方便初学者上手:
口23日21虫24目34艹14
Figure G2009101663720D0000222
木22扌33氵十42钅54马51
简码设置。6763字库中94.4%的字(6385个字)设了简码,共有简码13588个。其中一键简码6个:“1一2是3的4不5了6有”,二键简码30个:“11现12都13在14若15可21上22样23中24当25国31我32他33得34人35用41这42法43着44家45说51已52际53如54对55经61与62小63生64为65以”,三键简码176个:“111环112理113无......654买655水656发”,四键简码787个,五键简码2730个,六键简码4783个,七键简码5076个。标点符号的输入方法与实施例1相同,7键和9键也设为空格键。
与实施例1相比,增加了少许的记忆负担,即要记上述12个字根输入方法,其编码更分散更均匀,离散性大大提升,编码空间得到更合理有效的利用,各方面性能都有明显提高:①重码字数大幅下降,重码字数由1992个降为723个。常用词组的重码也大幅下降,例如“技巧,搭配”、“里面,颗”等常用字词之间就不再重码;②屏上键选率更低。其一级字中只有字频排序不高的“兆牡仕杠勺沽汞柑洱”9个字单字输入时需要屏上键选,而实施例1是55个;③简码字更多,分布更合理,效率更高。其一级字中94.8%(3561个)可以用一至六键简码无重码输入,而实施例1只有72.2%(2710个)。且其中字频排前1000的字有990个都可以用一至六键简码无重码输入。一级字中82.5%(3096个)可以用二、四、六键简码无重码输入,而实施例1的只有60%(2254个)。在简码字中,二、四、六键简码有更重要的价值,它们与完整字根对应,可以在大键盘上应用,三键简码和五键简码则不能。在数字键盘上二键简码和四键简码也比三键简码好用,六键简码比五键简码好用。本例二、四、六键简码在一级字中的覆盖范围大大增加。
本实施例平均码长比实施例1稍小,已接近数字键盘上六键处理6763字库的极限,输入轻松而快速,特别适合常发短信而追求速度者(如拇指一族等)。
本例也可以在大键盘应用,其设计如图27所示。当应用于手机屏幕软键盘输入时,软键盘也可以设计成如图28所示更整齐的排列方式,适于对电脑全健盘不熟悉者。
实施例6
本实施例是一款专为手机等的数字小键盘量身订做的编码容量特别大、重码特别少的双区模式输入法,其简单易学、输入快速高效、更适用于大字库或专业词库。其采用图32的大字根体系,键盘设计如图22所示。
在1、2、3、4、5键中分别刻印有符号“一”“丨”“丿”“丶”“乙”,分别用于输入字根字根笔画码的五个笔画,6键与1、2、3、4、5键两两组合“61”“62”“63”“64”“65”分别用于输入
Figure G2009101663720D0000231
五个单笔画字根。
其它调整:
一、以取密补稀为主的内部调整。
1、口→23,木→22,扌→33,艹→14。
2、目→21,马→51,心→44(笔画特征助记:都取第一、第三笔画)
虫→24             (取首、末笔画)
Figure G2009101663720D0000232
→12                (“雨”字的前两笔“一丨”)。
3、月用→54,“用”包括“用+
Figure G2009101663720D0000233
”,“月”包括“月+
Figure G2009101663720D0000234
二、另键输入。
1、在6、7、8、9键中刻印有“日氵土钅”,这四个字根分别用“66、77、88、99”输入。
2、在7、8、9、0、6键上刻印上符号“(一)”“(丨)”“(丿)”“(丶)”“(乙)”,它们两两组合输入“二区字根”:广西由阝贝勹厶十夕亠米田手耳又七寸匕力乂禾。即如下表所示:
  字根   字根笔画   笔画组合键   数字组合键
  西十耳   一丨   (一)(丨)   78
  七寸   一乙   (一)(乙)   76
  由贝田囗   丨乙   (丨)(乙)   86
  禾手   丿一   (丿)(一)   97
  勹夕匕   丿乙   (丿)(乙)   96
广亠 丶一 (丶)(一) 07
  厶又   乙丶   (乙)(丶)   60
  乂   丿丶   (丿)(丶)   90
  米   丶丿   (丶)(丿)   09
  阝   乙丨   (乙)(丨)   68
  力   乙丿   (乙)(丿)   69
这些字根非常好记,只要记住下面一句话即可:“广西邮购十多亩米田,手取七寸匕力乂禾”(乂读yì,“割”的意思)。一句话将16个字根连成句子,形成一个有趣的情节、一幅田间的景象,所以非常好记。
为了使初学者更易于上手,减少记忆负担,可以在屏幕上显示如下提示:
艹14木22口23雨12月用54
扌33虫24马51目21心44
广西由阝贝勹厶十夕亠米田
手耳又七寸匕力乂禾
如图29所示。有此提示,初学者了解取码规则后,就可以直接上手打字了。
本实施例方案已在发明人的电脑中制成输入法软件,用小键盘输入.其收录6763个一、二级字及4万个常用词组,其设置有10个一键简码字“1一2是3的4在5了6有7我8不9他0人”,45个二键简码:“07应09类11现12可13大14若15或21上22样23中......96多97和99钱”等,404个三键简码:“070廪071席......998铀999钩”等,1335个四键简码:“0707廪0711言0712度0713庆......9996钩9997锈”等,3896个五键简码,5403个六键简码,5345个七键简码,共16438个简码字.单字重码数仅357个,静态重码率仅为5.4%,远低于五笔.简码分布合理、高效,使所有一级字都可以无重码地输入.3755个一级国际字中3741个设置了简码.其中一键简码10个,二键简码45个,三键简码为较常用的字364个,四键简码为较常用的字1121个,五键简码2589个,六键简码3237个,七键简码2857个.3008个二级国际字中2790个设置有简码,其中一、二键简码0个,三键简码40个,四键简码214个,五键简码1307个,六键简码2083个,七键简码2488个.除“含”外,字频排序前1000位汉字都有一至六键简码,可以六键内无重码输入.其中,排前100位汉字中,有95个为一键、二键或四键简码.在字频排序前200位汉字中,绝大部分为二键或四键简码.
一级国际字中只有“柑”一个字必须屏上键选,大容量词组和大量简码字的设置使其输入的效率大为提高,日常打字主要是“无重码词组+一键或二键或四键简码字”的高效模式,可以盲打。其平均码长比实施例1稍低,输入的速度取决于使用者按键的速度。
标点符号的输入。可以在1、2、3、4、5、6、8、0键上分别刻印上最常用的标点符号“感叹号、问号、分号、顿号、逗号、双引号、冒号、句号”,分别采用“01、02、03、04、05、06、08、00”输入。
与实施例2比,本实施例有如下特点:①重码率更低,单字静态重码率仅为4.52%,不设置简码,也几乎可以实现零键选率,更利于盲打。②编码容量更巨大,可以容纳更多无重码词组,更具效率。其编码容量为45×45×45×45=4100625(410万),简码编码空间为10+45+45×10+452+452×10+453+453×10=102.5万。可以设置医药、化工等专业词组,专业词汇与普通词汇混合编码,满足专业应用需要。本实施例一键简码、二键简码、四键简码、六键简码数之和比实施例1多1162个。
本实施例二区字根中,“七由贝厶阝”五个字根虽有增加编码的离散性、降低词组的重码以及增加编码容量的作用,但对单字降重码的贡献不大。可以减去它们,二区字根精简为“广西勹十夕亠米田手耳又寸匕力乂禾”,重码字数为375个,编码容量为44×44×44×44=3748096(374.8万)。助记词是“广西勹十多亩米田,手取寸匕力乂禾”(勹读bāo,为“包”的古字),更好记。一般地,二区字根主要从次高重码字根(勹儿匕几夕夂九广疒亠田囗山由贝冂古工五耳西丁寸力刀人乂心辶子)中选出,尽可能连成句使好记,其类似设计还有多种,例如还可为:广西囗十夕亠米田,手耳又寸古勹力乂禾,重码字数为355个,编码容量为374.8万,助记词是“广西围十多亩米田,手取寸钩力乂禾”(囗读wéi,“围”的意思;勹,形似钩,可视为“钩”字的省略,“钩”义为镰刀)。
实施例7
这一款手机等数字键盘上使用的,简单易学的输入法。其键盘设计如图21所示。在1至5键中分别刻印有符号“一丨丿丶乙”,用于输入字根笔画码的五个笔画,6键与1、2、3、4、5两两组合“61”“62”“63”“64”“65”分别用于输入
Figure G2009101663720D0000251
五个单笔画字根。
一、内部调整。①钅→54,乂→52。②目→21,马→51,心→44(笔画特征助记:都取第1、第3笔画)。③月用→33,“用”包括“用+
Figure G2009101663720D0000252
”,“月”包括“月+”。
Figure G2009101663720D0000253
二、另键输入:在6、7、8、9、0键中还刻印有“口匕”“日虫”“木囗”“氵十”“
Figure G2009101663720D0000254
车”,输入时按“66”“77”“88”“99”“00”输入这几个字根。本实施例方案重码字数为565个。

Claims (15)

1.一种根据字根笔画码输入汉字的方法,其包括如下步骤:
(1)拆分所需输入的汉字的字根;
(2)从上述所拆分出来的字根中取不超过4个的字根作为选定字根;
(3)确定每个选定字根的字根笔画码,其中,所述的字根笔画码是指复笔画字根的前两笔画以及单笔画字根的笔画;
(4)按选定字根的书写顺序依次输入每个选定字根的字根笔画码。
2.如权利要求1所述的方法,其中,在步骤(2)中,当所拆分出来的字根为4个时,则选定该4个字根作为选定字根;当所拆分出来的字根超过4个时,则选定第一字根、第二字根、第三字根和最末字根作为选定字根。
3.如权利要求1所述的方法,其中,当所拆分出来的字根少于4个时,则在输入选定字根的笔画码之后加上一个笔画补码,所述的笔画补码是由所需输入汉字的末笔画和结构笔画组成;其中,所述的末笔画是指所需输入汉字的末字根的末笔画,所述的结构笔画是指反映所需输入汉字之结构的笔画。
4.如权利要求3所述的方法,其中,在所述的结构笔画中,用横“一”表示所需输入汉字为左右结构,用竖“丨”表示所需输入汉字为上下结构,用撇“丿”表示所需输入汉字为其它的结构,如独体、全包围、半包围、杂合等其它结构。
5.如权利要求1所述的方法,其中,当所需输入的汉字为成字、且所拆分出来的字根少于4个时,则最末字根的字根笔画码重复输入,直至满四码止;当所需输入的汉字为不成字的字根字,拆分后只有两个字根的,则末字根的字根笔画码重复输入一次,再追加输入一个字根笔画码“乙乙”,拆分后只有三个字根的,直接追加输入字根笔画码“乙乙”,拆分后刚好四个字根的,依次输入这四个字根的字根笔画码。
6.如权利要求3所述的方法,其中,“一二土大七日口山气人儿文之已力又子乃”18个字根字的输入方法为其所在键连敲四次。
7.如权利要求1所述的方法,其中,在所述的字根笔画码中,所述复笔画字根的前两笔画为“一一、一丨、一丿、一丶、一乙、丨一、丨丨、丨丿、丨丶、丨乙、丿一、丿丨、丿丿、丿丶、丿乙、丶一、丶丨、丶丿、丶丶、丶乙、乙一、乙丨、乙丿、乙丶、乙乙”,所述单笔画字根的笔画为“一、丨、丿、丶、乙”。
8.如权利要求1-7之一所述的方法,其中,在步骤(1)中,按照下述的拆分字根原则,拆分所需输入的汉字的字根:
(A)按书写顺序取字根,先写的字根先取;
(B)字根总数少的拆法优先;在字根总数相同的情况下“散”的拆法比“连”优先,“连”的拆法比“交”优先;
(C)前面的字根取大优先,即以“添加一个笔画便不能成为字根”为限,每次拆取一个笔画尽可能多的字根。
9.如权利要求8所述的方法,其中,所述的拆分字根原则还包括兼顾直观原则,即在字根选取过程中,要考虑拆出的字根符合人们的直观判断和感觉以及汉字字根的完整性。
10.如权利要求1-7之一所述的方法,其中,笔画“亅”按一般习惯划归为竖,在12字根组字根“土艹木扌十”中选出至少包括“木土艹扌”之中三个字根的共三至五个字根,在44字根组中选出“氵”或“忄宀”,在31字根组中选出“钅”,在55字根组中选出“纟”或“马”;把选出的字根调到相容性好的字根组所在的键或“新增键”中输入,同时其调整不能违反“八点相容性规定”;其中所述的“键”可以是指大键盘上的单个键,也可以是指小键盘上由两个键形成的组合键;
所述的“调到相容性好的字根组所在的键”是指:(一)“口木土氵忄宀日虫艹钅十目扌车马纟”十六个高重码字根之一可以调到14、21、22、23、24、33、42七个字根组之一,其中如果“艹”调到14字根组时,“
Figure F2009101663720C0000021
”必须调离14字根组;(二)一些高重码字根可以调到“一级接收组”之外的个别字根组中与这些字根组的字根同键输入:其中“氵”可以调到34、51或54字根组,“忄宀”可以调到51或54字根组,“日”可以调到52字根组,“虫”可以调到34字根组、“月”调走后的35字根组或54字根组,“艹”可以调到“人”调走后的34字根组,“钅”可以调到51或54字根组,“十”可以调到15、31、32、43、45、51或55字根组,“目”可以调到15、34、41、51或52字根组,“马”可以调到34、51、54、“月”调走后的35字根组或“讠”调走后的45字根组,“扌”可以调到34、51、54字根组、“月”调走后的35字根组或“石”调走后的13字根组,“车”可以调到34、51、52、54字根组、“月”调走后的35字根组、“石”调走后的13字根组或“钅”调走后的31字根组;其中的“调走”是指“月”可以调走到24、33、34、51或54字根组,“人”可以调走到24、32、33、52或55字根组,“”可以调走到除了12、25、31、41四个字根组以外的字根组,“石”可以调走到33、34、51、53、54或“月”调走的35字根组,“讠”可以调走到34、51或54字根组;
所述的八点相容性规定是指:(一)高重码字根“口木土氵忄宀日虫艹钅十目扌车马纟”以及有关字根“月人
Figure F2009101663720C0000031
石”共20个字根的键位相容性规定。(1)“十”不能与“口、土”同键,可以与其它18个字根之一同键输入;(2)“宀”不能与“艹、木、口、日或氵”同键,可以与其它字根之一同键;(3)“车”不能与“石、木、土、扌、虫、口、钅、月、氵或纟”同键,可以与其它字根之一同键;(4)“石”不能与“车、木、土、扌、艹、虫、口、目、钅、月、氵、忄、马或纟”同键,可以与其它字根之一同键;(5)“人”不能与“艹、木、口或日”同键,可以与其它字根之一同键;(6)“
Figure F2009101663720C0000032
”不能与“艹”同键,可以与其它字根之一同键;(7)“口木土氵忄日虫艹钅目扌马纟月”这14个字根之间,除了“马艹”、“艹目”、“日目”、“马日”、“马月”、“马忄”、“马目”、“虫日”这8对字根可以安排到同一键外,其它任两个字根都不可以安排到同一键输入;(二)上述20个字根与
Figure F2009101663720C0000033
之间的键位相容性规定:上述20个字根中,除了“宀木人十日土口”,另外的13个字根可以和
Figure F2009101663720C0000034
同键;除了“人”,其它字根可以和
Figure F2009101663720C0000035
同键,除了“十日土”,另外的字根可以和
Figure F2009101663720C0000036
同键;除了“土人口”,另外的字根可以和
Figure F2009101663720C0000037
同键;除了“土日人口”,另外的字根可以和
Figure F2009101663720C0000038
同键。
11.如权利要求1所述的方法,其中,所拆分出的字根是如下字根体系表中字根:
Figure F2009101663720C0000039
Figure F2009101663720C0000041
12.如权利要求1所述的方法,其中,所拆分出的字根是如下字根体系表中字根:
Figure F2009101663720C0000042
Figure F2009101663720C0000051
13.如权利要求1所述的方法,其中,根据每个字根的动态频次高低确定该字根所对应的键盘位置,使动态频次高的字根位于与高灵活手指相对应的键位。
14.如权利要求11或12所述的方法,其中,所述的方法是在如下设计的键盘体系中完成的:
Figure F2009101663720C0000052
15.如权利要求10所述的方法,其中,字根“口”、“日”、“虫”、“目”、“艹”、“”、“木”、“扌”、“氵十”、“钅”、“马”分别调到“23”、“21”、“24”、“34”、“14”、“12”、“22”、“33”、“42”、“54”、“51”字根组中同键输入。
CN200910166372.0A 2008-08-28 2009-08-28 利用字根笔画码输入汉字的方法 Expired - Fee Related CN101706682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910166372.0A CN101706682B (zh) 2008-08-28 2009-08-28 利用字根笔画码输入汉字的方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CN200810214093 2008-08-28
CN200810214093.2 2008-08-28
CN200910132876.0 2009-04-16
CN200910132876 2009-04-16
CN200910159656.7 2009-07-22
CN200910159656 2009-07-22
CN200910166372.0A CN101706682B (zh) 2008-08-28 2009-08-28 利用字根笔画码输入汉字的方法

Publications (2)

Publication Number Publication Date
CN101706682A true CN101706682A (zh) 2010-05-12
CN101706682B CN101706682B (zh) 2015-04-29

Family

ID=42376911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910166372.0A Expired - Fee Related CN101706682B (zh) 2008-08-28 2009-08-28 利用字根笔画码输入汉字的方法

Country Status (1)

Country Link
CN (1) CN101706682B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102830808A (zh) * 2010-07-01 2012-12-19 杨春华 利用规范部件码作补码的拼音输入法
CN104932708A (zh) * 2013-12-08 2015-09-23 杨春华 一种由汉字知识体系衍化而成的易学、高效的科学输入法
CN111797822A (zh) * 2020-07-03 2020-10-20 北京字节跳动网络技术有限公司 文字对象评价方法、装置和电子设备
CN113485563A (zh) * 2021-08-06 2021-10-08 纪德环 汉字三笔型基字根输入法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1173248C (zh) * 2000-01-27 2004-10-27 孙小军 六字元结构字根无重码输入法
CN100483308C (zh) * 2002-12-31 2009-04-29 陈劲松 小键盘分级分流字首输入方法
CN100428121C (zh) * 2006-09-30 2008-10-22 付好 五加加汉字输入法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102830808A (zh) * 2010-07-01 2012-12-19 杨春华 利用规范部件码作补码的拼音输入法
CN104932708A (zh) * 2013-12-08 2015-09-23 杨春华 一种由汉字知识体系衍化而成的易学、高效的科学输入法
CN104932708B (zh) * 2013-12-08 2019-10-18 杨春华 一种由汉字知识体系衍化而成的易学、高效的科学输入法
CN111797822A (zh) * 2020-07-03 2020-10-20 北京字节跳动网络技术有限公司 文字对象评价方法、装置和电子设备
CN111797822B (zh) * 2020-07-03 2024-01-23 北京字节跳动网络技术有限公司 文字对象评价方法、装置和电子设备
CN113485563A (zh) * 2021-08-06 2021-10-08 纪德环 汉字三笔型基字根输入法

Also Published As

Publication number Publication date
CN101706682B (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN101706682B (zh) 利用字根笔画码输入汉字的方法
CN102722257A (zh) 利用规范部件码输入汉字的方法
CN102279650A (zh) 简单规范输入法
KR101371325B1 (ko) 스마트 폰을 포함한 정보통신기기의 완성한글 생성방법 및 입력방법
CN109859565A (zh) 一种生成书法字帖的方法及装置
CN101236457B (zh) 音划中文输入法
CN102253726A (zh) 一种计算机汉字数字笔画的输入方法及键盘技术
CN102707809A (zh) 以国家规范部件为部件基础的部件码输入法
CN103744533A (zh) 三十偏旁部首字根输入法
CN101719023A (zh) 手持式汉字输入键盘及操作方法
CN105607752A (zh) 形易汉字输入法
CN101866225A (zh) 二笔输入法
CN100405264C (zh) 基于一键一字的汉字特征定位编码复合输入方法
CN106325540B (zh) 一种滇东北次方言苗文的简笔输入法及其应用
CN102043471A (zh) 二十五偏旁部首字根中华形码输入法
CN1111775C (zh) 二笔画输入法
CN101196782A (zh) 汉字输入法
CN101251773A (zh) 计算机汉字信息猎头码输入法
CN1326016C (zh) 一种基于小键盘的文字输入方法
CN104932708B (zh) 一种由汉字知识体系衍化而成的易学、高效的科学输入法
CN103207685A (zh) T形汉字码输入法
CN102681674A (zh) 笔划及区位汉字输入法
CN101256446A (zh) 两用输入汉字方法
CN107025000B (zh) 汉字拼音输入键盘、汉字拼音输入系统及汉字输入法
CN110442246A (zh) 一种汉字部件输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150429

Termination date: 20180828