CN102707809A - 以国家规范部件为部件基础的部件码输入法 - Google Patents
以国家规范部件为部件基础的部件码输入法 Download PDFInfo
- Publication number
- CN102707809A CN102707809A CN2011100910569A CN201110091056A CN102707809A CN 102707809 A CN102707809 A CN 102707809A CN 2011100910569 A CN2011100910569 A CN 2011100910569A CN 201110091056 A CN201110091056 A CN 201110091056A CN 102707809 A CN102707809 A CN 102707809A
- Authority
- CN
- China
- Prior art keywords
- code
- parts
- component
- input
- stroke
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种符合国家规范的汉字输入方法,即根据汉字的部件码编码输入汉字。该方法包括如下的步骤:(1)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取1个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;(2)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入每个选定部件码;本发明的方法可在电脑、手机等键盘上输入汉字,其以国家制定的《现代常用字部件及部件名称规范》为部件基础,以笔画、笔顺、汉字结构等基础汉字知识为知识基础,既有笔画输入法的简单易学,又有五笔字型的打字顺手、低重码、快速高效,而且具有高度的科学性和规范性,可以反辅汉字教学,帮助识字记字,预防提笔忘字,是“规范性”、“易学性”、“高效性”、“舒适性”完美统一的输入法。
Description
技术领域
本发明涉及一种以国家颁布的规范部件体系为部件基础的,利用规范部件码输入汉字的,且适用于汉字基础教学、民族地区汉语教学及及对外教学的汉字输入方法。
背景技术
为了推动汉字教育、辞书编纂、汉字信息处理等方面语言文字的规范化、标准化。为了汉字文化的健康传承,提高汉字教育质量,克服乱拆乱讲汉字的现象,促进中小学信息教育与汉字教学的一致性。国家于2009年7月正式颁布了《现代常用字部件及部件名称规范》,该规范给出了《现代常用字部件表》(简称《部件表》)。但是至今没有一款以该《部件表》作为部件基础的科学规范、易学好用的字形输入法,导致了中小学生汉字信息处理应用中,以及汉语对外教学中,学生没有一款好的形码可用,导致一边倒地使用拼音输入,绝大多数学生不能熟用哪怕一门的拼形输入法。
一、音形严重失衡,其后果日渐严重:
(一)一款科学规范、易学好用的字形输入法,当然应该是以汉字字形基础知识为其知识基础的输入法。它的缺失,对汉字教学产生了诸多不利的影响:
1、学生学习笔画、笔形、笔顺、汉字结构、汉字书写规范、独体字规范等字形基础知识后,学而无用武之地,或不能及时而充分地得到应用,导致学习热情不高,动力不足,错误得不到有效纠正,问题一箩筐。例如许多学生笔画知识掌握得不好,写字存在大量笔形、笔顺错误,倒插笔严重,错字连篇。
2、现在的学生纸上写字越来越少,聊天或写点什么基本都用电脑拼音输入,慢慢地对汉字的印象越来越模糊,记不住字形,提笔忘字普遍,执笔写字时感觉别扭不堪。有的学生离开了电脑就写不了一段像样的文章。国人汉字应用水平降到了历史的冰点,汉字文化正以惊人的速度退化。这一代已至如此,下一代又当如何?汉字文化的传承令人担忧。不少教育专家发出了“拯救汉字”的呼声。
老师虽深知问题严重,却无能为力。毕竟,学生字形方面问题琐碎、各不相同又隐藏不露,老师没有精力也不可能逐个学生逐个字地纠正。一些普遍性问题即使课堂上说了,学生大多也印象不深,记不住,错误依旧。
(二)只掌握拼音输入法不利于汉字输入技能的全面发展,除了上述的汉字印象模糊、提笔忘字等问题外,拼音输入法还有如下一些固有的缺陷:
1、不懂读或读不准的字无法输入或输入困难,方言地区或地方音重的地区较难掌握,输入单字或输入单个不常用的词组时受重码影响而效率不高。一些工作岗位常需要输入 人名、地址等等,就要求能快速地输入单字,这些场合拼音输入法就难以胜任。不能盲打,对稿打字困难,不适于文秘、文员使用。电脑写作也常需要修改其中打错或用得不当的单字、单个的次常用词组,表格处理时也常常只能打单字或单个词组而不能通过上下文来智能处理,这时拼音输入法的效率都不高,不仅用时较多,还容易因翻找一个字而中断思维、影响思路。
2、不论拼音输入智能度有多高也是达不到精确盲打的,眼睛总是要盯着候选框,怕出错,不自由。其键位负荷不能根据手指灵活性、耐疲劳性来分配负荷,位置好的U、V等键用得少,位置不太好的A、Z、Q、P等键却更常用,导致舒适性、协调性达不到最佳。上述两点的限制使拼音输入无法达到精确、自由、舒适的最高境界。
3、容易产生错别字,需要更仔细的校对。五笔字型等形码是精确输入,眼睛不需要盯着候选框选字,可以更专心看着录入点的字词一个一个地上屏,录入与校对同步,所以不容易出错。而拼音输入本来就缺少精确性,还常是一小段话或一个整句地输入,打得快时很容易出纰漏,总让人感觉不那么的放心。许多字词电脑智能也很难猜准,错时不易看出,例如:“房价上涨受那(哪)些因素影响”,“这个问题有(由)他(她)解决”,“在此(再次)郑重声明”......等等。据统计,拼音输入的错字率是字形的9倍,导致报刊、网络、传媒错别字激增泛滥,与过去相比可谓惨不忍睹。更糟糕的是,许多人明知打了错别字却懒得修改(因为拼音修改麻烦),养成了不严谨的作风和习惯,并相互传染漫延。过去写错用错一个字会觉得羞愧,如今却理所当然。
4、拼音输入法凭借自动记忆、智能猜词、网络共享等技术提高了输入效率,但这也是一把双刃剑,它同时又把用户错误的不规范的用语习惯记忆下来,并因词库共享或多人共用一台电脑而相互传染,从而将原本纯净(或许已不纯净)的语言变得更不纯净,更不规范。久而久之,对与错的界限越来越模糊,逐渐侵蚀汉语的质量。
汉字输入作为一项基本技能,无论是会读不会写的字,还是会写不会读的字都应该能够顺畅快速地输入。就这点而言,单一的拼音输入法或拼形输入法都是不能胜任的。拼音和拼形就像人的两条腿,互相支持,缺一不可。在校掌握的汉字输入技能只是上网聊天好用是不够的,必须能适应各种场合、各种职业的需要,为将来走出校门作准备。相对于字形输入,拼音输入法更加欠缺普适性,许多职业、岗位都难言胜任。如果学校只训练掌握拼音输入法,而漠视字形输入的训练,那么该项技能的培训可以说是不合格的。
二、国家教育部门并非不知音形失衡的严峻现状及其后果,早已意识到不能让学生们只会熟用拼音输入汉字,需要一款科学规范、易学好用的字形输入法在学校、社会中推广应用。这也是汉字教学的需要,还是国际汉语推广战略的需要。但无奈包括应用最广泛的五笔字型在内的各种字形输入法在科学性、规范性、易学性、易用性、效率性(重码度)、大小键盘的通用性、各阶层各职业的普适性等这些重要性能要求之间的矛盾仍然突出,尤其是普遍有着重大的科学性和规范性的问题:
首先是部件体系普遍不科学、不规范。《部件表》有部件514个,加上其它常见的一些成字规范部件,可选用的规范部件约700至800个。而五笔字型的字根只有200个左 右,而且其中很多是不规范的,是为了降低重码而人为“创造”的。部件的不规范和规范部件的严重缺失导致了一系列严重后果:1、乱拆汉字,对汉字破坏性的肢解和割裂,与汉语教学冲突。五笔字型也因此而得不到教育界支持其进入中小学计算机教学。2、汉字拆分困难,许多字的拆分牵强、矛盾、不直观,产生了大量的难拆难打的字。字拆得过于破碎,常需要想象字的笔画细节,使思维负担过重,影响心情和效率,尤其是对最常用的“想打”影响甚大。3、编码的信息损耗率大,不利于编码的记忆,也不利于识字记字。《部件表》是反映汉字的造字字理的,适合汉字的基础教育。但由于汉字造字之初并没有考虑到还需要键盘编码,因此键盘编码方案执行国家规范部件体系的难度自然是巨大的。其难度比执行《信息处理用GB13000.1字符集汉字部件规范》(简称《信息规范》)还要大很多。即使是后者,目前市场上也无一款字形输入法能够执行的。现在汉字编码界普遍存在这样的偏见,认为采用国家规范部件体系进行编码的易学、高效的方案永远也不可能产生。执行该部件规范的编码方案必然是难学、难记的,或是高重码、低效率的。有的甚至质问国家语委,那么多部件在键盘上如何科学合理地定位?一般人怎么可能记得住?那么多大部件的设置,怎么可能实现低重码、高效率?
其次,与汉字基础教学的知识体系协调性、一致性不好。许多字形输入法不能体现和反映汉字教学的基础知识,不能反辅汉字教学,甚至与之冲突矛盾。
再次,部件键盘排布方案普遍不科学、规律性不强、记忆负担过重。例如五笔字型的字根表就超难记,还易忘,令人望而却步。其键盘键帽上印制不下诸多字根,使用者常要查字根表,很不方便。还有的部件拼形类输入法把部件安排到与之形像的英文字母上,如用“F”输入“扌”、“O”输入“口”,但大部分部件都很牵强,也不好记。汉字与英文是两个完全不同的体系,这样不从汉字自身规律出发的硬凑是有欠科学的。
本发明人于2009年8月28日提出的申请号为200910166372.0专利申请,虽然其在易学性、好用性等方面取得了很大进步,但为了实现低重码率,其部件体系中还是包含了许多不规范的字根,例如有“ 等68个不规范的字根,而且《部件表》中还有大量基础部件没有录入,例如“卬办 曳 百击具卡卤卯么刃失术太头戌丫正直朱凹 卑本必乒乓丙秉不 叉产辰丞承尺斥赤出朿匆囱歹单 弟 刁鼎东兜斗豆凡飞非风弗甫 高革鬲个谷骨夬龟果亥黑后互户奂黄 兼 角疌巾今堇京久巨开来老乐吏丽隶 卵仑免民末母 内年鸟牛 农皮 妻欠 求去犭壬肉伞色勺少舌申身升生饣矢豕史示礻事氏首殳书鼠甩 司丝糸肃天凸乇丸万亡卫为我乌午勿 下向象血穴熏 亚 严 羊 夭页衣衤夷义亦 庸永尤酉鱼于禺禹与玉云丈兆争至 中舟州竹主 隹豖”等220个规范都没有录入,可见其仍然有突出的规范性的问题,仍不太适用于汉字教学。
一款具有高度科学性、规范性的,且适用于基础教学的字形输入法应该是(按重要性从大到小排列):
1、以《部件表》的基础部件作为其编码的部件基础。为了处理非常用字,可以在《信息规范》选取适当基础部件做为补充,还可适当补充一些规范的合成部件。其补充的部件可以因所应用的字集范围大小而不同,但字集范围所对应的基础部件不能随意删减,不规范的“部件”也不能任意添加,不应该自主创造一些不规范“字根”作为部件。
2、采用笔画、笔形、笔顺、汉字书写规范、汉字结构、独体字规范等汉字基础教学中最基本的字形知识作为其编码的知识基础。这一点有重大的意义,它使汉字的编码方案不仅仅是为了满足信息处理应用的需要,也能反辅汉字教学,帮助掌握和普及科学的汉字知识,帮助识字记字、减少别字错字,帮助掌握正确的汉字书写方法,增强全社会的语言文字应用的规范意识。还能帮助汉字教育手段的更新和科学化、利用信息技术促进语文教学、提高教学效率,使中小学信息教育与汉语汉字教学保持一致,使悠久灿烂的汉字文化在信息时代能够健康地传承。
3、易学性。不需要背繁杂的字根表,记忆负担小。可以短时间内学会基本的规则、并顺利地进入到打字练习的状态。从入门到精通没有明显的门槛,可以循序渐进地学习提高。
4、好用,打字轻松、快速而高效。拆字容易、取码自然直观、思维负担小。重码率低,特别是常用的字词重码要少,打字精确快速,很少需要用数字键选。编码容量大,可以方便地输入较大容量的常用词组。
5、建立汉语字形的键盘符号系统。英语是由26个拉丁字母构成的,这26个字母就是英语的键盘符号系统。科学的字形输入法也应当有反应汉字字形规律的键盘符号系统,该键盘符号必须能够编码表达所有的规范部件,并且该键盘符号在键盘上以双手运行键盘指法的舒适击键范围内有规律地排布。其只与汉字自身的规律相关,不以英文字母为参考背景,与英文字母在键盘上哪个位置没有任何关系。从实用性的要求出发,该键盘符号系统必须能够在计算机标准键盘的键帽上清晰地刻印容纳得下,便于学习者查看,方便教学和打字操作。所以每个键上的中文符号数量不能太多,不能刻印得密密麻麻的。
6、计算机键盘各键位的负荷分配科学合理。必须根据各手指灵活性、耐疲劳性来分配各键击键负荷,使手感舒适协调、耐疲劳。
7、键盘输入普适性。容易实现数字化编码,既能在标准计算机键盘上使用,也能在数字键盘上直接用数字高效地输入。我们已经或即将面临的是一个通信设备、家电设备、生产设备等智能化的时代,它们都面临着汉字输入的问题,且基本上只能通过键数较少的数字键盘输入。如果一款输入法不能数字化编码如何能适应这样的趋势?
8、社会普适性。通用于全社会,从初学识字起,到走出校门进入各行各业(无论从事何种职业),一辈子都适用。适用于各种场合、各种方言地域。能满足职业录入员高速盲打的要求,应用于大字库时还能满足古籍研究人员输入古字的需要。
9、与拼音编码具有较好的相容性。与拼音混合编码时,音形编码相互干扰较少,想打拼音就打拼音,想打字形就打字形,无需转换键。
10、可应用于汉字排序检索,如字典查字。
显然达到上述10点要求的具有高度科学性的字形输入法早已成了现今社会(尤其是教育界)普遍而迫切的需要。
发明内容
本发明的目的是提供一种以《部件表》部件体系为部件基础的具有高度科学性、规范性的,且可适用于中小学语文教学、民族地区汉语教学及对外汉语教学的易学好用的汉字输入方法,该方法采用一种部件码而实现汉字输入,其可应用于计算机、通信设备、数码学习机、电子词典、PDA等掌上电子产品以及一些高级机电设备上的汉字输入。
为实现上述的发明目的,本发明提供了一种根据规范部件码输入汉字的方法,其包括如下步骤:
(1)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取1个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;
(2)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入每个选定部件码;
上述的方法是本发明人在申请号为200910166372.0专利申请的基础上,再深入研究了汉字的字源、字理等知识,特别是深入研究国家颁布的适用于中小学语文教学、民族地区汉语教学及对外汉语教学的《部件表》,对其进行了大量的、深入的、细致的基础性统计研究,并全面深入地掌握其中的规律而得出的。
采用上述方法输入汉字时,屏幕上最终所显示的所需输入的汉字可以自动地被加入到相应文件的相应之处,也可以通过确认键或数字选择键而加入到相应文件的相应之处。
本方案执行了国家颁布的笔画、笔顺规范、独体字规范、书写规范等,特别是执行了《部件表》的规范性要求,以其所颁布的514个基础部件为部件基础进行编码。
由于《部件表》只是对3500个现代常用汉字进行部件拆分而得出的部件体系,且其中一些因书写部位不同笔形发生变异的部件没有设立(例如“ ”归入“手”而未在该部件体系中设立,同样还有“ ……”等),所以该部件体系应用于信息处理时,需要补回“ ”等因书写部位不同笔形发生变异的未设立的部件,同时针对非常用字编码的需要在《信息规范》中选取适当部件进行补充。另外,为了进一步提高相关字词的输入效率,简化拆字,降低编码的信息损耗率,更好体现汉字的字理结构,本方案部件体系在《部件表》514个基础部件的基础上作了如下几点不违反规范性的有益的补充:
1、因笔形变异而未在《部件表》中设立的15个部件从《信息规范》或《基础教学用现代汉语常用字部件》中选录补回: 孑 毋。2、因处理3500常用字之外的非常用字需要从《信息规范》中选录补充13个部件: 屮巜乜卝。3、部件字的分区取码时分区的字形参照需要而从《信息规范》中选录补充 的31个部件: 这些部件虽不直接在字拆成部件的过程中拆出,但在复码部件的分区取码时可作为分区的参考依据。4、从《基础教学用现代汉语常用字部件》中再引入32个部件:尔共囊行北鼻比兵齿典阜骨鼓麻麦黾齐青黍香兴疋 邑音舆羽支周走足 。这其中有许多是《新华字典》的部首,其作为编码部件更能体现汉字的字理结构。这样补充后《新华字典》中所有部首都已收入作为部件使用。5、为了提高部分字的编码效果增加了“冏吂刅 余章祭关并並早令”13个成字的规范部件。上述“囬吂刅冏 ”在计算机中的区位码分别是56EC、5402、5205、518F、E832、E83B。6、当处理繁体字时,从《信息规范》选录补充的43个繁体部件
补充了如上147个部件后,其部件总数为514+147=661个。这些部件分成两大类:单笔部件和复笔部件。单笔部件是只有一个笔画构成的部件,即是一(横)、丨(竖)、丿(撇)、丶(点)、乙乛 乚 5组10个部件;其余部件至少有两个笔画构成,称为复笔部件。
上述的部件码是指25个双笔画“一一、一丨、一丿、一丶、一乙、丨一、丨丨、丨丿、丨丶、丨乙、丿一、丿丨、丿丿、丿丶、丿乙、丶一、丶丨、丶丿、丶丶、丶乙、乙一、乙丨、乙丿、乙丶或乙乙”和5个单笔画 或 它是印在键盘上的编码符号,用于部件的编码表达和键盘输入。相关的笔画分类按国家规定,即提归横类,捺归点类,竖钩归竖类,除竖钩外的其它弯曲或带钩的笔画都为折类。将这30个部件码印在计算机键盘上,可以得到如图1所示的中文键盘。这是本方案的原始键盘排布方案,该键盘分横、竖、撇、点、折5个区,其中GFDSA为横区、HJKLM为竖区、TREWQ为撇区、YUIOP为点区、NBVCX为折区;5组双笔画的分布规律都是从键盘中间向两边散开。在数字键盘上分别用1、2、3、4、5代表五个笔画一丨丿丶乙进行输入,例如部件码“丿一”用31输入。而单笔画部件码 分别用61、62、63、64、65输入。
部件和部件码的对应关系、部件的编码表达和键盘输入:
一、有的部件只对应一个部件码,即由一个部件码进行编码表达和输入的部件称为单码部件。单码部件分两类,一类是单笔部件“一”“丨”“丿”“丶”“乙乛 乚 ”,其部件码分别是 分别由G、J、T、U、N输入。另一类是复笔部件,其部件码是部件的前两笔画的组合。例如“土士 才工 廿世束更臣柬两南雨丐長巿……”等单码部件的部件码就是部件的前两笔画组合“一丨”,在中文键盘中用F输入,数字键盘上用12输入;其它单码部件的部件码也都是其前两笔画,如“禾”的部件码为“丿一”,“亻”的部件码为“丿丨”,“彳”的部件码为“丿丿”,“八”的部件码为“丿丶”......以此类推。见如下表(1):
表(1)单码部件表
单码部件表说明:1.括号里的是繁体部件。2.组代号中数字“11、12、13......65”等也是其数字输入的代码。
二、有的部件则对应2至4个部件码,即由2至4个部件码进行编码表达和输入。这样的部件称为复码部件。复码部件取码方法一般是以笔画更少的单码部件的“形”作为划分标准,把该部件划分成至少2个取码区,每个取码区提取1个部件码,如果取码区数不超过4,依次在每个区提取部件码组成编码;如果区数超过4,则在前三个和最后一个区提取部件码组成编码。例如复码部件“户”以笔画更少的单码部件“丶”和“尸”的形作为参考,划分为 ”两个取码区,分别取部件码 和“乙一”,组合而成的复码“ 乙一”来编码表达和输入,在中文键盘上用两个键UN输入,在数字键盘上用6451输入。
其要遵守以下的分区原则:
1、要符合国家笔画、笔顺规范;例如“为→ 乙丿, →UVU”这样的分区是错误的,不合笔顺,第二区不能为“力”,因为第二、第三笔画是先撇后折而不是像力字那样的先折后撇;正确的分区是“为→ →UTNU”。
另外,部件的分区原则还包括兼顾直观、综合考虑的原则,即在部件分区取码的过程中,要考虑分成的取码区要符合人们的直观判断和感觉或构字理据。这样,很少的个别部件的分区可能不符合笔画顺序。例如:秉→ 丿一+乙一,虽然不完全符合笔画顺序,但是符合构字理据(秉,从又,从禾,表示以手持禾),也符合人们的直观判断和感觉,还符合取码区总数尽可能少的原则,利于提高分区取码的效率,这是综合考虑而得出的科学合理的分区方式。
“承东非甫黑 久乐鬲 民年皮犭身我熏羊于鱼禺禹舟 牜 余祭”等部件及繁体部件“冎亞爲 飛 昜長齊 ”共40个部件为了避免重要字词的重码而需要分区取码。为了避免分区过于细碎而影响取码思维的速度,及减少编码损耗率,优选地,它们不以单码部件的“形”作分区参照,而根据其自身笔形特征按尽可能简单、直观、利于大脑快速反应的方式进行分区取码。例如:熏→ →丿一,丶丶→T0;我→ 丿一, TU。其它38个部件的优选分区方式见下面复码部件表的“原始键盘排布方案”列。当上述40个部件采用了这一优选的分区方式来取码的部件分区方式,我们称作“优化分区方式”。
总共272个复码部件的优化分区方式及其部件码编码表达和键盘输入方法见如下表中的“原始键盘排布方案”部分。
表(2)复码部件表(说明:部件分区中,如果区数超过4区的只显示前3区和末区)
关于汉字拆分成部件。在五笔字型中汉字拆分是十分令人头痛的,而本方案由于部件与部件之间的笔画是没有交重的,所以拆字基本都是按“块”拆分,简单而少歧义。汉字拆分成部件后,部件的次序是以部件的首笔画的次序作为排序标准的。如“式”字拆分成部件“弋”“工”,因为弋的首笔画先写,所以“式”字部件的次序是“弋工”。
在本发明中,本身是成字且又是部件的汉字叫做部件字,例如“王干专三韦百卑本...”等。部件字又分单码部件字和复码部件字两种,例如“王干专三韦...”等为单码部件字,“百卑本...”等为复码部件字;不成字且本身是部件的汉字叫做非成字部件,如“扌、艹、氵、勹......”等;其它不作为部件的一般汉字叫做普通字。
在本发明的汉字输入方法中,如果所需输入的汉字是普通字,且当拆分出的部件转化为部件码后,部件码的个数正好为4个时,选定该4个部件码作为选定部件码;而当部件码的个数超过4个时,则选定第一部件码、第二部件码、第三部件码和最末部件码作为选定部件码;例如,<婉>部件拆为“女+宀+夕+ ”,都是单码部件,部件码个数之和为4,编码为“乙丿+丶丶+丿乙+乙乙”;<嫒>部件拆为“女+ +冖+ +又”,都是单码部件,部件码个数为5,选第一、第二、第三部件码和最末部件码作为选定部件码组成编码“乙丿+丿丶+丶乙+乙丶”。<解>部件拆为“角+刀+牛”,角为复码“丿乙,丿乙”,刀为单码部件,牛为复码“ 一一”,部件码总数为5,选第一、第二、第三和最末部件码组成编码为“(丿乙,丿乙)+乙丿+一一”。
在本发明的汉字输入方法中,如果所需输入的汉字是普通字,且拆分出的部件转化为部件码后,部件码的个数少于4个时,例如2个或3个时,则选定所有部件码作为选定部件码,输入所有部件码之后加上一个增补部件码(简称“补码”)。所述的增补部件码是由所需输入汉字的末笔画和结构笔画组成;其中,末笔画是指所需输入汉字的末部件的末笔画,结构笔画是指反映所需输入汉字之结构的笔画。
作为一种具体的实施方案,上述的结构笔画中,可以用横“一”表示所需输入汉字为左右结构,用竖“丨”表示所需输入汉字为上下结构,用撇“丿”表示所需输入汉字为其它 非左右非上下的杂合结构,如独体、全包围、半包围等结构。例如,<怒>编码为:乙丿(女)+乙丶(又)+丶乙(心)+丶丨(补码,末部件末笔画“丶”,结构笔画“丨”);<砼>编码为:一丿(石)+丿丶(人)+一丨(工)+一一(补码,末部件末笔画“一”,结构笔画“一”);<困>其编码为:丨乙(口)+一丨(木)+丶丿(补码,末部件末笔画为“丶”,结构笔画为“丿”)。
结构笔画是很容易理解和判断的,左右结构字是横向排列的,所以其结构笔画为“一”(横)。上下结构字是纵向排列的,所以其结构笔画为“丨”(竖),其它结构的字的排列不横也不纵,就像笔画撇的书写方向也是不横不纵一样,所以其结构笔画一律为“丿”撇。本发明创造性地提出了“结构笔画”这一概念,对提高汉字笔画分检能力有重要意义。它以简单形象的方式给汉字增添了一个“笔画”,使汉字笔画的分检功能更深入细致。
优选地,为了避免“连迓巡迄迓迪遇......”、“廷延...”等包围部分为“辶、廴”的半包围结构字的增补部件码都相同(都为“丶丿”)而起不到区分的作用造成重码,这类字作为补码的“末笔画”不再取末部件末笔画,而是改为取被包围部分的末部件末笔画。例如:<巡>其编码为:乙乙+丶乙+乙丿(被包围部分末部件末笔画为“乙”,结构笔画为“丿”)。<廷>其编码为:( 一丨)+乙丶+一丿(被包围部分末部件末笔画为“一”,结构笔画为“丿”)。
在本发明的汉字输入方法中,如果所需输入的汉字是部件字,当该字按上述分区原则所划分成的取码区数为4个,依次在这4个取码区提取部件码作为选定部件码;当该字划分成的取码区数超过4个,则在前三个和最后一个取码区提取部件码作为选定部件码;当该字划分成的取码区数为2个或3个,则所有取码区提取的部件码都为选定部件码,如果该字为单码部件字,输入每个选定部件码后末区部件码重复输入直到满4码止,如果该部件字为复码部件字,输入每个选定部件码后再加上一个增补部件码;所述的增补部件码是由所需输入部件字的末笔画和结构笔画组成;其中,末笔画是指所需输入部件字的末取码区的末笔画,结构笔画是指反映所需输入部件字之结构的笔画。
作为一种具体的实施方案,上述的结构笔画中,可以用横“一”表示所需输入部件字为左右结构,用竖“丨”表示所需输入部件字为上下结构,用撇“丿”表示所需输入部件字为其它非左右非上下的杂合结构,如独体、全包围、半包围等结构。部件字的增补部件码也简称补码,与普通字的补码定义基本一样,只是“末部件”改成了“末取码区”。例如:<两>部件字,分4个区 分别提取部件码作为选定部件码: 丨乙,丿丶,丿丶;<重>部件字,分5个区 在前3个区和最后1个区提取部件码作为选定部件码: 丨乙,一一;<豆>复码部件字,分3个区 所有取码区的部件码都为选定部件码,且后加上一个增补部件码:( 丨乙,丶丿)+一丨(补码,末区末笔画“一”,结构笔画“丨”);<户>分2个区 复码部件字,编码为:( 乙一)+丿丿(补码,末区末笔画“丿”,结构笔画“丿”);<缶>分3个区 单码部件字,编码为:丿一,一丨,乙丨,乙丨(末区部件码重复使满4码)。<六>分2个区 单码部件字,编码为:丶一,丿丶,丿丶,丿丶(末区部件码重复使满4码)。
五笔字型“字根字”的编码方法是“报户口+首笔画+次笔画+末笔画”,人脑对单笔画细节的反应较慢。本方案部件字“分区取码方式”更直观、反应明显更快,效率更高。
优选地,当所需输入的汉字为“大人之二儿子文气又力一日乃七八九丁几土山”这20个单码部件字之一,其编码为其部件码的四次重复,输入方法为其所在键连敲四次;
例如<大>编码为:一丿,一丿,一丿,一丿。<又>编码为:乙丶,乙丶,乙丶,乙丶。
这20个成字单码部件是非常好记的,可以组成这样一句话来帮助记忆:大人之二儿子,文气又大力,一日乃(领)七八九人丁(推翻)几(座)土山。
在本发明的汉字输入方法中,如果所需输入的汉字是非成字部件,当该字按上述分区原则所划分成的取码区数为3个或3个以上,则在前三个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,直接追加输入一个部件码“乙乙”;当该字划分成的取码区数只有2个,则在这2个取码区提取部件码作为选定部件码,依次每个选定部件码后,末区的部件码重复输入一次,再追加输入一个部件码“乙乙”;例如<辶>分区 ,编码为: 乙乙。<犭>优化分区 编码为:丿乙, 乙乙;<勹>分区“勹勹”,编码为: 乙乙;
词组的编码规则。如果是二字词组,每个字取其前两个部件码。例如:<统计>其编码为:乙乙(纟)+丶一(亠)+丶乙(讠)+一丨(十)。
如果是三字词,取第一、第二个字的首个部件码及第三个字的前两个部件码。例如:<国务院>其编码为:丨乙(口)+丿乙(夊)+乙丨(阝)+丶丶(宀)。
如果是四字或四字以上的词组,取第一、第二、第三和末一个字的首个部件码。例如:<进退维谷>其编码为:一一(井)+乙一(艮)+乙乙(纟)+丿丶(八)。<知识产权局>其编码为:丿一(矢)+丶乙(讠)+丶一(产)+乙一(尸)。
上述汉字编码方案中,如果:A、“大人之二儿子文气又力一日乃七八九丁几土山”这20个成字单码部件,其输入方法为其所对应的键连敲四次;B、包围部分为“辶、廴”的半包围结构字需要加末笔识别码时,其“末笔画”特别规定为被包围部分的末部件末笔画;同时具有上面AB两点,本发明则称为“优选编码方式”。
在中文键盘上,每一个键上都安排一个使用频率特别高的汉字,其输入码为所在键打一下加打空格,谓之一级简码;有600个以上汉字可以采用只输入其前两个部件码加打空格键输入,谓之二级简码;有3000个以上汉字可以采用只输入其前三个部件码加打空格键输入,谓之三级简码。同时,具有简码的汉字的全码输入方式仍然保留。
同样,在数字键盘上,每一个键上都安排一个使用频率特别高的汉字,其输入码为所在键打一下加打空格,谓之一键简码;有25或30个字采用按两键加打空格键输入,谓之二键简码;同理,通常有120~170个三键简码、500~620个字为四键简码、超过2000个五键简码、3500个左右六键简码、4000个左右七键简码。其中二键简码、四键简码和六键简码分别相当于大键盘的一级简码、二级简码和三级简码。
上述的中文键盘也可以采用如图5所示的设计方式,但由于单笔部件与常用标点符 号键位相重叠,影响标点符号的输入,且其手感也不太好,所以不是优选的方式。
以上阐述的方案虽已有很大进步,但仍可进一步优化,并且正是由于有了上述良好的基础,其可以在只增加很少的记忆负担的前提下,稍作调整就可进一步使其重码率大幅降低、使输入效率进一步提高,使“低重码”与“易记性”更完美地统一。以下阐述其优化方案。
为了实现在《部件表》为部件基础的情况下键盘键位排布的最优化,本发明采用了“基因图谱法”进行了大规模统计演算。因其核心数据库巨大,每一个数据都是通过6763字的一、二级国际字库(下面简称“6763字库”)的编码进行全面的修改、调整和统计而得,其工程巨繁,类似生物学基因图谱的基因测序,因而形象地比喻为“基因图谱法”。并通过计算机程序对“基因数据库”进行分析、推演和计算,最终掌握了《部件表》为部件基础的情况下的的“科学规范”“低重码”与“易学易记”等多方性能的最佳平衡点,设计出其最佳的键位排布优化方案。下面是这些优化方案核心技术的归纳:
可以在25部件组选出“口日虫目”,在12部件组部件“土艹木扌十”中选出至少包括“木土艹扌”之中三个部件的共三至五个部件,在44部件组中选出“氵”或“忄宀”,在31部件组中选出“钅”,在55部件组中选出“纟”或“马”;把选出的部件调到相容性好的部件组所在的键或“新增键”中输入,同时其调整不能违反“八点相容性規定”;其中所述的“键”可以是指大键盘上的单个键,也可以是指小键盘上由两个键形成的组合键,以下全文均同。所述的“调到相容性好的部件组所在的键”是指:(一)“口木土氵忄宀日虫艹钅十目扌车马纟”十六个部件之一可以调到14、21、22、23、24、33、42七个部件组之一,其中如果“艹”调到14部件组时,“ ”必须调离14部件组;上述“口木土氵忄宀日虫艹钅十目扌车马纟”十六个部件称作“高重码部件”,14、21、22、23、24、33、42这七个部件组称作“一级接收组”。因为这七个部件组部件笔画码的频次都很低,上述高重码部件与其同键输入时只能产生很少的重码。所以把上述高重码部件之一调到这7个部件组之一中同键输入,就可以消除该高重码部件相关的重码,同时不会产生新的重码或新产生的重码数量很少。这一调整措施在本发明中称作“取密补稀”。(二)通过本发明的编码实践和统计获知,一些高重码部件与“一级接收组”之外的个别部件组之间也有很好的相容性,可以将其调到这些部件组中同键输入:其中“氵”可以调到34、51或54部件组,“忄宀”可以调到51或54部件组,“日”可以调到52部件组,“虫”可以调到34部件组、“月”调走后的35部件组或54部件组,“艹”可以调到“人”调走后的34部件组,“钅”可以调到51或54部件组,“十”可以调到15、31、32、43、45、51或55部件组,“目”可以调到15、34、41、51或52部件组,“马”可以调到34、51、54、“月”调走后的35部件组或“讠”调走后的45部件组,“扌”可以调到34、51、54部件组、“月”调走后的35部件组或“石”调走后的13部件组,“车”可以调到34、51、52、54部件组、“月”调走后的35部件组、“石”调走后的13部件组或“钅”调走后的31部件组;上述13、15、32、34、35、41、43、45、51、52、54十一个部件组称作“二级接收组”。其中的“调走”是指“月”可以调走到24、33、34、51或54部件组,“人”可以调走到24、32、33、52或55部件组,“ ”可以调走到除了12、25、31、41四个部件组以外的部件组,“石”可以调 走到33、34、51、53、54或“月”调走的35部件组,“讠”可以调走到34、51或54部件组;
通过把部分部件调到相容性好的部件组中输入,从而降低编码重码率,改善编码离散性的调整方法在本发明中称作“内部调整”。所述的“新增键”是指新增的一个、两个或多个键,把部分部件分别或分组安排到新增键上输入,从而消除或大幅减少这些部件相关的重码。新增键的调整方法称作“另键输入”。
所述的八点相容性规定是指:(一)高重码部件“口木土氵忄宀日虫艹钅十目扌车马纟”以及有关部件“月人 石”共20个部件的键位相容性规定。(1)“十”不能与“口或土”同键,可以与其它18个部件之一同键输入;(2)“宀”不能与“艹、木、口、日或氵”同键,可以与其它部件之一同键;(3)“车”不能与“石、木、土、扌、虫、口、钅、月、氵或纟”同键,可以与其它部件之一同键;(4)“石”不能与“车、木、土、扌、艹、虫、口、目、钅、月、氵、忄、马或纟”同键,可以与其它部件之一同键;(5)“人”不能与“艹、木、口或日”同键,可以与其它部件之一同键;(6)“ ”不能与“艹”同键,可以与其它部件之一同键;(7)“口木土氵忄日虫艹钅目扌马纟月”这14个部件之间,除了“马艹”“艹目”“日目”“马日”“马月”“马忄”“马目”“虫日”这8对部件可以安排到同一键外,其它任两个部件都不可以安排到同一键输入;(二)上述20个部件与5个单笔部件之间的键位相容性规定:上述20个部件中,除了“宀木人十日土口”,另外的13个部件可以和单笔部件“一”同键;除了“人”,其它部件可以和单笔部件“丨”同键,除了“十日土”,另外的部件可以和单笔部件“丿”同键;除了“土人口”,另外的部件可以和单笔部件“丶”同键;除了“土日人口”,另外的部件可以和单笔部件“乙”同键。
上述的优化措施及有关相容性的规定,是对含有十多万数据量的“基因图谱数据库”分析而得,并且都经过了实际的编码实验和统计而最终证实的,其具有突出的效果。下面列举若干个例子并提供有关其效果的统计数据加以说明。
首先说明两个原始状态:以“优选编码方式”分别对3755字库和6763字库编码。当单笔部件独自一键输入,3755字库和6763字库编码的重码字数分别为820个和2030个;当5个单笔画部件码 分别划归到11、22、31、42、51部件组同键输入,其重码字数分别为905个和2237个。这是部件未调整时的两个原始状态。下面就是部件的多个调整例子及其效果统计数据,通过调整后重码字数下降的多少就可以说明其调整的效果。
上两表各举例方案都可用如图2所示数字键盘输入。其中“口23”是指把“口”从25部件组抽出来调到组代号为23的部件组同键输入,在数字键盘上用“23”输入。关于电脑大键盘设计,例如第一个表的例22和第二个表的例22在电脑大键盘上的设计分别如图6、图7所示。其它的以此类推。类如上两表的“内部调整”的还有很多种组合,只要把高重码部件按前面所述方法调到一、二级接收组,同时又不违反上述“八点相容性规定”就能使重 码字数、编码离散性、编码空间的合理有效的利用、常用词组的重码数、简码字的数量及其分布的合理性、键选率等输入效率方面的性能大大提升。
上面两表列举的多个优化调整措施,这些措施在数字键盘上应用时,其重码字数已很低了,可获得较满意的应用效果,但在电脑大键盘上与五笔字型相比其重码字数就偏高了,因此有必要进一步调整以减少重码。编码研究表明,6763字库重码字数降到550左右时就可以达到与五笔字型(86版重码字数为531个)相当的低重码输入效果。为了使重码字数降到550左右,可以在35部件组部件“勹夕儿匕几夊九”中选出3至6个部件(当同时选有勹和匕时,“九”就不必再选);在41部件组中选出“广(或疒)”、“亠”、“广亠”或“疒亠”;在25部件组部件“田口山由贝冂”中选出2至4个部件;在12部件组部件“古工五耳西丁寸 ”中选出3至5部件;在53部件组中选出“力”、“刀”或“力刀”;在34部件组中选出“人”、“乂”或“人乂”;在45部件组中选出“心”或“辶”;在52部件组中选出“子”;以上所选出的部件安排到相容性更好的部件组中同键输入;本发明称上述“勹儿匕几夕夊九广疒亠田口山由贝冂古工五耳西丁寸 力刀人乂心辶子”等为“次高重码部件”。
无论是高重码部件还是次高重码部件,在确定其调动的键盘位置时,都要充分考虑到该部件的动态频次的高低这一要素,尽可能把动态频次高的部件调到由食指、中指等高灵活手指控制的键位。本发明统计了基础部件的动态频次“王0.845% 0.495% 0.251%……”,作为本方案部件的键盘优化调动的数据支持。这里所述的动态频次是与静态频次相对的概念,例如由部件“虫”构成的汉字字数较多,“虫”的静态频次就较高;但这些字大多数都不太常用,所以“虫”的动态频次反而较低。
具体的调整方案有多种,例如可以把五甘、 夫冖、古扌、艹勹耳、十日、木口、二寸口、月用 、丁 、夕匕儿、人田、石、虫、目、氵夊攵、广几、辶、马、讠言、西覀、钅金、子孑了等调到组代号分别为11、12、13、14、21、22、23、24、31、32、33、34、35、41、42、43、44、45、51、53、54、55的部件组中同键输入,它们在计算机键盘中的位置关系如图3所示,这也是该优化方案的中文键盘。也就是说,把五甘、 夫冖……子孑了等都作为编码符号印在键盘上增设为部件码,与5个单笔画、25个双笔画一起参与部件的编码表达。
上述五甘、 夫冖……子孑了等新增的部件码名称分别是:五、甘、雨、夫[夫字形]、冖[冖字形]、古[古字形]、扌、艹[艹字形]、勹[勹字形]、耳[耳字形]、十[十字形]、日[日字形]、木[木字形]、口[口形]、二[二字形]、寸、口[口字形]、月[月字形]、用[用字形]、丁[丁字形]、夕[夕字形]、匕[匕字形]、儿[儿字形]、人[人字形]、田[田字形]、石、虫[虫字形]、目[目字形]、氵、夊[夊字形]、攵、广[广字形]、几[几字形]、辶、马、讠、言、西[西字形]、覀、钅、金、子、孑、了[了字形]。上述名称中有的有“×字形”,有的没有。这表示了不同的含义。例如名称“五”之后没有“[五字形]”就表示键盘上印的编码符号“五”只表示部件“五”;而“十[十字形]”则表示编码符号“十”既是指部件“十”,又指“十字形”。其中“十字形”是指笔画更多的复码部件或单码部件中形如“十”的笔画组合,如复码部件“斗”的第三第四笔画、又如单码部件“缶”的第三第四笔画。 也就是说键盘上的编码符号“十”既可以代表部件“十”,也用于“斗千 ......”等复码部件的编码表达和输入,还用于如“缶平辛......”等单码部件字的编码表达和输入。举例如下:
寤→宀+爿+五+口→丶丶+乙丨+五+口→OBGK 编码符号“五”代表部件“五”;
其参与了复码部件“斗”的编码表达和输入;
缶→ →丿一,十,乙丨,乙丨→THBB这里的编码符号“十”也是指“十字形”,
其参与了单码部件字“缶”的编码表达和输入。
可见,上述“五甘 夫......十日......子孑了”等印在键盘上的中文符号与5个单笔画、25个双笔画一样参与了汉字编码表达,因此也成为了部件码。这样部件码的总数量就在原来的30个的基础上增加到了70多个。同时一些部件的编码表达和键盘输入需要作相应调整,具体请看单码部件表和复码部件表中“优化键盘排布方案”的部分。图3所示的中文键盘在实际印制中可以把“月用 丁 子孑了”简印为“月用、丁、子了”,以节约键盘空间,如图4所示。图8为该优化方案的繁体中文键盘。
本优化方案是经过细致全面的统计、反复权衡而得出的,集多方面优异性能、追求细节完美综合极佳的方案。除了要达到前面所述的具有高度科学性的字形输入法的10点要求外,其下面几点尤其突出:1、重码率特别低、手感特别舒适协调,尤其是常用字词重码少且输入手感顺畅协调。2、键印部件码设置更科学、好记。调动少,许多都在本区内调动,数字键盘上输入时反应更容易、更快。键盘上的部件码便于印制。一个键的部件码个数一般是2至4个,最多不超过5个。避免了一个键的中文符号太多而印得密密麻麻的、不方便查看。3、与拼音编码有很好的相容性。可以与拼音混合编码形成拼音输入与字形输入免转换的状态,想打拼音就打拼音,想打部件码就打部件码,互相干扰少。4、输入速度比五笔字型更快。5、数字化高速输入。具体说明如下几点:
1、关于“细致全面的统计”。增设部件码的选取与定位、增设部件的取舍,单码还是复码,复码又如何分区取码......都是经过了细致全面的统计才定案的。例如,部件“冖”调到43部件组重码率也较低,键盘输入手感也很好,且属区内调动,似乎比调到12部件组更合理。但统计发现其一个极常用的词组“学习”与“慊”字重码,所以最终选择调到12部件组。又例如增设部件 可以使“定题......”等字打字更顺手,还能使“但是”与“倡”不重码。
2、关于其重码率。该优化方案对6763字库进行编码,重码字只有528个,与五笔字型相当。且绝大多数都是两个字的重码,很少三个字以上的重码,常用字之间也很少重码。
3、关于其键盘输入的舒适协调性。其各键的负荷比例如图35所示:
食指负荷占60.66%,中指23.81%,无名指11.03%,小指4.54%。其中灵活性和耐疲劳性最好的食指和中指负荷共84.5%负荷,而最无能的小指只占不到5%。这是一个极佳的负荷分配比例,使打字过程手指感觉非常轻松,长期操作而不易疲劳。实践表明,由于不太灵活无名指和小指的工作量小,打字时既便是手腕垫着键盘托,仍然能顺畅打字。
4、关于其易记易学性。键印部件的键位需要一定的记忆,但数量不多,有38组,例如 “讠言”算1组,还有“钅金”、“西 ”......等也各算1组。最容易学的拼音输入法也需要记忆26个字母的键位,本方案38组键印部件的记忆量比拼音输入法多一些,但与五笔字型要强记200个左右字根的键位相比,它就容易多了。键印部件之外的其它部件都很有规律,只要熟悉部件体系既可,不须强记。少了“强记字根表”这一大障碍,且其“补码”也比五笔字型的识别码容易理解,所以用10至20分钟了解其编码规则后,就可以直接通过《学习软件》进入打字练习,在打字练习中逐渐熟悉规则、熟悉部件体系,直至完全掌握。门槛大幅降低。其傻瓜化的《学习软件》已经完成制作,只要作简单讲解说明,一个小学生也能轻松学得会。如果需要,发明人可以提供该软件用作演示。完全掌握本输入法的关键不在于记忆什么,而是要熟悉其部件体系。看到上面长长的单码部件表和复码部件表,似乎部件体系难掌握,但是由于其规律性很强,不需要强记,过一遍就能基本掌握,所以并不难。无论哪种编码方案,如果把国家规范部件的编码方法都列出来都是一样那么长长的篇幅。
5、关于与拼音的相容性。评价四键形码与拼音(是指现在主流的全拼)的相容性好不好主要看其四键编码有多少与拼音重码。本方案与拼音有冲突的重码很少,主要有:cang钜,dang拒,fang考证,feng敷衍了事,keng听证,nang讵,neng认证、论证,ning谜语,peng验证,qiao蝉连,teng签证。都不是特别常用,影响不大。
6、关于它的科学性与规范性。
首先,其部件体系是国家规范的部件,避免了对汉字破坏性的肢解和割裂。在编码理论上,其突破了传统的拆分理论这一思维定式,创造性地提出了分区取码的模式。分区理论是拆分理论的继承、发展和突破。既能收录《部件表》所有部件,又实现了低重码,还体现了部件的整体性、避免了对汉字的破坏性肢解和割裂。部件整体性的体现如下:
A、在学习软件和说明资料中,复码部件都表现为一整体。例如说明字的拆分和编码时是这样表达的:容→宀+谷→丶丶+(丿丶,人,口)→OWEK其中“+”是部件间的分隔,“(×,×,×)”表示复码部件内部的分区及取码。而在拆分理论中的表达是这样:容→宀+八+人+口→丶丶+丿丶+人+口→OWEK。前者体现了复码部件“谷”的整体性,后者没有。
可见尽管复码部件要分区取码,但在所有文字或图像的学习资料中,它都表现为一个整体。用户在学习过程中,不会像五笔字型那样造成对汉字的破坏性肢解和割裂,反而可帮助掌握科学规范的部件结构、加深汉字的理解,帮助识记汉字。由于专利文件的图像是黑白色且是静态的,图像效果不明显,直接看《学习软件》彩色动态过程更明显。
本方案的分区取码理论与现行的字根拆分理论表面上看相似,实则本质不同。可以把汉字基础部件比喻做一栋叫做基础科学的大楼,我们可以把该大楼划分成若干个区域:一楼为数学部、二楼为物理部、三楼为化学部......这就是部件“分区”。但是我们不能把由钢筋水泥连为一体的大楼“拆分”开,即不能把一楼、二楼、三楼......拆下来再分别给数学部、物理部、化学部......。二楼、三楼拆下来就不是二楼、三楼了,强行拆解必然导致破坏,楼房拆成了墙板或砖头就不能住人了。可见基础部件可以“分区”但不能“拆分”。如部 件“黄”,“黄→ ”如同大楼分层的“分区”,适当。而“黄→+由+八”是拆分肢解则不当。
其次,其键盘部件排布具有高度科学性。一、部件在键盘上以笔画作为排布规律具有科学性和必然性。(1)笔画是部件的下级构成单位。部件在键盘上以笔画为排布规律、用笔画来编码表达是科学而自然的选择。就像英文单词是由26个字母构成的,所以英文词典按字母顺序进行排序就是最自然、最科学的一样。(2)笔画是汉字最基本、最简单的基础知识,是汉字书写的基础。部件以笔画作为键盘排布规律,学习起来就最简单、最容易。(3)汉字的笔画、笔形、笔顺、书写规范等问题比较细碎,老师无法逐个学生逐个字纠正其错误,而学习本方案可以帮助用户细致、全面、精确、牢固地掌握这些的知识。(4)以笔画规律进行键盘排布,部件就可以直接用数字编码表达,在数字键盘上输入。二、选择“前两笔画”是最佳选择。(1)从直观性看。前两笔画最简单、最直观、且具有键位导向功能。所谓键位导向功能是指键盘输入时,部件的“形”能不知不觉地把手指“牵引”到其所在的键位上。例如看到或想到“乍缶禾毛长垂重......”等部件时,手指就会自然而然地伸向“丿一”即“T”键,看到“己巳彐 弓艮尸聿肃......”,就会伸向“乙一”即“N”键。这是因为部件的外形轮廓与其前两笔画相关度最大,前两笔画不同则部件的外形轮廓就不一样,因此部件的外形轮廓所包含的位置信息,“牵引”我们的手指去按相关键位。部件只有取前两笔画才具有明显的导向性功能,中间笔画则没有这样的效果。显然部件“导向性”功能具有非常重要的意义。它使“部件→键位”的反应更自然、更快速、更轻松,进而提高了打字速度。初学者也不需要频繁地找部件表查健位,熟用者不会像五笔那样突然大脑短路,想不起某字根在哪个键上,也没有不用易忘的毛病。(2)从掌握书写方法的角度看,大多数笔画顺序错误都出现在部件的前两笔画中,掌握了部件前两笔画的顺序,笔画顺序的问题就基本解决了。(3)帮助识字、记字,凭着编码记忆或字图的印象反推字形。例如在纸上写“落”字,如果记不准是先写艹还是先写氵,就可以通过其键位记忆来推断。又如“游”字,小学生很容易错写成 字形上虽易混淆,但字图上区别巨大,有了字图印象有助于避免写错。
7、关于计算机输入速度。其重码率与五笔字型相当,但部件键位反应、拆字反应、补码反应、部件字编码反应等都更快,手感也更佳,实践证明其输入速度比五笔明显更快。
8、关于数字化高速输入。在手机数字键盘上输入时可以采用如图2所示的键盘设计,12345分别用于表示一丨丿丶乙,按8和0直接输入逗号和句号,感叹号、问号、分号、顿号、冒号、双引号分别用01、02、03、04、05、06输入,空格键用7和9两键表示,方便简码字快速上屏。由于单笔部件不再与双笔画同键输入,所以与计算机键盘方案相比,不仅编码容量大幅增加,而且重码率也大幅降低。特别是其简码编码空间巨大,虽然其单字编码码长最多可达8位,但几乎所有的一级国际字(使用频次占99.9%)都是用6码以内的简码实现无重码输入的,即它是以“简码+词组”为主的低重码高效输入方式。一般输入生僻单字时才需要输满8码,但概率很低。下面显示用该优化方案的数码版输入法软件输入北京奥运闭幕式奥委会主席罗格的致辞结语,其中“-”表示按空格键顶字上屏,无“-”的8键全码会自动上屏,逗号按8直接上屏:“这(41-)是(2-)一(1-)届(51251-)真正(21256121)的(3-)无与伦比(23613215)的(3-)奥运会(63233323),(8)现在(11251362),(8) 遵照(43532153)惯例(44553261),(8)我(63-)宣布(44611325)第(3151-)29(29)届(51251-)奥林匹克(63221513)运动会(23233323)闭幕(42121421),(8)并(4313-)号召(23155323)全(341-)世界(12653333-)青年(11243112)四(2232-)年(3112-)后(3361-)在(13-)伦敦(32334155)举办(44345364)的(3-)第(3151-)30(30)届(51251-)奥林匹克(63221513)运动会(23233323)上(21-)相聚(22411454),(8)谢谢(51635163)!(01)”全文77个字符,包括空格键按了239键,平均一个字符3.1键。本优化方案大幅提升了数字键盘汉字输入的性能和效果。基本实现了数字化无重码连续输入,极少需停下来选字,输入字词全码基本可以自动上屏,主要标点符号也不需换档处理。考虑到平常打字词组有的多有的少,平均每个字符只需要按2.5至4键,学会计算机标准键盘方案的用户就可直接在数字键盘上输入,不需另外专门学习。一般用户可以轻松地实现每分钟20~40字的速度(不采用联想输入方式),只要平均每秒按键2次就可以达到。进一步熟练、提高按键速度,还有每分钟50字以上的前景。
200910166372.0是本发明人以字根拼形(无规范限制)理论为基础提出的方案,与之相比本方案尽管部分技术手段相同或相似,但两者编码理论不同、部件基础不同、设计难度不同、价值和意义、适用范围、效果等不一样:1、本方案属部件编码理论,创造性地提出了“部件码”和“部件分区取码”的理论,是人们渴望已久的科学规范、易学好用的输入法。汉字编码应该用多少部件?用哪些部件?国家规范部件能不能用于汉字编码?汉字编码如何与教学知识体系协调统一?部件又如何在键盘上分类排布?如何解决汉字编码好学的不好用、好用的不好学......等一系列困扰汉字编码多年的问题,因此而一一解决,编码界关于“国家颁布的部件规范不具有可操作性”等诸多偏见也将得以纠正。国家制定部件规范,实现了汉语拼形方案的第一步,但如何利用规范部件在键盘上科学、合理、高效地组拼汉字,使既可应用于信息处理、又可反辅汉字教学,帮助掌握和普及科学的汉字知识,帮助识字记字、减少别字错字,帮助掌握正确的汉字书写方法,增强全社会语言文字应用的规范意识,帮助汉字教育手段的更新和科学化,利用信息技术促进语文教学(特别是促进汉字的部件化教学)、提高教学效率。这是十分重大的课题,本方案给出了一个解答、填补了空白。2、上述优化方案只用规范部件编码,同时要实现低重码等一系列高标准性能,其难度比前申请大得多。哪些部件可为单码,哪些部件必须为复码都需要大规模的统计。发明人完成前者设计后,再以《部件表》基础部件为构架,重新构建统计模型,又用1年多时间,每日十几小时统计研究才完成。3、部件体系有巨大差异,前者有重大的科学性规范性缺陷,不适于汉字教学。前者收录了68个不规范字根,有220个规范部件未录入。两者部件差异达280多个。4、如前面所述的,本方案在避免重要字词重码、部件码设置的科学性、操作手感、轻松度、拆字反应、数字编码输入效果......等多方面又有明显提升,总体性能显著提升。
如图9至图34所示的是其它多款优化方案(这些图中的“雨”是指 “月用”是指“月用 ”,“丁”是指“丁 ”)。其中图19是其中重码最少的,图21是键印部件较好记的,图22是区外键印部件最少的,综合效果最佳的是前面所述图3方案。
本发明部件码的编码方案也适用于辞书领域的汉字检索。
图1是本发明的中文键盘之一。
图2是本发明的小键盘设计图。
附图说明
图3是本发明优化方案的中文键盘设计方案之一。
图4是本发明优化方案的中文键盘之简化印刷设计。
图5是本发明的单笔画单独键输入的中文键盘设计。
图6、图7是本发明“内部调整”中文键盘排布例图。
图8是本发明优化方案的中文键盘设计之繁体方案设计。
图9至图34是本发明多款优化方案的中文键盘设计列举。
图35是本发明优化方案与五笔字型的计算机大键盘各键负荷比例对比图。
Claims (11)
1.一种根据规范部件码输入汉字的方法,其包括如下步骤:
(1)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取1个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;
(2)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入每个选定部件码。
2.如权利要求1所述的方法,其中普通字的输入方法中,当拆分出的部件转化为部件码后,部件码的个数正好为4个时,选定该4个部件码作为选定部件码;而当部件码的个数超过4个时,则选定第一部件码、第二部件码、第三部件码和最末部件码作为选定部件码。
3.如权利要求1所述的方法,其中普通字的输入方法中,当拆分出的部件转化为部件码后,部件码的个数少于4个时,则选定所有部件码作为选定部件码,输入所有部件码之后加上一个增补部件码;所述的增补部件码是由所需输入汉字的末笔画和结构笔画组成;其中,末笔画是指所需输入汉字的末部件的末笔画,结构笔画是指反映所需输入汉字之结构的笔画。
4.如权利要求1所述的方法,其中部件字的输入方法中,当该字划分成的取码区数为4个,依次在这4个取码区提取部件码作为选定部件码;当该字划分成的取码区数超过4个,则在前三个和最后一个取码区提取部件码作为选定部件码;当该字划分成的取码区数为2个或3个,则所有取码区提取的部件码都为选定部件码,如果该字为单码部件字,输入每个选定部件码后末区部件码重复输入直到满4码止,如果该部件字为复码部件字,输入每个选定部件码后再加上一个增补部件码;所述的增补部件码是由所需输入部件字的末笔画和结构笔画组成;其中,末笔画是指所需输入部件字的末取码区的末笔画,结构笔画是指反映所需输入部件字之结构的笔画。
5.如权利要求1所述方法,其中非成字部件的输入方法中,当该字划分成的取码区数为3个或3个以上,则在前三个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,直接追加输入一个部件码“乙乙”;当该字划分成的取码区数只有2个,则在这2个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,末区的部件码重复输入一次,再追加输入一个部件码“乙乙”。
6.如权利要求4所述的方法,其中,“大人之二儿子文气又力一日乃七八九丁几土山”20个部件字的输入方法为其所在键连敲四次。
7.如权利要求1、4、5、6之一所述的方法,其中,在步骤(1)中,按照下述的分区原则,划分所需输入的汉字的取码区:
(A)要符合国家笔画、笔顺规范;
(B)划分成的取码区总数尽可能少;
(C)能离不连,能连不交;
(D)前面的取码区尽可能取大;
(E)“亠”下的“口”及“”下的“一”跳过不参与分区取码。
8.如权利要求1-6之一所述的方法,其中,在12部件组部件“土艹木扌十”中选出至少包括“木土艹扌”之中三个部件的共三至五个部件,在44部件组中选出“氵”或“忄宀”,在31部件组中选出“钅”,在55部件组中选出“纟”或“马”;把选出的部件调到相容性好的部件组所在的键或“新增键”中输入,同时其调整不能违反“八点相容性规定”;其中所述的“键”可以是指大键盘上的单个键,也可以是指小键盘上由两个键形成的组合键;
所述的“调到相容性好的部件组所在的键”是指:(一)“口木土氵忄宀日虫艹钅十目扌车马纟”十六个高重码部件之一可以调到14、21、22、23、24、33、42七个部件组之一,其中如果“艹”调到14部件组时,“”必须调离14部件组;(二)一些高重码部件可以调到“一级接收组”之外的个别部件组中与这些部件组的部件同键输入:其中“氵”可以调到34、51或54部件组,“忄宀”可以调到51或54部件组,“日”可以调到52部件组,“虫”可以调到34部件组、“月”调走后的35部件组或54部件组,“艹”可以调到“人”调走后的34部件组,“钅”可以调到51或54部件组,“十”可以调到15、31、32、43、45、51或55部件组,“目”可以调到15、34、41、51或52部件组,“马”可以调到34、51、54、“月”调走后的35部件组或“讠”调走后的45部件组,“扌”可以调到34、51、54部件组、“月”调走后的35部件组或“石”调走后的13部件组,“车”可以调到34、51、52、54部件组、“月”调走后的35部件组、“石”调走后的13部件组或“钅”调走后的31部件组;其中的“调走”是指“月”可以调走到24、33、34、51或54部件组,“人”可以调走到24、32、33、52或55部件组,“”可以调走到除了12、25、31、41四个部件组以外的部件组,“石”可以调走到33、34、51、53、54或“月”调走的35部件组,“讠”可以调走到34、51或54部件组;
所述的八点相容性规定是指:(一)高重码部件“口木土氵忄宀日虫艹钅十目扌车马纟”以及有关部件“月人石”共20个部件的键位相容性规定;(1)“十”不能与“口、土”同键,可以与其它18个部件之一同键输入;(2)“宀”不能与“艹、木、口、日或氵”同键,可以与其它部件之一同键;(3)“车”不能与“石、木、土、扌、虫、口、钅、月、氵或纟”同键,可以与其它部件之一同键;(4)“石”不能与“车、木、土、扌、艹、虫、口、目、钅、月、氵、忄、马或纟”同键,可以与其它部件之一同键;(5)“人”不能与“艹、木、口或日”同键,可以与其它部件之一同键;(6)“”不能与“艹”同键,可以与其它部件之一同键;(7)“口木土氵忄日虫艹钅目扌马纟月”这14个部件之间,除了“马艹”、“艹目”、“日目”、“马日”、“马月”、“马忄”、“马目”、“虫日”这8对部件可以安排到同一键外,其它任两个部件都不可以安排到同一键输入;(二)上述20个部件与之间的键位相容性规定:上述20个部件中,除了“宀木人十日土口”,另外的13个部件可以和同键;除了“人”,其它部件可以和同键,除了“十日土”,另外的部件可以和同键;除了“土人口”,另外的部件可以和同键;除了“土日人口”,另外的部件可以和同键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100910569A CN102707809A (zh) | 2010-07-01 | 2011-04-02 | 以国家规范部件为部件基础的部件码输入法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010222642 | 2010-07-01 | ||
CN201010222642.8 | 2010-07-01 | ||
CN2011100910569A CN102707809A (zh) | 2010-07-01 | 2011-04-02 | 以国家规范部件为部件基础的部件码输入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102707809A true CN102707809A (zh) | 2012-10-03 |
Family
ID=46900684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011100910569A Pending CN102707809A (zh) | 2010-07-01 | 2011-04-02 | 以国家规范部件为部件基础的部件码输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102707809A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103279202A (zh) * | 2013-03-15 | 2013-09-04 | 闫健 | 一种符合教学用的规范全息汉字输入方法及输入法系统 |
CN104160436A (zh) * | 2013-02-12 | 2014-11-19 | 林广生 | 汉字信息记录方法 |
CN104932708A (zh) * | 2013-12-08 | 2015-09-23 | 杨春华 | 一种由汉字知识体系衍化而成的易学、高效的科学输入法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101206529A (zh) * | 2007-10-25 | 2008-06-25 | 北京善庐汉字对称码应用技术开发有限公司 | 数字键主键盘小键盘对称码拼音笔画输入法 |
CN101276246A (zh) * | 2008-05-19 | 2008-10-01 | 北京善庐汉字对称码应用技术开发有限公司 | 计算机数字键对称码部首笔画输入方法 |
CN102722257A (zh) * | 2009-07-22 | 2012-10-10 | 杨春华 | 利用规范部件码输入汉字的方法 |
-
2011
- 2011-04-02 CN CN2011100910569A patent/CN102707809A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101206529A (zh) * | 2007-10-25 | 2008-06-25 | 北京善庐汉字对称码应用技术开发有限公司 | 数字键主键盘小键盘对称码拼音笔画输入法 |
CN101276246A (zh) * | 2008-05-19 | 2008-10-01 | 北京善庐汉字对称码应用技术开发有限公司 | 计算机数字键对称码部首笔画输入方法 |
CN102722257A (zh) * | 2009-07-22 | 2012-10-10 | 杨春华 | 利用规范部件码输入汉字的方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104160436A (zh) * | 2013-02-12 | 2014-11-19 | 林广生 | 汉字信息记录方法 |
CN103279202A (zh) * | 2013-03-15 | 2013-09-04 | 闫健 | 一种符合教学用的规范全息汉字输入方法及输入法系统 |
CN104932708A (zh) * | 2013-12-08 | 2015-09-23 | 杨春华 | 一种由汉字知识体系衍化而成的易学、高效的科学输入法 |
CN104932708B (zh) * | 2013-12-08 | 2019-10-18 | 杨春华 | 一种由汉字知识体系衍化而成的易学、高效的科学输入法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Arbib | From monkey-like action recognition to human language: An evolutionary framework for neurolinguistics | |
WO2010049520A2 (de) | Verfahren zur eingabe von daten | |
CN1342276A (zh) | 键盘输入设备、方法和系统 | |
CN101706682B (zh) | 利用字根笔画码输入汉字的方法 | |
CN105513457A (zh) | 基于毛笔和硬笔的分步摹临法书写技艺训练方法 | |
CN102707809A (zh) | 以国家规范部件为部件基础的部件码输入法 | |
Anderson et al. | Analysis of alternative keyboards using learning curves | |
CN102722257A (zh) | 利用规范部件码输入汉字的方法 | |
CN103257720B (zh) | 一种汉字输入法 | |
Brennan | 10 EVERY LITTLE MOVEMENT HAS A MEANING ALL ITS OWN | |
CN102279650A (zh) | 简单规范输入法 | |
Gonzalez et al. | Creating and updating models of activities for people with Alzheimer disease using JClic platform | |
CN102253726A (zh) | 一种计算机汉字数字笔画的输入方法及键盘技术 | |
CN104932708B (zh) | 一种由汉字知识体系衍化而成的易学、高效的科学输入法 | |
CN1908870B (zh) | 单击与多键并击混合输入中英文的方法和键盘 | |
CN100545790C (zh) | 计算机汉字信息猎头码输入法 | |
CN1080748A (zh) | 简繁体声形特征码汉字输入法及其键盘 | |
CN102830808A (zh) | 利用规范部件码作补码的拼音输入法 | |
Myers et al. | Text input to handheld devices for people with physical disabilities | |
CN104238764A (zh) | 追音快录 | |
Chen et al. | Lexical variation and change in Taiwan Sign Language | |
CN101086687A (zh) | 一种首末码汉字输入方法 | |
CN105892708A (zh) | 三维数码输入法及其键盘代码 | |
CN102902370A (zh) | 一种计算机类形码汉字键盘技术 | |
Niles et al. | The Role Of Piano Technique In Typing Competency And It Productivity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121003 |