CN102830808A - 利用规范部件码作补码的拼音输入法 - Google Patents
利用规范部件码作补码的拼音输入法 Download PDFInfo
- Publication number
- CN102830808A CN102830808A CN2011100910573A CN201110091057A CN102830808A CN 102830808 A CN102830808 A CN 102830808A CN 2011100910573 A CN2011100910573 A CN 2011100910573A CN 201110091057 A CN201110091057 A CN 201110091057A CN 102830808 A CN102830808 A CN 102830808A
- Authority
- CN
- China
- Prior art keywords
- code
- parts
- components
- component
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 92
- 230000000295 complement effect Effects 0.000 title claims abstract description 37
- 230000008676 import Effects 0.000 claims description 25
- 239000007787 solid Substances 0.000 claims description 19
- 239000004575 stone Substances 0.000 claims description 17
- 239000002023 wood Substances 0.000 claims description 16
- 238000005096 rolling process Methods 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 12
- 239000002689 soil Substances 0.000 claims description 12
- 241000238631 Hexapoda Species 0.000 claims description 11
- 238000005192 partition Methods 0.000 claims description 9
- 239000011435 rock Substances 0.000 claims description 9
- 230000003190 augmentative effect Effects 0.000 claims description 7
- 210000003128 head Anatomy 0.000 claims description 7
- 238000012546 transfer Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 210000005069 ears Anatomy 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 241001023788 Cyttus traversi Species 0.000 claims description 3
- 241000283086 Equidae Species 0.000 claims description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 2
- 230000009977 dual effect Effects 0.000 abstract 2
- 208000006011 Stroke Diseases 0.000 description 130
- 238000005457 optimization Methods 0.000 description 15
- 238000012913 prioritisation Methods 0.000 description 14
- 238000013461 design Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 210000003811 finger Anatomy 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 241001104043 Syringa Species 0.000 description 5
- 235000004338 Syringa vulgaris Nutrition 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000005194 fractionation Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 241000239290 Araneae Species 0.000 description 3
- 230000001037 epileptic effect Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 210000005224 forefinger Anatomy 0.000 description 3
- 210000004932 little finger Anatomy 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 241000283690 Bos taurus Species 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 230000000386 athletic effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 210000001747 pupil Anatomy 0.000 description 2
- 238000004611 spectroscopical analysis Methods 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 101100018956 Bacillus subtilis (strain 168) iolB gene Proteins 0.000 description 1
- 241000931705 Cicada Species 0.000 description 1
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 208000035859 Drug effect increased Diseases 0.000 description 1
- 241001149900 Fusconaia subrotunda Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 241000590419 Polygonia interrogationis Species 0.000 description 1
- 241001620634 Roger Species 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 244000152045 Themeda triandra Species 0.000 description 1
- 210000000026 apposition eye Anatomy 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 239000011449 brick Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000004567 concrete Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000007799 cork Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 241001233061 earthworms Species 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000001483 mobilizing effect Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011514 reflex Effects 0.000 description 1
- 239000011150 reinforced concrete Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000003466 welding Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
- 238000013316 zoning Methods 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种以规范部件码的编码作为补码的拼音输入法,该方法包括如下的步骤:(1)输入汉字的拼音编码;拼音编码为双拼或全拼;(2)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取1个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;(3)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入至少1个选定部件码。采用上述方法输入汉字时,屏幕上最终所显示的所需输入的汉字可以迅速被锁定,实现无重码或几乎无重码的输入。本输入法的字形补码部分的编码本身是一款易学好用的字形输入法,它以国家制定的《现代常用字部件表》的基础部件为部件基础,以汉字教学的汉字基础知识为知识基础,具有高度的科学性和规范性,是“规范性”、“易学性”、“高效性”、“舒适性”的完美统一。
Description
技术领域
本发明涉及一种利用规范部件码作为补码的拼音输入汉字的方法。
背景技术
现行拼音输入法最大的不足之处就是字词输入时重码大多,特别是在常需要输入人名、地址的办事窗口等工作场合应用时尤其突出,影响了工作效率。因此一些拼音输入法利汉字字形提取编码作为补码分离重码,但其提取字形补码的部件(或字根)大多欠缺科学和规范性。有的以部首来取补码,但很多字的部首不容易判断,影响输入效率。许多拼音补码技术只提供单层补码,许多字输入一个补码时还有不少重码。应该具有多层补码,可以深度分离重码,即使应用于大字集字库时也能高效分离重码。最好该形码本身就是一款科学高效、易学好用的成熟字形输入法,使用户学会该拼音的补码技术的同时等于学会了一款科学高效成熟的形码输入技术,一举两得,降低了学习成本。或者使用该形码的用户需要用拼音输入法输入汉字时,也可以用该形码来分离拼音重码。
汉字输入作为一项基本技能,无论是会读不会写的字,还是会写不会读的字都应该能够顺畅快速地输入。就这点而言,单一的拼音输入法或拼形输入法都是不能胜任的。拼音和拼形就像人的两条腿,互相支持,缺一不可。所以学生应该掌握拼音输入法的同时,还应掌握一门科学规范、易学好用的形码输入法。可以根据自身特点或场合需要选择使用拼音还是字形。当使用拼音输入汉字时,还也可以用该形码来分离拼音重码,补拼音之不足。
该可做拼音补码的字形输入法应该具有如下特征:
1、以《现代常用字部件表》的基础部件作为其编码的部件基础。为了处理非常用字,可以在《信息规范》选取适当基础部件做为补充,还可适当补充一些规范的合成部件。其补充的部件可以因所应用的字集范围大小而不同,但字集范围所对应的基础部件不能随意删减,不规范的“部件”也不能任意添加,不应该自主创造一些不规范“字根”作为部件。
2、采用笔画、笔形、笔顺、汉字书写规范、汉字结构、独体字规范等汉字基础教学中最基本的字形知识作为其编码的知识基础。这一点有重大的意义,它使汉字的编码方案不仅仅是为了满足信息处理应用的需要,也能反辅汉字教学,帮助掌握和普及科学的汉字知识,帮助识字记字、减少别字错字,帮助掌握正确的汉字书写方法,增强全社会的语言文字应用的规范意识。还能帮助汉字教育手段的更新和科学化、利用信息技术促进语文教学、提高教学效率,使中小学信息教育与汉语汉字教学保持一致,使悠久灿烂的汉字文化在信息时代能够健康地传承。
3、易学性。不需要背繁杂的字根表,记忆负担小。可以短时间内学会基本的规则、并顺利地进入到打字练习的状态。从入门到精通没有明显的门槛,可以循序渐进地学习提高。
4、好用,打字轻松、快速而高效。拆字容易、取码自然直观、思维负担小。重码率低,特别是常用的字词重码要少,打字精确快速,很少需要用数字键选。编码容量大,可以方便地输入较大容量的常用词组。
5、建立汉语字形的键盘符号系统。英语是由26个拉丁字母构成的,这26个字母就是英语的键盘符号系统。科学的字形输入法也应当有反应汉字字形规律的键盘符号系统,该键盘符号必须能够编码表达所有的规范部件,并且该键盘符号在键盘上以双手运行键盘指法的舒适击键范围内有规律地排布。其只与汉字自身的规律相关,不以英文字母为参考背景,与英文字母在键盘上哪个位置没有任何关系。从实用性的要求出发,该键盘符号系统必须能够在计算机标准键盘的键帽上清晰地刻印容纳得下,便于学习者查看,方便教学和打字操作。所以每个键上的中文符号数量不能太多,不能刻印得密密麻麻的。
6、计算机键盘各键位的负荷分配科学合理。必须根据各手指灵活性、耐疲劳性来分配各键击键负荷,使手感舒适协调、耐疲劳。
7、键盘输入普适性。容易实现数字化编码,既能在标准计算机键盘上使用,也能在数字键盘上直接用数字高效地输入。我们已经或即将面临的是一个通信设备、家电设备、生产设备等智能化的时代,它们都面临着汉字输入的问题,且基本上只能通过键数较少的数字键盘输入。如果一款输入法不能数字化编码如何能适应这样的趋势?
8、社会普适性。通用于全社会,从初学识字起,到走出校门进入各行各业(无论从事何种职业),一辈子都适用。适用于各种场合、各种方言地域。能满足职业录入员高速盲打的要求,应用于大字库时还能满足古籍研究人员输入古字的需要。
9、与拼音编码具有较好的相容性。与拼音混合编码时,音形编码相互干扰较少,想打拼音就打拼音,想打字形就打字形,无需转换键。
10、可应用于汉字排序检索,如字典查字。
显然以具有如上10点特征的科学规范、易学好用的形码作为补码的拼音输入法也是现今社会的需要。
发明内容
本发明的目的是提供一种以规范部件码为补码的拼音输入法,该方法采用一种称为规范部件码的编码作为拼音输入的补码,而实现汉字无重码或几乎无重码的输入,其可应用于计算机、通信设备、数码学习机、电子词典、PDA等掌上电子产品以及一些高级机电设备上的汉字输入。
为实现上述的发明目的,本发明提供了一种以规范部件码的编码作为拼音输入法补码的汉字输入法,该方法包括如下步骤:
(1)输入汉字的拼音编码;拼音编码为双拼或全拼;
(2)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取1个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;
(3)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入至少1个选定的部件码;
采用上述方法输入汉字时,屏幕上最终所显示的所需输入的汉字可以迅速被锁定,实现无重码或几乎无重码的输入。其中所述的拼音编码可以是现在最常用的全拼编码,也可以是击键数更少的双拼编码。其中字形部分编码方案是发明人深入研究国家颁布的适用于中小学语文教学、民族地区汉语教学及对外汉语教学的《现代常用字部件表》(简称《部件表》),对其进行了大量的、深入的、细致的基础性统计研究,并全面深入地掌握其中的规律而得出的。它是科学、规范,易学好用的形码方案,能有效地分离拼音重码。
采用上述方法输入汉字时,屏幕上最终所显示的所需输入的汉字可以自动地被加入到相应文件的相应之处,也可以通过确认键或数字选择键而加入到相应文件的相应之处。
上述的拼音编码是指常见的全拼编码或双拼编码,双拼编码可以是自然码双拼、微软双拼、拼音加加双拼、搜狗双拼......等等。拼音部分非常简单,是大众熟知的技术,下面详细阐述其字形部分的编码方案。
其字形部分编码方案部分执行了国家颁布的笔画、笔顺规范、独体字规范、书写规范等,特别是执行了《部件表》的规范性要求,以其所颁布的514个基础部件为部件基础进行编码。
由于《部件表》只是对3500个现代常用汉字进行部件拆分而得出的部件体系,且其中一些因书写部位不同笔形发生变异的部件没有设立(例如“”归入“手”而未在该部件体系中设立,同样还有“……”等),所以该部件体系应用于信息处理时,需要补回“”等因书写部位不同笔形发生变异的未设立的部件,同时针对非常用字编码的需要在《信息规范》中选取适当部件进行补充。另外,为了进一步提高相关字词的输入效率,简化拆字,降低编码的信息损耗率,更好体现汉字的字理结构,本方案部件体系在《部件表》514个基础部件的基础上作了如下几点不违反规范性的有益的补充:
1、因笔形变异而未在《部件表》中设立的15个部件从《信息规范》或《基础教学用现代汉语常用字部件》中选录补回:孑 毋。2、因处理3500常用字之外的非常用字需要从《信息规范》中选录补充13个部件:氺 屮巜乜卝。3、部件字的分区取码时分区的字形参照需要而从《信息规范》中选录补充的31个部件:幺。这些部件虽不直接在字拆成部件的过程中拆出,但在复码部件的分区取码时可作为分区的参考依据。4、从《基础教学用现代汉语常用字部件》中再引入32个部件:尔共囊行北鼻比兵齿典阜骨鼓麻麦黾齐青黍香兴疋邑音舆羽支周走足。这其中有许多是《新华字典》的部首,其作为编码部件更能体现汉字的字理结构。这样补充后《新华字典》中所有部首都已收入作为部件使用。5、为了提高部分字的编码效果增加了“冏吂刅余章祭关并並早令”13个成字的规范部件。上述“囬吂刅冏”在计算机中的区位码分别是56EC、5402、5205、518F、E832、E83B。6、当处理繁体字时,从《信息规范》选录补充的43个繁体部件
补充了如上147个部件后,其部件总数为514+147=661个。这些部件分成两大类:单笔部件和复笔部件。单笔部件是只有一个笔画构成的部件,即是一(横)、丨(竖)、丿(撇)、丶(点)、乙乛乚5组10个部件;其余部件至少有两个笔画构成,称为复笔部件。
上述的部件码是指25个双笔画“一一、一丨、一丿、一丶、一乙、丨一、丨丨、丨丿、丨丶、丨乙、丿一、丿丨、丿丿、丿丶、丿乙、丶一、丶丨、丶丿、丶丶、丶乙、乙一、乙丨、乙丿、乙丶或乙乙”和5个单笔画或它是印在键盘上的编码符号,用于部件的编码表达和键盘输入。相关的笔画分类按国家规定,即提归横类,捺归点类,竖钩归竖类,除竖钩外的其它弯曲或带钩的笔画都为折类。将这30个部件码印在计算机键盘上,可以得到如图1所示的中文键盘。这是本方案的原始键盘排布方案,该键盘分横、竖、撇、点、折5个区,其中GFDSA为横区、HJKLM为竖区、TREWQ为撇区、YUIOP为点区、NBVCX为折区;5组双笔画的分布规律都是从键盘中间向两边散开。在数字键盘上分别用1、2、3、4、5代表五个笔画一丨丿丶乙进行输入,例如部件码“丿一”用31输入。而单笔画部件码分别用61、62、63、64、65输入。
部件和部件码的对应关系、部件的编码表达和键盘输入:
一、有的部件只对应一个部件码,即由一个部件码进行编码表达和输入的部件称为单码部件。单码部件分两类,一类是单笔部件“一”“丨”“丿”“丶”“乙乛乚”,其部件码分别是分别由G、J、T、U、N输入。另一类是复笔部件,其部件码是部件的前两笔画的组合。例如“土士才工廿世束更臣柬两南雨丐镸巿……”等单码部件的部件码就是部件的前两笔画组合“一丨”,在中文键盘中用F输入,数字键盘上用12输入;其它单码部件的部件码也都是其前两笔画,如“禾”的部件码为“丿一”,“亻”的部件码为“丿丨”,“彳”的部件码为“丿丿”,“八”的部件码为“丿丶”......以此类推。见如下表:
表(1)单码部件表
单码部件表说明:1.括号里的是繁体部件。2.组代号中数字“11、12、13......65”等也是其数字输入的代码。
二、有的部件则对应2至4个部件码,即由2至4个部件码进行编码表达和输入。这样的部件称为复码部件。复码部件取码方法一般是以笔画更少的单码部件的“形”作为划分标准,把该部件划分成至少2个取码区,每个取码区提取1个部件码,如果取码区数不超过4,依次在每个区提取部件码组成编码;如果区数超过4,则在前三个和最后一个区提取部件码组成编码。例如复码部件“户”以笔画更少的单码部件“丶”和“尸”的形作为参考,划分为“”两个取码区,分别取部件码和“乙一”,组合而成的复码“乙一“来编码表达和输入,在中文键盘上用两个键UN输入,在数字键盘上用6451输入。
其要遵守以下的分区原则:
另外,部件的分区原则还包括兼顾直观、综合考虑的原则,即在部件分区取码的过程中,要考虑分成的取码区要符合人们的直观判断和感觉或构字理据。这样,很少的个别部件的分区可能不符合笔画顺序。例如:秉→→丿一+乙一,虽然不完全符合笔画顺序,但是符合构字理据(秉,从又,从禾,表示以手持禾),也符合人们的直观判断和感觉,还符合取码区总数尽可能少的原则,利于提高分区取码的效率,这是综合考虑而得出的科学合理的分区方式。
“承东非甫黑久乐鬲民年皮犭身我熏羊于鱼禺禹舟牜 余祭”等部件及繁体部件共40个部件为了避免重要字词的重码而需要分区取码。为了避免分区过于细碎而影响取码思维的速度,及减少编码损耗率,优选地,它们不以单码部件的“形”作分区参照,而根据其自身笔形特征按尽可能简单、直观、利于大脑快速反应的方式进行分区取码。例如:熏→→丿一,丶丶→TO;我→→丿一→TU。其它38个部件的优选分区方式见下面复码部件表的“原始键盘排布方案”列。当上述40个部件采用了这一优选的分区方式来取码的部件分区方式,我们称作“优化分区方式”。
总共272个复码部件的优化分区方式及其部件码编码表达和键盘输入方法见如下表中的“原始键盘排布方案”部分。
表(2)复码部件表(说明:部件分区中,如果区数超过4区的只显示前3区和末区)
关于汉字拆分成部件。在五笔字型中汉字拆分是十分令人头痛的,而本方案由于部件与部件之间的笔画是没有交重的,所以拆字基本都是按“块”拆分,简单而少歧义。汉字拆分成部件后,部件的次序是以部件的首笔画的次序作为排序标准的。如“式”字拆分成部件“弋”“工”,因为弋的首笔画先写,所以“式”字部件的次序是“弋工”。
在本发明中,本身是成字且又是部件的汉字叫做部件字,例如“王干专三韦百卑本...”等。部件字又分单码部件字和复码部件字两种,例如“王干专三韦...”等为单码部件字,“百卑本...”等为复码部件字;不成字且本身是部件的汉字叫做非成字部件,如“扌、艹、氵、勹......”等;其它不作为部件的一般汉字叫做普通字。
在本发明的汉字输入方法中,如果所需输入的汉字是普通字,且当拆分出的部件转化为部件码后,部件码的个数正好为4个时,选定该4个部件码作为选定部件码;而当部件码的个数超过4个时,则选定第一部件码、第二部件码、第三部件码和最末部件码作为选定部件码;例如,<婉>部件拆为“女+宀+夕+”,都是单码部件,部件码个数之和为4,编码为“乙丿+丶丶+丿乙+乙乙”;<嫒>部件拆为“女++冖++又”,都是单码部件,部件码个数为5,选第一、第二、第三部件码和最末部件码作为选定部件码组成编码“乙丿+丿丶+丶乙+乙丶”。<解>部件拆为“角+刀+牛”,角为复码“丿乙,丿乙”,刀为单码部件,牛为复码“一一”,部件码总数为5,选第一、第二、第三和最末部件码组成编码为“(丿乙,丿乙)+乙丿+一一”。
在本发明的汉字输入方法中,如果所需输入的汉字是普通字,且拆分出的部件转化为部件码后,部件码的个数少于4个时,例如2个或3个时,则选定所有部件码作为选定部件码,输入所有部件码之后加上一个增补部件码(简称“补码”)。所述的增补部件码是由所需输入汉字的末笔画和结构笔画组成;其中,末笔画是指所需输入汉字的末部件的末笔画,结构笔画是指反映所需输入汉字之结构的笔画。
作为一种具体的实施方案,上述的结构笔画中,可以用横“一”表示所需输入汉字为左右结构,用竖“丨”表示所需输入汉字为上下结构,用撇“丿”表示所需输入汉字为其它非左右非上下的杂合结构,如独体、全包围、半包围等结构。例如,<怒>编码为:乙丿(女)+乙丶(又)+丶乙(心)+丶丨(补码,末部件末笔画“丶”,结构笔画“丨”);<砼>编码为:一丿(石)+丿丶(人)+一丨(工)+一一(补码,末部件末笔画“一”,结构笔画“一”);<困>其编码为:丨乙(口)+一丨(木)+丶丿(补码,末部件末笔画为“丶”,结构笔画为“丿”)。
结构笔画是很容易理解和判断的,左右结构字是横向排列的,所以其结构笔画为“一”(横)。上下结构字是纵向排列的,所以其结构笔画为“丨”(竖),其它结构的字的排列不横也不纵,就像笔画撇的书写方向也是不横不纵一样,所以其结构笔画一律为“丿”撇。本发明创造性地提出了“结构笔画”这一概念,对提高汉字笔画分检能力有重要意义。它以简单形象的方式给汉字增添了一个“笔画”,使汉字笔画的分检功能更深入细致。
优选地,为了避免“连迓巡迄迓迪遇......”、“廷延...”等包围部分为“辶、廴”的半包围结构字的增补部件码都相同(都为“丶丿”)而起不到区分的作用造成重码,这类字作为补码的“末笔画”不再取末部件末笔画,而是改为取被包围部分的末部件末笔画。例如:<巡>其编码为:乙乙+丶乙+乙丿(被包围部分末部件末笔画为“乙”,结构笔画为“丿”)。<廷>其编码为:(,一丨)+乙丶+一丿(被包围部分末部件末笔画为“一”,结构笔画为“丿”)。
在本发明的汉字输入方法中,如果所需输入的汉字是部件字,当该字按上述分区原则所划分成的取码区数为4个,依次在这4个取码区提取部件码作为选定部件码;当该字划分成的取码区数超过4个,则在前三个和最后一个取码区提取部件码作为选定部件码;当该字划分成的取码区数为2个或3个,则所有取码区提取的部件码都为选定部件码,如果该字为单码部件字,输入每个选定部件码后末区部件码重复输入直到满4码止,如果该部件字为复码部件字,输入每个选定部件码后再加上一个增补部件码;所述的增补部件码是由所需输入部件字的末笔画和结构笔画组成;其中,末笔画是指所需输入部件字的末取码区的末笔画,结构笔画是指反映所需输入部件字之结构的笔画。
作为一种具体的实施方案,上述的结构笔画中,可以用横“一”表示所需输入部件字为左右结构,用竖“丨”表示所需输入部件字为上下结构,用撇“丿”表示所需输入部件字为其它非左右非上下的杂合结构,如独体、全包围、半包围等结构。部件字的增补部件码也简称补码,与普通字的补码定义基本一样,只是“末部件”改成了“末取码区”。例如:<两>部件字,分4个区“”,分别提取部件码作为选定部件码:丨乙,丿丶,丿丶;<重>部件字,分5个区“”,在前3个区和最后1个区提取部件码作为选定部件码:丨乙,一一;<豆>复码部件字,分3个区“”,所有取码区的部件码都为选定部件码,且后加上一个增补部件码:(丨乙,丶丿)+一丨(补码,末区末笔画“一”,结构笔画“丨”);<户>分2个区“”,复码部件字,编码为:(乙一)+丿丿(补码,末区末笔画“丿”,结构笔画“丿”);<缶>分3个区“”,单码部件字,编码为:丿一,一丨,乙丨,乙丨(末区部件码重复使满4码)。<六>分2个区“,单码部件字,编码为:丶一,丿丶,丿丶,丿丶(末区部件码重复使满4码)。
五笔字型“字根字”的编码方法是“报户口+首笔画+次笔画+末笔画”,人脑对单笔画细节的反应较慢。本方案部件字“分区取码方式”更直观、反应明显更快,效率更高。
优选地,当所需输入的汉字为“大人之二儿子文气又力一日乃七八九丁几土山”这20个单码部件字之一,其编码为其部件码的四次重复,输入方法为其所在键连敲四次;
例如<大>编码为:一丿,一丿,一丿,一丿。<又>编码为:乙丶,乙丶,乙丶,乙丶。
这20个成字单码部件是非常好记的,可以组成这样一句话来帮助记忆:大人之二儿子,文气又大力,一日乃(领)七八九人丁(推翻)几(座)土山。
在本发明的汉字输入方法中,如果所需输入的汉字是非成字部件,当该字按上述分区原则所划分成的取码区数为3个或3个以上,则在前三个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,直接追加输入一个部件码“乙乙”;当该字划分成的取码区数只有2个,则在这2个取码区提取部件码作为选定部件码,依次每个选定部件码后,末区的部件码重复输入一次,再追加输入一个部件码“乙乙”;例如<辶>分区编码为:乙乙。<犭>优化分区“”,编码为:丿乙,乙乙;<勹>分区“勹”,编码为:乙乙;
当所需输入的汉字为五个单笔部件之一,则其输入方法为其所对应的键连敲三次后再追加输入一个部件码“乙乙”;例如:
词组的编码规则。如果是二字词组,每个字取其前两个部件码。例如:<统计>其编码为:乙乙(纟)+丶一(亠)+丶乙(讠)+一丨(十)。
如果是三字词,取第一、第二个字的首个部件码及第三个字的前两个部件码。例如:<国务院>其编码为:丨乙(口)+丿乙(夊)+乙丨(阝)+丶丶(宀)。
如果是四字或四字以上的词组,取第一、第二、第三和末一个字的首个部件码。例如:<进退维谷>其编码为:一一(井)+乙一(艮)+乙乙(纟)+丿丶(八)。<知识产权局>其编码为:丿一(矢)+丶乙(讠)+丶一(产)+乙一(尸)。
上述汉字编码方案中,如果:A、“大人之二儿子文气又力一日乃七八九丁几土山”这20个成字单码部件,其输入方法为其所对应的键连敲四次;B、包围部分为“辶、廴”的半包围结构字需要加末笔识别码时,其“末笔画”特别规定为被包围部分的末部件末笔画;同时具有上面AB两点,本发明则称为“优选编码方式”。
在中文键盘上,每一个键上都安排一个使用频率特别高的汉字,其输入码为所在键打一下加打空格,谓之一级简码;有600个以上汉字可以采用只输入其前两个部件码加打空格键输入,谓之二级简码;有3000个以上汉字可以采用只输入其前三个部件码加打空格键输入,谓之三级简码。同时,具有简码的汉字的全码输入方式仍然保留。
同样,在数字键盘上,每一个键上都安排一个使用频率特别高的汉字,其输入码为所在键打一下加打空格,谓之一键简码;有25或30个字采用按两键加打空格键输入,谓之二键简码;同理,通常有120~170个三键简码、500~620个字为四键简码、超过2000个五键简码、3500个左右六键简码、4000个左右七键简码。其中二键简码、四键简码和六键简码分别相当于大键盘的一级简码、二级简码和三级简码。
上述的中文键盘也可以采用如图5所示的设计方式,但由于单笔部件与常用标点符号键位相重叠,影响标点符号的输入,且其手感也不太好,所以不是优选的方式。
上面阐述的是本输入法中作为补码的字形部分的编码方案。下面是其完整的编码举例,即“拼音+字形补码”的编码举例:
一、全拼+部件码
<婉>编码为:wanv或wanvo或wanvoq或wanvoqx(全拼编码wan+部件码编码voqx之中的1至4个编码)
<两>编码为:liangg或lianggm或lianggmw或lianggmww(全拼编码liang+部件码编码gmww之中的1至4个编码)
<统计>编码为:tongjix或tongjixy或tongjixyp或tongjixypf(全拼编码tongji+部件码编码xypf之中的1至4个编码)
一般情况下输入一个或两个字形补码该字就可以唯一锁定或显示在第一位,很少需要输入第三、第四个字形补码。
二、双拼+部件码(双拼以自然码双拼为例)
<婉>编码为:wjv或wjvo或wjvoq或wjvoqx(自然码双拼编码wj+部件码编码voqx之中的1至4个编码)
<统计>编码还可以为:tsjix或tsjixy或tsjixyp或tsjixypf(自然码双拼编码tsji+部件码编码xypf之中的1至4个编码)
三、首声母+部件码
<统计>编码又可以为:tj或tjxy或tjxyp或tjxypf(首声母编码tj+部件码编码xypf之中的1至4个编码)
以上阐述的字形部分编码方案虽已有很大进步,但仍可进一步优化,其可以在只增加很少的记忆负担的前提下,稍作调整就可进一步使其字形部分分离重码能力大幅提升。以下阐述其优化方案。
为了实现在《部件表》为部件基础的情况下键盘键位排布的最优化,本发明采用了“基因图谱法”进行了大规模统计演算。因其核心数据库巨大,每一个数据都是通过6763字的一、二级国际字库(下面简称“6763字库”)的编码进行全面的修改、调整和统计而得,其工程巨繁,类似生物学基因图谱的基因测序,因而形象地比喻为“基因图谱法”。并通过计算机程序对“基因数据库”进行分析、推演和计算,最终掌握了《部件表》为部件基础的情况下的的“科学规范”“低重码”与“易学易记”等多方性能的最佳平衡点,设计出其最佳的键位排布优化方案。下面是这些优化方案核心技术的归纳:
可以在25部件组选出“口日虫目”,在12部件组部件“土艹木扌十”中选出至少包括“木土艹扌”之中三个部件的共三至五个部件,在44部件组中选出“氵”或“忄宀”,在31部件组中选出“钅”,在55部件组中选出“纟”或“马”;把选出的部件调到相容性好的部件组所在的键或“新增键”中输入,同时其调整不能违反“八点相容性规定”;其中所述的“键”可以是指大键盘上的单个键,也可以是指小键盘上由两个键形成的组合键,以下全文均同。所述的“调到相容性好的部件组所在的键”是指:(一)“口木土氵忄宀日虫艹钅十目扌车马纟”十六个部件之一可以调到14、21、22、23、24、33、42七个部件组之一,其中如果“艹”调到14部件组时,必须调离14部件组;上述“口木土氵忄宀日虫艹钅十目扌车马纟”十六个部件称作“高重码部件”,14、21、22、23、24、33、42这七个部件组称作“一级接收组”。因为这七个部件组部件笔画码的频次都很低,上述高重码部件与其同键输入时只能产生很少的重码。所以把上述高重码部件之一调到这7个部件组之一中同键输入,就可以消除该高重码部件相关的重码,同时不会产生新的重码或新产生的重码数量很少。这一调整措施在本发明中称作“取密补稀”。(二)通过本发明的编码实践和统计获知,一些高重码部件与“一级接收组”之外的个别部件组之间也有很好的相容性,可以将其调到这些部件组中同键输入:其中“氵”可以调到34、51或54部件组,“忄宀”可以调到51或54部件组,“日”可以调到52部件组,“虫”可以调到34部件组、“月”调走后的35部件组或54部件组,“艹”可以调到“人”调走后的34部件组,“钅”可以调到51或54部件组,“十”可以调到15、31、32、43、45、51或55部件组,“目”可以调到15、34、41、51或52部件组,“马”可以调到34、51、54、“月”调走后的35部件组或“讠”调走后的45部件组,“扌”可以调到34、51、54部件组、“月”调走后的35部件组或“石”调走后的13部件组,“车”可以调到34、51、52、54部件组、“月”调走后的35部件组、“石”调走后的13部件组或“钅”调走后的31部件组;上述13、15、32、34、35、41、43、45、51、52、54十一个部件组称作“二级接收组”。其中的“调走”是指“月”可以调走到24、33、34、51或54部件组,“人”可以调走到24、32、33、52或55部件组,“”可以调走到除了12、25、31、41四个部件组以外的部件组,“石”可以调走到33、34、51、53、54或“月”调走的35部件组,“讠”可以调走到34、51或54部件组;
通过把部分部件调到相容性好的部件组中输入,从而降低编码重码率,改善编码离散性的调整方法在本发明中称作“内部调整”。所述的“新增键”是指新增的一个、两个或多个键,把部分部件分别或分组安排到新增键上输入,从而消除或大幅减少这些部件相关的重码。新增键的调整方法称作“另键输入”。
所述的八点相容性规定是指:(一)高重码部件“口木土氵忄宀日虫艹钅十目扌车马纟”以及有关部件“月人石”共20个部件的键位相容性规定。(1)“十”不能与“口或土”同键,可以与其它18个部件之一同键输入;(2)“宀”不能与“艹、木、口、日或氵”同键,可以与其它部件之一同键;(3)“车”不能与“石、木、土、扌、虫、口、钅、月、氵或纟”同键,可以与其它部件之一同键;(4)“石”不能与“车、木、土、扌、艹、虫、口、目、钅、月、氵、忄、马或纟”同键,可以与其它部件之一同键;(5)“人”不能与“艹、木、口或日”同键,可以与其它部件之一同键;(6)“”不能与“艹”同键,可以与其它部件之一同键;(7)“口木土氵忄日虫艹钅目扌马纟月”这14个部件之间,除了“马艹”“艹目”“日目”“马日”“马月”“马忄”“马目”“虫日”这8对部件可以安排到同一键外,其它任两个部件都不可以安排到同一键输入;
(二)上述20个部件与5个单笔部件之间的键位相容性规定:上述20个部件中,除了“宀木人十日土口”,另外的13个部件可以和单笔部件“一”同键;除了“人”,其它部件可以和单笔部件“丨”同键,除了“十日土”,另外的部件可以和单笔部件“丿”同键;除了“土人口”,另外的部件可以和单笔部件“丶”同键;除了“土日人口”,另外的部件可以和单笔部件“乙”同键。
上述的优化措施及有关相容性的规定,是对含有十多万数据量的“基因图谱数据库”分析而得,并且都经过了实际的编码实验和统计而最终证实的,其具有突出的效果。下面列举若干个例子并提供有关其效果的统计数据加以说明。
首先说明两个原始状态:以“优选编码方式”分别对3755字库和6763字库编码。当单笔部件独自一键输入,3755字库和6763字库编码的重码字数分别为820个和2030个;当5个单笔画部件码分别划归到11、22、31、42、51部件组同键输入,其重码字数分别为905个和2237个。这是部件未调整时的两个原始状态。下面就是部件的多个调整例子及其效果统计数据,通过调整后重码字数下降的多少就可以说明其调整的效果。
上两表各举例方案都可用如图2所示数字键盘输入。其中“口23”是指把“口”从25部件组抽出来调到组代号为23的部件组同键输入,在数字键盘上用“23”输入。关于电脑大键盘设计,例如第一个表的例22和第二个表的例22在电脑大键盘上的设计分别如图6、图7所示。其它的以此类推。类如上两表的“内部调整”的还有很多种组合,只要把高重码部件按前面所述方法调到一、二级接收组,同时又不违反上述“八点相容性规定”就能使重码字数、编码离散性、编码空间的合理有效的利用、常用词组的重码数、简码字的数量及其分布的合理性、键选率等输入效率方面的性能大大提升。
上面两表列举的多个优化调整措施,这些措施在数字键盘上应用时,其重码字数已很低了,可获得较满意的应用效果,但在电脑大键盘上与五笔字型相比其重码字数就偏高了,因此有必要进一步调整以减少重码。编码研究表明,6763字库重码字数降到550左右时就可以达到与五笔字型(86版重码字数为531个)相当的低重码输入效果。为了使重码字数降到550左右,可以在35部件组部件“勹夕儿匕几夊九”中选出3至6个部件(当同时选有勹和匕时,“九”就不必再选);在41部件组中选出“广(或疒)”、“亠”、“广亠”或“疒亠”;在25部件组部件“田口山由贝冂”中选出2至4个部件;在12部件组部件“古工五耳西丁寸”中选出3至5部件;在53部件组中选出“力”、“刀”或“力刀”;在34部件组中选出“人”、“乂”或“人乂”;在45部件组中选出“心”或“辶”;在52部件组中选出“子”;以上所选出的部件安排到相容性更好的部件组中同键输入;本发明称上述“勹儿匕几夕夊九广疒亠田口山由贝冂古工五耳西丁寸力刀人乂心辶子”等为“次高重码部件”。
无论是高重码部件还是次高重码部件,在确定其调动的键盘位置时,都要充分考虑到该部件的动态频次的高低这一要素,尽可能把动态频次高的部件调到由食指、中指等高灵活手指控制的键位。本发明统计了基础部件的动态频次“王0.845%0.495%0.251%……”,作为本方案部件的键盘优化调动的数据支持。这里所述的动态频次是与静态频次相对的概念,例如由部件“虫”构成的汉字字数较多,“虫”的静态频次就较高;但这些字大多数都不太常用,所以“虫”的动态频次反而较低。
具体的调整方案有多种,例如可以把五甘、夫冖、古扌、艹勹耳、十日、木口、二寸口、月用、丁、夕匕儿、人田、石、虫、目、氵夊攵、广几、辶、马、讠言、西覀、钅金、子孑了等调到组代号分别为11、12、13、14、21、22、23、24、31、32、33、34、35、41、42、43、44、45、51、53、54、55的部件组中同键输入,它们在计算机键盘中的位置关系如图3所示,这也是该优化方案的中文键盘。也就是说,把五甘、夫冖……子孑了等都作为编码符号印在键盘上增设为部件码,与5个单笔画、25个双笔画一起参与部件的编码表达。
上述五甘、夫冖……子孑了等新增的部件码名称分别是:五、甘、雨、夫[夫字形]、冖[冖字形]、古[古字形]、扌、艹[艹字形]、勹[勹字形]、耳[耳字形]、十[十字形]、日[日字形]、木[木字形]、口[口形]、二[二字形]、寸、口[口字形]、月[月字形]、用[用字形]、丁[丁字形]、夕[夕字形]、匕[匕字形]、儿[儿字形]、人[人字形]、田[田字形]、石、虫[虫字形]、目[目字形]、氵、夊[夊字形]、攵、广[广字形]、几[几字形]、辶、马、讠、言、西[西字形]、覀、钅、金、子、孑、了[了字形]。上述名称中有的有“×字形”,有的没有。这表示了不同的含义。例如名称“五”之后没有“[五字形]”就表示键盘上印的编码符号“五”只表示部件“五”;而“十[十字形]”则表示编码符号“十”既是指部件“十”,又指“十字形”。其中“十字形”是指笔画更多的复码部件或单码部件中形如“十”的笔画组合,如复码部件“斗”的第三第四笔画、又如单码部件“缶”的第三第四笔画。也就是说键盘上的编码符号“十”既可以代表部件“十”,也用于“斗千......”等复码部件的编码表达和输入,还用于如“缶平辛......”等单码部件字的编码表达和输入。举例如下:
寤→宀+爿+五+口→丶丶+乙丨+五+口→OBGK 编码符号“五”代表部件“五”;卖→十+乛+头→十++(丶丶,一丿)→HNOD 编码符号“十”代表部件“十”;戽→户+斗→(乙一)+(丶丶,十)→UNOH 这里的编码符号“十”是指“十字形”,
其参与了复码部件“斗”的编码表达和输入;
其参与了单码部件字“缶”的编码表达和输入。
可见,上述“五甘夫......十日......子孑了”等印在键盘上的中文符号与5个单笔画、25个双笔画一样参与了汉字编码表达,因此也成为了部件码。这样部件码的总数量就在原来的30个的基础上增加到了70多个。同时一些部件的编码表达和键盘输入需要作相应调整,具体请看单码部件表和复码部件表中“优化键盘排布方案”的部分。图3所示的中文键盘在实际印制中可以把“月用、丁、子孑了”简印为“月用、丁、子了”,以节约键盘空间,如图4所示。图8为该优化方案的繁体中文键盘。
上面阐述的是本输入法中作为补码的字形部分的优化编码方案。下面是该优化编码方案作为拼音补码的编码举例:
一、全拼+优化部件码
<婉>编码为:wanv或wanvo或wanvor或wanvorx(全拼编码wan+婉字优化部件码编码vorx之中的1至4个编码)
<两>编码为:liangg或lianggm或lianggme或lianggmee(全拼编码liang+两字优化部件码编码gmee之中的1至4个编码)
<统计>编码为:tongjix或tongjixy或tongjixyn或tongjixynh(全拼编码tongji+统计一词的优化部件码编码xynh之中的1至4个编码)
二、双拼+优化部件码(双拼以自然码双拼为例)
<婉>编码为:wjv或wjvo或wjvor或wjvorx(自然码双拼编码wj+婉字优化部件码编码vorx之中的1至4个编码)
<统计>编码为:tsjix或tsjixy或tsjixyn或tsjixynh(自然码双拼编码tsji+统计一词的优化部件码编码xynh之中的1至4个编码)
三、首声母+优化部件码
<统计>编码为:tjx或tjxy或tjxyp或tjxypf(首声母编码tj+统计一词的优化部件码编码xypf之中的1至4个编码)
一般情况下输入一个或两个字形补码该字就可以唯一锁定或显示在第一位,很少需要输入第三、第四个字形补码。
该字形部分优化方案是经过细致全面的统计、反复权衡而得出的,集多方面优异性能、追求细节完美综合极佳的方案。它本身是一款具有高度的科学性规范性、易学好用的字形输入法。除了要达到前面所述的具有高度科学性的10点要求外,其下面几点尤其突出:1、重码率特别低、手感特别舒适协调,尤其是常用字词重码少且输入手感顺畅协调。2、键印部件码设置更科学、好记。调动少,许多都在本区内调动,数字键盘上输入时反应更容易、更快。键盘上的部件码便于印制。一个键的部件码个数一般是2至4个,最多不超过5个。避免了一个键的中文符号太多而印得密密麻麻的、不方便查看。3、与拼音编码有很好的相容性。可以与拼音混合编码形成拼音输入与字形输入免转换的状态,想打拼音就打拼音,想打部件码就打部件码,互相干扰少。4、输入速度比五笔字型更快。5、数字化高速输入。具体说明如下几点:
1、关于“细致全面的统计”。增设部件码的选取与定位、增设部件的取舍,单码还是复码,复码又如何分区取码......都是经过了细致全面的统计才定案的。例如,部件“冖”调到43部件组重码率也较低,键盘输入手感也很好,且属区内调动,似乎比调到12部件组更合理。但统计发现其一个极常用的词组“学习”与“慊”字重码,所以最终选择调到12部件组。又例如增设部件“”,可以使“定题......”等字打字更顺手,还能使“但是”与“倡”不重码。
2、关于其重码率。该字形优化方案对6763字库进行编码,重码字只有528个,与五笔字型相当。且绝大多数都是两个字的重码,很少三个字以上的重码,常用字之间也很少重码。
3、关于其键盘输入的舒适协调性。其各键的负荷比例如图37所示:
食指负荷占60.66%,中指23.81%,无名指11.03%,小指4.54%。其中灵活性和耐疲劳性最好的食指和中指负荷共84.5%负荷,而最无能的小指只占不到5%。这是一个极佳的负荷分配比例,使打字过程手指感觉非常轻松,长期操作而不易疲劳。实践表明,由于不太灵活无名指和小指的工作量小,打字时既便是手腕垫着键盘托,仍然能顺畅打字。
4、关于其易记易学性。键印部件的键位需要一定的记忆,但数量不多,有38组,例如“讠言”算1组,还有“钅金”、“西覀”......等也各算1组。最容易学的拼音输入法也需要记忆26个字母的键位,本字形方案38组键印部件的记忆量比拼音输入法多一些,但与五笔字型要强记200个左右字根的键位相比,它就容易多了。键印部件之外的其它部件都很有规律,只要熟悉部件体系既可,不须强记。少了“强记字根表”这一大障碍,且其“补码”也比五笔字型的识别码容易理解,所以用10至20分钟了解其编码规则后,就可以直接通过《学习软件》进入打字练习,在打字练习中逐渐熟悉规则、熟悉部件体系,直至完全掌握。门槛大幅降低。其傻瓜化的《学习软件》已经完成制作,只要作简单讲解说明,一个小学生也能轻松学得会。如果需要,发明人可以提供该软件用作演示。完全掌握本输入法的关键不在于记忆什么,而是要熟悉其部件体系。看到上面长长的单码部件表和复码部件表,似乎部件体系难掌握,但是由于其规律性很强,不需要强记,过一遍就能基本掌握,所以并不难。无论哪种编码方案,如果把国家规范部件的编码方法都列出来都是一样那么长长的篇幅。
5、关于与拼音的相容性。评价四键形码与拼音(是指现在主流的全拼)的相容性好不好主要看其四键编码有多少与拼音重码。本字形方案与拼音有冲突的重码很少,主要有:cang钜,dang拒,fang考证,feng敷衍了事,keng听证,nang讵,neng认证、论证,ning谜语,peng验证,qiao蝉连,teng签证。都不是特别常用,影响不大。
6、关于它的科学性与规范性。
首先,其部件体系是国家规范的部件,避免了对汉字破坏性的肢解和割裂。在编码理论上,其突破了传统的拆分理论这一思维定式,创造性地提出了分区取码的模式。分区理论是拆分理论的继承、发展和突破。既能收录《部件表》所有部件,又实现了低重码,还体现了部件的整体性、避免了对汉字的破坏性肢解和割裂。部件整体性的体现如下:
A、在学习软件和说明资料中,复码部件都表现为一整体。例如说明字的拆分和编码时是这样表达的:容→宀+谷→丶丶+(丿丶,人,口)→OWEK其中“+”是部件间的分隔,“(×,×,×)”表示复码部件内部的分区及取码。而在拆分理论中的表达是这样:容→宀+八+人+口→丶丶+丿丶+人+口→OWEK。前者体现了复码部件“谷”的整体性,后者没有。
B、在部件表中部件的分区用“”表达;而不把“正”拆分成“一”+“止”来表达。
C、《学习软件》中体现复码部件的整体性。《学习软件》中除了有专门的复码部件的练习项外。其打字练习中在空心字1中,分别对部件进行上色,表达出“字拆分成部件”的方法和次序,同时显示每一部件在键盘中相应的键位和部件码,告诉用户每一步需要按什么键。用户跟随打字的过程同时掌握了部件体系,逐渐记住了部件码的键位,是一个傻瓜化的学习过程。其空心字1部件上色的方法和过程体现了复码部件的整体性。比如其复码部件都是带有底色的,单码部件则不带底色。具体如下:
例如“蜘”字,如何体现复码部件“矢”的整体性。第一步,如图36所示,空心字1的“虫”显示红色,整个“矢”显示为浅紫色的底色,体现为一整体。第二步,如图38所示,“虫”仍是红色,而“矢”前两笔画显示深紫色,其余笔画仍显示浅紫色底色,显示了“矢”分区的首区。第三步,如图39所示,“虫”仍显示红色,“矢”前两笔画恢复为浅紫色底色,第三至第五笔画显示深紫色,显示了其分区的次区。第四步,如图35所示,“虫”仍显示红色,“矢”第三至第五笔画也恢复为浅紫色底色,此时整个“矢”都恢复为浅紫色底色,再次体现其整体性,而第三个部件“口”则显示蓝色。该过程体现出矢的整体性和“蜘→虫+矢+口”的部件结构。
上述四步空心字的变色过程中,下面中文键盘3同步显示相应的部件码和按键提示。例如第一步空心字中“虫”显示红色时,中文键盘Q键外显示一红框,部件码“虫”显示为黄色的突出显示,告诉用户请击部件码“虫”所在的Q键,击Q键后接着到第二步的显示。
该学习软件还有“字图”的功能。所谓的字图是指在中文键盘上按击打的顺序用箭头把某字或词的键位连接起来而形成的一个编码键位图。因为人脑对图像的记忆和反应比文字快,有意识地通过字图来帮助记忆高频字词的编码,能显著加快打字时反应速度,能帮助快速地建立编码的键位感。有了字图的印象后,打字时不需要想象字形,不拆字也能把字打出来,使打字更轻松,使更快地达到“条件反射”的高手境界。字图也有助于识记汉字,减少提笔忘字。如图36所示,2即为“蜘”字字图。其中方键表示属左手击打的键,圆键表示属右手击打的键。其字图也体现了复码部件的整体性。如图36所示,Q键为红色,K键为蓝色,而复码部件“矢”的两个键“T”“D ”都是深紫色、且为更粗的线条,并且它们之间的连线不是箭头,而是表示“焊接”的哑铃状线,表示它们是不可拆分的一个整体,同时在TD键中间上方显示一个“矢”字表示TD两键为复码部件“矢”的组合键。
可见尽管复码部件要分区取码,但在所有文字或图像的学习资料中,它都表现为一个整体。用户在学习过程中,不会像五笔字型那样造成对汉字的破坏性肢解和割裂,反而可帮助掌握科学规范的部件结构、加深汉字的理解,帮助识记汉字。由于专利文件的图像是黑白色且是静态的,图像效果不明显,直接看《学习软件》彩色动态过程更明显。
本字形方案的分区取码理论与现行的字根拆分理论表面上看相似,实则本质不同。可以把汉字基础部件比喻做一栋叫做基础科学的大楼,我们可以把该大楼划分成若干个区域:一楼为数学部、二楼为物理部、三楼为化学部......这就是部件“分区”。但是我们不能把由钢筋水泥连为一体的大楼“拆分”开,即不能把一楼、二楼、三楼......拆下来再分别给数学部、物理部、化学部......。二楼、三楼拆下来就不是二楼、三楼了,强行拆解必然导致破坏,楼房拆成了墙板或砖头就不能住人了。可见基础部件可以“分区”但不能“拆分”。如部件“黄”,“黄→”如同大楼分层的“分区”,适当。而“黄→+由+八”是拆分肢解则不当。
其次,其键盘部件排布具有高度科学性。一、部件在键盘上以笔画作为排布规律具有科学性和必然性。(1)笔画是部件的下级构成单位。部件在键盘上以笔画为排布规律、用笔画来编码表达是科学而自然的选择。就像英文单词是由26个字母构成的,所以英文词典按字母顺序进行排序就是最自然、最科学的一样。(2)笔画是汉字最基本、最简单的基础知识,是汉字书写的基础。部件以笔画作为键盘排布规律,学习起来就最简单、最容易。(3)汉字的笔画、笔形、笔顺、书写规范等问题比较细碎,老师无法逐个学生逐个字纠正其错误,而学习本字形方案可以帮助用户细致、全面、精确、牢固地掌握这些的知识。(4)以笔画规律进行键盘排布,部件就可以直接用数字编码表达,在数字键盘上输入。二、选择“前两笔画”是最佳选择。(1)从直观性看。前两笔画最简单、最直观、且具有键位导向功能。所谓键位导向功能是指键盘输入时,部件的“形”能不知不觉地把手指“牵引”到其所在的键位上。例如看到或想到“乍缶禾毛长垂重......”等部件时,手指就会自然而然地伸向“丿一”即“T”键,看到“己巳彐弓艮尸聿肃......”,就会伸向“乙一”即“N”键。这是因为部件的外形轮廓与其前两笔画相关度最大,前两笔画不同则部件的外形轮廓就不一样,因此部件的外形轮廓所包含的位置信息,“牵引”我们的手指去按相关键位。部件只有取前两笔画才具有明显的导向性功能,中间笔画则没有这样的效果。显然部件“导向性”功能具有非常重要的意义。它使“部件→键位”的反应更自然、更快速、更轻松,进而提高了打字速度。初学者也不需要频繁地找部件表查键位,熟用者不会像五笔那样突然大脑短路,想不起某字根在哪个键上,也没有不用易忘的毛病。(2)从掌握书写方法的角度看,大多数笔画顺序错误都出现在部件的前两笔画中,掌握了部件前两笔画的顺序,笔画顺序的问题就基本解决了。(3)帮助识字、记字,凭着编码记忆或字图的印象反推字形。例如在纸上写“落”字,如果记不准是先写艹还是先写氵,就可以通过其键位记忆来推断。又如“游”字,小学生很容易错写字形上虽易混淆,但字图上区别巨大,有了字图印象有助于避免写错。
7、关于计算机输入速度。其重码率与五笔字型相当,但部件键位反应、拆字反应、补码反应、部件字编码反应等都更快,手感也更佳,实践证明其输入速度比五笔明显更快。
8、关于数字化高速输入。在手机数字键盘上输入时可以采用如图2所示的键盘设计,12345分别用于表示一丨丿丶乙,按8和0直接输入逗号和句号,感叹号、问号、分号、顿号、冒号、双引号分别用01、02、03、04、05、06输入,空格键用7和9两键表示,方便简码字快速上屏。由于单笔部件不再与双笔画同键输入,所以与计算机键盘方案相比,不仅编码容量大幅增加,而且重码率也大幅降低。特别是其简码编码空间巨大,虽然其单字编码码长最多可达8位,但几乎所有的一级国际字(使用频次占99.9%)都是用6码以内的简码实现无重码输入的,即它是以“简码+词组”为主的低重码高效输入方式。一般输入生僻单字时才需要输满8码,但概率很低。下面显示用该字形优化方案的数码版输入法软件输入北京奥运闭幕式奥委会主席罗格的致辞结语,其中“-”表示按空格键顶字上屏,无“-”的8键全码会自动上屏,逗号按8直接上屏:“这(41-)是(2-)一(1-)届(51251-)真正(21256121)的(3-)无与伦比(23613215)的(3-)奥运会(63233323),(8)现在(11251362),(8)遵照(43532153)惯例(44553261),(8)我(63-)宣布(44611325)第(3151-)29(29)届(51251-)奥林匹克(63221513)运动会(23233323)闭幕(42121421),(8)并(4313-)号召(23155323)全(341-)世界(12653333-)青年(11243112)四(2232-)年(3112-)后(3361-)在(13-)伦敦(32334155)举办(44345364)的(3-)第(3151-)30(30)届(51251-)奥林匹克(63221513)运动会(23233323)上(21-)相聚(22411454),(8)谢谢(51635163)!(01)”全文77个字符,包括空格键按了239键,平均一个字符3.1键。本字形优化方案大幅提升了数字键盘汉字输入的性能和效果。基本实现了数字化无重码连续输入,极少需停下来选字,输入字词全码基本可以自动上屏,主要标点符号也不需换档处理。考虑到平常打字词组有的多有的少,平均每个字符只需要按2.5至4键,学会计算机标准键盘方案的用户就可直接在数字键盘上输入,不需另外专门学习。一般用户可以轻松地实现每分钟20~40字的速度(不采用联想输入方式),只要平均每秒按键2次就可以达到。进一步熟练、提高按键速度,还有每分钟50字以上的前景。
附图说明
图1是本发明的中文键盘之一。
图2是本发明的小键盘设计图。
图3是本发明优化方案的中文键盘设计方案之一。
图4是本发明优化方案的中文键盘之简化印刷设计。
图5是本发明的单笔画单独键输入的中文键盘设计。
图6、图7是本发明“内部调整”中文键盘排布例图。
图8是本发明优化方案的中文键盘设计之繁体方案设计。
图9至图34是本发明多款优化方案的中文键盘设计列举。
图35、图36、图38、图39是本发明学习软件设计案例之图解举例说明。
图37是本发明优化方案与五笔字型的计算机大键盘各键负荷比例对比图。
Claims (10)
1.一种以规范部件码的编码作为拼音输入法补码的汉字输入法,其包括如下步骤:
(1)输入汉字的拼音编码;所述的拼音编码为双拼编码或全拼编码;
(2)如果所需输入的汉字是普通字,拆分所需输入的汉字的部件;该部件是规范部件;把上述所拆分出的部件转化为部件码;如果所需输入的汉字是部件字或非成字部件,以笔画更少的单码部件的形为参照,把该字划分成至少2个取码区,每个取码区提取1个部件码;其中,所述的部件码是指25个双笔画以及5个单笔画;
(3)从中取不超过4个的部件码作为选定部件码;按书写的顺序依次输入至少1个选定部件码。
2.如权利要求1所述的方法,其中普通字的输入方法中,当拆分出的部件转化为部件码后,部件码的个数正好为4个时,选定该4个部件码作为选定部件码;而当部件码的个数超过4个时,则选定第一部件码、第二部件码、第三部件码和最末部件码作为选定部件码;当部件码的个数少于4个时,则选定所有部件码作为选定部件码,输入所有部件码之后加上一个增补部件码;所述的增补部件码是由所需输入汉字的末笔画和结构笔画组成;其中,末笔画是指所需输入汉字的末部件的末笔画,结构笔画是指反映所需输入汉字之结构的笔画。
3.如权利要求1所述的方法,其中部件字的输入方法中,当该字划分成的取码区数为4个,依次在这4个取码区提取部件码作为选定部件码;当该字划分成的取码区数超过4个,则在前三个和最后一个取码区提取部件码作为选定部件码;当该字划分成的取码区数为2个或3个,则所有取码区提取的部件码都为选定部件码,如果该字为单码部件字,输入每个选定部件码后未区部件码重复输入直到满4码止,如果该部件字为复码部件字,输入每个选定部件码后再加上一个增补部件码;所述的增补部件码是由所需输入部件字的末笔画和结构笔画组成;其中,末笔画是指所需输入部件字的末取码区的末笔画,结构笔画是指反映所需输入部件字之结构的笔画。
4.如权利要求1所述方法,其中非成字部件的输入方法中,当该字划分成的取码区数为3个或3个以上,则在前三个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,直接追加输入一个部件码“乙乙”;当该字划分成的取码区数只有2个,则在这2个取码区提取部件码作为选定部件码,依次输入每个选定部件码后,末区的部件码重复输入一次,再追加输入一个部件码“乙乙”。
5.如权利要求3所述的方法,其中,“大人之二儿子文气又力一日乃七八九丁几土山”20个部件字的输入方法为其所在键连敲四次。
7.如权利要求1-5之一所述的方法,其中,在12部件组部件“土艹木扌十”中选出至少包括“木土艹扌”之中三个部件的共三至五个部件,在44部件组中选出“氵”或“忄宀”,在31部件组中选出“钅”,在55部件组中选出“纟”或“马”;把选出的部件调到相容性好的部件组所在的键或“新增键”中输入,同时其调整不能违反“八点相容性规定”;其中所述的“键”可以是指大键盘上的单个键,也可以是指小键盘上由两个键形成的组合键;
所述的“调到相容性好的部件组所在的键”是指:(一)“口木土氵忄宀日虫艹钅十目扌车马纟”十六个高重码部件之一可以调到14、21、22、23、24、33、42七个部件组之一,其中如果“艹”调到14部件组时,“”必须调离14部件组;(二)一些高重码部件可以调到“一级接收组”之外的个别部件组中与这些部件组的部件同键输入:其中“氵”可以调到34、51或54部件组,“忄宀”可以调到51或54部件组,“日”可以调到52部件组,“虫”可以调到34部件组、“月”调走后的35部件组或54部件组,“艹”可以调到“人”调走后的34部件组,“钅”可以调到51或54部件组,“十”可以调到15、31、32、43、45、51或55部件组,“目”可以调到15、34、41、51或52部件组,“马”可以调到34、51、54、“月”调走后的35部件组或“讠”调走后的45部件组,“扌”可以调到34、51、54部件组、“月”调走后的35部件组或“石”调走后的13部件组,“车”可以调到34、51、52、54部件组、“月”调走后的35部件组、“石”调走后的13部件组或“钅”调走后的31部件组;其中的“调走”是指“月”可以调走到24、33、34、51或54部件组,“人”可以调走到24、32、33、52或55部件组,“”可以调走到除了12、25、31、41四个部件组以外的部件组,“石”可以调走到33、34、51、53、54或“月”调走的35部件组,“讠”可以调走到34、51或54部件组;
所述的八点相容性规定是指:(一)高重码部件“口木土氵忄宀日虫艹钅十目扌车马纟”以及有关部件“月人石”共20个部件的键位相容性规定;(1)“十”不能与“口、土”同键,可以与其它18个部件之一同键输入;(2)“宀”不能与“艹、木、口、日或氵”同键,可以与其它部件之一同键;(3)“车”不能与“石、木、土、扌、虫、口、钅、月、氵或纟”同键,可以与其它部件之一同键;(4)“石”不能与“车、木、土、扌、艹、虫、口、目、钅、月、氵、忄、马或纟”同键,可以与其它部件之一同键;(5)“人”不能与“艹、木、口或日”同键,可以与其它部件之一同键;(6)“”不能与“艹”同键,可以与其它部件之一同键;(7)“口木土氵忄日虫艹钅目扌马纟月”这14个部件之间,除了“马艹”、“艹目”、“日目”、“马日”、“马月”、“马忄”、“马目”、“虫日”这8对部件可以安排到同一键外,其它任两个部件都不可以安排到同一键输入;(二)上述20个部件与之间的键位相容性规定:上述20个部件中,除了“宀木人十日土口”,另外的13个部件可以和同键;除了“人”,其它部件可以和同键,除了“十日土”,另外的部件可以和同键;除了“土人口”,另外的部件可以和同键;除了“土日人口”,另外的部件可以和同键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100910573A CN102830808A (zh) | 2010-07-01 | 2011-04-02 | 利用规范部件码作补码的拼音输入法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201020254826 | 2010-07-01 | ||
CN201020254826.8 | 2010-07-01 | ||
CN2011100910573A CN102830808A (zh) | 2010-07-01 | 2011-04-02 | 利用规范部件码作补码的拼音输入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102830808A true CN102830808A (zh) | 2012-12-19 |
Family
ID=47333974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011100910573A Pending CN102830808A (zh) | 2010-07-01 | 2011-04-02 | 利用规范部件码作补码的拼音输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102830808A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1270340A (zh) * | 2000-05-29 | 2000-10-18 | 杨东宁 | 汉字字母拼音输入法及其键盘 |
US20080028303A1 (en) * | 2004-08-25 | 2008-01-31 | Google Inc. | Fault-Tolerant Romanized Input Method for Non-Roman Characters |
US20090033523A1 (en) * | 2007-08-03 | 2009-02-05 | Hoon Kyu Park | Language Input System and Method Based on Graphic Symbols |
CN101706682A (zh) * | 2008-08-28 | 2010-05-12 | 杨春华 | 利用字根笔画码输入汉字的方法 |
CN101930289A (zh) * | 2007-08-11 | 2010-12-29 | 宗刚 | 一种计算机汉字拼音及形码输入法 |
-
2011
- 2011-04-02 CN CN2011100910573A patent/CN102830808A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1270340A (zh) * | 2000-05-29 | 2000-10-18 | 杨东宁 | 汉字字母拼音输入法及其键盘 |
US20080028303A1 (en) * | 2004-08-25 | 2008-01-31 | Google Inc. | Fault-Tolerant Romanized Input Method for Non-Roman Characters |
US20090033523A1 (en) * | 2007-08-03 | 2009-02-05 | Hoon Kyu Park | Language Input System and Method Based on Graphic Symbols |
CN101930289A (zh) * | 2007-08-11 | 2010-12-29 | 宗刚 | 一种计算机汉字拼音及形码输入法 |
CN101706682A (zh) * | 2008-08-28 | 2010-05-12 | 杨春华 | 利用字根笔画码输入汉字的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101706682B (zh) | 利用字根笔画码输入汉字的方法 | |
CN101059734B (zh) | 十口格汉字书写模板 | |
CN102722257A (zh) | 利用规范部件码输入汉字的方法 | |
CN101281426A (zh) | 一种智能部件积木式汉字输入法 | |
CN101694602B (zh) | 一种利用汉字全息声韵母代码的汉字输入法 | |
CN102799282A (zh) | 笔画字根全息码汉字输入法 | |
CN1515988B (zh) | 一类音形义汉字编码输入法 | |
CN102707809A (zh) | 以国家规范部件为部件基础的部件码输入法 | |
CN102750000A (zh) | 双拼王输入法 | |
CN102279650A (zh) | 简单规范输入法 | |
CN101794176A (zh) | 基于汉语拼音方案的计算机中文输入法及键盘 | |
CN102830808A (zh) | 利用规范部件码作补码的拼音输入法 | |
CN103257720A (zh) | 一种中文键盘及基于该键盘的汉字输入法 | |
CN104765468A (zh) | 声韵双键盘滑行输入法 | |
KR102122611B1 (ko) | 초성자음 및 종성자음 상태에 따라 순환식 및 비순환식으로 처리되는 키패드에서의 한국어 입력 방법 | |
CN102253726A (zh) | 一种计算机汉字数字笔画的输入方法及键盘技术 | |
CN102289299A (zh) | 英文字母键选字的汉字拼音输入法 | |
CN101719023A (zh) | 手持式汉字输入键盘及操作方法 | |
JP2011522492A (ja) | 中国語教育に適した漢字の入力方法 | |
CN104932708B (zh) | 一种由汉字知识体系衍化而成的易学、高效的科学输入法 | |
CN102156616B (zh) | 触摸屏写键输入方法 | |
CN102750002A (zh) | 数码汉字输入法 | |
CN101908284A (zh) | 王码电脑跳字学习机 | |
CN101086687A (zh) | 一种首末码汉字输入方法 | |
CN102520808A (zh) | 头尾双笔汉字输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121219 |