CN104951094A

CN104951094A - 一种汉字音形五模式高效输入方法

Info

Publication number: CN104951094A
Application number: CN201410658122.XA
Authority: CN
Inventors: 李得道
Original assignee: Individual
Current assignee: Individual
Priority date: 2014-11-19
Filing date: 2014-11-19
Publication date: 2015-09-30
Anticipated expiration: 2034-11-19
Also published as: CN104951094B

Abstract

一种汉字音形五模式高效输入方法，是一种汉字音形2×2组合输入模式+1种纯字形输入模式共五种模式的汉字输入方法。在音码输入上是一种独特的双拼输入方案：把汉语拼音中的复合声母、复合韵母各用一个英文字母代替。在识别码输入上是根据汉字的字形特征：取汉字前两个笔画组合分别来对应一个近似象形的英文字母作为其编码。通过输入一至两个字形识别码从而在同音重码字中能极快捷地识别出所需汉字。

Description

一种汉字音形五模式高效输入方法

本发明涉及一种适用于计算机和移动智能设备的易学、易记、易用的汉字高效输入方法。

对于汉字输入，在解决易于学习和高效输入的问题上一直是个难题。在目前已经出现的汉字输入的多种编码方案中，依靠键盘输入的主要有以下几种类型：

第一种是纯字形输入方案。第二种是纯拼音输入方案，这里又有两种：全拼输入方案和双拼输入方案。第三种是音形相结合的输入方案。

第一种纯字形输入方案。最具代表性的是五笔字型。五笔字型具有高效输入的特点，但在是否易于学习的问题上，表现却是最差的，它几乎称得上是最难学习、最难掌握的一种汉字输入方法。它那与字母相对应的大量的字根编码，需要使用者花费几个月甚至更长的时间来学习、练习，死记硬背那些字根才能熟练地掌握它。同时它的拆字规则不统一，有的汉字让学习者不知如何拆分它，甚至要死记某些汉字的拆分规则。在大字符集情形下，同时随着新词汇的大量涌现，五笔字型输入的重码率也越来越面临挑战……由于这些缺陷的存在，使五笔字型的使用率越来越低，目前已经降到大约不足10％。在此种输入类型中，其它编码输入方法的使用率与五笔字型相比又相差甚远，故不作赘述。

第二种纯拼音输入方案。先说全拼输入方案，它的单字输入是全拼输入，只是偶尔在输入声母的情形下依靠词频靠前做投机取巧的选择罢了。在输入词汇时才有一定的简化功能，可以适当省略韵母。它的整体输入速度是非常慢的，虽然它的使用率极高，达到90％左右。再说双拼输入，就此前已经公开的几种双拼输入方案而言，由于那些双拼方案都存在不易学、不易记、不易用的缺陷而只有少数人使用，无法流行于大众。

第三种音形相结合的输入类型。目前此种输入类型的输入方案由于输入速度慢、实用性差、识别码不易掌握、无法推广而没有出现具有代表性的、大众化的输入方案。

而本人发明的这种汉字音形五模式高效输入方法旨在克服前面几种汉字输入方法中的多种缺陷，而推出的一种易学、易记、易用、高效的大众化汉字输入方法。

一种汉字音形五模式高效输入方法，指的是一种汉字音形2×2组合输入模式+1种纯字形输入模式共五种模式的汉字输入方法，包括整句输入用于修改操作的精准高效定位方法。此输入方法即是一个汉字的编码是用该汉字的双拼音码+字形识别码来进行汉字快捷输入的方案，且双拼音码方案和字形识别码取码方案各有两种模式可供选择，即两种双拼模式+两种字形识别码取码模式，总共产生出2×2四种音形组合的汉字输入方法，可以由使用者任意自选一种音形组合模式来进行汉字快捷输入的方案。当不知道所输入汉字的读音时，使用纯字形输入模式进行快捷输入。

在双拼方案的26个键位中，两种双拼模式只有8个键位的对应编码是不同的，其余键位的对应编码是完全相同的。在字形识别码方案中，两笔画组合识别码定义方案是完全相同的，只是两种识别码模式的取码规则不同，即两者所取两笔画顺序和识别码的数量不同。

一种汉字音形五模式高效输入方法，此两种双拼模式、此两种识别码取码模式和识别码编码定义方案、用于整句输入修改操作的数字定位混合定位批量后移定位批量返回定位方案等都是本发明所独有的。本发明技术方案如下：

首先在音码输入上是一种双拼输入方案：把汉语拼音中的复合声母(zh、ch、sh)、复合韵母(除单韵母以外的多字母韵母，但包括ü)，各用一个英文字母代替。那么一个汉字的全拼无论有多少个字母，而在此方案下，无需那么繁琐地输入全部字母，这个汉字的音码只用两个字母就可以完成全部字母的输入。比如：要输入汉字“扬”，如果用全拼输入则需输入如下四个字母yang，而使用本双拼方案只需输入两个字母yd即可，因为复合韵母ang在本方案中用d代替。且本双拼方案与目前已经公开的双拼方案截然不同，其不同之处在于本方案具有一定的合理性、独特性、关联性、易记性。

双拼方案中用两种模式可供选择。先介绍双拼模式一，双拼模式一的复合声母和复合韵母与键盘对应关系如表1所示：

表1

如表1所示，韵母ing的编码是v，如果输入汉字“丁”的读音就是输入dv，输入汉字“青”的读音就是输入qv。其它汉字双拼音码编码详见表1，不再赘述。

根据表1所示的复合声母、复合韵母和字母之间的编码对应关系，本发明提供一句记忆口诀，来帮助学习者快速记忆，在最短的时间里熟练地掌握本方案的编码规律。表中除第二行的声母和其后的韵母不能直接匹配产生一个汉字外(包括V键位编码)，其余三行各个汉字的声母和其后的韵母能够直接匹配产生一个汉字，所以本双拼模式一的编码规律存在一定的合理性、独特性、关联性和易记性。编码学习和记忆口诀如表2所示：

表2

如表2所示，表中的汉字记忆口诀“主持(人)说：吴宛薄欧喜爱特饮鳍歪鱼，刺！诶！能随棉云跨(洋)漂流，工人当街贩黄枣”。这句话的意思可以理解为：“主持人说：吴宛薄欧(两个人名)喜爱喝特(别)饮(料)，喜爱吃鳍歪鱼(一种鱼做的美食)，刺！诶！(叹息，刺多)。能随棉云(人名)跨(洋)漂流。工人当街贩(卖)黄枣”。从这句编码记忆口诀中可以看出，本方案的复合声母、复合韵母和其编码有一定的合理性、关联性、易记性、易学性。所谓的合理性指的是此种双拼方案非常适合能熟练肓打的人进行盲打输入。

在表2的表中带拼音的汉字，其中复合声母的编码是后面的单韵母，比如表中汉字“主zhu”，它的拼音中的复合声母zh的编码就是其后的单韵母u，即zh＝u，当输入汉字遇到声母zh时只需输入一个字母u即可。同样道理，ch＝i，sh＝o(汉字“说”的拼音是shuo，但如表1所示韵母uo＝o，所以复合声母sh的编码是单韵母o)。

在表2中单声母是其后面的韵母编码，比如表中汉字“漂piao”，它的拼音中的复合韵母iao的编码是前面的声母p，即iao＝p，当输入汉字“漂piao”时输入pp即可。当输入其他汉字遇到韵母iao时只需输入一个字母p代替即可，比如输入汉字“教”，其全拼是jiao，使用本双拼方案只需输入jp。其他复合韵母同此理。(另外通用英文字母键盘中并没有ü，所以韵母ü需要配置一个键位作为编码，本方案中用q键代替，即q＝ü。对于ü的输入遵循汉语拼音的通用记录规则，即当韵母ü和声母j、q、x等相配时，ü简化记录为u，即jü＝ju，qü＝qu，xü＝xu，所以输入汉字遇到jü时只需输入ju即可，而非输入jq。当韵母ü和声母n、1等相配汉字分别发“女、吕”读音时，韵母ü不作简化记录，在输入时以q键代替，即“女”的编码输入是nq，而非是nu，nu是汉字“奴”的编码。韵母üe、ün、üan等同此规则。)

摒弃杂乱无章的随意对应的双拼编码方式，而寻求一种有内在规律可循的科学的、易学、易记、易用的编码方式，正是本双拼编码方案的独特之处。

下面介绍双拼模式二。双拼模式二和键盘对应见表3：

表3

在双拼方案的26个键位中，双拼模式二和双拼模式一只有8个键位的复合韵母对应编码是不同的，这些键位分别是W、T、Y、G、J、Z、C、N，其余复合韵母键位的对应编码是完全相同的。双拼模式二保留了双拼模式一的大部分对应编码，保留了双拼模式一的合理性、独特性、关联性和易记性的特征。

双拼模式二同样提供了一句快速记忆口诀见表4：

拼音中的单声母是其后面的复合韵母编码，复合声母的编码是后面的单韵母

表4

如表4所示，表中的汉字记忆口诀“主持(人)更(正)说：喜爱鳍歪鱼，刺！诶！随人员当面漂流。铁贼犯弄跨黄金”。这句话的意思可以理解为：“主持人更正说：吴云薄欧(两个人名)喜爱吃鳍歪鱼(一种鱼做的美食)，刺！诶！(叹息，刺多)。随人员当面漂流。铁贼犯弄跨黄金(行情)”。

以上两种双拼模式由使用者根据个人喜好任意选择其中一种使用。

当汉语拼音中韵母单独使用而不存在与声母相配时，除er、ang、eng有一种对应编码外，其余韵母均有两种模式的自定义双拼对应编码，同时两种双拼编码可以共存，可由使用者任意选择使用。见表5：

表5

注：表5中“-”表示无此项对应编码，空格表示可以自定义双拼对应编码

在表5中，多数韵母都能对应两种双拼编码，空格处由使用者自由合理地自定义对应编码。只是韵母eng的对应编码在两种双拼模式下是固定且不相同的，在双拼模式一中，eng＝n因此eng单独使用时输入带零声母v的双拼编码vn，在双拼模式二中其对应的双拼编码是vg。

以韵母an为例，比如：输入汉字“安an”时，既可以输入an，也可以输入带零声母的双拼编码vf，因an＝f，两者任选一种输入。

需要特别指出在表5中，韵母ou在输入时既可以输入eu，也可以输入带零声母的vb(ou＝b)。在这里韵母ou单独使用时是不能输入ou的，因为在两种双拼模式中都规定声母sh的编码是o，当输入ou时就是输入shu，但ou可以输入eu，即ou＝eu(在传统的汉语拼音方案中ou读作“欧”，严格地说，ou发出的音并不是“欧”，而是“喔”，eu发出的音才是“欧”，所以在本发明方案中规定ou＝eu，以供选择使用)。

其次在识别码输入上，本发明同样提供了两种识别码取码模式。识别码在输入汉字时放在汉字的双拼音码之后，目的是为了快速识别出所需汉字而无需繁琐费时地翻页查找。先介绍识别码的定义规则，然后再介绍两种识别码取码模式的不同之处。

识别码是根据汉字书写笔画“-|/、乙”五种基本笔画和汉字字形结构特征来取的，能在同音重码字中更快捷地识别出所需汉字，从而提高输入效率。两个笔画组合对应一个字母，大多数两个笔画组合能分别来对应一个尽似象形的英文字母，这个对应的字母就是同音汉字的识别码。

在输入法时如果不使用识别码(也称为辅助码)，在大量的同音重码字中只能使用翻页键、数字键选择，输入效率低下。在其它双拼输入法中少有识别码，即使有的有识别码，但单字识别码或者稍显复杂不易记忆，或者存在取码不够形象直接，造成输入者思维迟顿的缺陷。在本发明技术输入方案中，两笔画和识别码之间存在象形性联系，无需死记硬背易学易用，这也是本发明技术输入方案中的另一独特之处。

汉字前两笔画组合对应识别码的编码对应键位如表6所示：

表6

表中E/x/c/z/s/p/b/t的识别码存在非笔顺象形特殊规则

汉字识别码的取码规则主要依据大小写字母的象形性和汉字前两笔画组合的象形性联系起来，从而建立编码对应关系。但个别前两笔画组合和字母之间不存在象形性，只好做特殊规定处理。在输入识别码时不输入大写字母，只输入小写字母。

如表4所示，前两笔画识别码分5行，共有25个编码。在第一行中，“点点”的编码是“u”，为何是“u”呢？把“点点”联想为“ü”上面的两个点，所以取“ü”下面的“u”为编码；“点横”可以联想为小写的“r”左转九十度平躺的相似形态；i和v的编码很容易理解；“讠”的编码可以理解为Y的稍微变形。在第二行中“横点”可以理解为“F”中两横笔画(局部)的变形；“横横”理解为“E”中的两个“横”，T、X、c的编码很容易理解。其余三行的编码原理如同第一行和第二行，根据其象形性、相似性、局部性、变形性或特殊性规定来确定编码的。多数识别码的编码对学习者而言很容易理解和记忆。

其中E/x/c/z/s/p/b/t八个识别码有特殊规定，之所以作特殊规定是因为这些汉字的偏旁部首在识别码取码时将会更加直观高效。这些有特殊规定的识别码仅适用于识别码取码模式一。偏旁带“山(竖折)、中(折竖)、出(折竖)、彐(折横)、非(竖横)、镸(横竖)、畏(横竖)、印(撇折)、段(撇竖)”等汉字，包括“疟(此字的内部，横折)”这些汉字其识别码取E，不再考虑前两笔画书写顺序，这样使原本几个不同的识别码统一成一个识别码，输入更加快捷方便。汉字“幽(竖折)、豳(横撇)”，同样不考虑笔顺第一识别码直接取E。偏旁带“匸”的汉字，正常笔顺先写“横”，再写“匸”里面的部首，最后一笔画是“匸”的末笔“折”，同样做特殊处理，不考虑笔顺把这个部首“匸”看作一个整体，第一识别码直接取象形的c。如果把带“匸”的汉字按正常笔划顺序取识别码，那么“匸”里面的部首的整体性在取第一个识别码之后就被破坏了，所以做特殊规定处理。同理偏旁“弋(横折)、戈(横折)”也看作一个整体，其识别码为c。汉字偏旁带“氺(shui)、水(shui)”的识别码一律取全拼的首字母s，同样不考虑书写笔顺。还有两个读音都是wan的特殊汉字“卐(折横)、卐(折竖)”，其识别码完全依据象形性分别取ss、zz。还有汉字“○”，其识别码取o。

表6各个笔画组合中只列出一个示例汉字。其它汉字偏旁部首的前两笔画的识别码可参考表7中的示例汉字来输入。

表7

表中E/x/c/z/s/p/b/t的识别码存在非笔顺象形特殊规则

输入汉字识别码需要注意的是：除了那八个特殊的识别码之外，输入者对汉字笔画的书写顺序的书写习惯必须是正确的，符合通用的汉字笔画书写顺序规范。如表7所示，汉字“力刀乃皮，，的笔画书写顺序是：先写“折”，再写“撇”。汉字“九匕迩”的笔画书写顺序是：先写“撇”，再写“折”。汉字“北”的笔画书写顺序是：先写“竖”，再写“横”。汉字“比”的笔画书写顺序是：先写“横”，再写“折”。汉字“了队”的笔画书写顺序是：先写“折”，再写“竖”。汉字“提”的笔画书写顺序是：先写“横”，再写“竖”。那么汉字“了提”的笔画书写顺序的第二笔画为何是“竖”呢？因为在通用的汉字笔画书写顺序规范中这个“竖钩”一律作为“竖”来处理，还有两点水的笔画“冫”的第二笔画作为横“-”来处理，笔画“捺”作为“点、”来处理。如果输入者平常书写汉字的笔画顺序符合通用的书写顺序规范，那么在输入汉字识别码时就会容易得多，如输入者有个别汉字的笔画书写顺序不规范，可以参考表7所列举的偏旁汉字示例。

对汉字进行输入识别码时，在识别码取码模式一中需要输入两个识别码。第一个识别码是汉字的前两笔画组合成的识别码，输入第二个识别码时，需要依一定的原则把汉字按结构拆分成两部分结构，汉字第二个部分结构的前两笔画组合就是第二个识别码。

如果汉字的字形结构属于上下结构，就把该汉字拆分成上下两个部分，如果汉字字形属于上中下结构，也把汉字拆分成上下两个部分，中部不取；同理，如果汉字字形属于左右结构，就把汉字拆分成左右两个部分，如果汉字字形属于左中右结构，就把汉字拆分成左右两个部分，中部不取；如果汉字字形属于半包围和全包围的结构就拆分成外围和围内两个部分。品字形结构属于上下结构。汉字结构拆分规则和第二识别码取码规则详情参见表8：

表8

在识别码取码模式一中，进行汉字输入时，汉字按编码规则先输入由汉字读音构成的双拼编码两个字母，再分别输入汉字的前一笔画或前两笔画组合构成的第一个识别码和汉字拆分后的第二部分汉字结构的前一笔画或前两笔画组合成的第二个识别码。即：

汉字编码＝汉字读音双拼编码+汉字第一识别码+汉字第二识别码

汉字的第一识别码或第二识别码也可能只有一个笔画，一个笔画的识别码用g代替。对于汉字只有一个识别码的情况，下面详细说明一下第一个识别码是单笔画的情形：

1.把一个汉字拆分成两部分结构，当其第一部分结构有且只有一个笔画时，其第一识别码取一个笔画。比如：丽、旧、卂等字。

2.把一个汉字按两笔画拆分第一识别码时，其剩余部分从字型上来看第二识别码不易取或第一识别码取两笔画不易取时，且第二部分结构多数情况下是一个汉字时，其第一识别码取一个笔画。比如：白、自、吏、良、正、王、身、未、末等字。

3.当合体字中存在识别码是单笔画的偏旁部首时，这些偏旁部首在合体字中的识别码则改用前两笔画组合而成的识别码。比如：汉字“白”的第一识别码是单笔画g，那么汉字“的”的第一识别码则改为z(撇竖)。其余单笔画识别码的汉字构成合体字时取识别码同此理。

凡是第一识别码是单笔画的汉字，本输入方案同时保留其前两笔画识别码的汉字编码，以照顾初学者，使其更容易自由输入。

下面举例说明本发明方案的识别码取码模式一的汉字输入。比如：输入汉字“神”，它的音码双拼是or，第一个识别码是汉字偏旁“礻”前两笔画组合的识别码y，第二个识别码是汉字的右半部分“申”的前两笔画识别码o，所以“神”的编码是oryo。

又如：汉字“部”，它的双拼音码是bu，第一个识别码是r，第二个识别码是右半部分的识别码b，所以“部”的编码是burb。又如：汉字“樊”和“攀”，它们的识别码分别是tx和tl。

只有一个笔画的识别码用g代替。比如：“乙”的识别码是g，即输入yig即可。汉字“丙”可以拆成“一和内”，所以其第一识别码是单笔画g。又如：汉字“旧”，可以拆成“|和日”，所以其第一识别码是单笔画g。

比如输入汉字“疡(拼音：yang)”，在大字符集下，发音为yang的汉字100个左右，如果不使用识别码，又假设输入候选框每页显示10个汉字，有的发音为yang汉字要翻10次左右才能找到。在初始字频状态下当输入双拼yd后，使用翻页键在第三页才能出现“疡”，此时按数字键1或空格键选择上屏。如表9、10、11所示：

表9(第一页)

表10(第二页)

表11(第三页)

如果在输入汉字“疡”时使用本发明技术方案中的识别码，在第一页里就能快速找到“疡”。“疡”的前两笔画分别是：点横，点横两笔画组合在一起的识别码是r，所以“疡”的第一个识别码就是r，第二个识别码是内部的前两笔：折撇，其识别码m，当输入ydrm时，“疡”就会在候选输入框的第一页出现，再使用空格键或输入系统自动上屏。如表12所示：

表12

在这种汉字读音双拼编码+识别码取码模式一情形下，就一个包含6700多个常用字、2000个非常用字、600多个多音字总共约9400个编码的汉字字符集而言，统计结果显示汉字重码数值范围≤6，这样即使在输入时有的汉字存在重码字，也无需翻页查找，从而达到快捷高效输入汉字的目的。包含9400个汉字编码的字符集，重码统计数据如下：

重码有1个(即唯一无重码)的编码共6713个，对应字条总数为：6713，占字库9395个编

码总量的71.45％，其中1906个无重码汉字只需输入一个识别码，占字库总量的20.29％

重码有2个(即二选一)的编码共888个，对应字条总数为：1776，占字库总量的18.9％

重码有3个的编码共184个，对应字条总数为：552，占字库总量的5.87％

重码有4个的编码共61个，对应字条总数为：244，占字库总量的2.59％

重码有5个的编码共16个，对应字条总数为：80，占字库总量的.85％

重码有6个的编码共5个，对应字条总数为：30，占字库总量的.31％

重码有7个的编码共0个。

因此本发明技术方案中的识别码能极大地提高汉字输入效率。

下面介绍识别码取码模式二的取码规则。识别码取码模式二的取码规则比较简单，识别码的定义规则和识别码取码模式一相同，参见表6。两种取码模式的区别在于：在识别码取码模式二中不存在识别码的特殊规则，且汉字的识别码只取汉字的首笔和末笔两个笔画组合而非识别码取码模式一的前两笔画组合构成的识别码，同时无需拆分汉字的结构。这样一个汉字只有一个识别码，少量汉字的重码率会略高于识别码取码模式一。

比如：输入汉字用“烊”举例，其双拼音码是yd，在识别码取码模式二中，识别码只取汉字的首末两笔画，“烊”的首笔画是“点、”，末笔画是“竖|”，其首末两笔画组合构成的识别码是“、|”的组合，即识别码是i，那么“烊”的全部编码是ydi，此时选择数字5，“烊” 即可上屏，见表13：

表13

特殊识别码的特殊用法。把\’\\”等几个符号分别定为特殊识别码，把其中之一用于少数的特殊的汉字、单位名称、个人姓名等一些汉字、词组、字符串的特殊识别，详见表14：

表14

特殊识别码的规定是为了使某些特殊汉字、词组、单位名称、个人姓名、字符串等能够更快捷地输入。其中单位名称、个人姓名是使用者的自定义短语，只要做到重码率低或者无重码，使用者就可以自由定义属于自己的特殊的字词和字符串编码，并导入到本输入法系统中便能做到这些特殊字词和字符串的快捷输入。

下面论述一下在词汇输入上的识别码使用问题。在词汇输入时，也可以使用识别码，尤其是两字词的重码率高。当输入一个词汇出现同音重码词汇时，按下面的规则输入：

词汇编码＝词汇的双拼编码+词汇中任意一字的一个识别码

比如：输入词汇“祭器”，如果不使用识别码输入，则出现10多个同音重码词汇，在初始词频状态下，“祭器”在输入候选框的第二页才会出现。如表15、16所示：

表15(第一页)

表16(第二页)

如果在输入词汇“祭器”时输入第一字的识别码s，此时“祭器”就会出现在输入候选框的第一页，此时使用数字键5选择上屏。如表17所示：

表17

如果在输入词汇“祭器”时输入第二字的识别码o，此时“祭器”就会出现在输入候选框的第一页的第二位，使用数字键2选择上屏。如表18所示：

表18

整句输入精准高效定位方法。本定位方案用于错误字母、错误字词的快速修改，通过下面步骤实现：

1.数字定位字母模式：用于输入汉字的识别码、修改输入错误的字母。在双拼输入状态下，每两个字母按输入顺序依次对应一个提示数字，一个长句一次可以定位10个数字即10个汉字。本方案设置三种数字定位开启键，可选择其中之一使用：Alt键、Shift键和空格键。

(1).Alt键+一个数字：

长按Alt键，然后按下需要识别码输入、错误字母对应的数字键。当按下Alt键+数字键之后光标就定位到数字对应的两个字母之后，此时按Tab键则进入识别码输入状态，可以输入汉字的识别码，若不输入识别码也可从下方候选框中用数字键选择正确的候选汉字。如果需要修改错误字母此时再使用Backspace、Delete键进行字母的删除、重新输入操作。如果需要在两个字母之间插入字母使用左右光标键移动光标位置即可进行输入。

当一个长句每两个字母对应的定位数字超过10个且这10个汉字都正确时，如果还想继续用数字定位该长句中的其余字母，此时长按Alt键+右方向键→，则自动向后从第11组字母起依序定位其余字母。其余依次类推。如果定位第二个10组字母之后，又想返回定位第一个10组字母，此时按Home键，光标即可返回到第一个字母位置并重新自动定位第一个10组20个字母。详见表19：

表19

(2).Shift键+一个数字：

长按Shiftt键，然后按下双拼字母对应的数字键。定位之后其余操作方法同a中方法相同，只是此时使用的定位键是Shift键。

(3).空格键+一个数字

长按空格键，然后按下双拼字母对应的数字键。定位之后其余操作方法同a中方法相同，只是此时使用的定位键是空格键。

2.F1～F9功能键定位中文字词模式：用于修改候选首位显示的长句中错误的字词。

进行长句输入时，输入系统依据分词筛选技术自动对一个长句进行分词定位，从第一个分词起依序对应F1～F12十二个定位功能键，非词汇的单个汉字也作为一个分词来对应定位功能键。当按一次中文分词所对应的功能键松开后，此时再按一次Tab键则该分词自动进入识别码输入状态，此时可以输入分词的识别码来选择正确的词汇，也可以从后面2、3、4、5、6、7、8、9、0九个候选提示中选择。

当一个长句对应的分词超过12个且这12个分词都正确时，如果还想继续用功能键定位该长句中的其余分词时，此时可以按一次F12键+右方向键→，则自动向后从第13个分词起从F1～F12依序定位其余12个分词。其余依次类推。如果定位第二个12组分词之后，又想返回定位第一个12组分词，此时按Home键，光标即可返回到第一个分词位置并重新自动定位第一个12组分词。详见表20：

表20

(3).数字键和功能键混合定位模式。

此种混合定位模式指的是数字键和功能键同是定位的模式，即数字定位英文字母，同时功能键定位中文分词。详见表21：

表21

整句输入精准高效定位方法，使错误字母的修改、错误中文字词的修改变得更加快捷。

本发明技术方案在输入汉字时，需要知道汉字的读音才能输入其音码，当不知汉字读音时，除了常见的笔画输入和手写输入方法外，本发明方案提供自有的汉字拆字识别码四码输入方法方法进行输入：

使用识别码四码输入方法输入，即依取大优先原则把一个汉字按偏旁部首合理地拆分成两个部分，汉字结构拆分规则与权利要求3中汉字拆分规则相同。如果汉字拆分后的第一部分还能继续拆分成两个次级部分，那么汉字第一部分的两个识别码就是其两个次级部分的前两笔画识别码，次级部分超过两个时取首末两个次级部分的前两笔画识别码；如果汉字拆分后的第一部分是独立部分不能继续拆分成两个次级部分时，那么汉字第一部分的两个识别码就是其独立部分的前两笔画识别码和末尾两笔画识别码。汉字拆分后的第二部分取码规则同此理。如果一个笔画前面已经用过，则后面不再使用。如果不足四码，有几码就输入几码。

在GBK21016个汉字大字符集下，有约10％的汉字存在重码过多的现象，为避免过多地翻页查找，这部分少量汉字的编码末尾必要时需再附加一个识别码，即在必要时附加该汉字的竖笔画总数的代码来降低重码。在这种情形下，统计结果显示汉字重码数值范围≤19，如果汉字输入提示窗口每页显示10行，则汉字的显示页数≤2页。因此本发明自有的汉字拆字识别码输入方法同样是一种高效率的汉字输入方法。

汉字竖笔画总数的对应代码见表21：

表21

在表19中除4的代码是其英文four的首字母外，其余代码是其数字的汉语拼音的首字母。在21016个汉字大字符集下，统计结果显示一个汉字的竖笔画总数≤10，因此汉字的竖笔画的最大数值是10。

一个汉字的拆字编码按以下规则依次输入：

汉字编码＝汉字第一部分两个识别码+汉字第二部分两个识别码+汉字竖笔画总数的代码

当此种类型编码字库和其他相同码元类型编码字库同时存在于一个输入系统中时，需要在编码之前添加一个v键或其他特殊的字母或特殊符号键作为此类编码字库输入的开启键，这样以避免多种同字母码元类型编码字库产生混淆。

比如：输入的汉字用“樣”来举例，当不知其读音时，该汉字拆分为左右两个部分，左边偏旁部首是“木”，其前两笔画是“横竖”，识别码是t，末尾两笔画是“撇点”，识别码是a，右边偏旁部首是“羊+永”，“羊”的识别码是v，“永”的识别码是y，所以该汉字的全部编码是tavy，此时选择数字3，“樣”即可上屏。见表22：

表22

比如：输入汉字“嫣”，该汉字拆分为左右两部分，左边部首“女”的前两笔画是“折撇”，识别码是m，末尾笔画是“横”，识别码是其单笔画g，右上角“正”的前两笔画是“横竖”，识别码是t，右下角前两笔画是“横折”，识别码是c，所以该汉字全部编码是mgtc，此时选择数字2，“嫣”即可上屏，见表23：

表23

比如：输入汉字“靠”，依取大优先原则，把该字拆分成“告”和“非”上下两个部分，“告”的两个识别码是lo，“非”的两个识别码是ee，所以该汉字的全部编码是loee。同理，汉字“赢”拆分取码的部首是“亡、口、月、凡”，所以“赢”的全部编码是ross。

当输入独体字时，能拆则拆。比如汉字“北、比”可以拆成左右两部分来输入。当不能拆分时，依笔画顺序每两笔画组合来输入前六个笔画，最后一码输入末尾两笔画。当独体汉字笔画不足八画时，识别码输完为止。

在使用汉字拆字纯字形识别码输入时，个别汉字的拆分需注意拆分的合理性。比如：“亘”，拆分成“一+旦”，“来”拆分成“一+米”，“夹”拆分成“夫+丷”，“爽”拆分成“大+乂乂乂乂”，这样处理将会更加方便取码。

如上所述，本发明技术“一种汉字音形五模式高效输入方法”是一种易学易用、独特高效的汉字输入方法。

Claims

1.一种汉字音形五模式高效输入方法，是一种汉字音形2×2组合输入模式+1种纯字形输入模式共五种模式的汉字输入方法。即是一个汉字的编码是用该汉字的双拼音码+字形识别码来进行汉字高效输入的方案，且双拼音码方案和字形识别码取码方案各有两种模式可供选择。当不知道所输入汉字的读音时，使用纯字形输入模式进行输入。

一种汉字音形五模式高效输入方法，包括两种双拼模式、两种识别码取码模式、识别码编码定义方案、用于整句输入修改操作的数字定位混合定位批量后移定位批量返回定位方案等都是本发明所独有的。其特征在于包括以下步骤：

1.在音码输入上是一种双拼输入方案且有两种双拼模式可供选择：把汉语拼音中的复合声母、复合韵母，各用一个英文字母代替。且方案具有一定的合理性、独特性、关联性、易记性。

(1).双拼模式一

a.双拼模式一和键盘对应如下表：

b.双拼模式一快速记忆口诀如下表：

拼音中的单声母是其后面复合韵母的编码，复合声母的编码是后面的单韵母

(2).双拼模式二

a.双拼模式二和键盘对应如下表：

b.双拼模式二快速记忆口诀如下表：

拼音中的单声母是其后面的韵母编码，复合声母的编码是后面的单韵母

2.当汉语拼音中韵母单独使用而不存在与声母相配时，除er、ang、eng有一种对应编码外，其余韵母均有两种模式的自定义双拼对应编码，同时两种编码可以共存，可任意选择使用。如下表：

注：表中“一”表示无此项对应编码，空格表示可以自定义双拼对应编码

3.在识别码输入上是根据汉字书写笔画“一丨/、乙”五种基本笔画和汉字字形特征：取前两个笔画组合，大多数组合能分别来对应一个尽似象形的英文字母，从而在同音重码字中更快捷地识别出所需汉字。识别码有两种模式可供选择使用。

识别码在输入时不分大小写，其对应键位如下表：

表中E/x/c/z/s/p/b/o/t的识别码存在非笔顺象形特殊规则

识别码取码有两种模式可供选择。

(1).识别码取码模式一：

对汉字进行输入识别码时，输入两个识别码。依汉字结构把汉字按结构拆分成两部分结构，汉字的前两笔画组合是第一个识别码，汉字拆分后的第二部分结构的前两笔画组合是第二个识别码。汉字拆分规则和第二识别码取码规则如下表：

识别码中的非笔顺的象形特殊规则仅适用于识别码模式一。对汉字进行输入时，全部编码按以下规则输入：

汉字编码＝汉字读音双拼编码+汉字的第一识别码+汉字第二部识别码

(2).识别码取码模式二：

此识别码取码模式下，只取一个汉字识别码，即：取汉字的首笔画和末笔画两笔画相结合产生的一个识别码作为同音汉字的识别。此时识别码仅与汉字的首末笔画有关，不存在识别码的非笔顺象形特殊规则。对汉字进行输入时，全部编码按以下规则输入：

汉字编码＝汉字读音双拼编码+汉字首末两笔画组合成的一个识别码

如果一个汉字只有一个笔画，其识别码取单笔画识别码g

4.特殊识别码的特殊用法。把\’；\\”；；等6个符号分别定为特殊识别码，把其中之一用于少量的特殊的汉字、单位名称、个人姓名等一些汉字、词组、字符串的特殊识别，详见下表：

其中单位名称、个人姓名为使用者的自定义短语

5.当输入一个词汇出现同音重码词汇时，可以使用识别码高效输入，即：

词汇编码＝词汇的双拼编码+词中任意一个汉字的第一识别码

6.整句输入精准高效定位方法。本定位方案用于错误字母、错误字词的快速修改，通过下面步骤实现：

(1).数字定位字母模式：用于输入汉字的识别码、修改输入错误的字母。在双拼输入状态下，每两个字母按输入顺序依次对应一个提示数字，一个长句一次可以定位10个数字即10个汉字。本方案设置三种数字定位开启键，可选择其中之一使用：Alt键、Shift键和空格键。

a.Alt键+一个数字：

当一个长句每两个字母对应的定位数字超过10个且这10个汉字都正确时，如果还想继续用数字定位该长句中的其余字母，此时长按Alt键+右方向键→，则自动向后从第11组字母起依序定位其余字母。其余依次类推。如果定位第二个10组字母之后，又想返回定位第一个10组字母，此时按Home键，光标即可返回到第一个字母位置并重新自动定位第一个10 组20个字母。详见下表：

b.Shift键+一个数字：

c.空格键+一个数字

(2).F1～F9功能键定位中文字词模式：用于修改候选首位显示的长句中错误的字词。

当一个长句对应的分词超过12个且这12个分词都正确时，如果还想继续用功能键定位该长句中的其余分词时，此时可以按一次F12键+右方向键→，则自动向后从第13个分词起从F1～F12依序定位其余12个分词。其余依次类推。如果定位第二个12组分词之后，又想返回定位第一个12组分词，此时按Home键，光标即可返回到第一个分词位置并重新自动定位第一个12组分词。详见下表：

(3).数字键和功能键混合定位模式。

此种混合定位模式指的是数字键和功能键同是定位的模式，即数字定位英文字母，同时功能键定位中文分词。详见下表：

7.进行汉字输入，当不知汉字读音时，除了常见的笔画输入和手写输入方法外，本发明方案提供自有的汉字拆字识别码四码输入方法输入：

使用汉字拆字识别码四码输入方法输入，即依取大优先原则把一个汉字按结构合理地拆分成两个部分，每一部分取两个识别码。汉字结构拆分规则和识别码取码规则与权利要求3中规则相同。如果汉字拆分后的第一部分还能继续拆分成两个次级部分，那么汉字第一部分的两个识别码就是其两个次级部分的前两笔画识别码，次级部分超过两个时取首末两个次级部分的前两笔画识别码；如果汉字拆分后的第一部分是独立部分不能继续拆分成两个次级部分时，那么汉字第一部分的两个识别码就是其独立部分的前两笔画识别码和末尾两笔画识别码。汉字拆分后的第二部分取码规则同此理。如果一个笔画前面已经用过，则后面不再使用。如果不足四码，有几码就输入几码。一个汉字的拆字编码按以下规则依次输入：

在GBK21016个汉字大字符集下，出现约10％的汉字编码重码过多的现象，为避免过多地翻页查找，这部分少量汉字的编码末尾必要时需再附加一个识别码，即在必要时附加所输入汉字的竖笔画总数的代码来降低重码。汉字竖笔画总数的对应代码如下表：

注：表中除4的代码是其英文four的首字母外，其余代码是其数字的汉语拼音的首字母。在21016个汉字大字符集下，统计结果显示一个汉字的竖笔画总数≤10。

8.当按照权利要求1、2、3、4、5、6、7所述输入，汉字、词汇仍有重码时，可使用数字键、翻页键进行选择输入。