CN104951094B

CN104951094B - 一种汉字音形五模式输入方法

Info

Publication number: CN104951094B
Application number: CN201410658122.XA
Authority: CN
Inventors: 李得道
Original assignee: Individual
Current assignee: Individual
Priority date: 2014-11-19
Filing date: 2014-11-19
Publication date: 2018-04-20
Anticipated expiration: 2034-11-19
Also published as: CN104951094A

Abstract

一种汉字音形五模式输入方法，是一种汉字音形2×2组合输入模式+1种纯字形输入模式共五种模式的汉字输入方法，且音码和形码各有两种编码方案。在音码输入上是一种独特流畅的双拼输入方案：用一个英文字母代替汉语拼音中的复合声母或复合韵母；在形码输入上是根据汉字的字形特征：取汉字前两个笔画组合分别来对应一个近似象形的英文字母作为其编码，通过输入一至两个字形识别码从而在同音重码字中无需翻页就能极快捷地识别出所需汉字；不知读音的汉字使用独特的识别码即可按纯字形输入。

Description

一种汉字音形五模式输入方法

技术领域

本发明涉及一种适用于计算机和移动智能设备操作系统中的汉字输入方法。

背景技术

对于汉字输入，在解决易于学习和快捷输入的问题上一直是个难题。在目前已经出现的汉字输入的多种编码方案中，依靠键盘输入的主要有以下几种类型：

第一种是纯字形输入方案。第二种是纯拼音输入方案：全拼输入方案和双拼输入方案。第三种是音形相结合的输入方案。

第一种纯字形输入方案，最具代表性的是五笔字型。五笔字型具有快捷输入的特点，但在是否易于学习的问题上，表现却是最差的，它几乎称得上是最难学习、最难掌握的一种汉字输入方法。它那与字母相对应的大量的字根编码，需要使用者花费几个月甚至更长的时间来学习、练习，死记硬背那些字根才能熟练地掌握它。同时它的拆字规则不统一，有的汉字让学习者不知如何拆分它，甚至要死记某些汉字的拆分规则。在大字符集情形下，同时随着新词汇的大量涌现，五笔字型输入的重码率也越来越多……由于这些缺陷的存在，使五笔字型的使用率越来越低，目前已经降到大约不足10％。在此种输入类型中，其它编码输入方法的使用率与五笔字型相比又相差甚远，故不作赘述。

第二种纯拼音输入方案。先说全拼输入方案，它的单字输入是全拼输入，只是偶尔在输入声母的情形下依靠词频靠前做投机取巧的选择罢了。在输入词汇时才有一定的简化功能，可以适当省略韵母。它的整体输入速度是非常慢的，虽然它的使用率极高，达到90％左右。再说双拼输入，就此前已经公开的几种双拼输入方案而言，由于那些双拼方案都存在不易学、不易记、不易用的缺陷而只有少数人使用，无法流行于大众。

第三种音形相结合的输入类型。目前此种输入类型的输入方案由于输入速度慢、实用性差、识别码不易掌握、无法推广而没有出现具有代表性的、大众化的输入方案。

发明内容

而本人发明的这种汉字音形五模式输入方法旨在克服前面几种汉字输入方法中的多种缺陷，而推出的一种易学、易记、易用的大众化汉字输入方法。

一种汉字音形五模式输入方法，指的是一种汉字音形2×2组合输入模式+1种纯字形输入模式共五种模式的汉字输入方法，包括整句输入用于修改操作的精准定位方法。此输入方法即是一个汉字的编码是用该汉字的双拼音码+字形识别码来进行汉字输入的方案，且双拼音码方案和字形识别码取码方案各有两种模式可供选择，即两种双拼模式+两种字形识别码取码模式，总共产生出2×2四种音形组合的汉字输入方法，由使用者任意自选一种音形组合模式来进行汉字输入的方案。当不知道所输入汉字的读音时，使用纯字形输入模式进行输入。

在双拼方案的26个键位中，两种双拼模式只有8个键位的对应编码是不同的，其余键位的对应编码是完全相同的。在字形识别码方案中，两笔画组合识别码定义方案是完全相同的，只是两种识别码取码模式的取码规则不同，即两者所取两笔画顺序和识别码的数量不同。

本发明技术方案如下：

首先在音码输入上是一种双拼输入方案：用一个英文字母代替汉语全拼中的复合声母(zh、ch、sh)或复合韵母(除单韵母以外的多字母韵母，但包括ü)。那么一个汉字的全拼无论有多少个字母，而在此方案下，无需那么繁琐地输入全部字母，这个汉字的音码只用两个字母就能完成全拼字母的输入。比如：要输入汉字“扬”，如果用全拼输入则需输入如下四个字母yang，而使用本双拼方案只需输入两个字母yd即可，因为复合韵母ang在本方案中用d代替。且本双拼方案与目前已经公开的双拼方案截然不同，其不同之处在于本双拼方案具有一定的合理性、独特性。

双拼方案有两种模式可供选择。先介绍双拼模式一，每个字母所对应的声母或韵母如表1：

表1

没有声母的全拼在双拼输入时用v代替其声母。

根据表1所示的复合声母或复合韵母和字母键之间的编码对应关系，双拼编码模式一提供了记忆口诀，来帮助学习者快速记忆，在最短的时间里熟练地掌握本方案的编码规律。表1中除第二行的声母和其后的韵母不能直接匹配产生一个汉字外(包括V键位编码)，其余三行各个汉字的声母和其后的韵母能够直接匹配产生一个汉字，所以本双拼模式一的编码规律存在一定的关联性、易记性、合理性和独特性。双拼编码模式一有四句记忆口诀，即口诀1“v团主持说：吴茵薄欧喜爱鳍歪鱼，刺！诶！能随棉云跨漂流，工人当街贩黄枣”，如下表2所示：

表2

如上表2中口诀1所示，拼音中的单声母是其后面的复合韵母编码，复合声母的编码是后面的单韵母，其中的汉字记忆口诀“v团(v团：一个演出团的名字)主持(人)说：吴茵薄欧(两个人名)喜爱鳍歪鱼(鳍歪鱼：一种美食)，刺！诶！(吴茵薄欧)能随棉云(棉云：人名)跨(洋)漂流，工人当街(当街：临街)贩黄枣”，这句话的意思可以理解为：“v团主持人说：吴宛薄欧(两个人名)喜爱吃鳍歪鱼(一种鱼做的美食)，刺！诶！(刺多，发出一声叹息)。(两人饭后)能随棉云(人名)跨(洋)漂流，(两人在异国看到)工人(因迫于生计而)当街贩(卖)黄枣”。表1中的复合声母、复合韵母和其编码有一定的合理性、关联性、易记性、易学性。所谓的合理性指的是此种双拼方案非常适合能熟练盲打的人进行流畅地盲打输入。

对于在口诀1中带拼音的汉字来说，其中的复合声母的编码是后面的单韵母，比如表中汉字“主zhu”，它的拼音中的复合声母zh的对应编码就是其后的单韵母u，即zh＝u，当输入汉字遇到声母zh时只需输入一个字母u即可。同样道理，ch＝i，sh＝o。

对于在口诀1中带拼音的汉字来说，其中的复合韵母的对应编码是其前面的单字母，比如表中汉字“漂piao”，它的拼音中的复合韵母iao的编码是前面的声母p，即iao＝p，当输入汉字“漂piao”时输入pp即可。当输入其他汉字遇到韵母iao时只需输入一个字母p代替即可，比如输入汉字“教”，其全拼是jiao，使用本双拼方案只需输入jp。其他复合韵母同此理。(另外通用英文字母键盘中并没有ü，所以韵母ü需要配置一个键位作为编码，本方案中用q键代替，即q＝ü。对于ü的输入遵循汉语拼音的通用记录规则，即当韵母ü和声母j、q、x等相配时，ü简化记录为u，即jü＝ju，qü＝qu，xü＝xu，所以输入汉字遇到jü时只需输入ju即可，而非输入jq。当韵母ü和声母n、l等相配时汉字分别发“女、吕”读音时，韵母ü不作简化记录，在输入时以q键代替，即“女”的编码输入是nq，而非是nu，nu是汉字“奴”的编码。韵母üe、ün、üan等同此规则。)

摒弃杂乱无章的随意对应的双拼编码方式，而寻求一种有内在规律可循的科学的、易学、易记、易用的编码方式，正是本发明中双拼编码方案的独特之处。

再介绍双拼模式二，每个字母所对应的声母或韵母如下表3：

表3

没有声母的全拼在双拼输入时用v代替其声母。

双拼模式二的复合声母和复合韵母与键盘对应关系如表2所示。

在双拼方案的26个键位中，双拼模式二和双拼模式一只有8个键位的复合韵母对应编码是不同的，这些键位分别是W、T、Y、G、J、Z、C、N，其余复合韵母键位的对应编码是完全相同的。双拼模式二保留了双拼模式一的大部分对应编码，保留了双拼模式一的合理性、独特性、关联性和易记性的特征。

双拼模式二同样提供了快速记忆口诀，即口诀2如下表4所示：

表4

如上表4中的口诀2所示，拼音中的单声母是其后面的复合韵母编码，复合声母的编码是后面的单韵母，其中的汉字记忆口诀“v(团)主持(人)曹更说:吴云薄欧喜爱鳍歪鱼，随人员/当面漂流。铁贼犯/弄跨黄金”。这句话的意思可以理解为：“v演出团主持人曹更(人名)说：吴云薄欧(两个人名)喜爱吃鳍歪鱼(一种鱼做的美食)，(两人饭后)随(其他)人员/当面去漂流，(而心中还在痛恨)铁(铁姓)贼犯/弄跨黄金(行情)”。

以上两种双拼模式由使用者根据个人喜好任意选择其中一种使用。

当汉语全拼中没有声母而只有韵母时，除er、ang、eng有一种对应编码外，其余此类韵母均有两种模式的自定义双拼对应编码，同时两种双拼编码可以共存，由使用者任意选择使用，也可以只定义一种对应编码，见表5：

表5

表5中的符号“－”表示无此项对应编码，空格表示由使用者自定义双拼对应编码。

在表5中，多数韵母都能对应两种双拼编码，空格处由使用者自由合理地自定义对应编码。以韵母an为例，比如：输入汉字“安an”时，既可以输入an，也可以输入带零声母的双拼编码vf，因an＝f，两者任选一种定义编码输入。

需要特别指出在表5中，韵母ou在输入时既可以输入eu，也可以输入带零声母的vb(ou＝b)。在这里韵母ou单独使用时是不能输入ou的，因为在本发明的两种双拼模式中都规定声母sh的编码是o，当输入ou时就是输入shu，但ou可以输入eu，即ou＝eu(在传统的汉语拼音方案中ou读作“欧”，严格地说，ou发出的音并不是“欧”，而是“喔”，eu发出的音才是“欧”，所以在本发明方案中规定ou＝eu，以供选择使用)。

其次在识别码输入上，同样有两种识别码(也称为辅助码)取码模式。识别码在输入汉字时放在汉字的双拼音码之后，目的是为了快速识别出所需汉字而无需繁琐费时地翻页查找。先介绍识别码的定义规则，然后再介绍两种识别码取码模式的不同之处。

识别码是根据汉字书写笔画“—∣/、乙”五种基本笔画和汉字字形结构特征来取的，能在同音重码字中更快捷地识别出所需汉字，从而提高输入效率。两个笔画组合对应一个字母，大多数两个笔画组合能分别来对应一个尽似象形的英文字母，这个对应的字母就是同音汉字的识别码。

在输入法时如果不使用识别码，在大量的同音重码字中只能使用翻页键、数字键选择，输入效率低下。在其它双拼输入法中少有识别码，即使有的有识别码，但单字识别码或者稍显复杂不易记忆，或者存在取码不够形象直接，造成输入者思维迟顿的缺陷。在本发明技术输入方案中，两笔画和识别码之间存在象形性联系，无需死记硬背易学易用，这也是本发明技术输入方案中的另一独特之处。

汉字前两笔画组合对应识别码的编码如表6所示：

表6

表中E/x/c/z/s/p/b/t的识别码存在非笔顺象形特殊规则

汉字识别码的取码规则主要依据大小写字母的象形性和汉字前两笔画组合的象形性联系起来，从而建立编码对应关系。但个别前两笔画组合和字母之间不存在象形性，只好做特殊规定处理。在输入识别码时不输入大写字母，只输入小写字母。

如表6所示，前两笔画识别码分5行，共有25个编码，分别对应25个字母。在第一行中，“点点”的编码是“u”，为何是“u”呢？把“点点”联想为“ü”上面的两个点，所以取“ü”的简化字母“u”为编码；“点横”可以联想为手写体小写的“r”左转九十度平躺的变形相似形态；i和v的编码很容易理解，分别是；“点竖”和“点撇”“讠”的编码可以理解为Y的稍微变形。在第二行中“横点”可以理解为“F”中两横笔画(局部)的变形；“横横”理解为“E”中的两个“横”，T、X、c的编码很容易理解。其余三行的编码原理如同第一行和第二行，根据其象形性、相似性、局部性、变形性或特殊性规定来确定编码的，多数识别码的编码对学习者而言很容易理解和记忆。

其中E/x/c/z/s/p/b/t八个识别码有特殊规定，之所以作特殊规定是因为这些汉字的偏旁部首在识别码取码时将会更加直观快捷，同时这些特殊的识别码和正常的汉字结构的前两笔划构成的识别码这两种识别码共存于输入系统中，供输入者自由选择使用。这些有特殊规定的识别码仅适用于识别码取码模式一。偏旁带“山(竖折)、屮(折竖)、出(折竖)、彐(折横)、非(竖横)、镸(横竖)、長(横竖)、印(撇折)、段(撇竖)”等汉字，包括“疟(此字的内部，横折)”这些汉字的识别码根据其笔划结构的象形性取E，不再考虑前两笔画书写顺序，这样使原本几个不同的识别码统一成一个识别码，输入更加快捷方便。汉字“幽(竖折)、豳(横撇)”，同样不考虑笔顺第一识别码直接取E。偏旁带“匚”的汉字，正常笔顺先写“横”，再写“匚”里面的部首，最后一笔画是“匚”的末笔“折”，同样做特殊处理，不考虑笔顺把这个部首“匚”看作一个整体，第一识别码直接取象形的c。如果把带“匚”的汉字按正常笔划顺序取识别码，那么“匚”里面的部首的整体性在取第一个识别码之后就被破坏了，所以做特殊规定处理。同理偏旁“弋(横折)、戈(横折)”也看作一个整体，其识别码为c。汉字偏旁带“氺(shui)、水(shui)”的识别码一律取全拼的首字母s，同样不考虑书写笔顺。还有两个读音都是wan的特殊汉字“卐(折横)、卍(折竖)”，其识别码完全依据象形性分别取ss、zz。还有汉字“〇”，其识别码取o。

表6各个笔画组合中只列出一个示例汉字。其它汉字偏旁部首的前两笔画的识别码可参考表6中的示例汉字来输入。

输入汉字识别码需要注意的是:除了那八个特殊的识别码之外，输入者对汉字笔画的书写顺序的书写习惯必须是正确的，符合通用的汉字笔画书写顺序规范。如表6所示，汉字“力刀乃皮”的笔画书写顺序是：先写“折”，再写“撇”；汉字“九匕迩”的笔画书写顺序是：先写“撇”，再写“折”；汉字“北”的笔画书写顺序是：先写“竖”，再写“横”；汉字“比”的笔画书写顺序是：先写“横”，再写“折”；汉字“了队”的笔画书写顺序是：先写“折”，再写“竖”；汉字“提”的笔画书写顺序是：先写“横”，再写“竖”。那么汉字“了提”的笔画书写顺序的第二笔画为何是“竖”呢？因为在通用的汉字笔画书写顺序规范中这个“竖钩”一律作为“竖”来处理，还有两点水的笔画“冫”作为“点横”来处理，笔画“捺”作为“点”来处理。如果输入者平常书写汉字的笔画顺序符合通用的书写顺序规范，那么在输入汉字识别码时就会容易得多，如输入者有个别汉字的笔画书写顺序不规范，请参考表6所列举的偏旁汉字示例。

对汉字进行输入识别码时，在识别码取码模式一中需要输入两个识别码。第一个识别码是汉字的前两笔画组合成的识别码，输入第二个识别码时，需要依一定的规则把汉字按结构拆分成两部分结构，汉字第二个部分结构的前两笔画组合就是第二个识别码。

如果汉字的字形结构属于上下结构，就把该汉字拆分成上下两个部分，如果汉字字形属于上中下结构，中部不取，两个识别码取上下两个部分的前两笔画；同理，如果汉字字形属于左右结构，就把汉字拆分成左右两个部分，如果汉字字形属于左中右结构，中部不取，两个识别码取上下左右两部分的前两笔画；如果汉字字形属于半包围和全包围的结构就拆分成外围和围内两个部分。汉字结构拆分规则和第二识别码取码规则详情参见表7：

表7

在识别码取码模式一中，进行汉字输入时，汉字按编码规则先输入由汉字读音构成的双拼编码两个字母，再分别输入汉字的前一笔画或前两笔画组合构成的第一个识别码和汉字拆分后的第二部分汉字结构的前一笔画或前两笔画组合成的第二个识别码。即：

汉字编码＝汉字读音双拼编码+汉字第一识别码+汉字第二识别码

汉字的第一识别码或第二识别码也可能只有一个笔画，一个笔画的识别码用g代替。对于汉字只有一个识别码的情况，下面详细说明一下第一个识别码是单笔画的情形：

1.把一个汉字拆分成两部分结构，当其第一部分结构有且只有一个笔画时，其第一识别码取一个笔画。比如：丽、旧、卂等字。

2.把一个汉字按两笔画拆分第一识别码时，其剩余部分从字型上来看第二识别码不易取或第一识别码取两笔画不易取时，且第二部分结构多数情况下是一个汉字时，其第一识别码取一个笔画。比如：白、自、吏、良、正、王、身、未、末等字。

3.当合体字中存在识别码是单笔画的偏旁部首时，这些偏旁部首在合体字中的识别码则改用前两笔画组合而成的识别码。比如：汉字“白”的第一识别码是单笔画g，那么汉字“的”的第一识别码则改为z(撇竖)。其余单笔画识别码的汉字构成合体字时取识别码同此理。

凡是第一识别码是单笔画的汉字，本输入方案同时保留其前两笔画识别码的汉字编码，以照顾初学者，使其更容易地自由输入。

下面举例说明本发明方案的识别码取码模式一的汉字输入。比如：输入汉字“绅”，它的音码双拼是or，第一个识别码是汉字偏旁“纟”前两笔画组合的识别码w，第二个识别码是汉字的右半部分“申”的前两笔画识别码o，所以“绅”的编码是orwo，当输入orwo时，没有重码字，只有一个汉字“绅”，此时用空格键上屏或继续输入则该汉字“绅”就自动上屏；又如：输入汉字“裔”，它的双拼音码是yi，第一个识别码是汉字的上半部分“衣”的前两笔画组合的识别码r，第二个识别码是下半部分“冏”的前两笔画识别码o，所以“裔”的编码是yiro，当输入yiro，出现两个重码字分别是“裔廙”，此时用空格键上屏或继续输入则该汉字“裔”就自动上屏。

只有一个笔画的识别码用g代替。比如：“乙”的识别码是g，即输入yig即可。汉字“丙”拆成“一和内”，所以其第一识别码是单笔画g。又如：汉字“旧”，拆成“丨和日”，所以其第一识别码是单笔画g。

比如输入汉字“疡(拼音：yang)”，在大字符集下，发音为yang的汉字100个左右，如果不使用识别码，又假设输入候选框每页显示10个汉字，有的发音为yang的汉字要翻10次左右才能找到。在初始字频状态下当输入双拼yd后，使用翻页键翻页2～3次才能出现“疡”的显示，此时按数字键选择上屏。如果在输入汉字“疡”时使用本发明技术方案中的识别码输入ydr m，输入法候选框就能快速显示“疡”，且无重码汉字。

在这种汉字读音双拼编码+识别码取码模式一情形下，就一个包含6700多个常用字、2000个非常用字、600多个多音字总共约9395个编码的汉字字符集而言，统计结果显示汉字重码数值范围≤6，这样即使在输入时有的汉字存在重码字，也无需翻页查找，从而达到快捷输入汉字的目的。包含9395个汉字编码的字符集，重码统计数据如下：

无重码的编码共6713个，对应字条总数为：6713，占字库9395个编码总量的71.45％(其

中1906个无重码汉字只需输入一个识别码，占字库总量9395个汉字的20.29％)。

重码有2个(即二选一)的编码共888个，对应字条总数为：1776，占字库总量的18.9％

重码有3个的编码共184个，对应字条总数为：552，占字库总量的5.87％

重码有4个的编码共61个，对应字条总数为：244，占字库总量的2.59％

重码有5个的编码共16个，对应字条总数为：80，占字库总量的.85％

重码有6个的编码共5个，对应字条总数为：30，占字库总量的.31％

重码有7个的编码共0个。

因此本发明技术方案中的识别码能极大地提高汉字输入效率。

下面介绍识别码取码模式二的取码规则。识别码取码模式二的取码规则比较简单，识别码的定义规则和识别码取码模式一相同，参见表6。两种取码模式的区别在于：在识别码取码模式二中不存在识别码的特殊规则，且汉字的识别码只取汉字的首笔和末笔两个笔画组合而非识别码取码模式一的前两笔画组合构成的识别码，同时无需拆分汉字的结构。这样一个汉字只有一个识别码，少量汉字的重码率会略高于识别码取码模式一。综合对比这两种识别码取码方式，识别码取码模式一更加方便快捷，所以提倡输入者使用第一种识别码取码模式。

下面举例说明第二种识别码取码模式的使用，比如：输入汉字用“烊”举例，其双拼音码是yd，在识别码取码模式二中，识别码只取汉字的首末两笔画，“烊”的首笔画是“点、”，末笔画是“竖丨”，其首末两笔画组合构成的识别码是“、丨”的组合，即识别码是i(参见表5)，那么“烊”的全部编码是ydi，当输入ydi时输入法候选框出现5个重码字，此时无需翻页用数字键选择，“烊”字即可上屏。

整句输入精准定位方法。本定位方案用于错误字母或错误字词的快速修改，通过下面步骤实现：

1.数字定位字母模式：用于输入汉字的识别码或修改输入错误的字母。在双拼输入状态下，每两个字母按输入顺序依次对应一个提示数字，一个长句一次可以定位10个数字即10个汉字，如下文所示：

本定位方案设置三种数字定位开启键，可选择其中之一使用：Alt键、Shift键和空格键。

⑴.Alt键+一个数字：

长按Alt键，然后按下需要识别码输入或错误字母对应的数字键。当按下Alt键+数字键之后光标就定位到数字对应的两个字母之后，此时按Tab键则进入识别码输入状态，输入汉字的识别码，若不输入识别码也可从下方候选框中用数字键选择正确的候选汉字。如果需要修改错误字母此时再使用Backspace或Delete键进行字母的删除或重新输入操作。如果需要在两个字母之间插入字母使用左右光标键移动光标位置即可进行输入。

当一个长句定位的数字超过10个且这10个汉字都正确时，如果还想继续用数字定位该长句中的其余字母，此时长按Alt键+右方向键→，则自动向后从第11组字母起依序定位其余字母。如果定位第二个10组字母之后，又想返回定位第一个10组字母，此时按Home键，光标即可返回到第一个字母位置并重新自动定位第一个10组20个字母。数字定位字母时，也可以通过软件设置选择只定位一个字母。

⑵.Shift键+一个数字：

长按Shiftt键，然后按下双拼字母对应的数字键。定位之后其余操作方法同a中方法相同，只是此时使用的定位键是Shift键。

⑶.空格键+一个数字

长按空格键，然后按下双拼字母对应的数字键。定位之后其余操作方法同a中方法相同，只是此时使用的定位键是空格键。

2.F1～F12功能键定位中文字词模式：用于修改候选首位显示的长句中错误的字词，如下文所示：

进行长句输入时，输入系统依据分词筛选技术自动对一个长句进行分词定位，从第一个分词起依序对应F1～F12十二个功能键符，非词汇的单个汉字也作为一个分词来对应定位功能键。当按一次中文分词所对应的功能键松开后，此时再按一次Tab键则该分词自动进入识别码输入状态，此时可以输入分词的识别码来选择正确的词汇，也可以从显示窗口候选提示中选择。

当一个长句定位的分词超过12个且这12个分词都正确时，如果还想继续用功能键符定位该长句中的其余分词时，此时按一次F12键+右方向键→，则自动向后从第13个分词起从F1～F12依序定位其余12个分词。如果定位第二个12组分词之后，又想返回定位第一个12组分词，此时按Home键，光标即可返回到第一个分词位置并重新自动定位第一个12组分词。功能键定位分词时也可以通过软件设置选择只定位单字。

3.数字键和功能键混合定位模式，如下文所示：

此种混合定位模式指的是数字键和功能键同时定位的模式，即数字定位英文字母，同时功能键符定位中文分词。在混合定位模式下，按一次Page Down键，则数字和功能键符同时批量后移定位，按一次Page Up键，则数字和功能键符同时批量前移定位。

输入者可以在软件设置里自由选择使用数字键定位，或者选择功能键定位，或者选择数字键和功能键同时混合定位。

整句输入精准定位方法，使错误字母的修改、错误中文字词的修改变得更加快捷。

本发明中的双拼方案在输入汉字时，需要知道汉字的读音才能输入其音码，当不知汉字读音时，除了常见的笔画输入和手写输入方法外，本发明提供自有的汉字拆字识别码四码输入方法方法进行输入：

使用识别码四码输入方法输入，即依取大优先原则把一个汉字按偏旁部首合理地拆分成两个部分，汉字结构拆分规则与权利要求3中汉字拆分规则相同。如果汉字拆分后的第一部分还能继续拆分成两个次级部分，那么汉字第一部分的两个识别码就是其两个次级部分的前两笔画识别码，次级部分超过两个时取首末两个次级部分的前两笔画识别码；如果汉字拆分后的第一部分是独立部分不能继续拆分成两个次级部分时，那么汉字第一部分的两个识别码就是其独立部分的前两笔画识别码和末尾两笔画识别码。汉字拆分后的第二部分取码规则同此理。如果一个笔画前面已经用过，则后面不再使用。如果不足四码，有几码就输入几码。

在GBK21016个汉字大字符集下，有10％的汉字存在重码过多的现象，为避免过多地翻页查找，这部分少量汉字的编码末尾需再附加一个识别码，即附加该汉字的竖笔画总数的代码来降低重码。在这种情形下，统计结果显示汉字重码数值范围≤19，如果汉字输入提示窗口每页显示10行，则汉字的显示页数≤2页。

汉字竖笔画总数的对应代码见表8：

表8

在表8中除4的代码是其英文four的首字母外，其余代码是其数字的汉语拼音的首字母。在21016个汉字大字符集下，统计结果显示一个汉字的竖笔画总数≤10，因此汉字的竖笔画的最大数值是10。

一个汉字的拆字编码按以下规则依次输入：

汉字编码＝汉字第一部分两个识别码+汉字第二部分两个识别码+汉字竖笔画总数的代码

当此种类型编码字库和其他相同码元类型编码字库同时存在于一个输入系统中时，需要在编码之前添加一个v键或其他特殊的字母(比如e或a)或特殊符号键作为此类编码字库输入的开启键，这样以避免多种同字母码元类型编码字库产生混淆。

当输入汉字或词汇仍有重码时，可使用数字键或翻页键结合数字键进行选择输入。

比如：输入的汉字用“樣”来举例，当不知其读音时，该汉字拆分为左右两个部分，左边偏旁部首是“木”，其前两笔画是“横竖”，识别码是t，末尾两笔画是“撇点”，识别码是a，右边偏旁部首是“羊+永”，“羊”的识别码是v，“永”的识别码是y，所以该汉字的全部编码是tavy，当输入tavy后，出现3个重码字，此时用选择数字键选择，“樣”即可上屏。

比如：输入汉字“嫣”，该汉字拆分为左右两部分，左边部首“女”的前两笔画是“折撇”，识别码是m，末尾笔画是“横”，识别码是其单笔画g，右上角“正”的前两笔画是“横竖”，识别码是t，右下角前两笔画是“横折”，识别码是c，所以该汉字全部编码是mgtc，当输入mgtc后出现2个重码字，此时选择用数字键选择，“嫣”即可上屏。

再举例说明一下当输入者无法立即知道所输汉字读音时，使用全字形识别码四码输入的方法来输入。比如:输入汉字“靠”，依取大优先原则，把该字拆分成“告”和“非”上下两个部分，再把每一个部分各自拆分成两个次级部分，“告”的两个识别码是lo，“非”的两个识别码是ee，所以“靠”的全字形识别码四码输入全部编码是loee。同理，汉字“赢”拆分取码的部首是“亡、口、月、凡”，所以“赢”的全部编码是ross。

当输入独体字时，能拆则拆。比如汉字“北、比”拆成左右两部分来输入。当不能拆分时，依笔画顺序每两笔画组合来输入前六个笔画，最后一码输入末尾两笔画。当独体汉字笔画不足八画时，识别码输完为止。

在使用汉字拆字纯字形识别码输入时，个别汉字的拆分需注意拆分的合理性。比如：“亘”，拆分成“一+旦”，“来”拆分成“一+米”，“夹”拆分成“夫+丷”，“爽”拆分成“大+乂乂乂乂”，这样处理将会更加方便取码。

如上所述，本发明技术“一种汉字音形五模式输入方法”是一种易学易用的汉字输入方法。此两种双拼方案、此两笔画识别码定义及取码方案和全字形识别码输入方案、用于整句输入修改操作的数字定位混合定位和批量后移定位批量返回定位方案等都是本发明所独有的技术。

具体实施方式

一种汉字音形五模式输入方法，由输入法软件开发人员利用专业的编程技术制作出不同的客户端软件产品，即可供计算机或移动智能设备端的用户下载安装使用。

Claims

1.一种汉字音形五模式输入方法，是一种汉字音形2×2组合输入模式+1种纯字形输入模式共五种模式的汉字输入方法，即是一个汉字的编码是用该汉字的双拼音码+字形识别码来进行汉字输入的方案，且双拼音码方案和字形识别码取码方案各有两种模式可供选择，当不知道所输入汉字的读音时，使用纯字形识别码输入模式进行输入，其特征在于包括以下步骤：

在音码输入上是一种用简化的双拼输入代替全拼输入的方案,且有两种双拼模式可供选择，用一个英文字母来代替汉语拼音中的复合声母或复合韵母：

A.双拼模式一

每个字母所对应的复合声母或复合韵母如下表：

没有声母的拼音在双拼输入时用v代替其声母；

B.双拼模式二

每个字母所对应的声母或韵母如下表：

没有声母的拼音在双拼输入时用v代替其声母。

2.根据权利要求1所述的方法，其特征在于：当汉语拼音中韵母单独使用而不存在与声母相配时，除er、ang、eng有一种对应编码外，其余几个韵母均有两种模式的自定义双拼对应编码，同时两种编码可以共存，供使用者任意选择使用，也可以只定义一种对应编码，如下表：

单独使用的韵母对应自身编码方案对应零声母编码方案对应其他编码方案 er er －－ ang － vd － eng －－ ei － en － an － ai － ao － ou － eu a － o － e －

表中的符号“－”表示无此项对应编码，空格表示由输入者自定义双拼对应编码。

3.根据权利要求1所述的方法，在识别码输入上是根据汉字书写笔画“—∣/、乙”五种基本笔画和汉字字形特征：取汉字偏旁部首的前两个笔画组合，大多数组合能分别来对应一个尽似象形的英文字母，从而在同音重码字中更快捷地识别出所需汉字，识别码有两种取码模式可供选择使用，识别码在输入时一律使用小写字母，其对应键位如下表：

表中E/x/c/z/s/p/b/t的识别码存在非笔顺象形特殊规则

根据汉字偏旁部首的前两笔画的象形性构成的识别码，能够使学习者很容易掌握。

4.根据权利要求3所述的方法，其特征在于：识别码有两种取码模式可供选择，分别是按汉字结构取码和汉字首尾两笔画取码，识别码取码模式一：

对汉字进行输入识别码时，输入两个识别码，即把汉字按结构拆分成两部分结构，汉字的前两笔画组合是第一个识别码，汉字拆分后的第二部分结构的前两笔画组合是第二个识别码，汉字拆分规则和第二识别码取码规则如下表：

识别码中的非笔顺的象形特殊规则仅适用于识别码取码模式一，对汉字进行输入时，全部编码按以下规则输入：

汉字编码＝汉字读音双拼编码+汉字的第一识别码+汉字第二识别码；

识别码取码模式二：此识别码取码模式下，只取一个汉字识别码，即：取汉字的首笔画和末笔画两笔画相结合产生的一个识别码作为同音汉字的识别，对汉字进行输入时，全部编码按以下规则输入：

汉字编码＝汉字读音双拼编码+汉字首末两笔画组合成的一个识别码

如果一个汉字只有一个笔画，其识别码取单笔画识别码g。

5.根据权利要求1或2所述的方法，其特征在于：当在整句输入中出现错误字母或错误字词时，可通过下面步骤实现整句快速修改，即整句输入精准定位的三种方法：数字定位字母模式：用于输入汉字的识别码或修改输入错误的字母；在双拼输入状态下，每两个字母按输入顺序依次对应一个提示数字，一个长句一次可以定位10个数字即10个汉字；设置三种数字定位开启键，可选择其中之一使用，Alt键、Shift键和空格键：Alt键+一个数字，长按Alt键，然后按下需要识别码输入或错误字母对应的数字键，其对应的数字是输入系统自动同步呈现在输入框中的；当按下Alt键+数字键之后光标就定位到数字对应的两个字母之后，此时按Tab键则进入识别码输入状态，可以输入汉字的识别码，若不输入识别码也可从下方候选框中用数字键选择正确的候选汉字；如果需要修改错误字母此时再使用Backspace或Delete键进行字母的删除以及重新输入操作；如果需要在两个字母之间插入字母使用左右光标键移动光标位置即可进行输入；当一个长句定位的数字超过10个且这10个汉字都正确时，如果还想继续用数字定位该长句中的其余字母，此时长按Alt键+右方向键→，则定位系统自动向后从第11组字母起依序定位其余字母；如果定位第二个10组字母之后，又想返回定位第一个10组字母，此时按Home键，光标即可返回到第一个字母位置并重新自动定位第一个10组20个字母；数字定位字母时，也可以通过软件设置选择只定位一个字母；F1～F12功能键定位中文字词模式，用于修改候选首位显示的长句中错误的字词：进行长句输入时，输入系统依据分词筛选技术自动对一个长句进行分词定位，从第一个分词起依序对应F1～F12十二个功能键符，这些功能键符也是输入系统自动同步呈现在输入框中的，非词汇的单个汉字也作为一个分词来对应定位功能键；当按一次中文分词所对应的功能键松开后，此时再按一次Tab键则该分词进入识别码输入状态，此时可以输入分词的识别码来选择正确的词汇，也可以从输入窗口显示的候选提示中选择；当一个长句定位的分词超过12个且这12个分词都正确时，如果还想继续用功能键符定位该长句中的其余分词时，此时按一次F12键+右方向键→，则定位系统自动向后从第13个分词起从F1～F12依序定位其余12个分词；如果定位第二个12组分词之后，又想返回定位第一个12组分词，此时按Home键，光标即可返回到第一个分词位置并重新自动定位第一个12组分词；功能键定位分词时，也可以通过软件设置选择只定位单字；数字键和功能键混合定位模式：此种混合定位模式指的是数字键和功能键同时定位的模式，即数字定位英文字母，同时功能键符定位中文分词；在混合定位模式下，按一次Page Down键，则数字和功能键符同时批量后移定位，按一次Page Up键，则数字和功能键符同时批量前移定位；对于使用哪一种定位修改方式，可由输入者从软件设置里选择而设定。

6.根据权利要求1～4任意一项所述的方法，其特征在于：进行汉字输入时，当不知汉字读音时，使用汉字拆字识别码四码输入方法输入，即依取大优先原则把一个汉字按结构合理地拆分成两个部分，每一部分取两个识别码；汉字结构拆分规则和识别码取码规则与权利要求3中的规则相同；如果汉字拆分后的第一部分还能继续拆分成两个次级部分，那么汉字第一部分的两个识别码就是其两个次级部分的前两笔画识别码，次级部分超过两个时取首末两个次级部分的前两笔画识别码；如果汉字拆分后的两个部分都是独立部分不能继续拆分成两个次级部分时，那么汉字每部分的两个识别码就是其独立部分的前两笔画识别码和末尾两笔画识别码；如果一个笔画前面已经用过，则后面不再使用，如果不足四码，有几码就输入几码；一个汉字的拆字编码按以下规则依次输入：

在GBK21016个汉字大字符集下，出现10％的汉字编码重码过多的现象，为避免过多地翻页查找，这部分少量汉字的编码末尾需再附加一个识别码，即附加所输入汉字的竖笔画总数的代码来降低重码，汉字竖笔画总数的对应代码如下表：

汉字竖笔画总数对应代码 1 y 2 e 3 s 4 f 5 w 6 l 7 q 8 b 9 j 10 o

表中除4的代码是其英文four的首字母外，其余代码是其数字的汉语拼音的首字母，在21016个汉字大字符集下，统计结果显示一个汉字的竖笔画总数≤10。

7.根据权利要求1～4任意一项所述的方法，当输入汉字或词汇仍有重码时，可使用数字键或翻页键结合数字键进行选择输入。