CN101504572A

CN101504572A - 完善汉字码输入法

Info

Publication number: CN101504572A
Application number: CNA2008100807180A
Authority: CN
Inventors: 王治阳
Original assignee: Individual
Current assignee: Individual
Priority date: 2008-02-07
Filing date: 2008-02-07
Publication date: 2009-08-12

Abstract

一种计算机汉字编码输入方法即完善汉字码输入法，它由音码和形部编码两部分组成，形部编码的取码规则是：独体字，按书写顺序取前二个基本部件的代码编码；合体字，按书写顺序各取首部和剩部的第一个基本部件的代码。由于同音同偏旁的合体字除偏旁外的部分的第一笔为同类基本笔画的情况更是出乎意外的少，因此只需选用27个基本部件和五种基本笔画就能做到既简单又快速。

Description

完善汉字码输入法

技术领域

本发明属于电脑汉字编码输入方法，也就是计算机汉字输入法。因为本发明是对汉字码输入法的优化完善，所以称为完善汉字码输入法，还涉及了为实现这一输入法的键盘。

背景技术

键盘输入法是目前汉字输入法中技术最成熟，使用最广泛的输入法。汉字编码是指用一组代码表示一个汉字。键盘输入的特点是必须对输入的汉字进行编码，按汉字编码所在键，通常要按1～4键输入一个汉字。键盘输入按编码划分，可分为音码、形码、音形码三类。

音码是以汉语拼音为基础，利用汉字的读音进行编码。音码的优点是使用方便，只要会普通话，就可以进行输入，简单易学，所以使用最为广泛。缺点是同音字多，导致单字重码率高，汉字输入速度慢，采用智能拼音输入法也只能部分提高输入速度，无法完全避免同音字选择。还有对不认识的字无法用拼音直接输入，对发音不准的字也不能很快输入。

形码利用汉字的字形特征进行编码，克服了音码重码率高、输入速度慢等缺点，但往往汉字部件太多，记忆麻烦，另外有时拆分也麻烦。有的形码采用将汉字五种基本笔画二二组合的方法，汉字部件少，记忆方便，但却付出了不够直观，将汉字部件拆散了的代价。虽然形码虽然声称对不认识的汉字也能迅速输入，但对于一个文盲来说，他打字的速度是要受限制的，根本原因是汉字的字与词无明显间隔，不知道哪个是词组，无法利用词组输入，因此形码输入人员也要有文化。

音形码利用汉字的语音特征和汉字的字形特征编码。它利用了汉字的音码和形码各自的优点，兼顾了汉字的音和形，往往较为简单，容易学习和记忆，有的音形码比如三五音码等输入法重码率低，输入速度足以与任何形码相比，利用整个拼音的音形码还有利于推广普通话，优点十分明显。音形码的缺点是打字时在音和形之间思维不断转换，容易疲劳，当然对打字熟练者来说，往往已熟记汉字的编码，见字识码，根本不存在音和形之间思维转换问题。还要指出的是，只用汉字声母参与编码的音形码，由于必须舍弃韵母，与人们的习惯思维不符，才特别存在音形转换问题。如果完整地利用了汉字的声母和韵母，即利用了汉字的整个拼音，并且规定音码部分在先，形部编码部分在后的话，则思维不大需要在音和形之间不停转换，基本不会影响思维。因为在一般的文章中，大多数都是词语，平常打字时，往往尽量采用词组输入的方式，因此大部分内容都可用拼音词组输入。还有一些常用的字也可用拼音输入，即便要用到形部编码，一般也只要输入形部编码的第一码，而形部编码的第一码多为汉字的偏旁，偏旁数量是有限的，且常见偏旁数量更少，一般都用固定编码代码，是很容易记住形部编码的第一码的。真正需要输入形部编码第二码的单字是很少的，只有这少部分汉字才不大容易记住形部编码，由于输入形部编码的第一码后，第二码会提示出来，因此实际上没有多大必要需要记住形部编码第二码，因此这种音形码基本不会影响思维。所以如果想发明音形码，为避免音形转换麻烦，要尽量利用汉字的整个拼音输入，而不要只利用拼音的首字母或声母。受方言的影响，有些人读不准某些汉字的拼音，但这也可通过南方模糊音解决，而且多利用拼音输入汉字也有利于推广普通话。正因为如此，整个汉字拼音在先的音形码相对与其它音码、形码、只用汉字拼音首字母的音形码来说，越来越显示出其优越性。

可使用全拼的话，则存在着拼音的码长过长，输入不便的问题，利用双拼则能使码长大为缩短，可目前的大多数双拼都比较难记，要记什么口诀，所幸的是本人发明了几种新的双拼，由于发明人是王治阳，所以称为王治阳双拼，已申请专利，很简单易学，不要记口诀，几分钟就可学会。所以发明音形码的关键是发明出简单易学且能有效区分同音字的方法，这就要靠音形码的形部编码部分设计简单合理，然而目前各种利用了拼音的音形码的形部编码往往存在汉字部件过多或部件不够直观规范或取码规则不合理等问题。如何选用尽可能少的汉字部件，使重码率尽可能低，是一个未解决的大难题。

针对于此，本人发明了汉字码输入法，它在王治阳双拼后，再利用28个多笔画部件和五种基本笔画输入形部编码，具有汉字部件简单、直观、规范的优点，稍微不足的是基本部件排列时按笔画数排列，有点不便记忆，若用拼音或象形排列可能记忆更方便点。另外取码规则规定合体字的首部只有一个基本部件时才能取剩部的基本部件，这也会造成一定的重码，特别是以辶、阝、鸟结尾的汉字会造成一定数量的重码，必须纠正，于是本人潜心研究后推出了按拼音声母或象形排列的优化汉字码输入法，并对取码规则做了优化规定，规定合体字取部首的首尾二个部件或部首的前两个部件编码，当部首只有一个基本部件时，按书写顺序取剩余部分的第一个部件编码。可这一规定也有个缺点，那就是需要认识近200个部首，并且部首在字尾的汉字在编码时有时会与书写顺序不符。

发明内容

这样，目前的汉字输入法要么汉字部件不规范或选取汉字部件过多；要么码长太长；要么重码过高，影响输入速度；要么只利用汉字的声母或拼音首字母；要么不够直观；要么取码规则不太合理，都没能很好解决简单的不快速，快速的不简单这一技术难题，输入汉字不甚方便。

本发明的目的是提供一种汉字部件规范直观、简单易学、输入汉字简便快捷、取码规则合理的计算机汉字编码输入方法，那就是完善汉字码输入法。

为达到完善汉字码输入法的目的，本发明规定完善汉字码的编码由音码和形部编码两部分组成。音码部分采用王治阳双拼，占二码。形部编码部分也最多占二码。当然音码也可用全拼或其它双拼或注音字母。

音码部分采用王治阳双拼，王治阳双拼将韵母按第一个字母分为a、o、e、i、u区，每区又按韵母个数多少以及a、o、e、i、u、n、g的顺序排列，极具规律性，当然也可不按韵母的个数，只考虑按a、o、e、i、u、n、g的顺序将韵母分区排列。唯一需要记忆的是双拼韵母的合并规律。在记忆双拼韵母合并规律时，只要记住以a、ong结尾的多个字母的韵母合并，以ang结尾的4个字母的韵母合并排列就是，另外ui排在v上，uo排在o上，读音简记为“为余”(为我)，“我窝”。

形部编码也由两个代码组成，本发明优选了五种基本笔画和27个多笔画部件参与编码，这五个基本笔画和多笔画部件被称为基本部件，简称部件，全部选自汉字的偏旁部首，简单常见又直观，并且数量少，容易记忆。由于国家语委将五种基本笔画也归类为汉字部件，因此在本发明中称五种基本笔画称为单笔画部件，而27个优选的汉字部件由多个笔画组成，称为多笔画部件。在形部编码时要优先按笔画多的基本部件编码，否则选取多笔画部件就无意义。

形部编码的取码规则是：独体字，按书写顺序取前二个基本部件的相应代码编码，当只有一个基本部件时，就只取这个基本部件的相应代码编码，当然也规定独体字按书写顺序取第一个和最末个基本部件的相应代码编码。合体字，按整体结构将合体字一分为二，先写部分为首部，后写部分为剩部，按书写顺序分别取首部的第一个基本部件和剩部的第一个基本部件的相应代码编码。

这一编码规则既十分简单又能有效地降低重码。在国标6763个汉字中，合体字占了绝大多数，约为95％。同音又同偏旁的合体字数量较多，约有五、六百对。氵、艹、口、木、扌、钅、亻、女、讠、忄、月、虫、土、纟、火、疒、、、山、石、日、王、阝、鱼、礻包括衤、禾等偏旁部首产生的同音字较多，为降低重码，这些偏旁被选了出来，分别用一个字母或别的符号编码，当然个别偏旁也可弃而不选。考虑到礻与衤属于不同的部首，总共只能减少五对左右的重码，因此在完善汉字码输入法编码实例中弃而不选。而有的偏旁部首虽然常用，可只有一、二对同音字，甚至没有同音字，因此弃而不选。本人研究还发现，将合体字一分为二后，同音同偏旁部首的合体字除偏旁部首外的部分的第一笔为同类基本笔画的情况出乎意外的少，只有100多对，其中部件“十”和“宀”出现得比较多，有四、五对重码，它们也可被选出，分别用别的字母或符号编码。这一发现是只选用5种基本笔画和二三十个基本部件参与编码的原因所在。考虑到汉字部件“十”往往不出现在汉字的首部，而“宀”在首部也出现得较多，因此，在完善汉字码输入法中弃“十”而选“宀”，将“宀”用一个字母或别的符号编码。这样，26个多笔画部件和五种基本笔画被优选出来，排列到键盘上，将这26个多笔画部件分别用一个相应的字母或标点符号编码，在编码实例中用多笔画部件都排在字母键上。部件辶、阝、鸟惯常出现在字尾，其中阝已被列为基本部件，鸟首笔为撇，根据合体字的取码规则取码不大会产生重码，就弃而不选，而部件辶的首笔为点，由于点在独体字或合体字的第二部分的首尾位置出现较为常见，将部件辶按点编码容易造成重码，因此也将它列为基本部件，为降低重码，将辶与疒合并排列，用同一个字母或符号编码。这样共优选了27个多笔画部件。而五种基本笔画则可从减少重码角度出发，可选其中的几个笔画与27个多笔画部件合并排列在同一个键上，用同一个字母或符号编码。当然这27个多笔画部件不是固定的，可少于27个多笔画部件，也可多于27个多笔画部件，只要27个左右即可，例如也可将汉字部件“十”入选，用一个字母或标点符号编码。

为便于记忆，在完善汉字码输入法中排列多笔画部件时不按笔画数和横、竖、撇、点、折的次序排列，而按拼音或象形排列，见附图3或附图4所示。本人建议按附图3排列，它以按基本部件的拼音字母排列为主，对少数几个同声母的基本部件改按象形的方式排列。这样由于按基本部件的读音编码几乎无需记忆，实际上只要记住少数几个同声母的基本部件即可，由于这少数几个同声母的基本部件是按与英文字母形似编码，所以能很快记住，记忆量很小，当然汉字的部件与西文字母有所区别，只能部分相似。附图4完全按象形排列，可汉字的方块笔画部件与西文字母毕竟有所区别，难以做到十分相像，需要按象形记忆的汉字基本部件就要多上几倍，记忆量也相应多上几倍，因此本发明也不太建议用这种方式排列经过优选的基本部件。当然有人可能更喜欢这种排列方式。横、竖、撇、点等基本笔画的在本编码中出现的频率较高，为降低重码，不宜与基本部件排在同一键上，排到标点符号键上，用标点符号编码比较合理。折因为频率太低，与有的多笔画部件排在同一健上，用同一个字母或符号编码的话，几乎不会导致重码，因此就按拼音首字母排列。将合体字的首部、剩部分别按书写顺序各取一码，五种基本笔画尽量不与优选的多笔画部件合并排列，这是降低重码的关键。另外之所以规定独体字最好按书写顺序取前两个基本部件的相应代码的编码，是为了便于头脑反应，又不会增加重码。

这样，通过优选27个多笔画部件和五种基本笔画，优化规定取码规则，就做到了形部编码既简单、容易记忆，又能有效地区分同音字，重码率很低。这就解决了其他任何输入法都未能解决的难题，真正做到了简单直观、重码率很低、输入快速，是一种唯一的理想的完善的汉字输入法。这就是称为完善汉字码输入法的根本原因。

附图说明

附图1为王治阳双拼键盘排列图之一

附图2为王治阳双拼键盘排列图之二

附图3为形部编码键盘排列图之一

附图4为形部编码键盘排列图之二

具体实施方式

完善汉字码由两部分组成，一部分是音码，即拼音，或称拼音码，另一部分是形部编码。完善汉字码的两部分可前可后，一经选定，不能改变，为便于想打，与思维一致，又能充分利用标点符号键，建议拼音在先，形部编码在后，在编码实例中就采用这种方法。拼音可采用全拼或双拼或简拼或不完整拼音，不想学习双拼的人可采用全拼，即采用一个汉字的完整拼音。为缩短码长，提高输入速度，建议使用双拼，最好采用几分钟可学会的王治阳双拼。当然也可使用全拼，它几乎不要记忆，现在汉字输入技术有了很大的进步，可做到全拼、双拼兼容，而不需要调整输入法状态。在实施例中选用王治阳发明的双拼，同时也可兼容全拼。

王治阳双拼是一种声母、韵母的键位配置合理，在键盘上排列规律性强的双拼计算机汉字输入法。可单独作为一种输入法使用，也可作为完善汉字码的音码部分使用。

王治阳双拼的技术方案的特征在于：

(1)单个字母的声母与各字母键一致，而翘舌音ch、sh、zh按音序分别用i、u、v表示，以便于记忆，当然也可将ch用u表示，sh用i表示，单韵母ü用字母v表示，根据韵母的语音互补关系，单个字母的韵母除了可排按声韵合并规律，被它包含的韵母外，不能再排其它韵母。复韵母和鼻韵母也用单个字母表示，开口呼韵母配置在标准键盘中排，并按第一个字母分为a、o、e区；齐齿呼韵母配置在键盘上排，称为i区，合口呼和撮口呼韵母配置在标准键盘下排，称为u区，包括ü区；每区又按韵母字母个数从左到右排列，字母个数相同的韵母按a、o、e、i、u、n、g的次序从左到右排列。见附图1。当然也可将合口呼和撮口呼韵母配置在键盘上排，称为u区，齐齿呼韵母配置在键盘下排，称为i区。在编码实例中不这么排列。

(2)各韵母与字母映射关系设定为：

a——a b——uai c——un ün d——ai

e——e f——an g——ang h——ou i——i

j——ong iong k——ei l——en m——uang iang

n——uan üan o——o uo p——ing

q——ie r——in er s——ao t——iao

u——u v——ü ui w——iu x——ue üe

y——ian z——ua ia ；——eng

见附图1所示。这里翘舌音ch、sh、zh按音序分别用i、u、v表示，本人认为这种双拼键盘排列方式是比较理想的，因此在编码实例中采用这种双拼。

当然也可不考虑韵母的个数，对每区按韵母字母根据a、o、e、i、u、n、g从左到右排列；

这时各韵母与字母映射关系设定为：

a——a b——uang iang c——uan üan d——ai

e——e f——an g——ang h——ou

i——i j——ong iong k——ei l——en

m——un ün n——ue üe o——o uo p——ing

q——iao r——ie er s——ao t——iu

u——u v——ü ui w——ian x——uai

y——in z——ua ia ；——eng

在键盘上的排列如附图2所示，这里为防止绕过专利，ch用u作代码，sh用i作代码，zh仍用v作代码。当然也可将字母个数相同的韵母按英文音序从左到右排列。还可不考虑字母个数，将韵母按英文音序排列。

(3)只有韵母没有声母的，取e或。或a作声母，还可取韵母的第一个字母作声母代码，再补上韵母代码，在编码实例中选用e作声母代码；选用e作声母代码有个优点，那就是er排在r上的话，就能做到全拼与双拼的拼写形式完全相同。

(4)完善汉字码输入法的音码部分的输入步骤为：按双拼根据上述声母或韵母与字母键的映射关系依次输入单个汉字的声母和韵母。

下面再对形部编码作详细说明。

汉字可分为独体字和合体字二类。合体字是指具有左右、上下、包围结构的汉字。独体字是指不具有左右、上下、包围结构的汉字。根据整体结构将合体字一分为二，也就是说将合体字左部与右部或者上部与下部或者包围部分与被包围部分分开，含首笔画的部分为首部，即首部含有汉字书写顺序的第一个笔画，除首部外的剩余部分为剩部。这一划分是很有用的，例如有的包围结构的汉字如“或”、“载”等字，它的包围部分按笔顺要分开书写，由于规定含有第一笔的部分为首部，不含第一笔的部分为剩部，“或”字的首部就为“戈”，余下的部分就为剩部，“载”字的剩部就为“车”，其它部分为首部。对左中右结构或上中下结构的汉字，可规定将其中间部分划为剩部，当然也可规定将中间部分划分到首部，右边部分划分剩部，在编码实例中规定将中间部分划分到剩部。对上中下结构的汉字，将其上面部分划分为首部，中间部分、下面部分划为剩部，当然也可规定将中间部分划分到首部，在编码实例中规定将中间部分划分到剩部。

为降低重码，本发明还规定了成字优先的划分原则。当一个汉字为上中下结构或左中右结构时，若两边都能成字的话，要按“两边都成字优先”的原则划分，若一边能成字的话，要按“一边成字优先”划分。如“营”字，是上中下结构，若把艹列为首部，则两边都不能成字，若把“吕”列为剩部的话，一边能成字，因此要把“吕”列为剩部。又如“案”字，若把“宀”列为首部，则两边都不能成字，若把“木”列为剩部的话，则两边都能成字，所以要将“安”列为首部，“木”列为剩部。当然这类字可采用容错码技术予以解决。容许一个合体汉字按不同的划分，进行编码。

合体字的最佳划分方法是根据绝大部分的合体字都为形声字的特点进行划分，将义部和声部分为二个部分，这样“案”字，必定声部“安”列为首部，义部“木”列为剩部。“营”字的话，“吕”列为剩部。还有的合体字为会意字，也可按会意结构拆分。

又将汉字的各种笔画按国家语委的规定归类为横、竖、撇、点、折五种基本笔画。笔画是书写汉字时，不间断地一次写成的一个线条，在只考虑汉字笔画的运笔方向，而不计其轻重长短时，可将笔画归类为横、竖、撇、点、折五种基本笔画，其中提并入横，竖钩并入竖，捺并入点，其余各种带转折的笔画并入折，在本发明中将横、竖、撇、点、折五种基本笔画称为单笔画部件。为降低重码，还优选27个组字频率或实用频率高的几个笔画结构即国家语委规定的汉字部件排到字母键上，参与编码，在本发明中称为多笔画部件。

形部编码的取码规则是：独体字，按书写顺序取前二个基本部件的相应代码编码，当只有一个基本部件时，就只取这个基本部件的相应代码编码，当然也规定独体字按书写顺序取第一个和最末个基本部件的相应代码编码，为与合体字的编码规则保持连贯，特别是首部为基本部件的合体字的编码保持一致，建议规定按书写顺序取前二个基本部件的相应代码编码，这样取码不会导致重码增加，还有利于思维一致。合体字，按整体结构一分为二，先写部分为首部，后写部分为剩部，按书写顺序分别取首部的第一个基本部件和剩部的第一个基本部件的相应代码编码。

这一编码规则是长年潜心研究和突发灵感的结果。在汉字中，合体字占了绝大多数，约为95％。同音又同偏旁部首的合体字数量较多，约有五、六百对。其中氵、艹、口、木、扌、钅、亻等偏旁部首产生的同音字最多，氵约有六十余对同音字，其它的也有三、四十对同音字，为降低重码，这些偏旁部首必须被选出，分别用一个字母或别的符号编码。女、讠、忄、月、虫、土、纟、火、疒等偏旁部首就只有十来对同音字，为降低重码，这些偏旁部首也要被选出，分别用一个字母或别的符号编码。、、山、石、日、王、阝、鱼、禾等偏旁部首只有五对左右的同音字，为降低重码，这些偏旁部首也可被选了出来，分别用一个字母或别的符号编码，当然个别偏旁也可弃而不选。而有的偏旁部首如“田”、“目”、“贝”、“车”、“酉”、“犭”、“饣”等虽然常用，可只有二、三对同音字，甚至没有同音字，因此弃而不选。部件“犭”的重码相对较多，也可将它入选多笔画部件，在编码实例中没入选。本人研究发现，同音同偏旁部首的汉字的除偏旁部首外部分的第一笔为同类基本笔画的情况更是出乎意外的少，只有100多对，其中部件十、宀出现得比较多，宀还经常出现在剩部的首位，因此宀被选了出来，接着将26个多笔画部件分别用一个字母或别的符号编码，建议将这26个多笔画部件分别用一个字母编码。部件辶惯常出现在剩部，按编码规则要取剩部辶的第一个笔画点，按点编码，由于点在剩部第一个位置的组字频率很高，容易造成重码，因此也将它列为基本部件。这样共有27个多笔画部件。辶惯常出现在字尾，而疒惯常出现在字首，两者位置不同，不会造成重码，因此将它们合并排列，用同一个字母或符号编码。为便于记忆，排列时主要以多笔画部件的读音的声母为代码。为避免重码，还将若干声母相同的部件取了出来，改按象形或韵母的方式编码。按照取码规则，横、竖、撇等基本笔画的出现的频率较高，为降低重码，不宜与多笔画部件排在同一个键上，在编码实例中，将它们分别排到三个标点符号“，”、“.”、“/”键上，用三个标点符号“，”、“.”、“/”编码，比较有序合理。点、折等基本笔画的组字频率相对较低，可将它们与多笔画部件合并排列，分别用两个字母编码。当然由于基本笔画点的组字频率与撇相差不大，而且出现在独体字以及合体字的第二部分的首位和尾位的频率很高，也可将基本笔画点排在其它一个标点符号键上，用该标点符号编码，比如排在“；”上，用“；”编码，或者排在“’”上，用“’”编码。在编码实例中，点用“；”编码。还可将基本笔画折排到其它一个标点符号键上，用该标点符号编码，在编码实例中基本笔画折按折的声母z编码。将横、竖、撇、点四个基本笔画分别用四个标点符号编码还有个好处，那就是充分利用了键盘上的30个键，扩大了编码空间，又不影响指法和标点符号的输入。

27个多笔画部件和五种基本笔画在键盘上的优选排列见附图3所示。27个多笔画部件、五种基本笔画与字母、标点符号的影射关系设定为：

a——鱼 b——疒辶 c——艹 d——氵

e——禾 f——扌 g——宀 h——火

i——虫 j——钅 k——口 l——纟

m——木 n——女 o——日 p——阝

q——月 r——亻 s——石 t——土

u——山 v—— w——王 x——忄

y——讠 z—— 折；——点

，——横 .——竖 /——撇

根据设定关系将部件分别用相应的字母和标点符号编码。下面作具体解说：a似鱼，鱼的字首又与A相似；b是疒的声母；c是艹的声母；d是氵的声母；e是禾的韵母；f似扌；g是宀的声母；h是火的声母；i因为ch排在其上，而ch是虫的声母；j是钅的声母k是口的声母；L似纟的首笔；m是木的声母；n是女的声母；o似日即太阳的外形；p似阝；Q似有时残缺有时圆的月亮，就作为月代码r是亻的声母；s是石的拼音的首字母；t是土的声母u因为sh排在u上，而sh是山的声母；v因为zh排在u上，而zh是的声母；w是王的声母；x是忄的声母；Y是讠的声母；z是和折的声母；这些字母就分别作为相应的部件的编码。“；”作为点的代码；“，”作为横的代码“.”作为竖的代码；“/”作为撇的代码。将四个标点符号用作横、竖、撇、点的代号，有两个好处：一是避免这四个基本笔画与多笔画部件排在同一键上后，与多笔画部件编码相同，发生重码。二是扩大了编码空间，又不会影响标点符号的输入。

当然也可以汉字部件与英文的相似程度排列，即根据象形排列。一种优选的排列见附图4。这时27个多笔画部件、五种基本笔画与字母、标点符号的影射关系设定为：

a——亻 b——日 c——宀 d——石

e——山 f——扌 g——足 h——艹

i——讠 j——疒辶 k—— l——忄

m——木 n——月 o——口 p——阝

q——虫 r——女 s——氵 t——土

u——鱼 v——钅 w——纟 x——火

y——禾 z——王、折；——点

，——横 .——竖 /——撇

根据设定关系将基本部件分别用相应的字母和标点符号编码。

下面作具体解说：大写a似亻；大写b似日；c似宀；d似石，框在下部；大写e似山；f似扌，特别似反扌；g似足，框在上部；大写h似艹；i似讠；j似疒，又似辶的前二笔；k似，似半个；l似忄；m似木，似树林，木的声母也是m；n似月；o似口；p似阝；大写q似虫，都是框内有出笔；大写r似女；s似氵，似水流形，氵声母也是s；t似土，土的声母也是t；u似鱼，似鱼泡，读音也似；v似钅字头或字尾；w似纟；x似火；y似禾，禾苗的形状往往似y；z似王，也与折“乙”的外形相似。为便于记忆，就将横、竖、撇、点按次序分别“，”、“.”、“/”、“；”。当然也可按别的方式分别排列，如将横排在“；”，将竖排在“/”；将撇排在“，”；将点排在“.”上，用相应的标点符号编码。将多笔画部件完全按形似排在字母键上，有个好处，那就是不必象按读音排那样，为避免重码，不得不将有些部件按象形排，编码原理具有一致性，有的人可能更喜欢这种方式。

有的基本部件在作为偏旁后，字形会有所改变，但必须视为同类基本部件，用同一字母编码，这类基本部件如和竹，足和，亻和人，讠和言，钅和金，氵含水、氺，扌含手，忄含心等。

由于按附图1和附图3排列，较为简单易记，在编码实例中按附图1和附图3编码。编码实例：如“汉”的编码，声母是h，韵母为an，代码是f，音码部分就为hf，形部编码为合体字，按整体结构一分为二，首部为氵，剩部为“又”，首部只有一个部件氵，编码为d，再按书写顺序取剩部“又”的第一个基本部件为笔画“折”编码，代码为z，“汉”的编码为“hfdz”。又如“字”的编码，音码部分按双拼，为zi，形部编码按合体字编码，首部只有一个部件宀，编码为g，再按书写顺序取剩部的第一个基本部件“折”编码，代码为z，“字”的编码为“zigz”。又如“封”，全拼为feng，双拼为f；，形部编码时，首部按书写顺序取第一个基本部件“土”、代码为“t”，剩部的第一个基本部件为横，代码为“，”“封”的编码就为“f；t，”。注意取基本部件时要遵循取大优先的编码原则，要优先取笔画多的基本部件编码，例如“封”字的首部编码时应取“土”，而不能取横，因为“土”的笔画数多于“横”，要按“土”编码。又如“木”的编码，双拼为mu，为独体字，只有一个基本部件“木”，代码为m，木的编码就为mum。

本人在长期的编码研究中早就认识到一个汉字是否为左右结构是一目了然的，左右结构的汉字很容易在其产生空隙处将它一分为二，而上下、包围结构的汉字有时不易一分为二，甚至有时难以分清一个字是独体字还是上下结构或包围结构。根据一个汉字是否为左右结构划分是最简单易学，但这样不利于降低重码，实际上对于难以划分结构的汉字还可以用容错码的技术加以解决，即容许对同一个汉字根据不同的划分采取不同编码，所以还是划分为独体字和合体字为好，这样也与人们的传统思维一致。需要指出的是将合体字按整体结构一分为二，分成二个部分别进行编码的技术由来已久，其他人在发明中也对此做出了重要贡献。

若将所有的汉字分为左右结构和非左右结构的话也可编码，仍可用附图1、附图2、附图3、附图4编码，也就是说所选用的拼音、基本部件以及代码仍不变。编码由拼音和形部编码组成。形部编码规则是：左右结构的汉字，按书写顺序分别取左边部分、右边部分的第一个基本部件的相应代码编码；非左右结构的汉字，按书写顺序取第一个和最末个基本部件的相应代码编码。这时非左右结构的汉字，不能按书写顺序取前二个基本部件的相应代码编码，因为会造成重码，而应按书写顺序取第一个和最末个基本部件的相应代码编码，只有一个基本部件就只取这个基本部件的相应代码编码。由于一个汉字是否为左右结构是很清楚的，不会产生歧义，有的人可能更喜欢这种编码规则。

还可在形部编码时还可根据义部即部首优先原则编码，即形部编码时，先取该汉字的偏旁部首编码，若该汉字的偏旁部首为排在键上的某一个基本部件，就只取这个基本部件的代码，再按书写顺序取汉字中除掉该偏旁部首后的部分的第一个部件编码，即按书写顺序取不属于偏旁部首部分的第一个基本部件的相应代码编码。若该汉字的偏旁部首有多个基本部件，则按书写顺序取该偏旁部首的首尾两个部件编码。这些都是对本发明的变形。本人不太赞成这种方法，因为有时会与书写顺序不符。当然有的人可能更喜欢这种编码方式。

为提高输入速度，对于使用频繁的字，设计了简码。简码就是对常用的汉字只是取其完整编码的前编1个、2个或3个编码，再加1个空格键就构成了简码。由于规定音码在先，形部编码在后，许多汉字的形部编码并不需要全部输入，所以单字的编码实际上是音码为主，辅以形部编码。

由于拼音的二级简码只有四百来个汉字，而编码空间有729个，因此，对于其余三百来个编码空间，还可设立简码词，以进一步提高打字速度。如汉字的拼音无kian的形式，双拼编码也就无ky的形式，而“k”、“y”却分别为“可”、“以”的声母，因此ky可以作为“可以”的编码。由于本输入法设有三百多个简码词，从理论上说词组输入速度要比单字更快，因此这会明显提高汉字的输入速度。在计算机上敲击完某个汉字或词组的简码所在的键后，再敲击空格键，就可输入相应的汉字或词组。

词语输入是提高汉字输入速度的最常用方法，由于规定音码在先，形部编码在后，词语输入就全部利用音码输入，音码选用王治阳双拼，词语输入的步骤是：

a、二字词语，取每个字的声母、韵母的代码依次输入；如“编码”代码为byma。

b、三字词语，取每个字的声母的代码依次输入，再补空格输入；如“计算机”的代码为“jsj”。当然也可规定取第一字、第二字的前一码即声母的代码，再取第三字的前二码。还可规定再第一字的前二码，再取第二字、第三字的前一码即声母的代码。

c、四字及以上词语，取前三个字及最后一个字的声母的代码依次输入；如“科学技术”为四字词，取每个字的声母的代码为“kxju”。又如“新疆维吾尔自治区”，编码取前三个字及最后一个字“新疆维区”的声母的代码“xjwq”。

词组输入时会遇到重码问题，总的来说按拼音输入汉字的有效重码率要低于拼形码，但也不是没有，遇到同音词时，一个非常简便的方法是根据上下文采用智能处理。有时无法智能处理时，有个技巧，可基本避免同音字选择，那就是再输入词组中第一个字或最后一个字的形部编码的第一个代码，一般输入第一个字的形部编码的第一个代码。如输入“uiji”后，其中u为sh的压缩声母，会出现“实际、事迹、试剂、世纪、史记”等词供挑选，这时每个词的前面会有数字键供选择，后面会有一个字母或标点符号供选择，它为第一个字的形部编码的第一码，采用附图3的话，宀、横、讠、艹、口的编码代号分别为“g”、“，”、“y”、“c”、“k”。敲击这几个基本部件的相应代码所在的键后就能直接上屏，而无需再用数字键选择重码。这一创新方法显然十分简便实用，实际上能做到几乎没什么重码词。

这样，本发明对拼音输入法遇到的重码字和重码词问题都作了成功处理，采用附图1和附图3的话，十来分钟就可学会，甚至几分钟就可基本学会，比如双拼只要记住a、o、e、i、u区开头就可以了，还可结合双拼提示行进行输入，形部编码只有26个多笔画部件和五个单笔画部件，且大部分基本部件都用拼音的声母作代码。采用附图2和附图4的话也只要二三十分钟就能学会，使本发明显示出极大的优越性，成为唯一理想的完善的汉字输入法。

利用完善汉字码输入法软件，在计算机键盘上敲击某个汉字或词组的相应的编码所在的键，就可完成输入，无重码且达到规定码长的汉字或词组自动上屏，有重码的单字或词组根据提示行选择。本发明字词兼容，最多码长都为4码。“～”键为万能学习键，当某个汉字的编码不知道时，可用“～”代替，帮助把正确的编码找出来，再利用提示行选择。

为了便于使用，还设置了容错码，对一些编码容易出错的汉字，在错误输入时也能出现所要输入的汉字。

需要指出的是在本说明书、权利要求书和说明书附图中的字母均不分大小写，字母的大小写是等效的。

Claims

1、一种计算机汉字编码键盘输入法即完善汉字码输入法，将汉字的各种笔画按国家语委的规定归类为横、竖、撇、点、折五种基本笔画后，其特征是：

(1)、编码由两部分组成，一部分是音码，即拼音，或称拼音码，另一部分是形部编码，汉字码的两部分可前可后，一经选定，不能改变；

(2)、拼音可采用全拼或双拼或简拼或不完整拼音；

(3)、形部编码的取码规则是：独体字，按书写顺序取前二个基本部件的相应代码编码，当只有一个基本部件时，也可只取这个基本部件的相应代码，当然也规定独体字按书写顺序取第一个和最末个基本部件的相应代码编码，合体字，按整体结构一分为二，先写部分为首部，后写部分为剩部，按书写顺序分别取合体字的首部、剩部的第一个基本部件的相应代码编码；

(4)形部编码时，优选五种基本笔画和27个基本部件参与编码，27个基本部件、五种基本笔画与字母、标点符号的一种影射关系设定为：a——鱼 b——疒辶 c——艹 d——氵

e——禾 f——扌 g——宀 h——火

i——虫 j——钅 k——口 l——纟

m——木 n——女 o——日 p——阝

q——月 r——亻 s——石 t——土

u——山 v—— w——王 x——忄

y——讠 z——、折；——点

，——横 .——竖 /————撇

27个基本部件、五种基本笔画与字母、标点符号的另一种影射关系设定为：

a——亻 b——日 c——宀 d——石

e——山 f——扌 g——足 h——艹

i——讠 j——疒辶 k—— l——忄

m——木 n——月 o——口 p——阝

q——虫 r——女 s——氵 t——土

u——鱼 v——钅 w——纟 x——火

y——禾 z——王、折；——点

，——横 .——竖 /——撇。

2、根据权利要求1所述的完善汉字码输入法，其特征是：双拼最好选用王治阳双拼：ch、sh、zh按音序分别用i、u、v表示，单韵母ü用字母v表示，各韵母与字母映射关系设定为：

a——a b——uai c——un ün d——ai

e——e f——an g——ang h——ou i——i

j——ong iong k——ei l——en m——uang iang

n——uan üan o——o uo p——ing

q——ie r——in er s——ao t——iao

u——u v——ü ui w——iu x——ue üe

y——ian z——ua ia ；——eng

这时各韵母与字母映射关系设定为：

a——a b——uang iang c——uan üan d——ai

e——e f——an g——ang h——ou

i——i j——ong iong k——ei l——en

m——un ün n——ue üe o——o uo p——ing

q——iao r——ie er s——ao t——iu

u——u v——ü ui w——ian x——uai

y——in z——ua ia ；——eng

当然也可将字母个数相同的韵母按音序从左到右排列，还可不考虑字母个数，将韵母按音序排列；

只有韵母没有声母的，取e或。或a作声母，还可取韵母的第一个字母作声母代码，再补上韵母代码，建议选用e作声母代码。

3、根据权利要求1所述的完善汉字码输入法，其特征是：氵、艹、口、木、寸、钅、亻等发生的同音字很多的偏旁必须被选出，分别用一个字母或别的符号编码，女、讠、忄、月、虫、土、纟、火、疒、辶等发生同音字较多的偏旁也要被选出，分别用一个字母或别的符号编码，、、山、石、日、王、阝、鱼、礻及衤、禾、十、宀等能发生几对同音字的偏旁也可，分别用一个字母或别的符号编码。

4、根据权利要求2所述的完善汉字码输入法，其特征是：氵、艹、口、木、扌、钅、亻、女、讠、忄、月、虫、土、纟、火、疒、、、山、石、日、王、阝、鱼、礻包括衤、禾、十、宀、辶等基本部件全部选自汉字的偏旁部首。

5、根据权利要求1所述的完善汉字码输入法，其特征是：对上中下结构或上中下结构的汉字，将其中间部分划分到剩部，当然也可规定将中间部分划分到首部，还可按成字优先的划分原则划分，当一个汉字为上中下结构或左中右结构时，若两边都能成字的话，要按“两边都成字优先”的原则划分，若一边能成字的话，要按“一边成字优先”划分。

6、根据权利要求1所述的完善汉字码输入法，其特征是：合体字的最佳划分方法是根据绝大部分的合体字都为形声字的特点进行划分，按形声、会意结构拆分为二个部分。

7、根据权利要求1所述的完善汉字码输入法，其特征是：对于使用频繁的字，设计了简码，它对常用的汉字只是取其完整编码的前编1个、2个或3个编码，再加1个空格键就构成了简码。

8、根据权利要求1所述的完善汉字码输入法，其特征是：词语输入的步骤是：

二字词语，取每个字的声母、韵母的代码依次输入；

三字词语，取每个字的声母的代码依次输入，再补空格输入；

四字及以上词语，取前三个字及最后一个字的声母的代码依次输入。