CN1276337C

CN1276337C - 计算机汉字编码输入方法

Info

Publication number: CN1276337C
Application number: CN 200410072377
Authority: CN
Inventors: 孙自匡; 李仲强
Original assignee: Individual
Current assignee: Individual
Priority date: 2004-10-22
Filing date: 2004-10-22
Publication date: 2006-09-20
Anticipated expiration: 2024-10-22
Also published as: CN1601452A

Abstract

本发明是计算机汉字编码输入方法。通过计算机的键盘进行汉字单字输入和词组输入，将计算机键盘的每个字母键设置编码，编码是由键盘区号加上位置号组成，构成两位数码的编码。按照笔顺规则、笔形规则和笔画规则，同时依据单笔字根的位置号为1，多笔字根首笔确定键盘区号，次笔确定位置号，确定一个汉字字根的键盘区号和位置号。组合成一个汉字是由若干个字根构成一个汉字，字形规则是确定一个汉字的字根之间的位置状态，以及各种各样的“穿”和“包”的关系。本发明重码率低，重码率低于7%，单字输入速度快，词组输入重码少，在大量扩充词组库以后提高汉字输入速度，具有规范性、易学性、社会性强和校正性强的特点。

Description

计算机汉字编码输入方法

技术领域

本发明涉及一种汉字输入方法，尤其涉及一种计算机汉字输入编码方法。

背景技术

改革开放以后，国家出现了经济腾飞、科学技术大发展、人民生活大提高的局面。在使用汉语的区域里，都离不开使用汉字，特别是在信息处理领域，就出现了一个汉字与一切新技术(包括计算机)如何融合，并如何促进一切新技术发展的问题。在二十多年前曾出现的一种编码，解决了当时有无的问题，做出了一定贡献。就其编码规则大都是设计者的单一思路，脱离了汉字的规范性，脱离了书写汉字的笔顺规律和笔形规律，让使用者学起来无规律可循，非死记硬背不可。造成常人难学易忘，必须培训专职人员长期专职应用，其他人很难掌握，因为学会了不用就容易忘记，致使大多数华人还是不能充分利用它。

汉字计算机输入与我国的教育脱节，学生们在学校里学习电脑而不与规范的计算机汉字输入接触；脱离规范性的汉字信息处理的状况，使汉字不适应汉语国际化的要求。学校培养出来的小学生、中学生、大学生、研究生，都不会规范的汉字输入。

发明内容

本发明的主要目的在于解决编码输入中的问题，提供一种规范性、易学性、快捷性、恢复汉字本来面目的计算机汉字编码输入方法。

汉字是我国五千年文明史的记载和标志，秦始皇统一了汉字，汉字的形体美本身就是一门其它文字所不具备的艺术，汉字书法从古到今不知留下多少艺术珍品，最有代表性的是王羲之的“兰亭序”。其它文字的形体不知美在何处，成不了艺术品，更成不了艺术珍品。

汉字的迷人之处，不仅在于它的造字的灵活性、创造性、严肃性，还在于它表意之贴切、深刻、准确，表现力之丰富、精美，遣词造句之灵活，这是其它文字所无法比拟的。例如：“望断南飞雁”用西文很难完全、准确地翻译出来。正是由于汉字的这些特性，才使中华民族从古到今不知留下多少精美的不朽诗篇和巨著，诗经、唐诗、宋词，红楼梦、三国演义等。还有其它许多作品。这些都是中华民族灿烂文化的组成部分。

汉字能紧随时代的发展而发展并能和一切新技术融合，汉字具有永存的青春活力。不同时代很自然就会出现不同的语言，唐、宋、元、明、清都有各自不同的时代语言。解放以后不同时期有不同的语言，解放初期有解放初期的语言，文革时期有文革时期的语言，现在有现在的语言。如“改革开放”、“与时俱进”、“三个代表”等新词的出现。这就是汉字的神奇与活力。汉字的发明是人类文化中最光辉灿烂的发明，汉字是东方永放光芒的明珠。

汉字编码是寻求解决汉字与一切新技术(包括计算机)融会、沟通的一门新的科学。汉字专家们认为：汉字编码是关系到子孙万代的大事，也是当前摆在我们中华民族面前的一大难题。

本发明解决其技术问题所采用的技术方案是：

通过计算机的键盘进行汉字单字输入和词组输入，将计算机键盘的每个字母键设置编码，编码是由键盘区号加上位置号组成，构成两位数码的编码。

汉字有三要素，即“形”、“音”、“意”，三者都有各自的内涵，但是汉字的“形”存在唯一性，而“音”、“意”具有多元性。就“音”来说，无论南腔北调，语言如何不“通”，只要写成文字，大家就都“通”了，这就是汉字“形”的神奇。只有抓住汉字的“形”，才算抓住了汉字编码的本质，编码要从汉字的“形”上下手。编码规则必须为汉字教学服务，为学电脑又学汉字输入服务，要书写汉字的规范相一致。编码规则要让使用者不学而会，或一学就会，不可让使用者死记硬背编码规则。编码规则必须确保编码输入的规范性、易学性、快捷性。

组合成一个汉字是由单笔笔形构成单笔字根或由若干个笔形组合成的若干个字根构成一个汉字，输入一个汉字前，确认属于大于等于4字根的一个汉字，首先按照笔顺规则和笔形规则对一个汉字确定笔顺和笔形，再按照笔画规则确定一个字根的第一笔画、第二笔画、第三笔画和末笔画；按照笔顺规则、笔形规则和笔画规则，同时依据单笔字根的位置号为1，多笔字根首笔确定键盘区号，次笔确定位置号，确定一个汉字字根的键盘区号和位置号。

对于大于或等于四字根汉字的输入，需要不需要先把需要输入的汉字依笔形规则、笔顺规则和笔画规则，展开成一个数字串，然后用“数字采样”的方法进行输入呢？当然不需要，因为那是编码原理的叙述。

在实际汉字输入过程中，掌握了笔形规则、笔顺规则、笔画规则后，就可以把二维的方块汉字视为一维来处理。实际上这类汉字的输入，十分简单，就八个字：“就字拆根、见根知码”。将以上内容概括之为：“横1竖23撇提；点和捺笔在4里；折和钩笔居5域；字根首笔定“区”号；字根次笔定“位”序；‘见根知码’不用记”。前三句是说明笔形编号，后三句是说明字根代码与“区位”中的英文字母的对应关系。只要使用者掌握并会运用这个顺口溜，就等于学会了大于或等于四字根汉字的输入。

例如：“澜”的字根是：氵、门、、米，输入码是：OUFI。

“数”的输入码是IVTW；米、女、、，输入码是：IVTW。

“编”的输入码是XPMS；纟、户、、艹，输入码是：XPMS。

“实”的输入码是YPOD；丶、冖、、大，输入码是：YPOD。

“减”的输入码是YTDV；丶、、厂、输入码是：YTDV。

“穿”的输入码是OWAT；宀、八、、丿，输入码是：OWAT。

“横”的输入码是FSMW；木、、、八，输入码是：FSMW

“竖”的输入码是JCYI；、又、亠、，输入码是：JCYI

“准：的输入码是YTRY；丶、、亻、，输入码是：YTRY

“描”的输入码是ASMF；扌、艹、冂、士，输入码是：ASMF。

“输”的输入码是AKWM；依此类推。

确认属于小于等于3字根的一个汉字，按照笔顺规则、笔形规则和笔画规则，再按照字形规则增加一个字形码，确定键盘区号和位置号。

对于小于或等于三字根的汉字输入，也十分简单，即“就字折根、见根知码、见字识形”，就是在四字根汉字输入的基础上，再增加一个字形码。也就是说，对于这类汉字的输入，除了“就字折根、见根知码”外，还需要引入字形码。目的是用字形码来准确描述这类字的字根间各种复杂关系，以减少重码。

这类字的字根码少，不加字形码，就会产生大量重码。对汉字的各种字形进行反复分析、归纳、总结，终于研究出字形规则。字形码是由字形规则决定的。字形规则是介定字根间相互位置及各种“穿”、“包”关系的规则。

字形规则是：“横1竖2易区分；‘穿透’结构视横形；上左左下‘包’为3；上右右下为4形；上下全‘包’定为5；见字识‘形’一见明”。

字形规则是从汉字“形”的内涵中总结出来的。字形规则不仅给出了字根间相互位置以及各种“穿”、“包”关系的编号，还给出了由字根与字根、字根与字根组合所决定的字形代码与“区位”中的英文字母之间对应关系。

例如：两个字根横排列，其编号为1；若竖排列，其编号为2；若一个字根穿透另一个字根或字根组合(不论方向)，其编号也为1；若一个字根从上左方或左下方包住另一个字根或字根组合，其编号为3；若一个字根从上右方或右下方包住另一个字根或字根组合，其编号为4；若一个字根从上方或下方或全部包住另一个字根或字根组合，其编号为5；有了这些编号，再依先上后下、先左后右、先外后内的原则，见到任何一个小于或等于三字根的汉字，就能直接读出字形的数字代码，当然也就知道字形的英文字母代码。这样使用者免去对汉字字形代码的死记硬背，见到小于或等于三字根的汉字，立即就能知道该汉字的字形代码是什么英文字母。

例如：

“横结构”：

“林”的输入码是FFG；注：双字根的字形码“位”号为1；

“班”的输入码是GIGG；

“排”的输入码是AHHG；

“竖结构”：

“吕”的输入码是MMH；注：双字根的字形码“位”号为1；

“横、竖兼有的结构”：“形”的输入码是GDEH；

“位”的输入码是RYIF；

“昂”的输入码是MQBH；

“凹”的输入码是MNGF；

“凸”的输入码是HNGF；

“穿透结构”：

“册”的输入码是QQGG；

“串”的输入码是MMHH；

“戈”的输入码是AWG；

“又”的输入码是NYG；

“式”的输入码是GFCH；

“上左包结构”：

“左”的输入码是DFT；

“右”的输入码是DMT；

“存”的输入码是DXGT；

“在”的输入码是DFGR；

“庆”的输入码是YDT；

“康”的输入码是YNCT；

“佐”的输入码是RDFD；

“佑”的输入码是RDMD；

“左下包结构”：

“达”的输入码是DPT；

“进”的输入码是IRPR；

“送”的输入码是IWPR；

“建”的输入码是NGCT；

“上右包结构”：

“司”的输入码是NFY；

“勾”的输入码是QCY；

“句”的输入码是QMY；

“枸”的输入码是FQMS；

“苟”的输入码是SQML；

“右下包结构”：

“斗”的输入码是OFY；

“上包结构”：

“同”的输入码是MFN；

“国”的输入码是MGYB；

“桐”的输入码是FMFA；

“下包结构”：

“凶”的输入码是WBN；

“全包结构”：

“叉”的输入码是CYN；

“一包二结构”：

“者”的输入码是FDMI；

“二包一结构”：

“包”的输入码是QNNI；

“画”的输入码是FFBX；以此类推。

用首笔定“区”、次笔定“位”，实现了“见根知码”，免去使用者对字根的记忆。汉字的重码多，源于汉字的造字原理，形声字占90％以上，形声字的自然重码太多，难以解决重码。总结出了汉字产生重码的原因后，采用下列方法解决汉字的重码问题：即正确对待左偏旁字根、正确处理交叉同码、选择字根要反复推敲狠下功夫。重码率下降到7％左右。

对A～Y的字母键设定编码，将键盘上A～Y的字母键划分为五个“键盘区”，分别为：键盘一区、键盘二区、键盘三区、键盘四区、键盘五区；每个键盘区内设置五个字母键，依次排列设置键盘区号和位置号；键盘一区的字母键盘为：G字母键、F字母键、D字母键、S字母键和A字母键；G字母键的编码为：11，F字母键的编码为：12，D字母键的编码为：13，S字母键的编码为：14，A字母键的编码为：15；键盘二区的字母键为：H字母键、J字母键、K字母键、L字母键和M字母键；H字母键的编码为：21，J字母键的编码为：22，K字母键的编码为：23，L字母键的编码为：24，M字母键的编码为：25；键盘三区的字母键为：T字母键、R字母键、E字母键、W字母键和Q字母键；T字母键的编码为：31，R字母键的编码为：32，E字母键的编码为：33，W字母键的编码为：34，Q字母键的编码为：35；键盘四区的字母键为：Y字母键、U字母键、I字母键、O字母键和P字母键；Y字母键的编码为：41，U字母键的编码为：42，I字母键的编码为：43，O字母键的编码为：44，P字母键的编码为：45；键盘五区的字母键为：N字母键、B字母键、V字母键、C字母键和X字母键；N字母键的编码为：51，B字母键的编码为：52，V字母键的编码为：53，C字母键的编码为：54，X字母键的编码为：55；。

用A-Y这25个英文字母，能够概括全部汉字的字形代码，让使用者能够一见汉字，便知其“形”，即“见字识形”。

将计算机的标准键盘上的25个英文字母A-Y字母键划分为五个“键盘区”，每个键盘区设定键盘区号；每个“键盘区”内设置五个英文字母键，划分为五个“位置号”。把英文字母置于“区”、“位”阵格之中，每个英文字母一个两位数的“编码”。“区”、“位”阵格表示如下：

一区：G(11)F(12)D(13)S(14)A(15)；

二区：H(21)J(22)K(23)L(24)M(25)；

三区：T(31)R(32)E(33)W(34)Q(35)；

四区：Y(41)U(42)I(43)O(44)P(45)；

五区：N(51)B(52)V(53)C(54)X(55)。

阵格中的每个英文字母后括弧内的两位数就是该字母的“编码”。十位数是其“键盘区号”，个位数是“位置号”。

用字根首笔的笔形号定“键盘区号”，字根次笔的笔形号定“位置号”，这样就在英文字母与字根代码间建立了“直通车”。使用者见到字根，就能知道字根的英文字母编码是什么，即作到“见根知码”，免去了人们需要对字根及其代码的死记硬背。

笔顺规则是完成书写字体笔画顺序的准则，笔顺规则为：先上后下，先左后右，先外后内，先中间后两边，先里头后封口，先横后竖，先横后撇，先主体后穿心，先主体后配件；笔形规则是构成汉字的基本笔形，构成汉字的基本笔形共有八种笔形，八种笔形分别为：横、竖、撇、提、点、捺、折和钩，将构成汉字的八种笔形横、竖、撇、提、点、捺、折和钩划分在五个键盘区内；横划分在键盘一区，横包含笔形“一”，键盘区号为“1”。竖划分在键盘二区，竖包含笔形“丨”，键盘区号为“2”。撇和提划分在键盘三区，撇包含笔形“丿”，提包含笔形“/”，键盘区号为“3”。点和捺划分在键盘四区，点包含笔形“丶”，捺包含笔形“乀”，键盘区号为“4”。折和钩划分在键盘五区，折包含笔形“”，钩包含笔形“乛、亅、、乚”，键盘区号为“5”。

汉字的笔顺是中华民族在长期写字过程中，摸索出的一整套笔画排序规则，书写汉字时按照正确的笔形书写顺序进行书写。本发明的笔顺规则规定是：先上后下(如二字)，先左后右(如八字)，先外后内(如同字)，先中间后两边(如承字)，先里头后封口(如因字)，先横后竖(如十字)，先横后撇(如右字)，先撇后捺(如大字)，先主体后穿心(如串字)，先主体后配件(如肃字)，最短路线原则是它的出发点和归宿。

笔形受笔顺制约，笔形为笔顺服务，这是汉文化的内涵所决定的原则。有少数人写字时，把撇(丿)写成竖(丨)。写“直”时，第一笔是横(一)，第二笔是撇(丿)，这样再写下面的笔画时，就不需要抬笔，符合最短路线原则。如果把第二笔写成竖(丨)，再写下面的笔画，就需要一个本不需要的抬笔，这样写不符合最短路线原则。写“真”和“南”时，第二笔都应该是撇(丿)。又如写“草头”时，正确的写法是：第二笔是右斜笔(\)，第三笔是撇(丿)。如果把第二笔和第三笔都写成竖(丨)，再写下面笔画时，显而易见不符合最短路线原则，又增加了本不需要的抬笔动作。同样写“共”字时，也应该符合最短路线原则。由此可见，汉字的笔形需受笔顺制约，笔形要为笔顺服务。

笔画规则是确定提取一个汉字基本笔形的笔画准则，笔画规则为：一个汉字只提取四个基本字根，按照笔顺规则提取一个汉字的第一字根、第二字根、第三字根和末字根，第一字根至第三字根之间，不准遗漏笔画增加笔画和改变笔形，第三字根和末字根之间允许跨过一笔或多笔，末字根必须包含一个汉字的最末笔形。

汉字的每一个笔画(笔形)都是固定的，对于每一个汉字从第一笔起到最后一笔结束，每一笔的笔形必须保持原状，不得因输入汉字的需要而改变其任何一笔的笔形，更不能因输入汉字的需要而增加或减少其笔画。对于笔画很多的汉字，本发明最多只取四个字根码，在一、二、三字根码间，不准漏笔，当然也不准增加笔画和改变笔形，在三、末字根码间，允许跨过一笔或多笔，但是，字根末码必须包含末笔。

依据笔顺规则和笔形规则首笔确定键盘区号，次笔确定位置号。组合成一个汉字是由若干个字根构成一个汉字，字形规则是确定一个汉字的字根之间的位置状态，以及各种各样的“穿”和“包”的关系。一个汉字小于或等于3字根，按照先上后下、先左后右、先外后内的规则确认位置状况。一个字根与另一个字根是横排列，其编号为1。一个字根穿透另一个字根或字根组合的排列，其编号也为1；一个字根与另一个字根或字根组合是竖排列，其编号为2。一个字根从上左方或左下方“包”住另一个字根或字根组合的排列，其编号为3。一个字根从上右方或右下方“包”住另一个字根或字根组合的排列，其编号为4。一个字根从上方或下方或全部“包”住另一个字根或字根组合的排列，其编号为5。一个字根在一个汉字中所占面积小于或等于四分之一的排列，其编号为6。一个字根穿透另一个字根的排列，其编号为7。

下面是字形代码25个英文字母(A-Y)所表达的一部分小于或等于三字根汉字的字形结构。

G(代码11)：

①表示两个字根(1和1)是横排列，其区号为1(注：两字根字的汉字其字形码的位号为1)，故其字形码是11，例如：林。

②前两个字根(1和1)横排列，其区号为1，其组合又和下一个字根1是横排列，位号也为1，故其字形代码是11，例如：班。

③字根1和1是横排列，而其组合又被字根7穿透，故其字形代码是11，例如：册。

F(代码12)：

①两个字根6和6是横排列，而其组合与字根2是竖排列，故其字形代码是12，例如：碧。

②字根1与竖排列的6和6的组合是横排列，而字根6和6是竖排列，故其字形代码是12，例如：保。

D(代码13)：

①字根1与字根3和6的组合横排列，而字根3和6又构成3形包，故其字形代码是13，例如：挞。

②与上同，例如：佑。

S(代码14)：

①字根1与字根4和6的组合间是横排列，而字根4和6的组合是4形包，故其字形代码是14，例如：伺。

②与上同，例如：抖。

A(代码15)：

①字根1与字根5和6的组合是横排列，而字根5和6的组合是5形包，故其字形代码是15，例如：枫。

②与上同，例如：仙。

H(代码21)：

①字根6和6是竖排列，而其组合与字根1是横排列，故其代码是21，例如：形。

②字根2和2是竖排列，而其组合被字根7穿透，故字形代码是21，例如：串。

J(代码22)：

①前两个字根2和2是竖排列，而其组合与下一个字根2又是竖排列，故其代码是22，例如：音。

K(代码23)：

①字根2与字根3和6的组合是竖排列，而字根3和6之间是3形包，故其字形代码是23，例如：芭。

②与上同，例如：苈。

L(代码24)：

①字根2与4和6的字根组合是竖排列，而字根4和6的组合是4形包，故其字形代码是24，例如：苟。

②与上同，例如：卖。

M(代码25)：

①字根2与字根5和6的组合是竖排列，而字根5和6的组合是5形包，故其字形代码是25，例如：茼。

②与上同，例如：齿。

T(代码31)：

①字根3从上左方包住字根6，而被包的字根6只有一个，故其字形代码是31，例如：左。

②字根3从上左方包住字根1和1的组合，而被包的字根组合是横排列，故其字形代码是31，例如：麻。

③与T(31)的①同，例如：达。

④与T(31)的②同，例如：逖。

R(代码32)：

①字根3与字根6是3形包，而其组合与字根2是竖排列，故其字形代码是32，例如：导。

②字根2和2是竖排列，而2和2的组合又被字根3从左下方包住，故其字形代码是32，例如：这。

③与R(32)的②同，例如：厝。

④与R(32)的①同，例如：否。

E(代码33)：

①字根3从上左方包住字根3和6的组合，而3和6的组合又是3形包，故其字形代码是33，例如：底。

②与上同，例如：庭。

③与上同，例如：逅。

④与上同，例如：退。

W(代码34)：

①字根3以3形包的方式包住字根4和6的组合，而4和6的组合是4形包，故其字形代码是34，例如：迅。

②与上同，例如：(？)。

③与上同，例如：局。

④与上同，例如：戽。

注：(？)表示《新华字典》、《现代汉语词典》和《国标1、2级汉字字库》中无此字形，以下同。

Q(代码35)：

①字根3以3形包的形式包住字根5和6的字根组合，而字根5和6又是以5形包的形式构成组合，故其字根代码是35，例如：扁。

②同上，例如：(？)。

③同上，例如：迥。

④同上，例如：(？)。

Y(代码41)：

①字根4以4形包的形式包住字根6，故其字形代码是41，例如：司。

②字根4以4形包的形式包住字根1和1的字根组合，而字根1和1的组合是横排列，故其字形代码是41，例如：(？)。

③与Y(41)①同，例如：斗。

④与Y(41)②同，例如：(？)。

U(代码42)：

①字根4以4形包的方式包住字根2和2的组合，而字根2和2是竖排列，故其字形代码是42，例如：(？)。

②字根4以4形包的形式包住字根6，而4和6的组合与字根2是竖排列，故其字形代码是42，例如：(？)。

③与U(42)②同，例如：(？)。

④与U(42)①同，例如：(？)。

I(代码43)：

①字根以4形包的方式包住字根3和6的组合，而字根3和6的组合又构成3形包，故其字形代码是43，例如：(？)。

②同上，例如：包。

O(代码44)：

①字根4以4形包的方式包住字根4和6的组合，而4和6的组合又以4形包的方式存在，故其字形代码是44，例如：(？)。

②同上，例如：(？)。

P(代码45)：

①字根4以4形包的方式包住字根5和6的组合，而5和6的组合又以5形包的方式存在，故其字形代码是45，例如：甸。

②同上，例如：匈。

N(代码51)：

①字根5和6构成5形包的组合，而其又和字根2是横排列，故其字形代码是51，例如：刚。

②同上，例如：(？)。

B(代码52)：

①字根5和6构成5形包的组合，而其又和字根2是竖排列，故其字形代码是52，例如：奔。

②字根5以5形包的方式包住字根6和6的组合，字根6和6的组合是竖排列故其字形代码是52，例如：凰。

V(代码53)：

①字根5以5形包的方式包住字根3和6的组合，而字根3和6又构成3形包，故其字形代码是53，例如：闼。

②同上，例如：闳。

C(代码54)：

①字根5以5形包的方式包住字根4和6的组合，而字根4和6又构成4形包，故其字形代码是54，例如：(？)。

②，同上，例如：闭。

X(代码55)：

①字根5以5形包的方式包住字根5和6的组合，而字根5和6又构成5形包，故其字形代码是55，例如：(？)。

②同上，例如：画。

词组输入，两个字的词组输入是提取第一个汉字的第一字根的编码和第二字根的编码，再取第二个汉字的第一字根的编码和第二字根的编码。

两字词的输入编码：取第一字的第一编码和第二编码，再取第二字的第一编码和第二编码。

例如：中国--MHMG；人类--TYID；地球--FTGA；年华--THRV等等。

三个字词组的输入是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第二字根的编码。

三字词的输入编码：取第一字的第一编码，第二字的第一编码，再取第三字的第一编码和第二编码。

例如：共产党--SYLM；解放军--QYPA；全人类--WTID；全世界--WFMF等等。

四个字词组的输入是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第四个汉字的第一字根的编码。

四字词的输入码：依次取每个字的第一编码。

例如：集成电路--RDMM；五笔字型--DTYG；学以致用--OCAQ等等。

多字词组(大于四个字的词组)的输入是提取第一个汉字的第一字根的编码、第二个汉字的第一字根的编码、第三个汉字的第一字根的编码和第四个汉字的第一字根的编码。

多字让的输入码：依次取前四个字的第一编码。

例如：中华人民共和国--MRTN；中国人民解放军-MMTN；电子计算机--MXPT等等。

本发明是计算机汉字编码输入方法。重码率低，重码率低于7％。有两大好处：1、单字输入速度快；2、词组输入重码少，对提高汉字输入速度更有意义，特别在大量扩充词组库以后。

规范性：本发明的四大规则是：《笔形规则》、《笔顺规则》、《笔画规则》、《字形规则》，四大规则是完全来源于汉字“形”的内涵，不加入任何设计者的主观臆造，它具有极强的规范性或曰汉文化性；

易学性：使用者只要具备规范地书写汉字的基本素质，就自然地掌握了本发明的全部规则，只需1-2天就能学会并会使用，本发明能够“见根知码”、“见字识形”，彻底消除了汉字计算机输入的“瓶颈”，使用者无需要死记硬背。

社会性强：中华民族是使用汉字的民族，无论是小学生、中学生、大学生乃至研究生、博士生，不管文化程度如何，要想规范地将汉字输入计算机要很困难。据统计99％以上的华人不会使用《五笔字型》，即便你下了很大功夫学会了，一段时间不用又忘了，且不规范。再就是学“拼音”，又慢且受发音限制。娃娃们从入学那天起，学习的是规范化汉字，同时又学习电脑。但，没有一种规范而易学的编码供老师教学生，老师和学生们都望眼欲穿地盼望国家推广一种规范而易学的汉字编码供他(她)们教学和学习，本发明正是他(她)们所需要的，也是全体华人所需要的，更是汉字国际化所需要的。

校正性强：本发明具有极的规范性，有些人写汉字不规范，因而造成汉字输入计算机时操作不规范。本发明起到了维护汉字规范化的作用，这对提高全民族汉文化水准以及汉字走向国际化，具有特别重要的意义。

附图说明

以下结合附图和实施例对本发明详细说明。

图1计算机汉字编码输入方法的键盘示意图

图2计算机汉字编码输入方法的字形结构示意图

1字根横排列，2字根竖排列，3字根从左上方或左下方“包”住另一个字根或字根组合，4字根从右上方或右下方“包”住另一个字根或字根组合，5字根从上方或下方或全部“包”住另一个字根或字根组合，6根在汉字中所占面积小于或等于四分之一的字根，7单笔字根“穿透”字根，8键盘一区，9键盘二区，10键盘三区，11键盘四区，12键盘五区，13字母键，14编码，15键盘区号，16位置号

具体实施方式

实施例1

通过计算机的键盘进行汉字单字输入和词组输入，将计算机键盘的每个字母键(13)设置编码(14)，编码(14)是由键盘区号(15)加上位置号(16)组成，构成两位数码的编码(14)。

组合成一个汉字是由单笔笔形构成单笔字根或由若干个笔形组合成的若干个字根构成一个汉字，输入一个汉字前，确认属于大于等于4字根的一个汉字，首先按照笔顺规则和笔形规则对一个汉字确定笔顺和笔形，再按照笔画规则确定一个字根的第一笔画、第二笔画、第三笔画和末笔画；按照笔顺规则、笔形规则和笔画规则，同时依据单笔字根的位置号(16)为1，多笔字根首笔确定键盘区号(15)，次笔确定位置号(16)，确定一个汉字字根的键盘区号(15)和位置号(16)。

确认属于小于等于3字根的一个汉字，按照笔顺规则、笔形规则和笔画规则，再按照字形规则增加一个字形码，确定键盘区号(15)和位置号(16)。，如图1所示

实施例2

对A～Y的字母键(13)设定编码(14)，将键盘上A～Y的字母键(13)划分为五个“键盘区”，分别为：键盘一区(8)、键盘二区(9)、键盘三区(10)、键盘四区(11)、键盘五区(12)；每个键盘区内设置五个字母键(13)，依次排列设置键盘区号(15)和位置号(16)；键盘一区(8)的字母键盘(13)为：G字母键、F字母键、D字母键、S字母键和A字母键；G字母键的编码(14)为：11，F字母键的编码(14)为：12，D字母键的编码(14)为：13，S字母键的编码(14)为：14，A字母键的编码(14)为：15；键盘二区(9)的字母键(13)为：H字母键、J字母键、K字母键、L字母键和M字母键；H字母键的编码(14)为：21，J字母键的编码(14)为：22，K字母键的编码(14)为：23，L字母键的编码(14)为：24，M字母键的编码(14)为：25；键盘三区(10)的字母键(13)为：T字母键、R字母键、E字母键、W字母键和Q字母键；T字母键的编码(14)为：31，R字母键的编码(14)为：32，E字母键的编码(14)为：33，W字母键的编码(14)为：34，Q字母键的编码(14)为：35；键盘四区(11)的字母键(13)为：Y字母键、U字母键、I字母键、O字母键和P字母键；Y字母键的编码(14)为：41，U字母键的编码(14)为：42，I字母键的编码(14)为：43，O字母键的编码(14)为：44，P字母键的编码(14)为：45；键盘五区(12)的字母键(13)为：N字母键、B字母键、V字母键、C字母键和X字母键；N字母键的编码(14)为：51，B字母键的编码(14)为：52，V字母键的编码(14)为：53，C字母键的编码(14)为：54，X字母键的编码(14)为：55，如图1所示。

实施例3

笔顺规则是完成书写字体笔画顺序的准则，笔顺规则为：先上后下，先左后右，先外后内，先中间后两边，先里头后封口，先横后竖，先横后撇，先主体后穿心，先主体后配件；笔形规则是构成汉字的基本笔形，构成汉字的基本笔形共有八种笔形，八种笔形分别为：横、竖、撇、提、点、捺、折和钩，将构成汉字的八种笔形横、竖、撇、提、点、捺、折和钩划分在五个键盘区内；横划分在键盘一区(8)，横包含笔形“一”，键盘区号(15)为“1”。竖划分在键盘二区(9)，竖包含笔形“丨”，键盘区号(15)为“2”。撇和提划分在键盘三区(10)，撇包含笔形“丿”，提包含笔形“/”，键盘区号(15)为“3”。点和捺划分在键盘四区(11)，点包含笔形“丶”，捺包含笔形“乀”，键盘区号(15)为“4”。折和钩划分在键盘五区(12)，折包含笔形“”，钩包含笔形“乛、亅、、乚”，键盘区号(15)为“5”，如图1所示。

实施例4

依据笔顺规则和笔形规则首笔确定键盘区号(15)，次笔确定位置号(16)。组合成一个汉字是由若干个字根构成一个汉字，字形规则是确定一个汉字的字根之间的位置状态，以及各种各样的“穿”和“包”的关系。一个汉字小于或等于3字根，按照先上后下、先左后右、先外后内的规则确认位置状况。一个字根与另一个字根或字根组合是横排列，其编号为1。一个字根穿透另一个字根的排列，其编号也为1；一个字根与另一个字根或字根组合是竖排列，其编号为2。一个字根从上左方或左下方“包”住另一个字根或字根组合的排列，其编号为3。一个字根从上右方或右下方“包”住另一个字根或字根组合的排列，其编号为4。一个字根从上方或下方或全部“包”住另一个字根或字根组合的排列，其编号为5。一个字根在一个汉字中所占面积小于或等于四分之一的排列，其编号为6。一个字根穿透另一个字根的排列，其编号为7，如图1、图2所示。

实施例5

G(11)：

F(12)：

D(13)：

②与上同，例如：佑。

S(14)：

②与上同，例如：抖。

A(15)：

②与上同，例如：仙。

H(21)：

J(22)：

K(23)：

②与上同，例如：苈。

L(24)：

②与上同，例如：卖。

M(25)：

②与上同，例如：齿。

T(31)：

③与T(31)的a同，例如：达。

④与T(31)的b同，例如：逖。

R(32)：

③与R(32)的b同，例如：厝。

④与R(32)的a同，例如：否。

E(33)：

②与上同，例如：庭。

③与上同，例如：逅。

④与上同，例如：退。

W(34)：

②与上同，例如：(？)。

③与上同，例如：局。

④与上同，例如：戽。

Q(35)：

②同上，例如：(？)。

③同上，例如：迥。

④同上，例如：(？)。

Y(41)：

③与Y(41)①同，例如：斗。

④与Y(41)②同，例如：(？)。

U(42)：

③与U(42)②同，例如：(？)。

④与U(42)①同，例如：(？)。

I(43)：

②同上，例如：包。

O(44)：

②同上，例如：(？)。

P(45)：

②同上，例如：匈。

N(51)：

②同上，例如：(？)。

B(52)：

V(53)：

②同上，例如：闳。

C(54)：

②，同上，例如：闭。

X(55)：

②同上，例如：画，如图1、图2所示。

实施例6

词组输入，两个字的词组输入是提取第一个汉字的第一字根的编码(14)和第二字根的编码(14)，再取第二个汉字的第一字根的编码(14)和第二字根的编码(14)，如图1所示。

实施例7

三个字词组的输入是提取第一个汉字的第一字根的编码(14)、第二个汉字的第一字根的编码(14)、第三个汉字的第一字根的编码(14)和第二字根的编码(14)，如图1所示。

实施例8

四个字词组的输入是提取第一个汉字的第一字根的编码(14)、第二个汉字的第一字根的编码(14)、第三个汉字的第一字根的编码(14)和第四个汉字的第一字根的编码(14)，如图1所示。

实施例9

多字词组(大于四个字的词组)的输入是提取第一个汉字的第一字根的编码(14)、第二个汉字的第一字根的编码(14)、第三个汉字的第一字根的编码(14)和第四个汉字的第一字根的编码(14)，如图1所示。

Claims

1、一种计算机汉字编码输入方法，其特征是通过计算机的键盘进行汉字单字输入和词组输入，将计算机键盘的每个字母键(13)设置编码(14)，编码(14)是由键盘区号(15)加上位置号(16)组成，构成两位数码的编码(14)；组合成一个汉字是由若干个单笔笔形构成单笔字根或由若干个笔形组合成的字根构成一个汉字，输入一个汉字前，确认属于大于等于4字根的一个汉字，首先按照笔顺规则和笔形规则对一个汉字确定笔顺和笔形，再按照笔画规则确定一个字根的第一笔画、第二笔画、第三笔画和末笔画；按照笔顺规则、笔形规则和笔画规则，同时依据单笔字根的位置号(16)为1，多笔字根首笔确定键盘区号(15)，次笔确定位置号(16)，确定一个汉字字根的键盘区号(15)和位置号(16)；确认属于小于等于3字根的一个汉字，按照笔顺规则、笔形规则和笔画规则，再按照字形规则增加一个字形码，确定键盘区号(15)和位置号(16)；对A～Y的字母键(13)设定编码(14)，将键盘上A～Y的字母键(13)划分为五个“键盘区”，分别为：键盘一区(8)、键盘二区(9)、键盘三区(10)、键盘四区(11)、键盘五区(12)；每个键盘区内设置五个字母键(13)，依次排列设置键盘区号(15)和位置号(16)；键盘一区(8)的字母键盘(13)为：G字母键、F字母键、D字母键、S字母键和A字母键；G字母键的编码(14)为：11，F字母键的编码(14)为：12，D字母键的编码(14)为：13，S字母键的编码(14)为：14，A字母键的编码(14)为：15；键盘二区(9)的字母键(13)为：H字母键、J字母键、K字母键、L字母键和M字母键；H字母键的编码(14)为：21，J字母键的编码(14)为：22，K字母键的编码(14)为：23，L字母键的编码(14)为：24，M字母键的编码(14)为：25；键盘三区(10)的字母键(13)为：T字母键、R字母键、E字母键、W字母键和Q字母键；T字母键的编码(14)为：31，R字母键的编码(14)为：32，E字母键的编码(14)为：33，W字母键的编码(14)为：34，Q字母键的编码(14)为：35；键盘四区(11)的字母键(13)为：Y字母键、U字母键、I字母键、O字母键和P字母键；Y字母键的编码(14)为：41，U字母键的编码(14)为：42，I字母键的编码(14)为：43，O字母键的编码(14)为：44，P字母键的编码(14)为：45；键盘五区(12)的字母键(13)为：N字母键、B字母键、V字母键、C字母键和X字母键；N字母键的编码(14)为：51，B字母键的编码(14)为：52，V字母键的编码(14)为：53，C字母键的编码(14)为：54，X字母键的编码(14)为：55；笔顺规则是完成书写字体笔画顺序的准则，笔顺规则为：先上后下，先左后右，先外后内，先中间后两边，先里头后封口，先横后竖，先横后撇，先主体后穿心，先主体后配件；笔形规则是构成汉字的基本笔形，构成汉字的基本笔形共有八种笔形，八种笔形分别为：横、竖、撇、提、点、捺、折和钩，将构成汉字的八种笔形横、竖、撇、提、点、捺、折和钩划分在五个键盘区内；横划分在键盘一区(8)，横包含笔形“一”，键盘区号(15)为“1”；竖划分在键盘二区(9)，竖包含笔形“丨”，键盘区号(15)为“2”；撇和提划分在键盘三区(10)，撇包含笔形“丿”，提包含笔形“/”，键盘区号(15)为“3”；点和捺划分在键盘四区(11)，点包含笔形“丶”，捺包含笔形“ㄟ”，键盘区号(15)为“4”；折和钩划分在键盘五区(12)，折包含笔形“”，钩包含笔形“乛、亅、、乚”，键盘区号(15)为“5”；笔画规则是确定提取一个汉字基本笔形的笔画准则，笔画规则为：一个汉字只提取四个基本字根，按照笔顺规则提取一个汉字的第一字根、第二字根、第三字根和末字根，第一字根至第三字根之间，不准遗漏笔画增加笔画和改变笔形，第三字根和末字根之间允许跨过一笔或多笔，末字根必须包含一个汉字的最末笔形；依据笔顺规则和笔形规则首笔确定键盘区号(15)，次笔确定位置号(16)；组合成一个汉字是由若干个字根构成一个汉字，字形规则是确定一个汉字的字根之间的位置状态，以及各种各样的“穿”和“包”的关系；一个汉字小于或等于3字根，按照先上后下、先左后右、先外后内的规则确认位置状况；一个字根与另一个字根或字根组合是横排列，其编号为1；一个字根穿透另一个字根的排列，其编号也为1；一个字根与另一个字根或字根组合是竖排列，其编号为2；一个字根从上左方或左下方“包”住另一个字根或字根组合的排列，其编号为3；一个字根从上右方或右下方“包”住另一个字根或字根组合的排列，其编号为4；一个字根从上方或下方或全部“包”住另一个字根或字根组合的排列，其编号为5；一个字根在一个汉字中所占面积小于或等于四分之一的排列，其编号为6；一个字根穿透另一个字根的排列，其编号为7。

2、根据权利要求1所述的计算机汉字编码输入方法，其特征在于所述的词组输入，两个字的词组输入是提取第一个汉字的第一字根的编码(14)和第二字根的编码(14)，再取第二个汉字的第一字根的编码(14)和第二字根的编码(14)；三个字词组的输入是提取第一个汉字的第一字根的编码(14)、第二个汉字的第一字根的编码(14)、第三个汉字的第一字根的编码(14)和第二字根的编码(14)；四个字词组的输入是提取第一个汉字的第一字根的编码(14)、第二个汉字的第一字根的编码(14)、第三个汉字的第一字根的编码(14)和第四个汉字的第一字根的编码(14)；多字词组(大于四个字的词组)的输入是提取第一个汉字的第一字根的编码(14)、第二个汉字的第一字根的编码(14)、第三个汉字的第一字根的编码(14)和第四个汉字的第一字根的编码(14)。