CN1515988B

CN1515988B - 一类音形义汉字编码输入法

Info

Publication number: CN1515988B
Application number: CN 03112606
Authority: CN
Inventors: 黄振荣
Original assignee: Individual
Current assignee: Individual
Priority date: 2003-01-01
Filing date: 2003-01-01
Publication date: 2010-04-07
Anticipated expiration: 2023-01-01
Also published as: CN1515988A

Abstract

一类音形义汉字编码输入法，采用计算机字母键盘或手机、计算机数字键盘进行输入操作，根据GF3001规范选取640个编码部件，归成405个编码部件组，并把编码部件的字义归纳成25个义类，对每个编码部件一般以其主形编码部件的读音和义类名称中一个汉字的汉语拼音的声母赋予部件字母型代码、字母型义类码，并把每个汉字分为“首部”、“余部”或“部首”、“余部”两个部分，分别取码，再组合成整个汉字编码，可以设计成码长为3、4、5、6、7等多种类型编码方法。GB2312汉字字符集，4码法字母型输入法，其重码率3％左右，并且引伸设计出6码法数字型输入法，其重码率2％。

Description

一类音形义汉字编码输入法

技术领域

本发明属于用于计算机或其他对汉字符信息进行处理装置的一类音形义汉字编码输入方法。

背景技术

十几年来，已公开的汉字编码输入方案已有近2000件。但是已公开的汉字编码方案，都是只利用汉字或汉字部件的音、形两方面的特征而设计的，而且绝大多数只解决GB2312的6763个汉字的计算机输入。此外，很多编码方案在字的拆分规则方面、构字部件的确定方面没能很好遵照国家语委的有关规范，不利于推广应用。

发明内容

本发明的目的是提供汉字输入重码率低，便于人们掌握使用的一类音形义汉字编码输入法。本发明人经十多年反复研究提出一大类解决GB18030-2000的汉字字符集，甚至更大汉字字符集的计算机或其他对汉字字符信息进行处理、存储、传输、显现、输入和输出的装置的汉字输入技术方案。本发明遵照国家语委的有关规定，确定构字部件和部件的拆分规则，根据编码部件(包括笔画部件)的音、形、义三方面的特征，设计本计算机汉字输入方案。本发明针对不同大小的汉字字符集(如：GB2312的6763个汉字字符集，GB18030-2000的27000多汉字字符集，《汉语大字典》的54000多汉字字符集，《中华字海》的85000多汉字字符集)，不同使用对象(如：一般使用人员，一般专业录入员，古籍出版专业录入员)，对重码率的不同要求，不同的输入设备等，提出了码长为3、码长为4、码长为5、码长为6、码长为7等等多种类型编码输入方案。由于本发明较充分利用了人们对汉字、部件、笔画、部首等已经具有的音、形、义方面的知识，能使一般人较容易地掌握使用本技术方案。

本发明的一类音形义汉字编码输入法，利用计算机通用字母键盘或者手机、计算机的数字键盘，输入汉字或词语，根据GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》选定560个编码部件，选定的编码部件，根据义相同或形相近等明显关联性，归并成若干组，并从每个编码部件组中选定一个主形编码部件作代表，则：

(1)根据主形编码部件赋有的一种读音的汉语拼音的第1个字母，或者根据与主形编码部件的其他关联因素取1个便于联想记忆的字母，赋予每个主形编码部一个字母型代码；

(2)把所有主形编码部件的含义，归并确定为20至26种义类，根据义类名称中的一个汉字的一种读音的汉语拼音的第1个字母，或者根据与义类名称的其他关联因素取1个便于联想记忆的字母，赋予每一种义类一个字母型义类码；

(3)根据每个主形编码部件赋有的一种含义，归为已确定的义类中的一类，并赋予相应的字母型义类码；

(4)每个编码部件组中的每个编码部件赋予与其编码部件组的主形编码部件完全相同的部件字母型代码和部件字母型义类码；

(5)确定16或28个含有构字能力特别强的主形编码部件的编码部件组为高频编码部件组，确定其组内20或36个编码部件为高频编码部件以及其在汉字结构中的主部位位置；

从而得到选定的每个编码部件的字母型代码和字母型义类码；用1至9的9个数字中的每个数字不重复地分别替代编码部件字母型代码和字母型义类码的2至4个英文字母，从而得到每个编码部件的数字型代码和数字型义类码，并且还选定5个数字分别作为汉字5类笔画的数字型代码；利用编码部件的字母型汉字编码资源的音形义汉字编码输入法称为音形义字母型汉字编码输入法，在计算机的通用字母键盘上实现输入操作；利用编码部件的字母型汉字编码资源和汉字的汉语拼音资源的音形义汉字编码输入法称为拼音类音形义字母型汉字编码输入法，在计算机通用字母键盘上实现输入操作；利用编码部件的数字型汉字编码资源的音形义汉字编码输入法称为音形义数字型汉字编码输入法，在计算机或手机的数字键盘上实现输入操作；具体实现则为：

(6)音形义字母型汉字编码输入法：

A、选定一个码长，从而具体确定一种音形义字母型汉字编码输入法，码长数在3至12的10个数字中确定1个；

B、单个编码部件的汉字以及其他所有编码部件的字母型编码为其部件字母型代码加上部件字母型义类码；

C、2个或2个以上编码部件组成的汉字，分成首部与余部或部首与余部两部分，利用上述确定的编码部件字母型代码、字母型义类码、高频编码部件及其主部位等字母型汉字编码资源分别对上述两部分编码，再组合成整个汉字的编码；

D、依照整个汉字的字母型编码，依次击字母键，次数达码长数；

E、如果整个汉字的编码的字母个数不足码长数，则以结束键结束；

F、结束编码输入后，如果显示有重码，再击重码选择键，完成整个汉字的编码输入；

(7)拼音类音形义字母型汉字编码输入法：

码长设定为4或8，利用编码部件的字母型代码、字母型义类码、高频编码部件及其主部位等字母型编码资源和汉字的汉语拼音首字母或汉字的整个汉语拼音，组合成整个汉字的编码，依次击字母键，不足设定的码长数的，以结束键结束，出现重码的，再击重码选择键，完成整个汉字的编码输入；

(8)音形义数字型汉字编码输入法：

A、选定一个码长，从而具体确定一种音形义数字型汉字编码输入法，码长数在5至12的8个数字中确定1个；

B、单个普通编码部件的汉字以及其他所有普通编码部件的数字型编码为其3位数数字型全码，即为其部件数字型代码加上部件数字型义类码加上该编码部件的首笔画或者末笔画的笔画部件数字型代码；高频编码部件的汉字的数字型编码或高频编码部件的数字型编码，都为其部件数字型代码加上部件数字型义类码；

C、2个或2个以上编码部件组成的汉字，分成首部与余部或者部首与余部两部分，利用以上确定的编码部件数字型代码、数字型义类码、5类笔画的数字型代码及数字型义类码、首笔画数字型代码、末笔画数字型代码、高频编码部件及其主部位等数字型汉字编码资源分别对上述两部分编码，再组合成整个汉字的编码；

D、依照整个汉字的数字型编码，依次击数字键，次数达码长数；

E、如果整个汉字的编码的数字码个数不足码长数，则以结束键结束；

F、结束编码输入后，如果显示有重码，再击重码选择键，完成整个汉字的编码输入。

本发明的计算机使用的一类音形义汉字编码输入方法，包括字母型、数字型两大类，这两大类中又包括若干小类，由下述具体实际步骤得以完成：

一、确定编码部件、编码部件组、高频编码部件组、高频编码部件及其主部位，确定编码部件的25类部件义类名称、义类含义及其字母型义类码，确定每个编码部件的编码部件字母型代码、编码部件字母型义类码、编码部件字母型全码

本发明遵照国家语委规范GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》的原则确定编码部件。在确定编码部件时，采纳《新华字典》、《汉语大字典》采用的《新旧字形对照表》，以新字形为准，传统部首的旧字形等同于新字形，不再另行一一列出。本发明采用GF3001-1997的《汉字基础部件表》中的560个部件，采用1983年中国文字改革委员会、国家出版局发布的《汉字统一部首表(草案)》中繁体字、简体字部首281个部件，去除重复的，实际共计640个部件确定为编码部件。

再把上述确定的640个编码部件，根据义相同或形相近似、或形有一定内在联系、或互为古今字、或互为繁、简字等明显的关联性归并成405个编码部件组，并确定各编码部件组的第一个编码部件为该组的主形编码部件，其余的为副形编码部件。

本发明把编码部件简称为字根，把编码部件组简称为部件组或字根组；主形编码部件简称为主形字根；副形编码部件简称为副形字根。把《汉字统一部首表(草案)》中列入的繁体字、简体字281个部首部件，称为部首编码部件。含有组字频度高的编码部件的27个编码部件组称为高频编码部件组，其组内构字能力特别强的编码部件称为高频编码部件。本发明确定高频编码部件只有在指定的主部位位置时才能以高频编码部件的名义方式取码，主部位简称主位。除高频编码部件以外的都称作普通编码部件，简称普通字根。

本发明设定了25个义类，每个义类大多数以其义类名称中的一个汉字的一种读音的汉语拼音的第1个字母赋于其字母型义类码，但有少数以其韵母第1字母或以英译名的第1字母作字母型义类码，极少数以与字母的相似性取其字母型义类码。25种字母型义类码，见附图1，《编码部件的25类部件义类名称、义类含义、字母型义类码、取码提示对照表》。

每个编码部件都有确定的形状，每个编码部件，有的有确定的读音，有的有俗定叫法，而且一般都表达一定的意义。为此，本发明对每个编码部件组以主形编码部件为代表，根据主形编码部件赋有的(是成字编码部件根据其汉字；是非成字编码部件根据其与另一个编码部件组成的一个常用汉字；是偏旁部首编码部件，根据其俗称名中的一个汉字)1种读音的汉语拼音的第1个字母，给主形编码部件取1个字母作为字母型代码，称作编码部件字母型代码，或称作部件字母型代码、或称作字根字母型代码，简称根码或代码；或者根据汉语拼音韵母的第1个字母，给主形编码部件取字根字母型代码；其中对于汉语拼音第1字母为y的主形编码部件，而首笔为“丨(竖)”、“乛(折)”、“丿(撇)”的，则其字根字母型代码取字母y；而首笔为“、(点)”、“一(横)”的，则其字根字母型代码取字母I；对于汉语拼音为WU的编码部件取U为字根字母型代码；或者根据主形编码部件与某一英文字母存在的一定的相似性或其英文译名的第1个字母，给主形码部件取部件字母型代码。

汉字是属于表意体系文字，其构字部件一般都有一定意义。为此，本发明根据主形编码部件(如果是成字部件，根据其汉字；如果是非成字部件，根据其与另一编码部件组成的一个常用汉字；如果是偏旁，根据其含义或其部首偏旁的身份)赋有的一种含义，归为25种义类中的一类，并赋予相应的字母型义类码，称作编码部件字母型义类码，或称作部件字母型义类码，或称作字根字母型义类码，简称义码。极少数编码部件(“事”、“书”、“牙”、“予”等)以其韵母字母为依据归入相应的义类，赋予相应的字母型义类码。本发明规定，每个编码部件组中的每个编码部件都赋予与该编码部件组的主形编码部件一样的字根字母型代码和字根字母型义类码。

根据上述的设计，本发明确定的每个编码部件都赋有一个部件字母型代码和一个部件字母型义类码，部件字母型代码加部件字母型义类码定义为该编码部件字母型全码。每个编码部件组中的每个编码部件具有相同的部件字母型全码，字根全码也就是它的两字母编码。

本发明提出了用1至9个数字替代若干个英文字母，从而得到每个编码部件的数字型代码和数字型义类码，以及5类笔画的数字型代码及数字型义类码，规定了编码部件的数字型全码，其具体实施方案，结合音形义数字型汉字编码输入法阐述。

虽然，本发明中有的编码部件组有多个编码部件，但大多是非成字部件，而成字部件大多有繁、简之分。为了区分繁、简字体，本发明规定，用大写字母处理繁体汉字编码输入，用小写字母处理简体汉字编码输入；或者用小写字母处理繁体汉字编码输入，用大写字母处理简体汉字编码输入。此外再辅以选择键，就可以在实际应用中区分所有的编码部件。

本发明设定的全部编码部件及其编码部件组、高频编码部件及部件组，以及主部位，及其编码部件字母型代码、编码部件字母型义类码都列于附图2，《405个编码部件组、640个编码部件的编码部件字母型代码、编码部件字母型义类码对照表》和附图4，《27个高频编码部件组的部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、首笔数字全码、末笔数字全码、取码提示及其主部位位置对照表》。

以上本发明选定为编码部件的640个编码部件，是遵照GF3001-1997标准进行的。选定编码部件还可以从以下两个方面进行舍取。一个方面，可以把一些编码部件合在一个编码部件组，例如：把“土”、“士”合在一组，把“火”、“灬”合在一组，把“母”，“毋”合在一组等等，可以相应减少编码部件组数量；还可以把(字母型全码取为AH)(注：以下编码部件后括号内的两上字母为为该编码部件的字母型全码)、“鼻”(BH)、“比”(BQ)、“髟”(BR)、

(CF)、“辰”(CG)、“齿”(CH)、“齒”(CH)、“赤”(CY)、“隶”(DE)、“斗”“DN”、“鼎”(DQ)、“豆”(DS)、“阜”(FL)、“风”(FT)、“風”(FT)、“龟”(GC)、(GC)“谷”(GL)、“骨”(GP)、“高”(GN)、“鼓”(GY)、“虎”(HD)、“黄”(HY)、“音”(IY)、“角”(JC)、“韭”(JS)、“鹿”(LD)、“卤”(LK)、“鹵”(LK)、“老”(LR)、“鬲”(LU)、“龍”(LX)、“黾”(MC)、“马”(MD)、“馬”(MD)、“面”(MH)、“麻”(MI)、“麦”(MZ)、“麥”(MZ)、“攴”(PE)、

(PF)、

(PF)、“欠”(QM)、“青”(QY)、“齐”(QZ)、“齊”(QZ)、“生”(SA)、“矢”(SB)、“鼠”(SC)、“首”(SH)、“舌”(SM)、“殳”(SU)、“色”(SY)、“黍”(SZ)、“无”(UX)、

(WI)、

(WP)、“网”(WQ)、“辛”(XG)、“页”(XH)、“頁”(XH)、“穴”(XJ)、“血”(XP)、“香”(XY)、“羽”(YC)、“邑”(YL)、“侖”(YH)、“走”(ZA)、“隹”(ZC)、“至”(ZK)、“支”(ZP)、“卓”(ZT)、“足”(FF)、

(FF)、“鸟”(NC)、“鳥”(NC)、“鱼”(YC)、“魚”(YC)等79个合体部首编码部件不确定为编码部件，只把GF3001-1997规定560个基础部件确定为编码部件。甚至把编码部件数减少到比GF3001-1997规定的560部件还要少，例如：可以把“个”(表序号552)、

(表序号10)、(表序号11)等部件，不作为编码部件。只是用这样缩减的编码部件集设计的编码输入法其重码率会提高，而且有违GF3001-1997标准规范。另外一个方面，可以再适当增加一些编码部件，例如：“勿”(字根全码UQ)、(字根全码AE)、“卑”(字根全码BU)、“尚”(字根全码AA)等等，这可以进一步降低重码率，尤其在音形义首部余部字母型汉字编码输入法类中，其作用更显突出。

本发明只用了25个字母来安排编码部件的字母型代码和字母型义类码。当然也可把字母V也利用起来，安排编码部件的编码，进行适当的调整，可以降低重码率，但由于V在汉语拼音中不发音，安排作编码也有不利的方面。

二、汉字的拆分规则

本发明基本遵照国家语委的有关规范制定拆分规则如下：

1、本发明确定为编码部件的，不论是独体字、基础部件，还是合体字，都不能再拆分，只能整体作为一个编码部件单元参与汉字编码。例如：“鼻”，不能再拆分成“自”、“田”、

2、以国家语委标准化工委制定的《(现代汉语通用字笔顺规范)》为依据，一般以汉字书写时组成该汉字的编码部件的第一笔的先后次序，确定这些编码部件的先后次序。但是，为了突出被包围的1个或多个编码部件，减少重码，也可设置为被围部分优先的原则，即规定，被二个或二个以上相同的编码部件从二面或三面或四面围住的部分，优先取码。例如：“器”字取码次序为“犬”、“口”、“口”、“口”、“口”。

3、一个汉字有几种拆分方案，取拆分成编码部件最少的那一种。如果仍有二种以上折分方案的，则取编码部件间没有相接的那一种。例如：字可拆成①父、王、，②父、干、，取第1种；如果仍然不能确定拆分方案的，则取拆分编码部件笔画多的在先的那一种；例如：“幸”字可拆成①“土”、、“十”，②“土”、“八”、“干”，取第1种；如果仍然不能确定拆分方案的，则比较编码部件的笔画排序，取排序在前的；例如：

字可拆分成①

、“彐”、，②、“巳”、“一”，取第1种。

本发明采纳GF3001-1997规范的“《汉字基础部件表》使用规则”，相同的规则，在汉字拆分中相离、相接可以拆，交重者只能以笔画拆分。在拆分比GB18030-2000更大的汉字字符集的汉字时，对超出GF3001-1997规范的《汉字基础部件表》以外的笔画交重的成字部件和非成字部件，以本发明规定的五类笔画编码部件拆分。

三、音形义汉字编码输入法

本发明规定在阐述音形义字母型汉字编码输入法时，对某个编码部件取2码就是依次取其部件字母型代码、部件字母型义类码，即为其字根字母型全码；如果对某个编码部件取1码，即取其部件字母型代码。

GB13000.1-93标准包括中国繁、简汉字、日语汉字和韩语汉字，本发明设计以不同命名的方法把上述几种子汉字字符集区分开来。至于中国繁、简汉字，也可以放在同一个汉字字符集中，用前面已经讲到的，用大、小字母区分输入。但是输入上述各子汉字字符集所采用的汉字编码输入方法的本质内容都是相同的。

本发明的字母型音形义汉字编码输入法，采用计算机通用字母键盘，每个字母键赋予新的含义，具体见附图3，《字母型汉字编码输入法用的字母键盘面结构示意图》。

本发明规定，对由单个编码部件组成的汉字以及其他所有编码部件的输入，只要在键盘上依次击打该编码部件字母型全码，即编码部件字母型代码和编码部件字母型义类码，再击打结束键(一般设置为空格键)就完成编码输入，如果在提示行显现多个汉字及编码部件时，再击打对应的选择键，就完成了输入操作。下面叙述的各种类型字母型输入法中，都采用上述单个编码部件组成的汉字以及其他所有编码部件的输入方法。

本发明利用确定的25种编码部件义类及其字母型义类码，对640个编码部件设计确定的部件字母型代码和部件字母型义类码，设计确定的27个高频编码部件组、高频编码部件及其主部位等字母型编码资源、汉字的拼音字母资源以及数字型编码资源，具体提出五种类型汉字编码输入方法：第一种称作音形义首部余部字母型汉字编码输入法；第二种称作音形义部首余部字母型汉字编码输入法；第三种称作首末编码部件代码拼音音形义字母型汉字编码输入法；第四种称作拼音首字母首末编码部件字母型汉字编码输入法；第五种称作音形义数字型汉字编码输入法。

分述如下：

(一)音形义首部余部字母型汉字编码输入法

在该种类型输入法中，码长定为3、或4、或5、或6、或7、或8、或9、或10、或11、或12，可以设计出3码法、4码法、5码法、6码法、7码法、8码法、9码法、10码法、11码法、12码法等多种具体输入法。例如：3码法就是输入一个汉字，最长码长为3；4码法就是最长码长为4；其他依此类推。3码法、4码法、5码法、6码法、7码法等等，都是同一种类型中相对独立，自成体系的汉字编码输入法。由使用者根据汉字库汉字数量大小和对重码率的不同要求而分别选用。但是同一种类型的汉字编码输入法技术方案的基本内容、基本原则是一致的。

本发明把由2个及2个以上字根组成的汉字，都把它分成两个部分：把由拆分规则确定的该汉字的第1字根设定为首部，把该汉字的剩余的字根组合设定为余部。把首部取的编码依次与余部取的编码组合在一起，就是该汉字的编码。

对首部这个字根取码，可以有两种情况，由此又可设计出2类相应的编码输入方法。当然也可以不管哪种字根都取2码，这样在同样重码率的情况下，码长要取得长一些，当然还可以不管哪种字根都取1码，这在同样长的码长下重码率会明显提高。

首部的第1种取码方法：首部这个字根，如果是处在主部位的高频编码部件，则取1码，否则都取2码。

首部的第2种取码方法：首部这个字根，如果是处在主部位的高频编码部件或者该汉字由4个或4个以上的字根组成的，则取1码，否则就取2码。

余部只有以下1种方法取编码：

首先确定余部取码个数。余部取码个数为该编码方法确定的码长数减去首部已取码个数之差，本发明称之为剩余取码数。剩余取码数确定后，对余部取码又有两种情况：

如果剩余取码数小于等于余部的编码部件个数，那么在满足末字根必需取1码的前提下，依次满足余部的第1字根、第2字根......末字根，各取1码，直到余部字根取码个数之和等于剩余取码数为止。换句话说，如果剩余取码数为1，只取末字根1码；如果剩余取码数为2，就取余部的第1字根和末字根各1码。依此类推。

如果剩余取码数大于余部的字根个数，那么以如下原则确定余部各字根的取码个数：首先满足余部的各个字根必需取1码，还不足剩余取码数，即有富余取码数，再依次满足末字根、次末字根取2码的要求。但也可设置为，如果余部是由2字根组成而且末字根为“日”、或“口”、或“刀”、或“刂”的，则先满足次末字根取2码，再有富余取码数，然后再满足末字根取2码。根据上述原则确定了余部各字根的取码个数，然后依次对余部的各字根取1码或2码。如果余部的各字根都取2码后，余部的实际取码数之和仍小于剩余取码数，如果汉字是上下型结构的，为了减少重码率可以加上字型识别码“A”，否则也就到此为止由于首部有2种取码方法，与余部组合起来，形成了2类编码输入方法，本发明把采用第1种首部取码方法的称为音形义首部余部字母型汉字编码输入法。把采用第2种首部取码方法的称为4字根以上汉字首部取1码式音形义首部余部字母型汉字编码输入法。

把汉字的首部部分取的编码与余部部分取的编码，以先首部后余部的次序组合成整个汉字的编码。

用上述方法得到汉字编码并依次击打相应字母键位，如果整个汉字的编码个数小于码长数，因而击键次数不到设定的码长数，再加击结束键；如果没有出现重码提示，就完成了该汉字的编码输入；如果在提示行中显示有重码，则再击打选择键，完成该汉字的编码输入。

下面阐述的各种类型输入法的具体击键操作方法，与上述的操作方法都完全一样，因此就不再重复了。

(二)音形义部首余部字母型汉字编码输入法

该种类型输入法也与“音形义首部余部字母型汉字编码输入法”一样，码长定为3、或4、或5、或6、或7、或8、或9、或10、或11、或12，可以设计出3码法、4码法、5码法、6码法、7码法、8码法、9码法、10码法、11码法、12码法等多种具体输入法。

大部分汉字是合体字，主要为形声字。为此，《说文解字》、《康熙字典》、《汉语大字典》等都采用部首法编排，便于查阅使用。本方法采用类似于上述字典的部首法把每个由两个以上字根组成的汉字，分成部首和余部两个编码部分，进行编码输入汉字。定为部首的只能是一个字根，余部是该汉字去掉部首字根剩下的那些字根组合。本发明称为部首的概念与字典的部首概念不完全一样。本发明确定的编码部件都可能作部首，但在具体编码中是不是作为部首，由它在汉字中所处位置而定。本方法中把两个字根或两个字根以上的汉字拆分成部首与余部两个编码部分的规则如下：

第一条，根据GB18030-2000标准附录B《表意文字描述符》所概括的文字基本结构中，把在“全包围结构”、“向下包围结构”、“向上包围结构”、“向右包围结构”、“向右下包围结构”、“向左下包围结构”、“向右上包围结构”的汉字中起二面包围、三面包围、四面包围作用的那1个部件，定义为该汉字的部首；该汉字除去部首的剩余部分定义为余部。部首与余部哪个在先，哪个在后，由部首与余部的第1笔画先后来定，但是本发明拆分规则规定的优先的情况除外。上述这一点，在以下的各个条款中也适用。例如：“图”字，“”为部首，为在先；“逊”字，“辶”为部首，为在后，余部为“子”、“小”；“器”字，“犬”为部首，为在先，余部为“口”、“口”、“口”、“口”。

第二条，对于“左右结构”、“上下结构”、“左中右结构”、“上中下结构”的汉字，其最上、最下、最左、最右的结构层，可以分成三种情况而确定部首与余部：

第1种情况，二个最外结构层中，只有一个最外结构层是由单独1个字根组成，则这1单独字根就定义为部首，其余为余部。例如：“莉”字，“艹”为部首，为在先；“雕”字，“隹”为部首，为在后；

第2种情况，二个最外结构层中，都是由1个单独的字根组成，则以最左边或最上边的那个字根为部首，其余为余部。例如：“鸿”字，“氵”是部首；“苕”字，“艹”为部首；

第3种情况，二个最外结构层中，都是由2个以上字根组成，则以该汉字的第1字根为部首，其余为余部。例如：

字，“雨”为部首。

第三条，除字根以外的交重的多个笔画类编码部件组成的汉字，定义其第1笔画编码部件为部首，其余为余部。例如

字，“一”为部首，为第1部分，其余为余部，为第2部分，且都为笔画字根。

第四条，对于本说明书“二、汉字的拆分规则”的第2条中规定“被二个或二个以上相同的编码部件从二面或三面或四面围住的部分，优先取码”因而以如下2种情况分别确定部首与余部：

第1种情况，被包围部分只有1个字根，那么该字根为部首，根据被围优先原则，部首在先，余部在后。例如：“器”字，“犬”为部首，为在先，余部为“口”、“口”、“口”、“口”，为在后。

第2种情况，被包围部分有2个或2个以上字根，那么被包围部分的第1字根为部首，剩余部分为余部。例如：字，“艹”为部首，且在先，余部依次为“见”、“口”、“口”、“口”、“口”。

根据上述规则确定汉字的部首与余部后，就可以分别据此进行编码。本发明根据部首与余部的不同取码方式以及部首编码与余部编码组合汉字编码的次序不同又可提出了三种编码方法。第一种定名为音形义部首余部顺序式字母型汉字编码输入法；第二种定名为音形义部首余部部首先取式字母型汉字编码输入法：第三种定名为部首取2码音形义部首余部部首先取式字母型汉字编码输入法。这三种汉字编码输入法，分述如下：

第一种，音形义部首余部顺序式字母型汉字编码输入法，根据拆分规则确定的先后次序，对确定为汉字部首与余部分别取码，且顺序组合在一起，就是该汉字的编码。具体取码方法如下：

对部首的取码与前面的首部法一样有2种类型：

部首的第1种取码方法：部首这个字根，如果是处于主部位的高频编码部件，除由2个编码部件组成的汉字中其部首为“辶”以外，都取1码，否则取2码；部首的第2种取码方法：部首这个字根，如果是处于主部位的高频编码部件，除由2个编码部件组成的汉字中其部首为“辶”以外，或者该汉字由4个或4个以上的字根组成的，则都取1码，否则就都取2码。部首的这两种取法，同样也会得到两类部首编码，从而形成两套部首余部顺序式字母型汉字输入法的两套编码，但是它们的本质内容是一致的。

余部取码方法只有一种，与前面的“音形义首部余部字母型汉字编码输入法”的余部取码方法完全一致，因此不再重复了。

第二种，音形义部首余部部首先取式字母型汉字编码输入法，凡是被确定为部首的字根，除处在主部位的高频编码部件“鳥”、“鸟”、“辶”以外，根据顺序不管它处在余部前，还是处在余部后，都首先取码，然后再对余部取码，并且以先部首后余部的次序依次组合在一起，就成为该汉字的编码。至于部首是处在主部位的“鳥”、“鸟”、“辶”字根的汉字，取码次序仍然与书写次序一样，为先余部后部首。至于部首与余部的具体取码方法与“音形义部首余部顺序式字母型汉字编码输入法”的部首与余部取码方法完全一样，因此不再重复。

由于对部首有2种取码方法，与余部组合起来，形成2类编码输入方法，本发明把采用第1种部首取码方法的相应分别称为：“音形义部首余部顺序式字母型汉字编码输入法”、“音形义部首余部部首先取式字母型汉字编码输入法”；采用第2种部首取码方法的，相应分别称为：“4字根以上汉字部首取1码式音形义部首余部顺序式字母型汉字编码输入法”、“4字根以上汉字部首取1码式部首音形义余部部首先取式字母型汉字编码输入法”。

第三种，部首取2码音形义部首余部部首先取式字母型汉字编码输入法，是一种主要用于计算机编辑字典，建立字词分析检索数据库的汉字编码输入方法，这种汉字编码方法规定只有列入《汉字统一部首表(草案)》的281个部件才能作部首编码部件，在汉字中确定为部首的，称之为字典部首部分，编码部件的先后次序，只依照笔顺为序；如果一个汉字中只有一个非笔画类部首编码部件，那么这个编码部件为该汉字的字典部首部分；如果一个汉字中有2个以上部首编码部件，那么其确定该汉字的字典部首部分的规则与《中华字海》的取部首规则，原则一致，即：

(1)上下有部首的取上不取下，如：夺(取大为部首)；

(2)左右有部首的，取左不取右，如：明(取日为部首)；

(3)部首在四角位置的，按照左上、左下、右上、右下的顺序取部首，如：疑(取匕为部首)、歸(取止为部首)；

(4)内外有部首的，取外不取内，如：因(取为部首)、巡(取辶为部首)；

(5)如下结构的字，取形体所占汉字面大的为部首部分：

想(心为部首)、桑(木为部首)、凯(几为部首)、(

为部首)、(为部首)、懿(心为部首)；

(6)分离性结构的部首和连接性结构的部首并存时，取分离性结构的为部首；弃(取为部首)、章(取立为部首)；

(7)无从取部首的字，按起笔画归入笔画部首类；

对归入笔画部首类的，如果其中有分离或相接的，非部首的非笔画类编码部件，那么仍作为编码部件取码，如：“奉”字归一(横)笔画部首，其中、仍以编码部件取码；对于超出《汉字基础部件表》的所有部件，只能以笔画的先后顺序，依次取笔画部件码；如果只有相交的笔画部件，那就只以笔画编码部件取码。

有些编码部件虽然归入了有作部首的编码部件组中，但本汉字编码输入法中，在实际使用中，不能把它看作部首，如：部件序号273的，虽然归在部件组号176的“卩”部首一组，但其本身没有列在《统一汉字部首表(草案)》中，因此不能作部首。

对于成字的或非成字的非部首编码部件，在本方法中其编码为首笔画字母型全码加上该编码部件字母型全码。例如：为非成字编码部件，其编码为HONQ；“甲”编码为SOAG；“重”编码为POZY。如果是部首编码部件，其编码仍为其字母型全码，例如：“王”编码为WK。

编码部件在某一种字典中定为部首编码部件，就以部首的规则取编码并根据上述规则确定是否在具体汉字中取作字典部首部分。

定为部首的除了完全遵照1983的《汉字统一部首表(草案)》的繁体字、简体字部首281个部件外，也可以根据各种类型字典的传统需要，从其他编码部件中挑选一些作部首，如《辞海》作部首的“丸”(字母型全码WC)、“亡”(字母型全码WA)等，还可以从以下的部件中选取一些增作部首编码部件：“尚”(字母型全码AA)、“用”(字母型全码YQ)、“行”(字母型全码XF)、“爻”(字母型全码YX)、(字母型全码LA)、“亦”和(字母型全码都为IP)、(字母型全码XZ)、

(字母型全码CS)、(字母型全码ZI)、“玄”(字母型全码XI)、“天”(字母型全码TT)、

(字母型全码JS)、(字母型全码ZB)、

(字母型全码CO)、和

(字母型全码都为YZ)、

(字母型全码HX)、“卵”(字母型全码LC)、“去”(字母型全码QF)、“龙)”(字母型全码LX)、(日文齐)”(字母型全码QZ)、(日文黑)”(字母型全码HT)、和(日文角)”(字母型全码JC)、

(日文龟)”和“龜”(《康熙字典》部首龟)(字母型全码GC)、(日文齿)”(字母型全码CH)。还可以把如下三个部首编码部件组(匚、)、()、(示、礻)，分列成六个编码部件组的编码部件：(字母型全码SF)、(字母型全码DF)、“示”(字母型全码SQ)、“礻”(字母型全码SX)、“匚”(字母型全码FQ)、

(字母型全码XQ)，可以根据需要分别选作部首编码部件。还可以根据需要把一些部首编码部件合并在一个编码部件组，还可以把某些部首编码部件调整其字母型全码，如把“艹”调整为CZ。

根据上述规则确定好字典部首部分以后，就可以进行汉字编码输入了。对于部首编码部件，其编码为该部首编码部件的字母型全码；对于一般成字编码部件或非成字编码部件，其编码为其首笔画字母型全码加上该编码部件的字母型全码。在下面将要阐述的两类方法中，都以上述方法，进行单个编码部件的编码。对于由2个或2个以上编码部件构成的汉字，根据对余部的不同取码方式，又可分成两种类型，分述如下：

第一种，称之为：部首取2码音形义部首余部部首先取式字母型汉字编码输入法类，根据要表达的字典或汉字字库的汉字数量，码长可选定为6、7、8、9、10、11、12中的任何一个数，以便把重码率降低到可以充许的程度。对于由2个或2个以上编码部件构成的汉字，对确定为字典部首部分的编码部件一律取2码，即依次取其部件字母型代码和部件字母型义类码。余部的取码方法与前面的音形义首部余部汉字编码输入法的余部取码方法基本一样，但取消被围先取的规定，完全按照笔顺定的先后次序，依次取码。并把字典部首部分和余部部分取的编码以部首在先余部在后的次序组合在一起；如其编码字母个数不足码长数，如果汉字为上下结构的，加结构识别码“A”；如果还不足码长数就以结束键结束；如果有重码再击重码选择键，就完成汉字的编码输入。

第二种，称之为，部首取2码余部第1编码部件先取2码的音形义部首余部部首先取式字母型汉字编码输入法，该方法的具体内容如下：码长可设定为7、或8、或9、或10、或11、或12；对于由2个或2个以上编码部件构成的汉字，分成字典部首部分与余部部分两部分；对确定为字典部首部分的编码部件一律取2码，即依次取其部件字母型代码和部件字母型义类码。余部部分的取码方法为：在首先满足末编码部件必需取不少于1码的前提下，依次满足余部部分第1编码部件、第2编码部件......取2码的要求，后面的满足不了取2码的，就取1码，直到余部部分取码数之和达到码长数减2的差数；如果余部部分各编码部件部取2码后，仍有取码富余数，且该汉字是上下结构型的，则再加上结构识别码A；如果再有取码富余数，以结束键结束余部部分的取码；以字典部首部分的编码在先，余部部分取的编码在后的次序，组合成整个汉字的编码；如有重码，再击重码选择键。

(三)首末编码部件代码拼音音形义字母型汉字编码输入法

本汉字编码输入方法，采用字母型编码资源，设计而成。

本方法，码长设定为8；对于编码部件及其只有1个编码部件的汉字的编码仍然为该编码部件的字根字母型代码加字根字母型义类码，并用结束键结束，有重码的话，再以选择键结束输入。

对于由2个或2个以上编码部件组成的汉字的编码，依次对该汉字根据拆字规则确定的首位编码部件和末位编码部件各取其字根字母型代码，然后与该汉字的汉语拼音字母依次组合在一起，就是该汉字的编码，如果编码字母个数小于确定的码长数，则以结束键结束，如有重码，再击重码选择键。汉语拼音部分又有两种编码输入方法，一种为取该汉字的全拼音字母，另一种类为取该汉字的双拼字母。两字母的双拼汉语拼音公知流行的方案有多种，取那一种都一样，最多对重码率有一些影响。本发明还提出了一种新的双拼技术方案，声母、韵母双拼字母替代方案，见附图5《双拼字母替代声母、韵母对照表》。新的双拼方案，零声母用字母O来表示，这样，除单个编码部件的汉字以外，其他每个汉字都由4字母组成编码，因此码长数也可定为4。

(四)拼音首字母首末编码部件音形义字母型汉字编码输入法

本汉字编码输入方法，采用字母型编码资源设计而成。

本方法，设定码长为4。主要适用于GB2312标准的汉字的汉字输入，尤其是一级汉字集。

成字编码部件及非成字编码部件的输入，仍以编码部件字母型全码输入再加击结束键，如有重码，再加击重码选择键。

对于由2个编码部件构成的汉字，如果其第1编码部件是处于主部位的高频编码部件，则第1编码部件取1码，即其字母型代码，第2编码部件取2码，即其字母型代码加上字母型义类码，以结束键结束，有重码，再击重码选择键；如果其第1编码部件是普通编码部件或是非处于主部位的高频编码部件，则依次取汉字拼音首字母、汉字首编码部件字母型代码、末编码部件字母型代码和字母型义类码；如果该汉字是由3个或3个以上编码部件构成的，则依次取该汉字拼音首字母、汉字首编码部件字母型代型、第2编码部件字母型代码、末编码部件字母型代码；依次击字母键，如有重码，再击重码选择键，完成汉字编码输入。

(五)字母型汉语词语输入法

在上述汉字编码输入法的基础上，本发明提出了两类字母型汉语词语输入法。其中第一类，当词语中的汉字要求取2码时就依次取该汉字整个字母型编码的第1和第2个字母码；其中第二类，当词语中的汉字要求取2码时就依次取该汉字的第1字根和第2字根的字根字母型代码。如果该汉字只有一个字根，就取该字根的字根字母型代码和字根字母型义类码。当词语中汉字要求取1码时不管哪一类都取汉字编码的第1个字母码。具体编码方法如下：

在选定的一种码长数(例如：3码法或4码法或5码法或6码法)的汉字编码输入法中，如果选定输入法的码长数小于等于词语中的汉字个数，那么在满足末个汉字必需取1码的前提下，依次对词语的第1个汉字，第2个汉字......末个汉字，都取1码，直到词语的取码个数之和等于输入法选定的码长数。

如果输入法选定的码长数大于词语的汉字个数，那么先确定给词语的每个汉字取码的个数。首先满足词语的每个汉字取1码的要求，再有取码富余数，然后再依次满足末个汉字，次末个汉字取2码的要求，直至词语的各个汉字的取码之和等于输入法选定的码长数为止。用上述方法确定了词语各个汉字的取码个数，然后依次对词语的各个汉字取1码或2码。如果，词语的各个汉字都取2码后，其取码数之和仍小于输入法选定的码长数，那么就以结束键结束编码。

用上述方法对词语编码并依次击打相应字母键后，如果没有出现重码提示，就完成了该词语的编码输入；如果在提示行中显示有重码，则再击打选择键，完成该词语的编码输入。

(六)音形义数字型汉字编码输入法类

用数字分别替代编码部件的字母型代码和字母型义类码，就可以得到这640个编码部件相应的数字型代码和数字型义类码，再加上高频编码部件及其主部位，数字型编码资源，利用上述资源，参照音形义字母编码输入法，设计出一类音形义数字型汉字编码输入法。本发明提出了三种用数字替代字母的方法从而可以得到三种类型的音形义数字型汉字编码输入法，以适应手机、电话机、计算机的数字键盘汉字编码输入。

第1种，根据手机等数字键盘公知的数字键对应字母进行转换。

第2种，本发明根据数字读音与字母的英文名称音、汉语拼音之间的一定相近性和形状等近似联系，提出了用2个数字替换1个字母的方案，具体如下：44换A；88换B；61换C；81换D；21换E；48换F；77换G；47换H；11换I；94换J；34换K；66换L；45换M；25换N；85换O；91换P；75换Q，22换R；33换S；71换T；55换U；99换V；56换W；24换X；14换Y，78换Z。

第3种，从1到9的9个数的每个数字不重复地分别替换640个编码部件的部件字母型代码和部件字母型义类码的若干个英文字母，从而得到640个编码部件相应的部件数字型代码和部件数字型义类码。具体替换方案如下：1替换I、Y；2替换R、N、T；3替换S、K、E；4替换A、F、H；5替换W、U、M；6替换L、C；7替换Q、G、Z；8替换D、O、B；9替换P、J、X。对于笔画的部件代码相对应的数字型代码为：横“一”为4；竖“丨”为3；

为9；点“、”为8；折“乛”为7。用数字替换字母的数字键盘可见附图6，《1数字码替代多字母码数字键盘盘面键位结构示意图》。当然把笔画“一”、“丨”、“丿”、“、”、“乛”、依次规定成为：1、2、3、4、5，五个数字，也可以。为了降低重码率，每个编码部件的数字型全码，就是编码部件数字型代码加上编码部件数字型义类码再在后面加上其首笔画编码部件或末笔画编码部件的部件数字型代码。同一个编码部件组的各个编码部件的首笔画或末笔画不一定不同，因此其数字全码也不一定相同。每个字根的数字型全码是个3位数字。由于所加的笔画不同，编码部件的数字型全码有两种，一种称为首笔画数字全码，另一种称为末笔画数字全码，这样该类数字型汉字编码输入法又可设计成两个类型，一种称为首笔画数字全码音形义数字型汉字编码输入法，另一种称为末笔画数字全码音形义数字型汉字编码输入法。但其方法原则都是一样的。一般编码部件的数字型编码输入为字根数字型代码加字根数字型义类代码加字根首笔画编码部件或末笔画编码部件的数字型代码，依次击数字键后再击输入结束键。如：“马”的首笔画数字全码的数字型编码为587，依次击5、8、7数字键，再击输入结束键，如有重码，再击重码选择键，即完成该汉字的输入。对于高频字根，虽然其数字全码也为3位数字，但只要输入字根数字型代码和字根数字型义类码，再击输入结束键，如有重码，再击重码选择键，就完成输入。如：“口”的首笔画数字全码为353，其编码输入只要依次击3、5数字键，再击输入结束键，如有重码，再击重码选择键。

为了便于叙述该数字编码方案，现规定对字根取3码就是取该字根的3位数字型全码，即字根数字型代码加字根数字型义类码加字根首笔画或末笔画编码部件数字型代码；取2码就是取该字根数字全码的前2位数字码，即字根数字型代码加字根数字型义类码；取1码就是取该字根数字型代码。例如：“麻”首笔画数字型字根全码为518，取3码即为518，取2码即为51，取1码即为5。

对于“音形义首部余部汉字编码输入法”(以下简称首部法)的“首部”字根和“音形义部首余部汉字编码输入法”(以下简称部首法)的“部首”字根，本数字编码法规定，是处于主部位的高频编码部件，一律只取2码，没有象字母型那样有其他的例外，至于其他的则取3码，这样设计的数字编码6码法其GB2312字符集的重码率只有百分之一点五左右。

对于首部法和部首法的余部的数字取码方法也与前面的首部法和部首法的字母取码方法原则基本相同。数字型汉字编码输入方法类，码长可以取为5、或6、或7、或8、或9、或10、或11、或12。对余部取码，首先确定余部取码个数。取码个数为该编码方法设定的码长数减去“首部”或“部首”已取码个数之差，称之为剩余取码数，又有两种情况：

剩余取码数小于等于余部的字根个数，在满足末字根必须取1码的前提下，依次取余部的第1字根，、第2字根......末字根，各取1数字码，直到余部字根取码个数之和等于剩余取码数为止。例如：“澳”字，“部首”为“氵”为主部位高频部件，取2码则为83，对于5码法来说，剩余取码数为5-2＝3，对余部的

、“大”和各取1码，则余部编码为998，整个“澳”字的5码法数字编码为83998；对于6码法来说，剩余取码数为4，则依次对余部的“”、“”、“米”、“大”各取1码，则余部编码为9958，整个“澳”字的6码法数字编码为839958。

剩余取码数大于余部的字根个数，以如下方法对余部各字根取码：必需首先满足余部的各个字根取1码，再有富余取码数，再依次满足末字根、次末字根取2码的要求。余部是由2字根组成，而且末字根为“日”、或“口”、或“刀”、或“刂”的，则先满足次末字根取2码，再有富余取码数，然后再满足末字根取2码；根据上述原则余部的字根都取了2码后，仍有富余取码数，对末字根取3码；余部都取了3码以后还有富余取码数，是上下结构型汉字，加取结构识别码“4”，否则，则以结束键结束编码。“首部”或“部首”与“余部”的编码确定后，再参照首部法或部首法的“顺序式”与“部首先取”的两种方法组合在一起，就形成了“音形义首部余部数字型汉字编码输入法”、“音形义部首余部顺序式数字型汉字编码输入法”、“音形义部首余部部首先取式数字型汉字编码输入法”三类数字型数字编码输入法，上述方法还要具体细化为“首笔画数字全码”或“末笔画数字全码”两类数字型汉字编码输入法。

音形义部首余部部首先取式数字型汉字编码输入法与音形义部首余部部首先取式字母型汉字编码输入法对于“鸟”、“鳥”、“辶”的处理，有不同，数字型方法中，上述3编码部件与其他的一样，作部首时也先取码，放在余部前。

汉字首部部分的编码与余部部分的编码和部首部分的编码与余部部分的编码组合成整个汉字的数字型编码的方式为：

A、首笔画数字全码音形义首部余部数字型汉字编码输入法和末笔画数字全码音形义首部余部数字型汉字编码输入法，都依次把首部、余部的数字型编码，组合成整个汉字的数字型编码。

B、首笔画数字全码音形义部首余部顺序式数字型汉字编码输入法和末笔画数字全码音形义部首余部顺序式数字型汉字编码输入法，都依次把部首、余部的数字型编码根据拆分规则确定的部首、余部的先后次序顺序地组合成整个汉字的编码。

C、首笔画数字全码音形义部首余部部首先取式数字型汉字编码输入法和末笔画数字全码音形义部首余部部首先取式数字型汉字编码输入法，都把部首、余部的数字型编码，以部首在先余部在后的次序组合成整个汉字的编码。

为了使数字码取码时思维比较流畅，也可设计为首部或部首的字根一律都取2码，称之为：“首部一律取2码音形义数字型汉字编码输入法”或“部首一律取2码音形义数字型汉字编码输入法”，码长定为5、或6、或7、或8，其“首部”或“部首”的编码部件都只取2码，即依次取其编码部件数字型代码、编码部件数字型义类码；对于2个编码部件组成的汉字，其余部以如下方式取码：如果其“首部”或“部首”是处于主部件的高频编码部件，则余部的编码部件的编码，取2码，即依次取其编码部件数字型代码、编码部件数字型义类码，否则，余部的编码部件的编码取3码，即依次取其编码部件数字型代码、编码部件数字型义类码、相应的首笔画数字型代码或者末笔画数字型代码。对于3个或3个以编码部件组成的汉字，余部部分的取码方法为：剩余取码数小于等于余部的字根个数，在满足末字根必须取1码的前提下，依次对余部的第1编码部件、第2编码部件......末编码部件，各取1数字码即其数字型代码，直到余部各编码部件取码个数之和等于剩余取码数为止；剩余取码数大于余部的编码部件个数，首先满足余部的各个编码部件取1码，再有富余取码数，再依次满足末编码部件、次末编码部件取2码的要求，但也可以，余部是由2个编码部件组成，且未编码部件为“日”或“口”或“刀”或“刂”，则先满足次末编码部件取2码，再有富余取码数，然后再满足末编码部件取2码；余部各编码部件都取2码后，仍有富余取码数，依次对末编码部件取3码、次末编码部件取3码；以上述规则余部各编码部件都取3码后，仍然还有富余取码数，且是上下结构的汉字，加结构识别码“4”，否则，则以结束键结束取码；根据上述方法确定余部部分各编码部件取码个数，并依次对余部部分的各编码部件取码，得到余部部分的编码；

汉字首部部分的编码与余部部分的编码和部首部分的编码与余部部分的编码，组合成整个汉字的数字型编码的方式为：

A、首笔画数字全码音形义首部余部数字型汉字编码输入法和末笔画数字全码音形义首部余部数字型汉字编码输入法，都依次把首部、余部的数字编码组合成整个汉字的数字型编码；

B、首笔画数字全码音形义部首余部顺序式数字型汉字编码输入法与末笔画数字全码音形义部首余部顺序式数字型汉字编码输入法，都依次把部首、余部的数字型编码根据拆分规则确定的部首、余部先后次序顺序地组合成整个汉字的编码；

C、首笔画数字全码音形义部首余部部首先取式数字型汉字编码输入法类与末笔画数数字全码音形义部首余部部首先取式数字型汉字编码输入法类，都把部首、余部的数字编码以部首在先余部在后的次序组合成整个汉字的数字型编码。

当然还可设计成，其“首部”或“部首”的编码部件，如果是为处在主部位的高频编码部件，或者其汉字的余部为二个或二个以上的编码部件组成的，则都取2码，其他情况，则取3码。余部的取码方式，与上述数字式汉字编码输入法中的余部取码方法完全一致。关于首部与余部或部首与余部组全成整个汉字的方式与上述数字式汉字编码输入法类完全相同。

(七)数字型词语编码输入方法

数字型词语编码输入法在上述数字型汉字编码输入法的基础上设计而成。为了便于表述数字型词语编码输入法，本发明规定，对词语中的1个汉字取4码，是指依次取该汉字编码的前4码；对于单个编码部件的汉字，只能取前3码，是指依次取该汉字数字编码的前3码；取3码，是指依次取该汉字数字编码的前3码；取2码，是指依次取该汉字数字编码的前2码；取1码，是指依次取该汉字数字编码的前1码。具体编码方法如下：

在选定的一种码长数(例如：5码法或6码法或7码法)的数字型汉字编码输入法中，选定输入法的码长数小于等于词语中的汉字个数，在满足末个汉字必须取1码的前提下，依次对词语的第1个汉字、第2个汉字......末个汉字，各取1码，直到词语的取码个数之和等于输入法选定的码长数。

如果输入法选定的码长数大于词语中的汉字个数，那么要先确定给词语的每个汉字取码的个数，然后根据确定的取码个数依次对词语的每个汉字取码。词语每个汉字的取码个数是这样确定的：首先满足词语的每个汉字取1码的要求，如果还有取码富余数，然后再依次满足末个汉字、次末个汉字、再次末个汉字取2码的要求，如果词语的各汉字都取2码后，还有取码富余数，则依次再满足末个汉字、次末个汉字的取3码的要求，直至词语的各个汉字的取码之和等于输入法选定的取码个数为止。如果对词语的每个汉字都取3码后，仍然还有取码富余数，则末汉字取4码；如果末汉字是个成字编码的部件，最多只能取3码，则以结束键结束编码。确定了词语的各个汉字的取码个数后依次取相应的数字码，就得到该词语的数字型编码，依次击数字键，如果有重码，再击重码选择键，完成词语输入。

为了便于输入，降低重码率也可以通过数字键盘上常设的一些符号键、数字键的0键等键或它们的组合，实现词汇输入引导，标点符号引导、英文字母输入引导、重码选择引导、空格引导、数字数值引导、切换汉字字集引导、手机原字母输入方式引导等功能。

有益的效果

音形义汉字编码输入法与已有技术比较具有显著的有益的效果，采用本发明的4码法音形义首部余部字母型汉字编码输入法对GB2312 6763汉字字符集编码，对其以D字母开头的汉字编码静态统计，其重码率不足百分之一。汉字编码以D开头的汉字达357个，是一个最大的汉字子集。考虑到其他一些因素，整个GB2312汉字字符集的编码重码率不会超过百分之三。从重码率指标看，达到国内领先水平。

采用本发明的4码法音形义部首余部字母型汉字编码输入法，对GB13000.1-93标准的汉字字符集的206个“辶”部首的汉字编码静态统计，其本部首的重码率为0.97％；对198个“犭”部首的汉字编码静态统计，其本首部的重码率为4％；采用5码法编码，该两个汉字集没有重码。

本发明根据各个编码部件的构字能力大小和构字时所处的主要部位，设计采用了高频编码部件和主部位的概念，以及处于主部位的高频编码部件取1码的编码技巧，使在同样码长的情况下其重码率最低。

本发明的字母型汉字编码输入法中用2码加结束键输入的编码部件字就达300多个，用3码加结束键输入的2部件字，其“首部”或“部首”为主部位高频编码部件的汉字就达一、二千字，而且几乎无重码。

本发明充分利用人们已经掌握的汉字音形义方面的知识、部首方面的知识，从整体上认识编码部件，进行编码，理据性比较强，便于使用者记忆掌握，有利于推广应用。

附图说明

附图1是，《编码部件的25种义类名称、义类含义、字母型义类码、取码提示对照表》。

附图2是，《405个编码部件组、640个编码部件的编码部件字母型代码、编码部件字母型义类码参照表》。对照表中“部件组号”栏目所列的是本发明把所确定的所有编码部件组的顺序号；“部件序号”栏目所列的是本发明确定的所有编码部件的顺序号；“部件代码”栏目所列的是所有编码部件的编码部件字母型代码；“部件义码”栏目所列的是所有编码部件的编码部件字母型义类码；“部件形状”栏目所列的是本发明确定的所有编码部件形状；“部件表序号”栏目所列的是本发明采用的编码部件在GF3001-1997标准的《汉字基础部件表》中的部件序号。“统一部首”栏目，把640编码部件中列在中国文字改革委员会、国家出版局发布的《汉字统一部首表(草案)》中的281个部首部件，都一一标明。考虑到本发明的《说明书》篇幅已经很长，该对照表中没有列入起说明作用的“部件汉语拼音”、“部件简义”、“取代码提示”、“取义码提示”等栏目的内容。

附图3是，《字母型汉字编码输入法用的字母键盘面结构示意图》。图中每个键位的纵向中间一列的上面字母，表示该键的字母键名称，下面汉字标出了该键的字母码表达的编码部件义类名称；左边一列、右边一列、上面一行、左下、左上等位置分别列着的高频编码部件的形状表示该字母键分别表达的27个高频编码部件组的高频编码部件及其在汉字结构中的主部位的相应位置；该键位的字母就是所列的高频编码部件字母型代码。例如：“艹”在Z字母键中间一列“Z”字母的上面，表示该高频部件的字母型代码为Z，且其主部位在汉字的上部位；“Z”字母的下面文字“植物类”，表示“Z”又是编码部件植物类义类的义类码。

附图4是，《27个高频编码部件组部件组号、高频编码部件的部件序号、基础部件表号、高频编码部件、部件字母型代码、部件字母型义类码、首笔数字全码、末笔数字全码、取码提示及其主部位位置对照表》。对照表中“部件组号”、“部件序号”二栏目分别为高频编码件组、高频编码部件在附图2《对照表》中所列的编码部件组的顺序号和编码部件的顺序号；“基础部件表号”为GF3001-1997所列的部件序号；“首笔数字全码”栏目，列出各高频编码部件的首笔画数字型全码；“末笔数字全码”栏目，列出各高频编码部件的末笔画数字，全码；“主部位位置”栏目，列出了各高频编码部件在整个汉字中处于主部位的位置。

附图5是，《双拼字母替代声母、韵母对照表》。

附图6是，《1数字码替代多字母码键盘盘面键位结构示意图》。

具体实施方法

以下举例说明音形义汉字编码输入方法的多种类型汉字编码输入法，对“黎”、、“江”、“涤”、“沿”、“船”“鸬”、“鸳”、“旰”、“旱”等10个汉字的编码：4码法音形义首部余部字母型汉字编码输入法其编码分别为：HZDS、DSGQ、DGQ、DSUZ、DJQK、ZUJK、BXPN、XTJN、OGD、OTGD；6码法首笔画数字全码音形义首部余部数字型汉字编码输入法，其编码分别为479823、834774、83774、833457、839735、759973、893926、929926、82784、823784；6码法末笔画数字全码音形义首部余部数字型汉字编码输入法，其编码分别为：478823、834774、83774、833457、839735、758973、894926、928926、82783、824783；4码法音形义部首余部顺序式字母型汉字编码输入法，其编码分别为：HRSK、DSGQ、DGQ、DSUZ、DJQK、ZUJK、BPXN、XJNC、OGD、OTGD；4码法音形义部首余部部首先取式字母型汉字编码输入法，其编码分别为：SKHR、DSGQ、DGQ、DSUZ、DJQK、ZUJK、BPXN、NCXJ、OGD、OTGD；6码法首笔画数字全码音形义部首余部顺序式数字型汉字编码输入法，其编码分别为：482333、834774、83774、833457、839735、759973、899926、992269、82784、823784；6码法首笔画数字全码式音形义部首余部部首先取式数字型汉字编码输入法，其编码分别为：333482、834774、83774、833457、839735、759973、268999、269992、82784、823784；6码法末笔画数字全码式音形义部首余部顺序式数字型汉字编码输入法，其编码分别为：482338、834774、83774、833457、839735、758973、899926、9992264、82783、824783。

Claims

1.一类音形义汉字编码输入法，利用计算机通用字母键盘或者手机、计算机的数字键盘，输入汉字或词语，其特征在于：根据GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》选定560个编码部件，利用汉字汉语拼音的字母表达形式，选定的编码部件根据义相同或形相近等明显关联性，归并成编码部件组，并从每个编码部件组中选定一个主形编码部件作代表，则：

(1)根据主形编码部件赋有的一种读音的汉语拼音的第1个字母，或者根据与主形编码部件的其他关联因素取1个便于联想记忆的字母，赋予每个主形编码部件一个字母型代码；

(2)把所有主形编码部件的含义，归并确定为20至26种义类，根据义类名称中的一个汉字的一种读音的汉语拼音的第1个字母，或者根据与义类名称的其他关联因素取1个便于联想记忆的字母，赋予每种义类一个字母型义类码；

(5)确定16至28个含有构字能力特别强的主形编码部件的编码部件组为高频编码部件组，确定其组内20至36个编码部件为高频编码部件以及其在汉字结构中的主部位位置；

从而得到选定的每个编码部件的字母型代码和字母型义类码；用1至9的9个数字中的每个数字不重复地分别替代编码部件字母型代码和字母型义类码的2至4个英文字母，从而得到每个编码部件的相应的数字型代码和数字型义类码，并且还选定5个数字分别作为汉字5类笔画的数字型代码；利用编码部件的字母型汉字编码资源的音形义汉字编码输入法称为音形义字母型汉字编码输入法，在计算机的通用字母键盘上实现输入操作；利用编码部件的字母型汉字编码资源和汉字的汉语拼音资源的音形义汉字的编码输入法称为拼音类音形义字母型汉字编码输入法，在计算机的通用字母键盘上实现输入操作；利用编码部件的数字型汉字编码资源的音形义汉字编码输入法称为音形义数字型汉字编码输入法，在计算机或手机的数字键盘上实现输入操作；具体实现则为：

(6)音形义字母型汉字编码输入法：

C、2个或2个以上编码部件组成的汉字，分成首部与余部或部首与余部两部分，利用上述确定的编码部件字母型代码、字母型义类码、高频编码部件及其主部位，对上述两部分编码，再组合成整个汉字的编码：

首部这个字根，是处在主部位的高频编码部件，则取1码，否则都取2码；

余部取编码：

首先确定余部取码个数，余部取码个数为该编码方法确定的码长数减去首部已取码个数之差，本发明称之为剩余取码数。剩余取码数确定后，对余部取码又有两种情况：

剩余取码数小于等于余部的编码部件个数，在满足末字根必需取1码的前提下，依次满足余部的第1字根、第2字根......末字根，各取1码，直到余部字根取码个数之和等于剩余取码数为止。换句话说，剩余取码数为1，只取末字根1码；剩余取码数为2，就取余部的第1字根和末字根各1码，依此类推；

剩余取码数大于余部的字根个数，以如下原则确定余部各字根的取码个数：首先满足余部的各个字根必需取1码，还不足剩余取码数，即有富余取码数，再依次满足末字根、次末字根取2码的要求；

把汉字的首部部分取的编码与余部部分取的编码，以先首部后余部的次序组合成整个汉字的编码；

(7)音形义数字型汉字编码输入法：

B、单个普通编码部件的汉字以及其他所有普通编码部件的数字型编码，为其3位数数字型全码，即为其部件数字型代码加上部件数字型义类码加上该编码部件的首笔画或者末笔画的笔画部件数字型代码；高频编码部件的汉字的数字型编码或高频编码部件的数字型编码，都为其部件数字型代码加上部件数字型义类码；

C、2个或2个以上编码部件组成的汉字，分成首部与余部或者部首与余部两部分，利用以上确定的编码部件数字型代码、数字型义类码、5类笔画的数字型代码、高频编码部件及其主部位，对上述两部分编码，再组合成整个汉字的编码：

“首部”字根，是处于主部位的高频编码部件，一律只取2码，至于其他的则取3码，

剩余取码数小于等于余部的字根个数，在满足末字根必须取1码的前提下，依次取余部的第1字根，、第2字根.....末字根，各取1数字码，直到余部字根取码个数之和等于剩余取码数为止；

剩余取码数大于余部的字根个数，以如下方法对余部各字根取码：必需首先满足余部的各个字根取1码，再有富余取码数，再依次满足末字根、次末字根取2码的要求；

依次把首部、余部的数字型编码组合成整个汉字的数字型编码；

2.根据权利要求1所述的一类音形义汉字编码输入法，其特征在于，其义类设定为25种，每个义类根据其义类名称中的一个汉字的一种读音的汉语拼音的第1个字母赋予其字母型义类码；或者以其韵母第1字母或以英译名的第1字母作其字母型义类码；或者以与字母的相似性取其字母型义类码；25种义类名称及其字母型义类码对照列于下面：

动作类兵器类虫鸟类大动物类手类足类干支类头部首类衣饰类居建类矿物类地理类目口词类数量类笔十类人身类器物类人类食物类天气类瓦皿车类位置类心信类乐色类植物类 A B C D E F G H I J K L M N O P Q R S T U W X Y Z

3.根据权利要求1所述的一类音形义汉字编码输入法，其特征在于，根据规范选定640个编码部件，并根据其义相同或形相近似、或形有一定的内在联系、或互为古今字、或互为繁简字等明显的关联性归并成405个编码部件组，并确定各编码部件组的第一个编码部件为该组的主形编码部件，并作为该组的代表；(1)根据主形编码部件，是成字部首的则根据其汉字，是非成字部件的则根据其与另一个编码部件组成的一个常用汉字，是偏旁部首的则根据其俗称中的一个汉字，而赋有的一种汉语读音的汉语拼音的第1个字母赋予其字母型代码；其中对于其汉语拼音第1个字母为y的主形编码部件，其首笔画为“丨”、“乛”、“丿”的，则其部件字母型代码取为y，其首笔画为“丶”、“一”的，其部件字母型代码取为I；其中对于汉语拼音为WU的主形编码部件取U为部件字母型代码；或者根据主形编码部件与某一英文字母存在的一定的相似性或其英译名的第1个字母，给主形编码部件取部件字母型代码；(2)根据主形编码件，是成字部件的则根据其汉字，是非成字部件的则根据其与另一编码部件组成的一个常用汉字的一种含义，是偏旁部首的则根据其含义或者其偏旁部首的身份，而赋有的一种含义，归为25种义类中的一类，并赋予相应的字母型义类码；主形编码部件“事”、“书”、“牙”、“予”以其读音的汉语拼音的韵母为依据归入相应的义类，取相应的部件字母型义类码；(3)每个编码部件组中的每个编码部件赋予与该编码部件组的主形编码部件完全一样的部件字母型代码和部件字母型义类码；405个编码部件组中的640个编码部件的部件形状、部件字母型代码、部件字母型义类码对照列于下面：

4.根据权利要求1所述的一类音形义汉字编码输入法，其特征在于确定27个含有构字能力特别强的主形编码部件组为高频编码部件组，确定其组内的各个高频编码部件，共计35个，高频编码部件以及其在汉字结构中的主部位的位置，对照列于下面：

5.根据权利要求1或2或3或4所述的一类音形义汉字编码输入法，其特征在于，码长从3、4、5、6、7、8等6个数中选定一个数；对“首部”、“余部”具体取码方法为：确定为首部部分的那个编码部件如果是处在主部位的高频编码部件，则取1码，即取其部件字母型代码，否则就取2码，即取其部件字母型代码和部件字母型义类码；余部的取码方法：(1)剩余取码数小于等于余部的编码部件个数，在满足末编码件必需取1码的前提下，依次对余部的第1编码部件、第2编码部件......末编码部件各取1码，直到余部编码部件取码个数之和等于剩余取码数为止；(2)剩余取码数大于余部的编码部件个数，首先满足余部的各编码部件必需取1码，有富余取码数，再依次满足末编码部件、次末编码部件取2码的要求；(3)余部是由2个编码部件组成，而且末编码部件为“日”、或“口”、或“刀”、或“刂”的，则先满足次末编码部件取2码的要求，再有富余取码数，然后再满足末编码部件取2码的要求；(4)余部的各编码部件都取2码后，仍有富余取码数，是上下结构型的汉字可加字型识别码字母“A”；根据上述方法确定余部的各编码部件取码个数，并依次对余部各编码部件取码，得到余部部分的编码；

汉字首部部分的编码与余部部分的编码，组合成整个汉字的编码的方式为：

对于音形义首部余部字母型汉字编码输入法，汉字的首部部分取的编码、余部部分取的编码，以先“首部”后“余部”的次序组合成整个汉字的编码。

6.根据权利要求1或2或3或4所述的一类音形义汉字编码输入法，其特征在于，部首取2码音形义部首余部部首先取式字母型汉字编码输入法，其部首部分只能由281个部首编码部件充当；码长设定为6、或7、或8、或9、或10；非部首编码部件以及单个非部首编码部件的汉字，其编码为该编码部件首笔画字母型全码加该编码部件的字母型全码；部首编码部件的编码为该部首编码部件的字母型全码；2或2以上编码部件的汉字分成字典类部首部分与余部部分，定为字典部首部分的部首编码部件，一律取2码；余部的取码方法：(1)剩余取码数小于等于余部的编码部件个数，在满足末编码件必需取1码的前提下，依次对余部的第1编码部件、第2编码部件......末编码部件各取1码，直到余部编码部件取码个数之和等于剩余取码数为止；(2)剩余取码数大于余部的编码部件个数，首先满足余部的各编码部件必需取1码，有富余取码数，再依次满足末编码部件、次末编码部件取2码的要求；(3)余部是由2个编码部件组成，而且末编码部件为“日”、或“口”、或“刀”、或“刂”的，则先满足次末编码部件取2码的要求，再有富余取码数，然后再满足末编码部件取2码的要求；(4)余部的各编码部件都取2码后，仍有富余取码数，是上下结构型的汉字可加字型识别码字母“A”；根据上述方法确定余部的各编码部件取码个数，并依次对余部各编码部件取码，得到余部部分的编码；以字典部首部分取的编码在先余部部分取的编码在后的次序组合成整个汉字的编码。

7.根据权利要求1或2或3或4所述的一类音形义汉字编码输入法，其特征在于，部首取2码余部第1编码部件先取2码的音形义部首余部部首先取式字母型汉字编输入法，码长可设定为7、或8、或9、或10、或11、或12；字典部首部分的编码部件一律取2码；余部部分的取码方法为：在首先满足末部件必需取不少于1码的前提下，依次满足余部部分第1编码部件、第2编码部件......取2码的要求，后面的，满足不了取2码，就取1码，直到余部部分取码数之和达到码长数减2的差数；余部部分各编码部件都取2码后，仍有取富余数，且该汉字是上下结构型的，则再加上结构识别码A；再有取码富余数，以结束键结束余部部分的取码；以字典部首部分取的编码在先，余部部分取的编码在后的次序组合成整个汉字的编码。

8.根据权利要求1或2或3或4所述的一类音形义汉字编码输入法，其特征在于，首末编码部件代码拼音音形义字母型汉字编码输入法，码长设定为8，对于编码部件及其只有一个编码部件的汉字的编码依次取其编码部件字母型代码、编码部件字母型义类码；对于2个或2个以上编码部件组成的汉字，依次对该汉字根据拆字规则确定的首位编码部件和末位编码部件各取其编码部件字母型代码，然后与该汉字的汉语拼音字母依次组合成整个汉字的编码，不足设定的码长数，以结束键结束，如有重码，再击重码选择键。

9.根据权利要求1或2或3或4所述的一类音形义汉字编码输入法，其特征在于，拼音首字母首末编码部件音形义字母型汉字编码输入法，码长为4；成字编码部件及非成字编码部件的编码，为其编码部件的字母型全码，以结束键结束，有重码，再击重码选择键；对于由2个编码部件构成的汉字，其第1编码部件是处于主部位的高频编码部件，则第1编码部件取1码，即其字母型代码，第2编码部件取2码，即其字母型代码加上字母型义类码，以结束键结束，有重码，再击重码选择键；其第1编码部件是普通编码部件或者是非处于主部位的高频编码部件，则依次取汉字拼音首字母、汉字首编码部件字母型代码、末编码部件的字母型代码和字母型义类码；对于由3个或3个以上编码部件构成的汉字，依次取汉字拼音首字母、汉字首编码部件字母型代码、第2编码部件字母型代码、末编码部件字母型代码；依次击字母键，如有重码，再击重码选择键，完成汉字编码输入。

10.根据权利要求1或2或3或4所述的一类音形义汉字编码输入法，其特征在于，音形义数字型汉字编码输入法，(1)以1分别替换I、Y，以2分别替换R、N、T，以3分别替换S、K、E，以4分别替换A、F、H，以5分别替换W、U、M，以6分别替换L、C，以7分别替换Q、G、Z，以8分别替换D、O、B，以9分别替换P、J、X的方式，替换640个编码部件字母型代码和编码部件字母型义类码中相应的英文字母，从而得到该640个编码部件相应的部件数字型代码和部件数字型义类码；(2)编码部件首笔画数字全码依次为其编码部件数字型代码、编码部件数字型义类码、该编码部件的首笔画编码部件数字型代码组合的3位数字码；(3)码长可以取为5、或6、或7、或8、或9、或10、或11、或12；(4)对于普通编码部件和单个普通编码部件的汉字编码取其相应的数字型全码；对于高频编码部件和单个高频编码部件的汉字的编码，为其数字型代码加上其数字型义类码；(5)对2或2以上编码部件构成的汉字，分成首部与余部两部分；(6)对于“首部”的编码部件，是处于主部位的高频编码部件，取2码即为其数字型代码和数字型义类码，其他的则取其相应的数字式全码，即其数字型代码加上其数字型义类码再加上相应的首笔画数字型代码或者末笔画数字型代码；(7)余部部分的取码方法为：剩余取码数小于等于余部的字根个数，在满足末字根必须取1码的前提下，依次对余部的第1编码部件、第2编码部件......末编码部件，各取1数字码即其数字型代码，直到余部各编码部件取码个数之和等于剩余取码数为止；如果剩余取码数大于余部的编码部件个数，那么首先满足余部的各个编码部件取1码，如果再有富余取码数，再依次满足末编码部件、次末编码部件取2码的要求，但是，如果余部是由2个编码部件组成，而且未编码部件为“日”或“口”或“刀”或“刂”的，则先满足次末编码部件取2码，再有富余取码数，然后再满足末编码部件取2码；余部各编码部件都取2码后，仍有富余取码数，依次对末编码部件取3码、次末编码部件取3码；以上述规则余部各编码部件都取3码后，仍然还有富余取码数，且是上下结构的汉字，加结构识别码“4”，否则，则以结束键结束取码；根据上述方法确定余部部分各编码部件取码个数，并依次对余部部分的各编码部件取码，得到余部部分的编码；

汉字首部部分的编码与余部部分的编码，组合成整个汉字的数字型编码的方式为：

首笔画数字全码音形义首部余部数字型汉字编码输入法，依次把首部、余部的数字编码组合成整个汉字的数字型编码。

11.根据权利要求1或2或3或4所述的一类音形义汉字编码输入法，其特征在于，“首部”一律取2码音形义数字型汉字编码输入法类，码长定为5、或6、或7、或8，其“首部”的编码部件都只取2码，即依次取其编码部件数字型代码、编码部件数字型义类码；对于2个编码部件组成的汉字，其余部以如下方式取码：如果其“首部”是处于主部位的高频编码部件，则余部的编码部件的编码，取2码，即依次取其编码部件数字型代码、编码部件数字型义类码，否则，余部的编码部件的编码取3码，即依次取其编码部件数字型代码、编码部件数字型义类码、相应的首笔画数字型代码或者末笔画数字型代码；对于3个或3个以上编码部件组成的汉字，余部部分的取码方法为：剩余取码数小于等于余部的字根个数，在满足末字根必须取1码的前提下，依次对余部的第1编码部件、第2编码部件......末编码部件，各取1数字码即其数字型代码，直到余部各编码部件取码个数之和等于剩余取码数为止；剩余取码数大于余部的编码部件个数，首先满足余部的各个编码部件取1码，再有富余取码数，再依次满足末编码部件、次末编码部件取2码的要求，余部是由2个编码部件组成，而且未编码部件为“日”、或“口”、或“刀”、或“刂”的，则先满足次末编码部件取2码，再有富余取码数，然后再满足末编码部件取2码；余部各编码部件都取2码后，仍有富余取码数，依次对末编码部件取3码、次末编码部件取3码；以上述规则余部各编码部件都取3码后，仍然还有富余取码数，且是上下结构的汉字，加结构识别码“4”，否则，则以结束键结束取码；根据上述方法确定余部部分各编码部件取码个数，并依次对余部部分的各编码部件取码，得到余部部分的编码；

首笔画数字全码音形义首部余部数字型汉字编码输入法，都依次把首部、余部的数字编码组合成整个汉字的数字型编码。