CN101241403B - 一种部件汉字编码输入方法及其相应键盘 - Google Patents
一种部件汉字编码输入方法及其相应键盘 Download PDFInfo
- Publication number
- CN101241403B CN101241403B CN2008100266160A CN200810026616A CN101241403B CN 101241403 B CN101241403 B CN 101241403B CN 2008100266160 A CN2008100266160 A CN 2008100266160A CN 200810026616 A CN200810026616 A CN 200810026616A CN 101241403 B CN101241403 B CN 101241403B
- Authority
- CN
- China
- Prior art keywords
- parts
- key
- stroke
- word
- sum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
一种部件汉字编码输入方法及其相应键盘,用英文或数字键盘5键输入;取136个部件,将字依次拆出部件,部件之前或之间或之后不构成部件的笔画组称为非部件笔画,每一部件或非部件笔画称为部分;无部件字逐笔拆分,每一笔作为一部分;部件读音码(D)与首笔笔形数码(S)或仅仅首笔笔形数码(S)组成所述部分的编码;与键位相对应的首笔笔形数码是指部件或非部件笔画中含有与该部件或非部件笔画的首笔笔形相同的笔画的总数目;字、简码字、词的第一部分的编码分别是D1.1+S1.1、S1.1+D1.1、S1.1+D1.1,字词编码兼容且相互识别。本方法记忆量小、易学、重码率低,用于计算机、手机、固定电话等电子信息产品输入汉字。
Description
技术领域
本发明涉及计算机信息处理技术,尤其是涉及利用英文键盘或数字键盘对计算机、手提电话、固定电话等电子信息产品进行汉字编码输入的方法。
背景技术
截至目前为止,向国家知识产权局申请专利的计算机汉字编码输入方法已有4000多种。虽然这些输入方法数量多,但归纳起来不外乎为以下几种方法:
1、音码输入法,即利用汉字的读音特征来编码输入汉字的输入法。例如,全拼输入法、智能ABC拼音输入法等都属于音码输入法。
2、形码输入法,即单纯利用部件或笔画等汉字的字形特征来编码输入汉字的输入法。例如,中国专利公开号CN85100837,公开日1986年7月30日,发明创造的名称为优化五笔字型编码法及其键盘;中国专利公开号CN1121596,公开日1996年5月1日,发明创造的名称为汉字实用部首编码法及其键盘;中国专利公开号CN1209600,公开日1999年3月3日,发明创造的名称为汉字部首编码计算机输入法;中国专利公开号CN1127385,公开日1996年7月24日,发明创造的名称为字根拼形规范码汉字输入方法;中国专利公开号CN1388439,公开日2003年1月1日,发明创造的名称为汉字纯部首编码计算机输入法,以上5种输入方法都属于形码输入法;中国专利公开号CN1191340,公开日1998年8月26日,发明创造的名称为汉字阴阳双极形码输入系统,该方法利用笔画特征来编码输入汉字,也属于形码输入法。
3、音形码输入法,即既利用读音特征又利用部件或笔画特征来编码输入汉字的输入法。例如,中国专利公开号CN1144930,公开日1997年3月12日,发明创造的名称为部首编码汉字键盘输入系统,该发明的词的编码输入就是要利用到词第一个字的拼音。
4、数字编码输入法,包括利用读音特征来编码的音码数字输入法、利用部件或笔画特征来编码的形码数字输入法以及利用读音特征与部件或笔画特征来编码的音形码数字输入法等。例如,中国专利公开号CN1256446,公开日2000年6月14日,发明创造的名称为首部余部笔画数字编码汉字输入法及其键盘;中国专利公开号CN1274880,公开日2000年11月29日,发明创造的名称为一种汉字数字编码输入方法;中国专利公开号CN1355465,公开日2002年6月26日,发明创造的名称为一种偏旁部首汉字输入方法,上述三种输入方法属于形码数字输入法;中国专利公开号CN1282012,公开日2001年1月31日,发明创造的 名称为笔韵码汉字输入法,该方法利用笔画与读音的特征来编码输入汉字,属于音形码数字输入法。
上述使用英文键盘的汉字输入方法不足之处可归纳为以下几种:
1、无法克服语言障碍,难学,不利于广泛推广。例如,对于音码输入法和音形码输入法,只有完全掌握汉字拼音的人才能熟练应用。而对于许多不讲普通话的人来说,熟悉汉字拼音是件很难的事。即使是讲普通话的人也对大多数汉字的拼音感到陌生。因此,音码输入法和音形码输入法无法克服语言障碍,难学,不为绝大多数人所掌握,不利于广泛推广,不利于深入应用。但由于中国人自小接受汉字拼音基础知识教育,而且音码输入法门槛低,因此,音码输入法将继续是多数中国人初学输入汉字所选择的方法。
2、记忆量大。有些形码输入法部件多,部件分布规律性不强,因此,记忆量大,难以掌握。例如,《优化五笔字型编码法及其键盘》有199个字根(部件),这些字根多数不是人们习惯使用的部首,而且分布在键位的规律性不强,所以非专业人员要记住199个字根及其在键位上的分布是比较困难的;《汉字实用部首编码法及其键盘》有208个部件;《部首编码汉字键盘输入系统》有240个部件;《汉字纯部首编码计算机输入法》虽然只有124个部件,但部件分布规律性不强,因此,记住124个部件也不容易。
3、重码率高。由于同音字多,所以音码输入法重码率相当高。而形码输入法,由于部件多的字的码位长仅4或5键,部件少的字的码位长仅2或3键,因而造成编码容量小,加之字词编码没有互相识别,字词之间互相交叉重码,所以形码输入法的重码率也比较高。例如,重码率比较低的《优化五笔字型编码法及其键盘》,其字词编码没有互相识别,如果字不采用识别码输入,仅仅国标6763个字的重码率就达6%,如果不进行简繁输入切换,仅国标6763个字及其的繁体字,重码率就高达25%,对于输入GB18030-2000字符集的27533个汉字以及《现代汉语词典》的约70000个词,其重码率之高也可想而知了。而《汉字纯部首编码计算机输入方法》,其国标6763个字的重码率就高达8.62%。
上述使用数字键盘的汉字输入法不足之处主要是重码率高,字数多的重码组组数占总重码组组数的比例大。音码数字输入法由于同音字多,编码键局限在9个键位,而形码数字输入法由于设置的多笔画部件或单笔画部件数目少,因此,上述两种输入法不仅重码率高,而且字数多的重码组组数占总重码组组数的比例大。例如,《首部余部笔画数字编码汉字输入法及其键盘》,3755个国标一级字内,用5键编码输入,单码字仅为722个,其中2重码字共652个,占重码字的21.50%;用6键编码输入,单码字为1564个,其中2重码字共926个,占重码字的42.26%。
发明内容
本发明克服了现有技术中的不足,提供一种记忆量小、易学、重码率低、字词数多的重码组组数占总重码组组数的比例小的汉字编码输入方法,该方法可利用英文键盘或数字键盘对计算机、手提电话、固定电话等电子信息产品进行汉字编码输入。
本发明的技术方案概述如下:
一种部件汉字编码输入方法,用于计算机、手提电话、固定电话等电子信息产品,包括如下步骤:
步骤一,以构成汉字的部件为依据将汉字拆分为部分,确定每个所述部件的编码;
步骤二,确定每个所述部分的首笔笔形数码,所述首笔笔形数码是指所述部分中包含有与该所述部分的首笔的笔形相同的笔画的总数目,所述笔形为横、竖、撇、点、折共五种,
其中横笔形包括提笔形,
点笔形包括捺笔形,
竖笔形是一竖,不包括一竖带钩或一竖带转折的笔形,
折笔形包括所有笔画走向出现转折或拐弯的笔形,
点笔形的首笔笔形数码最多是4点,超过4点的按4点计算,
横、竖、撇、折笔形的首笔笔形数码最多是5笔,超过5笔的按5笔计算,把所述首笔笔形数分配到英文键盘的字母键位或数字键盘的数字键位上,所述首笔笔形数所在的英文键盘字母键位上的字母或数字键盘键位上的数字称作部件读音码称作首笔笔形数码;
步骤三,给汉字或词编码,所述汉字或词的编码由每个所述部分的编码组成,所述部分的编码由每个所述部件的编码和所述首笔笔形数码组成,或仅由所述首笔笔形数码组成;
步骤四,依次键入所述汉字或词的编码,从而输入汉字或词。
运用本发明所述部件进行汉字编码,既可以采用现有的形码输入法的编码方式,也可以采用本发明归纳总结的编码方式。因此可避免改变用户的编码习惯,通用性强,用户的记忆量小。例如用户从五笔字型改用本发明的输入法,可以在不改变编码习惯的前提下较快地掌握本发明的输入法。
其中,所述部分为本发明的专用名词。
所述部分是汉字拆分后形成的组成汉字的单笔画或笔画组。
所述部件和所述部分两者相互联系,但定义不同。历来对部件的定义存在分歧,费锦昌认为,“部件是现代汉字字形中具有独立组字能力的构字单位,它 大于或等于笔画,小于或等于整字”。所述部分是汉字拆分后形成的组成汉字的单笔画或笔画组。所述部件都可以是所述部分,例如“明”字拆分成“日”和“月”,其中“日”和“月”是本发明中构成汉字的部件,同时也是汉字“明”拆分后的部分。所述部分不一定是所述部件,例如,无部件字按笔画拆分,“专”字拆分成“一”、“一”、“ㄣ”和“丶”四部分,这四部分都不是所述部件。
在常见的形码输入法中,每种不同的输入法之间的区别仅仅是其部件的编码体系不同,而输入汉字或词的方法基本相同,即是为拆分出的部件编码,然后在键盘中依次键入代表整个汉字或词的编码,从而输入汉字或词。本发明创造性地提出了首笔笔形数码的概念,所述部分的编码由每个所述部件的编码和所述首笔笔形数码组成,或仅由所述首笔笔形数码组成。对比现有的输入法,本发明提出的首笔笔形数码使字的编码与简体字或词的编码互相识别,使包含部件少的字的编码码位长度增长,从而使重码率显著降低。另外,用首笔笔形数码作为所述非部件笔画的编码,从而使用少量部件也能拆分汉字,也能为汉字编码,达到了降低对部件的记忆量的目的。
所属技术领域的普通技术人员根据本发明的提示,即可采用首笔笔形数码对汉字或词进行编码,从而输入汉字或词。
针对三种不同汉字,将汉字拆分为所述部分的方法如下,选取构成汉字的部件,
①包含所述部件的汉字按笔画顺序拆分,依次拆出笔画数目多的所述部件,每个所述部件均为所述部分;
②除所述部件外,位于所述部件之前或之间或之后的不构成一个完整所述部件的一画或一画以上的笔画组为非部件笔画,也作为所述部分;
依此规则,依笔画顺序把包含有所述部件的汉字拆分为两个或以上所述部分;
③没有包含所述部件的汉字,依笔画顺序逐笔拆分,拆分出来的每一单笔画也作为所述部分;
依此规则,把没有包含所述部件的汉字拆分为两个或以上所述部分,每个所述部分的单笔画亦为所述非部件笔画。
步骤一中确定拆分出的每个所述部件的编码的方法如下,
选取构成汉字的所述部件,把所述部件分配到英文键盘的字母键位上或数字键盘的数字键位上,所述部件所在的英文键盘字母键位上的字母或数字键盘键位上的数字称作部件读音码,即为步骤一拆分出的每个所述部件的编码;
其中,选取的所述部件,及其在所述英文键盘的字母键位的分配如下:
T键:土 士 田
R键:日 曰
E键:耳 儿 阝 卩
W键:王 夂 攵
Q键:气 犭
Y键:尢 酉 月 冃 讠 幺 糹
I键:十 及 飠 衤 乙
O键:厂 扌 囗 齒 九 魚 鳥 舟 言 又
P键:人 亻 彳
F键: 方
D键:大 刂 冫 氵 刀
S键:石 山 罒 皿 氏 饣 礻 尸 厶 水 氺 纟
A键:戈 工 革 骨 鬼 广 冖 宀 弓
H键:黑 禾 火
J键:巾 几 臼 金 钅 己 已 巳
L键:里 亠 立 力
V键:贝 白 勹
C键:寸 艹 廾 车 車 虫 齿
Z键:走 止 爫 辶
N键:牜 鸟 女
M键:木 ホ 目 门 門 米 马 馬
选取的所述部件与数字键盘的数字键位的对应关系是:
2键对应A、B、C键的部件,3键对应D、E、F键的部件,4键对应H、I键的部件,5键对应J、K、L键的部件,6键对应M、N、O键的部件,7键对应P、Q、R、S键的部件,8键对应T、U、V键的部件,9键对应W、X、Y、Z键的部件。
步骤二中所述首笔笔形数码与英文键盘的字母键位或数字键盘的数字键位的对应关系如下:
T、R、E、W、Q键分别代表1横、2横、3横、4横、5横;
Y、U、I、O、P键分别代表1竖、2竖、3竖、4竖、5竖;
G、F、D、S、A键分别代表1撇、2撇、3撇、4撇、5撇;
H、J、K、L键分别代表1点、2点、3点、4点;
B、V、C、X、Z键分别代表1折、2折、3折、4折、5折;
2键对应A、B、C键的首笔笔形数码,代表5撇、1折、3折;
3键对应D、E、F键的首笔笔形数码,代表3撇、3横、2撇;
4键对应G、H、I键的首笔笔形数码,代表1撇、1点、3竖;
5键对应J、K、L键的首笔笔形数码,代表2点、3点、4点;
6键对应O键的首笔笔形数码,代表4竖;
7键对应P、Q、R、S键的首笔笔形数码,代表5竖、5横、2横、4撇;
8键对应T、U、V键,代表1横、2竖、2折;
9键对应W、X、Y、Z键,代表4横、4折、1竖、5折。
步骤三中所述部分的编码由所述部件读音码D和所述首笔笔形数码S组成,若所述部分是所述非部件笔画,则所述部分的编码仅由所述首笔笔形数码S组成;
D1.1、D1.2、D1.3、D1.m分别表示单个字或词第一个字的第一、第二、第三、末部分的部件读音码;
D2.1、D2.2分别表示词第二个字的第一、第二部分的部件读音码;
D3.1表示词第三个字的第一部分的部件读音码;
Dm.1表示词末字的第一部分的部件读音码;
S1.1、S1.2、S1.3、S1.4、S1.m分别表示单个字或词第一个字的第一、第二、第三、第四、末部分的首笔笔形数码;
S2.1、S2.2分别表示词第二个字的第一、第二部分的首笔笔形数码;
S3.1表示词第三个字的第一部分的首笔笔形数码;
Sm.1表示词末字的第一部分的首笔笔形数码;
所述给汉字或词编码的方法如下:
成字部件或非成字部件=D+S
两部分有部件字=D1.1+S1.1+D1.2+S1.2
三部分有部件字=D1.1+S1.1+D1.2+S1.2+D1.3或S1.3
四部分或四部分以上有部件字=D1.1+S1.1+D1.2或S1.2+D1.3或S1.3+D1.m或S1.m
无部件字=S1.1+S1.2+S1.3+S1.4+S1.m
二字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D2.2或S2.2
三字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D3.1或S3.1
四字或四字以上词=S1.1+D1.1+D2.1或S2.1+D3.1或S3.1+Dm.1或Sm.1
成字部件或非成字部件二级简码=S+D
两部分有部件字三级简码=S1.1+D1.1+D1.2或S1.2
三部分或三部分以上有部件字四级简码=S1.1+D1.1+D1.2或S1.2+D1.m或S1.m
五部分或五部分以上无部件字四级简码=S1.1+S1.2+S1.3+S1.m
可采用以下要诀记住上述部件与各字母键位的对应关系:
1、大多数部件按其名称的拼音音节的第一个字母,分布在相应的字母键位上。名称的拼音音节的第一个字母是G的部件分布在A键位上。
2、“十”、“及”、“飠”、“衤”、“乙”等部件按其名称的拼音音节的韵母分布在I键位上。
3、O、P、V键位上的部件可按以下方法记忆:O(囗)齒言厂提(扌),九舟魚又鳥,P三人(人、亻、彳)两撇( ),V背(贝)白色包(勹)。
4、图2中没有带括号的部件属于部首的正体,标有( )的部件属于部首的变体,标有<>的部件属于繁体部首,要重点记住109个部首的正体与8个繁体部首。
各部件与数字键盘的数字键位对应关系是:
2键对应A、B、C键的部件:戈 工 革 骨 鬼 广 冖 宀 弓 髟 卜 八 丷匕 疒 寸 艹 廾 车 車 虫 齿
3键对应D、E、F键的部件:大 刂 冫 氵 刀 耳 儿 阝 卩 方
4键对应H、I键的部件:黑 禾 火 十 及 飠衤 乙
6键对应M、N、O键的部件:木 ホ 目 门 門 米 马 馬 牜 鸟 女 厂 扌 囗齒 九 魚 鳥 舟 言 又
7键对应P、Q、R、S键的部件:人 亻 彳 气 犭 日 曰 石 山 罒 皿 氏饣 礻 尸 厶 水 氺 纟
记住各部件与数字键位的对应关系要诀:按“2键对应A、B、C键,3键对应D、E、F键”的规律,只要记住各部件与各字母键的对应关系,就能记住各部件与数字键的对应关系。
将汉字拆分,拆分汉字有如下的规则:
1、包含有本发明自定义部件的汉字按笔画顺序拆分,依次拆分出笔画数目多的部件,每个部件称作为一部分。除部件外,位于部件之前或之间或之后的不构成一个完整部件的一画或一画以上的笔画组定义为非部件笔画,每组非部件笔画也称作为一部分。依此规则,依笔画顺序把包含有本发明自定义部件的汉字拆分为两部分或两部分以上。
例1:“没”字依次拆分为“氵”、“几”和“又”,共三部分。
例2:“博”字依次拆分为“十”、“一”、“冃”、“丨丶”和“寸”,共五部分,其中“一”和“丨丶”属于非部件笔画。
例3:“拆”字依次拆分为“扌”和“斥”,共两部分,其中“斥”属于非部件笔画。
例4:“后”字依次拆分为“一”和“口”,共两部分,其中“一”属于非部件笔画。
例5:“拜”字依次拆分为“三”和“十”,共两部分,其中“三”属于非部件笔画。
例6:“然”字依次拆分为“夕”、“丶”“大”、和“丶灬”,共四部分,其中“丶”和“丶灬”属于非部件笔画。
2、没有包含本发明自定义部件的汉字,依笔画顺序逐笔拆分,拆分出来的每一单笔画也称作为一部分。依此规则,把没有包含本发明自定义部件的汉字拆分为两部分或两部分以上,每部分的单笔画属于非部件笔画。
例1:“爪”字依次拆分为“丿”、“丿”、“丨”和“丶”,共四部分。
例2:“斥”字依次拆分为“丿”、“丿”、“一”、“丨”和“丶”,共五部分。
拆分汉字应遵循以下原则:
1、本发明自定义的部件无论是否成为一个独立的汉字,都不用拆分。在词组编码输入的时候,“一”字和成字部件的第一部分就是它的本身。例如,“车”字的第一部分就是“车”。
2、拆分的时候,依笔顺优先考虑拆出笔画数目多的部件。
例1:“路”字不应拆出“口”与“止”,而应拆出“”。
例2:“告”字不应拆出“”和“丨一”,而应拆出“丿”和“土”。
例3:“缸”、“陆”、“击”等字不应拆出“十”和“凵”,而应拆出“山”。
例5:“卸”、“御”等字不应拆出“十”,而应拆出“止”。
3、包含“囗”或“匚”部件的某些汉字,不应按笔顺把“囗”或“匚”拆 分开来,而应以“囗”或“匚”的起始笔为顺序,“囗”或“匚”被拆分为完整的一部分。
例2:“框”字应拆分为“木”、“匚”、和“王”,不应拆分为“木”、“一”、“王”和
4、对于“那”、“为”、“必”、“丑”、“贯”等汉字或包含有“那”、“为”、“必”、“丑”“、贯”等结构的汉字,拆分的时候不必严格考虑笔顺规则,“那”、“为”、“必”、“丑”、“贯”等汉字或包含有这些结构的汉字应该分别拆出“刀”、“力”、“心”、“十”、“十”等部件。
5、对于与某一部件在结构上相似的笔画组,如果与该部件相比较,该笔画组其中之一的某笔画笔形改变或笔顺改变或某一笔画延长至与该笔画组中的其它笔画相交,那么就不应该勉强把该笔画组当作是部件,而应该把它当作是非部件笔画,但是如果某一笔画延长,但不与该笔画组中的其它笔画相交,那么该笔画组仍当作是部件。需要注意的是,横笔与提笔当作是同一笔形,本发明规定“牛”字不当作是“牜”部件。
例1:“化”、“华”等字不拆出“匕”(因为“化”字的第二部分的笔画出现相交)。
例2:“重”和“垂”字不拆出“土”(因为笔顺跟“土”不同)。
例3:“驷”字不拆出“罒”(因为笔形不同)。
例4:“万”、“敖”、“傲”等字不拆出“勹”(因为笔顺不同)。
例5:“乌”字不拆出“马”(因为笔形不同)。
例6:“雌”、“麒”、“麟”等字不拆出“匕”(因为笔形已经改为横笔)。
例8:“省”、“束”、“赖”、“谏”等字可拆出
例9:“雨”、“刺”、“棘”、“枣”、“敝”等字可拆出“巾”。
例10:“带”、“世”等字可拆出“艹”。
例11:“久”字可拆出“”。
例12:“我”字可拆出“扌”。
例13:“裁”、“载”等字可拆出“土”,不拆出“戈”(因为笔顺不同)。
6、连续笔顺的“丿乚”结构可拆为“儿”部件。例:“兔”、“翘”、“见”、“既”等字可拆出“儿”。
7、有的部件因顾及整个字的美观性而改变笔画方向的,该部件仍当作是完整的部件,而不应该当作是非部件笔画。
例1:“顾”字可拆出“”。
例2:“改”、“凯”等字可拆出“己”。
例3:“顽”、“簪”、“赞”等字中的“ル”可当作“儿”。
8、对于整个汉字结构或其中的某些笔画结构呈左中右排列的汉字,其笔顺规则定为:除左右两边笔画分别为“丿、丶”或“丶、丿”或“フ、ㄑ”或“冫、ㄑ”或“丶、丶”或“、ㄑ”或“、 ”或“丿、丿”或“丿、 ”的汉字的笔顺规则定为先中间后两边之外,其余的汉字笔顺规则定为从左到右。例:“小”、“赚”、“亦”、“亚”、“业”、“光”、“曾”、“永”、“水”、“黎”、“兆”、“犀”、“懷”、“楽”、“办”、“梁”、“聚”、“家”、“鳏”、“步”、“”、“添”等字的笔顺规则定为先中间后两边;“燮”、“樂”、“燕”、“齊”、“幽”、“豐”、“非”、“北”、“巫”、“夔”、 “肃”、粛”、“肅”等字的笔顺规则定为从左到右。
9、“口”里包围着其它的笔画,且“口”的末笔跟其余的前三笔笔顺是不连续的,那么“口”就当作为“囗”(方框儿)部件。
例:“西”、“曹”、“曲”、“由”等字都可拆出“囗”。
确定从单个汉字或词拆分出的部分的首笔笔形数码,即是确定部件和非部件笔画的首笔笔形数码。首笔笔形数码是指部件或非部件笔画中包含有与该部件或非部件笔画的首笔的笔形相同的笔画的总数目。
本发明中的笔形定义为横、竖、撇、点、折共五种笔形,其中横笔形包括提笔形在内,点笔形包括捺笔形在内,竖笔形仅仅是一竖,不包括一竖带钩或一竖带转折的笔形在内,折笔形包括所有笔画走向出现转折或拐弯的笔形在内。点笔形的首笔笔形数码最多是4点,超过4点的按4点计算。横、竖、撇、折笔形的首笔笔形数码最多是5笔,超过5笔的按5笔计算。
例1:“王”部件的首笔是横笔画,“王”部件中横笔画总数目是3横,即“王”部件的首笔笔形数码是3横。
例2:“水”部件的首笔是折笔画,“水”部件中折笔画总数目是2折,即“水”部件的首笔笔形数码是2折。
例3:“后”字拆分为“一”和“口”两部分,“一”属于非部件笔画,“一”的首笔是撇笔画,“一”中撇笔画总数目是2撇,即“后”字的第一部分“一”的首笔笔形数码是2撇。
例4:“地”字拆分为“土”和“也”,“也”属于非部件笔画,“也”的首笔是折笔画,“也”中折笔画总数目是2折,即“地”字第二部分“也”的首笔笔形数码是2折。
例5:“然”字拆分为“夕”、“丶”、“大”、和“丶灬”,共四部分,末部分“丶灬”的首笔是点笔画,“丶灬”中点笔画总数目是5点,超过4点的按4点计算,即“然”字末部分“丶灬”的首笔笔形数码是4点。
例6:“爬”字属于无部件字,以每一单笔画作为一部分,“爬”字共拆分为八部分,其第一、第二、第三、第四、末部分的首笔笔形数码分别是1撇、1撇、1竖、1点、1折。
将首笔笔形数码与英文键盘的字母键位或数字键盘的数字键位相对应,其对应关系如下:
T、R、E、W、Q键分别代表1横、2横、3横、4横、5横;
Y、U、I、O、P键分别代表1竖、2竖、3竖、4竖、5竖;
G、F、D、S、A键分别代表1撇、2撇、3撇、4撇、5撇;
H、J、K、L键分别代表1点、2点、3点、4点;
B、V、C、X、Z键分别代表1折、2折、3折、4折、5折;
2键对应A、B、C键的首笔笔形数码,代表5撇、1折、3折;
3键对应D、E、F键的首笔笔形数码,代表3撇、3横、2撇;
4键对应G、H、I键的首笔笔形数码,代表1撇、1点、3竖;
5键对应J、K、L键的首笔笔形数码,代表2点、3点、4点;
6键对应O键的首笔笔形数码,代表4竖;
7键对应P、Q、R、S键的首笔笔形数码,代表5竖、5横、2横、4撇;
8键对应T、U、V键,代表1横、2竖、2折;
9键对应W、X、Y、Z键,代表4横、4折、1竖、5折;
例1:“王”部件的首笔笔形数码是3横,用E键代表或用3键代表。
例2:“水”部件的首笔笔形数码是2折,用V键代表或用8键代表。
例3:“后”字的第一部分“一”的首笔笔形数码是2撇,用F键代表或用3键代表。
例4:“地”字第二部分“也”的首笔笔形数码是2折,用V键代表或用8键代表。
例5:“然”字末部分“丶灬”的首笔笔形数码是4点,用L键代表或用5键代表。
例6:“爬”字的第一、第二、第三、第四、末部分的首笔笔形数码分别是1撇、1撇、1竖、1点、1折,分别用G键、G键、Y键、H键、B键代表,或分别用4键、4键、9键、4键、2键代表。图2中各部件旁边( )内的字母是该部件的首笔笔形数码。
确定从单个汉字或词拆分出的部分的编码,属于部件的部分的编码由部件读音码和首笔笔形数码组成。部件读音码是指部件所在的英文键盘键位上的字 母或数字键盘键位上的数字。属于非部件笔画的部分的编码仅由首笔笔形数码组成。
例1:“王”部件分布在W键上,它的部件读音码是W,首笔笔形数码是3横,用E键代表;在数字键盘上,“王”部件分布在9键上,它的部件读音码是9,首笔笔形数码是3横,用3键代表。
例2:“工”部件分布在A键上,它的部件读音码是A,首笔笔形数码是2横,用R键代表;在数字键盘上,“工”部件分布在2键上,它的部件读音码是2,首笔笔形数码是2横,用7键代表。
例3:“地”字的第一部分“土”属于部件,“土”部件分布在T键上,它的部件读音码是T,首笔笔形数码是2横,用R键代表;“地”字的第二部分“也”属于非部件笔画,没有部件读音码,它的首笔笔形数码是2折,用V键代表;在数字键盘上,“地”字的第一部分“土”分布在8键上,它的部件读音码是8,首笔笔形数码是2横,用7键代表,“地”字的第二部分“也”的首笔笔形数码是2折,用8键代表。
给汉字或词编码,字、词以及字简码的输入编码规则如下:
为方便表述,用公式表示输入编码规则,设:D表示部件读音码;S表示首笔笔形数码;D1.1、D1.2、D1.3、D1.m分别表示单个字或词第一个字的第一、第二、第三、末部分的部件读音码;D2.1、D2.2分别表示词第二个字的第一、第二部分的部件读音码;D3.1表示词第三个字的第一部分的部件读音码;Dm.1表示词末字的第一部分的部件读音码;S1.1、S1.2、S1.3、S1.4、S1.m分别表示单个字或词第一个字的第一、第二、第三、第四、末部分的首笔笔形数码;S2.1、S2.2分别表示词第二个字的第一、第二部分的首笔笔形数码;S3.1表示词第三个字的第一部分的首笔笔形数码;Sm.1表示词末字的第一部分的首笔笔形数码;
成字部件或非成字部件=D+S
两部分有部件字=D1.1+S1.1+D1.2+S1.2
三部分有部件字=D1.1+S1.1+D1.2+S1.2+D1.3或S1.3
四部分或四部分以上有部件字=D1.1+S1.1+D1.2或S1.2+D1.3或S1.3+D1.m或S1.m
无部件字=S1.1+S1.2+S1.3+S1.4+S1.m
二字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D2.2或S2.2
三字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D3.1或S3.1
四字或四字以上词=S1.1+D1.1+D2.1或S2.1+D3.1或S3.1+Dm.1或Sm.1
成字部件或非成字部件二级简码=S+D
两部分有部件字三级简码=S1.1+D1.1+D1.2或S1.2
三部分或三部分以上有部件字四级简码=S1.1+D1.1+D1.2或S1.2+D1.m或S1.m
五部分或五部分以上无部件字四级简码=S1.1+S1.2+S1.3+S1.m
字、词以及字简码的输入编码规则说明:如果字的第一部分或词第一字的第一部分或字的第二部分属于非部件笔画,没有部件读音码的话,即没有D1.1或D1.2,那么只取首笔笔形数码即可,即只取S1.1或S1.2;如果输入编码规则公式中带有“或”字的那部分属于非部件笔画,没有部件读音码的话,那么该部分才由首笔笔形数码取代。
一级简码字共25个,分别分布在25个键位上,按字母键+空格键即可输入简码字。一级简码字以及“一”字与字母键的对应关系如下:
T-一 R-你 E-我 W-他 Q-她
Y-是 U-为 I-了 O-和 P-着
G-不 F-用 D-要 S-的 A-地
H-所 J-以 K-现 L-在
B-这 V-那 C-而 X-有 Z-经
N-请 M-们
利用上述汉字编码方法开发的汉字输入软件应用于计算机、手机、固定电话等电子信息产品后,依照本发明的汉字编码方法,利用英文键盘或数字键盘以击键方式实现汉字输入。用英文键盘编码输入,编码足5键时,无重码字词直接上屏,如有重码字词,则在继续输入下一字词或按空格键的时候,第一个重码字词直接上屏,如不继续输入下一字词,则通过按数字键选择其它所需的字词;编码不足5键时,按空格键,无重码字词或第一个重码字词直接上屏,按数字键,相应的重码字词上屏。用数字键盘编码输入,编码足5键时,无重码字词直接上屏,如有重码字词,则自动将数字键转换为选字词状态,此时,再通过按数字键或结合按翻页键选择相应的字词;编码不足5键时,按确认键进入选字状态,此时,再按数字键或结合按翻页键选择相应的字词。
使用英文键盘编码输入时,字全码、词编码、字简码三种字母编码体系同时混合应用。使用数字键盘编码输入时,字全码、词编码体系混合应用,为了减少重码,不设置字简码的数字编码输入。
与现有技术相比,本发明有如下有益的效果:
1、记忆量小,易学。本发明的自定义部件只有136个,大多数部件按其名称的拼音音节的第一个字母分布在相应的字母键位上,而这些部件中19个属于部首的变体,部首的变体紧跟部首的正体分布,所以只要记住109个部首的正体和8个繁体部首及其分布,就能基本记住136个部件及其分布。而136个部件在数字键位上的分布又是按“2键对应A、B、C键,3键对应D、E、F键”的规律来分布。综上所述,本发明对部件的记忆量小,要记住136个部件及其在字母键位或数字键位的分布是比较容易的。至于字词的编码规则,已用公式来表示,且规则比较简单,因而要记住字词的编码规则也不是难事。由于记忆量小,无需熟悉汉字的读音,从而达到了易学的目的。
2、重码率低,2至5个字词的重码组组数占总重码组组数的比例大。在用部件作为编码元素的汉字字母编码体系中,以同一键位上的不同部件作为起始部件构成的所有字或词(构成词的第一个字)相互之间都存在交叉重码的可能。本发明要对部件进行编码,部件编码由部件读音码和首笔笔形数码组成。本发明中,作为构成字或词起始部件的高频部件中,仅有“土”与“士”、“人”与“亻”、“广”与“冖”、“”与“爫”、“白”与“勹”的部件编码是相同的。而本发明中,字全码、字简码与词编码的开头两个码位是字或词的第一部分的编码,分别是“D1.1+S1.1”、“S1.1+D1.1”与“S1.1+D1.1”,加之大多数词编码与字简码的码位长短不同,由此可见,字全码、字简码、词编码三者是相互识别的。综上所述,在本发明的汉字字母编码体系中,字或词的重码只可能出现在同一部件或部件编码相同的部件作为起始部件所构成的字或词当中,除“土、士、人、亻、广、冖、、爫、白、勹”等部件编码相同的部件外,其余部件编码不同的部件作为起始部件所构成的字或词相互之间是不会出现交叉重码的。除“一、丨、丿、丶、乛(折)、王、耳、幺、糹、贝、方、禾”等部件外,其余部件作为起始部件所构成的字与词当中,字全码与字简码或词编码两者相互之间不会出现交叉重码。码位长短不同的字简码与词编码两者相互之间也不会出现交叉重码。另外,本发明的编码码位长度最长是5键,码位容量大,而拆分为两、三部分的有部件字的码位长度最长分别也可有4键、5键,从而不使用识别码也降低了拆分为两、三部分的有部件字的重码率。上述的种种因素是本发明的汉字编码输入法重码率低下的主要原因。
应用本发明的汉字编码输入法对GB18030-2000中收录的双字节2、3、4区与四字节共27533个汉字以及第五版《现代汉语词典》中收录的68958个简体词分别进行字母和数字编码,并独立和交叉进行重码筛选(说明:筛选的时候,某个多次重复出现的编码只算一个计算入非重复数据中。),筛选结果见表1、表2和表3。
而现有技术中的一些汉字编码输入法的重码率是:《优化五笔字型编码法及其键盘》,如果字不采用识别码输入,国标6763个字的重码率是6%,如果不进行简繁输入切换,国标6763个字及其的繁体字,重码率高达25%;《汉字纯部首编码计算机输入方法》,其国标6763个字的重码率是8.62%;《首部余部笔画数字编码汉字输入法及其键盘》用数字编码,3755个国标一级字内,用5键编码输入,单码字仅为722个,其中2重码字共652个,占重码字的21.50%;用6键编码输入,单码字为1564个,其中2重码字共926个,占重码字的42.26%。
由上述可知,本发明的汉字编码输入法码位容量大,拆分为两、三部分的有部件字不使用识别码,在字母编码体系当中,字全码、字简码、词编码三者相互识别,字全码、字简码、词编码三者相互之间极少交叉重码,无论是用字母还是用数字编码输入,其重码率都低下,2至5个字词的重码组组数占总重码组组数的比例也都大。它尤其适合于用字母或数字对GB18030-2000中收录的 27533个汉字和第五版《现代汉语词典》中收录的约70000个简体词或繁体词的混合编码输入。
表1:
字全码、字简码、简体词编码、字词数字码独立和交叉筛选重码情况
字词来源名称 | 字词个数 | 重码个数 | 重码率 |
双字节2区字全码 | 6763 | 364 | 5.38% |
从双字节3、4区选出的繁体字全码 | 5696 | 437 | 7.72% |
双字节2、3、4区、四字节字全码 | 27533 | 3823 | 13.89% |
双字节2区字简码 | 6706 | 1395 | 20.80% |
双字节2、3、4区字简码 | 20915 | 8321 | 39.79% |
简体词 | 68958 | 13230 | 19.19% |
双字节2区字全码和从双字节3、4区选出的繁体 字全码 | 12459 | 1023 | 8.21% |
双字节2区字全码和双字节2区字简码 | 13469 | 1847 | 13.71% |
双字节2、3、4区、四字节字全码和双字节2、3、 4区字简码 | 48448 | 12483 | 25.77% |
简体词和双字节2区字全码 | 75721 | 13794 | 18.22% |
简体词和双字节2、3、4区、四字节字全码 | 96491 | 17615 | 18.26% |
简体词和双字节2、3、4区字简码 | 89873 | 24027 | 26.73% |
简体词、双字节2、3、4区、四字节字全码和双 字节2、3、4区字简码 | 117406 | 28566 | 24.33% |
双字节2区字的数字码 | 6763 | 1940 | 28.69% |
从双字节3、4区选出的繁体字的数字码 | 5696 | 1826 | 32.06% |
双字节2区字和从双字节3、4区选出的繁体字的 数字码 | 12459 | 4833 | 38.79% |
双字节2、3、4区、四字节字的数字码 | 27533 | 15345 | 55.73% |
简体词和双字节2、3、4区、四字节字的数字码 | 96491 | 71963 | 74.58% |
表2:
字全码、字简码、简体词编码三者相互之间交叉重码情况
字词来源名称 | 交叉重码个数 |
双字节2区6763个字全码与68958个简体词编码 | 200 |
双字节2区6763个字全码与双字节2区6706个字简码 | 88 |
双字节2、3、4区、四字节27533个字全码与68958个简体词编码 | 562 |
双字节2、3、4区、四字节27533个字全码与双字节2、3、4区20915 个字简码 | 339 |
双字节2、3、4区20915个字简码与68958个简体词编码 | 2476 |
表3
重码组组数统计情况
续表3:
[0266]附图说明
图1是本发明的部件汉字编码输入方法的输入步骤说明图;
图2是本发明的部件读音码和首笔笔形数码与字母键位的对应关系。
具体实施方式
图2中,部件旁边()内的字母是部件的首笔笔形数码,标有()的部件属于部首的变体,标有<>的部件属于繁体部首。
下面列举例子对本发明的字词输入编码规则作进一步描述:
成字部件或非成字部件=D+S
例1:王=WE 王=93
举例说明:“王”部件的部件读音码是W,取W键,首笔笔形数码是3横,取E键。用数字编码,“王”部件分布在9键,部件读音码是9,取9键,首笔笔形数码是3横(E),取3键。
例2:彳=PF 彳=73
举例说明:“彳”部件的部件读音码是P,取P键,首笔笔形数码是2撇,取F键。用数字编码,“彳”部件分布在7键,部件读音码是7,取7键,首笔笔形数码是2撇(F),取3键。
两部分有部件字=D1.1+S1.1+D1.2+S1.2
例1:理=WELU 理=9358
举例说明:“理”字依次拆分为“王”与“里”,共两部分。“王”的部件读音码是W,取W键,首笔笔形数码是3横,取E键;“里”的部件读音码是L,取L键,首笔笔形数码是2竖,取U键。用数字编码,“王”分布在9键,部件读音码是9,取9键,首笔笔形数码是3横(E),取3键;“里”分布在5键,部件读音码是5,取5键,首笔笔形数码是2竖(U),取8键。
例2:地=TRV 地=878
举例说明:“地”字依次拆分为“土”部件与“也”非部件笔画,共两部分。“土”的部件读音码是T,取T键,首笔笔形数码是2横,取R键;“也”不属于部件,没有部件读音码,首笔笔形数码是2折,取V键。用数字编码,“土”分布在8键,部件读音码是8,取8键,首笔笔形数码是2横(R),取7键;“也”不属于部件,没有部件读音码,首笔笔形数码是2折(V),取8键。
例3:版=DOB 版=362
举例说明:“版”字依次拆分为“片”非部件笔画与“又”部件,共两部分。“片”不属于部件,没有部件读音码,首笔笔形数码是3撇,取D键;“又”的部件读音码是O,取O键,首笔笔形数码是1折,取B键。用数字编码,“片”的首笔笔形数码是3撇(D),取3键;“又”分布在6键,部件读音码是6,取6键,首笔笔形数码是1折(B),取2键。
三部分有部件字=D1.1+S1.1+D1.2+S1.2+D1.3或S1.3
例1:梧=MTRK 梧=6875
举例说明:“梧”字依次拆分为“木”部件、“五”非部件笔画与“口”部件,共三部分。第一部分“木”的部件读音码是M,取M键,首笔笔形数码是1横,取T键;第二部分“五”不属于部件,没有部件读音码,首笔笔形数码是2横,取R键;第三部分“口”的部件读音码是K,取K键。用数字编码,“木”分布在6键,部件读音码是6,取6键,首笔笔形数码是1横(T),取8键;“五”的首笔笔形数码是2横(R),取7键;“口”分布在5键,部件读音码是5,取5键。
例2:第=ZFAVY 第=93289
举例说明:“第”字依次拆分为“”部件、“弓”部件与“丨 丿”非部件笔画,共三部分。第一部分“”的部件读音码是Z,取Z键,首笔笔形数码是2撇,取F键;第二部分“弓”的部件读音码是A,取A键,首笔笔形数码是2折,取V键;第三部分“丨 丿”不属于部件,没有部件读音码,首笔笔形数码是1竖,取Y键。用数字编码,“”分布在9键,部件读音码是9,取9键,首笔笔形数码是2撇(F),取3键;“弓”分布在2键,部件读音码是2,取2键,首笔笔形数码是2折(V),取8键;“丨 丿”的首笔笔形数码是1竖(Y),取9键。
例3:韨=EOBH 韨=3624
举例说明:“韨”字依次拆分为“韦”非部件笔画、“又”部件与“丶”非部件笔画,共三部分。“韦”不属于部件,没有部件读音码,首笔笔形数码是3横,取E键;“又”的部件读音码是O,取O键,首笔笔形数码是1折,取B键;“丶”不属于部件,没有部件读音码,首笔笔形数码是1点,取H键。用数字编码,“韦”的首笔笔形数码是3横(E),取3键;“又”分布在6键,部件读音码是6,取6键,首笔笔形数码是1折(B),取2键;“丶”的首笔笔形数码是1点(H),取4键。
例4:鹿=AHVB 鹿=2482
举例说明:“鹿”字依次拆分为“广”部件、“ 丨 丨 一 一 レ”非部件笔画与“匕”部件,共三部分。第一部分“广”的部件读音码是A,取A键,首笔笔形数码是1点,取H键;第二部分“ 丨 丨 一 一 レ”不属于部件,没有部件读音码,首笔笔形数码是2折,取V键;第三部分“匕”的部件读音码是B,取B键。用数字编码,“广”分布在2键,部件读音码是2,取2键,首笔笔形数码是1点(H),取4键;“ 丨 丨 一 一 レ”的首笔笔形数码是2折(V),取8键;“匕”分布在2键,部件读音码是2,取2键。
四部分或四部分以上有部件字=D1.1+S1.1+D1.2或S1.2+D1.3或S1.3+D1.m或S1.m
例1:摄=OREOO 摄=67366
举例说明:“摄”字依次拆分为“扌”、“耳”、“又”与“又”部件,共四部分。第一部分“扌”的部件读音码是O,取O键,首笔笔形数码是2横,取R键;第二部分“耳”的部件读音码是E,取E键;第三部分与末部分“又”的部件读音码是O键,各取O键。用数字编码,“扌”分布在6键,部件读音码是6,取6键,首笔笔形数码是2横(R),取7键;“耳”分布在3键,部件读音码是3,取3键;“又”部件分布在6键,部件读音码是6,取6键。
例2:览=UFHE 览=8343
举例说明:“览”字前三部分分别是“丨 丨”非部件笔画、“”部件和“丶”非部件笔画,末部分是“儿”部件。第一部分“丨 丨”不属于部件,没有部件读音码,首笔笔形数码是2竖,取U键;第二部分“”的部件读音码是F,取F键;第三部分“丶”不属于部件,没有部件读音码,首笔笔形数码是1点,取H键;末部分“儿”的部件读音码是E,取E键。用数字编码,“丨 丨”的首笔笔形数码是2竖(U),取8键;“”分布在3键,部件读音码是3,取3键;“丶”的首笔笔形数码是1点(H),取4键;“儿”分布在3键,部件读音码是3,取3键。
例3:然=XGHDL 然=94435
举例说明:“然”字依次拆分为“夕”部件、“丶”非部件笔画、“大”部件与“丶灬”非部件笔画,共四部分。第一部分“夕”的部件读音码是X,取 X键,首笔笔形数码是1撇,取G键;第二部分“丶”不属于部件,没有部件读音码,首笔笔形数码是1点,取H键;第三部分“大”的部件读音码是D,取D键;末部分“丶灬”不属于部件,首笔笔形数码是4点,取L键。用数字编码,“夕”分布在9键,部件读音码是9,取9键,首笔笔形数码是1撇(G),取4键;“丶”的首笔笔形数码是1点(H),取4键;“大”分布在3键,部件读音码是3,取3键;“丶灬”的首笔笔形数码是4点(L),取5键。
例4:麒=AHCCB 麒=24222
举例说明:“麒”字依次拆分为“广”部件、“ 丨 丨 一 一 レ 一 レ”非部件笔画、“艹”部件、“三”非部件笔画与“八”部件,共五部分。第一部分“广”的部件读音码是A,取A键,首笔笔形数码是1点,取H键;第二部分“ 丨 丨一 一 レ 一 レ”不属于部件,没有部件读音码,首笔笔形数码是3折,取C键;第三部分“艹”的部件读音码是C,取C键;末部分“八”的部件读音码是B,取B键。用数字编码,“广”分布在2键,部件读音码是2,取2键,首笔笔形数码是1点(H),取4键;“ 丨 丨 一 一 レ 一 レ”的首笔笔形数码是3折(C),取2键;“艹”分布在2键,部件读音码是2,取2键;“八”分布在2键,部件读音码是2,取2键。
例5:與=GBQB 與=4272
举例说明:“與”字依次拆分为“丿”非部件笔画、 部件、“一 一 ㄣ 丨 一 一 一”非部件笔画与“八”部件,共四部分。第一部分“丿”不属于部件,没有部件读音码,首笔笔形数码是1撇,取G键;第二部分 的部件读音码是B,取B键;第三部分“一 一 ㄣ 丨 一 一 一”不属于部件,没有部件读音码,首笔笔形数码是5横,取Q键;末部分“八”的部件读音码是B,取B键。用数字编码,“丿”的首笔笔形数码是1撇(G),取4键; 分布在2键,部件读音码是2,取2键;“一 一 ㄣ 丨 一 一 一”的首笔笔形数码是5横(Q),取7键;“八”分布在2键,部件读音码是2,取2键。
无部件字=S1.1+S1.2+S1.3+S1.4+S1.m
例1:爬=GGYHB 爬=44942
举例说明:“爬”字属于无部件字,依笔顺拆分,每一笔作为一部分,把“爬”字拆分为八部分,第一、第二、第三、第四、末部分分别是“丿”、“丿”、“丨”、“丶”、“乚”。第一、第二、第三、第四、末部分的首笔笔形数码分别是1撇、1撇、1竖、1点、1折,分别取G、G、Y、H、B键。用数字编码,“爬”字的第一、第二、第三、第四、末部分的首笔笔形数码分别是1撇(G)、1撇(G)、1竖(Y)、1点(H)、1折(B),分别取4、4、9、4、2键。
例2:专=TTBH 专=8824
举例说明:“专”字属于无部件字,依笔顺拆分,每一笔作为一部分,把“专”字拆分为“一”、“一”、“ㄣ”、“丶”,共四部分。第一、第二部分“一”的首笔 笔形数码分别是1横,各取T键;第三部分“ㄣ”的首笔笔形数码是1折,取B键;第四部分“丶”的首笔笔形数码是1点,取H键。用数字编码,“专”字的第一、第二、第三、第四部分的首笔笔形数码分别是1横(T)、1横(T)、1折(B)、1点(H),分别取8、8、2、4键。
二字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D2.2或S2.2
例1:编码=VSHSM 编码=87476
举例说明:“编”字的第一部分“纟”的首笔笔形数码是2折,取V键,部件读音码是S,取S键;“编”字的第二部分“丶”不属于部件,没有部件读音码,首笔笔形数码是1点,取H键;“码”字的第一部分“石”的部件读音码是S,取S键;“码”字的第二部分“马”的部件读音码是M,取M键。用数字编码,“纟”的首笔笔形数码是2折(V),取8键,“纟”分布在7键,部件读音码是7,取7键;“丶”的首笔笔形数码是1点(H),取4键;“石”分布在7键,部件读音码是7,取7键;“马”分布在6键,部件读音码是6,取6键。
例2:背诵=RBYB 背诵=7292
举例说明:“背”字的第一部分“一 一 丨”的首笔笔形数码是2横,取R键,“一 一 丨”不属于部件,没有部件读音码;“背”字的第二部分“匕”的部件读音码是B,取B键;“诵”字的第一部分“讠”的部件读音码是Y,取Y键;“诵”字的第二部分“”不属于部件,没有部件读音码,首笔笔形数码是1折,取B键。用数字编码,“一 一 丨”的首笔笔形数码是2横(R),取7键;“匕”分布在2键,部件读音码是2,取2键;“讠”分布在9键,部件读音码是9,取9键;“”的首笔笔形数码是1折(B),取2键。
例3:专心=TTX 专心=889
举例说明:“专”字属于无部件字,第一、第二部分都是“一”,“一”的首笔笔形数码是1横,各取T键;“心”属于成字部件,不能够拆分,它的第一部分就是“心”,“心”的部件读音码是X,取X键。用数字编码,“专”字的第一、第二部分“一”的首笔笔形数码是1横(T),各取8键;“心”分布在9键,部件读音码是9,取9键。
三字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D3.1或S3.1
例1:计算机=HYIZM 计算机=49496
举例简要说明:取“计”字的第一部分“讠”的首笔笔形数码(1点)H键或4键以及“讠”的部件读音码Y键或9键;取“计”字的第二部分“十”的部件读音码I键或4键;取“算”字的第一部分“”的部件读音码Z键或9键;取“机”字的第一部分“木”的部件读音码M键或6键。
例2:四人帮=YOEPE 四人帮=96373
举例简要说明:取“四”字的第一部分“囗”的首笔笔形数码(1竖)Y键或9键以及“囗”的部件读音码O键或6键;取“四”字的第二部分“儿”的 部件读音码E键或3键;取“人”的部件读音码P键或7键;“帮”字的第一部分“三 丿”不属于部件,取“三 丿”的首笔笔形数码(3横)E键或3键。
例3:一览表=TUW 一览表=889
举例简要说明:“一”字的第一部分是“一”,取“一”的首笔笔形数码(1横)T键或8键,“一”不属于部件,没有部件读音码;“览”字的第一部分“丨丨”不属于部件,取“丨 丨”的首笔笔形数码(2竖)U键或8键;取“表”字的第一部分“”的部件读音码W键或9键。
例4:专业户=TTUH 专业户=8884
举例简要说明:分别取“专”字的第一、第二部分“一”的首笔笔形数码(1横)T键或8键,“一”不属于部件,没有部件读音码;“业”字的第一部分“丨 丨”不属于部件,取“丨 丨”的首笔笔形数码(2竖)U键或8键;“户”字的第一部分“丶”不属于部件,取“丶”的首笔笔形数码(1点)H键或4键。
四字或四字以上词=S1.1+D1.1+D2.1或S2.1+D3.1或S3.1+Dm.1或Sm.1
例1:静电感应=EWROA 静电感应=39762
举例简要说明:取“静”字的第一部分“”的首笔笔形数码(3横)E键或3键以及“”的部件读音码W键或9键;取“电”字的第一部分“曰”的部件读音码R键或7键;取“感”字的第一部分“厂”的部件读音码O键或6键;取“应”字的第一部分“广”的部件读音码A键或2键。
例2:镜花水月=GJCSY 镜花水月=45279
举例简要说明:取“镜”字的第一部分“钅”的首笔笔形数码(1撇)G键或4键以及“钅”的部件读音码J键或5键;取“花”字的第一部分“艹”的部件读音码C键或2键;“水”字属于成字部件,第一部分就是“水”,取“水”的部件读音码S键或7键;取“月”字的第一部分“月”的部件读音码Y键或9键。
例3:一本万利=TMTH 一本万利=8684
举例简要说明:取“一”字的第一部分“一”的首笔笔形数码(1横)T键或8键,“一”不属于部件,没有部件读音码;取“本”字第一部分“木”的部件读音码M键或6键;“万”字的第一部分“一”不属于部件,取“一”的首笔笔形数码(1横)T键或8键;取“利”字的第一部分“禾”的部件读音码H键或4键。
例4:三好学生=TNHG 三好学生=8644
举例简要说明:取“三”字的第一部分“一”的首笔笔形数码(1横)T键或8键,“一”不属于部件,没有部件读音码;取“好”字的第一部分“女”的部件读音码N键或6键;“学”字的第一部分“丶”不属于部件,取“丶”的首笔笔形数码(1点)H键或4键;“生”的第一部分“丿”不属于部件,取“丿”的首笔笔形数码(1撇)G键或4键。
例5:中华人民共和国=YKPPO 中华人民共和国=95776
举例简要说明:取“中”字的第一部分“口”的首笔笔形数码(1竖)Y键或9键以及“口”的部件读音码K键或5键;取“华”字的第一部分“亻”的部件读音码P键或7键;取“人”的第一部分“人”的部件读音码P键或7键;取“国”字的第一部分“囗”的部件读音码O键或6键。
成字部件或非成字部件二级简码=S+D
例1:王=EW
举例简要说明:取“王”的首笔笔形数码(3横)E键,部件读音码W键。
例2:鬼=FA
举例简要说明:取“鬼”的首笔笔形数码(2撇)F键,部件读音码A键。
两部分有部件字三级简码=S1.1+D1.1+D1.2或S1.2
例1:理=EWL
举例简要说明:取“理”字的第一部分“王”的首笔笔形数码(3横)E键,部件读音码W键;取第二部分“里”的部件读音码L键。
例2:地=RTV
举例简要说明:取“地”字的第一部分“土”的首笔笔形数码(2横)R键,部件读音码T键;第二部分“也”不属于部件,取首笔笔形数码(2折)V键。
例3:字=JAV
举例简要说明:取“字”字的第一部分“宀”的首笔笔形数码(2点)J键,部件读音码A键;第二部分“子”不属于部件,取首笔笔形数码(2折)V键。
例4:版=DO
举例简要说明:“版”字的第一部分“片”不属于部件,取首笔笔形数码(3撇)D键;取第二部分“又”的部件读音码O键。
三部分或三部分以上有部件字四级简码=S1.1+D1.1+D1.2或S1.2+D1.m或S1.m
例1:梧=TMRK
举例简要说明:取“梧”字的第一部分“木”的首笔笔形数码(1横)T键,部件读音码M键;第二部分“五”不属于部件,取首笔笔形数码(2横)R键;取末部分“口”的部件读音码K键。
例2:第=FZAY
举例简要说明:取“第”字的第一部分“”的首笔笔形数码(2撇)F键,部件读音码Z键;取第二部分“弓”的部件读音码A键;末部分“丨 丿”不属于部件,取首笔笔形数码1(竖)Y键。
例3:韨=EOH
举例简要说明:取“韨”字的第一部分“韦”的首笔笔形数码(3横)E 键,“韦”不属于部件,没有部件读音码;取第二部分“又”的部件读音码O键;末部分“丶”不属于部件,取首笔笔形数码(1点)H键。
例4:然=GXHL
举例简要说明:取“然”字的第一部分“夕”的首笔笔形数码(1撇)G键,部件读音码X键;第二部分“丶”不属于部件,取首笔笔形数码(1点)H键;末部分“丶灬”不属于部件,取首笔笔形数码(4点)L键。
例5:麒=HACB
举例简要说明:取“麒”字的第一部分“广”的首笔笔形数码(1点)H键,部件读音码A键;第二部分“ 丨 丨 一 一 レ 一 レ”不属于部件,取首笔笔形数码(3折)C键;取末部分“八”的部件读音码B键。
五部分或五部分以上无部件字四级简码=S1.1+S1.2+S1.3+S1.m
例1:爬=GGYB
举例简要说明:“爬”字前三部分与末部分分别是“丿”、“丿”、“丨”与“乚”,分别取前三部分与末部分的首笔笔形数码H键、H键、Y键、B键。
例2:所=GGBY
Claims (3)
1.一种部件汉字编码输入方法,用于电子信息产品,其特征在于包括如下步骤:
步骤一,以构成汉字的部件为依据将汉字拆分为部分,确定每个所述部件的编码,选取构成汉字的所述部件,把所述部件分配到英文键盘的字母键位上或数字键盘的数字键位上,所述部件所在的英文键盘字母键位上的字母或数字键盘键位上的数字称作部件读音码,即为拆分出的每个所述部件的编码,其中,所述部分是汉字拆分后形成的组成汉字的单笔画或笔画组,选取的所述部件,及其在所述英文键盘的字母键位的分配如下:
T键:土 士 田
R键:日 曰
W键:王 夂 攵
Q键:气 犭
I键:十 及 飠 衤 乙
O键:厂 扌口 齒 九 魚 鳥 舟 言 又
P键:人 亻 彳
F键:方
D键:大 刂 冫 氵 刀
S键:石 山 罒 皿 氏 饣 礻 尸 厶 水 氺 纟
A键:戈 工 革 骨 鬼 广 冖 宀 弓
H键:黑 禾 火
J键:巾 几 臼 金 钅 己 已 巳
L键:里 亠 立 力
B键:髟 卜 八 丷 匕 疒
V键:贝 白 勹
C键:寸 艹 廾 车 車 虫 齿
N键:牜 鸟 女
M键:木 朩 目 门 門 米 马 馬
选取的所述部件与数字键盘的数字键位的对应关系是:
2键对应A、B、C键的部件,3键对应D、E、F键的部件,4键对应H、I键的部件,5键对应J、K、L键的部件,6键对应M、N、O键的部件,7键对应P、Q、R、S键的部件,8键对应T、U、V键的部件,9键对应W、X、Y、Z键的部件;
步骤二,确定每个所述部分的首笔笔形数码,所述首笔笔形数码是指所述部分中包含有与该所述部分的首笔的笔形相同的笔画的总数目,所述笔形为横、竖、撇、点、折共五种,
其中横笔形包括提笔形,
点笔形包括捺笔形,
竖笔形是一竖,不包括一竖带钩或一竖带转折的笔形,
折笔形包括所有笔画走向出现转折或拐弯的笔形,
点笔形的首笔笔形数码最多是4点,超过4点的按4点计算,
横、竖、撇、折笔形的首笔笔形数码最多是5笔,超过5笔的按5笔计算,把所述首笔笔形数分配到英文键盘的字母键位或数字键盘的数字键位上,所述首笔笔形数码与英文键盘的字母键位或数字键盘的数字键位的对应关系如下:
T、R、E、W、Q键分别代表1横、2横、3横、4横、5横;
Y、U、I、O、P键分别代表1竖、2竖、3竖、4竖、5竖;
G、F、D、S、A键分别代表1撇、2撇、3撇、4撇、5撇;
H、J、K、L键分别代表1点、2点、3点、4点;
B、V、C、X、Z键分别代表1折、2折、3折、4折、5折;
2键对应A、B、C键的首笔笔形数码,代表5撇、1折、3折;
3键对应D、E、F键的首笔笔形数码,代表3撇、3横、2撇;
4键对应G、H、I键的首笔笔形数码,代表1撇、1点、3竖;
5键对应J、K、L键的首笔笔形数码,代表2点、3点、4点;
6键对应O键的首笔笔形数码,代表4竖;
7键对应P、Q、R、S键的首笔笔形数码,代表5竖、5横、2横、4撇;
8键对应T、U、V键,代表1横、2竖、2折;
9键对应W、X、Y、Z键,代表4横、4折、1竖、5折;
步骤三,给汉字或词编码,所述汉字或词的编码由每个所述部分的编码组成,所述部分的编码由每个所述部件的编码和所述首笔笔形数码组成,或仅由所述首笔笔形数码组成;
步骤四,依次键入所述汉字或词的编码,从而输入汉字或词。
2.如权利要求1所述部件汉字编码输入方法,其特征在于:
针对三种不同汉字,将汉字拆分为所述部分的方法如下,选取构成汉字的部件,
①包含所述部件的汉字按笔画顺序拆分,依次拆出笔画数目多的所述部件,每个所述部件均为所述部分;
②除所述部件外,位于所述部件之前或之间或之后的不构成一个完整所述部件的一画或一画以上的笔画组为非部件笔画,也作为所述部分;
依此规则,依笔画顺序把包含有所述部件的汉字拆分为两个或以上所述部分;
③没有包含所述部件的汉字,依笔画顺序逐笔拆分,拆分出来的每一单笔画也作为所述部分;
依此规则,把没有包含所述部件的汉字拆分为两个或以上所述部分,每个所述部分的单笔画亦为所述非部件笔画。
3.如权利要求2所述部件汉字编码输入方法,其特征在于:
步骤三中所述部分的编码由所述部件读音码D和所述首笔笔形数码S组成,若所述部分是所述非部件笔画,则所述部分的编码仅由所述首笔笔形数码S 组成;
D1.1、D1.2、D1.3、D1.m分别表示单个字或词第一个字的第一、第二、第三、末部分的部件读音码;
D2.1、D2.2分别表示词第二个字的第一、第二部分的部件读音码;
D3.1表示词第三个字的第一部分的部件读音码;
Dm.1表示词末字的第一部分的部件读音码;
S1.1、S1.2、S1.3、S1.4、S1.m分别表示单个字或词第一个字的第一、第二、第三、第四、末部分的首笔笔形数码;
S2.1、S2.2分别表示词第二个字的第一、第二部分的首笔笔形数码;
S3.1表示词第三个字的第一部分的首笔笔形数码;
Sm.1表示词末字的第一部分的首笔笔形数码;
所述给汉字或词编码的方法如下:
成字部件或非成字部件=D+S
两部分有部件字=D1.1+S1.1+D1.2+S1.2
三部分有部件字=D1.1+S1.1+D1.2+S1.2+D1.3或S1.3
四部分或四部分以上有部件字=D1.1+S1.1+D1.2或S1.2+D1.3或S1.3+D1.m或S1.m
四部分或四部分以上有部件字=D1.1+S1.1+D1.2或S1.2+D1.3或S1.3+D1.m或S1.m
无部件字=S1.1+S1.2+S1.3+S1.4+S1.m
二字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D2.2或S2.2
三字词=S1.1+D1.1+D1.2或S1.2+D2.1或S2.1+D3.1或S3.1
四字或四字以上词=S1.1+D1.1+D2.1或S2.1+D3.1或S3.1+Dm.1或Sm.1
成字部件或非成字部件二级简码=S+D
两部分有部件字三级简码=S1.1+D1.1+D1.2或S1.2
三部分或三部分以上有部件字四级简码=S1.1+D1.1+D1.2或S1.2+D1.m或S1.m
五部分或五部分以上无部件字四级简码=S1.1+S1.2+S1.3+S1.m
。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100266160A CN101241403B (zh) | 2008-03-05 | 2008-03-05 | 一种部件汉字编码输入方法及其相应键盘 |
HK08112547.5A HK1120880A1 (en) | 2008-03-05 | 2008-11-17 | An input method by coding splitted chinese character and corresponding keyboard |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100266160A CN101241403B (zh) | 2008-03-05 | 2008-03-05 | 一种部件汉字编码输入方法及其相应键盘 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101241403A CN101241403A (zh) | 2008-08-13 |
CN101241403B true CN101241403B (zh) | 2011-08-24 |
Family
ID=39932969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100266160A Expired - Fee Related CN101241403B (zh) | 2008-03-05 | 2008-03-05 | 一种部件汉字编码输入方法及其相应键盘 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN101241403B (zh) |
HK (1) | HK1120880A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103744535B (zh) * | 2014-01-10 | 2017-01-18 | 李正才 | 同音五笔输入法 |
-
2008
- 2008-03-05 CN CN2008100266160A patent/CN101241403B/zh not_active Expired - Fee Related
- 2008-11-17 HK HK08112547.5A patent/HK1120880A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
HK1120880A1 (en) | 2009-04-09 |
CN101241403A (zh) | 2008-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102023716A (zh) | 26或者27或者29或者30字母键元的数字键中文输入法 | |
CN101751144B (zh) | 计算机键盘及数字键盘汉字“声形”输入法 | |
CN101694601B (zh) | 零记忆汉字编码输入法 | |
CN103616960A (zh) | 六元音字母双拼输入法 | |
CN102073386A (zh) | 一种象形会意分类字根的汉字计算机输入法 | |
CN101598976A (zh) | 汉字输入拼块音新方案 | |
CN101241403B (zh) | 一种部件汉字编码输入方法及其相应键盘 | |
CN101556509A (zh) | 国语音标 简化音标 英文键盘和小键盘汉字输入法 | |
CN103744532A (zh) | 二十六偏旁部首字根中英和谐输入方法 | |
CN103207684A (zh) | 音素字母双拼输入法 | |
CN101751134A (zh) | 正左上方汉字输入法 | |
CN101089794A (zh) | 中文简易检索与文字快速输入 | |
CN102221898A (zh) | 模糊三维拼音码汉字输入法 | |
CN101727189A (zh) | 一种用手机和电脑数字键盘输入的汉字笔位码输入法 | |
CN105278697B (zh) | 组合式双拼类主副码汉字、词语编码输入法及其键盘 | |
CN102520808A (zh) | 头尾双笔汉字输入法 | |
CN1220931C (zh) | 音形数码汉字输入法 | |
CN1125393C (zh) | 利用计算机键盘汉字编码输入方法 | |
CN100530054C (zh) | 一种汉字音形键码输入法 | |
CN1328649C (zh) | 汉字“三形联想”形码输入法 | |
CN102073383A (zh) | 字首部件拼音输入法 | |
CN102073382A (zh) | 笔画主副部首输入法 | |
CN101086687A (zh) | 一种首末码汉字输入方法 | |
CN103838390A (zh) | 单字二码输入法 | |
CN103970286A (zh) | T形二码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1120880 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1120880 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110824 Termination date: 20150305 |
|
EXPY | Termination of patent right or utility model |