CN104898862B - 形母码汉字输入法 - Google Patents
形母码汉字输入法 Download PDFInfo
- Publication number
- CN104898862B CN104898862B CN201510193975.5A CN201510193975A CN104898862B CN 104898862 B CN104898862 B CN 104898862B CN 201510193975 A CN201510193975 A CN 201510193975A CN 104898862 B CN104898862 B CN 104898862B
- Authority
- CN
- China
- Prior art keywords
- word
- coding
- mother
- chinese
- female
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
形母码汉字输入法,将汉字按汉字部件规范拆分单元分为基本形母、普通形母和组合形母,基本形母单独成字,在基本形母所在键名后加字母V;普通形母单独成字,在普通形母所在键名后加字的汉语拼音首字母;两码组成一字,输入两码所在键名的字母,少部分在两码后加字的汉语拼音首字母;三码组成一字,输入三码所在键名字母;四码组成一字,输入四码所在键名字母;超过四码组成一字,输入“首、二、中、末”四码所在键名;对于由两个字组成的词组,取“首末、首末”;对于由三个字组成的词组,取“首、首、首末”;对于由四个或四个以上字组成的词组,取“首、首、首、首”。本发明使用26个字母键输入汉字和词语的特征编码信息,简单易学。
Description
技术领域
本发明属于计算机信息处理技术领域,是对汉字形母码输入方法的改进。
背景技术
汉字的编码是对汉字进行检索的基本依据。特别是随着电子计算机应用的普及,如何通过标准键盘上的几十个按键输入成千上万个汉字,成为许多人所关注的课题,也出现了许多种汉字输入法。
各种名目的汉字输入法,主要可分为两大类:依照字音编码和依照字形编码。依照字音编码主要是按照汉语拼音进行汉字输入,没有多少创新的空间。这种方法简单,易于掌握使用。其缺点是重码率高,难以提高速度。对于不会汉语拼音和发音不准确的人难以使用。所以人们更多考虑创新的方向是依照字形编码。
多少年来,人们设计的属于计算机信息处理技术领域各种依照字形编码的汉字输入法侧重于解决汉字的计算机输入问题,尽量降低重码率,减小平均编码长度。由于汉字结构的复杂性,各种依照字形编码的输入法都比较难学,不宜掌握。
CN1054448C公开了一种汉字形母码输入方法,该方法使用26个字母键和10个数字键输入汉字和词语的特征编码信息,具有记忆量小、简单易学等特点,特别是率先提出了汉字输入法要与中文的教学相结合,尤其是与中小学的基础教育相结合,符合汉字书写笔顺,因此受到国家有关部门的重视,并在大庆等地教育系统进行推广的试点工作。
发明内容
本发明的目的是提供一种形母码汉字输入法,使用26个字母键输入汉字和词语的特征编码信息,是对汉字形母码输入方法的重大改进。
本发明的目的是通过以下技术方案实现的:
一种形母码汉字输入法,包括如下步骤:
一、将汉字输入键盘时的拆分单元分为基本形母、普通形母和组合形母,其中:
1)、基本形母包括26个码,分配在计算机键盘的26个英文键名上:
A:马、B:贝、C:寸、D:刀、E:人、F:丰、G:弓、H:火、I:匕、J:金、K:可、L:了、M:木、N:女、O:口、P:片、Q:犬、R:日、S:水、T:土、U:目、V:山、W:亡、X:小、Y:月、Z:止;
2)、普通形母包括146个码,分配在计算机键盘的26个英文键名上:
A:与、、厂、毛、厶、;
B:勹、、巨、臣、鱼;
C:艹、廿、廾、卌、
D:刂、东、车(車)、柬、虫;
E:亻、、八、癶;
F:、韦、阝、耳、尸、
G:扌、手、己、已、巳、巴;
H:灬、冖、宀;
I:丨、忄;
J:钅、九、丿、丁、丆、丂;
K:一、衤、礻;
L:丶、讠;
M:乙;
N:母、雨、牛、古、、午;
O:○;
P:爿、丬、冫、习、卩、、力、、气;
Q:大、犭、勿;
R:曰、艮、儿、几、
S:氵、氺、川、
T:士、干、耂、七、;
U:且、四、罒、皿、爪、爫、巾、
V:凵、冂()、丷;
W:亠、幺、纟、乡、心、;
X:、乂、又、米;
Y:夕;
Z:工、王、五、彐、彑、廴;
3)、组合形母包括341个码,对应以下英文键名:
凹:IMIK;FMJ;JVX;白:JR;百:KJR;KF;办:PLL;半:VC;卑:JRJI;本:MK;丌:KS;必:WJ;采:JX;丙:KVE;秉:JKUX;卜:IL;IK;不:KJIL;才:KIJ;KVCK;册:VVK;VC;VC;VVXK;叉:XL;产:WVA;长:JKML;II;辰:AKKK;尺:FL;斥:AKIL;丑:MIKK;出:UV;巛:MMM;串:OOI;垂:JKCK;:FL;匆:QL;囱:JVJXK;歹:KY;歺:IKY;丹:VLK;单:VRKI;LJ;BJ;WH;弟:VGIJ;GIJ;电:RM;刁:MK;夂:JX;斗:LLKI;豆:KOK;而:JVII;二:KK;发:MJXL;凡:RL;攴:IKX;方:WMJ;飞:MJL;风:RJL;缶:NV;夫:KQ;巿:KU;弗:GS;甫:KYIL;父:EX;丐:KIKM;尢:TM;甘:CKK;高:WOVO;戈:TJL;革:COKI;个:EI;UE;更:KRX;谷:EEO;瓜:AAL;MQ;毌:MMIK;广:WJ;龟:BRM;鬼:JRJA;果:RM;亥:WMJE;禾:JM;HEF;黑:VVKH;后:AKO;乎:JVKI;互:KZ;户:LF;奂:BVQ;黄:CKVE;击:CV;及:JML;ML;旡:KMJM;夹:KVQ;甲:RI;见:VJM;糸:WX;角:BYI;疌:KUZ;斤:AKI;今:ELM;TVK;堇:COF;京:WOX;井:KC;丩:MI;韭:FFK;乑:JS;:VKQ;卡:IKKL;开:KC;来:KX;老:TI; 乐:JMX;耒:FE;禸:VA;里:RIKK;立:WVK;吏:KOX;丽:KVVL;隶:US;鬲:KOVI;LL;两:KVEE;六:WE;龙:TMJL;卤:IKVXK;鹿:WJII;JK;仑:EI;矛:AMIJ;么:JA;门:LV;免:BOJM;面:JVIKK;民:GT;末:KM;毋:MMJK;乃:MJ;南:KIVT;KOIH;内:VE;屰:VKU;牜:JG;农:HJK;KE;乒:JIZJ;乓:JIZL;平:KVKI;妻:KUIN;千:JKI;VK;戋:KTJL;欠:BE;MLZ;丘:JIZ;求:KSL;匚:KM;曲:VCK;去:TA;冉:VIKK;壬:JT;刃:DL;入:JL;三:KKK;伞:EVKI;KIVK;色:BG;彡:JJJ;WV;上:IKK;勺:BL;少:XJ;舌:JN;申:RI;升:JC;生:NK;失:EQ;十:KI;石:JO;食:ELR;饣:BL;史:OX;矢:EQ;豕:KQ;示:KKX;世:CM;事:KOUI;首:VJU;殳:RX;书:MMIL;鼠:UMLM;术:ML;甩:YM;彳:JE;VKE;司:MKO;肃:UISE;太:QL;肀:UI;天:KQ;田:VT;头:LLQ;凸:IKIK;屯:KVM;乇:JT;瓦:KMML;丸:JL;万:KMJ;口:VK;卫:PK;为:LJML;未:KM;文:WX;我:JGML;乌:JA;无:KTM;ECK;兀:KR;戊:AMJL;:CK;下:KIL;向:JVO;象:BOQ;辛:WVT;囟:JVXK;戌:AKML;穴:HE;血:JU;熏:JKVH;卂:MKI;丫:VI;牙:KMIJ;央:VQ;MJJ;:VZ;VFL;夭:JQ;TJ;也:MIM;页:JB;曳:RMJ;衣:WJK;JK;夷:KGE;弋:TL;义:LX;AZM;冘:HJM;尹:UJ;庸:WJUI;永:LS;用:YI;尤:TML;由:VT;于:KKI;禺:RVIL;予:AMI;禹:JOVL;玉:ZL;聿:UC;肉:VEE;戉:KMML;云:KKA;再:KVIK;丈:KX;争:BUI;正:KZ;之:LZ;IJJ;至:KAT;EKU;中:OI;重:JKRK;舟:JVLL;州:LJLI;朱:NE;主:LZ;专:KKML;JB;IJ;子:LK;JMIJ;自:JU;辶:LZ;卬:UP;卯:UJP;ULD;卵:ULPL;氏:UT;兜:JRUR;臼:UU;UUI;非:FF;久:YL;镸:ZA;丞:LSK;承: LKKS;业:HK;亚:KHK;严:KHA;亦:WH;赤:TH;兼:VKUH;叚:BMKX;AT;皮:AIX;豸:UQ;疒:WP;羊:VF;其:FE;具:UE;直:KIU;身:JUJ;西:KU;覀:KU;MC;鸟:JA;JA;年:EN;丝:WWK;JZ;NZ;乍:PKK;KPML;攵:JX;言:WO;隹:EF;XV;豖:KQL;竹:PP;兆:RS;鼎:UPP;酉:UK;朿:VM;束:OM;
二、利用上述基本形母、普通形母和组合形母,进行汉字编码的方法为:
(一)单字输入:
1)、基本形母单独成字时,其编码是:基本形母所在键名后加字母V。
2)、“虫”、“巳”、”、“心”、“王”、“鸟”这六个形母组字时,如果是字的最后一个部件,且编码小于四码,则在末尾附加其末笔画的编码。
3)、普通形母单独成字时,其编码是:普通形母所在键名后加字的汉语拼音首字母;
特例:
①单笔画普通形母单独成字时,不加汉语拼音首字母。
②“○、一、四、五、七、八、九、儿”单独成字时,属“一级简码”,不再保留附加汉语拼音首字母的全码形式。
③普通形母中有一些在现代汉语中不单独成字,而只用做偏旁部首,如“氵、冫、扌、亻、廴、亠、冖、宀”等,对于这些字,只能按单笔画编码。
4)、两码组成一字时,其编码是:输入两码所在键名的字母。对于一部分常用字可以在两码后附加字的汉语拼音首字母以避免重码的选择。
5)、三码组成一字时,其编码是:输入三码所在键名的字母。
特例:由三个相同的基本形母或普通形母构成的“品字形”的字,要附加末笔画编码。
6)、四码组成一字时,其编码是:输入四码所在键名的字母;
7)、超过四码组成一字时,其编码是:输入“首、二、中、末”四码所在的键名。
(二)词组输入:
1)、对于由两个字组成的词组,依次取每个字的首、末码;
2)、对于由三个字组成的词组,依次取前两个字的首码和第三个字的首末码;
3)、对于由四个或四个以上字组成的词组,依次取前四个字的首码;
(三)简码输入:
一级简码:包括“一、快、看、他、她、它、不、把、吧、没、每、吗、四、想、要、否、非、发、更、该、给、来、里、啦、五、子、在、儿、如、若、你、能、呢、的、地、得、六、为、无、旁、将、第、从、除、此、比、以、及、七、都、走、我、○、着、和、还、或、是、所、说、八、做、作、学、些、谢、去、却、请、因、出、国、九、既、就、也、有、呀”78个最常用的字。它们大部分是按字的汉语拼音的首字母定义其编码,有少数是按字的韵母字母定义其编码,或根据字的编码包含的形母的字母定义其编码。
本发明具有如下优点:
1、汉字输入与汉语学习相结合。
本输入法不仅适合用于汉字输入,而且适应汉语教学,特别是中小学基础教育。它的拆分、编码完全符合汉字的部件组成及笔顺,符合汉字的字理。
2、本输入法的设计完全考虑到符合国家标准的规定。主要有:
识字教学用通用键盘汉字字形输入系统测评规则(教育部规GF-2011);
信息技术通用键盘汉字输入通用要求(国标GB/T 19246-2003);
现代常用字部件及部件名称规范(教育部规范GF 0014-2009);
现代汉语通用字笔顺规范(语委会1997);
GB13000.1字符集汉字笔顺规范(语委会GF3002-1999)。
3、简单易学。
本输入法选择26个笔划简单、有代表性、组字频率高的汉字部件作为组字的码元,在本输入法中称之为“基本形母”。根据这些字的汉语拼音特性,对应定在键盘上的26个英文字母键上,学者只需要几分钟就可以记住了。
根据26个基本形母,通过“形”、“音”、“义”的联想,将其它常用字部件做出了衍伸的定义,称为“普通形母”和“组合形母”。《现代常用字部件及部件名称规范》中所收录的汉字部件共有514个。对于“普通形母”和“组合形母”,需要做一点必要的学习和练习,但不必死记硬背,通过“形”、“音”、“义”的联想,很容易掌握。用本输入法对汉字拆分、编码和录入,就很容易实现了。
4、本输入法所定义的形母全部是规范的汉字部件,这是其它很多种汉字输入法,包括原始版本的形母码输入法所未能做到的。这对于学者准确地认识汉字的结构、字理是很有好处的。
5、本输入法对汉字的拆分、编码,完全符合汉字书写笔顺的规范,这对于正确地学会汉字的书写是很有益的。
除了使用本输入法设计的编码对汉字进行输入之外,同时也可以使用单笔画的方式进行汉字输入。两种方法可以根据自己的习惯任意混合交替使用。这既可以解决初学者遇到不会拆分的汉字无法输入的问题,又为学习汉字的人提供了练习汉字书写笔顺的环境。
6、按照国标GB/T 19246-2003的规定,使用26个字母键输入汉字和词语的特征编码信息,这是对形母码输入法(CN1054448C)的重大改进(CN1054448C使用26个字母键和10个数字键输入汉字和词语的特征编码信息)。
7、本输入法根据所包含的字符集的不同又分为三个版本。
首先是以国标GB2312《信息交换用汉字编码字符集》收录的6,763个汉字为基础,又根据2013年国家最新颁布的《通用规范汉字表》8,105个汉字做了补充,也保留了1988年版《现代汉语通用字表》 中的字,即《信息交换用汉字编码字符集》、《通用规范汉字表》和《现代汉语通用字表》的并集,共计8,243个汉字。
在此基础上简化出一个子集,只包括《通用规范汉字表》中一级字表的3,500个常用汉字的版本。它适合于初学汉语的人使用。
在此基础上又收集了国标GB18030-2000规定的27,533个汉字(包括部首、部件等),合起来编制成共计27,719个汉字的版本。它适合要求使用繁体字、异体字的人。
本输入法为提高汉字录入的速度,还收录了常用词汇约5万条。
8、平均码长和重码率。
对于8,243字符集的版本,本输入法收录的字、词共57,977条,计135,696字,将全部字词录入一遍,共需击键282,230次(包括重码选择的辅助信息输入击键),计算出平均码长为2.080键/字。
选择议论文、散文、诗歌、故事等几种体裁的文章共9篇,11,107个汉字(所有汉字都在国标GB2312范围内,不分段,无标点,无疑难字,无特殊符号,无专业术语),将全部资料录入一遍,共击键23,767次(包括重码选择的辅助信息输入击键),计算出平均码长为2.140键/字。
对于8,243字符集的版本,有重码字345个,重码率为4.185%。
对于3,500字符集的版本,重码字仅59个,重码率为1.686%。
对于27,719字符集的版本,重码字为5,458个,重码率为19.690%。
形母码输入法的原版仅包括国标GB2312的6,763字符集。在这个字符集中,原版本的重码字为467个,重码率为6.905%。《龙文基因形母码汉字输入法V8.1》版本的重码字为221个,重码率为3.268%,比原版本降低了一半多。
可见,本输入法在平均码长和重码率方面都有较好的效果。
附图说明
图1为基本形母与按键的对应关系图;
图2为普通形母“横”、“竖”、“撇”、“点”、“折”与按键的对应关系图;
图3为一级简码字在键盘上的位置图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的保护范围中。
一、汉字拆分单元
(一)基本形母
本输入法选择26个笔划简单,初学汉语的人较早就接触到并认识的汉字,也是很有代表性、组字频率高的汉字部件作为组字的码元,在本输入法中称之为“基本形母”。为了便于记忆,把这26个基本形母编成下面的口诀:
日月金木水火土;
山犬亡了刀弓止;
小贝寸片女可丰;
马口人匕目。
前三行中,“山”按其形象定义在“V”键上,其它20个按汉语拼音的声母首字母定键。
第四行5个,按韵母首字母定键。
基本形母与按键的对应关系如图1所示。
(二)普通形母
普通形母是由基本形母根据“形”、“音”、“义”等方面的联想而派生的形母,共有146个,详见表1。
定义普通形母的依据有以下两点:
1、单笔画
汉字是由笔划组成的。汉字的笔划归纳为五种:“横”、“竖”、“撇”、“点”、“折”。
横(一):定在“K”键上。算是一个特殊的规定。
竖(丨):与字母“I”形似,定在“I”键上。
撇(丿):与字母“J”形似,定在“J”键上。
点(丶):包括“捺”,与字母“L”形似,定在“L”键上。
折(包括各种形式的折笔,用“乙”来表示):与字母“M”形似,定在“M”键上。
本输入法也可以随意改成“笔划输入方式”。这时,这五个键恰好适合右手不须移位的键盘操作,非常方便。从这个角度来说,用本输入法,几分钟学会打字成为可能。
两种方法可以根据自己的习惯任意混合交替使用。这既可以解决初学者遇到不会拆分的汉字无法输入的问题,又为学习汉字的人提供了练习汉字书写笔顺的环境。
2、根据基本形母,或根据所在键名的“形”、“音”、“义”联想记忆,不须死记硬背,很快就可以掌握。
例如:
A键:基本形母是根据韵母首字母定键的“马”。
这些汉字部件就都作为普通形母定义在A键上。
B键:基本形母是根据声母首字母定键的“贝”。
这些汉字部件就都作为普通形母定义在B键上。
C键:基本形母是根据声母首字母定键的“寸”。
与“寸”形近音近:艹(卝)(草字头、贲字腰)
与“艹”形近:(带字头)廿廾(弄字底)
卌(举字底)
这些汉字部件就都作为普通形母定义在C键上。
(三)组合形母
教育部和国家语言文字工作委员会发布的《现代常用字部件及部件名称规范》(GF0014-2009)中收入了514个常用的汉字部件。这么多的部件不可能都用26个字母中的一个来定义成形母。所以有些部件用2个或2个以上的键来定义。这就是“组合形母”。
绝大多数的组合形母不需要记忆,就像对汉字进行拆分那样,可以把它们联想成是由若干个基本形母或普通形母组合成的。
例如:“白”,联想成“丿”和“日”组成;“本”联想成“木”和“一”组成。这是很容易的,人们日常生活中也常常这样来描述字的形象。
那么为什么还要引出“组合形母”的概念呢?这是要让学习汉字的人懂得:“白”和“本”都是组成汉字的基础部件,是不可分的。我们根据它们的形象,使用“丿”和“日”所在的键“JR”定义了部件“白”;用“木”和“一”所在的键“MK”定义了部件“本”。而不能认为“白”可以分成“丿”和“日”;“本”可以分成“木”和“一”。
另外,也有少部分的组合形母是需要特殊地学习和记忆一下的。
表2~4列出了《组合形母定义表》,共有341个,分为三个部分。
第一部分是绝大部分,包括290个。这部分只要简单地看一看就够了。按照书写的笔划顺序,很容易把它们联想为某些形母的组合。
例如:
第二部分有40个,需要简单地学一下,因为定义这些形母所依据的组成部分,有些只是形状相似,而并不完全相同。
例如:
“皮”:按照书写的笔顺分成“厂”、“丨”、“又”,所以定义为“AIX”。而实际上,第一部分与“厂”形象相似,但并不相同。
“直”:按照书写的笔顺分成“一”、“丨”、“且”,所以定义为“KIU”。下面的部分只是象“且”,其实并不是“且”。
“鸟”:按照书写的笔顺分成“丿”、“马”,所以定义为“JA”。下面的部分只是象“马”,其实并不是“马”。
尽管如此,还是很容易记忆的。
第三部分有11个,需要认真学一下,并记住。好在数量很少。因为定义这些形母,不完全按照书写的顺序,有些考虑到“字理”,有些为了汉字的拆分和编码的便利做了简化,有些是依据其突出的特点。
例如:
“言”:只按首末两部分,取“亠”、“口”,定义为“WO”。
“隹”(锥字边):只按首末两部分,取“亻”、“”,定义为“EF”。
“”(敝字旁):象“米”和“冂”组合在一起,定义为“XV”。
“豖”(啄字旁):比“豕”多一点,所以在“豕”的编码后面再加一个“点”的编码,定义为“KQL”。
“酉”:比“西”多一横,所以在“西”的编码后面再加一个“横”的编码,而省略了“西”的编码前面的一横,定义为“UK”。
“朿”:CN1054448C中是完全遵循书写顺序把它拆分为“一”、“冂”、“小”。而本方法按照字理分析,“朿”是象形字,由“木刺”的形象演变而来,还是应突出“木”的根本,所以分成“冂”、“木”,定义为“VM”。
“束”:CN1054448C中是完全遵循书写顺序把它拆分为“一”、“口”、“小”。而本方法按照字理分析,“束”是会意字,由木柴被一根带子捆扎起来的形象演变而来,还是应突出“木”的根本,“口”代表绳子,所以分成“口”、“木”,定义为“OM”。
在定义组合形母时,有时会想出多种组合方式。一般情况下,是遵循“尽多”的原则,就是看哪种方式能首先使尽可能多的笔划集中在 一起。
下例一些组合形母,可以设想出多种编码方式,但按照“尽多”的原则,可以确定一种是正确的:
二、编码规则
(一)单字输入
1、基本形母单独成字时,其编码是:基本形母所在键名后加字母V(两键一字)。例如:
2.附加末笔画编码的形母
“虫”、“巳”、“(仓字底)”、“心”、“王”、“鸟”这六个形母(前五个是普通形母,最后的“鸟”是组合形母)组字时,如果是字的最后一个部件,且编码小于四码,则在末尾附加其末笔画的编码。
例如:
下面各条规则都是在本条规则之外的。
3、普通形母单独成字
普通形母单独成字,其编码是在普通形母的编码后面附加字的汉 语拼音首字母(两键一字)。这些字的编码是必须附加汉语拼音首字母的,好在不多,只有47个,基本上都是大多数人熟知的、简单的常用字。
例如:
这里有下面的特例:
①单笔画普通形母单独成字时,不加汉语拼音首字母(一键一字)。有:
字:一 乙
编码:K M
②以下普通形母单独成字时,被列为“一级简码”,不再保留附加汉语拼音首字母的全码形式(一键一字)。有:
③普通形母中有一些属于GB2312标准收录的汉字,但在现代汉语中不单独成字,而只用做偏旁部首,对于这些字,只能按单笔画编码。
例如:
4.两码组成一字
两码组成一字时,由两码定义(二键一字)。
例如:
为了尽量避免重码的选择,有一少部分字可以附加汉语拼音声母首字母。具体规则如下:
①只选择了2013年国家发布的《通用规范汉字表》中的一级字 表和二级字表中的一部分常用的、大部分人都认识的字附加汉语拼音首字母。而对于较疑难的字,特别是不在一级字表和二级字表范围之内的字一律是不加汉语拼音首字母的(二键一字)。
例如:
这些是很多人不大认识的字,肯定是不加汉语拼音首字母的。
②两码都是单笔画形母时,不加汉语拼音声母首字母(二键一字)。
例如:
③没有声母的字(“零声母”),当然就不加汉语拼音声母首字母(二键一字)。
例如:
④可能有人会说,还是弄不清这个字要不要附加汉语拼音首字母。没关系。本输入法在设计中还实现了这样的功能,对于一级字表和二级字表中的常用字,加不加汉语拼音首字母都可以。只不过适当地附加汉语拼音首字母(三键一字)可以尽量减少对重码的选择。
例如:
这些都是由两码组成的字,加不加拼音首字母都可以录入。如果只输入两码,是重码字;加了拼音首字母,就不是重码字。
有些字按规定是不加汉语拼音首字母的,输入两码就已经排在首位,不是重码字。如果在汉字录入时附加了汉语拼音首字母,打了三码,也没有关系,但有可能反而成为重码字了。
5.三码组成一字
三码组成一字时,由三码定义(三键一字)。
例如:
这里有一个特例。由三个相同的基本形母或普通形母构成的“品字形”的字,要附加末笔画编码(四键一字)。
例如:
6.四码组成一字
四码组成一字时,由四码定义(四键一字)。
例如:
7.超过四码组成一字
超过四码组成一字时,由“首、二、中、末”四个编码来定义(四键一字)。也就是说,第一、第二和最后一码是必须的,而第三到末码之前的部分选择一个。选择的方法是:去掉单笔画形母,然后取最前面一个。如果中间都是单笔画,则保留最前面一个。这个规则称为“跳单笔”。具体字例见表5。
8.形母合并
有些字比较复杂,笔画多,只用四码来表达一个字很容易造成较多的重码字。为了尽量减少重码,规定下面的一些情况,将几个形母合并处理,也可以理解成是省略了某些部分。
但要注意,如果合并后的编码将不足三码,则不能合并。
①“亠”(玄字头)下面有“丷”(倒八),合并编码为“W”。也可以理解为省略了“丷”。
例如:
②“口”下面有“丷”(倒八),合并编码为“O”。也可以理解为省略了“丷”。
例如:
③以“人”开头的字下面有“一”,合并编码为“E””。也可以理解为省略了“一”。
例如:
④“亡”下面有“口”、“月”,合并编码为“W”。也可以理解为省略了“口”和“月”。
例如:
⑤两个“口”横向并排,看做“目”,合并编码为“U”。例如:
例如:
⑥“彳”与“攵”中间夹有其它的部件,或“彳”与“亍”中间夹有其它的部件形成左右结构的字,合并为“JE”,也可以理解为省略了“攵”或“亍”。
例如:
⑦两个“辛”中间夹有其它的部件形成左右结构的字,合并为“WT”,也可以理解为省略了右边的“辛”。
例如:
⑧有十个成字的部件(有基础部件,也有组合部件),为了编码的便利,用于组字时做了合并处理(或说是简化)。有的是合并为首码(一码),有的合并为首末两码。
具体字例见表6。
(二)简码
“简码”是单字编码的简化形式。用(一)所讲的编码规则为单字定义的编码就称其为“全码”。
为了提高汉字录入的速度,选出一部分使用频率高的字,为其定义一个比全码短的编码,就是该字的简码。
简码分为一、二、三级。
有些字的全码可能是三个或四个字符,现在只用两个字符为其编码,即“两键一字”,称为二级简码。
有些字的全码是四个字符,现在只用三个字符为其编码,即“三键一字”,称为三级简码。
二、三级简码比较多,不必专门去背。在实际操作中,有时全码还没有打完,该字就已经显示出来了。这就是其简码。逐渐就熟悉了。
我们着重讲一下一级简码。
选出78个最常用的字,每个字由一个字符编码,即“一键一字”,称为一级简码。这些字的使用频率特别高,所以掌握好一级简码对提高汉字录入速度是非常有利的。
前面讲的有8个普通形母(○、一、四、五、七、八、九、儿)单独成字时按其所在键的字符编码(一键一字),即属于一级简码的一部分。并且这8个字不再保留附加汉语拼音首字母的全码形式。
又选出70个特别常用的字为它们在全码之外又定义了一级简码。一时记不住简码,也可以使用其全码。但掌握了简码,对提高汉字录入速度是非常有利的。加上前面讲的8个,共78个。
我们先讲其中的26个。为了便于记住哪些字的编码属于一级简码,可以读一读下面的口诀:
因我的儿没去
更不从旁和你比
他是否也来学
一四五六七八九
这些字中,除了前面讲过的属于普通形母单独构成的字以外:
“我”、“他”、“比”,按其汉语拼音的韵母分别定义在“O”、“A”和“I”键上;
“因”、“六”,按全码的首字母,分别定在“V”和“W”键上;
其它字都是按其汉语拼音的首字母定键。很容易记住。
由这26个字,根据音近或其编码包含有所在键的形母,又定义了另外52个。为了便于记忆,再读一读下面的口诀:
这52个简码中,“她、它、以、及、着”是根据韵母分别定在“A、I、Q”键上,“想、要、将、第、都、走、做、作、出、国”是根据它们的编码包含有所在键的形母分别定在“U、P、T、E、V”键上,其它 字都是按其汉语拼音的声母首字母定键的。
每个三字句的第一字,输入其简码后,按空格键即可;每个三字句的第二、三字,输入其简码后,用“2”、“3”键选择即可。
一级简码字在键盘上的位置,如图3所示。
(三)词组编码
对于经常用到的由两个或两个以上汉字组成的词组用特定的方法为其编码是提高汉字录入速度的重要手段。本输入法吸纳了约5万条常用词组,这是不需要背的,也不可能背下来。在汉字录入的实际操作过程中自然会掌握。
下面说明词组的编码方法。
1、两字词的编码方法
对于由两个字组成的词组,依次取每个字的首、末码(不包括末尾附加的字符“V”或汉语拼音首字母、末笔画。下同,不重述),简记为“首末、首末”。
例如:
特殊情况:
(1)如果两个字之一的编码是单个字符,它的首末码就合为一个了。
例如:
(2)如果两个字的编码都是单个字符,要重复第二个字的编码。
例如:
2、三字词的编码方法
对于由三个字组成的词组,依次取前两个字的首码和第三个字的 首末码,简记为“首、首、首末”。
例如:
特殊情况:
如果第三个字的编码是单个字符,它的首末码就合为一个了。
例如:
3.多字词的编码方法
对于由四个或四个以上字组成的词组,依次取前四个字的首码,简记为“首、首、首、首”。
例如:
(四)编码中的注意事项
汉字的书写笔顺,绝大部分是写完一个部件再写另一个部件,但也有例外。
例如:带有围字框(“□”)的字,如“国”、“园”、“因”、“团”等,是先写围字框的“竖”和“横折”,然后写框内的部分,最后才写围字框底下的“横”。本输入法在编码时要考虑到汉字部件的完整性,又要考虑到书写笔顺的正确,对几种特殊情况做以下规定。这时要特别弄清汉字的部件是什么,并注意书写的笔顺。
1、带有围字框(“□”)的字
围字框(□)是组合形母,形似由“冂”和“一”组成。带有的围字 框(□)的字的编码顺序是:
围字框的第一码(V)+框内部分的编码+围字框的第二码(K)
例如:
在这里还有一个略为特殊的规则:如果围字框(□)下面的“一”是字的最后一码,要先略去这个“一”,其余部分按规则编码,最后再补上“一”的编码“K”。
这样一来,有些字会成为“五码一字”。但真正需要录入五码的字极少。
例如:
2、带有区字框(“匚”)的字
区字框(“匚”)是组合形母,由单笔画“一”和“乙”组成,带有的区字框(“匚”)的字的编码顺序是:
区字框的第一码(K)+框内部分的编码+区字框的第二码(M)
例如:
3、由“山”构成包围结构的字
把“山”分成“丨”和“凵”两部分,编码顺序是:
“丨”的编码(I)+框内部分的编码+“凵”的编码(V)
例如:
4、由“戈”或“弋”构成半包围结构的字。
“戈”是组合形母,编码是“TJL”。
“弋”是组合形母,编码是“TL”。
由“戈”、“弋”构成半包围结构的字是先写“一”,然后写被包围的部分,最后才写“戈”或“弋”剩余的笔画。
在这种情况下,“戈”、“弋”都完全拆分为单笔画。
例如:
“戈”的“一”有时与其它笔画相连组成新的编码。
例如:
“”(戕字框)是组合形母,左边的部分是“爿”的变体,笔顺也有变化。由“”构成半包围结构的字的编码顺序是:
“”的前两码(KP)+被包围部分的编码+“”的最后一码(L)
例如:
字:藏 臧
编码:CKPL KPBL
表2:组合形母定义表(第一部分)
表3:组合形母定义表(第二部分)
表4:组合形母定义表(第三部分)
表5:“跳单笔”字例
表6:“形母组合”字例
Claims (6)
1.形母码汉字输入法,其特征在于所述输入法步骤如下:
一、将汉字输入键盘时的拆分单元分为基本形母、普通形母和组合形母,其中:
1)、基本形母有26个,分配在计算机键盘的26个英文键名上:
A:马、B:贝、C:寸、D:刀、E:人、F:丰、G:弓、H:火、I:匕、J:金、K:可、L:了、M:木、N:女、O:口、P:片、Q:犬、R:日、S:水、T:土、U:目、V:山、W:亡、X:小、Y:月、Z:止;
2)、普通形母有146个,分配在计算机键盘的26个英文键名上:
A:与、厂、毛、、厶、
B:勹、、巨、臣、鱼;
C:艹、廿、卌、
D:刂、东、车或車、柬、虫;
E:亻、八、癶;
F:韦、阝、耳、尸、
G:扌、手、己、已、巳、巴;
H:灬、冖、宀;
I:丨、忄;
J:钅、九、丿、丁、
K:一、衤、礻;
L:丶、讠;
M:乙;
N:母、雨、牛、古、午;
O:〇;
P:爿、丬、冫、习、卩、、力、、气;
Q:大、犭、勿;
R:曰、艮、儿、几、
S:氵、氺、川、
T:士、干、耂、七、;
U:且、四、罒、皿、爪、巾、屮;
V:凵、冂或
W:亠、幺、纟、乡、心、;
X:、乂、又、米;
Y:夕;
Z:工、王、五、彐、廴;
3)、组合形母有341个,对应的编码如下:
凹:IMIK;FMJ;JVX;白:JR;百:KJR;KF;办:PLL;半:VC;卑:JRJI;本:MK;KS;必:WJ;釆:JX;丙:KVE;秉:JKUX;卜:IL;IK;不:KJIL;才:KIJ;KVCK;册:VVK;VC;VC;VVXK;叉:XL;产:WVA;长:JKML;II;辰:AKKK;尺:FL;斥:AKIL;丑:MIKK;出:UV;巛:MMM;串:OOI;垂:JKCK;:FL;匆:QL;囱:JVJXK;歹:KY;歺:IKY;丹:VLK;单:VRKI;LJ;BJ;WH;弟:VGIJ;GIJ;电:RM;刁:MK;夂:JX;斗:LLKI;豆:KOK;而:JVII;二:KK;发:MJXL;凡:RL;攴:IKX;方:WMJ;飞:MJL;风:RJL;缶:NV;夫:KQ;巿:KU;弗:GS;甫:KYIL;父:EX;丐:KIKM;尢:TM;甘:CKK;高:WOVO;戈:TJL;革:COKI;个:EI;UE;更:KRX;谷:EEO;瓜:AAL;夬:MQ;毌:MMIK;广:WJ;龟:BRM;鬼:JRJA;果:RM;亥:WMJE;禾:JM;HEF;黑:VVKH;后:AKO;乎:JVKI;互:KZ;户:LF;奂:BVQ;黄:CKVE;击:CV;及:JML;ML;KMJM;夹:KVQ;甲:RI;见:VJM;WX;角:BYI;疌:KUZ;斤:AKI;今:ELM;TVK;堇:COF;京:WOX;井:KC;MI;韭:FFK;JS;:VKQ;卡:IKKL;开:KC;来:KX;老:TI;乐:JMX;耒:FE;VA;里:RIKK;立:WVK;吏:KOX;丽:KVVL;隶:US;鬲:KOVI;LL;两:KVEE;六:WE;龙:TMJL;卤:IKVXK;鹿:WJII;JK;仑:EI;矛:AMIJ;么:JA;门:LV;免:BOJM;面:JVIKK;民:GT;末:KM;毋:MMJK;乃:MJ;南:KIVT;KOIH;内:VE;屰:VKU;JG;农:HJK;KE;乒:JIZJ;乓:JIZL;平:KVKI;妻:KUIN;千:JKI;VK;戋:KTJL;欠:BE;MLZ;丘:JIZ;求:KSL;匚:KM;曲:VCK;去:TA;冉:VIKK;壬:JT;刃:DL;入:JL;三:KKK;伞:EVKI;KIVK;色:BG;彡:JJJ;WV;上:IKK;勺:BL;少:XJ;舌:JN;申:RI;升:JC;生:NK;失:EQ;十:KI;石:JO;食:ELR;饣:BL;史:OX;矢:EQ;豕:KQ;示:KKX;世:CM;事:KOUI;首:VJU;殳:RX;书:MMIL;鼠:UMLM;术:ML;甩:YM;彳:JE;VKE;司:MKO;肃:UISE;太:QL;肀:UI;天:KQ;田:VT;头:LLQ;凸:IKIK;屯:KVM;乇:JT;瓦:KMML;丸:JL;万:KMJ;囗:VK;卫:PK;为:LJML;未:KM;文:WX;我:JGML;乌:JA;无:KTM;ECK;兀:KR;戊:AMJL;:CK;下:KIL;向:JVO;象:BOQ;辛:WVT;囟:JVXK;戌:AKML;穴:HE;血:JU;熏:JKVH;MKI;丫:VI;牙:KMIJ;央:VQ;MJJ;VZ;VFL;夭:JQ;TJ;也:MIM;页:JB;曳:RMJ;衣:WJK;JK;夷:KGE;弋:TL;义:LX;AZM;冘:HJM;尹:UJ;庸:WJUI;永:LS;用:YI;尤:TML;由:VT;于:KKI;禺:RVIL;予:AMI;禹:JOVL;玉:ZL;UC;肉:VEE;戉:KMML;云:KKA;再:KVIK;丈:KX;争:BUI;正:KZ;之:LZ;IJJ;至:KAT;EKU;中:OI;重:JKRK;舟:JVLL;州:LJLI;朱:NE;主:LZ;专:KKML;JB;IJ;子:LK;JMIJ;自:JU;辶:LZ;卬:UP;卯:UJP;ULD;卵:ULPL;氏:UT;兜:JRUR;臼:UU;UUI;非:FF;久:YL;镸:ZA;丞:LSK;承:LKKS;业:HK;亚:KHK;严:KHA;亦:WH;赤:TH;兼:VKUH;叚:BMKX;AT;皮:AIX;豸:UQ;疒:WP;羊:VF;其:FE;具:UE;直:KIU;身:JUJ;西:KU;覀:KU;MC;鸟:JA;JA;年:EN;丝:WWK;JZ;NZ;乍:PKK;KPML;攵:JX;言:WO;隹:EF;XV;豖:KQL;竹:PP;兆:RS;鼎:UPP;酉:UK;朿:VM;束:OM;
二、利用上述基本形母、普通形母和组合形母,进行汉字编码的方法为:
(一)单字输入:
1)、基本形母单独成字时,其编码是:基本形母所在键名后加字母V;
2)、“虫”、“巳”、“”、“心”、“王”、“鸟”这六个形母组字时,如果是字的最后一个部件,且编码小于四码,则在末尾附加其末笔画的编码;
3)、普通形母单独成字时,其编码是:普通形母所在键名后加字的汉语拼音首字母;特例:单笔画普通形母单独成字时,不加汉语拼音首字母;“〇、一、四、五、七、八、九、儿”单独成字时,属“一级简码”,不再保留附加汉语拼音首字母的全码形式;普通形母中在现代汉语中不单独成字,而只用做偏旁部首的字,按单笔画编码;
4)、两码组成一字时,其编码是:输入两码所在键名的字母;
5)、三码组成一字时,其编码是:输入三码所在键名的字母;
6)、四码组成一字时,其编码是:输入四码所在键名的字母;
7)、超过四码组成一字时,其编码是:输入“首、二、中、末”四码所在的键名;
(二)词组输入:
1)、对于由两个字组成的词组,依次取每个字的首、末码;特例:如果两个字之一的编码是单个字符,则首末码合为一个;如果两个字的编码都是单个字符,则重复第二个字的编码;
2)、对于由三个字组成的词组,依次取前两个字的首码和第三个字的首末码;特例:如果第三个字的编码是单个字符,则首末码合为一个;
3)、对于由四个或四个以上字组成的词组,依次取前四个字的首码;
(三)简码输入:
定义“一、快、看、他、她、它、不、把、吧、没、每、吗、四、想、要、否、非、发、更、该、给、来、里、啦、五、子、在、儿、如、若、你、能、呢、的、地、得、六、为、无、旁、将、第、从、除、此、比、以、及、七、都、走、我、〇、着、和、还、或、是、所、说、八、做、作、学、些、谢、去、却、请、因、出、国、九、既、就、也、有、呀”78个最常用的字为一级简码,其中:“我”、“着”、“他”、“她”、“它”、“比”、“以”、“及”,按其汉语拼音的韵母分别定义在“O”、“A”和“I”键上;“〇”、“一”、“四”、“想”、“要”、“五”、“六”、“七”、“都”、“走”、“八”、“做”、“作”、“儿”、“将”、“第”、“因”、“出”、“国”是根据其全码的特征分别定义在“O”、“K”、“U”、“Z”、“W”、“T”、“E”、“R”、“P”、“V”键上,其它字按其汉语拼音的声母首字母定键。
2.根据权利要求1所述的形母码汉字输入法,其特征在于由三个相同的基本形母或普通形母构成的“品字形”的字,要附加末笔画编码。
3.根据权利要求1所述的形母码汉字输入法,其特征在于对于带有围字框“囗”的字,编码顺序是:“冂”的编码+框内部分的编码+“一”的编码。
4.根据权利要求1所述的形母码汉字输入法,其特征在于对于带有区字框“匚”的字,编码顺序是:“一”的编码+框内部分的编码+“乙”的编码。
5.根据权利要求1所述的形母码汉字输入法,其特征在于对于由“山”构成包围结构的字,编码顺序是:“丨”的编码+被包围部分的编码+“凵”的编码。
6.根据权利要求1所述的形母码汉字输入法,其特征在于对于由“戈”或“弋”构成半包围结构的字,“戈”、“弋”完全拆分为单笔画。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510193975.5A CN104898862B (zh) | 2015-04-22 | 2015-04-22 | 形母码汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510193975.5A CN104898862B (zh) | 2015-04-22 | 2015-04-22 | 形母码汉字输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104898862A CN104898862A (zh) | 2015-09-09 |
CN104898862B true CN104898862B (zh) | 2017-12-08 |
Family
ID=54031566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510193975.5A Active CN104898862B (zh) | 2015-04-22 | 2015-04-22 | 形母码汉字输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104898862B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1108772A (zh) * | 1993-12-04 | 1995-09-20 | 杨清林 | 形母汉字输入法 |
CN1158450A (zh) * | 1996-12-02 | 1997-09-03 | 哈尔滨市巨丰电脑有限责任公司 | 一种汉字形母码输入方法 |
CN1166643A (zh) * | 1996-07-23 | 1997-12-03 | 唐文生 | 计算机汉字几何母根编码方案(唐码) |
CN1191342A (zh) * | 1997-11-12 | 1998-08-26 | 陆维辉 | 形母笔与汉字的强三点构造一种多态可拼汉字书写法 |
CN2591671Y (zh) * | 2001-10-30 | 2003-12-10 | 喻宜 | 信息技术用符底码汉字键盘 |
CN101086688A (zh) * | 2007-05-09 | 2007-12-12 | 欧阳贵林 | 和码汉字形义信息码输入法及其单手键盘 |
-
2015
- 2015-04-22 CN CN201510193975.5A patent/CN104898862B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1108772A (zh) * | 1993-12-04 | 1995-09-20 | 杨清林 | 形母汉字输入法 |
CN1166643A (zh) * | 1996-07-23 | 1997-12-03 | 唐文生 | 计算机汉字几何母根编码方案(唐码) |
CN1158450A (zh) * | 1996-12-02 | 1997-09-03 | 哈尔滨市巨丰电脑有限责任公司 | 一种汉字形母码输入方法 |
CN1191342A (zh) * | 1997-11-12 | 1998-08-26 | 陆维辉 | 形母笔与汉字的强三点构造一种多态可拼汉字书写法 |
CN2591671Y (zh) * | 2001-10-30 | 2003-12-10 | 喻宜 | 信息技术用符底码汉字键盘 |
CN101086688A (zh) * | 2007-05-09 | 2007-12-12 | 欧阳贵林 | 和码汉字形义信息码输入法及其单手键盘 |
Also Published As
Publication number | Publication date |
---|---|
CN104898862A (zh) | 2015-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101089795A (zh) | 单击与并击输入中英文的方法和键盘 | |
CN105938402B (zh) | 一种声形码汉字输入法及键盘 | |
CN104898862B (zh) | 形母码汉字输入法 | |
CN101813978A (zh) | 音义码汉字输入法 | |
CN105302330A (zh) | 组合式音笔类主副码汉字、词语编码输入法及其键盘 | |
CN102306058B (zh) | 音义及声义码汉字输入法 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN103135788B (zh) | 一种汉字四象意形输入法 | |
CN101976123A (zh) | 汉字声韵输入方法及输入键盘 | |
CN101344821B (zh) | 用汉字部首词组化双声编码在数字键盘输入汉字的方法 | |
CN109144288B (zh) | 汉字输入方法、输入装置、字库系统及存储介质 | |
CN105278697B (zh) | 组合式双拼类主副码汉字、词语编码输入法及其键盘 | |
CN103207685A (zh) | T形汉字码输入法 | |
CN101344820A (zh) | 一种计算机汉字输入方法及其键盘 | |
CN102750001B (zh) | 汉字输入法 | |
CN101446863A (zh) | 层次解析法汉字基本部件及其码元设置和编码输入法 | |
CN111459296B (zh) | 形拼意汉字输入方法及电子设备 | |
CN100568162C (zh) | 一种计算机汉字输入方法 | |
CN100596335C (zh) | 一种用于计算机的汉字部件分类编码输入方法 | |
CN1204487C (zh) | 根声码汉字输入法 | |
CN104834390B (zh) | 一种连山汉字输入方法 | |
CN105204657B (zh) | 组合式拼音类主副码汉字、词语编码输入法及其键盘 | |
CN100373307C (zh) | 汉字数码的国际交流软件 | |
CN112083816A (zh) | 音义及音型码汉字输入法 | |
CN100389376C (zh) | 一种通用的汉字输入方法及其虚拟键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |