零记忆汉字编码输入法
技术领域
本发明属于汉字输入法,具体涉及一种零记忆汉字编码输入法,适用于计算机汉字输入。
背景技术
目前的汉字输入法主要有五笔输入法、拼音输入法,五笔输入法,重码少,输入速度快,但是字根难记,还要非常熟悉字根在键盘上的布局,除了专业的打字员以外,很少有人认真学习五笔输入法;拼音输入法,不需要记字根,只需要知道汉字的读音就可以打出汉字,但是汉字的同音字很多,用户使用拼音输入法,需要选字,汉字的输入速度比较慢;现在的汉字音型输入法,需要用户记忆一些规则,虽然型码比五笔少,但是也有几十个之多,同样存在记忆麻烦。
现有技术的的缺点:五笔、汉字音型输入法需要记忆大量型码,记忆麻烦,拼音输入法存在大量同音字,需要选字,输入麻烦且速度慢。
发明内容
本发明所要解决的问题在于提供一种不需要大量记忆,输入速度快的零记忆汉字编码输入法。
为达到上述目的,本发明提供一种零记忆汉字编码输入法,使用通用电脑键盘中的英文字母键,其关键在于:汉字按照书写顺序进行顺序拆字,拆出的每一个字为子字,拆出来的子字最少时,每一个子字都是最大子字,以拆出的最大子字拼音的首字母组合,组成一个一至四位汉字输入码,该一至四位汉字输入码对应相应的一个或几个汉字,然后选择需要输入的汉字,所述汉字拆字编码具体步骤如下:
(1)按书写顺序对要输入的汉字进行拆字,拆出最大的子字,取拆出的最大子字的拼音首字母,按顺序排列组成四位编码;
汉字拆分规则:
几乎所有汉字都能拆分,拆分出来的每一个部分,如:子字、部首和剩余部分等每一部分,都成为一个拆分单元;汉字型部首是子字,与某汉字非常接近的拆分单元,是子字,这里所指与某汉字非常接近的拆分单元,不仅要求该拆分单元的结构和笔画数与某汉字完全相同,而且要能够很轻松地看出该拆分单元与某汉字在外型上很相似,极大降低了拆分的难度,达到零记忆的目的,如“言”可拆分为:“三”、“口”。
(2)如果拆出的最大子字为四个及四个以上,取顺序拆出的前四个最大子字拼音的首字母,组成汉字输入四位码;
(3)如果汉字拆出三个最大子字,则取三个最大子字拼音的首字母和该汉字的首笔画编码,顺序排列,组成汉字输入四位码;
(4)如果汉字拆出两个最大子字,则取这两个最大子字拼音的首字母、该汉字的首笔画编码和该汉字的末笔画编码,顺序排列,组成汉字输入四位码;
(5)如果汉字拆出一个最大子字,则取该最大子字拼音的首字母、汉字的首笔笔画汉字编码、汉字的次笔笔画汉字编码和汉字的末笔笔画汉字编码,顺序排列,组成汉字输入四位码;
a、如果汉字笔画为两笔,则取最大子字拼音的首字母、汉字的首笔笔画汉字编码、汉字的次笔笔画汉字编码和汉字的次笔笔画汉字编码,顺序排列,组成汉字输入四位码;
(6)如果汉字为不可拆分字,则取不可拆分字拼音的首字母、不可拆分字拼音的次字母、不可拆分字拼音的第三个字母和首笔画编码,顺序排列,组成汉字输入四位码;
所述不可拆分字就是不能被拆分出最大子字,也就是不能拆分出子字的汉字,如“永”、“了”等字,不能拆分出最大子字,因此“永”、“了”字就是一个不可拆分的汉字。
a、如果不可拆汉字只有两个拼音字母时,取不可拆分字拼音的首字母、不可拆分字拼音的次字母、不可拆分字拼音的次字母和首笔笔画汉字编码,顺序排列,组成汉字输入四位码;
b、如果不可拆汉字只有一个拼音字母时,取不可拆分字拼音的首字母、不可拆分字拼音的首字母、不可拆分字拼音的首字母和首笔笔画汉字编码,顺序排列,组成汉字输入四位码。
该汉字输入法,对于能够拆分的汉字,能够根据拆分出的最大子字,迅速输入汉字,输入简单,不需要大量记忆,即使不认识该汉字,也可以对其进行快速输入;
由于不可拆分的汉字大多比较简单,且按照本输入法,不能拆分的汉字及其少,因此利用本输入法,对于不能拆分的汉字,能够根据其读音和笔画进行快速输入。
四位汉字编码中的每一位编码,都是由26个字母中的任一个,该四位汉字编码重码少,用户可以迅速输入汉字。
(7)对常用汉字,在汉字输入四位码的基础上,取汉字输入四位码的第一位码、前两位码或前三位码,组成汉字输入简码;可用四位码或者输入简码输出常用的汉字。
汉字输入简码能够迅速输入常用的汉字,提高汉字输入速度。
汉字按照书写顺序进行顺序拆字,仅把汉字的下面这些部首作为最大子字,其对应编码如下表:
仅把汉字的少量部首作为能够被拆分出来的最大子字,取该部首代表的子字的拼音首字母,不需要记忆部首,简化了输入,同时减小了记忆量,提高了输入速度。
所述笔画编码,其与笔画的对应关系如下表:
名称 |
编码 |
点笔画 |
D |
横笔画 |
H |
竖笔画 |
S |
撇笔画 |
P |
捺笔画 |
N |
折笔画 |
Z |
提笔画 |
T |
勾笔画 |
G |
用户熟悉的八种基本笔画,笔画的编码就是该笔画的拼音首字母,勾笔画仅包括竖勾和斜勾,而其它勾笔画和折笔画统一规定为折笔画,这样让用户容易识别。
输入由两个及其以上汉字组成的词组,词组编码的码长同样为四码,通过键盘输入四位词组编码,词组组词编码步骤如下:
a、输入两个汉字组成的词组时,取第一个汉字输入四位码的前两位,第二个汉字输入四位码的前两位,组成四位词组编码;
b、输入三个汉字组成的词组时,取第一个汉字输入四位码的第一位,第二个汉字输入四位码的第一位,第三个汉字输入四位码的前两位,组成四位词组编码;
c、输入四个及其以上汉字组成的词组时,取第一个汉字输入四位码的第一位,第二个汉字输入四位码的第一位,第三个汉字输入四位码的第一位,最后一个汉字输入四位码的第一位,组成四位词组编码。
输入词组时,只需要取汉字的前两位编码或第一位编码,组成四位词组编码,该四位词组编码基数大,重码少,用户可以迅速输入词组,加快了汉字的输入速度。
本发明的显著效果是:记忆量小,重码少,能够简单快速的输入汉字及其词组。
具体实施方式
下面结合具体实施例对本发明作进一步详细说明。
一种零记忆汉字编码输入法,使用通用电脑键盘中的英文字母键,汉字按照书写顺序进行顺序拆字,拆出的每一个字为子字,拆出来的子字最少时,每一个子字都是最大子字,以拆出的最大子字拼音的首字母组合,组成一个一至四位汉字输入码,该一至四位汉字输入码对应相应的一个或几个汉字,然后选择需要输入的汉字,所述汉字拆字编码具体步骤如下:
(1)按书写顺序对要输入的汉字进行拆字,先拆分出来的最大子字笔画最多,拆出最大的子字,取拆出的最大子字的拼音首字母,按顺序排列组成四位编码;
按照书写顺序对要输入的汉字进行拆字,汉字无论笔画相连或相交,都可以拆分,且要求先拆分出来的最大子字笔画尽量多;
例如:“元”可拆分出最大子字:“二”、“儿”,不能拆分为“一”、“兀”。
下面举例说明汉字的拆分规则。(汉字拆分示例表)
(2)如果拆出的最大子字为四个及四个以上,取顺序拆出的前四个最大子字拼音的首字母,组成汉字输入四位码;
如“霞”,拆分最大子字“雨”、“尸”、“二”、“一”、“又”,取前四个最大子字的汉语拼音的首字母,“Y”、“S”“E”“Y”,组成四位汉字编码“YSEY”,只要在本输入法的下,用键盘输入“YSEY”,选择需要输入的“霞”字。
(3)如果汉字拆出三个最大子字,则取三个最大子字拼音的首字母和该汉字的首笔画编码,顺序排列,组成汉字输入四位码;
如“梁”,拆分出三个最大字“氵(水)”、“刃”、“木”和汉字的首笔画“丶”,组成四位汉字编码“SRMD”。
(4)如果汉字拆出两个最大子字,则取这两个最大子字拼音的首字母、该汉字的首笔画编码和该汉字的末笔画编码,顺序排列,组成汉字输入四位码;
如“平”,拆分出两个最大子字“一”、“十”,取汉字的首笔画“一”,汉字的末笔画“丨”,因此“平”汉字输入四位码“YSHS”。
(5)如果汉字拆出一个最大子字,则取该最大子字拼音的首字母、汉字的首笔笔画汉字编码、汉字的次笔笔画汉字编码和汉字的末笔笔画汉字编码,顺序排列,组成汉字输入四位码;
a、如果汉字笔画为两笔,则取最大子字拼音的首字母、汉字的首笔笔画汉字编码、汉字的次笔笔画汉字编码和汉字的次笔笔画汉字编码,顺序排列,组成汉字输入四位码;
如“九”,拆分出最大子字“乙”,“乙”拼音为“yi”,“九”的首笔汉字编码和次笔汉字编码分别为“P”、“Z”,因此“九”字的汉字四位输入码为“YPZZ”。
(6)如果汉字为不可拆分字,则取不可拆分字拼音的首字母、不可拆分字拼音的次字母、不可拆分字拼音的第三个字母和首笔画编码,顺序排列,组成汉字输入四位码;
如“刁”,拼音为“diao”,第一笔是折,因此“刁”的汉字四位输入码为“DIAZ”。
a、如果不可拆汉字只有两个拼音字母时,取不可拆分字拼音的首字母、不可拆分字拼音的次字母、不可拆分字拼音的次字母和首笔笔画汉字编码,顺序排列,组成汉字输入四位码;
如“一”,拼音为“yi”,则“一”的汉字输入四位码为“YIIH”。
b、如果不可拆汉字只有一个拼音字母时,取不可拆分字拼音的首字母、不可拆分字拼音的首字母、不可拆分字拼音的首字母和首笔笔画汉字编码,顺序排列,组成汉字输入四位码。
汉字中还存在异体字,异体字不能作为用于拆分的汉字的最大子字,如果某汉字含有该异体字,该异体字不能作为子字。但是异体字可用于拆分;如“迹”的异体字是“跡”,“跡”字可以拆分最大子字“足”、“亦”;另外如“蛋”,不能拆分为“疋”、“虫”,因为“疋”是异体字,不能作为最大子字,应该按照书写顺序拆分出最大子字“卜”、“人”、“虫”。
汉字按照书写顺序进行顺序拆字,仅把汉字的下面这些部首作为最大子字,这些部首,小学生都非常熟悉,不用记忆。其对应编码如下表:
仅把汉字的少量部首作为能够被拆分出来的最大子字,如“病”字,“疒”对应汉字“病”,根据拼音“疒”的汉字编码为“B”,“病”字拆分出“疒”、“丙”,其首笔笔画和末笔笔画首尾笔画分别为“丶”、“丶”,因此“病”字的汉字编码为“BBDD”;又如“疗”字,拆分汉字为“疒”、“了”,其首笔笔画和末笔笔画首尾笔画分别为“丶”、“亅”,因此“疗”字的汉字编码为“BLDG”。
所述笔画编码与笔画的对应关系如下表:
名称 |
编码 |
点笔画 |
D |
横笔画 |
H |
竖笔画 |
S |
撇笔画 |
P |
捺笔画 |
N |
折笔画 |
Z |
提笔画 |
T |
勾笔画 |
G |
用户熟悉的八种基本笔画,笔画的编码就是该笔画的拼音首字母,勾笔画仅包括竖勾和斜勾,而其它勾笔画和折笔画统一规定为折笔画。
输入由两个及其以上汉字组成的词组,词组编码的码长同样为四码,通过键盘输入四位词组编码,词组组词编码步骤如下:
a、输入两个汉字组成的词组时,取第一个汉字输入四位码的前两位,第二个汉字输入四位码的前两位,组成四位词组编码;
如欲输入“中国”,“中”、“国”的汉字编码为“KSSS”、“KYSH”,因此“中国”的汉字编码为“KSKY”。
b、输入三个汉字组成的词组时,取第一个汉字输入四位码的第一位,第二个汉字输入四位码的第一位,第三个汉字输入四位码的前两位,组成四位词组编码;
如欲输入“新中国”,“新”、“中”、“国”这三个字的汉字编码分别为“QJDS”、“KSSS”、“KYSH”,因此“新中国”的汉字编码为“QKKY”。
c、输入四个及其以上汉字组成的词组时,取第一个汉字输入四位码的第一位,第二个汉字输入四位码的第一位,第三个汉字输入四位码的第一位,最后一个汉字输入四位码的第一位,组成四位词组编码。
如欲输入“孟加拉国”,“孟”、“加”、“拉”、“国”四个字的的汉字编码分别为“ZMZH”、“LKZH”、“SLHH”、“KYSH”,因此“孟加拉国”的汉字编码为“ZLSK”。