一种计算机汉字输入方法及其键盘
本发明属于计算机技术领域,是一种以计算机进行汉字信息处理的方法,具体地说是一种汉字编码方法及其所涉及的键盘。
汉字键盘编码输入法分四类:第一类是数字编码,典型代表有区位码、五笔划、笔顺码等,区位码记忆量太大,只能作为辅助输入法,五笔划、笔顺码将汉字的笔画“横竖撇点折”,用数字“12345”代替,根据汉字的笔顺来取码,不足之处是,编码的码长长,编码的重码多,输入效率低;第二类是拼音编码,有全拼、简拼、双拼等多种,根据拼音的声母与韵母为汉字编码,不足之处是同音字多,重码率高,输入效率低;第三类是拼形编码,常用的有五笔字型、郑码、表形码等,不足之处是部件数量多,记忆量大,拆分规则复杂,学习时间长;第四类是音形编码,有六笔声形、阴阳码、自然码等,根据汉字的音、形为汉字编码,不足之处是,编码的码长仍然需要四键,记忆量仍然偏多。也就是说,汉字输入技术存在着“好学的打不快,快速的太难学”的问题。
汉字非键盘输入法主要有两类:第一类是笔输入,如汉王笔、慧笔等,不足之处是写入的笔画太多,输入的速度太慢,识别率不高,价格反而高;第二类是语音话筒输入,不足之处是识别率不高,难以解决“他期中考试得了100分”和“她期终考试得了100分”的同音不同字的难题,对用户的语音适应时间长,价格高。
本发明的目的主要是提供一种不记偏旁、按图索骥、直观易学、高效快速、重码率低的鼠标输入汉字的方法,并且提供一种部件排列规律性强便于掌握的鼠标输入汉字部件图。
该目的是这样实现的:
一种计算机汉字输入方法,通过选取汉字部件信息(特定的部首、笔画)与汉字拼音信息(声母或首字母)对汉字进行编码,并建立各有关汉字信息与键盘上的特定键位的对应关系来实现计算机汉字输入,其特征是:对于所包括的每一个(或绝大多数)汉字,它按如下次序进行编码:
取汉字的首偏旁(无首旁的取首笔画)为汉字的首码;
取汉字的尾偏旁(无尾旁的取尾笔画)为汉字的尾码;
取汉字的声母(无声母的取首字母)为汉字的声码。
输入汉字时,按“先取首码—再取尾码—后取声码”的次序编码。既可以用鼠标输入汉字,又可以用普通键盘输入汉字。这种编码以下简称《钱码》。
《钱码》选取了“横竖撇点折,头十口亻钩”十个类型部件,根据笔画递增的规律,扩展为十类共45个基本部件,将45个基本部件安排在计算机标准键盘的33个键位上(26个字母键,3个数字键,4个符号键)。其中“横竖撇点折”是从上到下并按123的递增规律排列的,如“一二三”、“丨
川”、“丿
彡”、“丶冫氵”等;“头十口亻钩”是按从左向右 渐递增笔画的规律排列的,如“十寸木禾”、“口日目古”、“小氺豕”、“匕已
”等。基本部件排列规律列在附图1中。
上述的一种计算机输入方法所采用的键盘,其西文字母和数字键采用标准键盘的排列,汉字部件的排列特征如图1所示;汉字部件与西文字母和数字键的对应关系如表1所示: 表1
每一个基本部件,以同形或近义的原则,包容或扩展几个部件,就得到了《钱码》的全部129个部件,列在附图2和附图3中。
图1是“基本部件排列规律图”,用于理解和掌握《钱码》的基本部件在计算机键盘上的排列规律,即“横竖撇点折”是按“123”的递增规律从上到下排列,“头十口亻钩”是按“逐一递增笔画”的规律至左向右排列。通过图1能方便地扩展到图2和图3。
图2是“键盘输入汉字部件图”,按标准键盘的基本样式排列,上面排列有《钱码》选定的部件,输入汉字时,依次输入汉字的首码、尾码、声码。《钱码》的键盘输入法具有部件排列规律性强、记忆量少、击键次数少、取码规则简单的特点。
图3是“鼠标输入汉字部件图”,它是一种虚拟键盘的构成,按标准键盘的基本样式显示在显示器上。其特征是:与标准键盘相对应的33个单个键位被分为4个独立键区,即鼠标点击某一个独立键区时,计算机将得到与鼠标点击其它独立键区不相同的信息;即每一个键区的编码是不同的。图3还可用于掌上电脑的触摸屏输入或手写板输入。
图2与图3上的部件数量和形状是完全相同的。图3的不同点是:它将单个键位平均分成四个独立键区,鼠标点击同一键位的不同的独立键区,计算机得到的信息是不相同的;而图2没有将一个键位分成四份独立键区,手击同一键位任一地方,计算机得到的信息是相同的,便于手击键盘输入汉字。
图3上的33个键位,每一个键位被分成4个键区,左上角是字母区,其它三区是部件区,其中右上角是1区,左下角是2区,右下角是3区。汉字部件在不同的键区,编码是各不相同的。部件、编码的对应关系列在表2中。
《钱码》对首、尾码的编码规则是:
1.取大优先:如“磨”的首码取“广”,不取“丶”,尾码取石,不取“口”。
2.首码优先:如“天、夫”的首、尾码都取“二、人”,不能取“一、大”。
3.框戈取整:含有“囗匚戈”的汉字,如果首笔在其上,首码应将“囗匚戈”整体取出,若首笔不在其上,尾笔落在其上,尾码也应整体取出。如“国区或”的首码分别取“囗匚戈”,尾码分别取“丶乂一”。
4.钩的区分:
儿钩是“”,它的竖弯部位无交、连、包的笔画;
交钩是“匕”,同类的有“乙七”,它的竖弯部位有交、连的笔画;
包钩是“巳”,同类的有“
己已巴”,它的竖弯部位有包的笔画;
戈钩是“戈”,同类的有“弋
戈
……”,戈钩不计横点撇。
5.口的区分:汉字分为左右、上下、包围等多种结构,如果“口”在左右结构的汉字中,取“J”键上的左下部位的“(口)”为首、尾码;“口”在上下、包围等其它结构的汉字中时,取“J”键右上部位的“口”为首、尾码。
《钱码》对声码的取码规则是:
以韵母“a o e”打头的汉字,声码分别取“A O E”;声母是“zh ch sh”的,声码分别取“U I O”,其余声码取各自的键位字母。对应关系见表3。
韵母、声母与声码对应关系表 表3
|
a |
o |
e |
b |
p |
m |
f |
d |
t |
l |
n |
g |
k |
h |
j |
q |
x |
y |
w |
zh |
ch |
sh |
z |
c |
s |
声码 |
A |
O |
E |
B |
P |
M |
F |
D |
T |
L |
N |
G |
K |
H |
J |
Q |
X |
Y |
W |
U |
I |
O |
Z |
C |
S |
从图2、图3可以看出,本编码的键位与现行标准键盘完全相同,
无需用户添加新键盘,使用的鼠标也是普通鼠标。
《钱码》对国标一级字库中的3755个汉字进行编码,鼠标点两键(取首码与尾码)后,超过10字的重码共有3条,其中13字重码为2条,14字重码为1条,设定屏幕提示10个重码字,则3条重码中共有10个(3×2+4×1=10)汉字需要翻页选字,可见输入两键后,一级字库中有99.7%的汉字立即显示在屏幕上,仅有3%的汉字在第二屏;鼠标点三键(取首码、尾码、声码)后,无重码的汉字高达3397个,2字重码有153条,3字重码有16条,4字重码仅1条,无需翻页选字。《钱码》设定计算机自选第一个重码字,点空格键选第二个重码字,数字键选后面的字,则三键直接输入的字高达3567个(3397+153+16+1),空格键选170个(153+16+1),需要用数字键选的仅有18个字(1×16+2×1)。可见输入三键后,一级字库中有94.99%的汉字被输入,有4.52%的汉字需要点空格键输入,仅有0.47%的汉字需要用数字键选入。
《钱码》对国标一二级字库中的6763个汉字统一编码,鼠标点两键(取首码与尾码)后,超过10字的重码共有24条,其中11字重码为7条,12字重码为4条,13字重码为8条,15字重码为1条,16字重码为1条,17字重码为2条,18字重码为1条,设定屏幕提示10个重码字,则24条重码中共有72个(1×7+2×4+3×8+5×1+6×1+7×2+8×1=72)汉字需要翻页选字;鼠标点三键(取首码、尾码、声码)后,无重码的汉字高达5824个,2字重码有396条,3字重码有41条,4字重码仅6条,无需翻页选字。《钱码》设定计算机自选第一个重码字,点空格键选第二个重码字,数字键选后面的字,则三键直接输入的字高达6267个(5824+396+41+6),空格键选443个(396+41+6),需要用数字键选的仅有63个字(1×41+2×6)。
钱码还编入了30000条常用词组,便于高速盲打。
本发明有两种输入状态:其一是普通键盘输入状态,其二是鼠标输入状态。计算机启动后,可用鼠标任意切换到“键盘”或“鼠标”输入状态。
切换到《钱码》键盘输入状态时,专业打字员可按图2所示的键盘部件图在普通键盘上高速盲打文章。
切换到《钱码》鼠标输入状态时,屏幕上出现一张如图3所示的鼠标部件图,用鼠标(对于手写板和各种电容触控板来说用笔)依次点击汉字的首码、尾码、声码,无需记忆部件,取码直观,规则简单,击键次数少,重码率低,易学易用,便于推广。仅用右手点击鼠标操作,而将左手解放出来,更适合诸如银行、民航、海关、机关、统计、财会等需要用左手翻阅资料的行业使用。
在鼠标输入状态下,《钱码》输入举例:
1.单部件汉字 鼠标点击其首码,再选入该汉字,或补上声码,点空格键输入。
例如“工”字,首码就是“工”,在“H”键上,先点击“H”上的“工”,屏幕立即显示出“工”,用鼠标选入,如果补上声码“G”,点空格键输入;“人”字,首码就是“人”,在“F”键上,点击“F”上的“人”,屏幕立即显示“人”,用鼠标选入,如果补上声码“R”,点空格键输入。
2.非单部件汉字,鼠标依次点击首、尾码,再选入该汉字,或补上声码直接输入。
例如“键”字,首、尾码分别是“钅”和“廴”,在“A”和“X”键上,依次点击“钅”和“廴”,屏幕立即显示“键”,鼠标选入,或点击它的声码“J”输入;“赢”字,首、尾码分别是“亠”和“丶”,都在“E”键上,依次点击“亠”和“丶”,屏幕立即显示“赢”,用鼠标选入,或点击它的声码“Y”输入。
3.对于没有读音的偏旁部首,先双击该部件,再击“V”键输入。
例如“讠”旁,在“S”键上,双击“讠”,再击“V”键输入。
4.输入汉字时,鼠标依次点击首、尾码后,99%的汉字显示在当前页,可直接选入,还有1%的汉字没有显示出来,有两种方法输入,其一是点击该汉字的声码(对于认识的汉字)输入,其二用鼠标点击向后翻页键捡索输入(对于不认识的汉字)。
5.词组输入都是四键,分四种情况:
①两字词 输入公式是“首尾+首尾”,例如“健康”输入“亻廴广氺”四键;
②三字词 输入公式是“首+首+首尾”,例“计算机”输“讠木乙”四键;
③四字词 输入公式是“首+首+首+首”,“老老实实”输“土土宀宀”四键;
④多字词 输入公式是“首+首+首+末首”,例如“中华人民共和国”输入“口亻人囗”四键。
5.重码的处理点击汉字的首、尾、声码后,偶而出现重码,第一个字计算机自选输入,第二个字空格键输入,后面标有数字的汉字可以点相应的数字键输入,也可直接点需要的重码字输入。输入词组时,如果出现重码,可以用数字键输入,也可点需要的词组输入。
本编码编有《一级字库码表》、《二级字库码表》、《常用词组码表》。作为示例,其《一级字库码表》的第一页列于本《说明书》的下页。
钱码一级字库码表啊j2s3 巴.2b 谤s1q2 鼻r1g1 斌e3p2 擦i2/1阿.1s3 拔i2e1 苞71.3 比,3,3 濒c1b2 猜,212埃h2v2 跋/2e1 胞l2.3 鄙j2.1 滨c1d3 裁h2p2挨i2v2 靶g2.2 包q2.3 笔83,2 宾81d3 材o1r1哎j2f3 把i2.2 褒e3/3 彼,1a1 摈i2d3 才y1r1唉j2v2 耙n3.2 剥n1s2 碧n2;3 兵r1d3 财b2r1哀e3/3 坝h2b2 薄71i1 蓖71,3 冰d1o2 睬l1o1皑r1.3 霸y312 雹y3.3 蔽71q3 柄o1f2 踩/2o1癌93b3 罢l3w3 保m1o1 毕,3u1 丙y1f2 采r1o1蔼71w1 爸d3.2 堡m1h2 毙,3,3 秉r1d3 彩r1v1矮f2v3 白r1k1 饱q2.3 毖,3r1 饼q273 菜71o1艾71f3 柏o1k1 宝81e1 币r1b1 炳p1f2 蔡71/1碍;3i1 百y1k1 抱i2.3 庇91,3 病93f2 餐t1/3爱r1a1 摆i2w3 报i2a1 痹93g1 并d273 参w3v1隘1l3 佰m1k1 暴k1o3 闭e1r1 玻n2a1 蚕h1;1鞍g2v3 败b2q3 豹,3e1 敝d2q3 菠71a1 残y1p2氨f2v3 拜r1n3 鲍z2.3 弊d273 播i2k2 惭u2t1安81v3 稗p1u1 爆p1o3 必c3r1 拨i2e1 惨u2v1俺m1,2 斑n2n2 杯o1u3 辟92g3 钵a3y1 灿p1b3按i2v3 班n2n2 碑;3u1 壁92h2 波c1a1 苍71.3暗k1k1 搬i2a1 悲t1c3 臂92l2 博u1i1 舱f1.3岸b3g3 扳i2a1 卑r1u1 避92x3 勃u1q1 仓f2.3胺l2v3 般f1a1 北t1,3 陛.1h2 搏i2i1 沧c1.3案81o1 颁d3b2 辈t1z3 鞭g2f3 铂a3k1 藏71p2肮l2,1 板o1a1 背t1l2 边q1x3 箔83k1 操i2o1昂k1.1 版r1a1 贝b2b 编x173 伯m1k1 糙o3x3盎t1l3 扮i2q1 钡a3b2 贬b2r3 帛r1b1 槽o1k1凹t1y1 拌i2g3 倍m1j2 扁9273 舶f1k1 曹y1k1敖n3q3 伴m1g3 狈,2b2 便m1f3 脖l2w2 草71u1熬n3c2 瓣e3g3 备q3k2 变e3a1 膊l2i1 厕91s2翱r1d1 半d2g3 惫q3c3 卞e3t3 渤c1q1 策83d3袄/1v2 办q1d3 焙p1j2 辨e3g3 泊c1k1 侧m1s2傲m1q3 绊x1g3 被/1a1 辩e3g3 驳z1f3 册r1y1奥r1v2 邦n3.1 奔v273 辫e3g3 捕i2e1 测c1s2懊u2v2 帮n3b1 苯71y1 遍92x3 卜t3b 层92w3澳c1v2 梆o1.1 本o1y1 标o1/1 哺j2e1 蹭/2k1芭71.2 榜o1q2 笨83y1 彪t1v1 补/1t3 插i2k2捌i2s2 膀l2q2 崩b312 膘l2/1 埠h2u1 叉a1e1