CN1403899A - 汉字键盘输入方法改进方案 - Google Patents
汉字键盘输入方法改进方案 Download PDFInfo
- Publication number
- CN1403899A CN1403899A CN 01128776 CN01128776A CN1403899A CN 1403899 A CN1403899 A CN 1403899A CN 01128776 CN01128776 CN 01128776 CN 01128776 A CN01128776 A CN 01128776A CN 1403899 A CN1403899 A CN 1403899A
- Authority
- CN
- China
- Prior art keywords
- key
- speech
- word
- instructions
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
汉字键盘输入方法改进方案,描述了改善拼音输入的五个创新方案。方案一将键盘上最左边一列的四个键对应于四声,用于对众多拼音候选字词用声调做限定。方案二在键盘上右边取五个键对应于五个笔划“横竖撇捺折”,用于对众多候选字词用第一,第二及末笔笔划做限定。方案二与方案一可以混用。方案三着眼于解决输入时敲了一堆键却发现找不到词的实际问题;描述了一种智能化的组词过程。方案四着眼于解决输入时敲错键和前缀匹配的问题。它描述了由输入键序列到汉字字词的匹配过程的算法。方案五着眼于解决在数字键盘上拼音输入时,对众多拼音候选字词做进一步限定这一突出的问题。
Description
本发明涉及汉字键盘输入领域,描述了改善汉字输入的几项创新。
中文键盘输入一直是中文信息处理的老大难问题。虽然语音输入与手写识别会对中文输入很有帮助,但前者适用场合与键盘输入很不相同,后者速度则较慢。因此,改善中文键盘输入的重要性不容低估。
一. 方案一
键盘上拼音输入应用已很普遍。由于汉字的同音字太多,且无论词组输入还是整句输入都不能避免单字的输入,单字的输入便构成输入速度的瓶颈之一。
解决问题的一个有效方法,是对众多拼音候选字用声调做进一步限定。由于拼音输入时脑海中出现的本来就是字或词的发音,故用声调做限定较为自然。
难点在于如何选择对应于四声的四个键。它们在位置上应该尽可能很容易被敲到。
在已敲入汉语拼音之后,键盘上最左边一列的四个键在这时其实是无用的。用它们对应四声是恰到好处。也即是说,用<、> (右小撇键)对应第一声,<TAB>键对应第二声,<Caps Lock>和左<Shift>键分别对应第三,四声。
作为这种方案的一个变通,为进一步对候选词做限定,可用右<Shift>键表示第五声(末声)。
作为这种方案的另一个变通,在使用四声结构的情况下,亦可不用<、> (右小撇)键,而用右<Shift>键。也即用<TAB>键对应第一声,<Caps Lock>键对应第二声,左<Shift>键和右<Shift>键分别对应第三,四声。
输汉字时,在输入拼音字母后,如想进一步对众多拼音候选字用声调做限定,则可敲入相应的声调键;此时只有符合该声调的字出现在候选字列表中。
以上所述亦可用于词组输入。做法是用声调对词组最后一字做限定。如输liuxing,候选词中出现“流行”和“流星”;但再敲入代表第一声调的键后,就只有“流星”了。
二. 方案二
解决拼音输入候选字词多的问题的另一有效方法,是对众多候选字词用笔划做限定。
方法是用键盘上右边的五个键,<->,<=>,<[>,<]>,<;>,分别代表笔划″横竖撇捺折″(具体对应关系可以有变化)。在已敲入汉语拼音之后,敲入单字(或词的最后一字)的第一,第二及末笔笔划,便可对候选字词做很有效的限定。在用笔划做限定时,不必每次都敲完三个笔划,只要达到限定候选字词的目的就可以了.
方案二与方案一可以混用。
三. 方案三
输入时另一大问题是敲了一堆键却找不到词,只好删掉重来。这大大降低输入效率。
解决这个问题的办法,是使用智能化的“组词过程”。下面描述这种“组词过程”的一种可能的实现方案:
当输入词组时,若未找到(或找错)词组,可用<回车>键进入智能化的“组词过程”.该过程会利用已敲的那些键,将其中各部分对应的词或字找出来,使您轻松的组成想要的词(新词可自动加入词库)。
具体做法是:如敲了一排键而未找到词组,则当你敲空格键时,便进入组词过程;如果情况是虽找到了词组,但不是所要的词组,则可敲回车键进入组词过程。
组词过程先对输入键序列进行分析;找出已拼成某个词或字的最大前缀序列;这样,显示出的输入键序列被分为前后两段;前段便是正考虑的当前键序列;与当前键序列对应的字或词显示在其下。对于当前键序列,您可像普通拼音输入时那样操作,也即是说,可以修改键序列,用声调键进行限定,用<空格>或数字键输入,等等。
在当前键序列上,可用左右箭头按每步一格移动当前插入点;用上下箭头(或前页后页键)按每步跳过一个拼音字的方式移动当前插入点;用<Home> <End>将插入点移至输入键序列的排头和排尾。用<Insert>键将“前后段切分点”移至插入点位置。当插入点向右移时,会自动将“前后段切分点”拖向右边;而左移时,当用<前页PageUp>时,“前后段切分点”会跟着走。
每当按当前键序列输入字或词时,当前键序列就被从输入键序列中去除;在显示区,该字或词被显示在原来的当前键序列的位置上。如剩下的输入键序列为空,则已组成的汉字词组便自动输入;否则,组词过程继续对输入键序列进行分析,找出已拼成某个词或字的最大前缀序列,并以此作为新的当前键序列供输入者继续选词或字。
如在输入键序列还未用完时所要词便已找到,则可按<回车>直接输入已组成的词。
组词时,当将组词结果输入时,组词结果会自动加入词库。若不想把结果存入词库,可在用<空格>或数字键输入最后一字(或词)之前,点一下<Ctrl>键即可。
从上面描述可看出,“组词过程”的核心思想在于通过对输入键序列前缀的分析,找出已拼成某个词或字的最大前缀序列;让输入者依此确定对应的词或字;如此反复,输入者便对输入序列一段一段地确定了对应的词或字,从而最终完成整个词的构成。
具体实施时完成哪些功能用哪些键,并不限于上述方案中的描述。
本方案不仅可用于拼音输入,亦可用于形码输入。
四. 方案四
这里考虑两个问题:(1)由于人们在输入汉字时难免有敲错键(少敲,多敲,错敲,两个键次序反)的时候,汉字输入法应有较多容错能力。(2)长点儿的词的编码,全敲有些费事;如在敲了前面一部分就已能确定该词时,就不应要求输入者敲完编码。
这两个问题实际上是提出了对由输入键序列到汉字字词的匹配过程的基本要求。
这里提出一个由输入键序列到汉字字词的匹配过程的算法。它满足这两个基本要求。
以下设K为输入键序列,K[i]为K的第i个字符,K[a..b]表示子序列K[a]K[a+1]K[a+2]...K[b],Len(K)表示K长度;C表示词库,C[j]为词库中的词,j=1,2,3,...,Cn;Cn为词的数量。
(1)如K与C的子集B的共同编码M完全匹配(K等于M),则取B为结果。
(2)否则,找出最大的前缀完全匹配长度u1(显然u<Len(K));即在C中有子集D1,D1中任意词满足条件D1[1..u1]==K[1..u1]。再找出第二大前缀完全匹配长度u2;即在C中有子集D2,D2中的任意词D2[i]满足条件D2[i][1..u2]==K[1..u2],u2<u1,D1与D2不相交。设D1,D2中的词数分别为D1n,D2n,并记D1n+D2n为Dn。
(3)对D1中的任意词D1[i](i=1,..,D1n),求出D1[i]与K之间的“编辑距离”(Edit-Distance,见参考文献[1]),记为E1[i](i=1,..,D1n);同样,对D2中的任意词D2[i](i=1,..,D2n),求出D2[i]与K之间的编辑距离,记为E2[i](i=1,..,D2n)。
为体现前缀匹配长度的重要性,再让E2[i]=E2[i]+(u1-u2)(i=1,..,D2n),即E2[i]再加上最大前缀匹配长度与第二大前缀匹配长度的差。编辑距离算法能精确地计算出两个字符串间的模糊距离,能很好地处理少敲,多敲,错敲,两个键次序反的情形。
(4)将D[i]与K之间的编辑距离记为E[i]。将所有D1i](i=1,..,D1n),D2[j](j=1,..,D2n)合并到一起并按编辑距离从小到大排序,形成词的序列D,其中任意词D[i](i=1,2,...,Dn)满足条件:E[i]<=E[i+1]。则D[i]或者说E[i](i=1,2,...,Dn)构成一个单调上升序列。
(5)如D1n为1,则将D1[1]调整为序列D中的第一个词,以突出前缀匹配的作用。
(6)D[i](i=1,2,...,Dn)即为最终结果(当然如Dn较大,可只取序列中前几项)。
五.方案五
数字键盘拼音输入的重要性,由于近来手机及其它小型键盘的普遍应用,越来越突出。如何对众多拼音候选字词做进一步限定,是一个突出的问题(见方案一,二的讨论)。
本方案借用方案一,二的思路,结合三乘三数字小键盘的特点,构造出同时把声调键和笔划键安排到三乘三键盘上的分布方案。具体图示如下:
(第一声) (第二声) (第三声)
(横) (竖) (第四声)
(撇) (捺) (折)
本方案的基本思路是把四声和五笔(横竖撇捺折)按顺手的原则排放到三乘三九键方阵上。上面只是示出本方案的一个特例,其他排法也是可能的。
这样,四声和五笔同在三乘三方阵上,互不交叉;输入者可根据自己的习惯,既可以按声调,亦可以按笔划,或同时按声调和笔划来对候选字词做限定。参考文献[1]Introduction to Algorithms,a creative approach,pp.155-158,
Manber,U.,Addison-Wesley,1989.
Claims (7)
1.一种将普通电脑键盘上最左边一列的四个键对应于四声,用于对众多拼音候选字词用声调做限定的方案。描述在说明书中第一节。
2.作为权利要求1所指方案的一个变通,为进一步对候选词做限定,可用右<Shift>键表示第五声(末声)。描述在说明书中第一节。
3.作为权利要求1所指方案的一个变通,在使用四声结构的情况下,可用<TAB>键对应第一声,<Caps Lock>键对应第二声,左<Shift>键和右<Shift>键分别对应第三,四声。描述在说明书中第一节。
4.一种在普通电脑键盘右边取五个键对应于五个笔划“横竖撇捺折”,用于对众多候选字词用第一,第二及末笔笔划做限定的方案。该方案用键盘上右边五个键,<->,<=>,<[>,<]>,<;>,分别代表笔划″横竖撇捺折″(具体对应关系可以有变化)。描述在说明书中第二节。
5.一种在输入时敲了一堆键却找不到词时使用的组词过程。该组词过程利用已敲的那些键,将其中各部分对应的词或字找出来,以组成想要的词,并将新词自动加入词库。描述在说明书中第三节。
6.一种由输入键序列到汉字字词编码的匹配算法。该算法兼顾输入键序列与字词编码间前缀匹配和模糊匹配的要求,创造性地使用了能精确地计算出两个字符串间的模糊距离,能很好地处理少敲,多敲,错敲,两个键次序反的情形的“编辑距离算法”(Edit-Distance,Dynamic Programming)。描述在说明书中第四节。
7.一种同时把代表四声和五笔(横竖撇捺折)的键按顺手的原则排放到三乘三九键方阵上的方案。用于在数字键盘上拼音输入时,对众多拼音候选字词做进一步限定。描述在说明书中第五节。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01128776 CN1403899A (zh) | 2001-09-03 | 2001-09-03 | 汉字键盘输入方法改进方案 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01128776 CN1403899A (zh) | 2001-09-03 | 2001-09-03 | 汉字键盘输入方法改进方案 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1403899A true CN1403899A (zh) | 2003-03-19 |
Family
ID=4668605
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 01128776 Pending CN1403899A (zh) | 2001-09-03 | 2001-09-03 | 汉字键盘输入方法改进方案 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1403899A (zh) |
-
2001
- 2001-09-03 CN CN 01128776 patent/CN1403899A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1039666C (zh) | 基于两笔形与两笔符的汉字输入方法及键盘 | |
CN100462901C (zh) | Gb拼音输入法 | |
CN1403899A (zh) | 汉字键盘输入方法改进方案 | |
CN1234061C (zh) | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 | |
CN1162767C (zh) | 方圆归类象形码汉字输入法 | |
CN1050915C (zh) | 一种计算机汉字输入引导提示方法 | |
CN1120403C (zh) | 一种汉字数字编码输入法 | |
CN1062667C (zh) | 全拼形导码计算机汉字输入方法 | |
CN1069420C (zh) | 文字式音形汉字输入方法 | |
CN1111777C (zh) | 三步码汉字输入方法及其键盘 | |
CN1885242A (zh) | 可减少候选字的汉字输入方法:笔画编码+拼音首字母 | |
CN1178344A (zh) | 四声码汉字输入方法 | |
CN1121007C (zh) | 汉字五音数码输入法 | |
CN1677321A (zh) | 多键并击式简音拼音输入汉字的方法及键盘 | |
CN1184280A (zh) | 汉字中文字母编码方法及其键盘 | |
CN1156277A (zh) | 计算机汉字输入方法 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1074147C (zh) | 一种五码汉字输入法 | |
CN2476059Y (zh) | 姜码输入法的键盘 | |
CN1039512C (zh) | 计算机中文单笔划输入系统 | |
CN1053506C (zh) | 层次表声的汉字输入方法 | |
CN1412662A (zh) | 一种数字键盘及汉字拼音输入法 | |
CN1503111A (zh) | 基于四角号码的字母汉字输入法及其键盘 | |
CN1251925A (zh) | 毕升计算机汉字输入法及其键盘 | |
CN1049418A (zh) | 统一码计算机汉字键盘输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |