背景技术 无线、掌上通讯设备如手提电话、个人数字助理(PDA)等是现今最流行的科讯产品,销售数额每年成倍递长。在使用这些通讯产品的同时,汉字的输入是必需的。而现今的计算机(包括台式计算机、笔记本电脑、掌上电脑、个人数字助理等,以及无线通讯设备等)环境大都是以英文为主,相对而言中文输入成为了一个复杂和困难的问题。现时这些产品的中文输入多使用手写和小键盘;手写局限于整个字的书写输入,非常费时和缓慢;键盘输入现时较流行的是背字根和拼音,字根输入可以比较快,比如仓颉和五笔输入法等,但是要熟练该等输入法需要花相当的时间练习;拼音输入(包括双拼输入)的毛病是需要选字,因为同音字太多;并且键盘在该等通讯设备上显示的比例相当小,不利于使用。
在基于笔画和键盘的汉字输入法中,五笔输入法是比较流行的。然而其最大的问题是拆字的方法不符合人们书写时的笔顺习惯,且输入时的拆字技巧需要很长时间的专业训练才能掌握。
在基于手写板的汉字输入法中,人们需要把整个汉字的所有笔画都写出,才可以把一个汉字输入到计算机或设备中。当要输入的汉字笔画很多时,或当书写时记不准汉字的书写时,出错是很常见的。
对于基于拼音的中文整旬输入,现有的方法通常需要把整个拼音所对应的字母都输入进来,这无形中会增加用户的击键次数。双拼输入法采用一种把每一个韵母对应到一个字母的方法,使得对每个拼音的输入简化为两个键;但是其问题是用户需要花很多时间去记住和习惯单个韵母到单个字母的对应关系。
发明内容 本发明的目的是为克服已有技术的不足之处,提出一种基于键选双拼的中文整句输入法及其键盘布局,以减少中文整句输入时的击键次数。
本发明提出的基于键选双拼的中文整句输入法,包括以下步骤:
(1)用户输入一个准声母,其中用户可输入的准声母是以下24个准声母中的任何一个:零声母、b、c、ch、d、f、g、h、j、k、l、m、n、p、q、r、s、sh、t、w、x、y、z、zh;
(2)根据国家标准拼音表和用户所选定的一个准声母,给出后接的准韵母列表,该准韵母列表是以下33个准韵母集合的子集,33个准韵母分别为a、ai、an、ang、ao、e、ei、en、eng、er、i、ia、ian、iang、iao、ie、in、ing、iong、iu、o、ong、ou、u、ua、uai、uan、uang、ue、ui、un、uo或v(即ǚ);
(3)用户从上述准韵母集合的子集中选出待输入汉字所对应的准韵母;
(4)将选定的准声母和准韵母编码组成一个拼音编码,并按中文语言模型解码算法对其进行动态解码;
(5)重复上述步骤(1)~(4),得到整句中文。
本发明针对上述输入方法,提出了专用键盘布局,其中准声母的键盘布局为:
或:
其中准韵母的键盘布局为:
本发明提出的基于键选双拼的中文整句输入法及其键盘布局,其优点如下:
1、在输入拼音时,用户不必像传统双拼那样记住每个韵母所对应的字母,只需要通过选择就可以输入相应的准韵母。
2、对基于触摸屏键盘布局的应用,输入每个拼音只需要两个键;对基于数字键盘和显示屏的应用,输入每个拼音只需要三个键。而传统方法输入一个拼音最多的时候需要6个键(如“zhuang”)。
3、本发明方法使用了中文语言模型,使得用户在输入汉字时无需逐个汉字地从其很长的候选列表中挑选,从而加快输入速度和精度。
具体实施方式
本发明提出的基于键选双拼的中文整句输入法,首先用户输入一个准声母,其中用户可输入的准声母是以下24个准声母中的任何一个:零声母、b、c、ch、d、f、g、h、j、k、l、m、n、p、q、r、s、sh、t、w、x、y、z、zh;根据国家标准拼音表和用户所选定的一个准声母,给出后接的准韵母列表,该准韵母列表是以下33个准韵母集合的子集,33个准韵母分别为a、ai、an、ang、ao、e、ei、en、eng、er、i、ia、ian、iang、iao、ie、in、ing、iong、iu、o、ong、ou、u、ua、uai、uan、uang、ue、ui、un、uo或v(即ǚ);用户从上述准韵母集合的子集中选出待输入汉字所对应的准韵母;将选定的准声母和准韵母编码组成一个拼音编码,并按中文语言模型解码算法对其进行动态解码;重复上述,得到整句中文。
本发明针对上述方法,设计了专用的键盘布局,其中准声母的键盘布局为:
或:
其中准韵母的键盘布局为:
本发明的方法中,用户输入汉字是按句子方式进行的,无需逐字从很长的字候选列表中选择;只要连续地输入所需要输入的所有汉字的拼音,之后,利用中文语言模型根据上下文的关联信息把整个输入串自动转换成句子。用户在输入拼音时,无需输入所有的拼音字母,只需要以键选的方式选择准声母和准韵母即可,因此输入每个拼音只需要两个键。
本发明把拼音分成两部分。第一部分是和声母相关的部分。如果拼音的第一个字母不是a、e或o,那么它是拼音的第一个字母或前面的zh、ch或sh,因此它不是严格意义上的声母(如以y和w开始的拼音的声母实际上是零声母,y和w并非声母),本发明称之为准声母;如果拼音的第一个字母是a、e或o,则准声母实际上不对应任何字母,是虚拟的,本发明称之为“零声母”。第二部分是和韵母相关的部分,是拼音去掉准声母后的部分,当然如果准声母是零声母则准韵母是整个拼音;显然准韵母也不是严格意义上的韵母,比如拼音“yu”的韵母应该ǚ是而不是u。
以下结合实施例详细介绍本发明方法的内容。
实施例1:利用本发明方法在触摸屏上用输入笔输入整句中文的键选双拼输入方法。按如下步骤:
(1)显示本发明提出的的准声母键盘布局,
用户通过触笔从上述键盘中选定一个准声母;
(2)根据国家标准拼音表和上述选定的准声母,给出后接的准韵母列表,该准韵母列表是本发明提出的准韵母列表的子集:
将其中不在该准韵母列表中的准韵母所对应的键的位置置为空白键;
(3)用户通过触笔从上述键盘布局中选定一个准韵母,如果用户误选了准声母,则可以点击空白键,转步骤(1)重新输入该准声母;
(4)将选定的准声母和准韵母编码组成一个拼音编码,并按中文语言模型解码算法对其进行动态解码,该解码方法可以是已有的中文整句输入的解码算法;
(5)重复上述步骤得到整句中文。
为了方便用户从键盘布局中快速找到要输入的准声母,本发明提供两种准声母键盘布局:一种从现有的qwert键盘布局修改而来,把其中不是准声母的键去掉,加上汉语特有的三个键zh、ch和sh分别放在z、c和s的右边,再加上一个“零声母”键:一种是把准声母按字母顺序排列,即按行排列,也可以按列排列。键盘布局上,准声母以外的键的具体内容、名称或位置可以根据需要定制。
为了方便用户从键盘布局中快速找到要输入的准韵母,本发明特意把33个准韵母分组排列,分成a组、e组、i组、o组、u组和v组,各组按符合视觉效果的方式加上分界线。准韵母分组排列时,既可以按行的方式排列,也可以按列的方式排列。
实施例2:利用本发明方法在数字键及屏幕上输入整句中文的键选双拼输入过程。
在带有显示屏的手机上,如图1所示,只有10个数字键(0-9)和“#”、“*”键等,而屏幕又只能用于显示,不能用笔触点击输入。在这样的设备上,具体步骤如下:
(1)用户输入一个准声母:零声母按1;准声母b、c或ch按2;准声母d或f按3;准声母g或h按4;准声母j、k或l按5;准声母m或n按6;准声母p、q、r、s或sh按7;准声母t按8;准声母w、x、y、z或zh按9。
(2)根据国家标准拼音表和用户所按的数字对应的几个准声母,给出后接的准韵母列表,该准韵母列表是以下33个准韵母集合的子集,33个准韵母分别为a、ai、an、ang、ao、e、ei、en、eng、er、i、ia、ian、iang、iao、ie、in、ing、iong、iu、o、ong、ou、u、ua、uai、uan、uang、ue、ui、un、uo或v(即ǚ),把它们按开头字母分成几组准韵母:a组、e组、i组、o组、uv组(uv组指以u或v开始的准韵母组),每组最多10个准韵母,如下表所示;
准声母分组 |
准韵母分组 |
可以组成合法拼音的准韵母 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1=[零声母] |
2 |
a |
ai |
an |
ang |
ao |
|
|
|
|
|
3 | e | ei | en | eng | er | | | | | |
6 |
o |
|
ou |
|
|
|
|
|
|
|
2=bc | 2 | a | ai | an | ang | ao | | | | | |
3 | e | ei | en | eng | | | | | | |
4 |
i |
ian |
iao |
ie |
in |
ing |
|
|
|
|
6 |
o |
ong |
ou |
|
|
|
|
|
|
|
8 | u | ua | uai | uan | uang | | ui | un | uo | |
3=df |
2 |
a |
ai |
an |
ang |
ao |
|
|
|
|
|
3 | e | ei | en | eng | | | | | | |
4 | i | ia | ian | iao | ie | ing | iu | | | |
6 |
o |
ong |
ou |
|
|
|
|
|
|
|
8 | u | | | uan | | | ui | un | uo | |
4=gh |
2 |
a |
ai |
an |
ang |
ao |
|
|
|
|
|
3 | e | ei | en | eng | | | | | | |
6 |
|
ong |
ou |
|
|
|
|
|
|
|
8 | u | ua | uai | uan | uang | | ui | un | uo | |
5=jkl | 2 | a | ai | an | ang | ao | | | | | |
3 | e | ei | en | eng | | | | | | |
4 | i | ia | ian | iang | iao | ie | in | ing | iong | iu |
6 |
o |
ong |
ou |
|
|
|
|
|
|
|
8 | u | ua | uai | uan | uang | ue | ui | un | uo | v |
6=mn | 2 | a | ai | an | ang | ao | | | | | |
3 |
e |
ei |
en |
eng |
|
|
|
|
|
|
4 | i | ian | iang | iao | ie | in | ing | iu | | |
6 |
o |
ong |
ou |
|
|
|
|
|
|
|
8 | u | uan | ue | un | uo | v | | | | |
7=pqrs | 2 | a | ai | an | ang | ao | | | | | |
3 |
e |
ei |
en |
eng |
|
|
|
|
|
|
4 |
i |
ia |
ian |
iang |
iao |
ie |
in |
ing |
iong |
iu |
6 |
o |
ong |
ou |
|
|
|
|
|
|
|
8 | u | ua | uai | uan | uang | ue | ui | un | uo | |
8=t | 2 | a | ai | an | ang | ao | | | | | |
3 | e | ei | | eng | | | | | | |
4 | i | ian | iao | ie | ing | | | | | |
6 |
|
ong |
ou |
|
|
|
|
|
|
|
8 | u | uan | ui | un | uo | | | | | |
9=wxyz |
2 |
a |
ai |
an |
ang |
ao |
|
|
|
|
|
3 | e | ei | en | eng | | | | | | |
4 | i | ia | ian | iang | iao | ie | in | ing | iong | iu |
6 |
o |
ong |
ou |
|
|
|
|
|
|
|
8 | u | ua | uai | uan | uang | ue | ui | un | uo | |
(3)用户选定准韵母分组:a组按2;e组按3;i组按4;o组按6;uv组按8。
(4)用户再从上述所选的准韵母分组中选出待输入汉字所对应的准韵母;
(5)将选定的一组准声母和一个准韵母编码组成一组拼音编码,并按中文语言模型解码算法对其进行动态解码,该解码方法可以是已有的中文整句输入的解码算法;
(6)重复上述步骤,得到整句中文。
在这里,准声母和准声母的输入比较方便。根据现有手机数字键盘布局,如图1,准声母和准韵母分组无需记忆,因为它直接与现有手机数字键盘上印刷的英文字母相对应。如果需要进行特殊设计,可以进一步把长按2、7、9分别对应为ch、sh、zh,以减少准声母组中准声母的个数,降低混淆度,提高整句输入精度和速度。在用户选定准韵母分组后,由于每组最多10个准韵母,借助于10个数字就可以选择,为了方便用户选择,可以在显示屏上显示出准韵母分组中的各个准韵母。