CN1828492A - 数字键盘上的字母布局 - Google Patents

数字键盘上的字母布局 Download PDF

Info

Publication number
CN1828492A
CN1828492A CN 200510052924 CN200510052924A CN1828492A CN 1828492 A CN1828492 A CN 1828492A CN 200510052924 CN200510052924 CN 200510052924 CN 200510052924 A CN200510052924 A CN 200510052924A CN 1828492 A CN1828492 A CN 1828492A
Authority
CN
China
Prior art keywords
digital keys
letters
gone
arrange
keys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200510052924
Other languages
English (en)
Inventor
燕鹏举
李斌
王爱俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to CN 200510052924 priority Critical patent/CN1828492A/zh
Publication of CN1828492A publication Critical patent/CN1828492A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Input From Keyboards Or The Like (AREA)

Abstract

本发明提供一种用于输入数字和字符的输入键盘,该输入键盘基于利用拼音输入汉字的击键次数来确定数字键盘上的字母布局,它通过重新安排数字键盘上的字母布局来使得汉字输入的平均击键次数最小化。本发明输入键盘的字母布局保持了拉丁字母的固有顺序,使得英语等以拉丁字母为单元的语文的输入受到的影响达到最低。根据本发明的字母布局,字母“x”布置在数字按键“8”上,字母“y”布置在数字按键“9”上;数字按键“6”上至少布置“opq”三个字母;数字按键“5”上至少布置“lmn”三个字母;数字按键“4”上至少布置“hij”三个字母;和数字按键“3”上至少布置三个字母,其中包括“ef”两个字母。

Description

数字键盘上的字母布局
技术领域
本发明涉及基于字频在数字输入键盘上布置字母的输入键盘,特别是涉及基于汉字拼音输入的字频在数字键盘上布置字母后所得到的数字字母键盘,使所采用的字母布局能够减少汉字拼音输入的重码率,从而加快汉字输入速度。
背景技术
诸如移动电话、个人数字助理(PDA)之类的嵌入式设备一般配备有数字键盘。数字键盘由数字0到9及数目不多的一些其它键组成。通过事先在数字键盘上设定各个字母所在位置,就可以通过输入一连串的数字键而得以输入汉语拼音,并进而输入汉字。
随着无线通信领域中短消息业务量的不断增加,利用移动电话的数字按键,通过拼音输入汉字来发送短消息的操作在不断地增加。电视接收机遥控器等非计算机设备上的键盘来进行中文输入的必要性也日益增强。如果这些设备具有电话簿、备忘录、电子邮件的发送和接收以及短信息显示等功能,就必须同时具有用于文字输入的简便方法。
图1示出了现有移动电话的数字键盘上的字母布局。如图1所示,分别在数字按键2-9上布置了字母。其中按键“2”上被分配了字母“abc”,按键“3”上被分配了字母“def”,按键“4”上被分配了字母“ghi”,按键“5”上被分配了字母“jkl”,按键“6”上被分配了字母“mno”,按键“7”上被分配了字母“pqrs”,按键“8”上被分配了字母“tuv”,按键“9”上被分配了字母“wxyz”。
然而,由于同一个数字串往往可以对应多个可能的汉字拼音(即,拼音重码问题),同一个拼音也往往对应多个可能的汉字(即,同音字问题)。因此,用户不得不使用额外的选择键在拼音候选列表和汉字候选列表中进行选择。以图1所示的现有移动电话的数字键盘的字母布局为例,用户按动数字键“8”和“2”以输入汉字“他”,因为“他”的拼音是“ta”。此时“她ta”、“它ta”、“台tai”、“谈tan”、和“躺tang”等汉字都会出现在候选汉字列表当中,因为他们的拼音的前两个字母均分别出现在键8和键2上。假设“他”字在这个汉字候选列表中排名第3,则用户必须加按两次按键才能选择到所要输入的“他”。
在现有数字键盘字母布局以及现有拼音输入法的情况下,汉字输入的平均击键次数是一个固定的水平。但通过有效的科学方法,该平均击键次数是可以降低的。目前已经提出了许多方法,其中有些方法将笔画、部首等形码结合到拼音码中,有些方法把元音字母和辅音字母分到不同键上来降低韵母输入的平均击键次数。但是很少有方法试图从字母整体布局的角度考虑解决方案。
申请号为“02155593”的中国专利申请提出了一种从字母整体布局的角度考虑解决方案。根据上述中国专利申请所公开的技术方案,在全空间中搜索可能的“好”字母布局,假设每个字母均可出现在所有数字键上,所以它得到的字母布局中拉丁字母的顺序被打乱,这会造成英语的输入与现有键盘上的输入大相径庭,造成用户的不方便。另外,该专利申请的目标是使所有不重码的拼音频率之和最大化,尽管这在一定程度上可能可以使平均击键次数取得比较小的值,但不能保证平均击键次数达到最低。此外,该专利申请的目标是减小汉语拼音输入的平均击键次数,而不是减小汉字输入的平均击键次数。其最优化指标属于拼音范畴,而不是属于汉字范畴。再者,因为搜索空间非常大,该专利申请的最优化求解过程使用的是遗传算法,而这一般只能求得次优解,而不能保证找到最优解。还有,该专利申请假设只有当用户把一个拼音的所有字母均输入完毕后,对应汉字才出现在候选汉字列表当中。这也不利于降低平均击键次数。
发明内容
鉴于现有的在数字键盘上利用汉字拼音输入汉字需要较多的按键次数的问题,本发明的目的是提供用于输入数字和字符的输入键盘及确定字母布局的方法,该输入键盘基于利用拼音输入汉字的击键次数来确定数字键盘上的字母布局,它通过重新安排键盘上的字母布局来使得汉字输入的平均击键次数最小化。因为根据本发明得到的字母布局中保持了拉丁字母的固有顺序,它和现有的字母布局差异不大,使得英语等以拉丁字母为单元的语文的输入受到的影响达到最低。
为了实现本发明的目的,根据本发明的一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“4”上布置“hij”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,和数字按键“9”上布置“yz”两个字母。
根据本发明的另一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“4”上布置“hijk”四个字母,数字按键“5”上布置“lmn”三个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,数字按键“9”上布置“yz”两个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“abc”三个字母,数字按键“3”上布置“def”三个字母,数字按键“4”上布置“ghij”四个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,数字按键“9”上布置“yz”两个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置不同的字母,其特征在于:数字按键“2”至数字按键“9”的每一个上布置两个至四个不同的字母;字母“x”布置在数字按键“8”上,字母“y”布置在数字按键“9”上;数字按键“6”上至少布置“opq”三个字母;数字按键“5”上至少布置“lmn”三个字母;数字按键“4”上至少布置“hij”三个字母;和数字按键“3”上至少布置三个字母,其中包括“ef”两个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,和数字按键“9”上布置“yz”两个字母;数字按键“2”上至少布置“abc”三个字母,数字按键“3”上至少布置“ef”两个字母,数字按键“4”上至少布置“hij”三个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“abc”三个字母,数字按键“3”上布置“def”三个字母,数字按键“4”上布置“ghij”四个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“9”上布置“yz”两个字母;数字按键“7”上至少布置“st”两个字母,数字按键“8”上至少布置“wx”两个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“4”上布置“hijk”四个字母,数字按键“5”上布置“lmn”三个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,数字按键“9”上布置“yz”两个字母;数字按键“2”上至少布置“abc”三个字母,数字按键“3”上至少布置“def”三个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“4”上布置“hij”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上至少布置“opq”三个字母,数字按键“8”上布置“uvwx”四个字母,数字按键“9”上布置“yz”两个字母;数字按键“7”上至少布置“st”两个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“4”上布置“hij”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“9”上布置“yz”两个字母;数字按键“2”上布置“abc”三个字母,数字按键“3”上至少布置“efg”三个字母,数字按键“7”上至少布置“st”两个字母,数字按键“8”上至少布置“wx”两个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“abc”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opq”三个字母,数字按键“7”上布置“rst”三个字母,数字按键“8”上布置“uvwx”四个字母,数字按键“9”上布置“yz”两个字母;数字按键“3”上至少布置“def”三个字母,数字按键“4”上至少布置“hij”三个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“ab”两个字母,数字按键“3”上布置“cdef”四个字母,数字按键“4”上布置“ghij”四个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,和数字按键“9”上布置“yz”两个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“6”上布置“opq”三个字母,数字按键“9”上布置“yz”两个字母;数字按键“4”上至少布置“hij”三个字母,数字按键“5”上至少布置“lmn”三个字母,数字按键“7”上至少布置“rst”三个字母,数字按键“8”上至少布置“vwx”三个字母。
根据本发明的再一个方面,提供一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:数字按键“4”上布置“hijk”四个字母,数字按键“5”上布置“lmn”三个字母,数字按键“6”上布置“opqr”四个字母,数字按键“9”上布置“yz”两个字母;数字按键“2”上至少布置“abc”三个字母,数字按键“3”上至少布置“efg”三个字母,数字按键“7”上至少布置“st”两个字母,数字按键“8”上至少布置“wx”两个字母。
根据本发明的再一个方面,提供一种确定数字键盘上的字母布局的方法,包括步骤:步骤1.设置一种字母布局,将字母映射到数字键;步骤2.在所述字母布局下穷举所有可能的按键序列,计算所述按键序列下利用拼音输入所有合法汉字的击键次数;步骤3.将于这些拼音对应的所有汉字组成候选汉字列表,将所述数字按键序列下的击键次数与已计算过字母布局下对应的数字按键序列下的最小击键次数进行比较,如果前者小于后者,则将最小击键次数更新成当前值;步骤4.将所述字母布局下的所有按键序列枚举完毕,得到所述布局下所有汉字的最小击键次数;步骤5.将这些最小击键次数乘以相应汉字的归一化频率fj,再进行求和,得到该字母布局下平均击键次数;步骤6.改变字母布局,重复步骤1至步骤5,以计算所述字母布局对应的平均击键次数,对它们进行比较,以得出平均击键次数最小的字母布局。
本发明提供的数字键盘上的最优化字母布局,在保持拉丁字母原有顺序的条件下,使汉字输入的平均击键次数达到最低。计算表明,相对于现有技术的数字键盘的字母布局而言,本发明提出的字母布局的平均击键次数下降率达到11.8%。
附图说明
通过阅读和理解下面参考附图对本发明优选实施例所做的详细描述,将使本发明的这些和其它目的、特征、和优点变得显而易见。其中:
图1是作为现有技术的移动电话的数字键盘上的字母布局的示意图;
图2是根据本发明一个优选实施例的数字键盘上用于两阶段单汉字拼音输入法的字母布局的示意图;
图3是根据本发明另一个优选实施例的数字键盘上用于两阶段词联想的汉字拼音输入法的字母布局的示意图;
图4是根据本发明另一个优选实施例的数字键盘上用于一阶段汉字拼音输入法的字母布局的示意图。
具体实施方式
下面参照附图对本发明的实施例进行详细的说明,在描述过程中省略了对于本发明来说是不必要的细节和功能,以防止对本发明的理解造成混淆。
本发明利用数学算法,对数字键盘上可能出现的字母布局及计算采用相应的字母布局利用拼音输入汉字所产生的击键次数进行穷举计算,得出了数字按键上的最佳字母布局分配,并按照所得出的结果在数字键盘上分配字母布局。
下面首先说明根据本发明的实施例进行计算所采用的数学模型。
可以假设cj为汉字集合中的第j个汉字,fj为汉字cj的归一化频率,并满足 Σ j f j = 1 · 假设汉字cj的拼音串为pj。设A拉丁字母集合为A={a..z},K为数字键盘集合K={0..9}。字母布局Li是一个从拉丁字母集合A到数字键盘集合K的映射,即Li:A→K。在某种字母布局Li下,当k1,k2,…,km数字键串被输入后,可以假设此时的候选汉字列表为canlistk1,k2,…,km i,其中的每个汉字cj满足Li(pj)是k1,k2,…,km的一个头。
把在候选汉字列表canlistk1,k2,…,km i中选择某个汉字cj所需要的击键次数记为 c _ stik e j , k 1 , k 2 , · · · , k m i = ′ ′ index of c j in canlis t k 1 , k 2 , · · · , k m i ′ ′ - 1 , 即汉字cj的canlistk1,k2,…km i中的出现位置减1。则在字母布局Li下,当k1,k2,…,km数字键串被输入后,输入汉字cj所需要的总击键次数为 stike j , k 1 , k 2 , · · · k m i = m + c _ stik e j , k 1 , k 2 , · · · k m i + 1 , 该式中的最后一个1是确认键的击键次数。
这样,可以得到字母布局Li下的平均击键次数,用下面的表达式(1)表示为:
STRIKE i = Σ j f j · ( min m , k 1 , k 2 · · · , k m stike j , k 1 k 2 · · · , k m i ) = Σ j f j · ( min m , k 1 , k 2 , · · · k m ( m + c _ stik e j , k 1 , k 2 , · · · k m i + 1 ) ) , - - - ( 1 )
进而可得最优字母布局,用下面的表达式(2)表示为:
LAYOUT = arg min i STRIKE i = arg min i Σ j f j · ( min m , k 1 , k 2 , · · · , k m ( m + c _ stike j , k 1 , k 2 , · · · , k m i + 1 ) ) · - - - ( 2 )
需要指出,候选汉字列表中的汉字是有顺序的。在字母布局Li下,当k1,k2,…,km数字键串被输入后,考察两个候选汉字c1和c2在canlistk1,k2,…,km i的先后顺序。它们的排序方法遵循下面的两条准则:
1).如果汉字c1的拼音长度是m,而汉字c2的拼音长度不是m(也即>m),则汉字c1排在汉字c2之前;反之亦然;
2).如果f1>f2,则汉字c1排在汉字c2之前;反之亦然。注意到汉字的归一化频率为浮点数,f1=f2的情况基本不存在。
按照本发明的实施例,先应用第1条准则,再应用第2条准则。这样的方法符合用户的习惯,因为它将输入拼音已经完全的汉字排在前,而在输入拼音不完全的汉字中将出现(或使用)频率高的汉字排在前。
本发明使用GB2312字符集进行了实验,该字符集含有日常最为通用的6763个汉字。使用从1996到2002等7年的人民日报全文作为统计字频音频用的文本语料库。
根据不同的输入法的差异,本实施例设计了4种不同的实施方式,即,1).两阶段单汉字输入法;2).两阶段词联想输入法;3).一阶段单汉字输入法;4).一阶段词联想输入法。应该指出,本发明不限于这四种实施方式,其构思可以应用于其它实施方式。
根据本发明,两阶段输入法是指,系统针对输入的数字键串先给出候选拼音列表,用户在候选拼音列表中选择了待输入汉字的拼音后,系统再给出候选汉字列表,最后用户在候选汉字列表中选择待输入汉字。
一阶段输入法是指,当用户输入了待输入汉字拼音对应的全部或部分数字键串后,系统即给出由所有可能的对应汉字组成的候选汉字列表,用户直接在该候选汉字列表中选出待输入汉字。
单汉字输入法是指,无论前面输入的是什么汉字,当前汉字均从输入拼音开始进行输入。
词联想输入法是指,当待输入词的首字输入之后,词内后续的汉字只需在候选后继汉字列表里选择即可输入。候选后继汉字列表由专门的软件模块生成。
为简单起见,前面给出的数学模型只针对上述实施方式3;对于实施方式4,fj指的是汉字cj作为词首汉字出现时的归一化字频。而对于实施方式1和实施方式2,相应的数学模型与实施方式3和4的数学模型仍然类似,只需将表述汉字处改为表述拼音,得到的即是对汉字输入中拼音输入阶段取得平均击键次数最低的最优字母布局。
应该指出,在上述所有4种实施方式中,有两个与现有技术的数字键盘一致的约束:一个约束是每个数字键上出现的字母个数大于1并且小于5,另一个约束是只允许字母出现在数字2到数字9这8个键上。
下面以一阶段输入法为例,描述根据本发明的最优布局的计算求解过程。
首先以图1所示的现有技术的数字键盘的字母布局为例进行说明。假设该字母布局是第100个布局,其字母到数字键的映射即为:
L 100 ( a ) = L 100 ( b ) = L 100 ( c ) = 2 L 100 ( d ) = L 100 ( e ) = L 100 ( f ) = 3 L 100 ( g ) = L 100 ( h ) = L 100 ( i ) = 4 L 100 ( j ) = L 100 ( k ) = L 100 ( l ) = 5 L 100 ( m ) = L 100 ( n ) = L 100 ( o ) = 6 L 100 ( p ) = L 100 ( q ) = L 100 ( r ) = L 100 ( s ) = 7 L 100 ( t ) = L 100 ( u ) = L 100 ( v ) = 8 L 100 ( w ) = L 100 ( x ) = L 100 ( y ) = L 100 ( z ) = 9 ·
在此字母布局下穷举所有可能的按键序列,计算该按键顺序下所有合法汉字的击键次数。应该指出,拼音长度不需超过最长汉语拼音的长度,即“6”,例如“zhuang”的长度6。
先以数字按键“2”和“3”为例,即k1,k2,…,km=23,m=2,k1=2及k2=3。按下数字按键“2”和“3”这个按键序列后,所有合法的拼音为bei、ben、beng、ce、cen和ceng,因为这些拼音的前两个字母均分别对应数字按键“2”及数字按键“3”。此时,对应这些拼音的所有汉字组成候选汉字列表。根据前面介绍的候选汉字列表中汉字的排序方法,对于所有拼音长度为2的汉字(在这个例子中只有拼音为ce的汉字),由于它们的拼音已经输入完毕,因此它们在候选汉字列表中排在所有其它拼音的汉字之前。对于拼音长度同为2的汉字,它们互相之间的先后顺序则由它们的出现频率决定,将出现频率高的汉字排在前面。对于所有其它拼音长度大于2的汉字,它们互相之间的先后顺序也由它们的出现频率决定,将出现频率高的汉字排在前。假设经排序后候选汉字列表如下:
设“策”是汉字字符集中第j1个汉字,它在该候选汉字列表中的索引是1,在该场景下选择“策”字所需要的击键次数就是 c _ stik e j 1 , 23 100 = 1 - 1 = 0 , 它的总击键次数就是 stike j 1 , 23 100 = 2 + c _ stik e j 1 , 23 100 + 1 = 2 + 0 + 1 = 3 , 即输入“策”字的总击键次数是3。根据本发明的方法,将“策”字这个数字按键序列下的击键次数与前面已计算过的其它可能的数字按键序列下“策”字的最小击键次数进行比较,如果前者小于后者,则将“策”字的最小击键次数更新成当前值,也就是这个例子中的3。
下面说明以输入汉字“北”为例的另一个实例。假设“北”是汉字字符集中的第j2个汉字,它在该候选汉字列表中的索引是10。在该场景下选择“北”字所需要的击键次数就是 c _ stik e j 2 , 23 100 = 10 - 1 = 9 , 它的总击键次数就是 stike j 2 , 23 100 = 2 + c _ stik e j 2 , 23 100 + 1 = 2 + 9 + 1 = 12 · 跟前述对“策”字的处理一样,根据情况对“北”字的最小击键次数进行更新。
如此进行,可以得到数字按键“2”和“3”下所有汉字的击键次数,并根据是否是当前最小值进行击键次数的更新。
然后,考察别的按键序列,例如以数字按键“2”,“3”和“4”为例,即k1,k2,…,km=234,m=3,k1=2,k2=3,及k3=4。按下这个按键序列后,只有拼音“bei”是合法的,因为它的前三个(也是全部的)字母均分别对应数字按键“2”、数字按键“3”、及数字按键“4”。根据前述对候选汉字的排序方法,假设经排序后候选汉字列表如下:
Figure A20051005292400173
再一次考察汉字“北”字(是汉字字符集中的第j2个汉字),它在该候选汉字列表中的索引是2,在该场景下选择“北”字所需要的击键次数就是 c _ stik e j 2 , 23 100 = 2 - 1 = 1 , 它的总击键次数就是 stik e j 2 , 234 100 = 2 + c _ stik e j 2 , 234 100 + 1 = 2 + 1 + 1 = 4 · 如果当前“北”字的最小击键次数为4,而刚才数字按键“2”和“3”按键序列下得到的击键次数为12,则将其更新成4。
继续进行,直到将图1所示的字母布局下的所有按键序列枚举完毕,就可以得到该布局下所有汉字的最小击键次数。将这些最小击键次数乘以相应汉字的归一化频率fj,再求和,就得到该字母布局下平均击键次数。实际计算结果可以由下面的表达式(3)表示。
STRIKE 100 = Σ j f j · ( min m , k 1 , k 2 , · · · k m stik e j , k 1 , k 2 , · · · k m 100 ) = 7.55 - - - ( 3 )
然后穷举所有可能的字母布局,计算出这些布局对应的平均击键次数,对它们进行比较,得出平均击键次数最小的字母布局,就是我们要找的最优布局。如果设最优布局是第4000个布局,则有 LAYOUT = arg min i STRIK E i = 4000 ·
下面的表1中给出了计算结果,每行对应一项实验。表中列出了当前布局和最优布局的平均击键次数,以及最优布局的平均击键次数相对于当前布局的下降率。
                               表1  计算结果
  实验号   输入法   平均击键次数 平均击键次数下降率
  一阶段或两阶段  单汉字(C)或词联想(w)   当前布局   最优布局
  1   两阶段  C   3.32   3.14   5.4%
  2  W   3.26   3.07   5.8%
  3   一阶段  C   10.55   9.52   9.7%
  4  W   7.55   6.66   11.8%
需要说明的是,对于两阶段输入法,统计的击键次数仅包含第一阶段中数字键的击键次数和在候选拼音列表中将光标移动到待输入汉字拼音的击键次数。例如对于“华hua”的输入,在输入了“hu”对应的数字键之后,如果“hua”在候选拼音中列在第3位,则该场景下的击键次数记为2+(3-1)=4。后续击键的次数,包括在候选拼音列表中确认待输入汉字拼音的控制键,以及在候选汉字列表中选择待输入汉字的控制键,它们没有考虑在公式当中,因为这些击键次数对于所有的字母布局都是一样的。
而对于一阶段输入法,统计的击键次数包括所有的击键,包括拼音对应的数字键串,在候选汉字列表中移动光标的控制键,和确认所选汉字的控制键。仍然以“华hua”字的输入为例,在输入了“hu”对应的数字键串之后,如果“华”列在候选汉字列表中的第5位,则该场景下的击键次数记为2+(5-1)+1=7。
通过如上所述的方式进行优选的字母布局计算,可以得出上述实施方式1对应的最优字母布局如图2所示。其中数字按键“2”上被分配了字母“abcd”,数字按键“3”上被分配了字母“efg”,数字按键“4”上被分配了字母“hij”,数字按键“5”上被分配了字母“klmn”,数字按键“6”上被分配了字母“opqr”,数字按键“7”上被分配了字母“stu”,数字按键“8”上被分配了字母“vwx”,数字按键“9”上被分配了字母“yz”。
同样,通过如上所述的方式进行优选的字母布局计算,可以得出上述实施方式2对应的最优字母布局如图3所示。其中数字按键“2”上被分配了字母“abcd”,数字按键“3”上被分配了字母“efg”,数字按键“4”上被分配了字母“hijk”,数字按键“5”上被分配了字母“lmn”,数字按键“6”上被分配了字母“opqr”,数字按键“7”上被分配了字母“stu”,数字按键“8”上被分配了字母“vwx”,数字按键“9”上被分配了字母“yz”。
此外,通过如上所述的方式进行优选的字母布局计算,可以得出上述实施方式3和4对应的最优字母布局如图4所示。其中数字按键“2”上被分配了字母“abc”,数字按键“3”上被分配了字母“def”,数字按键“4”上被分配了字母“ghij”,数字按键“5”上被分配了字母“klmn”,数字按键“6”上被分配了字母“opqr”,数字按键“7”上被分配了字母“stu”,数字按键“8”上被分配了字母“vwx”,数字按键“9”上被分配了字母“yz”。
如上面表中所显示的,应用最优字母布局,可以将汉语拼音输入法的平均击键次数降低5%到12%。下面给出一个句子的输入实例,以便直观地看出本发明的优点。在一阶段词联想输入法下输入“晚上天冷多穿点儿”整句话,使用图1所示的现有移动电话键盘上的字母布局,总共击键次数是13+1+7+5+4+8+7+6=51;而使用图4所示的最优布局,总共击键次数是6+1+6+7+4+8+6+6=44,比使用现有移动电话键盘上的字母布局减少了7次击键次数,为13.7%。下面的表2列出了利用最优字母布局输入上述句子的对比实例。
               表2  最优键盘对击键次数减少的一个实例
汉字   当前布局   最优布局
  输入拼音击键数   选择汉字击键数 总共击键数   输入拼音击键数   选择汉字击键数 总共击键数
  晚   3   10   13   3   3   6
  上   1   1   1   1
  天   4   3   7   4   2   6
  冷   4   1   5   4   3   7
  多   3   1   4   3   1   4
  穿   4   4   8   4   4   8
  点   3   4   7   4   2   6
  儿   2   4   6   2   4   6
  合计   51   44
具体地讲,有些字的击键次数在最优布局下变多了,比如“冷”字从5次变成7次,这是由于字母“1”和字母“mn”在最优布局下合并到一个键下,加重了在这个局部的拼音重码问题,使得“leng”和“meng”、“neng”重码。另一些字的击键次数得到了减少,比如“晚”字从13次变成6次,这是由于字母“w”在最优布局下与字母“yz”得到了分离,减轻了在这个局部的拼音重码问题,使得“wan”和“yan”、“zan”不再重码。又例如“天”和“点”字的击键次数从7次变成6次,这是由于字母“o”在最优布局下与字母“n”得到了分离,减轻了在这个局部的拼音重码问题,使得“dian”和“diao”不再重码,“tian”和“tiao”也不再重码。
应该指出,由于考虑的是词联想输入法,因此“上”字没有输入拼音的过程,而只有在“晚”字后所有合法后续字(如“上”、“点”、“饭”、“餐”、“安”等字)中选字的过程,由于“上”字排名第1,因此只需按1次键。
上面已经给出了最优布局,但是有许多其它字母布局的平均击键次数也比较小。下面表3给出的是通过上述计算得到的最优的前20个字母布局的在数字按键2-9上的字母分配状况。如下面的表3所示,最优的前20个字母布局的平均击键次数都在6.66到6.71之间,相差不大。此时用表3中的任意一种字母布局都能有效减少平均击键次数。
                                   表3  最优的前20个布局
  排名 2 3 4 5 6 7 8 9   平均击键次数
  1   abc   def   ghij   klmn   opqr   stu   vwx   yz   6.66
  2   abcd   efg   hij   klmn   opqr   stu   vwx   yz   6.67
  3   abc   defg   hij   klmn   opqr   stu   vwx   yz   6.67
  4   abc   def   ghij   klmn   opqr   st   uvwx   yz   6.69
  5   abc   def   ghij   klmn   opqr   stuv   wx   yz   6.69
  6   abcd   efg   hijk   lmn   opqr   stu   vwx   yz   6.69
  7   abc   defg   hijk   lmn   opqr   stu   vwx   yz   6.69
  8   abcd   efg   hij   klmn   opq   rst   uvwx   yz   6.69
  9   abcd   efg   hij   klmn   opqr   st   uvwx   yz   6.69
  10   abcd   efg   hij   klmn   opqr   stuv   wx   yz   6.69
  11   abc   defg   hij   klmn   opqr   st   uvwx   yz   6.70
  12   abc   defg   hij   klmn   opqr   stuv   wx   yz   6.70
  13   abc   def   ghij   klmn   opq   rst   uvwx   yz   6.70
  14   abc   defg   hij   klmn   opq   rst   uvwx   yz   6.70
  15   ab   cdef   ghij   klmn   opqr   stu   vwx   yz   6.70
  16   abcd   efg   hijk   lmn   opq   rst   uvwx   yz   6.70
  17   abcd   efg   hij   klmn   opq   rstu   vwx   yz   6.70
  18   abcd   efg   hijk   lmn   opqr   st   uvwx   yz   6.71
  19   abcd   efg   hijk   lmn   opqr   stuv   wx   yz   6.71
  20   abc   defg   hijk   lmn   opqr   st   uvwx   yz   6.71
这些最优与次优布局存在着如下一些共同规律,即特征。
I).拉丁字母的顺序未被打乱,安排在数字按键2到数字按键9上,每个数字键上出现2到4个拉丁字母;
II).字母“x”和“y”分离出现在两个键上,且字母“x”出现在数字按键“8”上,字母“y”出现在数字按键“9”上;
III).字母“n”和“o”分离出现在两个数字键上,且字母“n”出现在数字按键“5”上,字母“o”出现在数字按键9上;
IV).数字按键“6”上至少出现3个字母,且为字母“opq”;
V).数字按键“5”上至少出现3个字母,且为字母“lmn”;
VI).数字按键“4”上至少出现3个字母,且为字母“hij;
VII).数字按键“3”上至少出现3个字母,其中必有字母“ef”。
采用根据本发明的方法得到的字母布局,利用拼音输入汉字的平均击键次数下降率达到11.8%。现在大多数的移动电话均使用了一阶段词联想输入法。因此,在应用了本发明提出的如图4所示的字母布局后,词首字的平均击键次数下降了11.8%。考虑到现实应用场景下短信输入在人们日常手机利用中的流行程度,这是一个很大的改进。
另外,根据本发明得到的字母布局对英语输入的影响比较小。拉丁字母的顺序在数字键盘上得以保持。因此,用户花在熟悉新布局上的时间得以减少,也即使用户受到的干扰降到最少。
上面已经结合优选实施例对本发明进行了描述。本领域技术人员应该理解,在不脱离本发明的精神和范围的情况下,可以进行各种其它的改变、替换和添加。因此,本发明的范围不应该被理解为被局限于上述特定实施例,而应由所附权利要求所限定。

Claims (24)

1.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“4”上布置“hij”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,和数字按键“9”上布置“yz”两个字母。
2.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“4”上布置“hijk”四个字母,数字按键“5”上布置“lmn”三个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,数字按键“9”上布置“yz”两个字母。
3.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“abc”三个字母,数字按键“3”上布置“def”三个字母,数字按键“4”上布置“ghij”四个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,数字按键“9”上布置“yz”两个字母。
4.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置不同的字母,其特征在于:
数字按键“2”至数字按键“9”的每一个上布置两个至四个不同的字母;
字母“x”布置在数字按键“8”上,字母“y”布置在数字按键“9”上;
数字按键“6”上至少布置“opq”三个字母;
数字按键“5”上至少布置“lmn”三个字母;
数字按键“4”上至少布置“hij”三个字母;和
数字按键“3”上至少布置三个字母,其中包括“ef”两个字母。
5.根据权利要求4所述的输入键盘,其特征在于数字按键“2”上至少布置了“ab”两个字母。
6.根据权利要求4所述的输入键盘,其特征在于数字按键“2”上至少布置了“abc”三个字母。
7.根据权利要求4至6中的任何一项所述的输入键盘,其特征在于数字按键“9”上布置“yz”两个字母。
8.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,和数字按键“9”上布置“yz”两个字母;
数字按键“2”上至少布置“abc”三个字母,数字按键“3”上至少布置“ef”两个字母,数字按键“4”上至少布置“hij”三个字母。
9.根据权利要求8所述的输入键盘,其特征在于数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母。
10.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“abc”三个字母,数字按键“3”上布置“def”三个字母,数字按键“4”上布置“ghij”四个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“9”上布置“yz”两个字母;
数字按键“7”上至少布置“st”两个字母,数字按键“8”上至少布置“wx”两个字母。
11.根据权利要求10所述的输入键盘,其特征在于数字按键“8”上布置“uvwx”四个字母。
12.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“4”上布置“hijk”四个字母,数字按键“5”上布置“lmn”三个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,数字按键“9”上布置“yz”两个字母;
数字按键“2”上至少布置“abc”三个字母,数字按键“3”上至少布置“def”三个字母。
13.根据权利要求12所述的输入键盘,其特征在于数字按键“2”上布置“abcd”四个字母。
14.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“4”上布置“hij”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上至少布置“opq”三个字母,数字按键“8”上布置“uvwx”四个字母,数字按键“9”上布置“yz”两个字母;
数字按键“7”上至少布置“st”两个字母。
15.根据权利要求14所述的输入键盘,其特征在于数字按键“7”上至少布置“rst”三个字母。
16.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“4”上布置“hij”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“9”上布置“yz”两个字母;
数字按键“2”上布置“abc”三个字母,数字按键“3”上至少布置“efg”三个字母,数字按键“7”上至少布置“st”两个字母,数字按键“8”上至少布置“wx”两个字母。
17.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“abc”三个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opq”三个字母,数字按键“7”上布置“rst”三个字母,数字按键“8”上布置“uvwx”四个字母,数字按键“9”上布置“yz”两个字母;
数字按键“3”上至少布置“def”三个字母,数字按键“4”上至少布置“hij”三个字母。
18.根据权利要求17所述的输入键盘,其特征在于数字按键“3”上布置“defg”四个字母。
19.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“ab”两个字母,数字按键“3”上布置“cdef”四个字母,数字按键“4”上布置“ghij”四个字母,数字按键“5”上布置“klmn”四个字母,数字按键“6”上布置“opqr”四个字母,数字按键“7”上布置“stu”三个字母,数字按键“8”上布置“vwx”三个字母,和数字按键“9”上布置“yz”两个字母。
20.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“2”上布置“abcd”四个字母,数字按键“3”上布置“efg”三个字母,数字按键“6”上布置“opq”三个字母,数字按键“9”上布置“yz”两个字母;
数字按键“4”上至少布置“hij”三个字母,数字按键“5”上至少布置“lmn”三个字母,数字按键“7”上至少布置“rst”三个字母,数字按键“8”上至少布置“vwx”三个字母。
21.根据权利要求20所述的输入键盘,其特征在于数字按键“4”上布置“hijk”四个字母,数字按键“8”上布置“uvwx”四个字母。
22.一种用于输入数字和字符的输入键盘,所述输入键盘至少具有数字0至9的10个按键,在数字按键“2”至数字按键“9”上按字母顺序分别布置两个至四个不同的字母,其特征在于:
数字按键“4”上布置“hijk”四个字母,数字按键“5”上布置“lmn”三个字母,数字按键“6”上布置“opqr”四个字母,数字按键“9”上布置“yz”两个字母;
数字按键“2”上至少布置“abc”三个字母,数字按键“3”上至少布置“efg”三个字母,数字按键“7”上至少布置“st”两个字母,数字按键“8”上至少布置“wx”两个字母。
23.根据权利要求22所述的输入键盘,其特征在于数字按键“2”上布置“abcd”四个字母,数字按键“8”上布置“uvwx”四个字母。
24.根据权利要求22所述的输入键盘,其特征在于数字按键“3”上布置“defg”四个字母,数字按键“8”上布置“uvwx”四个字母。
CN 200510052924 2005-03-02 2005-03-02 数字键盘上的字母布局 Pending CN1828492A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200510052924 CN1828492A (zh) 2005-03-02 2005-03-02 数字键盘上的字母布局

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200510052924 CN1828492A (zh) 2005-03-02 2005-03-02 数字键盘上的字母布局

Publications (1)

Publication Number Publication Date
CN1828492A true CN1828492A (zh) 2006-09-06

Family

ID=36946917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510052924 Pending CN1828492A (zh) 2005-03-02 2005-03-02 数字键盘上的字母布局

Country Status (1)

Country Link
CN (1) CN1828492A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103677296A (zh) * 2012-08-30 2014-03-26 深圳全智达通信股份有限公司 一种键盘生成方法、装置及移动终端
CN107329587A (zh) * 2017-07-24 2017-11-07 杨威 一种低全拼重码率的英文字母序九宫格键盘字母映射方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103677296A (zh) * 2012-08-30 2014-03-26 深圳全智达通信股份有限公司 一种键盘生成方法、装置及移动终端
CN103677296B (zh) * 2012-08-30 2016-12-21 深圳全智达通信股份有限公司 一种键盘生成方法、装置及移动终端
CN107329587A (zh) * 2017-07-24 2017-11-07 杨威 一种低全拼重码率的英文字母序九宫格键盘字母映射方法

Similar Documents

Publication Publication Date Title
CN1258132C (zh) 用于进行字母符号输入的小键盘布局
CN1133918C (zh) 符号输入
CN1607491A (zh) 使用操纵杆输入中文的系统和方法
CN1501670A (zh) 字母数字数据输入系统及方法
CN1967534A (zh) 地址搜索栏输入字符串的过程中即时提示在线搜索结果
CN1811681A (zh) 字符的输入装置和方法
CN1731331A (zh) 字符预测
CN1928860A (zh) 用于校正按键错误的方法、搜索引擎和搜索系统
CN1704880A (zh) 将表意字符输入到手持设备中的方法和装置
CN1637695A (zh) 分割式屏幕键盘
CN1704879A (zh) 用于输入中文汉字短语的方法和设备
CN1556458A (zh) 一种中文整句输入法
CN1828492A (zh) 数字键盘上的字母布局
CN1991743A (zh) 一种语音输入法方法及其装置
CN1097766C (zh) 汉字五键输入法
CN1869892A (zh) 一种中文短语、短句快速输入的方法和系统
CN1217257C (zh) 数字键盘定档英文输入法和汉语拼音字母汉字输入法
CN101114196B (zh) 输入中文短语的方法和设备
CN1834868A (zh) 数字快拼汉字输入法
CN101055499A (zh) 音形汉字输入法
CN1034245C (zh) 缅文字型智能四码输入系统
CN100342311C (zh) 根拆式汉字输入及其显示方法
CN100342310C (zh) 二分汉字编码小键盘输入及其显示方法
CN1257445C (zh) 音义码汉字输入方法
CN1744005A (zh) 手机码手机输入平台

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20060906