CN103365573B

CN103365573B - 一种对多键输入字符进行识别的方法和装置

Info

Publication number: CN103365573B
Application number: CN201210084563.4A
Authority: CN
Inventors: 张扬
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2012-03-27
Filing date: 2012-03-27
Publication date: 2017-07-21
Anticipated expiration: 2032-03-27
Also published as: CN103365573A

Abstract

本申请提供了一种对多键输入字符进行识别的方法和装置，其中的方法具体包括：获取多键输入字符及该多键输入字符的上文，该多键输入字符包括两个或多个响应键位；根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度；将该多键输入字符的所有响应键位中单个响应键位与所述上文关联程度最高的一个或一个以上响应键位，作为该多键输入字符的识别结果。本申请能够更好的识别多键输入字符，提升用户的输入效率。

Description

一种对多键输入字符进行识别的方法和装置

技术领域

本申请涉及文字输入技术领域，特别是涉及一种对多键输入字符进行识别的方法和装置。

背景技术

计算机设备可被配置成接收来自计算机键盘的文本和字符的输入。传统计算机键盘的面积对于诸如移动电话、多媒体播放器或者个人数字助理之类的便携式装置来说可能会过大。有些便携式装置包括较小版本的传统计算机键盘或者使用虚拟键盘来接收用户输入。其中，以现今的26键全键盘或9键键盘为例，虚拟键盘可能具有对应多于一个字符的按键，例如9键键盘上一个按键对应2abc四个字符。但是，由于虚拟键盘的物理限制(例如尺寸)，用户在按动虚拟键盘时，往往造成误操作。

现有的便携式装置一般没有针对用户输入的容错机制。目前防止用户输入错误的一个方法是，让按键尽可能地大一些，让用户在触及的时候，能够更加准确地触及到有效区域；但是，由于便携式装置的面积有限，在按键较多的时候，分配给每个按键的面积有限，仍难免地出现误操作。

专利权人为中兴通讯股份有限公司、申请号为200710187358.X、发明名称为一种提高按键输入率的触摸屏手机的中国发明专利申请，针对触摸屏手机上的虚拟键盘输入，提出了一种通过扩大高频按键的响应面积对用户输入进行容错的方案，其根据触摸屏按键使用次数的高频率、低频率信息，动态调整按键的有效区域，放大高频率按键的有效区域；同时用户触摸到有争议的区域时(比如同时按下两个或多个键位时)，默认用户按下的是高频率按键，也即高频率按键是该次触摸屏按键的有效输入，来提高对触摸屏按键输入的效率；这里频率的高低是根据各按键累积的敲击次数来统计的。

但是，对某个输入过程中的一次按键来说，很可能按敲击次数统计的低频按键才是用户要输入的。因此，这种直接将低频率按键作为无效输入的识别多键输入字符的方案，究竟是提高还是降低了用户的输入效率，还是未知数。

在以手机为典型代表的便携式装置上，文字输入是用户与便携式装置之间的重要接口，是否能提升用户的输入效率，直接影响到用户的使用体验。

总之，需要本领域技术人员迫切解决的一个技术问题就是：如何能够更好的识别多键输入字符，提升用户的输入效率。

发明内容

本申请所要解决的技术问题是提供一种对多键输入字符进行识别的方法和装置，能够更好的识别多键输入字符，提升用户的输入效率。

为了解决上述问题，本申请公开了一种对多键输入字符进行识别的方法，包括：

获取多键输入字符及该多键输入字符的上文，该多键输入字符包括两个或多个响应键位；

根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度；

将该多键输入字符的所有响应键位中单个响应键位与所述上文关联程度最高的一个或一个以上响应键位，作为该多键输入字符的识别结果。

优选的，所述根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度的步骤，包括：在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率，所述语言模型存储有上文、下文及下文在上文条件下的概率。

优选的，所述在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率的步骤，包括：

在语言模型中查找以所述上文为上文的数据，得到第一查找结果；

在第一查找结果中查找以每个单个响应键位为下文的数据，得到每个单个响应键位作为下文在所述上文条件下的概率。

优选的，所述语言模型的类型包括拼音语言模型，和/或字母语言模型，和/或拼音汉字语言模型，和/或字母汉字语言模型，和/或拼音字母汉字语言模型。

优选的，所述在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率的步骤，包括：：

对所述上文进行解析，得到对应于语言模型类型的一种或多种解析结果；

针对所述上文的每一种解析结果，在对应类型的语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率；

如果对应类型的语言模型超过一个，对依据每种类型的语言模型得到的每个单个响应键位作为下文在所述上文条件下的概率进行归一化处理，归一化处理结果为候选的单个响应键位在上文条件下的概率。

优选的，所述方法还包括：

在纠错概率模型中匹配得到每个单个响应键位在该多键输入字符条件下的概率，所述纠错概率模型存储有多键输入字符、单个响应键位及单个响应键位在多键输入字符条件下的概率；和/或，依据全网和/或当前用户的输入法历史数据对上文与每个单个响应键位的组合和所述上文的分布进行统计，得到每个上文与每个单个响应键位的组合的输入频率；

根据每个单个响应键位在所述上文条件下的概率，每个单个响应键位在该多键输入字符条件下的概率，和/或，上文与每个单个响应键位的组合的输入频率，得到与该多键输入字符相应的多个上文与每个单个响应键位的组合的得分；

将多个上文与每个单个响应键位的组合中得分最多的一个或多个对应的响应键位，作为该多键输入字符的识别结果。

优选的，所述获取多键输入字符的步骤，包括：

接收并检测用户的按键操作，如果第一预置时间间隔内接收到两个或多个键位的按键操作，则以该第一预置时间间隔内的输入作为多键输入字符。

优选的，所述获取该多键输入字符的上文的步骤，包括：

采用存储结构存储用户输入，并在满足预置条件下清空该存储结构，接收到该多键输入字符时该存储结构的内容即为该多键输入字符的上文。

优选的，所述方法还包括：

对该多键输入字符的识别结果进行展现；

依据用户在展现该多键输入字符的识别结果后的操作，记录针对多键输入字符的用户反馈数据。

优选的，所述语言模型为依据全网和/或当前用户的输入法历史数据进行分析统计得到。

优选的，所述纠错概率模型为依据全网和/或当前用户的输入法历史数据和/或针对多键输入字符的用户反馈数据进行分析统计得到。

另一方面，本申请还提供了一种对多键输入字符进行识别的装置，包括：

字符上文获取单元，用于获取多键输入字符及该多键输入字符的上文，该多键输入字符包括两个或多个响应键位；

关联程度获取单元，用于根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度；及

识别结果获取单元，用于将该多键输入字符的所有响应键位中单个响应键位与所述上文关联程度最高的一个或一个以上响应键位，作为该多键输入字符的识别结果。

优选的，所述关联程度获取单元包括：

匹配子单元，用于在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率，所述语言模型存储有上文、下文及下文在上文条件下的概率。

优选的，所述匹配子单元包括：

第一查找模块，用于在语言模型中查找以所述上文为上文的数据，得到第一查找结果；

第二查找模块，用于在第一查找结果中查找以每个单个响应键位为下文的数据，得到每个单个响应键位作为下文在所述上文条件下的概率。

优选的，所述匹配子单元包括：：

解析模块，用于对所述上文进行解析，得到对应于语言模型类型的一种或多种解析结果；

类型匹配模块，用于针对所述上文的每一种解析结果，在对应类型的语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率；

归一化处理模块，用于如果对应类型的语言模型超过一个，对依据每种类型的语言模型得到的每个单个响应键位作为下文在所述上文条件下的概率进行归一化处理，归一化处理结果为候选的单个响应键位在上文条件下的概率。

优选的，所述装置还包括：

辅助匹配单元，用于在纠错概率模型中匹配得到每个单个响应键位在该多键输入字符条件下的概率，所述纠错概率模型存储有多键输入字符、单个响应键位及单个响应键位在多键输入字符条件下的概率；和/或，依据全网和/或当前用户的输入法历史数据对上文与每个单个响应键位的组合和所述上文的分布进行统计，得到每个上文与每个单个响应键位的组合的输入频率；

组合得分获取单元，用于根据每个单个响应键位在所述上文条件下的概率，每个单个响应键位在该多键输入字符条件下的概率，和/或，上文与每个单个响应键位的组合的输入频率，得到与该多键输入字符相应的多个上文与每个单个响应键位的组合的得分；

组合识别单元，用于将多个上文与每个单个响应键位的组合中得分最多的一个或多个对应的响应键位，作为该多键输入字符的识别结果。

优选的，所述字符上文获取单元包括：

接收检测子单元，用于接收并检测用户的按键操作，如果第一预置时间间隔内接收到两个或多个键位的按键操作，则以该第一预置时间间隔内的输入作为多键输入字符。

优选的，所述字符上文获取单元包括：

存储子单元，用于采用存储结构存储用户输入，并在满足预置条件下清空该存储结构，接收到该多键输入字符时该存储结构的内容即为该多键输入字符的上文。

优选的，所述装置还包括：

展现单元，用于对该多键输入字符的识别结果进行展现；

记录单元，用于依据用户在展现该多键输入字符的识别结果后的操作，记录针对多键输入字符的用户反馈数据。

与现有技术相比，本申请具有以下优点：

本申请从多键输入字符的所有响应键位中，识别出单个响应键位与所述上文关联程度最高的一个或一个以上响应键位，由于所述识别基于单个响应键位作为下文与所述上文的关联程度，而下文与所述上文的关联程度为依据语言模型得到，其能反映自然语言处理领域内的上下文相关规律，故本申请的识别能够给出最优、最合理的响应键位进行后续处理。

如果没有本申请的自动识别，在用户由于误操作而输入多键输入字符的情况下，需要用户手动退格删除其中的字符以保留其中的一个字符，本申请自动纠正用户输入过程中的误操作，避免了用户需要重新编辑的苦恼，从而能够提高用户的输入效率。

附图说明

图1是本申请一种对多键输入字符进行识别的方法实施例1的流程图；

图2是本申请一种对多键输入字符进行识别的方法实施例2的流程图；

图3是本申请一种对多键输入字符进行识别的方法实施例3的流程图；

图4是本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例1；

图5是本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例2；

图6是本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例3；

图7是本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例4；

图8是本申请一种在9键盘上识别多键输入字符及展现相应识别结果的示例1；

图9是本申请一种对多键输入字符进行识别的装置实施例的结构图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

本申请对用户输入过程中的误操作进行容错处理，具体而言，在用户由于不小心按错键、同时按到两个及两个以上按键等误操作，而使得设备检测到的输入包括两个或多个响应键位的多键输入字符时，对该多键输入字符进行自动识别，以自动纠正用户输入过程中的误操作，提高用户的输入效率，提升输入体验。

参照图1，示出了本申请一种对多键输入字符进行识别的方法实施例1的流程图，具体可以包括：

步骤101、获取多键输入字符及该多键输入字符的上文，该多键输入字符具体可以包括两个或多个响应键位；

本申请的多键输入字符可以源于硬件键盘或虚拟键盘。在实际应用中，传统硬件键盘的面积对于诸如移动电话、多媒体播放器或者个人数字助理之类的便携式装置来说可能会过大，故有些便携式装置包括较小版本的硬件键盘或者使用虚拟键盘来接收用户输入。而较小版本的硬件键盘或者使用虚拟键盘很容易引起用户的误操作，如不小心按错键、多按键等误操作导致用户在输入过程中同时按下两个或多个键位，也就是输入了包括两个或多个响应键位的多键输入字符。本申请正是对该多键输入字符进行自动识别，从中识别出一个或一个以上最优、最合理的响应键位进行后续处理的，以自动纠正用户输入过程中的误操作，提高用户的输入效率。

这里给出误操作引起的多键输入字符的示例，这些示例并不作为本申请的应用限制。例如，用户想输入萨琪玛，在输入完saqi之后，不小心连着按下了m和n；又如，用户想输入三角洲，在输入完三jiao之后，不小心连着按下了s、x和z。

正常情况下用户的每次按键操作，有且仅有一个按键响应，而如果用户不小心按错键、多按键，该次按键操作会有两个或多个按键响应，这也是引起多键输入字符的误操作的一个特征，故在本申请的一种优选实施例中，可以依据误操作的该特征获取多键输入字符，所述获取过程具体可以包括：

接收并检测检测用户的按键操作，如果第一预置时间间隔内接收到两个或多个键位的按键操作，则以该第一预置时间间隔内的输入作为多键输入字符。依据误操作的该特征，如果前后两次或多次按键操作发生在一定的时间间隔内，则认为前后两次或多次按键操作是用户的误操作，需要进行容错处理；这里的第一预置时间间隔可由本领域技术人员根据实际需要设置，通常，可将其设置为一个较小的数值，如0.01s，0.001s等等，本申请对具体的数值不加以限制。

在实际应用中，该多键输入字符的上文具体可以包括该多键输入字符前编辑框中的输入序列，和/或该多键输入字符前编辑框中已被选中的文字，和/或该多键输入字符前已上屏的文字，和/或该多键输入字符前的输入起始字符；其中，该多键输入字符前编辑框中的输入序列和该多键输入字符前的输入起始字符的主要区别在于，前者未上屏，后者已上屏。例如，tr、per等字符通常只能位于英文单词的起始位置，故其可以作为输入起始字符的典型示例。

在本申请的一种优选实施例中，所述获取该多键输入字符的上文的步骤，具体可以包括：

所述用户泛指该多键输入字符前用户的输入内容，其具体可以包括该多键输入字符前编辑框中的输入序列，和/或该多键输入字符前编辑框中已被选中的文字，和/或该多键输入字符前已上屏的文字，和/或该多键输入字符前的输入起始字符等等。在实际应用中，可以采用动态数组、动态链表甚至队列等存储结构来临时存储用户输入，这些存储结构可以根据实际的用户输入情况，有效利用存储空间。

在本申请的一些优选实施例中，所述预置条件具体可以包括输入到达第二预置时间间隔，和/或该存储结构中用户输入的长度到达预置长度，和/或该存储结构中最后一个元素为标点符号等，其中，第二预置时间间隔、预置长度可由本领域技术人员根据实际需求设置，本申请对此不加以限制。另外，上述三种预置条件不作为本申请的应用限制，实际上本领域技术人员还可以采用其它预置条件。

步骤102、根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度；

语言模型主要描述下文与上文的关联程度，在实际中，下文与上文的关联程度通常用下文在上文条件下的概率来描述。自然语言处理领域内语言模型提供字符序列的概率，其通常通过对训练数据中字符序列的频度计数从一训练数据集中训练得到。关于本申请语言模型的数据源，可以是预先算好的，在使用时不做更新(例如，可以依据字符的上下文相关规律得到的经验值或全网用户的输入法历史数据进行分析统计)；也可以依据当前用户的输入法历史数据进行分析统计；还可以是前两者的混合。由于构造语言模型是公知的技术，故在此不作赘述。

语言模型的类型有多种，例如，具体可以包括拼音语言模型，和/或字母语言模型，和/或拼音汉字语言模型，和/或字母汉字语言模型，和/或拼音字母汉字语言模型等等。

字母语言模型主要描述字母与字母之间的上下文关联程度，参照表1，示出了本申请一种字母语言模型的示例。

表1字母语言模型

音节语言模型主要描述音节与音节之间的上下文关联程度，参照表2，示出了本申请一种音节语言模型的示例。

表2音节语言模型

字母汉字语言模型主要描述字母汉字与字母之间的上下文关联程度，参照表3，示出了本申请一种字母汉字语言模型的示例。

表3字母汉字语言模型

上文	下文	概率	说明
				单pian	j	0.8214788828	单片机
单pian	b	0.0078698494	低概率转移路径
				单pian	w	0.1676487089	单篇文章......

需要说明的是，即使同一类型的语言模型，其描述或存储的数据不一定同时存在于一个表中，可分别存在于多个表中，使用时再去查找。同一类型语言模型、不同类型语言模型的表中记录的上下文之间的概率大小，也不具有绝对的大小关系，可以在使用时进行归一化。总之，表1-表3记载的数据均是作为示例，并不作为本申请的应用限制。

在本申请实施例中，所述语言模型的阶数具体可以包括一元语言模型，和/或二元语言模型，和/或三元语言模型，和/或长距离语言模型等。

无论使用何种类型、何种阶数的语言模型，由于语言模型存储有上文与下文之间的关联程度，故在匹配时，可以为每个单个响应键位找到相应的匹配项。

在本申请的一种优选实施例中，所述根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度的步骤，具体可以包括：在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率，所述语言模型存储有上文、下文及下文在上文条件下的概率。

在本申请的另一种优选实施例中，所述在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率的步骤，可以进一步包括：

子步骤A1、在语言模型中查找以所述上文为上文的数据，得到第一查找结果；

子步骤A2、在第一查找结果中查找以每个单个响应键位为下文的数据，得到每个单个响应键位作为下文在所述上文条件下的概率。

在本申请的一种应用示例中，假设采用动态数组lastinput作为存储结构来存储用户输入，且用户在输入了an之后，按下了键盘上的a和q键，此时，动态数组lastinput中存储的内容为“an”；通过查找表1可知，lastinput为“an”时，下文为“a”的概率是0.0214，下文为“q”的概率是0.133＞0.0214。因此，可以得出结论：在上文为“an”情况下，用户同时按下“a”和“q”，更有可能是在按“q”。在后续处理过程中，如果转换成词条，则anq组成的“安全”，也要比ana组成的“阿娜”的概率高。上例中使用的条件概率P(q|an)＞P(a|an)为二元模型。

通常语言模型中存储上文和下文之间的关联关系，这里的上文和下文可复杂可简单，例如，可以是单个字母，单个音节，单个汉字，还可以是字母组合、音节组合和汉字组合，还可以是字母、音节和汉字中任意多种的组合。

自然语言处理领域内字符解析是公知的技术，例如字符解析可以将混合字符串切分为汉字、字母或音节的细粒度，而汉字解析、字母解析、音节解析又分别将汉字、字母、音节等解析到一定细粒度。

例如，音节解析一般有两种方式：正向最大匹配和逆向最大匹配，两者的主要区别在于解析音节是从前往后找，还是从后往前找，找出最长的、合理的作为一个音节。参照表4，示出了本申请一种音节解析的例子。

表4

这样，如果上文有不同的解析结果，则在获取每个单个响应键位作为下文在所述上文条件下的概率的过程中很有可能用到不同的语言模型，例如，在“单pian”的解析结果为“单pian”时要用到字母汉字语言模型，在“单pian”的解析结果为“单+pian”时要用到字母音节语言模型，在“单pian”的解析结果为“单+pi+an”时要用到字母语言模型，等等。

于是，在本申请的一种优选实施例中，在所述语言模型的类型具体可以包括拼音语言模型，和/或字母语言模型，和/或拼音汉字语言模型，和/或字母汉字语言模型，和/或拼音字母汉字语言模型的情况下，可以按照每种解析结果，分别去查找相应类型的语言模型，得到不同的每个单个响应键位作为下文在所述上文条件下的概率结果。

此时，所述在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率的步骤，可以进一步包括：

子步骤B1、对所述上文进行解析，得到对应于语言模型类型的一种或多种解析结果；

子步骤B2、针对所述上文的每一种解析结果，在对应类型的语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率；

子步骤B3、如果对应类型的语言模型超过一个，对依据每种类型的语言模型得到的每个单个响应键位作为下文在所述上文条件下的概率进行归一化处理，归一化处理结果为候选的单个响应键位在上文条件下的概率。

在用到多个类型的语言模型时，如果候选i依据类型j的语言模型得到的候选的单个响应键位在上文条件下的概率为prob_ij，weight_j是第j个语言模型的权重，weight_j可由人工给出经验值，或者是机器学习得到，在某种情况下的候选得分缺失时，对应的权重为0；则可依据如下公式进行加权求和，得到候选i的单个响应键位在上文条件下的概率LMScore_i：

需要说明的是，即使同一种解析结果，在为其找到匹配项的过程中也有可能用到多种类型的语言模型，此时，可以对多种类型的语言模型的匹配结果进行相乘、加权求和或者其他归一化处理方法，得到最终的每个单个响应键位作为下文在所述上文条件下的概率结果。总之，只要能为候选找到相应的匹配项，本申请对多种类型的语言模型的使用不加以限制。

另外，在上文空缺时，可以认为是一种特殊的上文，假设记为“空”。只要在模型分析时统计了概率为空的情况，在实际应用中，就可以在上文空缺时使用该模型。例如，在lastinput为“空”的情况下，用户同时按下了“v”和“b”，通过查表发现P(v|空)远小于P(b|空)，同样可以识别出，用户是想输入“b”。而从常识的角度，以b开头的拼音有很多，如bu、ba......，而以v开头的拼音几乎没有，而只出现在句中，如nv、lve......等。总之，在具体实现中，可以不用区分上文的具体情况，只需要从存储结构中取上文即可完成后续的匹配。

再者，在无法依据语言模型找到匹配项时，可以试图将候选中的上文去掉，直接匹配无上下文的一元语言模型。

步骤103、将该多键输入字符的所有响应键位中单个响应键位与所述上文关联程度最高的一个或一个以上响应键位，作为该多键输入字符的识别结果。

本申请从多键输入字符的所有响应键位中，识别出单个响应键位与所述上文关联程度最高的一个或一个以上响应键位，由于所述识别基于下文与所述上文的关联程度，而下文与所述上文的关联程度为依据语言模型得到，其能反映自然语言处理领域内的上下文相关规律，故本申请能够识别出最优、最合理的响应键位，以自动纠正用户输入过程中的误操作，提高用户的输入效率。

需要说明的是，可以依据该多键输入字符及该多键输入字符的上文，生成相应的多个候选，该多键输入字符的每个候选具体可以包括上文和单个响应键位；候选的数目等于该多键输入字符中响应键位的数目，也即，单个响应键位对应唯一的候选。本申请的候选具体包括上文和单个响应键位，例如，多键输入字符包括o和p两个响应键位，该多键输入字符为ta，则生成的候选包括ta-o和ta-p。那么，在具体实现中，可以对每个候选进行打分，得分最高的为最优、最合理的候选。

参照图2，示出了本申请一种对多键输入字符进行识别的方法实施例2的流程图，具体可以包括：

步骤201、获取多键输入字符及该多键输入字符的上文，该多键输入字符具体可以包括两个或多个响应键位；

步骤202、在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率，所述语言模型存储有上文、下文及下文在上文条件下的概率；

步骤203、在纠错概率模型中匹配得到每个单个响应键位在该多键输入字符条件下的概率，所述纠错概率模型存储有多键输入字符、单个响应键位及单个响应键位在多键输入字符条件下的概率；

步骤204、根据每个单个响应键位在所述上文条件下的概率和每个单个响应键位在该多键输入字符条件下的概率，得到与该多键输入字符相应的多个上文与每个单个响应键位的组合的得分；

步骤205、将多个上文与每个单个响应键位的组合中得分最多的一个或多个对应的响应键位，作为该多键输入字符的识别结果。

本实施例依据每个候选的评定得分对多键输入字符进行识别，每个候选的评定得分除了考虑下文在上文条件下的概率外，还可以考虑纠错概率，以提高识别的准确度和合理性。

纠错概率模型主要用于描述单个响应键位在多键输入字符条件下的概率，例如，同时按下o和p时，选择o的概率有多大，选择p的概率有多大。参照表5，示出了本申请一种纠错概率模型的示意。

表5

如果纠错概率模型也引入上下文关系，那么评判的结果将更为精准。比如在上文ta之后同时按下o和p，选择o或者选择p的概率，就是基于上下文的。此时，所述纠错概率模型存储有上文、作为下文的多键输入字符、单个响应键位及单个响应键位在多键输入字符条件下的概率。参照表6，示出了本申请一种引入上下文关系的纠错概率模型的示意。

表6

在本申请的一种优选实施例中，所述根据每个单个响应键位在所述上文条件下的概率和每个单个响应键位在该多键输入字符条件下的概率，得到与该多键输入字符相应的多个上文与每个单个响应键位的组合的得分的步骤，可以为对每个单个响应键位在所述上文条件下的概率和每个单个响应键位在该多键输入字符条件下的概率进行归一化处理，本申请对具体的获取得分的方式不加以限制。

在本申请的一种优选实施例中，所述纠错概率模型可以为依据全网和/或当前用户的输入法历史数据和/或针对多键输入字符的用户反馈数据进行分析统计得到。

其中，所述用户反馈数据可以为依据用户在展现该多键输入字符的识别结果后的操作，记录的针对多键输入字符的用户反馈数据，在本申请的另一种优选实施例中，所述方法还可以包括：依据用户在展现该多键输入字符的识别结果后的操作，记录针对多键输入字符的用户反馈数据的步骤。

在实际中，可以不断收集当前用户针对多键输入字符的用户反馈数据，并不断地更新、记忆相应的统计结果，从而能够适应当前用户的输入习惯，实现多键输入字符的个性化识别。比如，某用户A经常将v键和b键连按，但大多数情况下他选择的是b键；某用户B经常在输入w之后将a和q连按，一开始系统给出的是q键，但经多次用户反馈发现他都选择的是a键。到后来也倾向给出a键的提示了。参见表6示例，这三种情况下的概率加和为1。

参照图3，示出了本申请一种对多键输入字符进行识别的方法实施例3的流程图，具体可以包括：

步骤301、获取多键输入字符及该多键输入字符的上文，该多键输入字符具体可以包括两个或多个响应键位；

步骤302、在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率，所述语言模型存储有上文、下文及下文在上文条件下的概率；

步骤303、依据全网和/或当前用户的输入法历史数据对上文与每个单个响应键位的组合和所述上文的分布进行统计，得到每个上文与每个单个响应键位的组合的输入频率；

步骤304、根据每个单个响应键位在所述上文条件下的概率和上文与每个单个响应键位的组合的输入频率，得到与该多键输入字符相应的多个上文与每个单个响应键位的组合的得分；

步骤305、将多个上文与每个单个响应键位的组合中得分最多的一个或多个对应的响应键位，作为该多键输入字符的识别结果。

本实施例依据每个候选的评定得分对多键输入字符进行识别，每个候选的评定得分除了考虑下文在上文条件下的概率外，还可以考虑上文与每个单个响应键位的组合的输入频率，以提高识别的准确度和合理性。

上文与每个单个响应键位的组合的输入频率指每个上文与每个单个响应键位的组合对应的字符串的输入频率，可依据全网和/或当前用户的输入法历史数据对上文与每个单个响应键位的组合和所述上文的分布进行统计得到。最直观的是，候选出现次数相对于候选的上文出现次数的比值在纠错概率模型中匹配得到每个候选的单个响应键位在该多键输入字符条件下的概率。例如，上文是ta，用户输入时有o和p两个响应键位，那么候选对应的字符串tao和tap的输入频率可以表示为：count(tao)/count(ta)、count(tap)/count(ta)，其中，count(x)表示对x的出现次数进行求和。

在本申请的一种优选实施例中，所述根据每个单个响应键位在所述上文条件下的概率和上文与每个单个响应键位的组合的输入频率，得到与该多键输入字符相应的多个上文与每个单个响应键位的组合的得分的步骤，可以为对每个单个响应键位在所述上文条件下的概率和上文与每个单个响应键位的组合的输入频率进行归一化处理，本申请对具体的获取得分的方式不加以限制。

在本申请的一种优选实施例中，还可以对每个单个响应键位在所述上文条件下的概率、每个单个响应键位在该多键输入字符条件下的概率和上文与每个单个响应键位的组合的输入频率进行归一化处理，得到与该多键输入字符相应的多个上文与每个单个响应键位的组合的得分；

假设用LMScore表示每个单个响应键位在所述上文条件下的概率，用CMScore表示每个单个响应键位在该多键输入字符条件下的概率，用InputFreq表示上文与每个单个响应键位的组合的输入频率，本申请可以给出如下整合候选得分的方案：

方案一、对不同情况下的候选得分进行相乘，相应的公式如下：

score＝InputFreq*LMScore*CMScore (2)

方案二、对不同情况下的候选得分进行加权求和，相应的公式如下：

score＝InputFreq*α+LMScore*β+CMScore*(1-α-β)(3)

其中，α为InputFreq的权重，β为LMScore的权重，(1-α-β)为CMScore的权重，α、β可由人工给出经验值，或者是机器学习得到，在某种情况下的候选得分缺失时，对应的权重为0。

在本申请的一种优选实施例中，还可以对该多键输入字符的识别结果进行展现，并依据用户在展现该多键输入字符的识别结果后的操作，记录针对多键输入字符的用户反馈数据。

其中，展现时可以给出最优识别结果，也可以同时给出次优识别结果，方便用户选择，能起到避免用户退格删除等编辑烦恼的作用。

总之，本申请从多键输入字符的所有响应键位中，识别出一个或多个在上文条件下的概率最大的响应键位，由于所述识别基于下文在上文条件下的概率，而这一概率是依据上下文的语言相关规律得到的经验值、和/或全网用户的输入法历史数据、和/或当前用户的输入法历史数据进行分析统计得到，其能反映自然语言处理领域内上下文的语言相关规律、和/或全网用户的输入习惯、和/或当前用户的个性化输入习惯，故所述能够识别出最优、最合理的响应键位进行后续处理，以自动纠正用户输入过程中的误操作，提高用户的输入效率。

为使本领域技术人员更好地理解本申请，下面给出几种在不同的键盘样式上识别多键输入字符及展现相应识别结果的示例。

示例1、

用户使用26键键盘，欲输入萨琪玛，在输入完saqi之后，不小心连着按下了m和n；根据语言模型的匹配结果，在给定上文saqi的情况下，通过查询语言模型发现后面出m的概率要比n要高(prob(m|saqi)＞prob(n|saqi))，于是自动识别输入串为saqim；其中，prob(A|B)表示在B条件下A的发生概率。

参照图4，示出了本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例1，除展现含有识别结果的字符串saqim外，还展现了字符串saqim的相应文字候选。

上面考虑了语言模型的匹配结果，如果还要结合考虑纠错模型的匹配结果，可以查看在用户的输入历史数据中，在用户连按m和n的情况下，倾向于选择m还是n；如果同时结合上下文，就是看在saqi，或者aqi，或者qi，或者i之后，连按m和n时选择m的几率大还是选择n的几率大。

相对于图4只展现最优的识别结果，参照图5，在本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例2中，在用户输入saqi之后同时按下m、n、j的情况下，同时展现最优、次优和近次优的识别结果及相应的候选文字，但把得分较高的排在前面。

示例2、

用户使用26键键盘，欲输入三角洲，在输入sanjiao后选择或上屏san的文字为“三”，并同时按下了z、s和x键；此种情况下获取的上文包括已选择文字三”和当前输入内容“jiao”。

如果不考虑已选择文字和已上屏文字，而是仅考虑当前输入内容作为上文，那么，可以根据表7所示的语言模型数据，查表得到prob(s|jiao)＝0.0258＞prob(x|jiao)＝0.0147＞prob(z|jiao)＝0.0121，因此，可以将s作为最优识别结果进行展现；参照图6，示出了本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例3，其在仅考虑当前输入内容作为上文的情况下展现最优识别结果及相应候选。

表7

如果考虑已选择文字和已上屏文字作为上文，那么，可以根据表8所示语言模型的三元概率，查表得到prob(x|三jiao)＝0.1553＞prob(z|三jiao)＝0.0942＞prob(s|三jiao)＝0.0031，因此，可以将x作为最优识别结果进行展现；参照图7，示出了本申请一种在26键盘上识别多键输入字符及展现相应识别结果的示例4，其在考虑已上屏文字和当前输入内容作为上文的情况下展现最优识别结果及相应候选。在实际应用中，语言模型的阶数越大，识别结果会越合理，但同时计算、存储的开销也就越大，因此，本领域技术人员可以根据实际需要有所取舍。

表8

语言模型	概率	示例
			prob(s\|三jiao)	0.0031	三角烧、三角市......
prob(x\|三jiao)	0.1553	三角星......
			prob(z\|三jiao)	0.0942	三角洲......

更进一步的，在考虑语言模型的基础上，还可以加入纠错模型进行辅助识别。由于纠错模型记录的是用户在连按下s、x和z时，分别选择s、x和z的概率各是多少，能够体现当前用户的个性化选择倾向，参见表6。此时，如果综合表6和表8，则可以计算三jiaos的得分为0.0031*0.13＝0.000403；三jiaox的得分为0.1553*0.24＝0.037272；三jiaoz的得分为0.0942*0.63＝0.059346；结合高阶语言模型和用户的个性化数据，可知最终的候选不是二元语言模型给出的s，不是三元语言模型给出的x，而是四元语言模型给出的z。

示例3、

参照图8，示出了本申请一种在9键盘上识别多键输入字符及展现相应识别结果的示例，在输入jiuw后，连续按下4键和7键，本申请对相应的多键输入字符进行识别，并给出识别结果：q是最高概率的识别结果，并自动展现相应的字符串和候选文字；同时，将s、p、h和r作为次优的识别结果，列在9键键盘的左侧作为备选。

总之，本申请能够对多键输入字符进行识别，自动给出可能性较大的识别结果，具有如下优点：

1、避免了用户需要重新编辑的苦恼；

如果没有本申请的自动识别，以示例1为例，同时按下m、n后，输入串变为saqimn或者saqinm。如果用户要输入saqim，那么用户要从saqimn退格删除一个字符的，本申请则避免了用户需要重新编辑的苦恼。

2、适应用户输入习惯，提升输入效率。

这里的用户输入习惯，可基于全网用户的历史输入数据进行分析统计，也可以根据当前用户的历史输入数据进行分析统计，总之，本申请能够自动纠正用户输入过程中的误操作，提高用户的输入效率，提升输入体验。

与前述方法实施例相应，本申请还公开了一种对多键输入字符进行识别的装置，参照图9所示的结构图，具体可以包括：

字符上文获取单元901，用于获取多键输入字符及该多键输入字符的上文，该多键输入字符包括两个或多个响应键位；

关联程度获取单元902，用于根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度；及

识别结果获取单元903，用于将该多键输入字符的所有响应键位中单个响应键位与所述上文关联程度最高的一个或一个以上响应键位，作为该多键输入字符的识别结果。

在本申请的一种优选实施例中，所述关联程度获取单元902可以进一步包括：

在本申请的另一种优选实施例中，所述匹配子单元可以进一步包括：

在本申请的再一种优选实施例中，所述语言模型的类型具体可以包括拼音语言模型，和/或字母语言模型，和/或拼音汉字语言模型，和/或字母汉字语言模型，和/或拼音字母汉字语言模型。

在本申请的一种优选实施例中，所述匹配子单元可以进一步包括：：

在本申请的一种优选实施例中，所述装置还可以包括：

在本申请的另一种优选实施例中，所述字符上文获取单元901具体可以包括：

在本申请的再一种优选实施例中，所述字符上文获取单元901具体可以包括：

在本申请的一种优选实施例中，所述装置还可以包括：

展现单元，用于对该多键输入字符的识别结果进行展现；

在本申请的另一种优选实施例中，所述语言模型可以为依据全网和/或当前用户的输入法历史数据进行分析统计得到。

在本申请的再一种优选实施例中，所述纠错概率模型可以为依据全网和/或当前用户的输入法历史数据和/或针对多键输入字符的用户反馈数据进行分析统计得到。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

以上对本申请所提供的一种对多键输入字符进行识别的方法和装置，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种对多键输入字符进行识别的方法，其特征在于，包括：

获取多键输入字符及该多键输入字符的上文，该多键输入字符包括多个响应键位；

根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度，包括：在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率，具体包括：

如果对应类型的语言模型超过一个，对依据每种类型的语言模型得到的每个单个响应键位作为下文在所述上文条件下的概率进行归一化处理，归一化处理结果为候选的单个响应键位在上文条件下的概率；

将该多键输入字符的所有响应键位中单个响应键位与所述上文关联程度最高的一个以上响应键位，作为该多键输入字符的识别结果。

2.如权利要求1所述的方法，其特征在于，所述语言模型存储有上文、下文及下文在上文条件下的概率。

3.如权利要求2所述的方法，其特征在于，所述在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率的步骤，包括：

4.如权利要求1至3中任一项所述的方法，其特征在于，所述语言模型的类型包括拼音语言模型，和/或字母语言模型，和/或拼音汉字语言模型，和/或字母汉字语言模型，和/或拼音字母汉字语言模型。

5.如权利要求2所述的方法，其特征在于，还包括：

将多个上文与每个单个响应键位的组合中得分最多的多个对应的响应键位，作为该多键输入字符的识别结果。

6.如权利要求1至3中任一项所述的方法，其特征在于，所述获取多键输入字符的步骤，包括：

接收并检测用户的按键操作，如果第一预置时间间隔内接收到多个键位的按键操作，则以该第一预置时间间隔内的输入作为多键输入字符。

7.如权利要求1至3中任一项所述的方法，其特征在于，所述获取该多键输入字符的上文的步骤，包括：

8.如权利要求1至3中任一项所述的方法，其特征在于，还包括：

对该多键输入字符的识别结果进行展现；

9.如权利要求1至3中任一项所述的方法，其特征在于，所述语言模型为依据全网和/或当前用户的输入法历史数据进行分析统计得到。

10.如权利要求5所述的方法，其特征在于，所述纠错概率模型为依据全网和/或当前用户的输入法历史数据和/或针对多键输入字符的用户反馈数据进行分析统计得到。

11.一种对多键输入字符进行识别的装置，其特征在于，包括：

字符上文获取单元，用于获取多键输入字符及该多键输入字符的上文，该多键输入字符包括多个响应键位；

关联程度获取单元，用于根据语言模型获得每个单个响应键位作为下文与所述上文的关联程度，包括：匹配子单元，用于在语言模型中匹配得到每个单个响应键位作为下文在所述上文条件下的概率，具体包括：

归一化处理模块，用于如果对应类型的语言模型超过一个，对依据每种类型的语言模型得到的每个单个响应键位作为下文在所述上文条件下的概率进行归一化处理，归一化处理结果为候选的单个响应键位在上文条件下的概率；

识别结果获取单元，用于将该多键输入字符的所有响应键位中单个响应键位与所述上文关联程度最高的一个以上响应键位，作为该多键输入字符的识别结果。

12.如权利要求11所述的装置，其特征在于，所述语言模型存储有上文、下文及下文在上文条件下的概率。

13.如权利要求12所述的装置，其特征在于，所述匹配子单元包括：

14.如权利要求11至13中任一项所述的装置，其特征在于，所述语言模型的类型包括拼音语言模型，和/或字母语言模型，和/或拼音汉字语言模型，和/或字母汉字语言模型，和/或拼音字母汉字语言模型。

15.如权利要求12所述的装置，其特征在于，还包括：

组合识别单元，用于将多个上文与每个单个响应键位的组合中得分最多的多个对应的响应键位，作为该多键输入字符的识别结果。

16.如权利要求11至13中任一项所述的装置，其特征在于，所述字符上文获取单元包括：

接收检测子单元，用于接收并检测用户的按键操作，如果第一预置时间间隔内接收到多个键位的按键操作，则以该第一预置时间间隔内的输入作为多键输入字符。

17.如权利要求11至13中任一项所述的装置，其特征在于，所述字符上文获取单元包括：

18.如权利要求11至13中任一项所述的装置，其特征在于，还包括：

展现单元，用于对该多键输入字符的识别结果进行展现；

19.如权利要求11至13中任一项所述的装置，其特征在于，所述语言模型为依据全网和/或当前用户的输入法历史数据进行分析统计得到。

20.如权利要求15所述的装置，其特征在于，所述纠错概率模型为依据全网和/或当前用户的输入法历史数据和/或针对多键输入字符的用户反馈数据进行分析统计得到。