CN109388252B

CN109388252B - 一种输入方法及装置

Info

Publication number: CN109388252B
Application number: CN201710693056.3A
Authority: CN
Inventors: 陈小帅; 张扬
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2017-08-14
Filing date: 2017-08-14
Publication date: 2022-10-04
Anticipated expiration: 2037-08-14
Also published as: CN109388252A

Abstract

本发明实施例提供一种输入方法和装置，所述方法包括：接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；判断所述上文内容和/或下文内容是否存在错误信息；若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容；基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。本发明实施例可以有效提高候选项排序的准确性，提高用户输入效率。

Description

一种输入方法及装置

技术领域

本发明实施例涉及计算机技术领域，具体涉及一种输入方法及装置。

背景技术

现有的输入法技术中，输入法应用可以基于用户的输入展示相关的候选项。用户选择所需候选项后，输入法应用可以上屏选中的候选项。为了方便用户更加快捷地找到想要输入的候选项，现有的输入法应用可以对各候选项进行排序，以期将用户较大概率选择的候选项排在前列。例如，可以通过对用户输入的上文内容进行分析，基于上述分析对各候选项进行排序，使更加符合当前上下文的候选项排在更靠前的位置，便于用户发现与选择输入，减少用户寻找候选项的浏览和翻页操作。然而，当用户输入的上下文存在错误时，若基于错误的上下文信息对候选项的排序进行调整，则会导致错误的调整结果，导致用户期望的候选项不能被调整到易于选择使用的位置，不方便用户进行输入，降低了用户的输入效率。

发明内容

本发明实施例提供了一种输入方法及装置，旨在解决现有技术中当用户输入错误的上下文时，基于错误的上下文对候选项排序导致的候选项排序不准确、用户输入效率低的缺陷。

为此，本发明实施例提供如下技术方案：

第一方面，本发明实施例提供了一种输入方法，包括：接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；判断所述上文内容和/或下文内容是否存在错误信息；若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/ 或下文内容；基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。

第二方面，本发明实施例提供了一种输入装置，包括：确定单元，用于接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；第一判断单元，用于判断所述上文内容和/或下文内容是否存在错误信息；更正单元，用于若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/ 或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容；排序单元，用于基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。

第三方面，本发明实施例提供了一种用于输入的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；判断所述上文内容和/或下文内容是否存在错误信息；若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容；基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。

第四方面，本发明实施例提供了一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如第一方面所示的输入方法。

本发明实施例提供的输入方法及装置，可以在识别用户上屏输入的上下文内容存在错误信息时，对所述上文内容和/或下文内容进行更正处理，并基于更正处理后的上文内容和/或下文内容对与用户输入对应的候选项进行排序，由此提高了候选项排序的准确性，提高了用户的输入效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的输入方法流程图；

图2为本发明另一实施例提供的输入方法流程图；

图3为本发明一实施例提供的输入装置示意图；

图4是根据一示例性实施例示出的一种用于输入装置的框图；

图5是根据一示例性实施例示出的服务器的框图。

具体实施方式

本发明实施例提供了一种输入方法及装置，可以有效提高候选项排序的准确性，提高用户输入效率。

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，在本发明实施例以中文为例进行说明。其中，技术术语“用户输入”既可以包括用户输入的编码字符串，也可以包括语音输入。

其中，技术术语“编码字符串编辑区”，一般是指用于展示用户输入的编码字符串的区域。

其中，技术术语“语音编辑区”一般是指用于提供语音输入编辑的区域。

其中，技术术语“字符上屏区”一般是指上屏输出用户选中的候选项的区域，例如输入框。

技术术语“候选项区”一般是指用于展示候选项的区域，所述候选项可以包括候选输入词以及候选输入字。

下面将结合附图1至附图2对本发明示例性实施例示出的输入方法进行介绍。

参见图1，为本发明一实施例提供的输入方法流程图。如图1所示，可以包括：

S101，接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容。

具体实现时，所述用户输入可以是编码字符串和/或语音输入。所述编码字符串例如可以是拼音字符串，所述拼音字符串可以是全拼字符串，也可以是简拼字符串。举例说明，接收用户输入的编码字符串“yy”，并可以在编码字符串编辑区展示用户输入的编码字符串。其中，用户输入编码字符串的方式可以是键盘输入、手写输入或者其他输入方式，在此不限定。又举例说明，用户还可以输入语音，输入装置用于接收用户的语音输入。

在一些实施方式中，确定与所述用户输入对应的上文内容和/或下文内容可以包括：获取字符上屏区中光标焦点所在的位置；获取所述光标焦点之前的输入内容作为与所述用户输入对应的上文内容，和/或，获取所述光标焦点之后的输入内容作为与所述用户输入对应的上文内容。所述上文内容和/或下文内容可以包括光标焦点之前的一个或多个词语。

在一些实施方式中，可以获取所述光标焦点所在的位置与第一语句分隔符之间的输入内容作为与所述用户输入对应的上文内容，和/或，获取所述光标焦点所在的位置与第二语句分隔符之间的输入内容作为与所述用户输入对应的下文内容，所述第一语句分隔符和第二语句分隔符分别位于所述光标焦点所在位置两侧。一般地，在获取上下文内容时，只需要获取当前光标焦点所在位置所对应的一个语句的部分或者全部即可。所述第一语句分隔符在字符上屏区的出现位置早于所述第二语句分隔符的出现位置。所述第一语句分隔符和第二语句分隔符例如可以是句号、逗号、分号、问号、感叹号、空格、换行符等符号。

在一些实施方式中，所述确定与所述用户输入对应的上文内容和/或下文内容包括：根据字符上屏区的历史输入记录确定与所述用户输入对应的上文内容和/或下文内容。举例说明，输入法应用可以保存用户的历史输入记录，并根据用户历史输入记录确定与所述用户输入对应的上文内容和/或下文内容。同样地，也可以语句分隔符为界，获取对应的上下文内容。

S102，判断所述上文内容和/或下文内容是否存在错误信息。

需要说明的是，对上文内容以及对下文内容是否存在错误信息以及如何更正处理的方法是相同或者类似的，因此，在本发明实施例中，以对上文内容进行处理为例进行说明，对下文内容的处理可以参照对上文内容进行处理的内容进行。

具体实现时，判断所述上文内容和/或下文内容是否存在错误信息包括：

S102A，对所述上文内容和/或下文内容进行分词处理，获得多个词语片段。

假设上文内容为ABC，进行分词处理得到的结果为词语片段(A，B，C)。

S102B，根据所述多个词语片段确定所述上文内容和/或下文内容的语言模型得分。

下面以确定上文内容的语言模型得分为例进行说明。具体实现时，可以对所述上文内容进行分词处理，获得多个词语片段，利用所述词语片段计算所述上文内容的语言模型得分。

其中，所述语言模型可以是统计语言模型、神经网络语言模型等。所述统计语言模型具体可以N-Gram语言模型，例如2-Gram、3-Gram等。所述神经网络语言模型例如可以是word2vec词向量语言模型、循环神经网络(英文全称为Recurrent neural Network，英文简称为RNN)语言模型训练方法，长短期记忆网络(英文全称为Long Short-Term Memory，英文简称为LSTM)语言模型训练方法等。所述语言模型得分用于衡量所述上文内容和/或下文内容的出现概率大小，出现概率越大说明所述上文内容和/或下文内容越平滑流利。

在一个具体实施例中，可以利用3-Gram语言模型计算上文内容的语言模型得分。一般地，N-Gram语言模型认为当前词的出现概率仅仅与前N-1个词相关。

(1)假设上文内容为ABC，在S102A中对ABC进行分词处理得到的结果为词语片段(A，B，C)。

(2)分别计算词语A、词语B、词语C在语料中出现的概率。其中：

P(A)＝A在语料中出现的次数/语料中总词数

(3)计算词组合AB语料中出现的概率。

P(B|A)＝AB在语料中出现的次数/语料中A出现的总次数

(4)计算词C在词组合AB后出现的条件概率。

P(C|AB)＝ABC在语料中出现的次数/语料中AB出现的次数

(5)计算句子ABC的出现概率。

P(ABC)＝P(A)P(B|A)P(C|AB)

将P(ABC)作为该上文内容的语言模型得分。

在另一些实施方式中，还可以利用深度神经网络模型来计算上文内容的语言模型得分，所述深度神经网络模型例如可以word2vec词向量模型。

S102C，判断所述语言模型得分是否小于设定阈值。

其中，设定阈值可以根据经验或需要设定，不同语言模型对应的阈值可以不同。

S102D，若判断所述语言模型得分小于设定阈值，确定所述上文内容和/ 或下文内容存在错误信息。

S103，若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容。

具体实现时，所述对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容包括：

S103A，对所述上文内容和/或下文内容进行分词处理，获得多个词语片段。

S103B，确定与所述词语片段相似度大于设定阈值的词语作为候选更正词语，利用所述候选更正词语生成候选更正的上文内容和/或下文内容。

具体实现时，可以预先计算词库中各词语之间的相似度，所述相似度计算可以基于读音相似或者字形相似进行。举例说明，可以基于读音相似计算相似度，例如词语A与词语B的最小编辑距离来计算相似度，最小编辑距离一般用于衡量字符串之间的替换代价，替换代价越小，字符串的相似度越高。例如，可以通过以下公式计算相似度。

其中，h_i表示第i个词语对应的字符串，h_j表示第j个词语对应的字符串； |h_i|、|h_j|分别表示词语h_i对应的字符串的长度以及词语h_j对应的字符串的长度；sed(h_i，h_j)表示词语h_i对应的字符串与词语h_j对应的字符串间的编辑距离； Simh_i，j表示词语h_j与词语h_j间的相似度；其中，i和j的取值为正整数。

需要说明的是，词语对应的字符串可以是拼音字符串，也可以是字形字符串。下面以拼音字符串为例间说明。例如，假设词语A的拼音串为“tieba”，词语B的拼音串为“tieban”,从拼音串“tieba”替换为“tieban”只需要进行一次增加操作，那么其编辑距离为1，由此计算得到：

举例说明，假设确定的上文内容为“我想去吃贴吧”，在判断上文内容存在错误信息后，对所述上文内容进行分词处理得到(我，想，去吃，贴吧)。其中，可以根据拼音相似度判断确定与“贴吧”相似度高的词语可以是“铁板”、“铁耙”、“贴补”等。

又举例说明，假设确定的上文内容为“我具有证卷从业”，在判断上文内容存在错误信息后，对所述上文内容进行分词处理得到(我，具有，证卷，从业)。其中，可以根据字形相似度判断与“证卷”相似度高的词语可以是“证券”。

S103C，计算所述候选更正的上文内容和/或下文内容的语言模型得分，根据所述语言模型得分确定更正后的上文内容和/或下文内容；所述语言模型得分用于衡量所述候选更正的上文内容和/或下文内容的出现概率大小。

需要说明的是，在计算候选更正的上文内容和/或下文内容的语言模型得分时，也需要对候选更正的上文内容和/或下文内容进行分词处理，以得到多个词语片段，根据所述词语片段计算相应的语言模型得分。这是因为更正后的上文内容和/或下文内容可能会发生语句结构的改变。

具体地，可以判断所述候选更正的上文内容和/或下文内容的语言模型得分是否大于更正前的上文内容和/或下文内容的语言模型得分；若是，确定得分最高的一个或多个候选更正的上文内容和/或下文内容作为更正后的上文内容和/或下文内容。一般地，选取一个得分最高且大于更正前的上文内容和/ 或下文内容的语言模型得分的候选更正内容作为最终的更正内容即可。

在这一实现中，计算语言模型得分的方式可以与S102A相同，可以参照 S102A进行。

S104，基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。

具体地，可以确定各候选项基于所述更正处理后的上文内容和/或下文内容的排序得分，根据所述各候选项的排序得分对所述各候选项降序排序。

其中，候选项的排序得分可以通过以下方式获得：

候选项的排序得分＝X₁*(用户输入的编码字符串或者语音输入到候选项的映射概率)+X₂*候选项的词频+X₃*候选项基于更正的上文内容和/或下文内容的语言模型得分。其中，X₁、X₂、X₃分别为权重值,其取值为【0,1】，X₁+X₂+X₃＝1。具体取值可以根据需要设定。

以用户输入拼音字符串为例说明，用户输入的拼音字符串到候选项的映射概率，可以认为是用户输入的拼音与候选的读音之间的相似度。例如，用户输入“tieba”与候选项“铁板”的读音“tieban”之间有一定的映射概率，映射概率可以有多种计算方式，比如可以通过“1-用户输入拼音串与读音之间的编辑距离/max{用户输入拼音串的长度，候选读音对应的拼音串的长度}”计算。例如可以参照公式(1)计算相似度。举例说明，用户输入的拼音串为“soug”，候选读音对应的拼音串为“sougou”,这两个拼音串的编辑距离为2。用户输入的拼音串“soug”的长度为4，候选拼音串“sougou”的长度为6，二者之间最大值为6。则得到的映射概率为(1-2/6)＝67.7％。

其中，候选项的词频一般是指候选项的词语输入频率。输入法词库中会记录每个词条的词频，这个词频的初始值时通过在语料中统计而来，在用户使用输入法的过程中，可以根据用户的历史输入数据动态调整。

其中候选项基于更正的上文内容和/或下文内容的语言模型得分例如可以是由上文内容和/或下文内容与候选项构成的语句的出现概率值，所述语句的出现概率值的计算可以与上文内容的出现概率值的计算方法相同。需要说明的是，在计算候选项基于更正的上文内容和/或下文内容的语言模型得分时，理论上也需要进行分词处理，以得到多个词语片段，根据所述词语片段计算相应的语言模型得分。这是因为更正后的上文内容和/或下文内容可能会发生语句结构的改变。此外，除了N-gram之外，还可以基于word2vec词向量这种使用深度神经网络计算模型来计算候选项的语言模型得分。例如，输入法应用可以预先在大规模语料上训练word2vec词向量，为词库中每个词条计算出词向量。在进行候选项的语言模型得分计算时，可以将每个词语映射为实数向量，上文的向量＝上文中各词语的向量和，然后候选的得分＝上文向量*候选向量。

在计算各候选项的排序得分后，即可以基于排序得分对候选项降序排序，得分高的排在前列。

在本发明这一实施例中，可以识别并更正用户上屏输入的上文内容，并基于更正后的上文内容对候选项进行排序，使得排序结果更符合用户的真实输入意图，提高候选项排序的准确性，并提高了用户的输入效率。

为了便于本领域技术人员更清楚地理解本发明在具体场景下的实施方式，下面以一个具体示例对本发明实施方式进行介绍。需要说明的是，该具体示例仅为使得本领域技术人员更清楚地了解本发明，但本发明的实施方式不限于该具体示例。

参见图2，为本发明又一实施例提供的输入方法示意图。在这一实施例中，以用户输入编码字符串、确定上文内容为例进行说明。

S201，接收用户输入的编码字符串。

所述编码字符串具体可以是拼音串。举例说明，假设用户意图输入“我想去吃铁板鱿鱼”为例进行说明，假设用户当前输入的拼音串为“yy”，在输入该拼音串之前，上屏输入为“我想去吃贴吧”。若采用现有技术的排序方法，显示的候选项可能为“一样”、“医院”、“也有”、“语音”，但用户期望输入的“鱿鱼”却不能够出现在候选项前列。

S202，确定所述编码字符串对应的上文内容。

具体的确定方式可以参见图1所示实施例中S101的实现。例如，确定所述上文内容为“我想去吃贴吧”。

S203，对所述上文内容进行分词处理，确定所述上文内容的语言模型得分。

需要说明的是，在计算语言模型得分前，需要对所述上文内容进行分词处理，获得多个词语片段；根据所述多个词语片段确定所述上文内容的语言模型得分。

S204，判断所述语言模型得分是否小于设定阈值。

S205，若是，对所述上文内容进行分词处理，获得多个词语片段。

对所述上文内容“我想去吃贴吧”分词处理得到词语(我，想，去吃，贴吧)。

S206，确定与所述词语片段相似度大于设定阈值的词语作为候选更正词语，利用所述候选更正词语生成候选更正的上文内容。

举例说明，可以根据拼音相似度判断确定与“贴吧”相似度高的词语可以是“铁板”、“铁耙”“贴补”等。

S207，计算候选更正的上文内容的语言模型得分。

S208，将得分最高且得分大于更正前的上文内容语言模型得分的候选更正上文内容作为更正后的上文内容。

假设“我想去吃铁板”的语音模型得分最高，且其得分大于“我想去吃贴吧”的语言模型得分，则可以将“我想去吃铁板”作为更正后的上文内容。

S209，确定各候选项基于所述更正处理后的上文内容的排序得分，根据所述各候选项的排序得分对所述各候选项降序排序。

假设通过计算排序得分，将排序得分由高到低进行排序对应的排序后候选结果分别为：鱿鱼、犹豫、由于、有雨，这样就基于更正后的上文内容把用户真正意图输入的候选项排在了前列。

S210，在显示排序后的候选项时，显示更正处理后的上文内容。

在一些实施方式中，还可以提示用户上文存在的错误内容，例如显示“贴吧—铁板”，用于提示用户输入的错误，供用户更正。当然，若确定的上下文输入还包括下文内容时，则可以在显示排序后的候选项时，显示更正处理后的上文内容和/或下文内容。

S211，接收用户针对所述候选项的选择操作，上屏输入所述更正处理后的上文内容以替代更正前的上文内容，以及上屏输入所述选择操作对应的候选项。

在这一实现方式中，用户若选择了对应的候选项“鱿鱼”，则可以直接上屏候选项，并利用更正后的上文内容替代更正前的上文内容的部分或者全部。需要说明的是，在执行替代操作时，可以只替代错误的内容例如一个词语，也可以整体替换更正后的上文内容。当然，若确定的上下文输入还包括下文内容时，还可以接收用户针对所述候选项的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容，以及上屏输入所述选择操作对应的候选项。

当然，替代S211的实现方式，也可以设计成当用户选择了该更正处理后的上文内容和/或下文内容时，才上屏输入更正后的内容。也就是说，可以接收用户针对更正处理后的上文内容和/或下文内容的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容。

在本发明这一实施例中，可以识别并更正用户上屏输入的上文内容和/或下文内容，并基于更正后的上文内容和/或下文内容对候选项进行排序，使得排序结果更符合用户的真实输入意图，提高用户输入效率。此外，还可以提示用户上文输入存在的错误，并可以更正所述错误，提高了用户输入准确性。

参见图3，为本发明一实施例提供的输入装置示意图。

一种输入装置300，包括：

确定单元301，用于接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容。其中，所述确定单元301的具体实现可以参照图1所示实施例的步骤101而实现。

第一判断单元302，用于判断所述上文内容和/或下文内容是否存在错误信息。其中，所述第一判断单元302的具体实现可以参照图1所示实施例的步骤102而实现。

更正单元303，用于若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/ 或下文内容。其中，所述更正单元303的具体实现可以参照图1所示实施例的步骤103而实现。

排序单元304，用于基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。其中，所述排序单元304的具体实现可以参照图1所示实施例的步骤104而实现。

其中，所述确定单元301具体包括：

第一确定单元，用于获取字符上屏区中光标焦点所在的位置；获取所述光标焦点之前的输入内容作为与所述用户输入对应的上文内容，和/或，获取所述光标焦点之后的输入内容作为与所述用户输入对应的上文内容；

第二确定单元，用于根据字符上屏区的历史输入记录确定与所述用户输入对应的上文内容和/或下文内容。

其中，所述第一判断单元具体包括：

第一分词子单元，用于对所述上文内容和/或下文内容进行分词处理，获得多个词语片段；

第一得分计算子单元，用于根据所述多个词语片段确定所述上文内容和/ 或下文内容的语言模型得分；所述语言模型得分用于衡量所述上文内容和/或下文内容的出现概率大小；

第一判断子单元，用于判断所述语言模型得分是否小于设定阈值；

第三确定子单元，用于若判断所述语言模型得分小于设定阈值，确定所述上文内容和/或下文内容存在错误信息。

其中，所述更正单元具体包括：

第二分词子单元，用于对所述上文内容和/或下文内容进行分词处理，获得多个词语片段；

相似度判断单元，用于确定与所述词语片段相似度大于设定阈值的词语作为候选更正词语，利用所述候选更正词语生成候选更正的上文内容和/或下文内容；

第二得分计算子单元，用于计算所述候选更正的上文内容和/或下文内容的语言模型得分，根据所述语言模型得分确定更正后的上文内容和/或下文内容；所述语言模型得分用于衡量所述候选更正的上文内容和/或下文内容的出现概率大小。

其中，第二得分计算子单元具体用于：判断所述候选更正的上文内容和/ 或下文内容的语言模型得分是否大于更正前的上文内容和/或下文内容的语言模型得分；若是，确定得分最高的一个或多个候选更正的上文内容和/或下文内容作为更正后的上文内容和/或下文内容。

其中，所述排序单元，用于确定各候选项基于所述更正处理后的上文内容和/或下文内容的排序得分，根据所述各候选项的排序得分对所述各候选项降序排序。

其中，所述装置还包括：

显示单元，用于在显示排序后的候选项时，显示更正处理后的上文内容和 /或下文内容。

其中，所述装置还包括：

第一上屏输入单元，用于接收用户针对所述候选项的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容，以及上屏输入所述选择操作对应的候选项；

第二上屏输入单元，用于接收用户针对更正处理后的上文内容和/或下文内容的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容。

其中，本发明装置各单元或模块的设置可以参照图1至图2所示的方法而实现，在此不赘述。

参见图4，为根据一示例性实施例示出的一种用于输入装置的框图。参见图4，为根据一示例性实施例示出的一种用于输入装置的框图。例如，装置400 可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图4，装置400可以包括以下一个或多个组件：处理组件402，存储器404，电源组件406，多媒体组件408，音频组件410，输入/输出(I/O) 的接口412，传感器组件414，以及通信组件416。

处理组件402通常控制装置400的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件402可以包括一个或多个模块，便于处理组件402和其他组件之间的交互。例如，处理部件402可以包括多媒体模块，以方便多媒体组件408和处理组件 402之间的交互。

存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件406为装置400的各种组件提供电力。电源组件406可以包括电源管理系统，一个或多个电源，及其他与为装置400生成、管理和分配电力相关联的组件。

多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个麦克风(MIC)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。

I/O接口412为处理组件402和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器，用于为装置400提供各个方面的状态评估。例如，传感器组件414可以检测到设备400的打开/关闭状态，组件的相对定位，例如所述组件为装置400的显示器和小键盘，传感器组件414 还可以检测装置400或装置400一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件414经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件414还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置400可以被一个或多个应用专用集成电路 (ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

具体地，本发明实施例提供了一种输入装置400，包括有存储器404，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器404 中，且经配置以由一个或者一个以上处理器420执行所述一个或者一个以上程序包含用于进行以下操作的指令：接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；判断所述上文内容和/或下文内容是否存在错误信息；若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/ 或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容；基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。

进一步地，所述处理器420执行所述确定与所述用户输入对应的上文内容和/或下文内容的操作包括：获取字符上屏区中光标焦点所在的位置；获取所述光标焦点之前的输入内容作为与所述用户输入对应的上文内容，和/或，获取所述光标焦点之后的输入内容作为与所述用户输入对应的上文内容；或者，根据字符上屏区的历史输入记录确定与所述用户输入对应的上文内容和/或下文内容。

进一步地，所述处理器420执行所述判断所述上文内容和/或下文内容是否存在错误信息操作的指令具体包括：对所述上文内容和/或下文内容进行分词处理，获得多个词语片段；根据所述多个词语片段确定所述上文内容和/或下文内容的语言模型得分；所述语言模型得分用于衡量所述上文内容和/或下文内容的出现概率大小；判断所述语言模型得分是否小于设定阈值；若判断所述语言模型得分小于设定阈值，确定所述上文内容和/或下文内容存在错误信息。

进一步地，所述处理器420执行所述对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容操作的指令具体包括：对所述上文内容和/或下文内容进行分词处理，获得多个词语片段；确定与所述词语片段相似度大于设定阈值的词语作为候选更正词语，利用所述候选更正词语生成候选更正的上文内容和/或下文内容；计算所述候选更正的上文内容和/或下文内容的语言模型得分，根据所述语言模型得分确定更正后的上文内容和/或下文内容；所述语言模型得分用于衡量所述候选更正的上文内容和/ 或下文内容的出现概率大小。

进一步地，所述处理器420执行所述根据所述语言模型得分确定更正后的上文内容和/或下文内容操作的指令具体包括：判断所述候选更正的上文内容和/或下文内容的语言模型得分是否大于更正前的上文内容和/或下文内容的语言模型得分；若是，确定得分最高的一个或多个候选更正的上文内容和/或下文内容作为更正后的上文内容和/或下文内容。

进一步地，所述处理器420执行所述基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序操作的指令具体包括：确定各候选项基于所述更正处理后的上文内容和/或下文内容的排序得分，根据所述各候选项的排序得分对所述各候选项降序排序。

进一步地，所述处理器420具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令：在显示排序后的候选项时，显示更正处理后的上文内容和/或下文内容。

进一步地，所述处理器420具体还用于执行所述一个或者一个以上程序包含用于进行以下操作的指令：接收用户针对所述候选项的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容，以及上屏输入所述选择操作对应的候选项；或者，接收用户针对更正处理后的上文内容和/或下文内容的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404，上述指令可由装置400的处理器420执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种机器可读介质，例如该机器可读介质可以为非临时性计算机可读存储介质，当所述介质中的指令由装置(终端或者服务器)的处理器执行时，使得装置能够执行一种输入方法，所述方法包括：接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；判断所述上文内容和/或下文内容是否存在错误信息；若判断所述上文内容和/或下文内容存在错误信息，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容；基于更正处理后的上文内容和/或下文内容对与所述用户输入对应的候选项进行排序。

图5是本发明实施例中服务器的结构示意图。该服务器500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)522(例如，一个或一个以上处理器)和存储器532，一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中，存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器522可以设置为与存储介质530通信，在服务器500上执行存储介质 530中的一系列指令操作。

服务器500还可以包括一个或一个以上电源526，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口558，一个或一个以上键盘 556，和/或，一个或一个以上操作系统541，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。以上所述仅是本发明的具体实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种输入方法，其特征在于，包括：

接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；

确定所述上文内容和/或下文内容的语言模型得分；

若判断所述上文内容和/或下文内容的语言模型得分小于设定阈值，则确定所述上文内容和/或下文内容存在错误信息；所述语言模型得分用于表示所述上文内容和/或下文内容的平滑流利程度；

若确定所述上文内容和/或下文内容存在错误信息，通过候选更正词语，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容；

根据用户输入到各候选项的映射概率、各候选项的词频以及各候选项基于所述更正处理后的上文内容和/或下文内容的语言模型得分，确定各候选项的排序得分，根据所述各候选项的排序得分对所述各候选项降序排序；

在显示排序后的候选项时，显示更正处理后的上文内容和/或下文内容，并将更正处理前的上文内容和/或下文内容中的错误内容，以及更正处理后的上文内容和/或下文内容中的更正内容进行同时显示，以提示用户上文内容和/或下文内容中存在的错误内容。

2.根据权利要求1所述的方法，其特征在于，所述确定与所述用户输入对应的上文内容和/或下文内容包括：

获取字符上屏区中光标焦点所在的位置；获取所述光标焦点之前的输入内容作为与所述用户输入对应的上文内容，和/或，获取所述光标焦点之后的输入内容作为与所述用户输入对应的上文内容；或者，

根据字符上屏区的历史输入记录确定与所述用户输入对应的上文内容和/或下文内容。

3.根据权利要求1所述的方法，其特征在于，所述获取所述上文内容和/或下文内容的语言模型得分包括：

对所述上文内容和/或下文内容进行分词处理，获得多个词语片段；

根据所述多个词语片段确定所述上文内容和/或下文内容的语言模型得分；所述语言模型得分用于衡量所述上文内容和/或下文内容的出现概率大小。

4.根据权利要求1所述的方法，其特征在于，所述通过候选更正词语，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容包括：

确定与所述词语片段相似度大于设定阈值的词语作为候选更正词语，利用所述候选更正词语生成候选更正的上文内容和/或下文内容；

计算所述候选更正的上文内容和/或下文内容的语言模型得分，根据所述语言模型得分确定更正后的上文内容和/或下文内容；所述语言模型得分用于衡量所述候选更正的上文内容和/或下文内容的出现概率大小。

5.根据权利要求4所述的方法，所述根据所述语言模型得分确定更正后的上文内容和/或下文内容包括：

判断所述候选更正的上文内容和/或下文内容的语言模型得分是否大于更正前的上文内容和/或下文内容的语言模型得分；

若是，确定得分最高的一个或多个候选更正的上文内容和/或下文内容作为更正后的上文内容和/或下文内容。

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

接收用户针对所述候选项的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容，以及上屏输入所述选择操作对应的候选项；或者，

接收用户针对更正处理后的上文内容和/或下文内容的选择操作，上屏输入所述更正处理后的上文内容和/或下文内容以替代更正前的上文内容和/或下文内容。

7.一种输入装置，其特征在于，包括：

确定单元，用于接收用户输入，确定与所述用户输入对应的上文内容和/或下文内容；

第一判断单元，用于确定所述上文内容和/或下文内容的语言模型得分；若判断所述上文内容和/或下文内容的语言模型得分小于设定阈值，则确定所述上文内容和/或下文内容存在错误信息；所述语言模型得分用于表示所述上文内容和/或下文内容的平滑流利程度；

更正单元，用于若确定所述上文内容和/或下文内容存在错误信息，通过候选更正词语，对所述上文内容和/或下文内容进行更正处理，获取更正处理后的上文内容和/或下文内容；

排序单元，用于根据用户输入到各候选项的映射概率、各候选项的词频以及各候选项基于所述更正处理后的上文内容和/或下文内容的语言模型得分，确定各候选项的排序得分，根据所述各候选项的排序得分对所述各候选项降序排序；

显示单元，用于在显示排序后的候选项时，显示更正处理后的上文内容和/或下文内容，并将更正处理前的上文内容和/或下文内容中的错误内容，以及更正处理后的上文内容和/或下文内容中的更正内容进行同时显示，以提示用户上文内容和/或下文内容中存在的错误内容。

8.根据权利要求7所述的装置，其特征在于，所述确定单元具体包括：

9.根据权利要求7所述的装置，其特征在于，所述第一判断单元具体包括：

第一得分计算子单元，用于根据所述多个词语片段确定所述上文内容和/或下文内容的语言模型得分；所述语言模型得分用于衡量所述上文内容和/或下文内容的出现概率大小；

10.根据权利要求7所述的装置，其特征在于，所述更正单元具体包括：

11.根据权利要求10所述的装置，其特征在于，所述第二得分计算子单元具体用于：判断所述候选更正的上文内容和/或下文内容的语言模型得分是否大于更正前的上文内容和/或下文内容的语言模型得分；若是，确定得分最高的一个或多个候选更正的上文内容和/或下文内容作为更正后的上文内容和/或下文内容。

12.根据权利要求7所述的装置，其特征在于，所述装置还包括：

13.一种用于输入的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

确定所述上文内容和/或下文内容的语言模型得分；

若判断所述上文内容和/或下文内容的语言模型得分小于设定阈值，则确定所述上文内容和/或下文内容是否存在错误信息；所述语言模型得分用于表示所述上文内容和/或下文内容的平滑流利程度；

14.一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如权利要求1至6中一个或多个所述的输入方法。