CN103927299A

CN103927299A - 输入法中候选语句的提供方法、输入内容推荐方法和装置

Info

Publication number: CN103927299A
Application number: CN201410172415.7A
Authority: CN
Inventors: 陈龙
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2014-04-25
Filing date: 2014-04-25
Publication date: 2014-07-16

Abstract

本发明提出一种输入法中候选语句的提供方法和装置以及输入内容推荐方法和装置，其中，输入法中候选语句的提供方法，包括：接收输入信息，输入信息包括多个字符组；分别根据多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条；根据多个候选词条集合获取对应的搭配模型，其中，搭配模型包括第一词汇和第二词汇，第一词汇与第二词汇分别为来自多个候选词条集合中的两个不同的候选词条集合中的候选词条；以及根据搭配模型以及多个候选词条集合生成至少一个候选语句。本发明的输入法中候选语句的提供方法，使候选语句更符合用户的输入意图，并且更加准确。

Description

输入法中候选语句的提供方法、输入内容推荐方法和装置

技术领域

本发明涉及输入法技术领域，特别涉及一种输入法中候选语句的提供方法和装置以及输入内容推荐方法和装置。

背景技术

随着计算机以及智能移动终端的普及，在计算机或移动终端中输入文字已经成为人们日常生活中必不可少的内容。因此，需要一个方便、好用的输入法来满足人们的输入需要。随着自然语言处理技术的发展，输入法已不仅只是提供读音和文字的转换功能。目前，输入法中逐渐引入用户模型，具有学习功能，即可通过对用户的历史输入进行统计分析构建高效的输入法系统，从而为用户提供更符合用户输入意图的候选词条；或者通过对大量语料进行统计分析以获取每个词条的词频，并根据词频推荐候选词条。

但是，在很多语种中，对于同一个读音，可能存在多个不同文字与其对应，因此，对于多个词条对应的读音字符串，在推进候选词条时，如果根据词频或者用户输入记录分别进行推荐的话，这些词条可能在语义或者结构上无法搭配，无法满足用户真正的输入意图。因而，目前的方法，无法真正的提供符合用户输入意图的词条，不够智能、准确率有待提升。

发明内容

本发明旨在至少在一定程度上解决上述技术问题。

为此，本发明的第一个目的在于提出一种输入法中候选语句的提供方法，该方法使候选语句更符合用户的输入意图，并且更加准确。

本发明的第二个目的在于提出一种输入法中候选语句的提供装置。

本发明的第三个目的在于提出一种输入内容推荐方法。

本发明的第四个目的在于提出一种输入内容推荐装置。

为达上述目的，根据本发明第一方面实施例提出了一种输入法中候选语句的提供方法，包括：接收输入信息，所述输入信息包括多个字符组；分别根据所述多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条；根据所述多个候选词条集合获取对应的搭配模型，其中，所述搭配模型包括第一词汇和第二词汇，所述第一词汇与所述第二词汇分别为来自所述多个候选词条集合中的两个不同的候选词条集合中的候选词条；以及根据所述搭配模型以及所述多个候选词条集合生成至少一个候选语句。

本发明实施例的输入法中候选语句的提供方法，可根据输入的多个字符组对应的多个候选词条集合获取候选词条的搭配模型，从而根据搭配模型在每个候选词条集合中选出候选词条组成候选语句，由此得到的候选语句中，不但每个词与输入信息相符，并且候选语句中的候选词条之间相互匹配，从而使候选语句更符合用户的输入意图，并且更加准确，提升了用户的输入体验。

本发明第二方面实施例提供了一种输入法中候选语句的提供装置，包括：接收模块，用于接收输入信息，所述输入信息包括多个字符组；第一获取模块，用于分别根据所述多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条；第二获取模块，用于根据所述多个候选词条集合获取对应的搭配模型，其中，所述搭配模型包括第一词汇和第二词汇，所述第一词汇与所述第二词汇分别为来自所述多个候选词条集合中的两个不同的候选词条集合中的候选词条；以及生成模块，用于根据所述搭配模型以及所述多个候选词条集合生成至少一个候选语句。

本发明实施例的输入法中候选语句的提供装置，可根据输入的多个字符组对应的多个候选词条集合获取候选词条的搭配模型，从而根据搭配模型在每个候选词条集合中选出候选词条组成候选语句，由此得到的候选语句中，不但每个词与输入信息相符，并且候选语句中的候选词条之间相互匹配，从而使候选语句更符合用户的输入意图，并且更加准确，提升了用户的输入体验。

本发明第三方面实施例提供了一种输入内容推荐方法，包括：接收输入信息，并根据所述输入信息提供多个第一候选词条；接收对所述多个第一候选词条的上屏选择指令；获取所述上屏选择指令选择的第一候选词条对应的至少一个搭配模型；根据所述至少一个搭配模型和所述上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对所述至少一个第二候选词条进行推荐。

本发明实施例的输入内容推荐方法，可根据用户上屏指令对应的第一候选词条获取相应的搭配模型，并根据获取到的搭配模型进一步获取与第一候选词条具有搭配关系的至少一个第二候选词条推荐给用户，从而使推荐的候选词条与已输入的内容语义更加符合，给用户以准确预测其输入意图效果，为用户提供了更好的输入体验。

本发明第四方面实施例提供了一种输入内容推荐装置，包括：第一接收模块，用于接收输入信息；提供模块，用于根据所述输入信息提供多个第一候选词条；第二接收模块，用于接收对所述多个第一候选词条的上屏选择指令；获取模块，用于获取所述上屏选择指令选择的第一候选词条对应的至少一个搭配模型；推荐模块，用于根据所述至少一个搭配模型和所述上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对所述至少一个第二候选词条进行推荐。

本发明实施例的输入内容推荐装置，可根据用户上屏指令对应的第一候选词条获取相应的搭配模型，并根据获取到的搭配模型进一步获取与第一候选词条具有搭配关系的至少一个第二候选词条推荐给用户，从而使推荐的候选词条与已输入的内容语义更加符合，给用户以准确预测其输入意图效果，为用户提供了更好的输入体验。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明一个实施例的输入法中候选语句的提供方法的流程图；

图2为根据本发明一个实施例的建立搭配模型数据库的方法流程图；

图3为根据本发明另一个实施例的输入法中候选语句的提供方法的流程图；

图4为根据本发明一个实施例的输入法中候选语句的提供装置的结构示意图；

图5为根据本发明一个具体实施例的输入法中候选语句的提供装置的结构示意图；

图6为根据本发明另一个具体实施例的输入法中候选语句的提供装置的结构示意图；

图7为根据本发明一个实施例的输入内容推荐方法的流程图；

图8为根据本发明另一个实施例的输入内容推荐方法的流程图；

图9为根据本发明一个实施例的输入内容推荐装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“多个”指两个或两个以上；术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。

下面参考附图描述根据本发明实施例的输入法中候选语句的提供方法和装置以及输入内容推荐方法和装置。

为了解决相关技术中无法为用户提供符合其输入意图的词条的问题，本发明提出了一种输入法中候选语句的提供方法，包括：接收输入信息，输入信息包括多个字符组；分别根据多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条；根据多个候选词条集合获取对应的搭配模型，其中，搭配模型包括第一词汇和第二词汇，第一词汇与第二词汇分别为来自多个候选词条集合中的两个不同的候选词条集合中的候选词条；以及根据搭配模型以及多个候选词条集合生成至少一个候选语句。

图1为根据本发明一个实施例的输入法中候选语句的提供方法的流程图。如图1所示，根据本发明实施例的输入法中候选语句的提供方法，包括：

S101，接收输入信息，输入信息包括多个字符组。

在本发明的实施例中，输入信息为用户根据需要输入的内容通过输入法输入的字符串，字符组为字符串中与每个字词对应的子字符串。举例来说，对于汉语输入法来说，如果用户需要输入汉字“一只美丽的大花猫”，则用户输入的输入信息为“yizhimeilidedahuam”，其中，包括“yizhi”、“meilide”和“dahuamao”三个字符组。

S102，分别根据多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条。

在本发明的实施例中，可针对每个字符组分别获取该字符组对应的候选词条集合。举例来说，“yizhi”，对应的候选词条集合可包括“一直”、“一只”、“一支”、“抑制”等多个候选词条的集合，“dahuamao”对应的候选词条集合可包括“大花猫”、“大花帽”等多个候选词条集合。具体地，获取候选词条集合的方法可参照相关技术，本发明对获取候选词条集合的方法不做具体限定。

S103，根据多个候选词条集合获取对应的搭配模型，其中，搭配模型包括第一词汇和第二词汇，第一词汇与第二词汇分别为来自多个候选词条集合中的两个不同的候选词条集合中的候选词条。

在本发明一个的实施例中，具体地，可根据多个候选词条集合查询搭配模型数据库，并获取搭配模型数据库中满足以下条件的搭配模型：

搭配模型中的第一词汇属于多个候选词集合中的一个候选词集合，且搭配模型中的第二词汇属于多个候选词集合中的另一个候选词集合。

在本发明的实施例中，搭配模型由第一词汇和第二词汇搭配组成，具体地，如果搭配模型中的第一词汇和第二词汇分别为多个候选系统集合中两个不同的候选词条集合中的候选词条时，则可获取该搭配模型。举例来说，对于搭配模型数据库中的搭配模型“一只猫”，其中“一只”来“yizhi”对应的自候选词条“一只”，“猫”来自“dahuamao”对应的候选词条“大花猫”，则可从搭配模型数据库获取搭配模型“一只猫”。

S104，根据搭配模型以及多个候选词条集合生成至少一个候选语句。

在本发明的实施例中，可对多个候选词条集合中根据搭配模型从多个候选词条集合中筛选出具有搭配关系的候选词条，并根据具有搭配关系的候选词条生成候选语句。

具体地，在本发明的一个实施例中，可首先根据搭配模型中第一词汇和第二词汇对应的候选词条的排序权值进行优化，且多个候选词条集合中其他候选词条的排序权值不变，然后根据排序权值在每个候选词条集合中分别选出至少一个候选词条，并根据选出的候选词条生成至少一个候选语句。

举例来说，对于输入信息“yizhimeilidedahuam”，由于已经查询到“一只猫”这样的搭配模型，因此，候选词条“一只”在其所在的候选词条集合中的排序权值被提升，候选词条“大花猫”在其在的候选词条集合中的排序权值也被提升，从而可选出“一只”、“美丽的”、“大花猫”，并据此得到候选语句“一只大花猫”。

对于更复杂的输入信息，其对应的多个候选词条集合中可能存在很多候选词条，因此即使经过排序权值优化，每个候选词条集合中也可选出多于一个的候选词条，并据此可生成多个候选语句。可将这多个候选语句全部提供给用户，供用户选择。

在本发明的一个实施例中，图2为根据本发明一个实施例的建立搭配模型数据库的方法流程图。如图2所示，建立搭配模型数据库可包括：

S201，获取语料。

在本发明的实施例中，可对互联网中资源进行语料挖掘和收集，以获取大规模的语料，如微博、新闻、聊天记录、网页内容等信息。

S202，对语料进行整理以获取多个语句。

在本发明的一个实施例中，具体地，可对获取的语料进行清洗，去除其中含有不合理的乱码、数字等内容，并针对基于较大段落的语料进行分句处理，从而获取多个完整、信息量高的语句。

S203，分别对每个语句进行分词和词性标注，并根据每个语句的分词和词性标注的结果获取多个词性搭配模型。

在本发明的实施例中，具体地，可分别对每个语句进行词法和句法分析，从而对每个语句进行分词，并对对每个分析进行词性标注，并根据每个分词的词性以及分析间的距离(即两个分词之间间隔其他分词的个数)得到符合如下词性搭配的搭配模型：

1、动词+名词；

2、形容词+名词；

3、量词+名词。

举例来说，通过上述步骤，可得到“一只猫”、“一支笔”、“魅力城市”、“美丽姑娘”、“上刀山”、“骑自行车”、“开车”等搭配模型。

S204，根据多个词性搭配模型建立搭配模型数据库。

在本发明的实施例中，可根据上述通过对大量语料进行整理分析得到的大量搭配模型建立搭配模型数据库。

在本发明的实施例中，由于不同的用户所使用的搭配模型不同，例如，对于使用方言的用户来说，由于在方言中的一些特殊字词组合，特殊发音等，因此，这些用户在使用输入法时，更希望推荐符合其语言习惯的候选语句。为了能够满足用户的个性化需求，在建立搭配模型数据库时，可在用户授权的情况下，即通过用户输入的账号、密码等信息登陆用户的邮箱、社交网站、个人存储器等，可分别收集该用户的个人资源，如聊天记录、日志、文档等资源获取该用户的语料，并对该用户的语料执行S202-S203以获取适用于该用户的搭配模型，并据此建立该用户的个性化数据库。以此类推，可分别建立不同用户的个性化数据库。

其中，每个个性化数据库与相应用户的用户标识信息相对应。用户标识信息为用户ID、账户名称、身份信息等能够标识用户身份的信息，为用户查询其个性化数据库的凭证。从而可根据个性化数据库中的搭配模型为不同用户提供更符合其输入需求的候选语句。

图3为根据本发明另一个实施例的输入法中候选语句的提供方法的流程图。如图3所示，该方法包括：

S301，接收输入信息，输入信息包括多个字符组。

S302，分别根据多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条。

S303，获取用户标识信息。

在本发明的实施例中，用户可通过输入其标识信息以使其个性化数据库可被访问。

S304，根据用户标识信息和多个候选词集合查询搭配模型数据库中相应的个性化数据库。

具体地，可根据用户标识信息访问搭配模型数据库中与该标识信息对应的个性化数据库，进而可根据获取到的多个候选词集合查询该个性化数据库，并获取该个性化数据库中满足以下条件的搭配模型：

在本发明的实施例中，可通过查询该个性化数据库获取相应的搭配模型，搭配模型由第一词汇和第二词汇搭配组成，具体地，如果搭配模型中的第一词汇和第二词汇分别为多个候选系统集合中两个不同的候选词条集合中的候选词条时，则可获取该搭配模型。举例来说，对于个性化数据库中的搭配模型“一只猫”，其中“一只”来“yizhi”对应的自候选词条“一只”，“猫”来自“dahuamao”对应的候选词条“大花猫”，则可从个性化数据库获取搭配模型“一只猫”。

S305，根据搭配模型以及多个候选词条集合生成至少一个候选语句。

在本发明的实施例中，可根据搭配模型从多个候选词条集合中筛选出具有搭配关系的候选词条，并根据具有搭配关系的候选词条生成候选语句。

具体地，在本发明的一个实施例中，可首先对多个候选词条集合中搭配模型中第一词汇和第二词汇对应的候选词条的排序权值进行优化，且多个候选词条集合中其他候选词条的排序权值不变，然后根据排序权值在每个候选词条集合中分别选出至少一个候选词条，并根据选出的候选词条生成至少一个候选语句。

本发明实施例的输入法中候选语句的提供方法，可根据用户的标识信息查询相应的个性化数据库，以获取相应的搭配模型，并据此提供候选语句，使得提供的候选语句更能够符合用户的个人输入习惯，满足了用户的个性化需求，进一步提升用户的输入体验。

在本发明的一个实施例中，搭配模型数据库中既可包括适用于大多数用户的数据库，也可同时包括多个个性化数据库。如果用户在输入信息之前已经输入用户标识信息，则在输入过程中，如果根据个性化数据库得到的搭配模型与跟进适用于大多数用户的数据库得到的搭配模型冲突的话，可默认优先以根据个性化数据库得到的搭配模型为准。当然，用户也可自行设定冲突时以根据哪一个数据库得到的搭配模型为准。

为了实现上述实施例，本发明还提出一种输入法中候选语句的提供装置。

一种输入法中候选语句的提供装置，包括：接收模块，用于接收输入信息，输入信息包括多个字符组；第一获取模块，用于分别根据多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条；第二获取模块，用于根据多个候选词条集合获取对应的搭配模型，其中，搭配模型包括第一词汇和第二词汇，第一词汇与第二词汇分别为来自多个候选词条集合中的两个不同的候选词条集合中的候选词条；以及生成模块，用于根据搭配模型以及多个候选词条集合生成至少一个候选语句。

图4为根据本发明一个实施例的输入法中候选语句的提供装置的结构示意图。

如图4所示，根据本发明实施例的输入法中候选语句的提供装置，包括：接收模块110、第一获取模块120、第二获取模块130和生成模块140。

具体地，接收模块110用于接收输入信息，输入信息包括多个字符组。在本发明的实施例中，输入信息为用户根据需要输入的内容通过输入法输入的字符串，字符组为字符串中与每个字词对应的子字符串。举例来说，对于汉语输入法来说，如果用户需要输入汉字“一只美丽的大花猫”，则用户输入的输入信息为“yizhimeilidedahuam”，其中，包括“yizhi”、“meilide”和“dahuamao”三个字符组。

第一获取模块120用于分别根据多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条。在本发明的实施例中，第一获取模块120可针对每个字符组分别获取该字符组对应的候选词条集合。举例来说，“yizhi”，对应的候选词条集合可包括“一直”、“一只”、“一支”、“抑制”等多个候选词条的集合，“dahuamao”对应的候选词条集合可包括“大花猫”、“大花帽”等多个候选词条集合。更具体地，获取候选词条集合的方法可参照相关技术，本发明对获取候选词条集合的方法不做具体限定。

第二获取模块130用于根据多个候选词条集合获取对应的搭配模型，其中，搭配模型包括第一词汇和第二词汇，第一词汇与第二词汇分别为来自多个候选词条集合中的两个不同的候选词条集合中的候选词条。在本发明的实施例中，搭配模型由第一词汇和第二词汇搭配组成，更具体地，如果搭配模型中的第一词汇和第二词汇分别为多个候选系统集合中两个不同的候选词条集合中的候选词条时，则第二获取模块130可获取该搭配模型。举例来说，对于搭配模型数据库中的搭配模型“一只猫”，其中“一只”来“yizhi”对应的自候选词条“一只”，“猫”来自“dahuamao”对应的候选词条“大花猫”，则可从搭配模型数据库获取搭配模型“一只猫”。

生成模块140用于根据搭配模型以及多个候选词条集合生成至少一个候选语句。在本发明的实施例中，可根据搭配模型从多个候选词条集合中筛选出具有搭配关系的候选词条，并根据具有搭配关系的候选词条生成候选语句。

在本发明的一个实施例中，如图5所示，第二获取模块130可进一步包括：查询单元131和获取单元132。

具体地，查询单元131用于根据多个候选词条集合查询搭配模型数据库。在本发明的实施例中，搭配模型数据库可由服务器建立，用户终端可通过互联网与服务器建立连接直接查询搭配模型数据库，也可将搭配模型数据库下载至本地，从而可在离线状态查询搭配模型数据库。

获取单元132用于获取搭配模型数据库中满足以下条件的搭配模型：

在本发明的一个实施例中，如图6所示，生成模块140可进一步包括：优化单元141、筛选单元142和第二生成单元143。

具体地，优化单元141用于对多个候选词条集合中搭配模型中第一词汇和第二词汇对应的候选词条的排序权值进行优化，且多个候选词条集合中其他候选词条的排序权值不变。

筛选单元142用于根据排序权值在每个候选词条集合中分别选出至少一个候选词条。

第二生成单元143用于根据选出的候选词条生成至少一个候选语句。

举例来说，对于输入信息“yizhimeilidedahuam”，由于已经查询到“一只猫”这样的搭配模型，因此，候选词条“一只”在其所在的候选词条集合中的排序权值被提升，候选词条“大花猫”在其在的候选词条集合中的排序权值也被提升，从而可选出“一只”、“美丽的”、“大花猫”，并据此得到候选语句“一只大花猫”。对于更复杂的输入信息，其对应的多个候选词条集合中可能存在很多候选词条，因此即使经过排序权值优化，每个候选词条集合中也可选出多于一个的候选词条，并据此可生成多个候选语句。可将这多个候选语句全部提供给用户，供用户选择。

本发明还提出一种输入内容推荐方法，包括：接收输入信息，并根据输入信息提供多个第一候选词条；接收对多个第一候选词条的上屏选择指令；获取上屏选择指令选择的第一候选词条对应的至少一个搭配模型；根据至少一个搭配模型和上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对至少一个第二候选词条进行推荐。

图7为根据本发明一个实施例的输入内容推荐方法的流程图，如图7所示，该方法包括：

S701，接收输入信息，并根据输入信息提供多个第一候选词条。

在本发明的实施例中，输入信息为用户根据需要输入的内容通过输入法输入的字符串。举例来说，对于汉语输入法来说，如果用户需要输入汉字“一支”，则用户输入的输入信息为“yizhi”，输入法系统可为用户提供“一只”、“一致”、“一支”、“一直”、“抑制”等多个第一候选词条。

S702，接收对多个第一候选词条的上屏选择指令。

在本发明的实施例中，如果用户可根据需要在多个第一候选词条中选择相应的第一候选词条上屏。举例来说，如果用户需要输入汉字“一支”，可通过商品选择指令选择“一只”、“一致”、“一支”、“一直”、“抑制”中的“一支”上屏。

S703，获取上屏选择指令选择的第一候选词条对应的至少一个搭配模型。

其中，搭配模型包括第一词汇和第二词汇，预先根据词语之间的词性搭配建立的。在本发明一个的实施例中，具体地，可根据上屏选择指令选择的第一候选词条查询搭配模型数据库，并获取搭配模型数据库中第一词汇为上屏选择指令选择的第一候选词条的至少一个搭配模型。举例来说，对于第一候选词汇“一支”，其对应的搭配模型可为“一支笔”、“一支箭”、“一只队伍”、“一支军队”等。

搭配模型数据库可由服务器建立，用户终端可通过互联网与服务器建立连接直接查询搭配模型数据库，也可将搭配模型数据库下载至本地，从而可在离线状态查询搭配模型数据库。

S704，根据至少一个搭配模型和上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对至少一个第二候选词条进行推荐。

在本发明的实施例中，可分别根据至少一个搭配模型和上屏选择指令对应的第一候选词条获取至少一个搭配模型中的第二词汇，并将获取到的至少一个第二词汇作为至少一个第二候选词条，推荐给用户。

在本发明的一个实施例中，建立搭配模型数据库的方法可如图2所示。

图8为根据本发明另一个实施例的输入内容推荐方法的流程图。如图8所示，该方法包括：

S801，接收输入信息，并根据输入信息提供多个第一候选词条。

S802，接收对多个第一候选词条的上屏选择指令。

S803，获取用户标识信息。

S804，根据用户标识信息和上屏选择指令对应的第一候选词条查询搭配模型数据库中相应的个性化数据库。

具体地，可根据用户标识信息访问搭配模型数据库中与该标识信息对应的个性化数据库，进而可根据上屏选择指令对应的第一候选词条查询该个性化数据库，并获取上屏选择指令选择的第一候选词条对应的至少一个搭配模型。

S805，根据至少一个搭配模型和上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对至少一个第二候选词条进行推荐。

本发明实施例的输入内容推荐方法，可根据用户的标识信息查询相应的个性化数据库，以获取相应的搭配模型，并据此提供候选语句，使得提供的候选语句更能够符合用户的个人输入习惯，满足了用户的个性化需求，进一步提升用户的输入体验。

为了实现上述实施例，本发明还提出一种输入内容推荐装置，包括：第一接收模块，用于接收输入信息；提供模块，用于根据输入信息提供多个第一候选词条；第二接收模块，用于接收对多个第一候选词条的上屏选择指令；获取模块，用于获取上屏选择指令选择的第一候选词条对应的至少一个搭配模型；推荐模块，用于根据至少一个搭配模型和上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对至少一个第二候选词条进行推荐。

图9为根据本发明一个实施例的输入内容推荐装置的结构示意图。如图9所示，该输入内容推荐装置包括：第一接收模块210、提供模块220、第二接收模块230、获取模块240和推荐模块250。

具体地，第一接收模块210用于接收输入信息。在本发明的实施例中，输入信息为用户根据需要输入的内容通过输入法输入的字符串。举例来说，对于汉语输入法来说，如果用户需要输入汉字“一支”，则用户输入的输入信息为“yizhi”。

提供模块220用于根据输入信息提供多个第一候选词条。举例来说，对于用户输入的输入信息“yizhi”，提供模块220可为用户提供“一只”、“一致”、“一支”、“一直”、“抑制”等多个第一候选词条。

第二接收模块230用于接收对多个第一候选词条的上屏选择指令。在本发明的实施例中，如果用户可根据需要在多个第一候选词条中选择相应的第一候选词条上屏。举例来说，如果用户需要输入汉字“一支”，可通过商品选择指令选择“一只”、“一致”、“一支”、“一直”、“抑制”中的“一支”上屏。

获取模块240用于获取上屏选择指令选择的第一候选词条对应的至少一个搭配模型。其中，搭配模型包括第一词汇和第二词汇，预先根据词语之间的词性搭配建立的。在本发明一个的实施例中，更具体地，获取模块240可根据上屏选择指令选择的第一候选词条查询搭配模型数据库，并获取搭配模型数据库中第一词汇为上屏选择指令选择的第一候选词条的至少一个搭配模型。举例来说，对于第一候选词汇“一支”，其对应的搭配模型可为“一支笔”、“一支箭”、“一只队伍”、“一支军队”等。

在本发明的一个实施例中，由于不同的用户所使用的搭配模型不同，例如，对于使用方言的用户来说，由于在方言中的一些特殊字词组合，特殊发音等，因此，这些用户在使用输入法时，更希望推荐符合其语言习惯的候选语句。为了能够满足用户的个性化需求，搭配模型数据库可包括预先根据不同用户的个人资源建立的多个个性化数据库，获取模块240具体用于获取用户标识信息，并根据用户标识信息查询搭配模型数据库中相应的个性化数据库，并获取相应的个性化数据库中第一词汇为上屏选择指令选择的第一候选词条的至少一个搭配模型。

推荐模块250用于根据至少一个搭配模型和上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对至少一个第二候选词条进行推荐。在本发明的实施例中，推荐模块250可分别根据至少一个搭配模型和上屏选择指令对应的第一候选词条获取至少一个搭配模型中的第二词汇，并将获取到的至少一个第二词汇作为至少一个第二候选词条，推荐给用户。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同限定。

Claims

1.一种输入法中候选语句的提供方法，其特征在于，包括：

接收输入信息，所述输入信息包括多个字符组；

分别根据所述多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条；

根据所述多个候选词条集合获取对应的搭配模型，其中，所述搭配模型包括第一词汇和第二词汇，所述第一词汇与所述第二词汇分别为来自所述多个候选词条集合中的两个不同的候选词条集合中的候选词条；以及

根据所述搭配模型以及所述多个候选词条集合生成至少一个候选语句。

2.如权利要求1所述的方法，其特征在于，所述根据所述多个候选词条集合获取对应的搭配模型，包括：

根据所述多个候选词条集合查询搭配模型数据库；

获取所述搭配模型数据库中满足以下条件的搭配模型：

所述搭配模型中的所述第一词汇属于所述多个候选词集合中的一个候选词集合，且所述搭配模型中的所述第二词汇属于所述多个候选词集合中的另一个候选词集合。

3.如权利要求2所述的方法，其特征在于，所述搭配模型数据库包括多个个性化数据库，所述根据所述多个候选词条集合查询搭配模型数据库，包括：

获取用户标识信息；

根据所述用户标识信息和所述多个候选词集合查询搭配模型数据库中相应的个性化数据库。

4.如权利要求2或3所述的方法，其特征在于，所述搭配模型为词性搭配模型，所述搭配模型数据库通过以下步骤建立：

获取语料；

对所述语料进行整理以获取多个语句；

分别对每个所述语句进行分词和词性标注，并根据每个所述语句的所述分词和词性标注的结果获取多个词性搭配模型；

根据所述多个词性搭配模型建立所述搭配模型数据库。

5.如权利要求1所述的方法，其特征在于，所述根据所述搭配模型以及所述多个候选词条集合生成至少一个候选语句，包括：

对所述多个候选词条集合中所述搭配模型中所述第一词汇和所述第二词汇对应的候选词条的排序权值进行优化，且所述多个候选词条集合中其他候选词条的排序权值不变；

根据所述排序权值在每个候选词条集合中分别选出至少一个候选词条；

根据选出的候选词条生成至少一个候选语句。

6.一种输入法中候选语句的提供装置，其特征在于，包括：

接收模块，用于接收输入信息，所述输入信息包括多个字符组；

第一获取模块，用于分别根据所述多个字符组获取多个候选词条集合，其中，每个候选词条集合与一个字符组对应，且每个候选词条集合包括字符组对应的至少一个候选词条；

第二获取模块，用于根据所述多个候选词条集合获取对应的搭配模型，其中，所述搭配模型包括第一词汇和第二词汇，所述第一词汇与所述第二词汇分别为来自所述多个候选词条集合中的两个不同的候选词条集合中的候选词条；以及

生成模块，用于根据所述搭配模型以及所述多个候选词条集合生成至少一个候选语句。

7.如权利要求6所述的装置，其特征在于，所述第二获取模块包括：

查询单元，用于根据所述多个候选词条集合查询搭配模型数据库；

获取单元，用于获取所述搭配模型数据库中满足以下条件的搭配模型：

8.如权利要求7所述的装置，其特征在于，所述搭配模型数据库包括多个个性化数据库，所述查询单元具体用于获取用户标识信息，并根据所述用户标识信息和所述多个候选词集合查询搭配模型数据库中相应的个性化数据库。

9.如权利要求6所述的装置，其特征在于，所述生成模块包括：

优化单元，用于对所述多个候选词条集合中所述搭配模型中所述第一词汇和所述第二词汇对应的候选词条的排序权值进行优化，且所述多个候选词条集合中其他候选词条的排序权值不变；

筛选单元，用于根据所述排序权值在每个候选词条集合中分别选出至少一个候选词条；

第二生成单元，用于根据选出的候选词条生成至少一个候选语句。

10.一种输入内容推荐方法，其特征在于，包括：

接收输入信息，并根据所述输入信息提供多个第一候选词条；

接收对所述多个第一候选词条的上屏选择指令；

获取所述上屏选择指令选择的第一候选词条对应的至少一个搭配模型；

根据所述至少一个搭配模型和所述上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对所述至少一个第二候选词条进行推荐。

11.如权利要求10所述的方法，其特征在于，所述搭配模型包括第一词汇和第二词汇，所述获取所述上屏选择指令选择的第一候选词条对应的至少一个搭配模型，包括：

查询搭配模型数据库，并获取所述搭配模型数据库中所述第一词汇为所述上屏选择指令选择的第一候选词条的至少一个搭配模型。

12.如权利要求11所述的方法，其特征在于，所述搭配模型数据库包括多个个性化数据库，所述查询搭配模型数据库，包括：

获取用户标识信息；

根据所述用户标识信息和所述上屏选择指令对应的第一候选词条，查询所述搭配模型数据库中相应的个性化数据库。

13.如权利要求11或12所述的方法，其特征在于，所述搭配模型为词性搭配模型，所述搭配模型数据库通过以下步骤建立：

获取语料；

对所述语料进行整理以获取多个语句；

根据所述多个词性搭配模型建立所述搭配模型数据库。

14.如权利要求10所述的方法，其特征在于，所述根据所述至少一个搭配模型和所述上屏选择指令对应的第一候选词条获取至少一个第二候选词条，包括：

根据所述至少一个搭配模型和所述上屏选择指令对应的第一候选词条获取所述至少一个搭配模型中的第二词汇，并将获取到的至少一个第二词汇作为所述至少一个第二候选词条。

15.一种输入内容推荐装置，其特征在于，包括：

第一接收模块，用于接收输入信息；

提供模块，用于根据所述输入信息提供多个第一候选词条；

第二接收模块，用于接收对所述多个第一候选词条的上屏选择指令；

获取模块，用于获取所述上屏选择指令选择的第一候选词条对应的至少一个搭配模型；

推荐模块，用于根据所述至少一个搭配模型和所述上屏选择指令对应的第一候选词条获取至少一个第二候选词条，并对所述至少一个第二候选词条进行推荐。

16.如权利要求15所述的装置，其特征在于，所述搭配模型包括第一词汇和第二词汇，所述获取模块具体用于查询搭配模型数据库，并获取所述搭配模型数据库中所述第一词汇为所述上屏选择指令选择的第一候选词条的至少一个搭配模型。

17.如权利要求16所述的装置，其特征在于，所述搭配模型数据库包括多个个性化数据库，所述获取模块具体用于获取用户标识信息，并根据所述用户标识信息和所述上屏选择指令对应的第一候选词条查询所述搭配模型数据库中相应的个性化数据库，并获取所述相应的个性化数据库中所述第一词汇为所述上屏选择指令选择的第一候选词条的至少一个搭配模型。

18.如权利要求15所述的装置，其特征在于，所述推荐模块具体用于根据所述至少一个搭配模型和所述上屏选择指令对应的第一候选词条获取所述至少一个搭配模型中的第二词汇，并将获取到的至少一个第二词汇作为所述至少一个第二候选词条，并对所述至少一个第二候选词条进行推荐。