CN113589945A

CN113589945A - 输入方法、装置和用于输入的装置

Info

Publication number: CN113589945A
Application number: CN202010365727.5A
Authority: CN
Inventors: 杨帆
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2020-04-30
Filing date: 2020-04-30
Publication date: 2021-11-02
Anticipated expiration: 2040-04-30
Also published as: CN113589945B

Abstract

本发明实施例提供了一种输入方法、装置和用于输入的装置。其中的方法具体包括：确定用户上文对应的第一向量；依据所述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到所述第一向量对应的句联想候选；所述映射关系为依据句子语料得到，所述句子语料包括：上文样本和句联想候选，所述第二向量与所述上文样本相应。本发明实施例可以提高联想候选的完整性，且能够提高句联想候选的覆盖范围。

Description

输入方法、装置和用于输入的装置

技术领域

本发明涉及输入技术领域，尤其涉及一种输入方法、装置和用于输入的装置。

背景技术

输入法是指为了将各种文字输入计算机或其他设备(如手机、平板电脑等)而采用的编码方法。用户如果要将文字输入到设备中，则需要使用输入法程序。例如，用户可以在搜索引擎中输入关键词以搜索网页，也可以在即时通讯APP(应用程序，Application)中输入文字以与其他用户进行交流，还可以在文档APP中输入文字以编辑文档等等。

输入法的联想功能是输入法程序的一种扩展功能，它的出现减少了用户主动输入的次数、按键的次数，并增加了输入法的智能性。目前，输入法程序可以针对用户上屏的字词，提供对应的联想候选。例如，针对用户上屏的“漫天”，提供“大雪”、“卷地”、“飞舞”等联想候选。又如，针对用户上屏的“生日”，提供“快乐”等联想候选。

发明人在实施本发明实施例的过程中发现，用户的表达是以句子为单位进行表达的，针对字词提供联想候选，使得联想候选的完整性较差。

发明内容

本发明实施例提供一种输入方法、装置和用于输入的装置，可以提高联想候选的完整性，且能够提高句联想候选的覆盖范围。

为了解决上述问题，本发明实施例公开了一种输入方法，包括：

确定用户上文对应的第一向量；

依据所述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到所述第一向量对应的句联想候选；所述映射关系为依据句子语料得到，所述句子语料包括：上文样本和句联想候选，所述第二向量与所述上文样本相应。

另一方面，本发明实施例公开了一种输入装置，包括：

向量确定模块，用于确定用户上文对应的第一向量；

向量检索模块，用于依据所述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到所述第一向量对应的句联想候选；所述映射关系为依据句子语料得到，所述句子语料包括：上文样本和句联想候选，所述第二向量与所述上文样本相应。

再一方面，本发明实施例公开了一种用于输入的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

确定用户上文对应的第一向量；

又一方面，本发明实施例公开了一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如前述一个或多个所述的输入方法。

本发明实施例包括以下优点：

本发明实施例依据针对句子语料对应映射关系的向量检索，确定用户上文对应的句联想候选。由于句联想候选对应的语言单元为句子，因此能够提高联想候选的完整性，进而能够提高输入效率和提升用户体验。

并且，本发明实施例基于向量检索，得到用户上文对应的句联想候选；能够基于第一向量与第二向量在空间中的距离，对第一向量与第二向量进行匹配。这样，不要求第一向量与第二向量在文本方面严格一致，因此能够增加句联想候选的覆盖范围。

例如，句子语料包括：上文样本A“可以和你语音吗”和句联想候选“我想听你的声音”，则在用户上文a为“能和你语音吗”的情况下，本发明实施例可以基于第一向量与第二向量在空间中的距离，确定第一向量与第二向量相匹配，进而提供对应的句联想候选“我想听你的声音”。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种输入方法的应用环境的示意；

图2是本发明的一种输入方法实施例的步骤流程图；

图3是本发明的一种输入装置实施例的结构框图；

图4是本发明的一种用于输入的装置800的框图；及

图5是本发明的一些实施例中服务端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供了一种输入方案，该方案可以包括：确定用户上文对应的第一向量；依据上述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到上述第一向量对应的句联想候选；上述映射关系为依据句子语料得到，上述句子语料包括：上文样本和句联想候选，上述第二向量与上述上文样本相应。

本发明实施例依据句子语料，得到第二向量与句联想候选对应的映射关系，并基于向量检索，得到用户上文对应的句联想候选。

例如，句子语料包括：上文样本B1“可以和你语音吗”和句联想候选B1“我想听你的声音”，则在用户上文A为“能和你语音吗”的情况下，本发明实施例可以基于第一向量与第二向量在空间中的距离，确定第一向量与第二向量相匹配，进而提供对应的句联想候选B1“我想听你的声音”。

本发明实施例能够实现句联想的连续性。例如，本发明实施例可以针对用户上文A，提供至少一个句联想候选(如句子B1、句子B2等)；若用户选择句子B2上屏，则还可以针对用户上文A和句子B2，提供至少一个句联想候选(如句子C1、句子C2等)；若用户选择句子C1上屏，则还可以针对用户上文A、句子B2和句子C1，提供至少一个句联想候选(如句子D1、句子D2等)。可以理解，在用户持续选择句联想候选的情况下，本发明实施例可以持续提供相应的句联想候选。

本发明实施例提供的输入方法可应用于图1所示的应用环境中，如图1所示，客户端100与服务端200位于有线或无线网络中，通过该有线或无线网络，客户端100与服务端200进行数据交互。

可选地，客户端100可以运行在终端上，上述终端具体包括但不限于：智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3，Moving Picture ExpertsGroup Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4，Moving PictureExperts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。客户端100可以对应于网站、或者APP(应用程序，Application)。客户端100可以对应有输入法APP、即时通信APP等应用程序。

本发明实施例的服务端可以为云服务端。云服务端是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。云服务端的资源信息具有动态性，使得其处理能力可弹性伸缩。

本发明实施例可应用于键盘符号、手写、语音等各种输入方式的输入法程序。以键盘符号输入方式为例，用户可以通过编码字符串进行文字输入，输入串可以指用户输入的编码字符串。在输入法领域，对于例如中文、日文、韩文、或者其它语言的输入法程序，通常可以把用户输入的输入串转换成相应语言的候选项。以下主要以中文为例进行说明，日文、韩文等其它语言相互参照即可。可以理解，上述中文输入法可以包括但不限于全拼、简拼、笔画、五笔等，本发明实施例对于某种语言对应的具体输入法程序不加以限制。

以中文的输入为例，编码字符串的类型可以包括：拼音串、字形串(如五笔串等)。以英文的输入为例，编码字符串的类型可以包括：字母字符串等。

在实际应用中，对于键盘符号的输入方式，用户可以通过实体键盘、或者虚拟键盘等输入上述输入串。例如，对于具有触摸屏的终端，其可以在输入界面中设置虚拟键盘，以通过触发上述虚拟键盘包括的虚拟按键进行输入串的输入。可选地，上述虚拟键盘的例子可以包括：9键键盘和26键键盘等。并且，可以理解，上述输入界面中除了设置有字母对应的虚拟按键之外，还可以设置有符号按键、数字按键、例如中英切换按键的功能按键，或者，还可以设置有工具栏按键等，可以理解，本发明实施例对于输入界面所包含的具体按键不加以限制。

根据一些实施例，上述输入串可以包括但不限于：用户通过按键所输入的一个按键符号或多个按键符号的组合。上述按键符号具体可以包括：拼音、笔画、假名等。

本发明实施例中，候选可用于表示输入法程序提供的待被用户选择的一个或多个字符。候选可以为中文字符、英文字符、日文字符等语言的字符，候选也可以为颜文字、图片等形式的符号组合。其中，上述颜文字包括但不限于线条、符号、文字所组成的图画，例如，上述颜文字的例子可以包括：“：P”、“:-o”、“:-)”等。

方法实施例

参照图2，示出了本发明的一种输入方法实施例的步骤流程图，具体可以包括如下步骤：

步骤201、确定用户上文对应的第一向量；

步骤202、依据上述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到上述第一向量对应的句联想候选；上述映射关系可以为依据句子语料得到，上述句子语料可以包括：上文样本和句联想候选，上述第二向量与上述上文样本相应。

图2所示方法实施例可由客户端和/或服务端执行，可以理解，本发明实施例对于方法实施例的具体执行主体不加以限制。

根据一种实施例，用户上文可以为输入光标之前的部分。该用户上文可以包括：最近一次或者最近多次的上屏内容。当然，用户上文可以包括：剪贴板内容。

根据另一种实施例，用户上文可以包括：在通信场景下，通信对端发送的通信内容。根据再一种实施例，该上文可以包括：在通信场景下，向通信对端发送的通信内容。可以理解，本发明实施例对于具体的用户上文不加以限制。

在本发明的一种可选实施例中，上述用户上文的末尾可以包括：预设标点符号。预设标点符号可以表征句子的停顿，以使用户上文对应完整性较高的语言单元。

预设标点符号可由本领域技术人员根据实际应用需求确定，例如，预设标点符号可以包括：逗号“，”、句号“。”、问号“？”、叹号“！”、句点“.”、“空格”等，可以理解，本发明实施例对于具体的预设标点符号不加以限制。

例如，用户A在上屏输入内容“大家都很忙”后，点击了逗号“，”，则可以针对用户上文“大家都很忙”执行本发明实施例的输入方法。

在本发明的另一种可选实施例中，用户上文可以为用户发送的上文。向通信对端发送的用户上文，通常对应完整性较高的语言单元。

本发明实施例针对完整性较高的输入内容确定对应的句联想候选，能够提高句联想候选与用户上文之间的相关性，进而能够提高输入效率和提升用户体验。

本发明实施例中，可选的是，可以利用文本到向量的转换方法，确定用户上文对应的第一向量。

上述转换方法可以包括如下方法中的至少一种：

VSM(向量空间模型，Vector Space Model)方法；

word2vec(词到向量，word to vector)方法等。

可以理解，本发明实施例对于具体的转换方法不加以限制。

本发明实施例中，可选的是，上述确定用户上文对应的第一向量，包括：

依据用户上文，确定用户上文对应的第一向量；或者

依据用户上文和相关信息，确定用户上文对应的第一向量；上述相关信息包括：输入环境特征、和/或、用户特征。

在本发明的一种可选实施例中，上述相关信息可以包括：用户特征。

用户特征可以指用户具有的特征。可选地，用户特征可以包括如下特征中的至少一种：偏好特征和静态特征。

静态特征可以为相对稳定的特征，如用户的年龄、性别、地域、学历、商圈、职业、婚姻、消费等级、身份(如爸爸、妈妈、爷爷、奶奶、姥姥、姥爷等)等。

相对于上述静态特征的相对稳定性，偏好特征通常具有动态性，其可以随着不断变化的用户行为而变化。在本申请的一种可选实施例中，偏好特征可以指用户对内容的偏好特征。其中，该偏好特征可以随着用户对于内容的行为(输入行为、浏览行为、搜索行为、收藏行为、保存行为、关注行为、购买行为、分享行为、选择行为和评价行为中的至少一种)而变化。

偏好特征可以包括：语言风格特征。例如，可以根据用户的历史输入数据，确定用户的语言风格特征。

语言风格特征可用于表征用户所使用语言的风格。语言风格特征的例子可以包括：幽默风格、严肃风格、活泼风格、甜蜜风格等。例如，用户的输入内容中有高比例的幽默词汇，则可以认为用户的语言风格特征包括“幽默风格”。又如，用户的输入内容中包含高比例的严肃词汇，整体风格偏向严肃，则可以认为用户的语言风格特征包括“严肃风格”。可以理解，本发明实施例对于具体的用户风格不加以限制。

本发明实施例可以针对不同的语言风格特征，提供不同的句联想候选，由此可以提升句联想候选与输入环境特征之间的契合度，进而能够提升用户体验。

假设用户上文为“我睡觉了”，则在语言风格特征为活泼风格的情况下，对应的回复候选可以为“不要睡，起来嗨”；在语言风格特征为“严肃风格”的情况下，对应的回复候选可以为“晚安”。

在本发明的一种可选实施例中，上述相关信息可以包括：输入环境特征。输入环境特征可用于表征用户输入时终端所处的环境信息。输入环境特征可以在一定程度上反映用户的输入意图，因此，在输入环境特征与用户的输入意图之间建立联系，可以间接识别用户的输入意图，进而提高用户的输入效率。

在实际应用中，上述输入环境特征可以包括各种类型的特征。可选地，上述输入环境特征可以包括：时间环境特征、位置环境特征、气候环境特征、应用程序环境特征和页面环境特征中的至少一种。应用程序环境特征可以包括：应用程序的名称、或者应用程序的安装包的名称、或者应用程序的类别等特征。

本发明实施例中，可选的是，可以预置应用程序环境特征与语言风格特征之间的映射关系。具体地，可以针对不同的应用程序环境特征，确定不同的语言风格特征。例如，聊天环境特征对应的语言风格特征包括：口语风格，而写作环境特征对应的语言风格特征包括：书面风格等。例如在聊天环境特征下，句联想候选为“明天有大风”，而在正式写新闻稿的环境特征下，句联想候选为“今明两天有三到四级大风”。

在应用程序环境特征为通信环境特征的情况下，上述输入环境特征还可以包括：对端用户特征。

在本发明的一种可选实施例中，上述对端用户特征可以包括：对端用户在通信平台上的注册信息、和/或、本端用户特征针对上述对端用户的设置信息、和/或、上述对端用户对应的评价信息。

本发明实施例中，用户在通信平台注册用户账号的情况下，通常会提交对应的注册信息，上述注册信息可以包括：昵称、年龄、地区等信息，本发明实施例可以依据上述注册信息得到用户特征。

本端用户特征针对上述对端用户的设置信息可以包括：备注信息、或分组信息等，本发明实施例可以依据上述设置信息，确定用户关系，并将用户关系应用于句联想候选的确定过程。例如，对端用户对应的分组信息为“家人”，则用户关系为“家人”。又如，对端用户对应的备注信息为“老婆”，则用户关系为“老婆”。

对端用户对应的评价信息可以指其他用户针对对端用户的评价信息，如“才女”、“知性美女”、“幽默达人”等。本发明实施例可以依据上述评价特征，确定对端用户的喜好特征。

本发明实施例可以预置对端用户特征与语言风格特征之间的映射关系。例如，对端用户特征包括：年龄，则年龄超过60岁的情况下，语言风格特征为严肃风格。又如，对端用户特征包括：用户关系，用户关系为“老婆”，则对应的语言风格特征为甜蜜风格；或者，用户关系为“同事”，则对应的语言风格特征为严肃风格；或者，用户关系为“孩子”，则对应的语言风格特征为活泼风格等等。可以理解，本领域技术人员可以根据实际应用需求，确定对端用户特征与语言风格特征之间的映射关系，本发明实施例对于对端用户特征与语言风格特征之间的映射关系不加以限制。

步骤202中，句子语料可以包括：输入法程序的输入语料、通讯平台的语聊语料、社交平台的微博语料、新闻语料、或者其他的互联网语料等。

本发明实施例基于向量检索，得到用户上文对应的句联想候选；能够基于第一向量与第二向量在空间中的距离，对第一向量与第二向量进行匹配，并将与第一向量相匹配的第二向量对应的句联想候选，作为用户上文对应的句联想候选。

需要说明的是，本发明实施例中，第一向量对应的信息种类和第二向量对应的信息种类相匹配。例如，第一向量为依据用户上文生成，则第二向量也可以依据上文样本得到。又如，第一向量为依据用户上文及其相关信息生成，则第二向量也可以依据上文样本及其相关信息得到。

根据一种实施例，可以将第一向量与所有句子语料对应的所有第二向量进行匹配。具体地，可以计算第一向量与所有第二向量之间的空间距离，并将距离小于第一距离阈值的第二向量，作为与第一向量相匹配的第二向量。第一距离阈值用于表征第一向量和第二向量相匹配的距离的门限，第一距离阈值可以为0到1之间的比较小的数值，本领域技术人员可以根据实际应用需求，确定第一距离阈值，本发明实施例对于具体的第一距离阈值不加以限制。

向量之间距离的度量方法可以包括：欧氏距离、夹角余弦、汉明距离、或者杰卡德相似系数等。可以理解，本发明实施例对于向量之间距离的具体度量方法不加以限制。

根据另一种实施例，上述在第二向量与句联想候选对应的映射关系中进行检索，具体包括：依据上述第一向量与上述第二向量的索引，确定上述第一向量对应的目标索引；依据上述第一向量和上述目标索引对应的第二向量，确定上述第一向量对应的句联想候选。

本发明实施例可以预先建立第二向量的索引；这样，在向量检索过程中，可以首先确定第一向量对应的目标索引，然后，对第一向量与目标索引对应的第二向量进行匹配。由于可以节省非目标索引对应的第二向量的匹配运算，因此能够提高向量检索效率。

在此提供一种建立第二向量的索引的示例。该示例具体包括：对多个第二向量进行聚类，以得到多个向量类别；依据上述向量类别的信息，建立上述向量类别内第二向量的索引。

向量类别的信息可以包括：向量类别的中心向量。相应地，上述确定上述第一向量对应的目标索引，具体包括：依据上述第一向量与上述向量类别对应的中心向量之间的空间距离，确定上述第一向量对应的目标向量类别。可选地，可以将距离小于第二距离阈值的向量类别，作为第一向量对应的目标向量类别，目标向量类别与目标索引相应。第二距离阈值与第一距离阈值的原理类似，在此不作赘述，相互参照即可。

本发明实施例中，用户上文对应的句联想候选可以为一个或多个，可选地，可以对多个句联想候选进行排序展示。

本发明实施例中，句联想候选的展示位置可以为候选区的位置。当然，本发明实施例对于具体的展示位置不加以限制。

在本发明的一种可选实施例中，客户端可以向服务端发送句联想请求，该句联想请求中可以包括：用户上文，以使服务端利用图2所示方法获得用户上文对应的句联想候选。

由于向服务端发送句联想请求、服务端确定句联想候选、以及服务端返回句联想候选的过程需要耗费一定的时间；因此，为了缓解用户等待句联想候选的问题，上述方法还可以包括：若检测到针对预设标点符号的输入操作，在对上述服务端返回的句联想候选进行展示之前，客户端在候选区展示上述预设标点符号对应的候选。预设标点符号对应的候选的处理，可以在一定程度上缓解用户等待句联想候选的问题。

可以理解，在用户将预设标点符号对应的候选后，客户端可以对上述服务端返回的句联想候选进行展示，以供用户选择上屏。

本发明实施例中，可选的是，所述句联想候选可以包括：输入内容和预测结果。例如，句联想候选包括：输入内容“锄禾日当午”和预测结果“汗滴禾下土”。

则所述方法还可以包括：利用第一展示方式，对所述句联想候选中的输入内容进行展示；以及，利用第二展示方式，对所述句联想候选中的预测结果进行展示。

本发明实施例对句联想候选中的输入内容和预测结果进行区分展示，可以提高输入内容和预测结果之间的区分度。

本发明实施例的展示方式可以包括：颜色展示、或角标展示、或文本展示等。例如，输入内容和预测结果的颜色不同，如输入内容为黑色，预测结果为红色。又如，输入内容不具有角标，而预测结果具有角标。或者，输入内容和预测结果的字体或字号不同，如预测结果的字号大于输入内容的字号等。

本发明实施例中，可选的是，所述方法还可以包括：对句联想候选进行缓存；针对用户的输入串，从缓存中获取与所述输入串相匹配的目标句联想候选；对所述目标句联想候选进行展示。本发明实施例对返回的句联想候选进行缓存，以备后续使用。

从缓存中获取与所述输入串相匹配的目标句联想候选，对应的匹配条件可以为：缓存中句联想候选对应的编码包括：输入串对应的编码，换言之，输入串对应的编码为缓存中句联想候选对应的编码的全集或子集。例如，缓存中句联想候选包括“过去这段时间，感谢你的帮助”，若输入串为“guoqu”或者“zheduan”，则可以认为输入串与句联想候选相匹配；而若输入串为“zaizheli”，则认为输入串与句联想候选不匹配。

本发明实施例中，可选的是，输入串对应字符的数量可以大于字符阈值，例如，字符阈值为2等。也即，输入串与缓存中句联想候选存在至少3个字的重码。当然，本发明实施例对于具体的字符阈值不加以限制。

本发明实施例中，可选的是，输入串可以与缓存中句联想候选的开头字符相匹配。例如，缓存中句联想候选包括“过去这段时间，感谢你的帮助”，输入串为“guoqu”。本发明实施例中，可选的是，输入串可以与缓存中句联想候选的中间字符相匹配。

本发明实施例中，可选的是，缓存的有效期，可以是至少一个输入周期，也可以是预设时间长度。可以依据输入间隔、或标点符号、或发送操作，确定一个输入周期。例如，在输入间隔超过间隔阈值的情况下，可以认为一个输入周期结束。又如，在输入了第三预设标点符号(如句号)，可以认为一个输入周期结束。再如，在向通信对端发送输入内容后，可以认为一个输入周期结束。

在本发明的一种可选实施例中，上述方法还可以包括：对多个句联想候选进行缓存；响应于用户针对第一句联想候选的上屏操作，从缓存中获取与所述第一句联想候选相匹配的第二句联想候选；对所述第二句联想候选进行展示。

返回的联想候选可以为多个，多个句联想候选在长度或内容方面存在差异。

例如，输入内容为“床前明月光”，返回的多个句联想候选可以包括：“疑是地上霜”、“疑是地上霜，举头望明月，低头思故乡”、“李白睡得香”、“李白睡得香，举头抱佳人,低头梦一场”等。若用户将第一句联想候选“李白睡得香”上屏，则本发明实施例可以从缓存中查找得到与第一句联想候选相匹配的句联想候选“举头抱佳人,低头梦一场”，并将“举头抱佳人”或“举头抱佳人,低头梦一场”作为第二句联想候选，提供给用户。由于能够节省发送句联想请求所耗费的时间和网络资源，因此能够节省资源、以及提高输入效率。

综上，本发明实施例的输入方法，依据针对句子语料对应映射关系的向量检索，确定用户上文对应的句联想候选。由于句联想候选对应的语言单元为句子，因此能够提高联想候选的完整性，进而能够提高输入效率和提升用户体验。

例如，句子语料包括：上文样本A“可以和你语音吗”和句联想候选“我想听你的声音”和句联想候选B“想听听你的声音”，则在用户上文a为“能和你语音吗”的情况下，本发明实施例可以基于第一向量与第二向量在空间中的距离，确定第一向量与第二向量相匹配，进而提供对应的句联想候选A“我想听你的声音”、和句联想候选B“想听听你的声音”等。

并且，本发明实施例基于大数据的句子语料，可以向用户提供与其用户上文相关性更高的句联想候选，能够给用户的带来更为便捷、智能的输入体验。

本发明实施例可以针对如下场景提供句联想候选：a.在当用户完成一个语言单元的输入，并输入预设标点符号后；b.用户在通信场景下发送输入内容后。

本发明实施例可以在接收到用户的输入串的情况下，依据句联想候选、对输入串对应的候选进行筛选。例如，用户上文a为“能和你语音吗”，输入串为“xiangtignting”，输入串“xiangtignting”对应的候选具体包括：“想听听”、“像亭亭”、“向婷婷”等；由于“想听听”与句联想候选相匹配，故可以增加“想听听”的排序得分，以将“想听听”放在靠前的位置。

本发明实施例可以在接收到用户的输入串的情况下，依据输入串对句联想候选进行筛选，以得到输入串对应的目标联想候选。例如，用户上文a为“能和你语音吗”，可以依据输入串“xiangtignting”，对句联想候选A“我想听你的声音”、和句联想候选B“想听听你的声音”进行筛选，将得到的句联想候选B作为目标联想候选。

本发明实施例依据句联想候选、对输入串对应的候选进行筛选，或者依据输入串对句联想候选进行筛选，具体包括：对输入串与句联想候选进行匹配，依据相应的匹配信息执行筛选操作。

可选地，输入串与句联想候选相匹配，对应的匹配条件可以为：句联想候选对应的编码包括：输入串对应的编码，换言之，输入串对应的编码为句联想候选对应的编码的全集或子集。例如，输入串“xiangtignting”与句联想候选B“想听听你的声音”相匹配，而输入串“woxiangni”与句联想候选B“想听听你的声音”不匹配。

本发明实施例中，可选的是，输入串对应字符的数量可以大于第一阈值，例如，第一阈值为2等。也即，输入串与句联想候选存在至少3个字的重码。当然，本发明实施例对于具体的第一阈值不加以限制。

本发明实施例中，可选的是，输入串可以与句联想候选的开头字符相匹配。当然，输入串可以与句联想候选的中间字符相匹配。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的运动动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的运动动作并不一定是本发明实施例所必须的。

装置实施例

参照图3，示出了本发明的一种输入装置实施例的结构框图，具体可以包括：

向量确定模块301，用于确定用户上文对应的第一向量；

向量检索模块302，用于依据所述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到所述第一向量对应的句联想候选；所述映射关系为依据句子语料得到，所述句子语料包括：上文样本和句联想候选，所述第二向量与所述上文样本相应。

可选地，上述向量检索模块可以包括：

目标索引确定模块，用于依据上述第一向量与上述第二向量的索引，确定上述第一向量对应的目标索引；

向量匹配模块，用于依据上述第一向量和上述目标索引对应的第二向量，确定上述第一向量对应的句联想候选。

可选地，上述装置还可以包括：

向量聚类模块，用于对多个第二向量进行聚类，以得到多个向量类别；

索引建立模块，用于依据上述向量类别的信息，建立上述向量类别内第二向量的索引。

可选地，上述向量确定模块可以包括：

第一向量确定模块，用于依据用户上文，确定用户上文对应的第一向量；或者

第二向量确定模块，用于依据用户上文和相关信息，确定用户上文对应的第一向量；上述相关信息可以包括：输入环境特征、和/或、用户特征。

可选地，上述用户特征可以包括：语言风格特征。

可选地，上述输入环境特征可以包括：即时通讯环境下的对端用户特征。

可选地，上述用户上文的末尾可以包括：预设标点符号；或者

上述用户上文为用户发送的上文。

可选地，上述句联想候选可以包括：输入内容和预测结果；

则上述装置还可以包括：

第一展示模块，用于利用第一展示方式，对上述句联想候选中的输入内容进行展示；以及，利用第二展示方式，对上述句联想候选中的预测结果进行展示。

可选地，上述装置还可以包括：

第一缓存模块，用于对句联想候选进行缓存；

第一缓存查找模块，用于针对用户的输入串，从缓存中获取与上述输入串相匹配的目标句联想候选；

第二展示模块，用于对上述目标句联想候选进行展示。

可选地，上述装置还可以包括：

第二缓存模块，用于对多个句联想候选进行缓存；

第二缓存查找模块，用于响应于用户针对第一句联想候选的上屏操作，从缓存中获取与上述第一句联想候选相匹配的第二句联想候选；

第三展示模块，用于对上述第二句联想候选进行展示。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本发明实施例提供了一种用于输入的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：确定用户上文对应的第一向量；依据所述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到所述第一向量对应的句联想候选；所述映射关系为依据句子语料得到，所述句子语料包括：上文样本和句联想候选，所述第二向量与所述上文样本相应。

图4是根据一示例性实施例示出的一种用于输入的装置800的框图。例如，装置800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图4，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音输入模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID，Radio Frequency Identification)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图5是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processingunits，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作系统1941，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时，使得装置能够执行图2或图3所示的输入方法。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时，使得装置能够执行一种输入方法，所述方法包括：确定用户上文对应的第一向量；依据所述第一向量，在第二向量与句联想候选对应的映射关系中进行检索，以得到所述第一向量对应的句联想候选；所述映射关系为依据句子语料得到，所述句子语料包括：上文样本和句联想候选，所述第二向量与所述上文样本相应。

本发明实施例公开了A1、一种输入方法，所述方法包括：

确定用户上文对应的第一向量；

A2、根据A1所述的方法，所述在第二向量与句联想候选对应的映射关系中进行检索，包括：

依据所述第一向量与所述第二向量的索引，确定所述第一向量对应的目标索引；

依据所述第一向量和所述目标索引对应的第二向量，确定所述第一向量对应的句联想候选。

A3、根据A2所述的方法，所述方法还包括：

对多个第二向量进行聚类，以得到多个向量类别；

依据所述向量类别的信息，建立所述向量类别内第二向量的索引。

A4、根据A1至A3中任一所述的方法，所述确定用户上文对应的第一向量，包括：

依据用户上文，确定用户上文对应的第一向量；或者

依据用户上文和相关信息，确定用户上文对应的第一向量；所述相关信息包括：输入环境特征、和/或、用户特征。

A5、根据A4所述的方法，所述用户特征包括：语言风格特征。

A6、根据A4所述的方法，所述输入环境特征包括：即时通讯环境下的对端用户特征。

A7、根据A1至A3中任一所述的方法，所述用户上文的末尾包括：预设标点符号；或者

所述用户上文为用户发送的上文。

A8、根据A1至A3中任一所述的方法，所述句联想候选包括：输入内容和预测结果；

则所述方法还包括：

利用第一展示方式，对所述句联想候选中的输入内容进行展示；以及，利用第二展示方式，对所述句联想候选中的预测结果进行展示。

A9、根据A1至A3中任一所述的方法，所述方法还包括：

对句联想候选进行缓存；

针对用户的输入串，从缓存中获取与所述输入串相匹配的目标句联想候选；

对所述目标句联想候选进行展示。

A10、根据A1至A3中任一所述的方法，所述方法还包括：

对多个句联想候选进行缓存；

响应于用户针对第一句联想候选的上屏操作，从缓存中获取与所述第一句联想候选相匹配的第二句联想候选；

对所述第二句联想候选进行展示。

本发明实施例公开了B11、一种输入装置，包括：

向量确定模块，用于确定用户上文对应的第一向量；

B12、根据B11所述的装置，所述向量检索模块包括：

目标索引确定模块，用于依据所述第一向量与所述第二向量的索引，确定所述第一向量对应的目标索引；

向量匹配模块，用于依据所述第一向量和所述目标索引对应的第二向量，确定所述第一向量对应的句联想候选。

B13、根据B12所述的装置，所述装置还包括：

索引建立模块，用于依据所述向量类别的信息，建立所述向量类别内第二向量的索引。

B14、根据B11至13中任一所述的装置，所述向量确定模块包括：

第二向量确定模块，用于依据用户上文和相关信息，确定用户上文对应的第一向量；所述相关信息包括：输入环境特征、和/或、用户特征。

B15、根据B14所述的装置，所述用户特征包括：语言风格特征。

B16、根据B14所述的装置，所述输入环境特征包括：即时通讯环境下的对端用户特征。

B17、根据B11至B13中任一所述的装置，所述用户上文的末尾包括：预设标点符号；或者

所述用户上文为用户发送的上文。

B18、根据B11至B13中任一所述的装置，所述句联想候选包括：输入内容和预测结果；

则所述装置还包括：

第一展示模块，用于利用第一展示方式，对所述句联想候选中的输入内容进行展示；以及，利用第二展示方式，对所述句联想候选中的预测结果进行展示。

B19、根据B11至B13中任一所述的装置，所述装置还包括：

第一缓存模块，用于对句联想候选进行缓存；

第一缓存查找模块，用于针对用户的输入串，从缓存中获取与所述输入串相匹配的目标句联想候选；

第二展示模块，用于对所述目标句联想候选进行展示。

B20、根据B11至B13中任一所述的装置，所述装置还包括：

第二缓存模块，用于对多个句联想候选进行缓存；

第二缓存查找模块，用于响应于用户针对第一句联想候选的上屏操作，从缓存中获取与所述第一句联想候选相匹配的第二句联想候选；

第三展示模块，用于对所述第二句联想候选进行展示。

本发明实施例公开了C21、一种用于输入的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

确定用户上文对应的第一向量；

C22、根据C21所述的装置，所述在第二向量与句联想候选对应的映射关系中进行检索，包括：

C23、根据C22所述的装置，所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

对多个第二向量进行聚类，以得到多个向量类别；

C24、根据C21至23中任一所述的装置，所述确定用户上文对应的第一向量，包括：

依据用户上文，确定用户上文对应的第一向量；或者

C25、根据C24所述的装置，所述用户特征包括：语言风格特征。

C26、根据C24所述的装置，所述输入环境特征包括：即时通讯环境下的对端用户特征。

C27、根据C21至C23中任一所述的装置，所述用户上文的末尾包括：预设标点符号；或者

所述用户上文为用户发送的上文。

C28、根据C21至C23中任一所述的装置，所述句联想候选包括：输入内容和预测结果；

则所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

C29、根据C21至C23中任一所述的装置，所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

对句联想候选进行缓存；

对所述目标句联想候选进行展示。

C30、根据C21至C23中任一所述的装置，所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

对多个句联想候选进行缓存；

对所述第二句联想候选进行展示。

本发明实施例公开了D31、一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如A1至A10中一个或多个所述的输入方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

以上对本发明所提供的一种输入方法、一种输入装置和一种用于输入的装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种输入方法，其特征在于，所述方法包括：

确定用户上文对应的第一向量；

2.根据权利要求1所述的方法，其特征在于，所述在第二向量与句联想候选对应的映射关系中进行检索，包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

对多个第二向量进行聚类，以得到多个向量类别；

4.根据权利要求1至3中任一所述的方法，其特征在于，所述确定用户上文对应的第一向量，包括：

依据用户上文，确定用户上文对应的第一向量；或者

5.根据权利要求4所述的方法，其特征在于，所述用户特征包括：语言风格特征。

6.根据权利要求4所述的方法，其特征在于，所述输入环境特征包括：即时通讯环境下的对端用户特征。

7.根据权利要求1至3中任一所述的方法，其特征在于，所述用户上文的末尾包括：预设标点符号；或者

所述用户上文为用户发送的上文。

8.一种输入装置，其特征在于，包括：

向量确定模块，用于确定用户上文对应的第一向量；

9.一种用于输入的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

确定用户上文对应的第一向量；

10.一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如权利要求1至7中一个或多个所述的输入方法。