CN110110204A

CN110110204A - 一种信息推荐方法、装置和用于信息推荐的装置

Info

Publication number: CN110110204A
Application number: CN201810036598.8A
Authority: CN
Inventors: 涂畅; 张扬; 王砚峰
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2018-01-15
Filing date: 2018-01-15
Publication date: 2019-08-09

Abstract

本发明实施例提供了一种信息推荐方法、装置和用于信息推荐的装置。其中的方法具体包括：获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；根据所述领域关键词，确定所述文本内容对应的推荐信息；输出所述推荐信息。本发明实施例向用户提供的推荐信息具有针对性和实时性，进而可以提高信息推荐的准确性。

Description

一种信息推荐方法、装置和用于信息推荐的装置

技术领域

本发明涉及互联网技术领域，尤其涉及一种信息推荐方法、装置和用于信息推荐的装置。

背景技术

随着互联网技术的发展，用户可以通过互联网平台获得越来越多的网络服务。例如，用户可以通过互联网观看视频、收听音乐、阅读以及购物等。用户可以通过互联网平台中的搜索功能搜索自己需要的信息，同时，互联网平台还可以主动向用户推荐信息，以便用户选择。

互联网平台在向用户推荐信息时，通常是向特定人群推荐其感兴趣的信息，所述特定人群可以为白领、学生、或者女性群体等。例如可以向女性群体推荐化妆品类的商品信息等，或者，还可以根据用户的历史搜索内容，向用户推荐用户曾经搜索过的相关信息等。

然而，在实际应用中，并不是所有的女性都对化妆品感兴趣，而且用户的历史搜索内容可能并不符合用户的当前需求，因此，目前的推荐方式不能根据用户的实际需求进行推荐，导致信息推荐不够准确。

发明内容

本发明实施例提供一种信息推荐方法、装置和用于信息推荐的装置，以解决现有技术中信息推荐不够准确的问题。

为了解决上述问题，本发明实施例公开了一种信息推荐方法，包括：

获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；

根据所述领域关键词，确定所述文本内容对应的推荐信息；

输出所述推荐信息。

可选地，所述确定所述文本内容中的领域关键词，包括：

对所述文本内容进行分词处理，以得到所述文本内容中的分词；

将所述文本内容中的分词与预置领域词进行匹配，以确定所述文本内容中的领域关键词。

可选地，在所述根据所述领域关键词，确定所述文本内容对应的推荐信息之前，所述方法还包括：

依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件；

若所述文本内容符合推荐条件，则根据所述领域关键词，确定所述文本内容对应的推荐信息。

可选地，所述依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件，包括：

确定所述文本内容中包含领域关键词的第一语言单位；

将所述第一语言单位中的领域关键词替换为预置字符，以得到替换后的第一语言单位；

将所述替换后的第一语言单位输入预置的判定模型，以通过所述判定模型判断所述文本内容是否符合推荐条件。

可选地，通过如下步骤训练得到所述判定模型：

确定语料中包含领域关键词的第二语言单位；

将所述第二语言单位中的领域关键词替换为预置字符，以得到替换后的第二语言单位；

对所述替换后的第二语言单位进行标记，以得到训练数据；

根据预置的训练模型对所述训练数据进行训练，以得到训练后的判定模型。

可选地，所述预置的训练模型包括：时间递归神经网络模型、和/或、逻辑回归模型。

可选地，所述根据所述领域关键词，确定所述文本内容对应的推荐信息，包括：

获取所述领域关键词对应领域的相关信息；

根据所述相关信息，确定所述文本内容对应的推荐信息。

可选地，所述方法还包括：

对所述文本内容进行纠错，以得到纠错后的文本内容；

确定所述纠错后的文本内容中的领域关键词。

另一方面，本发明实施例公开了一种信息推荐装置，包括：

获取模块，用于获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；

确定模块，用于根据所述领域关键词，确定所述文本内容对应的推荐信息；

输出模块，用于输出所述推荐信息。

可选地，所述获取模块，包括：

分词子模块，用于对所述文本内容进行分词处理，以得到所述文本内容中的分词；

确定子模块，用于将所述文本内容中的分词与预置领域词进行匹配，以确定所述文本内容中的领域关键词。

可选地，所述装置还包括：

判断模块，用于依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件；

确定模块，用于若所述文本内容符合推荐条件，则根据所述领域关键词，确定所述文本内容对应的推荐信息。

可选地，所述判断模块，包括：

第一确定子模块，用于确定所述文本内容中包含领域关键词的第一语言单位；

第一替换子模块，用于将所述第一语言单位中的领域关键词替换为预置字符，以得到替换后的第一语言单位；

输入子模块，用于将所述替换后的第一语言单位输入预置的判定模型，以通过所述判定模型判断所述文本内容是否符合推荐条件。

可选地，所述装置还包括：训练模块，用于训练得到所述判定模型；所述训练模块，包括：

第二确定子模块，用于确定语料中包含领域关键词的第二语言单位；

第二替换子模块，用于将所述第二语言单位中的领域关键词替换为预置字符，以得到替换后的第二语言单位；

标记子模块，用于对所述替换后的第二语言单位进行标记，以得到训练数据；

训练子模块，用于根据预置的训练模型对所述训练数据进行训练，以得到训练后的判定模型。

可选地，所述确定模块，包括：

第一获取子模块，用于获取所述领域关键词对应领域的相关信息；

第二获取子模块，用于根据所述相关信息，确定所述文本内容对应的推荐信息。

可选地，所述装置还包括：

纠错模块，用于对所述文本内容进行纠错，以得到纠错后的文本内容；

确定模块，用于确定所述纠错后的文本内容中的领域关键词。

再一方面，本发明实施例公开了一种用于信息推荐的装置，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

根据所述领域关键词，确定所述文本内容对应的推荐信息；

输出所述推荐信息。

可选地，所述确定所述文本内容中的领域关键词，包括：

可选地，在所述根据所述领域关键词，确定所述文本内容对应的推荐信息之前，所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

确定所述文本内容中包含领域关键词的第一语言单位；

可选地，所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

确定语料中包含领域关键词的第二语言单位；

对所述替换后的第二语言单位进行标记，以得到训练数据；

获取所述领域关键词对应领域的相关信息；

根据所述相关信息，确定所述文本内容对应的推荐信息。

对所述文本内容进行纠错，以得到纠错后的文本内容；

确定所述纠错后的文本内容中的领域关键词。

又一方面，本发明公开了一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如前述一个或多个所述的信息推荐方法。

本发明实施例包括以下优点：

本发明实施例可以根据用户的文本内容中的领域关键词，确定所述文本内容对应的推荐信息，以及向用户输出所述推荐信息；所述领域可以指某一专业性范围，如果用户的文本内容中存在领域关键词，说明用户对该领域关键词对应的领域感兴趣，也即用户对某一专业性范围内的信息感兴趣，因此，可以向用户提供该领域的相关信息作为推荐信息，以使推荐信息对用户具有针对性。此外，由于用户的文本内容可以包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容，也即用户的文本内容具有实时性，因此，本发明实施例的推荐信息具有实时性，可以体现用户的当前需求。可以看出，本发明实施例向用户提供的推荐信息具有针对性和实时性，进而可以提高信息推荐的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明的一种信息推荐方法实施例一的步骤流程图；

图2是本发明的一种信息推荐方法实施例二的步骤流程图；

图3是本发明的一种信息推荐装置实施例的结构框图；

图4是本发明的一种用于信息推荐的装置800的框图；及

图5是本发明的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

方法实施例一

参照图1，示出了本发明的一种信息推荐方法实施例一的步骤流程图，具体可以包括：

步骤101、获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容具体可以包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；

步骤102、根据所述领域关键词，确定所述文本内容对应的推荐信息；

步骤103、输出所述推荐信息。

本发明实施例提供的信息推荐方法可以应用于具有信息推荐功能的各种APP(应用程序，Application)或者网站中，且本发明实施例提供的信息推荐方法可应用于客户端与服务器对应的应用环境中，其中，客户端与服务器可以位于有线或无线网络中，通过该有线或无线网络，客户端与服务器进行数据交互。

具体地，客户端可以运行在终端上，所述终端具体可以包括但不限于：智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3，Moving PictureExperts Group Audio Layer III)播放器、MP4(动态影像专家压缩标准音频层面4，MovingPicture Experts Group Audio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备等等。

在本发明实施例中，所述文本内容具体可以包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容。

其中，用户接收到的文本内容具体可以为用户在通讯环境(如短信应用、即时通讯应用等环境)中，接收到通信对端发送的文本内容。在实际应用中，用户可以通过即时通讯应用、短消息应用、电子邮件应用、甚至网页应用等通讯应用接收通信对端发送的通信内容。可以理解，本发明实施例对于用户接收的文本内容的具体来源不加以限制。

所述用户输入的文本内容具体可以包括：当前光标位置之前已上屏的文本内容、或者用户拷贝的文本内容等。所述用户输入的文本内容具体可以为用户在浏览器、文档、微博、邮件等输入环境中输入的文本内容；或者，用户在通讯环境中输入的向通信对端发送的文本内容。可以理解，本发明实施例对于用户输入的文本内容的具体来源不加以限制。

此外，获取的文本内容还可以为根据用户输入或者接收的语音转换得到的文本内容，例如，用户可以在即时通讯等应用中输入或者接收语音信息，本发明实施例可以把所述语音信息转换为文本内容，可以理解，本发明实施例对于用户输入或者接收语音的具体环境不加以限制，例如可以包括微信、短信、邮件、语音通话等任意应用环境。

当然，上述用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容只是作为示例，实际上，本领域技术人员可以根据实际应用需求，将任意的文本内容作为用户的文本内容，如用户选中的文本内容等，本发明实施例对于用户的文本内容不加以限制。

本发明实施例可以根据用户的文本内容中的领域关键词，确定所述文本内容对应的推荐信息，并且向用户输出所述推荐信息。其中，领域可以指某一专业性范围，涉及在该范围内的所有事项均可引用。领域的例子可以包括：家电、娱乐、汽车、体育、科技、环保、视频、音乐等。领域关键词是指经常出现在某些特定领域，而很少在其他不相关领域出现的术语词。如“一汽大众”是汽车领域关键词，“低碳”是环保领域关键词，“海尔冰箱”是科技、家电领域关键词。在实际应用中，可以通过领域分类，确定一个词汇所属的领域范围，本发明实施例对于具体的领域分类过程不加以限制。

在实际应用中，本发明实施例在获取用户的文本内容之后，可以对用户的文本内容进行解析，以确定其中是否存在领域关键词，如果存在，说明用户可能对该领域关键词对应的领域感兴趣，因此，可以向用户提供该领域关键词对应领域的推荐信息，以提高信息推荐的准确性。

在本发明的一种可选实施例中，所述确定所述文本内容中的领域关键词，具体可以包括：

步骤S11、对所述文本内容进行分词处理，以得到所述文本内容中的分词；

步骤S12、将所述文本内容中的分词与预置领域词进行匹配，以确定所述文本内容中的领域关键词。

本发明实施例可以预先建立领域词表，所述领域词表中可用于存储预置领域词及其对应的领域，例如，在领域词表中可以存储有预置领域词“琅琊榜”，以及该预置领域词对应的领域为“视频”。再如，所述领域词表中还可以存储有预置领域词“一汽大众”，以及该预置领域词对应的领域为“汽车”。可以理解，本发明实施例对于所述领域词表的具体建立方式，以及所述领域词表中的具体内容不加以限制。

在实际应用中，可以对获取的用户的文本内容进行分词处理，以得到所述文本内容中的分词。在本发明的一种应用示例中，假设获取的用户的文本内容为：“听说最近上映了谍影重重五，我们今晚去看吧！”首先，对上述文本内容进行分词处理，可以得到如下分词：“听说”、“最近”、“上映了”、“谍影重重五”、“我们”、“今晚”、“去看”、“吧”。然后，将上述分词与领域词表中的预置领域词进行匹配，假设在所述领域词表中，存在与分词“谍影重重五”相匹配的预置领域词，且预置领域词“谍影重重五”对应的领域为“视频”。因此，可以确定上述获取的用户的文本内容中存在领域关键词，且领域关键词为“谍影重重五”。

可以理解，本发明实施例对于确定文本内容中的领域关键词的具体方式不加以限制。例如，在确定所述文本内容中的领域关键词的过程中，可以不对文本内容进行分词，直接按字匹配所述预置领域词。具体地，从所述文本内容的第一个字开始进行遍历，选取预设大小的窗口，查询该窗口内的词是否与预置领域词相匹配。

仍以上述文本内容“听说最近上映了谍影重重五，我们今晚去看吧！”为例，假设预设的最大窗口为6，则遍历到“谍”字的时候，当前窗口大小为6，从“谍”字向右查找6个字得到当前窗口内的词为“谍影重重五，”由于领域词表中不存在与该词相匹配的预置领域词，则当前窗口大小更新为5，从“谍”字向右查找5个字得到当前窗口内的词为“谍影重重五”，领域词表中存在与该词相匹配的预置领域词，按照上述过程，直至遍历到文本内容的最后一个字。

在本发明的一种可选实施例中，如果所述文本内容中包含多个领域关键词，则从多个领域关键词选择与所述文本内容的末尾距离最近的领域关键词，并将选择的领域关键词应用于后续处理。在本发明的一种应用示例中，假设获取的用户的文本内容为：“一会儿去吃肯德基吧！听说最近上映了谍影重重五，我们今晚去看吧！”在该文本内容中，包括领域关键词“肯德基”，其对应的领域为“美食”，以及领域关键词“谍影重重五”，其对应的领域为“视频”。其中，领域关键词“谍影重重五”与文本内容的末尾距离最近，因此，可以确定所述文本内容中的领域关键词为“谍影重重五”。

在实际应用中，所述领域词表中存储的数据量可能较大，为了减轻客户端的存储负担，以及减轻客户端查询所述领域词表的内存负担，在本发明的一种可选实施例中，可以将所述领域词表存储在服务器中，客户端可以将获取的用户的文本内容上传至服务器，通过服务器对所述文本内容进行分词处理，确定其中的领域关键词，以及通过服务器根据所述领域关键词，确定所述文本内容对应的推荐信息，最后向客户端输出所述推荐信息。可以理解，本发明实施例对于所述领域词表的存储位置不加以限制。

在本发明的一种可选实施例中，所述根据所述领域关键词，确定所述文本内容对应的推荐信息的过程，具体可以包括：

步骤S21、获取所述领域关键词对应领域的相关信息；

步骤S22、根据所述相关信息，确定所述文本内容对应的推荐信息。

在本发明实施例中，在确定所述文本内容中的领域关键词之后，可以获取所述领域关键词对应领域的相关信息。其中，所述相关信息具体可以为：所述领域关键词对应领域范围内、与所述领域关键词具有关联关系的信息。所述关联关系具体可以包括：人物关系、语义逻辑关系、事件关系、人物与其他实体之间的关系等表示相关性的关系，本发明对于所述关联关系的具体形式不加以限制。例如，“TFBOYS”与“王俊凯”的关联关系为：“王俊凯”是“TFBOYS团队”的领军人物。

在获取所述领域关键词对应领域的相关信息之后，可以根据所述相关信息，确定所述文本内容对应的推荐信息。例如，在上述示例中，对于文本内容“听说最近上映了谍影重重五，我们今晚去看吧！”，首先可以确定其中存在领域关键词“谍影重重五”，且根据领域词表可以得知领域关键词“谍影重重五”对应的领域为“视频”。然后，可以获取“视频”领域范围内、与领域关键词“谍影重重五”具有关联关系的相关信息。例如，所述相关信息具体可以包括：“谍影重重五视频”、“谍影重重五剧情介绍”、“谍影重重五演员介绍”、“谍影重重五在线购票”等。最后，可以根据上述获取的相关信息，确定所述文本内容对应的推荐信息。例如，将“谍影重重五视频”、“谍影重重五剧情介绍”、“谍影重重五演员”、“谍影重重五在线观看”等作为文本内容“听说最近上映了谍影重重五，我们今晚去看吧！”对应的推荐信息。

可以理解，在实际应用中，本发明实施例对于步骤S22“根据所述相关信息，确定所述文本内容对应的推荐信息”对应的具体确定方式不加以限制，例如，可以将获取的所述相关信息直接作为推荐信息，或者，可以根据一定的筛选规则从所述相关信息中筛选出推荐信息。例如，可以将所述相关信息中搜索频率较高的热门内容作为推荐信息，或者，还可以根据用户偏好，对获取的所述相关信息进行筛选，从中确定出更加符合用户偏好的推荐信息等。

在实际应用中，一个领域关键词有可能对应多个领域，例如，对于领域关键词“苹果”，其可以对应领域“水果”，还可以对应领域“手机”。此时，可以根据所述领域关键词的上下文确定所述领域关键词对应的领域，例如，对于文本内容“我的手机坏了，这次想换个苹果”，根据上下文可以确定，该文本内容中的领域关键词“苹果”对应的领域为“手机”，则可以向用户提供与苹果手机相关的推荐信息。

在本发明的一种可选实施例中，在一个领域关键词对应多个领域时，还可以根据预先设置的领域得分，确定所述领域关键词对应的领域。例如，对于文本内容“我想去买苹果”，根据上下文仍然无法确定其中的领域关键词“苹果”对应的领域到底是“水果”还是“手机”。因此，可以根据预先设置的领域得分，确定该领域关键词对应的领域。具体地，可以在领域词表中预先设置每个预置领域词对应领域的领域得分，可以理解，本发明实施例对于设置领域得分的具体方式不加以限制，例如，可以根据用户的搜索频率，设置搜索频率较高的热门领域具有较高的得分等。

在本发明第一种应用示例中，在领域词表中，预置领域词“苹果”，可以对应领域“水果”，还可以对应领域“手机”，由于“苹果”在“手机”领域的搜索频率较高，而在“水果”领域的搜索频率较低，因此，可以设置“苹果”对应“水果”领域的领域得分较低，而设置“苹果”对应“手机”领域的领域得分较高。假设设置“苹果”对应领域“水果”的领域得分为30，对应领域“手机”的领域得分为80，则可以确定文本内容“我想去买苹果”中领域关键词“苹果”对应的领域为“手机”。

可以理解，上述确定领域关键词对应领域的方式仅作为本发明的一种应用示例，在实际应用中，本发明实施例对于确定领域关键词对应领域的具体方式不加以限制。

在本发明的一种可选实施例中，所述方法还可以包括：

对所述文本内容进行纠错，以得到纠错后的文本内容；

确定所述纠错后的文本内容中的领域关键词。

在实际应用中，用户的文本内容中可能存在错误，此种情况下，如果按照用户的文本内容获取推荐信息，将导致推荐信息远远偏离用户的需求。为了进一步提高信息推荐的准确性，本发明实施例还可以对获取的用户的文本内容进行纠错，以得到纠错后的文本内容。进而可以对纠错后的文本提取领域关键词，以及根据领域关键词确定推荐信息，以提高信息推荐的准确性。

具体地，可以采用现有的纠错方法对用户的文本内容进行纠错处理，本发明对于具体的纠错方法不加以限制。也即，上述步骤101中确定所述文本内容中的领域关键词，具体可以包括：确定纠错后的文本内容中的领域关键词。

进一步地，本发明实施例还可以将所述推荐信息对应的链接展示给用户，该链接可以指向以该推荐信息进行搜索的结果页面。用户通过点击推荐信息对应的链接，即可进入以该推荐信息进行搜索的结果页面，由于可以节省手动输入搜索词进行搜索的操作，故可以简化用户操作，提高用户的搜索效率。

综上，本发明实施例可以根据用户的文本内容中的领域关键词，确定所述文本内容对应的推荐信息，以及向用户输出所述推荐信息。所述领域可以指某一专业性范围，如果用户的文本内容中存在领域关键词，说明用户对该领域关键词对应的领域感兴趣，也即用户对某一专业性范围内的信息感兴趣。因此，可以向用户提供该领域的相关信息作为推荐信息，以使推荐信息对用户具有针对性。此外，由于用户的文本内容可以包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容，也即用户的文本内容具有实时性，因此，本发明实施例的推荐信息具有实时性，可以体现用户的当前需求。可以看出，本发明实施例向用户提供的推荐信息具有针对性和实时性，进而可以提高信息推荐的准确性。

方法实施例二

在实际应用中，有些用户的文本内容中虽然存在领域关键词，但是该用户有可能并没有该领域的信息推荐需求，因此，为了使得信息推荐能够更加符合用户的需求，本发明实施例在所述根据所述领域关键词，确定所述文本内容对应的推荐信息之前，还可以依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件，如果符合推荐条件，可以向用户推荐该领域相关的推荐信息，如果所述文本内容不符合推荐条件，则不用户推荐该领域相关的推荐信息，以减少对用户带来不必要的烦扰，以及可以减少服务器所需处理的数据，进而可以提高服务器处理效率。

参照图2，示出了本发明的一种信息推荐方法实施例二的步骤流程图，具体可以包括：

步骤201、获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容具体可以包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；

步骤202、依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件；

本发明实施例可以通过预置的判定模型来判断所述文本内容是否符合推荐条件，其中，所述判定模型可以为根据收集的语料训练得到的。具体地，可以将所述文本内容输入预置的判定模型，通过所述判定模型对所述文本内容进行语义分析，以判断所述文本内容是否符合推荐条件，以及通过所述判定模型输出判定结果。例如，若文本内容符合推荐条件，则判定模型可以输出判定结果为1，若文本内容不符合推荐条件，则判定模型可以输出判定结果为0。

在实际应用中，如果将整个文本内容都输入判定模型，将会导致判定模型的计算量较大，进而影响判定模型的计算速度，因此，为了减少判定模型计算的数据量，提高判定模型的计算速度，本发明实施例对所述文本内容进一步处理，提取其中包含领域关键词的语言单位，并且将领域关键词替换为预置字符，仅将替换后的语言单位输入判定模型，由此可以极大地减少判定模型所需计算的数据量，进而可以提高判定模型的计算速度，进一步可以提高信息推荐的速度。

在本发明的一种可选实施例中，所述依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件，具体可以包括：

步骤S31、确定所述文本内容中包含领域关键词的第一语言单位；

所述第一语言单位可以指语言的使用单位，所述第一语言单位具体可以包括：段落、句子、分句、短语、词组等。为便于描述，本发明实施例均以句子为第一语言单位为例进行说明。

在本发明的一种应用示例中，假设获取的用户的文本内容如下：“我现在好饿啊，先去吃点东西。听说最近上映了谍影重重五，我们今晚去看吧！”，该文本内容包含两个语言单位，也即包含两个句子，分别为“我现在好饿啊，先去吃点东西。”、以及“听说最近上映了谍影重重五，我们今晚去看吧！”。分别对上述两个句子进行分词处理，以及匹配预置领域词，可以确定“听说最近上映了谍影重重五，我们今晚去看吧！”为包含领域关键词的第一语言单位。

步骤S32、将所述第一语言单位中的领域关键词替换为预置字符，以得到替换后的第一语言单位；

所述预置字符具体可以为预先设置的任意字符，字符是指计算机中使用的字母、数字、字和符号，本发明实施例对于具体的预置字符不加以限制，本发明实施例中以预置字符为“#”为例。所述预置字符可用于替代领域关键词，判定模型可以不对所述预置字符进行处理，可以减少领域关键词对语义分析带来的干扰，以及减少判定模型所需处理的数据量。

例如，无论第一语言单位为：“听说最近上映了谍影重重五，我们今晚去看吧！”，还是第一语言单位为：“听说最近上映了星际大战，我们今晚去看吧！”，通过对二者的语义进行分析，都可以得知用户表达了今晚想要去看某个电影，也即用户对今晚要看的电影感兴趣，因此，本发明实施例将第一语言单位中的领域关键词替换为预置字符如“#”，则上述两个第一语言单位经过替换后，都可以得到如下替换后的第一语言单位：“听说最近上映了#，我们今晚去看吧！”，由此，可以减少领域关键词对语义分析带来的干扰，以及减少判定模型所需处理的数据量。

步骤S33、将所述替换后的第一语言单位输入预置的判定模型，以通过所述判定模型判断所述文本内容是否符合推荐条件。

将替换后的第一语言单位输入预置的判定模型之后，判定模型对所述替换后的第一语言单位进行判断，最终输出所述替换后的第一语言单位是否符合推荐条件的判定结果。例如，如果输出的判定结果为1，则可以确定所述替换后的第一语言单位符合推荐条件，因此，可以确定获取的用户的文本内容也符合推荐条件；如果输出的判定结果为0，则可以确定所述替换后的第一语言单位不符合推荐条件，因此，可以确定获取的用户的文本内容也不符合推荐条件。

可以理解，在实际应用中，本发明实施例对于所述判定模型的存储位置不加以限制，例如，所述判定模型可以存储在客户端或者服务器。可选地，为了节省客户端的内存以及存储负担，本发明实施例可以将所述判定模型存储在服务器。

在本发明的一种可选实施例中，具体可以通过如下步骤训练得到所述判定模型：

步骤S41、确定语料中包含领域关键词的第二语言单位；

所述语料，是指在语言的实际使用中真实出现过的语言材料；语料通常储存在语料库中，语料库是以电子计算机为载体承载语料的数据库。本发明实施例对于收集的语料的具体内容不加以限制，例如可以为从互联网中收集的互联网语料，还可以为收集的大量用户在通讯环境中输入的、和/或、接收到的聊天语料等。

所述第二语言单位可以指语言的使用单位，所述第二语言单位具体可以包括：段落、句子、分句、短语、词组等。为便于描述，本发明实施例均以句子为第二语言单位为例进行说明。

在本发明实施例中，可以首先对收集的语料按照第二语言单位进行分割，然后将分割得到的第二语言单位进行分词处理，再将得到的分词与预置领域词进行匹配，以得到包含领域关键词的第二语言单位。

步骤S42、将所述第二语言单位中的领域关键词替换为预置字符，以得到替换后的第二语言单位；

本发明实施例在训练判定模型的过程中，将领域关键词替换为统一的预置字符，可以减少不同关键词给模型训练带来的干扰，以及减少训练过程中的数据量，进而可以提高模型训练的准确性和速度。

步骤S43、对所述替换后的第二语言单位进行标记，以得到训练数据；

本发明实施例可以采用人工标记等方式，对替换后的第二语言单位进行标记，例如，对于第二语言单位“咱们一起去吃肯德基吧！”，其中包含美食领域的领域关键词“肯德基”，将领域关键词替换为预置字符后得到替换后的第二语言单位为：“咱们一起去吃#吧！”，根据语义分析，得知该用户具有吃”#”类别的美食的需求，因此，该第二语言单位满足推荐条件，则可以将该第二语言单位标记为1。

再如，如果第二语言单位为：“我今晚不想吃肯德基！”，通过对领域关键词进行替换后，可以得到替换后的第二语言单位为：“我今晚不想吃#！”，根据语义分析，得知该用户不具有吃”#”类别的美食的需求，因此，该第二语言单位不满足推荐条件，则可以将该第二语言单位标记为0。

本发明实施例对替换后的第二语言单位进行标记后，可以将标记后的第二语言单位作为训练数据。

步骤S44、根据预置的训练模型对所述训练数据进行训练，以得到训练后的判定模型。

在确定训练数据之后，可以采用预置的训练模型对所述训练数据进行训练。在本发明的一种可选实施例中，所述预置的训练模型具体可以包括：时间递归神经网络模型、和/或、逻辑回归模型。

在本发明实施例中，可以采用深度学习模型对训练数据进行语义分析，以及采用分类模型对语义分析后的训练数据进行分类。具体地，所述深度学习模型具体可以为LSTM(Long Short-Term Memory，长短时记忆网络)模型，所述分类模型具体可以为LR(LogisticRegression，逻辑回归)模型。

其中，LSTM模型可用于对所述训练数据的语义进行分析，并且用向量来表示语义，以得到所述训练数据对应的语义向量，所述LSTM模型将得到的语义向量输入LR模型，LR模型可用于对输入的语义向量进行分类，即将语义向量分类为：符合推荐条件或者不符合推荐条件，以及输出最终的判定结果，如输出判定结果为1(符合推荐条件)或者输出判定结果为0(不符合推荐条件)。

在实际的训练过程中，本发明实施例对于训练的粒度不加以限制，例如，可以将训练数据进行分词处理，按照分词粒度进行训练，或者，还可以按照字的粒度进行训练等。以字为粒度进行训练，可以避免训练过程中的词表过大，可以极大地减少训练时间以及提高训练速度。此外，在以字为粒度进行训练的过程中，LSTM模型仅将训练数据中的最后一个字作为输出，输入到LR模型中，可以提高分类的速度。

可以理解，上述采用LSTM模型和LR模型来训练判定模型，仅作为本发明的一种应用示例，本发明实施例对于具体的训练模型不加以限制，例如还可以采用RNN(Recurrentneural Network，循环神经网络)模型、或者CNN(Convolutional Neural Network，卷积神经网络)模型等。

步骤203、若所述文本内容符合推荐条件，则根据所述领域关键词，确定所述文本内容对应的推荐信息；

步骤204、输出所述推荐信息。

综上，本发明实施例还可以依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件，如果符合推荐条件，可以向用户推荐领域关键词对应领域的推荐信息，如果所述文本内容不符合推荐条件，则不用向用户推荐领域关键词对应领域的推荐信息，以减少对用户带来不必要的烦扰，以及可以减少服务器所需处理的数据，进而可以提高服务器处理效率。

应用示例

为了使得本领域技术人员更加清楚地理解本发明的信息推荐方法，下面结合具体的应用示例说明本发明的信息推荐方法的具体实现步骤。在本示例中，以在通讯环境下获取用户的文本内容为例，且本示例中用于存储预置领域词的领域词表、以及用于判断文本内容是否符合推荐条件的判定模型均存储在服务器中。本发明的信息推荐方法具体可以包括如下步骤：

步骤A1、客户端获取文本内容；

具体地，可以通过输入法程序获取用户在通讯环境中输入的文本内容。例如，获取用户在聊天应用中输入的文本内容为：“我现在好饿啊，先去吃点东西。听说最近上映了谍影重重五，我们今晚去看吧！”。

步骤A2、客户端将步骤A1获取的文本内容发送至服务器；

步骤A3、服务器判断所述文本内容中是否存在领域关键词；若存在，则提取所述文本内容中的领域关键词，以及执行步骤A4；若不存在，则执行步骤A8；

具体地，可以通过服务器对所述文本内容进行分词，以得到所述文本内容中的分词，服务器根据所述文本内容中的分词，匹配预先存储的领域词表中的预置领域词，以判断所述文本内容中是否存在领域关键词。例如，可以确定上述文本内容中包含领域关键词“谍影重重五”，且对应领域为“视频”。

步骤A4、服务器判断所述文本内容是否符合推荐条件；如果符合推荐条件，则执行步骤A5；如果不符合推荐条件，则执行步骤A8；

首先，服务器确定所述文本内容中包含领域关键词的第一语言单位。具体地，可以确定上述文本内容中包含领域关键词的第一语言单位为：“听说最近上映了谍影重重五，我们今晚去看吧！”；

然后，将所述第一语言单位中的领域关键词替换为预置字符，以得到替换后的第一语言单位。具体地，将第一语言单位“听说最近上映了谍影重重五，我们今晚去看吧！”中的领域关键词“谍影重重五”替换为预置字符“#”，可以得到如下替换后的第一语言单位：“听说最近上映了#，我们今晚去看吧！”。

最后，将所述替换后的第一语言单位输入预置的判定模型，以通过所述判定模型判断所述文本内容是否符合推荐条件。具体地，将“听说最近上映了#，我们今晚去看吧！”输入判定模型，最终输出的判定结果为1，说明所述文本内容符合推荐条件，则可以向用户推荐所述领域关键词对应领域的推荐信息，执行步骤A5。

步骤A5、服务器获取所述领域关键词对应领域的相关信息；

步骤A6、服务器根据所述相关信息，确定所述文本内容对应的推荐信息；

由于上述文本内容中领域关键词对应的领域为“视频”，且上述文本内容符合推荐条件，则可以向当前用户提供领域关键词“谍影重重五”对应领域的推荐信息。例如，可以确定如下推荐信息：“谍影重重五剧情介绍”、“谍影重重五在线购票”、或者还可以推荐同期、即将上映的类似影片等。

步骤A7、服务器向客户端输出所述推荐信息；

步骤A8、结束。

装置实施例

参照图3，示出了本发明的一种信息推荐装置实施例的结构框图，具体可以包括：

获取模块301，用于获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容具体可以包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；

确定模块302，用于根据所述领域关键词，确定所述文本内容对应的推荐信息；

输出模块303，用于输出所述推荐信息。

可选地，所述获取模块301，具体可以包括：

可选地，所述装置还可以包括：

可选地，所述判断模块，具体可以包括：

可选地，所述装置还可以包括：训练模块，用于训练得到所述判定模型；所述训练模块，具体可以包括：

可选地，所述预置的训练模型具体可以包括：时间递归神经网络模型、和/或、逻辑回归模型。

可选地，所述确定模块302，具体可以包括：

可选地，所述装置还可以包括：

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本发明实施例还提供了一种用于信息推荐的装置，该装置可以包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；根据所述领域关键词，确定所述文本内容对应的推荐信息；输出所述推荐信息。

可选地，所述确定所述文本内容中的领域关键词，包括：

确定所述文本内容中包含领域关键词的第一语言单位；

确定语料中包含领域关键词的第二语言单位；

对所述替换后的第二语言单位进行标记，以得到训练数据；

获取所述领域关键词对应领域的相关信息；

根据所述相关信息，确定所述文本内容对应的推荐信息。

对所述文本内容进行纠错，以得到纠错后的文本内容；

确定所述纠错后的文本内容中的领域关键词。

图4是根据一示例性实施例示出的一种用于信息推荐的装置800的框图。例如，装置800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图4，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理组件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由设备(终端或服务器)的处理器执行时，使得设备能够执行一种信息推荐方法，所述方法包括：获取文本内容，并确定所述文本内容中的领域关键词；其中，所述文本内容包括：用户输入的文本内容、和/或、用户接收的文本内容、和/或、根据用户输入或者接收的语音转换得到的文本内容；根据所述领域关键词，确定所述文本内容对应的推荐信息；输出所述推荐信息。

可选地，所述确定所述文本内容中的领域关键词，包括：

可选地，在所述根据所述领域关键词，确定所述文本内容对应的推荐信息之前，所述处理器还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

确定所述文本内容中包含领域关键词的第一语言单位；

可选地，通过如下步骤训练得到所述判定模型：

确定语料中包含领域关键词的第二语言单位；

对所述替换后的第二语言单位进行标记，以得到训练数据；

获取所述领域关键词对应领域的相关信息；

根据所述相关信息，确定所述文本内容对应的推荐信息。

可选地，所述处理器还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

对所述文本内容进行纠错，以得到纠错后的文本内容；

确定所述纠错后的文本内容中的领域关键词。

图5是本发明实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作系统1941，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

以上对本发明所提供的一种信息推荐方法、一种信息推荐装置和一种用于信息推荐的装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

根据所述领域关键词，确定所述文本内容对应的推荐信息；

输出所述推荐信息。

2.根据权利要求1所述的方法，其特征在于，所述确定所述文本内容中的领域关键词，包括：

3.根据权利要求1所述的方法，其特征在于，在所述根据所述领域关键词，确定所述文本内容对应的推荐信息之前，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述依据所述文本内容中的领域关键词，判断所述文本内容是否符合推荐条件，包括：

确定所述文本内容中包含领域关键词的第一语言单位；

5.根据权利要求4所述的方法，其特征在于，通过如下步骤训练得到所述判定模型：

确定语料中包含领域关键词的第二语言单位；

对所述替换后的第二语言单位进行标记，以得到训练数据；

6.根据权利要求1所述的方法，其特征在于，所述根据所述领域关键词，确定所述文本内容对应的推荐信息，包括：

获取所述领域关键词对应领域的相关信息；

根据所述相关信息，确定所述文本内容对应的推荐信息。

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对所述文本内容进行纠错，以得到纠错后的文本内容；

确定所述纠错后的文本内容中的领域关键词。

8.一种信息推荐装置，其特征在于，包括：

输出模块，用于输出所述推荐信息。

9.一种用于信息推荐的装置，其特征在于，包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

根据所述领域关键词，确定所述文本内容对应的推荐信息；

输出所述推荐信息。

10.一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行如权利要求1至7中一个或多个所述的信息推荐方法。