CN109241431B

CN109241431B - 一种资源推荐方法和装置

Info

Publication number: CN109241431B
Application number: CN201811045757.7A
Authority: CN
Inventors: 刘安安; 翟俊杰
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-09-07
Filing date: 2018-09-07
Publication date: 2023-11-07
Anticipated expiration: 2038-09-07
Also published as: CN109241431A

Abstract

本发明实施例公开了一种资源推荐方法和装置，用于提高向用户推荐资源的效果。本发明实施例提供一种资源推荐方法，包括：获取用户的推荐请求，所述推荐请求包括：所述用户的唯一标识；根据所述用户的唯一标识查询神经网络模型的用户画像参数，输出所述用户的用户画像，所述用户画像参数包括所述神经网络模型根据所述用户的历史行为信息学习到的所述用户的隐层语义兴趣信息；使用所述神经网络模型对资源推荐池中的资源进行向量化处理，得到所述资源对应的资源描述信息；根据所述用户画像与所述资源描述信息之间的匹配度从所述资源推荐池中筛选出与所述用户匹配的资源，并将与所述用户匹配的资源推荐给所述用户。

Description

一种资源推荐方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种资源推荐方法和装置。

背景技术

现有技术中可以对用户进行画像刻画，然后基于得到的用户画像进行新闻推荐。在刻画用户画像时，常采用的方法是：基于用户的行为和新闻的属性计算用户对不同属性的偏好，以此向用户推荐新闻，其中，新闻的属性可以包括：分类、主题(topic)、标签(tag)。

现有技术中，主要是基于统计的方法来刻画用户画像，以基于主题的画像计算过程为例，主要分为以下步骤：首先收集用户u的点击历史(d1,d2,…)。然后根据主题模型推断新闻的主题分布。最后计算用户向量，其方法是点击过新闻的主题分布的平均值。

上述现有技术至少存在如下的缺点：1)、存在推荐效果差的问题。现有技术依赖新闻的属性(例如分类、主题、标签)的抽取准确率，如果抽取模型的结果有错误，在用户画像刻画时会累计这些错误，从而造成推荐效果差的问题。而且基于新闻的属性实现的抽取模型进行建模时，没有考虑推荐业务的场景，抽取模型是有偏的，也会进一步导致推荐效果差。2)存在语义偏移的问题。现有技术中基于统计(例如求平均、累加)的方法，容易出现语义偏移的现象，例如用户点击了“百度AI正百米冲刺令国际侧目”和“搜索引擎技术原理与Twitter实时搜索引擎的进化”两篇新闻，则这两篇新闻的主题有较大的差别(一个主题是百度AI、另一个主题是搜索)，但是基于现有技术中的统计方法，刻画出的用户向量和“利用百度搜索热度来做SEO优化”相关的新闻向量是相近的，而显然给用户推荐的这篇新闻并不是与用户匹配的，因此存在语义偏移的问题。

发明内容

本发明实施例提供了一种资源推荐方法和装置，用于提高向用户推荐资源的效果。

本发明实施例提供以下技术方案：

一方面，本发明实施例提供一种资源推荐方法，包括：

获取用户的推荐请求，所述推荐请求包括：所述用户的唯一标识；

根据所述用户的唯一标识查询神经网络模型的用户画像参数，输出所述用户的用户画像，所述用户画像参数包括所述神经网络模型根据所述用户的历史行为信息学习到的所述用户的隐层语义兴趣信息；

使用所述神经网络模型对资源推荐池中的资源进行向量化处理，得到所述资源对应的资源描述信息；

根据所述用户画像与所述资源描述信息之间的匹配度从所述资源推荐池中筛选出与所述用户匹配的资源，并将与所述用户匹配的资源推荐给所述用户。

另一方面，本发明实施例还提供一种资源推荐装置，包括：

请求获取模块，用于获取用户的推荐请求，所述推荐请求包括：所述用户的唯一标识；

画像生成模块，用于根据所述用户的唯一标识查询神经网络模型的用户画像参数，输出所述用户的用户画像，所述用户画像参数包括所述神经网络模型根据所述用户的历史行为信息学习到的所述用户的隐层语义兴趣信息；

向量化处理模块，用于使用所述神经网络模型对资源推荐池中的资源进行向量化处理，得到所述资源对应的资源描述信息；

资源推荐模块，用于根据所述用户画像与所述资源描述信息之间的匹配度从所述资源推荐池中筛选出与所述用户匹配的资源，并将与所述用户匹配的资源推荐给所述用户。

在前述方面中，资源推荐装置的组成模块还可以执行前述一方面以及各种可能的实现方式中所描述的步骤，详见前述对前述一方面以及各种可能的实现方式中的说明。

另一方面，本发明实施例提供一种资源推荐装置，该资源推荐装置包括：处理器、存储器；存储器用于存储指令；处理器用于执行存储器中的指令，使得资源推荐装置执行如前述一方面中任一项的方法。

另一方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面所述的方法。

在本发明实施例中，首先获取用户的推荐请求，推荐请求包括：用户的唯一标识，然后根据用户的唯一标识查询神经网络模型的用户画像参数，输出用户的用户画像，用户画像参数包括神经网络模型根据用户的历史行为信息学习到的用户的隐层语义兴趣信息，使用神经网络模型对资源推荐池中的资源进行向量化处理，得到资源对应的资源描述信息，最后根据用户画像与资源描述信息之间的匹配度从资源推荐池中筛选出与用户匹配的资源，并将与用户匹配的资源推荐给用户。由于本发明实施例中可以通过神经网络模型得到用户画像，该用户画像可以刻画用户的隐层语义兴趣，因此采用用户画像可以实现对用户更深层次的表达，通过该用户画像可以从资源推荐池中筛选出与用户精确匹配的资源，进行实现为用户准确的推荐资源，提高向用户推荐资源的效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种资源推荐方法的流程方框示意图；

图2为本发明实施例提供的另一种资源推荐方法的流程方框示意图；

图3为本发明实施例中神经网络模型的离线训练与线上推荐的示意图；

图4为本发明实施例提供的训练语料的原始数据示意图；

图5为本发明实施例提供的深度神经网络模型的示意图；

图6为本发明实施例提供的离线评测结果的对比示意图；

图7-a为本发明实施例提供的一种资源推荐装置的组成结构示意图；

图7-b为本发明实施例提供的另一种资源推荐装置的组成结构示意图；

图7-c为本发明实施例提供的一种模型训练模块的组成结构示意图；

图7-d为本发明实施例提供的一种模型训练单元的组成结构示意图；

图7-e为本发明实施例提供的一种资源推荐模块的组成结构示意图；

图8为本发明实施例提供的资源推荐方法应用于终端的组成结构示意图；

图9为本发明实施例提供的资源推荐方法应用于服务器的组成结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，下面所描述的实施例仅仅是本发明一部分实施例，而非全部实施例。基于本发明中的实施例，本领域的技术人员所获得的所有其他实施例，都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。

以下分别进行详细说明。

本发明资源推荐方法的一个实施例，具体可以应用于向用户推荐各种资源的场景。例如本发明实施例提供的资源推荐场景可以是新闻推荐场景，或者游戏软件推荐场景，或者商品(例如母婴类商品)推荐场景。本发明实施例神经网络模型可以刻画出用户的用户画像，从而可以基于用户画像向该用户推荐资源。本发明实施例中设计一个同时蕴含用户画像和资源描述的神经网络模型，使得用户画像和资源描述可以存在于同一个空间中，并且这两者是可比较的，在推荐系统中可以快速利用本发明实施例中神经网络模型输出的用户画像。

请参阅图1所示，本发明一个实施例提供的资源推荐方法，可以包括如下步骤：

101、获取用户的推荐请求，推荐请求包括：用户的唯一标识。

在本发明实施例中，用户是指请求推荐服务的发起方，用户可以向资源推荐装置发送推荐请求，在用户发送的推荐请求中可以包括用户的唯一标识，资源推荐装置解析该推荐请求可以获取到用户的唯一标识。其中，用户的唯一标识是用户的身份标识，以区别于推荐装置所服务的其它用户即可。本发明实施例资源推荐装置具体可以是一个资源推荐终端，用户操作移动终端与该资源推荐终端进行交互。本发明实施例资源推荐装置具体可以是一个服务器，用户操作移动终端与该服务器进行交互。

102、根据用户的唯一标识查询神经网络模型的用户画像参数，输出用户的用户画像，用户画像参数包括所述神经网络模型根据用户的历史行为信息学习到的用户的隐层语义兴趣信息。

在本发明实施例中，资源推荐装置可以预先训练出神经网络模型，该神经网络模型可以采用多种机器学习算法完成训练，例如该神经网络模型具体可以是深度神经网络模型(Deep Neural Networks，DNN)、循环神经网络模型等。资源推荐装置预先收集用户的历史行为信息，然后通过用户的历史行为信息进行模型训练后，输出神经网络模型。模型的训练过程详见后续实施例的说明。

本发明实施例中神经网络模型的用户画像参数可用于刻画用户画像，当神经网络模型中输入用户的唯一标识时，神经网络模型在训练完成后可以得到该神经网络模型的用户画像参数，每个用户对应有一个用户画像参数，通过用户的唯一标识查询神经网路模型的用户画像参数，可以输出用户的用户画像。其中，用户画像可用于刻画用户的隐层语义兴趣，用户画像可以包括用户向量，用户向量是实数向量。用户画像所刻画出的隐层语义兴趣区别于现有技术中的显式兴趣(比如分类、关键词等)，用户画像是对文本(例如分类、关键词)更深层次的表达。

103、使用神经网络模型对资源推荐池中的资源进行向量化处理，得到资源描述信息。

其中，资源推荐装置可以使用神经网络模型对资源推荐池中的所有资源进行向量化处理，例如向量化处理可以通过Sentence to Vector来实现，Sentence2vector可用于对资源进行向量化。通过向量化处理可以压缩资源的原有大小，例如可以把资源从一个12.3万维的稀疏向量压缩成200维的稠密向量。通过对资源推荐池中的所有资源分别进行向量化处理，可以得到每个资源对应的资源描述信息，其中，资源描述信息可以是资源向量，通过实数向量来刻画资源的隐层语义信息。

104、根据用户画像与资源描述信息之间的匹配度从资源推荐池中筛选出与用户匹配的资源，并将与用户匹配的资源推荐给用户。

在本发明实施例中，资源推荐池中保存有多个资源，在通过神经网络模型输出用户的用户画像之后，可以首先计算出该用户画像与每个资源对应的资源描述信息之间的匹配度，即将用户画像与资源推荐池中存储的多个资源进行匹配，匹配度的计算可以通过用户画像与资源描述信息这两个向量之间的距离来实现。根据该匹配度从该资源推荐池中筛选出与用户匹配的资源，其中，与用户匹配的资源是指资源推荐池中与该用户画像能够适配的至少一个资源。在筛选出可推荐的资源之后，向用户推荐与用户匹配的资源，从而用户可以在发送推荐请求之后看到资源推荐装置为该用户所推荐的资源。在实际应用中，可以使用推荐系统向用户推荐与用户匹配的资源。举例说明如下，用户在使用新闻客户端应用程序(APP)时，资源推荐装置可以通过该新闻客户端向用户显示该装置所推荐给用户的资源。

在本发明的一些实施例中，步骤104中的根据用户画像与资源描述信息之间的匹配度从资源推荐池中筛选出与用户匹配的资源，包括：

使用用户画像分别和资源推荐池中每个资源对应的资源描述信息进行得分计算，得到资源推荐池中每个资源对应的分值；

根据资源推荐池中每个资源对应的分值确定与用户匹配的k个资源，k为预设的召回资源个数。

在获取到资源推荐池中每个资源对应的资源描述信息之后，可以使用评价函数对用户画像分别与资源推荐池中每个资源对应的资源描述信息进行得分计算，得到了资源推荐池中每个资源对应于用户画像的分值，对于不同的评价函数所得到的分值具有不同的表现形式，但是通过资源推荐池中所有资源对应的分值，可以筛选出与用户匹配的多个资源，例如筛选的资源个数为预设的召回资源个数，用字母k来表示。

在本发明的一些实施例中，前述步骤104将与用户匹配的资源推荐给用户，包括：

将与用户匹配的k个资源加入到召回队列中；

将召回队列推送给用户。

其中，本发明实施例中资源推荐池中根据用户画像进行资源推荐可以由推荐系统来完成，在该推荐系统中可以包括：召回模块、排序模块、推荐策略模块等。通过召回模块可以快速找到用户潜在感兴趣的资源，缩短推荐服务的响应时间。根据资源推荐池中每个资源对应的分值确定与用户匹配的k个资源之后，将这k个资源加入到召回队列中，再由推荐策略模块将召回队列推送给用户，用户可以通过召回队列中所包括的资源确定出本次推荐的资源。

通过以上实施例对本发明实施例的描述可知，首先获取用户的推荐请求，推荐请求包括：用户的唯一标识，然后根据用户的唯一标识查询神经网络模型的用户画像参数，输出用户的用户画像，用户画像参数包括神经网络模型根据用户的历史行为信息学习到的用户的隐层语义兴趣信息，使用神经网络模型对资源推荐池中的资源进行向量化处理，得到资源对应的资源描述信息，最后根据用户画像与资源描述信息之间的匹配度从资源推荐池中筛选出与用户匹配的资源，并将与用户匹配的资源推荐给用户。由于本发明实施例中可以通过神经网络模型得到用户画像，该用户画像可以刻画用户的隐层语义兴趣，因此采用用户画像可以实现对用户更深层次的表达，通过该用户画像可以从资源推荐池中筛选出与用户精确匹配的资源，进行实现为用户准确的推荐资源，提高向用户推荐资源的效果。

在本发明的一些实施例中，在获取用户的推荐请求之前，本发明实施例还可以通过如下方式完成对神经网络模型的训练。如图2所示，本发明实施例提供的方法还包括如下步骤：

201、从用户的历史行为信息中获取到用户的推荐历史信息和点击历史信息。

在本发明实施例中，用户在使用资源服务时会产生历史行为信息，首先通过分析该历史行为信息，可以得到用户的推荐历史信息和点击历史信息。其中，推荐历史信息包括向用户推荐的历史资源，点击历史信息包括该用户点击的历史资源。

202、根据推荐历史信息和点击历史信息生成训练语料，训练语料包括：用户点击的资源和推荐给用户但没有点击的资源。

在获取到用户的推荐历史信息和点击历史信息之后，可以根据用户的推荐历史信息和点击历史信息来生成训练语料，其中训练语料是用于神经网络模型的训练，在训练语料中包括有用户点击的资源和推荐给用户但没有点击的资源。

举例说明如下，训练语料用Triple表示，本发明实施例中可以使用三元组(user，show，click)表示一条训练语料，其中user表示用户，show表示给用户推荐但是没有点击的一篇资源，click表示用户点击的一篇资源。例如，推荐系统给用户u推荐了3个资源(a,b,c)，用户点击了资源b。那么show是指资源a或者资源c，click是指资源b。通过这次推荐和用户产生的行为，可以获取到的如下的两个训练语料：三元组(u,a,b)和(u,c,b)。

203、使用训练语料对神经网络模型进行训练，在神经网络模型的网络参数满足结束条件时输出神经网络模型。

在本发明实施例中，可以设计神经网络模型，通过训练语料来训练该模型的网络参数，例如本发明实施例中可以使用深度神经网络模型的方法来获取到用户画像和资源描述信息。本发明实施例通过设计新的神经网络模型，使用一组向量来刻画用户和资源，从而提高线上的推荐效果。

进一步的，在本发明的一些实施例中，步骤203使用训练语料对神经网络模型进行训练，包括：

当训练语料中的资源包括有标题时，对训练语料中的资源的标题进行切词，得到训练语料中每个资源对应的标题向量，标题向量包括：用户点击的资源的标题切词结果和推荐给用户但没有点击的资源的标题切词结果；

使用训练语料中每个资源对应的标题向量对神经网络模型进行训练。

其中，在以资源为文本的推荐场景中，训练语料中的资源可以包括标题，首先对每个资源的标题进行切词，其中，切词又称为分词，是把一句话做切分，每个切分单元是一个词。比如句子“我爱北京天安门。”，切词结果包含5个词：“我”、“爱”、“北京”、“天安门”、“。”。对于每个训练语料中的每个资源都可以得到一个标题向量，该标题向量包括：用户点击的资源的标题切词结果和推荐给用户但没有点击的资源的标题切词结果，其中，每个标题切词结果都可以用词袋模型(bag of words)的形式描述，每个标题切词结果可以是一个维度为12.3万的向量。在得到训练语料中每个资源对应的标题向量之后，可以使用训练语料中每个资源对应的标题向量对神经网络模型进行训练，即使用训练语料中每个资源对应的标题向量训练神经网路模型的模型参数，训练语料中所有资源对应的标题向量共享神经网络模型的模型参数。

进一步的，在本发明的一些实施例中，使用训练语料中每个资源对应的标题向量对神经网络模型进行训练，可以包括如下过程：

对标题向量中的每个词的词向量进行向量化处理，得到词向量化结果；

使用词向量化结果对神经网络模型进行训练。

其中，本发明实施例可以对标题向量中的所有词的词向量进行向量化处理，例如向量化处理可以通过Sentence to Vector来实现，Sentence2vector可用于对资源进行向量化。通过向量化处理可以压缩资源的原有大小，例如可以把词向量从一个12.3万维的稀疏向量压缩成200维的稠密向量。通过对标题向量中的所有词的词向量分别进行向量化处理，可以得到每个词向量对应的词向量化结果，例如该词向量化结果可以是SentenceVector，即使用Sentence to Vector这个方法生成的结果。词向量化结果是实数向量，通过词向量化结果可以来刻画资源的隐层语义信息，基于标题向量中每个词向量对应的词向量化结果，可以对神经网络模型进行训练。

进一步的，在本发明的一些实施例中，使用词向量化结果对神经网络模型进行训练，包括：

将词向量化结果输入神经网络模型的激活函数进行计算，得到计算结果；

将计算结果输入神经网络模型的线性函数进行计算，得到资源描述信息；

使用用户画像分别和训练语料中每个资源对应的资源描述信息进行得分计算，得到训练语料中每个资源对应的分值；

根据训练语料中每个资源对应的分值对神经网络模型的损失函数进行计算，并在损失函数达到最小时结束模型训练。

其中，神经网络模型可以包括激活函数和线性函数，例如在神经网络模型中可以包括三层：两个激活函数(Relu)层和一个线性函数(Linear)层。首先将词向量化结果输入神经网络模型的激活函数进行计算，得到计算结果，该计算结果可以是依次经过神经网络模型的两个激活函数后得到的计算结果。在获取到激活函数计算出的结果之后，再将计算结果输入线性函数进行计算，可以得到资源描述信息，该资源描述信息可以包括：资源的语义要素(semantic feature)。在获取到训练语料中每个资源对应的资源描述信息之后，可以使用评价函数对用户画像分别与训练语料中每个资源对应的资源描述信息进行得分计算，得到了训练语料中每个资源对应于用户画像的分值，对于不同的评价函数所得到的分值具有不同的表现形式。最后根据训练语料中每个资源对应的分值对神经网络模型的损失函数进行计算，神经网络模型的优化目标是最小化损失值，在损失函数达到最小时结束模型训练。

通过以上实施例对本发明实施例的描述可知，本发明实施例可以训练出一个同时蕴含用户画像和资源描述的神经网络模型，使得用户向量和资源向量在同一个空间中，两者的向量是可比较的，在推荐系统中可以快速利用到本发明实施例所刻画出的用户画像。由于本发明实施例中可以通过神经网络模型得到用户画像，该用户画像可以刻画用户的隐层语义兴趣，因此采用用户画像可以实现对用户更深层次的表达，通过该用户画像可以从资源推荐池中筛选出与用户精确匹配的资源，进行实现为用户准确的推荐资源，提高向用户推荐资源的效果。

为便于更好的理解和实施本发明实施例的上述方案，下面举例相应的应用场景来进行具体说明。

本实施例中提供的资源推荐方法可以作为推荐系统的一部分，应用于客户端的推荐信息流服务中。请参阅图3所示，为本发明实施例中神经网络模型的离线训练与线上推荐的示意图。本发明实施例可以分为3个过程:获取训练语料、训练网络模型、线上推荐，接下来会详细描述这3个过程。

在图3所示的系统框架中分为：离线模型训练以及在线推荐两个部分，在离线模型训练中，首先获取训练语料，根据用户的推荐历史和点击历史，生成训练语料。然后训练网络模型，设计深度神经网络模型，训练网络参数。最后进行线上推荐，线上使用用户向量和新闻网络，对用户推荐感兴趣的文章。本发明实施例通过设计一种新的深度神经网络结构，使用一组向量来刻画用户和新闻，从而提高线上的推荐效果。其中，标题向量是深度神经网络模型中新闻网络的输入，是指文章标题的分词结果。推荐系统的候选新闻量非常大(至少包含几百万的文章)，用户使用一次新闻推荐类的app可以发送一个请求，推荐服务无法对所有的文章都处理一遍，因此需要使用召回模块，从这几百万篇新闻里，快速找到用户可能喜欢看的几千篇新闻。通过召回模块可以快速找到用户潜在感兴趣的新闻，缩短推荐服务的响应时间。

首先说明获取训练语料的过程。

本过程主要是根据用户的推荐历史和点击历史，获取模型训练所需要的语料。使用Triple(user，show，click)表示一个训练语料。show的选取范围限定在用户点击新闻的上下3个窗口。如图4所示，为本发明实施例提供的训练语料的原始数据示意图，用户U的推荐序列为(D1,D2,D3,D4,D5)，用户点击了D3，那么从这次推荐过程中可以获取到训练实例有：(U,D3,D1)(U,D3,D2)(U,D3,D4)(U,D3,D5)。

接下来描述训练网络模型的详细过程。

首先说明网络结构。

深度神经网络的结构如图5所示。其中网络参数包括：U,W₁,W₂,W₃,b₁,b₂,b₃,这7个量是深度神经网络的网络参数。其中，U是一个(用户数×128)维的实数矩阵，每一行是一个用户向量，不同的用户的向量在矩阵不同的行里。Wi表示第i层网络的权重，是一个矩阵。Bi表示第i层网络的偏置，是一个向量。w和b是标准DNN的网络参数。各个参数的维度为：U(用户数×128)，W₁(200×512)，W₂(512×512)，W₃(512×128)，b₁(512)，b₂(512)，b₃(128)。

D1是用户U点击的新闻的标题切词结果，D2是推荐给用户U但是没有点击的新闻的标题切词结果。D1和D2使用词袋模型(bag of words)的形式描述，是一个维度为12.3万的向量。D1和D2共享相同的网络参数{w,b}。w表示权重(weight)，b表示偏置(bias)。接下来用新闻的输入词向量x来描述D，x＝(x₁,x₂,x₃,…x_n)。

接下来进行Sentence to Vector过程，把新闻从一个12.3万维的稀疏向量压缩成200维的稠密向量。会预先训练好一个词嵌入(word2vec)的模型，把每个词通过一个200维的词向量来描述。Sentence to Vector过程是对标题中每个词的词向量求和后，再进行L2范数归一化。通过归一化可以实现长句子和短句子的比较。

其输出为其中f(x_i)表示词x_i的词向量。

其中，L₀表示sentence2vector计算公式。

l₀经过一个3层的DNN网络后，得到一个128维的新闻向量y,其具体过程如下：

l_i＝max(0,W_il_i-1+b_i)，i＝1,2。

y＝W₃l₂+b₃。

如图5所示，首先获取检索词向量(term vector)，用x表示，大小为123k，123k是一个数字，其大小是123000，k是数量单位千的单位。方框里面的数字表向量的维度。可包括：向量D1和向量D2，然后进行向量化处理(Sentence to Vector)，得到句子向量化结果(Sentence Vector)，用L₀表示，大小为200，L₀表示DNN第一层的输入。将L₀输入到DNN模型中，经过两层的激励函数计算，ReLU(W,b)表示的是输出y和输入x满足如下关系：y＝max{0,W*x+b}。然后进行线性层计算，得到语义要素(semantic feature)，用y表示，大小为128，Linear(W₃，b₃)是指线性层，输出y和输入x质检的关系是：y＝W₃*x+b。L₁表示DNN第一层的输出，L₂表示DNN第二层的输出，然后使用评价函数(score function)进行计算。例如，评价函数可以是图5中所示的cos函数，最后进行兴趣评分(interest score)，例如用cos(y_U,y_D1)、cos(y_U,y_D2)表示，y_u表示用户向量，y_D1，y_D2表示新闻的向量。

输出层z＝cos(y_U,y_D1)-cos(y_U,y_D2)，其中，cos(y_U,y_D1)表示用户U对D1的偏好程度，cos(y_U,y_D2)表示用户U对D1的偏好程度。

接下来说明神经网络模型的训练。

神经网络模型的优化目标是最小化损失值L(z)＝∑_zlog(1+exp(-z))，即用户点击的文章得分与推荐未点击的文章得分差值越大越好。本发明实施例中可以采用反向传播算法来训练DNN模型，W₁,W₂,W₃,b₁,b₂,b₃,的参数更新使用梯度下降算法，例如可以是AdaDelta算法，U的参数更新使用随机梯度下降(Stochastic gradientdescent，SGD)算法。

在神经网络模型训练完成之后，就可以使用该神经网络模型进行用户画像的生成，并使用推荐系统进行线上推荐。

首先对新闻推荐池里的新闻进行处理，通过训练好的神经网络模型得到128维的新闻向量y_D，当有用户来请求推荐服务时，推荐服务查找用户对应的用户向量U，然后使用U在新闻推荐池中检索cos(y_U,y_D)值最高的k篇新闻，作为一个召回队列供推荐策略使用。

接下来对本发明实施例提供的资源推荐方法的评测效果进行举例说明，请参阅图6所示，为本发明实施例提供的离线评测结果的对比示意图。评测Triple(user，show，click)的准确率，如果click新闻的得分，比show新闻的得分高，则认为兴趣模型刻画准确，否则认为是有误的。以本发明实施例提供的神经网络模型具体为DNN进行举例，DNN比现有技术中topic画像的准确率提高12.25％个绝对值，比现有技术中tag画像提高15.77％个绝对值。

接下来对本发明实施例提供的在线评测结果进行示例说明，基于深度神经网络的用户画像方案上线后，线上指标提升明显。本发明实施例在线上做A/B test实验，实验设置如下：对照组使用标签画像、分类画像、topic画像作为画像召回队列；实验组在对照组的基础上，增加本发明实施例生成的用户画像作为召回队列。使用点击率来评估实验的效果，具体的，点击率＝点击数/推荐数。对线上请求的用户随机分为两部分user_set_a，user_set_b，这两部分用户在都按对照组的策略进行推荐时，点击率是一样的。在实验期间，user_set_a按对照组的推荐策略进行推荐，user_set_b使用实验组的推荐策略进行推荐。实验期间，user_set_a(对照组)的点击率是14.0％，user_set_b(实验组)的点击率是14.5％，实验效果提升明显。其中本发明实施例提供的召回队列的点击率达到20％，是所有兴趣推荐队列里点击率最高的。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

为便于更好的实施本发明实施例的上述方案，下面还提供用于实施上述方案的相关装置。

请参阅图7-a所示，本发明实施例提供的一种资源推荐装置700，可以包括：请求获取模块701、画像生成模块702、向量化处理模块703、资源推荐模块704，其中，

请求获取模块701，用于获取用户的推荐请求，所述推荐请求包括：所述用户的唯一标识；

画像生成模块702，用于根据所述用户的唯一标识查询神经网络模型的用户画像参数，输出所述用户的用户画像，所述用户画像参数包括所述神经网络模型根据所述用户的历史行为信息学习到的所述用户的隐层语义兴趣信息；

向量化处理模块703，用于使用所述神经网络模型对资源推荐池中的资源进行向量化处理，得到所述资源对应的资源描述信息；

资源推荐模块704，用于根据所述用户画像与所述资源描述信息之间的匹配度从所述资源推荐池中筛选出与所述用户匹配的资源，并将与所述用户匹配的资源推荐给所述用户。

在本发明的一些实施例中，请参阅图7-b所示，所述资源推荐装置，还包括：

历史信息提取模块705，用于所述请求获取模块701获取用户的推荐请求之前，从所述用户的历史行为信息中获取到所述用户的推荐历史信息和点击历史信息；

语料生成模块706，用于根据所述推荐历史信息和所述点击历史信息生成训练语料，所述训练语料包括：所述用户点击的资源和推荐给所述用户但没有点击的资源；

模型训练模块707，用于使用所述训练语料对所述神经网络模型进行训练，在所述神经网络模型的网络参数满足结束条件时输出所述神经网络模型。

进一步的，在本发明的一些实施例中，所述模型训练模块707，具体用于当所述训练语料中的资源包括有标题时，对所述训练语料中的资源的标题进行切词，得到所述训练语料中每个资源对应的标题向量，所述标题向量包括：所述用户点击的资源的标题切词结果和推荐给所述用户但没有点击的资源的标题切词结果；使用所述训练语料中每个资源对应的标题向量对所述神经网络模型进行训练。

在本发明的一些实施例中，请参阅图7-c所示，所述模型训练模块707，包括：

向量化处理单元7071，用于对所述标题向量中的每个词的词向量进行向量化处理，得到词向量化结果；

模型训练单元7072，用于使用所述词向量化结果对所述神经网络模型进行训练。

进一步的，在本发明的一些实施例中，请参阅图7-d所示，所述模型训练单元7072，包括：

激活计算子单元70721，用于将所述词向量化结果输入所述神经网络模型的激活函数进行计算，得到计算结果；

线性计算子单元70722，用于将所述计算结果输入所述神经网络模型的线性函数进行计算，得到资源描述信息；

评分子单元70723，用于使用所述用户画像分别和所述训练语料中每个资源对应的资源描述信息进行得分计算，得到所述训练语料中每个资源对应的分值；

损失计算子单元70724，用于根据所述训练语料中每个资源对应的分值对所述神经网络模型的损失函数进行计算，并在所述损失函数达到最小时结束模型训练。

在本发明的一些实施例中，请参阅图7-e所示，所述资源推荐模块704，包括：

评分单元7041，用于使用所述用户画像分别和所述资源推荐池中每个资源对应的资源描述信息进行得分计算，得到所述资源推荐池中每个资源对应的分值；

资源检索单元7042，用于根据所述资源推荐池中每个资源对应的分值确定与所述用户匹配的k个资源，k为预设的召回资源个数。

在本发明的一些实施例中，所述资源推荐模块704，用于将与所述用户匹配的k个资源加入到召回队列中；将所述召回队列推送给所述用户。

通过以上对本发明实施例的描述可知，首先获取用户的推荐请求，推荐请求包括：用户的唯一标识，然后根据用户的唯一标识查询神经网络模型，输出用户的用户画像，神经网络模型通过用户的历史行为信息进行训练后输出，最后根据用户画像与资源描述信息之间的匹配度从资源推荐池中筛选出与用户匹配的资源，并将与用户匹配的资源推荐给用户。由于本发明实施例中可以通过神经网络模型得到用户画像，该用户画像可以刻画用户的隐层语义兴趣，因此采用用户画像可以实现对用户更深层次的表达，通过该用户画像可以从资源推荐池中筛选出与用户精确匹配的资源，进行实现为用户准确的推荐资源，提高向用户推荐资源的效果。

本发明实施例还提供了另一种终端，如图8所示，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant，个人数字助理)、POS(Point ofSales，销售终端)、车载电脑等任意终端设备，以终端为手机为例：

图8示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图8，手机包括：射频(Radio Frequency，RF)电路1010、第一存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(wireless fidelity，WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解，图8中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图8对手机的各个构成部件进行具体的介绍：

RF电路1010可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1080处理；另外，将设计上行的数据发送给基站。通常，RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication，GSM)、通用分组无线服务(General Packet RadioService，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

第一存储器1020可用于存储软件程序以及模块，处理器1080通过运行存储在第一存储器1020的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。第一存储器1020可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，第一存储器1020可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1030可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1080，并能接收处理器1080发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031，输入单元1030还可以包括其他输入设备1032。具体地，其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041，可选的，可以采用液晶显示器(LiquidCrystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1041。进一步的，触控面板1031可覆盖显示面板1041，当触控面板1031检测到在其上或附近的触摸操作后，传送给处理器1080以确定触摸事件的类型，随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图8中，触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1050，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1041和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路1060、扬声器1061，传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号，传输到扬声器1061，由扬声器1061转换为声音信号输出；另一方面，传声器1062将收集的声音信号转换为电信号，由音频电路1060接收后转换为音频数据，再将音频数据输出处理器1080处理后，经RF电路1010以发送给比如另一手机，或者将音频数据输出至第一存储器1020以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图8示出了WiFi模块1070，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1080是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在第一存储器1020内的软件程序和/或模块，以及调用存储在第一存储器1020内的数据，执行手机的各种功能和处理数据。可选的，处理器1080可包括一个或多个处理单元；优选的，处理器1080可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1080中。

手机还包括给各个部件供电的电源1090(比如电池)，优选的，电源可以通过电源管理系统与处理器1080逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本发明实施例中，该终端所包括的处理器1080还具有控制执行以上由终端执行的资源推荐方法流程。

图9是本发明实施例提供的一种服务器结构示意图，该服务器1100可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processingunits，CPU)1122(例如，一个或一个以上处理器)和第二存储器1132，一个或一个以上存储应用程序1142或数据1144的存储介质1130(例如一个或一个以上海量存储设备)。其中，第二存储器1132和存储介质1130可以是短暂存储或持久存储。存储在存储介质1130的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1122可以设置为与存储介质1130通信，在服务器1100上执行存储介质1130中的一系列指令操作。

服务器1100还可以包括一个或一个以上电源1126，一个或一个以上有线或无线网络接口1150，一个或一个以上输入输出接口1158，和/或，一个或一个以上操作系统1141，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的资源推荐方法步骤可以基于该图9所示的服务器结构。

另外需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外，本发明提供的装置实施例附图中，模块之间的连接关系表示它们之间具有通信连接，具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下，凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现，而且，用来实现同一功能的具体硬件结构也可以是多种多样的，例如模拟电路、数字电路或专用电路等。但是，对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘、U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

综上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照上述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对上述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种资源推荐方法，其特征在于，包括：

根据所述用户的唯一标识查询预先构建的神经网络模型的用户画像参数，输出所述用户的用户画像，所述用户画像参数包括所述神经网络模型根据所述用户的历史行为信息学习到的所述用户的隐层语义兴趣信息；

根据所述用户画像与所述资源描述信息之间的匹配度从所述资源推荐池中筛选出与所述用户匹配的资源，并将与所述用户匹配的资源推荐给所述用户；

所述神经网络模型的构建过程，包括：

从所述用户的历史行为信息中获取到所述用户的推荐历史信息和点击历史信息；

根据所述推荐历史信息和所述点击历史信息生成训练语料，所述训练语料包括：所述用户点击的资源和推荐给所述用户但没有点击的资源；

当所述训练语料中的资源包括有标题时，对所述训练语料中的资源的标题进行切词，得到所述训练语料中每个资源对应的标题向量，所述标题向量包括：所述用户点击的资源的标题切词结果和推荐给所述用户但没有点击的资源的标题切词结果；

使用所述训练语料中每个资源对应的标题向量对所述神经网络模型进行训练，在所述神经网络模型的网络参数满足结束条件时输出所述神经网络模型。

2.根据权利要求1所述的方法，其特征在于，所述使用所述训练语料中每个资源对应的标题向量对所述神经网络模型进行训练，包括：

对所述标题向量中的每个词的词向量进行向量化处理，得到词向量化结果；

使用所述词向量化结果对所述神经网络模型进行训练。

3.根据权利要求2所述的方法，其特征在于，所述使用所述词向量化结果对所述神经网络模型进行训练，包括：

将所述词向量化结果输入所述神经网络模型的激活函数进行计算，得到计算结果；

将所述计算结果输入所述神经网络模型的线性函数进行计算，得到资源描述信息；

使用所述用户画像分别和所述训练语料中每个资源对应的资源描述信息进行得分计算，得到所述训练语料中每个资源对应的分值；

根据所述训练语料中每个资源对应的分值对所述神经网络模型的损失函数进行计算，并在所述损失函数达到最小时结束模型训练。

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据所述用户画像与所述资源描述信息之间的匹配度从资源推荐池中筛选出与所述用户匹配的资源，包括：

使用所述用户画像分别和所述资源推荐池中每个资源对应的资源描述信息进行得分计算，得到所述资源推荐池中每个资源对应的分值；

根据所述资源推荐池中每个资源对应的分值确定与所述用户匹配的k个资源，k为预设的召回资源个数。

5.根据权利要求4所述的方法，其特征在于，所述将与所述用户匹配的资源推荐给所述用户，包括：

将与所述用户匹配的k个资源加入到召回队列中；

将所述召回队列推送给所述用户。

6.一种资源推荐装置，其特征在于，包括：

画像生成模块，用于根据所述用户的唯一标识查询预先构建的神经网络模型的用户画像参数，输出所述用户的用户画像，所述用户画像参数包括所述神经网络模型根据所述用户的历史行为信息学习到的所述用户的隐层语义兴趣信息；

资源推荐模块，用于根据所述用户画像与所述资源描述信息之间的匹配度从资源推荐池中筛选出与所述用户匹配的资源，并将与所述用户匹配的资源推荐给所述用户；

历史信息提取模块，用于所述请求获取模块获取用户的推荐请求之前，从所述用户的历史行为信息中获取到所述用户的推荐历史信息和点击历史信息；

语料生成模块，用于根据所述推荐历史信息和所述点击历史信息生成训练语料，所述训练语料包括：所述用户点击的资源和推荐给所述用户但没有点击的资源；

模型训练模块，用于使用所述训练语料对所述神经网络模型进行训练，在所述神经网络模型的网络参数满足结束条件时输出所述神经网络模型；

所述模型训练模块，具体用于当所述训练语料中的资源包括有标题时，对所述训练语料中的资源的标题进行切词，得到所述训练语料中每个资源对应的标题向量，所述标题向量包括：所述用户点击的资源的标题切词结果和推荐给所述用户但没有点击的资源的标题切词结果；使用所述训练语料中每个资源对应的标题向量对所述神经网络模型进行训练。

7.根据权利要求6所述的装置，其特征在于，所述模型训练模块，包括：

向量化处理单元，用于对所述标题向量中的每个词的词向量进行向量化处理，得到词向量化结果；

模型训练单元，用于使用所述词向量化结果对所述神经网络模型进行训练。

8.根据权利要求7所述的装置，其特征在于，所述模型训练单元，包括：

激活计算子单元，用于将所述词向量化结果输入所述神经网络模型的激活函数进行计算，得到计算结果；

线性计算子单元，用于将所述计算结果输入所述神经网络模型的线性函数进行计算，得到资源描述信息；

评分子单元，用于使用所述用户画像分别和所述训练语料中每个资源对应的资源描述信息进行得分计算，得到所述训练语料中每个资源对应的分值；

损失计算子单元，用于根据所述训练语料中每个资源对应的分值对所述神经网络模型的损失函数进行计算，并在所述损失函数达到最小时结束模型训练。

9.根据权利要求6至8中任一项所述的装置，其特征在于，所述资源推荐模块，包括：

评分单元，用于使用所述用户画像分别和所述资源推荐池中每个资源对应的资源描述信息进行得分计算，得到所述资源推荐池中每个资源对应的分值；

资源检索单元，用于根据所述资源推荐池中每个资源对应的分值确定与所述用户匹配的k个资源，k为预设的召回资源个数。

10.根据权利要求9所述的装置，其特征在于，所述资源推荐模块，用于将与所述用户匹配的k个资源加入到召回队列中；将所述召回队列推送给所述用户。

11.一种可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序被处理器加载并执行，实现如权利要求1～5任一项所述的资源推荐方法的各步骤。

12.一种计算机设备，其特征在于，所述计算机设备包括：

通信接口；

存储器，用于存储实现如权利要求1～5任一项所述的资源推荐方法的程序；

处理器，用于调用并执行所述存储器的程序，以实现如权利要求1～5任一项所述的资源推荐方法的各个步骤。