CN113590948A

CN113590948A - 信息推荐方法、装置、设备以及计算机存储介质

Info

Publication number: CN113590948A
Application number: CN202110855790.1A
Authority: CN
Inventors: 吴志勇; 郭宇; 金懿伟; 骆世顺; 裴兴
Original assignee: Migu Cultural Technology Co Ltd; China Mobile Communications Group Co Ltd; MIGU Digital Media Co Ltd
Current assignee: Migu Cultural Technology Co Ltd; China Mobile Communications Group Co Ltd; MIGU Digital Media Co Ltd
Priority date: 2021-07-28
Filing date: 2021-07-28
Publication date: 2021-11-02
Anticipated expiration: 2041-07-28
Also published as: CN113590948B

Abstract

本发明实施例涉及计算机处理技术领域，公开了一种信息推荐方法、装置、设备以及计算机存储介质，该方法包括：获取目标用户对应的用户属性数据、历史用户行为序列数据以及待推荐内容数据；根据所述待推荐内容数据和所述用户属性数据确定初始聚合特征向量；根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据确定兴趣隐特征向量；根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容。通过上述方式，本发明实施例提高了信息推荐的准确度。

Description

信息推荐方法、装置、设备以及计算机存储介质

技术领域

本发明实施例涉及计算机数据处理技术领域，具体涉及一种信息推荐方法、装置、设备以及计算机存储介质。

背景技术

随着深度学习在图像、语音以及自然语言处理等方面取得的巨大突破，将深度学习用于信息流推荐，实现H5页面、APP以及浏览器等多类型信息聚合平台的内容推荐成为当前信息推荐领域研究的热点。

发明人在实施本发明的过程中发现：现有的信息推荐方法，不能很好的反映用户兴趣多样性和时变性，并且无法反映出用户不同内容间兴趣的差异性以及关联性，由此导致现有的信息推荐的准确度不高。

发明内容

鉴于上述问题，本发明实施例提供了一种信息推荐的方法、装置、设备以及计算机存储介质，用于解决现有技术中存在的信息推荐的准确度较低问题。

根据本发明实施例的一个方面，提供了一种信息推荐方法，所述方法包括：

获取目标用户对应的用户属性数据、历史用户行为序列数据以及待推荐内容数据；

根据所述待推荐内容数据和所述用户属性数据确定初始聚合特征向量；

根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据确定兴趣隐特征向量；

根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容。

在一种可选的方式中，所述兴趣隐特征向量包括兴趣差异隐特征向量和兴趣共性隐特征向量；所述方法还包括：

根据所述历史用户行为序列数据确定所述兴趣差异隐特征向量；

根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据进行关联性挖掘，得到所述兴趣共性隐特征向量。

在一种可选的方式中，所述方法还包括：

对所述历史用户行为序列数据进行向量化处理，得到历史用户行为特征向量；

将当前时间之前预设时长内的所述历史用户行为序列数据对应的所述历史用户行为序列特征向量确定为近期用户行为特征向量；

对所述近期用户行为特征向量进行注意力机制处理，得到所述兴趣差异隐特征向量。

在一种可选的方式中，所述方法还包括：根据预设的生成网络对所述用户属性数据、历史用户行为序列数据、所述待推荐内容数据进行关联性挖掘，得到所述兴趣共性隐特征向量；其中，所述生成网络与对抗网络组成生成对抗网络；所述生成网络的输入根据所述用户属性数据以及噪声向量确定；所述对抗网络的输入根据所述生成网络的输出、所述初始聚合特征向量以及所述历史用户行为序列数据确定。

在一种可选的方式中，所述方法还包括：

根据所述历史用户行为序列数据确定第一历史用户行为特征向量和第二用户历史行为特征向量；所述第一历史用户行为特征向量用于表征所述目标用户在预设历史时刻的用户行为特征；所述第二用户历史行为特征向量用于表征所述目标用户在邻近历史区间的用户行为特征；所述邻近历史区间为与所述预设历史时刻邻近的时间区间；

根据所述初始聚合特征向量与所述第二历史用户行为特征向量确定目标聚合特征向量；

将所述目标聚合特征向量、所述初始聚合特征向量以及所述生成网络的输出确定为所述对抗网络的输入。

在一种可选的方式中，所述历史用户行为序列数据中包括用户行为对应的内容类型和行为发生时间；所述方法还包括：

将任一所述行为发生时间对应的所述历史用户行为序列确定为第一历史用户行为序列数据；

根据所述第一历史用户行为序列数据确定所述第一历史用户行为特征向量；

根据所述第一历史用户行为序列数据的内容类型和行为发生时间从所述历史用户行为序列数据中确定第二历史用户行为序列数据；

根据所述第二历史用户行为序列数据确定所述第二历史用户行为特征向量。

在一种可选的方式中，所述待推荐内容数据包括多种内容类型分别对应的待推荐子内容数据；所述方法还包括：

对各种所述待推荐子内容数据分别进行向量化，得到多个待推荐子内容特征向量；

确定所述用户属性数据对应的用户属性特征向量；

将所有所述子内容特征向量与所述用户属性特征向量进行池化处理，得到所述初始聚合特征向量。

根据本发明实施例的另一方面，提供了一种信息推荐装置，包括：

获取模块，用于获取目标用户对应的用户属性数据、历史用户行为序列数据以及待推荐内容数据；

第一确定模块，用于根据所述待推荐内容数据和所述用户属性数据确定初始聚合特征向量；

第二确定模块，用于根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据确定兴趣隐特征向量；

推荐模块，用于根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容。

根据本发明实施例的另一方面，提供了一种信息推荐设备，包括处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如所述的信息推荐方法的操作。

根据本发明实施例的又一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一可执行指令，所述可执行指令使信息推荐设备执行所述的信息推荐方法的操作。

本发明实施例通过获取目标用户对应的用户属性数据、历史用户行为序列数据以及待推荐内容数据；根据待推荐内容数据和用户属性数据确定初始聚合特征向量；其中，初始聚合特征向量用于表征用户属性和待推荐的媒资内容的组合，作为先验的信息推荐的背景信息；根据用户属性数据、历史用户行为序列数据以及待推荐内容数据确定兴趣隐特征向量；其中，兴趣隐特征向量用于表征用户兴趣随时间的变化以及不同的内容之间的兴趣之间的差异；最后根据兴趣隐特征向量、初始聚合特征向量确定目标用户对应的目标推荐内容。最后根据兴趣隐特征向量以及初始聚合特征向量确定目标用户对应的目标推荐内容，从而能够从兴趣内容关联性、兴趣时变性以及兴趣差异性这三方面来综合确定出目标推荐内容，能够提高信息推荐的准确率。

区别于现有技术中采用的只对兴趣之间的关联进行挖掘，忽略了用户兴趣的时变性以及差异性，从而在信息推荐时未考虑到用户的近期兴趣变化所导致的信息推荐准确率不高的问题，本发明实施例通过根据用户属性数据、历史用户行为序列数据以及待推荐内容数据确定出兴趣隐特征向量以及所述初始聚合特征向量，通过这两者共同确定出目标推荐内容，从而实现了从兴趣内容关联性、兴趣时变性以及兴趣差异性这三方面来综合确定出目标推荐内容，能够提高信息推荐的准确率，改进用户体验。

上述说明仅是本发明实施例技术方案的概述，为了能够更清楚了解本发明实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

附图仅用于示出实施方式，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的信息推荐方法的流程示意图；

图2示出了本发明另一个实施例提供的信息推荐方法的流程示意图；

图3示出了本发明实施例提供的信息推荐装置的结构示意图；

图4示出了本发明实施例提供的信息推荐设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例，然而应当理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。

图1示出了本发明实施例提供的信息推荐方法的流程图，该方法由计算机设备执行。计算机设备可以包括手机、笔记本电脑等。如图1所示，该方法包括以下步骤：

步骤101：获取目标用户对应的用户属性数据、历史用户行为序列数据以及待推荐内容数据。

在本发明的一个实施例中，目标用户指的是需为其推荐内容的用户，如可以是某应用的新注册或登录用户。用户属性数据为用户与兴趣相关的基本属性，记为P，如用户的性别、年龄、职业、学历以及地域等数据。

历史用户行为序列信息指的是目标用户在预设历史时间段内的行为序列信息，记为U，其中，行为序列中包括多个按时序排列的对内容的行为，行为的类型可以包括点击、阅读、点击、收藏、笔记、评论、转发以及分享等，预设历史时间段可以是距离当前时间第一预设时长的一段时间，如一周内或一年内等。

在本发明的再一个实施例中，待推荐内容数据包括预设的多媒体资源库中的多种类型的多媒体内容对应内容属性数据，如图书、视频、漫画以及音频等。如在推荐场景为H5页面内容推荐时，待推荐内容可以包括电子书(记为B)、短视频(记为V)、漫画(记为C)以及听书(记为L)等类型的内容属性数据。

其中，在内容类型为电子书时，内容属性数据可以包括书名、作者、类型、类别、标签、简介、版权方、出版时间、评论关键词、上架总字数、是否有影视题材以及影视题材简介等。在内容类型为短视频时，内容属性数据可以包括类型、类别、评论关键词、简介、标签、主人公以及首页语义信息等。在内容类型为漫画时，内容属性数据可以包括书名、作者、类型、类别、简介、标签、评论内容关键词、版权方等。在内容类型为听书时，内容属性数据可以包括书名、作者、主播名称、类别、类型、标签、简介、版权方、出版时间、评论关键词以及总时长等。

考虑到目标用户一方面存在与其属性对应的较为长期和稳定的兴趣取向，如职业为律师的目标用户对于法律方面的多媒体内容可能更为感兴趣，而另一方面，目标用户近期内对于内容的兴趣在长期兴趣取向的基础上也受到当下热点的影响，如近期较为火爆的电视剧或新出版的图书等也可能是目标用户所感兴趣的。因此，在本发明的再一个实施例中，所述历史用户行为序列数据包括近期用户行为序列数据。其中，近期指的是当前时间第二预设时长内的时间段，第二预设时长小于前述第一预设时长。

步骤102：根据所述待推荐内容数据和所述用户属性数据确定初始聚合特征向量。

考虑到步骤101中获取的数据为稀疏数据，在进行分析处理时的效率较低，因此，将待推荐内容数据和用户属性数据进行预处理，得到分别对应的稠密的特征向量，其中，特征向量在能表达内容以及属性信息本质的同时，降低后续推荐模型计算的难度，预处理可以包括向量化和降维处理等。

并且考虑到待推荐内容和用户属性数据都是作为先验的背景信息输入推荐模型，为了进一步提高后续推荐模型的计算效率，还可以将待推荐内容数据和用户属性数据对应的特征向量进一步进行聚合和提取特征，得到初始聚合特征向量(记为e^*)。

在本发明的再一个实施例中，步骤102还包括：

步骤1021：对各种所述待推荐子内容数据分别进行向量化，得到多个待推荐子内容特征向量。

在本发明的一个实施例中，对各种所述待推荐子内容数据首先进行编码，得到各种内容类型对应的编码数据，将所述编码数据输入预先训练完成的神经网络嵌入层，得到各种内容类型对应的待推荐子内容特征向量。

结合前述举例，多类型的待推荐内容特征向量可以包括b、v、l、c，分别对应于前述B、V、L、C，用户属性特征向量为p，对应于前述P。

其中，编码方式可以采用One-hot编码。神经网络嵌入层是预先训练得到的，可以采用Skip-Gram模型，其训练的输入可以是多个参考用户的用户属性大数据以及媒体资源库中的内容大数据。

神经网络嵌入层的网络损失函数为L＝-log p(w_o|w_I,1,...,w_I,N)。其中，N为嵌入词的量，w为文本词。当损失函数趋于稳定或者损失函数小于预设阈值时，神经网络嵌入层收敛，神经网络嵌入层收敛则确定神经网络嵌入层训练完成。

步骤1022：确定所述用户属性数据对应的用户属性特征向量。

步骤1022的向量化的方案与步骤1021的类似，不再赘述。

步骤1023：将所有所述子内容特征向量与所述用户属性特征向量进行池化处理，得到所述初始聚合特征向量。

在本发明的一个实施例中，池化处理的方法包括平均池化、重叠池化、最大化池化以及空金字塔池化等。池化处理用于在将待推荐内容特征向量和用户属性特征向量进行整合的同时，降低整合得到的特征向量的特征维度。

步骤103：根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据确定兴趣隐特征向量。

在本发明的一个实施例中，兴趣隐特征向量用于表征用户对于内容的兴趣随时间的变化情况以及用户对于不同的内容的兴趣之间的差异。

举例说明，如某用户A在近两年都是武侠相关多媒体内容的爱好者，但是在近两周，用户A对科幻相关的多媒体内容感兴趣最多，此为用户对于内容的兴趣随时间的变化情况。

而用户对于不同的内容的兴趣之间的差异可以是如用户A对于科幻相关的多媒体内容的感兴趣权重是70％，而对于武侠相关的多媒体内容的感兴趣权重是30％。

在本发明的再一个实施例中，兴趣隐特征向量包括兴趣差异隐特征向量(记为e^*)和兴趣共性隐特征向量(记为

)。其中，e^*用于用户对于不同的内容的兴趣之间的差异；

用于表征用户对于内容的兴趣随时间的变化情况。

步骤103还包括：步骤1031：根据所述历史用户行为序列数据确定所述兴趣差异隐特征向量。

在本发明的一个实施例中，历史用户行为序列数据中包括了近期用户行为序列数据；近期用户行为序列数据用于表征目标用户的近期兴趣取向，从而确定出用户的兴趣随时间的变化性，并且考虑到近期用户行为序列中针对不同的内容的偏好程度也是存在差异的，因此，对近期用户行为序列进行各内容偏好占比差异的分析，得到兴趣差异隐特征向量。

在本发明的再一个实施例中，步骤1031还包括：

步骤311：根据所述历史用户行为序列数据确定所述兴趣差异隐特征向量。

在本发明的一个实施例中，可以对历史用户行为序列数据进行向量化处理以及注意力机制处理，得到兴趣差异隐特征向量，由此确定出历史上用户对于各个内容的兴趣之间的差异。

在本发明的再一个实施例中，步骤311还包括：

步骤3111：对所述历史用户行为序列数据进行向量化处理，得到历史用户行为特征向量。

在本发明的一个实施例中，历史用户行为特征向量记为u，步骤1042的历史用户行为数据的向量化的方法与步骤1021中的类似，不再赘述。

步骤3112：将当前时间之前预设时长内的所述历史用户行为序列数据对应的所述历史用户行为序列特征向量确定为近期用户行为特征向量。

在本发明的一个实施例中，预设时长可以根据平台内容的内容总量、用户的活跃程度以及内容更新速度确定。近期是历史用户行为序列特征向量对应的历史时间区间的一个最邻近当前时间的子集，如历史时间区间可以是6个月内，近期可以是7天内。

步骤3113：对所述近期用户行为特征向量进行注意力机制处理，得到所述兴趣差异隐特征向量。

在本发明的一个实施例中，取近期用户行为序列长度为n，则对应的近期用户行为特征向量有：

其中，

为u的子集。

基于注意力机制的处理方法，参数Q和K有：

其中，W_K∈R^d×d＝W_Q∈R^d×d是注意力机制层Q(表示Query，询问值)和K(表示Key，回答值)的权重向量，ReLU为非线性注意力学习的激活函数，则关联矩阵

有：

其中，

为尺度标度，用于防止其结果过大，具体取值基于特定情况而定。

单类型的行为注意力机制机制的输出有：

其中

可视为用户短期兴趣点隐特征向量。将各行为类型下的兴趣点隐特征向量进行池化处理，得到注意力机制的输出即兴趣差异隐特征向量，记为u^*。

步骤312：根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据进行关联性挖掘，得到所述兴趣共性隐特征向量。

在本发明的一个实施例中，关联性挖掘可以通过多内容兴趣关联性挖掘模型来完成。多内容关联性挖掘模型用于挖掘用户在对第一内容感兴趣这一事件发生与该用户对其他的第二内容的感兴趣的事件发生概率之间的关联性。其中，多内容兴趣关联性挖掘模型包括生成网络(记为G)与对抗网络(记为D)。具体地，步骤312还包括：

根据预设的生成网络对所述用户属性数据、历史用户行为序列数据、所述待推荐内容数据进行关联性挖掘，得到所述兴趣共性隐特征向量；其中，所述生成网络与对抗网络组成生成对抗网络；所述生成网络的输入根据所述用户属性数据以及噪声向量确定；所述对抗网络的输入根据所述生成网络的输出、所述初始聚合特征向量以及所述历史用户行为序列数据确定。

在本发明的一个实施例中，所述生成网络的输入可以包括用户属性特征向量p以及噪声向量(记为z)。其中，p根据用户属性数据进行向量化得到，噪声向量可以是随机生成的预设维数的高斯噪声。噪声向量用于作为伪造的用户行为序列数据输入生成网络。从而将生成网络输出的生成样本交由对抗网络进行识别，由此判断生成网络的样本仿真效果。

当生成网络训练完成时，其输出的即为在确定用户属性的情况下，该用户在点击第一内容的前提下，点击第二内容的条件概率，即兴趣共性隐特征向量。

需要说明的是，为了提高在多类型内容推荐场景下的信息推荐的准确率，还可以进一步限定第一内容的类型应该为第二内容的类型的子集，如用户当前点击漫画A的情况下，需要确定条件概率的第二内容的类型应该包括漫画以及至少一个其他内容类型，如短视频、音频等。即所述历史用户行为序列中包括用户行为对应的内容类型。

在本发明的一个实施例中，所述对抗网络的输入可以包括所述生成网络的输出即

目标聚合特征向量(记为e)以及第一历史用户行为特征向量(记为u⁺)。

其中，生成网络的输出是对抗网络需要进行识别真伪的对象。

目标聚合特征向量是在历史某个时刻内的用户行为序列数据与用户属性数据，用于表征前述真实情况下，在确定用户属性的情况下，该用户在点击某类型内容这一前提，如用户在昨天点击了漫画A。

第一历史用户行为特征向量根据历史用户行为序列数据确定，用于表征真实情况下，在确定用户属性的情况下，该用户在点击某类型内容这一前提，用户点击其他内容的发生概率。

其中，为了使得第一历史用户行为特征向量的发生是在目标聚合特征向量发生的前提下，第一历史用户行为特征向量的时间与目标聚合特征向量对应的某时刻应该是邻近的关系，如第一历史用户行为特征向量可以是最近三天内对应的，从而与目标聚合特征向量对应的昨天邻近。

因此，在本发明的一个实施例中，所述对抗网络的输入根据所述生成网络的输出、所述初始聚合特征向量以及所述历史用户行为序列数据确定的过程，还包括：

步骤3121：根据所述历史用户行为序列数据确定第一历史用户行为特征向量和第二用户历史行为特征向量；所述第一历史用户行为特征向量用于表征所述目标用户在预设历史时刻的用户行为特征；所述第二用户历史行为特征向量用于表征所述目标用户在邻近历史区间的用户行为特征；所述邻近历史区间为与所述预设历史时刻邻近的时间区间。

在本发明的一个实施例中，第一历史行为特征向量对应的行为发生时间可以是历史时间段中的任一时间，如昨天、6月18日等。第二历史行为特征向量对应的行为发生时间为上述任一时间相邻的预设时长的时间段，如与昨天临近的一周内，或与6月18日临近的6月14日-6月21日。

如前所述，为了保证多类型内容推荐场景下的信息推荐的准确性，选取的第二历史行为特征向量(记为u^o)对应的内容类型应该包括第一历史行为特征向量对应的内容类型以及至少一个其他内容类型。

因此，在本发明的再一个实施例中，所述历史用户行为序列数据中包括用户行为对应的内容类型和行为发生时间；第一历史用户行为特征向量和第二历史用户行为特征向量的确定过程还可以包括：

步骤1211：将任一所述行为发生时间对应的所述历史用户行为序列确定为第一历史用户行为序列数据。

在本发明的一个实施例中，可以取当前时间距离在预设时长内的行为发生时间对应的所述历史用户行为序列作为第一历史用户行为序列数据。

步骤1212：根据所述第一历史用户行为序列数据确定所述第一历史用户行为特征向量。

步骤1213：根据所述第一历史用户行为序列数据的内容类型和行为发生时间从所述历史用户行为序列数据中确定第二历史用户行为序列数据。

在本发明的一个实施例中，第二历史用户行为序列数据的行为发生时间与第一历史用户行为序列数据的行为发生时间相邻，并且第二历史用户行为序列数据的内容类型中包括第一历史用户行为序列数据的内容类型。

步骤1214：根据所述第二历史用户行为序列数据确定所述第二历史用户行为特征向量。

对第二历史用户行为序列数据进行向量化，得到第二历史用户行为特征向量。

步骤3122：根据所述初始聚合特征向量与所述第二历史用户行为特征向量确定目标聚合特征向量。

可以将第二历史用户行为特征向量与初始聚合特征向量进行池化处理，得到目标聚合特征向量。目标聚合特征向量是在历史某个时刻内的用户行为序列数据与用户属性数据，用于表征前述真实情况下，在确定用户属性的情况下，该用户在点击某类型内容这一前提，如用户在昨天点击了漫画A。

步骤3123：将所述目标聚合特征向量、所述初始聚合特征向量以及所述生成网络的输出确定为所述对抗网络的输入。

在本发明的再一个实施例中，对抗网络的网络层级LD>2，根据生成对抗网络(Generative Adversarial Networks，GAN)的基本原理，取交叉熵损失函数为模型的损失函数，设对抗网络D的损失函数为V(G,D)，V(G,D)可以表示：

其中，e为目标聚合特征向量，u^o为第二历史用户行为特征向量，

为生成网络的输出，z为噪声向量，p为用户属性特征向量。

D(u^o|e)表示对抗网络判断真实数据是否为真实用户行为数据的概率，对于对抗网络而言，D(u^o|e)的值越接近于1越好，

表示是对抗网络判断生成网络输出的数据是否为真实用户行为数据的概率，对于推荐网络而言，

的值越大，说明生成网络的样本仿真能力越强，即对抗网络无法分辨真实用户行为数据和生成网络挖掘出的关联用户行为数据的区别。

基于损失函数优化生成网络和对抗网络的参数，直至损失函数收敛，确定多内容兴趣关联性挖掘模型训练结束，保存最后的多内容兴趣关联性挖掘模型参数，否则循环该步骤。

在本发明的再一个实施例中，可以采用梯度下降法对对抗网络和生成网络的参数进行优化。

步骤104：根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容。

在本发明的一个实施例中，将兴趣隐特征向量、所述初始聚合特征向量输入预设的推荐模型，得到目标推荐内容。其中，推荐模型用于根据兴趣关联隐特征向量和兴趣差异隐特征向量确定出能反映出兴趣关联性和兴趣时变性以及差异性的用户的综合兴趣取向，然后根据该综合兴趣取向结合用户属性特征向量确定感兴趣的内容属性特征向量对应的待推荐内容。

在本发明的再一个实施例中，所述推荐模型包括全连接层、多层感知隐藏层以及输出层；步骤104还包括：

步骤1041：将所述兴趣关联隐特征向量、初始聚合特征向量以及兴趣差异隐特征向量输入所述全连接层，得到扁平化特征向量。

在本发明的一个实施例中，全连接层用于将输入的多个特征向量转化为适合长度的特征向量，即扁平化特征向量，记为

方便后续感知隐含层的计算。

步骤1042：将所述扁平化特征向量输入所述多层感知隐藏层进行计算，得到待预测特征向量。

在本发明的一个实施例中，将输入多层感知器，感知器隐藏层的的计算函数为：

κ⁽ⁱ⁺¹⁾＝f(W⁽ⁱ⁾κ⁽ⁱ⁾+zⁱ)

其中，f为激活函数，k⁽ⁱ⁾、zⁱ和W⁽ⁱ⁾分别为第i层的输入、偏置项参数和权重参数，激活函数可以为ReLUs，各层的zⁱ和W⁽ⁱ⁾组成W^*、z^*，W^*、z^*为预先训练得到的推荐模型的参数。

步骤1043：将所述待预测特征向量输入所述输出层，得到所述目标用户属性数据对所述待推荐内容数据的偏好预测概率。

在本发明的一个实施例中，输出层用于对各个神经元的输出进行归一化，得到(0,1)区间中，得到用户p对内容i_s的点击率偏好为f(p,i_s)，其计算过程为：

其中，J为待推荐的多媒体信息库中的内容集合，

即扁平化特征向量。

在本发明的再一个实施例中，推荐模型以兴趣共性隐特征向量样本、初始聚合特征向量样本以及兴趣差异隐特征向量样本为输入进行训练得到；其中，兴趣共性隐特征向量样本包括前述步骤103中训练完成的生成网络的输出；生成网络的输入根据用户属性特征向量样本以及噪声向量样本确定；初始聚合特征向量样本根据多类型内容属性特征向量样本及用户属性特征向量样本确定；兴趣差异隐特征向量样本根据用户属性特征向量样本对应的历史行为特征向量样本确定。其中，上述多类型内容属性特征向量样本、用户属性特征向量样本、历史行为特征向量样本可以根据应用平台的用户大数据得到。

在本发明的再一个实施例中，从用户属性数据、历史用户行为序列数据以及待推荐内容数据得到目标推荐内容的过程，可以如图2所示。

在本发明的再一个实施例中，图2中的推荐模型的损失函数为：

其中，Y_i为样本i的标签，P_i为预测为正样本的概率，当损失函数J(·)小于阈值J1或者趋于稳定时，视多内容兴趣关联性挖掘模块训练完成，由此得到推荐模型的参数W^*、z^*。

其中，在本发明的再一个实施例中，P_i根据预测函数确定如下：

P(Y＝1|x)＝σ(W^T*κ+z)

其中，Y为soft_label_i即样本标签，σ(·)为softmax函数，W^T为权重参数，z为偏置项，k为根据多类型内容属性特征向量样本、用户属性特征向量样本、历史行为特征向量样本池化得到的扁平化特征向量样本，x为推荐模型的输入，P(Y＝1|x)为输入x的情况下用户对其进行点击的概率。当soft_label_i为1时，表示用户对该样本存在点击，为0时则未点击。

步骤1044：根据所述偏好预测概率从所述待推荐内容数据中确定所述目标推荐内容。

在本发明的一个实施例中，根据偏好预测概率的降序从待推荐内容数据中选取待推荐内容，并进行排序，得到目标推荐内容。

在本发明的再一个实施例中，还可以根据偏好预测概率对历史推荐内容进行召回。

在本发明的再一个实施例中，还可以根据多种类型的目标推荐内容生成H5页面展示给目标用户。

区别于现有技术中采用的只对兴趣之间的关联进行挖掘，忽略了用户兴趣的时变性以及差异性，从而在信息推荐时未考虑到用户的近期兴趣变化所导致的信息推荐准确率不高的问题，本发明实施例提供的信息推荐方法通过根据用户属性数据、历史用户行为序列数据以及待推荐内容数据确定出兴趣隐特征向量以及所述初始聚合特征向量从而实现了从兴趣内容关联性、兴趣时变性以及兴趣差异性这三方面来综合确定出目标推荐内容，能够提高信息推荐的准确率，改进用户体验。

图3示出了本发明实施例提供的信息推荐装置的结构示意图。如图3所示，该装置200包括：获取模块201、第一确定模块202、第二确定模块203、第二确定模块204以及推荐模块205，其中，

获取模块201，用于获取目标用户对应的用户属性数据、历史用户行为序列数据以及待推荐内容数据。

第一确定模块202，用于根据所述待推荐内容数据和所述用户属性数据确定初始聚合特征向量。

第二确定模块203，用于将根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据确定兴趣隐特征向量。

推荐模块204，用于根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容。

在一种可选的方式中，所述兴趣隐特征向量包括兴趣差异隐特征向量和兴趣共性隐特征向量；第二确定模块203还用于：

根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据进行关联性挖掘，得到所述兴趣共性隐特征向量。。

在一种可选的方式中，第二确定模块203还用于：

在一种可选的方式中，第二确定模块203还用于：根据预设的生成网络对所述用户属性数据、历史用户行为序列数据、所述待推荐内容数据进行关联性挖掘，得到所述兴趣共性隐特征向量；其中，所述生成网络与对抗网络组成生成对抗网络；所述生成网络的输入根据所述用户属性数据以及噪声向量确定；所述对抗网络的输入根据所述生成网络的输出、所述初始聚合特征向量以及所述历史用户行为序列数据确定。

在一种可选的方式中，第二确定模块203还用于：

在一种可选的方式中，所述历史用户行为序列数据中包括用户行为对应的内容类型和行为发生时间；第二确定模块203还用于：

在一种可选的方式中，所述待推荐内容数据包括多种内容类型分别对应的待推荐子内容数据；第一确定模块202还用于：

确定所述用户属性数据对应的用户属性特征向量；

本发明实施例的信息推荐装置的具体操作与前述信息推荐方法的方法步骤基本一致，不再赘述。区别于现有技术中采用的只对兴趣之间的关联进行挖掘，忽略了用户兴趣的时变性以及差异性，从而在信息推荐时未考虑到用户的近期兴趣变化所导致的信息推荐准确率不高的问题，本发明实施例提供的信息推荐设备通过根据用户属性数据、历史用户行为序列数据以及待推荐内容数据确定出兴趣隐特征向量以及所述初始聚合特征向量；其中兴趣隐特征向量用于表征用户的兴趣随时间的改变以及对于不同内容的兴趣的差异性，最后根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容，从而实现了从兴趣内容关联性、兴趣时变性以及兴趣差异性这三方面来综合确定出目标推荐内容，能够提高信息推荐的准确率，改进用户体验。

图4示出了本发明实施例提供的信息推荐设备的结构示意图，本发明具体实施例并不对信息推荐设备的具体实现做限定。

如图4所示，该信息推荐设备可以包括：处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。

其中：处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。通信接口304，用于与其它设备比如客户端或其它服务器等的网元通信。处理器302，用于执行程序310，具体可以执行上述用于信息推荐方法实施例中的相关步骤。

具体地，程序310可以包括程序代码，该程序代码包括计算机可执行指令。

处理器302可能是中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。信息推荐设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个CPU；也可以是不同类型的处理器，如一个或多个CPU以及一个或多个ASIC。

存储器306，用于存放程序310。存储器306可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

程序310具体可以被处理器302调用使信息推荐设备执行以下操作：

在一种可选的方式中，所述兴趣隐特征向量包括兴趣差异隐特征向量和兴趣共性隐特征向量；所述程序310被处理器302调用使信息推荐设备执行以下操作：

在一种可选的方式中，所述程序310被处理器302调用使信息推荐设备执行以下操作：

在一种可选的方式中，根据所述历史用户行为序列数据确定第一历史用户行为特征向量和第二用户历史行为特征向量；所述第一历史用户行为特征向量用于表征所述目标用户在预设历史时刻的用户行为特征；所述第二用户历史行为特征向量用于表征所述目标用户在邻近历史区间的用户行为特征；所述邻近历史区间为与所述预设历史时刻邻近的时间区间；

在一种可选的方式中，所述历史用户行为序列数据中包括用户行为对应的内容类型和行为发生时间；所述程序310被处理器302调用使信息推荐设备执行以下操作：

在一种可选的方式中，所述待推荐内容数据包括多种内容类型分别对应的待推荐子内容数据；所述程序310被处理器302调用使信息推荐设备执行以下操作：

确定所述用户属性数据对应的用户属性特征向量；

本发明实施例的信息推荐设备的具体操作与前述信息推荐方法的方法步骤基本一致，不再赘述。区别于现有技术中采用的只对兴趣之间的关联进行挖掘，忽略了用户兴趣的时变性以及差异性，从而在信息推荐时未考虑到用户的近期兴趣变化所导致的信息推荐准确率不高的问题，本发明实施例提供的信息推荐设备通过根据用户属性数据、历史用户行为序列数据以及待推荐内容数据确定出兴趣隐特征向量以及所述初始聚合特征向量；其中兴趣隐特征向量用于表征用户的兴趣随时间的改变以及对于不同内容的兴趣的差异性，最后根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容，从而实现了从兴趣内容关联性、兴趣时变性以及兴趣差异性这三方面来综合确定出目标推荐内容，能够提高信息推荐的准确率，改进用户体验。

本发明实施例提供了一种计算机可读存储介质，所述存储介质存储有至少一可执行指令，该可执行指令在信息推荐设备上运行时，使得所述信息推荐设备执行上述任意方法实施例中的信息推荐方法。

可执行指令具体可以用于使得信息推荐设备执行以下操作：

在一种可选的方式中，所述兴趣隐特征向量包括兴趣差异隐特征向量和兴趣共性隐特征向量；可执行指令具体可以用于使得信息推荐设备执行以下操作：

在一种可选的方式中，可执行指令具体可以用于使得信息推荐设备执行以下操作：

在一种可选的方式中，所述可执行指令使所述信息推荐设备执行以下操作：根据预设的生成网络对所述用户属性数据、历史用户行为序列数据、所述待推荐内容数据进行关联性挖掘，得到所述兴趣共性隐特征向量；其中，所述生成网络与对抗网络组成生成对抗网络；所述生成网络的输入根据所述用户属性数据以及噪声向量确定；所述对抗网络的输入根据所述生成网络的输出、所述初始聚合特征向量以及所述历史用户行为序列数据确定。

在一种可选的方式中，所述可执行指令使所述信息推荐设备执行以下操作：

在一种可选的方式中，所述历史用户行为序列数据中包括用户行为对应的内容类型和行为发生时间；所述可执行指令使所述信息推荐设备执行以下操作：

在一种可选的方式中，所述待推荐内容数据包括多种内容类型分别对应的待推荐子内容数据；所述可执行指令使所述信息推荐设备执行以下操作：

确定所述用户属性数据对应的用户属性特征向量；

本发明实施例的计算机存储介质的具体操作与前述信息推荐方法的方法步骤基本一致，不再赘述。区别于现有技术中采用的只对兴趣之间的关联进行挖掘，忽略了用户兴趣的时变性以及差异性，从而在信息推荐时未考虑到用户的近期兴趣变化所导致的信息推荐准确率不高的问题，本发明实施例提供的计算机存储介质通过根据用户属性数据、历史用户行为序列数据以及待推荐内容数据确定出兴趣隐特征向量以及所述初始聚合特征向量；其中兴趣隐特征向量用于表征用户的兴趣随时间的改变以及对于不同内容的兴趣的差异性，最后根据所述兴趣隐特征向量、所述初始聚合特征向量确定所述目标用户对应的目标推荐内容，从而实现了从兴趣内容关联性、兴趣时变性以及兴趣差异性这三方面来综合确定出目标推荐内容，能够提高信息推荐的准确率，改进用户体验。

本发明实施例提供一种信息推荐装置，用于执行上述信息推荐方法。

本发明实施例提供了一种计算机程序，所述计算机程序可被处理器调用使信息推荐设备执行上述任意方法实施例中的信息推荐方法。

本发明实施例提供了一种计算机程序产品，计算机程序产品包括存储在计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令在计算机上运行时，使得所述计算机执行上述任意方法实施例中的信息推荐方法。

在此提供的算法或显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。

本领域技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤，除有特殊说明外，不应理解为对执行顺序的限定。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述兴趣隐特征向量包括兴趣差异隐特征向量和兴趣共性隐特征向量；所述根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据确定兴趣隐特征向量，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述历史用户行为序列数据确定所述兴趣差异隐特征向量，包括：

4.根据权利要求2所述的方法，其特征在于，所述根据所述用户属性数据、历史用户行为序列数据以及所述待推荐内容数据进行关联性挖掘，得到确定所述兴趣共性隐特征向量，包括：

5.根据权利要求4所述的方法，其特征在于，所述对抗网络的输入根据所述生成网络的输出、所述初始聚合特征向量以及所述历史用户行为序列数据确定，包括：

6.根据权利要求5所述的方法，其特征在于，所述历史用户行为序列数据中包括用户行为对应的内容类型和行为发生时间；所述根据所述历史用户行为序列数据确定第一历史用户行为特征向量和第二用户历史行为特征向量，包括：

7.根据权利要求1所述的方法，其特征在于，所述待推荐内容数据包括多种内容类型分别对应的待推荐子内容数据；所述根据所述待推荐内容数据和所述用户属性数据确定初始聚合特征向量，包括：

确定所述用户属性数据对应的用户属性特征向量；

8.一种信息推荐装置，其特征在于，所述装置包括：

9.一种信息推荐设备，其特征在于，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；

所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如权利要求1-7任意一项所述的信息推荐方法的操作。

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一可执行指令，所述可执行指令在信息推荐设备上运行时，使得信息推荐设备执行如权利要求1-7任意一项所述的信息推荐方法的操作。