CN110489639B

CN110489639B - 一种内容推荐方法及装置

Info

Publication number: CN110489639B
Application number: CN201910635419.7A
Authority: CN
Inventors: 黄腾玉
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2019-07-15
Filing date: 2019-07-15
Publication date: 2022-10-25
Anticipated expiration: 2039-07-15
Also published as: CN110489639A

Abstract

本发明实施例提供了一种内容推荐方法及装置，其中方法包括：通过将待推荐用户的最近行为，待推荐用户画像中待推荐用户的长期兴趣以及待推荐用户的用户特征结合，作为已训练兴趣表示模型的输入，通过已训练兴趣表示模型，输出待推荐用户整体兴趣的向量嵌入表示。由于长期兴趣是历史时间段内的兴趣，最近行为是当前时间之前最近的行为，长期兴趣相较于最近行为比较稳定，并且最近行为随着时间的推进，会成为长期兴趣的一部分。因此，考虑待推荐用户的最近行为，待推荐用户画像中待推荐用户的长期兴趣以及待推荐用户的用户特征结合，能够更准确全面地描述用户兴趣，然后基于待推荐用户整体的向量嵌入表示，为待推荐用户推荐感兴趣的内容。

Description

一种内容推荐方法及装置

技术领域

本发明涉及个性化推荐服务技术领域，特别是涉及一种内容推荐方法及装置。

背景技术

随着网络技术的发展，信息数量越来越多，用户常常面对这些信息而束手无策，因此需要通过网络区分这些信息从而为用户提供内容服务。在此背景下，个性化推荐服务(PersonalizedRecommender Services，简称PRS)技术应运而生。PRS中的个性化推荐是内容分发的重要途径，通过描述用户兴趣，为用户推荐感兴趣的内容，从而实现内容分发。

目前相关技术中内容推荐方法的主要步骤如下：

第一步，基于用户user的行为项目item序列，通过词向量计算的工具word2vec技术，得到所有item的向量嵌入embedding表示作为分布式表示；

第二步，将user中当前时间之前的预设时间段内的行为，称为user最近行为，取user最近行为中两个以上item的embedding表示，取加权平均或者平均，其中，embedding表示包括：观看行为的embedding表示以及搜索query行为的embedding表示；

第三步，将加权平均或者平均的结果作为用户user的embedding表示，也就是用户兴趣的表示；

第四步，基于用户兴趣的表示，为用户推荐感兴趣的内容。具体的，对item的embedding表示或者对user的embedding表示进行召回和排序，最终选出排序前P个item作为用户待推荐内容，将这些用户待推荐内容推荐给用户，用户待推荐内容包括：待推荐视频，P可以是根据用户需求进行设置的。

这种方式虽然实现将内容推荐给用户，但是上述内容推荐方法会存在如下问题：

由于最近行为变化波动比较大，无法准确地反映当前时间之前的预设时间段的用户兴趣，进而为用户推荐感兴趣的内容不够准确。

发明内容

本发明实施例的目的在于提供一种内容推荐方法及装置，用以解决现有技术中由于最近行为变化波动比较大，无法准确地反映当前时间之前的预设时间段的用户兴趣，进而为用户推荐感兴趣的内容不够准确的技术问题。具体技术方案如下：

第一方面，本发明实施例提供了一种内容推荐方法，包括：

获取待推荐用户画像及待推荐用户的最近行为，所述待推荐用户画像包括：所述待推荐用户的长期兴趣及所述待推荐用户的用户特征，所述待推荐用户的长期兴趣是指当前时间之前历史时间段内所述待推荐用户的兴趣；

确定所述待推荐用户的最近行为中项目的向量嵌入表示；

将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出所述待推荐用户整体兴趣的向量嵌入表示，所述已训练兴趣表示模型是基于样本集训练得到的，所述样本集包括：用户行为的项目序列及用户画像，所述用户行为的项目包括：用户最近行为的项目，所述用户画像包括：用户的长期兴趣及用户的用户特征；

基于所述待推荐用户整体的向量嵌入表示，为所述待推荐用户推荐感兴趣的内容。

进一步的，所述基于所述待推荐用户整体兴趣的向量嵌入表示，为所述待推荐用户推荐感兴趣的内容，包括：

根据预先构建的预推荐内容的召回索引，通过所述待推荐用户整体兴趣的向量嵌入表示，召回所述待推荐用户整体兴趣的向量嵌入表示的预推荐内容；

确定所述待推荐用户整体兴趣的向量嵌入表示与所述待推荐用户整体兴趣的向量嵌入表示的预推荐内容之间的距离；

将与所述待推荐用户整体兴趣的向量嵌入表示之间距离最小的，所述待推荐用户整体兴趣的向量嵌入表示的预推荐内容，作为感兴趣的内容；

为所述待推荐用户推荐所述感兴趣的内容。

进一步的，采用如下步骤，得到所述已训练兴趣表示模型：

获取用户行为的项目序列及用户画像，得到用户的项目的向量嵌入表示；

从所述用户行为的项目序列中，确定正向样本及负向样本，所述正向样本是指用户的点击行为的项目，所述负向样本是指用户的浏览行为的项目；

通过所述正向样本，确定所述正向样本中用户最近行为及用户画像；

通过所述负向样本，确定所述负向样本中用户最近行为及用户画像；

将所述正向样本中用户最近行为及用户画像、所述负向样本中用户最近行为及用户画像，及所述用户的项目的向量嵌入表示，作为待训练兴趣表示模型的样本集；

将所述待训练兴趣表示模型的样本集作为所述待训练兴趣表示模型，通过所述待训练兴趣表示模型进行训练，得到已训练兴趣表示模型。

进一步的，所述将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出所述待推荐用户整体兴趣的向量嵌入表示，包括：

将待推荐用户的最近行为中项目的向量嵌入表示作为已训练兴趣表示模型中的已训练Transformer模型的输入，通过所述已训练Transformer模型，得到待推荐用户的最近行为的兴趣向量嵌入表示；

池化所述待推荐用户的最近行为的兴趣向量嵌入表示，得到所述待推荐用户短期兴趣的向量嵌入表示；

将所述待推荐用户短期兴趣的向量嵌入表示，所述待推荐用户画像中的待推荐用户的长期兴趣及所述待推荐用户的用户特征进行交叉融合，得到所述待推荐用户整体兴趣的向量嵌入表示。

进一步的，采用如下步骤，得到所述已训练Transformer模型：

获取用户行为的项目序列及用户短期兴趣的向量嵌入表示；

通过查询项目的向量嵌入表示字典，限制所述用户行为的项目序列的长度，得到用户行为的定长项目序列的向量嵌入表示；

将所述用户行为的定长项目序列的向量嵌入表示及所述用户短期兴趣的向量嵌入表示，作为待训练Transformer模型的样本集；

将所述待训练Transformer模型的样本集作为所述待训练Transformer模型的输入，利用所述待训练Transformer模型进行训练，得到所述已训练Transformer模型。

进一步的，所述将所述待推荐用户短期兴趣的向量嵌入表示，所述待推荐用户画像中的待推荐用户的长期兴趣及所述待推荐用户的用户特征进行交叉融合，得到所述待推荐用户整体兴趣的向量嵌入表示，包括：

将所述待推荐用户短期兴趣的向量嵌入表示，所述待推荐用户画像中的待推荐用户的长期兴趣及所述待推荐用户的用户特征作为已训练兴趣表示模型中的已训练交叉融合模型的输入，通过所述已训练交叉融合模型，得到所述待推荐用户整体兴趣的向量嵌入表示。

进一步的，采用如下步骤，得到所述已训练交叉融合模型：

获取用户短期兴趣的向量嵌入表示及所述用户的长期兴趣；

将所述用户短期兴趣的向量嵌入表示及所述用户的长期兴趣，作为待训练交叉融合模型的样本集；

将所述待训练交叉融合模型的样本集作为所述待训练交叉融合模型的输入，利用所述待训练交叉融合模型进行训练，得到所述已训练交叉融合模型。

第二方面，本发明实施例提供了一种内容推荐装置，包括：

获取模块，用于获取待推荐用户画像及待推荐用户的最近行为，所述待推荐用户画像包括：所述待推荐用户的长期兴趣及所述待推荐用户的用户特征，所述待推荐用户的长期兴趣是指当前时间之前历史时间段内所述待推荐用户的兴趣；

第一处理模块，用于确定所述待推荐用户的最近行为中项目的向量嵌入表示；

第二处理模块，用于将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出所述待推荐用户整体兴趣的向量嵌入表示，所述已训练兴趣表示模型是基于样本集训练得到的，所述样本集包括：用户行为的项目序列及用户画像，所述用户行为的项目包括：用户最近行为的项目，所述用户画像包括：用户的长期兴趣及用户的用户特征；

推荐模块，用于基于所述待推荐用户整体的向量嵌入表示，为所述待推荐用户推荐感兴趣的内容。

进一步的，所述推荐模块用于：

为所述待推荐用户推荐所述感兴趣的内容。

进一步的，所述装置还包括：第三处理模块，用于：

进一步的，所述第二处理模块，用于：

进一步的，所述装置还包括：第四处理模块，用于：

获取用户行为的项目序列及用户短期兴趣的向量嵌入表示；

进一步的，所述第二处理模块，用于：

进一步的，所述装置还包括：第五处理模块，用于：

获取用户短期兴趣的向量嵌入表示及所述用户的长期兴趣；

第三方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现第一方面所述的方法步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面任一的方法。

第五方面，本发明实施还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面任一的方法。

本发明实施例提供的一种内容推荐方法及装置，通过将待推荐用户的最近行为，待推荐用户画像中待推荐用户的长期兴趣以及待推荐用户的用户特征结合，作为已训练兴趣表示模型的输入，通过已训练兴趣表示模型，输出待推荐用户整体兴趣的向量嵌入表示。

由此可见，由于长期兴趣是历史时间段内的兴趣，最近行为是当前时间之前最近的行为，长期兴趣相较于最近行为比较稳定，并且最近行为随着时间的推进，会成为长期兴趣的一部分。因此，考虑待推荐用户的最近行为，待推荐用户画像中待推荐用户的长期兴趣以及待推荐用户的用户特征结合，能够更准确全面地描述用户兴趣，然后基于待推荐用户整体的向量嵌入表示，为待推荐用户推荐感兴趣的内容。相较于现有技术，为用户推荐感兴趣的内容更加准确，也提高了推荐内容的效果以及内容分发的效果。

当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要的附图作简单地介绍。

图1为本发明实施例提供的内容推荐方法的流程示意图；

图2为本发明实施例得到已训练兴趣表示模型的流程示意图；

图3为本发明实施例得到待推荐用户整体兴趣的向量嵌入表示的流程示意图；

图4为本发明实施例基于待推荐用户整体的向量嵌入表示，为待推荐用户推荐感兴趣的内容的流程示意图；

图5为本发明实施例提供的内容推荐方法的具体应用举例的流程示意图；

图6为本发明实施例提供的内容推荐装置的结构示意图；

图7为本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

针对现有技术中由于最近行为变化波动比较大，无法准确地反映当前时间之前的预设时间段的用户兴趣，进而为用户推荐感兴趣的内容不够准确的问题，本发明实施例提供一种内容推荐方法及装置，通过将待推荐用户的最近行为，待推荐用户画像中待推荐用户的长期兴趣以及待推荐用户的用户特征结合，作为已训练兴趣表示模型的输入，通过已训练兴趣表示模型，输出待推荐用户整体兴趣的向量嵌入表示。

下面首先对本发明实施例提供的一种内容推荐方法进行介绍。

本发明实施例所提供的一种内容推荐方法，可以应用于电子设备，该电子设备进一步可以为但不限于：台式计算机、便携式计算机、移动终端、服务器等。任何可以实现本发明实施例内容推荐方法的电子设备，均属于本发明实施例的保护范围。进一步的，内容推荐方法也可以应用于电子设备上的客户端，比如，个人计算机(personal computer，PC)客户端或者移动终端客户端。在此不作限定。

参见图1，图1为本发明实施例提供的内容推荐方法的流程示意图。本发明实施例所提供的内容推荐方法，可以包括如下步骤：

步骤110，获取待推荐用户画像及待推荐用户的最近行为，待推荐用户画像包括：待推荐用户的长期兴趣及待推荐用户的用户特征，待推荐用户的长期兴趣是指当前时间之前历史时间段内待推荐用户的兴趣。

其中，上述待推荐用户可以是指需要推荐感兴趣内容的用户，这些待推荐用户画像用来表示待推荐用户身份信息以及行为的信息，通过这些待推荐用户画像可以为后期掌握待推荐用户需要推荐感兴趣内容，提供所需的基本信息。

相较于上述待推荐用户画像而言，一般每个用户都有各自的画像信息，称为用户画像，用户画像包括待推荐用户画像及其他用户画像，待推荐用户画像可以包含待推荐用户画像的信息，同理，对于除待推荐用户以外的其他用户来讲，每个其他用户也可以有各自的画像信息，将其他用户各自的画像信息，可以统称为其他用户画像。并且，每个其他用户各自的画像信息会体现各自用户的独特性。这些画像信息可以但不限于包括：用户的用户User特征、项目Item特征，环境Context特征、用户行为及长期兴趣。上述画像信息的具体内容举例如下：

用户的User特征用于表示用户身份，用户的User特征比如用户年龄，性别，年龄，性别，职业，居住地，爱好，婚否，有无孩子等；Item特征用于表示用户行为执行的项目，Item特征比如价格，折扣，品类和品牌相关特征，短期和长期统计类特征等；Context特征用于表示用户所处环境，Context特征比如天气，时间，地理位置，温度等；用户行为比如用户点击项目Item序列，下单项目Item序列等；长期兴趣比如用户频道偏好等。

上述待推荐用户的长期兴趣属于待推荐用户画像中的信息，同理，其他用户也可以有各自的长期兴趣。由于长期兴趣是历史时间段内的兴趣，最近行为是当前时间之前最近的行为，长期兴趣相较于最近行为比较稳定，如果仅仅使用长期兴趣为用户推荐感兴趣的内容，那么为用户推荐感兴趣的内容比较固定，变化很少；如果仅仅根据最近行为为用户推荐感兴趣的内容，无视了长期兴趣，由于最近行为变化波动比较大，为用户推荐感兴趣的内容变化很快，也容易过于发散，无法准确地反映当前时间之前的预设时间段的用户兴趣，进而为用户推荐感兴趣的内容不够准确。基于这些问题，发现最近行为与长期兴趣之间存在相关性，即最近行为随着时间的推进，会成为长期兴趣的一部分，新的最近行为又会构成新的短期兴趣。因此，可以将长期兴趣与最近行为综合考虑，从而为用户推荐感兴趣的内容，使得推荐感兴趣的内容相较于现有技术更加准确。

上述长期兴趣用于描述用户稳定的兴趣，通常长期兴趣可以使用频道偏好强度、标签权重进行描述。长期兴趣中的历史时间段可以是根据用户需求进行设置的。而，最近行为可以是当前时间之前最近的行为，比如最近行为是指当前时间之前最近的预设数量个行为，最近行为中的预设数量也可以是根据用户需求进行设置的。再比如，最近行为也可以是当前时间之前预设时间段内的行为，历史时间段包括：预设时间段，且历史时间段长于预设时间段，最近行为中的预设时间段也可以是根据用户需求进行设置的。同理，最近行为可以包括待推荐用户的最近行为，也可以不包括待推荐用户的最近行为。比如，最近行为可以是当前时间之前最近的10个行为。再比如，最近行为可以是当前时间之前1小时内的行为。这样可以从数量的角度或按照时间的角度，确定最近行为，方便获取到不同情况下的最近行为。

最近行为中的当前时间之前的预设时间段，可以称为短期，长期兴趣中的当前时间之前的历史时间段，可以称为长期，这样可以通过名称区分两个不同的时间段。比如，短期可以但不限于为当前时间之前一天的时间，长期可以但不限于为当前时间之前两天的时间或当前时间之前的两天之前的时间，其中，当前时间可以是用户正在使用应用程序(Application Program，简称APP)的电子设备的系统时间。

步骤120，确定待推荐用户的最近行为中项目的向量嵌入表示。其中，此处的项目可以为两个以上的项目，从而实现多个项目的向量嵌入表示。

本步骤120中，采用如下步骤，可以确定待推荐用户的最近行为中项目的向量嵌入表示：

基于待推荐用户的最近行为，通过word2vec算法，得到待推荐用户的最近行为中项目item的向量嵌入表示embedding，其中，word2vec算法提出的一种字向量嵌入表示wordembedding的具体手段，一般word2vec算法是从大量文本语料中以无监督的方式学习语义知识的一种模型，被大量地用在自然语言处理(Natural Language Processing，简称NLP)中。word2vec算法可以但不限于包括：skipgram或cbow等。skipgram可以是用于给定输入字input word，预测上下文。而，cbow可以是用于给定上下文，预测input word。这样可以及时且准确地确定出待推荐用户的最近行为中项目item的向量嵌入表示embedding。

步骤130，将待推荐用户的最近行为中项目的向量嵌入表示及待推荐用户画像作为已训练兴趣表示模型的输入，通过已训练兴趣表示模型，输出待推荐用户整体兴趣的向量嵌入表示，已训练兴趣表示模型是基于样本集训练得到的，样本集包括：用户行为的项目序列及用户画像，用户行为的项目包括：用户最近行为的项目，用户画像包括：用户的长期兴趣及用户的用户特征。

其中，基于用户行为的项目序列及用户画像，通过已训练兴趣表示模型，输出的用户兴趣，称为用户整体兴趣的向量嵌入表示。用户整体兴趣的向量嵌入表示是用于全面的描述用户兴趣。而，待推荐用户整体兴趣的向量嵌入表示可以是将待推荐用户的最近行为中项目的向量嵌入表示及待推荐用户画像作为已训练兴趣表示模型的输入，通过已训练兴趣表示模型，输出的待推荐用户的兴趣的向量嵌入表示。

上述用户行为的项目序列，比如用户观看的视频序列，这些视频序列可以用视频身份标识清单id list表示；用户行为的项目序列再比如用户搜索的搜索query序列、浏览购买的商品序列等。需要说明的是，这里的项目item并不限制仅仅包含要推荐的item种类，也可以包含其他种类的item。item比如如果目的是推荐搜索的query，则可以收集的item不仅有query，也可以有观看的视频、购买的商品等其他种类的item。使用其他种类的item的好处是，随着用户的行为数据增多，对用户兴趣和需求的描述会更加全面准确。

上述用户行为的项目序列一般可以包括用户最近行为的项目，用户最近行为的项目包括：用户最近行为中用户的点击行为的项目及用户最近行为中用户的浏览行为的项目。

在介绍完上述用户最近行为的项目之后，需要继续介绍已训练兴趣表示模型。使用上述样本集，可以得到已训练兴趣表示模型，这样能够通过大量训练的样本，并且这些样本与用户整体兴趣的向量嵌入表示相关，因此，通过训练得到的已训练兴趣表示模型确定后期的待推荐用户整体兴趣的向量嵌入表示，相较于现有技术中直接对取user最近行为中两个以上item的embedding表示，取加权平均或者平均得到用户兴趣的表示更加准确，因此为了得到本发明实施例的已训练兴趣表示模型，本发明实施例的方法还包括：如图2所示，采用如下步骤，得到所述已训练兴趣表示模型：

步骤131，获取用户行为的项目序列及用户画像，得到用户的项目的向量嵌入表示；这样利用用户的项目的向量嵌入表示向趋于用户行为的项目序列进行训练，得到所述用户整体兴趣的向量嵌入表示。也就是利用用户的项目的向量嵌入表示与用户行为的项目序列的相近度，确定出用户整体兴趣的向量嵌入表示。

本步骤131可以采用如下任一可能的实现方式，得到用户的项目的向量嵌入表示：

在一种可能的实现方式中，通过用户行为的项目序列，利用word2vec算法，直接得到用户的项目的向量嵌入表示。这样方便直接得到用户的项目的向量嵌入表示。

为了提高用户的项目的向量嵌入表示的准确性，在另一种可能的实现方式中，本步骤131进一步的包括：使用用户行为的项目序列中的前N位及用户画像，以前N+1位为目标进行训练，得到用户的项目的向量嵌入表示，N表示用户行为的项目序列中的数量。这样可以得到用户的项目的向量嵌入表示。

上述另一种可能的实现方式可以采用如下任一可能的方式实现，得到用户的项目的向量嵌入表示：

在一种可能的方式中，直接随机初始化项目的向量嵌入表示；将随机初始化项目的向量嵌入表示及用户行为的项目序列和用户画像作为包含transformer模型的待训练兴趣表示模型的样本集，通过样本集训练包含transformer模型的待训练兴趣表示模型，得到已训练兴趣表示模型；通过用户行为的项目序列和用户画像作为已训练兴趣表示模型的输入，通过已训练兴趣表示模型，输出用户的项目的向量嵌入表示。

在另一种可能的方式中，获取预训练项目的向量嵌入表示；对预训练项目的向量嵌入表示进行初始化，并使用初始化后的预训练项目的向量嵌入表示，基于word2vec模型，训练得到项目的向量嵌入表示。这样多次训练项目的向量嵌入表示，提高得到的项目的向量嵌入表示的准确性。

在又一种可能的方式中，获取预训练项目的向量嵌入表示；对预训练项目的向量嵌入表示进行初始化，并使用初始化后的预训练项目的向量嵌入表示，基于word2vec模型，训练得到项目的向量嵌入表示；将训练得到的项目的向量嵌入表示作为包含transformer模型的待训练兴趣表示模型的输入，通过包含transformer模型的待训练兴趣表示模型，得到已训练兴趣表示模型；通过用户行为的项目序列和用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出用户的项目的向量嵌入表示。这样多次训练项目的向量嵌入表示，提高得到的项目的向量嵌入表示的准确性。

步骤132，从用户行为的项目序列中，确定正向样本及负向样本，正向样本是指用户的点击行为的项目，负向样本是指用户的浏览行为的项目。

步骤133，通过正向样本，确定正向样本中用户最近行为及用户画像。

步骤134，通过负向样本，确定负向样本中用户最近行为及用户画像。

上述步骤133中的正向样本及本步骤134中的负向样本是用于为待训练兴趣表示模型提供分类的依据，其中，正向样本可以是指用户的点击行为的项目，负样本可以是用户的浏览行为但无点击行为的项目。这个负向样本的获取方式可以是随机采样得到负向样本。

步骤135，将所述正向样本中用户最近行为及用户画像、所述负向样本中用户最近行为及用户画像，所述用户整体兴趣的向量嵌入表示及所述用户的项目的向量嵌入表示，作为待训练兴趣表示模型的样本集。这样可以基于正向样本，确定已训练兴趣表示模型中所需的分类的兴趣表示类别。

其中，待训练兴趣表示模型可以是指需要进行训练的模型，这个模型的作用是用于分类出兴趣表示。已训练兴趣表示模型可以是已训练好的模型，这个模型的作用是最终输出兴趣表示。

步骤136，将所述待训练兴趣表示模型的样本集作为所述待训练兴趣表示模型，通过所述待训练兴趣表示模型进行训练，得到已训练兴趣表示模型。

上述步骤130中的已训练兴趣表示模型可以是一个模型，使用这个模型得到用户整体兴趣的向量嵌入表示相较于现有技术更加准确。上述步骤130中已训练表示模型还可以是由多个子模型组合而成的模型。为了得到步骤130中的待推荐用户整体兴趣的向量嵌入表示，还可以通过一个模型与其他流程步骤相结合进行完成的。

基于上述内容，本发明实施例中步骤130可以采用如下任一可能的实现方式，得到所述待推荐用户整体兴趣的向量嵌入表示：

在一种可能的实现方式，如图3所示，步骤231，将待推荐用户的最近行为中项目的向量嵌入表示作为已训练兴趣表示模型中的已训练Transformer模型的输入，通过已训练Transformer模型，得到待推荐用户的最近行为的兴趣向量嵌入表示。

已训练Transformer模型包含：位置position embedding，所述positionembedding用于捕捉输入的前后序列关系。为了简化问题，本发明实施例也可以丢弃position embedding。

为了能够得到本步骤231中的已训练Transformer模型，本发明实施例的方法还包括：采用如下步骤，得到所述已训练Transformer模型：

第1步，获取用户行为的项目序列及用户短期兴趣的向量嵌入表示。

第2步，通过查询项目的向量嵌入表示字典，限制用户行为的项目序列的长度，得到用户行为的定长项目序列的向量嵌入表示。

上述第2步中，限制用户行为的项目序列的长度包括：若用户行为的项目序列的长度短于预设长度，则为所述用户行为的项目序列的长度补0，得到定长的item embedding序列；若用户行为的项目序列的长度长于预设长度，则截断所述用户行为的项目序列的长度，得到定长的item embedding序列，预设长度可以是根据用户需求设置的。这样基于待训练transformer模型的输入长度的限制或者受资源限制，比如存储空间存储不了太多item、也不能需要的时间较长来获取太多item，从而得到满足各种限制条件的已训练transformer模型。

第3步，将用户行为的定长项目序列的向量嵌入表示及用户短期兴趣的向量嵌入表示，作为待训练Transformer模型的样本集。

上述第3步中将还未进行训练的Transformer模型，称为待训练Transformer模型，在训练完成待训练Transformer模型之后，即下面第4步，将已进行训练的待训练Transformer模型，称为已训练Transformer模型。

第4步，将待训练Transformer模型的样本集作为待训练Transformer模型的输入，利用待训练Transformer模型进行训练，得到已训练Transformer模型。这样已训练Transformer模型中的自注意力机制self-attention，可以结合item之间的相互关系，为item赋予不同的侧重，更加准确地抽取item序列所对应的用户短期兴趣。

步骤232，池化待推荐用户的最近行为的兴趣向量嵌入表示，得到待推荐用户短期兴趣的向量嵌入表示。这样已训练Transformer模型将长度size为NxD的item序列，encode编码为size为NxD的兴趣表示，通过pooling池化，得到size为1xD的user短期兴趣表示。其中，N表示item序列的数量，D表示每个item embedding的长度。

其中，最近行为中的当前时间之前的预设时间段，可以称为短期，在短期内的兴趣，称为短期兴趣。短期兴趣能够反映用户最新的兴趣变化，准确地描述短期兴趣，能够快速针对用户的兴趣变化作出相应改变，提升用户体验，提高内容分发效率。

本步骤232的池化可以是指通过已训练Transformer模型的原始输出是NxD的矩阵，得到一个1xD的矩阵，或者得到一个D维向量来表示短期兴趣。常用的池化方法有最大池化max-pooling和均值池化mean-pooling等。如果池化是mean-pooling，则需要取平均。

步骤233，将待推荐用户短期兴趣的向量嵌入表示，待推荐用户画像中的待推荐用户的长期兴趣及待推荐用户的用户特征进行交叉融合，得到待推荐用户整体兴趣的向量嵌入表示。

此处的交叉融合可以是通过一个全连接层实现，此处的全连接层是指一种神经网络的层，比如输入的向量是一个L维向量，经过一个M个节点的一层全连接层，输出的向量就是一个M维向量。全连接层可以是指通过矩阵相乘，对输入的L维向量做变换，映射到另一个空间里，变为一个M维向量。本发明实施例中可以使用多层全连接层，多层全连接层的层数可以为三层，每一层都有很多参数，这些参数最初是随机设定的，然后通过训练数据多次迭代，不断优化调整这些参数，最终这些参数组成的多层全连接层，能够实现融合长期兴趣和短期兴趣这个任务。

上述步骤233中的交叉融合可以是采用交叉融合的方法实现，也可以采用已训练交叉融合模型实现。进一步的，上述步骤233包括：将待推荐用户短期兴趣的向量嵌入表示，待推荐用户画像中的待推荐用户的长期兴趣及待推荐用户的用户特征作为已训练兴趣表示模型中的已训练交叉融合模型的输入，通过已训练交叉融合模型，得到待推荐用户整体兴趣的向量嵌入表示。这样通过已训练交叉融合模型将待推荐用户短期兴趣的向量嵌入表示，待推荐用户画像中的待推荐用户的长期兴趣及待推荐用户的用户特征进行拼接交融，可以得到更加准确的待推荐用户整体兴趣的向量嵌入表示。

其中，本发明实施例的方法还包括：采用如下步骤，得到已训练交叉融合模型：

第一步，获取用户短期兴趣的向量嵌入表示及用户的长期兴趣。

第二步，将用户短期兴趣的向量嵌入表示及用户的长期兴趣，作为待训练交叉融合模型的样本集。

上述第二步中，将还未进行训练的交叉融合模型，称为待训练交叉融合模型，在训练完成待训练交叉融合模型之后，即下面第三步，将已进行训练的待训练交叉融合模型，称为已训练交叉融合模型。

第三步，将待训练交叉融合模型的样本集作为待训练交叉融合模型的输入，利用待训练交叉融合模型进行训练，得到已训练交叉融合模型。这样通过已训练Transformer模型可以得到更加准确地用户短期兴趣，结合用户的长期兴趣，得到用户整体兴趣的向量嵌入表示。

步骤140，基于待推荐用户整体的向量嵌入表示，为待推荐用户推荐感兴趣的内容。

为了能够得到待推荐用户待推荐感兴趣的内容，本步骤140中，可以采用如下任一种可能的实现方式，基于待推荐用户整体的向量嵌入表示，为待推荐用户推荐感兴趣的内容：

在一种可能的实现方式中，对待推荐用户整体的向量嵌入表示进行召回和排序，最终选出排序前S个item作为待推荐用户推荐感兴趣的内容，将这些待推荐用户推荐感兴趣的内容推荐给用户，待推荐用户推荐感兴趣的内容包括：待推荐视频，S可以是根据用户需求进行设置。这样可以直接使用待推荐用户整体的向量嵌入表示，进行推荐感兴趣的内容。

在另一种可能的实现方式中，如图4所示，步骤141，根据预先构建的预推荐内容的召回索引，通过待推荐用户整体兴趣的向量嵌入表示，召回待推荐用户整体兴趣的向量嵌入表示的预推荐内容。预推荐内容可以是指从所有待推荐内容中选择的内容，并且这些内容后期会成为感兴趣的内容。

预先构建的预推荐内容可以是根据用户需求设置的，比如，预先构建的预推荐内容可以为观看行为，相应的，预先构建的预推荐内容的召回索引为观看行为的item向量与item观看行为之间的索引。再比如，预先构建的预推荐内容可以为视频，相应的，预先构建的预推荐内容的召回索引为视频的item向量与item视频行为推荐之间的索引。还比如，预先构建的预推荐内容可以为观看行为和视频，相应的，预先构建的预推荐内容的召回索引包括：观看行为的item向量与item观看行为之间的索引及视频的item向量与item视频行为推荐之间的索引。具体使用哪个索引可以是根据实际情况进行设置的。

由于待推荐用户整体兴趣的向量嵌入表示中的部分内容，与预先构建的预推荐内容的召回索引中的部分内容相同，这样可以通过召回索引，找到待推荐用户整体兴趣的向量嵌入表示的预推荐内容，具体的，本步骤141可以通过如下步骤，实现召回待推荐用户整体兴趣的向量嵌入表示的预推荐内容：

比较待推荐用户整体兴趣的向量嵌入表示与预先构建的预推荐内容的召回索引；召回预先构建的预推荐内容的召回索引中，与待推荐用户整体兴趣的向量嵌入表示相同的推荐内容的向量，作为待推荐用户整体兴趣的向量嵌入表示的预推荐内容。这样方便确定预推荐内容。

步骤142，确定待推荐用户整体兴趣的向量嵌入表示与待推荐用户整体兴趣的向量嵌入表示的预推荐内容之间的距离。

本步骤142中的距离可以是余弦距离，一般待推荐用户整体兴趣的向量嵌入表示与待推荐用户整体兴趣的向量嵌入表示的预推荐内容之间的余弦距离越短，则待推荐用户整体兴趣的向量嵌入表示的预推荐内容成为感兴趣的内容的可能性越大。本发明实施例中的距离只要能够得到说明待推荐用户整体兴趣的向量嵌入表示与待推荐用户整体兴趣的向量嵌入表示的预推荐内容之间的相似度所使用的距离，均属于本发明实施例的保护范围，在此不再一一举例。

本步骤142可以存在多种实现的可能场景，比如，待推荐用户整体兴趣的向量嵌入表示中包含item观看行为及item视频行为，预先构建的预推荐内容的召回索引为视频的item向量与item视频行为推荐之间的索引，那么通过步骤143得到的感兴趣的内容是item视频行为。再比如，待推荐用户整体兴趣的向量嵌入表示中包含item观看行为及item视频行为，预先构建的预推荐内容的召回索引为观看行为的item向量与item观看行为之间的索引，那么通过步骤143得到的感兴趣的内容是item观看行为。这些可能的场景都与预先构建的预推荐内容的召回索引相关，在此不再举例。这样可以使用预先构建的预推荐内容的召回索引，完成对感兴趣的内容的确定。

步骤143，将与待推荐用户整体兴趣的向量嵌入表示之间距离最小的，待推荐用户整体兴趣的向量嵌入表示的预推荐内容，作为感兴趣的内容。

本步骤143中的感兴趣的内容表明与待推荐用户整体兴趣的向量嵌入表示最相似，这样可以更加准确地确定感兴趣的内容，为待推荐用户提供更好的服务。

步骤144，为待推荐用户推荐感兴趣的内容。

在本发明实施例中，通过将待推荐用户的最近行为，待推荐用户画像中待推荐用户的长期兴趣以及待推荐用户的用户特征结合，作为已训练兴趣表示模型的输入，通过已训练兴趣表示模型，输出待推荐用户整体兴趣的向量嵌入表示。由于长期兴趣是历史时间段内的兴趣，最近行为是当前时间之前最近的行为，长期兴趣相较于最近行为比较稳定，并且最近行为随着时间的推进，会成为长期兴趣的一部分。因此，考虑待推荐用户的最近行为，待推荐用户画像中待推荐用户的长期兴趣以及待推荐用户的用户特征结合，能够更准确全面地描述用户兴趣，然后基于待推荐用户整体的向量嵌入表示，为待推荐用户推荐感兴趣的内容。相较于现有技术，为用户推荐感兴趣的内容更加准确，也提高了推荐内容的效果以及内容分发的效果。并且，已训练兴趣表示模型是通过大量样本集训练得到的，这些样本集与用户整体兴趣存在关系，因此得到的待推荐用户整体兴趣的向量嵌入表示相对准确。

如图5所示，本发明实施例的具体应用举例如下。

在搜索query推荐领域，为用户推荐的item是query，用户行为的项目中包含：搜索行为和观看行为。

步骤311，确定一个待推荐用户的待推荐用户画像及待推荐用户的最近行为，比如最近的十个行为，其中，最近行为包括：用户的点击行为及用户的浏览行为。

步骤312，确定待推荐用户的最近行为的向量嵌入表示。

步骤313，将待推荐用户的最近行为的向量嵌入表示作为已训练Transformer模型的输入，通过已训练Transformer模型，得到所述待推荐用户短期兴趣的向量嵌入表示。

步骤314，将待推荐用户画像中待推荐用户的长期兴趣与待推荐用户短期兴趣的向量嵌入表示作为已训练交叉融合模型的输入，通过已训练交叉融合模型，得到待推荐用户整体兴趣的向量嵌入表示。

步骤315，通过待推荐用户整体兴趣的向量嵌入表示与待推荐用户整体兴趣的向量嵌入表示的预推荐内容之间的距离，为所述待推荐用户推荐所述感兴趣的内容。这样相较于现有技术，为用户推荐感兴趣的内容更加准确，也提高了推荐内容的效果以及内容分发的效果。并且，已训练兴趣表示模型是通过大量样本集训练得到的，这些样本集与用户整体兴趣存在关系，因此得到的待推荐用户整体兴趣的向量嵌入表示相对准确。

下面继续对本发明实施例提供的一种内容推荐装置进行介绍。

参见6所示，图6为本发明实施例的一种内容推荐装置的结构示意图。本发明实施例提供一种内容推荐装置，包括：

获取模块11，用于获取待推荐用户画像及待推荐用户的最近行为，所述待推荐用户画像包括：所述待推荐用户的长期兴趣及所述待推荐用户的用户特征，所述待推荐用户的长期兴趣是指当前时间之前历史时间段内所述待推荐用户的兴趣；

第一处理模块12，用于确定所述待推荐用户的最近行为中项目的向量嵌入表示；

第二处理模块13，用于将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出所述待推荐用户整体兴趣的向量嵌入表示，所述已训练兴趣表示模型是基于样本集训练得到的，所述样本集包括：用户行为的项目序列及用户画像，所述用户行为的项目包括：用户最近行为的项目，所述用户画像包括：用户的长期兴趣及用户的用户特征；

推荐模块14，用于基于所述待推荐用户整体的向量嵌入表示，为所述待推荐用户推荐感兴趣的内容。

在一种可能的实现方式中，所述推荐模块用于：

为所述待推荐用户推荐所述感兴趣的内容。

在一种可能的实现方式中，所述装置还包括：第三处理模块，用于：

在一种可能的实现方式中，所述第二处理模块，用于：

在一种可能的实现方式中，所述装置还包括：第四处理模块，用于：

获取用户行为的项目序列及用户短期兴趣的向量嵌入表示；

在一种可能的实现方式中，所述第二处理模块，用于：

在一种可能的实现方式中，所述装置还包括：第五处理模块，用于：

获取用户短期兴趣的向量嵌入表示及所述用户的长期兴趣；

参见图7，图7为本发明实施例的电子设备的结构示意图。本发明实施例还提供了一种电子设备，包括处理器21、通信接口22、存储器23和通信总线24，其中，处理器21，通信接口22，存储器23通过通信总线24完成相互间的通信，

存储器23，用于存放计算机程序；

处理器21，用于执行存储器23上所存放的程序时，实现如下步骤：

确定所述待推荐用户的最近行为中项目的向量嵌入表示；

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于为，图中仅用一条粗线为，但并不为仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(Non-Volatile Memory，简称NVM)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DigitalSignal Processing，简称DSP)、专用集成电路(Application Specific IntegratedCircuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的内容推荐方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的内容推荐方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(Digital Subscriber Line，简称DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，高密度数字视频光盘(Digital Video Disc，简称DVD)、或者半导体介质(例如固态硬盘(SolidState Disk，简称SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置/电子设备/存储介质实施例/包含指令的计算机程序产品而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种内容推荐方法，其特征在于，包括：

确定所述待推荐用户的最近行为中项目的向量嵌入表示；

将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出所述待推荐用户整体兴趣的向量嵌入表示，所述已训练兴趣表示模型是基于样本集训练得到的，所述样本集包括：用户行为的项目序列及用户画像，所述用户行为的项目包括：用户最近行为的项目，所述用户画像包括：用户的长期兴趣及用户的用户特征；其中，所述待推荐用户整体兴趣的向量嵌入表示用于全面的描述用户兴趣；

基于所述待推荐用户整体兴趣的向量嵌入表示，为所述待推荐用户推荐感兴趣的内容；

其中，所述将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出所述待推荐用户整体兴趣的向量嵌入表示，包括：

2.如权利要求1所述的方法，其特征在于，所述基于所述待推荐用户整体兴趣的向量嵌入表示，为所述待推荐用户推荐感兴趣的内容，包括：

为所述待推荐用户推荐所述感兴趣的内容。

3.如权利要求1所述的方法，其特征在于，采用如下步骤，得到所述已训练兴趣表示模型：

4.如权利要求1所述的方法，其特征在于，采用如下步骤，得到所述已训练Transformer模型：

获取用户行为的项目序列及用户短期兴趣的向量嵌入表示；

5.如权利要求1所述的方法，其特征在于，所述将所述待推荐用户短期兴趣的向量嵌入表示，所述待推荐用户画像中的待推荐用户的长期兴趣及所述待推荐用户的用户特征进行交叉融合，得到所述待推荐用户整体兴趣的向量嵌入表示，包括：

6.如权利要求5所述的方法，其特征在于，采用如下步骤，得到所述已训练交叉融合模型：

获取用户短期兴趣的向量嵌入表示及所述用户的长期兴趣；

7.一种内容推荐装置，其特征在于，包括：

第二处理模块，用于将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入，通过所述已训练兴趣表示模型，输出所述待推荐用户整体兴趣的向量嵌入表示，所述已训练兴趣表示模型是基于样本集训练得到的，所述样本集包括：用户行为的项目序列及用户画像，所述用户行为的项目包括：用户最近行为的项目，所述用户画像包括：用户的长期兴趣及用户的用户特征；其中，所述待推荐用户整体兴趣的向量嵌入表示用于全面的描述用户兴趣；

推荐模块，用于基于所述待推荐用户整体兴趣的向量嵌入表示，为所述待推荐用户推荐感兴趣的内容；

其中，所述第二处理模块，具体用于：

8.如权利要求7所述的装置，其特征在于，所述推荐模块用于：

为所述待推荐用户推荐所述感兴趣的内容。

9.如权利要求7所述的装置，其特征在于，所述装置还包括：第三处理模块，用于：

10.如权利要求7所述的装置，其特征在于，所述装置还包括：第四处理模块，用于：

获取用户行为的项目序列及用户短期兴趣的向量嵌入表示；

11.如权利要求7所述的装置，其特征在于，所述第二处理模块，用于：

12.如权利要求11所述的装置，其特征在于，所述装置还包括：第五处理模块，用于：

获取用户短期兴趣的向量嵌入表示及所述用户的长期兴趣；

13.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，所述处理器，所述通信接口，所述存储器通过所述通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的程序时，实现权利要求1-6任一所述的方法步骤。