CN115439770A

CN115439770A - 一种内容召回方法、装置、设备及存储介质

Info

Publication number: CN115439770A
Application number: CN202110622144.0A
Authority: CN
Inventors: 王良栋; 丘志杰; 张博; 饶君; 刘书凯
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-06-04
Filing date: 2021-06-04
Publication date: 2022-12-06

Abstract

本申请实施例提供了一种内容召回方法、装置、设备及存储介质，涉及人工智能技术领域，该方法包括：对内容观看记录中的目标内容序列进行特征提取，获得目标对象的第一兴趣特征，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征，然后结合第一兴趣特征、第二兴趣特征以及目标内容序列中各个目标内容对应的目标属性信息，确定目标对象的目标兴趣特征。由于目标对象的目标兴趣特征融合了目标对象在多个维度的兴趣特征，使得目标对象的目标兴趣特征更加完整准确地表征了目标对象的兴趣爱好，故基于目标对象的目标兴趣特征召回内容时，能有效提高内容召回的准确性，进而提高内容推荐的准确性。

Description

一种内容召回方法、装置、设备及存储介质

技术领域

本发明实施例涉及人工智能技术领域，尤其涉及一种内容召回方法、装置、设备及存储介质。

背景技术

如今各种应用层出不穷，为了满足不同用户的需求，应用一般都会提供大量的内容(比如视频、图像、文章等)供用户选择。由于应用提供的内容较多，用户需要花费大量的时间去搜索浏览自己感兴趣的内容。为了节约用户时间，一些应用采用推荐系统个性化地为用户推荐内容。具体地，推荐系统根据用户的历史浏览记录确定用户可能喜欢的内容，然后从内容库中召回与历史浏览内容相似的内容。然而，用户的兴趣爱好是会随时间变化的，且用户的历史浏览记录并不能完整表征用户的兴趣爱好，故仅仅基于历史浏览记录进行内容召回时，内容召回的准确性较低。

发明内容

本申请实施例提供了一种内容召回方法、装置、设备及存储介质，用于提高内容召回的准确性。

一方面，本申请实施例提供了一种内容召回方法，该方法包括：

从目标对象的内容观看记录中提取目标内容序列，并获取所述目标内容序列中各个目标内容各自对应的目标属性信息；

对所述目标内容序列进行特征提取，获得所述目标对象的第一兴趣特征；

对所述目标对象的目标画像信息进行特征提取，获得所述目标对象的第二兴趣特征；

基于所述第一兴趣特征、所述第二兴趣特征以及获得的各个目标属性信息，确定所述目标对象的目标兴趣特征；

根据所述目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容。

一方面，本申请实施例提供了一种内容召回装置，该装置包括：

获取模块，用于从目标对象的内容观看记录中提取目标内容序列，并获取所述目标内容序列中各个目标内容各自对应的目标属性信息；

第一特征提取模块，用于对所述目标内容序列进行特征提取，获得所述目标对象的第一兴趣特征；

第二特征提取模块，用于对所述目标对象的目标画像信息进行特征提取，获得所述目标对象的第二兴趣特征；

融合模块，用于基于所述第一兴趣特征、所述第二兴趣特征以及获得的各个目标属性信息，确定所述目标对象的目标兴趣特征；

内容召回模块，用于根据所述目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容。

可选地，所述第二特征提取模块具体用于：

对所述目标画像信息中的各个画像标签分别进行特征提取，获得所述各个画像标签各自对应的标签特征；

基于所述各个画像标签的权重，以及所述各个画像标签各自对应的标签特征，获得所述目标对象的第二兴趣特征。

可选地，所述融合模块具体用于：

将所述第一兴趣特征和所述第二兴趣特征融合，获得所述目标对象的目标融合特征；

基于所述目标融合特征和所述各个目标属性信息，获得所述目标对象的第三兴趣特征；

将所述第一兴趣特征、所述第二兴趣特征以及所述第三兴趣特征融合，获得所述目标对象的目标兴趣特征。

可选地，所述融合模块具体用于：

对所述各个目标属性信息分别进行特征提取，获得所述各个目标属性信息各自对应的候选属性特征；

基于所述目标融合特征，分别与获得的各个候选属性特征之间的相似度，从所述各个候选属性特征中获得至少一个目标属性特征；

基于所述至少一个目标属性特征，以及所述至少一个目标属性特征各自对应的权重，获得所述目标对象的第三兴趣特征。

可选地，所述融合模块具体用于：

将所述第一兴趣特征、所述第二兴趣特征、所述第三兴趣特征以及所述目标对象对应的上下文环境特征融合，获得所述目标对象的目标兴趣特征。

可选地，所述内容召回模块具体用于：

分别对所述各个待召回内容进行特征提取，获得所述各个待召回内容对应的内容特征；

基于所述目标兴趣特征，分别与获得的各个内容特征之间相似度，从所述各个待召回内容中确定至少一个目标召回内容。

可选地，还包括内容推荐模块；

所述内容推荐模块具体用于：

所述根据所述目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容之后，按照预设规则，对所述至少一个目标召回内容进行筛选，获得至少一个候选推荐内容；

基于所述目标兴趣特征，分别与所述至少一个候选推荐内容之间相似度，对所述至少一个候选推荐内容进行推荐排序，获得推荐排序结果；

按照所述推荐排序结果，将所述至少一个候选推荐内容推荐给所述目标对象。

可选地，所述第一兴趣特征用于表征所述目标对象的短期兴趣特征，所述第二兴趣特征用于表征所述目标对象的长期兴趣特征。

一方面，本申请实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述内容召回方法的步骤。

一方面，本申请实施例提供了一种计算机可读存储介质，其存储有可由计算机设备执行的计算机程序，当所述程序在计算机设备上运行时，使得所述计算机设备执行上述内容召回方法的步骤。

本申请实施例中，对内容观看记录中的目标内容序列进行特征提取，获得目标对象的第一兴趣特征，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征，然后结合第一兴趣特征、第二兴趣特征以及目标内容序列中各个目标内容对应的目标属性信息，确定目标对象的目标兴趣特征，使获得的目标对象的目标兴趣特征能更加完整准确地表征目标对象的兴趣爱好，故基于目标对象的目标兴趣特征召回内容时，有效提高了内容召回的准确性，进而提高内容推荐的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种系统架构示意图；

图2为本申请实施例提供的一种内容召回方法的流程示意图；

图3为本申请实施例提供的一种Transformer中layer的结构示意图；

图4为本申请实施例提供的一种提取第一兴趣特征的方法的流程示意图；

图5为本申请实施例提供的一种提取第二兴趣特征的方法的流程示意图；

图6为本申请实施例提供的一种提取第二兴趣特征的方法的流程示意图；

图7为本申请实施例提供的一种提取第二兴趣特征的方法的流程示意图；

图8为本申请实施例提供的一种获得目标兴趣特征的方法的流程示意图；

图9为本申请实施例提供的一种获得目标兴趣特征的方法的流程示意图；

图10为本申请实施例提供的一种获得目标兴趣特征的方法的流程示意图；

图11为本申请实施例提供的一种获得目标兴趣特征的方法的流程示意图；

图12为本申请实施例提供的一种推荐界面的示意图；

图13为本申请实施例提供的一种Transformer-based模型的网络结构的示意图；

图14为本申请实施例提供的一种内容召回装置的结构示意图；

图15为本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了方便理解，下面对本发明实施例中涉及的名词进行解释。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

项目(ITEM)：指一篇文章，或者一个视频，或者一张图像等内容。

属性(ATTR)：指一篇文章，或者一个视频，或者一张图像等内容的属性，通常包含多个，比如标签，类别等属性。

上下文(Context)：上下文信息，也即用户在当前所处的上下文环境信息。

协同过滤(CF)：利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息，个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的，进而帮助别人筛选信息，回应不一定局限于特别感兴趣的，特别不感兴趣信息的纪录也相当重要。

UserCF：挖掘User相似度信息，推荐相似的用户喜欢的物品。

ItemCF：通过挖掘Item同现信息计算Item相似度，然后利用Item的相似度。

Item2Vec：给每一个item分配一个稠密的向量，与one-hot表示方法形成对比，可以保持item与item之间的语义维度信息。

RNN：(Recurrent neural Network，循环神经网络)，是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为。不同于前馈神经网络的是，RNN可以利用它内部的记忆来处理任意时序的输入序列。

LSTM：(Long Short-Term Memory，长短期记忆网络)，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。

GRU：(Gated Recurrent Unit，门控循环单元)，通过引入Reset Gate(重置门)和Update Gate(更新门)，可以控制历史信息的传播。

Transformer：一种由Multi-Head-Attention(多头注意力机制)、Feed ForwardNetwork(前馈神经网络)堆叠成的网络结构，可以并行处理时间序列。

Cosine相似度：余弦相似度，又称为余弦相似性，是通过计算两个向量的夹角余弦值来评估他们的相似度。

下面对本申请实施例的设计思想进行介绍。

当前采用推荐系统个性化地为用户推荐内容时，往往是根据用户的历史浏览记录确定用户可能喜欢的内容，然后从内容库中召回与历史浏览内容相似的内容，进而基于召回的内容进行内容推荐。然而，用户的兴趣爱好是会随时间变化的，且用户的历史浏览记录并不能完整表征用户的兴趣爱好，故仅仅基于历史浏览记录进行内容召回时，内容召回的准确性较低。

通过分析发现，虽然用户的历史浏览记录中，较长时间之前的内容观看记录并不能表征用户当前的兴趣爱好，但是用户近期的历史观看记录可以表征用户最近的短期兴趣。而用户年龄、性别、所在城市等用户画像信息为用户的固有属性，且用户画像信息不会轻易变化，因此用户画像信息可以表征用户的长期兴趣。另外，用户最近观看的内容的属性也蕴含着丰富的信息，可以用于表征用户的内容属性兴趣。结合用户的长期兴趣、短期兴趣以及内容属性兴趣这几个维度的特征，可以更好地表征用户的兴趣爱好，从而提高内容召回以及内容推荐的准确性。

鉴于此，本申请实施例提供了一种内容召回方法，在该方法中，从目标对象的内容观看记录中提取目标内容序列，并获取目标内容序列中各个目标内容各自对应的目标属性信息。然后对目标内容序列进行特征提取，获得目标对象的第一兴趣特征，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征。再基于第一兴趣特征、第二兴趣特征以及获得的各个目标属性信息，确定目标对象的目标兴趣特征。之后再根据目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容。

本申请实施例中，对内容观看记录中的目标内容序列进行特征提取，获得目标对象的第一兴趣特征，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征，然后结合第一兴趣特征、第二兴趣特征以及目标内容序列中各个目标内容对应的目标属性信息，确定目标对象的目标兴趣特征。由于目标对象的目标兴趣特征融合了目标对象在多个维度的兴趣特征，使得目标对象的目标兴趣特征更加完整准确地表征了目标对象的兴趣爱好，故基于目标对象的目标兴趣特征召回内容时，能有效提高内容召回的准确性，进而提高内容推荐的准确性。

参考图1，其为本申请实施例适用的一种系统架构图，该系统架构至少包括终端设备101和服务器102。

终端设备101中预先安装具备内容推荐功能的目标应用，其中，目标应用可以是客户端应用、网页版应用、小程序应用等。终端设备101可以包括一个或多个处理器1011、存储器1012、与服务器102交互的I/O接口1013以及显示面板1014等。终端设备101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载设备等，但并不局限于此。

服务器102是目标应用的后台服务器，服务器102可以包括一个或多个处理器1021、存储器1022以及与终端设备101交互的I/O接口1023等。此外，服务器102还可以配置数据库1024。服务器102可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备101与服务器102可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

本申请实施例中内容召回方法的方法可以是终端设备101执行，也可以是服务器102执行。

第一种情况，本申请实施例中内容召回方法可以是终端设备101执行。

终端设备101从目标对象的内容观看记录中提取目标内容序列，并获取目标内容序列中各个目标内容各自对应的目标属性信息。然后对目标内容序列进行特征提取，获得目标对象的第一兴趣特征，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征。再基于第一兴趣特征、第二兴趣特征以及获得的各个目标属性信息，确定目标对象的目标兴趣特征。之后再根据目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容。进一步地，终端设备101对至少一个目标召回内容进行筛选，获得至少一个候选推荐内容。然后对至少一个候选推荐内容进行推荐排序，再按照推荐排序结果，将至少一个候选推荐内容展示在目标应用的推荐界面中。

第二种情况，本申请实施例中内容召回方法可以是服务器102执行。

服务器102从目标对象的内容观看记录中提取目标内容序列，并获取目标内容序列中各个目标内容各自对应的目标属性信息。然后对目标内容序列进行特征提取，获得目标对象的第一兴趣特征，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征。再基于第一兴趣特征、第二兴趣特征以及获得的各个目标属性信息，确定目标对象的目标兴趣特征。之后再根据目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容。进一步地，服务器102对至少一个目标召回内容进行筛选，获得至少一个候选推荐内容。然后对至少一个候选推荐内容进行推荐排序，获得推荐排序结果。服务器102将至少一个候选推荐内容以及推荐排序结果发送给终端设备101。终端设备101按照推荐排序结果，将至少一个候选推荐内容展示在目标应用的推荐界面中。

需要说明的是，本申请实施例中内容召回方法也可以由终端设备101与服务器102交互执行，此处不再赘述。

基于图1所示的系统架构图，本申请实施例提供了一种内容召回方法的流程，如图2所示，该方法的流程由计算机设备执行，该计算机设备可以是图1所示的终端设备101或服务器102，包括以下步骤：

步骤S201，从目标对象的内容观看记录中提取目标内容序列，并获取目标内容序列中各个目标内容各自对应的目标属性信息。

具体地，目标对象可以是用户账号、设备编号、操作系统编号等。本申请实施例中的内容可以是文章、图像、视频等，相应地，内容观看记录至少包括以下一项：文章观看记录、图像观看记录、视频观看记录等，用户可以通过点击、双击、长按等操作产生内容观看记录。目标内容序列为目标对象在目标时段内观看的内容的序列，其中，目标时段可以是最近的预设时长的时间段，也可以其他时间段。目标内容的目标属性信息包括目标内容的类别、目标内容的属性标签等。服务器保存各个内容的属性信息，并定期或实时更新各个内容的属性信息，内容的属性信息可以是人工标记获得的，也可以是通过语音识别或图像识别的方式获得的。

举例来说，设定当前时间为10：00，用户账号M在9:00-10:00之间点击了足球比赛视频A、足球比赛集锦视频B、足球球星1的新闻报道C、足球球星2的新闻报道D。从用户账号M在9:00-10:00之间的内容观看记录中提取目标内容序列为：足球比赛视频A、足球比赛集锦视频B、足球球星1的新闻报道C、足球球星2的新闻报道D。然后获取上述各个目标内容的目标属性信息，其中，足球比赛视频A的目标属性信息为：类别{视频}，属性标签{体育、足球}；足球比赛集锦视频B的目标属性信息为：类别{视频}，属性标签{体育、足球}；足球球星1的新闻报道C的目标属性信息为：类别{文章}，属性标签{体育、足球、足球球星1}；足球球星2的新闻报道D的目标属性信息为：类别{文章}，属性标签{体育、足球、足球球星2}。

步骤S202，对目标内容序列进行特征提取，获得目标对象的第一兴趣特征。

具体地，可以采用RNN模型、LSTM模型、GRU模型、Transformer模型、embedding等方式，对目标内容序列进行特征提取，获得目标对象的第一兴趣特征。由于第一兴趣特征是通过对一段时间内的目标内容序列进行特征提取获得的，因此第一兴趣特征可以用于表征目标对象在一段时间的短期兴趣特征。

以Transformer模型为例展开来说，Transformer模型是可以处理时间序列的高效并行运算模型，由Encoder(编码器)和Decoder(解码器)组成，本申请实施例采用的是Encoder(编码器)对目标内容序列进行特征提取，获得目标对象的第一兴趣特征。

具体地，Encoder包括6个相同的layer(层)，每个layer的结构如图3所示，每个layer由两个sub-layer(子层)组成，分别为multi-head self-attention mechanism(多头注意力机制)和fully connected feed-forward network(全连接前馈网络)，其中，每个sub-layer都加了residual connection(残差连接)和normalization(归一化)。因此可以将sub_layer的输出表示为以下公式(1)：

sub_layer_output＝LayerNorm(x+(sub_layer(x))).......(1)

其中，sub_layer_output表示sub_layer的输出，LayerNorm表示归一化，x表示sub_layer的输入，sub_layer(x)表示残差连接的输入。

下面来介绍这两个sub_layer的结构，两个sub_layer分别为sub_layer_1和sub_layer_2。

sub_layer_1：

sub_layer_1以Multi-head self-attention(多头注意力)为主要结构，其中，attention(注意力)的计算过程为以下公式(2)：

attention_output＝Attention(Q,K,V).......(2)

其中，Q表示查询向量query，K表示权重系数key，V表示待融合的值value。

multi-head attention是通过h个不同的线性变换对Q，K，V进行投影，最后将不同的attention结果拼接起来。

sub_layer_2：

sub_layer_2以feed-forward networks(FFN)为主要结构，这个FFN的作用为空间变换，FFN包含了2个linear transformation(线性变换层)，两个线性变换层中间的激活函数为ReLu。

本申请实施例中，将目标内容序列输入训练好的Transformer模型的Encoder，由Encoder对目标内容序列进行特征提取，获得目标对象的第一兴趣特征。

举例来说，如图4所示，将用户账号M的目标内容序列：足球比赛视频A、足球比赛集锦视频B、足球球星1的新闻报道C、足球球星2的新闻报道D输入训练好的Transformer模型的Encoder，Encoder输出用户账号M的第一兴趣特征。

由于用户在一段时间内的信息时间差异不大，因此基于一段时间内用户点击的目标内容序列，建模用户的短期兴趣最为有效，能够让模型捕获到此刻的用户兴趣点。另外，由于Transformer模型可以并行计算，同时可以考虑目标内容序列中全部的内容，因此采用Transformer模型对目标内容序列进行特征提取，能够更好地建模出用户的短期兴趣。

步骤S203，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征。

具体地，目标画像信息中包括目标对象的年龄、性别、所在城市、职业等画像标签。通过对各个画像标签进行特征提取，获得目标对象的第二兴趣特征。由于目标画像信息中的各个画像标签为目标对象的固有属性，且各个画像标签不会轻易变化，因此，对目标画像信息进行特征提取获得的第二兴趣特征，可以用于表征目标对象的长期兴趣特征。

具体实施中，可以采用GRU模型、Transformer模型、embedding等方式对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征。

步骤S204，基于第一兴趣特征、第二兴趣特征以及获得的各个目标属性信息，确定目标对象的目标兴趣特征。

具体地，目标内容序列中各个目标内容各自对应的目标属性信息，可以用于表征用户对内容属性的偏好，通过结合第一兴趣特征表征的短期兴趣特征、第二兴趣特征表征的长期兴趣特征以及用户对内容属性的偏好，获得可以完整表征用户兴趣的目标兴趣特征。

步骤S205，根据目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容。

具体地，待召回内容包括待召回视频、待召回图像和待召回文章等。各个待召回内容预先保存在内容库中，内容库定期或实时更新。

可选地，在上述步骤S203中，对目标对象的目标画像信息进行特征提取，获得目标对象的第二兴趣特征时，本申请实施例提供了以下几种实施方式：

实施方式一、如图5所示，对目标画像信息中的各个画像标签分别进行特征提取，获得各个画像标签各自对应的标签特征。基于各个画像标签的权重，以及各个画像标签各自对应的标签特征，获得目标对象的第二兴趣特征。

具体地，分别对各个画像标签进行embedding处理，获得各个画像标签各自对应的标签特征。目标画像信息中各个画像标签的重要程度是不相同的，为了使获得的第二兴趣特征更加准确地表征用户的长期兴趣，需要基于各个画像标签的重要程度对各个画像标签各自对应的标签特征进行加权融合，获得目标对象的第二兴趣特征。

具体实施中，预先对注意力机制网络进行训练，使注意力机制网络获得各个画像标签的权重。在训练结束后，采用注意力机制网络，基于各个画像标签的权重，对各个画像标签各自对应的标签特征进行加权融合，获得目标对象的第二兴趣特征。上述注意力机制网络可以是Transformer模型中multi-head self-attention mechanism(多头注意力机制)网络，也可以是单独的self-attention(自注意力机制)网络。

举例来说，如图6所示，设定用户账号M的目标画像信息中各个画像标签分别为：年龄：25岁，性别：男，城市：上海，职业：程序员。将各个画像标签输入训练好的Transformer模型的Encoder，Encoder输出用户账号M的第二兴趣特征。

本申请实施例中，通过各个画像标签的权重来区分各个画像标签的重要程序，然后基于各个画像标签的权重，对各个画像标签各自对应的标签特征进行加权融合，使获得目标对象的第二兴趣特征更加准确地表征了用户的长期兴趣。

实施方式二、如图7所示，对目标画像信息中的各个画像标签分别进行特征提取，获得各个画像标签各自对应的标签特征。将各个画像标签各自对应的标签特征相加，获得目标对象的第二兴趣特征。

具体地，分别对各个画像标签进行embedding处理，获得各个画像标签各自对应的标签特征。然后将各个画像标签各自对应的标签特征直接相加，获得用于表征用户长期兴趣的第二兴趣特征。

本申请实施中，将各个画像标签对应的标签特征直接相加，获得目标对象的第二兴趣特征的方式，对融合网络的复杂度要求较低，且处理速度快。

可选地，在上述步骤S204中，基于第一兴趣特征、第二兴趣特征以及获得的各个目标属性信息，确定目标对象的目标兴趣特征时，本申请实施例至少提供以下几种实施方式：

实施方式一，如图8所示，将第一兴趣特征和所述第二兴趣特征融合，获得目标对象的目标融合特征，然后基于目标融合特征和各个目标属性信息，获得目标对象的第三兴趣特征。再将第一兴趣特征、第二兴趣特征以及第三兴趣特征融合，获得目标对象的目标兴趣特征。

具体地，可以将第一兴趣特征和所述第二兴趣特征直接相加，获得目标对象的目标融合特征。也可以采用注意力机制网络对第一兴趣特征和所述第二兴趣特征进行加权求和，获得目标对象的目标融合特征。

可选地，对各个目标属性信息分别进行特征提取，获得各个目标属性信息各自对应的候选属性特征。然后基于目标融合特征，分别与获得的各个候选属性特征之间的相似度，从各个候选属性特征中获得至少一个目标属性特征。再基于至少一个目标属性特征，以及至少一个目标属性特征各自对应的权重，获得目标对象的第三兴趣特征。

具体地，分别对各个目标属性信息进行embedding处理，获得各个目标属性信息各自对应的候选属性特征。基于目标融合特征对各个目标属性信息各自对应的候选属性特征进行近邻搜索，确定目标融合特征分别与获得的各个候选属性特征之间的相似度，并基于相似度从各个候选属性特征中获得至少一个目标属性特征。

具体可以选取相似度排在前N位的候选属性特征作为目标属性特征，N为正整数，也可以选取相似度大于预设阈值的候选属性特征作为目标属性特征，相似度可以是Cosine相似度、欧式距离等，其中，Cosine相似度的计算为以下公式(3)：

其中，Cos(u,v)为特征向量u与特征向量v之间的Cosine相似度，u_i为特征向量u中第i维的特征值，v_i为特征向量v中第i维的特征值。

采用注意力机制网络，基于至少一个目标属性特征各自对应的权重，对至少一个目标属性特征融合，获得目标对象的第三兴趣特征，其中，通过对注意力机制网络进行训练，获得各个目标属性特征各自对应的权重。第三兴趣特征用于表征用户的内容属性兴趣。另外，可以采用avg-pooling方式或者max-pooling方式，将第一兴趣特征、第二兴趣特征以及第三兴趣特征融合，获得目标对象的目标兴趣特征。

举例来说，如图9所示，设定用户账号M最近一段时间观看两个视频和两篇文章，两个视频和两篇文章对应的各个目标属性信息为：视频、文章、体育、足球。对各个目标属性信息进行embedding处理，获得候选属性特征1、候选属性特征2、候选属性特征3、候选属性特征4。将用户账号M的第一兴趣特征和第二兴趣特征融合，获得目标融合特征。采用目标融合特征对各个候选属性特征进行近邻搜索，获得与目标融合特征最相似的2个目标属性特征，分别为候选属性特征3、候选属性特征4。然后将候选属性特征3、候选属性特征4输入注意力机制网络，获得第三兴趣特征。然后将第一兴趣特征、第二兴趣特征以及第三兴趣特征融合，获得用户账号M的目标兴趣特征。

本申请实施例中，先基于用户的长短期兴趣，从各个目标内容对应的目标属性特征中选取与用户最相关的目标属性特征，然后对各个目标属性特征进行加权融合，使获得的第三兴趣特征能更加准确的表征了用户对内容属性的偏好，同时使第三兴趣特征契合了用户在长期兴趣和短期兴趣上的分布，平衡了用户的长短期兴趣，加强刻画了用户观看的各个内容之间的协同关系，提升行为稀疏用户的推荐效果。

实施方式二、如图10所示，分别对各个目标属性信息分别进行特征提取，获得各个目标属性信息各自对应的目标属性特征。将获得的各个目标属性特征融合，获得目标对象的第三兴趣特征。将第一兴趣特征、第二兴趣特征以及第三兴趣特征融合，获得目标对象的目标兴趣特征。

具体地，分别对各个目标属性信息进行embedding处理，获得各个目标属性信息各自对应的目标属性特征。采用注意力机制网络，基于各个目标属性特征各自对应的权重，对各个目标属性特征融合，获得目标对象的第三兴趣特征，其中，通过对注意力机制网络进行训练，获得各个目标属性特征各自对应的权重。也可以将各个目标属性特征直接相加，获得目标对象的第三兴趣特征。第三兴趣特征用于表征用户的内容属性兴趣。

另外，可以采用avg-pooling方式或者max-pooling方式，将第一兴趣特征、第二兴趣特征以及第三兴趣特征融合，获得目标对象的目标兴趣特征。

举例来说，如图11所示，设定用户账号M最近一段时间观看两个视频和两篇文章，两个视频和两篇文章对应的各个目标属性信息为：视频、文章、体育、足球。对各个目标属性信息进行embedding处理，获得目标属性特征1、目标属性特征2、目标属性特征3、目标属性特征4。将目标属性特征1、目标属性特征2、目标属性特征3、目标属性特征4输入注意力机制网络，获得第三兴趣特征。然后将第一兴趣特征、第二兴趣特征以及第三兴趣特征融合，获得用户账号M的目标兴趣特征。

本申请实施例中，结合用户的长期兴趣、短期兴趣以及内容属性兴趣多个维度的特征，获得目标对象的目标兴趣特征，使获得的目标兴趣特征能更加全面准确地表征用户的兴趣爱好，故基于目标兴趣特征召回内容时，可以提高内容召回的准确性，进而提高内容推荐的准确性。

可选地，除了用户的长期兴趣、短期兴趣以及内容属性兴趣之外，用户观看内容的时间信息、设备信息、网络信息等上下环境信息对内容召回和内容推荐也具备一定的参考意义。为此，本申请实施例中，将第一兴趣特征、第二兴趣特征、第三兴趣特征以及目标对象对应的上下文环境特征融合，获得目标对象的目标兴趣特征。

具体地，预先获取目标对象对应的上下文环境信息，上下文环境信息包括时间信息、设备信息、网络信息等环境参数。分别对各个环境参数进行embedding处理，获得各个环境参数各自对应的环境特征。然后采用直接相加的方式或者采用注意力机制网络进行加权求和的方式，对获得的各个环境特征进行融合，获得目标对象对应的上下文环境特征。之后再采用avg-pooling方式或者max-pooling方式，将第一兴趣特征、第二兴趣特征、第三兴趣特征以及目标对象对应的上下文环境特征融合，获得目标对象的目标兴趣特征。

通过结合用户的长期兴趣、短期兴趣、内容属性兴趣以及上下文环境信息多个维度的特征，获得目标对象的目标兴趣特征，使获得的目标兴趣特征能更加全面准确地表征用户的兴趣爱好，故基于目标兴趣特征召回内容时，可以提高内容召回的准确性，进而提高内容推荐的准确性。

需要说明的是，在获得目标对象的目标兴趣特征时，可以不仅限于采用上述第一兴趣特征、第二兴趣特征、第三兴趣特征以及目标对象对应的上下文环境特征，也可以包括用户具体的内容观看形式(比如播放视频、分享视频、点赞视频、评论视频等)，也可以包括用户的反馈信息(比如用户对视频的正向评价和负面评价等)，还可以是用户的其他行为信息，对此，本申请不做具体限定。

可选地，在上述步骤S205中，在进行内容召回时，分别对各个待召回内容进行特征提取，获得各个待召回内容对应的内容特征。然后基于目标兴趣特征，分别与获得的各个内容特征之间相似度，从各个待召回内容中确定至少一个目标召回内容。

具体地，分别对各个待召回内容进行embedding处理，获得各个待召回内容对应的内容特征。相似度可以是Cosine相似度、欧式距离等。可以按照相似度从大到小的顺序对各个待召回内容进行排序，然后选取排在前L位的待召回内容作为目标召回内容，其中，L为预设正整数。也可以预先设置候选阈值，将相似度大于候选阈值的待召回内容，作为目标召回内容。

本申请实施例中，基于目标兴趣特征，分别与获得的各个内容特征之间相似度，从各个待召回内容中确定出与目标兴趣特征最相似的至少一个目标召回内容，使目标召回内容贴近用户兴趣，提高内容召回的准确性。

可选地，从各个待召回内容中确定至少一个目标召回内容之后，按照预设规则，对至少一个目标召回内容进行筛选，获得至少一个候选推荐内容。然后基于目标兴趣特征，分别与至少一个候选推荐内容之间相似度，对至少一个候选推荐内容进行推荐排序，获得推荐排序结果。然后按照推荐排序结果，将至少一个候选推荐内容推荐给目标对象。

具体地，预设规则可以是内容相关性、内容时效性、内容对应地域、内容多样性等。通过对至少一个目标召回内容进行筛选，获得至少一个候选推荐内容，可以减少后续推荐排序的规模。服务器按照相似度从大到小的顺序，对至少一个候选推荐内容进行推荐排序，获得推荐排序结果。然后将推荐排序结果以及至少一个候选推荐内容发送给终端设备，终端设备在应用的推荐界面中按照推荐排序结果展示至少一个候选推荐内容。

举例来说，设定服务器采用本申请实施例中的内容召回方法确定了5个目标召回内容，分别为视频1、视频2、视频3、文章4和文章5，然后按照内容相关性对5个目标召回内容进行筛选。由于视频1和视频2的内容相关性大于预设阈值，文章4和文章5的内容相关性大于预设阈值，为了避免向用户推荐重复的内容引发用户反感，故去除视频2和文章5，将保留的视频1、视频3和文章4作为候选推荐内容。然后基于目标兴趣特征，分别与上述3个候选推荐内容之间相似度，对上述3个候选推荐内容进行推荐排序，获得推荐排序结果为视频3、文章4、视频1。服务器将视频1、视频3、文章4以及推荐排序结果发送给终端设备。终端设备在应用的推荐界面中，按照推荐排序结果展示视频1、视频3、文章4，具体如图12所示，推荐界面中从上之下依次展示视频3、文章4、视频1。

需要说明的是，除了基于目标兴趣特征，分别与至少一个候选推荐内容之间相似度，对至少一个候选推荐内容进行推荐排序，获得推荐排序结果之后，还可以采用其他的方式对各个候选推荐内容进行推荐排序，比如训练点击率预估模型预估用户点击各个候选推荐内容的概率，然后按照概率从大到小的顺序进行推荐排序。

本申请实施例中，结合用户的长期兴趣、短期兴趣以及内容属性兴趣等多个维度的特征，获得目标对象的目标兴趣特征，使获得的目标兴趣特征能更加全面准确地表征用户的兴趣爱好，故基于目标兴趣特征召回内容时，可以提高内容召回的准确性。进一步地，通过对召回的内容进行筛选排序和推荐，也提高了内容推荐的准确性，从而提升用户体验。

为了更好地解释本申请实施例，下面结合模型结构，介绍本申请实施例提供的一种内容召回方法，该方法由服务器执行。首先介绍本申请实施例中Transformer-based模型的网络结构，如图13所示，包括内容序列模块(ItemSeq)、用户画像模块(UserProf)、内容属性模块(Attr2Item)、在线服务模块(Online Serving)、离线训练模块(OfflineTraining)、共享嵌入模块(Shared Embeds)、各种嵌入查找层(Various Embeds LookupLayer)。

内容序列模块(ItemSeq)包括两个Transformer layer，用户画像模块(UserProf)包括一个Transformer layer，内容属性模块(Attr2Item)包括一个注意力机制层(TopN-attention layer)。共享嵌入模块(Shared Embeds)为各种嵌入查找层提供各种特征嵌入，具体包括属性嵌入(Attr Embeds)、内容嵌入(Item Embeds)、动作嵌入(Action Embeds)以及上下文环境嵌入(Context Embeds)。

先对Transformer-based模型进行离线训练，离线训练模块(Offline Training)计算预测获得的样本兴趣特征与参考兴趣特征(Targrt Embed)之间的抽样损失(SampledLoss)。当抽样损失满足预设条件时，训练结束。

采用训练好的Transformer-based模型进行内容召回的具体过程如下：

从目标用户账号的内容观看记录中，提取最近一段时间内用户点击的目标内容序列(Item Seq Inputs)，并获取目标内容序列中各个目标内容各自对应的目标属性信息(Item Attr Inputs)，获取目标用户账号的用户画像信息(User Prof Inputs)。

通过各种嵌入查找层将目标内容序列(Item Seq Inputs)输入内容序列模块(ItemSeq)，内容序列模块通过序列嵌入(Seq Embeds Pooler)、Transformer layer以及序列单元(Seq Units)对用户画像信息进行特征提取，获得第一兴趣特征(V_short)。

通过各种嵌入查找层将用户画像信息(User Prof Inputs)输入用户画像模块(UserProf)，用户画像模块通过画像嵌入(Prof Embeds)、Transformer layer以及画像单元(Prof Units)对目标内容序列进行特征提取，获得第二兴趣特征(V_long)。

将第一兴趣特征和第二兴趣特征融合(Aggregate)，获得长短兴趣特征。将长短兴趣特征输入内容属性模块(Attr2Item)，同时将各个目标属性信息(Item Attr Inputs)对应的候选属性特征输入内容属性模块(Attr2Item)。内容属性模块以长短兴趣特征作为内容属性模块的激活信号进行近邻搜索，从各个目标属性信息对应的候选属性特征中，选取与长短兴趣特征最相近的N个目标属性特征，然后采用注意力机制将N个目标属性特征进行加权融合(weight-sum pooling)，获得第三兴趣特征(V_attr)。

采用avg-pooling的方式融合第一兴趣特征、第二兴趣特征和第三兴趣特征，获得目标兴趣特征并将目标兴趣特征输入在线服务模块(Online Serving)。在线服务模块(Online Serving)计算目标兴趣特征与召回内容库中各个待召回内容之间的Cosine相似度。基于Cosine相似度从各个待召回内容中选取TopK个目标召回内容。

进一步地，按照预设规则，对TopK个目标召回内容进行筛选，获得至少一个候选推荐内容。训练点击率预估模型预估用户点击各个候选推荐内容的概率，然后按照概率从大到小的顺序进行推荐排序，获得推荐排序结果。再按照推荐排序结果，将至少一个候选推荐内容推荐给目标用户账号。

基于相同的技术构思，本申请实施例提供了一种内容召回装置，如图14所示，该装置1400包括：

获取模块1401，用于从目标对象的内容观看记录中提取目标内容序列，并获取所述目标内容序列中各个目标内容各自对应的目标属性信息；

第一特征提取模块1402，用于对所述目标内容序列进行特征提取，获得所述目标对象的第一兴趣特征；

第二特征提取模块1403，用于对所述目标对象的目标画像信息进行特征提取，获得所述目标对象的第二兴趣特征；

融合模块1404，用于基于所述第一兴趣特征、所述第二兴趣特征以及获得的各个目标属性信息，确定所述目标对象的目标兴趣特征；

内容召回模块1405，用于根据所述目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容。

可选地，所述第二特征提取模块1403具体用于：

可选地，所述融合模块1404具体用于：

可选地，所述内容召回模块1405具体用于：

可选地，还包括内容推荐模块1406；

所述内容推荐模块1406具体用于：

根据所述目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容之后，按照预设规则，对所述至少一个目标召回内容进行筛选，获得至少一个候选推荐内容；

基于相同的技术构思，本申请实施例提供了一种计算机设备，计算机设备可以是终端或服务器，如图15所示，包括至少一个处理器1501，以及与至少一个处理器连接的存储器1502，本申请实施例中不限定处理器1501与存储器1502之间的具体连接介质，图15中处理器1501和存储器1502之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。

在本申请实施例中，存储器1502存储有可被至少一个处理器1501执行的指令，至少一个处理器1501通过执行存储器1502存储的指令，可以执行上述内容召回方法中所包括的步骤。

其中，处理器1501是计算机设备的控制中心，可以利用各种接口和线路连接计算机设备的各个部分，通过运行或执行存储在存储器1502内的指令以及调用存储在存储器1502内的数据，从而进行内容召回和内容推荐。可选的，处理器1501可包括一个或多个处理单元，处理器1501可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1501中。在一些实施例中，处理器1501和存储器1502可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。

处理器1501可以是通用处理器，例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器1502作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1502可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory，RAM)、静态随机访问存储器(Static Random Access Memory，SRAM)、可编程只读存储器(Programmable Read Only Memory，PROM)、只读存储器(Read Only Memory，ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性存储器、磁盘、光盘等等。存储器1502是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请实施例中的存储器1502还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

基于同一发明构思，本申请实施例提供了一种计算机可读存储介质，其存储有可由计算机设备执行的计算机程序，当程序在计算机设备上运行时，使得计算机设备执行上述内容召回方法的步骤。

本领域内的技术人员应明白，本发明的实施例可提供为方法、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种内容召回方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述对所述目标对象的目标画像信息进行特征提取，获得所述目标对象的第二兴趣特征，包括：

3.如权利要求1所述的方法，其特征在于，所述基于所述第一兴趣特征、所述第二兴趣特征以及获得的各个目标属性信息，确定所述目标对象的目标兴趣特征，包括：

4.如权利要求3所述的方法，其特征在于，所述基于所述目标融合特征和所述各个目标属性信息，获得所述目标对象的第三兴趣特征，包括：

5.如权利要求3所述的方法，其特征在于，所述将所述第一兴趣特征、所述第二兴趣特征以及所述第三兴趣特征融合，获得所述目标对象的目标兴趣特征，包括：

6.如权利要求1所述的方法，其特征在于，所述根据所述目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容，包括：

7.如权利要求1至6任一所述的方法，其特征在于，所述根据所述目标兴趣特征，从各个待召回内容中确定至少一个目标召回内容之后，还包括：

按照预设规则，对所述至少一个目标召回内容进行筛选，获得至少一个候选推荐内容；

8.如权利要求7所述的方法，其特征在于，所述第一兴趣特征用于表征所述目标对象的短期兴趣特征，所述第二兴趣特征用于表征所述目标对象的长期兴趣特征。

9.一种内容召回装置，其特征在于，包括：

10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1～8任一权利要求所述方法的步骤。

11.一种计算机可读存储介质，其特征在于，其存储有可由计算机设备执行的计算机程序，当所述程序在计算机设备上运行时，使得所述计算机设备执行权利要求1～8任一所述方法的步骤。