CN116628310A

CN116628310A - 内容的推荐方法、装置、设备、介质及计算机程序产品

Info

Publication number: CN116628310A
Application number: CN202210127545.3A
Authority: CN
Inventors: 吴贻清; 谢若冰; 陈鑫; 林乐宇; 何清; 朱勇椿; 张旭
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-02-11
Filing date: 2022-02-11
Publication date: 2023-08-22
Anticipated expiration: 2042-02-11
Also published as: CN116628310B

Abstract

本申请公开了一种内容的推荐方法、装置、设备、介质及计算机程序产品，涉及人工智能领域。该方法包括：获取候选内容的内容特征数据、目标账号的行为序列数据和全局账号的行为图数据；对行为序列数据和行为图数据进行视图特征融合，得到目标账号对应的账号特征数据；基于账号特征数据和内容特征数据对候选内容进行评分，得到推荐评分；基于推荐评分从候选内容中确定出向目标账号进行推送的目标推荐内容。由于通过序列结构的视图数据以及图结构的视图来共同构建用于指示目标账号的兴趣情况的账号特征数据，能够立体地对用户的兴趣进行建模，从而提升内容推荐时的推荐准确度。

Description

内容的推荐方法、装置、设备、介质及计算机程序产品

技术领域

本申请涉及人工智能领域，特别涉及一种内容的推荐方法、装置、设备、介质及计算机程序产品。

背景技术

在互联网服务中，个性化推荐服务能够根据用户的偏好对其进行对应的内容推荐，以使得互联网平台通过推荐的内容获取更高的效益。

相关技术中，为提升个性化推荐服务针对不同用户的推荐精准度，往往通过收集用户在应用中的交互行为数据来针对该用户的个性化推荐系统进行训练，其中，一般通过将用户的行为数据从交互日志中提取出来，并处理为一种指定数据结构的数据作为推荐系统的输入。

然而，上述推荐系统的设计中，仅仅考虑了一种数据结构的视图，不能立体地对用户的兴趣进行建模，从而导致个性化推荐服务的推荐准确度降低，且在行为数据的数据量较少的冷启动阶段，由于数据的稀疏性也会导致推荐准确度的降低。

发明内容

本申请实施例提供了一种内容的推荐方法、装置、设备、介质及计算机程序产品，能够提升内容推荐时的推荐准确度。所述技术方案如下：

一方面，提供了一种内容的推荐方法，所述方法包括：

获取候选内容的内容特征数据、目标账号的行为序列数据和全局账号的行为图数据，所述行为序列数据用于指示所述目标账号对应的个体交互行为，所述行为序列数据为序列结构的视图数据，所述行为图数据用于指示包括所述目标账号在内的所述全局账号的交互行为，所述行为图数据为图结构的视图数据；

对所述行为序列数据和所述行为图数据进行视图特征融合，得到所述目标账号对应的账号特征数据；

基于所述账号特征数据和所述内容特征数据对所述候选内容进行评分，得到推荐评分；

基于所述推荐评分从所述候选内容中确定出向所述目标账号进行推送的目标推荐内容。

另一方面，提供了一种内容的推荐装置，所述装置包括：

获取模块，用于获取候选内容的内容特征数据、目标账号的行为序列数据和全局账号的行为图数据，所述行为序列数据用于指示所述目标账号对应的个体交互行为，所述行为序列数据为序列结构的视图数据，所述行为图数据用于指示包括所述目标账号在内的所述全局账号的交互行为，所述行为图数据为图结构的视图数据；

融合模块，用于对所述行为序列数据和所述行为图数据进行视图特征融合，得到所述目标账号对应的账号特征数据；

评分模块，用于基于所述账号特征数据和所述内容特征数据对所述候选内容进行评分，得到推荐评分；

推荐模块，用于基于所述推荐评分从所述候选内容中确定出向所述目标账号进行推送的目标推荐内容。

另一方面，提供了一种计算机设备，所述终端包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现本申请实施例中任一所述的内容的推荐方法。

另一方面，提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现本申请实施例中任一所述的内容的推荐方法。

另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中任一所述的内容的推荐方法。

本申请的提供的技术方案至少包括以下有益效果：

通过对目标账号对应的行为序列数据和行为图数据分别进行视图特征融合，以得到目标账号对应的账号特征数据，然后通过账号特征数据和待推荐的候选内容的内容特征数据来确定候选内容对应的推荐评分，以使得能够根据推荐评分来从候选内容中确定出推送给目标账号的推荐内容。由于通过序列结构的视图数据以及图结构的视图来共同构建用于指示目标账号的兴趣情况的账号特征数据，能够立体地对用户的兴趣进行建模，从而提升内容推荐时的推荐准确度，同时，由于引入了图结构的行为图数据是由包括目标账号在内的全局账号的交互行为生成的，即使在冷启动阶段也能够通过行为图数据中全局账号和内容之间的连接关系来为目标账号进行内容推荐，保证了内容推荐的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的实施环境示意图；

图2是本申请一个示例性实施例提供的内容的推荐方法流程图；

图3是本申请一个示例性实施例提供的目标推荐系统示意图；

图4是本申请一个示例性实施例提供的账号特征数据的确定方法流程图；

图5是本申请一个示例性实施例提供的行为序列数据对应的序列视图示意图；

图6是本申请一个示例性实施例提供的行为图数据对应的图视图示意图；

图7是本申请一个示例性实施例提供的账号特征数据的确定流程图；

图8是本申请一个示例性实施例提供的推荐系统的训练方法流程图；

图9是本申请一个示例性实施例提供的样本内容特征列表示意图；

图10是本申请一个示例性实施例提供的内容的推荐装置结构框图；

图11是本申请另一个示例性实施例提供的内容的推荐装置结构框图；

图12是本申请一个示例性实施例提供的服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先，对本申请实施例中涉及的名词进行简要介绍：

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。在本申请实施例中，基于人工智能中的机器学习/深度学习完成针对目标账号的内容推荐过程。

其次，对本申请实施例提供的内容的推荐方法的应用场景进行说明：

第一，应用于电子商务平台，电子商务平台能够提供商品的交易服务，在电子商务平台在为用户进行商品内容的推荐时。电子商务平台的后台服务器可以在得到用户授权的情况下获取用户账号的行为数据，该行为数据包括用户账号对电子商务平台中提供商品的浏览行为、加入购物车行为、收藏行为、分享行为、购买行为等。通过用户账号的行为数据得到行为序列数据和行为图数据，对行为序列数据和行为图数据进行视图特征融合，得到用户账号的账号特征数据，通过该账号特征数据和待推荐商品对应的内容特征数据进行评分，得到待推荐商品的推荐评分，将推荐评分满足预设推荐要求的待推荐商品的商品信息推送至用户终端，由用户终端中电子商务平台的客户端进行显示。

第二，应用于文章/影视平台，文章平台能够提供文章内容的阅读服务，影视平台能够提供视频内容的观看服务。文章/影视平台的后台服务器在得到用户授权的情况下获取用户账号的行为数据，该行为数据包括文章/视频内容的浏览行为、浏览时长、收藏行为、分享行为、投稿行为等。后台服务器通过本申请实施例提供的内容的推荐方法，使用用户账号的行为数据进行待推荐文章/视频内容的推荐评分确定，将推荐评分满足预设推荐要求的待推荐文章/视频内容的文章/视频信息推送至用户终端，由用户终端中文章/影视平台的客户端进行显示。

示意性的，该方法同样可以应用于社交平台、搜索引擎、智慧交通平台等场景中，值得注意的是，上述应用场景仅为示意性的举例，本申请提供的内容推荐方法可以应用于其他包含个性化推荐的应用场景中。

结合上述名词简介和应用场景，对本申请实施例的实施环境进行说明。如图1所示，该实施环境的计算机系统中包括：终端设备110、服务器120和通信网络130。

终端设备110包括手机、平板电脑、台式电脑、便携式笔记本电脑、智能语音交互设备、智能家电、车载终端等多种形式的设备。终端设备110中运行有目标应用，该目标应用中包括用于对用户进行候选内容推荐的服务模块。该服务模块会在用户使用目标应用时进行内容推荐。示意性的，该目标应用可以是传统应用软件，可以是云应用软件，可以实现为宿主应用程序中的小程序或应用模块，也可以是某个网页平台，在此不进行限定。

服务器120用于向终端设备110中的目标应用提供后端服务，其中，后端服务包括内容推荐服务。示意性的，服务器120在得到用户授权的情况下，从终端设备110获取到用户账号对应的行为数据，服务器120通过上述行为数据获取用户账号对应的账号特征数据，通过候选内容对应的内容特征数据以及账号特征数据确定候选内容对应的推荐评分，根据推荐评分对候选内容进行筛选，确定向终端设备110进行推送的目标推荐内容。示意性的，服务器120在确定目标推荐内容后，将该目标推荐内容发送至终端设备110，终端设备110在接收到目标推荐内容后，通过目标应用对该目标推荐内容进行显示。

值得注意的是，上述服务器120可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

其中，云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。

在一些实施例中，上述服务器120还可以实现为区块链系统中的节点。区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。

示意性的，终端设备110和服务器120之间通过通信网络130连接，其中，上述通信网络130可以是有线网络，也可以是无线网络，在此不进行限定。

请参考图2，其示出了本申请一个实施例示出的内容的推荐方法，在本申请实施例中，以该方法应用于如图1所示的服务器中，该方法包括：

步骤201，获取候选内容的内容特征数据、目标账号的行为序列数据和全局账号的行为图数据。

上述行为序列数据用于指示目标账号对应的个体交互行为，即，行为序列数据为通过目标账号的行为数据生成的数据，其中，该行为序列数据为序列结构的视图数据。

上述行为图数据用于指示包括目标账号在内的全局账号的交互行为，即，行为图数据为由全局账号中各个账号的行为数据生成的数据，其中，行为图数据为图结构的视图数据。

示意性的，上述全局账号为满足指定账号范围要求的账号。在一些实施例中，在目标推荐系统的训练过程中，上述全局账号为参与目标推荐系统训练的样本账号，示意性的，以个性化目标推荐系统为例，即，服务器为目标账号训练的目标推荐系统针对目标账号的目标推荐系统，以满足对目标账号进行内容推荐的个性化需求，则上述全局账号可以是目标推荐系统的应用平台中所有的用户账号，也可以是与目标账号满足预设社交条件的账号，例如，服务器在获取用户授权的条件下，获取目标账号的通讯录，将目标账号通讯录中的账号确定为上述全局账号。上述目标推荐系统为内容推荐服务提供者向账号进行内容推荐所使用的推荐系统，其中，内容推荐服务提供者会向用户提供不针对其个人特征的选项，或者向用户提供便捷的关闭内容推荐服务的选项。用户选择关闭内容推荐服务的，内容推荐服务提供者会立即停止提供相关服务。内容推荐服务提供者会向用户提供选择或者删除用于内容推荐服务的针对其个人特征的用户标签的功能。当判断用户可能有沉迷，过度消费等行为时，会对用户进行提醒。

其中，上述账号的行为数据用于指示目标账号对已推送内容的触发情况，例如，终端设备通过目标应用显示了目标内容，目标账号对目标内容进行了点击操作，则终端设备在获取到目标账号的用户授权的情况下，对该点击操作进行记录，并生成对应的行为数据进行缓存，或上传至服务器进行云端记录。

在一些实施例中，上述行为数据与目标推荐系统的应用场景相关。在一个示例中，当目标推荐系统应用于电子商务平台时，上述行为数据包括搜索操作、浏览操作、加入购物车操作、购买操作、分享操作、收藏操作等。在另一个示例中，当目标推荐系统应用于文章/音视频平台时，上述行为数据包括搜索操作、浏览操作、分享操作、收藏操作、投稿操作等。其中，上述行为操作仅以电子商务平台和文章/音视频平台进行举例说明，行为数据还可以是其他行为产生的数据，在此不进行具体限定。

在一些实施例中，目标推荐系统中包括数据视图构造模块，该数据视图构造模块能够将输入的目标账号的行为数据构造为上述行为序列数据和行为图序列数据。示意性的，以电子商务平台中的目标推荐系统为例，数据视图构造模块从目标账号的交互日志中获取行为数据，将行为数据按照序列结构和图结构分别构造为行为序列数据和行为图序列数据。

示意性的，上述候选内容的内容特征数据可以是通过预先训练的内容编码网络对候选内容进行特征提取得到的。

上述候选内容为目标应用中的应用内容，例如，当目标应用为电子商务应用时，则候选内容为商品内容，当目标应用为音视频应用时，则候选内容为音视频内容。

可选地，上述候选内容可以是目标应用中的全部内容，也可以是通过预筛选得到的候选内容，在一个示例中，上述预筛选过程可以是根据内容的发布时间进行筛选得到的目标数量的候选内容，例如，优先选择发布时间较近的内容作为候选内容，在另一个示例中，上述预筛选过程还可以是根据内容的分类与目标账号的兴趣分类的关联程度进行筛选得到的目标数量的候选内容，例如，优先选择目标账号设置的兴趣分类下的内容作为候选内容。

步骤202，对行为序列数据和行为图数据进行视图特征融合，得到目标账号对应的账号特征数据。

在一些实施例中，通过对行为序列数据和行为图数据分别进行特征提取，得到对应行为特征，然后再对行为特征进行视图特征融合，以得到上述账号特征数据。

示意性的，对对行为序列数据进行特征编码，得到第一行为特征，对行为图数据进行特征编码，得到第二行为特征，对第一行为特征和第二行为特征进行视图特征融合，得到账号特征数据。

在一些实施例中，目标推荐系统还包括行为编码模块，该行为编码模块用于对行为序列数据和行为图数据进行编码。

示意性的，该行为编码模块中包括序列编码网络，该序列编码网络可以是通过提供的训练样本进行训练得到的网络，也可以是通过目标账号的历史行为数据训练得到的编码。在一个示例中，服务器以预设频率获取目标账号的历史行为数据对目标推荐系统进行训练，在目标推荐系统的训练过程中实现对上述序列编码网络的训练，上述预设频率可以是系统预设的，也可以是用户自定义设置的，具体的预设频率可以是一周训练一次，也可以是目标应用以登录目标账号的运行时长达到目标时长时，对目标账号对应的目标推荐系统进行一次训练。

可选地，上述序列编码网络可以是卷积神经网络(Convolutional NeuralNetworks，CNN)、循环神经网络(Recurrent Neural Network，RNN)、长短时记忆网络(LongShort-Term Memory Network，LSTM)、深度自动编码器(Deep Auto-encoders)等网络，在此不进行限定。

示意性的，上述编码模块还包括图编码网络，该图编码网络可以是通过提供的训练样本进行训练得到的网络，也可以是通过目标账号的历史行为数据训练得到的编码，即，与序列编码网络在目标账号的个性化目标推荐系统的训练过程中完成训练。

可选地，上述图编码网络可以是卷积神经网络、循环神经网络、长短时记忆网络、深度自动编码器、图卷积神经网络(Graph Convolutional Network，GCN)等网络，在此不进行限定。

在本申请实施例中，在通过行为序列数据得到第一行为特征，通过行为图数据得到第二行为特征之后，需要对第一行为特征和第二行为特征进行视图特征融合，从而得到用于表征目标账号的行为特征的账号特征数据。

在一些实施例中，上述目标推荐系统还包括视图融合模块，该视图融合模块用于对编码模块输出的不同视图对应的行为特征进行特征融合，以得到账号特征数据。示意性的，上述视图融合模块中包括视图融合网络，即，将第一行为特征和第二行为特征输入至视图融合网络中进行特征融合，得到账号特征数据。

可选地，上述视图融合网络可以是多层感知机(Multilayer Perceptron，MLP)，也可以是其他网络结构的网络，在此不进行限定。

步骤203，基于账号特征数据和内容特征数据对候选内容进行评分，得到推荐评分。

上述推荐评分用于从候选内容中确定出向目标账号进行推送的目标推荐内容。

在一些实施例中，上述目标推荐系统还包括评分模块，该评分模块用于对根据账号特征数据对候选内容相对于目标账号的推荐价值进行评分，得到上述推荐评分。示意性的，评分模块对输入的账号特征数据和内容特征数据进行特征相乘，得到推荐评分。在一个示例中，当账号特征数据和内容特征数据为向量形式的特征表示时，则通过账号特征向量和内容特征向量之间的乘积来得到推荐评分，其中，上述乘积的计算可以是数量积也可以是矢量积，在此不进行限定。

示意性的，如图3所示，其示出了本申请一个示例性实施例提供的目标推荐系统300示意图，该目标推荐系统300中包括数据视图构造模块310、编码模块320、视图融合模块330以及评分模块340，其中，目标账号的行为数据输入至数据视图构造模块310进行数据构造，得到行为序列数据和行为图数据，行为序列数据和行为图数据被输入至编码模块320进行特征编码，其中，编码模块320中的序列编码网络321用于对行为序列数据进行编码，得到第一行为特征，图编码网络322用于对行为图数据进行编码，得到第二行为特征，第一行为特征和第二行为特征被输入至视图融合模块330进行视图特征融合，得到目标账号对应的账号特征数据，同时，编码模块320中还包括内容编码网络323对候选内容进行特征提取，得到内容特征数据，账号特征数据和内容特征数据被输入至评分模块340进行特征相乘，输出候选内容对应的推荐评分。

步骤204，基于推荐评分从候选内容中确定出向目标账号进行推送的目标推荐内容。

可选地，在确定候选内容的推荐评分后，可以根据候选内容的推荐评分对候选内容进行排序，得到候选内容列表，从候选内容列表中筛选出向目标账号进行推送的目标推荐内容。在一个示例中，可以根据预设推送比例从候选内容列表中筛选出目标推荐内容，例如，候选内容列表中的候选内容根据推荐评分降序排列，将位于候选内容列表的前30％的候选内容确定为目标推荐内容。

可选地，在确定候选内容的推荐评分后，可以通过预设筛选阈值从候选内容中筛选出目标推荐内容，示意性的，响应于候选内容的推荐评分达到预设筛选阈值，将候选内容确定为目标推荐内容。

综上所述，本申请实施例提供的内容的推荐方法，通过对目标账号对应的行为序列数据和行为图数据分别进行视图特征融合，以得到目标账号对应的账号特征数据，然后通过账号特征数据和待推荐的候选内容的内容特征数据来确定候选内容对应的推荐评分，以使得能够根据推荐评分来从候选内容中确定出推送给目标账号的推荐内容。由于通过序列结构的视图数据以及图结构的视图来共同构建用于指示目标账号的兴趣情况的账号特征数据，能够立体地对用户的兴趣进行建模，从而提升内容推荐时的推荐准确度，同时，由于引入了图结构的行为图数据是由包括目标账号在内的全局账号的交互行为生成的，即使在冷启动阶段也能够通过行为图数据中全局账号和内容之间的连接关系来为目标账号进行内容推荐，保证了内容推荐的准确度。

请参考图4，其示出了本申请一个示例性实施例提供的账号特征数据的确定方法，在本申请实施例中，对目标账号的账号特征数据的确定进行示意性说明，该方法包括：

步骤401，获取目标账号的行为序列数据和目标账号的行为图数据。

上述行为序列数据用于指示目标账号对应的个体交互行为，其中，该行为序列数据为序列结构的视图数据。上述行为图数据用于指示包括目标账号在内的全局账号的交互行为，其中，行为图数据为图结构的视图数据。

在一些实施例中，上述行为序列数据和行为图数据通过目标推荐系统中的数据视图构造模块进行数据构造得到的。示意性的，获取目标账号的账号行为数据，目标账号的行为数据用于指示目标账号对已推送内容的触发情况，根据目标账号的行为数据以序列结构进行视图构建，得到行为序列数据，以图结构进行视图构建，得到行为图数据。

示意性的，基于账号行为数据中交互操作之间的时间顺序，生成行为序列数据，在一个示例中，以目标推荐系统应用于电子商务平台为例，如图5所示，其示出了本申请一个示例性实施例提供的行为序列数据对应的序列视图500示意图，其中，序列视图500中的序列节点501代表目标账号的行为数据对应的交互内容，即目标账号产生过行为数据的“商品”，第一行序列510代表“购买”操作对应的序列数据，第二行序列520代表“加购(加入购物车)”操作对应的序列数据，第三行序列530代表“点击”操作对应的序列数据，其中，每一行序列中的“商品”之间根据交互操作之间的时间顺序进行排列。

示意性的，由于行为图数据用于指示包括目标账号在内的全局账号的交互行为，因此行为图数据是基于全局账号的全局行为数据构建的。即，获取全局账号的全局行为数据，基于全局行为数据中账号与内容之间的交互情况，生成行为图数据。在一个示例中，以目标推荐系统应用于电子商务平台为例，如图6所示，其示出了本申请一个示例性实施例提供的行为图数据对应的图视图600示意图，其中，图视图600中的图节点包括账号节点601和内容节点602，账号节点601用于表示全局账号中的账号，内容节点602用于表示全局行为数据中涉及的交互内容，即全局账号产生过行为数据的“商品”，其中，账号节点601和内容节点602之间通过不同的边来指示账号节点601和内容节点602之间不同的交互行为。

在一些实施例中，当行为数据对应至少两种行为类别时，行为图数据对应的图视图中账号节点和内容节点之间的边用于指示至少两种行为类别中类别优先级最高的交互行为。例如，在电子商务平台的应用场景下，交互行为中购买操作对应的优先级最高，加购操作次之，点击操作的优先级最低，账号A对商品A进行了点击操作、加购操作和购买操作，则账号A的节点和商品A的节点之间的边为表示购买操作的边。

步骤4021，将行为序列数据输入至第一序列网络进行特征提取，得到至少两种行为类别分别对应的第一类别特征。

在本申请实施例中，目标推荐系统中还包括编码模块，该编码模块中包括序列编码网络和图编码网络。

在一些实施例中，当用于生成行为序列数据和行为图数据的行为数据为单类别的行为数据时，上述序列编码网络为用于对行为序列数据进行特征编码的网络，即，行为序列数据输入至序列编码网络进行特征提取，得到第一行为特征。

在另一些实施例中，当用于生成行为序列数据和行为图数据的行为数据为多类别的行为数据时，即，行为序列数据和至少两种行为类别对应，上述序列编码网络还用于对至少两种行为类别进行行为特征融合，得到第一行为特征，即，将行为序列数据输入至序列编码网络，对至少两种行为类别进行行为特征融合，得到第一行为特征。

在本申请实施例中，以行为数据为多类别的行为数据为例进行说明，示意性的，序列编码网络包括第一序列网络和第二序列网络，其中，第一序列网络用于对每个行为类别的数据进行特征编码，第二序列网络用于将每个行为类别的特征进行行为特征融合，将目标账号对应的所有行为数据融合成多行为的综合特征表示，得到第一行为特征。即，将行为序列数据输入至第一序列网络进行特征提取，得到至少两种行为类别分别对应的第一类别特征。

在一个示例中，对行为序列数据的编码具体如公式一所示，其中，SeqEnc为行为序列编码器，sb为上述行为序列数据，u^s,b表示目标账号在序列结构的视图下第b种行为类别的编码表示。

公式一：u^s,b＝SeqEnc(sb)

步骤4022，将至少两种行为类别分别对应的第一类别特征输入至第二序列网络进行特征融合，得到第一行为特征。

在得到第一类别特征之后，通过第二序列网络将每个行为类别的特征进行特征融合，即，将至少两种行为类别分别对应的第一类别特征输入至第二序列网络进行特征融合，得到第一行为特征。

在一个示例中，以通过MLP来完成特征融合过程为例，第一类别特征的融合具体如公式二所示，其中，MLPs表示用于MLP结构的第二序列网络，其中，u^s,bn表示目标账号u在行为类别bn下的第一类别特征。

公式二：u^s＝MLPs(u^s,b1‖,…,||u^s,bn)

步骤4031，将行为图数据输入至第一图网络进行特征提取，得到至少两种行为类别分别对应的第二类别特征。

在一些实施例中，当用于生成行为序列数据和行为图数据的行为数据为单类别的行为数据时，上述图编码网络为用于对行为图数据进行特征编码的网络，即，行为图数据输入至图编码网络进行特征提取，得到第二行为特征。

在另一些实施例中，当用于生成行为序列数据和行为图数据的行为数据为多类别的行为数据时，即，行为图数据和至少两种行为类别对应，上述图编码网络还用于对至少两种行为类别进行行为特征融合，得到第一行为特征，即，将行为图数据输入至图编码网络，对至少两种行为类别进行行为特征融合，得到第二行为特征。

示意性的，图编码网络包括第一图网络和第二图网络，其中，第一图网络用于对每个行为类别的数据进行特征编码，第二图网络用于将每个行为类别的特征进行行为特征融合，将目标账号对应的所有行为数据融合成多行为的综合特征表示，得到第二行为特征。即，将行为图数据输入至第一图网络进行特征提取，得到至少两种行为类别分别对应的第二类别特征。

在一个示例中，对行为图数据的编码具体如公式三所示，其中，GraphEnc为行为图编码器，G为行为图数据对应的图，u为图中用于表示用户的节点，b为图中用于表示交互行为的节点，u^g,b表示目标账号在图结构的视图下第b种行为类别的编码表示。

公式三：u^g,b＝GraphEnc(G,u,b)

步骤4032，将至少两种行为类别分别对应的第二类别特征输入至第二图网络进行特征融合，得到第二行为特征。

在得到第二类别特征之后，通过第二图网络将每个行为类别的特征进行特征融合，即，将至少两种行为类别分别对应的第二类别特征输入至第二图网络进行特征融合，得到第二行为特征。

在一个示例中，以通过MLP来完成特征融合过程为例，第二类别特征的融合具体如公式四所示，其中，MLPg表示用于MLP结构的第二图网络，其中，u^g,bn表示目标账号u在行为类别bn下的第二类别特征，u⁰表示行为图数据中用于表示账号节点的节点特征。

公式四：u^g＝MLPg(u⁰||u^g,b1‖,…,||u^g,bn)

步骤404，对第一行为特征和第二行为特征进行视图特征融合，得到账号特征数据。

在本申请实施例中，目标推荐系统还包括视图融合模块，该视图融合模块用于对编码模块输出的不同视图对应的行为特征进行特征融合，以得到账号特征数据。示意性的，上述视图融合模块中包括视图融合网络，即，将第一行为特征和第二行为特征输入至视图融合网络中进行特征融合，得到账号特征数据。

可选地，上述视图融合网络可以是多层感知机，也可以是其他网络结构的网络，在此不进行限定。在一个示例中，如公式五所示，账号特征数据u由第一行为特征us和第二行为特征ug输入至视图融合网络MLPU中进行视图融合得到。

公式五：u＝MLPU(u^s‖u^g)

示意性的，如图7所示，其示出了本申请一个示例性实施例提供的账号特征数据的确定流程图，行为序列数据711通过第一序列网络进行特征编码，得到第一类别特征712，行为图数据721通过第一图网络进行特征编码，得到第二类别特征722，第一类别特征712通过第二序列网络进行特征融合，得到第一行为特征713，第二类别特征722通过第二图网络进行特征融合，得到第二行为特征723，第一行为特征713和第二行为特征723通过视图融合网络进行视图特征融合，得到账号特征数据730。

综上所述，本申请实施例提供的账号特征数据的确定方法，通过在账号特征数据的确定过程中，将目标账号对应的行为数据构建为行为序列数据和行为图数据，针对行为序列数据和行为图数据分别进行特征编码和特征融合，得到第一行为特征和第二行为特征，通过视图特征融合将第一行为特征和第二行为特征进行融合，得到用于表征目标账号的兴趣情况的账号特征数据。其中，通过行为序列数据能够确定目标账号的兴趣情况随时间的演化，而通过行为图数据则能从系统全局出发确定目标账号和应用内容之间的全局联系，两者能够从不同角度强化推荐系统的推荐效果，同时，将用户的多行为和多视图(包括图结构的视图数据以及序列结构的视图数据)视为对账号对应的兴趣情况的数据增强，从而提高了推荐系统的推荐效果。

请参考图8，其示出了本申请一个示例性实施例提供的推荐系统的训练方法，在本申请实施例中，目标推荐系统由待训练推荐系统根据样本账号的历史行为数据进行训练得到，该方法包括：

步骤801，获取样本账号的历史行为数据。

上述历史行为数据用于指示样本账号在历史时段内对已推送内容的触发情况。

示意性的，上述样本账号可以是目标推荐系统对应的目标账号，也可以是全局账号中的其他账号。上述历史时段可以是系统预设的历史时段，也可以是用户自定义的历史时段，在此不进行限定。

步骤802，将历史行为数据输入至待训练推荐系统，由待训练推荐系统根据历史行为数据对样本内容的推荐价值进行预测，得到样本内容对应的预测评分。

示意性的，待训练推荐系统通过历史行为数据对样本内容的预测评分进行计算的过程包括：对历史行为数据进行数据构造，得到样本账号的样本序列数据和样本图数据，对样本序列数据和样本图数据进行视图特征融合，得到样本账号对应的训练账号特征数据，基于样本图数据获取样本内容对应的样本内容特征数据，基于训练账号特征数据和样本内容特征数据确定预测评分。其中，样本序列数据为用于指示样本账号在历史时段内的个体交互行为，样本图数据用于指示全局账号在历史时段内的交互行为。

在本申请实施例中，历史行为数据包括至少两种行为类别的行为数据，则通过样本序列数据和样本图数据进行视图特征融合的过程包括：对样本序列数据进行特征提取，得到至少两种行为类别分别对应的第三类别特征，对至少两种行为类别分别对应的第三类别特征进行特征融合，得到第三行为特征，对样本图数据进行特征提取，得到至少两种行为类别分别对应的第四类别特征，对至少两种行为类别分别对应的第四类别特征进行特征融合，得到第四行为特征，对第三行为特征和第四行为特征进行视图特征融合，得到训练账号特征数据。示意性的，上述训练账号特征数据的获取过程如步骤401～步骤404中示出的账号特征数据的获取过程相同，在此不进行赘述。

在本申请实施例中，针对待训练推荐系统的训练过程中，样本内容对应的样本内容特征数据由样本内容对应的内容信息以及样本图数据中样本内容之间的联系共同确定，示意性的，获取样本内容对应的第一样本特征，第一样本特征用于指示样本内容的内容信息，对样本图数据进行特征提取，得到第二样本特征，第二样本特征用于指示在样本账号的行为关联下样本内容之间的联系，对第一样本特征和第二样本特征进行特征融合，得到样本内容特征。

在一些实施例中，上述第一样本数据为通过将样本内容输入至第一内容特征提取网络进行特征提取得到的，上述第二样本特征为通过将样本图数据输入至第二内容特征提取网络进行特征提取得到的，上述第一内容特征提取网络和第二内容特征提取网络为预先训练得到的特征网络。可选地，上述第一内容特征提取网络可以是卷积神经网络、循环神经网络、长短时记忆网络、深度自动编码器等网络，在此不进行限定，上述第二内容特征提取网络可以是卷积神经网络、循环神经网络、长短时记忆网络、深度自动编码器、图卷积神经网络等网络，在此不进行限定。

可选地，对第一样本特征和第二样本特征进行特征融合可以是通过预先训练得到的特征融合网络完成，也可以是通过预设权重对第一样本特征和第二样本特征进行加权求和得到，在此不进行限定。示意性的，通过MLP对第一样本特征和第二样本特征进行融合为例，如公式六所示，样本内容特征v由第一样本特征v⁰和第二样本特征v^g输入至特征融合网络MLPV中进行特征融合得到。

公式六：v＝MLPV(v⁰‖v^g)

在本申请实施例中，当得到样本内容的样本内容特征之后，可以根据至少两种行为类别之间的类别优先级对样本内容特征进行排列，在一个示例中，如图9所示，其示出了本申请一个示例性实施例提供的样本内容特征列表900示意图，其中，内容特征列表900的队首部分910用于存储在与样本账号具有交互行为的样本内容中类别优先级高的样本内容特征，例如，购买操作对应的样本内容的样本内容特征，队中部分920用于存储与样本账号具有交互行为的样本内容中类别优先级低的样本内容特征，例如，加购操作和点击操作对应的样本内容的样本内容特征，在一个示例中，队首部分910用于存储类别优先级最高的样本内容特征，即，将类别优先级最高的交互行为视为推荐服务的主导向行为，而其他类别优先级对应的交互行为视为推荐服务的辅助导向行为，内容特征列表900还包括队尾部分930，该队尾部分930用于存储和样本账号之间不存在交互行为的样本内容。

其中，上述待训练推荐系统在训练过程中设置的主导向行为可以是应用内容在于目标账户交互过程中具有高价值的行为，例如，应用于电子商务平台时，购买操作即可作为主导向行为。

步骤803，基于预测评分与样本内容相对于样本账号的标准评分之间的差异情况，对待训练推荐系统进行迭代训练，得到目标推荐系统。

示意性的，在得到样本内容的预测评分之后，可以通过该预测评分与样本内容对应的标准评分之间的差异，来对待训练推荐系统进行迭代训练。其中，上述样本内容相对于样本账号的标准评分为根据样本账号对样本内容的交互行为的价值进行预标记的，例如，以电子商务平台为例，当样本账号对样本内容A的交互行为包括点击操作、加购操作和购买操作，由于购买操作为高价值的交互行为，因此将样本内容A相对于样本账号的标准评分设置为1，当样本账号对样本内容B的交互行为包括点击操作，因此将样本内容B相对于样本账号的标准评分设置为0.3，当样本账号对样本内容C不存在交互行为时，因此将样本内容C相对于样本账号的标准评分设置为0。

在一些实施例中，可以通过预测评分和标准评分之间的差异情况来对待训练推荐系统进行迭代训练，其中，上述预测评分和标准评分之间的差异情况可以通过交叉熵损失函数、最大似然损失函数、均方误差损失函数等损失函数计算得到。即，获取预测评分和标准评分之间的第一损失值，响应于第一损失值达到目标训练要求，确定待训练推荐系统训练完成，得到目标推荐系统，或者，响应于第一损失值未达到目标训练要求，对待推荐系统中的模型参数进行迭代训练。

示意性的，上述待推荐系统中的模型参数包括编码模块中序列编码网络的模型参数、图编码网络的模型参数、视图融合网络的模型参数中的至少一种参数。

在另一些实施例中，为提升训练得到的目标推荐系统的推荐准确度，在待训练推荐系统的损失值的确定过程中，除了上述第一损失值外，本申请还设计了以下三个学习方向，即，引入下述三个学习方向对应的损失值来对待训练推荐系统进行训练：

(a)多行为对比学习

一个用户的账号对应的不同交互行为均能够反映该用户的兴趣，因此不同的交互行为之间具有一定的联系，可以采用对比学习来建立这一部分的联系，即，将单个样本账号对应的多种行为类别的交互行为进行对比学习，其核心思想是单个样本账号对应的交互行为之间的关系要比其他样本账号对应的交互行为的关系更加紧密。

示意性的，多行为的对比学习过程为通过计算同一样本账号下不同行为类别之间的差异情况来完成迭代训练中模型的学习过程，在一些实施例中，基于至少两种行为类别分别对应的第三类别特征之间的差异情况，获取第二损失值，第二损失值用于指示在序列结构下不同行为类别之间的特征差异，基于至少两种行为类别分别对应的第四类别特征之间的差异情况，获取第三损失值，第三损失值用于指示在所述图结构下不同行为类别之间的特征差异。在一个示例中，以针对序列结构的视图数据为例，第二损失值L_seqCL由公式七计算得到，其中，表示样本账号u_i在交互行为b1下的第三类别特征，/>表示样本账号u_i在交互行为b2下的第三类别特征，/>表示样本账号u_j在交互行为b2下的第三类别特征。

公式七：

其中，公式七中的由公式八计算得到，公式八的输入x、y、z与的输入对应。

公式八：f(x,y,z)＝log(σ(x^Ty-x^Tz))

(b)多视图对比学习

同样的，由于单个样本账号对应的交互行为之间的关系要比其他样本账号对应的交互行为的关系更加紧密，因此还可以通过对比学习建立不同视图数据之间的联系，即，将同一样本是账号对应的多视图进行对比学习。

示意性的，多视图的对比学习过程为通过计算同一样本账号下不同视图数据之间的差异情况来完成迭代训练中模型的学习过程，在一些实施例中，基于第三行为特征和第四行为特征之间的差异情况，获取第四损失值，第四损失值用于指示不同视图数据之间的特征差异。在一个示例中，第四损失值LviewCL由公式九计算得到，其中，标识样本账号u_i对应的第三行为特征，/>标识样本账号u_i对应的第四行为特征，/>标识样本账号u_j对应的第四行为特征，其中，/>同样由公式八计算得到，即，将公式八的输入x、y、z分别替换为/>的输入。

公式九：

(c)账号行为对比学习

除了一个用户的账号对应的不同交互行为能够反映该用户的兴趣之外，不同行为类别之间的交互行为在代表账号对应的兴趣的强烈程度时有着一种偏序，例如，在电子商务平台的应用场景中，账号对应的购买操作所代表的用户对商品的兴趣往往要大于点击操作对应的兴趣，因此，还能够通过样本账号对应的不同类别优先级下样本内容之间的差异完成账号行为的对比学习过程。

示意性的，基于样本内容特征数据中样本内容之间的差异情况，获取第五损失值，第五损失值用于指示不同样本内容之间的特征差异。在一个示例中，根据类别优先级可以将至少两种行为类别划分为主导向行为和辅助导向行为，其中，第五损失值L_DisCL可以由公式十计算得到，其中，u代表第u个样本账号对应的训练账号特征数据，v_i代表第u个样本账号产生主导向行为的样本内容对应的样本内容特征数据，v_j代表第u个样本账号产生辅助导向行为的样本内容对应的样本内容特征数据，v_k代表第u个样本账号未产生交互行为的样本内容对应的样本内容特征数据，β为预设权重参数，其中，f(u,v_i,v_j)和f(u,v_j,v_k)均由公式八对应的计算方法计算得到。

公式十：

示意性的，通过上述三种对比学习的方法对待训练推荐模型进行迭代训练，即，基于第一损失值、第二损失值、第三损失值、第四损失值、第五损失值，对待训练推荐系统进行迭代训练，得到目标推荐系统。

综上所述，本申请实施例提供的推荐系统的训练方法，通过样本账号的历史行为数据对待训练推荐系统进行训练，其中，在训练过程中还引入了多行为对比学习、多视图对比学习以及账号行为对比学习，在联合建模多种交互行为的基础上，从不同的角度对账号对应的行为数据进行学习，提升了训练得到的目标推荐系统在个性化推荐时的准确度。

需要说明的是，本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本申请中涉及到的行为数据都是在充分授权的情况下获取的。

请参考图10，其示出了本申请一个示例性的实施例提供的内容的推荐装置结构框图，该装置包括如下模块：

获取模块1010，用于获取候选内容的内容特征数据、目标账号的行为序列数据和全局账号的行为图数据，所述行为序列数据用于指示所述目标账号对应的个体交互行为，所述行为序列数据为序列结构的视图数据，所述行为图数据用于指示包括所述目标账号在内的所述全局账号的交互行为，所述行为图数据为图结构的视图数据；

融合模块1020，用于对所述行为序列数据和所述行为图数据进行视图特征融合，得到所述目标账号对应的账号特征数据；

评分模块1030，用于基于所述账号特征数据和所述内容特征数据对所述候选内容进行评分，得到推荐评分；

推荐模块1040，用于基于所述推荐评分从所述候选内容中确定出向所述目标账号进行推送的目标推荐内容。

在一些可选的实施例中，如图11所示，所述装置还包括：

编码模块1050，用于对所述行为序列数据进行特征编码，得到第一行为特征；

所述编码模块1050，还用于对所述行为图数据进行特征编码，得到第二行为特征；

所述融合模块1020，还用于对所述第一行为特征和所述第二行为特征进行视图特征融合，得到所述账号特征数据。

在一些可选的实施例中，所述行为序列数据和至少两种行为类别对应，所述行为图数据和所述至少两种行为类别对应；

所述编码模块1050，还用于将所述行为序列数据输入至序列编码网络，对所述至少两种行为类别进行行为特征融合，得到所述第一行为特征；

所述编码模块1050，还用于将所述行为图数据输入至图编码网络，对所述至少两种行为类别进行行为特征融合，得到所述第二行为特征。

在一些可选的实施例中，所述序列编码网络包括第一序列网络和第二序列网络；

所述编码模块1050，包括：

第一编码单元1051，用于将所述行为序列数据输入至所述第一序列网络进行特征提取，得到所述至少两种行为类别分别对应的第一类别特征；

第一融合单元1052，用于将所述至少两种行为类别分别对应的第一类别特征输入至所述第二序列网络进行特征融合，得到所述第一行为特征。

在一些可选的实施例中，所述图编码网络包括第一图网络和第二图网络；

所述第一编码单元1051，还用于将所述行为图数据输入至所述第一图网络进行特征提取，得到所述至少两种行为类别分别对应的第二类别特征；

所述第一融合单元1052，还用于将所述至少两种行为类别分别对应的第二类别特征输入至所述第二图网络进行特征融合，得到所述第二行为特征。

在一些可选的实施例中，所述获取模块1010，还用于获取目标账号的账号行为数据，所述目标账号的行为数据用于指示所述目标账号对已推送内容的触发情况；

所述装置还包括：构造模块1060，用于基于所述账号行为数据中交互操作之间的时间顺序，生成所述行为序列数据；

所述获取模块1010，还用于获取所述全局账号的全局行为数据；

所述构造模块1060，还用于基于所述全局行为数据中账号与内容之间的交互情况，生成所述行为图数据。

在一些可选的实施例中，所述方法应用于目标推荐系统中，所述目标推荐系统由待训练推荐系统根据样本账号的历史行为数据进行训练得到；

所述获取模块1010，还用于获取所述样本账号的所述历史行为数据，所述历史行为数据用于指示所述样本账号在历史时段内对已推送内容的触发情况；

所述装置还包括：训练模块1070，用于将所述历史行为数据输入至所述待训练推荐系统，由所述待训练推荐系统根据所述历史行为数据对样本内容的推荐价值进行预测，得到所述样本内容对应的预测评分；

所述训练模块1070，还用于基于所述预测评分与所述样本内容相对于所述样本账号的标准评分之间的差异情况，对所述待训练推荐系统进行迭代训练，得到所述目标推荐系统。

在一些可选的实施例中，所述构造模块1060，还用于对所述历史行为数据进行数据构造，得到所述样本账号的样本序列数据和样本图数据，所述样本序列数据为用于指示所述样本账号在所述历史时段内的个体交互行为，所述样本图数据用于指示所述全局账号在所述历史时段内的交互行为；

所述训练模块1070，还包括：

第二融合单元1071，用于对所述样本序列数据和所述样本图数据进行视图特征融合，得到所述样本账号对应的训练账号特征数据；基于所述样本图数据获取样本内容对应的样本内容特征数据；

预测单元1072，用于基于所述训练账号特征数据和所述样本内容特征数据确定所述预测评分。

在一些可选的实施例中，所述历史行为数据包括至少两种行为类别的行为数据；

所述训练模块1070，还包括：

第二编码单元1073，用于对所述样本序列数据进行特征提取，得到所述至少两种行为类别分别对应的第三类别特征；

所述第二融合单元1071，还用于对所述至少两种行为类别分别对应的第三类别特征进行特征融合，得到第三行为特征；

所述第二编码单元1073，还用于对所述样本图数据进行特征提取，得到所述至少两种行为类别分别对应的第四类别特征；

所述第二融合单元1071，还用于对所述至少两种行为类别分别对应的第四类别特征进行特征融合，得到第四行为特征；

所述第二融合单元1071，还用于对所述第三行为特征和所述第四行为特征进行视图特征融合，得到所述训练账号特征数据。

在一些可选的实施例中，所述第二编码单元1073，还用于获取所述样本内容对应的第一样本特征，所述第一样本特征用于指示所述样本内容的内容信息；

所述第二编码单元1073，还用于对所述样本图数据进行特征提取，得到第二样本特征，所述第二样本特征用于指示在所述样本账号的行为关联下样本内容之间的联系；

所述第二融合单元1071，还用于对所述第一样本特征和所述第二样本特征进行特征融合，得到所述样本内容特征。

在一些可选的实施例中，所述训练模块1070，还包括：

训练单元1074，用于获取所述预测评分和所述标准评分之间的第一损失值；基于所述至少两种行为类别分别对应的第三类别特征之间的差异情况，获取第二损失值，所述第二损失值用于指示在所述序列结构下不同行为类别之间的特征差异；基于所述至少两种行为类别分别对应的第四类别特征之间的差异情况，获取第三损失值，所述第三损失值用于指示在所述图结构下不同行为类别之间的特征差异；基于所述第三行为特征和所述第四行为特征之间的差异情况，获取第四损失值，所述第四损失值用于指示不同视图数据之间的特征差异；基于所述样本内容特征数据中样本内容之间的差异情况，获取第五损失值，所述第五损失值用于指示不同样本内容之间的特征差异；基于所述第一损失值、所述第二损失值、所述第三损失值、所述第四损失值、所述第五损失值，对所述待训练推荐系统进行迭代训练，得到所述目标推荐系统。

综上所述，本申请实施例提供的内容的推荐装置，通过对目标账号对应的行为序列数据和行为图数据分别进行视图特征融合，以得到目标账号对应的账号特征数据，然后通过账号特征数据和待推荐的候选内容的内容特征数据来确定候选内容对应的推荐评分，以使得能够根据推荐评分来从候选内容中确定出推送给目标账号的推荐内容。由于通过序列结构的视图数据以及图结构的视图来共同构建用于指示目标账号的兴趣情况的账号特征数据，能够立体地对用户的兴趣进行建模，从而提升内容推荐时的推荐准确度，同时，由于引入了图结构的行为图数据是由包括目标账号在内的全局账号的交互行为生成的，即使在冷启动阶段也能够通过行为图数据中全局账号和内容之间的连接关系来为目标账号进行内容推荐，保证了内容推荐的准确度。

需要说明的是：上述实施例提供的内容的推荐装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的内容的推荐装置与内容的推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图12示出了本申请一个示例性实施例提供的服务器的结构示意图。具体来讲包括如下结构。

服务器1200包括中央处理单元(Central Processing Unit，CPU)1201、包括随机存取存储器(Random Access Memory，RAM)1202和只读存储器(Read Only Memory，ROM)1203的系统存储器1204，以及连接系统存储器1204和中央处理单元1201的系统总线1205。服务器1200还包括用于存储操作系统1213、应用程序1214和其他程序模块1215的大容量存储设备1206。

大容量存储设备1206通过连接到系统总线1205的大容量存储控制器(未示出)连接到中央处理单元1201。大容量存储设备1206及其相关联的计算机可读介质为服务器1200提供非易失性存储。也就是说，大容量存储设备1206可以包括诸如硬盘或者紧凑型光盘只读存储器(Compact Disc Read Only Memory，CD-ROM)驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、带电可擦可编程只读存储器(Electrically Erasable Programmable Read Only Memory，EEPROM)、闪存或其他固态存储器技术，CD-ROM、数字通用光盘(Digital Versatile Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1204和大容量存储设备1206可以统称为存储器。

根据本申请的各种实施例，服务器1200还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1200可以通过连接在系统总线1205上的网络接口单元1211连接到网络1212，或者说，也可以使用网络接口单元1211来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行。

本申请的实施例还提供了一种计算机设备，该计算机设备包括处理器和存储器，该存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的生物识别方法。可选地，该计算机设备可以是终端，也可以是服务器。

本申请的实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行，以实现上述各方法实施例提供的生物识别方法。

本申请的实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中任一所述的生物识别方法。

可选地，该计算机可读存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、固态硬盘(SSD，Solid State Drives)或光盘等。其中，随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM，Resistance RandomAccess Memory)和动态随机存取存储器(DRAM，Dynamic Random Access Memory)。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种内容的推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述行为序列数据和所述行为图数据进行视图特征融合，得到所述目标账号对应的账号特征数据，包括：

对所述行为序列数据进行特征编码，得到第一行为特征；

对所述行为图数据进行特征编码，得到第二行为特征；

对所述第一行为特征和所述第二行为特征进行视图特征融合，得到所述账号特征数据。

3.根据权利要求2所述的方法，其特征在于，所述行为序列数据和至少两种行为类别对应，所述行为图数据和所述至少两种行为类别对应；

所述对所述行为序列数据进行特征编码，得到第一行为特征，包括：

将所述行为序列数据输入至序列编码网络，对所述至少两种行为类别进行行为特征融合，得到所述第一行为特征；

所述对所述行为图数据进行特征编码，得到第二行为特征，包括：

将所述行为图数据输入至图编码网络，对所述至少两种行为类别进行行为特征融合，得到所述第二行为特征。

4.根据权利要求3所述的方法，其特征在于，所述序列编码网络包括第一序列网络和第二序列网络；

所述将所述行为序列数据输入至序列编码网络，对所述至少两种行为类别进行行为特征融合，得到所述第一行为特征，包括：

将所述行为序列数据输入至所述第一序列网络进行特征提取，得到所述至少两种行为类别分别对应的第一类别特征；

将所述至少两种行为类别分别对应的第一类别特征输入至所述第二序列网络进行特征融合，得到所述第一行为特征。

5.根据权利要求3所述的方法，其特征在于，所述图编码网络包括第一图网络和第二图网络；

所述将所述行为图数据输入至图编码网络，对所述至少两种行为类别进行行为特征融合，得到所述第二行为特征，包括：

将所述行为图数据输入至所述第一图网络进行特征提取，得到所述至少两种行为类别分别对应的第二类别特征；

将所述至少两种行为类别分别对应的第二类别特征输入至所述第二图网络进行特征融合，得到所述第二行为特征。

6.根据权利要求1至5任一所述的方法，其特征在于，所述获取目标账号的行为序列数据和全局账号的行为图数据，包括：

获取目标账号的账号行为数据，所述目标账号的行为数据用于指示所述目标账号对已推送内容的触发情况；

基于所述账号行为数据中交互操作之间的时间顺序，生成所述行为序列数据；

获取所述全局账号的全局行为数据；

基于所述全局行为数据中账号与内容之间的交互情况，生成所述行为图数据。

7.根据权利要求1至5任一所述的方法，其特征在于，所述方法应用于目标推荐系统中，所述目标推荐系统由待训练推荐系统根据样本账号的历史行为数据进行训练得到，所述待训练推荐系统的训练过程包括：

获取所述样本账号的所述历史行为数据，所述历史行为数据用于指示所述样本账号在历史时段内对已推送内容的触发情况；

将所述历史行为数据输入至所述待训练推荐系统，由所述待训练推荐系统根据所述历史行为数据对样本内容的推荐价值进行预测，得到所述样本内容对应的预测评分；

基于所述预测评分与所述样本内容相对于所述样本账号的标准评分之间的差异情况，对所述待训练推荐系统进行迭代训练，得到所述目标推荐系统。

8.根据权利要求7所述的方法，其特征在于，所述将所述历史行为数据输入至所述待训练推荐系统，由所述待训练推荐系统根据所述历史行为数据对样本内容的推荐价值进行预测，得到预测评分，包括：

对所述历史行为数据进行数据构造，得到所述样本账号的样本序列数据和样本图数据，所述样本序列数据为用于指示所述样本账号在所述历史时段内的个体交互行为，所述样本图数据用于指示所述全局账号在所述历史时段内的交互行为；

对所述样本序列数据和所述样本图数据进行视图特征融合，得到所述样本账号对应的训练账号特征数据；

基于所述样本图数据获取样本内容对应的样本内容特征数据；

基于所述训练账号特征数据和所述样本内容特征数据确定所述预测评分。

9.根据权利要求8所述的方法，其特征在于，所述历史行为数据包括至少两种行为类别的行为数据；

所述对所述样本序列数据和所述样本图数据进行视图特征融合，得到所述样本账号对应的训练账号特征数据，包括：

对所述样本序列数据进行特征提取，得到所述至少两种行为类别分别对应的第三类别特征；

对所述至少两种行为类别分别对应的第三类别特征进行特征融合，得到第三行为特征；

对所述样本图数据进行特征提取，得到所述至少两种行为类别分别对应的第四类别特征；

对所述至少两种行为类别分别对应的第四类别特征进行特征融合，得到第四行为特征；

对所述第三行为特征和所述第四行为特征进行视图特征融合，得到所述训练账号特征数据。

10.根据权利要求9所述的方法，其特征在于，所述基于所述样本图数据获取样本内容对应的样本内容特征数据，包括：

获取所述样本内容对应的第一样本特征，所述第一样本特征用于指示所述样本内容的内容信息；

对所述样本图数据进行特征提取，得到第二样本特征，所述第二样本特征用于指示在所述样本账号的行为关联下样本内容之间的联系；

对所述第一样本特征和所述第二样本特征进行特征融合，得到所述样本内容特征。

11.根据权利要求9所述的方法，其特征在于，所述基于所述预测评分与所述样本内容相对于所述样本账号的标准评分之间的差异情况，对所述待训练推荐系统进行迭代训练，得到所述目标推荐系统，包括：

获取所述预测评分和所述标准评分之间的第一损失值；

基于所述至少两种行为类别分别对应的第三类别特征之间的差异情况，获取第二损失值，所述第二损失值用于指示在所述序列结构下不同行为类别之间的特征差异；

基于所述至少两种行为类别分别对应的第四类别特征之间的差异情况，获取第三损失值，所述第三损失值用于指示在所述图结构下不同行为类别之间的特征差异；

基于所述第三行为特征和所述第四行为特征之间的差异情况，获取第四损失值，所述第四损失值用于指示不同视图数据之间的特征差异；

基于所述样本内容特征数据中样本内容之间的差异情况，获取第五损失值，所述第五损失值用于指示不同样本内容之间的特征差异；

基于所述第一损失值、所述第二损失值、所述第三损失值、所述第四损失值、所述第五损失值，对所述待训练推荐系统进行迭代训练，得到所述目标推荐系统。

12.一种内容的推荐装置，其特征在于，所述装置包括：

13.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至11任一所述的内容的推荐方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现如权利要求1至11任一所述的内容的推荐方法。

15.一种计算机程序产品，其特征在于，包括计算机程序或指令，所述计算机程序或指令被处理器执行时实现如权利要求1至11任一所述的内容的推荐方法。