CN113516522B

CN113516522B - 媒体资源推荐方法、多目标融合模型的训练方法及装置

Info

Publication number: CN113516522B
Application number: CN202111073114.5A
Authority: CN
Inventors: 赵忠; 傅妍玫; 梁瀚明; 马骊; 赵光耀; 户维波; 张立广; 吴铭津
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-09-14
Filing date: 2021-09-14
Publication date: 2022-03-04
Anticipated expiration: 2041-09-14
Also published as: WO2023040494A1; CN113516522A

Abstract

本申请提供了一种媒体资源推荐方法、多目标融合模型的训练方法及装置，属于机器学习技术领域，可应用于云技术、人工智能以及智慧交通等各种场景。所述方法包括：基于目标对象的对象特征、媒体资源的资源特征和关联特征，确定业务目标预估信息；基于所述对象特征，确定对象类型信息；基于所述业务目标预估信息和所述对象类型信息，确定所述媒体资源的推荐信息；响应于所述推荐信息满足推荐条件，向所述目标对象推荐所述媒体资源。上述技术方案，能够基于对象属于各对象类型的概率来对业务目标的预估效果进行融合，从而对于不同对象类型的对象，业务目标的预估效果的融合方式不同，提高了融合结果的准确性，能够有效的解决“此消彼长”问题。

Description

媒体资源推荐方法、多目标融合模型的训练方法及装置

技术领域

本申请涉及机器学习技术领域，特别涉及一种媒体资源推荐方法、多目标融合模型的训练方法及装置。

背景技术

多目标排序模型在推荐系统中有着广泛的应用，该多目标排序模型通过同时优化多种业务目标的效果去获得单目标模型无法获得的额外收益，其中业务目标的效果包括点击率、转换率以及点击转化率等。然而多目标建模经常会遇到的问题是，一些业务目标的效果有提升了，但另一些业务目标的效果却变差了，也就是难以让所有业务目标的效果都同时变好，这种问题简称为“此消彼长”问题。

目前，通常采用在训练阶段优化模型结构的方式，来缓解上述“此消彼长”的问题。通过在模型中引入专家网络，能够增加每个业务目标自身拟合的灵活性，减少由于底层参数共享导致的业务目标间的相互牵制，使得每个业务目标都能拟合得更好。

然而，上述方案虽然能够使得每个业务目标拟合的更好，但是在模型预测推荐概率的阶段，需要融合不同业务目标的预估效果，该预估效果为模型预测的分数，仍旧会由于融合方式不佳，导致融合结果准确性不高，出现“此消彼长”问题。

发明内容

本申请实施例提供了一种媒体资源推荐方法、装置、计算机设备及存储介质，能够基于对象属于各对象类型的概率来对业务目标的预估效果进行融合，从而对于不同对象类型的对象，业务目标的预估效果的融合方式不同，提高了融合结果的准确性，能够有效的解决“此消彼长”问题。所述技术方案如下。

一方面，提供了一种媒体资源推荐方法，所述方法包括：

基于目标对象的对象特征、媒体资源的资源特征和关联特征，确定业务目标预估信息，所述关联特征用于指示所述媒体资源与所述目标对象之间的关联关系，所述业务目标预估信息用于表示将所述媒体资源推荐给所述目标对象后多个业务目标的预估效果；

基于所述对象特征，确定对象类型信息，所述对象类型信息用于表示所述目标对象属于各对象类型的概率；

基于所述业务目标预估信息和所述对象类型信息，确定所述媒体资源的推荐信息，所述推荐信息用于指示所述媒体资源的推荐分数；

响应于所述推荐信息满足推荐条件，向所述目标对象推荐所述媒体资源。

另一方面，提供了一种内容推荐装置，所述装置包括：

第一确定模块，用于基于目标对象的对象特征、媒体资源的资源特征和关联特征，确定业务目标预估信息，所述关联特征用于指示所述媒体资源与所述目标对象之间的关联关系，所述业务目标预估信息用于表示将所述媒体资源推荐给所述目标对象后多个业务目标的预估效果；

第二确定模块，用于基于所述对象特征，确定对象类型信息，所述对象类型信息用于表示所述目标对象属于各对象类型的概率；

第三确定模块，用于基于所述业务目标预估信息和所述对象类型信息，确定所述媒体资源的推荐信息，所述推荐信息用于指示所述媒体资源的推荐分数；

推荐模块，用于响应于所述推荐信息满足推荐条件，向所述目标对象推荐所述媒体资源。

在一些实施例中，所述第一确定模块，包括：

特征交叉子模块，用于对所述目标对象的对象特征、所述媒体资源的资源特征和所述关联特征中的稀疏特征进行特征交叉，得到交叉特征；

第一确定子模块，用于基于所述对象特征、所述资源特征和所述关联特征，确定多个预估特征，所述多个预估特征用于指示所述多个业务目标的中间预估效果；

第二确定子模块，用于基于所述交叉特征和所述多个预估特征，确定所述业务目标预估信息。

在一些实施例中，所述特征交叉子模块，包括：

元素加权单元，用于对所述目标对象的对象特征、所述媒体资源的资源特征和所述关联特征中的稀疏特征中的多个非零元素进行加权求和，得到一阶特征，一个非零元素对应一个元素权重；

第一降维单元，用于对所述对象特征、所述资源特征和所述关联特征中的稀疏特征进行降维，得到多个第一降维特征；

第一确定单元，用于基于所述多个第一降维特征，确定二阶交叉特征；

第一拼接单元，用于对所述一阶特征和所述二阶交叉特征进行拼接，得到所述交叉特征。

在一些实施例中，所述元素加权单元，用于确定所述多个第一降维特征中任意两个第二降维特征的内积；对确定的多个内积进行求和，得到所述二阶交叉特征。

在一些实施例中，所述第一确定子模块，包括：

第二拼接单元，用于将所述对象特征、所述资源特征和所述关联特征中的稠密特征和多个第二降维特征进行拼接，得到第一输入特征，所述多个第二降维特征由对所述对象特征、所述资源特征和所述关联特征中的稀疏特征进行降维得到；

第一处理单元，用于基于所述多个业务目标对应的多个专家网络，分别对所述第一输入特征进行处理，得到多个专家网络输出特征；

第二处理单元，用于基于所述多个业务目标对应的多个门控函数，分别对所述第一输入特征和所述多个专家网络输出特征进行处理，得到多个门控输出特征；

第三处理单元，用于基于所述多个业务目标对应的多个多层感知器，分别对所述多个门控输出特征进行处理，得到所述多个预估特征。

在一些实施例中，所述第二处理单元，用于对于任一业务目标，基于所述业务目标的门控函数，对所述第一输入特征进行全连接和映射，得到多个第一权重，所述多个第一权重与所述多个专家网络输出特征一一对应；基于所述多个第一权重，对所述多个专家网络输出特征进行加权求和，得到所述业务目标对应的门控输出特征。

在一些实施例中，所述第二确定子模块，用于将所述交叉特征和所述多个预估特征分别进行拼接，得到多个第二拼接特征；基于所述多个第二拼接特征，确定所述业务目标预估信息。

在一些实施例中，所述第二确定模块，用于获取多个对象降维特征，所述对象降维特征由对对象特征中的稀疏特征进行降维得到；将所述多个对象降维特征和所述对象特征中的稠密特征进行拼接，得到第二输入特征；对所述第二输入特征进行多次全连接和映射，得到所述对象类型信息。

在一些实施例中，所述推荐条件包括下述任一项：

所述推荐信息所指示的推荐分数在多个媒体资源的推荐信息所指示的推荐分数中的排序小于次序阈值；

所述推荐信息所指示的推荐分数大于分数阈值。

另一方面，提供了一种多目标融合模型的训练方法，所述多目标融合模型包括对象类型子模型、多目标子模型以及融合子模型，所述方法包括：

对于任一样本信息，将所述样本信息中的样本对象特征、样本资源特征和样本关联特征输入所述多目标子模型，得到所述样本信息的样本预估信息，所述样本关联特征用于指示所述样本资源特征对应的样本媒体资源与所述样本对象特征对应的样本对象之间的关联关系，所述样本预估信息用于表示所述样本对象点击所述样本媒体资源后多个业务目标的预估效果；

将所述样本信息中的样本对象特征输入所述对象类型子模型，得到所述样本信息的样本对象类型信息，所述样本对象类型信息用于表示所述样本对象属于各对象类型的概率；

将所述样本预估信息和样本对象类型信息输入所述融合子模型，得到所述样本信息对应的样本推荐信息，所述样本推荐信息用于指示所述样本媒体资源的推荐分数；

基于多个样本信息对应的样本推荐信息，确定所述融合子模型的训练损失；

基于所述融合子模型的训练损失，训练所述多目标融合模型。

在一些实施例中，所述方法还包括：

对于任一样本信息，基于类型编码结果、权重特征以及业务特征，确定所述样本信息的样本权重，所述类型编码结果用于指示所述样本信息中样本对象所属的对象类型，所述权重特征用于指示所述多个业务目标的初始权重，所述业务特征用于指示所述样本信息中的样本媒体资源关联的业务。

在一些实施例中，所述方法还包括：

对于任一样本信息，获取所述样本信息中样本对象的实际对象类型信息；

基于所述样本信息的样本对象类型信息和所述实际对象类型信息，确定所述对象类型子模型的训练损失；

基于所述对象类型子模型的训练损失，训练所述对象类型子模型。

在一些实施例中，所述方法还包括：

对于任一样本信息，获取所述样本信息中多个业务目标的实际效果信息；

基于所述样本信息的样本预估信息和所述多个业务目标的实际效果信息，确定所述多目标子模型的训练损失；

基于所述多目标子模型的训练损失，训练所述多目标子模型。

另一方面，提供了一种多目标融合模型的训练装置，所述多目标融合模型包括对象类型子模型、多目标子模型以及融合子模型，所述装置包括：

第一训练模块，用于对于任一样本信息，将所述样本信息中的样本对象特征、样本资源特征和样本关联特征输入所述多目标子模型，得到所述样本信息的样本预估信息，所述样本关联特征用于指示所述样本资源特征对应的样本媒体资源与所述样本对象特征对应的样本对象之间的关联关系，所述样本预估信息用于表示所述样本对象点击所述样本媒体资源后多个业务目标的预估效果；

第二训练模块，用于将所述样本信息中的样本对象特征输入所述对象类型子模型，得到所述样本信息的样本对象类型信息，所述样本对象类型信息用于表示所述样本对象属于各对象类型的概率；

第三训练模块，用于将所述样本预估信息和样本对象类型信息输入所述融合子模型，得到所述样本信息对应的样本推荐信息，所述样本推荐信息用于指示所述样本媒体资源的推荐分数；

第四训练模块，用于基于多个样本信息对应的样本推荐信息，确定所述融合子模型的训练损失；

所述第四训练模块，还用于基于所述融合子模型的训练损失，训练所述多目标融合模型。

在一些实施例中，所述第四训练模块，用于将所述多个样本信息对应的样本推荐信息转换为样本推荐概率；基于所述多个样本信息对应的样本推荐概率和所述多个样本信息的样本权重，确定所述融合子模型的训练损失。

在一些实施例中，所述装置还包括：

权重确定模块，用于对于任一样本信息，基于类型编码结果、权重特征以及业务特征，确定所述样本信息的样本权重，所述类型编码结果用于指示所述样本信息中样本对象所属的对象类型，所述权重特征用于指示所述多个业务目标的初始权重，所述业务特征用于指示所述样本信息中的样本媒体资源关联的业务。

在一些实施例中，所述装置还包括：第五训练模块，用于对于任一样本信息，获取所述样本信息中样本对象的实际对象类型信息；基于所述样本信息的样本对象类型信息和所述实际对象类型信息，确定所述对象类型子模型的训练损失；基于所述对象类型子模型的训练损失，训练所述对象类型子模型。

在一些实施例中，所述装置还包括：第六训练模块，用于对于任一样本信息，获取所述样本信息中多个业务目标的实际效果信息；基于所述样本信息的样本预估信息和所述多个业务目标的实际效果信息，确定所述多目标子模型的训练损失；基于所述多目标子模型的训练损失，训练所述多目标子模型。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中媒体资源推荐方法所执行的操作。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行以实现本申请实施例中多目标融合模型的训练方法所执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一段计算机程序，所述至少一段计算机程序由处理器加载并执行以实现如本申请实施例中媒体资源推荐方法所执行的操作。

另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一段计算机程序，所述至少一段计算机程序由处理器加载并执行以实现如本申请实施例中多目标融合模型的训练方法所执行的操作。

另一方面，提供了一种计算机程序产品，该计算机程序产品包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各个方面的各种可选实现方式中提供的媒体资源推荐方法。

另一方面，提供了一种计算机程序产品，该计算机程序产品包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各个方面的各种可选实现方式中提供的多目标融合模型的训练方法。

本申请实施例提供的技术方案带来的有益效果是：

本申请实施例提供了一种媒体资源推荐方法，通过引入对象的对象类型信息，使得能够基于对象属于各对象类型的概率来对业务目标的预估效果进行融合，从而对于不同对象类型的对象，业务目标的预估效果的融合方式不同，提高了融合结果的准确性，能够有效的解决“此消彼长”问题。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本申请实施例提供的一种媒体资源推荐方法的实施环境示意图；

图2是根据本申请实施例提供的一种媒体资源推荐方法的流程图；

图3是根据本申请实施例提供的另一种媒体资源推荐方法的流程图；

图4是根据本申请实施例提供的一种多目标融合模型的训练方法的流程图；

图5是根据本申请实施例提供的一种对象类型子模型的结构示意图；

图6是根据本申请实施例提供的一种多目标子模型的结构示意图；

图7是根据本申请实施例提供的一种门控的结构示意图；

图8是根据本申请实施例提供的一种多目标融合模型的结构示意图；

图9是根据本申请实施例提供的一种测试结果对比图；

图10是根据本申请实施例提供的一种内容推荐装置的框图；

图11是根据本申请实施例提供的另一种内容推荐装置的框图；

图12是根据本申请实施例提供的一种多目标融合模型的训练装置的框图；

图13是根据本申请实施例提供的另一种多目标融合模型的训练装置的框图；

图14是根据本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。

本申请中术语“至少一个”是指一个或多个，“多个”的含义是指两个或两个以上。

本申请实施例中涉及的对象特征为从对象数据中所提取到的特征，该对象数据可以为账号数据，该账号数据为经过充分授权和准许后所采集和使用的数据。

以下，对本申请涉及的术语进行解释。

CTR（Click Through Rate）：点击率，也可以称为点击通过率，即点击数/曝光数。CTR是互联网广告术语，指广告的实际点击次数除以广告的展现量。

CVR (Conversion Rate): 转化率，即转化数/点击数。CVR是衡量广告效果的指标，简而言之就是对象点击广告到成为一个有效激活或者注册甚至付费对象的转化率。

CTCVR：点击转化率，即转化数/曝光数，也即CTR×CVR。

PCTR：页面访问点击率。

MLP（Multiple Layer Perceptron）：多层感知器，通常也称为DNN（Deep NeuralNetwork，深度神经网络），是多层全连接神经网络。

MMoE（Multi-gate Mixture-of-Experts）：多门控混合专家网络，用于多目标学习的网络结构，包括多个专家网络和多个门控，专家网络大多为DNN网络结构，多个专家网络用于提取不同的特征，门控用于分配每个专家网络的权重。

ESMM （Entire Space Multi-Task Model）：完整空间多任务模型，是一种能够同时拟合CTR和CTCVR的建模目标之间依赖关系的多目标模型。

以下，对本申请提供的方法的实施环境进行介绍。

本申请实施例提供的媒体资源推荐方法，能够由计算机设备执行。下面介绍一下本申请实施例提供的媒体资源推荐方法的实施环境，图1是根据本申请实施例提供的一种媒体资源推荐方法的实施环境示意图。参见图1，该实施环境包括终端101和服务器102。

终端101和服务器102能够通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

在一些实施例中，终端101是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能语音交互设备、智能家电以及车载终端等，但并不局限于此。终端101安装和运行有支持内容推荐的应用程序。在一些实施例中，服务器102是独立的物理服务器，也能够是多个物理服务器构成的服务器集群或者分布式系统，还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN（Content Delivery Network，内容分发网络）以及大数据和人工智能平台等基础云计算服务的云服务器。服务器102用于为支持虚拟场景的应用程序提供后台服务。在一些实施例中，服务器102承担主要计算工作，终端101承担次要计算工作；或者，服务器102承担次要计算工作，终端101承担主要计算工作；或者，服务器102和终端101二者之间采用分布式计算架构进行协同计算。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。

需要说明的是，本申请实施例还提供了一种多目标融合模型的训练方法，该方法训练得到的多目标融合模型能够用于实现该媒体资源推荐方法。该多目标融合模型的训练方法的实施环境可以与该媒体资源推荐方法的实施环境相同，也可以不同，本申请实施例对此不进行限制。

在一些实施例中，上述多目标融合模型能够应用于推荐系统上，该推荐系统能够基于上述媒体资源推荐方法，向对象推荐媒体资源，如推荐新闻、推荐广告、推荐视频等，还能够用于向对象推荐商品、服务等。例如，该上述终端为车载终端，服务器基于该多目标融合模型向多个车载终端推送附近的加油站、停车场等内容。

图2是根据本申请实施例提供的一种媒体资源推荐方法的流程图，如图2所示，在本申请实施例中以由服务器执行为例进行说明。该媒体资源推荐方法包括以下步骤。

201、服务器基于目标对象的对象特征、媒体资源的资源特征和关联特征，确定业务目标预估信息，该关联特征用于指示该媒体资源与该目标对象之间的关联关系，该业务目标预估信息用于表示将该媒体资源推荐给该目标对象后多个业务目标的预估效果。

在本申请实施例中，服务器能够基于目标对象的对象特征、待推荐的媒体资源的资源特征以及表示该目标对象与该媒体资源之间的关联关系的关联特征，确定将该媒体资源推荐给该目标对象后多个业务目标的预估效果。其中，该目标对象为目标账号，该对象特征为账号特征。服务器能够基于该多个业务目标的预估效果，确定是否向目标对象推荐该媒体资源。其中，该多个业务目标包括点击、浏览时长以及点赞等。

202、服务器基于目标对象的对象特征，确定对象类型信息，该对象类型信息用于表示该目标对象属于各对象类型的概率。

在本申请实施例中，服务器能够基于目标对象的对象特征，向目标对象推荐媒体资源。其中，服务器能够基于目标对象的对象特征，确定该目标对象属于各对象类型的概率，然后基于目标对象所属的对象类型，向该目标对象推荐媒体资源。

203、服务器基于该对象类型信息和该业务目标预估信息，确定该媒体资源的推荐信息，该推荐信息用于指示该媒体资源的推荐分数。

在本申请实施例中，服务器在得到上述对象类型信息和上述业务目标预估信息之后，能够基于该目标对象所属的对象类型，对该多个业务目标的预估效果进行融合，得到该媒体资源对应的推荐分数，该推荐分数用于判断是否向该目标对象推荐该媒体资源。

204、响应于该推荐信息满足推荐条件，服务器向该目标对象推荐该媒体资源。

在本申请实施例中，服务器在得到媒体资源的推荐信息之后，能够判断该推荐信息是否满足推荐条件，若该推荐信息满足推荐条件，则服务器向目标对象推荐该媒体资源；若该推荐信息不满足推荐条件，则服务器不向目标对象推荐该媒体资源。

上述图2示例性示出了本申请实施例提供的媒体资源推荐方法的主要流程，下面基于一种应用场景，来进一步介绍该媒体资源推荐方法。图3是根据本申请实施例提供的另一种媒体资源推荐方法的流程图，如图3所示，在本申请实施例中以由服务器执行为例进行说明。该媒体资源推荐方法包括以下步骤。

301、服务器对目标对象的对象特征、媒体资源的资源特征和关联特征中的稀疏特征进行特征交叉，得到交叉特征，该关联特征用于指示媒体资源与目标对象之间的关联关系。

在本申请实施例中，目标对象的对象特征包括稀疏特征和稠密特征，媒体资源的资源特征包括稀疏特征和稠密特征，关联特征也包括稀疏特征和稠密特征。服务器能够对目标对象的对象特征中的稀疏特征、媒体资源的资源特征中的稀疏特征以及媒体资源和目标对象之间的关联特征中的稀疏特征进行特征交叉，得到交叉特征。以对象特征为例，若一个对象特征中少量的元素的取值不为零，大量的元素的取值为零，则该对象特征为稀疏特征；若该对象特征中大量的元素的取值不为零，少量的元素的取值为零，则该对象特征为稠密特征。其中，该目标对象为目标账号，该对象特征为账号特征，该账号特征基于目标账号的账号数据提取得到，该目标账号的账号数据为经过充分授权和准许后所采集和使用的数据。

例如，以某个包括500个元素的对象特征为例，该对象特征中有450个元素的取值为零，则该对象特征为稀疏特征。

在一些实施例中，服务器能够采取对稀疏特征分别进行降维和提取非零元素的方式，来获取上述交叉特征。相应的，服务器对对象特征、资源特征和关联特征中的稀疏特征进行特征交叉，得到交叉特征的步骤包括：服务器对目标对象的对象特征、媒体资源的资源特征和关联特征中的稀疏特征中的多个非零元素进行加权求和，得到一阶特征，其中，一个非零元素对应一个元素权重，服务器基于每个零元素的元素权重对获取到的多个非零元素进行加权求和，得到一阶特征。对对象特征、资源特征和关联特征中的稀疏特征进行降维，得到多个第一降维特征，然后服务器基于该多个第一降维特征，确定二阶交叉特征。服务器对该一阶特征和二阶交叉特征进行拼接，得到该交叉特征。

其中，服务器能够采用对任意两个第二降维特征之间的内积进行求和的方式，确定上述二阶交叉特征，相应的，服务器基于多个第一降维特征，确定二阶交叉特征的步骤包括：服务器确定该多个第一降维特征中任意两个第二降维特征的内积，然后对确定的多个内积进行求和，得到二阶交叉特征。

在一些实施例中，服务器部署有多目标融合模型，该多目标融合模型包括多目标子模型，该多目标子模型用于对对象特征、资源特征以及关联特征进行处理，输出将媒体资源推荐给目标对象后多个业务目标的预估效果。该多目标子模型包括第一模型，该第一模型的输入为对象特征、资源特征以及关联特征这三类特征中的稀疏特征，该第一模型的输出为交叉特征。该第一模型能够从该稀疏特征中获取多个非零元素，然后基于每个非零元素对应的元素权重，对该多个非零元素进行加权求和，得到一阶特征。然后第一模型能够基于嵌入层对该稀疏特征进行降维，得到多个第一降维特征，然后分别计算每个第一降维特征和其他第一降维特征之间的内积，计算多个第一降维特征中任意两个第一降维特征的内积，然后再将对计算得到的多个内积进行求和，得到二阶交叉特征。第一模型对该一阶特征和该二阶交叉特征进行拼接，得到交叉特征。

302、服务器基于对象特征、资源特征和关联特征，确定多个预估特征，该多个预估特征用于指示该多个业务目标的中间预估效果。

在本申请实施例中，服务器基于对象特征、资源特征和关联特征来预估将媒体资源推荐给目标对象后，多个业务目标的中间预估效果。

在一些实施例中，服务器能够对对象特征、资源特征和关联特征中的稀疏特征进行降维，得到多个第二降维特征，该多个第二降维特征的维度比上述多个第一降维特征的维度多。服务器能够基于该多个第二降维特征来确定上述多个预估特征。相应的，服务器基于对象特征、资源特征和关联特征，确定多个预估特征步骤包括：服务器将对象特征、资源特征和关联特征中的稠密特征和多个第二降维特征进行拼接，得到第一输入特征。然后服务器基于该多个业务目标对应的多个专家网络，分别对该第一输入特征进行处理，得到多个专家网络输出特征；然后服务器基于多个业务目标对应的多个门控函数，分别对该第一输入特征和该多个专家网络输出特征进行处理，得到多个门控输出特征；最后服务器基于多个业务目标对应的多个多层感知器，分别对多个门控输出特征进行处理，得到多个预估特征。其中，该多个专家网络为DNN结构的网络。

其中，每个业务目标均对应有结构相同、参数不同的门控，服务器能够基于各门控对应的门控函数来处理上述第一输入特征和上述多个专家网络输出特征。相应的，服务器基于多个业务目标对应的多个门控函数，分别对第一输入特征和多个专家网络输出特征进行处理，得到多个门控输出特征的步骤包括：对于任一业务目标，服务器能够基于该业务目标的门控函数，对该第一输入特征进行全连接和映射，得到多个第一权重，该多个第一权重与多个专家网络输出特征一一对应，也即第一权重的数量与专家网络输出特征的数量相等。然后服务器能够基于多个第一权重，对该多个专家网络输出特征进行加权求和，得到该业务目标对应的门控输出特征。

在一些实施例中，上述多目标子模型包括第二模型，该第二模型的输入为第一输入特征，该第一输入特征由对象特征、资源特征以及关联特征中的稠密特征和多个第二降维特征拼接得到，该多个第二降维特征由对象特征、资源特征以及关联特征中的稀疏特征降维得到。该第二模型能够稠密特征和多个第二降维特征进行拼接，得到第一输入特征，当然也可以直接获取拼接好的第一输入特征。然后第二模型基于该第二模型中包括的多个业务目标对应的多个专家网络，分别对第一输入特征进行处理，得到多个专家网络输出特征；然后对于每个业务目标，第二模型基于该第二模型中该业务目标对应的门函数，对该第一输入特征进行全连接和映射，得到多个第一权重；然后服务器将基于该多个第一权重对该多个专家网络输出特征进行加权求和，得到该业务目标的门控输出特征。由于该对多个业务目标的门控能够并行运行，因此能够得到多个业务目标的多个门控输出特征。最后第二模型基于该第二模型中包括的多个多层感知器，分别对多个门控输出特征进行处理，得到多个预估特征。

303、服务器基于交叉特征和多个预估特征，确定业务目标预估信息，该业务目标预估信息用于表示将媒体资源推荐给目标对象后多个业务目标的预估效果。

在本申请实施例中，服务器在得到上述交叉特征和多个预估特征之后，将该交叉特征与该多个预估特征分别进行拼接，得到该多个第二拼接特征，然后对该多个第二拼接特征进行全连接和激活，再确定激活得到的结果的内积，得到上述业务目标预估信息。。

例如，以交叉特征为a，三个预估特征分别为A、B和C为例，则得到三个第二拼接特征，对上述三个第二拼接特征分别进行全连接和激活，得到：aA、aB以及aC。假设aA表示时长CVR，aB表示PCTR，aC表示点赞CVR，则在确定上述激活得到的结果的内积：aA×aB表示时长CTCVR，aB×aC表示点赞CTCVR，从而得到点击、时长以及点赞三个业务目标的预估效果。

304、服务器获取多个对象降维特征，该对象降维特征由对对象特征中的稀疏特征进行降维得到。

在本申请实施例中，服务器能够对对象特征、资源特征和关联特征中的稀疏特征进行降维，得到多个第二降维特征，然后从该多个第二降维特征中提取对象侧的对象降维特征。换而言之，该多个对象降维特征为服务器对对象特征中的稀疏特征进行降维得到的特征。对象降维特征能够表示为特征向量的形式。

305、服务器将多个对象降维特征和对象特征中的稠密特征进行拼接，得到第二输入特征。

在本申请实施例中，多个对象降维特征为特征向量的形式。对象特征中的稠密特征也为特征向量的形式，服务器能够拼接该多个对象降维特征和该稠密特征，得到第二输入特征，该第二输入特征也为特征向量的形式，该第二输入特征能够表示对象特征中的稀疏特征和稠密特征。

例如，服务器得到三个对象降维特征，该三个对象降维特征和稠密特征均表示为特征向量的形式，三个对象降维特征均包括5个元素，稠密特征包括10个元素，则服务器拼接该三个对象降维特征和稠密特征，得到包括25个元素的特征向量，即第二输入特征。

306、服务器对第二输入特征进行多次全连接和映射，得到对象类型信息，该对象类型信息用于表示该目标对象属于各对象类型的概率。

在本申请实施例中，服务器能够对第二输入特征进行多次全连接和映射，以对目标对象进行分类，得到该目标对象属于各对象类型的概率。其中，服务器部署有多目标融合模型，该多目标融合模型包括对象类型子模型，该对象类型子模型用于对对象特征进行处理，输出目标对象属于各个对象类型的概率。相应的，服务器将该对象特征输入该对象类型子模型，由该对象类型子模型中的多个全连接层依次对该第二输入特征进行全连接，再由非线性激活函数softmax输出目标对象属于各对象类型的概率，换而言之，对象类型子模型中包括多个MLP层，基于该多个MLP对该第二输入特征进行处理，得到该目标对象属于各对象类型的概率。

307、服务器基于对象类型信息和业务目标预估信息，确定媒体资源的推荐信息，该推荐信息用于指示该媒体资源的推荐分数。

在本申请实施例中，该对象类型信息表示为向量形式，服务器能够将该业务目标预估信息也表示为向量形式，然后服务器能够对该向量形式的对象类型信息和业务目标预估信息进行拼接，再对拼接后得到的向量进行多次全连接，得到上述媒体资源的推荐分数。

308、响应于推荐信息满足推荐条件，服务器向目标对象推荐该媒体资源。

在本申请实施例中，服务器判断媒体资源的推荐信息是否满足推荐条件，该推荐条件根据实际需求设置。如果该媒体资源的推荐信息满足推荐条件，则服务器向目标对象推荐该媒体资源，如果该媒体资源的推荐信息不满足推荐条件，则服务器不向目标对象推荐该媒体资源。

在一些实施例中，推荐条件为推荐信息所指示的推荐分时在多个媒体资源的推荐信息所指示的推荐分数中的排序小于次序阈值。也即，服务器获取多个媒体资源的推荐分数，并对该多个媒体资源的推荐分数从大到小排序，然后向对象推荐排序靠前的一个或者多个媒体资源。

在一些实施例中，推荐条件为推荐信息所指示的推荐分数大于分数阈值。也即，服务器判断该媒体资源的推荐分数与分数阈值的大小关系，若该媒体资源的推荐分数大于分数阈值，则向目标对象推荐该媒体资源；若该媒体资源的推荐分数不大于分数阈值，则不向目标对象推荐该媒体资源。

需要说明的是，上述媒体资源推荐方法还能够应用于云技术、人工智能、智慧交通等各种场景，以智慧交通为例，服务器能够与多个车在终端进行数据通信。以一个车载终端为例，该车载终端登录有目标账号，服务器基于该媒体资源推荐方法，向该车载终端推送多媒体资源，还能够向该车载终端推送附近的加油站、停车场以及风景区等，本申请实施例对此不进行限制。

图4是根据本申请实施例提供的一种多目标融合模型的训练方法的流程图，如图4所示，在本申请实施例中以由服务器执行为例进行说明。该多目标融合模型包括对象类型子模型、多目标子模型以及融合子模型，该多目标融合模型的训练方法包括以下步骤。

401、对于任一样本信息，服务器将该样本信息中的样本对象特征、样本资源特征和样本关联特征输入多目标子模型，得到样本信息的样本预估信息，该样本关联特征用于指示样本资源特征对应的样本媒体资源与样本对象特征对应的样本对象之间的关联关系，该样本预估信息用于表示样本对象点击样本媒体资源后多个业务目标的预估效果。

在本申请实施例中，服务器能够获取多个样本信息，每个样本信息包括样本对象的样本对象特征，与样本对象关联的一个或者多个样本媒体资源的样本资源特征，样本对象与样本媒体资源之间的样本关联特征。服务器能够基于样本信息中的样本对象特征、样本资源特征和样本关联特征，来训练得到多目标子模型，该多目标子模型用于预测各业务目标的效果。以样本媒体资源为样本文章为例，该多目标子模型的输入为对象和文章的各种离散型和连续型特征，输出的是样本对象对该样本文章的PCTR、时长CVR以及点赞CVR。其中，该样本对象为样本账号，该样本对象特征为样本账号特征，该样本信息中的样本账号特征基于样本账号数据提取得到，该样本账号数据为经过充分授权和准许后所采集和使用的数据。

需要说明的是，参见图5所示，图5是根据本申请实施例提供的一种多目标子模型的结构示意图。该多目标子模型包括第一模型、第二模型和第三模型。

其中，该第一模型为FM（Factorization Machines，分解机）模型，该第一模型的输入为上述样本对象特征、样本资源特征和样本关联特征中的稀疏特征，第一模型能够对输入的稀疏特征进行特征交叉，得到交叉特征。第一模型从该稀疏特征中获取多个非零元素，然后基于每个非零元素对应的元素权重，对该多个非零元素进行加权求和，得到一阶样本特征。然后第一模型能够基于嵌入层对该稀疏特征进行降维，得到多个第一样本降维特征，然后分别计算每个第一样本降维特征和其他第一样本降维特征之间的内积，计算多个第一样本降维特征中任意两个第一样本降维特征的内积，然后再将对计算得到的多个内积进行求和，得到二阶样本交叉特征。第一模型对该一阶样本特征和该二阶样本交叉特征进行拼接，得到样本交叉特征。

其中，第二模型为MMOE模型，该第二模型的输入为第一样本输入特征，该第一样本输入特征由样本对象特征、样本资源特征以及样本关联特征中的稠密特征和多个第二样本降维特征拼接得到，该多个第二样本降维特征由样本对象特征、样本资源特征以及样本关联特征中的稀疏特征降维得到。该第二模型能够将稠密特征和多个第二样本降维特征进行拼接，得到第一样本输入特征，当然也可以直接获取拼接好的第一样本输入特征。然后第二模型基于该第二模型中包括的多个业务目标对应的多个专家网络，分别对第一样本输入特征进行处理，得到多个样本专家输出特征；然后对于每个业务目标，第二模型基于该第二模型中该业务目标对应的门函数，对该第一样本输入特征进行全连接和映射，得到多个第一样本权重；然后服务器将基于该多个第一样本权重对该多个专家网络输出特征进行加权求和，得到该业务目标的样本门控输出特征。由于该对多个业务目标的门控能够并行运行，因此能够得到多个业务目标的多个样本门控输出特征。最后第二模型基于该第二模型中包括的多个多层感知器，分别对多个样本门控输出特征进行处理，得到多个样本预估特征。其中，该专家网络的结构为DNN。第二模型基于门控1、门控2和门控3分别对上述第一样本输入特征和上述三个样本专家输出特征进行加权求和，再由多层感知器对加权求和得到的样本门控输出特征进行处理，得到点击、时长以及点赞这三个业务目标的样本预估特征。

其中，各门控的结构相同，参数不同，参见图6所示，图6是根据本申请实施例提供的一种门控的结构示意图。该门控的输入为第一样本输入特征和三个样本专家输出特征。第一样本输入特征输入门控之后，门控先对第三样本中间特征做MLP，得到三个score（分数），然后这三个score经过归一化（softmax）之后变成三个概率形式的权重，门控基于上述三个权重对上述三个样本专家输出特征进行加权求和，得到样本门控输出特征。下面基于数学语言来表示上述过程，设

表示第一样本输入特征，

表示第

个专家网络输出的样本专家输出特征，

表示第

个业务目标的门控函数，

的表达式参见公式（1）所示：

（1）；

其中，

表示第一样本输入特征，

表示第

个业务目标的门控函数，

表示第

个业务目标的门控参数，

表示

经过全连接之后再经过softmax得到的概率向量，也即第一样本权重，该概率向量中元素的个数等于专家网络的个数。

记

中第

个分量为

，则

，其中

表示专家网络的个数。则第

个业务目标的门控的输出

参见公式（2）所示：

（2）；

其中，

表示第一样本输入特征，

表示第

个业务目标的门控输出的样本门控输出特征，

表示专家网络的个数，

表示

的第

个分量，

表示

经过全连接之后再经过softmax得到的概率向量，也即第一样本权重，

表示第

个专家网络的输出，也即第

个样本专家输出特征。

需要说明的是，在得到第

个业务目标的门控的输出

之后，还将该

输入第

个业务目标的MLP，得到该第

个业务目标的样本预估特征，该样本预估特征也可以称为样本输出score，该样本输出score能够用于拟合该第

个业务目标的对应的标签。设第

个业务目标的MLP为

，则第

个业务目标的样本预估特征参见公式（3）：

（3）；

其中，

表示第

个业务目标的样本预估特征，

表示第一样本输入特征，

表示第

个业务目标的门控输出的样本门控输出特征，

表示第

个业务目标的MLP。

其中，第三模型为ESMM模型，该第三模型的输入为第一模型和第二模型的输出，第三模型能够将第一模型输出的样本交叉特征和第二模型输出的点多个样本预估特征分别进行拼接，得到多个第二样本拼接特征，再对该多个第二样本拼接特征进行全连接和激活，得到时长CVR、PCTR和点赞CVR，再对上述激活的结果求取内积，得到时长CTCVR和点赞CTCVR。服务器能偶基于时长CTCVR确定时长CTCVR损失。第三模型能够基于PCTR确定CTR损失。第三模型能够基于点赞CTCVR确定点赞CTCVR损失。基于上述损失来调整该多目标子模型的参数。

在一些实施例中，服务器能够基于上述样本预估信息和多个业务目标的实际效果信息，来确定多目标子模型的训练损失。相应的，对于任一样本信息，服务器获取该样本信息中多个业务目标的实际效果信息；然后服务器基于该样本信息的样本预估信息和该多个业务目标的实际效果信息，确定该多目标子模型的训练损失；基于该多目标子模型的训练损失，训练该多目标子模型。

402、服务器将样本信息中的样本对象特征输入对象类型子模型，得到该样本信息的样本对象类型信息，该样本对象类型信息用于表示样本对象特征对应的样本对象属于各对象类型的概率。

在本申请实施例中，样本对象特征为描述对象的特征，如对象的性别、年龄、历史兴趣画像、各种行为的历史活跃度画像等。服务器能够从多个第二样本降维特征中抽取对象侧的对象样本降维特征，来训练对象类型子模型。该多个第二样本降维特征由样本对象特征、样本资源特征以及样本关联特征中的稀疏特征降维得到。

需要说明的是，在训练对象类型子模型之前，需要确定待预测的对象类型。以模型训练的总目标为点击、时长和点赞为例，对象类型包括三类：偏点击倾向的对象，偏深度阅读倾向的对象和偏点赞倾向的对象，上述三种对象类型可以简称为点击型、时长型以及点赞型。在选择训练样本时，由于曝光未点击样本中的对象特征没有发生变化，且标签中没有对象倾向信息，因此训练样本采用点击样本。当三种目标中出现两种或两种以上的正样本时，以最高优先级来确定对象所属的对象类型，优先级为：点赞＞时长＞点击。

例如，对于已曝光未点击的样本，由于没有对象点击该样本，则对象不会与该样本之间产生关联，进而对象的相关特征也未发生改变，从而无法判断对象的倾向，因此在选择训练样本时，不需要则已曝光未点击的样本。对于已点击的样本，由于对象已点击了该样本，则对象与该样本之间产生了关联，进而对象的相关特征发生了改变，如该样本为游戏文章，对应“游戏”、“攻略”这两个标签，则该对象的特征中关于游戏和攻略的相关特征发生变化。进一步的，对象在点击该样本的基础上，还能够阅读该样本，如果对象阅读该样本的时长超过了时长阈值，则该对象的相关特征发生了进一步改变。对象在阅读该样本的基础上，还能够点赞该样本，则该对象的相关特征也会发生变化。也即对象的行为会影响对象的对象特征。如果对象既点击又点赞，此时出现三个目标中的两种，则服务器基于上述优先级，确定该对象的对象类型为点赞型；如果对象既点击又阅读超过时长阈值，但是并未点赞，则服务器确定该对象的对象类型为时长型；如果对象仅点击，则服务器确定该对象的对象类型为点击型。

还需要说明的是，参见图7所示，图7是根据本申请实施例提供的一种对象类型子模型的结构示意图。该对象类型子模型的结构采用DNN结构，该对象类型子模型的输入为对象侧的对象特征，该对象特征包括对象稀疏特征和对象稠密特征，如图7所示，从多个第二样本降维特征中获取对象样本降维特征，该对象样本降维特征相当于对对象特征中的对象稀疏特征进行降维得到的特征。然后对象类型子模型将对象样本降维特征和对象样本稠密特征进行拼接，得到第二样本输入特征。基于多个MLP对该第二样本输入特征进行多次全连接，输出三个参数，分别对应点击型、时长型和点赞型三个对象类型的预估分数，然后经过归一化（softmax函数）后，得到样本样本对象类型信息，也即上述三个对象类型的预测概率：点击型概率、时长型概率以及点赞型概率。

在一些实施例中，服务器能够基于样本对象的实际对象类型信息和上述样本对象类型信息，来确定对象类型子模型的训练损失。相应的，对于任一样本信息，服务器能够获取该样本信息中样本对象的实际对象类型信息，然后服务器基于该样本信息的样本对象类型信息和实际对象类型信息，确定该对象类型子模型的训练损失，然后基于该对象类型子模型的训练损失，训练该对象类型子模型。

例如，采用多分类交叉熵作为上述对象类型子模型的损失函数。记第

个点击正样本中的第二样本输入特征为

，该第二样本输入特征

由对象稀疏特征经嵌入层降维后的对象样本降维特征和对象样本稠密特征拼接得到。记该样本的对象在点击型、时长型以及点赞型这三种对象类型上的预测概率分别为

、

以及

，其中

表示对象类型子模型的参数。记该对象的实际对象类型特征为one-hot向量

，其中，

的取值为0或1，且只有一个是1，k=1，2，3。比如

表示点击型的对象，

表示时长型的对象，

表示点赞型的对象。对象类型子模型的优化目标为最小化多分类交叉熵损失函数

，参见公式（4）：

（4）；

其中，

表示对象类型子模型的参数，

表示多分类交叉熵损失函数，M表示点击正样本的总个数，

表示对象的实际对象类型，

表示对象类型的预测概率，

表示第

个点击正样本中的第二样本输入特征，k=1，2，3。

403、服务器将样本预估信息和样本对象类型信息输入融合子模型，得到该样本信息对应的样本推荐信息，该样本推荐信息用于指示该媒体资源的推荐分数。

在本申请实施例中，服务器能够根据对象的对象类型，自适应的选择最适合的参数融合方式，也即本申请实施例中将多目标子模型输出的样本预估信息和对象类型子模型输出的样本对象类型信息，均输入融合子模型，由该融合子模型基于样本对象类型信息，对样本预估信息进行融合，得到样本推荐信息。

参见图8所示，图8是根据本申请实施例提供的一种多目标融合模型的结构示意图。该多目标融合模型包括多目标子模型、对象类型子模型以及融合子模型。以样本媒体资源为样本文章为例，样本信息包括样本对象的对象特征、样本文章的文章特征，样本对象和样本文章之间的上下文特征和样本交叉特征等。对于第

个样本信息，记

为多目标子模型输出的样本预估信息构成的向量，

表示对象类型子模型输出样本对象类型中对象属于各对象类型的概率构成的向量。

表示DNN融合函数，则融合分数（也即样本推荐信息）表示为

，其中，

表示多目标融合模型要训练的参数。

在一些实施例中，对于任一样本信息，服务器能够基于类型编码结果、权重特征以及业务特征，确定该样本信息的样本权重，该类型编码结果用于指示该样本信息中样本对象所属的对象类型，该权重特征用于指示多个业务目标的初始权重，所该述业务向量用于指示该样本信息中的样本媒体资源关联的业务。

需要说明的是，为让每种对象类型的对象能够得到对应该对象类型的推荐，多目标融合模型的训练目标为让每种对象类型的对象产生的对应该类的正样本的融合分数最大化。例如，对于点击类型的对象，训练目标为最大化这些对象的点击正样本的融合分数；对于时长类型的对象，训练目标为最大化这些对象的时长正样本的融合分数；对于点赞类型的对象，训练目标为最大化这些对象的点赞正样本的融合分数。对于第

个样本，记

为对象类型子模型输出的概率向量所转化成的one-hot向量。其中，1所在的对象类型为预估概率最大的对象类型，如[1，0，0]表示这个样本的样本对象被预测为点击类型的对象；[0，1，0]表示这个样本的样本对象被预测为时长类型的对象；[0，0，1]表示这个样本的样本对象被预测为点赞类型的对象。记点击、时长以及点赞这三个业务目标的初始权重为

，其中，

、

以及

的值根据业务实际情况预先设定。业务目标的正样本占比数量与权重成反相关，也即正样本在总样本中占比越少的业务目标，权要设置得越高。如，在本申请实施例中，三个业务目标的正样本占比是点击＞时长＞点赞，则

，即点击的初始权重为1.0，时长的初始权重为2.0，点赞的初始权重为4.0。记上述三个业务目标的类标构成的向量是

其中，

、

和

分别是点击、时长和点赞这三个业务目标的二分类类标。则对于第

个样本来说，该样本为点击正样本，该样本的样本权重

的计算方式参见公式（5）所示：

（5）；

其中，

表示第

个样本的样本权重，

表示第

个样本中第

个业务目标的类标，

表示第

个样本的对象类型，

表示第

个样本的中第

个业务目标的初始权重。

上述公式（5）使得不同对象类型的对象的样本在不同业务目标上的权重大小不同。例如，在本申请实施例中，点击型对象在上述三个业务目标上的权重为[2.0，1.0，1.0]；时长型对象在上述三个业务目标上的权重为[1.0，3.0，1.0]，点赞型对象在上述三个业务目标上的权重为[1.0，1.0，5.0]。

404、服务器基于多个样本信息对应的样本推荐信息，确定融合子模型的训练损失。

在本申请实施例中，服务器能够将上述多个样本信息对应的样本推荐信息转换为样本推荐概率；然后基于多个样本信息对应的样本推荐概率和多个样本信息的样本权重，确定该融合子模型的训练损失。该融合子模型的损失函数表示为

，参见公式（6）：

（6）；

其中，

表示融合子模型的损失，

表示样本总数，

表示第

个样本的样本权重，

表示点击这一业务目标的二分类类标，

，

表示sigmoid函数，用于将模型输出的融合分数

转化为预估概率

。

405、服务器基于融合子模型的训练损失，训练多目标融合模型。

在本申请实施例中，多目标子模型和对象类型子模型是训练完毕的模型，服务器能够基于该多目标融合模型中融合子模型的训练损失，调整该融合子模型的参数，从而得到多目标融合模型。该多目标融合模型能够部署在服务器中，以实现上述步骤301至步骤308所描述的媒体资源推荐方法。

需要说明的是，本申请以样本文章作为样本媒体资源，点击、时长以及点赞作为业务目标为例，来介绍该多目标融合模型的训练过程，在一些实施例中，该样本信息还可以为样本商品、样本服务等内容的信息，该业务目标还可以为其他与应用场景相关的业务目标，如商品的购买率、服务器的购买率等，本申请实施例对此不进行限制。该多目标融合模型的结构还可以选用DNN以外的结构，只要是以对象类型子模型的输出和多目标子模型的输出为输入，并根据对象类型构造样本权重，拟合加权点击目标的模型结构均可，本申请实施例对此不进行限制。该上述训练样本以及该多目标融合模型可以存储在区块链系统中。

本申请实施例提供了一种基于对象类型预测的多目标融合模型，能够解决多目标模型在不同业务目标的效果上出现“此消彼长”的问题，通过引入对象类型，能够个性化提升多目标融合的准确性。

需要说明的是，本申请实施例还针对图文推荐场景对点击、时长、点赞三个业务目标的多目标融合模型做了A/B测试，实验结果表明，使用本申请实施例提供的方案，相较于公式融合+grid-search（网格搜索）的方法，能够实现图文点击量（pv）平均提升0.78%，图文总时长提升0.48%，点赞pv持平。参见图9所示，图9是根据本申请实施例提供的一种测试结果对比图。如图9中的（a）-（c）分别展示了线上A/B测试的实验组（本申请的方案）与对照组（公式融合+grid-search的方法）在点击量、阅读总时长和点赞数这三个指标上的相对提升幅度，其中空跑期A/B两组都是用公式融合+grid-search的方法，试验期两组分别为本申请的方案与公式融合+grid-search的方法。根据图9中的（a）可知，本申请方案与公式融合+grid-search的方法的AB测试结果为：本申请方案的pv相对提升0.78%。根据图9中的（b）可知，本申请方案与公式融合+grid-search的方法的AB测试结果为：本申请方案的时长相对提升0.48%。根据图9中的（c）可知，本申请方案与公式融合+grid-search的方法的AB测试结果为：本申请方案的点赞pv与公式融合+grid-search的方法持平。

图10是根据本申请实施例提供的一种内容推荐装置的框图。该内容推荐装置用于执行上述媒体资源推荐方法中的步骤，参见图10，装置包括：第一确定模块1001、第二确定模块1002、第三确定模块1003以及推荐模块1004：

第一确定模块1001，用于基于目标对象的对象特征、媒体资源的资源特征和关联特征，确定业务目标预估信息，该关联特征用于指示该媒体资源与该目标对象之间的关联关系，该业务目标预估信息用于表示将该媒体资源推荐给该目标对象后多个业务目标的预估效果；

第二确定模块1002，用于基于该对象特征，确定对象类型信息，该对象类型信息用于表示该目标对象属于各对象类型的概率；

第三确定模块1003，用于基于该业务目标预估信息和该对象类型信息，确定该媒体资源的推荐信息，该推荐信息用于指示该媒体资源的推荐分数；

推荐模块1004，用于响应于该推荐信息满足推荐条件，向该目标对象推荐该媒体资源。

在一些实施例中，参见图11所示，图11是根据本申请实施例提供的另一种内容推荐装置的示意图，该第一确定模块1001，包括：

特征交叉子模块1101，用于对该目标对象的对象特征、该媒体资源的资源特征和该关联特征中的稀疏特征进行特征交叉，得到交叉特征；

第一确定子模块1102，用于基于该对象特征、该资源特征和该关联特征，确定多个预估特征，该多个预估特征用于指示该多个业务目标的中间预估效果；

第二确定子模块1103，用于基于该交叉特征和该多个预估特征，确定该业务目标预估信息。

在一些实施例中，参见图11所示，该特征交叉子模块1101，包括：

元素加权单元11011，用于对该目标对象的对象特征、该媒体资源的资源特征和该关联特征中的稀疏特征中的多个非零元素进行加权求和，得到一阶特征，一个非零元素对应一个元素权重；

第一降维单元11012，用于对该对象特征、该资源特征和该关联特征中的稀疏特征进行降维，得到多个第一降维特征；

第一确定单元11013，用于基于该多个第一降维特征，确定二阶交叉特征；

第一拼接单元11014，用于对该一阶特征和该二阶交叉特征进行拼接，得到该交叉特征。

在一些实施例中，该元素加权单元11011，用于确定该多个第一降维特征中任意两个第二降维特征的内积；对确定的多个内积进行求和，得到该二阶交叉特征。

在一些实施例中，参见图11所示，该第一确定子模块1102，包括：

第二拼接单元11021，用于将该对象特征、该资源特征和该关联特征中的稠密特征和多个第二降维特征进行拼接，得到第一输入特征，该多个第二降维特征由对该对象特征、该资源特征和该关联特征中的稀疏特征进行降维得到；

第一处理单元11022，用于基于该多个业务目标对应的多个专家网络，分别对该第一输入特征进行处理，得到多个专家网络输出特征；

第二处理单元11023，用于基于该多个业务目标对应的多个门控函数，分别对该第一输入特征和该多个专家网络输出特征进行处理，得到多个门控输出特征；

第三处理单元11024，用于基于该多个业务目标对应的多个多层感知器，分别对该多个门控输出特征进行处理，得到该多个预估特征。

在一些实施例中，该第二处理单元11023，用于对于任一业务目标，基于该业务目标的门控函数，对该第一输入特征进行全连接和映射，得到多个第一权重，该多个第一权重与该多个专家网络输出特征一一对应；基于该多个第一权重，对该多个专家网络输出特征进行加权求和，得到该业务目标对应的门控输出特征。

在一些实施例中，该第二确定子模块1103，用于将该交叉特征和该多个预估特征分别进行拼接，得到多个第二拼接特征；基于该多个第二拼接特征，确定该业务目标预估信息。

在一些实施例中，该第二确定模块1002，用于获取多个对象降维特征，该对象降维特征由对对象特征中的稀疏特征进行降维得到；将该多个对象降维特征和该对象特征中的稠密特征进行拼接，得到第二输入特征；对该第二输入特征进行多次全连接和映射，得到该对象类型信息。

在一些实施例中，该推荐条件包括下述任一项：

该推荐信息所指示的推荐分数在多个媒体资源的推荐信息所指示的推荐分数中的排序小于次序阈值；

该推荐信息所指示的推荐分数大于分数阈值。

本申请实施例提供了一种内容推荐装置，通过引入对象的对象类型信息，使得能够基于对象属于各对象类型的概率来对业务目标的预估效果进行融合，从而对于不同对象类型的对象，业务目标的预估效果的融合方式不同，提高了融合结果的准确性，能够有效的解决“此消彼长”问题。

需要说明的是：上述实施例提供的内容推荐装置在推荐内容时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的内容推荐装置与内容同推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图12是根据本申请实施例提供的一种多目标融合模型的训练装置的框图。该内容推荐装置用于执行上述媒体资源推荐方法中的步骤，参见图12，装置包括：第一训练模块1201、第二训练模块1202、第三训练模块1203以及第四训练模块1204：

第一训练模块1201，用于对于任一样本信息，将该样本信息中的样本对象特征、样本资源特征和样本关联特征输入该多目标子模型，得到该样本信息的样本预估信息，该样本关联特征用于指示该样本资源特征对应的样本媒体资源与该样本对象特征对应的样本对象之间的关联关系，该样本预估信息用于表示该样本对象点击该样本媒体资源后多个业务目标的预估效果；

第二训练模块1202，用于将该样本信息中的样本对象特征输入该对象类型子模型，得到该样本信息的样本对象类型信息，该样本对象类型信息用于表示该样本对象属于各对象类型的概率；

第三训练模块1203，用于将该样本预估信息和样本对象类型信息输入该融合子模型，得到该样本信息对应的样本推荐信息，该样本推荐信息用于指示该样本媒体资源的推荐分数；

第四训练模块1204，用于基于多个样本信息对应的样本推荐信息，确定该融合子模型的训练损失；

该第四训练模块1204，还用于基于该融合子模型的训练损失，训练该多目标融合模型。

在一些实施例中，该第四训练模块1204，用于将该多个样本信息对应的样本推荐信息转换为样本推荐概率；基于该多个样本信息对应的样本推荐概率和该多个样本信息的样本权重，确定该融合子模型的训练损失。

在一些实施例中，参见图13所示，图13是根据本申请实施例提供的另一种多目标融合模型的训练装置的框图，该装置还包括：

权重确定模块1301，用于对于任一样本信息，基于类型编码结果、权重特征以及业务特征，确定该样本信息的样本权重，该类型编码结果用于指示该样本信息中样本对象所属的对象类型，该权重向量用于指示该多个业务目标的初始权重，该业务向量用于指示该样本信息中的样本媒体资源关联的业务。

在一些实施例中，参见图13所示，该装置还包括：第五训练模块1302，用于对于任一样本信息，获取该样本信息中样本对象的实际对象类型信息；基于该样本信息的样本对象类型信息和该实际对象类型信息，确定该对象类型子模型的训练损失；基于该对象类型子模型的训练损失，训练该对象类型子模型。

在一些实施例中，参见图13所示，该装置还包括：第六训练模块1303，用于对于任一样本信息，获取该样本信息中多个业务目标的实际效果信息；基于该样本信息的样本预估信息和该多个业务目标的实际效果信息，确定该多目标子模型的训练损失；基于该多目标子模型的训练损失，训练该多目标子模型。

需要说明的是：上述实施例提供的多目标融合模型的训练装置在训练多目标融合模型时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的多目标融合模型的训练装置与多目标融合模型的训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图14是根据本申请实施例提供的一种服务器的结构示意图，该服务器1400可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（CentralProcessing Units，CPU）1401和一个或一个以上的存储器1402，其中，该存储器1402中存储有至少一条计算机程序，该至少一条计算机程序由该处理器1401加载并执行以实现上述各个方法实施例提供的媒体资源推荐方法，或者该至少一条计算机程序由该处理器1401加载并执行以实现上述各个方法实施例提供的多目标融合模型的训练方法。当然，该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该服务器还可以包括其他用于实现设备功能的部件，在此不做赘述。在一些实施例中，该服务器1400能够与多个车载终端进行数据通信，以一个车载终端为例，该车载终端登录有目标账号，服务器基于该媒体资源推荐方法，向该车载终端推送多媒体资源，还能够向该车载终端推送附近的加油站、停车场以及风景区等，本申请实施例对此不进行限制。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一段计算机程序，该至少一段计算机程序由计算机设备的处理器加载并执行，以实现上述实施例的媒体资源推荐方法中计算机设备所执行的操作。例如，所述计算机可读存储介质可以是只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random AccessMemory，RAM）、光盘只读存储器（Compact Disc Read-Only Memory，CD-ROM）、磁带、软盘和光数据存储设备等。

在一些实施例中，本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行，或者在位于一个地点的多个计算机设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算机设备上执行，分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有至少一段计算机程序，该至少一段计算机程序由计算机设备的处理器加载并执行，以实现上述实施例的多目标融合模型的训练方法中计算机设备所执行的操作。例如，所述计算机可读存储介质可以是只读存储器（Read-Only Memory，ROM）、随机存取存储器（RandomAccess Memory，RAM）、光盘只读存储器（Compact Disc Read-Only Memory，CD-ROM）、磁带、软盘和光数据存储设备等。

本申请实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各种可选实现方式中提供的媒体资源推荐方法。

本申请实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程序代码，该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码，处理器执行该计算机程序代码，使得该计算机设备执行上述各种可选实现方式中提供的多目标融合模型的训练方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种媒体资源推荐方法，其特征在于，所述方法包括：

基于多目标融合模型中的多目标子模型，对目标对象的对象特征、媒体资源的资源特征和关联特征进行处理，得到业务目标预估信息，所述多目标子模型包括第一模型、第二模型和第三模型，所述第一模型用于特征交叉，所述第二模型用于确定多个业务目标的中间预估效果，所述第三模型用于基于所述第一模型和所述第二模型的输出确定所述业务目标预估信息，所述关联特征用于指示所述媒体资源与所述目标对象之间的关联关系，所述业务目标预估信息用于表示将所述媒体资源推荐给所述目标对象后多个业务目标的预估效果；

基于所述多目标融合模型中的对象类型子模型，对所述对象特征进行处理，得到对象类型信息，所述对象类型子模型用于预测对象属于所述多个业务目标对应的多个对象类型的概率，所述对象类型信息用于表示所述目标对象属于各对象类型的概率；

基于所述多目标融合模型中的融合子模型，对所述业务目标预估信息和所述对象类型信息进行拼接，对拼接得到的向量进行多次全连接，得到所述媒体资源的推荐信息，所述推荐信息用于指示所述媒体资源的推荐分数，所述融合子模型用于基于所述目标对象所属的对象类型，对所述多个业务目标的预估效果进行融合；

2.根据权利要求1所述的方法，其特征在于，所述对目标对象的对象特征、媒体资源的资源特征和关联特征进行处理，得到业务目标预估信息，包括：

对所述目标对象的对象特征、所述媒体资源的资源特征和所述关联特征中的稀疏特征进行特征交叉，得到交叉特征；

基于所述对象特征、所述资源特征和所述关联特征，确定多个预估特征，所述多个预估特征用于指示所述多个业务目标的中间预估效果；

基于所述交叉特征和所述多个预估特征，得到所述业务目标预估信息。

3.根据权利要求2所述的方法，其特征在于，所述对所述目标对象的对象特征、所述媒体资源的资源特征和所述关联特征中的稀疏特征进行特征交叉，得到交叉特征，包括：

对所述目标对象的对象特征、所述媒体资源的资源特征和所述关联特征中的稀疏特征中的多个非零元素进行加权求和，得到一阶特征，一个非零元素对应一个元素权重；

对所述对象特征、所述资源特征和所述关联特征中的稀疏特征进行降维，得到多个第一降维特征；

基于所述多个第一降维特征，确定二阶交叉特征；

对所述一阶特征和所述二阶交叉特征进行拼接，得到所述交叉特征。

4.根据权利要求3所述的方法，其特征在于，所述基于所述多个第一降维特征，确定二阶交叉特征，包括：

确定所述多个第一降维特征中任意两个第二降维特征的内积；

对确定的多个内积进行求和，得到所述二阶交叉特征。

5.根据权利要求2所述的方法，其特征在于，所述基于所述对象特征、所述资源特征和所述关联特征，确定多个预估特征，包括：

将所述对象特征、所述资源特征和所述关联特征中的稠密特征和多个第二降维特征进行拼接，得到第一输入特征，所述多个第二降维特征由对所述对象特征、所述资源特征和所述关联特征中的稀疏特征进行降维得到；

基于所述多个业务目标对应的多个专家网络，分别对所述第一输入特征进行处理，得到多个专家网络输出特征；

基于所述多个业务目标对应的多个门控函数，分别对所述第一输入特征和所述多个专家网络输出特征进行处理，得到多个门控输出特征；

基于所述多个业务目标对应的多个多层感知器，分别对所述多个门控输出特征进行处理，得到所述多个预估特征。

6.根据权利要求5所述的方法，其特征在于，所述基于所述多个业务目标对应的多个门控函数，分别对所述第一输入特征和所述多个专家网络输出特征进行处理，得到多个门控输出特征，包括：

对于任一业务目标，基于所述业务目标的门控函数，对所述第一输入特征进行全连接和映射，得到多个第一权重，所述多个第一权重与所述多个专家网络输出特征一一对应；

基于所述多个第一权重，对所述多个专家网络输出特征进行加权求和，得到所述业务目标对应的门控输出特征。

7.根据权利要求2所述的方法，其特征在于，所述基于所述交叉特征和所述多个预估特征，确定所述业务目标预估信息，包括：

将所述交叉特征和所述多个预估特征分别进行拼接，得到多个第二拼接特征；

基于所述多个第二拼接特征，确定所述业务目标预估信息。

8.根据权利要求1所述的方法，其特征在于，所述对所述对象特征进行处理，得到对象类型信息，包括：

获取多个对象降维特征，所述对象降维特征由对对象特征中的稀疏特征进行降维得到；

将所述多个对象降维特征和所述对象特征中的稠密特征进行拼接，得到第二输入特征；

对所述第二输入特征进行多次全连接和映射，得到所述对象类型信息。

9.根据权利要求1-8任一项所述的方法，其特征在于，所述推荐条件包括下述任一项：

所述推荐信息所指示的推荐分数大于分数阈值。

10.一种多目标融合模型的训练方法，其特征在于，所述多目标融合模型包括对象类型子模型、多目标子模型以及融合子模型，所述方法包括：

对于任一样本信息，将所述样本信息中的样本对象特征、样本资源特征和样本关联特征输入所述多目标子模型，得到所述样本信息的样本预估信息，所述样本关联特征用于指示所述样本资源特征对应的样本媒体资源与所述样本对象特征对应的样本对象之间的关联关系，所述多目标子模型包括第一模型、第二模型和第三模型，所述第一模型用于特征交叉，所述第二模型用于确定多个业务目标的中间预估效果，所述第三模型用于基于所述第一模型和所述第二模型的输出确定所述业务目标预估信息，所述样本预估信息用于表示所述样本对象点击所述样本媒体资源后多个业务目标的预估效果；

将所述样本信息中的样本对象特征输入所述对象类型子模型，得到所述样本信息的样本对象类型信息，所述对象类型子模型用于预测对象属于所述多个业务目标对应的多个对象类型的概率，所述样本对象类型信息用于表示所述样本对象属于各对象类型的概率；

将所述样本预估信息和所述样本对象类型信息输入所述融合子模型，由所述融合子模型对所述样本预估信息和所述样本对象类型信息进行拼接，对拼接得到的向量进行多次全连接，得到所述样本信息对应的样本推荐信息，所述融合子模型用于基于所述样本对象所属的样本对象类型，对所述多个业务目标的预估效果进行融合，所述样本推荐信息用于指示所述样本媒体资源的推荐分数；

11.根据权利要求10所述的方法，其特征在于，所述基于多个样本信息对应的样本推荐信息，确定所述融合子模型的训练损失，包括：

将所述多个样本信息对应的样本推荐信息转换为样本推荐概率；

基于所述多个样本信息对应的样本推荐概率和所述多个样本信息的样本权重，确定所述融合子模型的训练损失。

12.一种内容推荐装置，其特征在于，所述装置包括：

第一确定模块，用于基于多目标融合模型中的多目标子模型，对目标对象的对象特征、媒体资源的资源特征和关联特征进行处理，得到业务目标预估信息，所述多目标子模型包括第一模型、第二模型和第三模型，所述第一模型用于特征交叉，所述第二模型用于确定多个业务目标的中间预估效果，所述第三模型用于基于所述第一模型和所述第二模型的输出确定所述业务目标预估信息，所述关联特征用于指示所述媒体资源与所述目标对象之间的关联关系，所述业务目标预估信息用于表示将所述媒体资源推荐给所述目标对象后多个业务目标的预估效果；

第二确定模块，用于基于所述多目标融合模型中的对象类型子模型，对所述对象特征进行处理，得到对象类型信息，所述对象类型子模型用于预测对象属于所述多个业务目标对应的多个对象类型的概率，所述对象类型信息用于表示所述目标对象属于各对象类型的概率；

第三确定模块，用于基于所述多目标融合模型中的融合子模型，对所述业务目标预估信息和所述对象类型信息进行拼接，对拼接得到的向量进行多次全连接，得到所述媒体资源的推荐信息，所述推荐信息用于指示所述媒体资源的推荐分数，所述融合子模型用于基于所述目标对象所属的对象类型，对所述多个业务目标的预估效果进行融合；

13.一种多目标融合模型的训练装置，其特征在于，所述多目标融合模型包括对象类型子模型、多目标子模型以及融合子模型，所述装置包括：

第一训练模块，用于对于任一样本信息，将所述样本信息中的样本对象特征、样本资源特征和样本关联特征输入所述多目标子模型，得到所述样本信息的样本预估信息，所述样本关联特征用于指示所述样本资源特征对应的样本媒体资源与所述样本对象特征对应的样本对象之间的关联关系，所述多目标子模型包括第一模型、第二模型和第三模型，所述第一模型用于特征交叉，所述第二模型用于确定多个业务目标的中间预估效果，所述第三模型用于基于所述第一模型和所述第二模型的输出确定所述业务目标预估信息，所述样本预估信息用于表示所述样本对象点击所述样本媒体资源后多个业务目标的预估效果；

第二训练模块，用于将所述样本信息中的样本对象特征输入所述对象类型子模型，得到所述样本信息的样本对象类型信息，所述对象类型子模型用于预测对象属于所述多个业务目标对应的多个对象类型的概率，所述样本对象类型信息用于表示所述样本对象属于各对象类型的概率；

第三训练模块，用于将所述样本预估信息和所述样本对象类型信息输入所述融合子模型，由所述融合子模型对所述样本预估信息和所述样本对象类型信息进行拼接，对拼接得到的向量进行多次全连接，得到所述样本信息对应的样本推荐信息，所述融合子模型用于基于所述样本对象所属的样本对象类型，对所述多个业务目标的预估效果进行融合，所述样本推荐信息用于指示所述样本媒体资源的推荐分数；

14.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段计算机程序，所述至少一段计算机程序由所述处理器加载并执行权利要求1-9任一项所述的媒体资源推荐方法，或者执行权利要求10-11任一项所述的多目标融合模型的训练方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储至少一段计算机程序，所述至少一段计算机程序用于执行权利要求1-9任一项所述的媒体资源推荐方法，或者执行权利要求10-11任一项所述的多目标融合模型的训练方法。