CN113034168B

CN113034168B - 内容项投放方法、装置、计算机设备及存储介质

Info

Publication number: CN113034168B
Application number: CN201911360246.9A
Authority: CN
Inventors: 杨文博; 刘永起; 张西龙; 盛名扬; 李宁; 王立
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2024-09-20
Anticipated expiration: 2039-12-25
Also published as: CN113034168A

Abstract

本公开关于一种内容项投放方法、装置、计算机设备及存储介质，属于网络技术领域。本公开通过用户的用户信息与内容项的内容项信息，不仅能够预测该用户对该内容项的行为信息，而且能够预测该用户与该内容项的投放群体之间的相似度，从而基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项，能够在保证尽可能的用户完成转化的基础上，控制尽可能少的高风险用户完成转化，提升了内容项投放过程的准确度和精确度。

Description

内容项投放方法、装置、计算机设备及存储介质

技术领域

本公开涉及网络技术领域，尤其涉及一种内容项投放方法、装置、计算机设备及存储介质。

背景技术

随着网络技术的发展，广告主可以与平台运营方进行合作，在指定平台上进行广告等内容项的投放，使得用户在终端上浏览指定平台上投放的广告，例如，该指定平台可以是网站、应用客户端、电视栏目等。

目前，广告主可以定义一些符合自身业务场景的转化目标，例如，该转化目标可以是用户在终端下载某个应用程序(application，APP)、用户在终端某一APP上注册用户账号、用户在终端某一APP上对任一商品进行下单等，不同的广告主可以为不同的内容项确定不同的转化目标，从而在内容项投放之后，可以通过考察对转化目标的完成度来衡量内容项的投放效果。

在上述过程中，由于内容项会被投放至各个用户的终端，一些高风险用户也会在浏览内容项之后进行转化，从而对广告主的业务造成无效或者负面的影响，根据广告主业务场景的不同，高风险用户的定义也各不相同，比如，若广告主为信用卡发行客户，转化目标是引入新的开卡用户，那么此时高风险用户可以是一些恶意套现、逾期不还款的用户，若广告主为游戏发行客户，转化目标是引入新的玩家，那么此时高风险用户可以是一些通过虚假信息注册游戏之后删除游戏的用户，因此，内容项投放过程的准确度差，如何在兼顾达成转化目标与控制高风险用户的情况下进行内容项投放，成为一个亟需解决的问题。

发明内容

本公开提供一种内容项投放方法、装置、计算机设备及存储介质，以至少解决相关技术中内容项投放过程准确度差的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种内容项投放方法，包括：

基于用户的用户信息与内容项的内容项信息，预测所述用户对所述内容项的行为信息，所述行为信息包括点击行为、注册行为或者转化行为中至少一项；

基于所述用户信息与所述内容项信息，预测所述用户与所述内容项的投放群体之间的相似度；

基于所述用户对所述内容项的行为信息与所述用户与所述内容项的投放群体之间的相似度，确定是否对所述用户投放所述内容项。

在一种可能实施方式中，所述基于用户的用户信息与内容项的内容项信息，预测所述用户对所述内容项的行为信息包括：

获取所述用户信息与所述内容项信息之间的第一融合特征；

将所述第一融合特征输入不同的预估模型，通过不同的预估模型分别对所述第一融合特征进行加权处理，得到所述用户对所述内容项的行为信息。

在一种可能实施方式中，所述将所述第一融合特征输入不同的深度网络，通过不同的深度网络分别对所述第一融合特征进行加权处理，得到所述用户对所述内容项的行为信息包括：

将所述第一融合特征输入点击率预估模型，通过所述点击率预估模型对所述第一融合特征进行加权处理，输出所述用户对所述内容项的预估点击率；

将所述第一融合特征输入注册率预估模型，通过所述注册率预估模型对所述第一融合特征进行加权处理，输出所述用户对所述内容项的预估注册率；

将所述第一融合特征输入转化率预估模型，通过所述转化率预估模型对所述第一融合特征进行加权处理，输出所述用户对所述内容项的预估转化率；

将所述用户对所述内容项的预估点击率、预估注册率或者预估转化率中至少一项确定为所述用户对所述内容项的行为信息。

在一种可能实施方式中，所述获取所述用户信息与所述内容项信息之间的第一融合特征包括：

将所述用户信息输入第一特征网络，通过所述第一特征网络对所述用户信息进行特征提取，得到所述用户的第一用户特征；

将所述内容项信息输入第二特征网络，通过所述第二特征网络对所述内容项信息进行特征提取，得到所述内容项的第一内容项特征；

对所述第一用户特征与所述第一内容项特征进行特征融合，得到所述第一融合特征。

在一种可能实施方式中，所述基于所述用户信息与所述内容项信息，预测所述用户与所述内容项的投放群体之间的相似度包括：

获取所述用户信息与所述内容项信息之间的第二融合特征；

将所述第二融合特征输入相似度模型，通过所述相似度模型对所述第二融合特征进行加权处理，输出所述用户与所述内容项的投放群体之间的相似度。

在一种可能实施方式中，所述获取所述用户信息与所述内容项信息之间的第二融合特征包括：

将所述用户信息输入第三特征网络，通过所述第三特征网络对所述用户信息进行特征提取，得到所述用户的第二用户特征；

将所述内容项信息输入第四特征网络，通过所述第四特征网络对所述内容项信息进行特征提取，得到所述内容项的第二内容项特征；

将所述第二用户特征与所述第二内容项特征进行特征融合，得到所述第二融合特征。

在一种可能实施方式中，所述基于用户的用户信息与内容项的内容项信息，预测所述用户对所述内容项的行为信息之前，所述方法还包括：

根据多个样本用户信息与多个样本内容项信息，对第一初始特征网络、第二初始特征网络、第三初始特征网络、第四初始特征网络、初始点击率模型、初始注册率模型、初始转化率模型以及初始相似度模型进行迭代训练，当满足停止训练条件时，得到第一特征网络、第二特征网络、第三特征网络、第四特征网络、点击率预估模型、注册率预估模型、转化率预估模型以及相似度模型。

在一种可能实施方式中，所述第二初始特征网络与所述第四初始特征网络在迭代训练的过程中共享参数。

在一种可能实施方式中，所述停止训练条件为：所述初始点击率模型、所述初始注册率模型、所述初始转化率模型以及所述初始相似度模型的损失函数值之和小于或等于第一目标阈值，且各个样本用户信息分别输入所述第一初始特征网络与所述第三初始特征网络之后，得到的各个第一样本用户特征与各个第二样本用户特征之间的平均差异值大于或等于第二目标阈值。

在一种可能实施方式中，所述基于所述用户对所述内容项的行为信息与所述用户与所述内容项的投放群体之间的相似度，确定是否对所述用户投放所述内容项包括：

获取所述内容项的控制信息，所述控制信息包括行为信息阈值或者相似度阈值中至少一项；

若所述行为信息高于所述行为信息阈值且所述相似度高于所述相似度阈值，确定对所述用户投放所述内容项；否则，确定不向所述用户投放所述内容项。

根据本公开实施例的第二方面，提供一种内容项投放装置，包括：

第一预测单元，被配置为执行基于用户的用户信息与内容项的内容项信息，预测所述用户对所述内容项的行为信息，所述行为信息包括点击行为、注册行为或者转化行为中至少一项；

第二预测单元，被配置为执行基于所述用户信息与所述内容项信息，预测所述用户与所述内容项的投放群体之间的相似度；

确定单元，被配置为执行基于所述用户对所述内容项的行为信息与所述用户与所述内容项的投放群体之间的相似度，确定是否对所述用户投放所述内容项。

在一种可能实施方式中，所述第一预测单元包括：

第一获取子单元，被配置为执行获取所述用户信息与所述内容项信息之间的第一融合特征；

第一加权子单元，被配置为执行将所述第一融合特征输入不同的预估模型，通过不同的预估模型分别对所述第一融合特征进行加权处理，得到所述用户对所述内容项的行为信息。

在一种可能实施方式中，所述第一加权子单元被配置为执行：

在一种可能实施方式中，所述第一获取子单元被配置为执行：

在一种可能实施方式中，所述第二预测单元包括：

第二获取子单元，被配置为执行获取所述用户信息与所述内容项信息之间的第二融合特征；

第二加权子单元，被配置为执行将所述第二融合特征输入相似度模型，通过所述相似度模型对所述第二融合特征进行加权处理，输出所述用户与所述内容项的投放群体之间的相似度。

在一种可能实施方式中，所述第二获取子单元被配置为执行包括：

在一种可能实施方式中，所述装置还用于：

在一种可能实施方式中，所述确定单元被配置为执行：

根据本公开实施例的第三方面，提供一种计算机设备，包括：

一个或多个处理器；

用于存储所述一个或多个处理器可执行指令的一个或多个存储器；

其中，所述一个或多个处理器被配置为执行上述第一方面以及第一方面的可能实施方式中任一项的内容项投放方法。

根据本公开实施例的第四方面，提供一种存储介质，当所述存储介质中的至少一条指令由计算机设备的一个或多个处理器执行时，使得计算机设备能够执行上述第一方面以及第一方面的可能实施方式中任一项的内容项投放方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括一条或多条指令，所述一条或多条指令可以由计算机设备的一个或多个处理器执行时，使得计算机设备能够执行上述第一方面以及第一方面的可能实施方式中任一项的内容项投放方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

通过用户的用户信息与内容项的内容项信息，不仅能够预测该用户对该内容项的行为信息，而且能够预测该用户与该内容项的投放群体之间的相似度，从而基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项，通过用户的行为信息兼顾了用户的转化意图以及广告主的转化目标，通过用户与内容项的投放群体之间的相似度兼顾了用户的风险等级，从而能够在保证尽可能的用户完成转化的基础上，控制尽可能少的高风险用户完成转化，提升了内容项投放过程的准确度和精确度。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是本公开实施例提供的一种内容项投放方法的实施环境示意图；

图2是根据一示例性实施例示出的一种内容项投放方法的流程图；

图3是根据一示例性实施例示出的一种内容项投放方法的流程图；

图4是本公开实施例提供的一种多任务模型的训练流程图；

图5是本公开实施例提供的一种多任务模型的训练原理图；

图6是根据一示例性实施例示出的一种内容项投放装置的逻辑结构框图；

图7是本公开实施例提供的一种计算机设备的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所涉及的用户信息可以为经用户授权或者经过各方充分授权的信息。

图1是本公开实施例提供的一种内容项投放方法的实施环境示意图。参见图1，在该实施环境中包括终端101和服务器102，终端101和服务器102通过无线网络或有限网络相连，服务器102也即是计算机设备的一种示例。

其中，终端101用于浏览服务器102投放的各个内容项，该内容项可以由多种类型的多媒体资源组合形成，例如，该内容项可以是视频广告或者图文广告，在终端101上可以安装有支持内容项投放业务的应用程序，使得用户可以通过启动该应用程序来浏览内容项，该应用程序可以是直播应用程序、短视频应用程序、购物应用程序、外卖应用程序、旅行应用程序、游戏应用程序或者社交应用程序中至少一项。

其中，服务器102用于向终端101投放内容项，服务器102可以包括一台服务器、多台服务器、云计算平台或虚拟化中心中的至少一项。可选地，服务器102可以承担主要计算工作，终端101可以承担次要计算工作；或者，服务器102承担次要计算工作，终端101承担主要计算工作；或者，服务器102和终端101两者之间采用分布式计算架构进行协同计算。

在一个示例性场景中，该内容项可以是视频广告，以终端101安装短视频应用程序为例，服务器102通过短视频应用程序向终端101提供短视频观看平台，服务器102获取终端101所对应用户所授权的用户信息，获取待投放的各个视频广告的内容项信息，从而基于本公开实施例提供的内容项投放方法，能够基于用户信息和各个内容项信息，确定是否向用户所对应的终端101投放各个视频广告，将确定投放的视频广告投放至终端101，使得用户可以在终端101浏览上述视频广告。

需要说明的是，终端101可以泛指多个终端中的一个，终端101的设备类型可以包括：智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group AudioLayer III，动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture ExpertsGroup Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机或者台式计算机中的至少一种。例如，终端101可以是智能手机，或者其他手持便携式电子设备。以下实施例，以终端包括智能手机来举例说明。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量。本公开实施例对终端的数量和设备类型不加以限定。

图2是根据一示例性实施例示出的一种内容项投放方法的流程图，参见图2，该内容项投放方法应用于计算机设备，下面以计算机设备为服务器为例进行说明。

在步骤201中，服务器基于用户的用户信息与内容项的内容项信息，预测该用户对该内容项的行为信息，该行为信息包括点击行为、注册行为或者转化行为中至少一项。

在步骤202中，服务器基于该用户信息与该内容项信息，预测该用户与该内容项的投放群体之间的相似度。

在步骤203中，服务器基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项。

本公开实施例提供的方法，通过用户的用户信息与内容项的内容项信息，不仅能够预测该用户对该内容项的行为信息，而且能够预测该用户与该内容项的投放群体之间的相似度，从而基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项，通过用户的行为信息兼顾了用户的转化意图以及广告主的转化目标，通过用户与内容项的投放群体之间的相似度兼顾了用户的风险等级，从而能够在保证尽可能的用户完成转化的基础上，控制尽可能少的高风险用户完成转化，提升了内容项投放过程的准确度和精确度。

在一种可能实施方式中，基于用户的用户信息与内容项的内容项信息，预测该用户对该内容项的行为信息包括：

获取该用户信息与该内容项信息之间的第一融合特征；

将该第一融合特征输入不同的预估模型，通过不同的预估模型分别对该第一融合特征进行加权处理，得到该用户对该内容项的行为信息。

在一种可能实施方式中，将该第一融合特征输入不同的深度网络，通过不同的深度网络分别对该第一融合特征进行加权处理，得到该用户对该内容项的行为信息包括：

将该第一融合特征输入点击率预估模型，通过该点击率预估模型对该第一融合特征进行加权处理，输出该用户对该内容项的预估点击率；

将该第一融合特征输入注册率预估模型，通过该注册率预估模型对该第一融合特征进行加权处理，输出该用户对该内容项的预估注册率；

将该第一融合特征输入转化率预估模型，通过该转化率预估模型对该第一融合特征进行加权处理，输出该用户对该内容项的预估转化率；

将该用户对该内容项的预估点击率、预估注册率或者预估转化率中至少一项确定为该用户对该内容项的行为信息。

在一种可能实施方式中，获取该用户信息与该内容项信息之间的第一融合特征包括：

将该用户信息输入第一特征网络，通过该第一特征网络对该用户信息进行特征提取，得到该用户的第一用户特征；

将该内容项信息输入第二特征网络，通过该第二特征网络对该内容项信息进行特征提取，得到该内容项的第一内容项特征；

对该第一用户特征与该第一内容项特征进行特征融合，得到该第一融合特征。

在一种可能实施方式中，基于该用户信息与该内容项信息，预测该用户与该内容项的投放群体之间的相似度包括：

获取该用户信息与该内容项信息之间的第二融合特征；

将该第二融合特征输入相似度模型，通过该相似度模型对该第二融合特征进行加权处理，输出该用户与该内容项的投放群体之间的相似度。

在一种可能实施方式中，获取该用户信息与该内容项信息之间的第二融合特征包括：

将该用户信息输入第三特征网络，通过该第三特征网络对该用户信息进行特征提取，得到该用户的第二用户特征；

将该内容项信息输入第四特征网络，通过该第四特征网络对该内容项信息进行特征提取，得到该内容项的第二内容项特征；

将该第二用户特征与该第二内容项特征进行特征融合，得到该第二融合特征。

在一种可能实施方式中，基于用户的用户信息与内容项的内容项信息，预测该用户对该内容项的行为信息之前，该方法还包括：

在一种可能实施方式中，该第二初始特征网络与该第四初始特征网络在迭代训练的过程中共享参数。

在一种可能实施方式中，该停止训练条件为：该初始点击率模型、该初始注册率模型、该初始转化率模型以及该初始相似度模型的损失函数值之和小于或等于第一目标阈值，且各个样本用户信息分别输入该第一初始特征网络与该第三初始特征网络之后，得到的各个第一样本用户特征与各个第二样本用户特征之间的平均差异值大于或等于第二目标阈值。

在一种可能实施方式中，基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项包括：

获取该内容项的控制信息，该控制信息包括行为信息阈值或者相似度阈值中至少一项；

若该行为信息高于该行为信息阈值且该相似度高于该相似度阈值，确定对该用户投放该内容项；否则，确定不向该用户投放该内容项。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

图3是根据一示例性实施例示出的一种内容项投放方法的流程图，如图3所示，内容项投放方法用于计算机设备，在本实施例中以计算机设备为服务器为例进行说明，该实施例包括以下步骤。

在步骤301中，服务器获取用户的用户信息与内容项的内容项信息。

可选地，用户的用户信息可以包括资料信息或者行为信息中至少一项，该资料信息可以包括用户的姓名、性别、年龄、昵称、职业或者地理位置中至少一项，该行为信息可以包括用户的历史点击行为信息、历史注册行为信息或者历史转化行为信息中至少一项，其中，在不同的情况下历史转化行为信息可以具有不同的含义，例如历史转化行为信息可以是历史消费行为信息，上述用户信息为经用户授权或者经过各方充分授权的信息。

可选地，内容项的内容项信息可以是承载了任一内容的多媒体资源，该内容项信息可以是视频资源、音频资源、图片资源、文本资源或者网页资源中至少一项的组合，每个内容项可以对应于一个物品(item)或服务，例如，该内容项可以为物品的视频广告、物品的图文广告等，此时物品的内容项可以包括物品名称、物品详情、物品图片或者物品跳转链接中至少一项。

在上述过程中，服务器为任一能够提供内容项投放服务的计算机设备，服务器可以从本地数据库中获取用户的用户信息以及内容项的内容项信息，也可以从云端数据库中下载该用户信息以及内容项信息，当然，在一些实施例中，广告主在与广告商合作进行内容项投放时，广告主通过广告主终端将内容项的内容项信息发送至服务器，用户终端在加载内容项时，可以将用户信息携带在内容项加载请求中，向服务器发送该内容项加载请求，使得服务器能够从广告主终端获取内容项信息，从用户终端获取用户信息，本公开实施例不对用户信息与内容项信息的获取方式进行具体限定。

在步骤302中，服务器将该用户信息输入第一特征网络，通过该第一特征网络对该用户信息进行特征提取，得到该用户的第一用户特征。

可选地，该第一特征网络用于对用户信息进行特征提取，该第一特征网络可以是词向量模型、多层感知机(Multi-Layer Perceptron，MLP，又称人工神经网络)、深度神经网络(Deep Neural Networks，DNN)或者卷积神经网络(Convolutional Neural Networks，CNN)中至少一项，本公开实施例不对第一特征网络的类型进行具体限定。

在一些实施例中，若第一特征网络为词向量模型，服务器可以将用户信息输入词向量模型，通过词向量模型对用户信息进行嵌入(embedding)处理，输出用户的第一嵌入向量，将该第一嵌入向量确定为第一用户特征。

在一些实施例中，若第一特征网络为DNN，DNN中可以包括多个隐藏层，各个隐藏层之间串联连接，服务器将用户信息输入DNN中多个隐藏层，通过多个隐藏层对用户信息进行加权处理，由最后一个隐藏层输出用户的第一特征向量，将该第一特征向量确定为第一用户特征。

在上述过程中，不同类型的第一特征网络可以具有不同的特征提取方式，通过第一特征网络进行特征提取，能够将用户信息转化为计算机可处理的第一用户特征，获取到了用户信息的更加准确的特征表示。

在步骤303中，服务器将该内容项信息输入第二特征网络，通过该第二特征网络对该内容项信息进行特征提取，得到该内容项的第一内容项特征。

可选地，该第二特征网络用于对内容项信息进行特征提取，该第二特征网络也可以是词向量模型、MLP、DNN或者CNN中至少一项，本公开实施例不对第二特征网络的类型进行具体限定。

在一些实施例中，由于内容项信息通常是视频资源、音频资源、图片资源、文本资源或者网页资源中至少一项的组合，因此服务器可以为不同类型的资源设置各自对应的特征子网络，将不同类型的内容项资源输入到与各自类型对应特征子网络中，通过各个特征子网络对不同类型的内容项资源进行特征提取，对各个特征子网络输出的资源特征进行融合，从而得到第一内容项特征。

可选地，若内容项信息包括视频资源、图片资源以及文本资源，第二特征网络可以包括视频子网络、图片子网络以及文本子网络，那么服务器可以将视频资源输入到视频子网络中，通过视频子网络提取视频资源的视频特征，将图片资源输入到图片子网络中，通过图片子网络提取图片资源的图片特征，将文本资源输入到文本子网络中，通过文本子网络提取文本资源的文本特征，将视频特征、图片特征以及文本特征进行特征融合，得到第一内容项特征。

在上述过程中，由于不同类型的资源通常会具有不同的特征，如果采用同一网络来提取各个类型资源的特征，容易丢失掉各个类型资源的细节信息，而通过有针对性的为不同类型资源设置各自的特征子网络，能够提取出准确度更高、表达能力更强的第一内容项特征。

在步骤304中，服务器对该第一用户特征与该第一内容项特征进行特征融合，得到第一融合特征。

在一些实施例中，服务器在进行特征融合时，可以将第一用户特征与第一内容项特征进行拼接(concat)处理，得到第一融合特征，能够简化特征融合过程的计算量，例如，将24维的第一用户特征与48维的第一内容项特征进行拼接处理，可以得到一个72维的第一融合特征。

在一些实施例中，服务器在进行特征融合时，还可以对第一用户特征进行维度变换，得到维度变换后的第一用户特征，该维度变换后的第一用户特征与第一内容项特征的维度相同，将第一内容项特征中各个元素分别与维度变换后的第一用户特征中各个对应位置的元素相加，得到第一融合特征，能够使得第一用户特征与第一内容项特征之间进行更加紧密的特征融合。

在上述步骤302-304中，获取该用户信息与该内容项信息之间的第一融合特征，可选地，在获取到第一用户特征与第一内容项特征之后，服务器还可以通过全连接层对第一用户特征与第一内容项特征进行级联，从而得到第一融合特征，或者，服务器还可以对第一用户特征与第一内容项特征进行多模态低阶双线性池化(multi-modal low-rankbilinear pooling，MLB)处理，得到第一融合特征，或者，服务器还可以对第一用户特征与第一内容项特征进行多模态因式分解双线性池化(multi-modal factorized bilinearpooling，MFB)处理，得到第一融合特征，本公开实施例不对第一用户特征与第一内容项特征之间的融合方式进行具体限定。

在步骤305中，服务器将该第一融合特征输入点击率预估模型，通过该点击率预估模型对该第一融合特征进行加权处理，输出该用户对该内容项的预估点击率。

在上述过程中，点击率(Click Through Rate，CTR)预估模型用于预测某一用户点击某一内容项的概率，该点击率预估模型可以是服务器预存在本地的，该点击率预估模型可以通过下述实施例中各步骤训练得到，这里不做赘述。

可选地，该点击率预估模型可以是一个点击率MLP，点击率MLP中可以包括至少一个隐藏层和归一化层，该至少一个隐藏层中相邻的隐藏层串联连接，也即是说，任一隐藏层的输出图作为该隐藏层的下一隐藏层的输入图。

在上述情况中，服务器可以将该第一融合特征输入点击率MLP中的至少一个隐藏层，通过该至少一个隐藏层对该第一融合特征进行加权处理，将最后一个隐藏层的输出图输入到归一化层中，通过该归一化层对最后一个隐藏层的输出图进行指数归一化(softmax)处理，得到该用户对该内容项的预估点击率。

在一些实施例中，除了点击率MLP之外，点击率预估模型还可以是Wide&Deep网络(宽度和深度联合网络)、GBDT(Gradient Boosting Decision Tree，梯度提升决策树)、XGBoost(eXtreme Gradient Boosting，极限梯度提升)等，本公开实施例不对点击率预估模型的类型进行具体限定。

在步骤306中，服务器将该第一融合特征输入注册率预估模型，通过该注册率预估模型对该第一融合特征进行加权处理，输出该用户对该内容项的预估注册率。

在上述过程中，当内容项所表示的物品为应用程序、论坛、网站等平台时，注册率预估模型用于预测某一用户在内容项所表示平台的注册概率，该注册率预估模型可以是服务器预存在本地的，该注册率预估模型可以通过下述实施例中各步骤训练得到，这里不做赘述。

可选地，该注册率预估模型可以是一个注册率MLP，注册率MLP中可以包括至少一个隐藏层和归一化层，该至少一个隐藏层中相邻的隐藏层串联连接，也即是说，任一隐藏层的输出图作为该隐藏层的下一隐藏层的输入图。

在上述情况中，服务器可以将该第一融合特征输入注册率MLP中的至少一个隐藏层，通过该至少一个隐藏层对该第一融合特征进行加权处理，将最后一个隐藏层的输出图输入到归一化层中，通过该归一化层对最后一个隐藏层的输出图进行softmax处理，得到该用户对该内容项所表示平台的预估注册率。

在一些实施例中，除了注册率MLP之外，注册率预估模型还可以是Wide&Deep网络、GBDT、XGBoost等，本公开实施例不对注册率预估模型的类型进行具体限定。

在步骤307中，服务器将该第一融合特征输入转化率预估模型，通过该转化率预估模型对该第一融合特征进行加权处理，输出该用户对该内容项的预估转化率。

在上述过程中，转化率预估模型用于预测某一用户对某一内容项完成转化的概率，比如，当内容项对应于某一物品时，转化率是指用户购买该物品的概率，或者，当内容项对应于某一发卡银行的信用卡时，转化率是指用户办理该发卡银行的信用卡的概率，对不同的内容项，转化率可以具有不同的具体含义。该转化率预估模型可以是服务器预存在本地的，该转化率预估模型可以通过下述实施例中各步骤训练得到，这里不做赘述。

可选地，该转化率预估模型可以是一个转化率MLP，转化率MLP中可以包括至少一个隐藏层和归一化层，该至少一个隐藏层中相邻的隐藏层串联连接，也即是说，任一隐藏层的输出图作为该隐藏层的下一隐藏层的输入图。

在上述情况中，服务器可以将该第一融合特征输入转化率MLP中的至少一个隐藏层，通过该至少一个隐藏层对该第一融合特征进行加权处理，将最后一个隐藏层的输出图输入到归一化层中，通过该归一化层对最后一个隐藏层的输出图进行softmax处理，得到该用户对该内容项所表示平台的预估转化率。

在一些实施例中，除了转化率MLP之外，转化率预估模型还可以是Wide&Deep网络、GBDT、XGBoost等，本公开实施例不对转化率预估模型的类型进行具体限定。

需要说明的是，上述点击率预估模型、注册率预估模型、转化率预估模型可以具有相同的网络结构，但具有不同的网络参数，也可以具有不同的网络结构，比如，三者互为具有不同网络参数的MLP，比如，点击率预估模型为Wide&Deep网络，注册率预估模型为注册率DNN，转化率预估模型为转化率MLP，本公开实施例不对点击率预估模型、注册率预估模型、转化率预估模型是否采用相同的网络结构进行具体限定。

在步骤308中，服务器将该用户对该内容项的预估点击率、预估注册率或者预估转化率中至少一项确定为该用户对该内容项的行为信息。

在上述步骤305-308中，服务器将该第一融合特征输入不同的预估模型，通过不同的预估模型分别对该第一融合特征进行加权处理，得到该用户对该内容项的行为信息。在一些实施例中，服务器可以根据广告主的投放需求，不执行上述步骤306-307中获取预估注册率、预估转化率的操作，而是可以直接将上述步骤305中获取的预估点击率确定为行为信息，同理，服务器也可以仅将预估注册率或者预估转化率确定为行为信息，本公开实施例不对行为信息具体包括哪几项进行具体限定。

在上述步骤302-308中，服务器基于用户的用户信息与内容项的内容项信息，预测该用户对该内容项的行为信息，该行为信息包括点击行为、注册行为或者转化行为中至少一项，具体地，服务器通过上述步骤305预测了用户的点击行为，通过上述步骤306预测了用户的注册行为，服务器通过上述步骤307预测了用户的转化行为，从而能够针对用户对内容项的“点击-注册-转化”的链路中各个节点分别进行概率预测，换言之，能够预测出用户对内容项的转化意图是否强烈，对同一内容项而言，重复执行获取不同用户对该内容项的行为信息的步骤，能够统计出各个用户对该内容项的转化数量。

在步骤309中，服务器将该用户信息输入第三特征网络，通过该第三特征网络对该用户信息进行特征提取，得到该用户的第二用户特征。

可选地，该第三特征网络用于对用户信息进行特征提取，该第三特征网络可以与上述步骤302中第一特征网络具有相同的网络结构但具有不同的网络参数，或者，第三特征网络与第一特征网络具有不同的网络结构，例如，该第三特征网络可以是词向量模型、MLP、DNN或者CNN中至少一项，本公开实施例不对第三特征网络的类型进行具体限定。

上述步骤309与上述步骤302类似，这里不做赘述。

在步骤310中，服务器将该内容项信息输入第四特征网络，通过该第四特征网络对该内容项信息进行特征提取，得到该内容项的第二内容项特征。

可选地，该第四特征网络用于对内容项信息进行特征提取，该第四特征网络可以与上述步骤303中第二特征网络具有相同的网络结构但具有不同的网络参数，或者，第四特征网络与第二特征网络具有不同的网络结构，例如，该第四特征网络可以是词向量模型、MLP、DNN或者CNN中至少一项，本公开实施例不对第四特征网络的类型进行具体限定。

在一些实施例中，若第四特征网络和第二特征网络在训练时共享参数，那么第四特征网络和第二特征网络为同一网络，也即是说，第一内容项特征与第二内容项特征也相同，此时服务器无需执行上述步骤310，而是在获取到第二用户特征之后，直接将第二用户特征与上述步骤303中获取到的第一内容项特征进行特征融合，得到第二融合特征。

上述步骤310与上述步骤303类似，这里不做赘述。

在步骤311中，服务器将该第二用户特征与该第二内容项特征进行特征融合，得到第二融合特征。

在上述步骤309-311中，服务器获取该用户信息与该内容项信息之间的第二融合特征，在对第二用户特征与第二内容项特征进行特征融合时，可以通过与上述步骤304类似的融合方式进行融合，例如，融合方式可以包括：拼接处理、维度变换与叠加处理、级联处理、MLB处理或者MFB处理中至少一项，本公开实施例不对第二用户特征与第二内容项特征之间的融合方式进行具体限定。

上述步骤311与上述步骤304类似，这里不做赘述。

在步骤312中，服务器将该第二融合特征输入相似度模型，通过该相似度模型对该第二融合特征进行加权处理，输出该用户与该内容项的投放群体之间的相似度。

在上述过程中，相似度模型用于预测用户与内容项的投放群体之间的相似度，该相似度模型可以是服务器预存在本地的，该相似度模型可以通过下述实施例中各步骤训练得到，这里不做赘述。

由于相似度模型能够预测用户与内容项的投放群体之间的相似度，那么当用户与投放群体的相似度越高时，可以认为用户较为符合内容项的投放群体，该用户也即是低风险的投放用户，当用户与投放群体的相似度越低时，可以认为用户不太符合内容项的投放群体，该用户也即是高风险的投放用户，因此，相似度模型也可以俗称为“风险预估模型”。

可选地，该风险预估模型可以是一个风险MLP，风险MLP中可以包括至少一个隐藏层和归一化层，该至少一个隐藏层中相邻的隐藏层串联连接，也即是说，任一隐藏层的输出图作为该隐藏层的下一隐藏层的输入图。

在上述情况中，服务器可以将该第二融合特征输入风险MLP中的至少一个隐藏层，通过该至少一个隐藏层对该第二融合特征进行加权处理，将最后一个隐藏层的输出图输入到归一化层中，通过该归一化层对最后一个隐藏层的输出图进行softmax处理，得到该用户与投放群体的相似度，进一步地，还可以根据相似度所在的取值区间，将相似度映射到某一风险等级，从而确定出该用户所对应的风险等级。

在一些实施例中，除了风险MLP之外，相似度模型还可以是Wide&Deep网络、GBDT、XGBoost等，本公开实施例不对相似度模型的类型进行具体限定。

在上述步骤309-312中，服务器基于该用户信息与该内容项信息，预测该用户与该内容项的投放群体之间的相似度，从而服务器基于上述相似度，能够确定用户所属的风险等级，从而有利于基于风险等级来定量地衡量用户的转化质量。

在步骤313中，服务器基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项。

在上述过程中，服务器可以获取广告主终端发送的该内容项的控制信息，该控制信息可以包括行为信息阈值或者相似度阈值中至少一项，服务器在上述步骤308中获取到行为信息，在上述步骤312中获取到相似度，若该行为信息高于行为信息阈值且相似度高于相似度阈值，那么确定向该用户投放该内容项，否则，确定不向该用户投放该内容项。

在一些实施例中，该控制信息还可以包括行为信息阈值或者风险等级阈值中至少一项，此时，服务器在获取到行为信息和相似度之后，还可以将相似度映射至对应的风险等级，若行为信息高于行为信息阈值且风险等级低于风险等级阈值，那么确定向该用户投放该内容项，否则，确定不向该用户投放该内容项。

例如，广告主终端发送的控制信息中携带了点击率阈值80％、注册率阈值60％、转化率阈值40％、风险等级为中级，若对某一用户而言，预估点击率为90％、预估注册率为75％、预估转化率为58％、风险等级为低级，那么服务器可以确定向该用户投放该内容项。

在一些实施例中，服务器在确定向用户投放内容项之后，可以将内容项的内容项信息发送至用户的用户终端，使得用户在用户终端上启动应用程序之后，在该应用程序所提供的用户界面中显示该内容项信息，当该内容项信息为广告时，能够实时地向用户投放该用户在线浏览的广告，从而实现了对内容项的在线预测服务。

在上述过程中，可以通过本公开实施例的各个步骤确定出是否向各个用户投放各个内容项，不仅通过用户的行为信息兼顾了用户的转化意图(用户是否有意愿对内容项进行点击行为、注册行为或者转化行为)，而且还通过用户与投放群体之间的相似度兼顾了用户的风险等级(用户是否与投放群体具有较多的共性)，从而能够平衡广告主对于转化数量和转化质量之间的需求，既能够挖掘出用户在内容项转化过程中的共性特征，又能够挖掘出高风险用户的个性特征，减少或者排除掉一些无效转化用户以及低质转化用户，从而提升了广告主的效费比。

在一些实施例中，对同一内容项而言，服务器可以获取不同用户对该内容项的行为信息，以及不同用户与该内容项的投放群体之间的相似度，那么可以确定出是否对各个用户投放该内容项，从而统计出各个用户对该内容项的平均点击率、平均注册率以及平均转化率，若平均点击率低于第一阈值时，可以确定不向所有用户投放该内容项，或者，若平均注册率低于第二阈值时，可以确定不向所有用户投放该内容项，或者，若平均转化率低于第三阈值时，可以确定不向所有用户投放该内容项。

在上述过程中，不仅能够针对每个用户进行个性化的判定是否投放每个内容项，而是能够基于统计出的平均点击率、平均注册率以及平均转化率，衡量出每个内容项的投放质量，从而筛选掉一些可以预估的投放质量较差的内容项，能够提升内容项投放的质量。

在上述实施例中，服务器基于不同的特征网络提取用户的用户特征与内容项的内容项特征，再基于不同的预估模型分别预测出用户对内容项的预估点击率、预估注册率、预估转化率以及用户与内容项投放群体之间的相似度，从而再基于各个预估点击率、预估注册率、预估转化率以及相似度确定是否为该用户投放该内容项，在本公开实施例中，将对各个特征网络以及各个预估模型(以下统称为“多任务模型”)的训练过程进行详细说明。

图4是本公开实施例提供的一种多任务模型的训练流程图，请参考图4，该训练过程应用于计算机设备，在本实施例中以计算机设备为服务器为例进行说明，该实施例包括以下步骤。

在步骤401中，服务器获取多个样本用户的多个样本用户信息与多个样本内容项的多个样本内容项信息。

可选地，每个样本用户信息可以包括一个样本用户的资料信息或者行为信息中至少一项，该资料信息可以包括样本用户的姓名、性别、年龄、昵称、职业或者地理位置中至少一项，该行为信息可以包括样本用户的历史点击行为信息、历史注册行为信息或者历史转化行为信息中至少一项，其中，在不同的情况下历史转化行为信息可以具有不同的含义，例如历史转化行为信息可以是历史消费行为信息，上述样本用户信息为经样本用户授权或者经过各方充分授权的信息。

可选地，每个样本内容项信息可以是承载了任一内容的多媒体资源，各个样本内容项信息可以是视频资源、音频资源、图片资源、文本资源或者网页资源中至少一项的组合，每个内容项可以对应于一个物品(item)或服务，例如，该内容项可以为物品的视频广告、物品的图文广告等，此时物品的内容项可以包括物品名称、物品详情、物品图片或者物品跳转链接中至少一项。

上述步骤401与上述步骤301类似，这里不做赘述。

在步骤402中，服务器获取该多个样本用户信息与该多个样本内容项信息之间的多个第一样本融合特征。

在一些实施例中，上述步骤402可以包括下述几个子步骤：

在步骤4021中，服务器将该多个样本用户信息输入第一初始特征网络，通过该第一初始特征网络对该多个样本用户信息进行特征提取，得到多个第一样本用户特征。

可选地，该第一初始特征网络用于对样本用户信息进行特征提取，该第一初始特征网络可以是词向量模型、MLP、DNN或者CNN中至少一项，本公开实施例不对第一初始特征网络的类型进行具体限定。

上述步骤4021与上述步骤302类似，这里不做赘述。

在步骤4022中，服务器将该多个样本内容项信息输入第二初始特征网络，通过该第二初始特征网络对该多个样本内容项信息进行特征提取，得到多个第一样本内容项特征。

可选地，该第二初始特征网络用于对样本内容项信息进行特征提取，该第二初始特征网络也可以是词向量模型、MLP、DNN或者CNN中至少一项，本公开实施例不对第二初始特征网络的类型进行具体限定。

上述步骤4022与上述步骤303类似，这里不做赘述。

在步骤4023中，服务器分别对该多个第一样本用户特征与该多个第一样本内容项特征进行特征融合，得到多个第一样本融合特征。

其中，一个第一样本融合特征用于表示一个第一样本用户特征与一个第一样本内容项特征之间融合所得的特征。

上述步骤4023与上述步骤304类似，这里不做赘述。

在步骤403中，服务器将该多个第一样本融合特征输入初始点击率模型，通过该初始点击率模型对该多个第一样本融合特征进行加权处理，输出多个样本用户对多个样本内容项的多个预估点击率。

在上述过程中，初始点击率模型用于预测某一样本用户点击某一样本内容项的概率，该初始点击率模型可以是点击率MLP、Wide&Deep网络、GBDT或者XGBoost中至少一项，本公开实施例不对初始点击率模型的类型进行具体限定。

上述步骤403与上述步骤305类似，这里不做赘述。

在步骤404中，服务器将该多个第一样本融合特征输入初始注册率模型，通过该初始注册率模型对该多个第一样本融合特征进行加权处理，输出多个样本用户对多个样本内容项的多个预估注册率。

在上述过程中，当样本内容项所表示的物品为应用程序、论坛、网站等平台时，初始注册率模型用于某一样本用户在某一样本内容项所表示平台的注册概率，该初始注册率模型可以是注册率MLP、Wide&Deep网络、GBDT或者XGBoost中至少一项，本公开实施例不对初始注册率模型的类型进行具体限定。

上述步骤404与上述步骤306类似，这里不做赘述。

在步骤405中，服务器将该多个第一样本融合特征输入初始转化率模型，通过该初始转化率模型对该多个第一样本融合特征进行加权处理，输出多个样本用户对多个样本内容项的多个预估转化率。

在上述过程中，初始转化率模型用于预测某一样本用户对某一样本内容项完成转化的概率，比如，当样本内容项对应于某一物品时，转化率是指样本用户购买该物品的概率，或者，当样本内容项对应于某一发卡银行的信用卡时，转化率是指样本用户办理该发卡银行的信用卡的概率，对不同的样本内容项，转化率可以具有不同的具体含义，该初始转化率模型可以是转化率MLP、Wide&Deep网络、GBDT或者XGBoost中至少一项，本公开实施例不对初始转化率模型的类型进行具体限定。

上述步骤405与上述步骤307类似，这里不做赘述。

在步骤406中，服务器获取初始点击率模型的点击预测误差、初始注册率模型的注册预测误差以及初始转化率模型的转化预测误差。

其中，点击预测误差也即是初始点击率模型的损失函数值，注册预测误差也即是初始注册率模型的损失函数值，转化预测误差也即是初始转化率模型的损失函数值。

在上述过程中，服务器可以根据该多个预估点击率以及多个样本用户对多个样本内容项的历史点击行为信息，获取初始点击率模型的点击预测误差，根据该多个预估注册率以及多个样本用户对多个样本内容项的历史注册行为信息，获取初始注册率模型的注册预测误差，根据该多个预估转化率以及多个样本用户对多个样本内容项的历史转化行为信息，获取初始转化率模型的转化预测误差。

在一些实施例中，服务器可以将各个样本用户对各个样本内容项的历史点击行为信息与预估点击率之间的均方误差(Mean-Square Error，MSE)确定为点击预测误差，将各个样本用户对各个样本内容项的历史注册行为信息与预估注册率之间的MSE确定为注册预测误差，将各个样本用户对各个样本内容项的历史转化行为与预估转化率之间的MSE确定为转化预测误差，从而能够减少获取点击预测误差、注册预测误差以及转化预测误差时的计算量。

在一些实施例中，服务器还可以将各个样本用户对各个样本内容项的历史点击行为信息与预估点击率之间的交叉熵或者相对熵确定为点击预测误差，将各个样本用户对各个样本内容项的历史注册行为信息与预估注册率之间的交叉熵或者相对熵确定为注册预测误差，将各个样本用户对各个样本内容项的历史转化行为与预估转化率之间的交叉熵或者相对熵确定为转化预测误差，从而能够提升获取点击预测误差、注册预测误差以及转化预测误差时的准确度。

在步骤407中，服务器获取该多个样本用户信息与该多个样本内容项信息之间的多个第二样本融合特征。

在一些实施例中，上述步骤407可以包括下述几个子步骤：

在步骤4071中，服务器将该多个样本用户信息输入第三初始特征网络，通过该第三初始特征网络对该多个样本用户信息进行特征提取，得到多个第二样本用户特征。

可选地，该第三初始特征网络用于对样本用户信息进行特征提取，该第三初始特征网络可以与上述步骤4021中第一初始特征网络具有相同的初始网络结构，但在迭代训练过程中训练出了不同的网络参数，或者，第三初始特征网络与第一初始特征网络具有不同的初始网络结构，例如，该第三初始特征网络可以是词向量模型、MLP、DNN或者CNN中至少一项，本公开实施例不对第三初始特征网络的类型进行具体限定。

上述步骤4071与上述步骤309类似，这里不做赘述。

在步骤4072中，服务器将该多个样本内容项信息输入第四初始特征网络，通过该第四初始特征网络对该多个样本内容项信息进行特征提取，得到多个第二样本内容项特征。

可选地，该第四初始特征网络用于对样本内容项信息进行特征提取，该第四初始特征网络可以与上述步骤4022中第二初始特征网络具有相同的初始网络结构，但在迭代训练过程中训练出了不同的网络参数，或者，第四初始特征网络与第二初始特征网络具有不同的初始网络结构，例如，该第四初始特征网络也可以是词向量模型、MLP、DNN或者CNN中至少一项，本公开实施例不对第四初始特征网络的类型进行具体限定。

上述步骤4072与上述步骤310类似，这里不做赘述。

在一些实施例中，该第二初始特征网络与该第四初始特征网络可以在迭代训练的过程中共享参数，也即是说，第二初始特征网络与第四初始特征网络可以为同一网络，此时服务器无需执行上述步骤4072，而是可以在获取到多个第二样本用户特征之后，直接将该多个第二样本用户特征与上述步骤4022中的多个第一样本内容项特征分别进行特征融合，得到多个第二样本融合特征。在这种情况下，由于共享了第二初始特征网络与第四初始特征网络的训练参数，能够体现出来，不管是针对用户的转化情况进行预测，还是针对用户的风险情况进行预测时，内容项特征本身是同质的，从而能够减少模型训练时所需要学习的参数量，减少模型训练过程的计算量。

在步骤4073中，服务器分别对该多个第二样本用户特征与该多个第二样本内容项特征进行特征融合，得到多个第二样本融合特征。

其中，一个第二样本融合特征用于表示一个第二样本用户特征与一个第二样本内容项特征之间融合所得的特征。

上述步骤4073与上述步骤311类似，这里不做赘述。

在步骤408中，服务器将该多个第二样本融合特征输入初始相似度模型，通过该初始相似度模型对该多个第二样本融合特征进行加权处理，输出多个样本用户与多个样本内容项的投放群体之间的相似度。

在上述过程中，初始相似度模型用于预测某一样本用户与某一样本内容项的投放群体之间的相似度，当样本用户与投放群体的相似度越高时，可以认为样本用户较为符合样本内容项的投放群体，该样本用户也即是低风险的投放用户，当样本用户与投放群体的相似度越低时，可以认为样本用户不太符合样本内容项的投放群体，该样本用户也即是高风险的投放用户。

可选地，该初始相似度模型可以是风险MLP、Wide&Deep网络、GBDT、XGBoost等，本公开实施例不对初始相似度模型的类型进行具体限定。

上述步骤408与上述步骤312类似，这里不做赘述。

在步骤409中，服务器获取初始相似度模型的风险预测误差。

其中，风险预测误差也即是初始相似度模型的损失函数值。

在上述过程中，服务器可以根据该多个相似度以及多个样本用户对多个样本内容项的历史风险行为信息，获取初始相似度模型的风险预测误差，其中，历史风险行为信息是指样本用户是否存在“伪转化情况”或者“低质转化情况”，比如样本用户在通过某一推广渠道下载某一游戏APP，在推广用户领取到奖励之后样本用户删除该游戏APP，比如样本用户在办理信用卡之后发生了恶意套现、逾期不还款等高风险行为。

在一些实施例中，服务器可以在本地预存相似度与风险等级之间的映射关系，从而根据该映射关系，将各个相似度映射至对应的风险等级，此外，将各个样本用户对各个样本内容项的历史风险行为信息映射至对应的历史风险等级，从而将历史风险等级与风险等级之间的均方误差(Mean-Square Error，MSE)、交叉熵或者相对熵确定为风险预测误差。

在步骤410中，服务器获取多个样本用户的多个第一样本用户特征与多个第二样本用户特征之间的平均差异值。

在上述过程中，对每个样本用户而言，服务器可以将该样本用户的第一样本用户特征与第二样本用户特征之间的绝对距离确定为该样本用户对应的差异值，服务器对各个样本用户重复执行获取差异值的操作，得到各个样本用户对应的差异值，将各个样本用户对应的差异值的平均值确定为上述平均差异值。

在步骤410中，服务器基于点击预测误差、注册预测误差、转化预测误差、风险预测误差以及平均差异值，确定是否符合停止训练条件。

可选地，该停止训练条件可以如下：点击预测误差、注册预测误差、转化预测误差以及风险预测误差之和小于或等于第一目标阈值，且平均差异值大于或等于第二目标阈值，其中，第一目标阈值或第二目标阈值为任一大于或等于0的数值。

换言之，上述停止训练条件也即是：初始点击率模型、初始注册率模型、初始转化率模型以及初始相似度模型的损失函数值之和小于或等于第一目标阈值，且各个样本用户信息分别输入该第一初始特征网络与该第三初始特征网络之后，得到各个第一样本用户特征与各个第二样本用户特征之间的平均差异值大于或等于第二目标阈值。

上述停止训练条件，能够兼顾用户的转化意图以及用户的转化风险两种不同维度的误差，从而能够保证最小化点击预测误差、注册预测误差、转化预测误差以及风险预测误差之和，且最大化各个样本用户所对应第一样本用户特征与第二样本用户特征之间的平均差异值(也即是说最大化用户转化特征与用户风险特征之间的差异)。

在步骤411中，若不符合停止训练条件，服务器对第一初始特征网络、第二初始特征网络、第三初始特征网络、第四初始特征网络、初始点击率模型、初始注册率模型、初始转化率模型以及初始相似度模型进行参数调整，迭代执行上述步骤402-410所执行的操作，直到符合停止训练条件，得到第一特征网络、第二特征网络、第三特征网络、第四特征网络、点击率预估模型、注册率预估模型、转化率预估模型以及相似度模型。

在上述过程中，若不符合停止训练条件，可以基于反向传播算法(Backpropagation algorithm，BP算法)对各个网络或模型进行参数调整，实现每次迭代过程中对各个网络或模型的参数进行更新，

图5是本公开实施例提供的一种多任务模型的训练原理图，请参考图5，服务器将第二初始特征网络与第四初始特征网络在迭代时共享参数，而第一初始特征网络和第二初始特征网络作为独立的两部分进行分别学习，初始点击率模型对应于点击任务(点击task)，初始注册率模型对应于注册任务(注册task)，初始转化率模型对应于转化任务(转化task)，初始相似度模型对应于风险任务(风险task)，各个特征网络和各个模型的联合训练流程可以形象地视为一个“多任务模型”的训练流程，在多任务模型达到预期的精度(也即是符合停止训练条件)时，得到训练后的多任务模型，服务器可以将多任务模型投入到在线预测过程中，将用户信息和内容项信息同时输入到多任务模型中，多任务模型可以同时分别预测任一用户对任一内容项的用户意图以及用户风险，提取出用户的行为信息以及用户与内容项投放群体之间的相似度，从而有利于评估用户的转化率高低以及用户风险高低。

在一些实施例中，服务器还可以每间隔目标时长，收集用户在该目标时长内对投放的各个内容项的行为信息，基于上述用户在该目标时长内对投放的各个内容项的行为信息，重新训练多任务学习模型，对多任务学习模型再次进行参数调整，能够使得多任务学习模型的准确度越来越高，从而更好地向用户投放越来越符合用户意图且越来越降低用户风险的内容项。

本公开实施例提供的方法，根据多个样本用户信息与多个样本内容项信息，对第一初始特征网络、第二初始特征网络、第三初始特征网络、第四初始特征网络、初始点击率模型、初始注册率模型、初始转化率模型以及初始相似度模型进行迭代训练，当满足停止训练条件时，得到第一特征网络、第二特征网络、第三特征网络、第四特征网络、点击率预估模型、注册率预估模型、转化率预估模型以及相似度模型，能够通过一种多任务学习的训练机制，代替单独的点击率模型或者单独的风险模型，提升了不同模型之间的数据共享能力，提升了在稀疏样本条件下训练出的多任务模型的精准度。

进一步地，停止训练条件中考虑了用户意图以及用户风险这两个不同维度上的差异化训练目标，避免了用户意图和用户风险这两个不同维度上的差异化训练目标在多任务模型中相互冲突或相互干扰，不仅最小化了初始点击率模型、初始注册率模型、初始转化率模型以及初始相似度模型的损失函数值之和，而且能够最大化各个样本用户所对应第一样本用户特征与第二样本用户特征之间的平均差异值，能够在针对同一内容项进行分析的背景下，最精准的描述不同转化用户各自的风险差异性，从而有利于提升后续内容项投放过程的精准度。

图6是根据一示例性实施例示出的一种内容项投放装置的逻辑结构框图。参照图6，该装置包括第一预测单元601、第二预测单元602以及确定单元603：

第一预测单元601，被配置为执行基于用户的用户信息与内容项的内容项信息，预测该用户对该内容项的行为信息，该行为信息包括点击行为、注册行为或者转化行为中至少一项；

第二预测单元602，被配置为执行基于该用户信息与该内容项信息，预测该用户与该内容项的投放群体之间的相似度；

确定单元603，被配置为执行基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项。

本公开实施例提供的装置，通过用户的用户信息与内容项的内容项信息，不仅能够预测该用户对该内容项的行为信息，而且能够预测该用户与该内容项的投放群体之间的相似度，从而基于该用户对该内容项的行为信息与该用户与该内容项的投放群体之间的相似度，确定是否对该用户投放该内容项，通过用户的行为信息兼顾了用户的转化意图以及广告主的转化目标，通过用户与内容项的投放群体之间的相似度兼顾了用户的风险等级，从而能够在保证尽可能的用户完成转化的基础上，控制尽可能少的高风险用户完成转化，提升了内容项投放过程的准确度和精确度。

在一种可能实施方式中，基于图6的装置组成，该第一预测单元601包括：

第一获取子单元，被配置为执行获取该用户信息与该内容项信息之间的第一融合特征；

第一加权子单元，被配置为执行将该第一融合特征输入不同的预估模型，通过不同的预估模型分别对该第一融合特征进行加权处理，得到该用户对该内容项的行为信息。

在一种可能实施方式中，该第一加权子单元被配置为执行：

在一种可能实施方式中，该第一获取子单元被配置为执行：

在一种可能实施方式中，基于图6的装置组成，该第二预测单元602包括：

第二获取子单元，被配置为执行获取该用户信息与该内容项信息之间的第二融合特征；

第二加权子单元，被配置为执行将该第二融合特征输入相似度模型，通过该相似度模型对该第二融合特征进行加权处理，输出该用户与该内容项的投放群体之间的相似度。

在一种可能实施方式中，该第二获取子单元被配置为执行包括：

在一种可能实施方式中，该装置还用于：

在一种可能实施方式中，该确定单元603被配置为执行：

关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该内容项投放方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图7是本公开实施例提供的一种计算机设备的结构示意图，该计算机设备700可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessing units，CPU)701和一个或一个以上的存储器702，其中，该存储器702中存储有至少一条指令，该至少一条指令由该处理器701加载并执行以实现上述各个实施例提供的内容项投放方法。当然，该计算机设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该计算机设备还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器，上述指令可由计算机设备的处理器执行以完成上述各个实施例提供的内容项投放方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，该非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供了一种计算机程序产品，包括一条或多条指令，该一条或多条指令可以由计算机设备的处理器执行，以完成上述各个实施例提供的内容项投放方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种内容项投放方法，其特征在于，包括：

获取多个样本用户的多个样本用户信息与多个样本内容项的多个样本内容项信息；

通过第一初始特征网络对所述多个样本用户信息进行特征提取，得到多个第一样本用户特征，所述第一样本用户特征为用户转化特征；通过第二初始特征网络对所述多个样本内容项信息进行特征提取，得到多个第一样本内容项特征；分别对所述多个第一样本用户特征与所述多个第一样本内容项特征进行特征融合，得到多个第一样本融合特征；基于所述多个第一样本融合特征，对第一初始特征网络、第二初始特征网络、初始点击率模型、初始注册率模型、初始转化率模型进行迭代训练；

通过第三初始特征网络对所述多个样本用户信息进行特征提取，得到多个第二样本用户特征，所述第二样本用户特征为用户风险特征；通过第四初始特征网络对所述多个样本内容项信息进行特征提取，得到多个第二样本内容项特征；分别对所述多个第二样本用户特征与所述多个第二样本内容项特征进行特征融合，得到多个第二样本融合特征；通过初始相似度模型对所述多个第二样本融合特征进行加权处理，输出所述多个样本用户与所述多个样本内容项的投放群体之间的相似度；基于所述多个样本用户与所述多个样本内容项的投放群体之间的相似度，对第三初始特征网络、第四初始特征网络、初始相似度模型进行迭代训练；

当满足停止训练条件时，得到第一特征网络、第二特征网络、第三特征网络、第四特征网络、点击率预估模型、注册率预估模型、转化率预估模型以及相似度模型，所述第二初始特征网络与所述第四初始特征网络在迭代训练的过程中共享参数；

将用户的用户信息输入所述第一特征网络，通过所述第一特征网络对所述用户信息进行特征提取，得到所述用户的第一用户特征；

将内容项的内容项信息输入所述第二特征网络，通过所述第二特征网络对所述内容项信息进行特征提取，得到所述内容项的第一内容项特征；

对所述第一用户特征进行维度变换，得到维度变换后的所述第一用户特征，维度变换后的所述第一用户特征与所述第一内容项特征的维度相同，将所述第一内容项特征中各个元素分别与维度变换后的所述第一用户特征中各个对应位置的元素相加，得到第一融合特征；

将所述第一融合特征输入不同的预估模型，通过不同的预估模型分别对所述第一融合特征进行加权处理，得到所述用户对所述内容项的行为信息，所述行为信息包括点击行为、注册行为或者转化行为中至少一项；

通过所述第三特征网络、所述第四特征网络以及所述相似度模型，基于所述用户信息与所述内容项信息，预测所述用户与所述内容项的投放群体之间的相似度；

基于所述用户对所述内容项的行为信息与所述用户与所述内容项的投放群体之间的相似度，确定是否对所述用户投放所述内容项；

其中，所述停止训练条件为：所述初始点击率模型、所述初始注册率模型、所述初始转化率模型以及所述初始相似度模型的损失函数值之和小于或等于第一目标阈值，且各个样本用户信息分别输入所述第一初始特征网络与所述第三初始特征网络之后，得到的各个第一样本用户特征与各个第二样本用户特征之间的平均差异值大于或等于第二目标阈值。

2.根据权利要求1所述的内容项投放方法，其特征在于，所述将所述第一融合特征输入不同的预估模型，通过不同的预估模型分别对所述第一融合特征进行加权处理，得到所述用户对所述内容项的行为信息包括：

3.根据权利要求1所述的内容项投放方法，其特征在于，所述基于所述用户信息与所述内容项信息，预测所述用户与所述内容项的投放群体之间的相似度包括：

获取所述用户信息与所述内容项信息之间的第二融合特征；

将所述第二融合特征输入所述相似度模型，通过所述相似度模型对所述第二融合特征进行加权处理，输出所述用户与所述内容项的投放群体之间的相似度。

4.根据权利要求3所述的内容项投放方法，其特征在于，所述获取所述用户信息与所述内容项信息之间的第二融合特征包括：

将所述用户信息输入所述第三特征网络，通过所述第三特征网络对所述用户信息进行特征提取，得到所述用户的第二用户特征；

将所述内容项信息输入所述第四特征网络，通过所述第四特征网络对所述内容项信息进行特征提取，得到所述内容项的第二内容项特征；

5.根据权利要求1所述的内容项投放方法，其特征在于，所述基于所述用户对所述内容项的行为信息与所述用户与所述内容项的投放群体之间的相似度，确定是否对所述用户投放所述内容项包括：

6.一种内容项投放装置，其特征在于，

所述装置被配置为执行获取多个样本用户的多个样本用户信息与多个样本内容项的多个样本内容项信息；通过第一初始特征网络对所述多个样本用户信息进行特征提取，得到多个第一样本用户特征，所述第一样本用户特征为用户转化特征；通过第二初始特征网络对所述多个样本内容项信息进行特征提取，得到多个第一样本内容项特征；分别对所述多个第一样本用户特征与所述多个第一样本内容项特征进行特征融合，得到多个第一样本融合特征；基于所述多个第一样本融合特征，对第一初始特征网络、第二初始特征网络、初始点击率模型、初始注册率模型、初始转化率模型进行迭代训练；通过第三初始特征网络对所述多个样本用户信息进行特征提取，得到多个第二样本用户特征，所述第二样本用户特征为用户风险特征；通过第四初始特征网络对所述多个样本内容项信息进行特征提取，得到多个第二样本内容项特征；分别对所述多个第二样本用户特征与所述多个第二样本内容项特征进行特征融合，得到多个第二样本融合特征；通过初始相似度模型对所述多个第二样本融合特征进行加权处理，输出所述多个样本用户与所述多个样本内容项的投放群体之间的相似度；基于所述多个样本用户与所述多个样本内容项的投放群体之间的相似度，对第三初始特征网络、第四初始特征网络、初始相似度模型进行迭代训练；当满足停止训练条件时，得到第一特征网络、第二特征网络、第三特征网络、第四特征网络、点击率预估模型、注册率预估模型、转化率预估模型以及相似度模型，所述第二初始特征网络与所述第四初始特征网络在迭代训练的过程中共享参数；

所述装置包括：第一预测单元，被配置为执行将用户的用户信息输入所述第一特征网络，通过所述第一特征网络对所述用户信息进行特征提取，得到所述用户的第一用户特征；将内容项的内容项信息输入所述第二特征网络，通过所述第二特征网络对所述内容项信息进行特征提取，得到所述内容项的第一内容项特征；对所述第一用户特征进行维度变换，得到维度变换后的所述第一用户特征，维度变换后的所述第一用户特征与所述第一内容项特征的维度相同，将所述第一内容项特征中各个元素分别与维度变换后的所述第一用户特征中各个对应位置的元素相加，得到第一融合特征；将所述第一融合特征输入不同的预估模型，通过不同的预估模型分别对所述第一融合特征进行加权处理，得到所述用户对所述内容项的行为信息，所述行为信息包括点击行为、注册行为或者转化行为中至少一项；

第二预测单元，被配置为执行通过所述第三特征网络、所述第四特征网络以及所述相似度模型，基于所述用户信息与所述内容项信息，预测所述用户与所述内容项的投放群体之间的相似度；

确定单元，被配置为执行基于所述用户对所述内容项的行为信息与所述用户与所述内容项的投放群体之间的相似度，确定是否对所述用户投放所述内容项；

7.根据权利要求6所述的内容项投放装置，其特征在于，所述第一预测单元被配置为执行：

8.根据权利要求7所述的内容项投放装置，其特征在于，所述第二预测单元包括：

9.根据权利要求8所述的内容项投放装置，其特征在于，所述第二获取子单元被配置为执行包括：

10.根据权利要求6所述的内容项投放装置，其特征在于，所述确定单元被配置为执行：

11.一种计算机设备，其特征在于，包括：

一个或多个处理器；

其中，所述一个或多个处理器被配置为执行所述指令，以实现如权利要求1至权利要求5中任一项所述的内容项投放方法。

12.一种存储介质，其特征在于，当所述存储介质中的至少一条指令由计算机设备的一个或多个处理器执行时，使得计算机设备能够执行如权利要求1至权利要求5中任一项所述的内容项投放方法。

13.一种计算机程序产品，其特征在于，包括一条或多条指令，所述一条或多条指令由计算机设备的一个或多个处理器执行，使得所述计算机设备能够执行如权利要求1至权利要求5中任一项所述的内容项投放方法。