CN117216387A

CN117216387A - 推送处理方法、相关装置和介质

Info

Publication number: CN117216387A
Application number: CN202311149480.3A
Authority: CN
Inventors: 赵光耀
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2023-09-06
Filing date: 2023-09-06
Publication date: 2023-12-12

Abstract

本公开提供了一种推送处理方法、相关装置和介质。该推送处理方法包括：将获取的目标对象特征和目标内容特征输入第一模型得到推送决策结果，第一模型通过以下过程训练而成：将样本集中的样本输入第一模型得到第一输出，样本包括样本对象特征、和与样本对象特征对应的样本内容特征，样本分配有样本标签；获取样本内容特征、和第一模型训练时的第一兴趣基准特征之间的第一相似度表征；将第一相似度表征输入与第一模型并联的第二模型得到第二输出，第一模型和第二模型组成总体模型；基于第一输出和第二输出的第一总输出、以及样本标签，训练总体模型。本公开实施例提高了内容推送处理中推送内容的多样性。本公开实施例应用于大数据、数据处理等。

Description

推送处理方法、相关装置和介质

技术领域

本公开涉及大数据领域，特别是涉及一种推送处理方法、相关装置和介质。

背景技术

目前，互联网应用为对象推荐内容(视频、文章等)时，往往根据对象兴趣与内容的匹配度、以及内容是否热门等进行推荐。结果是，只给对象推荐最感兴趣的内容。分发内容的多样性不足，造成新内容和新作者难以有效触达对象，形成信息茧房，不利于多样性信息的传递。

现有技术中对信息多样性进行调控的方法，主要是在召回/粗排/精排后的重排阶段，基于策略或模型对精排后的结果进行打散。而重排阶段的推荐列表已经缺乏足够的多样性，调整空间较为有限。另外，对经过层层筛选的最终排序推荐列表进行直接干预，往往对分发效率具有较大的负向影响。因此，这些方法并不能大幅改善推送信息的多样性。

发明内容

本公开实施例提供了一种推送处理方法、相关装置和介质，它能够提高内容推送处理中推送内容的多样性。

根据本公开的一方面，提供了一种推送处理方法，包括：

获取目标对象特征和目标内容特征；

将所述目标对象特征和所述目标内容特征输入第一模型，得到推送决策结果，所述第一模型通过以下过程训练而成：

将样本集中的样本输入所述第一模型，得到第一输出，其中，所述样本包括样本对象特征、和与所述样本对象特征对应的样本内容特征，所述样本分配有样本标签；

获取所述样本内容特征、和所述第一模型训练时的第一兴趣基准特征之间的第一相似度表征；

将所述第一相似度表征输入与所述第一模型并联的第二模型，得到第二输出，其中，所述第一模型和所述第二模型组成总体模型；

基于所述第一输出和所述第二输出的第一总输出、以及所述样本标签，训练所述总体模型。

根据本公开的一方面，提供了一种推送处理装置，包括：

第一获取单元，用于获取目标对象特征和目标内容特征；

第一输入单元，用于将所述目标对象特征和所述目标内容特征输入第一模型，得到推送决策结果，所述第一模型通过以下过程训练而成：

可选地，所述第一兴趣基准特征包括目标对象兴趣基准特征和总体对象兴趣基准特征；所述第一相似度表征包括第一相似度子表征和第二相似度子表征；

所述第一输入单元具体用于：

获取所述样本内容特征和所述目标对象兴趣基准特征的所述第一相似度子表征；

获取所述样本内容特征和所述总体对象兴趣基准特征的所述第二相似度子表征。

可选地，所述第一输入单元具体用于：

将所述目标对象浏览时长超过第一时长的内容级联成内容序列；

将所述内容序列向量化为内容序列向量；

对所述内容序列向量进行池化，得到所述目标对象兴趣基准特征。

可选地，所述目标对象兴趣基准特征为多个维度的所述目标对象兴趣基准特征，所述第一相似度子表征为多个所述维度的所述第一相似度子表征；

所述第一输入单元具体用于：针对多个所述维度中的每个所述维度，将所述维度上所述目标对象浏览时长超过第一时长的内容级联成内容序列。

可选地，所述第一输入单元具体用于：

获取所述目标对象在当前时间之前预定时间段内浏览内容的第一平均时长；

获取推送处理平台的多个平台对象在当前时间之前预定时间段内浏览内容的第二平均时长；

基于所述第一平均时长和所述第二平均时长，确定所述第一时长。

可选地，所述第一输入单元具体用于：

获取所述推送处理平台在当前时间之前的第二时长内的多个待推送内容；

将所述待推送内容向量化为待推送内容向量；

将多个所述待推送内容的所述待推送内容向量累加，得到所述总体对象兴趣基准特征。

可选地，所述总体对象兴趣基准特征是分时间批次的，所述第一输入单元具体用于：

获取所述推送处理平台在所述当前时间批次的多个待推送内容；

将所述待推送内容向量化为待推送内容向量；

基于在所述当前时间批次多个所述待推送内容的所述待推送内容向量的累加和、以及上一个时间批次的所述总体对象兴趣基准特征，确定所述当前时间批次的所述总体对象兴趣基准特征。

可选地，所述第一输入单元具体用于：

获取所述累加和的第一权重，其中，所述第一权重属于区间(0，1)；

将1与所述第一权重的差，确定为所述上一个时间批次的所述总体对象兴趣基准特征的第二权重；

基于所述第一权重和所述第二权重，确定所述累加和与所述上一个时间批次的所述总体对象兴趣基准特征的加权和，作为所述当前时间批次的所述总体对象兴趣基准特征。

可选地，所述第一输入单元具体用于：

获取所述目标内容的推送统计量特征；

将所述第一相似度表征、与所述推送统计量特征输入与所述第一模型并联的第二模型，得到所述第二输出。

可选地，所述推送统计量特征包括曝光量和点击量；

所述第一输入单元具体用于：

获取所述目标内容推送给所述推送处理平台的多个平台对象的次数，作为所述曝光量；

获取在推送所述目标内容后多个所述平台对象对所述目标内容点击的次数，作为所述点击量。

可选地，所述第一输入单元具体用于：

将所述第一输出和所述第二输出加和，得到所述第一总输出；

基于所述第一总输出，确定为所述样本对象推送所述样本内容的第一概率；

基于所述第一概率和所述样本标签，计算损失函数；

基于所述损失函数，训练所述总体模型。

可选地，在将样本集中的样本输入所述第一模型，得到第一输出之前，所述第一模型的训练过程还包括：

第二获取单元，具体用于获取样本集；

所述第一输入单元具体用于：

基于所述样本集中的每个样本的所述损失函数，确定总损失函数；

基于所述总损失函数，训练所述总体模型。

可选地，所述第一输入单元具体用于：

获取每个所述样本的置信度；

基于所述置信度，对每个样本的所述损失函数进行加权和，得到所述总损失函数。

可选地，所述第一输入单元具体用于：

将所述目标对象特征和所述目标内容特征输入第一模型，得到为所述目标对象推送所述目标内容的第二概率；

基于为所述目标对象推送多个所述目标内容的多个所述第二概率，确定所述推送决策结果。

可选地，所述第一输入单元具体用于：

将所述目标对象特征和所述目标内容特征输入第一模型，得到第三输出；

获取所述目标内容特征、和使用所述第一模型时的第二兴趣基准特征之间的第二相似度表征；

将所述第二相似度表征输入与所述第一模型并联的所述第二模型，得到第四输出；

用第三权重加权所述第四输出，得到加权后第四输出，所述第三权重属于区间【0,1】；

基于所述第三输出和所述加权后第四输出的第二总输出，确定所述第二概率。

可选地，所述第一输入单元具体用于：

获取目标对象的目标多样性偏好程度；

获取推送处理平台的多个平台对象的平均多样性偏好程度；

基于所述目标多样性偏好程度和所述平均多样性偏好程度，确定所述第三权重。

根据本公开的一方面，提供了一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如上所述的推送处理方法。

根据本公开的一方面，提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的推送处理方法。

根据本公开的一方面，提供了一种计算机程序产品，该计算机程序产品包括计算机程序，所述计算机程序被计算机设备的处理器读取并执行，使得该计算机设备执行如上所述的推送处理方法。

本公开实施例在用于内容推送的第一模型的基础上并联一个第二模型。在模型训练时，把样本内容特征、和代表目标对象或平台对象兴趣的第一兴趣基准特征之间的第一相似度表征输入该第二模型。样本内容与目标对象兴趣或平台对象兴趣越相似，越可能出现由于内容命中了头部兴趣而得到大幅推荐的局面，即容易造成推荐单一性。本公开实施例用第二模型建模头部兴趣对多样性的影响。在模型训练时，按照第一模型的第一输出与第二模型的第二输出的总输出与样本标签来训练，而第二模型建模的是头部兴趣的影响，这样第一模型就成为了去除了头部兴趣影响的多样性模型，而模型使用的时候可以只使用第一模型，从而减少头部兴趣对内容推送多样性的影响，提高了内容推送处理中推送内容的多样性。

本公开的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本公开而了解。本公开的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本公开技术方案的进一步理解，并且构成说明书的一部分，与本公开的实施例一起用于解释本公开的技术方案，并不构成对本公开技术方案的限制。

图1是本公开实施例的推送处理方法的体系架构图；

图2A-图2C是本公开的实施例应用于视频内容推送消息的场景下的界面示意图；

图3是根据本公开的一个实施例的推送处理方法的流程图；

图4是图3中步骤310中获取待推送内容集的一个流程图；

图5是基于第一标签和第二标签的匹配度，筛选出待推送内容集的示意图；

图6是图4中步骤430中筛选待推送内容集的一个流程图；

图7是基于多个推送指标筛选出待推送内容的示意图；

图8是图3中步骤320中确定推送决策结果的一个流程图；

图9是图8中步骤820中基于第二概率确定推送决策结果的示意图；

图10是基于与第一模型并联的第二模型来训练第一模型的流程图；

图11A是图10中步骤1010的一个模型输入输出示意图；

图11B是图10中步骤1010在结合场景特征输入的一个模型输入输出示意图；

图12是图10中步骤1020中计算第一相似度表征的一个流程图；

图13是图12中步骤1210中确定目标对象兴趣基准特征的一个流程图；

图14A是图13中步骤1310中在时间维度下级联成内容序列的示意图；

图14B是图13中步骤1310中在条数维度下级联成内容序列的示意图；

图15是图13中步骤1320中将内容序列向量化为内容序列向量的示意图；

图16是图13中步骤1330中对内容序列向量池化得到目标对象兴趣基准特征的示意图；

图17是图12中步骤1220中确定总体对象兴趣基准特征的一个流程图；

图18是图17中步骤1710中获取在当前时间之前的第二时长内的多个待推送内容的示意图；

图19是图17中步骤1730中得到总体对象兴趣基准特征的示意图；

图20是基于时间批次获取的总体对象兴趣基准特征的一个流程图；

图21是获取当前时间批次的总体对象兴趣基准特征的示意图；

图22是将第一相似度表征与推送统计量特征输入第二模型得到第二输出的一个流程图；

图23是图22中步骤2210中获取目标内容的推送统计量特征的流程图；

图24是将第一相似度表征与推送统计量特征输入第二模型得到第二输出的示意图；

图25是图10中步骤1040中训练总体模型的一个流程图；

图26是基于为样本对象推送样本内容的第一概率和样本标签计算损失函数的示意图；

图27是图10中步骤1010中获取样本集的一个流程图；

图28是图25中步骤2540基于样本集中的每个样本的损失函数得到总损失函数的一个流程图；

图29是图25中步骤2540基于样本集中的每个样本的损失函数得到总损失函数的示意图；

图30是结合第一模型和第二模型得到为目标对象推送目标内容的第二概率的示意图；

图31是根据本公开的实施例的推送处理装置的模块图；

图32是执行根据本公开的实施例图3所示的推送处理方法的终端结构图；

图33是执行根据本公开的实施例图3所示的推送处理方法的服务器结构图。

具体实施方式

为了使本公开的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本公开进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本公开，并不用于限定本公开。

对本公开实施例进行进一步详细说明之前，对本公开实施例中涉及的名词和术语进行说明，本公开实施例中涉及的名词和术语适用于如下的解释：

人工智能：是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得目标结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

深度神经网络：是一种多层无监督神经网络。深度神经网络将上一层的输出特征作为下一层的输入进行特征学习，通过逐层特征映射后，将现有空间样本的特征映射到另一个特征空间，以此来学习对现有输入具有更好的特征表达。深度神经网络具有多个非线性映射的特征变换，可以对高度复杂的函数进行拟合。

推送：指系统或平台主动将信息、内容或服务发送给用户，无需用户明确的请求或搜索的方法。推送处理方法通常是基于用户的兴趣、偏好、历史行为等个人信息进行定向投放，以提供个性化的内容推送。

反向梯度下降算法：一种损失函数最小化方法，通过比较神经网络的输出结果和实际的标签，计算出网络的误差函数。然后，反向梯度更新过程将从输出层开始，逐层向前进行，通过计算误差函数在当前位置的梯度，并朝着梯度下降的方向更新神经网络的参数，以找到最优解使得损失函数的值最小。

sigmoid函数：一种非线性激活函数，也称为逻辑函数或S形函数。sigmoid函数将输入值映射到一个介于0和1之间的输出值，即输出值的范围在0到1之间。当输入值趋近于负无穷大时，输出值接近于0；当输入值趋近于正无穷大时，输出值接近于1。

归一化指数(softmax函数)：将一个含任意实数的K维向量压缩到另一个K维向量中，使得每个元素的范围都在(0,1)之间，并且所有元素的和为1。

本公开实施例应用的系统体系构架及场景说明

图1是根据本公开的实施例的推送处理方法所应用的系统构架图。它包括：对象终端110、互联网120、网关130、与服务器140。

对象终端110是对象用来查看被推送的内容对应的提醒消息的设备。它包括桌面电脑、膝上型电脑、PDA(个人数字助理)、手机、车载终端、家庭影院终端、专用终端等多种形式。另外，它可以是单台设备，也可以是多台设备组成的集合。例如，多台设备通过局域网连接，公用一台显示设备进行协同工作，共同构成一个终端。终端也可以以有线或无线的方式与互联网120进行通信，交换数据。

网关130又称网间连接器、协议转换器。网关130在传输层上实现网络互连，是一种充当转换作用的计算机系统或设备。在使用不同的通信协议、数据格式或语言，甚至体系结构完全不同的两种系统之间，网关130是一个翻译器。同时，网关130也可以提供过滤和安全功能。对象终端110向服务器140发送的消息要通过网关130发送到相应的服务器140。服务器140向对象终端110发送的消息也要通过网关130发送到相应的对象终端110。

服务器140是指能向对象终端110提供内容消息推送服务的计算机系统。相对于对象终端110来说，服务器140在稳定性、安全性、性能等方面都要求更高。服务器140可以是网络平台中的一台高性能计算机、多台高性能计算机的集群、一台高性能计算机中划出的一部分(例如虚拟机)、多台高性能计算机中划出的一部分(例如虚拟机)的组合等。服务器140也可以通过有线或无线的方式与互联网120进行通信，交换数据。

本公开实施例可以应用在多种场景下，例如图2A-C所示的在即时短消息应用中查看视频内容推送消息的场景等。

如图2A所示的对象终端110中的即时短消息应用的界面所示，即时短消息应用可以用来与多个联系人进行即时通讯，也可以用来观看视频或查看多个联系人的动态信息。在触发下方功能栏中的“短消息”选项后，显示短消息列表。短消息列表中包含与多个联系人的消息栏、与视频推荐的消息推送栏。在上午10:00时，视频推荐的消息推荐栏没有新消息推送，直到上午10:30时，即时短消息应用的短消息界面如图2B所示。

在图2B中，视频推荐的消息推送栏向对象推送一条新消息，新消息显示：“您收到一条未读消息，为您推荐您可能感兴趣的视频A”。对象可以通过点击消息推送栏的新消息或触发下方功能栏中的“视频”选项，观看推荐的视频A。当对象触发“视频”选项，即时短消息应用的界面如图2C所示。

在图2C中，即时短消息应用打开了视频界面，并播放推荐的视频A。视频界面中展示了用户A上传的视频A，并配文了“今天是个高兴的日子”。视频界面中还展示了视频A在当前时间之前获得的点赞数、评论数、推荐数、与转发数收藏数。对象也可以在界面中对视频A进行点赞、评论、推荐、转发、与开启弹幕等操作。向对象推送的视频内容与推送时间由服务器140决定。如果向对象推送的内容时，只根据对象兴趣与内容的匹配度、以及内容是否热门等进行推荐。结果是，只给对象推荐最感兴趣的内容。分发内容的多样性不足，造成新内容和新作者难以有效触达对象，形成信息茧房，不利于多样性信息的传递。因此，本公开实施例在用于内容推送的第一模型的基础上并联一个第二模型，用第二模型建模头部兴趣对多样性的影响。这样第一模型就成为了去除了头部兴趣影响的多样性模型，而模型使用的时候可以只使用第一模型，从而减少头部兴趣对内容推送多样性的影响，提高了内容推送处理中推送内容的多样性。

本公开实施例的总体说明

根据本公开的一个实施例，提供了一种推送处理方法。

推送处理方法是指根据目标对象的目标对象特征和待推送的目标内容特征，确定推送给目标对象的对象终端110的推送决策结果的过程。目标对象是指要查看推送决策结果中对应的目标内容的对象。推送决策结果是指决策出的将推送给目标对象的目标内容。在现代技术和通信的发展下，推送决策结果可以通过各种方式进行，比如手机应用的通知、电子邮件、短信、即时通讯工具等。本公开实施例可应用于不同类型的内容的推送，推送决策结果中对应的目标内容可以是图片、视频、文章、应用等多种类型。推送决策结果可以在预设时段推送给目标对象。预设时段是指向目标对象推送目标内容对应的提醒消息的时间段。预设时段可以是得到推动决策结果的当前时刻，也可以为根据目标对象的使用习惯预先设定的时间段。例如，目标对象习惯在下午6:00-8:00查看一些推送内容，则预设时段为下午6:00-8:00。目标内容为内容A，那么在下午6:00-8:00之间的某个时刻向目标对象发送内容A的提醒消息。

本公开实施例的推送处理方法可以在对象终端110执行，也可以在服务器140执行。在服务器140执行的情况下，在确定目标对象的推送决策结果后，服务器140在目标时段通过网络与互联网120将目标内容对应的提醒消息推送到对象终端110。

目前，在一种方法中，互联网应用为对象推荐内容(视频、文章等)时，往往根据对象兴趣与内容的匹配度、以及内容是否热门等进行推荐。结果是，只给对象推荐最感兴趣的内容。分发内容的多样性不足，造成新内容和新作者难以有效触达对象，形成信息茧房，不利于多样性信息的传递。例如，一个月前，为了备战期末考试，目标对象喜欢观看学习类的内容。而一个月后，目标对象已经结束考试，对象兴趣发生了变化，喜欢看一些当下热门的内容。那么这时候还按照目标对象一个月前的兴趣与内容进行匹配推送，目标对象并不感兴趣，推送效果较差。本公开实施例在内容推送的第一模型的基础上并联一个第二模型，第二模型建模头部兴趣对多样性的影响。这样第一模型就成为了去除了头部兴趣影响的多样性模型，而模型使用的时候可以只使用第一模型，从而减少头部兴趣对内容推送多样性的影响，提高了内容推送处理中推送内容的多样性。

如图3所示，根据本公开的一个实施例，推送处理方法包括：

步骤310、获取目标对象特征和目标内容特征；

步骤320、将目标对象特征和目标内容特征输入第一模型，得到推送决策结果。

下面对上述步骤310-步骤320进行详细描述。

步骤310的详细描述

在步骤310中，获取目标对象特征和目标内容特征。

目标对象特征是指与目标对象相关的特征。目标对象特征可以是目标对象本身的特征，例如，目标对象的对象标识符(UserId)、目标对象的行业、教育程度等特征。针对同一种特征，如果特征值不同，目标对象对于内容的偏好可能不同。例如，不同行业的目标对象喜好的内容可能不同。以视频内容为例，新闻行业的对象可能更加关注热点事件的相关视频，餐饮行业的对象可能喜欢养生健康类的相关视频。

注意，在获取目标对象特征时，要事先征求目标对象的同意。而且，对这些对象特征的收集、使用和处理等，都会遵守相关法律法规和标准。在征求目标对象的同意时，可以通过弹窗或者跳转到确认页面等方式获得目标对象的单独许可或者单独同意。

目标对象特征还可以是目标对象所在的对象组(如家庭、工作群)的对象特征。这是因为，在某些情况下，对象对于内容的偏好受其所在的对象组的影响很大。例如，对象本身喜欢看与音乐相关的视频内容，但由于对象的家庭组中的其他成员喜欢看游戏相关的视频内容，对象可能也会对游戏类的视频内容感兴趣。考虑目标对象所在的对象组的对象特征，可以提高内容推送的准确度。与上述类似，在获取目标对象所在的对象组(如家庭、工作群)的对象特征时，也要事先征求对象组成员的同意，故不赘述。

对象标识符是指用于唯一标识一个目标对象的标识符。在推送处理装置中，为了区分和识别不同的对象，会为每个对象分配一个独特的标识符，即对象标识符。对象标识符通常是一个由系统生成的字符串，具有唯一性。

目标内容特征是指用于推送给目标对象的待推送内容的特征。目标内容特征可以包括待推送内容的内容标识符、待推送内容的内容主题、待推送内容的内容语言等特征。内容标识符是指用于标识和区分一个待推送内容的标识符。在推送处理装置中，为了区分和预估不同的待推送内容，会为每个待推送内容分配一个独特的标识符。待推送内容的内容主题是指待推送内容所属的类别，例如新闻、娱乐、教育、体育。待推送内容的内容语言是指待推送内容的语言或语种，用于区分不同语言对象的推送需求。

待推送内容是目标对象可能感兴趣的内容。获取目标内容特征包括：获取待推送内容集，从待推送内容集中选择待推送内容，将待推送内容的特征作为目标内容特征。

在一个实施例中，如图4所示，获取待推送内容集，从待推送内容集中选择待推送内容，将待推送内容的特征作为目标内容特征，包括：

步骤410、获取目标对象的第一标签；

步骤420、获取原始内容集中原始内容的第二标签；

步骤430、基于第一标签和第二标签的匹配度，从原始内容集中筛选出待推送内容集；

步骤440、获取待推送内容集中每个待推送内容的目标内容特征。

在步骤410中，第一标签是指目标对象可能感兴趣的内容标签。

在一个实施例中，获取目标对象的第一标签，可以通过获取目标对象事先自主选择的第一标签的方式。

注意，在获取目标对象的第一标签时，要事先征求目标对象的同意。而且，对第一标签的收集、使用和处理等，都会遵守相关法律法规和标准。在征求目标对象的同意时，可以通过弹窗或者跳转到确认页面等方式获得目标对象的单独许可或者单独同意。

当目标对象在使用推送待推送内容的软件时，需要在软件系统提供的众多标签中选择自己感兴趣标签作为第一标签。例如，软件系统提供的众多标签包括：“学习”、“宠物”、“游戏”、“运动”、“电影”、“篮球”、“音乐”、“健康”等，目标对象根据自己的喜好从中选择了“宠物”、“游戏”、“电影”、“音乐”，作为自己的第一标签。当获取目标对象的第一标签时，可以直接获取目标对象自主选择的第一标签。

直接获取目标对象自主选择的第一标签的优点是，获取第一标签的效率较高，且第一标签一定是目标对象感兴趣的内容类型，提高了获取第一标签的准确性。

在另一个实施例中，目标对象的第一标签可以通过目标对象在当前时间点之前的预定时间段内的历史观看日志进行获取。历史观看日志是指目标对象在当前时间段之前的预定时间段内查看的推送内容的相关记录。

预定时间段可以是一小时、一天、一周、一个月等。预定时间段可以根据目标对象查看推送内容的频率来确定。如果目标对象查看推送内容的频率较高，那么通过较短的时间段的观看记录就可以获取目标对象最近一段时间内感兴趣的类型；如果目标对象查看推送内容的频率较低，那么需要使用较长的时间段内的观看记录以保证有足够的数据用来获取目标对象的第一标签。预定时间段还可以根据推送内容的类型来确定。例如，如果推送内容是视频内容，可以使用较长时间段作为预定时间段，以获取目标对象的长期偏好；如果推送内容是新闻内容，由于新闻具有时效性，所以需要使用较短时间段作为预定时间段。

注意，获取目标对象的历史观看日志，也要实现征求目标对象的同意。

历史观看日志中记录的内容可以包括：观看时间、观看内容、内容类型、是否观看完整、是否存在其他操作(例如对内容点赞、评论、收藏等)等。例如，表1为目标对象在当前时间点之前的一天之内的历史观看日志的一个例子。

观看时间	观看内容	内容类型	是否观看完整	是否存在其他操作
					20230602 08:10:00	内容A	电影	是	否
20230602 08:11:38	内容B	音乐	是	否
					20230602 08:15:30	内容C	读书	否	否
……	……	……	……	……
					20230603 08:03:18	内容D	宠物	是	是

表1

如表1所示，目标对象在2023年6月2日观看了内容A，内容A的内容类型为“电影”，目标对象完整观看了内容A，但是没有对内容A执行其他操作。“是否观看完整”与“是否存在其他操作”是一条观看记录中针对观看内容的任务。任务还可以是“是否点赞”、“是否评论”等。

根据表1的历史观看日志，可以获取目标对象的第一标签。

在一个实施例中，通过历史观看日志获取目标对象的第一标签，包括：通过对历史观看日志中各个内容类型的观看日志的任务完成次数统计，确定目标对象对推送内容的偏好；将偏好内容类型作为目标对象的第一标签。

由于历史观看日志中记录了目标对象对观看内容是否观看完整、是否存在其他操作。因此，通过历史观看日志可以初步判断目标对象对一个观看内容的态度。例如表1所示的历史观看日志中，目标对象完整观看了内容D，并对内容D执行了点赞或评论等操作，可以推断出目标对象对内容D很感兴趣。但是目标对象对内容C既没有完整观看，也没有执行任何操作，可以推断出目标对象对内容C不感兴趣。通过对同一内容类型的观看内容的任务完成次数统计，可以确定目标对象对一个内容类型的感兴趣程度。

例如，表2所示的是对表1中的历史观看日志中各个内容类型的观看内容的任务完成次数统计。

内容类型	观看完整次数	其他操作次数
			电影	12	8
音乐	10	6
			读书	4	1
宠物	15	10
			……	……	……

表2

如表2所示，目标对象对内容类型为“电影”的内容的观看完整次数为12，其他操作次数为8。

注意，在获取历史观看日志中各个内容类型的观看内容时，要征得目标对象的同意。

在一个实施例中，通过对历史观看日志中各个内容类型的任务完成次数统计，确定目标对象的第一标签，包括：计算每一种内容类型对应的任务完成次数的平均值，基于全部内容类型的操作属性的平均值，确定目标对象的第一标签。例如，根据表2中各个内容类型的任务完成次数统计可得，电影类型的内容，任务完成次数的平均值为(12+8)/3＝10；音乐类型的内容，任务完成次数的平均值为(10+6)/2＝8。在确定每一种内容类型的任务完成次数的平均值之后，按照平均值由高到低的顺序对内容类型进行排名，并选择排名中前预定数目个内容类型作为目标对象的第一标签。例如，在计算表2中各个内容类型的任务完成次数的平均值后，依据平均值对内容类型进行排名，选择排名中前3名的内容类型作为目标对象的第一标签，目标对象的第一标签为“宠物”、“电影”、“音乐”。使用平均值确定目标对象的第一标签的优点是，公平地体现每个任务对于目标对象偏好的影响，提高了确定第一标签的公平性。

在另一个实施例中，通过对历史观看日志中各个内容类型的任务完成次数统计，确定目标对象的第一标签，包括：为每个任务完成次数设置权重；基于所有内容类型的任务完成加权平均值排名，确定目标对象的第一标签。为不同任务完成次数设置权重的原因是，不同的任务可能对目标对象的感兴趣程度的影响不同。例如，目标对象对执行了其他操作(如点赞、评论等)的内容的感兴趣程度可能高于只是完整观看了内容的感兴趣程度。因此，可以通过设置权重来表示不同任务对于目标对象感兴趣程度的影响。例如，“观看完整次数”的权重为0.3，“其他操作次数”的权重为0.7。基于权重计算不同内容类型的任务完成次数的加权平均值。例如，表2中，电影类型的内容的任务完成次数的加权平均值为12*0.3+8*0.7＝9.2；音乐类型的内容的任务完成次数的加权平均值为10*0.3+6*0.7＝7.2。在确定每一种内容类型的任务完成次数的加权平均值后，按照加权平均值由高到低的顺序对内容类型进行排名，并选择排名中前预定数目个内容类型作为目标对象的第一标签。例如，选择表2中排名前3名的内容类型作为目标对象的第一标签，所以，最终可得目标对象的第一标签为“宠物”、“电影”、与“音乐”。使用加权平均数结果确定目标对象的第一标签的优点是：可以根据实际应用情况，为不同的任务完成次数设置不同的权重，提高了确定第一标签的灵活性。

通过历史观看日志获取目标对象的第一标签可以确定目标对象在最近一段时间内的内容偏好，有利于提高获取第一标签的准确性。

在步骤420中，原始内容集中包括了各种内容类型的原始内容，以满足向具有不同偏好的目标对象的推送要求。第二标签指示了原始内容的类型。

在一个实施例中，获取原始内容集中原始内容的第二标签，包括：获取原始内容的发布对象为原始内容设置的第二标签。

当发布对象发布一个原始内容时，可以为原始内容设置第二标签。例如，发布对象发布一个原始内容时，为原始内容设置的标签为：“音乐”、“吉他”。

注意，在获取原始内容的第二标签时，要征得原始内容的发布对象的同意。

在获取原始内容的第二标签时，可以直接获取由发布对象设置的标签。本实施例的优点是，提高了获取第二标签的效率。

在另一个实施例中，获取原始内容集中原始内容的第二标签，包括：将原始内容输入标签预测模型；标签预测模型输出原始内容的第二标签。例如，将一个原始内容输入标签预测模型，得到原始内容的第二标签为：“电影”、“搞笑”。

通过标签预测模型输出第二标签的优点在于，提高了获取第二标签的准确性。

注意，在获取原始内容并将原始内容输入标签预测模型时，要征得原始内容的发布对象的同意。

在步骤430中，第一标签和第二标签的匹配度代表了原始内容与目标对象偏好的匹配度，将匹配度符合预定条件的原始内容加入待推送内容集。这时的待推送内容集中包括了多个待推送内容。

在一个实施例中，第一标签和第二标签的匹配程度为第二标签与第一标签的重叠标签在全部第二标签中的占比。例如，如图5所示，目标对象的第一标签包括：“宠物”、“游戏”、“电影”、与“音乐”。原始内容集中原始内容A的第二标签为：“电影”、与“搞笑”，其中，有一个标签属于目标对象的第一标签。因此，原始内容A的第二标签与第一标签的匹配度为50％。同理，原始内容B的第二标签全部属于目标对象的第一标签，因此，原始内容B的第二标签与第一标签的匹配度为100％。原始内容C的3个第二标签中，“宠物”与“电影”属于目标对象的第一标签，因此，原始内容C的第二标签与第一标签的匹配度为66.7％。原始内容D的3个第二标签中，“游戏”属于目标对象的第一标签，因此，原始内容D的第二标签与第一标签的匹配度为33.3％。原始内容E没有与第一标签匹配的第二标签，因此，匹配度为0。通过重叠标签在全部第二标签中的占比确定匹配程度的优点在于，可以通过重叠的标签快速确定原始内容与目标对象偏好的匹配程度，提高了获取待推送内容集的效率。

将匹配度符合预定条件的原始内容加入待推送内容集，并将待推送内容集中每个待推送内容的原始内容特征加入待推送内容特征集，作为待推送内容对应的目标内容特征。

在一个实施例中，预定条件是指将与第一标签的匹配度大于或等于预设的匹配度阈值的原始内容加入待推送内容集。例如，预设的匹配度阈值为50％，基于图5所示的第一标签与第二标签的匹配度，将匹配度大于或等于50％的原始内容加入待推送内容集，因此，待推送内容集中包括原始内容A(匹配度50％)、原始内容B(匹配度100％)、与原始内容C(匹配度66.7％)。这时的待推送内容特征集包括原始内容A特征(匹配度50％)、原始内容B特征(匹配度100％)、与原始内容C特征(匹配度66.7％)。

根据本实施例中，基于匹配度阈值确定待推送内容集的优点在于，确保待推送内容集中的待推送内容都是与目标对象匹配度较高的内容，提高了从待推送内容中确定推送内容的准确度。

在另一个实施例中，预设条件可以是：为原始内容的匹配度排名；设置固定数量，根据匹配度排名由高到低的顺序，将前固定数量个原始内容加入待推送内容集。例如，设置固定数量为10，则从原始内容集中选择与第一标签匹配度前10名的原始内容加入待推送内容集。当目标对象的第一标签与原始内容的第二标签的匹配度都较低时，如果按照匹配度阈值筛选待推送内容，可能会导致待推送内容集中的内容数量不能满足向目标对象推送的要求。因此，通过本实施例，可以确保待推送内容集中的待推送内容的数量满足向目标对象推送的要求。通过目标对象对待推送内容集中的内容的反应的分析，可以获取更加精确的第一标签，以便在以后的筛选中提高目标对象与原始内容的匹配度，从而获取匹配度更高的内容。因此，本实施例中，基于匹配度排名确定待推送内容集的优点在于，为获取目标对象更加准确的第一标签提供了数据支持，进而一步步提高确定待推送内容集中待推送内容的准确度。

在一实施例中，如图6所示，基于第一标签和第二标签的匹配度，从原始内容集中筛选出待推送内容集，包括：

步骤610、基于匹配度，从原始内容集中筛选出第一标签和第二标签匹配的匹配内容；

步骤620、获取每个匹配内容的多个推送指标；

步骤630、基于多个推送指标，从匹配内容中筛选出待推送内容，组成待推送内容集。

在步骤610中，基于第一标签与第二标签的匹配度从原始内容集中筛选匹配内容的过程与前述实施例中步骤430中筛选待推送内容集的过程相同，此处不再赘述。

在步骤620中，匹配内容的推送指标是指用于评估内容的推送效果的指标。推送效果是指目标对象对推送内容对应的提醒消息的反馈。例如，目标对象是否通过提醒消息观看推送内容、目标对象是否完成观看推送内容、目标对象是否对推送内容点赞或评论等。推送指标是将内容的推送效果统计成具体数值，以便对推送效果进行评估。推送指标可以是推送转化率、完播率、点赞率、或者评论率等。

获取每个匹配内容的多个推送指标时，要征得匹配内容的发布对象的同意。

例如，如图7所示，获取的匹配内容包括：匹配内容A、匹配内容B、与匹配内容C。分别获取每个匹配内容的推送指标，匹配内容A的推送指标包括：推送转化率(0.72)、完播率(0.56)、点赞率(0.68)、与评论率(0.46)等，同理可得匹配内容B与匹配内容C的推送指标。

在步骤630中，根据多个推送指标，从匹配内容中筛选出待推送内容。由于推送指标是内容的推送效果的数值化表示，所以，基于推送指标确定的待推送内容向目标对象推送后获得的推送效果可能更好。例如，在图7中，根据三个匹配内容的推送指标，最终筛选得到的待推送内容集包括匹配内容A与匹配内容B。

在一个实施例中，基于多个推送指标，从匹配内容中筛选出待推送内容，组成待推送内容集，包括：基于多个推送指标数值，确定匹配内容的推送分数；基于全部匹配内容的推送分数，筛选出待推送内容。

在一个实施例中，确定匹配内容的推送分数可以通过计算多个推送指标数值总和的方式。例如，在图7中，匹配内容A的推送分数为0.72+0.56+0.68+0.46＝2.42；匹配内容B的推送分数为0.66+0.72+0.77+0.57＝2.72；匹配内容C的推送分数为0.32+0.45+0.42+0.39＝1.58。使用总和计算推送分数的优点在于，平等地体现了不同推送指标对匹配内容的影响。

在另一个实施例中，确定匹配内容的推送分数可以通过计算多个推送指标数值加权和的方式。在本实施例中，需要为每个推送指标设置权重。基于上述例子，推送转化率的权重为0.7，完播率的权重为0.5，点赞率的权重为0.6，评论率的权重为0.6。匹配内容A的推送分数为0.72*0.7+0.56*0.5+0.68*0.6+0.46*0.6＝1.468；匹配内容B的推送分数为0.66*0.7+0.72*0.5+0.77*0.6+0.57*0.6＝1.626；匹配内容C的推送分数为0.32*0.7+0.45*0.5+0.42*0.6+0.39*0.6＝0.935。使用加权和计算推送分数的优点在于，可以根据实际应用情况灵活地设置不同推送指标的权重，提高了筛选待推送内容的灵活性。

在确定所有匹配内容的推送分数后，根据推送分数按照预定条件筛选待推送内容。用于筛选的预定条件可以是：

设置推送分数阈值，将匹配内容的推送分数大于推送分数阈值的匹配内容作为待推送内容；

或者将匹配内容按照推送分数由高到低进行排序，将前预定数目个匹配内容作为待推送内容。

根据推送分数筛选待推送内容的方式与前述实施例中根据第一标签与第二标签的匹配度筛选待推送内容的方式相似，此处不再赘述。

基于各个匹配内容的推送分数确定待推送内容的优点在于，计算速度快，提高了确定待推送内容集的效率。

在步骤440中，由于每个待推送内容可能包括多种类型的特征，需要对每个待推送内容进行向量化，得到目标内容特征。因此，目标内容特征为机器可学习的形式。

步骤610-步骤630的实施例的优点是，基于推送指标对原始内容进一步筛选，使得筛选出的待推送内容是匹配内容中推送效果较好的，有利于提高推送效果。

步骤410-步骤440的实施例的优点是，根据目标对象的标签对原始内容进行初步筛选，确保待推送内容均是与目标对象匹配程度较高的，节省了计算资源，提高了待推送内容与目标对象之间的匹配程度。

步骤320的详细描述

在步骤320中，将目标对象特征和目标内容特征输入第一模型，得到推送决策结果。

第一模型是指在内容推送时能够去除头部兴趣影响的多样性模型。推送决策结果是指在去除头部兴趣影响后推送给目标对象的目标内容的决策集合。

在一个实施例中，如图8所示，将目标对象特征和目标内容特征输入第一模型，得到推送决策结果，包括：

步骤810、将目标对象特征和目标内容特征输入第一模型，得到为目标对象推送目标内容的第二概率；

步骤820、基于为目标对象推送多个目标内容的多个第二概率，确定推送决策结果。

在步骤810中，第二概率是指向目标对象推送目标内容特征对应的目标内容的概率。第二概率越大表示更有可能向目标对象推送对应的目标内容，也就是说，目标对象更加有可能对第二概率对应的待推送内容感兴趣。例如，目标内容A的第二概率为0.82，目标内容B的第二概率为0.75，因此，更有可能向目标对象推送目标内容A。

在步骤820中，推送决策结果中包括多个将推送给目标对象的目标内容。推送决策结果可以根据预先设定的一个推送数量阈值向目标对象推送目标内容，也可以是根据预先设定的一个推送概率阈值向目标对象推送目标内容。其中，推送数量阈值是指从推送决策结果中筛选出推送给目标对象的目标内容的最大数量。推送数量阈值可以是一个固定的值，也可以是根据历史推送数据和推送决策结果中目标内容的数量进行动态调整的值。推送概率阈值是指推送给目标对象的全部待推送内容对应的第二概率的最小值。

在一个实施例中，推送决策结果可以根据预先设定的一个推送数量阈值向目标对象推送目标内容。推送决策集是指用于存储推送决策结果所包含的目标内容的集合。例如，在图9中，待推送内容集中包括待推送内容A、待推送内容B、待推送内容C、和待推送内容D。将目标对象特征和每个待推送内容的目标内容特征输入第一模型，得到为目标对象推送目标内容的第二概率。其中，待推送内容A的第二概率为0.82，待推送内容B的第二概率为0.85，待推送内容C的第二概率为0.72，待推送内容D的第二概率为0.66。根据待推送内容对应的第二概率进行概率降序排列，并将概率降序排列后的待推送内容加入待推送内容集。然后，根据推送数量阈值对排序后的待推送内容进行筛选。当推送阈值为数值2，表示根据推送决策结果向目标对象一次推送2个目标内容。因此，根据降序排列后的待推送内容筛选概率较高的2个待推送内容作为目标内容，并将目标内容加入到推送决策集。这时的推送决策集中包含待推送内容A和待推送内容B。

在另一个实施例中，推送决策结果也可以是根据预先设定的一个推送概率阈值向目标对象推送目标内容。例如，待推送内容集中包括待推送内容A、待推送内容B、待推送内容C、和待推送内容D。将目标对象特征和每个待推送内容的目标内容特征输入第一模型，得到为目标对象推送目标内容的第二概率。其中，待推送内容A的第二概率为0.82，待推送内容B的第二概率为0.85，待推送内容C的第二概率为0.72，待推送内容D的第二概率为0.66。这时的推送概率阈值为0.7，将每个第二概率和推送概率阈值进行概率比较，得到每个待推送内容的概率比较结果。其中，待推送内容A的第二概率0.82>0.7,待推送内容B的第二概率0.85>0.7，待推送内容C的第二概率0.72>0.7,待推送内容D的第二概率0.66<0.7，因此，这时的推送决策集中的目标内容包含待推送内容A、待推送内容B、与待推送内容C。

步骤810-步骤820的实施例的优点是，基于为目标对象推送多个目标内容的多个第二概率确定推送决策结果，使得推送决策结果可以根据不同的需求灵活地选择不同的确定方式，提高了内容推送处理中推送内容的多样性。

第一模型训练过程的详细描述

在一个实施例中，如图10所示，第一模型通过以下过程训练而成：

步骤1010、将样本集中的样本输入第一模型，得到第一输出，其中，样本包括样本对象特征、和与样本对象特征对应的样本内容特征，样本分配有样本标签；

步骤1020、获取样本内容特征、和第一模型训练时的第一兴趣基准特征之间的第一相似度表征；

步骤1030、将第一相似度表征输入与第一模型并联的第二模型，得到第二输出，其中，第一模型和第二模型组成总体模型；

步骤1040、基于第一输出和第二输出的第一总输出、以及样本标签，训练总体模型。

在步骤1010中，样本集是指存储用于训练和构建模型的样本的集合。样本集中包括多个样本，每个样本包括样本对象特征、和与样本对象特征对应的样本内容特征，且样本分配有样本标签。因此，每个样本的样本标签、样本的样本对象特征、与样本对象特征对应的样本内容特征相互对应。

样本标签是指用于表示样本对象特征对应的样本内容特征是否推送给样本对象的标签。样本标签包括正样本标签和负样本标签。正样本标签是指样本内容特征对应的待推送内容推送给样本对象的标签。负样本标签是指样本内容特征对应的待推送内容不推送给样本对象的标签。

将样本集中的样本输入第一模型，得到第一输出，包括：将样本集中的样本的样本对象特征、和与样本对象特征对应的样本内容特征输入第一模型，得到第一输出。样本对象特征是指与样本对象相关的特征。样本对象特征与上述目标对象特征相似，样本内容特征与上述目标内容特征相似，只是这里都是作为训练的样本存在，在此不再赘述。

注意，在获取样本对象特征时，要事先征求样本对象的同意。而且，对这些对象特征的收集、使用和处理等，都会遵守相关法律法规和标准。在征求样本对象的同意时，可以通过弹窗或者跳转到确认页面等方式获得样本对象的单独许可或者单独同意。

第一模型是指基于深度神经网络(Deep Neural Networks,DNN)构建的模型。第一模型在内容推送时能够有效去除头部兴趣影响。

第一输出是指将样本内容特征对应的待推送内容推送给样本对象的预测推送值。第一输出是第一模型最后一层输出的且未经过激活函数处理的值。第一输出是一个标量，可以是任意实数范围内的值。第一输出越大表示将样本内容特征对应的待推送内容推送给样本对象的预测置信度越高。因此，计算第一输出的过程如公式1所示：

logit_debias＝h(X) (公式1)。

在公式1中，logit_debias是指第一输出，X表示样本对象特征、和与样本对象特征对应的样本内容特征级联后的特征，h(·)表示第一模型的处理过程。

每一个特征为经过向量化后得到的一个对应的向量化结果。将所有特征对应的向量化结果输入级联层进行特征级联，以将所有向量化结果级联为一个向量。

对所有向量化结果进行特征级联是指将向量化结果按照输出的顺序进行首尾串联，组合成一个向量的过程。例如，向量化结果包括：[1,0,1,1,0,1,1,0]、[0,0,1,0,1,0,1,0]、[0,0,0,1,1,0,1,1]、[0,1,1,1,1,0,0,1,0,1]。对向量化结果进行级联，得到的第一特征向量为：[1,0,1,1,0,1,1,0,0,0,1,0,1,0,1,0,0,0,0,1,1,0,1,1,0,1,1,1,1,0,0,1,0,1]。

在一个实施例中，第一模型的输入参数包括样本对象特征、和与样本对象特征对应的样本内容特征。样本待推送内容集用于存储样本对象可能感兴趣的样本待推送内容。样本待推送内容集与上述待推送内容集相似，样本待推送内容与上述待推送内容详细，只是这里都是作为训练的样本存在，在此不再赘述。例如图11A所示，样本待推送内容集中包括样本待推送内容O、样本待推送内容P、样本待推送内容Q、样本待推送内容R、和样本待推送内容S。当对样本待推送内容P进行推送处理时，将样本对象特征、和与样本对象特征对应的样本待推送内容P的样本内容特征进行特征级联，并将特征级联后的向量结果一起输入第一模型，得到与样本待推送内容P对应的第一输出。

在一个实施例中，计算样本对象特征、和与样本对象特征对应的样本内容特征进行特征级联的过程如公式2所示：

X＝[…,x_n,…](公式2)。

在公式2中，X是指特征级联后的向量结果，也是输入到第一模型的输入向量，x_n是指级联时的第n个特征，X的维度为d_X，d_n是指x_n对应的维度值，N是指级联的特征总数。

在另一个实施例中，将样本对象特征、和与样本对象特征对应的样本内容特征输入第一模型，得到第一输出，包括：将样本对象特征、样本对象所处的样本场景特征、和与样本对象特征对应的样本内容特征输入第一模型，得到第一输出。例如图11B所示，样本待推送内容集中包括样本待推送内容O、样本待推送内容P、样本待推送内容Q、样本待推送内容R、和样本待推送内容S。当对样本待推送内容P进行推送处理时，将样本对象特征、样本对象所处的样本场景特征、和与样本对象特征对应的样本待推送内容P的样本内容特征进行特征级联，并将特征级联后的向量结果一起输入第一模型，得到与样本待推送内容P对应的第一输出。

样本场景特征是指样本对象查看推送内容时所处的当前场景的特征。同一样本对象在不同场景下，也可能向量查看不同的推送内容。例如，样本对象在工作场景下，可能更想要查看与工作相关的推送内容；在家时，可能更想要查看与自身喜好相关的推送内容。因此，样本场景特征也会对第一输出产生影响。这时的第一输出是指将样本内容特征对应的待推送内容，在场景下推送给样本对象的预测推送值。样本场景特征包括：样本对象当前所在的地理区域特征、当前输入日类型特征(工作日、周末、还是节日)等。

在获取样本对象所处的场景特征时，要事先得到样本对象的同意，与上类似，故不赘述。

同样地，将目标对象特征和目标内容特征输入第一模型，得到推送决策结果，包括：将目标对象特征、与目标对象所处的场景特征、目标内容特征输入第一模型，得到推送决策结果。因此，场景特征是指目标对象查看推送内容时所处的当前场景的特征。场景特征也会对推送决策结果产生影响。这时的推送决策结果是指将目标内容特征对应的待推送内容，在场景下推送给目标对象的预测推送值。场景特征包括：目标对象当前所在的地理区域特征、当前输入日类型特征(工作日、周末、还是节日)等。

在获取目标对象所处的场景特征时，要事先得到目标对象的同意，与上类似，故不赘述。

当前所在的地理区域特征是指目标对象目前所处的地理区域的特征。这个地理区域可以是行政上的地理区域，如A市、B市等，也可以是地图上按实体划分的地理区域，如XX商场区域、XX医院区域等。对于行政上的地理区域，对于目标对象感兴趣的推送内容是有影响的。例如，如果目标对象在A市，推送内容可以是与A市相关的旅游景点或美食文化等。对于按实体划分的地理区域，对目标对象感兴趣的推送内容也是有影响的。例如，如果目标对象在XX商场区域，推送内容可以是该商场中的活动信息或特色项目等；如果目标对象在XX医院区域，推送内容可以是与健康养生相关的内容。

当前输入日类型特征是指目标对象查看推送内容时的日的类型的特征。它分为工作日、周末、与节日等。目标对象在不同类型的日子中，想要查看的推送内容的类型可能是不同的。例如，在工作日(周一到周五)，目标对象往往在工作，想要查看的推送内容可能是与工作相关的；在周末(周六和周日)，目标对象在不需要工作的时候，想要查看的推送内容可能是与自身爱好相关的；在节日，目标对象可能想要查看与节日文化相关的推送内容。

在步骤1020中，获取样本内容特征、和第一模型训练时的第一兴趣基准特征之间的第一相似度表征。

第一兴趣基准特征是指用于评估目标对象对待推送内容兴趣程度的特征。样本对象对某个内容的兴趣程度容易受到自身兴趣和热门主题的影响。自身兴趣是指目标对象自身的兴趣偏好和兴趣倾向。热门主题是指当前推送平台总体使用对象的兴趣偏好和兴趣倾向。

第一兴趣基准特征包括目标对象兴趣基准特征和总体对象兴趣基准特征。

目标对象兴趣基准特征是指与目标对象自身的兴趣偏好和兴趣倾向相关的特征。目标对象兴趣基准特征可以通过对目标对象的个人信息、历史行为、兴趣爱好等进行分析得到。目标对象兴趣基准特征可以提高内容推送处理中推送内容和对象兴趣的匹配性。

注意，在获取目标对象的个人信息、历史行为、兴趣爱好时，要事先征求目标对象的同意。而且，对这些对象特征的收集、使用和处理等，都会遵守相关法律法规和标准。在征求目标对象的同意时，可以通过弹窗或者跳转到确认页面等方式获得目标对象的单独许可或者单独同意。

总体对象兴趣基准特征是指与推送处理平台中多个平台对象的兴趣偏好和兴趣倾向相关的特征。总体对象兴趣基准特征可以通过对多个平台对象的行为数据、统计数据或其他信息进行分析得到。总体对象兴趣基准特征可以在内容推送处理中避免只给对象推荐最感兴趣的内容，导致分发内容的多样性不足的问题。

注意，在获取平台对象的行为数据、统计数据或其他信息时，要事先征求每个平台对象的同意。而且，对这些对象特征的收集、使用和处理等，都会遵守相关法律法规和标准。在征求平台对象的同意时，可以通过弹窗或者跳转到确认页面等方式获得平台对象的单独许可或者单独同意。

第一相似度表征是指样本内容特征和第一兴趣基准特征之间的相似程度。第一相似度表征中进行相似度比较的特征可以表示为高维向量，其中每个维度表示一种属性特征。通过计算两个向量之间的距离或相似度，可以度量数据之间的相似性。

在一个实施例中，如图12所示，第一相似度表征包括第一相似度子表征和第二相似度子表征，获取样本内容特征、和第一模型训练时的第一兴趣基准特征之间的第一相似度表征，包括：

步骤1210、获取样本内容特征和目标对象兴趣基准特征的第一相似度子表征；

步骤1220、获取样本内容特征和总体对象兴趣基准特征的第二相似度子表征。

在步骤1210中，第一相似度子表征是指样本内容特征和目标对象兴趣基准特征之间的相似程度。对第一相似度子表征的计算方法包括：余弦相似度函数、欧氏距离函数、曼哈顿距离函数等计算方法。

在一个实施例中，如图13所示，目标对象兴趣基准特征通过以下方式获取：

步骤1310、将目标对象浏览时长超过第一时长的内容级联成内容序列；

步骤1320、将内容序列向量化为内容序列向量；

步骤1330、对内容序列向量进行池化，得到目标对象兴趣基准特征。

在步骤1310中，目标对象浏览时长是指目标对象在一个推送内容对应的浏览界面停留的时长。例如，目标对象在推送内容A的目标对象浏览时长为15秒，目标对象在推送内容B的目标对象浏览时长为10秒。

第一时长是指预先设定的可以表征目标对象的兴趣偏好的浏览时长阈值。目标对象浏览时长超过第一时长的内容，是指目标对象在推送内容对应的浏览界面停留的时长超过第一时长的内容。目标对象浏览时长超过第一时长的内容可以表征目标对象兴趣偏好。例如，目标对象在推送内容A的目标对象浏览时长为15秒，目标对象在推送内容B的目标对象浏览时长为10秒，目标对象在推送内容C的目标对象浏览时长为12秒，第一时长为10秒。因此，目标对象浏览时长超过第一时长的内容包括推送内容A和推送内容C。

在一个实施例中，第一时长通过以下方式确定：

获取目标对象在当前时间之前预定时间段内浏览内容的第一平均时长；

基于第一平均时长和第二平均时长，确定第一时长。

第一平均时长是指目标对象在当前时间之前预定时间段内浏览内容的时长平均值。例如，目标对象在当前时间之前预定时间段内的浏览内容包括：内容A、内容B、内容C、和内容D。其中，目标对象在当前时间之前预定时间段内浏览内容A的浏览时长为20秒，目标对象在当前时间之前预定时间段内浏览内容A的浏览时长为5秒，目标对象在当前时间之前预定时间段内浏览内容A的浏览时长为13秒，目标对象在当前时间之前预定时间段内浏览内容A的浏览时长为10秒，那么第一平均时长为(20+5+13+10)/4＝12秒。

预定时间段可以是一小时、一天、一周、一个月、一年等。预定时间段可以根据目标对象查看推送内容的频率来确定。如果目标对象查看推送内容的频率较高，那么通过较短的时间段的观看记录就可以获取目标对象最近一段时间内感兴趣的类型类型；如果目标对象查看推送内容的频率较低，那么需要使用较长的时间段内的观看记录以保证有足够的数据用来获取目标对象的第一平均时长。预定时间段还可以根据推送内容的类型来确定。例如，如果推送内容是视频内容，可以使用较长时间段作为预定时间段，以获取目标对象的长期偏好；如果推送内容是新闻内容，由于新闻具有时效性，所以需要使用较短时间段作为预定时间段。

注意，获取目标对象在当前时间之前预定时间段内浏览内容，也要实现征求目标对象的同意。

第二平均时长是指推送处理平台的多个平台对象在当前时间之前预定时间段内浏览内容的时长平均值。例如，推送处理平台中包括：平台对象A、平台对象B、和平台对象C。平台对象A在当前时间之前预定时间段内的浏览内容包括内容A1、内容A2、和内容A3，其中，平台对象A在当前时间之前预定时间段内浏览内容A1的浏览时长为8秒，平台对象A在当前时间之前预定时间段内浏览内容A2的浏览时长为5秒，平台对象A在当前时间之前预定时间段内浏览内容A3的浏览时长为13秒。平台对象B在当前时间之前预定时间段内的浏览内容包括：内容B1、内容B2、和内容B3，其中，平台对象B在当前时间之前预定时间段内浏览内容B1的浏览时长为7秒，平台对象B在当前时间之前预定时间段内浏览内容B2的浏览时长为18秒，平台对象B在当前时间之前预定时间段内浏览内容B3的浏览时长为9秒。平台对象C在当前时间之前预定时间段内的浏览内容包括：内容C1、内容C2、和内容C3，其中，平台对象C在当前时间之前预定时间段内浏览内容C1的浏览时长为3秒，平台对象C在当前时间之前预定时间段内浏览内容C2的浏览时长为20秒，平台对象C在当前时间之前预定时间段内浏览内容C3的浏览时长为7秒。这是的第二平均时长为(8+5+13+7+18+9+3+20+7)/9＝10秒。

基于第一平均时长和第二平均时长，确定第一时长，可以通过基于第一平均时长确定第一分数，基于第二平均时长确定第二分数，基于第一分数和第二分数计算总分数，并根据总分数确定第一时长。

基于第一平均时长确定第一分数可以通过第一对照表。表3所示的是一个第一对照表的例子。

第一平均时长(秒)	第一分数
		小于4	10
4-8	20
		8-12	30
……	……
		大于60	100

表3

参照表3，如果第一平均时长为10秒，那么对应的第一分数为30。

基于第二平均时长确定第二分数可以用过第二对照表。表4所示的是一个第二对照表的例子。

表4

参照表4，如果第二平均时长为15秒，那么对应的第二分数为80。

基于第一分数与第二分数计算总分数。在一个实施例中，使用平均数的方式计算总分数。例如，第一分数为30，第二分数为60，那么总分数为(30+60)/2＝45。利用平均数的方式计算总分数的优点是，使得第一平均时长与第二平均时长对于计算总分数的影响是相同的，提高了确定第一时长的公平性。

在另一实施例中，使用加权平均数的方式计算总分数。在本实施例中，首先需要为第一分数与第二分数分别设置权重。例如，第一分数的权重为0.6，第二分数的权重为0.4，第一分数为30，第二分数为60，那么总分数为30*0.6+60*0.4＝42。利用加权平均数的方式计算总分数的优点是，可以根据实际应用的需要灵活地为第一平均时长与第二平均时长设置不同权重，提高了确定第一时长的灵活性。

根据总分数确定第一时长。总分数越高，代表所需要的第一时长越长。

在一个实施例中，可以通过总分数与第一时长的第三对照表确定第一时长。表5所示的是一个第三对照表的例子。

总分数	第一时长(秒)
		0-20	5
21-41	10
		41-61	15
61-81	20
		81-100	25

表5

参照图5，如果总分数是45，那么第一时长为15秒，也就是将目标对象浏览时长超过15秒的内容级联成内容序列。

通过第三对照表确定第一时长的方式的优点是，便于查询，处理效率高。

本实施例可以快速通过分数确定第一时长，提高了将目标对象浏览时长超过15秒的内容级联成内容序列的效率。

上述实施例的优点是，根据第一平均时长与第二平均时长确定第一时长，使得第一时长可以满足任务的要求，提高了级联内容序列的准确性。

级联是指将多个目标对象浏览时长超过第一时长的内容，按照输出的顺序进行首尾串联，组合成一个内容序列的过程。

在一个实施例中，样本对象的行为序列可以包含多种方式，目标对象兴趣基准特征可以为多个维度的目标对象兴趣基准特征。目标对象兴趣基准特征的维度，是指获取目标对象浏览时长超过第一时长的内容所采用的范围划分方式。目标对象兴趣基准特征的维度包括基于内容条数的划分方式或基于内容浏览时间的划分方式。当目标对象兴趣基准特征的维度为内容浏览时间，例如，基于一天(24小时)之内播放超过第一时长的视频内容获取的目标对象兴趣基准特征。当目标对象兴趣基准特征的维度为内容条数，例如，基于最近20条播放超过第一时长的视频内容获取的目标对象兴趣基准特征。

第一相似度子表征为多个维度的第一相似度子表征。这时的第一相似度子表征是指在维度上样本内容特征和目标对象兴趣基准特征之间的相似程度。

在一个实施例中，将目标对象浏览时长超过第一时长的内容级联成内容序列，包括：针对多个维度中的每个维度，将维度上目标对象浏览时长超过第一时长的内容级联成内容序列。

在一个实施例中，如图14A所示，当目标对象兴趣基准特征的维度为内容浏览时间，将时间维度上目标对象浏览时长超过第一时长的内容级联成内容序列。例如，当内容浏览时间设定为一天时，获取样本对象在一天时间内浏览的样本推送内容K1、样本推送内容K2……样本推送内容K9。将浏览的每个样本推送内容、与样本推送内容对应的浏览时间、和与样本推送内容对应的目标对象浏览时长作为第一组合。例如，样本推送内容K1对应的第一组合为：(样本推送内容K1，08:02:00,浏览时长为15秒)；样本推送内容K2对应的第一组合为：(样本推送内容K2，09:10:30,浏览时长为8秒)。当第一时长为10秒，目标对象浏览时长超过第一时长的内容包括：样本推送内容K1、样本推送内容K3、样本推送内容K4、样本推送内容K6。因此，将目标对象浏览时长超过第一时长的内容级联后的内容序列为：(样本推送内容K1，样本推送内容K3，样本推送内容K4，样本推送内容K6)。

在另一个实施例中，如图14B所示，当目标对象兴趣基准特征的维度为内容条数，将内容条数维度上目标对象浏览时长超过第一时长的内容级联成内容序列。例如，当内容条数设定为8条时，获取样本对象最近浏览的8条样本推送内容K1、样本推送内容K2……样本推送内容K8。将浏览的每个样本推送内容、和与样本推送内容对应的目标对象浏览时长作为第二组合。例如，样本推送内容K1对应的第二组合为：(样本推送内容K1，浏览时长为15秒)；样本推送内容K2对应的第二组合为：(样本推送内容K2，浏览时长为8秒)。当第一时长为10秒，目标对象浏览时长超过第一时长的内容包括：样本推送内容K1、样本推送内容K3、样本推送内容K4、样本推送内容K6、样本推送内容K7、样本推送内容K8。因此，将目标对象浏览时长超过第一时长的内容级联后的内容序列为：(样本推送内容K1，样本推送内容K3，样本推送内容K4，样本推送内容K6，样本推送内容K7，样本推送内容K8)。

在步骤1320中，由于内容序列中包含了多种类型的内容信息，因此，需要将内容序列向量化成为机器可学习的形式。

在一个实施例中，对内容序列采用相同的嵌入参数表进行向量化，使得不同的样本对象对于相同的内容序列，也能够得到相同的内容序列向量。相同的嵌入参数表中每一行表示一个不同的单词、特征或标签，每一列表示该单词、特征或标签的向量表示。例如图15所示，目标对象浏览时长超过第一时长的内容级联后的内容序列为：(样本推送内容K1，样本推送内容K3，样本推送内容K4，样本推送内容K6，样本推送内容K7，样本推送内容K8)，采用嵌入参数表向量化后，得到内容序列向量：[23，45，1，31，24，32，38，6，10，12，11，25，25，14，15，1，8，6，1，2，18，23，33，31，11，40，42，7，11，30，20，2，14，6，14，22]。

在步骤1330中，对内容序列向量进行池化，得到目标对象兴趣基准特征。由于内容序列向量是多个超过第一时长的内容级联后的内容序列的向量化结果，内容序列向量与单个的样本内容特征或样本对象特征相比，是一个不定长序列特征。

池化处理是将高维向量降维的过程。池化处理的具体过程是将根据不定长序列特征生成的高维向量中的预设邻域内的几个特征值整合为一个新的特征值。将预设邻域内的几个特征值整合为一个新的特征值的方式，可以是取邻域中特征值的平均值作为邻域新的特征值，用于保留整体特征；也可以取邻域内的几个特征值中最大的特征值作为邻域新的特征值，用于保留最显著的特征。例如图16所示，内容序列为：(样本推送内容K1，样本推送内容K3，样本推送内容K4，样本推送内容K6，样本推送内容K7，样本推送内容K8)，经过向量化处理后，得到不定长的内容序列向量：[23，45，1，31，24，32，38，6，10，12，11，25，25，14，15，1，8，6，1，2，18，23，33，31，11，40，42，7，11，30，20，2，14，6，14，22]。将预设邻域的值设置为3，也就是将高维特征向量中每3个相邻的特征量作为一个邻域，将一个邻域中的特征值整合为一个新的特征值。整合方式可以是，取领域中特征值的平均值作为邻域的特征值。例如，在上述高维的内容序列向量中，取第一个邻域为[23,45,2]，这个邻域中特征量的平均值为(23+45+1)/3＝23，因此该邻域整合后的特征值为23。第二个邻域为[31,24,32]，这个邻域中的特征值的平均值为(31+24+32)/3＝29，因此该邻域整合后的特征值为29。同理，之后的邻域整合后的特征值分别为18、16、18、5、7、29、31、16、12、14。因此，该不定长的内容序列向量经过池化后，得到的目标对象兴趣基准特征为：[23，29，18，16，18，5，7，29，31，16，12，14]。

将预设领域内的几个特征值整合为一个新的特征值还可以是，将邻域内特征值的最大值作为一个邻域的特征值。例如，在上述高维特征向量中，同样将预设邻域的值设置为3，取邻域内的最大值作为邻域的特征值，那么该不定长的内容序列向量经过池化后，得到的目标对象兴趣基准特征为：[45，32，38，25，25，8，18，33，42，30，20，22]。

步骤1310-步骤1330的实施例的优点是，将目标对象浏览时长超过第一时长的内容级联成内容序列，从而根据内容序列得到目标对象兴趣基准特征，能够提供更符合样本对象兴趣的内容。

在一个实施例中，可以采用余弦相似度函数计算样本内容特征和目标对象兴趣基准特征之间的第一相似度子表征。余弦相似度函数是计算两个特征向量之间的夹角余弦值，夹角余弦值的取值范围在[-1,1]之间。其中，夹角余弦值为1表示完全相似，夹角余弦值为0表示不相似，夹角余弦值为-1表示完全相反。因此，计算第一相似度子表征的过程如公式3所示：

在公式3中，cos<·,·>是指余弦相似度函数，v是指多个维度构成的样本内容特征，u是指多个维度构成的目标对象兴趣基准特征，v_i是指样本内容特在第i个维度对应的特征，u_i是指目标对象兴趣基准特征在第i个维度对应的特征，d_E是指维度总数。因为样本内容特征和目标对象兴趣基准特征都是相同大小的特征向量，所以样本内容特征的维度和目标对象兴趣基准特征的维度相同，都是d_E。例如，基于样本待推送内容A对应的样本内容特征和目标对象兴趣基准特征，计算得到的第一相似度子表征的值为0.8，基于样本待推送内容B对应的样本内容特征和目标对象兴趣基准特征，计算得到的第一相似度子表征的值为0.5，那么这时表示样本待推送内容A与目标对象兴趣基准特征之间的相似程度越高，换句话说，样本对象对待推送内容A的感兴趣程度越高。

在另一个实施例中，可以采用欧氏距离函数计算样本内容特征和目标对象兴趣基准特征之间的第一相似度子表征。欧氏距离函数是计算两个向量之间的欧氏距离，欧氏距离的越小表示越相似。

本实施例中，将内容序列向量化为内容序列向量，并对内容序列向量进行池化的优点在于，采用相同的嵌入参数表对不同的内容序列进行向量化，确保了特征向量化结果的准确性。采用池化将不定长的内容序列向量整合为定长的向量，确保了第一相似度子表征结果的准确性。

在步骤1220中，获取样本内容特征和总体对象兴趣基准特征的第二相似度子表征。

第二相似度子表征是指样本内容特征和总体对象兴趣基准特征之间的相似程度。对第二相似度子表征的计算方法包括：余弦相似度函数、欧氏距离函数、曼哈顿距离函数等计算方法。具体的计算过程与上述第一相似度子表征相似，为了节约篇幅，在此不再赘述。

在一个实施例中，可以采用余弦相似度函数计算样本内容特征和总体对象兴趣基准特征之间的第二相似度子表征。因此，计算第二相似度子表征的过程如公式4所示：

在公式4中，cos<·,·>是指余弦相似度函数，v是指多个维度构成的样本内容特征，CommVideo是指多个维度构成的总体对象兴趣基准特征，v_i是指样本内容特在第i个维度对应的特征，CommVideo_i是指总体对象兴趣基准特征在第i个维度对应的特征，d_E是指维度总数。因为样本内容特征和总体对象兴趣基准特征都是相同大小的特征向量，所以样本内容特征的维度和总体对象兴趣基准特征的维度相同，都是d_E。例如，基于样本待推送内容A对应的样本内容特征和总体对象兴趣基准特征，计算得到的第一相似度子表征的值为0.8，基于样本待推送内容B对应的样本内容特征和总体对象兴趣基准特征，计算得到的第一相似度子表征的值为0.5，那么这时表示样本待推送内容A与总体对象兴趣基准特征之间的相似程度越高，换句话说，样本对象对待推送内容A的感兴趣程度越高。

在一个实施例中，如图17所示，总体对象兴趣基准特征通过以下方式获取：

步骤1710、获取推送处理平台在当前时间之前的第二时长内的多个待推送内容；

步骤1720、将待推送内容向量化为待推送内容向量；

步骤1730、将多个待推送内容的待推送内容向量累加，得到总体对象兴趣基准特征。

在步骤1710中，推送处理平台是一种用于管理和向对象发送推送内容的系统。推送处理平台能够向对象发送推送通知，包括内容提醒、内容更新等。

第二时长是指可以表征推送处理平台中总体对象兴趣的时长阈值。这时的多个待推送内容是指推送处理平台在当前时间之前的第二时长内即将推送的内容。例如图18所示，当前时间为18:00:00，当第二时长为5分钟，获取推送处理平台在当前时间之前的5分钟内的多个待推送内容，这时的多个待推送内容包括：待推送内容L1、待推送内容L2、待推送内容L3、待推送内容L4、待推送内容L5、待推送内容L6、与待推送内容L7。

在步骤1720中，待推送内容向量是指对待推送内容经过向量化后的结果。例如图19所示，推送处理平台在当前时间之前的第二时长内的多个待推送内容包括：待推送内容L1、待推送内容L2、待推送内容L3、待推送内容L4、待推送内容L5、待推送内容L6、与待推送内容L7。其中，待推送内容L1经过向量化后，得到待推送内容向量V1：[1,45,2,31,24,18,11,9,10,55,1]，待推送内容L2经过向量化后，得到待推送内容向量V2：[11,6,10,12,11,25,23,2,4,26,13,11]，待推送内容L3经过向量化后，得到待推送内容向量V3：[2,14,15,1,8,6,44,68,12,11,3,19]，待推送内容L4经过向量化后，得到待推送内容向量V4：[1,2,18,23,33,31,17,13,28,32,30,3]，待推送内容L5经过向量化后，得到待推送内容向量V5：[11,40,42,7,11,30,25,35,37,16,18,2]，待推送内容L6经过向量化后，得到待推送内容向量V6：[20,2,14,6,14,22,5,8,1,66,12,35],待推送内容L7经过向量化后，得到待推送内容向量V7：[32,18,13,62,2,15,7,31,52,21,53,3]。

在步骤1730中，总体对象兴趣基准特征是指将多个待推送内容的待推送内容向量累加后的向量结果。总体对象兴趣基准特征用于近似表示大盘分发内容的整体表示。大盘分发内容是指推送处理平台广泛分发给所有平台对象的待推送内容。大盘分发内容不考虑每个平台对象各自的个性化需求。将多个待推送内容的待推送内容向量累加，是指将多个待推送内容向量对应元素累加，以得到总体对象兴趣基准特征。例如图19所示，推送处理平台在当前时间之前的第二时长内的多个待推送内容包括：待推送内容L1、待推送内容L2、待推送内容L3、待推送内容L4、待推送内容L5、待推送内容L6、与待推送内容L7。在得到每个待推送内容对应的待推送内容向量后，待推送内容向量V1、待推送内容向量V2、待推送内容向量V3、待推送内容向量V4、待推送内容向量V5、待推送内容向量V6、和待推送内容向量V1对应元素进行累加，即第一列元素累加为：1+11+2+1+11+20+32＝78，第二列元素累加为：45+6+14+2+40+2+18＝127。同理，最后得到总体对象兴趣基准特征为：[78,127,114,142,103,161,139,168,143,182,184,74]。

步骤1710-步骤1730的实施例的优点是，基于在当前时间之前的第二时长内的多个待推送内容对应的待推送内容向量进行向量累加，能够得到一个更全面和综合的总体对象兴趣基准特征，提高了第一相似度表征的准确性，从而避免造成推荐单一性。

在另一个实施例中，如图20所示，总体对象兴趣基准特征是分时间批次的，当前时间批次的总体对象兴趣基准特征通过以下方式获取：

步骤2010、获取推送处理平台在当前时间批次的多个待推送内容；

步骤2020、将待推送内容向量化为待推送内容向量；

步骤2030、基于在当前时间批次多个待推送内容的待推送内容向量的累加和、以及上一个时间批次的总体对象兴趣基准特征，确定当前时间批次的总体对象兴趣基准特征。

时间批次(Batch)是指在确定总体对象兴趣基准特征时，按照预设批次时间段获取推送处理平台中的待推送内容的方式。预设批次时间段可以是十分钟、一小时、一天、一周、一月等。时间批次对应的预设批次时间段的选择可以根据目标对象查看推送内容的频率来确定。例如图21所示，推送处理平台在当前时间批次的多个待推送内容包括：待推送内容M1、待推送内容M2、待推送内容M3、待推送内容M4、待推送内容M5、待推送内容M6、与待推送内容M7。将当前时间批次的每个待推送内容向量化，得到每个待推送内容对应的待推送内容向量。其中，待推送内容M1对应的待推送内容向量为：[23,45,2,31,24,18,11,9,10,55,1],待推送内容M2对应的待推送内容向量为：[38,6,10,12,11,25,23,2,4,26,13,11]，同理，得到待推送内容M3、待推送内容M4、待推送内容M5、待推送内容M6、与待推送内容M7对应的待推送内容向量。

基于在当前时间批次多个待推送内容的待推送内容向量的累加和，和上述实施例的步骤1730相似，只是将第二时长内的多个待推送内容对应的待推送内容向量变为当前时间批次的多个待推送内容对应的待推送内容向量，在此不再赘述。

上一个时间批次的总体对象兴趣基准特征，是指基于当前时间批次的前一个预设批次时间段内获取的多个待推送内容得到的特征。

在一个实施例中，基于在当前时间批次多个待推送内容的待推送内容向量的累加和、以及上一个时间批次的总体对象兴趣基准特征，确定当前时间批次的总体对象兴趣基准特征，包括：

获取累加和的第一权重，其中，第一权重属于区间(0，1)；

将1与第一权重的差，确定为上一个时间批次的总体对象兴趣基准特征的第二权重；

基于第一权重和第二权重，确定累加和与上一个时间批次的总体对象兴趣基准特征的加权和，作为当前时间批次的总体对象兴趣基准特征。

第一权重是指当前时间批次多个待推送内容的待推送内容向量对总体对象兴趣基准特征的影响程度。如果第一权重越大，那么当前时间批次的待推送内容对目标对象的兴趣程度影响越大。

第二权重是指上一个时间批次多个待推送内容的待推送内容向量对总体对象兴趣基准特征的影响程度。如果第二权重越大，那么上一个时间批次的待推送内容对目标对象的兴趣程度影响依然保留，并随着时间批次的增多，影响不断减少。第一权重和第二权重的和为1。例如，第一权重为0.02，第二权重为1-0.02＝0.08，那么这时上一个时间批次的待推送内容对目标对象的兴趣程度影响较大。因此，基于第一权重和第二权重，确定累加和与上一个时间批次的总体对象兴趣基准特征的加权和，作为当前时间批次的总体对象兴趣基准特征的过程如公式5所示：

在公式5中，CommVideo₁是指当前时间批次的总体对象兴趣基准特征，α是指第一权重，(1-α)是指第二权重，B是指推送处理平台在当前时间批次获取的待推送内容的数量，Videold_i是指当前时间批次的第i个待推送内容，Emb(VideoId_i)是指当前时间批次的第i个待推送内容对应的待推送内容向量，是指当前时间批次多个待推送内容的待推送内容向量的累加和，CommVideo₀是指上一个时间批次的总体对象兴趣基准特征。例如图21所示，第一权重为0.2，第二权重为1-0.2＝0.8，当前时间批次多个待推送内容的待推送内容向量的累加和为：[150，127，114，142，103，161，139，168，143，182，184，74]，上一个时间批次的总体对象兴趣基准特征为：[121，100，95，66，120，115，126，108，140，150，118，112]。将第一权重和当前时间批次多个待推送内容的待推送内容向量的累加和中的每个元素进行加权计算，得到累加和的加权特征为：[30.2，25.4，22.8，28.4，20.6，32.2，27.8，33.6，28.6，36.4，36.8，14.8]。将第二权重和上一个时间批次的总体对象兴趣基准特征中的每个元素进行加权计算，得到上一个时间批次的总体对象兴趣基准特征的加权特征为：[96.8，80，76，52.8，96，92，100.8，86.4，112，120，84.4，89.6]。将累加和的加权特征和上一个时间批次的总体对象兴趣基准特征的加权特征进行加和计算，得到当前时间批次的总体对象兴趣基准特征为：[129，105.4，98.8，81.2，116.6，124.2，128.6，120，140.6，156.4，121.2，104.4]。

步骤2010-步骤2030的实施例的优点是，基于时间批次获取当前时间批次的总体对象兴趣基准特征，可以实时了解到当前平台对象共同的兴趣和喜好，能够得到一个更全面和综合的总体对象兴趣基准特征，提高了第一相似度表征的准确性，从而避免造成推荐单一性。

步骤1210-步骤1220的实施例的优点是，基于与目标对象兴趣基准特征相关的第一相似度子表征和与总体对象兴趣基准特征相关的第二相似度子表征，能够得到一个更全面和完整的第一相似度表征，在模型训练时，能够帮助第一模型有效去除头部兴趣影响，从而减少头部兴趣对内容推送多样性的影响，提高了内容推送处理中推送内容的多样性。

在步骤1030中，将第一相似度表征输入与第一模型并联的第二模型，得到第二输出，其中，第一模型和第二模型组成总体模型。

第二模型是指用于关注头部兴趣对多样性的影响的模型。第二模型可以基于DNN的网络结构进行构建得到。

第一模型与第二模型并联的优点，可以充分利用第一模型与第二模型各自的优势，第二模型建模的是头部兴趣的影响，这样第一模型就成为了去除了头部兴趣影响的多样性模型，而模型使用的时候可以只使用第一模型，从而减少头部兴趣对内容推送多样性的影响，提高了内容推送处理中推送内容的多样性。

第二输出是指结合头部兴趣的影响后，将待推送内容推送给样本对象的预测推送值。第二输出是指第二模型最后一层输出的且未经过激活函数处理的值。第二输出是一个标量，可以是任意实数范围内的值。第二输出越大表示将待推送内容推送给样本对象时头部兴趣的影响程度越高。因此，计算第二输出的过程如公式6所示：

logit_bias＝h_bias(X_bias) (公式6)。

在公式6中，logit_bias是指第二输出，X_bias表示第二模型的输入特征，h_bias(·)表示第二模型的处理过程。例如，第二模型的输入特征为：[0.8,0.3,230,200]，经过公式6计算后得到第二输出为18。

在一个实施例中，如图22所示，将第一相似度表征输入与第一模型并联的第二模型，得到第二输出，包括：

步骤2210、获取目标内容的推送统计量特征；

步骤2220、将第一相似度表征、与推送统计量特征输入与第一模型并联的第二模型，得到第二输出。

在步骤2210中，推送统计量特征是指在推送处理中，针对每条目标内容所收集到的统计数据特征。推送统计量特征包括曝光量和点击量。

在一个实施例中，如图23所示，获取目标内容的推送统计量特征，包括：

步骤2310、获取目标内容推送给推送处理平台的多个平台对象的次数，作为曝光量；

步骤2320、获取在推送目标内容后多个平台对象对目标内容点击的次数，作为点击量。

曝光量是指推送处理平台在预定时间段将目标内容推送展示给多个平台对象的总次数。曝光量的取值范围是大于或等于0的正整数，曝光量的数值越大，那么曝光程度越高。预定时间段可以是一小时、一天、一周、一个月等。预定时间段可以根据目标对象查看推送内容的频率来确定。例如，这时的预定时间段为一小时，推送处理平台在一小时内将目标内容推送展示给多个平台对象的总次数为500次，那么这时的曝光量为500。

在一个实施例中，为了平衡曝光量的分布，减小极端值对整体分析的影响，将曝光量大于预设曝光阈值的曝光量进行对数函数计算，并将计算的结果作为推送统计量特征的曝光量。预设曝光阈值是指评估曝光量是否为极端值的阈值。因此，计算曝光量的过程如公式7所示：

ExposePv1＝log(ExposePv0+1)(公式7)。

在公式7中，ExposePv0是指大于预设曝光阈值的曝光量，ExposePv1是指推送统计量特征的曝光量，log(·)是指对数函数。因此，将曝光量加1后取对数函数可以减小数据量的大小，从而在存储和处理上节省资源。例如，预设曝光阈值为100，如果获取的目标内容推送给推送处理平台的多个平台对象的次数为200>100，那么这时ExposePv0为200，采用上述公式7进行计算，得到推送统计量特征的曝光量为log(200+1)≈3。

点击量是指推送处理平台将目标内容推送展示给多个平台对象后，在预定时间段内平台对象对目标内容点击的总次数。例如，这时的预定时间段为一小时，推送处理平台在将目标内容推送展示给多个平台对象后，在一小时内多个平台对象对目标内容点击的次数为250次，而那么这时的点击量为250。

步骤2310-步骤2320的实施例的优点是，曝光量可以表示目标内容的曝光范围和覆盖面，点击量可以表示目标对象对目标内容的兴趣和互动程度。基于曝光量和点击量确定推送统计量特征，将第一相似度表征、与推送统计量特征输入与第一模型并联的第二模型，能够使第二模型更准确地建模头部兴趣的影响。

在步骤2220中，将第一相似度表征、与推送统计量特征进行级联，并将级联后的特征输入与第一模型并联的第二模型，得到第二输出。

在一个实施例中，如图24所示，第一相似度表征包括第一相似度子表征和第二相似度子表征，所以将第一相似度表征、与推送统计量特征进行级联，并将级联后的特征输入与第一模型并联的第二模型，得到第二输出，包括：将第一相似度子表征、第二相似度子表征、曝光量、与点击量进行级联，并将级联后的特征输入与第一模型并联的第二模型，得到第二输出。其中，第一相似度子表征可以表示为cos<v,u>，第二相似度子表征可以表示为cos<v,CommVideo>，曝光量可以表示为ExposePv1，点击量可以表示为ClickPv1，那么这时将第一相似度子表征、第二相似度子表征、曝光量、与点击量进行级联后,得到第二模型的输入特征X_bias为：[cos<v,u>,cos<v,CommVideo>,ExposePv1,ClickPv1]。例如，第一相似度子表征为0.8，第二相似度子表征为0.3，曝光量为230，点击量为200，那么这时的第二模型的输入特征为：[0.8,0.3,230,200]。

总体模型是指通过将第一模型和第二模型并联后得到的模型。总体模型在图24中以黑色粗实线框表示。总体模型可以结合第二模型中头部兴趣对多样性的影响，因此，训练后的总体模型中的第一模型就成为了去除了头部兴趣影响的多样性模型。

步骤2210-步骤2220的实施例的优点是，基于第一相似度表征、与推送统计量特征输入与第一模型并联的第二模型，能够综合不同类型的特征，使得第二模型能够更准确地建模头部兴趣对多样性地影响，从而减少头部兴趣对内容推送多样性的影响，提高内容推送处理中推送内容的多样性。

在步骤1040中，因为一个样本对应的样本标签与样本中的样本对象特征、样本内容特征对应，因此，基于第一输出和第二输出的第一总输出、以及样本标签，训练总体模型，包括：基于第一输出和第二输出的第一总输出、以及样本标签，训练由第一模型和第二模型组成的总体模型。

在一个实施例中，如图25所示，基于第一输出和第二输出的第一总输出、以及样本标签，训练总体模型，包括：

步骤2510、将第一输出和第二输出加和，得到第一总输出；

步骤2520、基于第一总输出，确定为样本对象推送样本内容的第一概率；

步骤2530、基于第一概率和样本标签，计算损失函数；

步骤2540、基于损失函数，训练总体模型。

在步骤2510中，如图26所示，第一总输出是指利用样本内容特征与目标对象或平台对象兴趣的第一兴趣基准特征的影响后，将待推送内容推送给样本对象的预测推送值。第一总输出可以是任意实数范围内的值。第一总输出是指第一输出和第二输出加和计算后的值。

在一个实施例中，第一输出、第二输出、和第一总输出为对数几率值(也称为logit值)。因此，计算第一总输出的过程如公式8所示：

logit＝logit_debias+logit_bias (公式8)。

在公式8中，logit是指第一总输出，logit_debias是指第一输出，logit_bias是指第二输出。例如，第一输出为32，第二输出为40，那么第一总输出为32+40＝72。

在步骤2520中，第一概率是指模型为样本对象推送对应的样本内容的概率值。第一概率的大小可以用来衡量模型对样本内容推送分类的置信度。置信度是指对某个结论或判断的信任程度或确信程度。第一概率越大，表示模型预测该样本内容属于正样本标签的置信度越高。例如，样本标签包括正样本标签和负样本标签，如果第一概率越接近1，那么可以认为该样本被预测为正样本的可能性越高。

logit值经过激活函数处理后，可以转化为概率值。基于第一总输出，确定为样本对象推送样本内容的第一概率，包括：将第一总输出的logit值映射到一个确定的范围内，得到第一概率。激活函数包括sigmoid函数、softmax函数等。因此，如果采用sigmoid函数对第一总输出进行激活函数处理，那么计算第一概率的过程如公式9所示：

在公式9中，p是指第一概率，logit是指第一总输出，sigmoid(·)是指sigmoid函数。

本实施例中通过激活函数处理获取第一概率的优点是，将基于第一模型的第一输出和第二模型的第二输出确定的第一总输出映射到在同一数值范围内，能够更有效地体现出不同的第一输出和第二输出对于获取第一概率的影响，提高了获取第一概率的准确性。

在一个实施例中，如图27所示，在将样本对象特征、和与样本对象特征对应的样本内容特征输入第一模型，得到第一输出之前，第一模型的训练过程还包括：步骤2710、获取样本集。

在步骤2530中，损失函数是指模型为样本对象推送样本内容的第一概率和样本内容对应的样本标签之间的距离。距离越近代表误差损失越小，预测效果越好。基于第一概率和样本标签，计算损失函数的方法，包括：首先，确定样本对象推送样本内容的第一概率；其次，获取该样本对象推送样本内容对应的样本标签，如果样本标签是正样本标签，那么样本标签为1，反之，样本标签为0；最后，基于样本对象推送样本内容的第一概率、与样本对象推送样本内容对应的样本标签，确定单个样本对应的损失函数。因此，计算损失函数的过程如公式10所示：

L_t＝-ylogp-(1-y)log(1-p) (公式10)。

在公式10中，L_t是指单个样本对应的损失函数，y是指样本标签，p是指第一概率。例如，如果样本标签为1，第一概率是0.6，那么损失函数为-1*log(0.6)＝0.22。

在步骤2540中，在确定每个样本的损失函数后，基于误差函数，训练总体模型。其中，训练总体模型是指联合训练所包含的第一模型和第二模型。训练的目的是为了使误差函数降低，误差函数降低代表了预测结果更加准确。因此，训练过程是通过更新第一模型和第二模型中的参数，使得基于更新后的模型获取的误差函数降低。

基于误差函数训练第一模型和第二模型可以采用反向梯度下降的方法，以使第一模型和第二模型的参数可以朝着误差函数梯度下降的方向更新。

在一个实施例中，如图28所示，基于损失函数，训练总体模型，包括：

步骤2810、基于样本集中的每个样本的损失函数，确定总损失函数；

步骤2820、基于总损失函数，训练总体模型。

在步骤2810中，总损失函数是指样本集中全部样本对应的第一概率与对应的样本标签之间的差距的总和。总损失函数越小代表模型的预测结果越好。

在一个实施例中，基于样本集中的每个样本的损失函数，确定总损失函数，包括：对样本集中每个样本的损失函数求和，得到总损失函数。

在本实施例中，计算总损失函数的过程如公式11所示：

在公式11中，L表示总损失函数，T代表样本集中样本的数量，L_t表示单个样本对应的损失函数，t为样本在样本集中对应的编号。例如，样本集中包括三个样本，其中，样本A的损失函数为0.3，样本B的损失函数为0.45；样本C的损失函数为0.27，那么这时的总损失函数为0.3+0.45+0.27＝1.02。

通过对每个样本的损失函数求和确定总损失函数的优点在于，每个样本对应的损失函数对于确定样本集的总损失函数的贡献是相同的，提高了训练模型时的公平性。

在一个实施例中，基于样本集中的每个样本的损失函数，确定总损失函数，包括：

获取每个样本的置信度；

基于置信度，对每个样本的损失函数进行加权和，得到总损失函数。

置信度指的是对样本预测或估计的信任程度或确信程度。样本的权重是指用来样本对整体模型的贡献程度。样本的权重可以根据具体的算法或任务设定进行调整。样本的置信度，那么该样本对应的权重设定的值较大。因此，在本实施例中，计算总损失函数的过程还可以如公式12所示。

在公式12中，L表示总损失函数，T代表样本集中样本的数量，L_t表示单个样本对应的损失函数，W^t表示基于单个样本的置信度确定的样本权重，t为样本在样本集中对应的编号。例如图29所示，样本集包括五个样本，样本A的置信度为0.95，样本A的损失函数为0.21；样本B的置信度为0.7，样本B的损失函数为0.05；样本C的置信度为0.65，样本C的损失函数为0.10；样本D的置信度为0.8，样本D的损失函数为0.23；样本E的置信度为0.9，样本E的损失函数为0.21。那么，基于置信度可以确定每个样本对应的权重，样本A对应的权重为0.4，样本B对应的权重为0.1，样本C对应的权重为0.05，样本D对应的权重为0.15，样本E对应的权重为0.3。那么，将每个样本对应的权重和损失函数进行加权计算，得到样本A的加权损失函数为0.4*0.21＝0.084，样本B的加权损失函数为0.1*0.05＝0.005，样本C的加权损失函数为0.05*0.1＝0.005，样本D的加权损失函数为0.15*0.23≈0.035，样本E的加权损失函数为0.3*0.21＝0.036。因此，对每个样本的加权损失函数进行加和计算，得到总损失函数为0.084+0.005+0.005+0.035+0.036≈0.165。

通过对每个样本的损失函数求加权和确定总损失函数的优点在于，可以根据实际应用场景为不同的样本设置不同的权重，提高了训练模型的灵活性。

在步骤2820中，在确定样本集对应的总损失函数后，基于总损失函数，训练总体模型。也就是说，在确定样本集对应的总损失函数后，基于总损失函数，联合训练总体模型包含的第一模型和第二模型，训练的目的是为了使总损失函数降低，总损失函数降低代表了预测结果更加准确。因此，训练过程是通过更新第一模型和第二模型中的参数，使得基于更新后的模型获取的总损失函数降低。

步骤2810-步骤2830的实施例的优点在于，通过单个样本的损失函数确定整体样本集的总损失函数，使得每个样本的预测结果都对训练模型产生影响，提高了训练模型的全面性与准确性。

步骤2510-步骤2540的实施例的优点是，按照第一模型的第一输出与第二模型的第二输出的总输出与样本标签，来训练由第一模型和第二模型组成的总体模型。第二模型建模的是头部兴趣的影响，这样可以避免由于内容命中了头部兴趣而得到大幅推荐的局面，即避免造成推荐单一性的问题，提高了内容推送处理中推送内容的多样性。

步骤1010-步骤1040的实施例的优点是，基于样本内容特征、和第一模型训练时的目标对象兴趣基准特征和总体对象兴趣基准特征，通过同时通过比较目标对象的兴趣基准特征与总体对象的兴趣基准特征，了解目标对象在整体用户中的相对兴趣水平。在模型训练时，按照第一模型的第一输出与第二模型的第二输出的总输出与样本标签来训练，这样第一模型就成为了去除了头部兴趣影响的多样性模型，而模型使用的时候可以只使用第一模型，从而减少头部兴趣对内容推送多样性的影响，提高了内容推送处理中推送内容的多样性。

结合第二模型的推送处理过程的详细描述

在一个实施例中，将目标对象特征和目标内容特征输入第一模型，得到推送决策结果。这时的第一模型为完全去除了头部兴趣影响的多样性模型。也就是说，这时的推送决策结果是完全去除目标对象兴趣基准特征和总体对象兴趣基准特征带来的预估偏差后，得到的推送给目标对象的决策结果。

在另一个实施例中，将目标对象特征和目标内容特征输入第一模型，得到为目标对象推送目标内容的第二概率。然后，基于为目标对象推送多个目标内容的多个第二概率，确定推送决策结果。这时的第一模型不是完全去除了头部兴趣影响的多样性模型。也就是说，这时的推送决策结果结合目标对象兴趣基准特征和总体对象兴趣基准特征带来的预估偏差后，得到的推送给目标对象的决策结果。

在该实施例中，如图30所示，将目标对象特征和目标内容特征输入第一模型，得到为目标对象推送目标内容的第二概率，包括：

将目标对象特征和目标内容特征输入第一模型，得到第三输出；

获取目标内容特征、和使用第一模型时的第二兴趣基准特征之间的第二相似度表征；

将第二相似度表征输入与第一模型并联的第二模型，得到第四输出；

用第三权重加权第四输出，得到加权后第四输出，第三权重属于区间【0,1】；

基于第三输出和加权后第四输出的第二总输出，确定第二概率。

第三输出是指在结合部分头部兴趣影响的条件下，将样本内容特征对应的待推送内容推送给样本对象的预测推送值。第三输出是未完全去除了头部兴趣影响的第一模型在最后一层输出的未经过激活函数处理的值。第三输出是一个标量，可以是任意实数范围内的值。第三输出越大表示将样本内容特征对应的待推送内容推送给样本对象的预测置信度越高。

第二相似度表征是指在结合部分头部兴趣影响的条件下，用于评估目标对象对待推送内容兴趣程度的特征。

第四输出是指在结合头部兴趣的影响后，将待推送内容推送给样本对象的预测推送值。第四输出是指第二模型最后一层输出的未经过激活函数处理的值。第四输出是一个标量，可以是任意实数范围内的值。

第三权重是指第二模型的输出对推送决策结果的影响权重。第三权重越大，表示推送决策结果对多样性偏好程度的考虑程度越高。

在一个实施例中，第三权重通过以下方式确定：

获取目标对象的目标多样性偏好程度；

获取推送处理平台的多个平台对象的平均多样性偏好程度；

基于目标多样性偏好程度和平均多样性偏好程度，确定第三权重。

目标多样性偏好程度是指目标对象对于多样性内容的偏好程度。目标多样性偏好程度越大，表示目标对象更偏好被推送多样性的内容，而不是单一兴趣的内容。例如，目标多样性偏好程度可以映射为[0,1]中的任一值，目标多样性偏好程度越接近1，表示目标对象更偏好被推送多样性的内容；目标多样性偏好程度越接近0，表示目标对象更偏好被推送单一兴趣的内容。

平均多样性偏好程度是指推送处理平台的多个平台对象的多样性偏好程度的平均值。平均多样性偏好程度越大，表示平台对象普遍更偏好被推送多样性的内容，而不是单一兴趣的内容。例如，平均多样性偏好程度可以映射为[0,1]中的任一值，平均多样性偏好程度越接近1，表示平台对象普遍更偏好被推送多样性的内容；平均多样性偏好程度越接近0，表示平台对象普遍更偏好被推送单一兴趣的内容。

基于目标多样性偏好程度和平均多样性偏好程度，确定第三权重，可以通过基于目标多样性偏好程度确定第三分数，基于平均多样性偏好程度确定第四分数，基于第三分数和第四分数计算总分数，并根据总分数确定第三权重。

基于目标多样性偏好程度确定第三分数可以通过第四对照表。表6所示的是一个第四对照表的例子。

目标多样性偏好程度	第三分数
		0-0.2	20
0.2-0.4	40
		0.4-0.6	60
0.6-0.8	80
		0.8-1.0	100

表6

参照表6，如果目标多样性偏好程度为0.3，那么对应的第三分数为30。

基于平均多样性偏好程度确定第四分数可以用过第五对照表。表7所示的是一个第五对照表的例子。

表7

参照表7，如果平均多样性偏好程度为0.5，那么对应的第四分数为60。

基于平均多样性偏好程度确定第四分数，基于第三分数和第四分数计算总分数。在一个实施例中，使用平均数的方式计算总分数。例如，第一分数为30，第二分数为60，那么总分数为(30+60)/2＝45。利用平均数的方式计算总分数的优点是，使得目标多样性偏好程度和平均多样性偏好程度对于计算总分数的影响是相同的，提高了确定第三权重的公平性。

在另一实施例中，使用加权平均数的方式计算总分数。在本实施例中，首先需要为第三分数与第四分数分别设置权重。例如，第三分数的权重为0.6，第四分数的权重为0.4，第三分数为30，第四分数为60，那么总分数为30*0.6+60*0.4＝42。利用加权平均数的方式计算总分数的优点是，可以根据实际应用的需要灵活地为目标多样性偏好程度和平均多样性偏好程度设置不同权重，提高了确定第三权重的灵活性。

根据总分数确定第三权重。总分数越高，代表所需要的第三权重越大。

在一个实施例中，可以通过总分数与第三权重的第六对照表确定第三权重。表8所示的是一个第六对照表的例子。

总分数	第三权重
		0-20	0
21-41	0.3
		41-61	0.5
61-81	0.7
		81-100	1

表8

参照表8，如果总分数是15，那么三权重为0；如果总分数是45，那么三权重为0.5。

本实施例可以快速通过分数确定第三权重，便于查询，处理效率高。

第二总输出是指在结合部分头部兴趣影响的条件下，利用样本内容特征与目标对象或平台对象兴趣的第一兴趣基准特征的影响后，将待推送内容推送给样本对象的预测推送值。第二总输出可以是任意实数范围内的值。第二总输出是指第三输出和加权后第四输出加和计算后的值。

第二概率是指在结合部分头部兴趣影响的条件下，模型为样本对象推送对应的样本内容的概率值。基于第三输出和加权后第四输出的第二总输出，确定第二概率，包括：基于第三输出和加权后第四输出的第二总输出，将第二总输出的logit值映射到一个确定的范围内，得到第二概率。因此，如果采用sigmoid函数对第二总输出进行激活函数处理，那么计算第二概率的过程如公式13所示：

在公式13中，是指第二概率，β是指第三权重，logit_debias是指第三输出，logit_bias是指第四输出，(logit_debias+β·logit_bias)是指第二总输出，sigmoid(·)是指sigmoid函数。

本实施例中，在实际推送处理时，基于第一模型得到的第三输出和基于第二模型得到的加权后第四输出，得到第二总输出，并基于第二总输出确定第二概率，能够在减少头部兴趣对内容推送多样性的影响的同时，考虑目标对象自身的兴趣，能够实现对目标对象的个性化推送，并提高了内容推送处理中推送内容的多样性。

本公开实施例的装置和设备描述

可以理解的是，虽然上述各个流程图中的各个步骤按照箭头的表征依次显示，但是这些步骤并不是必然按照箭头表征的顺序依次执行。除非本实施例中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时间执行完成，而是可以在不同的时间执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

需要说明的是，在本申请的各个具体实施方式中，当涉及到需要根据目标内容属性信息或属性信息集合等与目标内容特性相关的数据进行相关处理时，都会先获得目标内容的许可或者同意，而且，对这些数据的收集、使用和处理等，都会遵守相关法律法规和标准。此外，当本申请实施例需要获取目标内容属性信息时，会通过弹窗或者跳转到确认页面等方式获得目标内容的单独许可或者单独同意，在明确获得目标内容的单独许可或者单独同意之后，再获取用于使本申请实施例能够正常运行的必要的目标内容相关数据。

图31为本公开实施例提供的推送处理装置3100的结构示意图。该推送处理装置3100包括：

第一获取单元3110，用于获取目标对象特征和目标内容特征；

第一输入单元3120，用于将目标对象特征和目标内容特征输入第一模型，得到推送决策结果，第一模型通过以下过程训练而成：

将样本集中的样本输入第一模型，得到第一输出，其中，样本包括样本对象特征、和与样本对象特征对应的样本内容特征，样本分配有样本标签；

获取样本内容特征、和第一模型训练时的第一兴趣基准特征之间的第一相似度表征；

将第一相似度表征输入与第一模型并联的第二模型，得到第二输出，其中，第一模型和第二模型组成总体模型；

基于第一输出和第二输出的第一总输出、以及样本标签，训练总体模型。

可选地，第一兴趣基准特征包括目标对象兴趣基准特征和总体对象兴趣基准特征；第一相似度表征包括第一相似度子表征和第二相似度子表征；

第一输入单元3120具体用于：

获取样本内容特征和目标对象兴趣基准特征的第一相似度子表征；

获取样本内容特征和总体对象兴趣基准特征的第二相似度子表征。

可选地，第一输入单元3120具体用于：

将目标对象浏览时长超过第一时长的内容级联成内容序列；

将内容序列向量化为内容序列向量；

对内容序列向量进行池化，得到目标对象兴趣基准特征。

可选地，目标对象兴趣基准特征为多个维度的目标对象兴趣基准特征，第一相似度子表征为多个维度的第一相似度子表征；

第一输入单元3120具体用于：针对多个维度中的每个维度，将维度上目标对象浏览时长超过第一时长的内容级联成内容序列。

可选地，第一输入单元3120具体用于：

基于第一平均时长和第二平均时长，确定第一时长。

可选地，第一输入单元3120具体用于：

获取推送处理平台在当前时间之前的第二时长内的多个待推送内容；

将待推送内容向量化为待推送内容向量；

将多个待推送内容的待推送内容向量累加，得到总体对象兴趣基准特征。

可选地，总体对象兴趣基准特征是分时间批次的，第一输入单元3120具体用于：

获取推送处理平台在当前时间批次的多个待推送内容；

将待推送内容向量化为待推送内容向量；

基于在当前时间批次多个待推送内容的待推送内容向量的累加和、以及上一个时间批次的总体对象兴趣基准特征，确定当前时间批次的总体对象兴趣基准特征。

可选地，第一输入单元3120具体用于：

获取累加和的第一权重，其中，第一权重属于区间(0，1)；

可选地，第一输入单元3120具体用于：

获取目标内容的推送统计量特征；

将第一相似度表征、与推送统计量特征输入与第一模型并联的第二模型，得到第二输出。

可选地，推送统计量特征包括曝光量和点击量；

第一输入单元3120具体用于：

获取目标内容推送给推送处理平台的多个平台对象的次数，作为曝光量；

获取在推送目标内容后多个平台对象对目标内容点击的次数，作为点击量。

可选地，第一输入单元3120具体用于：

将第一输出和第二输出加和，得到第一总输出；

基于第一总输出，确定为样本对象推送样本内容的第一概率；

基于第一概率和样本标签，计算损失函数；

基于损失函数，训练总体模型。

可选地，在将样本集中的样本输入第一模型，得到第一输出之前，第一模型的训练过程还包括：

第二获取单元(未示出)，具体用于获取样本集；

第一输入单元3120具体用于：

基于样本集中的每个样本的损失函数，确定总损失函数；

基于总损失函数，训练总体模型。

可选地，第一输入单元3120具体用于：

获取每个样本的置信度；

可选地，第一输入单元3120具体用于：

将目标对象特征和目标内容特征输入第一模型，得到为目标对象推送目标内容的第二概率；

基于为目标对象推送多个目标内容的多个第二概率，确定推送决策结果。

可选地，第一输入单元3120具体用于：

获取目标对象的目标多样性偏好程度；

获取推送处理平台的多个平台对象的平均多样性偏好程度；

参照图32，图32为实现本公开实施例的推送处理方法的终端的部分的结构框图，该终端包括：射频(Radio Frequency，简称RF)电路3210、存储器3215、输入单元3230、显示单元3240、传感器3250、音频电路3260、无线保真(wireless fidelity，简称WiFi)模块3270、处理器3280、以及电源3290等部件。本领域技术人员可以理解，图32示出的终端结构并不构成对手机或电脑的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

RF电路3210可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器3280处理；另外，将设计上行的数据发送给基站。

存储器3215可用于存储软件程序以及模块，处理器3280通过运行存储在存储器3215的软件程序以及模块，从而执行内容终端的各种功能应用以及数据处理。

输入单元3230可用于接收输入的数字或字符信息，以及产生与内容终端的设置以及功能控制有关的键信号输入。具体地，输入单元3230可包括触控面板3231以及其他输入装置3232。

显示单元3240可用于显示输入的信息或提供的信息以及内容终端的各种菜单。显示单元3240可包括显示面板3241。

音频电路3260、扬声器3261，传声器3262可提供音频接口。

在本实施例中，该终端所包括的处理器3280可以执行前面实施例的推送处理方法。

本公开实施例的终端包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。本发明实施例可应用于各种场景，包括但不限于内容推荐、数据筛选等。

图33为实施本公开实施例的推送处理方法的服务器的部分的结构框图。服务器可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(CentralProcessing Units，简称CPU)3322(例如，一个或一个以上处理器)和存储器3332，一个或一个以上存储应用程序3342或数据3344的存储介质3330(例如一个或一个以上海量存储装置)。其中，存储器3332和存储介质3330可以是短暂存储或持久存储。存储在存储介质3330的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器3322可以设置为与存储介质3330通信，在服务器上执行存储介质3330中的一系列指令操作。

服务器还可以包括一个或一个以上电源3326，一个或一个以上有线或无线网络接口3350，一个或一个以上输入输出接口3358，和/或，一个或一个以上操作系统3341，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

服务器中的中央处理器3322可以用于执行本公开实施例的推送处理方法。

本公开实施例还提供一种计算机可读存储介质，计算机可读存储介质用于存储程序代码，程序代码用于执行前述各个实施例的推送处理方法。

本公开实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程序。计算机设备的处理器读取该计算机程序并执行，使得该计算机设备执行实现上述的推送处理方法。

本公开的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的内容，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“包含”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或装置不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或装置固有的其它步骤或单元。

应当理解，在本公开中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联内容的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联内容是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

应了解，在本公开实施例的描述中，多个(或多项)的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。

在本公开所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)执行本公开各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

还应了解，本公开实施例提供的各种实施方式可以任意进行组合，以实现不同的技术效果。

以上是对本公开的实施方式的具体说明，但本公开并不局限于上述实施方式，熟悉本领域的技术人员在不违背本公开精神的条件下还可作出种种等同的变形或替换，这些等同的变形或替换均包括在本公开权利要求所限定的范围内。

Claims

1.一种推送处理方法，其特征在于，包括：

获取目标对象特征和目标内容特征；

2.根据权利要求1所述的推送处理方法，其特征在于，所述第一兴趣基准特征包括目标对象兴趣基准特征和总体对象兴趣基准特征；所述第一相似度表征包括第一相似度子表征和第二相似度子表征；

所述获取所述样本内容特征、和所述第一模型训练时的第一兴趣基准特征之间的第一相似度表征，包括：

3.根据权利要求2所述的推送处理方法，其特征在于，所述目标对象兴趣基准特征通过以下方式获取：

将所述内容序列向量化为内容序列向量；

4.根据权利要求3所述的推送处理方法，其特征在于，所述目标对象兴趣基准特征为多个维度的所述目标对象兴趣基准特征，所述第一相似度子表征为多个所述维度的所述第一相似度子表征；

所述将所述目标对象浏览时长超过第一时长的内容级联成内容序列，包括：针对多个所述维度中的每个所述维度，将所述维度上所述目标对象浏览时长超过第一时长的内容级联成内容序列。

5.根据权利要求3所述的推送处理方法，其特征在于，所述第一时长通过以下方式确定：

6.根据权利要求2所述的推送处理方法，其特征在于，所述总体对象兴趣基准特征通过以下方式获取：

将所述待推送内容向量化为待推送内容向量；

7.根据权利要求2所述的推送处理方法，其特征在于，所述总体对象兴趣基准特征是分时间批次的，当前时间批次的所述总体对象兴趣基准特征通过以下方式获取：

获取推送处理平台在所述当前时间批次的多个待推送内容；

将所述待推送内容向量化为待推送内容向量；

8.根据权利要求7所述的推送处理方法，其特征在于，所述基于在所述当前时间批次多个所述待推送内容的所述待推送内容向量的累加和、以及上一个时间批次的所述总体对象兴趣基准特征，确定所述当前时间批次的所述总体对象兴趣基准特征，包括：

9.根据权利要求1所述的推送处理方法，其特征在于，所述将所述第一相似度表征输入与所述第一模型并联的第二模型，得到第二输出，包括：

获取所述目标内容的推送统计量特征；

10.根据权利要求9所述的推送处理方法，其特征在于，所述推送统计量特征包括曝光量和点击量；

所述获取所述目标内容的推送统计量特征，包括：

获取所述目标内容推送给推送处理平台的多个平台对象的次数，作为所述曝光量；

11.根据权利要求1所述的推送处理方法，其特征在于，所述基于所述第一输出和所述第二输出的第一总输出、以及所述样本标签，训练所述总体模型，包括：

基于所述第一概率和所述样本标签，计算损失函数；

基于所述损失函数，训练所述总体模型。

12.根据权利要求11所述的推送处理方法，其特征在于，在将样本集中的样本输入所述第一模型，得到第一输出之前，所述第一模型的训练过程还包括：获取样本集；

所述基于所述损失函数，训练所述总体模型，包括：

基于所述总损失函数，训练所述总体模型。

13.根据权利要求12所述的推送处理方法，其特征在于，所述基于所述样本集中的每个样本的所述损失函数，确定总损失函数，包括：

获取每个所述样本的置信度；

14.根据权利要求1所述的推送处理方法，其特征在于，所述将所述目标对象特征和所述目标内容特征输入第一模型，得到推送决策结果，包括：

15.根据权利要求14所述的推送处理方法，其特征在于，所述将所述目标对象特征和所述目标内容特征输入第一模型，得到为所述目标对象推送所述目标内容的第二概率，包括：

16.根据权利要求15所述的推送处理方法，其特征在于，所述第三权重通过以下方式确定：

获取目标对象的目标多样性偏好程度；

获取推送处理平台的多个平台对象的平均多样性偏好程度；

17.一种推送处理装置，其特征在于，包括：

第一获取单元，用于获取目标对象特征和目标内容特征；

18.一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现根据权利要求1至16任意一项所述的推送处理方法。

19.一种计算机可读存储介质，所述存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现根据权利要求1至16任意一项所述的推送处理方法。

20.一种计算机程序产品，该计算机程序产品包括计算机程序，所述计算机程序被计算机设备的处理器读取并执行，使得该计算机设备执行根据权利要求1至16任意一项所述的推送处理方法。