CN113902103A

CN113902103A - 模型训练方法、点击率确定方法、介质、装置和计算设备

Info

Publication number: CN113902103A
Application number: CN202111262649.7A
Authority: CN
Inventors: 石佳影; 许盛辉; 潘照明
Original assignee: Netease Media Technology Beijing Co Ltd
Current assignee: Netease Media Technology Beijing Co Ltd
Priority date: 2021-10-28
Filing date: 2021-10-28
Publication date: 2022-01-07

Abstract

本公开公开了模型训练方法、点击率确定方法、介质、装置和计算设备。该模型训练方法包括：确定获取多个训练样本，训练样本包括样本多媒体的多个静态属性数据，静态属性数据表示样本多媒体自身的性质；获取训练样本对应的标签数据，标签数据用于表示样本多媒体的实际点击率等级；将训练样本输入点击率预测模型，得到训练输出点击率等级；根据标签数据和训练输出点击率等级，调整点击率预测模型，以得到训练完成的点击率预测模型。本公开采用多媒体的静态属性数据作为点击率的预测的依据，能够有效增加点击率预测的应用场景，不用依赖用户的点击行为进行建模分析，进一步增强训练得到的点击率预测模型的健壮性和稳定性。

Description

模型训练方法、点击率确定方法、介质、装置和计算设备

技术领域

本公开的实施方式涉及多媒体技术领域，更具体地，本公开的实施方式涉及模型训练方法、点击率确定方法、介质、装置和计算设备。

背景技术

本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

多媒体的点击率是指当前多媒体被用户点击的次数和曝光给用户的次数的比值。多媒体的点击率能够体现用户对该多媒体的喜好以及系统推荐该多媒体的合理性。

多媒体的点击率是对待曝光的多媒体进行排序的参考数据。其中，目前预测多媒体的点击率的方法，均需要结合用户的点击行为，因此对于未曝光过的多媒体的点击率无法准确预测。

发明内容

在本上下文中，本公开的实施方式期望提供一种模型训练方法、点击率确定方法、介质、装置和计算设备，以解决目前无法对未曝光过的多媒体的点击率准确预测的问题。

在本公开实施方式的第一方面中，提供了一种模型训练方法，包括：获取多个训练样本，训练样本包括样本多媒体的多个静态属性数据，静态属性数据表示样本多媒体自身的性质；获取训练样本对应的标签数据，标签数据用于表示样本多媒体的实际点击率等级；将训练样本输入点击率预测模型，得到训练输出点击率等级；根据标签数据和训练输出点击率等级，调整点击率预测模型，以得到训练完成的点击率预测模型。

在本公开的一个实施例中，点击率预测模型为单分类模型，单分类模型的分类个数与点击率等级划分的个数相同，将训练样本输入点击率预测模型，得到训练输出点击率等级，包括：将训练样本输入点击率预测模型，得到不同点击率等级的概率值；确定概率值中最大概率值对应的点击率等级为训练输出点击率等级。

在本公开的另一实施例中，静态属性数据包括：样本多媒体的封面图像和样本多媒体的文本数据；将训练样本输入点击率预测模型，得到不同点击率等级的概率值，包括：将封面图像输入卷积神经网络，得到第一特征向量；将文本数据输入嵌入网络，得到第二特征向量；将第一特征向量和第二特征向量拼接后，得到拼接特征向量；将拼接特征向量输入全连接层，得到不同点击率等级的概率值。

在本公开的又一个实施例中，文本数据包括：标题数据、内容数据和关联数据，关联数据用于表示样本多媒体的质量，嵌入网络包括：词嵌入网络、预训练嵌入网络和查找嵌入网络，将文本数据输入嵌入网络，得到第二特征向量，包括：将标题数据输入词嵌入网络，得到第一子特征向量；将内容数据输入预训练嵌入网络，得到第二子特征向量；将关联数据输入查找嵌入网络，得到第三子特征向量；将第一子特征特征向量、第二子特征向量和第三子特征拼接后，得到第二特征向量。

在本公开的又一个实施例中，获取多个训练样本，包括：获取预设历史时间内曝光过的样本多媒体的曝光日志；对同一样本多媒体的曝光日志进行预处理，得到不重复的备用数据；在备用数据中筛选出属于预设样本词典的训练样本，预设样本词典用于表示样本多媒体的静态属性。

在本公开的又一个实施例中，获取预设历史时间内曝光过的样本多媒体的曝光日志，包括：每隔预设时间，获取预设历史时间内曝光过的样本多媒体的曝光日志，曝光日志是由多媒体库中的多媒体在曝光时产生的，多媒体库中的多媒体实时更新。

在本公开的又一个实施例中，获取训练样本对应的标签数据，包括：获取训练样本对应的当前点击率；根据当前点击率，按照预设的映射规则，确定训练样本对应的实际点击率等级，当前点击率和实际点击率等级正相关，实际点击率等级用于表示标签数据。

在本公开的又一个实施例中，根据标签数据和训练输出点击率等级，调整点击率预测模型，以得到训练完成的点击率预测模型，包括：根据标签数据和训练输出点击率等级，确定点击率预测模型对应的交叉熵损失函数；根据交叉损失函数调整点击率预测模型，以得到训练完成的点击率预测模型。

在本公开实施方式的第二方面中，提供了一种点击率确定方法，包括：获取待检测多媒体的静态属性数据；将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体的目标点击率等级，点击率预测模型为根据第一方面任一项模型训练方法进行训练而获得，目标点击率等级用于表示待检测多媒体的点击率范围。

在本公开的一个实施例中，将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体的目标点击率等级，包括：将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体在不同点击率等级下的概率值；确定概率值中最大概率值对应的点击率等级为目标点击率等级。

在本公开的一个实施例中，点击率确定方法还包括：采用以下公式确定待检测多媒体的点击率评分：

上式中，s表示点击率评分，t表示设定的最大点击率等级，i表示点击率等级的取值，p_i表示点击率等级为i时的概率值，点击率评分用于表示待检测多媒体的点击率预估值。

在本公开实施方式的第三方面中，提供了一种模型训练装置，包括：

第一获取模块，用于获取多个训练样本，训练样本包括样本多媒体的多个静态属性数据，静态属性数据表示样本多媒体自身的性质；

第二获取模块，用于获取训练样本对应的标签数据，标签数据用于表示样本多媒体的实际点击率等级；

点击率确定模块，用于将训练样本输入点击率预测模型，得到训练输出点击率等级；

调整模块，用于根据标签数据和训练输出点击率等级，调整点击率预测模型，以得到训练完成的点击率预测模型。

在本公开的一个实施例中，点击率预测模型为单分类模型，单分类模型的分类个数与点击率等级划分的个数相同，点击率确定模块，包括：

输入单元，用于将训练样本输入点击率预测模型，得到不同点击率等级的概率值；

确定单元，用于确定概率值中最大概率值对应的点击率等级为训练输出点击率等级。

在本公开的一个实施例中，静态属性数据包括：样本多媒体的封面图像和样本多媒体的文本数据；输入单元，包括：

第一输入子单元，用于将封面图像输入卷积神经网络，得到第一特征向量；

第二输入子单元，用于将文本数据输入嵌入网络，得到第二特征向量；

第三输入子单元，用于将第一特征向量和第二特征向量拼接后，得到拼接特征向量；

第四输入子单元，用于将拼接特征向量输入全连接层，得到不同点击率等级的概率值。

在本公开的一个实施例中，文本数据包括：标题数据、内容数据和关联数据，关联数据用于表示样本多媒体的质量，嵌入网络包括：词嵌入网络、预训练嵌入网络和查找嵌入网络，第二输入子单元，具体用于：将标题数据输入词嵌入网络，得到第一子特征向量；将内容数据输入预训练嵌入网络，得到第二子特征向量；将关联数据输入查找嵌入网络，得到第三子特征向量；将第一子特征特征向量、第二子特征向量和第三子特征拼接后，得到第二特征向量。

在本公开的一个实施例中，第一获取模块，包括：

获取单元，用于获取预设历史时间内曝光过的样本多媒体的曝光日志；

处理单元，用于对同一样本多媒体的曝光日志进行预处理，得到不重复的备用数据；

筛选单元，用于在备用数据中筛选出属于预设样本词典的训练样本，预设样本词典用于表示样本多媒体的静态属性。

在本公开的一个实施例中，获取单元，具体用于：每隔预设时间，获取预设历史时间内曝光过的样本多媒体的曝光日志，曝光日志是由多媒体库中的多媒体在曝光时产生的，多媒体库中的多媒体实时更新。

在本公开的一个实施例中，第二获取模块，具体用于：获取训练样本对应的当前点击率；根据当前点击率，按照预设的映射规则，确定训练样本对应的实际点击率等级，当前点击率和实际点击率等级正相关，实际点击率等级用于表示标签数据。

在本公开的一个实施例中，调整模块，具体用于：根据标签数据和训练输出点击率等级，确定点击率预测模型对应的交叉熵损失函数；根据交叉损失函数调整点击率预测模型，以得到训练完成的点击率预测模型。

在本公开实施方式的第四方面中，提供了一种点击率确定装置，包括：

获取模块，用于获取待检测多媒体的静态属性数据；

点击率确定模块，用于将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体的目标点击率等级，点击率预测模型为根据第三方面任一项模型训练装置进行训练而获得，目标点击率等级用于表示待检测多媒体的点击率范围。

在本公开的一个实施例中，点击率确定模块，具体用于：将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体在不同点击率等级下的概率值；确定概率值中最大概率值对应的点击率等级为目标点击率等级。

在本公开的一个实施例中，点击率确定装置，还包括：

确定模块，用于采用以下公式确定待检测多媒体的点击率评分：

在本公开实施方式的第五方面中，提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序指令，计算机程序指令被执行时，实现如上述第一方面或第二方面中任一项的方法。

在本公开实施方式的第六方面中，提供了一种计算设备，包括：存储器和处理器；存储器用于存储程序指令；处理器用于调用存储器中的程序指令执行如上述第一方面或第二方面中任一项的方法。

根据本公开实施方式的获取多个训练样本，训练样本包括样本多媒体的多个静态属性数据，静态属性数据表示样本多媒体自身的性质；获取训练样本对应的标签数据，标签数据用于表示样本多媒体的实际点击率等级；将训练样本输入点击率预测模型，得到训练输出点击率等级；根据标签数据和训练输出点击率等级，调整点击率预测模型，以得到训练完成的点击率预测模型。一方面采用多媒体的静态属性数据作为点击率的预测的依据，能够有效增加点击率预测的应用场景，不用依赖用户的点击行为进行建模分析。另一方面采用多媒体的多个静态属性数据是多方面特征的组合结果，单一特征的误差影响得以减弱，能够增强训练得到的点击率预测模型的健壮性和稳定性。

附图说明

通过参考附图阅读下文的详细描述，本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：

图1示意性地示出了根据本公开实施方式的模型训练方法的应用场景图；

图2示意性地示出了根据本公开一实施例的模型训练方法的步骤流程图；

图3示意性地示出了根据本公开另一实施例的模型训练方法的步骤流程图；

图4示意性地示出了根据本公开一实施例的点击率预测模型的结构示意图；

图5示意性地示出了根据本公开一实施例的点击率确定方法的步骤流程图；

图6示意性地示出了根据本公开另一实施例的点击率确定方法的步骤流程图；

图7示意性地示出了根据本公开一实施例的计算机存储介质的结构示意图；

图8示意性地示出了根据本公开一实施例的模型训练装置的结构框图；

图9示意性地示出了根据本公开一实施例的点击率确定装置的结构框图；

图10示意性地示出了根据本公开一实施例的计算设备的结构框图。

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本公开的实施方式，提出了一种模型训练方法、介质、装置和计算设备。

在本文中，需要理解的是，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本公开的若干代表性实施方式，详细阐释本公开的原理和精神。

发明概述

本发明人发现，第一种点击率预测模型是采用逻辑回归方法(LogisticRegression,LR)，该点击率预测模型结构简单，可解释性强。具体的，该点击率预测模型是将视频的各个特征以加权求和的形式进行特征计算，逻辑回归的激活函数(sigmoid)取值范围是0到1，该激活函数的输出值用于解释视频的点击概率。并且，该点击率预测模型经过长期的优化发展，可以在原始的逻辑回归公式上添加平方等计算或者自定义特征作为额外特征补充，进一步优化视频的内容表示。

但是，该第一种点击率预测模型由视频特征向点击率拟合的方式很大程度上依赖逻辑回归的公式定义，这样会受限于先验知识。并且通过增加特征复杂度的方式优化逻辑回归的方法，一些起重要作用的交叉特征无法被线性模型表达，需要人工加入这些交叉特征来扩展输入，这会导致算法的可扩展性不强。此外，也会大幅度提升特征的难度，进而会导致样本数据的过拟合，从而无法处理复杂的实际应用场景。

其中，第二种点击率预测模型是因子分解机模型(Factorization Machines,FM)，因子分解机模型可以表示为特征的一阶交叉项与二阶交叉项之和，不区分视频静态特征还是动态特征，该第二种点击率预测模型是通过给每维特征学习一个低维嵌入向量，然后用嵌入向量的内积来表示交叉系数，这样可以降低该第二种点击率预测模型的参数个数，使得模型学习交叉特征变得可行，最终增加模型的实用性，将每维特征对应到一个嵌入向量上还会带来一个优点：只要训练集中该特征的非零取值次数足够多，对应的嵌入向量就能得到充分训练，这样就能通过嵌入向量的内积计算出交叉特征的系数，而并不要求交叉项在训练集中出现很多次。

虽然，该第二种点击率预测模型在一定程度上避免了由于特征交叉和特征增多带来的模型参数问题，但是由于该第二种点击率预测模型只对二阶交叉特征进行了建模，然而实际应用场景中更高阶特征交叉对点击率的预估也很重要，因此限制了该第二种点击率预测模型的应用场景。

此外，为了应对更为复杂的应用场景，充分利用到用户行为特征和视频内容特征。一些深度学习的方法也成为了预估点击率的常用手段。深度学习方法往往通过增加网络的深度和特征的交叉计算，让该第三种点击率预测模型能够学习高阶特征交叉。常见的方法有深度因子分解机(Deep FM)、深度兴趣网络(DIN)等。这些方法将点击率预测问题关注的特征交叉工程和深度学习网络关注的特征相结合。比如DIN先对用户的每一个历史行为进行编码，然后通过局部注意力模块计算出这些历史行为的注意力权重向量，最后将注意力权重与历史行为编码向量相乘，做加权求和后即获得用户的特征编码；用户特征与其他特征以及视频特征拼接在一起，输入到多层神经网络中，最终得到视频点击率预测值。

但是，该第三种点击率预测模型需要结合用户点击行为的样本(正样本)，但是该样本往往只占总样本的很小一部分，这会给预测正样本带来很大的挑战。并且由于正负样本比例的不同，大多数分类器都会更偏向于给出偏向负样本的预测结果。此外，该第三种点击率预测模型为深度模型，而深度模型的复杂度也会引起模型的过拟合，表现在训练集和测试集的效果大不同。

本公开基于上述问题，提供一种模型训练方法，可以只采用样本多媒体的静态属性数据，进行点击率预测模型的训练，进而能够使训练得到的点击率预测模型应用到没有被用户点击的多媒体的预测，并达到一个准确的预测结果。

介绍了本公开的基本原理之后，下面具体介绍本公开的各种非限制性实施方式。

应用场景总览

首先参考图1，为本公开提供的模型训练方法的应用场景图，具体在服务器11的多媒体库111中存储有多个多媒体，其中，多媒体在多媒体库中具有点击率排序，服务器11会在多媒体库111中查找对应的多媒体，在用户通过客户端12进入页面时，将该多媒体推送给该客户端12进行显示。其中，当多媒体显示时，会产生对应的曝光日志，服务器将该多媒体的曝光日志对应存储在日志存储空间112中，用于服务器11训练模型时调用。

其中，用户通过客户端12进入页面时页面上会显示当前播放的多媒体的标题121，正在播放的多媒体122，还有其他多个多媒体的标题123按照顺序显示。此外，正在播放的多媒体122可以是点击率最高的多媒体，其他多个多媒体的标题123也可以是按照对应的点击率排序，并且当用户触发某个标题123时，可以播放对应的多媒体。

进一步的，若正在播放的多媒体122或者其他多个多媒体的标题123对应的多媒体均未被曝光过，则需要预先预估这些多媒体的点击率，然后可以按照点击率的大小，确定在页面的显示位置。

示例性方法

下面结合图1的应用场景，参考图2来描述根据本公开示例性实施方式的模型训练方法。需要注意的是，上述应用场景仅是为了便于理解本公开的精神和原理而示出，本公开的实施方式在此方面不受任何限制。相反，本公开的实施方式可以应用于适用的任何场景。

图2示出本公开提供的一种模型训练方法的步骤流程图，具体包括如下步骤：

S201，获取多个训练样本。

其中，训练样本包括样本多媒体的多个静态属性数据，静态属性数据表示样本多媒体自身的性质。

在本公开中，样本多媒体包括视频、音频、图片或者广告等内容。以下描述中以视频为例说明本公开内容。具体的，样本多媒体是指存储在多媒体库中，已经曝光过的数据。其中，多媒体库中存储有大量的多媒体数据，一部分多媒体数据被曝光过，即在客户端的页面上显示过，可以作为样本多媒体，一部分多媒体数据还未被曝光过，但是多媒体库中的任一多媒体数据均可以被服务器调用形成页面。

进一步的，多媒体库中的样本多媒体具有时效，并且实时更新。示例性的，若设置多媒体库中的样本多媒体的时效是6个月，则将多媒体库中存储超过6个月的样本多媒体删除，并且向多媒体库中增加新的多媒体，实现多媒体库中的样本多媒体的实时更新。

此外，样本多媒体具有静态属性数据。例如，样本多媒体的身份信息(ID)、样本多媒体的标题、样本多媒体的分类、兴趣点、关键词、标签、发布账号名、发布账号的身份信息(ID)、发布账号等级、质量分、质量等级、时效、封面地址(URL)、标识、封面清晰度、内容清晰度、三俗分、标题党标识等中的多项。这些静态属性数据能够表示样本多媒体自身的性质，一个样本多媒体的多个静态属性数据组成了该样本多媒体对应的一个训练样本。

S202，获取训练样本对应的标签数据。

其中，标签数据用于表示样本多媒体的实际点击率等级。

具体的，样本多媒体是指被曝光过的多媒体数据，则样本多媒体被曝光后，具有对应的点击率。其中，点击率是指多媒体的曝光点击率(click-through rate，ctr)，点击率表示多媒体被用户点击的次数与被曝光给用户的次数的比值，点击率在一定程度上体现了该多媒体在用户维度的喜好和给用户推荐的合理性。

此外，根据样本多媒体的点击率，确定该样本多媒体所属的实际点击率等级，为对应训练样本的标签数据。

示例性的，若样本多媒体的点击率小于0.08，则确定实际点击率等级为0，则0作为训练样本的标签数据。若样本多媒体的点击率大于或等于0.08，且小于0.13，则确定实际点击率等级为1，则1作为训练样本的标签数据。若样本多媒体的点击率大于或等于0.13，则确定实际点击率等级为2，则2作为训练样本的标签数据。

在本公开中，存储器中可以预先存储当前样本多媒体的训练样本和标签数据，则在训练点击率预测模型时，可以直接获取训练样本和对应的标签数据训练点击率预测模型。

S203，将训练样本输入点击率预测模型，得到训练输出点击率等级。

其中，点击率预测模型为单分类模型。将训练样本输入点击率预测模型后，会输出一个值为训练输出点击率等级。

S204，根据标签数据和训练输出点击率等级，调整点击率预测模型，以得到训练完成的点击率预测模型。

其中，标签数据为真值，训练输出点击率等级为预估值，可以根据真值和预估值之间的差值，调整点击率预测模型的参数，采用调整后的点击率预测模型，继续执行步骤S203和S204，直到调整后的点击率预测模型满足收敛要求，或者满足训练次数。示例性的，可以设置点击率预测模型每天都更新，一天循环执行10次步骤S203和S204，这样得到当前训练完成的点击率预测模型。

此外，由于多媒体库中的多媒体会实时更新，并且每天会有多媒体库中的多媒体曝光，产生新的曝光日志，因此，可以每天选取新的曝光日志训练点击率预测模型，当天训练完成的点击率预测模型用于第二天未曝光多媒体的点击率预测，并且第二天训练点击率预测模型是以前一天训练完成的点击率预测模型为基础进行训练。进而达到了点击率预测模型的实时性，进一步提高多媒体点击率预测的准确性。

本公开实施方式一方面采用多媒体的静态属性数据作为点击率的预测的依据，能够有效增加点击率预测的应用场景，不用依赖用户的点击行为进行建模分析。另一方面采用多媒体的多个静态属性数据是多方面特征的组合结果，单一特征的误差影响得以减弱，能够增强训练得到的点击率预测模型的健壮性和稳定性。

图3示出本公开提供的另一种模型训练方法的步骤流程图，具体包括如下步骤：

S301，获取预设历史时间内曝光过的样本多媒体的曝光日志。

其中，每隔预设时间，获取预设历史时间内曝光过的样本多媒体的曝光日志，曝光日志是由多媒体库中的多媒体在曝光时产生的，多媒体库中的多媒体实时更新。

具体的，预设历史时间可以是10天、8天、5天或者3天等。预设时间可以是24小时或者12小时。比如，可以每隔24小时，获取10天内曝光过的样本多媒体的曝光日志。这样每24小时训练一次点击率预测模型，每次训练点击率预测模型的迭代次数为10个循环(epoch)。

S302，对同一样本多媒体的曝光日志进行预处理，得到不重复的备用数据。

在本公开中，在预设历史时间内，每个样本多媒体可能会在不同时间被曝光，并且每次曝光都会产生曝光日志。其中，同一个样本多媒体的曝光日志中包含的静态属性数据是相同的，不同的是动态属性数据。因此，对同一样本多媒体的曝光日志进行预处理，得到不重复的备用数据，是指在同一样本多媒体的多个曝光日志中，确定其中一个曝光日志的所有数据为不重复的备用数据。

其中，样本多媒体具有身份信息(ID)，因此可以根据身份信息在多个曝光日志中确定属于同一样本多媒体的各曝光日志。

其中，曝光日志包括大量的数据，包括静态属性数据和动态数据，其中，动态数据为用户的交互数据。例如，动态数据包括：点击该样本多媒体的用户的身份信息，用户的性别，年龄等。

此外，本公开也可以通过样本多媒体的身份信息，在预设的数据库中获取该样本多媒体对应的静态属性数据。该预设的数据中存储有各样本多媒体的身信息与其静态属性数据的对应关系。

S303，在备用数据中筛选出属于预设样本词典的训练样本。

其中，预设样本词典用于表示样本多媒体的静态属性。预设样本词典如表一，可以按照表一的预设样本词典，在备用数据中筛选属于预设样本词典的训练样本。

表一

编号	字段名	字段含义	字段取值属性
				1	Docid	多媒体ID	字符串
2	Title	多媒体标题	字符串
				3	Category	多媒体分类	字符串
4	Poi	兴趣点	字符串
				5	Key_word	关键词	字符串
6	Tags	标签	字符串
				7	Source_name	发布账号名	字符串
8	Source_id	发布账号ID	整型
				9	Source_lv	发布账号等级	整型
10	Quality	多媒体质量分	浮点型
				11	Quality_lv	多媒体等级	整型
12	Exp_time	多媒体时效	整型
				13	Cover	封面url	字符串
14	Short_video	多媒体标识	整型
				15	Def_cover	封面清晰度	整型
16	Def_video	多媒体清晰度	整型
				17	Vulgar	三俗分	浮点型
18	Cheat	标题党标识	整型

在表一中多媒体ID是指多媒体的身份信息。多媒体标题如图1中的“如何做出一盘好吃的红烧肉”、“我的家乡”、“经济布局”、“小王的生活”或“财经事件”。多媒体分类包括：国际新闻、社会、娱乐或生活等。兴趣点(POI)是描述该多媒体的数据，是预设的成体系的数据，例如，对于图1中的视频“如何做出一盘好吃的红烧肉”的兴趣点可以是“美食制作”。关键词是描述该多媒体内容的数据，例如，对于图1中的视频“如何做出一盘好吃的红烧肉”的关键词可以是“红烧肉”。标签也是描述该多媒体的数据，例如，对于图1中的视频“如何做出一盘好吃的红烧肉”的标签可以是“肉”、“制作”和“美食”等。发布账号名是指制作或上传该多媒体的账号名。发布账号ID是指制作或上传该多媒体的账号的身份信息。

此外，发布账号等级可以是根据预设规则确定的该发布账号的等级，例如，若该发布账号几乎没有发布过视频，则等级为0，若该发布账号偶尔少量发布过视频，则等级为1。若该发布账号经常发布视频，但是视频点击率较低，则等级为2。若该发布账号经常发布视频，并且点击率较高，则等级为3。多媒体质量分是预先根据预设规则给予该多媒体设定的分数，如90分、60分或40分等。多媒体等级是预先根据预设规则给予该多媒体设定的等级，如1级、2级或者3级。多媒体时效是指多媒体可以在多媒体库中保存的时长，如6个月或3个月。封面url是指多媒体封面的地址信息。例如，可以设定小于30秒的视频的多媒体视频的多媒体标识为1，表示短视频，可以设定大于或等于30秒的视频的多媒体视频的多媒体标识为2。封面清晰度包括0,1,2或3。其中，3是指清晰度较高，0是指清晰度很差。多媒体清晰度是指多媒体内容的清晰度，如视频内容的清晰度，也可以是0,1,2或3。其中，3是指清晰度较高，0是指清晰度很差。三俗分是指属于三俗的分数，如0，则代表没有三俗内容，若为1则为具有少量三俗内容，若为2则为存在大量三俗内容。标题党标识是指标题与内容的符合程度，若为0，则完全符合不属于标题党，若为1，表示标题与内容有少许不符，若为2则表示标题与内容完全不同，为标题党视频。

S304，获取训练样本对应的当前点击率。

其中，当前点击率也可以从曝光日志中确定，曝光日志中具有对应样本多媒体的曝光次数，以及被点击的次数，可以根据被点击的次数和曝光的次数确定当前点击率。

此外，若训练样本是基于样本多媒体在预设历史时间(如10天)内的曝光日志确定的，则当前点击率也是基于对应样本多媒体在预设历史时间(10天)内的曝光日志确定。

S305，根据当前点击率，按照预设的映射规则，确定训练样本对应的实际点击率等级。

其中，当前点击率和实际点击率等级正相关，实际点击率等级用于表示标签数据。

具体的，预设的映射规则可以是若当前点击率为小于0.08，则确定实际点击率等级为0，则0作为训练样本的标签数据。若样本多媒体的点击率大于或等于0.08，且小于0.13，则确定实际点击率等级为1，则1作为训练样本的标签数据。若样本多媒体的点击率大于或等于0.13，则确定实际点击率等级为2，则2作为训练样本的标签数据。此外，预设的映射规则可以是其他，例如，可以将点击率等级划分为0至3或者0至4等任意多个等级。

S306，将训练样本输入点击率预测模型，得到不同点击率等级的概率值。

其中，点击率预测模型为单分类模型，单分类模型的分类个数与点击率等级划分的个数相同。

此外，将点击率划分为n个等级(0,1，2，…，n-1)，则单分类模型的个数为n。将训练样本输入点击率预测模型，得到的是不同点击率等级的概率值。例如，若点击率划分为3个等级(0,1,2)，单分类模型的个数为3，然后将一训练样本输入点击率预测模型，得到的概率值为(0.1,0.3,0.7)，则可以理解为训练样本对应的点击率等级为0的概率为0.1，为1的概率为0.3，为2的概率为0.7。

在本公开中，静态属性数据至少包括：样本多媒体的封面图像和样本多媒体的文本数据。则，将训练样本输入点击率预测模型，得到不同点击率等级的概率值，包括：将封面图像输入卷积神经网络，得到第一特征向量；将文本数据输入嵌入网络，得到第二特征向量；将第一特征向量和第二特征向量拼接后，得到拼接特征向量；将拼接特征向量输入全连接层，得到不同点击率等级的概率值。

其中，文本数据包括：标题数据、内容数据和关联数据，关联数据用于表示样本多媒体的质量，嵌入网络包括：词嵌入网络、预训练嵌入网络和查找嵌入网络，将文本数据输入嵌入网络，得到第二特征向量，包括：将标题数据输入词嵌入网络，得到第一子特征向量；将内容数据输入预训练嵌入网络，得到第二子特征向量；将关联数据输入查找嵌入网络，得到第三子特征向量；将第一子特征特征向量、第二子特征向量和第三子特征拼接后，得到第二特征向量。

具体的，封面图像可以根据封面url获取。标题数据可以是指表一中的多媒体标题。内容数据可以是指表一中的多媒体分类、兴趣点、关键词、标签和发布账号名中的至少一项。关联数据可以是指表一中的发布账号ID、发布账号等级、多媒体质量分、质量等级、视频时效、多媒体标识、封面清晰度、多媒体清晰度、三俗分和标题党标识中的至少一项。

其中，点击率预测模型的结构示意图如图4，该点击率预测模型40包括：输入层41，卷积神经网络42、嵌入网络43、拼接层44、全连接层45和输出层46。

在本公开中，输入层输入各个静态属性数据。其中，将封面图像输入卷积神经网络，卷积神经网络包括：inception v3模型和第一全连接子层(fc)，采用inception v3模型对封面图像进行特征提取，得到1024维的特征向量，然后将该1024维的特征向量通过第一全连接子层，得到128维的第一特征向量。

其中，词嵌入网络包括：词处理网络(word embedding)和聚合网络(nextvlad)。将标题数据通过词处理(word embedding)进行分词加词，得到词向量，再将词向量通过聚合网络进行词向量之间的聚合，得到128维度的第一子特征向量。

此外，将内容数据通过预训练嵌入网络(pre-train embedding)进行处理，得到维度为64维的第二子特征向量。具体的，由于内容数据包括：多媒体分类、兴趣点等，词表大小较大，如20万，因此，采用预训练嵌入网络对词表进行初始化，对各个内容数据均处理为64维的特征向量。

再者，关联数据为二次加工的属性数据，因此采用查找嵌入网络(look-upembedding)进行向量化，得到维度为4维的第三子特征向量。将第一子特征向量、第二子特征向量和第三子特征向量在拼接层(concat)进行拼接得到第二特征向量，再将第二特征向量和第一特征向量在拼接层拼接得到拼接特征向量。然后将拼接特征向量输入全连接层(包括两层fc)，得到输出维度为128维的n个概率值。其中，n个概率值对应n个不同点击率等级的概率值。

S307，确定概率值中最大概率值对应的点击率等级为训练输出点击率等级。

示例性的，若3个概率值为(0，0，1)，则训练输出点击率等级为2。若3个概率值为(0.8，0.2，0)，则训练输出点击率等级为0。若3个概率值为(0.1，0.7，0.2)，则训练输出点击率等级为1。

S308，根据标签数据和训练输出点击率等级，确定点击率预测模型对应的交叉熵损失函数。

其中，标签数据为实际输出率等级。其中，若标签数据为1，则对应的实际概率值为(0，1,0)，训练输出点击率等级为上述的1，则根据上述对应的输出概率值为(0.1，0.7，0.2)，则可以根据实际概率值(0，1,0)和输出概率值(0.1，0.7，0.2)，确定交叉熵损失函数。其中，采用交叉熵损失函数能够使训练得到的点击率预测模型的具有更好的点击率预估性能。

S309，根据交叉损失函数调整点击率预测模型，以得到训练完成的点击率预测模型。

在本公开中，采用多媒体的静态属性数据作为训练样本进行点击率预测模型的训练，能够扩展点击率预测模型的应用场景。不用依赖于用户具体的点击行为进行点击率预测模型的训练，例如，只需要获取到针对样本多媒体的点击率，而不需要获取点击样本多媒体的用户账号、年龄、偏好数据等具体的信息。此外，本公开的点击率预测模型的基础结构为深度学习网络，具有较强的泛化能力，能够保证线下点击率预测模型对多媒体点击率的测试与线上训练的点击率预测模型的一致性，进而显著的提高了用户在页面的停留时长以及点击率。

进一步的，本公开充分考虑了多媒体的静态属性数据的优点，在训练点击率预测模型时实现静态属性数据的优点的最大化。并且，由于采用了不同维度、不同类型的静态属性数据，以及在点击率预测模型的结构设计上，不同类型的静态属性数据用不同的方式进行特征的提取，最后融合所有特征进行训练输出点击率等级的预测，极大的提高了点击率预测模型的健壮性和稳定性。

最后，本公开能够及时的用最新的训练样本进行点击率预测模型的训练和更新，使得点击率预测模型能够和线上生成的训练样本分布保持一致，使点击率预测模型具有较强的时效性以及与线上的多媒体的一致性。

图5示出本公开提供的一种点击率确定方法的步骤流程图，具体包括如下步骤：

S501，获取待检测多媒体的静态属性数据。

其中，待检测多媒体可以是未曝光的音频或视频等。待检测多媒体的静态属性数据是该待检测多媒体携带的数据，是描述待检测多媒体本身性质的数据。

S502，将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体的目标点击率等级。

其中，可以将静态属性数据输入上述训练好的点击率预测模型中，则可以得到该多媒体的目标点击率等级。

其中，点击率预测模型为根据图2或图3模型训练方法进行训练而获得，目标点击率等级用于表示待检测多媒体的点击率范围。

本公开中，采用上述训练得到的点击率预测模型进行点击率的预测，得到的目标点击率等级是多维度特征对应的结果，因此，单一的静态属性数据的误差对目标点击率等级的影响较弱，进而提高了使用点击率预测模型预测目标点击率等级的准确性。

图6示出本公开提供的另一种点击率确定方法的步骤流程图，具体包括如下步骤：

S601，获取待检测多媒体的静态属性数据。

该步骤的具体实现过程，参照S501，在此不再赘述。

S602，将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体在不同点击率等级下的概率值。

在本公开中，点击率预测模型为单分类模型。示例性的，将待检测多媒体的静态属性数据输入点击率预测模型后，输出的为(0.1,0.2,0.7)，则表示待检测多媒体的点击率等级为0级的概率为0.1，为1级的概率为0.2，为2级的概率为0.7。

S603，确定概率值中最大概率值对应的点击率等级为目标点击率等级。

示例性的，上述点击率预测模型输出的不同点击率等级下的概率值为(0.1,0.2,0.7)，则可以确定该待检测多媒体的目标点击率等级为2。对应可以确定该待检测多媒体的点击率范围为大于0.13。

S604，采用以下公式确定待检测多媒体的点击率评分。

示例性的，若设定的点击率等级为0,1和2。则t为设定的最大点击率等级2。i依次取0,1和2。其中，若待检测多媒体A，在不同点击率等级下的概率值为(0.1,0.2,0.7)则p₀为0.1,p₁为0.2,p₂为0.7，则点击率评分s＝2.6。若待检测多媒体B，在不同点击率等级下的概率值为(0.1,0.1,0.8)则p₀为0.1,p₁为0.1,p₂为0.8，则点击率评分s＝2.7。

其中，点击率评分可以区分相同点击率等级的点击率预估值的大小，例如，在上述待检测多媒体A和待检测多媒体B的点击率等级均为2。但是待检测多媒体A的点击率评分2.6小于待检测多媒体B的点击率评分2.7，则可以确定待检测多媒体A的点击率预估值小于待检测多媒体B的点击率预估值，则对待检测多媒体进行点击率排序时，可以根据对应的点击率评分进行排序，例如，图1中将点击率评分较大的多媒体排在页面的较前面。

本公开中，能够采用待检测多媒体的静态属性数据，在不考虑用户与多媒体的交互情况的前提下预测待检测多媒体的点击率。并且能够根据点击率预测模型输出的在不同点击率等级下的概率值，确定点击率评分，进而能够应用在线上服务端，扩展本公开的应用范围。

示例性介质

在介绍了本公开示例性实施方式的方法之后，接下来，参考图7对本公开示例性实施方式的计算机可读存储介质进行如下说明。

参考图7所示，描述了根据本公开的实施方式的用于实现上述方法的程序产品70，其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备。

示例性装置

在介绍了本公开示例性实施方式的介质之后，接下来，参考图8对本公开示例性实施方式的模型训练装置进行如下说明。

图8示出本公开提供的一种模型训练装置80的结构框图，该模型训练装置80包括：第一获取模块81，第二获取模块82，点击率确定模块83和调整模块84。其中：

第一获取模块81，用于获取多个训练样本，训练样本包括样本多媒体的多个静态属性数据，静态属性数据表示样本多媒体自身的性质；

第二获取模块82，用于获取训练样本对应的标签数据，标签数据用于表示样本多媒体的实际点击率等级；

点击率确定模块83，用于将训练样本输入点击率预测模型，得到训练输出点击率等级；

调整模块84，用于根据标签数据和训练输出点击率等级，调整点击率预测模型，以得到训练完成的点击率预测模型。

在本公开的一个实施例中，点击率预测模型为单分类模型，单分类模型的分类个数与点击率等级划分的个数相同，点击率确定模块83，包括：

在本公开的一个实施例中，第一获取模块81，包括：

在本公开的一个实施例中，第二获取模块82，具体用于：获取训练样本对应的当前点击率；根据当前点击率，按照预设的映射规则，确定训练样本对应的实际点击率等级，当前点击率和实际点击率等级正相关，实际点击率等级用于表示标签数据。

在本公开的一个实施例中，调整模块84，具体用于：根据标签数据和训练输出点击率等级，确定点击率预测模型对应的交叉熵损失函数；根据交叉损失函数调整点击率预测模型，以得到训练完成的点击率预测模型。

本公开提供的模型训练装置可以执行图2和/或图3所示的模型训练方法，具体内容参照上述模型训练方法的说明，在此不再赘述。

接下来，参考图9对本公开示例性实施方式的点击率确定装置进行如下说明。

图9示出本公开提供的一种点击率确定装置90的结构框图，该点击率确定装置90包括：获取模块91和点击率确定模块92。其中：

获取模块91，用于获取待检测多媒体的静态属性数据；

点击率确定模块92，用于将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体的目标点击率等级，点击率预测模型为根据上述任一项模型训练装置进行训练而获得，目标点击率等级用于表示待检测多媒体的点击率范围。

在本公开的一个实施例中，点击率确定模块92，具体用于：将待检测多媒体的静态属性数据输入点击率预测模型，得到待检测多媒体在不同点击率等级下的概率值；确定概率值中最大概率值对应的点击率等级为目标点击率等级。

在本公开的一个实施例中，点击率确定装置，还包括：

确定模块(未示出)，用于采用以下公式确定待检测多媒体的点击率评分：

本公开提供的点击率确定装置可以执行图5和/或图6所示的点击率确定方法，具体内容参照上述点击率确定方法的说明，在此不再赘述。

示例性计算设备

在介绍了本公开示例性实施方式的方法、介质和装置之后，接下来，参考图10对本公开示例性实施方式的计算设备进行说明。

图10显示的计算设备100仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图10所示，计算设备100以通用计算设备的形式表现。计算设备100的组件可以包括但不限于：上述至少一个处理单元101、上述至少一个存储单元102，连接不同系统组件(包括处理单元101和存储单元102)的总线103。

总线103包括数据总线、控制总线和地址总线。

存储单元102可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)1021和/或高速缓存存储器1022，可以进一步包括非易失性存储器形式的可读介质，例如只读存储器(ROM)1023。

存储单元102还可以包括具有一组(至少一个)程序模块1024的程序/实用工具1025，这样的程序模块1024包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算设备100也可以与一个或多个外部设备104(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口105进行。并且，计算设备100还可以通过网络适配器106与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图10所示，网络适配器106通过总线103与计算设备100的其它模块通信。应当理解，尽管图中未示出，可以结合计算设备100使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

应当注意，尽管在上文详细描述中提及了模型训练装置/点击率确定装置的若干单元/模块或子单元/模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之，上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。

此外，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本公开的精神和原理，但是应该理解，本公开并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims

1.一种模型训练方法，包括：

获取多个训练样本，所述训练样本包括样本多媒体的多个静态属性数据，所述静态属性数据表示所述样本多媒体自身的性质；

获取所述训练样本对应的标签数据，所述标签数据用于表示所述样本多媒体的实际点击率等级；

将所述训练样本输入点击率预测模型，得到训练输出点击率等级；

根据所述标签数据和所述训练输出点击率等级，调整所述点击率预测模型，以得到训练完成的点击率预测模型。

2.根据权利要求1所述的模型训练方法，所述点击率预测模型为单分类模型，所述单分类模型的分类个数与所述点击率等级划分的个数相同，所述将所述训练样本输入点击率预测模型，得到训练输出点击率等级，包括：

将所述训练样本输入所述点击率预测模型，得到不同点击率等级的概率值；

确定所述概率值中最大概率值对应的点击率等级为所述训练输出点击率等级。

3.根据权利要求2所述的模型训练方法，所述静态属性数据包括：所述样本多媒体的封面图像和所述样本多媒体的文本数据；所述将所述训练样本输入所述点击率预测模型，得到不同点击率等级的概率值，包括：

将所述封面图像输入卷积神经网络，得到第一特征向量；

将所述文本数据输入嵌入网络，得到第二特征向量；

将所述第一特征向量和所述第二特征向量拼接后，得到拼接特征向量；

将所述拼接特征向量输入全连接层，得到不同点击率等级的概率值。

4.根据权利要求3所述的模型训练方法，所述文本数据包括：标题数据、内容数据和关联数据，所述关联数据用于表示样本多媒体的质量，所述嵌入网络包括：词嵌入网络、预训练嵌入网络和查找嵌入网络，所述将所述文本数据输入嵌入网络，得到第二特征向量，包括：

将所述标题数据输入所述词嵌入网络，得到第一子特征向量；

将所述内容数据输入所述预训练嵌入网络，得到第二子特征向量；

将所述关联数据输入所述查找嵌入网络，得到第三子特征向量；

将所述第一子特征特征向量、所述第二子特征向量和所述第三子特征拼接后，得到所述第二特征向量。

5.根据权利要求1至4任一项所述的模型训练方法，所述获取多个训练样本，包括：

获取预设历史时间内曝光过的样本多媒体的曝光日志；

对同一样本多媒体的曝光日志进行预处理，得到不重复的备用数据；

在所述备用数据中筛选出属于预设样本词典的训练样本，所述预设样本词典用于表示所述样本多媒体的静态属性。

6.一种点击率确定方法，包括：

获取待检测多媒体的静态属性数据；

将所述待检测多媒体的静态属性数据输入点击率预测模型，得到所述待检测多媒体的目标点击率等级，所述点击率预测模型为根据权利要求1至5任一项所述模型训练方法进行训练而获得，所述目标点击率等级用于表示所述待检测多媒体的点击率范围。

7.一种模型训练装置，包括：

第一获取模块，用于获取多个训练样本，所述训练样本包括样本多媒体的多个静态属性数据，所述静态属性数据表示所述样本多媒体自身的性质；

第二获取模块，用于获取所述训练样本对应的标签数据，所述标签数据用于表示所述样本多媒体的实际点击率等级；

点击率确定模块，用于将所述训练样本输入点击率预测模型，得到训练输出点击率等级；

调整模块，用于根据所述标签数据和所述训练输出点击率等级，调整所述点击率预测模型，以得到训练完成的点击率预测模型。

8.一种点击率确定装置，包括：

获取模块，用于获取待检测多媒体的静态属性数据；

点击率确定模块，用于将所述待检测多媒体的静态属性数据输入点击率预测模型，得到所述待检测多媒体的目标点击率等级，所述点击率预测模型为根据权利要求7所述模型训练装置进行训练而获得，所述目标点击率等级用于表示所述待检测多媒体的点击率范围。

9.一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序指令，所述计算机程序指令被执行时，实现如权利要求1至6中任一项所述的方法。

10.一种计算设备，包括：存储器和处理器；

所述存储器用于存储程序指令；

所述处理器用于调用所述存储器中的程序指令执行如权利要求1至6中任一项所述的方法。