CN114493724A

CN114493724A - 一种基于多任务学习的竞价关键词效果预估模型构建方法

Info

Publication number: CN114493724A
Application number: CN202210151280.0A
Authority: CN
Inventors: 陈观林; 彭石元
Original assignee: Hangzhou City University
Current assignee: Hangzhou City University
Priority date: 2022-02-17
Filing date: 2022-02-17
Publication date: 2022-05-13

Abstract

本发明涉及一种基于多任务学习的竞价关键词效果预估模型构建方法，包括步骤：收集广告和对应竞价关键词的历史数据；对广告和竞价关键词的特征向量进行预处理，得到降维后的特征向量和广告和竞价关键词的数值特征向量；将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起，输入深度神经网络。本发明的有益效果是：构建了基于多任务学习的竞价关键词效果预估模型，该模型通过多任务学习，预估广告购买竞价关键词在未来一段时间内的展现量、点击量和转化量，并且在基于多任务学习的竞价关键词效果预估模型中显示建模任务之间的关系以增强模型的效果。相较PLE模型，本发明提出的预估模型在展示任务、点击任务和转化任务上均有所提升。

Description

一种基于多任务学习的竞价关键词效果预估模型构建方法

技术领域

本发明属于搜索广告领域，尤其涉及一种基于多任务学习的竞价关键词效果预估模型构建方法。

背景技术

作为在线广告形式中的十分重要的一种，搜索广告主要是在用户的搜索结果页进行广告投放。在搜索广告中，广告平台主要通过广告主选择的竞价关键词与用户的搜索词进行匹配，然后再进行广告的曝光。作为连接用户、广告主和广告平台的核心枢纽，竞价关键词的选择是广告主投放广告过程中最关键的环节之一。但是除了少数广告主花费大量资金聘请专业团队外，大多数广告主很难提前预知竞价关键词的广告效果，只能通过不断尝试来验证竞价关键词的广告效果，在一定程度上增加了广告主的试错成本。

作为近年来最火热的研究方向之一，多任务学习从最初简单的参数共享发展到了现在的多种的自定参数共享。目前，多任务学习已经被广告应用于各个领域，包括计算机视觉、搜索推荐等领域。

在国内学者Hongyan Tang提出PLE模型之后，很多基于PLE模型的多任务模型都取得了很好的效果。这些模型在训练中都将有关任务联合在一起学习，然后通过参数共享的方式增强模型的泛化能力。但是只是简单地将任务放在一起，并不能获得最好的效果。

专利号为CN202010270578.4的《一种针对广告主广告投放效果的风险评估方法及平台》中，公开了一种竞价关键词广告效果预估的方法；其方法包括如下步骤：收集历史数据，每个关键词包括搜索量、价格、点击量、转化量和展示量；建立模拟广告平台，采用线性插值模型预测关键词的展示量，采用概率模型预测关键词的点击量和展示量；该竞价关键词广告效果预估的方法通过使用多个模型的方式来对竞价关键词的多种广告效果进行预估，可以取得一定的效果。但是多个模型的方式增加了维护成本，也无法利用多个任务之间的联系增强预测效果。

发明内容

本发明的目的是克服现有技术中的不足，提供一种基于多任务学习的竞价关键词效果预估模型构建方法。

这种基于多任务学习的竞价关键词效果预估模型构建方法，包括以下步骤：

S1、收集广告和对应竞价关键词的历史数据；广告和对应竞价关键词的历史数据包括：<广告，竞价关键词>二元组集合的展现量、点击量、转化量、点击率和转化率；将精排点击率和转化率模型作为竞价关键词效果预估模型的教师模型，并将教师模型预估的点击率和转化率作为标签来计算竞价关键词效果预估模型的点击率和转化率损失；在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理；

S2、对广告和竞价关键词的特征向量进行预处理，得到降维后的特征向量和广告和竞价关键词的数值特征向量；将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起，作为深度神经网络的输入；

S3、构建基于多任务学习的深度神经网络，将步骤S2所得降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起，得到d维的向量，作为深度神经网络的输入；深度神经网络输出<广告，竞价关键词>二元组集合的展现量、点击量和转化量的预估值；

S4、利用深度神经网络输出的<广告，竞价关键词>二元组集合的展现量、点击量和转化量的预估值来计算预估的点击率和预估的转化率；

预估的点击率

计算公式如下：

上式中，

代表深度神经网络输出的<广告，竞价关键词>二元组集合的展现量的预估值，

代表深度神经网络输出的<广告，竞价关键词>二元组集合的点击量的预估值；

预估的转化率

计算公式如下：

上式中，

代表深度神经网络输出的<广告，竞价关键词>二元组集合的点击量的预估值，

代表深度神经网络输出的<广告，竞价关键词>二元组集合的转化量的预估值；

S5、利用泊松损失计算展现量、点击量和转化量的损失，利用均方根损失函数计算点击率和转化率的损失；

S6、将步骤S5所得展现量、点击量和转化量的损失，以及点击率和转化率的损失加权融合，得到最终损失；按照反向传播算法对深度神经网络进行参数更新，最终得到竞价关键词效果预估模型；最终损失的计算公式为：

Loss＝λ₁loss₁+λ₂loss₂+λ₃loss₃+λ₄loss_ctr+λ₅loss_cvr

上式中，λ₁和loss₁分别代表展现量的权重系数和基于泊松损失得到的展现量损失，λ₂和loss₂分别代表点击量的权重系数和基于泊松损失得到的点击量损失，λ₃和loss₃分别代表转化量的权重系数和基于泊松损失得到的转化量损失，λ₄和loss_ctr分别代表点击率的权重系数和基于均方根损失得到的点击率损失，λ₅和loss_cvr分别代表转化率的权重系数和基于均方根损失得到的转化率损失。

作为优选，步骤S1中<广告，竞价关键词>二元组集合在广告系统被展现过。

作为优选，点击率和转化率为广告系统中排序模型对<广告，竞价关键词>二元组集合点击率和转化率的预估值，或者点击率和转化率由真实的统计值计算得到。

作为优选，步骤S1中在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理的具体方式为：设任意一个样本x_i每次被展现时，精排点击率和转化率模型预估的点击率集合为{ctr_i，1，ctr_i，2，...，ctr_i，K}，其中ctr_i，1，ctr_i，2，...，ctr_i，K表示样本x_i对应的第1个至第K个点击率预估值；精排点击率和转化率模型预估的转化率集合为{cvr_i，1，cvr_i，2，...，cvr_i，K}，其中cvr_i，1，cvr_i，2，...，cvr_i，K表示x_i对应的第1个至第K个转化率预估值；K表示竞价关键词和广告的展现集合大小；则样本x_i对应的点击率集合ctr_i和转化率集合cvr_i由下式计算得出：

作为优选，步骤S3中深度神经网络的参数共享方式为硬共享、MMOE或PLE方式。

作为优选，步骤2具体包括如下步骤：

S2.1、收集广告和竞价关键词数据集X＝{x₁，x₂，...，x_N}作为总的训练样本集合，N为样本集合大小，x_i∈{x₁，x₂，...，x_N}表示第i个待处理的样本特征数据；x_i，j∈{x_i，1，x_i，2，…，x_i，M}代表第i个样本的第j个特征；样本特征数据类型分为离散特征和数值特征；其中离散型特征指特征取值之间没有大小关系的特征；数值特征指用数字直接表示的特征；

S2.2、若x_i，j为数值特征向量，则将广告和竞价关键词的特征向量进行标准化，变成均值为0，方差为1的数据；标准化之后的数据使用x′表示，具体计算公式如下：

上式中，x表示原始数值，μ表示该特征原始数值分布的均值，σ表示该特征原始数值分布的方差；

S2.3、若x_i，j是离散型特征向量，则将广告和竞价关键词的离散型特征向量进行One-hot编码，将广告和竞价关键词的离散型特征向量转化成由0和1构成的高维度的稀疏特征向量[0,1,0,…,0]；将高维度的稀疏特征向量通过Embedding嵌入层进行降维，转化成低维稠密向量；Embedding嵌入层由单层神经网络组成，Embedding嵌入层的输入为One-hot编码，Embedding嵌入层的输出为指定维度的特征向量。

作为优选，步骤5具体包括如下步骤：

S5.1、在单个任务下，利用泊松损失计算展现量、点击量和转化量的损失的公式为：

上式中，y和

分别代表该任务下样本的标签集合和预估值集合，

和y_i分别代表第i个样本的预估值和标签值，N代表样本集合大小；

S5.2、利用均方根损失函数计算点击率和转化率的损失：

上式中，y和

分别代表样本标签集合和预估值集合，

和y_i分别代表第h个样本的预估值和标签值，N代表样本集合大小。

本发明的有益效果是：本发明构建了基于多任务学习的竞价关键词效果预估模型，该模型通过多任务学习，预估广告购买竞价关键词在未来一段时间内的展现量、点击量和转化量，并且在基于多任务学习的竞价关键词效果预估模型中显示建模任务之间的关系以增强模型的效果。相较PLE模型，本发明提出的预估模型在展示任务、点击任务和转化任务上均有所提升。

附图说明

图1为基于多任务学习的竞价关键词效果预估模型的构建及训练流程图。

具体实施方式

下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出，对于本技术领域的普通人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

实施例一

本申请实施例一提供了一种如图1所示基于多任务学习的竞价关键词效果预估模型的构建方法：

预估的点击率

计算公式如下：

上式中，

预估的转化率

计算公式如下：

上式中，

Loss＝λ₁loss₁+λ₂loss₂+λ₃loss₃+λ₄loss_ctr+λ₅loss_cvr

实施例二

在实施例一的基础上，本申请实施例二提供了实施例一中方法的具体应用；本实施例以一天为投放周期为例，预估广告购买竞价关键词后在未来一天内的广告效果。本实施例基于国内学者Hongyan Tang提出PLE多任务模型,利用添加辅助损失(CTR和CVR的损失)的方式显式建模任务之间依赖关系。如图1所示，该方法主要包括以下步骤

S1、收集广告和对应竞价关键词的历史数据；广告和对应竞价关键词的历史数据包括：<广告，竞价关键词>二元组集合的展现量、点击量、转化量、点击率和转化率；在模型蒸馏的思想中，通过将教师模型的输出作为学生模型的标签，来将教师模型中学到的知识蒸馏到学生模型当中。通过借鉴这样一个思想，本发明引入直接预估点击率和转化率的模型来作为竞价关键词效果预估模型的教师模型；通常情况下，无需从头训练预估点击率和转化率的模型这两个模型；从整个广告链路出发，广告在购买关键词后需要经过召回排序等过程才能展现在用户面前；而在排序过程中，排序阶段的点击率模型和转化率模型的预估值对广告的胜出有着至关重要的作用；因此排序阶段的点击率模型和转化率模型的预估值对竞价关键词效果预估模型有着一定的指导意义；<广告，竞价关键词>二元组集合在广告系统被展现过；点击率和转化率为广告系统中排序模型对<广告，竞价关键词>二元组集合点击率和转化率的预估值，或者点击率和转化率由真实的统计值计算得到；直接利用样本的真实标签计算得到点击率和转化率时，由于<广告，竞价关键词>二元组的稀疏性会导致绝大部分的样本的点击数和转化数都是零，一方面会导致计算出来的点击率和转化率绝大部分都是0，另外一方面点击数为0的样本也无法计算转化率；经过实验，这样不仅无法给模型带来性能上的提升还会使得模型学习出现偏差。

广告的排序阶段通常主要分为粗排和精排两个阶段；而作为广告领域最重要的研究方向之一，精排阶段的点击率模型和转化率模型相关的工作都十分的成熟，并且相比粗排阶段更加复杂和准确；最重要的是，由于本发明所使用的训练集是有被展现过的样本，那么很容易从广告系统日志中解析该样本在精排阶段中的点击率和转化率预估值；因此将精排点击率和转化率模型作为竞价关键词效果预估模型的教师模型，并将教师模型预估的点击率和转化率作为标签来计算竞价关键词效果预估模型的点击率和转化率损失；需要注意的是，广告系统中的精排模型往往是针对当次流量的个性化模型；所以需要在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理；

竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理的具体方式为：

设任意一个样本x_i每次被展现时，精排点击率和转化率模型预估的点击率集合为{ctr_i，1，ctr_i，2，...，ctr_i，K}，其中ctr_i，1，ctr_i，2，...，ctr_i，K表示样本x_i对应的第1个至第K个点击率预估值；精排点击率和转化率模型预估的转化率集合为{cvr_i，1，cvr_i，2，...，cvr_i，K}，其中cvr_i，1，cvr_i，2，...，cvr_i，K表示x_i对应的第1个至第K个转化率预估值；K表示竞价关键词和广告的展现集合大小；则样本x_i对应的点击率集合ctr_i和转化率集合cvr_i由下式计算得出：

S2、对广告和竞价关键词的特征向量进行预处理，得到降维后的特征向量(低维稠密向量)和广告和竞价关键词的数值特征向量；将降维后的特征向量与广告和竞价关键词的数值特征向量拼接在一起，作为深度神经网络的输入；

S2.1、收集广告和竞价关键词数据集X＝{x₁，x₂，...，x_N}作为总的训练样本集合，N为样本集合大小，x_i∈{x₁，x₂，...，x_N}表示第i个待处理的样本特征数据；x_i，j∈{x_i，1，x_i，2，...，x_i，M}代表第i个样本的第j个特征；样本特征数据类型分为离散特征和数值特征(连续稠密特征)；其中离散型特征指特征取值之间没有大小关系的特征，例如性别-男和性别-女；数值特征指用数字直接表示的特征，例如年龄；

S2.3、若x_i，j是离散型特征向量，则将广告和竞价关键词的离散型特征向量进行One-hot(独热)编码，将广告和竞价关键词的离散型特征向量转化成由0和1构成的高维度的稀疏特征向量[0，1，0，…，0](高维独热特征向量)；将高维度的稀疏特征向量通过Embedding嵌入层进行降维，转化成低维稠密向量；Embedding嵌入层由单层神经网络组成，Embedding嵌入层的输入为One-hot编码，Embedding嵌入层的输出为指定维度的特征向量；

S3、构建基于多任务学习的深度神经网络，将步骤S2所得降维后的特征向量(低维稠密向量)与广告和竞价关键词的数值特征向量拼接在一起，得到d维的向量，作为深度神经网络的输入；深度神经网络输出<广告，竞价关键词>二元组集合的展现量、点击量和转化量的预估值；深度神经网络的参数共享方式为硬共享、MMOE或PLE方式；

预估的点击率

计算公式如下：

上式中，

预估的转化率

计算公式如下：

上式中，

S5、在搜索广告系统中，当广告展现给用户后，用户才能对广告进行点击。并且转化行为也只能发生在点击行为之后。那么显然，点击数是不能超过展现数的，并且转化数也是不能超过点击数的。但是传统的多任务模型中，并没有对预估值进行限制。也就是可能存在点击数(转化数)的预估值超过展现数(点击数)的预估值的。如果只是简单的对模型的预估值进行上限进行阈值限制，效果并不会很明显。因此，希望通过显式的在损失函数中加入点击率和转化率的损失来对模型的预估值进行约束。这样不仅可以对模型的预估值进行限制，还可以增强多任务模型中任务之间的联动，达到提高模型效果的目的。利用泊松损失计算展现量、点击量和转化量的损失，利用均方根损失函数计算点击率和转化率的损失；

上式中，y和

分别代表该任务下样本的标签集合和预估值集合，

和y_i分别代表第i个样本的预估值和标签值，N代表样本集合大小；在统计学上，泊松回归(PoissonRegression)是用来为计数资料和列联表建模的一种回归分析；泊松回归假设目标变量服从于泊松分布，并假设目标变量的期望值的对数可由一组未知参数进行线性表达。基于泊松分布的特性，泊松回归常用目标变量为计数形式，例如事件发生的次数等；而竞价关键词效果预估任务本质上也是在预估展现事件、点击事件、转化事件的次数；所以泊松损失是十分适合竞价关键词效果预估任务的损失函数之一；

S5.2、利用均方根损失函数计算点击率和转化率的损失：

上式中，y和

分别代表样本标签集合和预估值集合，

Loss＝λ₁loss₁+λ₂loss₂+λ₃loss₃+λ₄loss_ctr+λ₅loss_cvr

实验结果

为了证明本实施例的有效性，本实施例与目前性能最优秀的多任务模型之一PLE模型在淘宝搜索广告平台的数据集上进行对比实验。该数据集中包含20亿训练样本，1亿条测试样本。

在训练过程中，所有网络均使用TensorFlow实现，激活函数采用Leaky RectifiedLinear Unit(LRelu)。所有网络都是用Adagrad优化器和随机梯度下降法进行训练。学习率设为0.002。学习轮次Epoch为3。

下表1表示本实施例所得竞价关键词效果预估模型在测试集上相对PLE模型在评估指标上的相对提升结果。其中评估指标为50％相对误差范围内的比例。结果显示，相较PLE模型，本发明提出的优化方法在展示任务、点击任务和转化任务上分别达到了8.13％、13.13％和15.76％的相对提升。

表1本实施例所得竞价关键词效果预估模型在测试集上相对PLE模型在评估指标上的相对提升结果表

Claims

1.一种基于多任务学习的竞价关键词效果预估模型构建方法，其特征在于，包括以下步骤：

预估的点击率

计算公式如下：

上式中，

预估的转化率

计算公式如下：

上式中，

Loss＝λ₁loss₁+λ₂loss₂+λ₃loss₃+λ₄loss_ctr+λ₅loss_cvr

2.根据权利要求1所述基于多任务学习的竞价关键词效果预估模型构建方法，其特征在于：步骤S1中<广告，竞价关键词>二元组集合在广告系统被展现过。

3.根据权利要求2所述基于多任务学习的竞价关键词效果预估模型构建方法，其特征在于：点击率和转化率为广告系统中排序模型对<广告，竞价关键词>二元组集合点击率和转化率的预估值，或者点击率和转化率由真实的统计值计算得到。

4.据权利要求1所述基于多任务学习的竞价关键词效果预估模型构建方法，其特征在于，步骤S1中在竞价关键词和广告维度对点击率和转化率预估值进行求平均值处理的具体方式为：设任意一个样本x_i每次被展现时，精排点击率和转化率模型预估的点击率集合为{ctr_i，1，ctr_i，2，...，ctr_i，K}，其中ctr_i，1，ctr_i，2，...，ctr_i，K表示样本x_i对应的第1个至第K个点击率预估值；精排点击率和转化率模型预估的转化率集合为{cvr_i，1，cvr_i，2，...，cvr_i，K}，其中cvr_i，1，cvr_i，2，...，cvr_i，K表示x_i对应的第1个至第K个转化率预估值；K表示竞价关键词和广告的展现集合大小；则样本x_i对应的点击率集合ctr_i和转化率集合cvr_i由下式计算得出：

5.根据权利要求1所述基于多任务学习的竞价关键词效果预估模型构建方法，其特征在于：步骤S3中深度神经网络的参数共享方式为硬共享、MMOE或PLE方式。

6.根据权利要求4所述基于多任务学习的竞价关键词效果预估模型构建方法，其特征在于：步骤2具体包括如下步骤：

S2.1、收集广告和竞价关键词数据集X＝{x₁，x₂，...，x_N}作为总的训练样本集合，N为样本集合大小，x_i∈{x₁，x₂，...，x_N}表示第i个待处理的样本特征数据；x_i，j∈{x_i，1，x_i，2，...，x_i，M}代表第i个样本的第j个特征；样本特征数据类型分为离散特征和数值特征；其中离散型特征指特征取值之间没有大小关系的特征；数值特征指用数字直接表示的特征；

S2.3、若x_i，j是离散型特征向量，则将广告和竞价关键词的离散型特征向量进行One-hot编码，将广告和竞价关键词的离散型特征向量转化成由0和1构成的高维度的稀疏特征向量[0，1，0，…，0]；将高维度的稀疏特征向量通过Embedding嵌入层进行降维，转化成低维稠密向量；Embedding嵌入层由单层神经网络组成，Embedding嵌入层的输入为One-hot编码，Embedding嵌入层的输出为指定维度的特征向量。

7.根据权利要求6所述基于多任务学习的竞价关键词效果预估模型构建方法，其特征在于，步骤5具体包括如下步骤：

上式中，y和

分别代表该任务下样本的标签集合和预估值集合，

S5.2、利用均方根损失函数计算点击率和转化率的损失：

上式中，y和

分别代表样本标签集合和预估值集合，

和y_i分别代表第i个样本的预估值和标签值，N代表样本集合大小。