CN110796499B

CN110796499B - 一种广告转化率预估模型及其训练方法

Info

Publication number: CN110796499B
Application number: CN201911077019.5A
Authority: CN
Inventors: 林宇烽; 卓汉逵
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2019-11-06
Filing date: 2019-11-06
Publication date: 2023-05-30
Anticipated expiration: 2039-11-06
Also published as: CN110796499A

Abstract

本发明涉及一种广告转化率预估模型及其训练方法，预估模型中包括编码网络、预测网络和损失函数计算模块，损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值并加入差分隐私机制；预测网络根据损失函数值更新自身网络。通过训练方法对预估模型进行训练。本发明通过部分预测结果结合广告主的标签数据计算损失函数值来反馈预测网络，广告转化率预测模型可以利用广告主的标签数据，同时也保证了数据隐私，提高预估广告转化率的准确性。

Description

一种广告转化率预估模型及其训练方法

技术领域

本发明涉及通信技术领域，更具体地，涉及一种广告转化率预估模型及其训练方法。

背景技术

转化率预估是在线广告领域十分重要的一项任务，它在实现在线广告精准投放，评估广告投放价值等都具有重要应用，一个准确好用的转化率预估模型对实现广告平台和广告主双赢具有重大意义，其中广告主是指出资投放广告的一方，广告平台是指利用自身平台技术帮助广告主筛选出广告的目标用户的一方。

当广告通过广告平台投放以后，会经历以下流程：首先是用户看到广告，这个过程称为曝光；在曝光以后，用户有可能会点击感兴趣的广告，这一行为称为点击；在点击广告过后，用户有可能会购买广告中的商品，或下载广告中的应用等，这一行为称为转化。预测广告投放以后用户会产生点击行为的概率称为点击率(post-view click through rate，CTR)预估，而预测广告投放以后用户会产生转化行为的概率称为转化率(post-clickconversion rate，CVR)预估。

目前，转化率预估模型的方法通常是沿用点击率预估模型中用到的技术。一种比较简单的传统方法就是把广告特征和用户特征等输入到逻辑回归(Logistic Regression，LR)分类器中，得到用户转化的概率。而随着深度学习的兴起，现今大部分转化率预估方法都是基于神经网络，其中较为经典的是Deep Crossing模型，通过神经网络的编码层，把高维稀疏的特征转化为低维稠密的特征，把得到的特征向量再通过多层神经网络完成特征组合、转换，最终得到转化率的预估值。为了增强特征交叉的作用，PNN(Product-basedNeural Network)在编码层和全连接层之间加入了乘积层，在不同特征域之间进行特征组合。还有许多其他的方法如Wide&Deep，Deep FM，NFM等方法都是用了不同的方法来做特征交叉，这些方法的总体框架基本都是利用编码层来得到低维稠密的特征向量，再设计一个进行特征交叉的模块，最后输入多层网络当中得到最终结果，这些方法都取得了不错的效果。

然而，这些方法都是假定我们拥有所有的数据，包括相关特征，以及用户是否点击，是否转化的标签数据，没有考虑过这中间存在的数据隐私问题。实际上，用户是否转化这一标签数据通常是被广告主拥有，而不是广告平台，因为用户点击广告后进入的是广告主设定的网页，而在这个网页里进行的操作广告平台是不得而知的。然而，出于对隐私的顾虑，广告主并不一定愿意提供他们拥有的转化标签数据，因为这包含着他们的客户有哪些人这样的信息，因此现有的广告转化率预估模型难以准确预测广告的转化率，准确率难以提升。

发明内容

本发明为克服上述现有技术中广告转化率预估模型没有加入广告主转化标签数据导致准确率不高的问题，提供一种广告转化率预估模型及其训练方法，能够在获得广告主转化标签数据且不会发生数据泄漏，使得预估模型能够加入广告主转化标签数据，提高转化率预估的准确率。

为解决上述技术问题，本发明采用的技术方案是：提供一种广告转化率预估模型：包括编码网络、预测网络和损失函数计算模块，预测网络输入编码网络得到的整体特征向量后输出预测结果，损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值；所述预测网络根据所述损失函数值更新自身网络；损失函数值的具体计算公式为：

loss＝-(y*log(p)+(1-y)*log(1-p))

其中，p为预测结果的概率值；y为其对应的转化标签值。

损失函数计算模块应用在广告主方。当广告主收到广告平台传送过来的网络预测结果以后，从这批预测结果随机选取一部分用以计算，使得广告平台无法得知该损失函数值具体由哪些数据计算得出，使得且广告主可以不直接共享自己的标签数据，保证数据隐私。

优选的，所述损失函数值加上拉普拉斯机制的差分隐私，具体的公式为：

loss_dp＝loss+Y

其中Y服从拉普拉斯分布，均值为0，Δf表示两个相邻数据集D，D′为最大距离。通过差分隐私计算，进一步保证数据安全。

优选的，所述编码网络利用编码层来得到各个特征的特征向量，将同一特征域的特征向量取平均，不同特征域的特征向量做拼接，得到的结果输入到全连接层，得到整体特征向量。编码网络在点击率预估任务下进行训练，充分利用广告平台自身拥有的特征数据以及点击标签数据，得到的特征向量可直接迁移到转化率预估任务中使用，降低了转化率预估模型的学习难度同时也可以减少广告平台和广告主之间的通信消耗。

还提供一种广告转化率预估模型的训练方法，用于训练上述的广告转化率预估模型，包括以下步骤：

步骤一：将训练数据输入编码网络，得到所述训练数据的整体特征向量，再输入到预测网络中得到所述训练数据对应的预测结果；

步骤二：将预测结果传送给广告主，广告主根据预测结果计算损失函数值并加入差分隐私机制后将损失函数值回传至预测网络，预测网络利用损失函数值进一步计算网络参数梯度，并更新预测网络的参数；

步骤三：重复步骤一和步骤三，直到达到最大迭代次数或是损失值在预设的迭代次数内不再下降，完成广告转化率预估模型训练。

优选的，在进行步骤一前，需要把编码网络在点击率预估任务中进行预训练，并保存网络参数，使得可以把该网络得到的编码迁移到转化率预估任务中，降低预测网络的学习难度。

优选的：在所述步骤二中，广告主根据预测结果计算损失函数值的具体步骤为：

S1：从广告平台方接收一批由当前预测网络计算得到的预测结果；

S2：从预测结果中随机取一部分，并使用自身拥有的标签数据，计算损失函数值。

优选的：所述损失函数值加上拉普拉斯机制的差分隐私进行计算获得最终的损失函数值，广告主将最终的损失函数值回传至预测网络。

与现有技术相比，本发明的有益效果是：通过部分预测结果结合广告主的标签数据计算损失函数值来反馈预测网络，广告转化率预测模型可以利用广告主的标签数据，同时也保证了数据隐私，提高预估广告转化率的准确性。

附图说明

图1是本发明的一种广告转化率预估模型的架构示意图；

图2是本发明的一种广告转化率预估模型的编码网络结构示意图；

图3是本发明的一种广告转化率预估模型的预测网络结构示意图；

图4是本发明的一种广告转化率预估模型的训练方法的流程图；

图5是本发明的一种广告转化率预估模型的训练方法的损失函数值计算流程图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明，不能理解为对本专利的限制。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若有术语“上”、“下”、“左”、“右”“长”“短”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

下面通过具体实施例，并结合附图，对本发明的技术方案作进一步的具体描述：

实施例1

如图1-3所示为一种广告转化率预估模型的实施例，包括编码网络、预测网络和损失函数计算模块，预测网络输入的使得编码网络得到的整体特征向量后输出预测结果；损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值；预测网络根据损失函数值更新自身网络；损失函数值的具体计算公式为：

loss＝-(y*log(p)+(1-y)*log(1-p))

其中，p为预测结果的概率值；y为其对应的转化标签值。

进一步的，损失函数值加上拉普拉斯机制的差分隐私，具体的公式为：

loss_dp＝loss+Y

另外的，编码网络利用编码层来得到各个特征的特征向量，将同一特征域的特征向量取平均，不同特征域的特征向量做拼接，得到的结果输入到全连接层，得到整体特征向量。编码网络在点击率预估任务下进行训练，充分利用广告平台自身拥有的特征数据以及点击标签数据，得到的特征向量可直接迁移到转化率预估任务中使用，降低了转化率预估模型的学习难度同时也可以减少广告平台和广告主之间的通信消耗。

本实施例的工作原理：损失函数计算模块应用在广告主方。当广告主收到广告平台传送过来的网络预测结果以后，从这批预测结果随机选取一部分用以计算，使得广告平台无法得知该损失函数值具体由哪些数据计算得出，使得且广告主可以不直接共享自己的标签数据，保证数据隐私。

本实施例的有益效果：通过部分预测结果结合广告主的标签数据计算损失函数值来反馈预测网络，通过该模型预估转化率，可以利用广告主的标签数据，同时也保证了数据隐私，提高了本发明的广告转化率预估模型的准确性。

实施例2

如图4-5所示为一种广告转化率预估模型的训练方法的实施例，用于训练实施例1的广告转化率预估模型，包括以下步骤：

预处理：对编码网络预训练，并保存网络参数；

步骤二：将预测结果传送给广告主，广告主根据预测结果计算损失函数值后将损失函数值回传至预测网络，预测网络利用损失函数值进一步计算网络参数梯度，并更新预测网络的参数；

步骤三：重复步骤一和步骤三，直到达到最大迭代次数或是损失值在预设的迭代次数内不再下降，完成转化率预估模型训练。

其中，步骤二中，广告主根据预测结果计算损失函数值的具体步骤为：

S2：从预测结果中随机取一部分，并使用自身拥有的标签数据，计算损失函数值；

S3：损失函数值加上拉普拉斯机制的差分隐私进行计算获得最终的损失函数值。广告主将最终的损失函数值回传至预测网络。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种广告转化率预估模型的建立方法，包括编码网络和预测网络，所述预测网络输入编码网络得到的整体特征向量后输出预测结果，其特征在于，还包括损失函数计算模块；所述损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值；所述预测网络根据所述损失函数值更新自身网络；损失函数值的具体计算公式为：

loss＝-(y*log(p)+(1-y)*log(1-p))

其中，p为预测结果的概率值；y为其对应的转化标签值；

所述损失函数值加上拉普拉斯机制的差分隐私，具体的公式为：

loss_dp＝loss+Y

其中Y服从拉普拉斯分布，均值为0，Δf表示两个相邻数据集D，D′为最大距离；

所述编码网络利用编码层来得到各个特征的特征向量，将同一特征域的特征向量取平均，不同特征域的特征向量做拼接，得到的结果输入到全连接层，得到整体特征向量；编码网络在点击率预估任务下进行训练，利用广告平台自身拥有的特征数据以及点击标签数据，得到的特征向量直接迁移到转化率预估任务中使用。

2.一种广告转化率预估模型的训练方法，其特征在于，用于训练上述权利要求1中的所建立的广告转化率预估模型，包括以下步骤：

3.根据权利要求2所述的一种广告转化率预估模型的训练方法，其特征在于，在进行步骤一前，需要对编码网络预训练，并保存网络参数。

4.根据权利要求2所述的一种广告转化率预估模型的训练方法，其特征在于：在所述步骤二中，广告主根据预测结果计算损失函数值的具体步骤为：

5.根据权利要求4所述的一种广告转化率预估模型的训练方法，其特征在于：所述损失函数值由随机选取的一部分预测结果数据计算得出，然后加上拉普拉斯机制的差分隐私进行计算获得最终的损失函数值，广告主将最终的损失函数值回传至预测网络。