CN110796499B - 一种广告转化率预估模型及其训练方法 - Google Patents
一种广告转化率预估模型及其训练方法 Download PDFInfo
- Publication number
- CN110796499B CN110796499B CN201911077019.5A CN201911077019A CN110796499B CN 110796499 B CN110796499 B CN 110796499B CN 201911077019 A CN201911077019 A CN 201911077019A CN 110796499 B CN110796499 B CN 110796499B
- Authority
- CN
- China
- Prior art keywords
- network
- loss function
- prediction
- function value
- conversion rate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种广告转化率预估模型及其训练方法,预估模型中包括编码网络、预测网络和损失函数计算模块,损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值并加入差分隐私机制;预测网络根据损失函数值更新自身网络。通过训练方法对预估模型进行训练。本发明通过部分预测结果结合广告主的标签数据计算损失函数值来反馈预测网络,广告转化率预测模型可以利用广告主的标签数据,同时也保证了数据隐私,提高预估广告转化率的准确性。
Description
技术领域
本发明涉及通信技术领域,更具体地,涉及一种广告转化率预估模型及其训练方法。
背景技术
转化率预估是在线广告领域十分重要的一项任务,它在实现在线广告精准投放,评估广告投放价值等都具有重要应用,一个准确好用的转化率预估模型对实现广告平台和广告主双赢具有重大意义,其中广告主是指出资投放广告的一方,广告平台是指利用自身平台技术帮助广告主筛选出广告的目标用户的一方。
当广告通过广告平台投放以后,会经历以下流程:首先是用户看到广告,这个过程称为曝光;在曝光以后,用户有可能会点击感兴趣的广告,这一行为称为点击;在点击广告过后,用户有可能会购买广告中的商品,或下载广告中的应用等,这一行为称为转化。预测广告投放以后用户会产生点击行为的概率称为点击率(post-view click through rate,CTR)预估,而预测广告投放以后用户会产生转化行为的概率称为转化率(post-clickconversion rate,CVR)预估。
目前,转化率预估模型的方法通常是沿用点击率预估模型中用到的技术。一种比较简单的传统方法就是把广告特征和用户特征等输入到逻辑回归(Logistic Regression,LR)分类器中,得到用户转化的概率。而随着深度学习的兴起,现今大部分转化率预估方法都是基于神经网络,其中较为经典的是Deep Crossing模型,通过神经网络的编码层,把高维稀疏的特征转化为低维稠密的特征,把得到的特征向量再通过多层神经网络完成特征组合、转换,最终得到转化率的预估值。为了增强特征交叉的作用,PNN(Product-basedNeural Network)在编码层和全连接层之间加入了乘积层,在不同特征域之间进行特征组合。还有许多其他的方法如Wide&Deep,Deep FM,NFM等方法都是用了不同的方法来做特征交叉,这些方法的总体框架基本都是利用编码层来得到低维稠密的特征向量,再设计一个进行特征交叉的模块,最后输入多层网络当中得到最终结果,这些方法都取得了不错的效果。
然而,这些方法都是假定我们拥有所有的数据,包括相关特征,以及用户是否点击,是否转化的标签数据,没有考虑过这中间存在的数据隐私问题。实际上,用户是否转化这一标签数据通常是被广告主拥有,而不是广告平台,因为用户点击广告后进入的是广告主设定的网页,而在这个网页里进行的操作广告平台是不得而知的。然而,出于对隐私的顾虑,广告主并不一定愿意提供他们拥有的转化标签数据,因为这包含着他们的客户有哪些人这样的信息,因此现有的广告转化率预估模型难以准确预测广告的转化率,准确率难以提升。
发明内容
本发明为克服上述现有技术中广告转化率预估模型没有加入广告主转化标签数据导致准确率不高的问题,提供一种广告转化率预估模型及其训练方法,能够在获得广告主转化标签数据且不会发生数据泄漏,使得预估模型能够加入广告主转化标签数据,提高转化率预估的准确率。
为解决上述技术问题,本发明采用的技术方案是:提供一种广告转化率预估模型:包括编码网络、预测网络和损失函数计算模块,预测网络输入编码网络得到的整体特征向量后输出预测结果,损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值;所述预测网络根据所述损失函数值更新自身网络;损失函数值的具体计算公式为:
loss=-(y*log(p)+(1-y)*log(1-p))
其中,p为预测结果的概率值;y为其对应的转化标签值。
损失函数计算模块应用在广告主方。当广告主收到广告平台传送过来的网络预测结果以后,从这批预测结果随机选取一部分用以计算,使得广告平台无法得知该损失函数值具体由哪些数据计算得出,使得且广告主可以不直接共享自己的标签数据,保证数据隐私。
优选的,所述损失函数值加上拉普拉斯机制的差分隐私,具体的公式为:
lossdp=loss+Y
其中Y服从拉普拉斯分布,均值为0,Δf表示两个相邻数据集D,D′为最大距离。通过差分隐私计算,进一步保证数据安全。
优选的,所述编码网络利用编码层来得到各个特征的特征向量,将同一特征域的特征向量取平均,不同特征域的特征向量做拼接,得到的结果输入到全连接层,得到整体特征向量。编码网络在点击率预估任务下进行训练,充分利用广告平台自身拥有的特征数据以及点击标签数据,得到的特征向量可直接迁移到转化率预估任务中使用,降低了转化率预估模型的学习难度同时也可以减少广告平台和广告主之间的通信消耗。
还提供一种广告转化率预估模型的训练方法,用于训练上述的广告转化率预估模型,包括以下步骤:
步骤一:将训练数据输入编码网络,得到所述训练数据的整体特征向量,再输入到预测网络中得到所述训练数据对应的预测结果;
步骤二:将预测结果传送给广告主,广告主根据预测结果计算损失函数值并加入差分隐私机制后将损失函数值回传至预测网络,预测网络利用损失函数值进一步计算网络参数梯度,并更新预测网络的参数;
步骤三:重复步骤一和步骤三,直到达到最大迭代次数或是损失值在预设的迭代次数内不再下降,完成广告转化率预估模型训练。
优选的,在进行步骤一前,需要把编码网络在点击率预估任务中进行预训练,并保存网络参数,使得可以把该网络得到的编码迁移到转化率预估任务中,降低预测网络的学习难度。
优选的:在所述步骤二中,广告主根据预测结果计算损失函数值的具体步骤为:
S1:从广告平台方接收一批由当前预测网络计算得到的预测结果;
S2:从预测结果中随机取一部分,并使用自身拥有的标签数据,计算损失函数值。
优选的:所述损失函数值加上拉普拉斯机制的差分隐私进行计算获得最终的损失函数值,广告主将最终的损失函数值回传至预测网络。
与现有技术相比,本发明的有益效果是:通过部分预测结果结合广告主的标签数据计算损失函数值来反馈预测网络,广告转化率预测模型可以利用广告主的标签数据,同时也保证了数据隐私,提高预估广告转化率的准确性。
附图说明
图1是本发明的一种广告转化率预估模型的架构示意图;
图2是本发明的一种广告转化率预估模型的编码网络结构示意图;
图3是本发明的一种广告转化率预估模型的预测网络结构示意图;
图4是本发明的一种广告转化率预估模型的训练方法的流程图;
图5是本发明的一种广告转化率预估模型的训练方法的损失函数值计算流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利的限制。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”“长”“短”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
下面通过具体实施例,并结合附图,对本发明的技术方案作进一步的具体描述:
实施例1
如图1-3所示为一种广告转化率预估模型的实施例,包括编码网络、预测网络和损失函数计算模块,预测网络输入的使得编码网络得到的整体特征向量后输出预测结果;损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值;预测网络根据损失函数值更新自身网络;损失函数值的具体计算公式为:
loss=-(y*log(p)+(1-y)*log(1-p))
其中,p为预测结果的概率值;y为其对应的转化标签值。
损失函数计算模块应用在广告主方。当广告主收到广告平台传送过来的网络预测结果以后,从这批预测结果随机选取一部分用以计算,使得广告平台无法得知该损失函数值具体由哪些数据计算得出,使得且广告主可以不直接共享自己的标签数据,保证数据隐私。
进一步的,损失函数值加上拉普拉斯机制的差分隐私,具体的公式为:
lossdp=loss+Y
其中Y服从拉普拉斯分布,均值为0,Δf表示两个相邻数据集D,D′为最大距离。通过差分隐私计算,进一步保证数据安全。
另外的,编码网络利用编码层来得到各个特征的特征向量,将同一特征域的特征向量取平均,不同特征域的特征向量做拼接,得到的结果输入到全连接层,得到整体特征向量。编码网络在点击率预估任务下进行训练,充分利用广告平台自身拥有的特征数据以及点击标签数据,得到的特征向量可直接迁移到转化率预估任务中使用,降低了转化率预估模型的学习难度同时也可以减少广告平台和广告主之间的通信消耗。
本实施例的工作原理:损失函数计算模块应用在广告主方。当广告主收到广告平台传送过来的网络预测结果以后,从这批预测结果随机选取一部分用以计算,使得广告平台无法得知该损失函数值具体由哪些数据计算得出,使得且广告主可以不直接共享自己的标签数据,保证数据隐私。
本实施例的有益效果:通过部分预测结果结合广告主的标签数据计算损失函数值来反馈预测网络,通过该模型预估转化率,可以利用广告主的标签数据,同时也保证了数据隐私,提高了本发明的广告转化率预估模型的准确性。
实施例2
如图4-5所示为一种广告转化率预估模型的训练方法的实施例,用于训练实施例1的广告转化率预估模型,包括以下步骤:
预处理:对编码网络预训练,并保存网络参数;
步骤一:将训练数据输入编码网络,得到所述训练数据的整体特征向量,再输入到预测网络中得到所述训练数据对应的预测结果;
步骤二:将预测结果传送给广告主,广告主根据预测结果计算损失函数值后将损失函数值回传至预测网络,预测网络利用损失函数值进一步计算网络参数梯度,并更新预测网络的参数;
步骤三:重复步骤一和步骤三,直到达到最大迭代次数或是损失值在预设的迭代次数内不再下降,完成转化率预估模型训练。
其中,步骤二中,广告主根据预测结果计算损失函数值的具体步骤为:
S1:从广告平台方接收一批由当前预测网络计算得到的预测结果;
S2:从预测结果中随机取一部分,并使用自身拥有的标签数据,计算损失函数值;
S3:损失函数值加上拉普拉斯机制的差分隐私进行计算获得最终的损失函数值。广告主将最终的损失函数值回传至预测网络。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (5)
1.一种广告转化率预估模型的建立方法,包括编码网络和预测网络,所述预测网络输入编码网络得到的整体特征向量后输出预测结果,其特征在于,还包括损失函数计算模块;所述损失函数计算模块根据预测网络得到的部分预测结果和广告主标签数据计算出具体的损失函数值;所述预测网络根据所述损失函数值更新自身网络;损失函数值的具体计算公式为:
loss=-(y*log(p)+(1-y)*log(1-p))
其中,p为预测结果的概率值;y为其对应的转化标签值;
所述损失函数值加上拉普拉斯机制的差分隐私,具体的公式为:
lossdp=loss+Y
其中Y服从拉普拉斯分布,均值为0,Δf表示两个相邻数据集D,D′为最大距离;
所述编码网络利用编码层来得到各个特征的特征向量,将同一特征域的特征向量取平均,不同特征域的特征向量做拼接,得到的结果输入到全连接层,得到整体特征向量;编码网络在点击率预估任务下进行训练,利用广告平台自身拥有的特征数据以及点击标签数据,得到的特征向量直接迁移到转化率预估任务中使用。
2.一种广告转化率预估模型的训练方法,其特征在于,用于训练上述权利要求1中的所建立的广告转化率预估模型,包括以下步骤:
步骤一:将训练数据输入编码网络,得到所述训练数据的整体特征向量,再输入到预测网络中得到所述训练数据对应的预测结果;
步骤二:将预测结果传送给广告主,广告主根据预测结果计算损失函数值并加入差分隐私机制后将损失函数值回传至预测网络,预测网络利用损失函数值进一步计算网络参数梯度,并更新预测网络的参数;
步骤三:重复步骤一和步骤三,直到达到最大迭代次数或是损失值在预设的迭代次数内不再下降,完成广告转化率预估模型训练。
3.根据权利要求2所述的一种广告转化率预估模型的训练方法,其特征在于,在进行步骤一前,需要对编码网络预训练,并保存网络参数。
4.根据权利要求2所述的一种广告转化率预估模型的训练方法,其特征在于:在所述步骤二中,广告主根据预测结果计算损失函数值的具体步骤为:
S1:从广告平台方接收一批由当前预测网络计算得到的预测结果;
S2:从预测结果中随机取一部分,并使用自身拥有的标签数据,计算损失函数值。
5.根据权利要求4所述的一种广告转化率预估模型的训练方法,其特征在于:所述损失函数值由随机选取的一部分预测结果数据计算得出,然后加上拉普拉斯机制的差分隐私进行计算获得最终的损失函数值,广告主将最终的损失函数值回传至预测网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911077019.5A CN110796499B (zh) | 2019-11-06 | 2019-11-06 | 一种广告转化率预估模型及其训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911077019.5A CN110796499B (zh) | 2019-11-06 | 2019-11-06 | 一种广告转化率预估模型及其训练方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110796499A CN110796499A (zh) | 2020-02-14 |
CN110796499B true CN110796499B (zh) | 2023-05-30 |
Family
ID=69443072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911077019.5A Active CN110796499B (zh) | 2019-11-06 | 2019-11-06 | 一种广告转化率预估模型及其训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110796499B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113495986A (zh) * | 2020-03-20 | 2021-10-12 | 华为技术有限公司 | 数据处理的方法与装置 |
WO2020143849A2 (en) * | 2020-04-13 | 2020-07-16 | Alipay (Hangzhou) Information Technology Co., Ltd. | Method and system for optimizing user grouping for advertisement |
CN113822688B (zh) * | 2020-06-23 | 2024-07-19 | 北京沃东天骏信息技术有限公司 | 广告转化率预估方法及装置、存储介质、电子设备 |
CN113011920B (zh) * | 2021-03-15 | 2024-02-13 | 北京百度网讯科技有限公司 | 转化率预估模型的训练方法、装置及电子设备 |
CN112950291B (zh) * | 2021-03-31 | 2023-07-21 | 北京奇艺世纪科技有限公司 | 模型的偏差优化方法、装置、设备及计算机可读介质 |
CN113450146B (zh) * | 2021-06-25 | 2024-02-02 | 上海明略人工智能(集团)有限公司 | 多触点广告归因方法、系统、计算机设备和可读存储介质 |
CN113657926A (zh) * | 2021-07-28 | 2021-11-16 | 上海明略人工智能(集团)有限公司 | 一种广告效果预测方法、系统、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN109409125A (zh) * | 2018-10-12 | 2019-03-01 | 南京邮电大学 | 一种提供隐私保护的数据采集和回归分析方法 |
CN109615060A (zh) * | 2018-11-27 | 2019-04-12 | 深圳前海微众银行股份有限公司 | Ctr预估方法、装置及计算机可读存储介质 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
-
2019
- 2019-11-06 CN CN201911077019.5A patent/CN110796499B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN109409125A (zh) * | 2018-10-12 | 2019-03-01 | 南京邮电大学 | 一种提供隐私保护的数据采集和回归分析方法 |
CN109615060A (zh) * | 2018-11-27 | 2019-04-12 | 深圳前海微众银行股份有限公司 | Ctr预估方法、装置及计算机可读存储介质 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110796499A (zh) | 2020-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110796499B (zh) | 一种广告转化率预估模型及其训练方法 | |
US11521221B2 (en) | Predictive modeling with entity representations computed from neural network models simultaneously trained on multiple tasks | |
US7827128B1 (en) | System identification, estimation, and prediction of advertising-related data | |
US20120150626A1 (en) | System and Method for Automated Recommendation of Advertisement Targeting Attributes | |
CN106997549A (zh) | 一种广告信息的推送方法及系统 | |
US10726466B2 (en) | System and method for recommending products to bridge gaps between desired and actual personal branding | |
US20210174222A1 (en) | Bias scoring of machine learning project data | |
CN111259222A (zh) | 物品推荐方法、系统、电子设备及存储介质 | |
US10552863B1 (en) | Machine learning approach for causal effect estimation | |
CN112053188B (zh) | 一种基于混合深度神经网络模型的互联网广告推荐方法 | |
EP4242955A1 (en) | User profile-based object recommendation method and device | |
US20220108334A1 (en) | Inferring unobserved event probabilities | |
CN112068962B (zh) | 一种基于深度学习的云渲染资源兑换方法 | |
US20200013092A1 (en) | Message Generation for Ranked Users Based on User Interaction Probabilities | |
CN109034853A (zh) | 基于种子用户寻找相似用户方法、装置、介质和电子设备 | |
CN113763019A (zh) | 一种用户信息管理方法和装置 | |
CN115270001A (zh) | 基于云端协同学习的隐私保护推荐方法及系统 | |
CN115269977A (zh) | 一种基于图神经网络的融合知识与协同信息的推荐方法 | |
Biswas et al. | Technology acceptance perception for promotion of sustainable consumption | |
US11983742B1 (en) | Systems and methods for modeled advertisement conversion attributions | |
US20180121987A1 (en) | System and Method for Enabling Personal Branding | |
CN113159809A (zh) | 对象处理方法、装置、电子设备及计算机可读存储介质 | |
CN116362841A (zh) | 金融产品的推荐方法、装置、计算机设备及可读存储介质 | |
CN105654345A (zh) | 一种基于贝叶斯网络的广告点击率预测方法及装置 | |
Tian et al. | Agent behavior prediction and its generalization analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |