CN113822688A - 广告转化率预估方法及装置、存储介质、电子设备 - Google Patents
广告转化率预估方法及装置、存储介质、电子设备 Download PDFInfo
- Publication number
- CN113822688A CN113822688A CN202010582527.5A CN202010582527A CN113822688A CN 113822688 A CN113822688 A CN 113822688A CN 202010582527 A CN202010582527 A CN 202010582527A CN 113822688 A CN113822688 A CN 113822688A
- Authority
- CN
- China
- Prior art keywords
- conversion rate
- feature
- rate estimation
- advertisement
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 230
- 238000000034 method Methods 0.000 title claims abstract description 69
- 239000013598 vector Substances 0.000 claims abstract description 116
- 238000012545 processing Methods 0.000 claims abstract description 19
- 230000001131 transforming effect Effects 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 68
- 230000006870 function Effects 0.000 claims description 45
- 230000004927 fusion Effects 0.000 claims description 31
- 238000000605 extraction Methods 0.000 claims description 21
- 230000009466 transformation Effects 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000003321 amplification Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例是关于一种广告转化率预估方法及装置、存储介质、电子设备,涉及大数据处理技术领域,该方法包括:对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量;对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。本发明实施例提高了预估结果的准确性。
Description
技术领域
本发明实施例涉及大数据处理技术领域,具体而言,涉及一种广告转化率预估方法、广告转化率预估装置、计算机可读存储介质以及电子设备。
背景技术
转化率(Conversion Rate,CVR)预估是通过统计、模型等方法预估用户在某个候选上的转化概率。在电商场景下,用户的转化与商家的投资回报率(Return OnInvestment,ROI)密切相关,再加上转化率预估是对商家友好的智能出价产品(如tCPA)的基础,因此,准确的转化率预估是十分重要的。
在现有的转化率预估方法中,通常是采用固定的t+n的数据进行转化率预估模型的训练,即在训练集(训练模型的数据集)中只考虑用户在点击后n天内的转化行为,而忽略n天之后的转化行为。其中,t指的是点击日期,n为点击日期和转化日期之间间隔的天数。
但是,上述方法存在如下缺陷:一方面,如果选用较小的n,则可以使用较新的点击订单信息,但是会存在模型的训练集中正负样本的分布偏离于真实情况,进而使得预估结果的准确性较低的问题;另一方面,如果选用较大的n,则在一定程度上的保证了模型预估的准确性,但是会存在无法使用到的最新的点击数据,从而导致模型较为滞后,使得预估结果的实时性较差。
因此,需要提供一种新的广告转化率预估方法及装置。
需要说明的是,在上述背景技术部分发明的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明的目的在于提供一种广告转化率预估方法、广告转化率预估装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的预估结果的准确性较低的问题。
根据本公开的一个方面,提供一种广告转化率预估方法,包括:
对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量;
对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。
在本公开的一种示例性实施例中,在对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量之前,所述广告转化率预估方法还包括:
利用目标转化率预估模型的宽度端对各所述候选广告的宽度特征进行特征融合抽取,得到各所述候选广告的宽度特征向量;
利用目标转化率预估模型的深度端对各所述候选广告的深度特征进行特征融合提取,并对提取出的特征进行多次线性变换以及非线性映射处理,得到各所述候选广告的深度特征向量。
在本公开的一种示例性实施例中,对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果包括:
利用目标转化率预估模型的全连接层对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
其中,所述不同时间间隔是根据用户对各所述候选广告的点击日期与购买日期之间的间隔时长进行确定的。
在本公开的一种示例性实施例中,所述广告转化率预估方法还包括:
计算各所述候选广告的点击率,根据各所述候选广告的转化率以及转化价值得到点击价值,并根据所述点击率以及点击价值计算各所述候选广告的排序因子;
根据所述排序因子对各所述候选广告进行排序,对排序后的各所述候选广告依次进行展示,并获取用户对展示的各所述候选广告的点击日期以及购买日期;
根据各所述点击日期与各所述购买日期之间的时间间隔,生成多个不同时间间隔的拼接日志;其中,所述点击日期与所述购买日期之间的时间间隔介于0到5之间;
根据各所述候选广告的特征生成多个特征日志,并根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型;其中,所述当前转化率预估模型的训练过程为离线训练。
在本公开的一种示例性实施例中,根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型包括:
对各所述特征日志进行宽度特征向量融合抽取,得到各所述特征日志的宽度特征向量;
对各所述特征日志进行深度特征向量融合抽取得到各所述特征日志的融合特征向量,并对各所述特征日志的融合特征向量进行多次线性变换和非线性映射处理得到各所述特征日志的深度特征向量;
对各所述特征日志的深度特征向量以及宽度特征向量进行拼接得到多个输入特征向量,并对各所述输入特征向量进行变化,得到多个不同时间间隔的预测输出结果;
根据与各所述特征日志对应的拼接日志确定与各所述预测输出结果对应的实际输出结果,并根据各所述预测输出结果以及各所述实际输出结果构建目标损失函数;
根据所述目标损失函数对所述当前转化率预估模型进行训练,得到所述目标转化率预估模型。
在本公开的一种示例性实施例中,根据各所述预测输出结果以及各所述实际输出结果构建目标损失函数包括:
其中,Loss为目标损失函数,N为用于训练的特征日志总数,M为预测输出结果的总数,i表示第i条特征日志;ni表示第i条特征日志的时间间隔的取值,ni∈[0,5];为普通损失函数,为第i条特征日志的第j个预测输出结果,为与对应的实际输出结果;I(·)为指示函数,当j≤ni+1时,取值为1,否则取值为0。
在本公开的一种示例性实施例中,所述广告转化率预估方法还包括:
当所述时间间隔的取值为[0,4]时,利用所述指示函数对与该时间间隔对应的普通损失函数的函数值进行扩大运算。
根据本公开的一个方面,提供一种广告转化率预估装置,包括:
特征处理模块,用于对多个候选广告的深度特征向量以及宽度特征向量进行拼接得到多个拼接特征向量;
特征向量变换模块,用于对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
转化率预估模块,用于对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的广告转化率预估方法。
根据本公开的一个方面,提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的广告转化率预估方法。
本发明实施例提供的一种广告转化率预估方法,一方面,通过对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量,并对各拼接特征向量进行变换,得到各候选广告在不同时间间隔下的初始转化率预估结果,最后对各初始转化率预估结果进行选择,得到各候选广告在预设的时间间隔内的目标转化率预估结果,解决了现有技术中由于使用较新的点击数据,从而使得模型的训练集中正负样本的分布偏离于真实情况,进而使得预估结果的准确性较低的问题,提高了预估结果的准确率;另一方面,解决了现有技术中由于无法使用到的最新的点击数据,从而导致模型较为滞后,使得预估结果的实时性较差的问题,提高了预估结果的实时性;再一方面,通过对各融合结果进行选择得到各候选广告的选择结果,并根据各选择结果对各候选广告在预设的时间间隔内的转化率进行预估,保持了预估结果的一致性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示意性示出根据本发明示例实施例的一种广告转化率预估方法的流程图。
图2示意性示出根据本发明示例实施例的一种目标转化率预估模型的结构示例图。
图3示意性示出根据本发明示例实施例的另一种广告转化率预估方法的流程图。
图4示意性示出根据本发明示例实施例的一种根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型的方法流程图。
图5示意性示出根据本发明示例实施例的一种广告转化率预估系统的框图。
图6示意性示出根据本发明示例实施例的另一种广告转化率预估方法的流程图。
图7示意性示出根据本发明示例实施例的一种广告转化率预估装置的框图。
图8示意性示出根据本发明示例实施例的一种用于实现上述广告转化率预估方法的电子设备。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本发明的各方面变得模糊。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
转化,一般定义为用户采取了如注册、下单或购买等行为。而转化率(ConversionRate,CVR)预估是通过统计、模型等方法预估用户在某个候选上的转化概率。在电商场景下,用户的转化与商家的投资回报率(Return On Investment,ROI)密切相关,再加上转化率预估是对商家友好的智能出价产品(如tCPA)的基础,因此,准确的转化率预估是十分重要的。
但是,由于转化行为天然具有延迟性,即用户在点击一个广告商品后,可能会在数天甚至数周之后才会发生转化行为,导致在构建转化率预估模型的训练集时,会面临一定的困难,从而影响转化率预估模型的准确性和时效性。
目前,业界通常是采用固定的t+n的数据进行转化率预估模型的训练,即在训练集(训练模型的数据集)中只考虑用户在点击后n天内的转化行为,而忽略n天之后的转化行为。其中,t指的是点击日期,n为点击日期和转化日期之间间隔的天数,具体可以参考下表1所示。由表1可以看出,以n=1、点击日期为10月8日为例,如果10月8日的点击在10月8日和10月9日(点击后1天之内)发生了转化,则在训练集中认为此条点击转化样本为正例,如果10月8日的点击的转化日期在10月9日之后(如表中的10月10日和10月11日)或者没有发生转化,则在训练集中把此条样本当作负例。此外,从上述举例可以轻易看出,t+n数据中的转化数据包含t+n-1数据中的转化数据,如上例中t+1数据中的转化数据包含t+0数据中的转化数据。
表1
点击日期 | 转化日期 | 正/负例 |
2018.10.08 | 2018.10.08 | 正例 |
2018.10.08 | 2018.10.09 | 正例 |
2018.10.08 | 2018.10.10 | 负例 |
2018.10.08 | 2018.10.11 | 负例 |
2018.10.08 | - | 负例 |
但是,上述现有的转化率预估模型的训练有不能兼顾准确性和时效性的问题:
譬如,如果选用较小的n,如n=1,即模型的训练集里只考虑用户点击当天和点击后1天的转化行为,这样让模型具有良好的时效性,即可以使用较新的点击订单信息。但是,因为忽略了部分转化行为,导致模型的训练集中正负样本的分布偏离于真实情况,从而导致模型预估的准确性有一定的损失。
又譬如,如果选用较大的n,如n=5,显然可以让模型的训练集中正负样本的分布更趋近于真实情况,从而在一定程度上的保证了模型预估的准确性。但是,使用t+5的点击订单数据进行模型训练时,无法使用到的最新的点击数据,也就是只能使用5天前及更早的点击数据。从而导致模型较为滞后,损失了一定的时效性。而且,一般来说,较新的数据对于转化率预估有更好的指导意义,所以,较大的n也可能会导致预估准确性的损失。
总的来说,使用固定的t+n数据训练出的转化率预估模型无法同时兼顾准确性和时效性。
本示例实施方式中首先提供了一种广告转化率预估方法,该方法可以运行于服务器、服务器集群或云服务器等;当然,本领域技术人员也可以根据需求在其他平台运行本发明的方法,本示例性实施例中对此不做特殊限定。参考图1所示,该广告转化率预估方法可以包括以下步骤:
步骤S110.对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量。
步骤S120.对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果。
步骤S130.对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。
上述广告转化率预估方法中,一方面,通过对多个候选广告的深度特征向量以及宽度特征向量进行拼接得到多个拼接特征向量,并对各拼接特征向量进行变换,得到各候选广告在不同时间间隔下的初始转化率预估结果;最后对各初始转化率预估结果进行选择,得到各候选广告在预设的时间间隔内的目标转化率预估结果,解决了现有技术中由于使用较新的点击数据,从而使得模型的训练集中正负样本的分布偏离于真实情况,进而使得预估结果的准确性较低的问题,提高了预估结果的准确率;另一方面,解决了现有技术中由于无法使用到的最新的点击数据,从而导致模型较为滞后,使得预估结果的实时性较差的问题,提高了预估结果的实时性;再一方面,通过对各融合结果进行选择得到各候选广告的选择结果,并根据各选择结果对各候选广告在预设的时间间隔内的转化率进行预估,保持了预估结果的一致性。
以下,将结合附图对本发明示例实施例广告转化率预估方法中涉及的步骤进行详细的解释以及说明。
首先,对本发明示例实施例的发明目的进行解释以及说明。具体的,本发明技术方案主要在当前转化率预估模型(使用t+1点击订单数据训练出的模型)的基础上,解决了该模型因忽略部分订单数据(n>2的订单数据),导致的转化率预估效果不理想的问题。同时还避免了只通过简单地选用较大的n,带来的时效性损失的问题。
其次,对本发明示例实施例中所涉及到的目标转化率预估模型进行解释以及说明。具体的,参考图2所示,该目标转化率预估模型可以包括宽度端输入层201、深度端输入层202、隐藏层203、拼接模块204、全连接层205、选择模块206以及损失函数计算模块207。其中,宽度端输入层201与拼接模块204连接,深度端输入层202与隐藏层203连接以后再与拼接模块204连接,拼接模块204、全连接层205以及选择模块206依次连接,损失函数计算模块207与全连接层205连接。
具体的,宽度端输入层201可以用于对多个候选广告的宽度特征进行特征融合抽取,得到各所述候选广告的宽度特征向量;
深度端输入层202可以用于对各所述候选广告的深度特征进行特征融合提取;
隐藏层203可以用于对提取出的特征进行多次线性变换以及非线性映射处理,得到各所述候选广告的深度特征向量;
拼接模块204可以用于对各所述候选广告的深度特征向量以及宽度特征向量进行拼接得到多个拼接特征向量;
全连接层205可以用于对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
选择模块206可以用于对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果;
损失函数计算模块207可以用于根据与各所述特征日志对应的拼接日志确定与各所述预测输出结果对应的实际输出结果,并根据各所述预测输出结果以及各所述实际输出结果构建目标损失函数。
此处需要补充说明的是,该目标转化率预估模型采用的是多任务学习的方法进行训练得到的。
以下,将对步骤S110-步骤S130进行解释以及说明。
在步骤S110中,对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量。
在本示例实施例中,首先,终端设备可以接收用户输入的搜索词,当接收到搜索词以后,可以根据该搜索词生成包括搜索ID的搜索请求,并将该搜索请求发送给服务器,当服务器接收到该搜索请求后,可以对该搜索词进行搜索得到多个初始广告;其次,可以根据各初始广告与搜索词之间的匹配度,以及上述用户的用户画像对各初始广告进行粗排序得到多个候选广告。譬如,当搜索词为Iphone 11 pro max钢化膜时,可以基于该搜索词与初始广告之间的匹配度大小,对出现的各商品广告进行排序,进而得到上述候选广告。
进一步的,当得到上述候选广告以后,为了可以得到拼接特征向量,还需要抽取各候选广告的深度特征向量以及宽度特征向量。具体的,首先,可以利用目标转化率预估模型的宽度端对各所述候选广告的宽度特征进行特征融合抽取,得到各所述候选广告的宽度特征向量;其次,可以利用目标转化率预估模型的深度端对各所述候选广告的深度特征进行特征融合提取,并对提取出的特征进行多次线性变换以及非线性映射处理,得到各所述候选广告的深度特征向量;进一步的,当得到该深度特征向量以及宽度特征向量以后,可以通过拼接模块通过对深度特征向量以及宽度特征向量进行拼接进而得到多个拼接特征向量。通过抽取各候选广告的深度特征向量以及宽度特征向量,进而可以增加拼接特征向量的全面性,进而可以提高融合结果的准确性,最终起到提高预估结果准确性的作用。
此处需要补充说明的是,为了可以进一步的提高深度端特征以及宽度端特征的准确性,在进行特征融合抽取的过程中,还可以加上用户画像的宽度特征以及深度特征,进而得到各候选广告的宽度特征向量以及深度特征向量。
在步骤S120中,对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果。
在本示例实施例中,当得到上述拼接特征向量以后,可以利用目标转化率预估模型的全连接层对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;其中,所述不同时间间隔是根据用户对各所述候选广告的点击日期与购买日期之间的间隔时长进行确定的。
在步骤S130中,对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果
在本示例实施例中,当得到初始转化率预估结果以后,可以通过选择层对各初始转化率预估结果进行选择得到各候选广告在预设的时间间隔内的目标转化率预估结果。通过该方法,可以使得在线预估结果与离线预估结果保持一致。其中,该预设的时间间隔为一天。
图3示意性示出根据本发明示例实施例的一种对当前转化率预估模型进行训练,进而得到目标转化率预估模型的示例图。参考图3所示,该广告转化率的预估方法还可以包括步骤S310-步骤S340。其中:
在步骤S310中,计算各所述候选广告的点击率,根据各所述候选广告的转化率以及转化价值得到点击价值,并根据所述点击率以及点击价值计算各所述候选广告的排序因子。
在步骤S320中,根据所述排序因子对各所述候选广告进行排序,对排序后的各所述候选广告依次进行展示,并获取所述用户对展示的各所述候选广告的点击日期以及购买日期。
在步骤S330中,根据各所述点击日期与各所述购买日期之间的时间间隔,生成带有不同时间间隔的拼接日志;其中,所述点击日期与所述购买日期之间的时间间隔介于0到5之间。
在步骤S340中,根据各所述候选广告的特征生成多条特征日志,并根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型;其中,所述当前转化率预估模型的训练过程为离线训练。
以下,将对步骤S310-步骤S340进行解释以及说明。首先,基于点击率模型(CTR模型)预测各候选广告的点击率,然后再根据各候选广告的转化率以及转化价值计算各候选广告的点击价值,再根据各候选广告的点击率以及点击价值计算各候选广告的排序因子;其次,根据各候选广告的排序因子对各候选广告进行排序,然后再将候选广告发送至终端设备,以使得终端设备将其展示给用户;进一步的,当用户对各候选广告进行各种行为操作(例如,点击浏览以及购买等等)时,还需要获取点击日期以及购买日期;再根据各点击日期与购买日期之间的时间间隔,生成多个不同时间间隔的拼接日志;譬如,点击日期为t,购买日期为点击日期当天时,其时间间隔为t+0,延迟一天的时间间隔为t+1,等等。进一步的,当得到拼接日志以后,还需要根据各候选广告的特征生成多条特征日志,然后再根据拼接日志以及特征日志对当前转化率预估模型进行训练,得到目标转化率预估模型。
此处需要补充说明以下几点:
一方面,为了避免数据过于冗余以及预估结果的及时性较差的问题,本申请仅选取延迟时间为5天以内的输入,也就是说,点击日期与购买日期之间的时间间隔不大于五天。
另一方面,上述拼接日志是指点击数据以及购买数据进行拼接得来的;具体的拼接原则为:由于用户在发送请求时,包括了请求ID,因此可以将具有相同请求ID的点击数据以及购买数据进行拼接,进而可以保证该拼接日志的准确性。
再一方面,由于特征日志是候选广告展示给用户时,获取到的广告自身特征和用户画像特征,但是拼接日志是根据用户的实际操作得到的,因此可以将特征日志作为训练数据,拼接日志作为与特征日志对应的标签对当前转化率预估模型进行训练。同时,该拼接操作可以在Hadoop集群中执行。
图4示意性示出根据本发明示例实施例的一种根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型的方法流程图。参考图4所示,根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型可以包括步骤S410-步骤S450。其中:
在步骤S410中,对各所述特征日志进行宽度特征向量融合抽取,得到各所述特征日志的宽度特征向量。
在步骤S420中,对各所述特征日志进行深度特征向量融合抽取得到各所述特征日志的融合特征向量,并对各所述特征日志的融合特征向量进行多次线性变换和非线性映射处理得到各所述特征日志的深度特征向量。
在步骤S430中,对各所述特征日志的深度特征向量以及宽度特征向量进行拼接得到多个输入特征向量,并对各所述输入特征向量进行变化,得到多个不同时间间隔的预测输出结果。
在步骤S440中,根据与各所述特征日志对应的拼接日志确定与各所述预测输出结果对应的实际输出结果,并根据各所述预测输出结果以及各所述实际输出结果构建目标损失函数。
在步骤S450中,根据所述目标损失函数对所述当前转化率预估模型进行训练,得到所述目标转化率预估模型。
以下,将对步骤S410-步骤S450进行解释以及说明。首先需要说明的是,为了可以降低服务器的负担,对当前转化率预估模型进行训练的过程可以离线进行;当训练完成后,利用训练完成后的目标转化率预估模型,通过网盘等形式对线上系统中的目标转化率预估模型进行更新。其次,对整个训练过程进行解释以及说明。具体的,以电商广告场景为例,对当前转化率预估模型的离线训练做如下说明:
首先,生成多种口径的点击订单数据。具体的,点击订单数据是通过拼接点击数据和订单数据得到的。对于同一天的点击而言,用户的下单量随着时间的推移快速衰减,因此,可以考虑t+5的点击订单数据,即只考虑点击之后5天内的订单,而忽略点击后超过5天的订单。统计发现,t+5的订单量占t+15的订单量的95%左右,这说明使用t+5的点击订单数据已经考虑到足够多的转化行为了。
具体而言,例如需要训练今天使用的目标转化率预估模型,那么,今天之前所有的点击订单数据均可以用来训练cvr预估模型。对于5天之前的所有数据,均可以直接使用t+5的点击订单数据。而对于距离今天不足5天的数据,显然是没有完整的t+5训练数据的,如果只考虑使用t+5的训练数据,则依然会面临时效性的问题。因此,为了使用到这部分数据,本发明根据时间间隔,依次生成t+0到t+4的点击订单数据用于训练。
其次,为了应用多任务学习的方法,对当前在用的转化模型的结构进行了改进,将离线训练时的输出由1路增加到6路,之所以增加到6路,是因为训练数据中考虑了t+0到t+5共6种点击订单口径。因此,本发明中的多任务相应地分别指的是t+0到t+5的转化率预估任务,这6个任务的输出分别对应“多任务输出”的6个输出。
进一步的,对模型参数的进行训练,其中,模型参数可采用常用机器学习优化算法如SGD、Adagrad等进行参数的训练。具体的,离线训练模型的损失函数是通过把6路输出的损失(loss)求和得到的,但是对于t+1到t+4的数据要进行一些特殊考虑。以t+4的数据为例进行说明,因为t+4的数据中只有点击后4天内的订单数据,没有第5天的订单信息,所以t+4的数据只能用于t+0到t+4任务的训练,而不能用于t+5任务的训练,即在t+4的数据上的loss为5路输出的loss的和。但是这样带来的问题是,t+0到t+4的数据上的loss要小于t+5数据的loss,例如在t+4数据上的loss大约只有t+5数据loss的六分之五,更极端的情况是t+0数据上的loss大约只有t+5数据loss的六分之一。数据上的loss大小可以认为模型对于这部分数据的重视程度,为了降低在所有数据上的loss,模型会更趋向于在loss大的数据上进行学习。但是,一般而言,较新的数据对cvr预估相对更重要一些。因此,该广告转化率预估方法还包括:当所述时间间隔的取值为[0,4]时,利用所述指示函数对与该时间间隔对应的普通损失函数的函数值进行扩大运算。也就是,把t+0到t+4的数据上的loss按比例地扩大到与t+5数据的loss大小相当的水平。其中:
其中,Loss为目标损失函数,N为用于训练的样本总数,也就是特征日志的总数,M为预测输出结果的总数,i表示第i条训练样本(特征日志);ni表示第i条训练样本(特征日志)的时间间隔的取值,ni∈[0,5];为普通损失函数,为第i条训练样本(特征日志)的第j个预测输出结果,为与对应的实际输出结果;I(·)为指示函数,当j≤ni+1时,取值为1,否则取值为0。指示函数具体可以如下所示:
图5示意性示出根据本发明示例实施例的一种广告转化率预估系统的示例图。参考图5所示,该广告转化率预估系统可以包括离线训练系统510、在线预测系统520、搜索系统530以及Hadoop集群540。
其中,在线预测系统520分别与离线训练系统510以及检索系统530相连接,Hadoop集群540分别与在线预测系统520以及离线训练系统510相连。其中,在线预测系统520中可以包括目标转化率预估模型以及点击率预测模型。
以下,将结合图5以及图6对本发明示例实施例的广告转化率预估方法进行进一步的解释以及说明。具体的,参考图6所示,该广告转化率预估方法可以包括以下步骤:
步骤S610,离线训练系统510从Hadoop集群540中获取多个不同时间间隔的点击订单数据,例如可以是t+5点击订单数据、t+4点击订单数据、t+3点击订单数据、t+2点击订单数据、t+1点击订单数据以及t+0点击订单数据,共六路数据;
步骤S620,离线训练系统510根据该六路数据对当前转化率预估模型进行训练得到目标转化率预估模型,并利用目标转化率预估模型对在线预测系统中的目标转化率预估模型进行更新;
步骤S630,检索系统530对用户输入的搜索词进行搜索得到多个初始广告,并根据各初始广告与搜索词的匹配度对各所述初始广告进行排序得到多个候选广告;
步骤S640,在线预测系统中的目标转化率预估模型对各候选广告的转化率进行预估,并根据转化率预估值以及转化价值计算各候选广告的点击价值;同时,在线预测系统中的点击率预测模型对各候选广告的点击率进行预测,得到各候选广告的点击率;根据所述候选广告的点击价值和点击率,计算出排序因子,根据各排序因子的高低对各所述候选广告进行排序。
步骤S650,Hadoop集群540根据用户对各候选广告的点击数据以及购买数据生成拼接日志,然后再根据各融合结果生成特征日志,并对各拼接日志以及特征日志进行存储,以使得离线训练系统可以根据各拼接日志以及特征日志对当前转化率预估模型进行训练;依次往复循环,以保证转化率预估模型的准确性以及实时性。
本发明示例实施例提供的广告转化率预估方法,可以将多任务学习应用到当前在用的转化率预估模型中,搭建了多任务的转化率预估模型。通过将多任务学习的方法应用到转化率预估模型中,通过多个任务的共同训练,让主任务(本发明中为t+1任务)在没有损失时效性的前提下,取得更好的转化预估效果。并针对模型和训练数据的特点,提出适用于该模型的损失函数。在离线auc评估中,主任务的auc平均提升0.004,上线后,在该模型生效的部分,给系统带来了1.6%的点击增长和2.2%的消费增长。同时,通过更改模型结构,解决多任务学习模型可能都会遇到的离线训练和在线使用不一致的问题。
本发明示例实施例还提供了一种广告转化率预估装置。参考图7所示,该广告转化率预估装置可以包括特征处理模块710、特征向量变换模块720以及转化率预估模块730。其中:
特征处理模块710可以用于对各多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量。
转化率预估模块720可以用于对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果。
转化率选择模块730可以用于并对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。
在本公开的一种示例性实施例中,所述广告转化率预估装置还包括:
第一特征抽取模块,可以用于利用目标转化率预估模型的宽度端对各所述候选广告的宽度特征进行特征融合抽取,得到各所述候选广告的宽度特征向量;
第二特征抽取模块,可以用于利用目标转化率预估模型的深度端对各所述候选广告的深度特征进行特征融合提取,并对提取出的特征进行多次线性变换以及非线性映射处理,得到各所述候选广告的深度特征向量。
在本公开的一种示例性实施例中,对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果包括:
利用目标转化率预估模型的全连接层对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
其中,所述不同时间间隔是根据所述用户对各所述候选广告的点击日期与购买日期之间的间隔时长进行确定的。
在本公开的一种示例性实施例中,所述广告转化率预估装置还包括:
排序因子计算模块,可以用于计算各所述候选广告的点击率,根据各所述候选广告的转化率以及转化价值得到点击价值,并根据所述点击率以及点击价值计算各所述候选广告的排序因子;
排序模块,可以根据所述排序因子对各所述候选广告进行排序,对排序后的各所述候选广告依次进行展示,并获取所述用户对展示的各所述候选广告的点击日期以及购买日期;
拼接日志生成模块,可以用于根据各所述点击日期与各所述购买日期之间的时间间隔,生成带有不同时间间隔的拼接日志;其中,所述点击日期与所述购买日期之间的时间间隔介于0到5之间;
转化率预估模型训练模块,可以用于根据各所述候选广告的特征生成多条特征日志,并根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型;其中,所述当前转化率预估模型的训练过程为离线训练。
在本公开的一种示例性实施例中,根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型包括:
对各所述特征日志进行宽度特征向量融合抽取,得到各所述特征日志的宽度特征向量;
对各所述特征日志进行深度特征向量融合抽取得到各所述特征日志的融合特征向量,并对各所述特征日志的融合特征向量进行多次线性变换和非线性映射处理得到各所述特征日志的深度特征向量;
对各所述特征日志的深度特征向量以及宽度特征向量进行拼接得到多个输入特征向量,并对各所述输入特征向量进行变化,得到多个不同时间间隔的预测输出结果;
根据与各所述特征日志对应的拼接日志确定与各所述预测输出结果对应的实际输出结果,并根据各所述预测输出结果以及各所述实际输出结果构建目标损失函数;
根据所述目标损失函数对所述当前转化率预估模型进行训练,得到所述目标转化率预估模型。
在本公开的一种示例性实施例中,根据各所述预测输出结果以及各所述实际输出结果构建目标损失函数包括:
其中,Loss为目标损失函数,N为用于训练的特征日志总数,M为预测输出结果的总数,i表示第i条特征日志;ni表示第i条特征日志的时间间隔的取值,ni∈[0,5];为普通损失函数,为第i条特征日志的第j个预测输出结果,为与对应的实际输出结果;I(·)为指示函数,当j≤ni+1时,取值为1,否则取值为0。
在本公开的一种示例性实施例中,所述广告转化率预估装置还包括:
函数值扩大模块,可以用于当所述时间间隔的取值为[0,4]时,利用所述指示函数对与该时间间隔对应的普通损失函数的函数值进行扩大运算。
上述广告转化率预估装置中各模块的具体细节已经在对应的广告转化率预估方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图8来描述根据本发明的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同系统组件(包括存储单元820和处理单元810)的总线830以及显示单元840。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元810可以执行如图1中所示的步骤S110:对多个候选广告的深度特征向量以及宽度特征向量进行拼接得到多个拼接特征向量;步骤S120:对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;步骤S130:对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。
存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)8201和/或高速缓存存储单元8202,还可以进一步包括只读存储单元(ROM)8203。
存储单元820还可以包括具有一组(至少一个)程序模块8205的程序/实用工具8204,这样的程序模块8205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备900(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本发明实施方式的方法。
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
根据本发明的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其他实施例。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。
Claims (10)
1.一种广告转化率预估方法,其特征在于,包括:
对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量;
对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。
2.根据权利要求1所述的广告转化率预估方法,其特征在于,在对多个候选广告的深度特征向量以及宽度特征向量进行拼接,得到多个拼接特征向量之前,所述广告转化率预估方法还包括:
利用目标转化率预估模型的宽度端对各所述候选广告的宽度特征进行特征融合抽取,得到各所述候选广告的宽度特征向量;
利用目标转化率预估模型的深度端对各所述候选广告的深度特征进行特征融合提取,并对提取出的特征进行多次线性变换以及非线性映射处理,得到各所述候选广告的深度特征向量。
3.根据权利要求1所述的广告转化率预估方法,其特征在于,对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果包括:
利用目标转化率预估模型的全连接层对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
其中,所述不同时间间隔是根据用户对各所述候选广告的点击日期与购买日期之间的间隔时长进行确定的。
4.根据权利要求2或3所述的广告转化率预估方法,其特征在于,所述广告转化率预估方法还包括:
计算各所述候选广告的点击率,根据各所述候选广告的转化率以及转化价值得到点击价值,并根据所述点击率以及点击价值计算各所述候选广告的排序因子;
根据所述排序因子对各所述候选广告进行排序,对排序后的各所述候选广告依次进行展示,并获取用户对展示的各所述候选广告的点击日期以及购买日期;
根据各所述点击日期与各所述购买日期之间的时间间隔,生成带有时间间隔的拼接日志;其中,所述点击日期与所述购买日期之间的时间间隔介于0到5之间;
根据各所述候选广告的特征成多条特征日志,并根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型;其中,所述当前转化率预估模型的训练过程为离线训练。
5.根据权利要求4所述的广告转化率预估方法,其特征在于,根据各所述拼接日志以及各所述特征日志对当前转化率预估模型进行训练,得到所述目标转化率预估模型包括:
对各所述特征日志进行宽度特征向量融合抽取,得到各所述特征日志的宽度特征向量;
对各所述特征日志进行深度特征向量融合抽取得到各所述特征日志的融合特征向量,并对各所述特征日志的融合特征向量进行多次线性变换和非线性映射处理得到各所述特征日志的深度特征向量;
对各所述特征日志的深度特征向量以及宽度特征向量进行拼接得到多个输入特征向量,并对各所述输入特征向量进行变化,得到多个不同时间间隔的预测输出结果;
根据与各所述特征日志对应的拼接日志确定与各所述预测输出结果对应的实际输出结果,并根据各所述预测输出结果以及各所述实际输出结果构建目标损失函数;
根据所述目标损失函数对所述当前转化率预估模型进行训练,得到所述目标转化率预估模型。
7.根据权利要求6所述的广告转化率预估方法,其特征在于,所述广告转化率预估方法还包括:
当所述时间间隔的取值为[0,4]时,利用所述指示函数对与该时间间隔对应的普通损失函数的函数值进行扩大运算。
8.一种广告转化率预估装置,其特征在于,包括:
特征处理模块,用于对多个候选广告的深度特征向量以及宽度特征向量进行拼接得到多个拼接特征向量;
转化率预估模块,用于对各所述拼接特征向量进行变换,得到各所述候选广告在不同时间间隔下的初始转化率预估结果;
转化率选择模块,用于并对各所述初始转化率预估结果进行选择,得到各所述候选广告在预设的时间间隔内的目标转化率预估结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的广告转化率预估方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的广告转化率预估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010582527.5A CN113822688A (zh) | 2020-06-23 | 2020-06-23 | 广告转化率预估方法及装置、存储介质、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010582527.5A CN113822688A (zh) | 2020-06-23 | 2020-06-23 | 广告转化率预估方法及装置、存储介质、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113822688A true CN113822688A (zh) | 2021-12-21 |
Family
ID=78912286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010582527.5A Pending CN113822688A (zh) | 2020-06-23 | 2020-06-23 | 广告转化率预估方法及装置、存储介质、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113822688A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130339126A1 (en) * | 2012-06-13 | 2013-12-19 | Yahoo! Inc. | Campaign performance forecasting for non-guaranteed delivery advertising |
CN105956888A (zh) * | 2016-05-31 | 2016-09-21 | 北京创意魔方广告有限公司 | 广告个性化展示方法 |
US20170186030A1 (en) * | 2015-04-21 | 2017-06-29 | Tencent Technology (Shenzhen) Company Limited | Advertisement click-through rate correction method and advertisement push server |
CN108921624A (zh) * | 2018-07-27 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 广告融合方法、装置、存储介质和终端设备 |
CN108960901A (zh) * | 2018-06-13 | 2018-12-07 | 网易(杭州)网络有限公司 | 数据处理方法、装置、介质及电子设备 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
CN110674857A (zh) * | 2019-09-15 | 2020-01-10 | 桂林电子科技大学 | 一种基于多尺度堆叠网络的广告点击分类方法 |
CN110796499A (zh) * | 2019-11-06 | 2020-02-14 | 中山大学 | 一种广告转化率预估模型及其训练方法 |
US10565622B1 (en) * | 2015-03-24 | 2020-02-18 | Amazon Technologies, Inc. | Optimization of real-time probabilistic model evaluation for online advertising |
CN111178981A (zh) * | 2020-01-02 | 2020-05-19 | 众安在线财产保险股份有限公司 | 一种广告投放方法、装置、计算机设备及存储介质 |
WO2020107762A1 (zh) * | 2018-11-27 | 2020-06-04 | 深圳前海微众银行股份有限公司 | Ctr预估方法、装置及计算机可读存储介质 |
-
2020
- 2020-06-23 CN CN202010582527.5A patent/CN113822688A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130339126A1 (en) * | 2012-06-13 | 2013-12-19 | Yahoo! Inc. | Campaign performance forecasting for non-guaranteed delivery advertising |
US10565622B1 (en) * | 2015-03-24 | 2020-02-18 | Amazon Technologies, Inc. | Optimization of real-time probabilistic model evaluation for online advertising |
US20170186030A1 (en) * | 2015-04-21 | 2017-06-29 | Tencent Technology (Shenzhen) Company Limited | Advertisement click-through rate correction method and advertisement push server |
CN105956888A (zh) * | 2016-05-31 | 2016-09-21 | 北京创意魔方广告有限公司 | 广告个性化展示方法 |
CN108960901A (zh) * | 2018-06-13 | 2018-12-07 | 网易(杭州)网络有限公司 | 数据处理方法、装置、介质及电子设备 |
CN108921624A (zh) * | 2018-07-27 | 2018-11-30 | 百度在线网络技术(北京)有限公司 | 广告融合方法、装置、存储介质和终端设备 |
WO2020107762A1 (zh) * | 2018-11-27 | 2020-06-04 | 深圳前海微众银行股份有限公司 | Ctr预估方法、装置及计算机可读存储介质 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
CN110674857A (zh) * | 2019-09-15 | 2020-01-10 | 桂林电子科技大学 | 一种基于多尺度堆叠网络的广告点击分类方法 |
CN110796499A (zh) * | 2019-11-06 | 2020-02-14 | 中山大学 | 一种广告转化率预估模型及其训练方法 |
CN111178981A (zh) * | 2020-01-02 | 2020-05-19 | 众安在线财产保险股份有限公司 | 一种广告投放方法、装置、计算机设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
聂鑫: "基于改进深度学习的移动APP广告转化率预估", 中国优秀硕士学位论文全文数据库信息科技辑, no. 09, pages 4 - 1 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240095490A1 (en) | Aspect Pre-selection using Machine Learning | |
US10515378B2 (en) | Extracting relevant features from electronic marketing data for training analytical models | |
CN109034853B (zh) | 基于种子用户寻找相似用户方法、装置、介质和电子设备 | |
CN114117216A (zh) | 推荐概率预测方法及装置、计算机存储介质和电子设备 | |
CN111695960A (zh) | 一种对象推荐系统、方法、电子设备及存储介质 | |
CN111209478A (zh) | 任务推送方法及装置、存储介质及电子设备 | |
CN113159355A (zh) | 数据预测方法、装置、物流货量预测方法、介质、设备 | |
CN111612581A (zh) | 一种物品推荐的方法、装置、设备及存储介质 | |
CN111209351A (zh) | 对象关系预测、对象推荐方法及装置、电子设备、介质 | |
CN110889725A (zh) | 在线广告ctr预估方法、装置、设备及存储介质 | |
CN111738766A (zh) | 用于多媒体信息的数据处理方法、装置以及服务器 | |
CN111340605B (zh) | 训练用户行为预测模型、用户行为预测的方法和装置 | |
CN110348581B (zh) | 用户特征群中用户特征寻优方法、装置、介质及电子设备 | |
CN110310162B (zh) | 样本生成的方法及装置 | |
CN111814050A (zh) | 旅游场景强化学习模拟环境构建方法、系统、设备和介质 | |
CN111754300A (zh) | 一种商品推荐方法、装置、设备和存储介质 | |
CN111695967A (zh) | 一种报价的确定方法、装置、设备及存储介质 | |
CN111368195A (zh) | 一种模型训练方法、装置、设备及存储介质 | |
CN113822688A (zh) | 广告转化率预估方法及装置、存储介质、电子设备 | |
CN110503306A (zh) | 一种满意度指标可视化处理方法及装置 | |
CN115860877A (zh) | 一种产品营销方法、装置、设备及介质 | |
CN110516024B (zh) | 地图搜索结果展现方法、装置、设备和存储介质 | |
CN111507366B (zh) | 推荐概率模型的训练方法、智能补全方法及相关装置 | |
CN112559877A (zh) | 基于跨平台异构数据及行为上下文的ctr预估方法及系统 | |
US8126765B2 (en) | Market demand estimation method, system, and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |