CN112884529B - 一种广告竞价方法、装置、设备及介质 - Google Patents
一种广告竞价方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN112884529B CN112884529B CN202110311536.5A CN202110311536A CN112884529B CN 112884529 B CN112884529 B CN 112884529B CN 202110311536 A CN202110311536 A CN 202110311536A CN 112884529 B CN112884529 B CN 112884529B
- Authority
- CN
- China
- Prior art keywords
- advertisement
- exposure times
- determining
- sample
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000009826 distribution Methods 0.000 claims abstract description 183
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims description 40
- 230000008569 process Effects 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 230000008685 targeting Effects 0.000 claims description 13
- 239000002131 composite material Substances 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 22
- 239000013598 vector Substances 0.000 description 12
- 238000004891 communication Methods 0.000 description 9
- 238000013135 deep learning Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0273—Determination of fees for advertising
- G06Q30/0275—Auctions
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开涉及一种广告竞价方法、装置、设备及介质。由于预先训练有预测模型,通过该预测模型,基于任一目标终端的特征信息,确定包括该目标终端对候选广告在不同曝光次数下的点击率的分布序列。根据该分布序列包含的每个点击率、及保存的该候选广告在目标终端上的历史曝光次数,确定该候选广告对应的权重值。后续基于候选广告的eCPM及候选广告对应的权重值,所确定的该候选广告的综合分值可以综合考虑该候选广告在不同曝光次数下目标终端对该候选广告的点击率的影响。当确定该候选广告的综合分值满足预设的投放条件,将该候选广告确定为目标广告投放给目标终端进行展示,有利于有效提高目标广告的点击率和准确性。
Description
技术领域
本公开涉及大数据技术领域,尤其涉及一种广告竞价方法、装置、设备及介质。
背景技术
随着互联网的广泛应用,广告投放的方式已经从传统的线下投放(如报纸、杂志、实体广告栏)转向线上广告投放,如利用各种APP应用页面或者网站页面进行广告的线上投放,互联网广告应运而生。互联网广告俨然成为广告传播的主要途径之一,日益受到广告主的青睐。如何从众多广告主的广告中,确定目标广告并将目标广告投放给目标终端进行展示,是人们日益关注的问题。
发明内容
本公开提供了一种广告竞价方法、装置、设备及介质,用以准确地确定目标广告。
本公开提供了一种广告竞价方法,所述方法包括:
获取目标终端的特征信息;
通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列;
基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值;
根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值;
若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告并投放给所述目标终端进行展示。
在某些可能的实施方式中,所述基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值,包括:
确定所述分布序列中包含的最大值;
基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值。
在某些可能的实施方式中,所述基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值,包括:
若所述期望曝光次数大于所述历史曝光次数,则从所述每个点击率分别对应的曝光次数中,确定不大于所述期望曝光次数,且不小于所述历史曝光次数的每个参考曝光次数;根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值;
若所述期望曝光次数不大于所述历史曝光次数,则将预设的数值确定为所述候选广告对应的权重值。
在某些可能的实施方式中,通过如下公式根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值:
其中,maxcnt表示所述期望曝光次数,n表示所述历史曝光次数,pn表示所述分布序列中所述历史曝光次数对应的第二点击率,pi表示所述分布序列中参考曝光次数i对应的第一点击率。
在某些可能的实施方式中,所述确定所述候选广告的综合分值满足预设的投放条件,包括:
若所述综合分值大于预设的分数阈值,且当前确定的目标广告的数量小于预设数量,则确定所述候选广告的综合分值满足预设的投放条件。
在某些可能的实施方式中,所述确定所述候选广告的综合分值满足预设的投放条件,包括:
若所述候选广告的综合分值,在针对所述目标终端对应的每个候选广告的综合分值中,满足预设的筛选条件,则确定所述候选广告的综合分值满足预设的投放条件。
在某些可能的实施方式中,所述点击率预测模型通过如下方式确定:
获取样本集中的任一样本终端对应的样本特征信息,其中,所述样本终端对应有样本分布序列;所述样本分布序列包括所述样本终端在不同曝光次数下对任一广告的点击率;
通过原始点击率预测模型,基于所述样本特征信息,确定包括所述样本终端对样本候选广告在不同曝光次数下的点击率的识别分布序列;
根据所述识别分布序列以及所述样本分布序列,对所述原始点击率预测模型进行训练。
在某些可能的实施方式中,通过如下方式获取所述样本终端对应的样本分布序列:
针对不同曝光次数,确定在该曝光次数下,投放给所述样本终端的第一广告的第一数量、以及所述每个第一广告中被点击的第二广告的第二数量;根据所述第一数量以及所述第二数量,确定所述样本终端在该曝光次数下对任一广告的点击率。
在某些可能的实施方式中,所述方法还包括:
基于所述目标终端的标识信息、所述目标广告在所述目标终端上的已曝光次数、以及所述目标广告是否被点击,确定所述目标终端对应的优化分布序列;
基于所述目标终端对应的特征信息、以及所述目标终端对应的优化分布序列,对所述点击率预测模型继续训练。
本公开提供了一种广告竞价装置,所述装置包括:
获取单元,用于获取目标终端的特征信息;
第一处理单元,用于通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列;
第二处理单元,用于基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值;
第三处理单元,用于根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值;
确定单元,用于若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告;
发送单元,用于将所述目标广告投放给所述目标终端进行展示。
在某些可能的实施方式中,所述第二处理单元,具体用于确定所述分布序列中包含的最大值;基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值。
在某些可能的实施方式中,所述第二处理单元,具体用于若所述期望曝光次数大于所述历史曝光次数,则从所述每个点击率分别对应的曝光次数中,确定不大于所述期望曝光次数,且不小于所述历史曝光次数的每个参考曝光次数;根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值;若所述期望曝光次数不大于所述历史曝光次数,则将预设的数值确定为所述候选广告对应的权重值。
在某些可能的实施方式中,所述第二处理单元,具体用于通过如下公式根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值:
其中,maxcnt表示所述期望曝光次数,n表示所述历史曝光次数,pn表示所述分布序列中所述历史曝光次数对应的第二点击率,pi表示所述分布序列中参考曝光次数i对应的第一点击率。
在某些可能的实施方式中,所述确定单元,具体用于若所述综合分值大于预设的分数阈值,且当前确定的目标广告的数量小于预设数量,则确定所述候选广告的综合分值满足预设的投放条件。
在某些可能的实施方式中,所述确定单元,具体用于若所述候选广告的综合分值,在针对所述目标终端对应的每个候选广告的综合分值中,满足预设的筛选条件,则确定所述候选广告的综合分值满足预设的投放条件。
在某些可能的实施方式中,所述装置还包括:训练单元;
所述训练单元,用于通过如下方式确定所述点击率预测模型:
获取样本集中的任一样本终端对应的样本特征信息,其中,所述样本终端对应有样本分布序列;所述样本分布序列包括所述样本终端在不同曝光次数下对任一广告的点击率;
通过原始点击率预测模型,基于所述样本特征信息,确定包括所述样本终端对样本候选广告在不同曝光次数下的点击率的识别分布序列;
根据所述识别分布序列以及所述样本分布序列,对所述原始点击率预测模型进行训练。
在某些可能的实施方式中,所述装置还包括:预处理单元;
所述预处理单元,用于通过如下方式获取所述样本终端对应的样本分布序列:
针对不同曝光次数,确定在该曝光次数下,投放给所述样本终端的第一广告的第一数量、以及所述每个第一广告中被点击的第二广告的第二数量;根据所述第一数量以及所述第二数量,确定所述样本终端在该曝光次数下对任一广告的点击率。
在某些可能的实施方式中,所述装置还包括:更新单元;
所述更新单元,用于基于所述目标终端的标识信息、所述目标广告在所述目标终端上的已曝光次数、以及所述目标广告是否被点击,确定所述目标终端对应的优化分布序列;
基于所述目标终端对应的特征信息、以及所述目标终端对应的优化分布序列,对所述点击率预测模型继续训练。
本公开提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述广告竞价方法的步骤。
本公开提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述广告竞价方法的步骤。
由于预先训练有点击率预测模型,通过该点击率预测模型,可以基于任一目标终端的特征信息,确定包括该目标终端对候选广告在不同曝光次数下的点击率的分布序列。根据该分布序列、以及保存的该候选广告在目标终端上的历史曝光次数,确定该候选广告对应的权重值。后续基于该候选广告的预测收入以及该候选广告对应的权重值,所确定的该候选广告的综合分值可以综合考虑该候选广告在不同曝光次数下目标终端对该候选广告的点击率的影响。最后根据该候选广告的综合分值是否满足预设的投放条件,从而确定是否将该候选广告确定为目标广告并投放给目标终端进行展示,有利于有效提高目标广告的点击率以及准确性,尽可能保证在目标终端展示的目标广告被点击。
本公开的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本公开而了解。本公开的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种广告竞价的过程示意图;
图2为本公开提供的一种原始点击率预测模型的结构示意图;
图3为本公开实施例提供的具体的广告竞价流程示意图;
图4为本公开实施例提供的一种预处理后的日志的示意图;
图5为本公开实施例提供的一种关联后的日志的示意图;
图6为本公开实施例提供的具体的获取目标终端对应的分布序列的流程图;
图7为本公开实施例提供的具体的广告竞价流程示意图;
图8为本公开实施例提供的一种广告竞价装置的结构示意图;
图9为本公开实施例提供的一种电子设备结构示意图。
具体实施方式
下面将结合附图对本公开作进一步地详细描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
为了方便理解,下面对本公开实施例中涉及的部分概念进行解释:
点击率(Click-Through-Rate,CTR):互联网广告被投放到某一移动终端后被点击的可能性。
千次展示获得收入(effective cost per mile,eCPM):每一千次展示可以获得的广告收入。
广告竞价:每次用户请求,广告投放系统会通过竞价从候选广告中筛选出eCPM最高的广告进行投放。
下面对本公开实施例的设计思想进行介绍。
在广告竞价过程中,对于任一待投放的广告,预先配置了该广告被单次点击的收入。当接收到某一目标终端发送的曝光请求后,对该曝光请求进行解析,获取该曝光请求中携带的特征信息。针对每个待投放的广告,将获取到的特征信息与预先配置的该广告的定向条件进行匹配,若确定该曝光请求中携带的特征信息满足该广告的定向条件,则确定该广告为投放给该目标终端进行展示的候选广告,预测该候选广告在当前曝光次数下的点击率;根据该候选广告的点击率以及被单次点击的收入,确定该候选广告的eCPM。
其中,当前曝光次数是根据候选广告的历史曝光次数确定的。
由于待投放的广告有很多,针对每个广告均执行上述的操作,确定投放给目标终端进行展示的候选广告的eCPM。按照eCPM从大到小的顺序,将每个候选广告排序,将排序在前N个的候选广告确定为投放给目标终端进行展示的目标广告。其中,N为预先配置的可以投放给目标终端进行展示的目标广告的数量,比如,N=1。
经大数据分析发现,广告的曝光次数会影响用户的点击率。用户对某一广告的点击率,可能会随着该广告在该用户的移动终端上的曝光次数的增加,呈现先上升后下降的趋势,即任一用户对广告在不同曝光次数下的点击率是不同的,比如,用户A在广告1曝光1次时的点击率是0.3,用户A在广告1曝光3次时的点击率是0.8。并且不同用户对广告的点击率最大时,广告所需的曝光次数是不同的,比如,用户A在广告1曝光3次时的点击率最大,而用户B在广告1曝光5次时的点击率最大。
对于上述广告竞价的技术方案,其只考虑了各候选广告的eCPM,便从各候选广告中确定目标广告并将目标广告投放,将除目标广告之外的其他候选广告不进行投放,使得一些只是在当前曝光次数下的点击率低,但当前曝光次数并未达到该用户对广告点击率最大时所对应的曝光次数(为了方便描述,记为期望曝光次数)的候选广告,无法曝光,也无法快速到达期望曝光次数。其并没有考虑如果将某一候选广告进行投放后,是否会有利于提高该候选广告后续在该目标终端上曝光的点击率,进而提高该候选广告的收益期望的情况。
为了改善上述情况,本公开提供了一种广告竞价方法、装置、设备及介质中,预先训练有点击率预测模型,通过该点击率预测模型,可以基于任一目标终端的特征信息,确定包括该目标终端对候选广告在不同曝光次数下的点击率的分布序列。根据该分布序列、以及保存的该候选广告在目标终端上的历史曝光次数,确定该候选广告对应的权重值。后续基于该候选广告的预测收入以及该候选广告对应的权重值,所确定的该候选广告的综合分值可以综合考虑该候选广告在不同曝光次数下目标终端对该候选广告的点击率的影响。最后根据该候选广告的综合分值是否满足预设的投放条件,从而确定是否将该候选广告确定为目标广告并投放给目标终端进行展示,有利于有效提高目标广告的点击率以及准确性,尽可能保证在目标终端展示的目标广告被点击。
图1为本公开实施例提供的一种广告竞价的过程示意图,该过程包括:
S101:获取目标终端的特征信息。
本公开提供的广告竞价方法可应用于电子设备,该电子设备可以是服务器,也可以是智能设备等。具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体限定。
当目标用户点开某一应用或者网页时,该目标用户的移动终端(为了方便描述,记为目标终端)会向进行广告竞价的电子设备发送曝光请求,该曝光请求会携带有该目标终端的特征信息。进行广告竞价的电子设备获取到该曝光请求后,对该曝光请求进行解析,获取该曝光请求中携带的目标终端的特征信息。基于该目标终端的特征信息,进行相应的处理,确定投放给该目标终端的目标广告。
其中,任一目标终端的特征信息包括该目标终端的设备号、该目标终端的IP地址、该目标终端的MAC地址、该目标终端所归属的目标用户的用户画像中的至少一种。
任一目标用户的用户画像信息包括该目标用户的性别、年龄、爱好、职业、收入等可以体现目标用户特征的信息中的至少一种。
需要说明的是,上述实施例中所举出的特征信息以及用户画像信息仅是为了方便说明所提出的示例性的信息,并不是对本发明实施例所提供的目标终端的特征信息和目标用户的用户画像信息的一种限定。本领域技术人员应当知道,可以体现目标终端特征信息以及体现用户特征的信息均可应用于本发明实施例中。
S102:通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列。
为了准确地确定目标广告,预先训练有点击率预测模型。当获取到目标终端的特征信息后,将该特征信息输入到预先训练完成的点击率预测模型。通过该点击率预测模型,基于该特征信息,获取该目标终端对应的分布序列。其中,该分布序列包括该目标终端对任一候选广告在不同曝光次数下的点击率。
S103:基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值。
S104:根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值。
为了可以将广告主的广告投放给优质的流量,预先配置了每个广告的定向条件,即预先分别配置了每个广告所要投放的终端的特征信息。当获取到目标终端的特征信息,针对待投放的每个广告,确定该广告的定向条件是否与该特征信息匹配。若确定该广告的定向条件与该特征信息匹配,则确定该广告可以作为投放给目标终端的候选广告。若确定该广告的定向条件与该特征信息不匹配,说明该广告不适合投放给目标终端进行展示,则确定该广告不为投放给目标终端的候选广告。
在一些可能的实施方式中,可能出现一些被多次投放给目标终端进行展示,但仍没有被目标用户点击的广告,对于这些广告,这些广告的已曝光次数很可能已经超过了该目标用户对广告点击的期望曝光次数了,即这些广告的历史曝光次数大于该目标用户对广告点击的期望曝光次数,且这些广告很可能不被目标用户点击。因此,在确定某一广告是否为投放给目标终端的候选广告时,不仅考虑该广告的定向条件,还考虑该广告在目标终端上曝光的次数,即考虑该广告在目标终端上的历史曝光次数。
其中,任一广告在目标终端上的历史曝光次数可以是广告在目标终端上进行展示的总次数,也可以是该广告在设定时间段内在目标终端上进行展示的次数。
为了控制投放给目标终端进行展示的目标广告的曝光次数,预先设置有次数阈值。针对待投放的每个广告,确定该广告的定向条件是否与该特征信息匹配,且该广告在该目标终端上的历史曝光次数是否小于预设的次数阈值。若确定该广告的定向条件与该特征信息匹配,且该广告在该目标终端上的历史曝光次数小于预设的次数阈值,则将该广告确定为投放给目标终端的候选广告。若确定该广告的定向条件与该特征信息不匹配,或,确定该广告在该目标终端上的历史曝光次数不小于预设的次数阈值,说明该广告不适合投放给目标终端进行展示,则确定该广告不为投放给目标终端的候选广告。
作为一种可能的实施方式,由于短时间内将某一目标广告多次投放给目标终端进行展示的话,很可能会降低目标用户对该目标广告的兴趣度以及点击率。因此,为了避免上述情况的出现,针对待投放的每个广告,确定该广告的定向条件是否与该特征信息匹配,且该广告在设定时间段内在该目标终端上的历史曝光次数是否小于预设的次数阈值。其中,该设定时间段可以为某一时刻之前的设定时间长度的时间段,比如,当前时刻之前的3个小时,周五零点之前的7天等,也可以是预设的某一时间段。具体实施中,可以根据实际需求进行灵活设置,在此不做具体限定。
若确定该广告的定向条件与该特征信息匹配,且该广告在设定时间段内在该目标终端上的历史曝光次数小于预设的次数阈值,则将该广告确定为投放给目标终端的候选广告。若确定该广告的定向条件与该特征信息不匹配,或,确定该广告在设定时间段内在该目标终端上的历史曝光次数不小于预设的次数阈值,说明该广告不适合投放给目标终端进行展示,则确定该广告不为投放给目标终端的候选广告。
比如,设定时间段为当前时刻之前的5天,预设的次数阈值为5次,确定定向条件与目标终端的特征信息匹配的广告有广告1、广告2,统计的广告1在当前时刻之前的5天内在该目标终端上的历史曝光次数为5次,广告2在当前时刻之前的5天内在该目标终端上的历史曝光次数3次,确定广告1在当前时刻之前的5天内的历史曝光次数5次不小于预设的次数阈值5次,则确定广告1不为投放给目标终端的候选广告,确定广告2在当前时刻之前的5天内的历史曝光次数3次小于预设的次数阈值5次,则确定广告2为投放给目标终端的候选广告。
任一候选广告的历史曝光次数、以及目标用户对候选广告在不同曝光次数下的点击率,对确定目标用户在当前曝光次数下点击该候选广告的可能性有一定的影响。当基于上述的实施例确定了候选广告后,获取任一候选广告,根据上述S102获取到的分布序列、以及保存的该候选广告在目标终端上的历史曝光次数,进行相应的处理,确定该候选广告对应的权重值。
在一种可能的实施方式中,当基于上述的实施例获取到了目标终端对应的分布序列后,可以从该分布序列中,确定最大值并获取最大值对应的曝光次数,即获取期望曝光次数。基于获取到的期望曝光次数以及该候选广告的历史曝光次数,进行相应的处理,确定候选广告对应的权重值。
由于可能出现候选广告的历史曝光次数已经超过了期望曝光次数的情况,如果继续将该种候选广告投放到目标终端进行展示,用户点击该广告的点击率很可能会下降。而对于历史曝光次数还未到达期望曝光次数的候选广告,将该种候选广告投放到目标终端进行展示,用户点击该广告的点击率很可能会提高。因此,在确定候选广告对应的权重值时,获取到了候选广告对应的期望曝光次数以及历史曝光次数后,可以将该候选广告对应的期望曝光次数与历史曝光次数进行比较,根据比较结果,确定该候选广告对应的权重值。
在一种可能的实施方式中,所述基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值,包括:
若所述期望曝光次数大于所述历史曝光次数,则从所述每个点击率分别对应的曝光次数中,确定不大于所述期望曝光次数,且不小于所述历史曝光次数的每个参考曝光次数;根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值;
若所述期望曝光次数不大于所述历史曝光次数,则将预设的数值确定为所述候选广告对应的权重值。
为了准确地确定目标广告,当确定期望曝光次数大于历史曝光次数时,即该候选广告在目标终端上展示,被用户点击的可能性还未到最大点击率时,可以根据基于S102获取到的分布序列中每个点击率分布对应的曝光次数中,确定不大于该候选广告的期望曝光次数,且不小于该候选广告的历史曝光次数的曝光次数(为了方便描述,记为参考曝光次数),并确定分布序列中每个参考曝光次数分布对应的点击率(为了方便描述,记为第一点击率)。基于每个第一点击率以及历史曝光次数,确定该候选广告的权重值。
作为一种可能的实施方式,通过如下公式基于每个第一点击率以及历史曝光次数,确定该候选广告的权重值:
其中,maxcnt表示所述期望曝光次数,n表示所述历史曝光次数,pn表示所述分布序列中所述历史曝光次数对应的第二点击率,pi表示所述分布序列中参考曝光次数i对应的第一点击率。
为了准确地确定候选广告对应的权重值,预设有数值,比如,1,0.9等。当确定期望曝光次数不大于历史曝光次数时,即该候选广告在目标终端上展示,被用户点击的可能性已经达到了最大点击率时,可以直接将预设的数值确定为该候选广告对应的权重值。
当获取到了该候选广告的权重值之后,根据获取到的该候选广告的预测收入以及该候选广告的权重值,进行相应的处理,确定该候选广告的综合分值。
在一种可能的实施方式中,该候选广告的预测收入可以是该候选广告的被单次点击的收入、百次展示获得收入,eCPM等。
作为一种可能的实施方式,根据该候选广告的预测收入以及该候选广告的权重值,进行相应的处理,确定该候选广告的综合分值,可通过如下公式确定:
Pk=Qk*Wk
其中,Pk为候选广告k的综合分值,Qk为候选广告k的预测收入,Wk为候选广告k的权重值。
若候选广告的预测收入为eCPM,则获取候选广告的eCPM通过如下公式确定:
eCPMk=bidk*1000*CTRk
其中,eCPMk表示候选广告k的eCPM,bidk表示候选广告k被单次点击的收入,CTRk为预测的候选广告k在当前曝光次数下的点击率。
由于可以投放给目标终端进行展示的候选广告有若干个,针对每个候选广告,均执行上述的步骤,确定每个候选广告分别对应的综合分值。
S105:若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告并投放给所述目标终端进行展示。
为了准确地确定目标广告,预设有投放条件。当基于上述实施例获取到任一候选广告的综合分值后,判断该候选广告的综合分值是否满足预设的投放条件,从而确定该候选广告是否为目标广告。若确定该候选广告的综合分值满足预设的投放条件,则将该候选广告确定为目标广告并投放给目标终端进行展示。若确定该候选广告的综合分值不满足预设的投放条件,则不将该候选广告确定为目标广告。
其中,该预设的投放条件可以为大于预设的分数阈值,也可以为大于预设的分数阈值,且当前确定的目标广告的数量小于预设数量。还可以为在目标终端对应的每个候选广告的综合分值中的最大值等。具体实施过程中,可以根据实际需求进行灵活设置,在此不做具体限定。
作为一种可能的实施方式,若预设的条件为大于预设的分数阈值,当基于上述实施例获取到任一候选广告的综合分值后,判断该候选广告的综合分值是否大于该预设的分数阈值,从而确定该候选广告是否为目标广告。
若确定该候选广告的综合分值大于该预设的分数阈值,则将该候选广告确定为目标广告并投放给目标终端进行展示。
若确定该候选广告的综合分值不大于该预设的分数阈值,则不将该候选广告确定为目标广告。
作为另一种可能的实施方式,若预设的条件为大于预设的分数阈值,且当前确定的目标广告的数量小于预设数量,当基于上述实施例获取到任一候选广告的综合分值后,判断该候选广告的综合分值是否大于该预设的分数阈值,并判断当前确定的目标广告的数量是否小于预设数量,从而确定该候选广告是否为目标广告。
若确定该候选广告的综合分值大于该预设的分数阈值,且当前确定的目标广告的数量小于预设数量,则将该候选广告确定为目标广告并投放给目标终端进行展示。
若确定该候选广告的综合分值不大于该预设的分数阈值,或,当前确定的目标广告的数量不小于预设数量,则不将该候选广告确定为目标广告。
作为再一种可能的实施方式,预设有筛选条件,该筛选条件可以是按照综合分值从大到小的顺序,排序在前的N个综合分值等。其中,N为正整数。获取到目标终端对应的每个候选广告的综合分值后,按照综合分值从大到小的顺序,将每个综合分值进行排序。对于任一候选广告,判断该综合广告的综合分值,在针对该目标终端对应的每个候选广告的综合分值中,是否满足预设的筛选条件,从而确定该候选广告的综合分值是否满足预设的投放条件。
比如,预设的筛选条件为按照综合分值从大到小的顺序,排序在前的N个综合分值,对于任一候选广告,判断该综合广告的综合分值是否在排序在前的N个综合分值中。若确定该候选广告的综合分值在排序在前的N个综合分值中,则确定该候选广告的综合分值满足预设的投放条件。
若确定该候选广告的综合分值不在排序在前的N个综合分值中,则确定该候选广告的综合分值不满足预设的投放条件。
由于预先训练有点击率预测模型,通过该点击率预测模型,可以基于任一目标终端的特征信息,确定包括该目标终端对候选广告在不同曝光次数下的点击率的分布序列。根据该分布序列、以及保存的该候选广告在目标终端上的历史曝光次数,确定该候选广告对应的权重值。后续基于该候选广告的预测收入以及该候选广告对应的权重值,所确定的该候选广告的综合分值可以综合考虑该候选广告在不同曝光次数下目标终端对该候选广告的点击率的影响。最后根据该候选广告的综合分值是否满足预设的投放条件,从而确定是否将该候选广告确定为目标广告并投放给目标终端进行展示,有利于有效提高目标广告的点击率以及准确性,尽可能保证在目标终端展示的目标广告被点击。
在一种可能的实施方式中,所述点击率预测模型通过如下方式确定:
获取样本集中的任一样本终端对应的样本特征信息,其中,所述样本终端对应有样本分布序列;所述样本分布序列包括所述样本终端在不同曝光次数下对任一广告的点击率;
通过原始点击率预测模型,基于所述样本特征信息,确定包括所述样本终端对样本候选广告在不同曝光次数下的点击率的识别分布序列;
根据所述识别分布序列以及所述样本分布序列,对所述原始点击率预测模型进行训练。
为了训练点击率预测模型,预先收集了用于训练点击率预测模型的样本集,该样本集中包含有样本终端对应的样本特征信息,以根据样本集中样本终端对应的样本特征信息,对原始点击率模型进行训练,以便后续可以通过训练完成的点击率模型,基于任一目标终端的特征信息,即可预测该目标终端对任一候选广告在不同曝光次数下的点击率。其中,任一样本终端该对应有样本分布序列,该样本分布序列中包括该样本终端在不同曝光次数下对任一广告的点击率。
在一种可能的实施方式中,通过如下方式获取所述样本终端对应的样本分布序列:
针对不同曝光次数,确定在该曝光次数下,投放给所述样本终端的第一广告的第一数量、以及所述每个第一广告中被点击的第二广告的第二数量;根据所述第一数量以及所述第二数量,确定所述样本终端在该曝光次数下对任一广告的点击率。
为了获取到样本终端对应的样本分布序列,对于任一样本终端,预先收集了每次接收到该样本终端的曝光请求后投放给该样本终端的广告的信息(为了方便描述,记为曝光信息),以及该样本终端在投放的广告中实际点击的广告的信息(为了方便描述,记为点击信息)。将该样本终端的每个曝光信息、以及每个点击信息进行汇总。然后对于任一曝光次数,根据汇总后的信息,确定在该曝光次数下,投放给该样本终端的广告(为了方便描述,记为第一广告)的数量(为了方便描述,记为第一数量),以及该样本终端在投放的每个第一广告中所点击的广告(为了方便描述,记为第二广告)的数量(为了方便描述,记为第二数量)。根据该曝光次数下的第一数量以及第二数量,可以确定该样本终端在该曝光次数下对任一广告的点击率。
为了保证点击率预测模型可以准确预测出经常点击广告的终端对应的分布序列,预设有点击阈值,比如,100。在获取用于训练点击率预测模型的样本终端时,针对每个终端,获取该终端对每次展示的目标广告点击的总次数,将该总次数与预设的点击阈值进行比较。若该总次数大于预设的点击阈值,则将该终端确定为样本终端,获取该样本终端的特征信息以及对应的样本分布序列;若该总次数不大于预设的点击阈值,则确定该终端不为样本终端。
需要说明的是,在设置点击阈值时,可以根据场景的不同,设置不同的值,如果尽可能的准确预测出经常点击广告的终端对应的分布序列,可以将点击阈值设置的大一些,如果希望点击率预测模型预测的分布序列更加普适性,可以将点击阈值设置的小一些。
在一种可能的实施方式中,通过如下公式根据该曝光次数下的第一数量以及第二数量,确定该样本终端在该曝光次数下对任一广告的点击率:
CTRi=D2/D1
其中,CTRi为该样本终端在曝光次数i下对任一广告的点击率,D1表示曝光次数i下的第一数量,D2表示曝光次数i下的第二数量。
由于样本分布序列中包含样本终端在不同曝光次数下对任一广告的点击率,则针对每个曝光次数,均执行上述的操作,确定该样本终端对应的样本分布序列。
当基于上述的实施例获取到了用于训练点击率预测模型的样本集后,获取样本集中任一样本终端对应的样本特征信息,将该样本特征信息输入到原始点击率预测模型。通过该原始点击率预测模型,基于输入的样本特征信息,获取包括该样本终端在不同曝光次数下对任一广告的点击率的识别分布序列。基于该样本终端的识别分布序列以及样本分布序列,确定损失值。根据确定的损失值,对原始点击率预测模型进行训练,即对原始点击率预测模型包含的参数的参数值进行调整。
在一种可能的实施方式中,点击率预测模型为深度学习模型,该深度学习模型主要包括向量(embedding)层、深度学习层以及输出层。其中,向量层与深度学习层连接,向量层用于将输入的特征信息转化为方便机器学习特征的向量,并将转化的向量输出给深度学习层;深度学习层与输出层连接,深度学习层用于根据向量层输出的向量进行相应的计算,获取隐含特征,将该隐含特征输出给输出层;输出层用于分别通过包含的预设数量的神经元,对深度学习层输出的隐含特征进行相应的处理,比如,softmax归一化处理等,获取样本终端对应的识别分布序列并输出。
图2为本公开实施例提供的一种原始点击率预测模型的结构示意图。如图2所示,该原始点击率预测模型中包括向量层、深度学习层以及输出层,向量层与深度学习层连接,深度学习层与输出层连接。获取任一样本终端的特征信息后,将该特征信息输入到原始点击率预测模型的向量层,通过该向量层,获取该特征信息对应的特征向量;通过原始点击率预测模型的深度学习层,获取该特征向量对应的隐含特征;通过原始点击率预测模型中的输出层,基于输入的隐含特征,获取样本终端对应的识别分布序列。
若预设有10个神经元,分别通过输出层中包含的10个神经元,基于输入的隐含特征,获取样本终端分别在10个不同的曝光次数下,对任一广告的点击率,即获取样本终端对应的识别分布序列。
在一种可能的实施方式中,基于该样本终端的识别分布序列以及样本分布序列,确定损失值可通过如下公式确定:
其中,MSE为损失值,yi表示识别分布序列中第i个元素的值,表示样本分布序列中第i个元素的值。
由于样本集中包含有若干个样本终端对应的样本特征信息,针对每个样本终端对应的样本特征信息,均执行上述的操作,直至训练的点击率预测模型满足预设的收敛条件。
其中,满足预设的收敛条件可以为在任一次迭代,根据样本集中的每个样本终端分别对应的识别分布序列以及分别对应的样本分布序列,所确定的损失值的和小于预设的损失值阈值,也可以为每次迭代所获得的损失值的和中的最小值,还可以是对原始点击率预测模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
作为一种可能的实施方式,在进行点击率预测模型训练时,可以把样本集中的样本分布序列分为训练样本和测试样本,先基于训练样本对原始点击率预测模型进行训练,再基于测试样本对上述已训练的点击率预测模型的可靠程度进行验证。
下面通过具体的实施例对本公开提供的一种广告竞价方法进行详细的说明:
以执行主体为服务器为例,图3为本公开实施例提供的具体的广告竞价流程示意图,该流程包括:
S301:第一服务器获取样本集中任一样本终端对应的样本分布序列。
其中,任一样本终端对应的样本分布序列包括该样本终端在不同曝光次数下对任一广告的点击率。
具体的,通过如下方式获取样本终端对应的样本分布序列:
针对不同曝光次数,确定在该曝光次数下,投放给样本终端的第一广告的第一数量、以及每个第一广告中被点击的第二广告的第二数量;根据第一数量以及第二数量,确定样本终端在该曝光次数下对任一广告的点击率。
S302:第一服务器获取样本集中的任一样本终端对应的样本特征信息。
S303:第一服务器通过原始点击率预测模型,基于获取到的样本特征信息,确定包括该样本终端对样本候选广告在不同曝光次数下的点击率的识别分布序列。
S304:第一服务器根据获取到的识别分布序列以及该样本终端对应的样本分布序列,对原始点击率预测模型进行训练。
在进行点击率预测模型训练的过程中,一般采用离线的方式,第一服务器预先通过样本集中的任一样本终端对应的样本特征信息以及对应的样本分布序列,对原始点击率预测模型进行训练,以获得训练完成的点击率预测模型。
基于上述第一服务器训练完成的点击率预测模型,将上述训练完成的点击率预测模型保存到第二服务器中,通过第二服务器确定投放给目标终端的目标广告,具体实现包括如下步骤:
S305:第二服务器获取目标终端的特征信息以及目标终端对应的候选广告。
S306:第二服务器通过预先训练完成的点击率预测模型,基于特征信息,确定包括目标终端对候选广告在不同曝光次数下的点击率的分布序列。
S307:第二服务器确定分布序列中包含的最大值,并确定该最大值对应的期望曝光次数。
对于目标终端对应的任一候选广告,均执行以下步骤:
S308:第二服务器获取该候选广告在该目标终端上的历史曝光次数。
S309:第二服务器判断该候选广告的期望曝光次数是否大于该历史曝光次数,若大于,则执行S310,否则,执行S311。
S310:第二服务器从每个点击率分别对应的曝光次数中,确定不大于该期望曝光次数,且不小于历史曝光次数的每个参考曝光次数;根据分布序列中每个参考曝光次数分别对应的第一点击率、以及该历史曝光次数,确定该候选广告对应的权重值,执行S312。
其中,通过如下公式根据分布序列中每个参考曝光次数分别对应的第一点击率、以及历史曝光次数,确定候选广告对应的权重值:
其中,maxcnt表示期望曝光次数,n表示历史曝光次数,pn表示分布序列中历史曝光次数对应的第二点击率,pi表示分布序列中参考曝光次数i对应的第一点击率。
S311:第二服务器将预设的数值确定为候选广告对应的权重值。
S312:第二服务器根据该候选广告的预测收入以及权重值,确定该候选广告的综合分值。
S313:第二服务器判断该候选广告的综合分值是否满足预设的投放条件,若满足,则执行S314,否则,执行S315。
S314:第二服务器将候选广告确定为目标广告并投放给目标终端进行展示。
S315:第二服务器获取下一候选广告,直至目标终端对应的最后一个候选广告。
为了进一步提高确定的目标广告的准确性,在上述实施例的基础上,在本公开中,所述方法还包括:
基于所述目标终端的标识信息、所述目标广告在所述目标终端上的已曝光次数、以及所述目标广告是否被点击,确定所述目标终端对应的优化分布序列;
基于所述目标终端对应的特征信息、以及所述目标终端对应的优化分布序列,对所述点击率预测模型继续训练。
为了进一步保证点击率预测模型预测的分布序列的准确性,在本公开中,可以对预先训练的点击率预测模型进行更新,即对点击率预测模型进行进一步地训练。而为了实现对点击率预测模型进行进一步地训练,预先获取可以用于对该点击率预测模型进行进一步训练的样本集(为了方便说明,记为优化样本集),该优化样本集中也包含有若干终端的特征信息以及对应的分布序列(为了方便说明,记为优化分布序列),以基于该优化样本集中包含的终端的特征信息以及对应的优化分布序列,对训练完成的点击率预测模型进行进一步地训练。
需要说明的是,该优化样本集中的终端可以与上述样本集中的样本终端完全相同,也可以部分相同,当然还可以是优化样本集中的终端不仅包含上述样本集中的样本终端,还包含有上述样本集中没有的样本终端。
在一种可能的实施方式中,为了确定优化样本集中终端的特征信息以及终端对应的优化分布序列,可以在广告竞价过程中,根据目标终端的标识信息、确定的目标广告在目标终端上的已曝光次数以及目标广告是否被点击,实时对样本集中样本终端的特征信息以及样本终端对应的样本分化序列进行更新,将更新后的样本集确定为优化样本集。
当获取到任一目标终端的曝光请求后,对该曝光请求进行解析,获取该曝光请求中携带的目标终端的标识信息,将该标识信息与样本集中保存的每个样本终端的标识信息(为了方便描述,记为第一标识信息)进行匹配。若存在匹配的第一标识信息,则根据目标广告在目标终端上的已曝光次数以及目标广告是否被点击,确定该目标终端对应的优化分布序列并对匹配的第一标识信息所对应的样本分布序列进行更新;若不存在匹配的第一标识信息,则直接根据目标广告在目标终端上的已曝光次数以及目标广告是否被点击,确定该目标终端对应的优化分布序列并根据该目标终端的标识信息、特征信息以及对应的分布序列,对样本集进行更新,即对应保存该目标终端的标识信息、特征信息以及对应的优化分布序列到样本集中。
在一种可能的实施方式中,在根据目标广告在目标终端上的已曝光次数以及目标广告是否被点击,确定该目标终端对应的优化分布序列时,可以通过如下方式确定:
获取对该目标终端发送的所有曝光请求进行响应后分别确定的每个目标广告,分别统计每个目标广告已在目标终端进行展示的最大曝光次数。针对不同的最大曝光次数,确定在该最大曝光次数下,投放给该目标终端的目标广告(为了方便描述,记为第三广告)的数量(为了方便描述,记为第三数量)、以及每个第三广告中被用户点击的广告(为了方便描述,记为第四广告)的数量(为了方便描述,记为第四数量),根据第三数量以及第四数量,确定该目标终端在该最大曝光次数下对任一广告的点击率。根据每个最大曝光次数分别对应的点击率,确定该目标终端对应的优化分布序列。
其中,根据第三数量以及第四数量,确定该目标终端在该最大曝光次数下对任一广告的点击率,与上述根据第一数量以及第二数量,确定该样本终端在该曝光次数下对任一广告的点击率的方法类似,重复之处不做赘述。
在一种可能的实施方式中,还可以当获取到任一目标终端的曝光请求后,对该曝光请求进行解析,获取该曝光请求中携带的目标终端的标识信息,将该标识信息与保存的优化样本集中的每个终端的标识信息(为了方便描述,记为第二标识信息)进行匹配。若存在匹配的第二标识信息,则根据目标广告在目标终端上的已曝光次数以及目标广告是否被点击,确定该目标终端对应的分布序列并对优化样本集中匹配的第二标识信息所对应的优化分布序列进行更新;若不存在匹配的第二标识信息,则直接根据目标广告在目标终端上的已曝光次数以及目标广告是否被点击,确定该目标终端对应的优化分布序列并根据该目标终端的标识信息、特征信息以及对应的分布序列,对优化样本集进行更新,即对应保存该目标终端的标识信息、特征信息以及对应的优化分布序列到优化样本集中。
其中,在设置初始优化样本集时,该优化样本集可以为空,也可以包含有样本集中的部分样本终端的特征信息及其对应的样本分布序列,在后续进行广告竞价的过程中,可以对该优化样本集中的终端的特征信息及其对应的优化分布序列进行实时的更新。
当基于上述的实施例,获取到了优化样本集中之后,可以基于优化样本集中终端的特征信息、以及终端对应的优化分布序列,即基于目标终端对应的特征信息以及目标终端对应的优化分布序列,对点击率预测模型继续训练。具体的训练过程已在上述实施例中进行描述,在此不做具体限定。
为了尽可能的保证点击率预测模型的精度,可以预设更新周期,比如,一天、一周等,按照预设的更新周期,对点击率预测模型进行更新,当然也可以在接收到确认更新点击率预测模型的触发操作时,对点击率预测模型进行更新。具体实施过程中,可以灵活设置,在此不做具体限定。
需要说明的是,在设置更新周期时,可以根据场景的不同,设置不同的值,如果希望尽可能的及时更新点击率预测模型的精度,可以将更新周期设置的小一些;如果希望减少频繁更新点击率预测模型所耗费的资源,也可以将该更新周期设置的大一些。
在一种可能的实施方式中,为了方便模型训练,比如,对原始点击率预测模型进行训练,或者是对点击率预测模型进行进一步地训练,获取目标广告的曝光日志以及点击日志,基于每个目标广告的曝光日志以及点击日志,进行相应的处理,从而确定每个目标终端分别对应的分布序列。
为了准确地将目标广告响应某一目标终端发送的曝光请求后产生的曝光日志,与该目标广告响应该曝光请求在该目标终端上进行展示后产生的点击日志对应,任一目标广告的曝光日志中至少包括该目标广告所响应的曝光请求的标识信息(为了方便描述,记为请求标识信息)、该目标广告的标识信息(为了方便描述,记为广告标识信息)、以及目标终端的标识信息(为了方便描述,记为设备标识信息),任一目标广告的点击日志中也至少包括请求标识信息、广告标识信息以及设备标识信息,后续可以基于曝光日志以及点击日志中携带的请求标识信息、广告标识信息以及设备标识信息,确定每个曝光日志分别对应的点击日志。
为了方便后续确定目标广告在设定时间段内的历史曝光次数,任一目标广告的曝光日志中可以包括该目标广告的曝光时间。为了方便确定目标广告被点击的情况,任一目标广告的点击日志中可以包括该目标广告是否被点击的信息。其中,可以通过预设的标签表示目标广告是否被点击,该标签可以是数字、字母、特殊符号、字符串等,也可以为其他形式的,只要能唯一标识该目标广告是否被点击均可作为本公开中的标签。
比如,预设的第一标签“1”表示目标广告被点击,预设的第二标签“0”表示目标广告没有被点击。
为了方便后续确定在某段时间被曝光的广告被点击的情况,对于被点击的目标广告的点击日志中还可以包括该目标广告的点击时间。该点击时间可以用该目标广告的曝光时间表示,也可以是该目标广告接收到被点击的触发操作的时间。具体实施过程中,可以根据需求进行灵活设置。
为了方便确定目标广告的历史曝光次数,任一目标广告的曝光日志或点击日志中还可以包括该目标广告的已曝光次数,当然也可以在目标广告的曝光日志和点击日志中均包括该目标广告的已曝光次数。
由于可能出现终端突然关机、用户退出当前用于展示目标广告的界面等因素,导致确定的目标广告没有在终端上进行展示,即曝光的情况,任一目标广告的曝光日志中还可以包括该目标广告是否被曝光的信息。其中,可以通过预设的标签表示目标广告是否被曝光,该标签可以是数字、字母、特殊符号、字符串等,也可以为其他形式的,只要能唯一标识该目标广告是否被曝光均可作为本公开中的标签。
比如,预设的第三标签“a”表示目标广告被曝光,预设的第四标签“b”表示目标广告没有被曝光。
在一种可能的实施方式中,由于接收到的曝光请求是非常多的,导致产生的目标广告的曝光日志以及点击日志也非常的多,无法实时对产生的大量的曝光日志以及点击日志进行后续的处理。因此,在本公开中,当获取到任一目标广告的曝光日志或点击日志时,可以将该曝光日志或点击日志进行缓存,后续可以直接获取缓存的日志并进行处理。其中,日志可以缓存在消息队列中,比如,分布式发布订阅消息系统Kafka,也可以是缓存在数据库等。
获取到日志后,对获取到的日志进行解析和格式化等预处理,比如,通过分布式流数据流引擎(Flink)对获取到的日志进行解析和格式化,以使预处理后的日志可以按照预设的格式存储信息。图4为本公开实施例提供的一种预处理后的日志的示意图。通过对目标广告的曝光日志进行解析和格式化等预处理,获取预处理后的曝光日志数据(exposure_info),该预处理后的曝光日志数据中包括该目标广告的请求标识信息(req_uid),设备标识信息(user_id),广告标识信息(adform_id),曝光时间(exp_time),目标广告是否被曝光(exposure)。通过对目标广告的点击日志进行解析和格式化等预处理,获取预处理后的点击日志数据(click_info),该预处理后的点击日志数据中包括该目标广告的请求标识信息(req_uid),广告标识信息(adform_id),点击时间(click_time),目标广告是否被点击(click),该目标广告在该目标终端的历史曝光次数(exp_count)。
在一种可能的实施方式中,可能出现获取到的预处理后的日志也非常的多的情况,无法实时对大量的预处理后的日志进行后续的处理。因此,在本公开中,当获取到任一预处理后的日志时,可以将该预处理后的日志进行缓存,后续可以直接获取缓存的预处理后的日志并进行处理。其中,预处理的日志可以缓存在消息队列中,比如,分布式发布订阅消息系统Kafka,也可以是缓存在数据库等。
需要说明的是预处理的日志的缓存位置可以与上述日志的缓存位置相同,也可以不同。具体实施过程中,可以根据需求进行灵活设置,在此不做具体限定。
为了方便后续对目标广告的日志进行查询,获取到预处理后的日志之后,对该预处理后的日志进行保存,比如通过数据库连接池(Druid)对预处理后的日志进行保存,后续需要对日志进行查询时,可以通过预处理后的日志中包含的广告标识信息、设备标识信息、请求标识信息、是否被曝光、曝光时间、是否被点击、点击时间、历史曝光次数等信息,对保存的预处理后的日志进行筛选,从而获取所需的预处理后的日志。
以图4为例,当需要查询某一时间段内在目标终端进行展示的目标广告的历史曝光次数时,可以根据exposure_info里的user_id,adform_id,exp_time,exposure字段,从保存的预处理后的日志进行筛选统计。
为了方便确定目标终端对应的分布序列,当基于上述的实施例获取到预处理后的曝光日志和预处理后的点击日志后,可以通过请求标识信息,将预处理后的曝光日志和预处理后的点击日志进行关联,即通过请求标识信息可以将响应于同一曝光请求而产生的预处理后的曝光日志和预处理后的点击日志对应。图5为本公开实施例提供的一种关联后的日志的示意图。如图5所示,通过请求标识信息,将预处理后的曝光日志和预处理后的点击日志关联,生成关联后的日志(exp_click_info)。该关联后的日志中包括user_id,adform_id,exp_time,exposure,req_uid,click,exp_count等。
为了方便确定目标终端在不同曝光次数下对任一广告的点击率,获取到关联后的日志后,可以根据设备标识信息以及曝光次数,对关联后的日志进行汇总,从而可以针对预设的每个曝光次数,获取在该曝光次数下,在目标终端上进行展示的目标广告所对应的关联后的日志。针对预设的每个曝光次数,根据该曝光次数下,在目标终端上进行展示的目标广告所对应的关联后的日志中的exposure,可以确定在该曝光次数下在该目标终端上进行展示的目标广告的曝光数量;并根据该曝光次数下,在目标终端上进行展示的目标广告所对应的关联后的日志中的click,可以确定在该曝光次数下在该目标终端上被点击的目标广告的点击数量;根据该点击数量以及曝光数量,确定该目标终端在该曝光次数下对任一广告的点击率。
其中,根据该点击数量以及曝光数量,确定该目标终端在该曝光次数下对任一广告的点击率,与上述根据第一数量以及第二数量,确定样本终端在该曝光次数下对任一广告的点击率类似,重复之处不做赘述。
下面通过具体的实施方式对本公开提供的获取目标终端对应的分布序列的方法:
图6为本公开实施例提供的具体的获取目标终端对应的分布序列的流程图,该流程包括:
S601:对于获取到的日志,将该日志缓存在消息队列中。
其中,获取到的日志可以为曝光日志,也可以为点击日志。
S602:当确定预处理操作被触发时,获取缓存在消息队列中的日志,并对获取到的日志进行解析和格式化等预处理,将预处理后的日志再缓存到消息队列中。
在一种可能的实施方式中,可以通过如下方式确定预处理操作被触发:
方式一、达到预设的处理时刻。
比如,预设每天上午10点对获取到的日志进行解析和格式化处理,若确定达到上午十点,则获取缓存在消息队列中的日志,对获取到的日志进行解析和格式化等预处理;若确定未达到上午十点,则继续等待,直到达到预设的处理时刻。
方式二、接收到对日志进行预处理的触发操作。
方式三、按照预设的周期触发预处理操作。
S603:通过时序数据库,将消息队列中预处理后的日志进行保存。
其中,可以将实现上述S601~S603的步骤集成在电子设备的实时处理模块中。
然后通过请求标识信息,将预处理后的曝光日志和预处理后的点击日志进行关联;再根据设备标识信息以及曝光次数,对关联后的日志进行汇总。
针对预设的每个曝光次数,根据该曝光次数下,在目标终端上进行展示的目标广告所对应的关联后的日志中的exposure,确定在该曝光次数下在该目标终端上进行展示的目标广告的曝光数量;并根据该曝光次数下,在目标终端上进行展示的目标广告所对应的关联后的日志中的click,确定在该曝光次数下在该目标终端上被点击的目标广告的点击数量;根据该点击数量以及曝光数量,确定该目标终端在该曝光次数下对任一广告的点击率。
下面通过具体的实施方式对本公开提供的广告竞价方法进行详细的描述:
图7为本公开实施例提供的具体的广告竞价流程示意图,以训练点击率预测模型的电子设备与用于广告竞价的电子设备相同为例,该流程包括:
S701:通过实时数据处理模块获取预处理后的日志。
其中,实时数据处理模块执行的过程参见上述S601~S603,重复之处不做赘述。
S702:获取样本集中任一样本终端对应的样本分布序列。
S703:获取样本集中的任一样本终端对应的样本特征信息。
S704:获取训练完成的点击率预测模型。
具体的训练过程,已在上述实施例进行描述,重复之处不做赘述。
S705:接收目标终端发送的曝光请求。
S706:根据预设的次数阈值以及每个待投放广告的定向条件,确定候选广告。
S707:获取目标终端的特征信息。
S708:通过预先训练完成的点击率预测模型,基于特征信息,确定包括目标终端对候选广告在不同曝光次数下的点击率的分布序列。
S709:根据该目标终端对应的分布序列以及每个候选广告分别对应的历史曝光次数,确定每个候选广告对应的权重值。
首先,获取目标终端对应的分布序列中包含的每个元素的值,假设该分布序列中包含有10个元素,该10个元素的值分别为p1~p10。
其次,获取分布序列中最大值所对应的期望曝光次数,即p1~p10中的最大值所对应的期望曝光次数。
在一种可能实施方式中,可通过如下公式获取分布序列中的最大值所对应的期望曝光次数:
maxcnt=argmax(p1~p10)
其中,maxcnt为分布序列中的最大值所对应的期望曝光次数,argmax()为获取分布序列中的最大值所对应的期望曝光次数的函数。
再次,针对每个候选广告,获取该候选广告的历史曝光次数n,将该候选广告的历史曝光次数n与期望曝光次数maxcnt进行比较,根据比较结果,确定该候选广告单对应的权重值w。
在一种可能的实施方式中,若n≥maxcnt,则确定该候选广告的w=1;若n<maxcnt,则通过如下公式确定该候选广告的w:
S710:确定每个候选广告的综合分值并排序。
在一种可能的实施方式中,针对每个候选广告,确定该候选广告的eCPM,根据该候选广告的eCPM和对应的权重值,确定该候选广告的综合分值。
在一种可能的实施方式中,可以通过如下公式根据该候选广告的eCPM和对应的权重值,确定该候选广告的综合分值:
score=eCPM*w
其中,score为候选广告的综合分值。
最后根据排序结果,确定目标广告并投放给目标终端在对应APP的显示界面上进行展示。
同时,在响应目标终端发送的曝光请求的过程中,获取目标广告的曝光日志和点击日志,并触发实时数据处理模块进行预处理操作,执行S701。
本公开还提供了一种广告竞价装置,图8为本公开实施例提供的一种广告竞价装置的结构示意图,该装置包括:
获取单元81,用于获取目标终端的特征信息;
第一处理单元82,用于通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列;
第二处理单元83,用于基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值;
第三处理单元84,用于根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值;
确定单元85,用于若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告;
发送单元86,用于将所述目标广告投放给所述目标终端进行展示。
由于上述广告竞价装置解决问题的原理与广告竞价方法相似,因此上述广告竞价装置的实施可以参见方法的实施,重复之处不再赘述。
在某些可能的实施方式中,所述第二处理单元83,具体用于确定所述分布序列中包含的最大值;基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值。
在某些可能的实施方式中,所述第二处理单元83,具体用于若所述期望曝光次数大于所述历史曝光次数,则从所述每个点击率分别对应的曝光次数中,确定不大于所述期望曝光次数,且不小于所述历史曝光次数的每个参考曝光次数;根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值;若所述期望曝光次数不大于所述历史曝光次数,则将预设的数值确定为所述候选广告对应的权重值。
在某些可能的实施方式中,所述第二处理单元83,具体用于通过如下公式根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值:
其中,maxcnt表示所述期望曝光次数,n表示所述历史曝光次数,pn表示所述分布序列中所述历史曝光次数对应的第二点击率,pi表示所述分布序列中参考曝光次数i对应的第一点击率。
在某些可能的实施方式中,所述确定单元85,具体用于若所述综合分值大于预设的分数阈值,且当前确定的目标广告的数量小于预设数量,则确定所述候选广告的综合分值满足预设的投放条件。
在某些可能的实施方式中,所述确定单元85,具体用于若所述候选广告的综合分值,在针对所述目标终端对应的每个候选广告的综合分值中,满足预设的筛选条件,则确定所述候选广告的综合分值满足预设的投放条件。
在某些可能的实施方式中,所述装置还包括:训练单元;
所述训练单元,用于通过如下方式确定所述点击率预测模型:
获取样本集中的任一样本终端对应的样本特征信息,其中,所述样本终端对应有样本分布序列;所述样本分布序列包括所述样本终端在不同曝光次数下对任一广告的点击率;
通过原始点击率预测模型,基于所述样本特征信息,确定包括所述样本终端对样本候选广告在不同曝光次数下的点击率的识别分布序列;
根据所述识别分布序列以及所述样本分布序列,对所述原始点击率预测模型进行训练。
在某些可能的实施方式中,所述装置还包括:预处理单元;
所述预处理单元,用于通过如下方式获取所述样本终端对应的样本分布序列:
针对不同曝光次数,确定在该曝光次数下,投放给所述样本终端的第一广告的第一数量、以及所述每个第一广告中被点击的第二广告的第二数量;根据所述第一数量以及所述第二数量,确定所述样本终端在该曝光次数下对任一广告的点击率。
在某些可能的实施方式中,所述装置还包括:更新单元;
所述更新单元,用于基于所述目标终端的标识信息、所述目标广告在所述目标终端上的已曝光次数、以及所述目标广告是否被点击,确定所述目标终端对应的优化分布序列;
基于所述目标终端对应的特征信息、以及所述目标终端对应的优化分布序列,对所述点击率预测模型继续训练。
由于预先训练有点击率预测模型,通过该点击率预测模型,可以基于任一目标终端的特征信息,确定包括该目标终端对候选广告在不同曝光次数下的点击率的分布序列。根据该分布序列、以及保存的该候选广告在目标终端上的历史曝光次数,确定该候选广告对应的权重值。后续基于该候选广告的预测收入以及该候选广告对应的权重值,所确定的该候选广告的综合分值可以综合考虑该候选广告在不同曝光次数下目标终端对该候选广告的点击率的影响。最后根据该候选广告的综合分值是否满足预设的投放条件,从而确定是否将该候选广告确定为目标广告并投放给目标终端进行展示,有利于有效提高目标广告的点击率以及准确性,尽可能保证在目标终端展示的目标广告被点击。
如图9为本公开实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本公开实施例还提供了一种电子设备,如图9所示,包括:处理器91、通信接口92、存储器93和通信总线94,其中,处理器91,通信接口92,存储器93通过通信总线94完成相互间的通信;
所述存储器93中存储有计算机程序,当所述程序被所述处理器91执行时,使得所述处理器91执行如下步骤:
获取目标终端的特征信息;
通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列;
基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值;
根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值;
若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告并投放给所述目标终端进行展示。
由于上述电子设备解决问题的原理与广告竞价方法相似,因此上述电子设备的实施可以参见方法的实施,重复之处不再赘述。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口92用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
在上述各实施例的基础上,本公开实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由处理器执行的计算机程序,当所述程序在所述处理器上运行时,使得所述处理器执行时实现如下步骤:
获取目标终端的特征信息;
通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列;
基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值;
根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值;
若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告并投放给所述目标终端进行展示。
由于计算机可读存储介质解决问题的原理与上述广告竞价方法相似,因此具体实施可以参见广告竞价方法的实施,重复之处不再赘述。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。
Claims (20)
1.一种广告竞价方法,其特征在于,所述方法包括:
获取目标终端的特征信息;
通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列;其中,所述候选广告的确定过程包括:针对待投放的每个广告,若确定该广告的定向条件与所述特征信息匹配,则确定该广告为所述目标终端的候选广告;
基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值;
根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值;
若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告并投放给所述目标终端进行展示。
2.根据权利要求1所述的方法,其特征在于,所述基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值,包括:
确定所述分布序列中包含的最大值;
基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值。
3.根据权利要求2所述的方法,其特征在于,所述基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值,包括:
若所述期望曝光次数大于所述历史曝光次数,则从所述每个点击率分别对应的曝光次数中,确定不大于所述期望曝光次数,且不小于所述历史曝光次数的每个参考曝光次数;根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值;
若所述期望曝光次数不大于所述历史曝光次数,则将预设的数值确定为所述候选广告对应的权重值。
4.根据权利要求3所述的方法,其特征在于,通过如下公式根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值:
其中,maxcnt表示所述期望曝光次数,n表示所述历史曝光次数,pn表示所述分布序列中所述历史曝光次数对应的第二点击率,pi表示所述分布序列中参考曝光次数i对应的第一点击率。
5.根据权利要求1所述的方法,其特征在于,所述确定所述候选广告的综合分值满足预设的投放条件,包括:
若所述综合分值大于预设的分数阈值,且当前确定的目标广告的数量小于预设数量,则确定所述候选广告的综合分值满足预设的投放条件。
6.根据权利要求1所述的方法,其特征在于,所述确定所述候选广告的综合分值满足预设的投放条件,包括:
若所述候选广告的综合分值,在针对所述目标终端对应的每个候选广告的综合分值中,满足预设的筛选条件,则确定所述候选广告的综合分值满足预设的投放条件。
7.根据权利要求1所述的方法,其特征在于,所述点击率预测模型通过如下方式确定:
获取样本集中的任一样本终端对应的样本特征信息,其中,所述样本终端对应有样本分布序列;所述样本分布序列包括所述样本终端在不同曝光次数下对任一广告的点击率;
通过原始点击率预测模型,基于所述样本特征信息,确定包括所述样本终端对样本候选广告在不同曝光次数下的点击率的识别分布序列;
根据所述识别分布序列以及所述样本分布序列,对所述原始点击率预测模型进行训练。
8.根据权利要求7所述的方法,其特征在于,通过如下方式获取所述样本终端对应的样本分布序列:
针对不同曝光次数,确定在该曝光次数下,投放给所述样本终端的第一广告的第一数量、以及所述每个第一广告中被点击的第二广告的第二数量;根据所述第一数量以及所述第二数量,确定所述样本终端在该曝光次数下对任一广告的点击率。
9.根据权利要求7所述的方法,其特征在于,所述方法还包括:
基于所述目标终端的标识信息、所述目标广告在所述目标终端上的已曝光次数、以及所述目标广告是否被点击,确定所述目标终端对应的优化分布序列;
基于所述目标终端对应的特征信息、以及所述目标终端对应的优化分布序列,对所述点击率预测模型继续训练。
10.一种广告竞价装置,其特征在于,所述装置包括:
获取单元,用于获取目标终端的特征信息;
第一处理单元,用于通过预先训练完成的点击率预测模型,基于所述特征信息,确定包括所述目标终端对候选广告在不同曝光次数下的点击率的分布序列;其中,所述候选广告的确定过程包括:针对待投放的每个广告,若确定该广告的定向条件与所述特征信息匹配,则确定该广告为所述目标终端的候选广告;
第二处理单元,用于基于所述分布序列、以及保存的所述候选广告在所述目标终端上的历史曝光次数,确定所述候选广告对应的权重值;
第三处理单元,用于根据所述候选广告的预测收入以及所述权重值,确定所述候选广告的综合分值;
确定单元,用于若确定所述候选广告的综合分值满足预设的投放条件,则将所述候选广告确定为目标广告;
发送单元,用于将所述目标广告投放给所述目标终端进行展示。
11.根据权利要求10所述的装置,其特征在于,所述第二处理单元,具体用于确定所述分布序列中包含的最大值;基于所述最大值对应的期望曝光次数以及所述历史曝光次数,确定所述候选广告对应的权重值。
12.根据权利要求11所述的装置,其特征在于,所述第二处理单元,具体用于若所述期望曝光次数大于所述历史曝光次数,则从所述每个点击率分别对应的曝光次数中,确定不大于所述期望曝光次数,且不小于所述历史曝光次数的每个参考曝光次数;根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值;若所述期望曝光次数不大于所述历史曝光次数,则将预设的数值确定为所述候选广告对应的权重值。
13.根据权利要求12所述的装置,其特征在于,所述第二处理单元,具体用于通过如下公式根据所述分布序列中所述每个参考曝光次数分别对应的第一点击率、以及所述历史曝光次数,确定所述候选广告对应的权重值:
其中,maxcnt表示所述期望曝光次数,n表示所述历史曝光次数,pn表示所述分布序列中所述历史曝光次数对应的第二点击率,pi表示所述分布序列中参考曝光次数i对应的第一点击率。
14.根据权利要求10所述的装置,其特征在于,所述确定单元,具体用于若所述综合分值大于预设的分数阈值,且当前确定的目标广告的数量小于预设数量,则确定所述候选广告的综合分值满足预设的投放条件。
15.根据权利要求10所述的装置,其特征在于,所述确定单元,具体用于若所述候选广告的综合分值,在针对所述目标终端对应的每个候选广告的综合分值中,满足预设的筛选条件,则确定所述候选广告的综合分值满足预设的投放条件。
16.根据权利要求10所述的装置,其特征在于,所述装置还包括:训练单元;
所述训练单元,用于通过如下方式确定所述点击率预测模型:
获取样本集中的任一样本终端对应的样本特征信息,其中,所述样本终端对应有样本分布序列;所述样本分布序列包括所述样本终端在不同曝光次数下对任一广告的点击率;
通过原始点击率预测模型,基于所述样本特征信息,确定包括所述样本终端对样本候选广告在不同曝光次数下的点击率的识别分布序列;
根据所述识别分布序列以及所述样本分布序列,对所述原始点击率预测模型进行训练。
17.根据权利要求16所述的装置,其特征在于,所述装置还包括:预处理单元;
所述预处理单元,用于通过如下方式获取所述样本终端对应的样本分布序列:
针对不同曝光次数,确定在该曝光次数下,投放给所述样本终端的第一广告的第一数量、以及所述每个第一广告中被点击的第二广告的第二数量;根据所述第一数量以及所述第二数量,确定所述样本终端在该曝光次数下对任一广告的点击率。
18.根据权利要求16所述的装置,其特征在于,所述装置还包括:更新单元;
所述更新单元,用于基于所述目标终端的标识信息、所述目标广告在所述目标终端上的已曝光次数、以及所述目标广告是否被点击,确定所述目标终端对应的优化分布序列;
基于所述目标终端对应的特征信息、以及所述目标终端对应的优化分布序列,对所述点击率预测模型继续训练。
19.一种电子设备,其特征在于,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-9中任一所述广告竞价方法的步骤。
20.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-9中任一所述广告竞价方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311536.5A CN112884529B (zh) | 2021-03-24 | 2021-03-24 | 一种广告竞价方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110311536.5A CN112884529B (zh) | 2021-03-24 | 2021-03-24 | 一种广告竞价方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112884529A CN112884529A (zh) | 2021-06-01 |
CN112884529B true CN112884529B (zh) | 2024-04-26 |
Family
ID=76041968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110311536.5A Active CN112884529B (zh) | 2021-03-24 | 2021-03-24 | 一种广告竞价方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112884529B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506139B (zh) * | 2021-07-19 | 2024-03-01 | 成都屏盟科技有限公司 | 一种广告投放定价方法、装置及计算机设备 |
CN115330467B (zh) * | 2022-10-12 | 2022-12-20 | 南通中泓网络科技有限公司 | 一种营销广告点击的预测方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010016731A2 (ko) * | 2008-08-05 | 2010-02-11 | 엔에이치엔비즈니스플랫폼 주식회사 | 광고노출순위에 따른 가중치를 이용하여 광고를 제공하는 방법 및 시스템 |
CN103246985A (zh) * | 2013-04-26 | 2013-08-14 | 北京亿赞普网络技术有限公司 | 一种广告点击率预测方法及装置 |
KR20140015721A (ko) * | 2012-07-18 | 2014-02-07 | 주식회사 다음커뮤니케이션 | 타겟팅 광고 노출 방법 및 장치 |
CN103606098A (zh) * | 2013-11-29 | 2014-02-26 | 北京随视传媒科技股份有限公司 | 一种网络实时竞价控制方法及装置 |
CN105447724A (zh) * | 2015-12-15 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 内容项推荐方法及装置 |
CN106372249A (zh) * | 2016-09-23 | 2017-02-01 | 北京三快在线科技有限公司 | 一种点击率预估方法、装置及电子设备 |
CN107657488A (zh) * | 2017-10-19 | 2018-02-02 | 厦门美柚信息科技有限公司 | 基于广告匹配的广告投放处理方法及装置 |
CN108109008A (zh) * | 2017-12-21 | 2018-06-01 | 暴风集团股份有限公司 | 用于预估广告的点击率的方法、装置、设备和存储介质 |
CN108960901A (zh) * | 2018-06-13 | 2018-12-07 | 网易(杭州)网络有限公司 | 数据处理方法、装置、介质及电子设备 |
CN110807655A (zh) * | 2019-10-15 | 2020-02-18 | 微梦创科网络科技(中国)有限公司 | 一种广告竞价方法、装置及设备 |
CN110889725A (zh) * | 2019-11-26 | 2020-03-17 | 深圳市随手金服信息科技有限公司 | 在线广告ctr预估方法、装置、设备及存储介质 |
CN110929206A (zh) * | 2019-11-20 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 点击率预估方法、装置、计算机可读存储介质和设备 |
CN112380430A (zh) * | 2020-11-10 | 2021-02-19 | 腾讯科技(北京)有限公司 | 基于人工智能的推荐方法、装置及电子设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110231241A1 (en) * | 2010-03-18 | 2011-09-22 | Yahoo! Inc. | Real-time personalization of sponsored search based on predicted click propensity |
-
2021
- 2021-03-24 CN CN202110311536.5A patent/CN112884529B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010016731A2 (ko) * | 2008-08-05 | 2010-02-11 | 엔에이치엔비즈니스플랫폼 주식회사 | 광고노출순위에 따른 가중치를 이용하여 광고를 제공하는 방법 및 시스템 |
KR20140015721A (ko) * | 2012-07-18 | 2014-02-07 | 주식회사 다음커뮤니케이션 | 타겟팅 광고 노출 방법 및 장치 |
CN103246985A (zh) * | 2013-04-26 | 2013-08-14 | 北京亿赞普网络技术有限公司 | 一种广告点击率预测方法及装置 |
CN103606098A (zh) * | 2013-11-29 | 2014-02-26 | 北京随视传媒科技股份有限公司 | 一种网络实时竞价控制方法及装置 |
CN105447724A (zh) * | 2015-12-15 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 内容项推荐方法及装置 |
CN106372249A (zh) * | 2016-09-23 | 2017-02-01 | 北京三快在线科技有限公司 | 一种点击率预估方法、装置及电子设备 |
CN107657488A (zh) * | 2017-10-19 | 2018-02-02 | 厦门美柚信息科技有限公司 | 基于广告匹配的广告投放处理方法及装置 |
CN108109008A (zh) * | 2017-12-21 | 2018-06-01 | 暴风集团股份有限公司 | 用于预估广告的点击率的方法、装置、设备和存储介质 |
CN108960901A (zh) * | 2018-06-13 | 2018-12-07 | 网易(杭州)网络有限公司 | 数据处理方法、装置、介质及电子设备 |
CN110807655A (zh) * | 2019-10-15 | 2020-02-18 | 微梦创科网络科技(中国)有限公司 | 一种广告竞价方法、装置及设备 |
CN110929206A (zh) * | 2019-11-20 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 点击率预估方法、装置、计算机可读存储介质和设备 |
CN110889725A (zh) * | 2019-11-26 | 2020-03-17 | 深圳市随手金服信息科技有限公司 | 在线广告ctr预估方法、装置、设备及存储介质 |
CN112380430A (zh) * | 2020-11-10 | 2021-02-19 | 腾讯科技(北京)有限公司 | 基于人工智能的推荐方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112884529A (zh) | 2021-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109345302B (zh) | 机器学习模型训练方法、装置、存储介质和计算机设备 | |
CN107491432B (zh) | 基于人工智能的低质量文章识别方法及装置、设备及介质 | |
EP3407285B1 (en) | Target user orientation method and device, and computer storage medium | |
US10348550B2 (en) | Method and system for processing network media information | |
CN109840782B (zh) | 点击率预测方法、装置、服务器以及存储介质 | |
US20210295388A1 (en) | Methods and apparatus for managing models for classification of online users | |
KR101330273B1 (ko) | 콘텍스트 기반 리소스 관련성 | |
CN110929052A (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN109388674B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN112884529B (zh) | 一种广告竞价方法、装置、设备及介质 | |
CN106095842B (zh) | 在线课程搜索方法和装置 | |
US11809505B2 (en) | Method for pushing information, electronic device | |
CN112148992A (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN113034171B (zh) | 一种业务数据处理方法、装置、计算机及可读存储介质 | |
CN108805332B (zh) | 一种特征评估方法和装置 | |
CN112839063A (zh) | 消息推送方法、消息显示方法、存储介质和计算机设备 | |
CN112579910A (zh) | 信息处理方法、信息处理装置、存储介质和电子设备 | |
CN113015010A (zh) | 推送参数确定方法、装置、设备及计算机可读存储介质 | |
CN114201626B (zh) | 多媒体推荐方法、装置、电子设备及存储介质 | |
US9087339B2 (en) | Content performance estimation | |
CN108647986B (zh) | 一种目标用户确定方法、装置及电子设备 | |
CN112070564B (zh) | 广告拉取方法、装置、系统与电子设备 | |
CN109191159B (zh) | 数据定向方法、装置、计算机设备及计算机可读存储介质 | |
CN111177331A (zh) | 一种对话意图识别方法及装置 | |
WO2022247671A1 (zh) | 用户召回方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |