CN117216541A - 素材投放效果预测模型的训练方法、预测方法、相关产品 - Google Patents
素材投放效果预测模型的训练方法、预测方法、相关产品 Download PDFInfo
- Publication number
- CN117216541A CN117216541A CN202310567806.8A CN202310567806A CN117216541A CN 117216541 A CN117216541 A CN 117216541A CN 202310567806 A CN202310567806 A CN 202310567806A CN 117216541 A CN117216541 A CN 117216541A
- Authority
- CN
- China
- Prior art keywords
- feature
- tower
- display position
- model
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000463 material Substances 0.000 title claims abstract description 380
- 230000000694 effects Effects 0.000 title claims abstract description 216
- 238000012549 training Methods 0.000 title claims abstract description 136
- 238000000034 method Methods 0.000 title claims abstract description 79
- 239000013598 vector Substances 0.000 claims description 71
- 230000004044 response Effects 0.000 claims description 48
- 230000006870 function Effects 0.000 claims description 25
- 238000010606 normalization Methods 0.000 claims description 24
- 238000013507 mapping Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 15
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 230000001960 triggered effect Effects 0.000 claims description 8
- 230000007246 mechanism Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 239000003999 initiator Substances 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 4
- 238000012417 linear regression Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种素材投放效果预测模型的训练方法、预测方法、相关产品。将模型输入特征输入至待训练的预测模型中,通过待训练的预测模型获得素材分别在多个展示位投放给对象的投放效果预测值;当待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。可见,在本申请中在训练预测模型时考虑到了展示位偏差的问题,提出在模型结构中设置与多个展示位一一对应的展示位分塔模块,以根据对应的展示位更新展示位的塔参数。如此,使得预测模型能够预测对象对该素材处于不同展示位的点击率,实现更加精细的点击率预测,从而有助于以展示位为预测维度提升预测准确性,并提升投放效果。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种素材投放效果预测模型的训练方法、预测方法、相关产品。
背景技术
随着互联网的不断发展,越来越多的人都偏向于在网络上查阅资料或者解答疑惑等。在此种大数据环境的影响下,大多数的推荐素材方逐渐将推荐素材的重心转移到此种场景中,比如:在对象查阅资料或者解答疑惑的时候,投放与对象查阅资料相关的素材,以便对象在查阅资料的同时也可以浏览到该推荐素材,从而点击该推荐素材。
在推荐素材的场景中,需要训练能够对推荐素材投放点击率预测的模型,从而指导推荐素材的投放行为,以获得较好的推荐素材投放效果,例如AUC(排序效果)和GMV(素材收益总额)等。投放效果可以通过CTR(点击率)等指标的数值大小来表征。在相关技术中,所训练的预测模型忽视了搜索场景中投放、推荐的素材的展示位置对素材投放效果以及预测模型的预测结果的影响。例如,相关技术中没有考虑到素材展示位对于预测点击率的影响,导致预测的点击率存在素材展示位偏差(Position bias),该偏差影响了预测的准确性,进而导致依据预测的结果规划素材投放后,AUC(排序效果)和GMV(素材收益总额)等指标仍有进一步提升、优化的空间。
由此,如何解决展示位偏差问题以及提高素材投放效果预测模型预测的准确性,已经成为当前领域亟待解决的技术问题。
发明内容
本申请实施例提供了一种素材投放效果预测模型的训练方法、预测方法、相关产品,旨在解决展示位偏差问题以及提高素材投放效果预测模型预测的准确性。
本申请第一方面提供了一种素材投放效果预测模型的训练方法,包括:
获取素材在展示位投放后对象的响应数据;所述素材为受到所述对象的搜索请求触发后向所述对象投放的;
根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本;所述训练样本包括:基于所述素材、所述展示位和所述对象的搜索请求提取的模型输入特征,以及基于所述响应数据生成的所述模型输入特征的标签;
将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值;所述待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数;
根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整;
当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
本申请第二方面提供了一种素材投放效果预测方法,包括:
接收目标对象的搜索请求;
根据待投放素材和所述搜索请求得到待输入特征;
将所述待输入特征作为素材投放效果预测模型的输入,通过所述素材投放效果预测模型得到所述待投放素材在多个展示位投放给所述目标对象的投放效果预测值;其中,所述素材投放效果预测模型为通过第一方面所述的训练方法训练得到的。
本申请第三方面提供了一种素材投放效果预测模型的训练装置,包括:
响应数据获取单元,用于获取素材在展示位投放后对象的响应数据;所述素材为受到所述对象的搜索请求触发后向所述对象投放的;
训练样本构建单元,用于根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本;所述训练样本包括:基于所述素材、所述展示位和所述对象的搜索请求提取的模型输入特征,以及基于所述响应数据生成的所述模型输入特征的标签;
投放效果预测单元,用于将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值;所述待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数;
模型参数调整单元,用于根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整;
训练迭代判定单元,用于当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
本申请第四方面提供了一种素材投放效果预测装置,包括:
搜索请求接收单元,用于接收目标对象的搜索请求;
待输入特征获得单元,用于根据待投放素材和所述搜索请求得到待输入特征;
投放效果获得单元,用于将所述待输入特征作为素材投放效果预测模型的输入,通过所述素材投放效果预测模型得到所述待投放素材在多个展示位投放给所述目标对象的投放效果预测值;其中,所述素材投放效果预测模型为通过第一方面所述的训练方法训练得到的。
本申请第五方面提供了一种素材投放效果预测模型的训练设备,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
所述处理器用于根据所述计算机程序中的指令执行第一方面提供的素材投放效果预测模型的训练方法的步骤。
本申请第六方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被执行时实现第一方面所述的素材投放效果预测模型的训练方法的步骤,或者执行时实现第二方面所述的素材投放效果预测方法的步骤。
本申请第七方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被素材投放效果预测模型的训练设备执行时实现第一方面提供的素材投放效果预测模型的训练方法的步骤。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请技术方案中首先获取素材在展示位投放后对象的响应数据;然后根据素材、展示位、响应数据和对象的搜索请求构建训练样本;最后将模型输入特征输入至待训练的预测模型中,通过待训练的预测模型获得素材分别在多个展示位投放给对象的投放效果预测值。在本申请实施例提供的素材投放效果预测模型训练之初,模型结构中包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数。训练期间,根据相同展示位投放效果预测值与标签的差异,对待训练的预测模型进行参数调整;当待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。结合模型结构可知,在本申请中在训练预测模型时考虑到了展示位偏差的问题,提出在模型结构中设置与多个展示位一一对应的展示位分塔模块,以根据对应的展示位更新展示位的塔参数。如此,使得预测模型能够预测对象对该素材处于不同展示位的点击率,实现更加精细的点击率预测,从而有助于以展示位为预测维度提升预测准确性,并提升投放效果,进而还提高了AUC(排序效果)和GMV(素材收益总额)。
附图说明
图1为相关技术在展示位中展示素材的场景图;
图2为相关技术中对象点击素材的实际点击率占比图;
图3为相关技术中预测模型的架构图;
图4为本申请实施例提供的一种素材投放效果预测模型的训练方法的场景架构图;
图5为本申请实施例提供的一种素材投放效果预测模型的训练方法的工作流程图;
图6a为本申请实施例提供的素材投放效果预测模型的架构图;
图6b为本申请实施例提供的另一种素材投放效果预测模型的架构图;
图6c为本申请实施例提供的另一种素材投放效果预测模型的架构图;
图7为本申请实施例提供的一种素材投放效果预测模型的训练方法的流程图;
图8为本申请实施例提供的另一种素材投放效果预测模型的架构图;
图9为本申请实施例提供的一种素材投放效果预测方法的流程图;
图10为本申请实施例提供的素材投放效果预测模型的训练装置的结构示意图;
图11为本申请实施例提供的素材投放效果预测装置的结构示意图;
图12为本申请实施例中服务器的一个结构示意图;
图13为本申请实施例中终端设备的一个结构示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
首先对本申请下文的实施例中可能涉及的若干个名词术语进行解释。
AUC(Area under the curve):排序效果,衡量素材排序的最重要指标,AUC的取值范围在0-1,越接近1表示模型排序能力越好。
GMV(Gross merchandise volume):素材收益总额。如:若素材为推荐口红的广告,则表示该口红的总收益额。总收益额包括对象拍下后最终未支付的订单金额(包括拍下后放入购物车未支付的订单、取消的订单、拒收商品的订单和退货的订单)和拍下后已支付的订单金额之和。
CTR(Click through rate):点击率。
展示位偏差(Position bias):即素材在页面上的位置对CTR的影响。一般来说,展示位越靠前,CTR越高。因为对象在浏览页面时,往往会先看到靠前的素材,而忽略靠后的素材。
FM(Factorization machine):因子分解机,旨在解决大规模模型输入特征数据下的特征组合问题。
FwFFM(Field weight factorization machine):分域权重因子分解机,一种因子分解机的变种模型。
Wide&Deep:一种推荐领域广泛使用的深度学习框架,核心思想是结合线性模型和DNN,提升模型效果。
DNN(Deep neural network):深度神经网络,是一种拥有多层隐含层的神经网络,机器学习算法中常用的模型结构。
LR(Linear Regression):线性回归。
sigmoid函数:将数值映射到(0,1)的函数。
随着互联网的不断发展,越来越多的人都偏向于在网络上查阅资料或者解答疑惑等。在此种大数据环境的影响下,大多数的推荐素材方逐渐将推荐素材的重心转移到此种场景中,比如:在对象查阅资料或者解答疑惑的时候,投放与对象查阅资料相关的素材,以便对象在查阅资料的同时也可以浏览到该推荐素材,从而点击该推荐素材。
下面结合图1和图2来对相关技术的示例进行说明。图1为相关技术在展示位中展示素材的场景图。在图1中,推荐素材可以包括广告,当对象在页面上搜索“口红有几种色系”这个问题的时候,后端在为对象提供问题答案的同时,还会在素材展示位上为对象投放有关“口红”的广告,以便对象了解到问题答案的同时,还会浏览到有关“口红”的广告(AA口红广告或者AC口红广告或者BC口红广告),其中,AA口红广告被投放到第一素材展示位,AC口红广告被投放到第二素材展示位,BC口红广告被投放到第三素材展示位,若对象对其中一个口红广告感兴趣,则可以点击该口红广告进行进一步了解。
在推荐素材的场景中,需要训练能够对推荐素材投放点击率预测的模型,从而指导推荐素材的投放行为,以获得较好的推荐素材投放效果,例如AUC(排序效果)和GMV(素材收益总额)等。图2为相关技术中对象点击素材的实际点击率占比图。在图2中,由于在相关技术中,所训练的预测模型没有考虑到素材展示位对于预测点击率的影响,因此使得第一素材展示位、第二素材展示位和第三素材展示位的实际点击率偏差较大,如此,影响了预测的准确性,进而导致AUC(排序效果)和GMV(素材收益总额)仍有进一步提升的空间。
下面结合图3来对相关技术的预测模型进行介绍。图3为相关技术中预测模型的架构图。在图3中,相关技术中的预测模型包括输入层、嵌入层、交叉层、隐层和输出层,还采用了Wide&Deep结构,其中,隐层包括两层感知层,Deep侧由FwFFM和FM两个模型组成,Wide侧为LR,输入层包括对象输入的搜索信息和需要投放的素材信息。可以得知,相关技术中的预测模型仅存在一个素材展示位,也就是说,相关技术仅完成了对素材的点击率进行预测,而并未对素材在不同展示位上的点击率进行预测。其也并未考虑到素材展示位对于预测点击率的影响,由此,造成了素材展示位偏差的问题,该偏差则进一步影响了预测的准确性,还导致AUC和GMV仍有进一步提升的空间。
由此,如何解决展示位偏差问题以及提高素材投放效果预测模型预测的准确性,已经成为当前领域亟待解决的技术问题。
鉴于以上问题,在本申请中提供了一种素材投放效果预测模型的训练方法、预测方法、相关产品,旨在解决展示位偏差问题以及提高素材投放效果预测模型预测的准确性。在本申请提供的技术方案中,在素材投放效果预测模型训练之初,在待训练的预测模型中设置与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数构建训练样本,如此,在训练模型期间,将训练样本中的模型输入特征输入至待训练的预测模型中,可以利用与多个展示位一一对应的展示位分塔模块对素材投放效果进行预测。可见,在此模型结构中考虑到了素材展示位对于预测点击率的影响,提出设置与多个展示位一一对应的展示位分塔模块,解决了展示位偏差问题,进而还提高了素材投放效果预测模型预测的准确性。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请提供的素材投放效果预测模型的训练方法主要涉及机器学习。其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本申请实施例提供的素材投放效果预测模型的训练方法的执行主体可以为终端设备。例如对象在终端设备上输入搜索请求,以获得素材在展示位投放后对象的响应数据。作为示例,终端设备具体可以包括但不限于手机、台式电脑、平板电脑、笔记本电能、掌上电脑、智能语音交互设备、智能家电、车载终端、飞行器等。本申请实施例提供的的执行主体也可以是服务器,即可以在服务器上运行搜索请求,获得素材在展示位投放后对象的响应数据。本申请实施例提供的素材投放效果预测模型的训练方法也可以由终端设备和服务器协同执行。故本申请实施例中对于执行本申请技术方案的实现主体不做限定。
图4示例性地展示了一种素材投放效果预测模型的训练方法的场景架构图。图中包括服务器以及多种形式的终端设备。图4所示的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统。另外,服务器还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
图5为本申请实施例提供的一种素材投放效果预测模型的训练方法的工作流程图。如图5所示,服务器端获取对象在用户端输入的搜索请求,然后根据搜索请求返回给用户端相应的响应数据,也即为对象投放最合适的素材。在此过程中,根据搜索请求产生的所有素材,在通过曝光、点击和转化后产生的数据都会被数据库存储起来,然后将存储起来的数据通过抽取、转化和载入等方式,生成输入特征和输入特征的标签,该输入特征和输入特征的标签用于进行预测模型训练,训练完毕后的预测模型会被加载到服务器端,用于实时预测素材的点击率。
接下来介绍本申请中的素材投放效果预测模型。图6a为本申请实施例提供的素材投放效果预测模型的架构图。在图6a中,首先介绍素材投放效果预测模型的隐层,隐层包括与展示位一一对应的展示位分塔模块。例如:展示位分塔模块1、展示位分塔模块2和展示塔分塔模块n。以便素材投放效果预测模型对展示位分塔模块1对应的展示位1投放给对象的投放效果进行预测,对展示位分塔模块2对应的展示位2投放给对象的投放效果进行预测,对展示位分塔模块n对应的展示位n投放给对象的投放效果进行预测。如此,解决了展示位偏差问题,可以实现更加精细化的投放效果预测。
图6b为本申请实施例提供的另一种素材投放效果预测模型的架构图。在图6b中,接着介绍素材投放效果预测模型的隐层,隐层还包括为各展示位分塔模块提供参数的共享塔模块,以及介绍素材投放效果预测模型的注意力层,注意力层包括注意力模块和展示位归一化模块。其中,共享塔模块用于辅助各展示位分塔模块预测素材在对应的展示位的投放效果,注意力模块用于为各个第一特征交叉学习结果配置权重,展示位归一化模块用于对相应的展示位分塔模块的待传输交叉数据进行归一化处理。如此,注意力模块可以给不同的分塔模块提供加权,让不同的分塔模块有不同的强度,以便结合展示位分塔模块可以更好的拟合出不同展示位的数据。
图6c为本申请实施例提供的另一种素材投放效果预测模型的架构图。在图6c中,接着介绍本申请素材投放效果预测模型中的模型输入特征、嵌入层、第一特征交叉层、第二特征交叉层、线性模型和输出层。嵌入层用于对模型输入特征进行转换获得特征向量全集,模型输入特征包括素材特征、对象特征、搜索词特征和上下文特征;第一特征交叉层用于对特征向量全集进行特征交叉,得到第一特征交叉学习结果;第二特征交叉层用于对特征向量全集中的素材特征向量和对象特征向量进行特征交叉,得到第二特征交叉学习结果;线性模型用于对特征向量全集中的素材特征向量进行线性映射,得到线性映射结果;输出层用于结合共享塔模块的共享塔学习结果、各展示位分塔模块对应的分塔学习结果、第二特征交叉层的第二特征交叉结果和线性模型的线性映射结果,对各展示位分塔模块对应的展示位投放给对象的投放效果进行预测。
图7为本申请实施例提供的一种素材投放效果预测模型的训练方法的流程图。如图7所示的素材投放效果预测模型的训练方法中,包括:
S701:获取素材在展示位投放后对象的响应数据。
本申请实施例中,为了解决相关技术中因素材展示位偏差影响了素材投放效果预测模型准确性的问题,首先提出收集多种展示位投放素材后,对象的响应数据。素材是在受到对象的搜索请求的触发后,向对象投放的。此处对象可以理解为用户,不同的对象即是指不同的用户。素材可以涉及多种内容,例如广告或者其他具有推荐、宣传属性的内容。此外,素材的形式不局限于图像、文字,还可以为视频、音频等形式。作为示例,用户在搜索引擎中输入关键字,并点击搜索引擎页面上的“搜索”控件,生成搜索请求。对应地,搜索引擎在海量知识、资讯中,展示基于关键字的搜索结果,与此同时页面上还可以进一步在多个素材展示位展示推荐的素材。这些素材可能与本次搜索输入的关键字存在一定的联系,也可能与用户的过往搜索历史存在联系。比如:若对象的搜索请求为“动物”,则可以为对象投放有关“动物”的广告或者可以为有关“保护动物”的宣传内容。多个展示位具有顺序的差别,例如在页面从上至下的顺序陈列的展示位分别是第一展示位、第二展示位、第三展示位等。
本申请实施例中,收集对象的响应数据的目的是为了训练能够以展示位的维度实现素材投放效果预测的模型。为了训练该模型,可以收集较多的响应数据,如,收集1万个用户对于在多种展示位投放不同素材后,他们的点击情况:点击或不点击。当然,响应数据不限于点击等交互操作的数据,还可以是评论、转发等交互操作的数据,此处均不加以限定。
需要说明的是,本申请书中相关数据收集处理在实例应用时应该严格根据相关国家法律法规的要求,获取对象个人信息主体的知情同意或单独同意,并在法律法规及对象个人信息主体的授权范围内,开展后续数据使用及处理行为。
S702:根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本。
在本步骤中,训练样本包括模型输入特征和模型输入特征的标签,其中,模型输入特征为基于素材、展示位和对象的搜索请求提取的,模型输入特征的标签为基于响应数据生成的。
进一步的,分别对素材、展示位和对象的搜索请求进行提取操作,获得其分别对应的特征。具体的,对素材进行提取,获得素材的素材特征,素材的素材特征包括素材的标识、素材的类型和素材的发起方信息。其中,若素材为广告,则素材的发起方信息可以是广告主信息。对对象的搜索请求进行提取,获得对象特征和搜索词特征。对展示位和对象的搜索请求进行提取,获得上下文特征,上下文特征包括搜索请求的时间、搜索请求的次数和展示位的信息。例如,不同的展示位具有不同的排序标识,排序标识可以作为展示位信息。
然后将素材特征、对象特征、搜索词特征和上下文特征构建为一组模型输入特征,并基于响应数据生成模型输入特征的标签。需要说明的是,若标签为1,则表示素材在展示位投放后,对象对于素材执行预期响应操作;若标签为0,则表示素材在展示位投放后,对象未对素材执行预期响应操作。预期响应操作可以是:点击操作或者其他交互操作,例如素材页面打开后浏览超过5秒钟等。
S703:将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值。
在本步骤中,投放效果预测值包括点击率,待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,以便预测模型能够预测对象对该素材处于不同展示位的点击率,展示位分塔模块包括对应的展示位的塔参数。其中,展示位分塔模块位于注意力层中展示位归一化模块的后端,以及位于输出层的前端。
S704:根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整。
在本步骤中,可以基于不同展示位分别对应的投放效果预测值和标签的差异,来调整待训练的预测模型的参数。比如:基于展示位1对应的投放效果预测值和展示位1对应的标签的差异,来调整参数;或者,基于展示位2对应的投放效果预测值和展示位2对应的标签的差异,来调整参数。此外,也可以综合根据不同展示位的投放效果预测值与对应展示位标签的综合差异,来调整模型的参数。
进一步的,在本申请中,可以根据损失函数L对相同展示位投放效果预测值与标签的差异进行计算。损失函数L包括:
其中,N表示一轮训练回合中使用的相同展示位相关的训练样本总数,yi表示对于一轮训练回合中N个训练样本中第i个训练样本的标签,pi表示对于一轮训练回合中N个训练样本中第i个训练样本的投放效果预测值,σ(·)表示sigmoid函数。
S705:当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
在本步骤中,训练截止条件包括总损失值小于预设阈值,总损失值为针对于多个展示位分别通过损失函数L计算得到的损失值之和。可以理解的是,在对不同展示位进行损失函数计算后,获取不同展示位分别对应的损失值,并计算各损失值之和,以获得总损失值,若总损失值小于预设阈值,则表示待训练的预测模型满足训练截止条件,可以生成素材投放效果预测模型。
在上述步骤中介绍了素材投放效果预测模型的训练过程,并介绍了待训练的素材投放效果预测模型中的模型输入特征和展示位分塔模块。接下来对待训练的素材投放效果预测模型中的嵌入层、第一特征交叉层、第二特征交叉层、线性模型、共享塔模块、注意力层和输出层一一进行介绍。
首先结合图8对待训练的素材投放效果预测模型中归一化模块、隐层和展示位的关系进行说明。图8为本申请实施例提供的另一种素材投放效果预测模型的架构图。在图8中,注意力层中的展示位归一化模块包括共享塔模块、分塔模块1、分塔模块2和分塔模块n,其中,共享塔模块对应于隐层中的共享塔模块;分塔模块1对应于隐层中的展示位分塔模块1、以及对应于展示位1;分塔模块2对应于隐层中的展示位分塔模块2、以及对应于展示位2;分塔模块n对应于隐层中的展示位分塔模块n、以及对应于展示位n。
可以理解的是,展示位归一化模块中的分塔模块1会根据对应的展示位1,将注意力模块中输出的对应于展示位分塔模块1的待传输特征交叉数据进行归一化处理,并将归一化后特征交叉数据传输给展示位分塔模块1,以便素材投放效果预测模型能够预测对象对该素材处于展示位1的点击率。其中,展示位归一化模块中的分塔模块2和分塔模块n均适用于上述方法,在此不再赘述。
还需要进行说明的是,展示位归一化模块中的共享模块会根据所有展示位,将注意力模块中输出的所有展示位分塔模块的待传输特征交叉数据进行归一化处理,并将归一化后特征交叉数据全部传输给共享分塔模块,以便共享塔模块可以及时地给展示位分塔模块提供塔参数的补充。
在待训练的素材投放效果预测模型中包括嵌入层和第一特征交叉层FwFFM。第一特征交叉层包括分域权重因子分解机,嵌入层位于模型输入特征的后端和第一特征交叉层的前端,第一特征交叉层位于嵌入层的后端和注意力层中注意力模块的前端。
可以理解的是,在隐层的各展示位分塔模块和共享塔模块进行学习之前,会通过嵌入层将素材特征、对象特征、搜索词特征和上下文特征进行转换,以得到特征向量全集,其中,特征向量全集包括依据模型输入特征转换出的多种类型的特征向量。然后将特征向量全集输入至第一特征交叉层,通过第一特征交叉层对特征向量全集进行特征交叉,得到第一特征交叉学习结果。
在待训练的素材投放效果预测模型中还包括第二特征交叉层FM和线性模型Wide。第二特征交叉层包括因子分解机,第二特征交叉层和线性模型位于待训练的素材投放效果预测模型中的右侧。
可以理解的是,在通过嵌入层将模型输入特征转换得到特征向量全集之后,第二特征交叉层会根据特征向量全集中的部分特征向量进行特征交叉,也即根据特征向量全集中的素材特征向量和对象特征向量进行特征交叉,得到第二特征交叉学习结果;以及线性模型会根据特征向量全集中的部分特征向量进行线性映射,也即根据特征向量全集中的素材特征向量进行线性映射,得到线性映射结果。
需要说明的是,由于第一特征交叉层进行特征交叉的是特征向量全集,而第二特征交叉层进行特征交叉的是特征向量全集中的素材特征向量和对象特征向量,因此第二特征交叉层的特征交叉机制与第一特征交叉层的特征交叉机制具有区别。素材特征向量为嵌入层根据模型输入特征中的素材特征转换得到的特征向量,对象特征向量为嵌入层根据模型输入特征中的对象特征转换得到的特征向量。
在待训练的素材投放效果预测模型中的隐层除了展示位分塔模块,还包括共享塔模块,共享塔模块用于辅助各展示位分塔模块预测素材在对应的展示位的投放效果。可以理解的是,不同展示位分塔模块包括不同展示位分塔模块分别对应的塔参数,共享塔模块包括全部展示位模块的塔参数。在模型训练过程中,由于素材被投放到不同的展示位中,对象点击素材的点击率就会有不同,因此获取的响应数据会存在一定差异,就会存在各展示位分塔模块分别对应的塔参数不同的情况,也即出现个别展示位分塔模块的塔参数存在不充足的情况,进一步导致预测准确率低下。以目标展示位分塔模块为例,目标展示位分塔模块为多个展示位分塔模块中的任意一个,对象点击投放到目标展示位的素材对应的点击率小,相应的,目标展示位分塔的塔参数就会存在不充足的情况,如此,在本申请中,共享塔模块就会对该目标展示位分塔模块提供塔参数的补充。可见,在目标展示位分塔的塔参数就会存在不充足的情况下,共享塔模块可以及时地给目标展示位分塔模块提供塔参数的补充,以实现更好的拟合出其对应展示位的投放效果预测值。
进一步的,通过待训练的预测模型获得素材分别在多个展示位投放给对象的投放效果预测值,具体包括步骤Sa1-Sa2:
Sa1:由各展示位分塔模块基于模型输入特征中与所对应的展示位关联的信息进行学习,并输出分塔学习结果;以及,由共享塔模块基于模型输入特征中与多个展示位分别关联的信息进行学习,并输出共享塔学习结果。
可以理解的是,各展示位分塔模块和共享塔模块位于第一特征交叉层的后端,各展示位分塔模块可以接收到,第一特征交叉学习结果中与各展示分塔模块位分别对应的展示位关联的信息;共享塔模块可以接收到,第一特征交叉学习结果中与多个展示分塔模块位对应的展示位关联的信息。因此,在本步骤中,各展示位分塔模块可以基于第一特征交叉学习结果中与所对应的展示位关联的信息进行学习;以及,共享塔模块可以基于第一特征交叉学习结果中与多个展示位分别关联的信息进行学习。
Sa2:对于多个展示位之中的目标展示位,基于目标展示位对应的展示位分塔模块的分塔学习结果以及共享塔学习结果,对素材在目标展示位投放给对象的投放效果进行预测,得到目标展示位的投放效果预测值。
可以理解的是,目标展示位为多个展示位中的任意一个,以目标展示位为示例进行说明:可以根据第二特征交叉学习结果、线性映射结果、目标展示位对应的展示位分塔模块的分塔学习结果以及共享塔学习结果,对素材在目标展示位投放给对象的投放效果进行预测,以得到目标展示位的投放效果预测值。
比如:目标展示位为展示位2,在输出层中根据第二特征交叉层输出的第二特征交叉学习结果、线性模型输出的线性映射结果、展示位2对应的展示位分塔模块2输出的分塔学习结果以及共享塔模块输出的共享塔学习结果,对素材在展示位2投放给对象的投放效果进行预测,以得到目标展示位的投放效果预测值。如此,使得预测模型能够预测对象对该素材处于目标展示位的点击率,实现了更加精细的点击率预测。其中,除了展示位2以外的其他展示位,例如展示位1和展示位n等,均适用于上述方式获得投放效果预测值,在此不再赘述。
在待训练的素材投放效果预测模型中还包括注意力层,注意力层包括注意力模块和展示位归一化模块。注意力模块位于第一特征交叉层的后端和展示位归一化模块的前端,展示位归一化模块位于注意力模块的后端和隐层的前端。
可以理解的是,在隐层中的各展示位分塔模块和共享塔模块进行学习之前,会通过注意力模块根据第一特征交叉层输出的特征向量全集,为各个第一特征交叉学习结果配置权重,以得到对应于各展示位分塔模块的待传输特征交叉数据。
然后通过展示位归一化模块根据不同的展示位,对对应于各展示位分塔模块的待传输特征交叉数据进行归一化处理,并将对应于各展示位分塔模块的归一化后特征交叉数据传输给对应的展示位分塔模块,以及将对应于各展示位分塔模块的归一化后特征交叉数据共同传输给共享塔模块。
比如:展示位归一化模块中的分塔模块1会根据对应的展示位1,将注意力模块中对应于展示位分塔模块1的待传输特征交叉数据进行归一化处理,并将归一化后特征交叉数据传输给展示位分塔模块1;以及,展示位归一化模块中的共享模块会根据展示位1和展示位2,将注意力模块中对应于展示位分塔模块1和展示位分塔模块2的待传输特征交叉数据进行归一化处理,并将归一化后特征交叉数据全部传输给共享分塔模块。
前述已经介绍了素材投放效果预测模型的训练方法,接下来对素材投放效果预测方法进行介绍。图9为本申请实施例提供的一种素材投放效果预测方法的流程图。如图9所示的素材投放效果预测方法中,包括:
S901:接收目标对象的搜索请求。
在本步骤中,搜索请求包括目标对象输入的问题和词语等。比如:目标对象输入的搜索请求为“口红有几种色系”。
S902:根据待投放素材和所述搜索请求得到待输入特征。
在本步骤中,在接收目标对象的搜索请求之后,首先可以根据搜索请求产生与搜索请求相关的待投放素材,待投放素材可以包括广告、宣传内容和推荐内容,待投放素材可以为一个或多个。比如:待投放素材为与“口红”相关的广告。然后对待投放素材和搜索请求进行处理,以得到待输入特征。
S903:将所述待输入特征作为素材投放效果预测模型的输入,通过所述素材投放效果预测模型得到所述待投放素材在多个展示位投放给所述目标对象的投放效果预测值。
在本步骤中,素材投放效果预测模型为通过前述素材投放效果预测模型的训练方法训练得到的。将待输入特征作为素材投放效果预测模型的输入,经过训练后得到的素材投放效果预测模型可以预测得到,待投放素材在每个展示位上投放给目标对象的投放效果预测值。
比如:拟待投放素材为待投放素材1,展示位为展示位1、展示位2和展示位3,则将待投放素材1分别投放到展示位1、展示位2和展示位3这三个展示位中,以预测投放给目标对象的投放效果预测值;或者,拟待投放素材为待投放素材1、待投放素材2和待投放素材3,展示位为展示位1、展示位2和展示位3,则将待投放素材1分别投放到展示位1、展示位2和展示位3这三个展示位中,以预测投放给目标对象的投放效果预测值。待投放素材2和待投放素材3以此类推,在此不再赘述。
需要说明的是,在待投放素材为多个且不同的情况下,利用素材投放效果预测模型进行预测,以获得该待投放素材分别在不同展示位上投放给目标对象的投放效果预测值,并根据预期的投放目标,进行投放决策,得到素材投放排序结果,素材投放排序结果包括从前到后的多个展示位分别对应的待投放素材,最后根据素材投放排序结果投放待投放素材。如此,在实际应用场景中,利用本申请中的素材投放效果预测模型进行预测,实现了更加精细的点击率预测。
比如:待投放素材为待投放素材1、待投放素材2和待投放素材3,展示位为展示位1、展示位2和展示位3,预期的投放目标为展示位1的投放效果预测值为80%、展示位2的投放效果预测值为70%和展示位3的投放效果预测值为60%。则将待投放素材1分别投放到展示位1、展示位2和展示位3这三个展示位中,以预测投放给目标对象的投放效果预测值,得到待投放素材1在展示位1、展示位2和展示位3的投放效果预测值分别为70%、50%和60%;将待投放素材2分别投放到展示位1、展示位2和展示位3这三个展示位中,以预测投放给目标对象的投放效果预测值,得到待投放素材2在展示位1、展示位2和展示位3的投放效果预测值分别为80%、40%和30%;将待投放素材3分别投放到展示位1、展示位2和展示位3这三个展示位中,以预测投放给目标对象的投放效果预测值,得到待投放素材3在展示位1、展示位2和展示位3的投放效果预测值分别为60%、70%、30%。然后进行投放决策,得到的素材投放排序结果为在展示位1投放待投放素材2、在展示位2投放待投放素材3和在展示位3投放待投放素材1。
基于前文实施例提供的一种素材投放效果预测模型的训练方法,本申请中还相应提供了一种素材投放效果预测模型的训练装置。以下结合图10进行说明。图10为本申请实施例提供的素材投放效果预测模型的训练装置的结构示意图。如图10所示的素材投放效果预测模型的训练装置包括:
响应数据获取单元1001,用于获取素材在展示位投放后对象的响应数据;所述素材为受到所述对象的搜索请求触发后向所述对象投放的;
训练样本构建单元1002,用于根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本;所述训练样本包括:基于所述素材、所述展示位和所述对象的搜索请求提取的模型输入特征,以及基于所述响应数据生成的所述模型输入特征的标签;
投放效果预测单元1003,用于将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值;所述待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数;
模型参数调整单元1004,用于根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整;
训练迭代判定单元1005,用于当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
可选的,所述投放效果预测单元1003,具体用于:
由各展示位分塔模块基于所述模型输入特征中与所对应的展示位关联的信息进行学习,并输出分塔学习结果;以及,由所述共享塔模块基于所述模型输入特征中与所述多个展示位分别关联的信息进行学习,并输出共享塔学习结果;
对于所述多个展示位之中的目标展示位,基于所述目标展示位对应的展示位分塔模块的分塔学习结果以及所述共享塔学习结果,对所述素材在所述目标展示位投放给所述对象的投放效果进行预测,得到所述目标展示位的投放效果预测值。
可选的,所述装置还包括:
向量全集获得单元,用于由所述嵌入层将所述模型输入特征转换得到特征向量全集;所述特征向量全集包括依据所述模型输入特征转换出的多种类型的特征向量;
第一学习结果获得单元,用于由所述第一特征交叉层根据所述特征向量全集进行特征交叉,得到第一特征交叉学习结果;
所述投放效果预测单元1003,还用于:由各展示位分塔模块基于所述第一特征交叉学习结果中与所对应的展示位关联的信息进行学习;
所述投放效果预测单元1003,还用于:由所述共享塔模块基于所述第一特征交叉学习结果中与所述多个展示位分别关联的信息进行学习。
可选的,所述装置还包括:
交叉数据获得单元,用于由所述注意力模块根据所述特征向量全集,为各个第一特征交叉学习结果配置权重,得到对应于各展示位分塔模块的待传输特征交叉数据。
可选的,所述装置还包括:
归一化处理单元,用于由所述展示位归一化模块基于不同的展示位对所述对应于各展示位分塔模块的待传输特征交叉数据进行归一化处理;
交叉数据传输单元,用于由所述展示位归一化模块将对应于各展示位分塔模块的归一化后特征交叉数据传输给对应的展示位分塔模块,并将对应于各展示位分塔模块的归一化后特征交叉数据共同传输给所述共享塔模块。
可选的,所述装置还包括:
第二学习结果获得单元,用于由所述第二特征交叉层根据所述特征向量全集中的部分特征向量进行特征交叉,得到第二特征交叉学习结果;所述第二特征交叉层的特征交叉机制与所述第一特征交叉层的特征交叉机制具有区别;
映射结果获得单元,用于由所述线性模型对所述特征向量全集中的部分特征向量进行线性映射,得到线性映射结果;
所述投放效果预测单元,还用于:
基于所述第二特征交叉学习结果、所述线性映射结果、所述目标展示位对应的展示位分塔模块的分塔学习结果以及所述共享塔学习结果,对所述素材在所述目标展示位投放给所述对象的投放效果进行预测。
可选的,所述训练样本构建单元1002,具体用于:
提取所述素材的素材特征;所述素材的素材特征包括:所述素材的标识、所述素材的类型和所述素材的发起方信息;
根据所述对象的搜索请求提取对象特征和搜索词特征;
根据所述展示位和所述对象的搜索请求提取上下文特征;
将所述素材特征、所述对象特征、所述搜索词特征和所述上下文特征构建为一组模型输入特征;
基于所述响应数据生成所述模型输入特征的标签;若所述标签为1,表示所述素材在所述展示位投放后,所述对象对于所述素材执行预期响应操作;若所述标签为0,表示所述素材在所述展示位投放后,所述对象未对所述素材执行所述预期响应操作;
将所述模型输入特征及所述模型输入特征的标签的组合作为一个训练样本。
可选的,所述第二学习结果获得单元,具体用于:
由所述第二特征交叉层根据所述特征向量全集中的素材特征向量和对象特征向量进行特征交叉,得到第二特征交叉学习结果;其中,所述素材特征向量为所述嵌入层根据所述模型输入特征中的所述素材特征转换得到的特征向量,所述对象特征向量为所述嵌入层根据所述模型输入特征中的所述对象特征转换得到的特征向量;
所述映射结果获得单元,具体用于:
由所述线性模型对所述特征向量全集中的所述素材特征向量进行线性映射,得到线性映射结果。
可选的,所述模型参数调整单元1004,具体用于:
其中,N表示一轮训练回合中使用的所述相同展示位相关的训练样本总数,yi表示对于一轮训练回合中N个训练样本中第i个训练样本的标签,pi表示对于一轮训练回合中N个训练样本中第i个训练样本的投放效果预测值,σ(·)表示sigmoid函数。
可选的,所述训练迭代判定单元1005,具体用于:
所述训练截止条件包括总损失值小于预设阈值;所述总损失值为针对于所述多个展示位分别通过所述损失函数L计算得到的损失值之和。
可选的,所述第一特征交叉层包括分域权重因子分解机,所述第二特征交叉层包括因子分解机。
基于前文实施例提供的一种素材投放效果预测方法,本申请中还相应提供了一种素材投放效果预测装置。以下结合图11进行说明。图11为本申请实施例提供的素材投放效果预测装置的结构示意图。如图11所示的素材投放效果预测装置包括:
搜索请求接收单元1101,用于接收目标对象的搜索请求;
待输入特征获得单元1102,用于根据待投放素材和所述搜索请求得到待输入特征;
投放效果获得单元1103,用于将所述待输入特征作为素材投放效果预测模型的输入,通过所述素材投放效果预测模型得到所述待投放素材在多个展示位投放给所述目标对象的投放效果预测值;其中,所述素材投放效果预测模型为通过第一方面所述的训练方法训练得到的。
可选的,所述装置还包括:
投放排序结果单元,用于根据多个不同的待投放素材各自在多个展示位投放给所述目标对象的投放效果预测值以及预期的投放目标,进行投放决策,得到素材投放排序结果;所述素材投放排序结果包括从前到后的多个展示位分别对应的待投放素材;
待投放素材投放单元,用于根据所述素材投放排序结果投放待投放素材。
本申请实施例提供了一种素材投放效果预测模型的训练设备,该素材投放效果预测模型的训练设备可以为服务器。图12是本申请实施例提供的一种服务器结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)922(例如,一个或一个以上处理器)和存储器932,一个或一个以上存储应用程序942或数据944的存储介质930(例如一个或一个以上海量存储设备)。其中,存储器932和存储介质930可以是短暂存储或持久存储。存储在存储介质930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器922可以设置为与存储介质930通信,在服务器900上执行存储介质930中的一系列指令操作。
服务器900还可以包括一个或一个以上电源926,一个或一个以上有线或无线网络接口950,一个或一个以上输入输出接口958,和/或,一个或一个以上操作系统941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
其中,CPU 922用于执行如下步骤:
获取素材在展示位投放后对象的响应数据;所述素材为受到所述对象的搜索请求触发后向所述对象投放的;
根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本;所述训练样本包括:基于所述素材、所述展示位和所述对象的搜索请求提取的模型输入特征,以及基于所述响应数据生成的所述模型输入特征的标签;
将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值;所述待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数;
根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整;
当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
本申请实施例还提供了另一种素材投放效果预测模型的训练设备,该素材投放效果预测模型的训练设备可以为终端设备。如图13所示,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。以该终端设备为手机为例:
图13示出的是与本申请实施例提供的手机的部分结构的框图。参考图13,手机包括:射频(英文全称:Radio Frequency,英文缩写:RF)电路1010、存储器1020、输入单元1030、显示单元1040、传感器1050、音频电路1060、无线保真(英文全称:wirelessfidelity,英文缩写:WiFi)模块1070、处理器1080、以及电源1090等部件。本领域技术人员可以理解,图13中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图13对手机的各个构成部件进行具体的介绍:
RF电路1010可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1080处理;另外,将设计上行的数据发送给基站。通常,RF电路1010包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(英文全称:LowNoise Amplifier,英文缩写:LNA)、双工器等。此外,RF电路1010还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(英文全称:Global System of Mobile communication,英文缩写:GSM)、通用分组无线服务(英文全称:General Packet Radio Service,GPRS)、码分多址(英文全称:CodeDivision Multiple Access,英文缩写:CDMA)、宽带码分多址(英文全称:Wideband CodeDivision Multiple Access,英文缩写:WCDMA)、长期演进(英文全称:Long TermEvolution,英文缩写:LTE)、电子邮件、短消息服务(英文全称:Short Messaging Service,SMS)等。
存储器1020可用于存储软件程序以及模块,处理器1080通过运行存储在存储器1020的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1020可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1020可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1030可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1030可包括触控面板1031以及其他输入设备1032。触控面板1031,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1031上或在触控面板1031附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1031可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1080,并能接收处理器1080发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1031。除了触控面板1031,输入单元1030还可以包括其他输入设备1032。具体地,其他输入设备1032可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1040可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1040可包括显示面板1041,可选的,可以采用液晶显示器(英文全称:Liquid Crystal Display,英文缩写:LCD)、有机发光二极管(英文全称:Organic Light-Emitting Diode,英文缩写:OLED)等形式来配置显示面板1041。进一步的,触控面板1031可覆盖显示面板1041,当触控面板1031检测到在其上或附近的触摸操作后,传送给处理器1080以确定触摸事件的类型,随后处理器1080根据触摸事件的类型在显示面板1041上提供相应的视觉输出。虽然在图13中,触控面板1031与显示面板1041是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1031与显示面板1041集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器1050,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1041的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1041和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1060、扬声器1061,传声器1062可提供用户与手机之间的音频接口。音频电路1060可将接收到的音频数据转换后的电信号,传输到扬声器1061,由扬声器1061转换为声音信号输出;另一方面,传声器1062将收集的声音信号转换为电信号,由音频电路1060接收后转换为音频数据,再将音频数据输出处理器1080处理后,经RF电路1010以发送给比如另一手机,或者将音频数据输出至存储器1020以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块1070可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图13示出了WiFi模块1070,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1080是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1020内的软件程序和/或模块,以及调用存储在存储器1020内的数据,执行手机的各种功能和处理数据,从而对手机进行整体数据及信息收集。可选的,处理器1080可包括一个或多个处理单元;优选的,处理器1080可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1080中。
手机还包括给各个部件供电的电源1090(比如电池),优选的,电源可以通过电源管理系统与处理器1080逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该手机所包括的处理器1080还具有以下功能:
获取素材在展示位投放后对象的响应数据;所述素材为受到所述对象的搜索请求触发后向所述对象投放的;
根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本;所述训练样本包括:基于所述素材、所述展示位和所述对象的搜索请求提取的模型输入特征,以及基于所述响应数据生成的所述模型输入特征的标签;
将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值;所述待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数;
根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整;
当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,计算机程序被执行时实现前述素材投放效果预测模型的训练方法的步骤,或者执行时实现前述素材投放效果预测方法的步骤。
本申请实施例还提供一种包括计算机程序的计算机程序产品,当其在素材投放效果预测模型的训练设备上运行时,使得素材投放效果预测模型的训练设备执行前述素材投放效果预测模型的训练方法中的任意一种实施方式。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、设备的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述系统的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个系统可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的系统可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (16)
1.一种素材投放效果预测模型的训练方法,其特征在于,包括:
获取素材在展示位投放后对象的响应数据;所述素材为受到所述对象的搜索请求触发后向所述对象投放的;
根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本;所述训练样本包括:基于所述素材、所述展示位和所述对象的搜索请求提取的模型输入特征,以及基于所述响应数据生成的所述模型输入特征的标签;
将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值;所述待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数;
根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整;
当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
2.根据权利要求1所述的方法,其特征在于,所述待训练的预测模型中还包括共享塔模块,所述共享塔模块用于辅助各展示位分塔模块预测所述素材在对应的展示位的投放效果;所述通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值,具体包括:
由各展示位分塔模块基于所述模型输入特征中与所对应的展示位关联的信息进行学习,并输出分塔学习结果;以及,由所述共享塔模块基于所述模型输入特征中与所述多个展示位分别关联的信息进行学习,并输出共享塔学习结果;
对于所述多个展示位之中的目标展示位,基于所述目标展示位对应的展示位分塔模块的分塔学习结果以及所述共享塔学习结果,对所述素材在所述目标展示位投放给所述对象的投放效果进行预测,得到所述目标展示位的投放效果预测值。
3.根据权利要求2所述的方法,其特征在于,所述待训练的预测模型中还包括前后连接的嵌入层和第一特征交叉层;在各展示位分塔模块和所述共享塔模块进行学习前,还包括:
由所述嵌入层将所述模型输入特征转换得到特征向量全集;所述特征向量全集包括依据所述模型输入特征转换出的多种类型的特征向量;
由所述第一特征交叉层根据所述特征向量全集进行特征交叉,得到第一特征交叉学习结果;
所述由各展示位分塔模块基于所述模型输入特征中与所对应的展示位关联的信息进行学习,具体包括:由各展示位分塔模块基于所述第一特征交叉学习结果中与所对应的展示位关联的信息进行学习;
所述由所述共享塔模块基于所述模型输入特征中与所述多个展示位分别关联的信息进行学习,具体包括:由所述共享塔模块基于所述第一特征交叉学习结果中与所述多个展示位分别关联的信息进行学习。
4.根据权利要求3所述的方法,其特征在于,所述待训练的预测模型还包括注意力模块;在各展示位分塔模块和所述共享塔模块进行学习前,还包括:
由所述注意力模块根据所述特征向量全集,为各个第一特征交叉学习结果配置权重,得到对应于各展示位分塔模块的待传输特征交叉数据。
5.根据权利要求4所述的方法,其特征在于,所述待训练的预测模型还包括位于所述注意力模块后端的展示位归一化模块;在所述得到对应于各展示位分塔模块的待传输特征交叉数据之后,还包括:
由所述展示位归一化模块基于不同的展示位对所述对应于各展示位分塔模块的待传输特征交叉数据进行归一化处理;
由所述展示位归一化模块将对应于各展示位分塔模块的归一化后特征交叉数据传输给对应的展示位分塔模块,并将对应于各展示位分塔模块的归一化后特征交叉数据共同传输给所述共享塔模块。
6.根据权利要求3-5任一项所述的方法,其特征在于,所述待训练的预测模型还包括:第二特征交叉层和线性模型;在所述由所述嵌入层将所述模型输入特征转换得到特征向量全集之后,还包括:
由所述第二特征交叉层根据所述特征向量全集中的部分特征向量进行特征交叉,得到第二特征交叉学习结果;所述第二特征交叉层的特征交叉机制与所述第一特征交叉层的特征交叉机制具有区别;
由所述线性模型对所述特征向量全集中的部分特征向量进行线性映射,得到线性映射结果;
所述基于所述目标展示位对应的展示位分塔模块的分塔学习结果以及所述共享塔学习结果,对所述素材在所述目标展示位投放给所述对象的投放效果进行预测,具体包括:
基于所述第二特征交叉学习结果、所述线性映射结果、所述目标展示位对应的展示位分塔模块的分塔学习结果以及所述共享塔学习结果,对所述素材在所述目标展示位投放给所述对象的投放效果进行预测。
7.根据权利要求6所述的方法,其特征在于,所述根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本,包括:
提取所述素材的素材特征;所述素材的素材特征包括:所述素材的标识、所述素材的类型和所述素材的发起方信息;
根据所述对象的搜索请求提取对象特征和搜索词特征;
根据所述展示位和所述对象的搜索请求提取上下文特征;
将所述素材特征、所述对象特征、所述搜索词特征和所述上下文特征构建为一组模型输入特征;
基于所述响应数据生成所述模型输入特征的标签;若所述标签为1,表示所述素材在所述展示位投放后,所述对象对于所述素材执行预期响应操作;若所述标签为0,表示所述素材在所述展示位投放后,所述对象未对所述素材执行所述预期响应操作;
将所述模型输入特征及所述模型输入特征的标签的组合作为一个训练样本。
8.根据权利要求7所述的方法,其特征在于,所述由所述第二特征交叉层根据所述特征向量全集中的部分特征向量进行特征交叉,得到第二特征交叉学习结果,包括:
由所述第二特征交叉层根据所述特征向量全集中的素材特征向量和对象特征向量进行特征交叉,得到第二特征交叉学习结果;其中,所述素材特征向量为所述嵌入层根据所述模型输入特征中的所述素材特征转换得到的特征向量,所述对象特征向量为所述嵌入层根据所述模型输入特征中的所述对象特征转换得到的特征向量;
所述由所述线性模型对所述特征向量全集中的部分特征向量进行线性映射,得到线性映射结果,包括:
由所述线性模型对所述特征向量全集中的所述素材特征向量进行线性映射,得到线性映射结果。
9.根据权利要求1-5,7-8中任一项所述的方法,其特征在于,相同展示位所述投放效果预测值与所述标签的差异通过以下损失函数L计算:
其中,N表示一轮训练回合中使用的所述相同展示位相关的训练样本总数,yi表示对于一轮训练回合中N个训练样本中第i个训练样本的标签,pi表示对于一轮训练回合中N个训练样本中第i个训练样本的投放效果预测值,σ(·)表示sigmoid函数。
10.根据权利要求9所述的方法,其特征在于,所述训练截止条件包括总损失值小于预设阈值;所述总损失值为针对于所述多个展示位分别通过所述损失函数L计算得到的损失值之和。
11.根据权利要求6所述的方法,其特征在于,所述第一特征交叉层包括分域权重因子分解机,所述第二特征交叉层包括因子分解机。
12.一种素材投放效果预测方法,其特征在于,包括:
接收目标对象的搜索请求;
根据待投放素材和所述搜索请求得到待输入特征;
将所述待输入特征作为素材投放效果预测模型的输入,通过所述素材投放效果预测模型得到所述待投放素材在多个展示位投放给所述目标对象的投放效果预测值;其中,所述素材投放效果预测模型为通过权利要求1-11任意一项所述的训练方法训练得到的。
13.根据权利要求12所述的方法,其特征在于,还包括:
根据多个不同的待投放素材各自在多个展示位投放给所述目标对象的投放效果预测值以及预期的投放目标,进行投放决策,得到素材投放排序结果;所述素材投放排序结果包括从前到后的多个展示位分别对应的待投放素材;
根据所述素材投放排序结果投放待投放素材。
14.一种素材投放效果预测模型的训练装置,其特征在于,包括:
响应数据获取单元,用于获取素材在展示位投放后对象的响应数据;所述素材为受到所述对象的搜索请求触发后向所述对象投放的;
训练样本构建单元,用于根据所述素材、所述展示位、所述响应数据和所述对象的搜索请求构建训练样本;所述训练样本包括:基于所述素材、所述展示位和所述对象的搜索请求提取的模型输入特征,以及基于所述响应数据生成的所述模型输入特征的标签;
投放效果预测单元,用于将所述模型输入特征输入至待训练的预测模型中,通过所述待训练的预测模型获得所述素材分别在多个展示位投放给所述对象的投放效果预测值;所述待训练的预测模型包括与多个展示位一一对应的展示位分塔模块,展示位分塔模块包括对应的展示位的塔参数;
模型参数调整单元,用于根据相同展示位所述投放效果预测值与所述标签的差异,对所述待训练的预测模型进行参数调整;
训练迭代判定单元,用于当所述待训练的预测模型满足训练截止条件时,完成训练获得素材投放效果预测模型。
15.一种素材投放效果预测模型的训练设备,其特征在于,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序,并将所述计算机程序传输给所述处理器;
所述处理器用于根据所述计算机程序中的指令执行权利要求1至11中任一项所述的素材投放效果预测模型的训练方法的步骤。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被执行时实现权利要求1至11中任一项所述的素材投放效果预测模型的训练方法的步骤,或者执行时实现权利要求12或13所述的素材投放效果预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310567806.8A CN117216541A (zh) | 2023-05-19 | 2023-05-19 | 素材投放效果预测模型的训练方法、预测方法、相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310567806.8A CN117216541A (zh) | 2023-05-19 | 2023-05-19 | 素材投放效果预测模型的训练方法、预测方法、相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117216541A true CN117216541A (zh) | 2023-12-12 |
Family
ID=89043216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310567806.8A Pending CN117216541A (zh) | 2023-05-19 | 2023-05-19 | 素材投放效果预测模型的训练方法、预测方法、相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117216541A (zh) |
-
2023
- 2023-05-19 CN CN202310567806.8A patent/CN117216541A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109241431B (zh) | 一种资源推荐方法和装置 | |
WO2021238722A1 (zh) | 资源推送方法、装置、设备及存储介质 | |
CN111177371B (zh) | 一种分类方法和相关装置 | |
CN111931501B (zh) | 一种基于人工智能的文本挖掘方法、相关装置及设备 | |
CN113821720A (zh) | 一种行为预测方法、装置及相关产品 | |
CN111353299B (zh) | 基于人工智能的对话场景确定方法和相关装置 | |
CN111368171B (zh) | 一种关键词推荐的方法、相关装置以及存储介质 | |
CN111709398A (zh) | 一种图像识别的方法、图像识别模型的训练方法及装置 | |
CN113569572B (zh) | 文本实体生成方法、模型训练方法及装置 | |
CN111651604A (zh) | 基于人工智能的情感分类方法和相关装置 | |
CN113220848A (zh) | 用于人机交互的自动问答方法、装置和智能设备 | |
CN111738000B (zh) | 一种短语推荐的方法以及相关装置 | |
CN111611369B (zh) | 基于人工智能的交互方法和相关装置 | |
CN112907255A (zh) | 一种用户分析方法和相关装置 | |
CN112862021A (zh) | 一种内容标注方法和相关装置 | |
CN116975295A (zh) | 一种文本分类方法、装置及相关产品 | |
CN110929882A (zh) | 一种基于人工智能的特征向量计算方法和相关装置 | |
CN113822435B (zh) | 一种用户转化率的预测方法及相关设备 | |
CN117216541A (zh) | 素材投放效果预测模型的训练方法、预测方法、相关产品 | |
CN113569043A (zh) | 一种文本类别确定方法和相关装置 | |
CN115080840A (zh) | 一种内容推送方法、装置及存储介质 | |
CN116450384A (zh) | 一种信息处理方法和相关装置 | |
CN112163164B (zh) | 一种用户标签确定方法和相关装置 | |
CN111475732B (zh) | 一种信息处理方法和装置 | |
CN118035567B (zh) | 模型训练和数据推荐方法、装置、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |