CN109615060B - Ctr预估方法、装置及计算机可读存储介质 - Google Patents

Ctr预估方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN109615060B
CN109615060B CN201811432671.XA CN201811432671A CN109615060B CN 109615060 B CN109615060 B CN 109615060B CN 201811432671 A CN201811432671 A CN 201811432671A CN 109615060 B CN109615060 B CN 109615060B
Authority
CN
China
Prior art keywords
advertisement data
ctr
neural network
network model
loss function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811432671.XA
Other languages
English (en)
Other versions
CN109615060A (zh
Inventor
刘博�
郑文琛
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201811432671.XA priority Critical patent/CN109615060B/zh
Priority to PCT/CN2019/080306 priority patent/WO2020107762A1/zh
Publication of CN109615060A publication Critical patent/CN109615060A/zh
Application granted granted Critical
Publication of CN109615060B publication Critical patent/CN109615060B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Molecular Biology (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种CTR预估方法,包括:获取待训练的不同类型的广告数据样本;基于所述广告数据样本对预设的神经网络模型进行训练;获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。本发明还公开了一种CTR预估装置及计算机可读存储介质。本发明有效地提高了CTR预估的准确性。

Description

CTR预估方法、装置及计算机可读存储介质
技术领域
本发明涉及互联网广告技术领域,尤其涉及一种CTR预估方法、装置及计算机可读存储介质。
背景技术
CTR(Click Through Rate,点击率)预估是计算广告点击率中最核心的算法之一,简单来说,CTR预估是对每次广告的点击情况做出预测,预测用户是点击还是不点击。当前的CTR预估方法大多利用同一领域的用户行为数据进行学习训练,这种方法受数据的质量和数量影响较大;另外,当前的CTR预估方法多基于超高维度的监督模型或深度模型,例如超高维度的逻辑回归、分解机模型以及宽度深度模型等,这些CTR预估方法专注于CTR预估的准确性,严重缺乏对CTR预估结果的合理分析和解释,因而,当前的CTR预估方法难以给出预测理由也难以进行优化调整。
发明内容
本发明的主要目的在于提供一种CTR预估方法、装置及计算机可读存储介质,旨在解决现有的CTR预估方法不够准确及缺乏对CTR预估结果的合理分析和解释的技术问题。
为实现上述目的,本发明提供一种CTR预估方法,所述CTR预估方法包括:
获取待训练的不同类型的广告数据样本;
基于所述广告数据样本对预设的神经网络模型进行训练;
获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
可选地,所述广告数据样本包括无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本,所述标注信息至少包括群体和点击率。
可选地,所述基于所述广告数据样本对预设的神经网络模型进行训练的步骤包括:
将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
可选地,所述基于损失函数对所述同一特征空间中的特征进行学习的步骤包括:
基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和,
基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
可选地,所述基于所述广告数据样本对预设的神经网络模型进行训练的的步骤之后,还包括:
保存所述训练后的神经网络模型。
可选地,所述获取待预估的广告数据的步骤包括:
当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
可选地,所述将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估的步骤包括:
基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
基于所述多次CTR预估的结果,确定所述广告数据的CTR。
可选地,所述获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估的步骤之后,还包括:
基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
此外,为实现上述目的,本发明还提供一种CTR预估装置,所述CTR预估装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的CTR预估程序,所述CTR预估程序被所述处理器执行时实现如上所述的CTR预估方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有CTR预估程序,所述CTR预估程序被处理器执行时实现如上所述的CTR预估方法的步骤。
本发明提出的一种CTR预估方法,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本发明提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明CTR预估方法第一实施例的流程示意图;
图3为图2中的步骤S20的细化流程示意图;
图4为本发明CTR预估方法第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:获取待训练的不同类型的广告数据样本;基于所述广告数据样本对预设的神经网络模型进行训练;获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。通过本发明实施例的技术方案,解决了现有的CTR预估方法不够准确及缺乏对CTR预估结果的合理分析和解释的技术问题。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图。
本发明实施例装置可以是PC,也可以是智能手机、平板电脑、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该装置可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,装置还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、Wi-Fi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。当然,装置还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的装置结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及CTR预估程序。
在图1所示的装置中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001、存储器1005可以设置在CTR预估装置中,所述CTR预估装置通过处理器1001调用存储器1005中存储的CTR预估程序,并执行以下操作:
获取待训练的不同类型的广告数据样本;
基于所述广告数据样本对预设的神经网络模型进行训练;
获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和,
基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
保存所述训练后的神经网络模型。
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
基于所述多次CTR预估的结果,确定所述广告数据的CTR。
进一步地,处理器1001可以调用存储器1005中存储的CTR预估程序,还执行以下操作:
基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
本实施例提供的方案,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本发明提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
基于上述硬件结构,提出本发明CTR预估方法实施例。
参照图2,图2为本发明CTR预估方法第一实施例的流程示意图,在该实施例中,所述方法包括:
步骤S10,获取待训练的不同类型的广告数据样本;
为了减轻CTR预估中对用户行为数据的质量和数量的过分依赖,提高CTR预估的准确性,本发明提出了一种CTR预估方法,利用迁移学习结合多种不同的广告数据以及用户行为数据对CTR预估的模型进行训练、学习,有效地提高了后续CTR预估的准确性。
具体地,首先获取待训练的广告数据样本,为了给不同的应用场景提供通用的解决方法,本实施例中将广告数据样本分为三种不同的类型:无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本,其中,标注信息包括但不限于群体和点击率。
其中,无标注信息的广告数据样本,例如从互联网等来源抓取的广告文案,此类数据样本的获取成本极低,因此,在多数的应用场景下,该类数据样本的数量最多,但是抓取的数据样本缺乏明确的标准信息,即广告对应的CTR等,显然,该类数据质量较差,无法直接用来训练CTR预估所需的神经网络模型;而带有完整标注信息的广告数据样本,此类数据样本可以直接用来训练神经网络模型,具体地,标注信息可以包括该广告的点击率以及点击群体,例如,在金融产品推荐案例中,该类数据即为用户点击金融产品的行为数据、用户画像以及金融产品的属性等,这类数据在低频应用场景下,同一公司的此类数据较少,因此,该类数据质量最高,但数量较少;最后,带有弱标注信息的广告数据样本,该类数据样本大多为从第三方获取的广告文案及用户行为,点击率未知,可以理解的是,该类数据样本也不可以直接用来训练神经网络模型,例如,在用户对金融产品的点击率预测这个应用中,用户对新闻的点击行为无法被直接用来训练对金融产品点击率预测的CTR预估模型,此类包含弱标注信息的样本数据包含一定的行为信息且从第三方获取,因此,该类数据的质量和数量皆为中等。如下表1所示,对这三类数据的质量及数量关系进行总结,如下:
广告数据样本类型 质量 数量
无标注信息的广告数据样本
带有弱标注信息的广告数据样本
带有完整标注信息的广告数据样本
表1
步骤S20,基于所述广告数据样本对预设的神经网络模型进行训练;
进一步地,当获取上述三种不同类型的广告数据样本后,因为无标注信息的广告数据样本和带有弱标注信息的广告数据样本都无法直接用来训练CTR预估所需的神经网络模型,因此,需要利用迁移学习结合不同的广告数据以及用户行为数据对CTR预估所需的模型进行训练,具体地,如图3所示,所述步骤S20具体包括:
步骤S21,将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
在本实施例中,主要是利用特征迁移,特征迁移是通过观察源领域数据与目标域数据之间的共同特征,然后利用观察所得的共同特征在不同层级的特征间进行自动迁移,源领域数据即为无标注信息的广告数据样本和带有弱标注信息的广告数据样本,而目标域数据即带有完整标注信息的广告数据样本,通过迁移学习将不同的广告数据样本所记载的信息迁移至同一个特征空间中,在同一特征空间中维持各种数据的原有信息,以便更好地对CTR预估所需的模型进行训练。
具体地,首先是通过深度神经网络对输入的广告数据样本的文本特征进行提取,具体过程可以包括:将广告数据样本中的词转换为词向量,并通过深度神经网络扫描上述词向量,得到扫描特征;进一步地,通过对扫描特征进行采样生成深度特征;最后,将深度特征输入至深度神经网络的分类层得到分类结果,即完成了文本特征的提取,当然,除了上述表述的方式之外,还可以采用其他的方式进行文本特征提取,在此不作赘述。
步骤S22,基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
进一步地,对无标注信息的广告数据样本、带有弱标注信息的广告数据样本、带有完整标注信息的广告数据样本三者分别对应的文本特征进行处理,使其迁移至同一特征空间中。
步骤S23,基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
进一步地,基于预设的损失函数对上述同一特征空间中的特征进行学习,具体地,在本实施例中,预设的损失函数可以包括非监督损失函数、弱监督损失函数和监督损失函数,对应的,非监督损失函数是对同一特征空间中无标注信息的广告数据样本所对应的特征进行学习;弱监督损失函数是对同一特征空间中带有弱标注信息的广告数据样本所对应的特征进行学习;而监督损失函数是对同一特征空间中带有完整标注信息的广告数据样本所对应的特征进行学习。同时,还利用非监督损失函数对同一特征空间中所有的广告数据样本所对应的特征进行学习,因为,带有完整标注信息的广告数据样本和带有弱标注信息的广告数据样本,与无标注信息的广告数据样本相比,带有群体或点击率等标记信息,同样地可以被视为不带标注信息的样本数据,即对其所带有的完整标注、弱标注进行去除,然后利用非监督损失函数进行特征学习。可以理解的是,上述四个基于损失函数进行学习的过程可以同时进行,同时对该预设的神经网络模型进行优化训练。
进一步地,当损失函数开始收敛时,表明对预设的神经网络模型的训练完成,同时,对训练后的神经网络模型进行保存,以便用于后续的CTR在线预估。
可以理解的是,在利用迁移学习结合不同的广告数据以及用户行为数据对CTR预估所需的神经网络模型进行训练之前,为了加快学习的速度,即加速损失函数的收敛,提高神经网络模型的准确率,可以优先采用对预训练的神经网络模型进行权重初始化,权重初始化的方式可以包括但不限于初始化为小的随机数,如均值为0,方差为0.01的高斯分布,或者是Xavier均匀分布,以减少梯度弥散问题,使得信号在神经网络中可以传递得更深,还可以采用其他的方式进行权重初始化,在此不作赘述。
步骤S30,获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
当需要进行CTR预估时,获取待预估的广告数据,并将其输入至训练后的神经网络模型中,神经网络模型即可输出该广告数据对应的CTR,即广告点击率。
在本实施例中,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本发明提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
进一步的,参照图4,基于上述实施例,提出本发明CTR预估方法第二实施例,在本实施例中,所述步骤S30还包括:
步骤S31,当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据;
当用户需要进行广告数据的CTR预估时,即可在终端上进行操作,当终端接收到相应的广告数据的CTR预估请求时,即可获取待广告数据的CTR预估请求对应的广告数据,以便基于训练好的神经网络模型对其进行CTR预估。
步骤S32,基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
在本实施例中,为了进一步地提高CTR预估的准确性,通过引入正则项的方式为神经网络模型引入随机性,进行多次CTR预估,以帮助估计CTR预估的不确定性。具体地,首先通过深度神经网络对待预估的广告数据进行特征提取,再通过引入正则项随机地减少特征的数量,再进行CTR预估,即可得到多次CTR预估结果。
步骤S33,基于所述多次CTR预估的结果,确定所述广告数据的CTR。
进一步地,对上述多次CTR预估的结果取平均值,即可得到本次广告数据的预估CTR。
进一步地,所述步骤S30之后,还包括:
步骤a,基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
在本实施例中,当通过神经网络模型对待预估的广告数据的CTR进行预测后,还可以通过特征筛选的方式确定该广告数据的重要特征,特征筛选所得的重要特征即为对广告预估结果的解释。具体地,是通过改变广告数据的某一特征后,再进行CTR预估,判断CTR预估的结果是否有发生大的变化,若没有,则表明该改变的特征不是重要特征;若有,则表明该特征是重要特征。例如,一金融广告数据基于神经网络模型进行特征提取后,得到6个特征,分别为男性、40-60岁、广东地区、高收益、高风险、购买人多,通过特征筛选的方式,确定重要特征为40-60岁和高收益,即神经网络模型主要依赖于这两个特征做出CTR预估。
在本实施例中,通过引入正则项的方式为神经网络模型引入随机性,进行多次CTR预估,得到多个CTR预估结果,提高了CTR预估结果的可信度及不确定性,同时采用特征筛选的方式确定广告数据对应的重要特征,对神经网络模型做出的CTR预估结果做出解释。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有CTR预估程序,所述CTR预估程序被处理器执行时实现如下操作:
获取待训练的不同类型的广告数据样本;
基于所述广告数据样本对预设的神经网络模型进行训练;
获取待预估的广告数据,并将所述广告数据输入至训练后的所述神经网络模型中,以便对所述广告数据进行点击率CTR预估。
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
将所述广告数据样本输入至预设的神经网络模型中,以便提取所述广告数据样本对应的特征;
基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成。
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和,
基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
保存所述训练后的神经网络模型。
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
基于所述多次CTR预估的结果,确定所述广告数据的CTR。
进一步地,所述CTR预估程序被处理器执行时还实现如下操作:
基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释。
本实施例提供的方案,首先,获取待训练的不同类型的广告数据样本,以便基于该广告数据样本对预设的神经网络模型进行训练,进一步地,获取待预估的广告数据,并将该广告数据输入至训练后的神经网络模型中以进行CTR预估,最终输出该广告数据对应的CTR。本发明提出的CTR预估方法,通过多种不同类型的广告数据样本,事先对预设的神经网络模型进行训练,减轻了CTR预估中对广告数据的质量和数量的过分依赖,有效地提高了CTR预估的准确性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (5)

1.一种CTR预估方法,其特征在于,所述CTR预估方法包括以下步骤:
获取待训练的不同类型的广告数据样本,其中,所述广告数据样本包括未知点击率的无标注信息的广告数据样本、未知点击率的带有弱标注信息的广告数据样本、以及已知点击率的带有完整标注信息的广告数据样本;
基于所述广告数据样本对预设的神经网络模型进行训练,以便提取所述广告数据样本对应的特征;
基于迁移学习将所述广告数据样本对应的特征迁移至同一特征空间中;
基于损失函数对所述同一特征空间中的特征进行学习,当所述损失函数开始收敛时,确认所述预设的神经网络模型训练完成;
获取待预估的广告数据,并基于所述训练后的神经网络模型对所述广告数据的特征进行提取,并引入相应的正则项以便所述神经网络模型基于所述特征进行多次CTR预估;
基于所述多次CTR预估的结果,确定所述广告数据的CTR;
基于所述广告数据的CTR对所述广告数据进行特征筛选,确定所述广告数据对应的重要特征,以便基于所述重要特征对所述广告数据的CTR进行解释;
所述基于损失函数对所述同一特征空间中的特征进行学习的步骤包括:
基于非监督损失函数,对所述广告数据样本在所述同一特征空间中的特征进行学习;和,
基于非监督损失函数,对所述无标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于弱监督损失函数,对所述带有弱标注信息的广告数据样本在所述同一特征空间中的特征进行学习;和,
基于监督损失函数,对所述带有完整标注信息的广告数据样本在所述同一特征空间中的特征进行学习。
2.如权利要求1所述的CTR预估方法,其特征在于,所述基于所述广告数据样本对预设的神经网络模型进行训练的步骤之后,还包括:
保存所述训练后的神经网络模型。
3.如权利要求2所述的CTR预估方法,其特征在于,所述获取待预估的广告数据的步骤包括:
当接收到基于广告数据的CTR预估请求时,获取所述CTR预估请求对应的广告数据。
4.一种CTR预估装置,其特征在于,所述CTR预估装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的CTR预估程序,所述CTR预估程序被所述处理器执行时实现如权利要求1至3中任一项所述的CTR预估方法的步骤。
5.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有CTR预估程序,所述CTR预估程序被处理器执行时实现如权利要求1至3中任一项所述的CTR预估方法的步骤。
CN201811432671.XA 2018-11-27 2018-11-27 Ctr预估方法、装置及计算机可读存储介质 Active CN109615060B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811432671.XA CN109615060B (zh) 2018-11-27 2018-11-27 Ctr预估方法、装置及计算机可读存储介质
PCT/CN2019/080306 WO2020107762A1 (zh) 2018-11-27 2019-03-29 Ctr预估方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811432671.XA CN109615060B (zh) 2018-11-27 2018-11-27 Ctr预估方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109615060A CN109615060A (zh) 2019-04-12
CN109615060B true CN109615060B (zh) 2023-06-30

Family

ID=66005674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811432671.XA Active CN109615060B (zh) 2018-11-27 2018-11-27 Ctr预估方法、装置及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN109615060B (zh)
WO (1) WO2020107762A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11004108B2 (en) * 2019-06-28 2021-05-11 Microsoft Technology Licensing, Llc Machine-learning techniques to predict offsite user interactions based on onsite machine- learned models
CN110472162B (zh) * 2019-08-20 2024-03-08 深圳前海微众银行股份有限公司 评估方法、系统、终端及可读存储介质
CN110796499B (zh) * 2019-11-06 2023-05-30 中山大学 一种广告转化率预估模型及其训练方法
CN113822688A (zh) * 2020-06-23 2021-12-21 北京沃东天骏信息技术有限公司 广告转化率预估方法及装置、存储介质、电子设备
CN112381607B (zh) * 2020-11-12 2023-11-24 杭州时趣信息技术有限公司 一种网络商品排序方法、装置、设备及介质
CN112396473A (zh) * 2020-12-23 2021-02-23 上海苍苔信息技术有限公司 一种提高ctr值的cpm系统和方法
CN113269232B (zh) * 2021-04-25 2023-12-08 北京沃东天骏信息技术有限公司 模型训练方法、向量化召回方法、相关设备及存储介质
CN113222651B (zh) * 2021-04-29 2024-05-07 西安点告网络科技有限公司 广告投放模型统计类特征离散化方法、系统、设备及介质
US20240046314A1 (en) * 2022-08-03 2024-02-08 Hong Kong Applied Science and Technology Research Institute Company Limited Systems and methods for multidimensional knowledge transfer for click through rate prediction

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104536983A (zh) * 2014-12-08 2015-04-22 北京掌阔技术有限公司 一种预测广告点击率的方法和装置
CN105260913A (zh) * 2015-10-16 2016-01-20 上海晶赞科技发展有限公司 用于互联网广告投放的ctr预估方法、dsp服务器、系统
CN105869016A (zh) * 2016-03-28 2016-08-17 天津中科智能识别产业技术研究院有限公司 一种基于卷积神经网络的点击通过率预估方法
CN107622086A (zh) * 2017-08-16 2018-01-23 北京京东尚科信息技术有限公司 一种点击率预估方法和装置
CN108038541A (zh) * 2017-12-07 2018-05-15 百度在线网络技术(北京)有限公司 Ctr预估的方法、装置、设备及计算机可读介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080249832A1 (en) * 2007-04-04 2008-10-09 Microsoft Corporation Estimating expected performance of advertisements
US8738436B2 (en) * 2008-09-30 2014-05-27 Yahoo! Inc. Click through rate prediction system and method
CN105005911B (zh) * 2015-06-26 2017-09-19 深圳市腾讯计算机系统有限公司 深度神经网络的运算系统及运算方法
CN104951965B (zh) * 2015-06-26 2017-04-19 深圳市腾讯计算机系统有限公司 广告投放方法及装置
CN105654200A (zh) * 2015-12-30 2016-06-08 上海珍岛信息技术有限公司 一种基于深度学习的广告点击率预测方法及装置
CN107463580B (zh) * 2016-06-06 2020-07-24 腾讯科技(深圳)有限公司 训练点击率预估模型方法和装置、点击率预估方法和装置
CN107527091B (zh) * 2016-10-14 2021-05-25 腾讯科技(北京)有限公司 数据处理方法和装置
CN108053050A (zh) * 2017-11-14 2018-05-18 广州优视网络科技有限公司 点击率预估方法、装置、计算设备及存储介质
CN108520442A (zh) * 2018-04-10 2018-09-11 电子科技大学 一种基于融合结构的展示广告点击率预测方法
CN108694386B (zh) * 2018-05-15 2021-08-10 华南理工大学 一种基于并联卷积神经网络的车道线检测方法
CN108805259A (zh) * 2018-05-23 2018-11-13 北京达佳互联信息技术有限公司 神经网络模型训练方法、装置、存储介质及终端设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104536983A (zh) * 2014-12-08 2015-04-22 北京掌阔技术有限公司 一种预测广告点击率的方法和装置
CN105260913A (zh) * 2015-10-16 2016-01-20 上海晶赞科技发展有限公司 用于互联网广告投放的ctr预估方法、dsp服务器、系统
CN105869016A (zh) * 2016-03-28 2016-08-17 天津中科智能识别产业技术研究院有限公司 一种基于卷积神经网络的点击通过率预估方法
CN107622086A (zh) * 2017-08-16 2018-01-23 北京京东尚科信息技术有限公司 一种点击率预估方法和装置
CN108038541A (zh) * 2017-12-07 2018-05-15 百度在线网络技术(北京)有限公司 Ctr预估的方法、装置、设备及计算机可读介质

Also Published As

Publication number Publication date
CN109615060A (zh) 2019-04-12
WO2020107762A1 (zh) 2020-06-04

Similar Documents

Publication Publication Date Title
CN109615060B (zh) Ctr预估方法、装置及计算机可读存储介质
CN109547814B (zh) 视频推荐方法、装置、服务器及存储介质
CN108563722B (zh) 文本信息的行业分类方法、系统、计算机设备和存储介质
CN107563500B (zh) 一种基于用户头像的视频推荐方法及系统
CN107871244B (zh) 一种广告效果的检测方法和装置
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN105160545B (zh) 投放信息样式确定方法及装置
CN111881343A (zh) 信息推送方法、装置、电子设备及计算机可读存储介质
CN110119477B (zh) 一种信息推送方法、装置和存储介质
CN111291264A (zh) 基于机器学习的访问对象预测方法、装置和计算机设备
CN107894998A (zh) 视频推荐方法及装置
CN111178983B (zh) 用户性别预测方法、装置、设备及存储介质
CN111783810B (zh) 用于确定用户的属性信息的方法和装置
CN113360622A (zh) 用户对话信息的处理方法、装置及计算机设备
CN110597965B (zh) 文章的情感极性分析方法、装置、电子设备及存储介质
CN107291774B (zh) 错误样本识别方法和装置
US20210406325A1 (en) Dynamically integrating interactive machine learning multi-models
CN110675179A (zh) 营销信息处理方法、装置、电子设备及可读存储介质
CN112381236A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN110717094A (zh) 信息推荐方法、装置、计算机设备和存储介质
CN114223012A (zh) 推送对象确定方法、装置、终端设备及存储介质
CN114385915A (zh) 一种内容推荐方法、装置、存储介质及电子设备
CN116205686A (zh) 一种多媒体资源推荐的方法、装置、设备和存储介质
CN111127057B (zh) 一种多维用户画像恢复方法
CN112200602A (zh) 用于广告推荐的神经网络模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant