CN105654200A - 一种基于深度学习的广告点击率预测方法及装置 - Google Patents
一种基于深度学习的广告点击率预测方法及装置 Download PDFInfo
- Publication number
- CN105654200A CN105654200A CN201511022651.1A CN201511022651A CN105654200A CN 105654200 A CN105654200 A CN 105654200A CN 201511022651 A CN201511022651 A CN 201511022651A CN 105654200 A CN105654200 A CN 105654200A
- Authority
- CN
- China
- Prior art keywords
- training
- advertisement
- deep learning
- learning model
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度学习的广告点击率预测方法及装置,其中,该方法包括:获取预设量的训练广告,以及每个训练广告对应的训练点击率及训练特征;将每个训练广告的训练特征转换成训练向量,利用训练向量及每个训练广告的训练点击率训练深度学习模型,其中,深度学习模型为基于非线性函数实现的;获取由待测广告的待测特征转换成的待测向量,并将待测向量作为深度学习模型的输入,得到与待测广告对应的预测点击率。本申请中的深度学习模型充分考虑到特征之间的非线性关系,由此,将待测向量输入至深度学习模型后,深度学习模型基于非线性函数能够高效、准确的输出待测向量对应的预测点击率。
Description
技术领域
本发明涉及互联网计算广告技术领域,更具体地说,涉及一种基于深度学习的广告点击率预测方法及装置。
背景技术
随着互联网的飞速发展,互联网广告也随之兴起,与传统的广告相比,互联网广告具有得天独厚的优势,是实施现代营销媒体战略的重要部分之一,以下均将互联网广告简称为广告。无论是搜索广告、展示广告还是移动设备端广告,点击率预估问题是互联网广告领域的核心问题,而点击率预估的准确性,直接影响到用户体验、广告主收益、广告平台收益三方利益,进而影响到整个广告生态系统的平衡。因此,做好广告点击率预估工作具有十分重要的意义。
现有技术中通常使用线性学习模型实现广告的点击率预估问题,但是,发明人发现,使用线性学习模型实现广告的点击率预估问题时,线性模型中的各个特征对预测结果的关系都是互相独立,彼此不受影响的,因此,线性模型无法学习特征之间的非线性关系,如高收入人群对奢侈品广告的点击率要高于普通收入人群,研究人员点击机器学习书籍的概率要大于高中学生等。但是,实际数据中具有很多的非线性关系的特征,这些特征需要同时出现才能够对预测结果起到正向作用。因此,现有技术中利用线性模型学习实现广告的点击率预估问题时,忽略了特征之间的非线性关系,进而导致获取的预测结果的准确性较差,即广告点击率预测预估的准确性较低,效果较差。
综上所述,现有技术中广告点击率预估存在准确性较低,效果较差的问题。
发明内容
本发明的目的是提供一种基于深度学习的广告点击率预测方法及装置,以解决现有技术的广告点击率预估中存在的准确性较低、效果较差的问题。
为了实现上述目的,本发明提供如下技术方案:
一种基于深度学习的广告点击率预测方法,包括:
获取预设量的训练广告,以及每个所述训练广告对应的训练点击率及训练特征;
将每个所述训练广告的训练特征转换成训练向量,利用所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,其中,所述深度学习模型为基于非线性函数实现的;
获取由待测广告的待测特征转换成的待测向量,并将所述待测向量作为所述深度学习模型的输入,得到与所述待测广告对应的预测点击率。
优选的,获取每个所述训练广告的训练点击率,包括:
获取展示日志及点击日志,其中,所述展示日志记录有被展示过的训练广告,所述点击日志记录有被点击过的训练广告;
利用所述展示日志及所述点击日志确定每个训练广告对应的展示次数及点击次数,并确定每个所述训练广告的点击次数与展示次数的商为该训练广告的训练点击率。
优选的,获取展示日志及点击日志之后,还包括:
将所述展示日志及所述点击日志进行拼接;
将进行拼接后的所述展示日志及所述点击日志中的无效日志进行滤除,其中,所述无效日志包括残缺的日志及被点击后在对应广告页面上停留时间小于第一预设值的日志。
优选的,将每个所述训练广告的训练特征转换成训练向量,包括:
对于所述训练特征中的离散型训练特征,统计所述离散型训练特征在所述训练特征中出现的频次,作为该离散训练特征对应的特征值;对于所述训练特征中连续型训练特征,统计所述连续性训练特征在所述训练特征中对应的最大值及最小值,并依据所述最大值及最小值将所述连续型训练特征切分成预设数量个子训练特征,统计每个所述子训练特征在所述训练特征中出现的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到的全部特征值及特征向量值连接起来,得到所述训练向量。
优选的,将得到的全部特征值及特征向量连接起来之前,还包括:
将所述特征值及所述特征向量值中对应的频次小于第二预设值的特征值或者特征向量值进行删除。
优选的,利用所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,包括:
采用随机初始化的方法初始化所述深度学习模型中包含的连接权重参数,其中,所述深度学习模型中包含的隐藏层节点为非线性函数;
依次将所述训练向量输入至所述深度学习模型中,并在将任一训练向量输入至所述深度学习模型后,得到对应的输出点击率,判断该输出点击率与输入的训练向量对应的训练点击率之间的误差是否大于第三预设值,如果是,则依据该误差利用反向传播算法更新所述连接权重参数,如果否,则确定当前的连接权重参数对应的深度学习模型为训练得到的深度学习模型。
一种基于深度学习的广告点击率预测装置,包括:
获取模块,用于获取预设量的训练广告,以及每个所述训练广告对应的训练点击率及训练特征;
训练模块,用于将每个所述训练广告的训练特征转换成训练向量,利用所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,其中,所述深度学习模型为基于非线性函数实现的;
测试模块,用于获取由待测广告的待测特征转换成的待测向量,并将所述待测向量作为所述深度学习模型的输入,得到与所述待测广告对应的预测点击率。
优选的,获取模块包括:
获取单元,用于获取展示日志及点击日志,其中,所述展示日志记录有被展示过的训练广告,所述点击日志记录有被点击过的训练广告;
计算单元,用于利用所述展示日志及所述点击日志确定每个训练广告对应的展示次数及点击次数,并确定每个所述训练广告的点击次数与展示次数的商为该训练广告的训练点击率。
优选的,训练模块包括:
转换单元,用于:对于所述训练特征中的离散型训练特征,统计所述离散型训练特征在所述训练特征中出现的频次,作为该离散训练特征对应的特征值;对于所述训练特征中连续型训练特征,统计所述连续性训练特征在所述训练特征中对应的最大值及最小值,并依据所述最大值及最小值将所述连续型训练特征切分成预设数量个子训练特征,统计每个所述子训练特征在所述训练特征中出现的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到的全部特征值及特征向量值连接起来,得到所述训练向量。
优选的,训练包括:
训练单元,用于:采用随机初始化的方法初始化所述深度学习模型中包含的连接权重参数,其中,所述深度学习模型中包含的隐藏层节点为非线性函数;依次将所述训练向量输入至所述深度学习模型中,并在将任一训练向量输入至所述深度学习模型后,得到对应的输出点击率,判断该输出点击率与输入的训练向量对应的训练点击率之间的误差是否大于第三预设值,如果是,则依据该误差利用反向传播算法更新所述连接权重参数,如果否,则确定当前的连接权重参数对应的深度学习模型为训练得到的深度学习模型。
本发明提供了一种基于深度学习的广告点击率预测方法及装置,其中,该方法包括:获取预设量的训练广告,以及每个所述训练广告对应的训练点击率及训练特征;将每个所述训练广告的训练特征转换成训练向量,利用所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,其中,所述深度学习模型为基于非线性函数实现的;获取由待测广告的待测特征转换成的待测向量,并将所述待测向量作为所述深度学习模型的输入,得到与所述待测广告对应的预测点击率。本申请公开的上述技术特征中,利用训练广告的训练点击率及训练特征训练得到深度学习模型,而深度学习模型为基于非线性函数实现的,即本申请中的深度学习模型充分考虑到训练特征之间的非线性关系,由此,将待测向量输入至深度学习模型后,深度学习模型基于非线性函数能够高效、准确的输出待测向量对应的预测点击率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种基于深度学习的广告点击率预测方法的流程图;
图2为本发明实施例提供的一种基于深度学习的广告点击率预测方法中深度学习模型的内部结构示意图;
图3为本发明实施例提供的一种基于深度学习的广告点击率预测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种基于深度学习的广告点击率预测方法的流程图,可以包括以下步骤:
S11:获取预设量的训练广告,以及每个训练广告对应的训练点击率及训练特征。
其中,预设量可以根据实际需要进行确定,训练广告实际为历史上投放的广告,训练点击率则为训练广告被点击的概率,而训练特征为与训练广告对应的特征,通常可以由广告、受众、网站的属性中提取,具体来说,由广告的属性中提取的特征可以包括广告类型、广告标题、广告的编号、广告内容简介等,由受众的属性中提取的特征可以包括性别、年龄、职业、地域等,由网站的属性中提取的特征可以包括网站的描述、网站内容、网站类别等,其中,网站即为对应训练广告被投放的网站,当然,也可以根据实际需要进行其他设置,均在本发明的保护范围之内。
S12:将每个训练广告的训练特征转换成训练向量,利用训练向量及每个训练广告的训练点击率训练深度学习模型,其中,深度学习模型为基于非线性函数实现的。
利用训练向量训练深度学习模型,而深度学习模型可以包括输入层、隐藏层和输出层,输入层对应于输入的特征向量,隐藏层用于对特征向量进行计算,输出层将计算得出的预测结果进行输出,其中,隐藏层即为利用非线性函数对输入的特征向量进行计算的层,由此,能够充分考虑到特征之间的非线性关系,已得到更准确的预测结果。
S13:获取由待测广告的待测特征转换成的待测向量,并将待测向量作为深度学习模型的输入,得到与待测广告对应的预测点击率。
需要说明的是,当有用户浏览某个网站的页面时,该页面对应的广告平台就会收到一个广告请求,此时,广告平台由巨大的广告库中获取一部分合适的广告,该部分广告均为待测广告,利用深度学习模型确定出每个待测广告的预测点击率,并将点击率最高的广告进行展示。
而待测特征可以为检索待测广告及其对应的受众、网站等提取得到的,具体对于由广告、受众及网站中提取的特征可以为如步骤S11中描述的特征,也可以根据实际需要进行确定,均在本发明的保护范围之内。
另外,深度学习模型针对待测向量输出的结果可以0到1之间的任一数值,包括0和1,而得到的概率即对应预测点击率,如输出的结果为0.5,则对应的预测点击率则为50%。
本申请公开的上述技术特征中,利用训练广告的训练点击率及训练特征训练得到深度学习模型,而深度学习模型为基于非线性函数实现的,即本申请中的深度学习模型充分考虑到特征之间的非线性关系,由此,将待测向量输入至深度学习模型后,深度学习模型基于非线性函数能够高效、准确的输出待测向量对应的预测点击率,进而指导待测广告的投放策略,优化广告主的投资回报率。
本发明实施例提供的一种基于深度学习的广告点击率预测方法中,获取每个训练广告的训练点击率,可以包括:
获取展示日志及点击日志,其中,展示日志记录有被展示过的训练广告,点击日志记录有被点击过的训练广告;
利用展示日志及点击日志确定每个训练广告对应的展示次数及点击次数,并确定每个训练广告的点击次数与展示次数的商为该训练广告的训练点击率。
其中,展示日志及点击日志即为记录历史上被投放的广告对应的展示次数及点击次数的日志,即通过统计展示日志中被展示过的任一训练广告的次数得到该训练广告的展示次数,通过统计点击日志中被点击过的任一训练广告的次数得到该训练广告的点击次数,由此,计算每个训练广告的点击次数与展示次数的商为该训练广告的训练点击率,以保证深度学习模型的顺利训练。
另外,获取展示日志及点击日志之后,还可以包括:
将展示日志及点击日志进行拼接;
将进行拼接后的展示日志及点击日志中的无效日志进行滤除,其中,无效日志包括残缺的日志及被点击后在对应广告页面上停留时间小于第一预设值的日志。其中,第一预设值可以由工作人员根据实际需要进行确定。
即,对展示日志及点击日志对应的投放数据进行清洗和净化,具体来说,将无效日志进行删除,无效日志包括残缺的日志及点击后再对应广告页面上停留时间小于第一预设值的日志,其中残缺的日志可以是当服务器出现故障时形成的并不完整的日志,而点击后再对应广告页面上停留时间小于第一预设值的日志可以为用户无意中点击一个广告后,由于该广告并不符合用户的需求,因此,用户可能会马上关闭该广告,此时,对应日志中记载的该用户在对应广告界面上停留的时间过短,即小于第一预设值,因此,认为该日志为无效日志,总之,只要是影响训练点击率的准确性的日志均可以视为无效日志,进而将其删除,从而能够保证通过展示日志及点击日志得到的训练点击率有效且准确。
本发明实施例提供的一种基于深度学习的广告点击率预测方法中,将每个训练广告的训练特征转换成训练向量,可以包括:
对于训练特征中的离散型训练特征,统计离散型训练特征在训练特征中出现的频次,作为该离散训练特征对应的特征值;对于训练特征中连续型训练特征,统计连续性训练特征在训练特征中对应的最大值及最小值,并依据最大值及最小值将连续型训练特征切分成预设数量个子训练特征,统计每个子训练特征在训练特征中出现的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到的全部特征值及特征向量值连接起来,得到训练向量。
其中,预设数量可以根据实际需要进行确定。需要说明的是,以上述步骤S11中由广告、受众、网站的属性中提取训练特征为例进行说明,此时,网站类别、用户性别及广告编号等特征属于离散型训练特征,而其它特征属于连续型训练特征。对于离散型训练特征,直接统计该特征在训练特征组成的数据集中出现的频次,作为其特征值;而对于连续型训练特征,首先统计该特征在训练特征组成的数据集中对应的最大值和最小值,并将最大值及最小值之间的区域均分成预设数量份,从而形成预设数量个子训练特征,分别统计每个子训练特征在训练特征组成的数据集中出现的频次,从而获得该连续型训练特征的特征向量值。由此,对训练特征进行向量化,进而训练深度学习模型。
另外,将得到的全部特征值及特征向量连接起来之前,还可以包括:
将特征值及特征向量值中对应的频次小于第二预设值的特征值或者特征向量值进行删除。
其中,第二预设值可以根据实际需要进行确定,由此,可以将频次较少的特征值或者特征向量进行删除,从而保证了得到的特征向量的有效性,进一步保证了利用特征向量训练的深度学习模型获取的待测广告的预测点击率的准确性。
本发明实施例提供的一种基于深度学习的广告点击率预测方法中,利用训练向量及每个训练广告的训练点击率训练深度学习模型,可以包括:
采用随机初始化的方法初始化深度学习模型中包含的连接权重参数,其中,深度学习模型中包含的隐藏层节点为非线性函数;
依次将训练向量输入至深度学习模型中,并在将任一训练向量输入至深度学习模型后,得到对应的输出点击率,判断该输出点击率与输入的训练向量对应的训练点击率之间的误差是否大于第三预设值,如果是,则依据该误差利用反向传播算法更新连接权重参数,如果否,则确定当前的连接权重参数对应的深度学习模型为训练得到的深度学习模型。
需要说明的是,深度学习模型是对传统的神经网络模型的扩展,通过增加隐藏层的层数,提高模型对数据的拟合能力,进一步自动学习输入的特征向量对应的特征之间的非线性关系。图2所示为一深度学习模型,其中含有输入层、隐藏层和输出层,每层的节点都和下一层节点形成全连接关系,在整个深层学习模型中,数据从输入层进入网络,经过中间的多个隐藏层计算之后,在输出层得到对应的输出值,该输出值即为针对输入的特征向量得到的概率值。由于需要用到深度学习模型的非线性特性,各个隐藏层节点上的激活函数需要是非线性函数,优选的,深度神经网络模型隐藏层节点激活函数均可以选择为Sigmoid函数,而Sigmoid函数是一个在生物学中常见的S型的函数,也称为S形生长曲线,在此不再赘述。
深度学习模型的训练过程采用随机梯度下降优化算法,即首先采用随机初始化的方法初始化深度学习模型中的连接权重参数,然后依次将训练向量输入至深度学习模型中,并且,每输入一个训练向量,得到对应的输出点击率,计算该输出点击率与输入的训练向量对应的训练点击率之间的误差,如果该误差大于第三预设值,则说明误差不符合要求,此时依据该误差利用反向传播算法更新连接权重参数,如果该误差不大于第三预设值,则停止训练,此时得到的深度学习模型则为训练得到的深度学习模型。另外,如果将训练向量均输入至深度学习模型后,输入至深度学习模型的最后一个训练向量对应的误差仍然大于第三预设值,则继续执行依次将训练向量输入至深度学习模型的步骤,即可以进行多轮迭代,直至得到的误差不大于第三预设值,符合要求为止。由此,得到的深度学习模型用于预测待测广告的点击率时准确性较高。另外,对于训练向量输入至深度学习模型后的输出请参见上述实施例中说明的将待测向量输入至深度学习模型后的输出,其原理一致,在此不再赘述。
与上述方法实施例相对应,本发明实施例还提供了一种基于深度学习的广告点击率预测装置,如图3所示,可以包括:
获取模块11,用于获取预设量的训练广告,以及每个训练广告对应的训练点击率及训练特征;
训练模块12,用于将每个训练广告的训练特征转换成训练向量,利用训练向量及每个训练广告的训练点击率训练深度学习模型,其中,深度学习模型为基于非线性函数实现的;
测试模块13,用于获取由待测广告的待测特征转换成的待测向量,并将待测向量作为深度学习模型的输入,得到与待测广告对应的预测点击率。
本申请公开的上述技术特征中,利用训练广告的训练点击率及训练特征训练得到深度学习模型,而深度学习模型为基于非线性函数实现的,即本申请中的深度学习模型充分考虑到特征之间的非线性关系,由此,将待测向量输入至深度学习模型后,深度学习模型基于非线性函数能够高效、准确的输出待测向量对应的预测点击率,进而指导待测广告的投放策略,优化广告主的投资回报率。
本发明实施例提供的一种基于深度学习的广告点击率预测装置中,获取模块可以包括:
获取单元,用于获取展示日志及点击日志,其中,展示日志记录有被展示过的训练广告,点击日志记录有被点击过的训练广告;
计算单元,用于利用展示日志及点击日志确定每个训练广告对应的展示次数及点击次数,并确定每个训练广告的点击次数与展示次数的商为该训练广告的训练点击率。
本发明实施例提供的一种基于深度学习的广告点击率预测装置中,获取单元可以包括:
拼接单元,用于将展示日志及点击日志进行拼接;
滤除单元,用于将进行拼接后的展示日志及点击日志中的无效日志进行滤除,其中,无效日志包括残缺的日志及被点击后在对应广告页面上停留时间小于第一预设值的日志。
本发明实施例提供的一种基于深度学习的广告点击率预测装置中,训练模块可以包括:
转换单元,用于:对于训练特征中的离散型训练特征,统计离散型训练特征在训练特征中出现的频次,作为该离散训练特征对应的特征值;对于训练特征中连续型训练特征,统计连续性训练特征在训练特征中对应的最大值及最小值,并依据最大值及最小值将连续型训练特征切分成预设数量个子训练特征,统计每个子训练特征在训练特征中出现的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到的全部特征值及特征向量值连接起来,得到训练向量。
本发明实施例提供的一种基于深度学习的广告点击率预测装置中,转换单元可以包括:
删除单元,用于将特征值及特征向量值中对应的频次小于第二预设值的特征值或者特征向量值进行删除。
本发明实施例提供的一种基于深度学习的广告点击率预测装置中,训练可以包括:
训练单元,用于:采用随机初始化的方法初始化深度学习模型中包含的连接权重参数,其中,深度学习模型中包含的隐藏层节点为非线性函数;依次将训练向量输入至深度学习模型中,并在将任一训练向量输入至深度学习模型后,得到对应的输出点击率,判断该输出点击率与输入的训练向量对应的训练点击率之间的误差是否大于第三预设值,如果是,则依据该误差利用反向传播算法更新连接权重参数,如果否,则确定当前的连接权重参数对应的深度学习模型为训练得到的深度学习模型。
本发明实施例提供的一种基于深度学习的广告点击率预测装置中相关部分的说明请参见本发明实施例提供的一种基于深度学习的广告点击率预测方法中对应部分的详细说明。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于深度学习的广告点击率预测方法,其特征在于,包括:
获取预设量的训练广告,以及每个所述训练广告对应的训练点击率及训练特征;
将每个所述训练广告的训练特征转换成训练向量,利用所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,其中,所述深度学习模型为基于非线性函数实现的;
获取由待测广告的待测特征转换成的待测向量,并将所述待测向量作为所述深度学习模型的输入,得到与所述待测广告对应的预测点击率。
2.根据权利要求1所述的方法,其特征在于,获取每个所述训练广告的训练点击率,包括:
获取展示日志及点击日志,其中,所述展示日志记录有被展示过的训练广告,所述点击日志记录有被点击过的训练广告;
利用所述展示日志及所述点击日志确定每个训练广告对应的展示次数及点击次数,并确定每个所述训练广告的点击次数与展示次数的商为该训练广告的训练点击率。
3.根据权利要求2所述的方法,其特征在于,获取展示日志及点击日志之后,还包括:
将所述展示日志及所述点击日志进行拼接;
将进行拼接后的所述展示日志及所述点击日志中的无效日志进行滤除,其中,所述无效日志包括残缺的日志及被点击后在对应广告页面上停留时间小于第一预设值的日志。
4.根据权利要求1所述的方法,其特征在于,将每个所述训练广告的训练特征转换成训练向量,包括:
对于所述训练特征中的离散型训练特征,统计所述离散型训练特征在所述训练特征中出现的频次,作为该离散训练特征对应的特征值;对于所述训练特征中连续型训练特征,统计所述连续性训练特征在所述训练特征中对应的最大值及最小值,并依据所述最大值及最小值将所述连续型训练特征切分成预设数量个子训练特征,统计每个所述子训练特征在所述训练特征中出现的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到的全部特征值及特征向量值连接起来,得到所述训练向量。
5.根据权利要求4所述的方法,其特征在于,将得到的全部特征值及特征向量连接起来之前,还包括:
将所述特征值及所述特征向量值中对应的频次小于第二预设值的特征值或者特征向量值进行删除。
6.根据权利要求1至5任一项所述的方法,其特征在于,利用所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,包括:
采用随机初始化的方法初始化所述深度学习模型中包含的连接权重参数,其中,所述深度学习模型中包含的隐藏层节点为非线性函数;
依次将所述训练向量输入至所述深度学习模型中,并在将任一训练向量输入至所述深度学习模型后,得到对应的输出点击率,判断该输出点击率与输入的训练向量对应的训练点击率之间的误差是否大于第三预设值,如果是,则依据该误差利用反向传播算法更新所述连接权重参数,如果否,则确定当前的连接权重参数对应的深度学习模型为训练得到的深度学习模型。
7.一种基于深度学习的广告点击率预测装置,其特征在于,包括:
获取模块,用于获取预设量的训练广告,以及每个所述训练广告对应的训练点击率及训练特征;
训练模块,用于将每个所述训练广告的训练特征转换成训练向量,利用所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,其中,所述深度学习模型为基于非线性函数实现的;
测试模块,用于获取由待测广告的待测特征转换成的待测向量,并将所述待测向量作为所述深度学习模型的输入,得到与所述待测广告对应的预测点击率。
8.根据权利要求7所述的装置,其特征在于,获取模块包括:
获取单元,用于获取展示日志及点击日志,其中,所述展示日志记录有被展示过的训练广告,所述点击日志记录有被点击过的训练广告;
计算单元,用于利用所述展示日志及所述点击日志确定每个训练广告对应的展示次数及点击次数,并确定每个所述训练广告的点击次数与展示次数的商为该训练广告的训练点击率。
9.根据权利要求7所述的装置,其特征在于,训练模块包括:
转换单元,用于:对于所述训练特征中的离散型训练特征,统计所述离散型训练特征在所述训练特征中出现的频次,作为该离散训练特征对应的特征值;对于所述训练特征中连续型训练特征,统计所述连续性训练特征在所述训练特征中对应的最大值及最小值,并依据所述最大值及最小值将所述连续型训练特征切分成预设数量个子训练特征,统计每个所述子训练特征在所述训练特征中出现的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到的全部特征值及特征向量值连接起来,得到所述训练向量。
10.根据权利要求7至9任一项所述的装置,其特征在于,训练包括:
训练单元,用于:采用随机初始化的方法初始化所述深度学习模型中包含的连接权重参数,其中,所述深度学习模型中包含的隐藏层节点为非线性函数;依次将所述训练向量输入至所述深度学习模型中,并在将任一训练向量输入至所述深度学习模型后,得到对应的输出点击率,判断该输出点击率与输入的训练向量对应的训练点击率之间的误差是否大于第三预设值,如果是,则依据该误差利用反向传播算法更新所述连接权重参数,如果否,则确定当前的连接权重参数对应的深度学习模型为训练得到的深度学习模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511022651.1A CN105654200A (zh) | 2015-12-30 | 2015-12-30 | 一种基于深度学习的广告点击率预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511022651.1A CN105654200A (zh) | 2015-12-30 | 2015-12-30 | 一种基于深度学习的广告点击率预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105654200A true CN105654200A (zh) | 2016-06-08 |
Family
ID=56490772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511022651.1A Pending CN105654200A (zh) | 2015-12-30 | 2015-12-30 | 一种基于深度学习的广告点击率预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105654200A (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106327251A (zh) * | 2016-08-22 | 2017-01-11 | 北京小米移动软件有限公司 | 模型训练系统和方法 |
CN106529721A (zh) * | 2016-11-08 | 2017-03-22 | 安徽大学 | 一种深度特征提取的广告点击率预测系统及其预测方法 |
CN106529996A (zh) * | 2016-10-24 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于深度学习的广告展示方法和装置 |
CN106600333A (zh) * | 2016-12-20 | 2017-04-26 | 北京平塔科技有限公司 | 一种虚拟现实中广告位内容曝光的监测方法及装置 |
CN107124320A (zh) * | 2017-06-30 | 2017-09-01 | 北京金山安全软件有限公司 | 流量数据的监控方法、装置及服务器 |
CN107341691A (zh) * | 2017-07-01 | 2017-11-10 | 郭庭 | 一种广告查看比率的估计方法及装置 |
CN107437111A (zh) * | 2017-07-31 | 2017-12-05 | 杭州朗和科技有限公司 | 基于神经网络的数据处理方法、介质、装置和计算设备 |
CN107818476A (zh) * | 2016-09-12 | 2018-03-20 | 东芝泰格有限公司 | 促销信息提供系统及促销信息提供方法、终端设备 |
CN108024205A (zh) * | 2017-10-27 | 2018-05-11 | 北京理工大学 | 基于深度学习的车联网移动广告传播方法 |
CN108520442A (zh) * | 2018-04-10 | 2018-09-11 | 电子科技大学 | 一种基于融合结构的展示广告点击率预测方法 |
CN108647691A (zh) * | 2018-03-12 | 2018-10-12 | 杭州电子科技大学 | 一种基于点击特征预测的图像分类方法 |
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN109615060A (zh) * | 2018-11-27 | 2019-04-12 | 深圳前海微众银行股份有限公司 | Ctr预估方法、装置及计算机可读存储介质 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
CN109801100A (zh) * | 2018-12-26 | 2019-05-24 | 北京达佳互联信息技术有限公司 | 广告投放方法、装置和计算机可读存储介质 |
CN109840782A (zh) * | 2017-11-24 | 2019-06-04 | 腾讯科技(深圳)有限公司 | 点击率预测方法、装置、服务器以及存储介质 |
CN109902849A (zh) * | 2018-06-20 | 2019-06-18 | 华为技术有限公司 | 用户行为预测方法及装置、行为预测模型训练方法及装置 |
CN109993559A (zh) * | 2017-12-29 | 2019-07-09 | 北京京东尚科信息技术有限公司 | 模型训练方法和系统 |
CN110020877A (zh) * | 2018-01-09 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 点击率的预测方法、点击率的确定方法及服务器 |
CN110046711A (zh) * | 2018-12-29 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种模型特征剔除方法及装置 |
CN110569461A (zh) * | 2018-05-18 | 2019-12-13 | 清华大学 | 网页点击量预测方法、装置、计算机设备及存储介质 |
CN110933499A (zh) * | 2018-09-19 | 2020-03-27 | 飞狐信息技术(天津)有限公司 | 一种视频点击率的预估方法及装置 |
CN113689234A (zh) * | 2021-08-04 | 2021-11-23 | 华东师范大学 | 一种基于深度学习的平台相关的广告点击率预测方法 |
CN113763000A (zh) * | 2020-08-20 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 对象点击量的确定方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663617A (zh) * | 2012-03-20 | 2012-09-12 | 亿赞普(北京)科技有限公司 | 一种广告的点击率预测方法及系统 |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
-
2015
- 2015-12-30 CN CN201511022651.1A patent/CN105654200A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663617A (zh) * | 2012-03-20 | 2012-09-12 | 亿赞普(北京)科技有限公司 | 一种广告的点击率预测方法及系统 |
CN103310003A (zh) * | 2013-06-28 | 2013-09-18 | 华东师范大学 | 一种基于点击日志的新广告点击率预测方法及系统 |
CN105160548A (zh) * | 2015-08-20 | 2015-12-16 | 北京奇虎科技有限公司 | 对广告点击率进行预测的方法及装置 |
Non-Patent Citations (1)
Title |
---|
王孝舒: "广告点击率预估的深层神经网络模型研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106327251A (zh) * | 2016-08-22 | 2017-01-11 | 北京小米移动软件有限公司 | 模型训练系统和方法 |
CN107818476A (zh) * | 2016-09-12 | 2018-03-20 | 东芝泰格有限公司 | 促销信息提供系统及促销信息提供方法、终端设备 |
CN106529996A (zh) * | 2016-10-24 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于深度学习的广告展示方法和装置 |
CN106529721A (zh) * | 2016-11-08 | 2017-03-22 | 安徽大学 | 一种深度特征提取的广告点击率预测系统及其预测方法 |
CN106600333A (zh) * | 2016-12-20 | 2017-04-26 | 北京平塔科技有限公司 | 一种虚拟现实中广告位内容曝光的监测方法及装置 |
CN107124320A (zh) * | 2017-06-30 | 2017-09-01 | 北京金山安全软件有限公司 | 流量数据的监控方法、装置及服务器 |
CN107341691A (zh) * | 2017-07-01 | 2017-11-10 | 郭庭 | 一种广告查看比率的估计方法及装置 |
CN107437111B (zh) * | 2017-07-31 | 2020-07-14 | 杭州朗和科技有限公司 | 基于神经网络的数据处理方法、介质、装置和计算设备 |
CN107437111A (zh) * | 2017-07-31 | 2017-12-05 | 杭州朗和科技有限公司 | 基于神经网络的数据处理方法、介质、装置和计算设备 |
CN108024205A (zh) * | 2017-10-27 | 2018-05-11 | 北京理工大学 | 基于深度学习的车联网移动广告传播方法 |
CN108024205B (zh) * | 2017-10-27 | 2020-07-24 | 北京理工大学 | 基于深度学习的车联网移动广告传播方法 |
CN109840782A (zh) * | 2017-11-24 | 2019-06-04 | 腾讯科技(深圳)有限公司 | 点击率预测方法、装置、服务器以及存储介质 |
CN109993559A (zh) * | 2017-12-29 | 2019-07-09 | 北京京东尚科信息技术有限公司 | 模型训练方法和系统 |
CN110020877B (zh) * | 2018-01-09 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 点击率的预测方法、点击率的确定方法及服务器 |
CN110020877A (zh) * | 2018-01-09 | 2019-07-16 | 腾讯科技(深圳)有限公司 | 点击率的预测方法、点击率的确定方法及服务器 |
CN108647691A (zh) * | 2018-03-12 | 2018-10-12 | 杭州电子科技大学 | 一种基于点击特征预测的图像分类方法 |
CN108520442A (zh) * | 2018-04-10 | 2018-09-11 | 电子科技大学 | 一种基于融合结构的展示广告点击率预测方法 |
CN110569461A (zh) * | 2018-05-18 | 2019-12-13 | 清华大学 | 网页点击量预测方法、装置、计算机设备及存储介质 |
CN109902849A (zh) * | 2018-06-20 | 2019-06-18 | 华为技术有限公司 | 用户行为预测方法及装置、行为预测模型训练方法及装置 |
US11531867B2 (en) | 2018-06-20 | 2022-12-20 | Huawei Technologies Co., Ltd. | User behavior prediction method and apparatus, and behavior prediction model training method and apparatus |
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN108875916B (zh) * | 2018-06-27 | 2021-07-16 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN110933499B (zh) * | 2018-09-19 | 2021-12-24 | 飞狐信息技术(天津)有限公司 | 一种视频点击率的预估方法及装置 |
CN110933499A (zh) * | 2018-09-19 | 2020-03-27 | 飞狐信息技术(天津)有限公司 | 一种视频点击率的预估方法及装置 |
CN109615060A (zh) * | 2018-11-27 | 2019-04-12 | 深圳前海微众银行股份有限公司 | Ctr预估方法、装置及计算机可读存储介质 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
CN109801100A (zh) * | 2018-12-26 | 2019-05-24 | 北京达佳互联信息技术有限公司 | 广告投放方法、装置和计算机可读存储介质 |
CN110046711A (zh) * | 2018-12-29 | 2019-07-23 | 阿里巴巴集团控股有限公司 | 一种模型特征剔除方法及装置 |
CN110046711B (zh) * | 2018-12-29 | 2023-08-04 | 创新先进技术有限公司 | 一种模型特征剔除方法及装置 |
CN113763000A (zh) * | 2020-08-20 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 对象点击量的确定方法及装置 |
CN113689234A (zh) * | 2021-08-04 | 2021-11-23 | 华东师范大学 | 一种基于深度学习的平台相关的广告点击率预测方法 |
CN113689234B (zh) * | 2021-08-04 | 2024-03-15 | 华东师范大学 | 一种基于深度学习的平台相关的广告点击率预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105654200A (zh) | 一种基于深度学习的广告点击率预测方法及装置 | |
CN103064945B (zh) | 基于本体的情境搜索方法 | |
CN104424291B (zh) | 一种对搜索结果进行排序的方法及装置 | |
CN103886487B (zh) | 基于分布式的b2b平台的个性化推荐方法与系统 | |
CN104899273B (zh) | 一种基于话题和相对熵的网页个性化推荐方法 | |
CN110196946A (zh) | 一种基于深度学习的个性化推荐方法 | |
CN104102648A (zh) | 基于用户行为数据的兴趣推荐方法及装置 | |
CN106803190A (zh) | 一种广告个性化推送系统及方法 | |
CN102254038B (zh) | 一种分析网络评论相关度的系统及其分析方法 | |
CN106355442A (zh) | 基于大数据驱动的在线广告精准投放方法和系统 | |
CN107506402A (zh) | 搜索结果的排序方法、装置、设备及计算机可读存储介质 | |
CN104615767A (zh) | 搜索排序模型的训练方法、搜索处理方法及装置 | |
CN106649282A (zh) | 基于统计的机器翻译方法、装置及电子设备 | |
CN101216825A (zh) | 标引关键词提取/预测方法、在线广告推荐方法和装置 | |
CN107203518A (zh) | 在线系统个性化推荐的方法、系统以及装置、电子设备 | |
CN106933996A (zh) | 一种采用深度特征匹配的推荐方法 | |
CN105302810A (zh) | 一种信息搜索方法和装置 | |
CN105243149B (zh) | 一种基于语义的查询推荐方法和系统 | |
CN103324666A (zh) | 一种基于微博数据的话题跟踪方法及装置 | |
CN112287238B (zh) | 用户特征的确定方法和装置、存储介质及电子设备 | |
CN104866557A (zh) | 一种基于建构学习理论的个性化即时学习支持系统与方法 | |
CN102637179B (zh) | 词项加权函数确定及基于该函数进行搜索的方法及装置 | |
CN110134845A (zh) | 项目舆情监控方法、装置、计算机设备及存储介质 | |
CN110188268A (zh) | 一种基于标签和时间信息的个性化推荐方法 | |
CN106503907A (zh) | 一种业务评估信息确定方法以及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160608 |