CN111325579A - 一种广告点击率预测方法 - Google Patents
一种广告点击率预测方法 Download PDFInfo
- Publication number
- CN111325579A CN111325579A CN202010117174.1A CN202010117174A CN111325579A CN 111325579 A CN111325579 A CN 111325579A CN 202010117174 A CN202010117174 A CN 202010117174A CN 111325579 A CN111325579 A CN 111325579A
- Authority
- CN
- China
- Prior art keywords
- data
- advertisement click
- rate prediction
- layer
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000003993 interaction Effects 0.000 claims abstract description 50
- 238000012360 testing method Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 18
- 230000007246 mechanism Effects 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 239000013598 vector Substances 0.000 claims description 44
- 238000011176 pooling Methods 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 abstract description 11
- 230000006870 function Effects 0.000 description 30
- 230000002452 interceptive effect Effects 0.000 description 17
- 230000000694 effects Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种广告点击率预测方法,包括以下步骤:获取原始实例数据;对原始实例数据进行预处理;构建基于卷积神经网络和注意力机制的广告点击率预测网络模型;对广告点击率预测网络模型进行训练;对广告点击率预测网络模型进行测试。通过利用卷积神经网络的提取局部特征交互的能力和非线性能力,解决数据过于稀疏的问题;此外,通过在浅层交互特征的基础上进一步利用卷积神经网络进行特征的交互产生3阶或3阶以上的高阶特征,解决了现有广告点击率预测方法仅仅局限于内积计算和外积计算这样的低阶特征的交互;同时,通过引入注意力机制,在生成高阶特征的基础上进一步提取有用特征,降低无用特征对网络的影响。
Description
技术领域
本发明涉及互联网计算广告技术领域,特别涉及一种广告点击率预测方法。
背景技术
随着互联网的广泛普及以及大数据技术的快速发展,使得广告商利用互联网平台进行广告精准营销成为可能。与传统广告相比,在线广告在覆盖范围、灵活性和效果评估等方面拥有得天独厚的优势。在线广告的主要目标之一是在给定预算的情况下,最大化广告商的收益,例如最大化广告的点击次数。因此,在线广告的一个重要环节是对将广告投放到一个曝光机会的用户点击概率进行预测,应尽可能将广告投放到预测点击率高的曝光机会。
现有很多广告点击率预测方法是通过将线性模型和深度学习模型进行融合,来实现预测功能,但是,这些方法存在以下缺陷:(1)这些方法都是以隐式方式学习高阶特征交互,因此缺乏良好的模型可解释性;(2)对于浅层交叉部分也并未做进一步的交叉去学习更丰富的高阶信息,仅仅局限于内积计算和外积计算这样的低阶特征的交互;(3)这些方法都是将原始特征降维的特征向量直接输送到深度神经网络,从理论上讲,深度神经网络能够从原始特征中学习任意特征交互,然而,与原始特征的组合空间相比,有用的相互作用通常是稀疏的,原始特征本就高维和稀疏,高阶的有效交互特征更为稀疏导致直接从大量参数中有效地学习是非常困难的。
发明内容
有鉴于此,本发明提出一种广告点击率预测方法,能够解决现有广告点击率预测方法所存在的更高阶重要交互特征和隐含交互特征生成难、仅仅计算低阶特征的交互,以及数据过于稀疏的技术问题。
本发明的技术方案是这样实现的:
一种广告点击率预测方法,所述方法基于卷积神经网络和注意力机制,具体包括以下步骤:
步骤S1,获取原始实例数据;
步骤S2,对所述原始实例数据进行预处理,生成训练数据和测试数据;
步骤S3,构建基于卷积神经网络和注意力机制的广告点击率预测网络模型,所述广告点击率预测网络模型输入为所述训练数据和测试数据,所述广告点击率预测网络模型输出为广告点击预测概率;
步骤S4,输入所述训练数据对所述广告点击率预测网络模型进行训练;
步骤S5,输入所述测试数据对所述广告点击率预测网络模型进行测试。
作为所述广告点击率预测方法的进一步可选方案,所述原始实例数据包括类别型特征数据和数字型特征数据。
作为所述广告点击率预测方法的进一步可选方案,所述步骤S2中的对所述原始实例数据进行预处理预处理包括以下步骤:
步骤S21,对所述原始实例数据进行缺失补全处理;
步骤S22,对缺失补全处理后的原始实例数据进行排序处理。
作为所述广告点击率预测方法的进一步可选方案,所述步骤S21中的对所述原始实例数据进行缺失补全处理包括以下步骤:
步骤S211,将缺失的类别型特征数据当做一类数据补全并重新编码后生成one-hot向量;
步骤S212,将缺失的数字型特征数据的缺失值用0填充,再归一化到0 到1之间。
作为所述广告点击率预测方法的进一步可选方案,所述步骤S3中的广告点击率预测网络模型包括嵌入层、低阶交互层、卷积-池化层、注意力层、拼接层、全连接层和输出层。
作为所述广告点击率预测方法的进一步可选方案,所述注意力层采用 SENET结构,包括Squeeze函数、Excitaion函数和Reweight函数。
作为所述广告点击率预测方法的进一步可选方案,所述全连接层包括3 层全连接网络。
作为所述广告点击率预测方法的进一步可选方案,所述步骤S5中对所述广告点击率预测网络模型进行测试,所述测试采用交叉熵损失函数和ROC曲线下与坐标轴围成的面积进行评价。
本发明的有益效果是:本发明通过利用卷积神经网络的提取局部特征交互的能力和非线性能力,有效的降低了特征工程的难度,解决数据过于稀疏的问题;此外,本发明通过在浅层交互特征的基础上进一步利用卷积神经网络进行特征的交互产生3阶或3阶以上的高阶特征,解决了现有广告点击率预测方法仅仅局限于内积计算和外积计算这样的低阶特征的交互;同时,通过引入注意力机制,在生成高阶特征的基础上进一步提取有用特征,降低无用特征对网络的影响,为全连接网络提供有用特征,降低更高阶重要交互特征和隐含交互特征生成的难度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种广告点击率预测方法的流程图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
参照图1,一种广告点击率预测方法,所述方法基于卷积神经网络和注意力机制,具体包括以下步骤:
步骤S1,获取原始实例数据;
步骤S2,对所述原始实例数据进行预处理,生成训练数据和测试数据;
步骤S3,构建基于卷积神经网络和注意力机制的广告点击率预测网络模型,所述广告点击率预测网络模型输入为所述训练数据和测试数据,所述广告点击率预测网络模型输出为广告点击预测概率;
步骤S4,输入所述训练数据对所述广告点击率预测网络模型进行训练;
步骤S5,输入所述测试数据对所述广告点击率预测网络模型进行测试。
在本实施例中,本发明通过利用卷积神经网络的提取局部特征交互的能力和非线性能力,有效的降低了特征工程的难度,解决数据过于稀疏的问题;此外,本发明通过在浅层交互特征的基础上进一步利用卷积神经网络进行特征的交互产生3阶或3阶以上的高阶特征,解决了现有广告点击率预测方法仅仅局限于内积计算和外积计算这样的低阶特征的交互;同时,通过引入注意力机制,在生成高阶特征的基础上进一步提取有用特征,降低无用特征对网络的影响,为全连接网络提供有用特征,降低更高阶重要交互特征和隐含交互特征生成的难度;
需要说明的是,本发明获取原始实例数据可以通过在avazu和criteo广告数据集中获取,所述avazu和criteo广告数据集为在kaggle的比赛平台公布出的公有的数据集;此外,构建基于卷积神经网络和注意力机制的广告点击率预测网络模型可以通过采用keras框架包基于tensorflow深度学习力学响应预测网络来实现构建。
优选的,所述原始实例数据包括类别型特征数据和数字型特征数据。
优选的,所述步骤S2中的对所述原始实例数据进行预处理预处理包括以下步骤:
步骤S21,对所述原始实例数据进行缺失补全处理;
步骤S22,对缺失补全处理后的原始实例数据进行排序处理。
在本实施例中,通过对原始实例数据进行缺失补全处理,使得数据能够成为可以输入到神经网络训练的特征向量,然后再对缺失补全处理后的原始实例数据按照数据的时间戳进行排序处理,目的是为了生成训练数据和测试数据,将排在时间戳前70%的数据作为训练数据,排在时间戳后30%的数据作为测试数据,使得模拟的环境更加真实。
优选的,所述步骤S21中的对所述原始实例数据进行缺失补全处理包括以下步骤:
步骤S211,将缺失的类别型特征数据当做一类数据补全并重新编码后生成one-hot向量;
步骤S212,将缺失的数字型特征数据的缺失值用0填充,再归一化到0 到1之间。
在本实施例中,首先对于类别特征,将缺失的值当成同一类别,之后用 one-hot编码转换成one-hot变量,同一特征不同的数字表示不同的类别,然后对于数字特征,将缺失的值补0后归一化到0和1之间,最后将处理后的类别型特征和数字型特征拼接起来得到可输入到卷积神经网络的特征向量。
优选的,所述步骤S3中的广告点击率预测网络模型包括嵌入层、低阶交互层、卷积-池化层、注意力层、拼接层、全连接层和输出层。
在本实施例中,所述嵌入层用于将类别型特征和数字型特征都映射成相同维度的一维向量,一方面可以将高维的类别类型数据映射成低维向量,解决类别特征经过one-hot编码带来的维度过大问题,另一方面可以方便特征之间的交互形成高阶交互特征;
所述低阶交互层用于将两个嵌入特征的外积以细粒度的方式进行2阶交互生成2维的特征向量,嵌入特征向量两两外积操作后拼接生成一个三维特征向量;
所述卷积-池化层用于对低阶交互层输出的三维向量当做特征图应用卷积核进一步提取高维交互特征,输出一个三维向量;
所述注意力层用于基于卷积-池化层的输出应用注意力机制挑选出重要的交互特征,避免不重要的交互特征干扰模型的训练和影响模型的精度;
所述拼接层用于将嵌入层、低阶交互层和注意力层的输出向量各自变换成一维向量,再将各个一维向量拼接在一起形成一个一维向量;
所述全连接层用于提取高阶交互特征和人工无法发现的隐含特征;
所述输出层用于输出表示用户点击广告的概率,概率越大表示用户越有可能点击该广告。
优选的,所述注意力层采用SENET结构,包括Squeeze函数、Excitaion 函数和Reweight函数。
在本实施例中,Squeeze函数利用全局平均池化操作将池化层输出的特征图压缩成一维向量,Excitaion函数通过连接参数为每个特征通道生成权重,该参数显式地学习对特征通道之间的相关性建模,Reweight函数通过将池化层的输出与Excitaion重建模后的输出按照通道相乘重标定交互特征向量;通过Squeeze函数、Excitaion函数和Reweight函数的作用,能够为全连接层网络预先挑选有用的交互特征,减轻全连接网络的学习负担。
优选的,所述全连接层包括3层全连接网络。
优选的,所述步骤S5中对所述广告点击率预测网络模型进行测试,所述测试采用交叉熵损失函数和ROC曲线下与坐标轴围成的面积进行评价。
在本实施例中,通过采用交叉熵损失函数作为测试评价因子之一,其值介于0到1之间且值越小表明预测的效果越好,通过采用ROC曲线下与坐标轴围成的面积作为另一个测试评价因子,其值也介于0到1之间且值越大表明预测的效果越好。
实施例:
一种广告点击率预测方法,所述方法基于卷积神经网络和注意力机制,包含4个阶段,分别为第一阶段、第二阶段、第三阶段和第四阶段,第一阶段为数据的获取和数据特征特征向量的生成,选取合适的数据和合适的预处理有利于模型的验证和改进,为模型的输入做好准备;第二阶段为基于卷积神经网络和注意力机制的模型的构建;第三阶段为模型的训练,训练的目标是使得用户对感兴趣的广告的预测概率值大,使用户对不感兴趣的广告的预测概率小;第四阶段为模型的测试,对模型进行验证;依次经过4个阶段得到一个具有鲁棒性的模型,用以判断用户对某个广告的感兴趣程度。
第一阶段包括原始数据的获取和数据预处理;原始数据为计算广告场景中历史上投放给用户的广告,用户点击过的实例为正样本,其标签设置为1,用户未点击过的实例为负样本,其标签设置为0;
数据的预处理将原始数据处理成可以输入到神经网络训练的特征向量;原始数据的特征可分为类别型特征和数字型特征,对于类别特征,将缺失的值当成同一类别,之后用one-hot编码转换成one-hot变量,同一特征不同的数字表示不同的类别,对于数字特征,将缺失的值补0后归一化到0和1之间,将处理后的类别型特征和数字型特征拼接起来得到可输入到网络的特征向量,将数据按照时间排序,前70%的数据用作模型的训练,后30%的数据用作模型的测试。
第二阶段为基于卷积神经网络和注意力机制的广告点击率预测模型的构建;模型包括嵌入层、低阶交互层、卷积-池化层、注意力层、拼接层、全连接层和输出层;特征之间的交互非常重要,不同性别对不同类别的广告的感兴趣程度不一样,例如女性一般来说会对化妆品更加感兴趣,而男性会对体育更加感兴趣,不同的职业对不同的领域感兴趣程度也不同,例如计算机领域的人会对科技类的广告会更加感兴趣等等;模型的作用在于代替手工生成交互特征并且也能生成人工无法提取的隐含特征;本模型采用keras框架基于tensorflow后端进行构建,详细实施过程如下:
(1)嵌入层:嵌入层的作用是将不同维度的特征映射成相同的维度,一方面防止直接输入高维稀疏的数据带来的冗余,另一方面方便不同维度特征之间进行交互;类别特征和数字特征的处理方法不同,对于类别特征,第i个类别特征对应的嵌入向量ei进行的运算如下:
ei=Wixi,
其中,xi为one-hot向量表示第i个类别特征;Wi为第i个类别特征的嵌入矩阵;对于数字特征,词嵌入向量ej进行的运算如下:
ej=vjxj,
其中,xj为第j个数字特征;vj为第j个数字型特征对应的嵌入向量。嵌入层的输出可表示为:
e=[e1;e2;e3;...;en],
其中,n表示类别型特征和数字型特征的总和,数据经过嵌入层可产生n个嵌入特征向量。
(2)低阶交互层:将嵌入层的输出向量进行两两外积操作,以细粒度的方式进行特征间的交互,两个特征向量的的外积运算如下:
其中,f表示嵌入向量长度;ei表示第i个特征的嵌入向量;ej表示第j个特征的嵌入向量;oij表示第i个特征的嵌入向量与第j个特征的嵌入向量的外积产生的2阶浅层交互特征向量,oij的维度为f×f,低阶交互层的输出可表示为:
o=[o1,2;o1,3;o1,4;...;o(n-l),n],
(3)卷积-池化层:在低阶交互生成的特征图上进一步提取高阶交互特征,第i个卷积核对应的运算如下式所示:
s=[s1;s2;...;sl],
其中,l表示卷积核个数。
池化层采取最大池化操作,初步筛选提取出的特征,采用最大池化层来初步筛选有用特征,避免特征冗余造成过拟合,池化操作后输出如下式所示:
c=[c1;c2;c3;...;cl]
(4)注意力层:由于数据是高维且稀疏的,有用的交互特征则更为稀疏,注意力层作用在于提取有用特征,给有用特征设置大的系数,给无用特征设置小的系数,进一步防止过拟合;注意力层也为全连接层网络预先挑选有用的交互特征,减轻全连接网络的学习负担。
注意力层采用SENET结构,在卷积-池化层后利用Squeeze、Excitaion、 Reweight操作进行交互特征的重标定;Squeeze利用全局平均池化操作将池化层输出的特征图压缩成一维向量,Excitaion通过连接参数为每个特征通道生成权重,该参数显式地学习对特征通道之间的相关性建模,Reweight通过将池化层的输出与Excitaion重建模后的输出按照通道相乘重标定交互特征向量,计算公式分别如下所示,Squeeze的计算如下所示:
其中,t表示池化层生成的特征图的第t个通道;i表示第t个通道的行下标; j表示第t个通道的列下标;Squeeze操作后的输出如下所示:
q=[q1;q2;q3;...;ql],
其中,l为通道数量。Excitaion的计算如下所示
E=f(W2f(W1q+b1)+b2),
其中,f表示使用的激活函数为线性整流函数;W1为第一层连接网络的权重;b1为第一层连接网络的偏置;W2为第二层连接网络的权重;b2为第二层连接网络的偏置;Reweight操作计算如下所示:
(5)拼接层:将嵌入层、低阶交互层和注意力层的输出向量各自变换成一维向量,再将各个一维向量拼接在一起形成一个一维向量,输出如下式所示:
c=[e;o;F]
(6)全连接层:全连接层由3层全连接网络构成,使用的激活函数为线性整流函数(ReLU:Rectified Linear Unit);全连接层一方面可以提取高阶交互特征,另一方面可以提取人工无法发现的隐含特征。
(7)输出层:输出层的概率输出由浅层交互层生成的2阶交互特征、注意力层生成的高阶交互特征和全连接层生成的高阶交互特征决定,尽可能全面地提取有用交互特征,增加模型的鲁棒性。输出层的激活函数为sigmoid函数,输出一个0到1之间的小数,输出表示用户点击广告的概率,概率越大表示用户越有可能点击该广告。
第三阶段为模型的训练。数据按时间排序后的前70%的数据选为训练数据。正样本的标签为1,负样本的标签为0;采用小批量梯度下降法更新网络参数,每批数据量设置为4096,损失函数采用交叉熵,优化函数采用adagrad,学习率为0.01;考虑到数据量比较大,训练轮次设置为1轮,有效地避免了过拟合,模型通过前向传播算法和后向传播算法按批次更新网络参数。
第四阶段为模型的测试;为模拟真实环境,数据按时间排序后的后30%的数据选为测试数据;模型测试选用logloss和auc作为评价指标,logloss即为交叉熵损失函数,其值介于0到1之间且值越小表明预测的效果越好,auc 为ROC曲线下与坐标轴围成的面积,常用于点击率预估领域,其值也介于0 到1之间且值越大表明预测的效果越好。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种广告点击率预测方法,其特征在于,所述方法基于卷积神经网络和注意力机制,包括以下步骤:
步骤S1,获取原始实例数据;
步骤S2,对所述原始实例数据进行预处理,生成训练数据和测试数据;
步骤S3,构建基于卷积神经网络和注意力机制的广告点击率预测网络模型,所述广告点击率预测网络模型输入为所述训练数据和测试数据,所述广告点击率预测网络模型输出为广告点击预测概率;
步骤S4,输入所述训练数据对所述广告点击率预测网络模型进行训练;
步骤S5,输入所述测试数据对所述广告点击率预测网络模型进行测试。
2.根据权利要求1所述的广告点击率预测方法,其特征在于,所述原始实例数据包括类别型特征数据和数字型特征数据。
3.根据权利要求2所述的广告点击率预测方法,其特征在于,所述步骤S2中的对所述原始实例数据进行预处理预处理包括以下步骤:
步骤S21,对所述原始实例数据进行缺失补全处理;
步骤S22,对缺失补全处理后的原始实例数据进行排序处理。
4.根据权利要求3所述的广告点击率预测方法,其特征在于,所述步骤S21中的对所述原始实例数据进行缺失补全处理包括以下步骤:
步骤S211,将缺失的类别型特征数据当做一类数据补全并重新编码后生成one-hot向量;
步骤S212,将缺失的数字型特征数据的缺失值用0填充,再归一化到0到1之间。
5.根据权利要求4所述的广告点击率预测方法,其特征在于,所述步骤S3中的广告点击率预测网络模型包括嵌入层、低阶交互层、卷积-池化层、注意力层、拼接层、全连接层和输出层。
6.根据权利要求5所述的广告点击率预测方法,其特征在于,所述注意力层采用SENET结构,包括Squeeze函数、Excitaion函数和Reweight函数。
7.根据权利要求6所述的广告点击率预测方法,其特征在于,所述全连接层包括3层全连接网络。
8.根据权利要求7所述的广告点击率预测方法,其特征在于,所述步骤S5中对所述广告点击率预测网络模型进行测试,所述测试采用交叉熵损失函数和ROC曲线下与坐标轴围成的面积进行评价。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010117174.1A CN111325579A (zh) | 2020-02-25 | 2020-02-25 | 一种广告点击率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010117174.1A CN111325579A (zh) | 2020-02-25 | 2020-02-25 | 一种广告点击率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111325579A true CN111325579A (zh) | 2020-06-23 |
Family
ID=71172999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010117174.1A Pending CN111325579A (zh) | 2020-02-25 | 2020-02-25 | 一种广告点击率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325579A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111784062A (zh) * | 2020-07-07 | 2020-10-16 | 上海携旅信息技术有限公司 | 点击概率预测方法、系统、电子设备和介质 |
CN111861583A (zh) * | 2020-07-31 | 2020-10-30 | 成都新潮传媒集团有限公司 | 一种广告点击率的预测方法、装置及计算机可读存储介质 |
CN111967675A (zh) * | 2020-08-19 | 2020-11-20 | 京东方科技集团股份有限公司 | 光伏发电量的预测方法以及预测装置 |
CN112182379A (zh) * | 2020-09-28 | 2021-01-05 | 上海宏路数据技术股份有限公司 | 数据处理方法、电子设备及介质 |
CN112288471A (zh) * | 2020-10-26 | 2021-01-29 | 杭州电子科技大学 | 一种基于用户历史行为序列的广告点击率预测方法 |
CN112328844A (zh) * | 2020-11-18 | 2021-02-05 | 恩亿科(北京)数据科技有限公司 | 一种处理多类型数据的方法及系统 |
CN112365297A (zh) * | 2020-12-04 | 2021-02-12 | 东华理工大学 | 一种广告点击率预估方法 |
CN112381581A (zh) * | 2020-11-17 | 2021-02-19 | 东华理工大学 | 一种基于改进Transformer的广告点击率预估方法 |
CN112561599A (zh) * | 2020-12-24 | 2021-03-26 | 天津理工大学 | 一种融合域特征交互的基于注意力网络学习的点击率预测方法 |
CN113409090A (zh) * | 2021-07-05 | 2021-09-17 | 中国工商银行股份有限公司 | 广告点击率预测模型的训练方法、预测方法及装置 |
CN113706211A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于神经网络的广告点击率预测方法及系统 |
CN113793175A (zh) * | 2021-09-07 | 2021-12-14 | 广东工业大学 | 基于双线性ffm和多头注意力机制的广告点击率预估方法 |
CN113887694A (zh) * | 2020-07-01 | 2022-01-04 | 复旦大学 | 一种注意力机制下基于特征表征的点击率预估模型 |
WO2022011553A1 (en) * | 2020-07-14 | 2022-01-20 | Alibaba Group Holding Limited | Feature interaction via edge search |
CN114155016A (zh) * | 2021-10-26 | 2022-03-08 | 度小满科技(北京)有限公司 | 一种点击率预估方法、装置、设备及可读存储介质 |
CN114493674A (zh) * | 2021-12-30 | 2022-05-13 | 天翼云科技有限公司 | 一种广告点击率预测模型及方法 |
CN115271272A (zh) * | 2022-09-29 | 2022-11-01 | 华东交通大学 | 多阶特征优化与混合型知识蒸馏的点击率预测方法与系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869016A (zh) * | 2016-03-28 | 2016-08-17 | 天津中科智能识别产业技术研究院有限公司 | 一种基于卷积神经网络的点击通过率预估方法 |
CN108520442A (zh) * | 2018-04-10 | 2018-09-11 | 电子科技大学 | 一种基于融合结构的展示广告点击率预测方法 |
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN109191191A (zh) * | 2018-08-20 | 2019-01-11 | 南京工业大学 | 基于代价敏感卷积神经网络的广告点击欺诈检测方法 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
-
2020
- 2020-02-25 CN CN202010117174.1A patent/CN111325579A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869016A (zh) * | 2016-03-28 | 2016-08-17 | 天津中科智能识别产业技术研究院有限公司 | 一种基于卷积神经网络的点击通过率预估方法 |
CN108520442A (zh) * | 2018-04-10 | 2018-09-11 | 电子科技大学 | 一种基于融合结构的展示广告点击率预测方法 |
CN108875916A (zh) * | 2018-06-27 | 2018-11-23 | 北京工业大学 | 一种基于gru神经网络的广告点击率预测方法 |
CN109191191A (zh) * | 2018-08-20 | 2019-01-11 | 南京工业大学 | 基于代价敏感卷积神经网络的广告点击欺诈检测方法 |
CN109711883A (zh) * | 2018-12-26 | 2019-05-03 | 西安电子科技大学 | 基于U-Net网络的互联网广告点击率预估方法 |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887694A (zh) * | 2020-07-01 | 2022-01-04 | 复旦大学 | 一种注意力机制下基于特征表征的点击率预估模型 |
CN111784062A (zh) * | 2020-07-07 | 2020-10-16 | 上海携旅信息技术有限公司 | 点击概率预测方法、系统、电子设备和介质 |
CN115699058A (zh) * | 2020-07-14 | 2023-02-03 | 阿里巴巴集团控股有限公司 | 通过边缘搜索的特征交互 |
WO2022011553A1 (en) * | 2020-07-14 | 2022-01-20 | Alibaba Group Holding Limited | Feature interaction via edge search |
CN111861583B (zh) * | 2020-07-31 | 2022-10-21 | 成都新潮传媒集团有限公司 | 一种广告点击率的预测方法、装置及计算机可读存储介质 |
CN111861583A (zh) * | 2020-07-31 | 2020-10-30 | 成都新潮传媒集团有限公司 | 一种广告点击率的预测方法、装置及计算机可读存储介质 |
CN111967675A (zh) * | 2020-08-19 | 2020-11-20 | 京东方科技集团股份有限公司 | 光伏发电量的预测方法以及预测装置 |
CN112182379A (zh) * | 2020-09-28 | 2021-01-05 | 上海宏路数据技术股份有限公司 | 数据处理方法、电子设备及介质 |
CN112288471A (zh) * | 2020-10-26 | 2021-01-29 | 杭州电子科技大学 | 一种基于用户历史行为序列的广告点击率预测方法 |
CN112381581B (zh) * | 2020-11-17 | 2022-07-08 | 东华理工大学 | 一种基于改进Transformer的广告点击率预估方法 |
CN112381581A (zh) * | 2020-11-17 | 2021-02-19 | 东华理工大学 | 一种基于改进Transformer的广告点击率预估方法 |
CN112328844A (zh) * | 2020-11-18 | 2021-02-05 | 恩亿科(北京)数据科技有限公司 | 一种处理多类型数据的方法及系统 |
CN112365297B (zh) * | 2020-12-04 | 2022-06-28 | 东华理工大学 | 一种广告点击率预估方法 |
CN112365297A (zh) * | 2020-12-04 | 2021-02-12 | 东华理工大学 | 一种广告点击率预估方法 |
CN112561599A (zh) * | 2020-12-24 | 2021-03-26 | 天津理工大学 | 一种融合域特征交互的基于注意力网络学习的点击率预测方法 |
CN113409090A (zh) * | 2021-07-05 | 2021-09-17 | 中国工商银行股份有限公司 | 广告点击率预测模型的训练方法、预测方法及装置 |
CN113409090B (zh) * | 2021-07-05 | 2024-07-05 | 中国工商银行股份有限公司 | 广告点击率预测模型的训练方法、预测方法及装置 |
CN113706211A (zh) * | 2021-08-31 | 2021-11-26 | 平安科技(深圳)有限公司 | 基于神经网络的广告点击率预测方法及系统 |
CN113706211B (zh) * | 2021-08-31 | 2024-04-02 | 平安科技(深圳)有限公司 | 基于神经网络的广告点击率预测方法及系统 |
CN113793175A (zh) * | 2021-09-07 | 2021-12-14 | 广东工业大学 | 基于双线性ffm和多头注意力机制的广告点击率预估方法 |
CN114155016A (zh) * | 2021-10-26 | 2022-03-08 | 度小满科技(北京)有限公司 | 一种点击率预估方法、装置、设备及可读存储介质 |
CN114493674A (zh) * | 2021-12-30 | 2022-05-13 | 天翼云科技有限公司 | 一种广告点击率预测模型及方法 |
CN115271272A (zh) * | 2022-09-29 | 2022-11-01 | 华东交通大学 | 多阶特征优化与混合型知识蒸馏的点击率预测方法与系统 |
CN115271272B (zh) * | 2022-09-29 | 2022-12-27 | 华东交通大学 | 多阶特征优化与混合型知识蒸馏的点击率预测方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325579A (zh) | 一种广告点击率预测方法 | |
CN111222332B (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN109754317B (zh) | 融合评论的可解释性服装推荐方法、系统、设备及介质 | |
CN109657156A (zh) | 一种基于循环生成对抗网络的个性化推荐方法 | |
CN109102341B (zh) | 一种用于养老服务的老人画像方法 | |
CN112288471B (zh) | 一种基于用户历史行为序列的广告点击率预测方法 | |
CN107230113A (zh) | 一种多模型融合的房产评估方法 | |
CN108520442A (zh) | 一种基于融合结构的展示广告点击率预测方法 | |
CN112070078B (zh) | 基于深度学习的土地利用分类方法及系统 | |
CN112527966B (zh) | 基于Bi-GRU神经网络和自注意力机制的网络文本情感分析方法 | |
CN111563770A (zh) | 一种基于特征差异化学习的点击率预估方法 | |
CN110175857B (zh) | 优选业务确定方法及装置 | |
CN110110372B (zh) | 一种用户时序行为自动切分预测方法 | |
CN109858972B (zh) | 广告点击率的预测方法和装置 | |
CN108182597A (zh) | 一种基于决策树和逻辑回归的点击率预估方法 | |
CN110704510A (zh) | 一种结合用户画像的题目推荐方法及系统 | |
CN117522479B (zh) | 互联网广告精准投放方法及系统 | |
CN112116137A (zh) | 一种基于混合深度神经网络的学生辍课预测方法 | |
CN112529415A (zh) | 基于组合多感受野图神经网络的物品评分方法 | |
CN111985680A (zh) | 基于胶囊网络与时序的刑事多罪名预测方法 | |
CN113868537B (zh) | 一种基于多行为会话图融合的推荐方法 | |
CN114781503A (zh) | 一种基于深度特征融合的点击率预估方法 | |
CN115032602A (zh) | 一种基于多尺度卷积胶囊网络的雷达目标识别方法 | |
CN114357284A (zh) | 基于深度学习的众包任务个性化推荐方法和系统 | |
CN113010774A (zh) | 一种基于动态深度注意力模型的点击率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20231201 |
|
AD01 | Patent right deemed abandoned |