CN112102004B - 一种基于残差学习的点击率预测融合方法 - Google Patents
一种基于残差学习的点击率预测融合方法 Download PDFInfo
- Publication number
- CN112102004B CN112102004B CN202010984847.3A CN202010984847A CN112102004B CN 112102004 B CN112102004 B CN 112102004B CN 202010984847 A CN202010984847 A CN 202010984847A CN 112102004 B CN112102004 B CN 112102004B
- Authority
- CN
- China
- Prior art keywords
- click
- model
- click rate
- epoch
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于残差学习的点击率预测融合方法,包括:1.根据点击率预测数据特点构造训练数据集;2.获取样本基于传统机器学习的点击率预测概率;3.获取基于机器学习模型的预测结果与真实标签之间的残差值;4.获取每个样本基于深度学习的点击率预测概率;5.获得两类模型联合训练的预测结果;6.重复步骤4.2~5以完成一轮次训练;7.重复步骤4~6至至点击率预测准确率达到最好;8.对预测结果集进行降序排序,选取前若干个产品进行推荐。本发明基于残差学习的融合思路,能够充分挖掘点击率预测数据中各类型特征背后的隐藏信息,进而更好地捕获用户的兴趣爱好,并为用户展示点击概率更大的产品,以实现更精准的个性化产品推荐任务。
Description
技术领域
本发明涉及个性化推荐、信息检索、在线广告等领域,具体地来说是一种基于残差学习的点击率预测融合方法,以产品个性化推荐的效果。
技术背景
近年来,随着互联网和智能移动设备的普及,各类应用平台的层出不穷引发了数据规模的爆炸式增长,随之发展的各类数据挖掘,机器学习,深度学习等技术使得从大规模的用户产品交互数据中高效精确地挖掘出对用户有价值的信息,实现个性化推荐成为可能。面对实际应用中用户和产品项目数量众多的问题,如何根据用户历史点击记录提前预测用户的下一次点击状态已成为这些应用平台有针对性地投放产品的重要内容之一。如广告搜索中的点击预测、网页搜索中的内容排序、推荐系统中的内容优化、运输网络中的路线选择等。这个过程我们通常称之为点击率预测(Click-throughrate,CTR)任务。当前点击率预测(CTR)已经广泛应用于电商、音乐、电影、社交等移动平台,实际上,CTR预测任务专注于预测用户点击项目的可能性,并且可以为用户展示具有较大概率的预测项目,以提高个性化推荐的效果,但是其性能往往限制于点击率预测数据本身的特性。该类数据常常包含稠密数值特征和稀疏类别特征的特点,导致现有模型学习性能不佳。
由于点击率预测模型通常被认为是一个分类过程,因此当前的解决方案可以分为两类:传统的基于机器学习模型和基于深度学习的模型。在这两类模型中,利用用户(性别、年龄、职业等)和产品(价格、质量、种类)等丰富的属性特征对用户与产品之间交互关系进行建模,根据用户对产品是否进行点击操作从而挖掘用户的个人喜好,从而为用户展示用户更有可能点击的产品,实现个性化推荐的同时还能提高用户浏览产品的效率。但是现实世界中的点击率预测数据通常包含稠密的数值特征和稀疏的类别特征,而现有的点击率预测模型通常只关注到一方面的特征,而忽视了另一方面特征上的学习效果。因此,现有点击率预测方法存在数据利用不充分以及单方面学习的缺陷,造成点击率预测效果不佳,随之,各大电商平台的个性化推荐效果也受到了一定的限制。
通过把分别适用于各类特征的模型进行融合(如:机器学习模型和更适合处理稠密的数值特征,深度学习模型更适合处理稀疏的类别特征),可以有效地解决现有模型单方面学习的问题。近来,有许多研究者针对当前点击率预测方法存在的效果不佳的问题提出一系列的融合方法,并且这些方法显示了同时对线性和非线性特征进行建模的优势,并在实践中带来了更好的性能。然而,对于现有的融合方法来说,它们要不就是基于特征融合,要不就是基于预测结果融合;前者仅将单个模型用作特征提取过程,并没有直接结合两类模型的互补优势,后者还需要一个额外的集成方法来融合两个单一模型的结果,这就会使得最终模型的预测结果质量在很大程度上依赖于附加集成方法的融合能力综合提到的两种融合方式来看,这些融合方法并未有效地考虑不同的模型可以捕获到数据的不同特征的特点以及不同模型学习能力的差异,也就无法获得最佳的准确性。所以,探索如何利用传统机器学习模型和深度神经网络模型各自的优势,并有效地融合两种类型的模型以解决特征学习中的单方面学习的问题,以提高个性化推荐的效果显得至关重要。
发明内容
本发明为解决现有点击率预测技术所存在的问题,提出一种基于残差学习的点击率预测融合方法,以期能够在残差学习的基础上,结合基于传统机器学习和基于深度学习的点击率预测模型的优点,充分挖掘点击率预测数据中包含的各类特征中的隐藏信息,解决当前点击率模型中存在的数据利用不充分以及单方面学习的问题,从而提高点击率预测模型的准确性的同时,也可以更好地捕获用户的兴趣爱好,并为用户展示点击概率更大的产品,进而实现更精准的个性化产品推荐任务。
本发明为解决技术问题采用如下技术方案:
本发明一种基于残差学习的点击率预测融合方法的特点是按如下步骤进行:
步骤1、根据点击率预测数据特点构造训练数据集:
令U表示用户集,且U={u1,u2,...ua,...um},ua表示第a个用户,m表示用户总数,1≤a≤m;令V表示产品集,且V={v1,v2,...,vb,...,vn},vb表示第b个产品,n表示产品总数,1≤b≤n;令Cab表示第a个用户ua对第b个产品vb的点击情况,当Cab=1时,表示第a个用户ua点击第b个产品vb;当Cab=0时,表示第a个用户ua未点击第b个产品vb,用户对产品的点击矩阵为C={Cab}m×n;剔除所述点击矩阵为C={Cab}m×n中的空数据,从而得到筛选后的点击矩阵;
令用户属性矩阵Xu={xu1,xu2,...,xua,...,xum},其中,xua表示第a个用户ua的du维属性向量;令产品属性矩阵Xv={xv1,xv2,...,xvb,...,xvn},其中,xvb表示第b个产品vb的dv维属性向量;
根据所述筛选后的点击矩阵,将第a个用户ua的du维属性向量xua和与第a个用户ua有点击关系的产品属性向量拼接成一条点击率预测特征向量,从而得到所有具有点击关系的用户和产品之间的点击率预测特征向量所构成的历史点击记录集,记为Dtrain={(x1,y1),...(xi,yi),...,(xN,yN)},其中,(xi,yi)表示第i条历史点击记录,xi表示第i条点击率预测特征向量,yi表示第i条点击率预测特征向量的标签,且yi∈{0,1};1≤i≤N,N表示历史点击记录的总量;
步骤2.1、利用式(1)初始化ML模型的参数θML:
θML=fML(yn) (1)
式(1)中,fML(·)为ML模型的初始化函数;
步骤2.2、根据式(2)建立ML模型的损失函数LML:
式(2)中,lML(xi)为ML模型中第i条点击率预测特征向量xi的损失函数,并有:
步骤2.3、将所述历史点击记录集Dtrain输入初始化后的ML模型中,并利用式(4)更新ML模型待优化的参数,使得式(3)的损失函数值达到最小,从而对ML模型进行特征识别与建模,并得到基于传统机器学习的点击率预测模型及其点击率预测概率
步骤3、定义当前训练轮次为epoch,并初始化epoch=1;
步骤4.1、定义当前训练的批次为J,并初始化J=1;
步骤4.3、将所述历史点击记录集Dtrain输入初始化后的NN模型中,并在NN模型进行特征传播的过程中,根据式(8)按批次更新NN模型的第epoch轮第J批的网络参数Wepoch,J,使得式(6)中的损失函数达到最小,从而得到第epoch轮第J批基于深度学习的拟合残差预测模型及其拟合残差预测概率值
步骤7、判断当前模型是否达到收敛,若未达到收敛,则利用式(10)计算新的残差值并将epoch+1赋值给epoch,将赋值给将赋值给后,返回步骤4顺序执行,若达到收敛,则退出epoch循环,并得到N条历史点击记录中每条记录的最终预测结果其中,s(·)表示激活函数;表示第i条历史点击记录(xi,yi)的最终预测结果;
与已有技术相比,本发明有益效果体现在:
1.本发明针对现存点击率预测模型单方面学习的问题,提出了一种基于残差学习的点击率预测融合方法,结合不同类型的点击率预测模型在学习方法上的区别,充分挖掘各类特征数据背后的隐藏信息,进而有效地提高了点击率预测的准确性和个性化推荐效果。
2.本发明通过残差学习的方式进行模型融合,即本模型是在两个单一模型互补的基础上进行训练的,通过在真实标签和另一个模型的输出之间的残差上拟合一个新模型,以了解前一个模型无法学习的内容,由于新模型只需要学习较少的内容,所以模型可以以更快的速度达到收敛,进而更快的挖掘出用户喜爱的产品,完成个性化推荐。
3.本发明设计的基于残差学习的融合方式,充分考虑了不同模型对于同样的输入数据将会专注于不同的内容的特点,通过两个完全不同的学习机制的重复联合学习,以解决之前提出的融合模型中未考虑不同的模型可以捕获到数据的不同特征的特点以及不同模型学习能力的差异的缺陷,充分学习每个特征的特点,提高了模型的泛化性,进而可以更准确地捕捉到用户的兴趣爱好,实现更精准的个性化推荐任务。
4.本发明所提出的模型,与之前的融合模型相比,本模型不需要额外的外部融合方式,而是巧妙地将两个模型通过顺序链接进行了融合,同时,本模型也可以结合特征融合方式进行扩展,具有很好的灵活性,因此可以便捷的结合其他方法进行个性化推荐工作。
附图说明
图1为本发明基于残差学习的点击率预测融合方法的流程图;
图2a为本发明与选用的三种融合模型作为对比方法在Avazu数据集上利用AUC指标验证模型收敛速度的实验结果图;
图2b为本发明与选用的三种融合模型作为对比方法在Avazu数据集上利用Logloss指标验证模型收敛速度的实验结果图。
具体实施方式
本实施例中,基于上述提出的融合学习策略,选取具体的基于机器学习和基于深度学习的点击率预测模型进行实验。由于GBDT和DeepFM分别作为基于机器学习和基于深度学习最具代表性的模型之一,因此本实施例中我们选取GBDT和DeepFM分别代表机器学习模型和深度学习模型进行实施例操作。如图1所示,一种基于残差学习的点击率预测融合方法是按如下步骤进行:
步骤1、根据点击率预测数据特点构造训练数据集:
令U表示用户集,且U={u1,u2,...ua,...um},ua表示第a个用户,m表示用户总数,1≤a≤m;令V表示产品集,且V={v1,v2,...,vb,...,vn},vb表示第b个产品,n表示产品总数,1≤b≤n;令Cab表示第a个用户ua对第b个产品vb的点击情况,当Cab=1时,表示第a个用户ua点击第b个产品vb;当Cab=0时,表示第a个用户ua未点击第b个产品vb,用户对产品的点击矩阵为C={Cab}m×n;剔除点击矩阵为C={Cab}m×n中的空数据,这些空数据指的是用户和产品之间从未有过交互关系的数据,即既没有点击操作,也没有未点击操作,点击关系既不为1也不为0,而是空值null,从而得到筛选后的点击矩阵;
令用户属性矩阵Xu={xu1,xu2,...,xua,...,xum},其中,xua表示第a个用户ua的du维属性向量,即每个用户包含有du个属性特征;令产品属性矩阵Xv={xv1,xv2,...,xvb,...,xvn},其中,xvb表示第b个产品vb的dv维属性向量,即每个产品包含有dv个属性特征;
根据上述筛选后的点击矩阵,将第a个用户ua的du维属性向量xua和与第a个用户ua有点击关系的产品属性向量拼接成一条点击率预测特征向量,每个特征向量长为du+dv,表示每个向量中有du+dv个属性特征,从而得到所有具有点击关系的用户和产品之间的点击率预测特征向量所构成的历史点击记录集,记为Dtrain={(x1,y1),...(xi,yi),...,(xN,yN)},其中,(xi,yi)表示第i条历史点击记录,xi表示第i条点击率预测特征向量,yi表示第i条点击率预测特征向量的标签,且yi∈{0,1};1≤i≤N,N表示历史点击记录的总量;
步骤2.1、利用式(1)初始化ML模型的参数θML:
θML=fML(yn) (1)
式(1)中,fML(·)为ML模型的初始化函数;
对于实施例中的GBDT模型,选取式(2)作为fML(·)函数对GBDT模型进行初始化。
步骤2.2、根据式(3)建立ML模型的损失函数LML:
式(3)中,lML(xi)为ML模型中第i条点击率预测特征向量xi的损失函数,并有:
在实施例中,GBDT模型通过树分裂的方式进行优化与更新,定义优化的模型参数为γm,j,并构造GBDT模型的优化方式。
通过拟合每次迭代的残差值来训练多棵CART回归树进而优化GBDT模型。对于N个样本,根据式(5)计算第m棵树的残差值。
式(5)中,rm,i为GBDT模型中第m棵树上第i条点击率预测特征向量xi的残差值,对于N个样本,通过训练CART回归树来拟合当前的样本对(xn,rm,n),以获得第m棵树模型。声明该棵树对应的叶子节点区域为Rm,j(j=1,2,......,jm),其中jm表示这颗树上的节点个数。对于jm个节点区域,根据式(6)计算当前最好的拟合值,即优化参数γm,j。
步骤2.3、将历史点击记录集Dtrain输入初始化后的ML模型中,并利用式(7)更新ML模型待优化的参数,使得式(4)的损失函数值达到最小,从而对ML模型进行特征识别与建模,并得到基于传统机器学习的点击率预测模型及其点击率预测概率
在实施例中,将历史点击记录集Dtrain输入初始化后的GBDT模型中,根据式(8)更新GBDT模型;
多次重复步骤2.2~2.3,更新GBDT模型参数,并最终获得训练好的强分类模型,即GBDT。
模型结构如式(9)所示。
步骤3、定义当前训练轮次为epoch,并初始化epoch=1;
步骤4.1、定义当前训练的批次为J,并初始化J=1;
式(14)中,为NN模型训练后第epoch轮第J批数据中第h条点击率预测特征向量xh的预测值,为第epoch轮第J批数据中第h条点击率预测特征向量xh的残差值,lossNN(·)为NN模型的损失函数;
式(16)中,为DeepFM模型训练后第epoch轮第J批数据中第h条点击率预测特征向量xh的预测值,为第epoch轮第J批数据中第h条点击率预测特征向量xh的残差值,在DeepFM模型中我们选取了二分类交叉熵作为训练损失函数;
步骤4.3、将历史点击记录集Dtrain输入初始化后的NN模型(即DeepFM模型)中,并在NN模型(DeepFM模型)进行特征传播的过程中,根据式(17)按批次更新NN模型的第epoch轮第J批的网络参数Wepoch,J,对于具体的DeepFM模型,将赋给式(17)中的使得式(13)中的损失函数达到最小,也就是使得达到最小,从而得到第epoch轮第J批基于深度学习的拟合残差预测模型及其拟合残差预测概率值具体实施例中可得到DeepFM模型及其点击率预测概率值
步骤7、判断当前模型是否达到收敛,若未达到收敛,则利用式(19)计算新的残差值并将epoch+1赋值给epoch,将赋值给将赋值给后,返回步骤4顺序执行,若达到收敛,则退出epoch循环,并得到N条历史点击记录中每条记录的最终预测结果其中,表示第i条历史点击记录(xi,yi)的最终预测结果;s(·)表示激活函数,可根据所选深度模型输出层结构特点进行选择;
实施例:
为了验证本方法的有效性,本发明采用CTR预测中常用的两个个公开的数据集以及2019年知乎比赛(智源看山杯专家发现算法大赛)中提供的一个真实数据集:Avazu、Cretio、Zhihu。对每个数据集数据进行筛选、补全与去重等预处理工作后,随机划分数据集中的90%为训练集,另外剩下的作为测试集。
对于点击率预测任务,本发明采用AUC和Logloss作为评价标准。本发明选用了8种方法进行效果对比,分别是LR、FM、GBDT、DeepFM、GBDT+LR、GBDT2DNN、GBDT2DeepFM、具体地,根据实验结果可得出结果如表1,表2,图2a,图2b所示,实验结果显示了本发明的可行性。
表1本发明方法与不同对比模型的CTR预测结果
表1所示的实验结果显示,在Avazu、Cretio、Zhihu数据集上进行点击率预测实验,本发明方法在两个评价标准AUC和Logloss上均优于对比的8种方法,从而证明了本发明提出方法的有效性;
表2本发明方法在不同迭代次数下的CTR预测结果
表2所示的实验结果显示,在Avazu、Cretio、Zhihu数据集上进行模型泛化性的探究实验中,在三个数据集上,本发明提出的方法在K=2时,模型效果可以达到最优。这意味着通过前两次的迭代学习,每一部分的单模型结构已经充分学习了另一模型没有学习到的内容,从而证明本发明提出的方法具有很好的泛化性。
图2a所示的实验结果表明,利用AUC指标在Avazu数据集上进行模型收敛速度的验证实验中,本发明方法具有更快的收敛速度;
图2b所示的实验结果表明,利用Logloss指标在Avazu数据集上进行模型收敛速度的验证实验中,同样可以验证本发明方法具有更快的收敛速度。
Claims (1)
1.一种基于残差学习的点击率预测融合方法,其特征是按如下步骤进行:
步骤1、根据点击率预测数据特点构造训练数据集:
令U表示用户集,且U={u1,u2,...ua,...um},ua表示第a个用户,m表示用户总数,1≤a≤m;令V表示产品集,且V={v1,v2,...,vb,...,vn},vb表示第b个产品,n表示产品总数,1≤b≤n;令Cab表示第a个用户ua对第b个产品vb的点击情况,当Cab=1时,表示第a个用户ua点击第b个产品vb;当Cab=0时,表示第a个用户ua未点击第b个产品vb,用户对产品的点击矩阵为C={Cab}m×n;剔除所述点击矩阵为C={Cab}m×n中的空数据,从而得到筛选后的点击矩阵;
令用户属性矩阵Xu={xu1,xu2,...,xua,...,xum},其中,xua表示第a个用户ua的du维属性向量;令产品属性矩阵Xv={xv1,xv2,...,xvb,...,xvn},其中,xvb表示第b个产品vb的dv维属性向量;
根据所述筛选后的点击矩阵,将第a个用户ua的du维属性向量xua和与第a个用户ua有点击关系的产品属性向量拼接成一条点击率预测特征向量,从而得到所有具有点击关系的用户和产品之间的点击率预测特征向量所构成的历史点击记录集,记为Dtrain={(x1,y1),...(xi,yi),...,(xN,yN)},其中,(xi,yi)表示第i条历史点击记录,xi表示第i条点击率预测特征向量,yi表示第i条点击率预测特征向量的标签,且yi∈{0,1};1≤i≤N,N表示历史点击记录的总量;
步骤2.1、利用式(1)初始化ML模型的参数θML:
θML=fML(yn) (1)
式(1)中,fML(·)为ML模型的初始化函数;
步骤2.2、根据式(2)建立ML模型的损失函数LML:
式(2)中,lML(xi)为ML模型中第i条点击率预测特征向量xi的损失函数,并有:
步骤2.3、将所述历史点击记录集Dtrain输入初始化后的ML模型中,并利用式(4)更新ML模型待优化的参数,使得式(3)的损失函数值达到最小,从而对ML模型进行特征识别与建模,并得到基于传统机器学习的点击率预测模型及其点击率预测概率
步骤3、定义当前训练轮次为epoch,并初始化epoch=1;
步骤4.1、定义当前训练的批次为J,并初始化J=1;
步骤4.3、将所述历史点击记录集Dtrain输入初始化后的NN模型中,并在NN模型进行特征传播的过程中,根据式(8)按批次更新NN模型的第epoch轮第J批的网络参数Wepoch,J,使得式(6)中的损失函数达到最小,从而得到第epoch轮第J批基于深度学习的拟合残差预测模型及其拟合残差预测概率值
步骤7、判断当前模型是否达到收敛,若未达到收敛,则利用式(10)计算新的残差值并将epoch+1赋值给epoch,将赋值给将赋值给后,返回步骤4顺序执行,若达到收敛,则退出epoch循环,并得到N条历史点击记录中每条记录的最终预测结果其中,s(·)表示激活函数;表示第i条历史点击记录(xi,yi)的最终预测结果;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010984847.3A CN112102004B (zh) | 2020-09-18 | 2020-09-18 | 一种基于残差学习的点击率预测融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010984847.3A CN112102004B (zh) | 2020-09-18 | 2020-09-18 | 一种基于残差学习的点击率预测融合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112102004A CN112102004A (zh) | 2020-12-18 |
CN112102004B true CN112102004B (zh) | 2022-08-30 |
Family
ID=73759859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010984847.3A Active CN112102004B (zh) | 2020-09-18 | 2020-09-18 | 一种基于残差学习的点击率预测融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102004B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679651A (zh) * | 2017-09-15 | 2018-02-09 | 江苏大学 | 一种基于灰色预测模型与bp人工神经网络模型的月用电量预测方法 |
WO2019009452A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화 또는 복호화하는 방법 및 장치 |
CN109255505A (zh) * | 2018-11-20 | 2019-01-22 | 国网辽宁省电力有限公司经济技术研究院 | 一种多模型融合神经网络的短期负荷预测方法 |
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐系统点击率预测方法 |
CN111581832A (zh) * | 2020-05-12 | 2020-08-25 | 哈尔滨工程大学 | 一种基于ARMA模型修正的改进灰色Elman神经网络气垫船运动预报方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8296253B2 (en) * | 2009-06-15 | 2012-10-23 | Hewlett-Packard Development Company, L. P. | Managing online content based on its predicted popularity |
CN110008842A (zh) * | 2019-03-09 | 2019-07-12 | 同济大学 | 一种基于深度多损失融合模型的行人重识别方法 |
-
2020
- 2020-09-18 CN CN202010984847.3A patent/CN112102004B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019009452A1 (ko) * | 2017-07-06 | 2019-01-10 | 삼성전자 주식회사 | 영상을 부호화 또는 복호화하는 방법 및 장치 |
CN107679651A (zh) * | 2017-09-15 | 2018-02-09 | 江苏大学 | 一种基于灰色预测模型与bp人工神经网络模型的月用电量预测方法 |
CN109255505A (zh) * | 2018-11-20 | 2019-01-22 | 国网辽宁省电力有限公司经济技术研究院 | 一种多模型融合神经网络的短期负荷预测方法 |
CN109960759A (zh) * | 2019-03-22 | 2019-07-02 | 中山大学 | 基于深度神经网络的推荐系统点击率预测方法 |
CN111581832A (zh) * | 2020-05-12 | 2020-08-25 | 哈尔滨工程大学 | 一种基于ARMA模型修正的改进灰色Elman神经网络气垫船运动预报方法 |
Non-Patent Citations (5)
Title |
---|
A Relevance Model Based Filter for Improving Ad Quality;Raghavan, Hema等;《PROCEEDINGS 32ND ANNUAL INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION RETRIEVAL》;20090101;全文 * |
BP-灰度模型的电力负荷预测模型研究;朱晓明;《科技通报》;20130815(第08期);全文 * |
Correcting Predictions from Oceanic Maritime Numerical Models vi;Tingwei Wang;《2018 OCEANS - MTS/IEEE Kobe Techno-Oceans (OTO)》;20181206;全文 * |
基于Resnet_FM模型的电影个性化推荐研究;简恒;《中国优秀硕士学位论文全文数据库 (哲学与人文科学辑)》;20200115(第1期);全文 * |
基于提升回归树与随机森林的风电功率集成预测方法;李国等;《电力系统及其自动化学报》;20181115(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112102004A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | Deep interest evolution network for click-through rate prediction | |
CN111523047B (zh) | 基于图神经网络的多关系协同过滤算法 | |
CN109299396B (zh) | 融合注意力模型的卷积神经网络协同过滤推荐方法及系统 | |
CN108829763B (zh) | 一种基于深度神经网络的影评网站用户的属性预测方法 | |
CN111339415B (zh) | 一种基于多交互式注意力网络的点击率预测方法与装置 | |
CN112115377B (zh) | 一种基于社交关系的图神经网络链路预测推荐方法 | |
Peacock | Data mining in marketing: Part 1 | |
CN110245285B (zh) | 一种基于异构信息网络的个性化推荐方法 | |
CN111932336A (zh) | 一种基于长短期兴趣偏好的商品列表推荐方法 | |
CN106202519A (zh) | 一种结合用户评论内容和评分的项目推荐方法 | |
CN109241366B (zh) | 一种基于多任务深度学习的混合推荐系统及其方法 | |
CN112613602A (zh) | 基于知识感知超图神经网络的推荐方法及系统 | |
CN111949885B (zh) | 一种面向旅游景点的个性化推荐方法 | |
CN114817663B (zh) | 一种基于类别感知图神经网络的服务建模与推荐方法 | |
CN112632296B (zh) | 基于知识图谱具有可解释性的论文推荐方法及系统、终端 | |
CN112231583A (zh) | 基于动态兴趣组标识和生成对抗网络的电商推荐方法 | |
CN112765461A (zh) | 一种基于多兴趣胶囊网络的会话推荐方法 | |
CN112115358A (zh) | 一种利用知识图谱中多跳路径特征的个性化推荐方法 | |
CN114529364A (zh) | 一种基于注意力机制的商品序列推荐的方法 | |
CN113343077A (zh) | 一种融合用户兴趣时序波动的个性化推荐方法及系统 | |
JP7427717B2 (ja) | マルチモーダルのトランスフォーマベースのアイテム分類システム、データ処理システム、データ処理方法、及びコンピュータ実行方法 | |
CN107220745A (zh) | 一种意图行为数据的识别方法、系统及设备 | |
CN110851694A (zh) | 基于用户记忆网络和树形结构的深度模型的个性化推荐系统 | |
CN112016000B (zh) | 一种基于卷积协同过滤的电影组推荐方法及系统 | |
CN113344648A (zh) | 一种基于机器学习的广告推荐方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |