CN112053188A - 一种基于混合深度神经网络模型的互联网广告推荐方法 - Google Patents

一种基于混合深度神经网络模型的互联网广告推荐方法 Download PDF

Info

Publication number
CN112053188A
CN112053188A CN202010862465.3A CN202010862465A CN112053188A CN 112053188 A CN112053188 A CN 112053188A CN 202010862465 A CN202010862465 A CN 202010862465A CN 112053188 A CN112053188 A CN 112053188A
Authority
CN
China
Prior art keywords
model
neural network
user
advertisement
rnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010862465.3A
Other languages
English (en)
Other versions
CN112053188B (zh
Inventor
周仁杰
刘臣
万健
张纪林
殷昱煜
蒋从锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202010862465.3A priority Critical patent/CN112053188B/zh
Publication of CN112053188A publication Critical patent/CN112053188A/zh
Application granted granted Critical
Publication of CN112053188B publication Critical patent/CN112053188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于混合深度神经网络模型的互联网广告推荐方法。本发明从基于深度学习用于广告点击率预估的模型出发,在DeepFM网络提供特征自动组合的基础上,利用RNN模型从用户历史点击行为记录中精准建模用户的兴趣,提高了广告点击率的预估性能;模型不需要超大规模的广告ID作为输入,降低了对现有广告系统的数据要求,也降低了模型的过拟合风险。本发明在应用到对用户兴趣刻画要求严格的互联网广告投放系统中,能提升广告的点击率,同时不影响模型的更新训练速度。

Description

一种基于混合深度神经网络模型的互联网广告推荐方法
技术领域
本发明属于面向互联网广告领域,涉及一种基于混合深度神经网络模型的互联网广告推荐方法,更具体地说是一种解决现有方法无法对用户随时间变化的兴趣进行充分挖掘的互联网广告推荐方法。
背景技术
在推荐系统、互联网广告投放等个性化服务中,预估点击率具有非常重要的意义。预估点击率的任务就是计算用户在特定的上下文环境下会点击物品的概率。这个概率值表达了用户对特定物品(如一个视频,一个商品广告等)的感兴趣程度。根据预估的点击概率,不同应用可采用不同的策略,如新闻推送系统可直接向用户推送预估点击率高的新闻,互联网广告系统可向用户投放点击收益最高的广告。无论哪种情况,关键是要尽可能准确预估点击率。
在互联网广告中,用户从不主动表达他们的兴趣,因此设计模型捕捉用户的兴趣对提高互联网广告预估点击率准确性具有至关重要的作用。但目前大多数基于深度学习的模型关注于捕获来自不同领域的特性之间的交互,而较少关注用户兴趣对于广告推荐的影响力。用户兴趣是会随着时间的变化而变化,目前并没有人提出相关技术侧重考虑时序对用户兴趣影响,进而影响广告推荐方法。
因此,针对目前深度学习在互联网广告点击率预估中存在的问题,有必要发明一种高效建模用户随时间变化的行为序列,且能够更加精准捕捉用户点击兴趣的深度神经网络模型。
发明内容
本发明的目的在于解决现有互联网广告推荐方法无法对用户随时间变化的兴趣进行充分挖掘的问题,提出了一种基于混合深度神经网络模型的互联网广告推荐方法。
本发明采用的技术方案步骤如下:
一种基于混合深度神经网络模型的互联网广告推荐方法,在DeepFM深度神经网络进行特征自动组合的基础上,利用RNN模型从用户的随时间变化的历史点击行为记录中建模用户的点击兴趣,以提升互联网广告点击率预估性能。该模型采用以下步骤实现:
步骤(1)、获取互联网广告系统中用户属性、用户历史点击行为记录、广告属性和上下文环境特征,将其转换为统一的数据格式。
步骤(2)、从广告投放点击记录数据库中抽取全量数据集,分别从用户、广告维度拼接相应的属性构成训练集。
步骤(3)、用户特征、广告特征和上下文环境特征输入到DeepFM中进行特征的自动组合,用户历史点击行为记录输入到RNN中用于捕捉用户的点击兴趣。
步骤(4)、将DeepFM的输出和RNN的输出相加,输入到sigmoid函数中,得到预测结果y,和真实结果计算误差进行反向传播,更新模型参数直至模型收敛。
步骤(5)、若预测结果y大于事先设定阈值,则该预测结果对应的广告为用户感兴趣广告。
一种基于混合深度神经网络模型的互联网广告推荐设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被所述处理器执行时实现上述基于混合深度神经网络模型的互联网广告推荐方法的步骤。
一种存储介质,存储有基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被处理器执行时实现上述基于混合深度神经网络模型的互联网广告推荐方法的步骤。
本发明具有的有益效果是:
1、本发明提出一种新的混合深度神经网络模型,在DeepFM模型基础上融合RNN模型,利用RNN模型从带有时间维度的用户点击记录中提取用户随时间变化的兴趣,弥补的DeepFM无法建模时间序列的缺点。对用户兴趣的精准刻画将大幅提升互联网广告的推荐精准度。
2、本发明不需要输入超大规模的物品ID,这降低了对现有广告系统的数据要求,也避免了模型训练容易过拟合的风险。这非常有利于互联网广告推荐中的模型训练、模型更新、模型上线。
附图说明
图1为本发明方法混合深度神经网络模型架构图。
具体实施方式
下面结合附图1,对本发明的具体实施方案作进一步详细描述。其中:
步骤(1)、获取互联网广告系统中用户属性、用户历史点击行为记录、广告属性和上下文环境特征;
用户属性包括性别、年龄等。
用户历史点击行为记录是用户过去一段时间的点击情况,比如一个用户在此时刻之前一共有三个记录,第一次未点击,第二次点击,第三次点击,则用户历史点击行为记录L取值为[0,1,1]。
广告属性包括广告主所属行业、广告定向年龄等。
上下文环境包括用户本次请求的网络情况(WIFI、4G)、用户的设备(PC、Phone、iPad)。
步骤(2)、预处理用户属性、用户历史点击行为记录、广告属性和上下文环境特征。分别对用户属性、广告属性、上下文环境特征进行序号编码;对用户历史点击行为记录进行截断,使用户历史点击行为记录长度不超过指定值。
步骤(3)、构建DeepFM模型
3.1将用户属性、广告属性、上下文环境特征输入到DeepFM模块中,进行高阶特征的自动组合。具体的计算过程如下:
DeepFM能够同时进行低阶特征交互和高阶特征交互。DeepFM有两部分组成,FM进行一阶和二阶特征建模,全连接网络进行高阶特征建模。
3.2计算FM的输出;
Figure BDA0002648609890000031
其中w为d维向量,d是所有特征的个数,Vi是第i个特征的表示向量。<w,x>表示向量w和特征x做内积,用于计算一阶特征的重要性,<Vi,Vj>表示第i个特征的表示向量和第j个特征的表示向量做内积,用于计算特征的相互作用程度。
3.3计算全连接网络的输出;
前馈神经网络以特征的嵌入向量作为输入,通过多层的神经网络结构学习多阶特征交互,他的工作方法如下:
a(0)=[e1,e2,...,ed],
a(l)=σ(W(l-1)a(l-1)+b(l-1))
其中ei是第i个特征的嵌入向量,d是所有特征的个数。l为神经网络当前层深度,σ为激活函数,W(l)是第l层的权重矩阵,b(l)是第l层的偏置项。最后前馈神经网络的输出为:
yMLP=σ(Whah-1+bh)
其中h为神经网络的最大深度。
3.4计算DeepFM的输出。
yDeepFM=σ(yFM+yMLP)
其中yFM为FM的输出,yMLP为前馈神经网络的输出。
步骤4:构建RNN模型
将用户历史点击记录输入到RNN中,进行用户点击兴趣的建模。
RNN组件是一个标准的循环神经网络,它有能力处理任意长度的序列。RNN递归的为序列中的每一个输入元素的隐状态应用转换函数,被我们用来学习用户点击行为记录。
RNN通过应用转换函数为每个输入元素得到一个隐状态,在t时刻的隐状态ht以当前输入元素xt和前一时刻t-1的隐状态ht-1为输入,应用转换函数f计算得到:
ht=f(xt,ht-1)
为了得到非线性组合,激活函数f通常为:
ht=φ(Wxt+Uht-1)
其中W是输入到隐层的映射矩阵,U为状态到状态的转移矩阵,φ为非线性激活函数双曲正切函数或者logisticsigmoid函数。
通常,标准的循环神经网络使用最后一个隐状态来表示整个序列的信息,它可以被输入到下游任务中,我们将它应用到CTR预测中。计算公式如下:
yRNN=sigmoid(Vhlast+b)
其中hlast为序列最后一个元素对应的隐状态,V为一个向量,b为偏置项,yRNN即为整个RNN组件的输出。
步骤5:将DeepFM的输出和RNN的输出相加,输入到sigmoid函数中,得到预测结果,和真实结果计算误差进行反向传播,更新模型参数直至模型收敛。
y`=sigmoid(yDeepFM+yRNN)
步骤6:在互联网广告系统中,给定一个用户,一个广告和当时的上下文环境特征,利用模型预测用户会点击这个广告的概率,当概率大于系统指定的阈值,系统向用户推送该广告。
实施例采用以下两个数据集对比了本发明模型和其他模型的效果:
1)图灵联邦数据集。图灵联邦提供了三天的用户视频点击行为数据,预测第四天用户在相应的上下文环境下会点击视频的概率。给定一个用户基本属性,一个视频基本属性和环境上下文信息,预测用户会点击这个视频的概率。
2)盘石广告数据集。浙江盘石信息技术股份有限公司是中国领先的专注于广告投放的企业。收集了一个月的广告点击记录,将前25天用于训练,后5天用于预测。在该数据集中,一条训练样本包含广告的特征(广告定向性别、广告定向行业、广告定向年龄),和媒介网站上广告位的特征(网站访问量、网站所属行业、网站用户性别比例)。
实验中使用AUC和LogLoss来评价模型的性能。
AUC:AUC是ROC曲线下的面积,被广泛应用于CTR领域性能评价。AUC衡量一个模型能够在多大程度上将用户喜欢的商品与不喜欢的商品区分出来,如果模型预测用户喜欢的商品和不喜欢的商品的AUC差别很大,则模型性能越好。
LogLoss:和AUC不同,LogLoss衡量每一个样本的预测值和真实标签的偏离程度,越小越好。
表1
Figure BDA0002648609890000051
实验结果表明,本发明提出的一种新的混合深度神经网络模型比其他先进模型的推荐精度提升4.3%。

Claims (3)

1.一种基于混合深度神经网络模型的互联网广告推荐方法,其特征在于该方法包括以下步骤:
步骤(1)、获取互联网广告系统中用户属性、用户历史点击行为记录、广告属性和上下文环境特征;
步骤(2)、对用户属性、用户历史点击行为记录、广告属性和上下文环境特征预处理,具体是分别对用户属性、广告属性、上下文环境特征进行序号编码;对用户历史点击行为记录进行截断,使用户历史点击行为记录长度不超过指定值;
步骤(3)、构建DeepFM模型
用户属性、广告属性、上下文环境特征作为DeepFM模型的输入,由于DeepFM能够同时进行低阶特征交互和高阶特征交互,DeepFM由FM、全连接网络两部分构成:FM进行一阶和二阶特征建模,全连接网络进行高阶特征建模;
FM的输出:
Figure FDA0002648609880000011
其中w为d维向量,d是所有特征的个数,Vi是第i个特征的表示向量,<w,x>表示向量w和特征x做内积,用于计算一阶特征的重要性,<Vi,Vj>表示第i个特征的表示向量和第j个特征的表示向量做内积,用于计算特征的相互作用程度;
全连接网络的输出:
前馈神经网络以特征的嵌入向量作为输入,通过多层的神经网络结构学习多阶特征交互:
a(0)=[e1,e2,...,ed],
a(l)=σ(W(l-1)a(l-1)+b(l-1))
其中ei是第i个特征的嵌入向量,d是所有特征的个数,l为神经网络当前层深度,σ为激活函数,W(l)是第l层的权重矩阵,b(l)是第l层的偏置项;
前馈神经网络的输出为:
yMLP=σ(Whah-1+bh)
其中h为神经网络的最大深度;
DeepFM的输出:
yDeepFM=σ(yFM+yMLP)
其中yFM为FM的输出,yMLP为前馈神经网络的输出;
步骤(4)、构建RNN模型
用户历史点击记录作为RNN模型的输入,yRNN作为RNN模型的输出;
yRNN=sigmoid(Vhlast+b)
其中hlast为用户历史点击记录序列最后一个元素对应的隐状态,V为一个向量,b为偏置项;
RNN通过应用转换函数为每个输入元素得到一个隐状态,在t时刻的隐状态ht以当前输入元素xt和前一时刻t-1的隐状态ht-1为输入,应用转换函数f计算得到:
ht=f(xt,ht-1)
为了得到非线性组合,激活函数f通常为:
ht=φ(Wxt+Uht-1)
其中W是输入到隐层的映射矩阵,U为状态到状态的转移矩阵,φ为非线性激活函数双曲正切函数或者logisticsigmoid函数;
步骤(5)、将DeepFM模型的输出和RNN模型的输出相加,输入到sigmoid函数中,得到预测结果y;通过预测结果y和真实结果计算误差进行反向传播,更新模型参数直至模型收敛;
y`=sigmoid(yDeepFM+yRNN)
步骤(6)、若预测结果y大于事先设定阈值,则该预测结果对应的广告为用户感兴趣广告。
2.一种基于混合深度神经网络模型的互联网广告推荐设备,其特征在于包括所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被所述处理器执行时实现如权利要求1中所述的基于混合深度神经网络模型的互联网广告推荐方法的步骤。
3.一种存储介质,其特征在于,所述存储介质上存储有基于混合深度神经网络模型的互联网广告推荐程序,所述基于混合深度神经网络模型的互联网广告推荐程序被处理器执行时实现如权利要求1中所述的基于混合深度神经网络模型的互联网广告推荐方法的步骤。
CN202010862465.3A 2020-08-25 2020-08-25 一种基于混合深度神经网络模型的互联网广告推荐方法 Active CN112053188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010862465.3A CN112053188B (zh) 2020-08-25 2020-08-25 一种基于混合深度神经网络模型的互联网广告推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010862465.3A CN112053188B (zh) 2020-08-25 2020-08-25 一种基于混合深度神经网络模型的互联网广告推荐方法

Publications (2)

Publication Number Publication Date
CN112053188A true CN112053188A (zh) 2020-12-08
CN112053188B CN112053188B (zh) 2024-01-16

Family

ID=73600794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010862465.3A Active CN112053188B (zh) 2020-08-25 2020-08-25 一种基于混合深度神经网络模型的互联网广告推荐方法

Country Status (1)

Country Link
CN (1) CN112053188B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529621A (zh) * 2020-12-10 2021-03-19 中山大学 一种基于异构图嵌入技术的广告受众基础属性预估方法
CN113204655A (zh) * 2021-07-02 2021-08-03 北京搜狐新媒体信息技术有限公司 多媒体信息的推荐方法、相关装置及计算机存储介质
CN113570416A (zh) * 2021-07-30 2021-10-29 北京达佳互联信息技术有限公司 投放内容确定方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐系统点击率预测方法
CN110457589A (zh) * 2019-08-19 2019-11-15 上海新共赢信息科技有限公司 一种车辆推荐方法、装置、设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960759A (zh) * 2019-03-22 2019-07-02 中山大学 基于深度神经网络的推荐系统点击率预测方法
CN110457589A (zh) * 2019-08-19 2019-11-15 上海新共赢信息科技有限公司 一种车辆推荐方法、装置、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112529621A (zh) * 2020-12-10 2021-03-19 中山大学 一种基于异构图嵌入技术的广告受众基础属性预估方法
CN113204655A (zh) * 2021-07-02 2021-08-03 北京搜狐新媒体信息技术有限公司 多媒体信息的推荐方法、相关装置及计算机存储介质
CN113570416A (zh) * 2021-07-30 2021-10-29 北京达佳互联信息技术有限公司 投放内容确定方法、装置、电子设备及存储介质
CN113570416B (zh) * 2021-07-30 2022-04-01 北京达佳互联信息技术有限公司 投放内容确定方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112053188B (zh) 2024-01-16

Similar Documents

Publication Publication Date Title
CN111538912B (zh) 内容推荐方法、装置、设备及可读存储介质
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
CN111339415B (zh) 一种基于多交互式注意力网络的点击率预测方法与装置
CN109657156B (zh) 一种基于循环生成对抗网络的个性化推荐方法
CN111209386B (zh) 一种基于深度学习的个性化文本推荐方法
CN112053188B (zh) 一种基于混合深度神经网络模型的互联网广告推荐方法
US8543445B2 (en) System and method for direct mailing insurance solicitations utilizing hierarchical bayesian inference for prospect selection
CN110796313B (zh) 一种基于带权图卷积和项目吸引力模型的会话推荐方法
CA2931434A1 (en) Promotion selection for online customers using bayesian bandits
CN112765480B (zh) 一种信息推送方法、装置及计算机可读存储介质
CN111127142A (zh) 一种基于广义神经注意力的物品推荐方法
CN111382361A (zh) 信息推送方法、装置、存储介质和计算机设备
CN110738314B (zh) 一种基于深度迁移网络的点击率预测方法及装置
CN112819575B (zh) 一种考虑重复购买行为的会话推荐方法
CN111667024A (zh) 内容推送方法、装置、计算机设备和存储介质
CN112288554A (zh) 商品推荐方法和装置、存储介质及电子装置
CN113688306A (zh) 一种基于强化学习的推荐策略生成方法及装置
WO2023185320A1 (zh) 冷启动对象推荐方法、装置、计算机设备和存储介质
CN114595323B (zh) 画像构建、推荐、模型训练方法、装置、设备及存储介质
US20220358366A1 (en) Generation and implementation of dedicated feature-based techniques to optimize inference performance in neural networks
CN111178987B (zh) 训练用户行为预测模型的方法和装置
CN114298734A (zh) 一种基于多任务学习的互联网在线广告精准投放方法
CN117112781A (zh) 文本信息处理模型训练方法、装置、以及存储介质
CN113822734A (zh) 用于生成信息的方法和装置
CN116029770B (zh) 广告创意智能化推送方法、系统、设备与存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant