CN113034196A - 一种基于核心兴趣网络的点击率预测方法 - Google Patents

一种基于核心兴趣网络的点击率预测方法 Download PDF

Info

Publication number
CN113034196A
CN113034196A CN202110369914.5A CN202110369914A CN113034196A CN 113034196 A CN113034196 A CN 113034196A CN 202110369914 A CN202110369914 A CN 202110369914A CN 113034196 A CN113034196 A CN 113034196A
Authority
CN
China
Prior art keywords
user
core
click
time
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110369914.5A
Other languages
English (en)
Inventor
於志文
徐恩
郭斌
崔禾磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202110369914.5A priority Critical patent/CN113034196A/zh
Publication of CN113034196A publication Critical patent/CN113034196A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0242Determining effectiveness of advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供了一种基于核心兴趣网络的点击率预测方法。聚焦点击率预测任务下的时序数据中的长序列问题。提出了核心兴趣网络模型,将一个长序列切分成多个子序列,在每个子序列中提取用户的核心兴趣,每个子序列提取的核心兴趣将向下一个子序列传递,模型完成对整个长序列用户兴趣的学习,通过提取用户的核心兴趣,这是用户在更高层次和更稳定的兴趣传递给下一个子序列的数据中的噪声较小,更有利于学习用户的兴趣。本发明不仅可以用于推荐系统中的兴趣提取,还可以用于处理其他序列数据中的长序列问题。在推荐系统序列化预测场景有很多应用前景。

Description

一种基于核心兴趣网络的点击率预测方法
技术领域
本发明涉及商品点击率预测和基于深度学习的序列化推荐系统领域,尤其是一种基于点击率预测方法,为一种基于神经网络的商品推荐方法。
背景技术
随着互联网的发展,收集到用户的信息是越来越多,如何利用该信息提取用户兴趣变得尤为重要。获取用户兴趣,给用户推荐相应的物品带给公司巨大的收益。谷歌公司百分之八十以上的收入来自广告。广告的计费模式有很多,其中传统广告计费方式有:以展示量收费,即根据给用户展示的次数收费;以长期租赁的方式收费,即固定位置展示一定的时间收取相应的费用。但随着行业的发展更细致的方式更利于双方交易,如今则出现了,以点击量付费,用户点击了广告才收取相应费用,所以对一个公司来说提高点击率CTR则格外重要。
典型的CTR预测方法有微软研究院提出的逻辑回归模型(LR);斯坦福大学Friedman等人提出一种解决特征组合问题的方案GDBT;日本大阪大学Steffen Rendle等人于2010年提出FM模型,旨在解决数据量大而稀疏的情况下的特征组合的问题。但是由于深度学习优秀的拟合能力。并且端到端的学习方式,不需要再进行特征工程,使得深度学习在推荐领域大放异彩。
如今CTR的主流方法都是基于深度学习,而且如今已有很多代表工作。它们大致分为两类一类是基于池化的方法,将用户的各个历史行为分别学习它们的表征形式,最后通过求和或是平均的方式来学习到用户最终的兴趣,如DIN、FNN、NFM。这种方式忽略了用户行为之间的依赖性。另外一类是基于时序的方法,将用户各个时间购买的物品视为时间序列,用LSTM/GRU等模型从时序中捕获用户的兴趣,最终依据用户兴趣对候选物品进行点击率预测。然而,当序列长度相对较长时,例如超过100时,这些解决方案无法处理这种情况。这是由于RNN的消失梯度问题,即模型不能学习距离太远行为的信息。
发明内容
为了克服现有技术的不足,本发明提供一种基于核心兴趣网络的点击率预测方法。本发明提出了一种新的核心利益网络(CIN)模型,以减轻CTR预测中长序列的梯度消失问题。提出一种基于核心兴趣网络的点击率预测方法。本发明利用以下原理:本发明聚焦点击率(Click Through Rate,CTR)预测任务下的时序数据中的长序列问题。为了缓解臭名昭著的LSTM/GRU的梯度消失问题,提出了核心兴趣网络(Core Interest Network,CIN)模型,将一个长序列切分成多个子序列,在每个子序列中提取用户的核心兴趣。每个子序列提取的核心兴趣将向下一个子序列传递。通过这种方法,模型完成对整个长序列用户兴趣的学习。通过提取用户核心兴趣,这是用户更高阶更稳定的兴趣,使得传递给下一子序列数据中噪音更少,更利于学习到用户的兴趣。同时加入了多层感知机(Multi-Layer Perception,MLP)这一深度学习方法,可以从数据中学习任意函数,增加了点击率预测的准确性。
本发明解决其技术问题所采用的技术方案包括以下步骤:
步骤1:获取用户属性描述、用户行为列表、广告信息以及上下文信息;
步骤2:将用户行为序列按session切分,每个session中依据用户行为数据,提取用户核心兴趣:
ut=σ(Wuit+Uuht-1+bu),
rt=σ(Writ+Urht-1+br),
Figure BDA0003008864590000021
Figure BDA0003008864590000022
其中,ut表示更新门,rt表示重置门,
Figure BDA0003008864590000023
表示t时刻产生的新记忆,ht表示t时刻对应的隐藏状态,σ表示sigmoid激活函数,
Figure BDA0003008864590000027
是元素级的点积,Wu、Wr、Wh以及Uu、Ur、Uh表示系数参数,it表示第t个被输入的用户行为的向量表示,ht表示用户t时刻的隐状态;
步骤3:根据用户的隐状态以及用户各个时刻的真实行为计算辅助损失;
步骤4:将每个session提取的核心向后传递捕获用户动态兴趣,描述为:
Figure BDA0003008864590000024
其中ii,1表示第一阶段第i个session的输入数据,
Figure BDA0003008864590000025
表示第i-1个session第t时刻(最后时刻)第二层GRU提取出的用户核心兴趣,
Figure BDA0003008864590000026
表示第i个session开始时刻用户行为向量的原始输入,角标b表示用户行为(behavior)特征;
步骤5:根据用户行为与候选物品的相似度,计算对应的attention值;
步骤6:通过辅助损失函数以及目标损失函数来定义模型的损失,使用交叉熵损失函数来定义模型损失函数,描述为:
L=Ltarget+α*Laux
其中,L为系统全局损失值,Ltarget表示预测点击率与真实点击率的损失函数,Laux表示辅助损失函数,α为超参,表示辅助损失所占比重;
步骤7:在得到全局损失L后,通过随机梯度下降方法计算得到整个神经网络模型参数更新迭代的大小及方向,设定迭代更新轮数,最终能够得到模型收敛的参数,在得到模型的所有训练后的参数以后,再将用户的历史行为以及候选物品作为输入,模型最终能够计算出点击率,即该用户点击候选物品的概率,从而能够点击率预测任务。
所述步骤1中,所述用户属性描述、用户行为列表、广告信息以及上下文信息,分别用one-hot编码表示成xp,xb,xa,xc;例如用户的性别,[0,1]定义为男性,[1,0]定义为女性;向量的维度表示该特征类别的个数。
所述步骤3中,辅助损失描述为:
Figure BDA0003008864590000031
其中,Laux表示辅助损失,
Figure BDA0003008864590000032
为t时刻第i层GRU对应的隐状态,
Figure BDA0003008864590000033
为t+1时刻用户真实点击的物品向量表示,
Figure BDA0003008864590000034
为t+1时刻用户没有点击过的物品,即负样本的向量表示,另外N表示样本数量,t表示时刻。
所述步骤5中,attention值描述为:
Figure BDA0003008864590000035
Figure BDA0003008864590000036
Figure BDA0003008864590000037
其中,at为t时刻的隐状态与被预测物品ea之间的attention值,ea表示目标广告的embedding向量,W为
Figure BDA0003008864590000038
为系数矩阵,是为了使得nh维的ht向量与na维的ea向量能够相乘;结合attention值与GRU的公式,更新门的值考虑attention值的大小,其中
Figure BDA0003008864590000041
ht′如前所述分别是更新状态和隐状态。
本发明的有益效果在于重点研究了CTR预测下序列数据中的长序列问题,为了缓解LSTM/GRU梯度消失的臭名昭著的问题,提出了CIN模型,将一个长序列划分为多个子序列,并在每个子序列中提取用户的核心兴趣,从每个子序列中提取的核心兴趣被传递给下一个子序列,以此模型就完成了整个长序列中用户兴趣的学习。通过提取用户的核心兴趣,这是用户在更高层次和更稳定的兴趣传递给下一个子序列的数据中的噪声较小,更有利于学习用户的兴趣。值得一提的是,本发明不仅可以用于推荐系统中的兴趣提取,还可以用于处理其他序列数据中的长序列问题。在推荐系统序列化预测场景有很多应用前景。
附图说明
图1为本发明基于核心兴趣网络的点击率预测方法流程图。
图2为核心兴趣传递模型的示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明共有图1和图2,如图1所示,本发明的具体步骤如下:
步骤一:获取用户属性描述、用户行为列表、广告信息以及上下文信息。分别用one-hot编码表示成xp,xb,xa,xc
步骤二:将用户行为序列按session切分,每个session中依据用户行为数据,提取用户核心兴趣。
ut=σ(Wuit+Uuht-1+bu),
rt=σ(Writ+Urht-1+br),
Figure BDA0003008864590000042
Figure BDA0003008864590000043
步骤三:根据用户的隐状态以及用户各个时刻的真实行为来计算辅助损失。
Figure BDA0003008864590000044
步骤四:将每个session提取的核心向后传递捕获用户动态兴趣。
Figure BDA0003008864590000045
步骤五:根据用户行为与候选物品的相似度,计算对应的attention值。
Figure BDA0003008864590000051
Figure BDA0003008864590000052
Figure BDA0003008864590000053
步骤六:通过辅助损失函数以及目标损失函数来定义模型的损失,使用交叉熵损失函数来定义模型损失函数。
L=Ltarget+α*Laux
步骤七:通过随机梯度下降更新模型参数,依据样本数据学习得到优化模型。最终能够依据用户核心兴趣对物品点击率进行预测。
本发明为基于核心兴趣网络的点击率预测方法,使用多层GRU提取每个session中用户的核心兴趣;将每个session提取的核心向后传递捕获用户动态兴趣;基于用户核心兴趣、用户特征以及物品属性,得到最终用户对物品的点击率预测值。
以上所述仅为本发明的较佳实施列,对于发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变、修改等,但都将落入本发明的保护范围内。

Claims (4)

1.一种基于核心兴趣网络的点击率预测方法,其特征在于包括下述步骤:
步骤1:获取用户属性描述、用户行为列表、广告信息以及上下文信息;
步骤2:将用户行为序列按session切分,每个session中依据用户行为数据,提取用户核心兴趣:
ut=σ(Wuit+Uuht-1+bu),
rt=σ(Writ+Urht-1+br),
Figure FDA0003008864580000011
Figure FDA0003008864580000012
其中,ut表示更新门,rt表示重置门,
Figure FDA0003008864580000013
表示t时刻产生的新记忆,ht表示t时刻对应的隐藏状态,σ表示sigmoid激活函数,
Figure FDA0003008864580000014
是元素级的点积,Wu、Wr、Wh以及Uu、Ur、Uh表示系数参数,it表示第t个被输入的用户行为的向量表示,ht表示用户t时刻的隐状态;
步骤3:根据用户的隐状态以及用户各个时刻的真实行为计算辅助损失;
步骤4:将每个session提取的核心向后传递捕获用户动态兴趣,描述为:
Figure FDA0003008864580000015
其中ii,1表示第一阶段第i个session的输入数据,
Figure FDA0003008864580000016
表示第i-1个session第t时刻(最后时刻)第二层GRU提取出的用户核心兴趣,
Figure FDA0003008864580000017
表示第i个session开始时刻用户行为向量的原始输入,角标b表示用户行为(behavior)特征;
步骤5:根据用户行为与候选物品的相似度,计算对应的attention值;
步骤6:通过辅助损失函数以及目标损失函数来定义模型的损失,使用交叉熵损失函数来定义模型损失函数,描述为:
L=Ltarget+α*Laux
其中,L为系统全局损失值,Ltarget表示预测点击率与真实点击率的损失函数,Laux表示辅助损失函数,α为超参,表示辅助损失所占比重;
步骤7:在得到全局损失L后,通过随机梯度下降方法计算得到整个神经网络模型参数更新迭代的大小及方向,设定迭代更新轮数,最终能够得到模型收敛的参数,在得到模型的所有训练后的参数以后,再将用户的历史行为以及候选物品作为输入,模型最终能够计算出点击率,即该用户点击候选物品的概率,从而能够点击率预测任务。
2.根据权利要求1所述的基于核心兴趣网络的点击率预测方法,其特征在于:
所述步骤1中,所述用户属性描述、用户行为列表、广告信息以及上下文信息,分别用one-hot编码表示成xp,xb,xa,xc
3.根据权利要求1所述的基于核心兴趣网络的点击率预测方法,其特征在于:
所述步骤3中,辅助损失描述为:
Figure FDA0003008864580000021
其中,Laux表示辅助损失,
Figure FDA0003008864580000022
为t时刻第i层GRU对应的隐状态,
Figure FDA0003008864580000023
为t+1时刻用户真实点击的物品向量表示,
Figure FDA0003008864580000024
为t+1时刻用户没有点击过的物品,即负样本的向量表示,另外N表示样本数量,t表示时刻。
4.根据权利要求1所述的基于核心兴趣网络的点击率预测方法,其特征在于:
所述步骤5中,attention值描述为:
Figure FDA0003008864580000025
Figure FDA0003008864580000026
Figure FDA0003008864580000027
其中,at为t时刻的隐状态与被预测物品ea之间的attention值,ea表示目标广告的embedding向量,W为
Figure FDA0003008864580000028
为系数矩阵,结合attention值与GRU的公式,更新门的值考虑attention值的大小,其中
Figure FDA0003008864580000029
h′t分别是更新状态和隐状态。
CN202110369914.5A 2021-04-07 2021-04-07 一种基于核心兴趣网络的点击率预测方法 Pending CN113034196A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110369914.5A CN113034196A (zh) 2021-04-07 2021-04-07 一种基于核心兴趣网络的点击率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110369914.5A CN113034196A (zh) 2021-04-07 2021-04-07 一种基于核心兴趣网络的点击率预测方法

Publications (1)

Publication Number Publication Date
CN113034196A true CN113034196A (zh) 2021-06-25

Family

ID=76453877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110369914.5A Pending CN113034196A (zh) 2021-04-07 2021-04-07 一种基于核心兴趣网络的点击率预测方法

Country Status (1)

Country Link
CN (1) CN113034196A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163886A (zh) * 2020-09-30 2021-01-01 大连海事大学 一种基于强化学习的实时竞价广告资源分配方法
CN112288471A (zh) * 2020-10-26 2021-01-29 杭州电子科技大学 一种基于用户历史行为序列的广告点击率预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112163886A (zh) * 2020-09-30 2021-01-01 大连海事大学 一种基于强化学习的实时竞价广告资源分配方法
CN112288471A (zh) * 2020-10-26 2021-01-29 杭州电子科技大学 一种基于用户历史行为序列的广告点击率预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
EN XU等: "Core Interest Network for Click-Through Rate Prediction", ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA, vol. 15, no. 2, pages 1 - 16 *

Similar Documents

Publication Publication Date Title
You et al. Image-based appraisal of real estate properties
CN111080400B (zh) 一种基于门控图卷积网络的商品推荐方法及系统、存储介质
CN111339415B (zh) 一种基于多交互式注意力网络的点击率预测方法与装置
CN110008408A (zh) 一种会话推荐方法、系统、设备及介质
CN112364976B (zh) 基于会话推荐系统的用户偏好预测方法
US10552863B1 (en) Machine learning approach for causal effect estimation
CN112541124B (zh) 生成多任务模型的方法、装置、设备、介质及程序产品
CN112967112B (zh) 一种自注意力机制和图神经网络的电商推荐方法
CN112381581A (zh) 一种基于改进Transformer的广告点击率预估方法
US20210342701A1 (en) Deep learning based visual compatibility prediction for bundle recommendations
CN112288471B (zh) 一种基于用户历史行为序列的广告点击率预测方法
US11501110B2 (en) Descriptor learning method for the detection and location of objects in a video
CN115658864A (zh) 一种基于图神经网络和兴趣注意力网络的会话推荐方法
CN110689110B (zh) 处理交互事件的方法及装置
Wang A survey of online advertising click-through rate prediction models
CN114595383A (zh) 一种基于会话序列的海洋环境数据推荐方法及系统
CN112053188A (zh) 一种基于混合深度神经网络模型的互联网广告推荐方法
CN111667024A (zh) 内容推送方法、装置、计算机设备和存储介质
CN114529077A (zh) 一种基于会话内异构行为的点击率预测方法
JPWO2017010514A1 (ja) 画像検索装置及び方法、撮影時刻推定装置及び方法、反復構造抽出装置及び方法、並びにプログラム
CN116975686A (zh) 训练学生模型的方法、行为预测方法和装置
CN113034196A (zh) 一种基于核心兴趣网络的点击率预测方法
CN115618079A (zh) 会话推荐方法、装置、电子设备及存储介质
CN114519600A (zh) 一种融合相邻节点方差的图神经网络ctr预估算法
CN115564532A (zh) 序列推荐模型的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination