CN113034196A - 一种基于核心兴趣网络的点击率预测方法 - Google Patents
一种基于核心兴趣网络的点击率预测方法 Download PDFInfo
- Publication number
- CN113034196A CN113034196A CN202110369914.5A CN202110369914A CN113034196A CN 113034196 A CN113034196 A CN 113034196A CN 202110369914 A CN202110369914 A CN 202110369914A CN 113034196 A CN113034196 A CN 113034196A
- Authority
- CN
- China
- Prior art keywords
- user
- core
- click
- time
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Game Theory and Decision Science (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明提供了一种基于核心兴趣网络的点击率预测方法。聚焦点击率预测任务下的时序数据中的长序列问题。提出了核心兴趣网络模型,将一个长序列切分成多个子序列,在每个子序列中提取用户的核心兴趣,每个子序列提取的核心兴趣将向下一个子序列传递,模型完成对整个长序列用户兴趣的学习,通过提取用户的核心兴趣,这是用户在更高层次和更稳定的兴趣传递给下一个子序列的数据中的噪声较小,更有利于学习用户的兴趣。本发明不仅可以用于推荐系统中的兴趣提取,还可以用于处理其他序列数据中的长序列问题。在推荐系统序列化预测场景有很多应用前景。
Description
技术领域
本发明涉及商品点击率预测和基于深度学习的序列化推荐系统领域,尤其是一种基于点击率预测方法,为一种基于神经网络的商品推荐方法。
背景技术
随着互联网的发展,收集到用户的信息是越来越多,如何利用该信息提取用户兴趣变得尤为重要。获取用户兴趣,给用户推荐相应的物品带给公司巨大的收益。谷歌公司百分之八十以上的收入来自广告。广告的计费模式有很多,其中传统广告计费方式有:以展示量收费,即根据给用户展示的次数收费;以长期租赁的方式收费,即固定位置展示一定的时间收取相应的费用。但随着行业的发展更细致的方式更利于双方交易,如今则出现了,以点击量付费,用户点击了广告才收取相应费用,所以对一个公司来说提高点击率CTR则格外重要。
典型的CTR预测方法有微软研究院提出的逻辑回归模型(LR);斯坦福大学Friedman等人提出一种解决特征组合问题的方案GDBT;日本大阪大学Steffen Rendle等人于2010年提出FM模型,旨在解决数据量大而稀疏的情况下的特征组合的问题。但是由于深度学习优秀的拟合能力。并且端到端的学习方式,不需要再进行特征工程,使得深度学习在推荐领域大放异彩。
如今CTR的主流方法都是基于深度学习,而且如今已有很多代表工作。它们大致分为两类一类是基于池化的方法,将用户的各个历史行为分别学习它们的表征形式,最后通过求和或是平均的方式来学习到用户最终的兴趣,如DIN、FNN、NFM。这种方式忽略了用户行为之间的依赖性。另外一类是基于时序的方法,将用户各个时间购买的物品视为时间序列,用LSTM/GRU等模型从时序中捕获用户的兴趣,最终依据用户兴趣对候选物品进行点击率预测。然而,当序列长度相对较长时,例如超过100时,这些解决方案无法处理这种情况。这是由于RNN的消失梯度问题,即模型不能学习距离太远行为的信息。
发明内容
为了克服现有技术的不足,本发明提供一种基于核心兴趣网络的点击率预测方法。本发明提出了一种新的核心利益网络(CIN)模型,以减轻CTR预测中长序列的梯度消失问题。提出一种基于核心兴趣网络的点击率预测方法。本发明利用以下原理:本发明聚焦点击率(Click Through Rate,CTR)预测任务下的时序数据中的长序列问题。为了缓解臭名昭著的LSTM/GRU的梯度消失问题,提出了核心兴趣网络(Core Interest Network,CIN)模型,将一个长序列切分成多个子序列,在每个子序列中提取用户的核心兴趣。每个子序列提取的核心兴趣将向下一个子序列传递。通过这种方法,模型完成对整个长序列用户兴趣的学习。通过提取用户核心兴趣,这是用户更高阶更稳定的兴趣,使得传递给下一子序列数据中噪音更少,更利于学习到用户的兴趣。同时加入了多层感知机(Multi-Layer Perception,MLP)这一深度学习方法,可以从数据中学习任意函数,增加了点击率预测的准确性。
本发明解决其技术问题所采用的技术方案包括以下步骤:
步骤1:获取用户属性描述、用户行为列表、广告信息以及上下文信息;
步骤2:将用户行为序列按session切分,每个session中依据用户行为数据,提取用户核心兴趣:
ut=σ(Wuit+Uuht-1+bu),
rt=σ(Writ+Urht-1+br),
其中,ut表示更新门,rt表示重置门,表示t时刻产生的新记忆,ht表示t时刻对应的隐藏状态,σ表示sigmoid激活函数,是元素级的点积,Wu、Wr、Wh以及Uu、Ur、Uh表示系数参数,it表示第t个被输入的用户行为的向量表示,ht表示用户t时刻的隐状态;
步骤3:根据用户的隐状态以及用户各个时刻的真实行为计算辅助损失;
步骤4:将每个session提取的核心向后传递捕获用户动态兴趣,描述为:
其中ii,1表示第一阶段第i个session的输入数据,表示第i-1个session第t时刻(最后时刻)第二层GRU提取出的用户核心兴趣,表示第i个session开始时刻用户行为向量的原始输入,角标b表示用户行为(behavior)特征;
步骤5:根据用户行为与候选物品的相似度,计算对应的attention值;
步骤6:通过辅助损失函数以及目标损失函数来定义模型的损失,使用交叉熵损失函数来定义模型损失函数,描述为:
L=Ltarget+α*Laux
其中,L为系统全局损失值,Ltarget表示预测点击率与真实点击率的损失函数,Laux表示辅助损失函数,α为超参,表示辅助损失所占比重;
步骤7:在得到全局损失L后,通过随机梯度下降方法计算得到整个神经网络模型参数更新迭代的大小及方向,设定迭代更新轮数,最终能够得到模型收敛的参数,在得到模型的所有训练后的参数以后,再将用户的历史行为以及候选物品作为输入,模型最终能够计算出点击率,即该用户点击候选物品的概率,从而能够点击率预测任务。
所述步骤1中,所述用户属性描述、用户行为列表、广告信息以及上下文信息,分别用one-hot编码表示成xp,xb,xa,xc;例如用户的性别,[0,1]定义为男性,[1,0]定义为女性;向量的维度表示该特征类别的个数。
所述步骤3中,辅助损失描述为:
所述步骤5中,attention值描述为:
其中,at为t时刻的隐状态与被预测物品ea之间的attention值,ea表示目标广告的embedding向量,W为为系数矩阵,是为了使得nh维的ht向量与na维的ea向量能够相乘;结合attention值与GRU的公式,更新门的值考虑attention值的大小,其中ht′如前所述分别是更新状态和隐状态。
本发明的有益效果在于重点研究了CTR预测下序列数据中的长序列问题,为了缓解LSTM/GRU梯度消失的臭名昭著的问题,提出了CIN模型,将一个长序列划分为多个子序列,并在每个子序列中提取用户的核心兴趣,从每个子序列中提取的核心兴趣被传递给下一个子序列,以此模型就完成了整个长序列中用户兴趣的学习。通过提取用户的核心兴趣,这是用户在更高层次和更稳定的兴趣传递给下一个子序列的数据中的噪声较小,更有利于学习用户的兴趣。值得一提的是,本发明不仅可以用于推荐系统中的兴趣提取,还可以用于处理其他序列数据中的长序列问题。在推荐系统序列化预测场景有很多应用前景。
附图说明
图1为本发明基于核心兴趣网络的点击率预测方法流程图。
图2为核心兴趣传递模型的示意图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
本发明共有图1和图2,如图1所示,本发明的具体步骤如下:
步骤一:获取用户属性描述、用户行为列表、广告信息以及上下文信息。分别用one-hot编码表示成xp,xb,xa,xc。
步骤二:将用户行为序列按session切分,每个session中依据用户行为数据,提取用户核心兴趣。
ut=σ(Wuit+Uuht-1+bu),
rt=σ(Writ+Urht-1+br),
步骤三:根据用户的隐状态以及用户各个时刻的真实行为来计算辅助损失。
步骤四:将每个session提取的核心向后传递捕获用户动态兴趣。
步骤五:根据用户行为与候选物品的相似度,计算对应的attention值。
步骤六:通过辅助损失函数以及目标损失函数来定义模型的损失,使用交叉熵损失函数来定义模型损失函数。
L=Ltarget+α*Laux
步骤七:通过随机梯度下降更新模型参数,依据样本数据学习得到优化模型。最终能够依据用户核心兴趣对物品点击率进行预测。
本发明为基于核心兴趣网络的点击率预测方法,使用多层GRU提取每个session中用户的核心兴趣;将每个session提取的核心向后传递捕获用户动态兴趣;基于用户核心兴趣、用户特征以及物品属性,得到最终用户对物品的点击率预测值。
以上所述仅为本发明的较佳实施列,对于发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在发明权利要求所限定的精神和范围内可对其进行许多改变、修改等,但都将落入本发明的保护范围内。
Claims (4)
1.一种基于核心兴趣网络的点击率预测方法,其特征在于包括下述步骤:
步骤1:获取用户属性描述、用户行为列表、广告信息以及上下文信息;
步骤2:将用户行为序列按session切分,每个session中依据用户行为数据,提取用户核心兴趣:
ut=σ(Wuit+Uuht-1+bu),
rt=σ(Writ+Urht-1+br),
其中,ut表示更新门,rt表示重置门,表示t时刻产生的新记忆,ht表示t时刻对应的隐藏状态,σ表示sigmoid激活函数,是元素级的点积,Wu、Wr、Wh以及Uu、Ur、Uh表示系数参数,it表示第t个被输入的用户行为的向量表示,ht表示用户t时刻的隐状态;
步骤3:根据用户的隐状态以及用户各个时刻的真实行为计算辅助损失;
步骤4:将每个session提取的核心向后传递捕获用户动态兴趣,描述为:
其中ii,1表示第一阶段第i个session的输入数据,表示第i-1个session第t时刻(最后时刻)第二层GRU提取出的用户核心兴趣,表示第i个session开始时刻用户行为向量的原始输入,角标b表示用户行为(behavior)特征;
步骤5:根据用户行为与候选物品的相似度,计算对应的attention值;
步骤6:通过辅助损失函数以及目标损失函数来定义模型的损失,使用交叉熵损失函数来定义模型损失函数,描述为:
L=Ltarget+α*Laux
其中,L为系统全局损失值,Ltarget表示预测点击率与真实点击率的损失函数,Laux表示辅助损失函数,α为超参,表示辅助损失所占比重;
步骤7:在得到全局损失L后,通过随机梯度下降方法计算得到整个神经网络模型参数更新迭代的大小及方向,设定迭代更新轮数,最终能够得到模型收敛的参数,在得到模型的所有训练后的参数以后,再将用户的历史行为以及候选物品作为输入,模型最终能够计算出点击率,即该用户点击候选物品的概率,从而能够点击率预测任务。
2.根据权利要求1所述的基于核心兴趣网络的点击率预测方法,其特征在于:
所述步骤1中,所述用户属性描述、用户行为列表、广告信息以及上下文信息,分别用one-hot编码表示成xp,xb,xa,xc。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110369914.5A CN113034196A (zh) | 2021-04-07 | 2021-04-07 | 一种基于核心兴趣网络的点击率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110369914.5A CN113034196A (zh) | 2021-04-07 | 2021-04-07 | 一种基于核心兴趣网络的点击率预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113034196A true CN113034196A (zh) | 2021-06-25 |
Family
ID=76453877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110369914.5A Pending CN113034196A (zh) | 2021-04-07 | 2021-04-07 | 一种基于核心兴趣网络的点击率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113034196A (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163886A (zh) * | 2020-09-30 | 2021-01-01 | 大连海事大学 | 一种基于强化学习的实时竞价广告资源分配方法 |
CN112288471A (zh) * | 2020-10-26 | 2021-01-29 | 杭州电子科技大学 | 一种基于用户历史行为序列的广告点击率预测方法 |
-
2021
- 2021-04-07 CN CN202110369914.5A patent/CN113034196A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163886A (zh) * | 2020-09-30 | 2021-01-01 | 大连海事大学 | 一种基于强化学习的实时竞价广告资源分配方法 |
CN112288471A (zh) * | 2020-10-26 | 2021-01-29 | 杭州电子科技大学 | 一种基于用户历史行为序列的广告点击率预测方法 |
Non-Patent Citations (1)
Title |
---|
EN XU等: "Core Interest Network for Click-Through Rate Prediction", ACM TRANSACTIONS ON KNOWLEDGE DISCOVERY FROM DATA, vol. 15, no. 2, pages 1 - 16 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
You et al. | Image-based appraisal of real estate properties | |
CN111080400B (zh) | 一种基于门控图卷积网络的商品推荐方法及系统、存储介质 | |
CN111339415B (zh) | 一种基于多交互式注意力网络的点击率预测方法与装置 | |
CN110008408A (zh) | 一种会话推荐方法、系统、设备及介质 | |
CN112364976B (zh) | 基于会话推荐系统的用户偏好预测方法 | |
US10552863B1 (en) | Machine learning approach for causal effect estimation | |
CN112541124B (zh) | 生成多任务模型的方法、装置、设备、介质及程序产品 | |
CN112967112B (zh) | 一种自注意力机制和图神经网络的电商推荐方法 | |
CN112381581A (zh) | 一种基于改进Transformer的广告点击率预估方法 | |
US20210342701A1 (en) | Deep learning based visual compatibility prediction for bundle recommendations | |
CN112288471B (zh) | 一种基于用户历史行为序列的广告点击率预测方法 | |
US11501110B2 (en) | Descriptor learning method for the detection and location of objects in a video | |
CN115658864A (zh) | 一种基于图神经网络和兴趣注意力网络的会话推荐方法 | |
CN110689110B (zh) | 处理交互事件的方法及装置 | |
Wang | A survey of online advertising click-through rate prediction models | |
CN114595383A (zh) | 一种基于会话序列的海洋环境数据推荐方法及系统 | |
CN112053188A (zh) | 一种基于混合深度神经网络模型的互联网广告推荐方法 | |
CN111667024A (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN114529077A (zh) | 一种基于会话内异构行为的点击率预测方法 | |
JPWO2017010514A1 (ja) | 画像検索装置及び方法、撮影時刻推定装置及び方法、反復構造抽出装置及び方法、並びにプログラム | |
CN116975686A (zh) | 训练学生模型的方法、行为预测方法和装置 | |
CN113034196A (zh) | 一种基于核心兴趣网络的点击率预测方法 | |
CN115618079A (zh) | 会话推荐方法、装置、电子设备及存储介质 | |
CN114519600A (zh) | 一种融合相邻节点方差的图神经网络ctr预估算法 | |
CN115564532A (zh) | 序列推荐模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |