CN113034196A

CN113034196A - 一种基于核心兴趣网络的点击率预测方法

Info

Publication number: CN113034196A
Application number: CN202110369914.5A
Authority: CN
Inventors: 於志文; 徐恩; 郭斌; 崔禾磊
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2021-04-07
Filing date: 2021-04-07
Publication date: 2021-06-25

Abstract

本发明提供了一种基于核心兴趣网络的点击率预测方法。聚焦点击率预测任务下的时序数据中的长序列问题。提出了核心兴趣网络模型，将一个长序列切分成多个子序列，在每个子序列中提取用户的核心兴趣，每个子序列提取的核心兴趣将向下一个子序列传递，模型完成对整个长序列用户兴趣的学习，通过提取用户的核心兴趣，这是用户在更高层次和更稳定的兴趣传递给下一个子序列的数据中的噪声较小，更有利于学习用户的兴趣。本发明不仅可以用于推荐系统中的兴趣提取，还可以用于处理其他序列数据中的长序列问题。在推荐系统序列化预测场景有很多应用前景。

Description

一种基于核心兴趣网络的点击率预测方法

技术领域

本发明涉及商品点击率预测和基于深度学习的序列化推荐系统领域，尤其是一种基于点击率预测方法，为一种基于神经网络的商品推荐方法。

背景技术

随着互联网的发展，收集到用户的信息是越来越多，如何利用该信息提取用户兴趣变得尤为重要。获取用户兴趣，给用户推荐相应的物品带给公司巨大的收益。谷歌公司百分之八十以上的收入来自广告。广告的计费模式有很多，其中传统广告计费方式有：以展示量收费，即根据给用户展示的次数收费；以长期租赁的方式收费，即固定位置展示一定的时间收取相应的费用。但随着行业的发展更细致的方式更利于双方交易，如今则出现了，以点击量付费，用户点击了广告才收取相应费用，所以对一个公司来说提高点击率CTR则格外重要。

典型的CTR预测方法有微软研究院提出的逻辑回归模型(LR)；斯坦福大学Friedman等人提出一种解决特征组合问题的方案GDBT；日本大阪大学Steffen Rendle等人于2010年提出FM模型，旨在解决数据量大而稀疏的情况下的特征组合的问题。但是由于深度学习优秀的拟合能力。并且端到端的学习方式，不需要再进行特征工程，使得深度学习在推荐领域大放异彩。

如今CTR的主流方法都是基于深度学习，而且如今已有很多代表工作。它们大致分为两类一类是基于池化的方法，将用户的各个历史行为分别学习它们的表征形式，最后通过求和或是平均的方式来学习到用户最终的兴趣，如DIN、FNN、NFM。这种方式忽略了用户行为之间的依赖性。另外一类是基于时序的方法，将用户各个时间购买的物品视为时间序列，用LSTM/GRU等模型从时序中捕获用户的兴趣，最终依据用户兴趣对候选物品进行点击率预测。然而，当序列长度相对较长时，例如超过100时，这些解决方案无法处理这种情况。这是由于RNN的消失梯度问题，即模型不能学习距离太远行为的信息。

发明内容

为了克服现有技术的不足，本发明提供一种基于核心兴趣网络的点击率预测方法。本发明提出了一种新的核心利益网络(CIN)模型，以减轻CTR预测中长序列的梯度消失问题。提出一种基于核心兴趣网络的点击率预测方法。本发明利用以下原理：本发明聚焦点击率(Click Through Rate,CTR)预测任务下的时序数据中的长序列问题。为了缓解臭名昭著的LSTM/GRU的梯度消失问题，提出了核心兴趣网络(Core Interest Network,CIN)模型，将一个长序列切分成多个子序列，在每个子序列中提取用户的核心兴趣。每个子序列提取的核心兴趣将向下一个子序列传递。通过这种方法，模型完成对整个长序列用户兴趣的学习。通过提取用户核心兴趣，这是用户更高阶更稳定的兴趣，使得传递给下一子序列数据中噪音更少，更利于学习到用户的兴趣。同时加入了多层感知机(Multi-Layer Perception,MLP)这一深度学习方法，可以从数据中学习任意函数，增加了点击率预测的准确性。

本发明解决其技术问题所采用的技术方案包括以下步骤：

步骤1：获取用户属性描述、用户行为列表、广告信息以及上下文信息；

步骤2：将用户行为序列按session切分，每个session中依据用户行为数据，提取用户核心兴趣：

u_t＝σ(W^ui_t+U^uh_t-1+b^u),

r_t＝σ(W^ri_t+U^rh_t-1+b^r),

其中，u_t表示更新门，r_t表示重置门，

表示t时刻产生的新记忆，h_t表示t时刻对应的隐藏状态，σ表示sigmoid激活函数，

是元素级的点积，W^u、W^r、W^h以及U^u、U^r、U^h表示系数参数，i_t表示第t个被输入的用户行为的向量表示，h_t表示用户t时刻的隐状态；

步骤3：根据用户的隐状态以及用户各个时刻的真实行为计算辅助损失；

步骤4：将每个session提取的核心向后传递捕获用户动态兴趣，描述为：

其中i_i,1表示第一阶段第i个session的输入数据，

表示第i-1个session第t时刻(最后时刻)第二层GRU提取出的用户核心兴趣，

表示第i个session开始时刻用户行为向量的原始输入，角标b表示用户行为(behavior)特征；

步骤5：根据用户行为与候选物品的相似度，计算对应的attention值；

步骤6：通过辅助损失函数以及目标损失函数来定义模型的损失，使用交叉熵损失函数来定义模型损失函数，描述为：

L＝L_target+α*L_aux

其中，L为系统全局损失值，L_target表示预测点击率与真实点击率的损失函数，L_aux表示辅助损失函数，α为超参，表示辅助损失所占比重；

步骤7：在得到全局损失L后，通过随机梯度下降方法计算得到整个神经网络模型参数更新迭代的大小及方向，设定迭代更新轮数，最终能够得到模型收敛的参数，在得到模型的所有训练后的参数以后，再将用户的历史行为以及候选物品作为输入，模型最终能够计算出点击率，即该用户点击候选物品的概率，从而能够点击率预测任务。

所述步骤1中，所述用户属性描述、用户行为列表、广告信息以及上下文信息，分别用one-hot编码表示成x_p，x_b，x_a，x_c；例如用户的性别，[0,1]定义为男性，[1,0]定义为女性；向量的维度表示该特征类别的个数。

所述步骤3中，辅助损失描述为：

其中，L_aux表示辅助损失，

为t时刻第i层GRU对应的隐状态，

为t+1时刻用户真实点击的物品向量表示，

为t+1时刻用户没有点击过的物品，即负样本的向量表示，另外N表示样本数量，t表示时刻。

所述步骤5中，attention值描述为：

其中，a_t为t时刻的隐状态与被预测物品e_a之间的attention值，e_a表示目标广告的embedding向量，W为

为系数矩阵，是为了使得n_h维的h_t向量与n_a维的e_a向量能够相乘；结合attention值与GRU的公式，更新门的值考虑attention值的大小，其中

h_t′如前所述分别是更新状态和隐状态。

本发明的有益效果在于重点研究了CTR预测下序列数据中的长序列问题，为了缓解LSTM/GRU梯度消失的臭名昭著的问题，提出了CIN模型，将一个长序列划分为多个子序列，并在每个子序列中提取用户的核心兴趣，从每个子序列中提取的核心兴趣被传递给下一个子序列，以此模型就完成了整个长序列中用户兴趣的学习。通过提取用户的核心兴趣，这是用户在更高层次和更稳定的兴趣传递给下一个子序列的数据中的噪声较小，更有利于学习用户的兴趣。值得一提的是，本发明不仅可以用于推荐系统中的兴趣提取，还可以用于处理其他序列数据中的长序列问题。在推荐系统序列化预测场景有很多应用前景。

附图说明

图1为本发明基于核心兴趣网络的点击率预测方法流程图。

图2为核心兴趣传递模型的示意图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

本发明共有图1和图2，如图1所示，本发明的具体步骤如下：

步骤一：获取用户属性描述、用户行为列表、广告信息以及上下文信息。分别用one-hot编码表示成x_p，x_b，x_a，x_c。

步骤二：将用户行为序列按session切分，每个session中依据用户行为数据，提取用户核心兴趣。

u_t＝σ(W^ui_t+U^uh_t-1+b^u),

r_t＝σ(W^ri_t+U^rh_t-1+b^r),

步骤三：根据用户的隐状态以及用户各个时刻的真实行为来计算辅助损失。

步骤四：将每个session提取的核心向后传递捕获用户动态兴趣。

步骤五：根据用户行为与候选物品的相似度，计算对应的attention值。

步骤六：通过辅助损失函数以及目标损失函数来定义模型的损失，使用交叉熵损失函数来定义模型损失函数。

L＝L_target+α*L_aux

步骤七：通过随机梯度下降更新模型参数，依据样本数据学习得到优化模型。最终能够依据用户核心兴趣对物品点击率进行预测。

本发明为基于核心兴趣网络的点击率预测方法，使用多层GRU提取每个session中用户的核心兴趣；将每个session提取的核心向后传递捕获用户动态兴趣；基于用户核心兴趣、用户特征以及物品属性，得到最终用户对物品的点击率预测值。

以上所述仅为本发明的较佳实施列，对于发明而言仅仅是说明性的，而非限制性的。本专业技术人员理解，在发明权利要求所限定的精神和范围内可对其进行许多改变、修改等，但都将落入本发明的保护范围内。