CN114529077A

CN114529077A - 一种基于会话内异构行为的点击率预测方法

Info

Publication number: CN114529077A
Application number: CN202210137611.5A
Authority: CN
Inventors: 韩启龙; 马懋群; 宋洪涛; 徐悦竹; 李丽洁; 张海涛; 王也
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2022-02-15
Filing date: 2022-02-15
Publication date: 2022-05-24

Abstract

本发明提出了一种基于会话内异构行为的点击率预测方法，获得用户信息数据集、项目信息数据集和用户行为序列数据集，分别对三种数据集进行预处理，并分为训练集和测试集；构建基于会话内异构行为的点击率预测模型；训练构建的基于会话内异构行为的点击率预测模型；将待推荐用户的个人信息、待推荐项目信息和待推荐用户行为序列输入到训练后的基于会话内异构行为的点击率预测模型，计算用户对目标项目的点击率，根据点击率将项目进行排序，并将排序后的项目列表推荐给用户；本发明同时考虑了用户与项目之间的多种异构行为对用户兴趣的影响，利用注意力机制计算不同类型的行为对兴趣的影响权重，更加精准地提取用户的兴趣。

Description

一种基于会话内异构行为的点击率预测方法

技术领域

本发明属于点击率预测领域，具体地，涉及一种基于会话内异构行为的点击率预测方法。

背景技术

随着信息技术的不断发展，互联网上用户量及信息量的指数级递增造成了信息过载的现象，越来越多的技术倾向于利用用户与项目的历史交互信息来了解每个用户的兴趣，从而为用户提供个性化的推荐服务。而序列推荐系统与传统的协同过滤和基于内容过滤的推荐系统不同，它考虑并捕获了用户的行为序列、用户与项目之间的交互、用户偏好以及项目受欢迎程度随时间变化的演变模式。因此序列推荐能够更加精准地表达用户上下文信息、意图、目标以及项目的消费趋势，从而进行更加精准的预测和推荐。序列推荐系统主要通过对序列中用户与项目之间的交互进行建模，从而推荐用户可能感兴趣的项目。与传统的推荐系统相比，序列推荐系统的特点在于主要根据用户的历史交互信息对用户的兴趣进行预测，用户本身信息及项目本身信息仅仅作为辅助信息的一部分。而用户的历史交互信息中所包含的有效信息有限，无法直观地表达出用户的兴趣与意图。因此序列推荐系统需要根据有限的用户与项目交互序列表达出来的用户偏好来预测用户的真实兴趣并做出针对性推荐。

传统的推荐系统由于缺少相关技术的支撑，所以倾向于在学习用户表征的时候只选择从单一类型的用户-项目交互行为中进行学习，例如在点击率预测任务中仅考虑用户点击项目的交互行为。但是在现实世界中，用户与项目之间的交互并不仅仅是简单的点击浏览行为，还包括其他的行为类型，例如，用户在网上购物时通常会依次浏览多个商品进行比较，将喜欢的商品收藏或加入购物车，然后购买其中的一个或几个商品。用户进行比较的商品通常属于同一类别，而最后购买的多个商品通常在功能等方面可以进行互补且属于不同类别。因此在多行为类型的会话中存在更为复杂的依赖关系。也就是说，依赖不仅存在于同一类型的交互中(例如浏览)，还存在于不同类型的交互中(例如浏览和购买)。同时，最终用户购买的多个商品是同一个会话中用户不同兴趣的体现。而这种多类型的异构行为中隐含了更加复杂的依赖关系。

Wang等人曾提出只利用同一类型的用户行为进行预测具有局限性，忽略了其他行为所提供的信息的重要性，这些信息在目标行为稀疏且重要的情况下具有重要意义，他们提出一种基于会话的多关系图神经网络模型(MGNN-SPred)，将所有行为序列构建成了多关系项图。2016年Twardowski将异构行为的思想融入到了基于RNN的模型中进行下一项推荐的任务。2019年You等人在研究中提出了一个将时间卷积网络与GRU结合起来进行下一项预测的模型(HierTCN)，也在其中加入了异构行为的元素。

综上所述，目前的研究工作主要存在的问题是在推荐系统中所利用的用户行为类型过于单一，一定程度上忽视了在同一个会话中用户的异构行为对用户在该会话内所体现出的兴趣的影响是不同的。

发明内容

本发明针对在推荐系统中利用的用户行为类型过于单一问题，克服现有技术的不足，提出了一种基于会话内异构行为的点击率预测方法；本发明在推荐系统中考虑用户在同个会话中存在的多种兴趣，将用户的行为序列进行更加精准的划分。同时考虑了用户与项目之间的多种异构行为对用户兴趣的影响，利用注意力机制计算不同类型的行为对兴趣的影响权重，更加精准地提取用户的兴趣，并对曝光给该用户的项目的点击率进行更加精准的计算。

本发明通过以下技术方案实现：

一种基于会话内异构行为的点击率预测方法：

所述方法具体包括以下步骤：

步骤1：获得用户信息数据集、项目信息数据集和用户行为序列数据集，分别对三种数据集进行预处理，并分为训练集和测试集；

步骤2：构建基于会话内异构行为的点击率预测模型；

步骤3：训练步骤2构建的基于会话内异构行为的点击率预测模型；

步骤4：将待推荐用户的个人信息、待推荐项目信息和待推荐用户行为序列输入到步骤3训练后的基于会话内异构行为的点击率预测模型，计算用户对目标项目的点击率，根据点击率将项目进行排序，并将排序后的项目列表推荐给用户。

进一步地，在步骤1中，具体包括以下步骤：

步骤1.1：从用户个人信息数据集中，提取包括用户id、性别和年龄的用户个人信息；

步骤1.2：从项目信息数据集中，提取包括项目id、卖方id、品牌id、类别id和价格的项目具体信息；

步骤1.3：从用户行为序列数据集中，提取包括进行交互的用户id、被交互项目id以及用户对项目的交互类型的用户行为序列；

步骤1.4：对三种数据集进行预处理，以8:2的比例划分为训练集和测试集。

进一步地，在步骤2中，具体包含以下步骤：

步骤2.1：获得用户信息嵌入向量、项目信息嵌入向量和用户行为序列的嵌入向量；

其中用户信息嵌入向量表示为X^U，项目信息嵌入向量表示为X^I，用户行为序列嵌入向量表示为S；

步骤2.2：将步骤2.1中获取的用户行为序列的嵌入向量S输入到行为序列分割处理层，将行为序列分割成会话序列-1，对会话序列按照行为类型及交互项目类型进一步分割为会话序列-2，利用注意力机制计算每个行为类型的影响权重并形成加权会话序列；

步骤2.3：将步骤2.2中形成的加权会话序列输入到transformer编码层中进行兴趣提取，捕获会话内部的依赖关系，输出基于会话内依赖的兴趣序列；

步骤2.4：将步骤2.3中输出的基于会话内依赖的兴趣序列输入到一个Bi-LSTM层中进一步提取用户兴趣，捕获会话间的依赖关系，输出基于会话内和会话间依赖的兴趣序列。

进一步地，在步骤2.2中，

通过将用户行为序列的嵌入向量S以设定时间为间隔进行分割，并过滤掉不含有行为序列的嵌入向量以形成会话序列-1；

通过在每个会话序列-1上进一步按照交互项目的类别分割成更小的会话，最终将用户行为序列的嵌入向量S划分成多个会话Q；

其中第k个会话可以表示为Q_k＝[b₁；…；b_i；…；b_T]，T是会话长度，b_i是用户在一个会话中的第i次交互的向量表示；

对于每一个会话序列，根据用户与项目的四种交互类型将会话表达为Q_k＝[B₁；B₂；B₃；B₄]，所述四种交互类型分别为浏览、收藏、加入购物车以及购买；其中第k个行为类型的行为序列为

n_k为以第k种行为类型进行交互的次数，N_k是四种行为中最大交互次数，对于每个B_k中的

到

以0补全；

加权会话序列为将四种行为类型输入到一个注意力层中，利用注意力机制计算每个行为类型的影响因子，计算第i个行为的影响因子α_i；

公式为：

其中W^B是训练的权重矩阵；

加权后行为向量为：

最终输出加权后的k个会话Q′，且

进一步地，在步骤2.3中，

首先为每个会话添加一个位置编码BE：

BE_(k,t，c)代表了第k个会话中第t个物品的嵌入向量的第c个位置的偏置项，

为第k个会话的偏置项，

为第t个物品的偏置项，

为第c个位置的偏置项，将偏置项加入到会话表示中进行更新，更新后的会话为：Q′＝Q′+BE；

利用多头自注意机制对这种关系进行建模，令Q′_k＝[Q′_k1；…；Q′_kh；…；Q′_kH]，其中Q′_kh是Q′_k的第h个头部，H是头的数量，第h个头的输出为：head_h＝Attention(Q′_khW^Q，Q′_khW^K，Q′_khW^V)，其中W^Q，W^K，W^V都是线性矩阵，将所有的头部输出联结起来，输入到一个前馈神经网络中，其输出为：

其中FFN是前馈神经网络，W^O是线性矩阵；

最后经过一个平均池化操作，得到兴趣序列I_k：

将其输入到一个激活单元中计算带权重的兴趣表征，计算方式如下：

其中W^I是符合维度的线性矩阵。

进一步地，在步骤2.4中，首先计算Bi-LSTM的每个隐藏状态并形成混合了上下文信息的兴趣表征：

其中

和

分别是LSTM前向传播和反向传播对应时刻的隐藏状态；

然后将所述计算Bi-LSTM的每个隐藏状态并形成混合了上下文信息的兴趣表征输入到一个激活单元中计算带权重且混合了上下文信息的兴趣表征，计算方式如下：

其中W^H是符合维度的线性矩阵。

进一步地，在步骤3中，具体包括如下步骤：

步骤3.1：将训练集中的数据输入到步骤2所述的基于会话内异构行为的点击率预测模型，得到基于会话内依赖的兴趣序列以及基于会话内和会话间依赖的兴趣序列；

步骤3.2：将用户信息嵌入表示、项目信息嵌入表示、基于会话内依赖的兴趣序列以及基于会话内和会话间依赖的兴趣序列输入到预测模块，得到用户对于目标项目的点击概率；

步骤3.3：通过计算预测的点击率与真实点击率之间的误差来更新模型的参数并优化损失函数，训练得到最优的基于会话内异构行为的点击率预测模型；

所述失函数具体计算如下：

其中y_c为样本真实值，

为预测值。

进一步地，在步骤4中，将所述项目点击率进行排序，取前k个得分最高的项目推荐给用户。

一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

一种计算机可读存储介质，用于存储计算机指令，所述计算机指令被处理器执行时实现上述任一项所述方法的步骤。

本发明有益效果

本发明在推荐系统中考虑用户在同个会话中存在的多种兴趣，将用户的行为序列进行更加精准的划分，以获得点击率预测效果的提升；同时还通过考虑同一会话内的异构行为对用户在该会话内的兴趣的影响不同，不仅提高了对用户兴趣预测的准确性，还进一步地提升了对广告点击率的预测效果。

本发明考虑了用户与项目之间的多种异构行为对用户兴趣的影响，利用注意力机制计算不同类型的行为对兴趣的影响权重，更加精准地提取用户的兴趣，并对曝光给该用户的项目的点击率进行更加精准的计算。

附图说明

图1为本发明所述方法的流程图；

图2为本发明所述方法的模型框架图；

图3为本发明所述方法的分割处理层部分结构图；

图4为本发明所述方法的transformer编码层部分结构图；

图5为本发明所述方法的Bi-LSTM部分结构图；

图6为本发明所述方法最终预测部分结构图。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

结合图1至图6。

一种基于会话内异构行为的点击率预测方法：

所述方法具体包括以下步骤：

步骤2：构建基于会话内异构行为的点击率预测模型；

在步骤1中，具体包括以下步骤：

在步骤2中，具体包含如下步骤：

通过嵌入将用户和项目的稀疏特征转换为低维密集向量，其中用户信息嵌入向量表示为X^U，项目信息嵌入向量表示为X^I，用户行为序列嵌入向量表示为S；

在步骤2.2中，

通过将用户行为序列的嵌入向量S以设定时间为间隔进行分割，并过滤掉不含有行为序列的嵌入向量以形成会话序列-1；所述设定时间优选为30分钟；

到

以0补全；

公式为：

其中W^B是训练的权重矩阵；

加权后行为向量为：

最终输出加权后的k个会话Q′，且

在步骤2.3中，

首先为每个会话添加一个位置编码BE：

BE_(k，t，c)代表了第k个会话中第t个物品的嵌入向量的第c个位置的偏置项，

为第k个会话的偏置项，

为第t个物品的偏置项，

其中FFN是前馈神经网络，W^O是线性矩阵；

最后经过一个平均池化操作，得到兴趣序列I_k：

其中W^I是符合维度的线性矩阵。

在步骤2.4中，首先计算Bi-LSTM的每个隐藏状态并形成混合了上下文信息的兴趣表征：

其中

和

分别是LSTM前向传播和反向传播对应时刻的隐藏状态；

其中W^H是符合维度的线性矩阵。

在步骤3中，具体包括如下步骤：

对于用户U，待推荐项目I，步骤3.2所述的预测模块将用户a的信息嵌入向量X^U、待推荐项目的信息嵌入向量X^I、基于会话内依赖的兴趣序列U^I以及基于会话内和会话间依赖的兴趣序列U^H进行横向拼接，输入到以RELU作为激活函数的MLP层，然后利用softmax函数来计算用户点击目标项目的概率

所述失函数具体计算如下：

其中y_c为样本真实值，

为预测值。

在步骤4中，将所述项目点击率进行排序，取前k个得分最高的项目推荐给用户。

以上对本发明所提出的一种基于对比学习和多头自注意力机制的多模态情感分析方法，进行了详细介绍，对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。