CN112528161B

CN112528161B - 一种基于物品点击序列优化的会话推荐方法

Info

Publication number: CN112528161B
Application number: CN202110178084.8A
Authority: CN
Inventors: 刘峤; 蓝天; 吴祖峰; 代婷婷; 宋明慧; 周乐; 曾义夫; 孙建强; 曾维智; 张志鹏; 李银强
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-02-07
Filing date: 2021-02-07
Publication date: 2021-04-30
Anticipated expiration: 2041-02-07
Also published as: CN112528161A

Abstract

本发明公开了一种基于物品点击序列优化的会话推荐方法，属于会话推荐技术领域。本发明所述方法利用最短路径方法提炼用户最感兴趣的物品序列，能够剔除长序列中多条兴趣路径对用户兴趣表征的干扰；本发明所述方法从最短路径物品序列的长度分布与用户点击的兴趣强弱出发，定义了三种用户兴趣类型，能够捕获不同类型下物品点击行为随时间变化的用户兴趣，可有效建模长序列的用户兴趣。

Description

一种基于物品点击序列优化的会话推荐方法

技术领域

本发明属于会话推荐技术领域，具体涉及一种基于物品点击序列优化的会话推荐方法。

背景技术

随着互联网的快速发展和各种电子产品的普及，京东、拼多多等电商平台走进大众视野，实现了消费模式由传统的实体店购买到线上的转变，为市民生活提供了便捷服务。对电商企业而言，电商平台物品数量庞大，不同用户间的消费兴趣迥异，如何提升用户购买率以提升收益是当前面临的一个挑战。学术界将其归纳为一个基于序列学习的会话推荐问题，即如何利用用户会话日志中记录的历史行为（如浏览、购买）预测用户下一时刻的点击行为，达到如用户购买电脑后，平台会自动推荐鼠标、键盘等物品的目的。

目前会话推荐主要存在两个技术问题，一是用户通常是匿名的，仅通过当前会话很难获得足够的上下文信息对用户兴趣进行建模；二是数据中不包含用户对物品的主观意见（如评分），因此只能通过历史行为数据对用户兴趣进行间接推测。文献 “NeuralAttentive Session-based Recommendation[C]//Proceedings of the 17th ACM CIKMon Conference on Information and Knowledge Management, Singapore, ACM Press,2017,1419-1428”和“Session-Based Recommendation with Graph Neural Networks[C]//Proceedings of the 33th AAAI Conference on Artificial Intelligence,Hawaii, USA, AAAI Press,2019, 346-353”先后把循环神经网络、注意力机制以及图神经网络应用于推荐系统用于提取用户兴趣特征。然而上述现有技术在对物品点击序列提取用户兴趣特征时，侧重于强调序列最后一个物品对预测结果的重要性，而忽视了对具有动态变化特点的用户兴趣建模，直接影响预测准确率。

发明内容

本发明的目的是克服上述现有技术的缺陷，提供一种基于物品点击序列优化的会话推荐方法。

本发明所提出的技术问题是这样解决的：

一种基于物品点击序列优化的会话推荐方法，包括以下步骤：

步骤1. 根据用户物品点击序列，构建物品字典、物品集合、物品邻接矩阵与有向物品关联图；

步骤2. 对物品字典进行初始化，形成物品字典和物品集合的高维空间表示，利用门控图卷积神经网络建模物品邻接矩阵，更新物品集合的高维空间表示，形成用户物品点击序列的高维空间表示；

步骤3. 利用最短路径算法优化用户物品点击序列，提取最短路径序列；

步骤4. 定义初始兴趣、直接兴趣和动态兴趣三种用户兴趣类型，利用用户物品点击序列的最短路径序列长度判定用户兴趣类型，并计算对应用户兴趣类型的高维空间表示；

步骤5. 基于三种用户兴趣类型的条件概率，采用全概率公式对用户物品点击序列进行建模，并用负对数似然损失函数进行模型优化，取概率最大值对应的物品作为会话推荐的下一时刻点击推荐的物品。

进一步的，步骤1的具体过程为：、

用户物品点击序列为

，

为用户第p次点击的物品，

，

为用户点击的物品数量，用户物品点击序列的物品集合为V，物品集合为物品字典的子集，物品集合中物品个数为

，

，物品邻接矩阵为

，有向物品关联图为

，其中

代表用户点击物品

后再点击

，

，

，

，

，

。

进一步的，步骤2的具体过程为：

步骤2-1. 采用方差为0.01均值为0的方式对物品字典进行初始化，得到物品字典的高维空间表示

，提取物品集合的高维空间表示

，

为物品集合中第k个物品的高维空间表示，

，

为

维矩阵，d为物品高维空间表示的维度；

步骤2-2. 利用门控图卷积神经网络建模物品邻接矩阵，更新物品集合的高维空间表示，更新后的物品集合的高维空间表示为

，

为更新后的第k个物品的高维空间表示；

其中，gatedGNN为门控图卷积神经网络函数，GRU为门控循环单元函数；

步骤2-3.将用户物品点击序列

中的所有物品用

代替，形成用户物品点击序列的高维空间表示

，

为用户第p次点击的物品的高维空间表示，

为

维矩阵。

进一步的，步骤3的具体过程为：

利用最短路径算法获取用户物品点击序列中第一个物品

到最后一个物品

的最短路径序列

，实现用户物品点击序列优化；

其中，

为迪杰斯特拉函数。

进一步的，步骤4的具体过程为：

当用户物品点击序列的最短路径序列长度为1时，用户兴趣类型为初始兴趣，建立初始兴趣ini，初始兴趣的高维空间表示为：

当用户物品点击序列的最短路径序列长度为2时，用户兴趣类型为直接兴趣，建立直接兴趣dir，直接兴趣的高维空间表示为：

其中，

为平均池化函数；

当用户物品点击序列的最短路径序列长度大于2时，用户兴趣类型为动态兴趣，统计用户物品点击序列中物品的点击频次，选择出现频次最多的前两个物品

和

作为用户最感兴趣的物品，然后再分别计算用户最感兴趣的两个物品与用户物品点击序列中最后一个物品之间的最短距离

和

：

建立动态兴趣dyn，动态兴趣的高维空间表示为：

其中，

和

分别为

和

的高维空间表示。

进一步的，步骤5的具体过程为：

由用户物品点击序列

预测下一个点击物品的概率

的具体计算方法如下：

、

和

分别为用户物品点击序列

中用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣的概率，具体计算方法如下：

其中，softmax和tanh为激活函数，

为激活函数softmax的学习参数，

、

、

、

和

为激活函数tanh的学习参数，上标T表示转置；

、

和

分别为用户物品点击序列

中用户兴趣类型分别为初始兴趣、直接兴趣和动态兴趣情形时的物品推荐概率，具体计算方法如下：

若用户物品点击序列的最短路径序列长度为1，

，

，否则，

；

若用户物品点击序列的最短路径序列长度为2，

，

，否则，

；

若用户物品点击序列的最短路径序列长度大于2，

，

，否则，

；

其中，

，

，

、

、

、

、

、

、

和

为激活函数tanh的学习参数；

取概率

中最大值对应的物品作为会话推荐的下一时刻点击推荐的物品。

本发明的有益效果是：

本发明所述方法利用最短路径方法提炼用户最感兴趣的物品序列，能够剔除长序列中多条兴趣路径对用户兴趣表征的干扰；本发明所述方法从最短路径物品序列的长度分布与用户点击的兴趣强弱出发，定义了三种用户兴趣类型，能够捕获不同类型下物品点击行为随时间变化的用户兴趣，可有效建模长序列的用户兴趣。

具体实施方式

下面结合实施例对本发明进行进一步的说明。

本实施例提供一种基于物品点击序列优化的会话推荐方法，包括以下步骤：

步骤1. 用户物品点击序列（即一条会话）为

，

为用户第p次点击的物品，

，

，且一般地

，物品邻接矩阵为

，有向物品关联图为

，其中

代表用户点击物品

后再点击

，

，

，

，

，

；

，提取物品集合的高维空间表示

，

为物品集合中第k个物品的高维空间表示，

，

为

维矩阵，

为物品高维空间表示的维度；

，

为更新后的第k个物品的高维空间表示；

其中，gatedGNN（gated graph neural network，gatedGNN）为门控图卷积神经网络函数，GRU（Gated Recurrent Unit，GRU）为门控循环单元函数；

步骤2-3.将用户物品点击序列

中的所有物品用

代替，形成用户物品点击序列的高维表示

，

为用户第p次点击的物品的高维空间表示，

为

维矩阵；

步骤3. 利用最短路径算法获取用户物品点击序列中第一个物品

到最后一个物品

的最短路径序列

，实现用户物品点击序列优化；

其中，

为迪杰斯特拉函数；

步骤4. 当用户物品点击序列的最短路径序列长度为1时，用户兴趣类型为初始兴趣，建立初始兴趣ini，初始兴趣的高维空间表示为：

其中，

为平均池化函数；

和

和

：

建立动态兴趣dyn，动态兴趣的高维空间表示为：

其中，

和

分别为

和

的高维空间表示；

步骤5. 基于三种用户兴趣类型的条件概率，采用全概率公式对用户物品点击序列进行建模，并用负对数似然损失函数进行模型优化，取概率最大值对应的物品作为会话推荐的下一时刻点击推荐的物品；

由用户物品点击序列

预测下一个点击物品的概率

的具体计算方法如下：

、

和

分别为用户物品点击序列

其中，softmax和tanh为激活函数，

为激活函数softmax的学习参数，

、

、

、

和

为激活函数tanh的学习参数，上标T表示转置；

、

和

分别为用户物品点击序列

若用户物品点击序列的最短路径序列长度为1，

，

，否则，

；

若用户物品点击序列的最短路径序列长度为2，

，

，否则，

；

若用户物品点击序列的最短路径序列长度大于2，

，

，否则，

；

其中，

，

，

、

、

、

、

、

、

和

为激活函数tanh的学习参数；

取概率

Claims

1.一种基于物品点击序列优化的会话推荐方法，其特征在于，包括以下步骤：

步骤1的具体过程为：

用户物品点击序列为

，

为用户第p次点击的物品，

，

，

，物品邻接矩阵为

，有向物品关联图为

，其中

代表用户点击物品

后再点击

，

，

，

，

，

；

步骤2的具体过程为：

，提取物品集合的高维空间表示

，

为物品集合中第k个物品的高维空间表示，

，

为

维矩阵，d为物品高维空间表示的维度；

，

为更新后的第k个物品的高维空间表示；

步骤2-3.将用户物品点击序列

中的所有物品用

代替，形成用户物品点击序列的高维空间表示

，

为用户第p次点击的物品的高维空间表示，

为

维矩阵；

步骤3的具体过程为：

利用最短路径算法获取用户物品点击序列中第一个物品

到最后一个物品

的最短路径序列

，实现用户物品点击序列优化；

其中，

为迪杰斯特拉函数；

步骤4的具体过程为：

其中，

为平均池化函数；

和

和

：

建立动态兴趣dyn，动态兴趣的高维空间表示为：

其中，

和

分别为

和

的高维空间表示；

步骤5. 基于三种用户兴趣类型的条件概率，采用全概率公式对用户物品点击序列进行建模，并用负对数似然损失函数进行模型优化，取概率最大值对应的物品作会话推荐的为下一时刻点击推荐的物品。

2.根据权利要求1所述的基于物品点击序列优化的会话推荐方法，其特征在于，步骤5的具体过程为：

由用户物品点击序列

预测下一个点击物品的概率

的具体计算方法如下：

、

和

分别为用户物品点击序列

其中，softmax和tanh为激活函数，

为激活函数softmax的学习参数，

、

、

、

和

为激活函数tanh的学习参数，上标T表示转置；

、

和

分别为用户物品点击序列

若用户物品点击序列的最短路径序列长度为1，

，

，否则，

；

若用户物品点击序列的最短路径序列长度为2，

，

，否则，

；

若用户物品点击序列的最短路径序列长度大于2，

，

，否则，

；

其中，

，

，

、

、

、

、

、

、

和

为激活函数tanh的学习参数；

取概率