CN113641811B

CN113641811B - 促进购买行为的会话推荐方法、系统、设备及存储介质

Info

Publication number: CN113641811B
Application number: CN202110953476.7A
Authority: CN
Inventors: 周凡; 李伊昕; 苏卓
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2021-08-19
Filing date: 2021-08-19
Publication date: 2023-09-01
Anticipated expiration: 2041-08-19
Also published as: CN113641811A

Abstract

本发明公开了一种促进购买行为的会话推荐方法与系统。包括：收集会话数据集并进行预处理与数据增强；把数据增强后的数据集建模为图结构输入到GNN网络中，并且通过停留时间的注意力层得到初步会话表示并存储在历史会话表示内存中；在该内存中查找与待推荐的会话相似度最高的若干个邻域会话表示，之后和初步会话表示连接得到最终会话表示；再与会话数据集中的所有物品计算余弦相似度，相似度最高的物品为推荐结果。本发明利用历史购买会话作为协同信息，可以有效建模用户的购买行为，并且在给用户进行推荐时，考虑历史会话中和用户存在相同偏好的用户行为，使得推荐算法可以更有效地预测用户的真实需求，从而给出更加准确的推荐结果。

Description

促进购买行为的会话推荐方法、系统、设备及存储介质

技术领域

本发明涉及深度学习及推荐系统技术领域，具体涉及一种促进购买行为的会话推荐方法、促进购买行为的会话推荐系统、计算机设备及计算机可读存储介质。

背景技术

在信息爆炸时代，网络平台所拥有的数据信息是非常巨大的，对于用户而言，需要在庞大的数据库中查找到自己需要的信息是非常困难的，对于平台而言，为用户提供他们所需要的信息，可以达到留存用户、吸引用户、从而提升平台效益的效果。而推荐系统正是起到这样的桥梁作用，即根据用户的个人需求从海量的数据中给出符合用户偏好的推荐结果。会话指的是用户在一段时间内和网站等平台产生的交互。会话推荐是推荐系统中一个专门的领域，专门在匿名/非登录场景下根据用户短时间内的交互行为来预测用户意图，给出符合需求的推荐结果，由于用户行为的不确定性和信息的有限性，这个问题很相比于传统的推荐场景更具有挑战性。但是通过引入深度学习技术，对大量的用户行为进行分析和建模，可以在用户信息有限的情况下，仅仅根据用户的若干次交互给出更加符合用户和平台需求的推荐结果。

目前的现有技术之一，论文“Session-based recommendations with recurrentneural networks”所提出的基于循环神经网络的会话推荐模型，将用户行为建模为序列，综合考虑用户行为在整个会话上表现出的偏好，给出推荐结果。该技术包括：(1)对数据进行预处理，得到按时间排序的会话序列；(2)将会话序列输入到RNN模型中，得到序列的向量化表示；(3)对数据集中的所有项的向量表示和当前会话序列的向量表示计算余弦相似度，将相似度高的项推荐给用户。该技术的缺点是：(1)当一个会话中用户的行为数量比较少时，也就是说会话序列很短的情况下，这种方法较难捕获用户的行为表示；(2)物品之前的转移模式在会话推荐中是十分重要的特征，但该技术只对相邻的两个物品的单项转移向量进行建模，而忽略了会话中其他的物品之间的关联程度。

目前的现有技术之二，论文“Session-Based Recommendation with GraphNeural Networks”所提出的基于GNN网络的会话推荐方法，将用户的行为建模为图，综合考虑用户的交互行为中不同物品间的转移，给出推荐结果。该技术包括：(1)对数据集中的数据进行预处理，将会话数据建模为图结构的数据；(2)对会话数据输出到GNN模型中进行训练，得到会话表示向量；(3)用得到的会话表示向量和数据库中的物品表示向量进行相似度计算，得到推荐结果。该技术的缺点是：(1)将会话数据建模为图，一定程度上损失了时序信息，这个方法中没有综合考虑对于长序列而言用户的偏好可能发生变化；(2)没有考虑平台噪声的存在，比如各种各样的物品可能会由于广告等原因被链接到同一商品，但是并不代表广告物品和所有物品都具有真实意义上的相关度。

发明内容

本发明的目的是克服现有方法的不足，提出了一种促进购买行为的会话推荐方法、系统、设备及存储介质。本发明解决的主要问题，一是如何设计历史会话的表示方式；二是如何根据当前会话从历史的含有购买行为的会话中提取出邻域会话；三是如何根据上述结果得到更合适的推荐结果。

为了解决上述问题，本发明提出了一种促进购买行为的会话推荐方法，所述方法包括：

从公开的数据集中收集包含物品信息、用户停留时间、用户购买行为在内的用户在电商平台的会话数据集；

对所述会话数据集进行预处理，包括：对会话数据进行时间上的排序得到按时间排列的会话序列，去除掉只有一次点击的会话、删除出现频率过低的点击项；

将所述预处理后的会话数据集根据是否产生购买行为划分为两个部分，点击数据集和购买数据集；

对所述点击数据集和所述购买数据集进行数据增强，方式是对每一个数据进行片段式截取；

把所述数据增强后的点击数据集和购买数据集建模为图结构，之后输入到GNN网络中，并且通过一个停留时间的注意力层，得到初步会话向量化表示数据集；

将所述初步会话向量化表示数据集中产生了购买行为的会话存储在历史会话向量化表示内存中；

对于待推荐的会话，在所述历史会话向量化表示内存中查找相似度最高的若干个邻域会话向量化表示，并且将这些邻域会话向量化表示和初步会话向量化表示数据集通过一个融合层连接到一起，得到最终会话向量化表示；

用所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。

优选地，所述会话数据集，其会话数据中的每一项还包含了物品的序号item_id和物品被点击的时间戳time_stamp。

优选地，所述对会话数据进行时间上的排序得到按时间排列的会话序列，具体为：

从会话数据集中获取共N个会话数据，用s表示会话，v表示被点击的物品项，将会话中的所有物品项v按所述物品被点击的时间戳time_stamp进行排序，则一个会话序列表示为s＝<v₁，v₂，v₃…v_t>，其中v的下标表示点击的先后顺序，t表示当前时间；

通过所述每一个物品被点击的时间戳，计算相邻相似点击的所述time_stamp之差，得到会话的停留时间sdwell＝<t₁，t₂，t₃…0>，由于最后一项点击的停留时间未知因此将其设置为0，sdwell中的各项与s中的各项一一对应。

优选地，所述将所述预处理后的会话数据集根据是否产生购买行为划分为两个部分，点击数据集和购买数据集，具体为：

在所述预处理后的会话数据集中，将存在购买行为的会话数据集从点击数据集中筛选出来，得到购买数据集BuySession和不存在购买行为的点击数据集ClickSession；

其中，购买数据集BuySession由两个部分组成，一个是会话序列集S＝{s₁，s₂，...s_N}，另一个是停留时间集Sdwell＝{sdwell₁，sdwell₂，...sdwell_N}，两个部分的数据一一对应。

优选地，所述把所述数据增强后的点击数据集和购买数据集建模为图结构，之后输入到GNN网络中，并且通过一个停留时间的注意力层，得到初步会话向量化表示数据集，具体为：

把所述数据增强后的点击数据集和购买数据集建模为图结构，输入到GNN模型中，经过训练后得到会话图中每一个图节点的向量化表示；

所述会话图中每一个图节点的向量化表示，代表了一个物品在综合了相邻物品特征后的向量表示X＝{x₁，x₂，...，x_n}；

将所述会话图中每一个图节点的向量化表示通过停留时间注意力层，按照停留时间的相对大小为权重结合起来得到每一个会话的向量化表示，其中最后一次点击的向量化表示的权值设置为1，对于会话s＝<v₁，v₂，v₃…v_k-1，v_k>，停留时间sdwell＝<t₁，t₂，t₃…tk-₁，0>，其中k为会话s所包含的点击次数，其初步会话向量化表示为：

优选地，所述将所述初步会话向量化表示数据集中产生了购买行为的会话存储在历史会话向量化表示内存中，具体为：

将所述初步会话向量化表示数据集中产生了购买行为的会话向量化表示存储起来，该集合记为M，用作后续的邻域信息查找，其中P代表购买会话数据集中的会话个数，/>表示第i会话在进行了上述数据增强后长度为j的会话向量化表示。

优选地，所述对于待推荐的会话，在所述历史会话向量化表示内存中查找相似度最高的若干个邻域会话向量化表示，并且将这些邻域会话向量化表示和初步会话向量化表示数据集通过一个融合层连接到一起，得到最终会话向量化表示，具体为：

对于每一个待推荐的当前会话h_current，在所述集合M的购买会话中查找相似度最高的Y个会话M_neighbor＝{m₁，m₂，...m_Y}，将他们的向量化表示融合起来，得到邻域会话向量化表示：

其中权值w_r由相似度决定，w_r＝Softmax(sim(h_current，m_r)，其中sim代表两个向量的余弦相似度计算：

将当前会话向量化表示和所述邻域会话向量化表示连接起来得到最终会话向量化表示z：

z＝αh_current+(1-α)m^neighbor，

其中参数α＝σ(W₁m_current+W₂m_neighbor)，σ代表sigmoid函数，W₁，W₂是可以训练的模型参数。

优选地，用所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果，具体为：

得到所述最终会话向量化表示后，计算所述最终会话向量化表示和所述物品向量化表示X的相似度得分value作为推荐依据，相似度得分value计算如下：

value＝softmax(z^TX)，其中T表示向量转秩；

得分最高的K个物品形成最终的推荐物品列表。

相应地，本发明还提供了一种促进购买行为的会话推荐系统，包括：

数据预处理单元，用于从公开的数据集中收集用户在电商平台的会话数据集，并对会话数据集进行预处理，包括：对会话数据进行时间上的排序得到按时间排列的会话序列，去除掉只有一次点击的会话、删除出现频率过低的点击项，之后将预处理后的会话数据集根据是否产生购买行为划分为点击数据集和购买数据集并进行数据增强；

历史会话建立单元，用于把所述数据增强后的点击数据集和购买数据集建模为图结构，之后输入到GNN网络中，并且通过一个停留时间的注意力层，得到初步会话向量化表示数据集，之后将其中产生了购买行为的会话存储在历史会话向量化表示内存中；

会话购买推荐单元，用于在所述历史会话向量化表示内存中查找相似度最高的若干个邻域会话向量化表示，并且将这些邻域会话向量化表示和初步会话向量化表示数据集通过一个融合层连接到一起，得到最终会话向量化表示，之后与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。

相应地，本发明还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行上述促进购买行为的会话推荐方法的步骤。

相应地，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述促进购买行为的会话推荐方法的步骤。

实施本发明，具有如下有益效果：

本发明通过对存在购买行为的历史会话进行表示和存储，利用历史购买会话作为协同信息，可以有效建模用户的购买行为模式，并且在给当前用户进行推荐时，考虑历史会话中和当前用户存在相同偏好的用户行为，给出推荐结果，使得新的推荐算法可以更有效地预测用户的真实需求，从而给出更加准确的推荐结果。

附图说明

图1是本发明实施例的促进购买行为的会话推荐方法的总体流程图；

图2是本发明实施例的促进购买行为的会话推荐系统的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明实施例的基于监控视频的船舶识别方法的总体流程图，如图1所示，该方法包括：

S1，从公开的数据集中收集包含物品信息、用户停留时间、用户购买行为在内的用户在电商平台的会话数据集；

S2，对所述会话数据集进行预处理，包括：对会话数据进行时间上的排序得到按时间排列的会话序列，去除掉只有一次点击的会话、删除出现频率过低的点击项；

S3，将所述预处理后的会话数据集根据是否产生购买行为划分为两个部分，点击数据集和购买数据集；

S4，对所述点击数据集和所述购买数据集进行数据增强，方式是对每一个数据进行片段式截取；

S5，把所述数据增强后的点击数据集和购买数据集建模为图结构，之后输入到GNN网络中，并且通过一个停留时间的注意力层，得到初步会话向量化表示数据集；

S6，将所述初步会话向量化表示数据集中产生了购买行为的会话存储在历史会话向量化表示内存中；

S7，对于待推荐的会话，在所述历史会话向量化表示内存中查找相似度最高的若干个邻域会话向量化表示，并且将这些邻域会话向量化表示和初步会话向量化表示数据集通过一个融合层连接到一起，得到最终会话向量化表示；

S8，用所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。

步骤S1，具体如下：

从公开数据平台上得到包含物品类别信息、用户停留时间、用户购买行为的会话数据集，会话数据中的每一项还包含了物品的序号item_id和物品被点击的时间戳time_stamp。

步骤S2，具体如下：

S2-1，从会话数据集中获取共N个会话数据，用s表示会话，v表示被点击的物品项，将会话中的所有物品项v按所述物品被点击的时间戳time_stamp进行排序，则一个会话序列表示为s＝<v₁，v₂，v₃…vt>，其中v的下标表示点击的先后顺序，t表示当前时间；

S2-2，通过所述每一个物品被点击的时间戳，计算相邻相似点击的所述time_stamp之差，得到会话的停留时间sdwell＝<t₁，t₂，t₃…0>，由于最后一项点击的停留时间未知因此将其设置为0，sdwell中的各项与s中的各项一一对应；

S2-3，对S2-1预处理后得到的会话进行进一步预处理，本实施例中，去除掉整个数据库中出现次数少于5次的项，然后去除掉会话长度少于2的数据。

步骤S3，具体如下：

步骤S4，具体如下：

对S3得到的两个数据集进行相同方式的数据增强，采用的方式是截取序列前缀，比如对于会话s₁＝<v₁，v₂，v₃，v₄，v₅>，经数据增强后得到4个会话序列即<v1，v2，>、<v1，v2，v₃>、<v₁，v₂，v₃，v₄>，<v₁，v₂，v₃，v₄，v₅>，4个停留时间序列为<t₁，0>，<t₁，t₂，0>，<t₁，t₂，t₃，0>，<t₁，t₂，t₃，t₄，0>。

步骤S5，具体如下：

S5-1，把S4中数据增强后的点击数据集和购买数据集建模为图结构，输入到GNN模型中，经过训练后得到会话图中每一个图节点的向量化表示；

会话图中每一个图节点的向量化表示，代表了一个物品在综合了相邻物品特征后的向量表示X＝{x₁，x₂，...，x_n}；

S5-2，将S5-1会话图中每一个图节点的向量化表示通过停留时间注意力层，按照停留时间的相对大小为权重结合起来得到每一个会话的向量化表示，其中最后一次点击的向量化表示的权值设置为1，对于会话s＝<v₁，v₂，v₃…v_k-1，v_k>，停留时间sdwell＝<t₁，t₂，t₃…t_k-1，0>，其中k为会话s所包含的点击次数，其初步会话向量化表示为：

步骤S6，具体如下：

比如对于会话s₁＝<v₁，v₂，v₃，v₄，v₅>进行数据增强后的结果是对应到M就是/>

步骤S7，具体如下：

S7-1，对于每一个待推荐的当前会话h_current，在所述集合M的购买会话中查找相似度最高的Y个会话M_neighbor＝{m₁，m2，...m_Y}，将他们的向量化表示融合起来，得到邻域会话向量化表示：

S7-2，将当前会话向量化表示和所述邻域会话向量化表示连接起来得到最终会话向量化表示z：

z＝αh_current+(1-α)m^neighbor，

步骤S8，具体如下：

value＝softmax(z^TX)，其中T表示向量转秩；

得分最高的K个物品形成最终的推荐物品列表。

相应地，本发明还提供了一种促进购买行为的会话推荐系统，如图2所示，包括：

数据预处理单元1，用于从公开的数据集中收集用户在电商平台的会话数据集，并对会话数据集进行预处理，包括：对会话数据进行时间上的排序得到按时间排列的会话序列，去除掉只有一次点击的会话、删除出现频率过低的点击项，之后将预处理后的会话数据集根据是否产生购买行为划分为点击数据集和购买数据集并进行数据增强；

历史会话建立单元2，用于把所述数据增强后的点击数据集和购买数据集建模为图结构，之后输入到GNN网络中，并且通过一个停留时间的注意力层，得到初步会话向量化表示数据集，之后将其中产生了购买行为的会话存储在历史会话向量化表示内存中；

会话购买推荐单元3，用于在所述历史会话向量化表示内存中查找相似度最高的若干个邻域会话向量化表示，并且将这些邻域会话向量化表示和初步会话向量化表示数据集通过一个融合层连接到一起，得到最终会话向量化表示，之后与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果。

因此，本发明通过对存在购买行为的历史会话进行表示和存储，利用历史购买会话作为协同信息，可以有效建模用户的购买行为模式，并且在给当前用户进行推荐时，考虑历史会话中和当前用户存在相同偏好的用户行为，给出推荐结果，使得新的推荐算法可以更有效地预测用户的真实需求，从而给出更加准确的推荐结果。

相应地，本发明还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述促进购买行为的会话推荐方法的步骤。同时，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述促进购买行为的会话推荐方法的步骤。

以上对本发明实施例所提供的促进购买行为的会话推荐方法、系统、设备及存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种促进购买行为的会话推荐方法，其特征在于，所述方法包括：

用所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果；

其中，所述会话数据集，其会话数据中的每一项还包含了物品的序号item_id和物品被点击的时间戳time_stamp；

其中，所述对会话数据进行时间上的排序得到按时间排列的会话序列，具体为：

从会话数据集中获取共N个会话数据，用s表示会话，v表示被点击的物品项，将会话中的所有物品项v按所述物品被点击的时间戳time_stamp进行排序，则一个会话序列可以表示为s＝<v₁,v₂,v₃…v_t>,其中v的下标表示点击的先后顺序，t表示当前时间；

通过所述每一个物品被点击的时间戳，计算相邻相似点击的所述time_stamp之差，得到会话的停留时间sdwell＝<t₁,t₂,t₃…0>，由于最后一项点击的停留时间未知因此将其设置为0，sdwell中的各项与s中的各项一一对应；

其中，所述把所述数据增强后的点击数据集和购买数据集建模为图结构，之后输入到GNN网络中，并且通过一个停留时间的注意力层，得到初步会话向量化表示数据集，具体为：

所述会话图中每一个图节点的向量化表示，代表了一个物品在综合了相邻物品特征后的向量表示X＝{x₁,x₂,…,x_n}；

将所述会话图中每一个图节点的向量化表示通过停留时间注意力层，按照停留时间的相对大小为权重结合起来得到每一个会话的向量化表示，其中最后一次点击的向量化表示的权值设置为1，对于会话s＝<v₁,v₂,v₃…v_k-1,v_k>，停留时间sdwell＝<t₁,t₂,t₃…t_k-1,0>，其中k为会话s所包含的点击次数，其初步会话向量化表示为：

2.如权利要求1所述的促进购买行为的会话推荐方法，其特征在于，所述将所述预处理后的会话数据集根据是否产生购买行为划分为两个部分，点击数据集和购买数据集，具体为：

其中，购买数据集BuySession由两个部分组成，一个是会话序列集S＝{s₁,s₂,…s_N}，另一个是停留时间集sdwell＝{sdwell₁,sdwell₂,…sdwell_N}，两个部分的数据一一对应。

3.如权利要求1所述的促进购买行为的会话推荐方法，其特征在于，所述将所述初步会话向量化表示数据集中产生了购买行为的会话存储在历史会话向量化表示内存中，具体为：

4.如权利要求3所述的促进购买行为的会话推荐方法，其特征在于，所述对于待推荐的会话，在所述历史会话向量化表示内存中查找相似度最高的若干个邻域会话向量化表示，并且将这些邻域会话向量化表示和初步会话向量化表示数据集通过一个融合层连接到一起，得到最终会话向量化表示，具体为：

对于每一个待推荐的当前会话h_current，在所述集合M的购买会话中查找相似度最高的Y个会话M_neighbor＝{m₁,m₂,…m_Y}，将他们的向量化表示融合起来，得到邻域会话向量化表示：

其中权值w_r由相似度决定，w_r＝Softmax(sim(h_current,m_r))，其中sim代表两个向量的余弦相似度计算：

z＝αh_current+(1-α)m_neighbor,

其中参数α＝σ(W₁h_current+W₂m_neighbor)，σ代表sigmoid函数，W₁，W₂是可以训练的模型参数。

5.如权利要求4所述的促进购买行为的会话推荐方法，其特征在于，所述用所述最终会话向量化表示与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果，具体为：

value＝softmax(z^TX)，其中T表示向量转秩；

得分最高的K个物品形成最终的推荐物品列表。

6.一种促进购买行为的会话推荐系统，其特征在于，所述系统包括：

会话购买推荐单元，用于在所述历史会话向量化表示内存中查找相似度最高的若干个邻域会话向量化表示，并且将这些邻域会话向量化表示和初步会话向量化表示数据集通过一个融合层连接到一起，得到最终会话向量化表示，之后与所述会话数据集中的所有物品计算余弦相似度，将相似度最高的物品作为推荐结果；

其中，所述数据预处理单元中的会话数据集，其会话数据中的每一项还包含了物品的序号item_id和物品被点击的时间戳time_stamp；

其中，所述数据预处理单元中，对会话数据进行时间上的排序得到按时间排列的会话序列，具体为：

其中，所述历史会话建立单元中，把所述数据增强后的点击数据集和购买数据集建模为图结构，之后输入到GNN网络中，并且通过一个停留时间的注意力层，得到初步会话向量化表示数据集，具体为：

7.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的方法的步骤。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。