CN112819575A

CN112819575A - 一种考虑重复购买行为的会话推荐方法

Info

Publication number: CN112819575A
Application number: CN202110102234.7A
Authority: CN
Inventors: 顾盼
Original assignee: China Jiliang University
Current assignee: Zhejiang Zhiduo Network Technology Co ltd
Priority date: 2021-01-26
Filing date: 2021-01-26
Publication date: 2021-05-18
Anticipated expiration: 2041-01-26
Also published as: CN112819575B

Abstract

本发明公开了一种考虑重复购买行为的会话推荐方法。该方法建立一个模型对当前会话和用户长期兴趣进行建模，并预测用户点下一个点击的物品。用户在在线平台上往往会有固定的行为习惯，因此本方法提出一种考虑重复购买行为的推荐方法，主要由四个部分组成：第一部分是根据用户当前交互会话序列，得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征，选择重复模式或探索模式。第三部分是在重复模式下，根据用户的短期、长期兴趣表征和辅助行为(购买)表征，在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下，根据用户的短期和长期兴趣表征，对不在用户历史购买的物品序列中的物品进行推荐。

Description

一种考虑重复购买行为的会话推荐方法

技术领域

本发明属于互联网服务技术领域，尤其是涉及一种考虑重复购买行为的会话推荐方法。

背景技术

随着在线服务的发展和流行，在线平台记录着大量的用户行为数据。从海量数据中找出用户最感兴趣的物品并推荐给用户，可以极大地提升用户的满意度和公司的收益。此时，推荐系统显得非常重要。推荐系统可以从海量物品中挖掘出用户最喜欢的物品。

传统的推荐方法主要包括三种。一种是一般的推荐系统，从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联，包括，协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中，忽略了用户兴趣的动态变化。第二种是基于物品序列，推荐用户下一个交互的物品，叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法，会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来，同时对用户的静态的长期兴趣和动态的当前兴趣进行建模，然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时，同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的行为习惯。比如，在电商平台上，用户经常会重复购买固定的商品；在音乐平台上，用户会经常重复听同一首歌曲。Ren等人在论文中提出了重复网络(RepeatNet)来解决重复消费推荐问题，但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为，所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中，推荐重复的物品是在当前会话中的物品序列中推荐，而用户在短时间内，也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣，用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高，那么发生重复购买行为的概率较大。所以在模型中，判断推荐模式是重复模式还是探索模式时，应该同时考虑用户的长期兴趣和用户的短期兴趣。其中，重复模式是指推荐用户历史购买过的物品，探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多，但是工业界已经有相关的应用。如，“淘宝”APP在订单页面会有“常购好货”的功能展示，从该用户历史购买商品中推荐用户当下还有可能购买的商品。

发明内容

本方法是一种基于会话的物品点击率预测方法。会话(session)指一段时间内的用户交互的物品序列，会话推荐任务是指基于当前会话中的物品序列，预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为S_T＝{x₁,x₂,…,x_τ,…,x_t}，其中，x_τ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(x_t+1|S_T)，其中，P(x_t+1|S_T)表示基于用户的当前会话S_T，用户下一个交互物品x_t+1的概率。将用户行为序列划分成会话更符合用户行为规律，一般来讲，用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(time gap)，如，淘宝将时间间隔设置为三十分钟。现在越来越多的方法，在基于会话推荐时，会同时将用户过去一段时间内的交互行为作为信息补充考虑进来，用于捕捉用户的长期兴趣，来提升推荐的准确度。此时，推荐物品的概率变成P(x_t+1|S_T,p^l)，其中p^l表示用户的长期兴趣。

对于用户的重复消费行为的研究工作较少。而用户在在线平台上会有固定的行为习惯。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题，但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为，所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中，推荐重复的物品是在当前会话中的物品序列中推荐，而用户在短时间内，也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣，用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高，那么发生重复购买行为的概率较大。所以在模型中，判断推荐模式是重复模式还是探索模式时，应该同时考虑用户的长期兴趣和用户的短期兴趣。其中，重复模式是指推荐用户历史购买过的物品，探索模式是指推荐用户从未购买过的商品。为此，本发明采用以下技术方案：

一种考虑重复购买行为的会话推荐方法，包括以下步骤：

根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列，得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为S_T＝{x₁,x₂,…,x_τ,…,x_t}，其中，x_τ代表第τ个物品，T表示当前会话的时间段下标,且S_T的向量表征为{x₁,x₂，…，x_τ，…，x_t}，其中

d是物品向量表征的长度。S_T表示当前会话中所有交互的物品序列，其中，购买行为序列为

且

A_T的向量表征为

购买行为序列的表征对于重复模式下的物品推荐至关重要，因为用户在短时间内，也就是在一个会话内，进行重复消费的可能性较低。通常，在推荐系统中，把交互序列中的交互类型叫做目标类型(target type),把购买行为类型叫做辅助类型(auxiliary type)。采用平均池(mean-pooling)对购买行为序列进行表征，如下：

其中，A_T是当前会话中的购买行为序列，

是购买行为序列A_T中购买的物品，

是物品

的向量表示，|A_T|表示序列A_T的个数，p^a是购买行为序列表征。

根据用户当前交互会话序列，得到用户短期兴趣表征p^s。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征：

z_τ＝σ(W_xz·x_τ+W_hz·h_τ-1)

r_τ＝σ(W_xr·x_τ+W_hr·h_τ-1)

其中，r_τ是重置门(reset gate)，z_τ为更新门(update gate)，这两个门控向量决定了哪些信息能作为门控循环单元的输出。

是当前记忆内容。x_τ是当前层的节点输入。

和

分别是控制更新门z_τ和重置门r_τ的参数。

和

是控制前记忆内容

的参数。⊙是元素级别的矩阵相乘，σ是sigmoid函数。GRU的输入序列为S_T＝{x₁,x₂，…,x_τ,…,x_t}。最后，当前会话序列表征为

用户短期兴趣(short-term interest)表征为前会话序列表征

更新用户长期兴趣(long-term interest)表征p^l。用户当前会话所在时间为T，用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到，此时用户历史会话表征序列为

用户长期兴趣的序列性不强，因此采用平均池(mean-pooling)获得用户较为稳定的长期兴趣表征p^l：

其中，Z_T-1为时间T之前的用户历史会话表征列表，z_τ为第τ个用户历史会话表征，|Z_T-1|表示序列Z_T-1的个数。p^l是用户的长期兴趣表征。

根据用户的短期和长期兴趣表征，在重复推荐模式和探索推荐模式中选择。在本方法中，基于用户的当前会话S_T和用户长期兴趣p^l，用户下一个交互物品x_t+1的概率P(x_t+1|S_T，p^l)可以进一步分解为：

其中，

是模型权重参数，p^s和p^l分别是用户动态的短期兴趣表征和静态的长期兴趣表征。

表示向量连接操作，softmax是softmax函数，在本方法是一个二分类方法。从公式中可以看出，选择重复模式(repeat mode)和探索模式(explore mode)是一个二分类问题，且是一个软分类(soft classification)问题。

在重复模式下，根据用户的短期、长期兴趣表征和辅助行为(购买)表征，在用户历史购买的物品序列中进行推荐。令用户历史消费序列为B_T-1＝{x₁，x₂，…，x_l}，用户历史消费序列B_T-1的向量表征为

其中上标a表示购买行为(auxiliary behavior)。那么，在重复模式下，用户历史购买的物品的推荐概率P(x_τ|r，S_T，p^l)是：

其中，

是用户历史消费序列中第τ个物品x_τ的向量表征，且W_rs，W_rl，

和

是模型参数，共同决定了第τ个物品x_τ的重要程度，V代表物品集合。p^s、p^l和p^a分别为用户短期、长期兴趣表征以及当前会话中的辅助(消费)行为表征。从公式中可以看出，历史购买的物品和当前购买物品越相似，推荐该物品的概率越低。

在探索模式下，根据用户的短期兴趣表征和用户长期兴趣，对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(x_τ|e，S_T，p^l)为：

其中，x_τ为物品集合V-B_T-1中的物品x_τ的向量表征。p^s和p^l分别为用户短期和长期兴趣表征。对于x_τ∈B_T-1的物品，

也就是推荐概率P(x_τ|e，S_T，p^l)＝0。

构建损失函数，训练模型参数。采用对数似然损失函数：

其中，

是训练集中所有的会话序列。P(x_τ|S_T，p^l)是上文中提到的概率，表示基于用户的当前会话S_T和用户长期兴趣p^l，预测用户下一个交互物品x_τ的概率，x_τ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。

本发明的有益技术效果如下：

(1)本发明是一种同时对用户长期兴趣和短期兴趣进行建模的方法。同时考虑到用户短期兴趣的动态变化性和用户长期兴趣的稳定性。

(2)本发明考虑到用户的重复消费行为，并在判断推荐模式是重复模式还是探索模式时，同时考虑用户的长期兴趣和用户的短期兴趣，更符合用户决策规律。

(3)本发明考虑到用户的重复消费行为，并在重复模式下推荐历史购买过的物品时，对用户当前会话中的购买行为进行表征，因为在一个会话内重复购买相同物品的可能性很低。

附图说明

图1为本发明一种考虑重复购买行为的会话推荐方法的流程示意图；

图2为本发明一种考虑重复购买行为的会话推荐方法的模型框架图。

具体实施方式

为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种考虑重复购买行为的会话推荐方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

会话(session)指一段时间内的用户交互的物品序列，会话推荐任务是指基于当前会话中的物品序列，预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为S_T＝{x₁，x₂,…，x_τ，…,x_t}，其中，x_τ代表第τ个物品。预测用户在当前会话中下一个感兴趣的物品用数学语言可以表示为P(x_t+1|S_T)，其中，P(x_t+1|S_T)表示基于用户的当前会话S_T，用户下一个交互物品x_t+1的概率。将用户行为序列划分成会话更符合用户行为规律，一般来讲，用户在一个会话中会有特定的目的。会话和会话之间会有一个较长时间间隔(timegap)，如，淘宝将时间间隔设置为三十分钟。现在越来越多的方法，在基于会话推荐时，会同时将用户过去一段时间内的交互行为作为信息补充考虑进来，用于捕捉用户的长期兴趣，来提升推荐的准确度。此时，推荐物品的概率变成P(x_t+1|S_T,p^l)，其中p^l表示用户的长期兴趣。

传统的推荐方法主要包括三种。一种是一般的推荐系统，从用户和物品之间的历史交互数据中挖掘出用户和物品的静态关联，包括，协同过滤和矩阵分解等方法。这类方法将用户-物品的交互关系输入到网络中，忽略了用户兴趣的动态变化。第二种是基于物品序列，推荐用户下一个交互的物品，叫做序列推荐方法。会话推荐方法就属于一种序列推荐方法，会话是指一段时间内的用户交互序列。最后一种方法是将前两种方法结合起来，同时对用户的静态的长期兴趣和动态的当前兴趣进行建模，然后再推荐用户下一个交互的物品。本方法在对用户兴趣建模时，同样是采取第三种方法。但是本方法最大的不同点是考虑到用户的重复消费行为。用户在在线平台上会有固定的习惯。比如，在电商平台上，用户经常会重复购买固定的商品；在音乐平台上，用户会经常重复听同一首歌曲。Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题，但是该论文提出的解法和问题定义不符。重复网络在介绍(introduction)中提出用户存在重复消费行为，所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中，推荐重复的物品是在当前会话中的物品序列中推荐，而用户在短时间内，也就是在一个会话内部重复购买相同的物品的可能性很低。并且该方法没有考虑到用户的长期兴趣，用户长期兴趣是偏向于静态的。如果用户在当前会话中的短期兴趣和用户的长期兴趣重复度很高，那么发生重复购买行为的概率较大。所以在模型中，判断推荐模式是重复模式还是探索模式，应该同时考虑用户的长期兴趣和用户的短期兴趣。其中，重复模式是指推荐用户历史购买过的物品，探索模式是指推荐用户从未购买过的商品。关于重复行为这个场景的论文或者方法不多，但是工业界已经有相关的应用。如，“淘宝”APP在订单页面会有“常购好货”的功能展示，从该用户历史购买商品中推荐用户当下还有可能购买的商品。

一种考虑重复购买行为的会话推荐方法的向前传播(forward propagation)部分主要由四个部分组成，如图2所示。第一部分是根据用户当前交互会话序列，得到用户短期、长期兴趣表征和辅助行为(购买)表征。第二部分是根据用户短期和长期兴趣表征，选择重复模式或探索模式。第三部分是在重复模式下，根据用户的短期、长期兴趣表征和辅助行为(购买)表征，在用户历史购买的物品序列中进行推荐。第四部分是在探索模式下，根据用户的短期和长期兴趣表征，对不在用户历史购买的物品序列中的物品进行推荐。

如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

S100，根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列，得到用户辅助行为(购买)表征。用户当前交互的会话可以表示为S_T＝{x₁,x₂,…,x_τ,…,x_t}，其中，x_τ代表第τ个物品，T表示当前会话的时间段下标,且S_T的向量表征为{x₁,x₂,…,x_τ,…,x_t}，其中

且

A_T的向量表征为

其中，A_T是当前会话中的购买行为序列，

是购买行为序列A_T中购买的物品，

是物品

S200，根据用户当前交互会话序列，得到用户短期兴趣表征。本方法采用门控循环单元网络(GRU)对用户当前交互序列进行表征：

z_τ＝σ(W_xz·x_τ+W_hz·h_τ-1)

r_τ＝σ(W_xr·x_τ+W_hr·h_τ-1)

是当前记忆内容。x_τ是当前层的节点输入。

和

分别是控制更新门z_τ和重置门r_τ的参数。

和

是控制前记忆内容

的参数。⊙是元素级别的矩阵相乘，σ是sigmoid函数。GRU的输入序列为S_T＝{x₁,x₂,…,x_τ,…,x_t}。最后，当前会话序列表征为

用户短期兴趣(short-term interest)表征为前会话序列表征

S300，更新用户长期兴趣(long-term interest)表征p^l。用户当前会话所在时间为T，用户历史所有会话表征仍然采用门控循环单元网络(GRU)结构得到，此时用户历史会话表征序列为

其中，

S500，在重复模式下，根据用户的短期、长期兴趣表征和辅助行为(购买)表征，在用户历史购买的物品序列中进行推荐。令用户历史消费序列为B_T-1＝{x₁,x₂,…,x_l}，用户历史消费序列B_T-1的向量表征为

其中上标a表示购买行为(auxiliarybehavior)。那么，在重复模式下，用户历史购买的物品的推荐概率P(x_τ|r,S_T,p^l)是：

其中，

和

S600，在探索模式下，根据用户的短期兴趣表征和用户长期兴趣，对不在用户历史购买的物品序列中的物品进行推荐,物品推荐概率计算公式P(x_τ|e,S_T,p^l)为：

也就是推荐概率P(x_τ|e,S_T,p^l)＝0。

S700，构建损失函数，训练模型参数。采用对数似然损失函数：

其中，

是训练集中所有的会话序列。P(x_τ|S_T,p^l)是上文中提到的概率，表示基于用户的当前会话S_T和用户长期兴趣p^l，预测用户下一个交互物品x_τ的概率，x_τ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。

上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims

1.一种考虑重复购买行为的会话推荐方法，其特征在于：

根据用户当前交互会话序列中的辅助行为(auxiliary behavior)序列，得到用户辅助行为(购买)表征；用户当前交互的会话可以表示为S_T＝{x₁，x₂，…，x_τ，…，x_t}，其中，x_τ代表第τ个物品，T表示当前会话的时间段下标，且S_T的向量表征为{x₁，x₂，…，x_τ，…，x_t}，其中