CN112905886A

CN112905886A - 一种基于多兴趣重复网络的会话推荐方法

Info

Publication number: CN112905886A
Application number: CN202110197639.3A
Authority: CN
Inventors: 顾盼
Original assignee: China Jiliang University
Current assignee: Zhejiang Zhiduo Network Technology Co ltd
Priority date: 2021-02-22
Filing date: 2021-02-22
Publication date: 2021-06-04
Anticipated expiration: 2041-02-22
Also published as: CN112905886B

Abstract

本发明公开了一种基于多兴趣重复网络的会话推荐方法，对当前会话中的多兴趣和用户历史购买物品序列中的多兴趣进行建模，并预测用户下一个交互的物品。本发明的向前传播部分主要由五个部分组成：第一部分是根据用户当前交互会话序列，得到用户当前多兴趣表征。第二部分是根据用户历史购买物品序列，得到用户历史购买多兴趣表征。第三部分是根据用户当前多兴趣表征和用户历史购买多兴趣表征，得到重复推荐模式的概率。第四部分是在重复模式下，根据用户的当前多兴趣表征和历史购买多兴趣表征，在用户历史购买的物品序列中进行推荐。第五部分是在探索模式下，根据用户的当前多兴趣表征，对不在用户历史购买物品序列中的物品进行推荐。

Description

一种基于多兴趣重复网络的会话推荐方法

技术领域

本发明属于互联网服务技术领域，尤其是涉及一种基于多兴趣重复网络的会话推荐方法。

背景技术

随着在线服务的发展和流行，在线平台记录着大量的用户行为数据。从海量数据中找出用户最感兴趣的物品并推荐给用户，可以极大地提升用户的满意度和公司的收益。此时，推荐系统显得非常重要。推荐系统可以从海量物品中挖掘出用户最喜欢的物品。

会话(session)指一段时间内用户交互的物品序列，一般通过用户行为之间的时间间隔进行划分。用户在一个会话中会有特定的一些目的。传统的会话推荐方法认为用户在一个会话内只有一个目的或者兴趣，或者说会话内的物品是同质的，会话间的物品是异质的。这样的假设和实际情况不符，用户往往在一个时间段内会有多个兴趣，比如，在某店铺中同时浏览了羽绒服和裤子。此时，用一个向量来表示用户的兴趣就不够准确，会导致用户的主要兴趣覆盖用户的次要兴趣。所以，本方法从用户会话中的物品序列中抽取出用户多兴趣表征，本方法是一种基于多兴趣的会话推荐方法。

传统的推荐方法是基于一个物品候选集，从中推荐用户感兴趣的物品。本方法考虑用户的重复购买行为，因为用户在在线平台上会有固定的习惯。比如，在电商平台上，用户经常会重复购买固定的商品；在音乐平台上，用户会经常重复听同一首歌曲。工业界已经有相关的应用。如，“淘宝”APP在订单页面会有“常购好货”的功能展示，从该用户历史购买商品中推荐用户当下还有可能感兴趣的商品。关于重复行为这个场景的论文或者方法不多，其中，Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题，但是该论文提出的解法和问题定义不符。重复网络(RepeatNet)方法在介绍(introduction)中提出用户存在重复消费行为，所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中，推荐重复的物品是在当前会话中的物品序列中推荐，而不是在用户的历史购买序列中推荐，和问题定义不符。且用户在短时间内，也就是在一个会话内部重复购买相同物品的可能性很低。另外，重复网络(RepeatNet)推荐物品是基于用户单兴趣向量表征进行推荐，所以从历史交互物品中推荐物品时，物品种类较为单一。比如，用户在当前会话中同时看了早餐食品类和生活日用品类的物品，且早餐食品类的物品是主要兴趣。那么基于单兴趣的推荐可能只推荐早餐食品类的牛奶、鸡蛋等，但是基于多兴趣的推荐方法会同时推荐早餐食品类的牛奶和生活日用品的垃圾袋等。这样的推荐结果更加多样性，也更符合平台的产品思维。所以，本方法是一种同时考虑用户多兴趣和用户重复购买行为的会话推荐方法。

发明内容

本方法的问题定义为基于当前会话中的物品序列和用户历史购买物品序列，预测用户在当前会话中下一个感兴趣的物品。用户的当前会话可以表示为S_T＝{x₁,x₂,…,x_τ,…,x_t}，其中，x_τ代表用户交互的第τ个物品，且交互指代用户的点击、收藏、加购和购买等行为。且S_T的向量表征为{x₁,x₂,…,x_τ,…,x_t}，其中

d是物品向量表征的长度。用户历史购买序列可以表示为B_T-1＝{x₁,x₂,…,x_l}，用户历史消费序列B_T-1的向量表征为

其中上标a表示购买行为。此时，推荐下一个感兴趣物品的概率为P(x_t+1∣S_T,B_T-1)。

本方法在推荐物品时，考虑从用户的历史购买物品集合中推荐物品。因为用户在在线平台上会有固定的习惯。比如，在电商平台上，用户经常会重复购买固定的商品；在音乐平台上，用户会经常重复听同一首歌曲。关于重复行为这个场景的论文或者方法不多，其中，Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题，但是该论文提出的解法和问题定义不符。重复网络(RepeatNet)方法在介绍(introduction)中提出用户存在重复消费行为，所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中，推荐重复的物品是在当前会话中的物品序列中推荐，而不是在用户的历史购买序列中推荐，和问题定义不符。且用户在短时间内，也就是在一个会话内部重复购买相同物品的可能性很低。另外，重复网络(RepeatNet)推荐物品是基于用户单兴趣向量表征进行推荐，所以从历史交互物品中推荐物品时，物品种类较为单一。比如，用户在当前会话中同时看了早餐食品类和生活日用品类的物品，且早餐食品类的物品是主要兴趣。那么基于单兴趣的推荐可能只推荐早餐食品类的牛奶、鸡蛋等，但是基于多兴趣的推荐方法会同时推荐早餐食品类的牛奶和生活日用品的垃圾袋等。这样的推荐结果更加多样性，也更符合平台的产品思维。为此，本发明采用以下技术方案：

一种基于多兴趣重复网络的会话推荐方法，包括以下步骤：

根据用户当前交互会话序列，得到用户当前多兴趣表征。用户当前交互的会话可以表示为S_T＝{x₁,x₂,…,x_τ,…,x_t}，其中，x_τ代表用户交互的第τ个物品，T表示当前会话的时间段下标,且S_T的向量表征为{x₁,x₂,…,x_τ,…,x_t}，其中

d是物品向量表征的长度。采用基于门机制的多兴趣胶囊网络从物品序列中抽取出用户多兴趣，多兴趣胶囊网络的低层(low layer)是物品胶囊(item capsule)，高层(high layer)是兴趣胶囊(interestcapsule)。基于门机制的多兴趣胶囊网络的伪代码为：

其中，

为会话中第i个物品向量表征，

是第j个兴趣的表征且q_j为所有用户共享。用户兴趣的个数参数为M。

和

是第j个兴趣的转移矩阵，

是第j个模块的偏置向量。

为转移矩阵，被所有兴趣共享。⊙是门机制中常用的向量元素级别(element-wise)的乘法。通过兴趣相关的门机制(interest-specificgating mechanism)和转移矩阵，可以从物品向量x_i中抽取出不同兴趣空间下的向量表征

原始的胶囊网络中

的公式是

本方法将该公式改成门机制，降低模型参数大小，也更符合推荐场景。

方法是胶囊网络中的动态路由部分，输入参数

是第i个物品向量表征x_i映射到第j个兴趣空间的向量表征，输入参数r是动态路由算法的迭代次数。

方法的输出参数v_j代表用户多兴趣向量表征。b_ij是第i个物品向量表征到第j个兴趣的连接系数，c_ij是系数b_ij归一化后的连接系数。squash是胶囊网络中常用的squash向量激活函数，公式为

从激活公式中可以看出，输出的兴趣向量v_j的长度||v_j||≤1，且向量长度||v_j||代表兴趣v_jj的概率，向量v_j的方向代表兴趣v_jj的属性。

根据用户历史购买物品序列，得到用户历史购买多兴趣表征。用户历史购买序列可以表示为B_T-1＝{x₁,x₂,…,x_l}，用户历史消费序列B_T-1的向量表征为

其中上标a表示购买行为。本方法在基于门机制的多兴趣胶囊网络算法的基础上，继续改进胶囊网络从用户历史购买物品序列中抽取出用户多兴趣。为了使得在重复模式中，增加推荐结果的多样性，本方法改进胶囊网络连接系数b_ij的归一化方式。原本胶囊网络用于分类，在本问题定义中，分类就是该物品体现用户哪种兴趣。为了增强推荐结果的多样性，本方法同时增加同一兴趣下的不同物品之间连接系数c_ij的差异性，使得推荐结果偏向于推荐不同兴趣下的物品，而不是相同兴趣下的不同物品。一种增强推荐多样性的多兴趣胶囊网络算法伪代码为：

一种增强推荐多样性的多兴趣胶囊网络算法伪代码

其中，

为用户历史购买序列中第i个物品向量表征。

以及

和从用户当前交互会话序列中抽取多兴趣的胶囊网络共享。

方法是胶囊网络中的动态路由部分，输入参数

是第i个购买物品向量表征

映射到第j个购买兴趣空间的向量表征，输入参数r^a是动态路由算法的迭代次数。

方法的输出参数

代表用户历史购买多兴趣向量表征。

是第i个购买物品向量表征到第j个购买兴趣的连接系数，

是系数

归一化后的连接参数。

表示在购买兴趣胶囊内对参数

进行归一化，τ是温度系数。当τ→0⁺，购买兴趣胶囊趋向于只关注一个物品胶囊。而当τ→∞，物品胶囊对于情感胶囊的作用趋于一致。所以可以通过温度系数τ来控制推荐的多样性，当τ→0⁺，推荐结果更能够体现用户兴趣的多样性。而当τ→∞，推荐结果偏向于从主要兴趣中挑选相关物品。

是在购买兴趣胶囊间对参数

进行归一化，用于对物品胶囊进行兴趣分类，即判断物品体现用户哪种购买兴趣。squash是胶囊网络中常用的squash向量激活函数，公式为

输出的购买兴趣向量

的长度

且向量长度

代表购买兴趣

的概率，向量

的方向代表购买兴趣

的属性。

根据用户当前多兴趣表征和用户历史购买多兴趣表征，得到重复推荐模式(推荐用户历史购买物品)的概率。在本方法中，基于用户的当前会话S_T和用户历史购买物品序列B_T-1，推荐下一个交互物品x_t+1的概率P(x_t+1∣S_T,B_T-1)可以进一步分解为：

P(x_t+1∣S_T,B_T-1)＝P(r∣S_T,B_T-1)·P(x_t+1∣r,S_T,B_T-1)+(1-P(r∣S_T,B_T-1))·P(x_t+1∣e,S_T)

其中，r和e分别代表重复模式(repeat mode)和探索模式(explore mode)，重复模式指在用户历史购买物品集中推荐，探索模式指在用户历史购买物品集以外的候选物品集中推荐。P(r∣S_T,B_T-1)代表基于当前交互会话序列S_T和用户历史购买物品序列B_T-1，重复模式的概率。P(x_t+1∣r,S_T,B_T-1)和P(x_t+1∣e,S_T)分别代表在重复模式和探索模式下，推荐物品x_t+1的概率。该方法常见于自然语言处理(NLP)中的复制机制(copy mechanism)。重复模式的概率P(r∣S_T,B_T-1)主要由当前会话中抽取的多兴趣v_j决定，且多兴趣v_j的权重由历史购买兴趣

和当前兴趣v_jj的相似度

决定，这里采用余弦相似度来计算向量相似度。参数

是转化向量，σ是sigmoid函数。

在重复模式下，根据用户的当前多兴趣表征和历史购买多兴趣表征，在用户历史购买的物品序列中进行推荐。推荐物品x_i∈B_T-1的概率为P(x_i∣r,S_T,B_T-1):

其中，

是向量之间的相似度函数。

表示物品x_i是购买兴趣

的概率。V代表物品集合。

在探索模式下，根据用户的当前多兴趣表征，对不在用户历史购买物品序列中的物品进行推荐。

其中，

和

是模型需要训练的参数。v_τ为物品集合V-B_T-1中的物品x_τ的向量表征。v_j是从用户当前交互会话中抽取出的多兴趣。对于x_τ∈B_T-1的物品，

也就是推荐概率P(x_τ∣e,S_T)＝0。

构建损失函数，训练模型参数。采用对数似然损失函数：

其中，

是训练集中所有的会话序列。P(x_τ∣S_T,B_T-1)表示基于用户的当前会话S_T和用户历史购买物品序列B_T-1，预测用户下一个交互物品x_τ的概率，x_τ是会话序列中真实交互的物品。我们采用Adam优化器更新模型参数。

本发明的有益技术效果如下：

(1)本发明考虑到推荐场景中的重复购买现象，基于当前用户会话序列，考虑从用户历史购买商品中推荐用户可能感兴趣的商品。并且在判断是选择重复模式还是探索模式时，既考虑当前会话中的用户兴趣，又考虑用户历史购买物品序列中的用户兴趣。

(2)本发明考虑到重复推荐问题中用户兴趣的多样性问题，采用基于门机制的多兴趣胶囊网络算法分别从用户当前会话序列和用户历史购买物品序列中抽取用户的多兴趣，提高推荐的准确性和多样性。

(3)本发明在重复推荐模式下，改变原始胶囊网络中连接系数的归一化方式，使得可以根据具体场景调节温度系数，进而进一步增强推荐的多样性。

附图说明

图1为本发明一种基于多兴趣重复网络的会话推荐方法的流程示意图；

图2为本发明一种基于多兴趣重复网络的会话推荐方法的模型框架图。

具体实施方式

为了进一步理解本发明，下面结合具体实施方式对本发明提供的一种基于多兴趣重复网络的会话推荐方法进行具体描述，但本发明并不限于此，该领域技术人员在本发明核心指导思想下做出的非本质改进和调整，仍然属于本发明的保护范围。

传统的推荐方法是基于一个物品候选集，从中推荐用户感兴趣的物品。本方法考虑用户的重复购买行为，因为用户在在线平台上会有固定的习惯。比如，在电商平台上，用户经常会重复购买固定的商品；在音乐平台上，用户会经常重复听同一首歌曲。工业界已经有相关的应用。如，“淘宝”APP在订单页面会有“常购好货”的功能展示，从该用户历史购买商品中推荐用户当下还有可能感兴趣的商品。关于重复行为这个场景的论文或者方法不多，其中，Ren等人提出了重复网络(RepeatNet)来解决重复消费推荐问题，但是该论文提出的解法和问题定义不符。重复网络(RepeatNet)方法在介绍(introduction)中提出用户存在重复消费行为，所以在推荐物品时应考虑到用户这一消费规律。但是在方法(method)中，推荐重复的物品是在当前会话中的物品序列中推荐，而不是在用户的历史购买序列中推荐，和问题定义不符。且用户在短时间内，也就是在一个会话内部重复购买相同物品的可能性很低。另外，重复网络(RepeatNet)推荐物品是基于用户单兴趣向量表征进行推荐，所以从历史交互物品中推荐物品时，物品种类较为单一。比如，用户在当前会话中同时看了早餐食品类和生活日用品类的物品，且早餐食品类的物品是主要兴趣。那么基于单兴趣的推荐可能只推荐早餐食品类的牛奶、鸡蛋等，但是基于多兴趣的推荐方法会同时推荐早餐食品类的牛奶和生活日用品的垃圾袋等。这样的推荐结果更加多样性，也更符合平台的产品思维。

一种基于多兴趣重复网络的会话推荐方法的向前传播(forward propagation)部分主要由五个部分组成，如图2所示。第一部分是根据用户当前交互会话序列，得到用户当前多兴趣表征。第二部分是根据用户历史购买物品序列，得到用户历史购买多兴趣表征。第一部分和第二部分是使用改进的胶囊网络方法从用户当前会话序列和用户历史购买序列分别抽取出当前多兴趣向量表征和用户历史购买多兴趣表征。本方法摒弃原先应用于图像的胶囊网络中的映射参数，原先的映射参数是所有输入物品和所有兴趣之间不共享的，导致映射参数占用过大内存。本方法采用基于兴趣的门机制(interest-specific gatingmechanism)对物品向量进行信息过滤，再采用所有输入物品和所有兴趣共享的映射矩阵进行向量转换。并且从用户历史购买序列中抽取用户历史购买多兴趣表征时，进一步改变胶囊网络连接参数的归一化方式。使得连接参数不仅可以对物品进行兴趣分类，还增大同一兴趣下不同物品之间的区分性，进而增强重复推荐模式下的推荐物品的多样性。第三部分是根据用户当前多兴趣表征和用户历史购买多兴趣表征，得到重复推荐模式(推荐用户历史购买物品)的概率。重复模式是指推荐用户历史购买过的物品，探索模式是指推荐用户从未购买过的商品。第四部分是在重复模式下，根据用户的当前多兴趣表征和历史购买多兴趣表征，在用户历史购买的物品序列中进行推荐。第五部分是在探索模式下，根据用户的当前多兴趣表征，对不在用户历史购买物品序列中的物品进行推荐。

本方法的问题定义为基于当前会话中的物品序列和用户历史购买物品序列，预测用户在当前会话中下一个感兴趣的物品。方法在推荐物品时，考虑从用户的历史购买物品集合中推荐物品。用户的当前会话可以表示为S_T＝{x₁,x₂,…,x_τ,…,x_t}，其中，x_τ代表用户交互的第τ个物品，且交互指代用户的点击、收藏、加购和购买等行为。且S_T的向量表征为{x₁,x₂,…,x_τ,…,x_t}，其中

如图1所示，按照本发明的一个实施例，本方法包括如下步骤：

S100，根据用户当前交互会话序列，得到用户当前多兴趣表征。用户当前交互的会话可以表示为S_T＝{x₁,x₂,…,x_τ,…,x_t}，其中，x_τ代表用户交互的第τ个物品，T表示当前会话的时间段下标,且S_T的向量表征为{x₁,x₂,…,x_τ,…,x_t}，其中

d是物品向量表征的长度。采用基于门机制的多兴趣胶囊网络从物品序列中抽取出用户多兴趣，多兴趣胶囊网络的低层(low layer)是物品胶囊(item capsule)，高层(high layer)是兴趣胶囊(interest capsule)。基于门机制的多兴趣胶囊网络的伪代码为：

基于门机制的多兴趣胶囊网络算法伪代码

其中，

为会话中第i个物品向量表征，

是第j个兴趣的表征且q_j为所有用户共享。用户兴趣的个数参数为M,本方法中M取值为3。

和

是第j个兴趣的转移矩阵，

是第j个模块的偏置向量。

为转移矩阵，被所有兴趣共享。⊙是门机制中常用的向量元素级别(element-wise)的乘法。通过兴趣相关的门机制(interest-specific gating mechanism)和转移矩阵，可以从物品向量x_i中抽取出不同兴趣空间下的向量表征

原始的胶囊网络中

的公式是

本方法将该公式改成门机制，使得更符合推荐场景。

方法是胶囊网络中的动态路由部分，输入参数

是第i个物品向量表征x_i映射到第j个兴趣空间的向量表征，输入参数r是动态路由算法的迭代次数，本实验中迭代次数r设置为2。

方法的输出参数v_j代表用户多兴趣向量表征。b_ij是第i个物品向量表征到第j个兴趣的连接系数，c_ij是参数b_ij归一化后的连接参数。squash是胶囊网络中常用的squash向量激活函数，公式为

输出的兴趣向量v_j的长度||v_j||≤1，且向量长度||v_jj||代表兴趣v_jj的概率，向量v_j的方向代表兴趣v_jj的属性。

S200，根据用户历史购买物品序列，得到用户历史购买多兴趣表征。用户历史购买序列可以表示为B_T-1＝{x₁,x₂,…,x_l}，用户历史消费序列B_T-1的向量表征为

其中上标a表示购买行为。本方法在基于门机制的多兴趣胶囊网络算法的基础上，继续改进胶囊网络从用户历史购买物品序列中抽取出用户多兴趣。为了使得在重复模式中，增加推荐结果的多样性，本方法改进胶囊网络连接系数b_ij的归一化方式。原本胶囊网络用于分类，在本问题定义中，就是该物品体现用户哪种兴趣。为了增强推荐结果的多样性，本方法同时增加相同兴趣下的物品之间连接系数c_ij的差异性，使得推荐结果偏向于推荐不同兴趣下的不同物品，而不是相同兴趣下的不同物品。一种增强推荐多样性的多兴趣胶囊网络算法伪代码为：

其中，

为用户历史购买序列中第i个物品向量表征。

以及

和从用户当前交互会话序列中抽取多兴趣的胶囊网络共享。

方法是胶囊网络中的动态路由部分，输入参数

是第i个购买物品向量表征

映射到第j个购买兴趣空间的向量表征，输入参数r^a是动态路由算法的迭代次数，本实验中迭代次数r^a设置为2。

方法的输出参数

代表用户历史购买多兴趣向量表征。

是第i个购买物品向量表征到第j个购买兴趣的连接系数，

是系数

归一化后的连接参数。

表示在购买兴趣胶囊内对参数

进行归一化，τ是温度系数。当τ→0⁺，购买兴趣胶囊趋向于只关注一个物品胶囊。而当τ→∞，物品胶囊对于情感胶囊的作用趋于一致。所以可以通过温度系数τ来控制推荐的多样性，当τ→0⁺，推荐结果更能够体现用户兴趣的多样性。而当τ→∞，推荐结果偏向于从主要兴趣中挑选相关物品。本实验中温度系数τ设置为0.8。

是在购买兴趣胶囊间对参数

输出的购买兴趣向量

的长度

且向量长度

代表购买兴趣

的概率，向量

的方向代表购买兴趣

的属性。

S300，根据用户当前多兴趣表征和用户历史购买多兴趣表征，得到重复推荐模式(推荐用户历史购买物品)的概率。在本方法中，基于用户的当前会话S_T和用户历史购买物品序列B_T-1，推荐下一个交互物品x_t+1的概率P(x_t+1∣S_T,B_T-1)可以进一步分解为：

和当前兴趣v_jj的相似度

决定，这里采用余弦相似度来计算向量相似度。参数

是转化向量，σ是sigmoid函数。

S400，在重复模式下，根据用户的当前多兴趣表征和历史购买多兴趣表征，在用户历史购买的物品序列中进行推荐。推荐物品x_i∈B_T-1的概率为P(x_i∣r,S_T,B_T-1):

其中，

是向量之间的相似度函数。

表示物品x_i是购买兴趣

的概率。V代表物品集合。

S500，在探索模式下，根据用户的当前多兴趣表征，对不在用户历史购买物品序列中的物品进行推荐。

其中，

和

是模型需要训练的参数。x_τ为物品集合V-B_T-1中的物品x_τ的向量表征。v_j是从用户当前交互会话中抽取出的多兴趣。对于x_τ∈B_T-1的物品，

也就是推荐概率P(x_τ∣e,S_T)＝0。

S600，构建损失函数，训练模型参数。采用对数似然损失函数：

其中，

上述对实施例的描述是为方便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

Claims

1.一种基于多兴趣重复网络的会话推荐方法，其特征在于：

根据用户当前交互会话序列，得到用户当前多兴趣表征；用户当前交互的会话可以表示为S_T＝{x₁，x₂，…，x_τ，…，x_t}，其中，x_τ代表用户交互的第τ个物品，T表示当前会话的时间段下标，且S_T的向量表征为{x₁，x₂，…，x_τ，…，x_t}，其中

d是物品向量表征的长度；采用基于门机制的多兴趣胶囊网络从物品序列中抽取出用户多兴趣，伪代码为：

其中，

为会话中第i个物品向量表征，

是第j个兴趣的表征且q_j为所有用户共享；用户兴趣的个数参数为M；

和

是第j个兴趣的训练参数；

为转移矩阵，被所有兴趣共享；⊙是门机制中常用的向量元素级别(element-wise)的乘法；通过兴趣相关的门机制(interest-specific gating mechanism)和转移矩阵，可以从物品向量x_i中抽取出不同兴趣空间下的向量表征

方法是胶囊网络中的动态路由部分，输入参数

是第i个物品向量表征x_i映射到第j个兴趣空间的向量表征，输入参数r是动态路由算法的迭代次数，输出参数v_j代表用户多兴趣向量表征；b_ij是第i个物品向量表征到第j个兴趣的连接系数，c_ij是系数b_ij归一化后的连接系数；squash是胶囊网络中常用的squash向量激活函数，公式为

根据用户历史购买物品序列，得到用户历史购买多兴趣表征；用户历史购买物品序列可以表示为B_T-1＝{x₁，x₂，…，x_l}，用户历史消费序列B_T-1的向量表征为

其中上标a表示购买行为；本方法在基于门机制的多兴趣胶囊网络算法的基础上，继续改进胶囊网络从用户历史购买物品序列中抽取出用户多兴趣；为了使得在重复模式中增加推荐结果的多样性，本方法提出一种增强推荐多样性的多兴趣胶囊网络算法；该算法根据场景继续改进胶囊网络连接系数b_ij的归一化方式；

根据用户当前多兴趣表征和用户历史购买多兴趣表征，得到重复推荐模式(推荐用户历史购买物品)的概率；基于用户的当前会话S_T和用户历史购买物品序列B_T-1，推荐下一个交互物品x_t+1的概率P(x_t+1|S_T，B_T-1)可以进一步分解为：

其中，r和e分别代表重复模式(repeat mode)和探索模式(explore mode)，重复模式指在用户历史购买物品集中推荐，探索模式指在用户历史购买物品集以外的候选物品集中推荐；P(r|S_T，B_T-1)代表基于当前交互会话序列S_T和用户历史购买物品序列B_T-1，重复模式的概率；P(x_t+1|r，S_T，B_T-1)和P(x_t+1|e，S_T)分别代表在重复模式和探索模式下，推荐物品x_t+1的概率；重复模式的概率P(r|S_T，B_T-1)主要由当前会话中抽取的多兴趣v_j决定，且多兴趣v_j的权重由历史购买兴趣