CN116258551A

CN116258551A - 用户表征学习及推荐方法及系统

Info

Publication number: CN116258551A
Application number: CN202310135479.9A
Authority: CN
Inventors: 朱能军; 孙凌丹; 刘俊; 薛青云
Original assignee: Shanghai Linshu Health Technology Co ltd; University of Shanghai for Science and Technology
Current assignee: Shanghai Linshu Health Technology Co ltd; University of Shanghai for Science and Technology
Priority date: 2023-02-17
Filing date: 2023-02-17
Publication date: 2023-06-13

Abstract

本发明提供了一种用户表征学习及推荐方法及系统，包括如下步骤：使用全连接神经网络将用户和项目的one‑hot编码转换为embedding表征；将用户会话分为长期会话和短期会话，抽取关键信息，分别形成长期会话表征和短期会话表征；计算用户可能属于的用户组的概率分布；根据概率分布，聚合不同用户组的特征，捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异，得到群体影响表征；用户的长期会话表征和短期会话表征以及群体影响表征构建混合用户表征；估计一个项目成为下一个访问项目的概率。本发明解决了大多数现有的基于会话的推荐系统中，独立地基于用户自身的会话总结用户的表征，而忽视了用户模型之间信息共享的问题。

Description

用户表征学习及推荐方法及系统

技术领域

本发明涉及推荐系统技术领域，具体地，涉及一种用户表征学习及推荐方法及系统，尤其是一种基于长短期用户分组建模的用户表征学习及推荐方法及系统。

背景技术

基于会话的推荐系统(SBRSs，Session-based Recommender Systems)已经成为目前的研究热点，并且越来越多地应用于下一个项目的推荐。在一个会话中指定了项目的封装范围，例如购物车中的一组产品，一定时间范围内的一组已浏览的网站等。不同的会话反映了用户不同的偏好和需求，因为用户的兴趣在不同的时间段是不断变化的。因此，基于会话的推荐不仅能模拟用户的长期偏好，同时也能捕捉用户的短期偏好。

大多数现有的SBRS假设用户当前的偏好与长期和短期的会话有不同的关联，他们采用不同的网络来区分长短期会话对描述用户当前兴趣的不同贡献。与传统方法相比，这些系统显著的提高了推荐的性能。但在这些方法中，用户的表征都是独立地基于其自身的会话进行总结的，因此学习到的模型是基于每个用户构建的，在用户的模型之间没有明确的信息共享。

然而，在实际的应用中，志同道合的用户组成的动态群体存在于不同的上下文中，并且同一群体中的用户通常具有相似的偏好。因此，如果有效地利用这些群体信息，将更多的重点放在一些相关的项目或用户上，来构建一个更具有针对性的局部推荐模型，将能够更好地捕捉到用户的动态偏好和不断演变的潜在群体信息，从而提高推荐的性能。

公开号为CN115204967A的专利文献公开了一种融入用户长短期兴趣表征隐式反馈的推荐方法，属于机器学习领域中的推荐系统研究领域，该专利文献的方法对基于矩阵分解的协同过滤方法的隐式反馈部分进行了改进，不仅考虑了用户商品二部图中用户浏览或评分商品的隐式反馈，还考虑兴趣相似用户的隐式反馈。但是该专利文献仍然存在用户的模型之间没有明确的信息共享的缺陷。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种用户表征学习及推荐方法及系统。

根据本发明提供的一种用户表征学习及推荐方法，，包括如下步骤：

步骤1：使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征；

步骤2：将用户会话分为长期会话和短期会话，基于步骤1中得到的会话中项目的表征，抽取关键信息，通过池化层分别形成长期会话表征和短期会话表征；

步骤3：基于步骤2得到的长期和短期会话表征，计算用户可能属于的用户组的概率分布；

步骤4：根据步骤3得到的概率分布，聚合不同用户组的特征，捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异，得到群体影响表征；

步骤5：利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征；

步骤6：利用步骤5得到的混合用户表征代替成对模型中的用户潜在向量，估计一个项目成为下一个访问项目的概率。

优选的，所述步骤1具体为：使用全连接神经网络将用户和物品的one-hot编码转换为低维的embedding表征，得到用户矩阵U∈R^N×K和物品矩阵V∈R^M×K，其中N＝|U|，M＝|V|，分别表示用户的数量和物品的数量，K表示隐式向量维度，u∈R^K和v∈R^K分别表示用户u的静态表征和物品v的静态表征，R代表矩阵。

优选的，所述步骤2具体为：将一个用户u的会话划分为两部分，其中，当前会话

为短期会话，用于描述用户的短期需求，其余会话为

为长期会话，用于表示用户的长期偏好，其中，v_i表示第i个物品的静态表征，/>

表示短期会话中的物品数量，/>

表示长期会话中的物品数量；

根据每个会话中的物品表征，为该会话生成一个物品表征矩阵，并通过池化操作来聚合这些物品特征，形成两个上下文感知的输入表征x_s和x_l，反映用户在不用时间戳的状态。

优选的，具体计算公式如下：

其中，x_s和x_l分别是短期会话表征和长期会话表征，

表示由短期会话中的物品静态表征拼接得到的矩阵，/>

表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作，根据目标用户u的静态表征与物品v的静态表征计算权重，具体计算公式如下：

其中，w_u,v表示基于目标用户u生成的对于物品v的权重，u表示用户u的静态表征，v表示物品v的静态表征，

表示长期用户会话，v_i表示长期会话中第i个物品的静态表征，T表示转置操作，exp()表示以e为底的指数函数。

优选的，所述步骤3具体为：基于步骤2生成的长短期会话表征x_s和x_l，计算它们与潜在用户组G_k的键表征之间的相似性，评估用户当前可能属于的用户组的概率分布b_s ^u和b_l ^u，具体计算公式如下：

其中，b_s ^u,b_l ^u∈R^L，分别表示用户当前可能属于的短期用户组和长期用户组的概率分布，x_s和x_l分别表示短期会话表征和长期会话表征，softmax函数将向量G_kx_s ^u转换为伪概率分布向量。

优选的，所述步骤4具体为：根据步骤3得到的概率分布b_s ^u和b_l ^u，聚合不同用户组的特征，捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异，聚合用户组特征的计算公式如下：

其中，g_l ^u∈R^K，g_s ^u∈R^K，分别表征用户u的长期和短期潜在群体的影响，G_v表示潜在的用户组，b_s ^u和b_l ^u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。

优选的，所述步骤5具体为：利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征，构建混合的用户表征，将{x_s ^u,x_l ^u,g_s ^u,g_l ^u}表示为F。

优选的，以动态的方式组合x_s ^u、x_l ^u、g_s ^u、g_l ^u，具体方法为使用MLP聚合或使用注意力聚合；

使用MLP聚合：使用多层感知机将每个特征向量映射为一个标量，然后使用softmax层将标量转换为每个组件的权重，具体计算如下所示：

其中，F表示混合的用户表征，f表示F中的某个特征向量，w_f表示为特征向量f生成的权重，h^u表示得到的混合用户表征，MLP表示多层感知机，T表示转置操作，exp()表示以e为底的指数函数；

使用注意力聚合：根据组件与目标用户u的表征之间的关系计算权重，具体计算如下所示：

其中，F表示混合的用户表征，f表示F中的某个特征向量，u表示用户u的静态表征，w_f表示为特征向量f生成的权重，h^u表示得到的混合用户表征，T表示转置操作，exp()表示以e为底的指数函数。

优选的，所述步骤6具体为：计算步骤5得到混合用户表征h^u与物品v的表征向量的内积，将其作为预测的用户u对物品v的偏好分数，计算公式如下：

其中，

表示预测的用户u对物品v的偏好分数，h^u表示混合用户表征，v表示物品v的静态表征，T表示转置操作；

利用排序和成对损失函数来训练模型，对于正采样v⁺，从用户的当前会话中随机选择一个项目，对于负采样v^-，选择一个用户以前从未购买或访问过的商品，最终的损失函数如下：

其中，

和/>

分别表示预测的用户u对正采样物品v⁺和负采样物品v^-的偏好分数，/>

表示长期用户会话，σ表示s igmoid函数，θ表示模型的参数，argmin表示最小化函数；

利用得到的训练好的模型，选择预测分数最高的项目，作为预测用户u下一个最有可能访问的物品。

本发明还提供一种用户表征学习及推荐系统，包括如下步骤：：

模块M1：使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征；

模块M2：将用户会话分为长期会话和短期会话，基于模块M1中得到的会话中项目的表征，抽取关键信息，通过池化层分别形成长期会话表征和短期会话表征；

模块M3：基于模块M2得到的长期和短期会话表征，计算用户可能属于的用户组的概率分布；

模块M4：根据模块M3得到的概率分布，聚合不同用户组的特征，捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异，得到群体影响表征；

模块M5：利用模块M2得到的用户的长期会话表征和短期会话表征以及模块M4得到的群体影响表征构建混合用户表征；

模块M6：利用模块M5得到的混合用户表征代替成对模型中的用户潜在向量，估计一个项目成为下一个访问项目的概率。

与现有技术相比，本发明具有如下的有益效果：

1、本发明解决了大多数现有的基于会话的推荐系统中，独立地基于用户自身的会话总结用户的表征，而忽视了用户模型之间信息共享的问题；

2、本发明在为用户推荐物品时，综合考虑用户自身的动态兴趣信息与潜在群体的影响，可以帮助商家捕捉到蕴含信息更丰富更准确的用户偏好，从而提高推荐的准确性和用户的黏着度，不仅更好地满足了用户的需求，也会为商家带来更高的经济收益；

3、本发明不仅能捕捉到用户潜在的群体信息，还能感知到用户群体信息随时间的变化情况。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明的用户表征学习及推荐方法的步骤流程图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

实施例1：

如图1所示，本实施例提供一种用户表征学习及推荐方法，包括如下步骤：

步骤1：使用全连接神经网络将用户和项目的one-hot编码转换为embedding表征；步骤1具体为：使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征，得到用户矩阵U∈R^N×K和物品矩阵V∈R^M×K，其中N＝|U|，M＝|V|，分别表示用户的数量和物品的数量，K表示隐式向量维度，u∈R^K和v∈R^K分别表示用户u的静态表征和物品v的静态表征，R表示矩阵。

步骤2：将用户会话分为长期会话和短期会话，基于步骤1中得到的会话中项目的表征，抽取关键信息，通过池化层分别形成长期会话表征和短期会话表征；将一个用户u的会话划分为两部分，其中，当前会话

为短期会话，用于描述用户的短期需求，其余会话为/>

表示短期会话中的物品数量，/>

表示长期会话中的物品数量；

根据每个会话中的物品表征，为该会话生成一个物品表征矩阵，并通过池化操作来聚合这些物品特征，形成两个上下文感知的输入表征x_s和x_l，反映用户在不用时间戳的状态；

具体计算公式如下：

其中，x_s和x_l分别是短期会话表征和长期会话表征，

表示由短期会话中的物品静态表征拼接得到的矩阵，/>

表示由长期会话中的物品静态表征拼接得到的矩阵。pooling表示加权平均池化操作。根据目标用户u的静态表征与物品v的静态表征计算权重，具体计算公式如下：

表示长期用户会话，v_i表示长期会话中第i个物品的静态表征。T表示转置操作，exp()表示以e为底的指数函数。

步骤3：基于步骤2得到的基于长短期会话表征，计算用户可能属于的用户组的概率分布；步骤3具体为：基于步骤2生成的长短期会话表征x_s和x_l，计算它们与潜在用户组G_k的键表征之间的相似性，评估用户当前可能属于的用户组的概率分布b_s ^u和b_s ^u，具体计算公式如下：

其中，b_s ^u,b_l ^u∈R^L，分别表示用户当前可能属于的短期用户组和长期用户组的概率分布，x_s和x_l分别表示短期会话表征和长期会话表征。softmax函数将向量G_kx_s ^u转换为伪概率分布向量。

步骤4：根据步骤3得到的概率分布，聚合不同用户组的特征，捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异，得到群体影响表征；步骤4具体为：根据步骤3得到的概率分布b_s ^u和b_s ^u，聚合不同用户组的特征，捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异，聚合用户组特征的计算公式如下：

其中，g_l ^u∈R^K，g_s ^u∈R^K，分别表征用户u的长期和短期潜在群体的影响。G_v表示潜在的用户组。b_s ^u和b_l ^u分别表示用户当前可能属于的短期用户组和长期用户组的概率分布。

步骤5：利用步骤2得到的用户的长期会话表征和短期会话表征以及步骤4得到的群体影响表征构建混合用户表征；所述步骤5具体为：利用步骤2得到的用户长短期会话表征以及步骤4得到的当前群体和历史群体的影响表征，构建混合的用户表征，将{x_s ^u,x_l ^u,g_s ^u,g_l ^u}表示为F；

以动态的方式组合x_s ^u、x_l ^u、g_s ^u、g_l ^u，具体方法为使用MLP聚合或使用注意力聚合；

其中F表示混合的用户表征，f表示F中的某个特征向量，w_f表示为特征向量f生成的权重，h^u表示得到的混合用户表征。MLP表示多层感知机，T表示转置操作，exp()表示以e为底的指数函数。

/>

其中F表示混合的用户表征，f表示F中的某个特征向量，u表示用户u的静态表征，w_f表示为特征向量f生成的权重，h^u表示得到的混合用户表征。T表示转置操作，exp()表示以e为底的指数函数。

步骤6：利用步骤5得到的的混合用户表征代替成对模型中的用户潜在向量，估计一个项目成为下一个访问项目的概率；步骤6具体为：计算步骤5得到混合用户表征h^u与物品v的表征向量的内积，将其作为预测的用户u对物品v的偏好分数，计算公式如下：

其中

表示预测的用户u对物品v的偏好分数，h^u表示混合用户表征，v表示物品v的静态表征，T表示转置操作。

其中

和/>

表示长期用户会话。σ表示s igmoid函数，θ表示模型的参数，argmin表示最小化函数。

本实施例的方法是基于长期和短期潜在用户群建模的推荐方法，通过考虑用户的长期和短期会话，以及潜在用户群体对建模用户当前偏好的不同影响，来学习得到信息量更丰富的用户表征，进而更准确地预测出下一个应该推荐给用户的项目。

本实施例的方法在考虑用户群体兴趣信息演变，建模用户的动态偏好方面，具有现实意义和良好的应用前景。

由于用户的行为模式比较复杂，为了捕捉每个潜在用户组的动态和不断发展的分组，本实施例的方法要解决的问题体现在以下几点：

a、在实际场景中，一个用户可能属于多个用户组，而不是像传统的局部方法那样被分配一个静态组；

b、每个潜在用户群体的兴趣将会随时间更新；

c、由于用户偏好和需求的演变等多种原因，用户可能会切换其潜在群体。

实施例2：

本实施例提供一种用户表征学习及推荐系统，包括如下步骤：：

实施例3：

本领域技术人员可以将本实施例理解为实施例1、实施例2的更为具体的说明。

本实施例提供一种基于长期和短期潜在用户群建模的推荐方法，方法包括以下步骤：

步骤1：使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征；

步骤2：将用户会话分为长期会话和短期会话，基于会话中项目的表征，抽取关键信息，通过池化层分别形成长期和短期会话表征：

步骤3：基于长短期会话表征，计算用户可能属于的用户组的概率分布；

步骤4：聚合不同用户组的特征，以捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异；

步骤5：利用用户的长期和短期会话表征以及群体影响构建混合用户表征；

步骤6：用得到的混合用户表征代替成对模型中的用户潜在向量，来估计一个项目成为下一个访问项目的概率。

为了考虑潜在用户群体的影响，来更好地了解用户的偏好，本实施例提出通过建模长期和短期的动态潜在用户群来学习用户的表征，该模型利用两个网络分别学习用户的长期和短期会话表征，再使用另外两个单元来检测用户属于哪些潜在的用户组，并对这些潜在组的表征进行加权聚合，然后，基于注意力机制来综合考虑这四个方面，形成用户最终的偏好表征，最后，使用这些表征替代成对模型中的用户潜在向量，来估计一个项目成为下一个访问项目的概率，该模型不仅能捕捉到用户潜在的群体信息，还能感知到用户群体信息随时间的变化情况。

实施例4：

如表1和表2所示，假设用户集合和物品集合分别为

和

对于用户集合中的一个用户u，设/>

是它在一个会话中(例如Δt时间内)点击的物品序列。通过分析用户u的整个行为历史，可以得到他的会话序列/>

其中t表示对应时间戳的会话索引。

表1数据集统计信息表

表2问题定义符号描述表

假设存在L个潜在的用户组，矩阵G_v∈R^L×K描述了这些用户组的偏好，同时矩阵G_k∈R^L×K决定了用户和潜在用户组的关系。由此可以将一个用户分配到多个组中，并且可以得到用户组对该用户的累积影响。

因此，给定一个用户u和他的会话序列

通过考虑用户u的长期和短期会话，以及与他关联的长期和短期潜在群体的影响，进而预测出下一个最有可能属于当前会话s_t的项目。

本实施例提供一种基于长期和短期潜在用户群建模的推荐方法，具体步骤如下：

步骤1：使用全连接神经网络将用户和物品的one-hot编码转换为embedding表征，得到用户矩阵U∈R^N×K和物品矩阵V∈R^M×K，其中N＝|U|，M＝|V|，分别表示用户和物品的数量，K表示隐式向量维度，u∈R^K和v∈R^K分别表示用户u和物品v的静态表征；

步骤2：将一个用户u的会话划分为两部分，其中当前会话

为短期会话，用于描述用户的短期需求，其余会话

为长期会话，用于表示用户的长期偏好，根据每个会话中的物品表征，为该会话生成一个物品表征矩阵，并通过池化操作来聚合这些物品特征，形成两个上下文感知的输入表征x_s和x_l，反映用户在不用时间戳的状态，具体计算公式如下所示：

其中，x_s和x_l分别是短期会话表征和长期会话表征，

表示由短期会话中的物品静态表征拼接得到的矩阵，/>

步骤3：基于步骤2生成的长短期会话表征x_s和x_l(输入表征)，计算它们与潜在用户组G_k的键表征之间的相似性，从而评估用户当前可能属于的用户组的概率分布b_s ^u和b_s ^u，计算公式如下：

步骤4：根据步骤3得到的概率分布b_s ^u和b_s ^u，聚合不同用户组的特征，以捕捉用户邻居的影响以及志同道合用户子集之间的偏好差异。聚合用户组特征的计算公式如下：

步骤5：利用步骤2得到的用户长短期会话表征(个人偏好表征以及步骤4得到的当前群体和历史群体的影响表征(群体影响表征)，构建混合的用户表征，将{x_s ^u,x_l ^u,g_s ^u,g_l ^u}表示为F，为了以动态的方式组合这四个组件，本实施例提供了两种方法来融合它们：

1)使用MLP聚合：使用多层感知机(MLP)将每个特征向量映射为一个标量，然后使用softmax层将标量转换为每个组件的权重，具体计算如下所示：

2)使用注意力聚合：根据组件与目标用户u的表征之间的关系计算权重，具体计算如下所示：

步骤6：在步骤5得到混合用户表征h^u后，计算它与物品v的表征向量的内积，作为预测的用户u对物品v的偏好分数，计算公式如下所示：

其中

步骤7：利用排序和成对损失函数来训练模型，对于正采样v⁺，从用户的当前会话中随机选择一个项目，对于负采样v^-，选择一个用户以前从未购买或访问过的商品，最终的损失函数如下所示：

其中

和/>

步骤8：利用步骤7得到的训练好的模型，选择预测分数最高的项目，作为预测用户u下一个最有可能访问的物品。

本发明解决了大多数现有的基于会话的推荐系统中，独立地基于用户自身的会话总结用户的表征，而忽视了用户模型之间信息共享的问题。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统及其各个装置、模块、单元以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同功能。所以，本发明提供的系统及其各项装置、模块、单元可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置、模块、单元也可以视为硬件部件内的结构；也可以将用于实现各种功能的装置、模块、单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种用户表征学习及推荐方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的用户表征学习及推荐方法，其特征在于，所述步骤1具体为：使用全连接神经网络将用户和物品的one-hot编码转换为低维的embedding表征，得到用户矩阵U∈R^N×K和物品矩阵V∈R^M×K，其中N＝|U|，M＝|V|，分别表示用户的数量和物品的数量，K表示隐式向量维度，u∈R^K和v∈R^K分别表示用户u的静态表征和物品v的静态表征，R代表矩阵。

3.根据权利要求2所述的用户表征学习及推荐方法，其特征在于，所述步骤2具体为：将一个用户u的会话划分为两部分，其中，当前会话