CN111815410A

CN111815410A - 基于选择性邻域信息的商品推荐方法

Info

Publication number: CN111815410A
Application number: CN202010644877.XA
Authority: CN
Inventors: 温家辉; 张光达; 王会权; 王冬升; 张鸿云; 方健; 王之元; 赵夏; 胡海韵; 隋京高
Original assignee: National Defense Technology Innovation Institute PLA Academy of Military Science
Current assignee: National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2020-10-23
Anticipated expiration: 2040-07-07
Also published as: CN111815410B

Abstract

本发明公开了一种基于选择性邻域信息的商品推荐方法，该方法包括：获取目标用户的兴趣偏好；获取商品的属性特征；获取与商品有过历史评分记录的所有用户，将所有用户作为目标用户在商品下的邻域信息并确定其兴趣偏好；确定目标用户与邻域信息中每个用户的兴趣偏好的相似性；对邻域信息的兴趣偏好进行融合以得到目标用户的邻域特征信息；确定邻域特征信息的可用性；获取基于邻域信息的目标用户特征信息；获取目标用户对商品的预测评分；选择预测评分最大的若干个商品推荐给目标用户。本发明的方法将邻域信息当作一种辅助信息，自动过滤出相似邻域信息，捕获用户与其邻域信息之间兴趣偏好的一致性，能够有效缓解数据稀疏性问题，显著提高推荐精度。

Description

基于选择性邻域信息的商品推荐方法

技术领域

本发明涉及商品推荐系统技术领域，尤其涉及一种基于选择性邻域信息的商品推荐方法。

背景技术

个性化推荐技术主要分析不同用户的行为，猜测用户兴趣，主动向用户推荐资源，从而缓解了互联网信息爆炸与用户快速获取信息之间的矛盾，也弥补了通用搜索引擎个性化反馈结果能力弱的缺点。

随着电子商务的不断发展，规模的不断扩大，商品的个数和种类也快速的增加，这使得顾客在挑选所需的商品上，会花费大量的时间，在较短的时间购买到适合自己的商品，已经成为网络购物的发展方向。基于海量数据分析与数据挖掘技术的推荐服务也因此成为各大电子商务网站使用的技术之一。

推荐系统是一种典型的信息过滤工具，推荐系统通常通过用户和商品之间的历史交互记录，捕获用户对商品的兴趣偏好，以便更快的将用户感兴趣的商品优先呈现给他们。一个推荐问题，通常情况下可描述为用户和商品之间的评分预测问题，即给定用户和商品之间已经完成的评分记录，来预测缺失的评分记录，并据此给用户推荐评分高的商品。然而，在实际应用中，由于和网络平台中数目庞大的商品相比，大多数用户仅跟极少数商品具有历史交互记录，而仅根据这些少量的交互数据，无法全面捕获用户的兴趣偏好和商品的属性特征，使推荐系统面临着严重的数据稀疏性和冷启动问题，导致推荐系统的推荐性能指标收到限制，推荐效果差。

为解决上述问题，目前通过利用辅助性信息来缓解数据稀疏性和冷启动困难的问题，以降低推荐决策的不确定性，提高推荐效果。近年来，随着互联网的普及，社交网络数据成为最常被推荐系统利用的一种辅助性信息。在一个社交网络上，用户可以被看成一个个节点，用户之间的关系可以用连接节点之间的边来表示，根据社交网络的不同，边的定义有所不同；比如两个用户之间存在一条边，可以解释为两个用户之间的“关注”或者“好友”关系。对于一个用户而言，与其存在边连接的所有其他用户称为该用户的邻域。由于社交网络上的节点(即用户)通常具有同质性，具体而言，两个用户之间的边的权重越大，那么大概率上两个用户具有相同兴趣偏好，因此在缺少用户与商品的交互数据的情况下，可以根据用户的邻域信息来对该用户的兴趣偏好进行预测，从而确定推荐给该用户的商品。

虽然现有的推荐方法通过利用邻域信息作为辅助性信息能够提高推荐效果；但是，现有的推荐方法在使用时不加区别地将邻域信息引入推荐处理过程，忽视了邻域信息对用户的可用性存在着个体差异性，由于有些用户的兴趣偏好并不依赖于该用户的邻域信息，不加区分的引入邻域信息，反而给推荐处理过程引入了干扰信息，影响推荐性能，使推荐效果变差；此外，现有的推荐方法在引入邻域信息时，并没有显式地对用户与该用户的邻域之间地语义相似性进行建模，导致无法高效地捕获用户与该用户的邻域之间的相似性，推荐效果不佳。

发明内容

为解决上述现有技术中存在的技术问题，本发明提供一种基于选择性邻域信息的商品推荐方法。

为此，本发明公开了一种基于选择性邻域信息的商品推荐方法，所述方法用于确定推荐给用户的商品，包括如下内容：

1)确定需要进行商品推荐的目标用户，获取目标用户的兴趣偏好；

2)获取网站平台中与目标用户没有评分记录的一个商品，并确定商品对应的属性特征；

3)获取网站平台中与商品有过历史评分记录的所有用户，将所有用户作为目标用户在商品下的邻域信息，并确定邻域信息的兴趣偏好，邻域信息的兴趣偏好为邻域信息中所有用户的兴趣偏好组成的信息集合；

4)计算确定目标用户与邻域信息中每个用户的兴趣偏好的相似性；

5)根据目标用户与邻域信息中每个用户的兴趣偏好的相似性，对邻域信息的兴趣偏好进行加权和操作的融合以得到目标用户的邻域特征信息，邻域信息中每个用户对应的权重为其与目标用户的兴趣偏好的相似性；

6)设定目标用户对应的邻域信息相似性门限值，将邻域信息中与目标用户的相似性的分值小于邻域信息相似性门限值的所有用户划分到非相似邻域并计算确定非相似邻域的相似性的均值，将邻域信息中与目标用户的相似性的分值大于等于邻域信息相似性门限值的所有用户划分到相似邻域并计算确定相似邻域的相似性的均值，根据非相似邻域的相似性的均值和相似邻域的相似性的均值计算确定邻域特征信息的可用性；

7)基于邻域特征信息的可用性，对目标用户的邻域特征信息和目标用户的兴趣偏好进行融合处理，获取基于邻域信息的目标用户特征信息；

8)对基于邻域信息的目标用户特征信息和商品的属性特征之间的交互进行建模，获取目标用户对商品的预测评分；

9)从与目标用户没有评分记录的所有商品中选择预测评分最大的若干个商品推荐给目标用户。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤4)中，运用注意力机制模型计算目标用户与其邻域信息中每个用户的兴趣偏好的相似性。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤4)中，采用以下公式计算目标用户与其邻域信息中每个用户的兴趣偏好的相似性；

其中，矩阵

矩阵

向量v和向量b_u为注意力机制模型参数，tanh为非线性变换函数，

为向量的点乘操作，N(v_j)＝{u₁,u₂,...,u_t}表示目标用户u_i在商品v_j下的邻域信息，u_t表示邻域信息中的第t个用户，β_t表示目标用户u_i与其邻域用户u_t的兴趣偏好的相似性的中间结果，α_t表示目标用户u_i与其邻域用户u_t对商品v_j的兴趣偏好的相似性分值。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤5)中，利用以下公式确定目标用户的邻域特征信息；

其中，向量p_i表示目标用户u_i的邻域特征信息。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤6)中，利用以下公式确定邻域特征信息的可用性；

f(θ_i)＝σ((t_s-θ_i)(θ_i-t_d))-0.5

其中，f(θ_i)表示邻域特征信息的可用性分值，σ为非线性变化递增函数，

该函数的意义为将输入x映射到[0,1]之间，t_s表示相似邻域的相似性的均值，t_d表示非相似邻域的相似性的均值。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤7)包括以下内容：

根据门网络机制模型权衡目标用户的兴趣偏好及其邻域特征信息，得到相应的门网络机制值，根据门网络机制值和邻域特征信息的可用性，将目标用户的兴趣偏好及其邻域特征信息进行融合，得到基于邻域信息的目标用户特征信息。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤7)中，采用以下公式对目标用户的邻域特征信息和目标用户的兴趣偏好进行融合处理，获取基于邻域信息的目标用户特征信息；

其中，矩阵

矩阵

和向量b_g为门网络机制模型参数，σ为非线性变化递增函数，h_i表示基于邻域信息的目标用户特征信息，g表示门网络机制值。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤8)中，运用多层神经网络模型对基于邻域信息的目标用户特征信息和商品的属性特征之间的交互进行建模，以获取目标用户对商品的预测评分。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，步骤8)中，利用以下公式获取目标用户对商品的预测评分；

其中，

表示目标用户u_i对商品v_j的预测评分，[；]表示向量的拼接操作，

为向量的点乘操作，L表示神经网络的层数，φ_l表示第l层神经网络，z_l-1表示第l-1层神经网络的输出，σ_l表示第l层神经网络的激活函数，矩阵W_l ^T和向量b_l表示第l层神经网络参数，h_i表示基于邻域信息的目标用户特征信息，向量v_j表示商品v_j的属性特征，第l层神经网络以第l-1层网络的输出z_l-1作为输入，并输出z_l，作为第l+1层神经网络的输入，以此类推，最后一层网络输出标量

作为目标用户u_i对商品v_j的预测评分。

进一步地，在上述基于选择性邻域信息的商品推荐方法中，商品包括有形的产品、无形的服务和信息。

本发明技术方案的主要优点如下：

本发明的基于选择性邻域信息的商品推荐方法将邻域信息当作一种辅助信息，基于邻域信息的可用性，自动过滤出相似邻域信息，同时对用户与其邻域信息之间的相似性进行建模，捕获用户与其邻域信息之间兴趣偏好的一致性，能够有效缓解数据稀疏性问题，显著提高推荐精度和推荐效果。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明一实施例的基于选择性邻域信息的商品推荐方法的流程图；

图2为本发明一实施例的基于选择性邻域信息的商品推荐方法的总体流程框图；

图3为本发明一实施例的基于选择性邻域信息的商品推荐方法的模型训练过程框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本发明的一部分实施例，而不是全部的实施例。基于本发明的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

以下结合附图，详细说明本发明实施例提供的技术方案。

如附图1所示，本发明一实施例提供了一种基于选择性邻域信息的商品推荐方法，该方法用于确定推荐给用户的商品，包括如下内容：

本发明一实施例中，预测评分的大小表示相应的商品符合目标用户的兴趣偏好的程度，推荐的过程就是将预测评分大的商品优先推荐给目标用户。

本发明一实施例中，商品包括有形的产品、无形的服务和信息；与商品有过历史评分记录的用户表示购买过、使用过、或/和评价过该商品的用户，相应地，用户与商品没有评分记录表示该用户未购买过、未使用过和未评价过该商品。

假设网站平台中的任意一对用户和商品用＜u_i,v_j＞表示，u_i表示第i个用户，v_j表示第j个商品；对于一对用户和商品＜u_i,v_j＞中的用户u_i和商品v_j，通过嵌入检索(embedding lookup)操作，分别获取用户的兴趣偏好和商品的属性特征，用户u_i的兴趣偏好以一个嵌入向量u_i表示，商品v_j的属性特征以一个嵌入向量v_j表示。嵌入检索是一个1对1的映射，将一个用户u_i(商品v_j)对应唯一一个嵌入向量u_i(v_j)，嵌入向量可以从各种显式信息源里面提取出来，当没有显式信息源时，可以根据用户与商品的交互记录中学习的，因此嵌入向量为模型参数，需要在模型训练中自动学习更新。

设定：第j个用户u_i为目标用户，第j个商品v_j为与目标用户u_i没有评分记录的一个商品，以获取目标用户u_i对商品v_j的预测评分为例，对本发明一实施例的商品推荐方法的步骤及原理进行具体说明。

如附图2所示，当需要获取目标用户u_i对商品v_j的预测评分时，第一步，通过嵌入检索(embedding lookup)操作，获取目标用户u_i的兴趣偏好u_i。

第二步，通过嵌入检索操作，获取商品v_j的属性特征v_j。

具体操作为：假设平台中的用户嵌入矩阵可表示为U∈R^M×d，其中M为所有用户的个数，d为嵌入向量的维度，那么用户嵌入矩阵U中u_i所对应的行向量即为u_i的嵌入向量u_i；同理，假设平台中的商品嵌入矩阵可表示为V∈R^N×d，其中N为所有商品的个数，d为嵌入向量的维度，那么商品嵌入矩阵V中v_j所对应的行向量即为v_j的嵌入向量v_j。

第三步，确定目标用户u_i在商品v_j下的邻域信息及其对应的兴趣偏好。

由于一个用户的邻域可以看成是与该用户在社交网络上相邻的节点，根据社交网络的同质性，一个用户与其邻域在兴趣偏好上具有相似性；为此，在本发明一实施例的推荐方法中，针对网站平台中的任意一对用户和商品＜u_i,v_j＞，该商务网站中所有对该商品v_j有过历史评分记录的用户被认定为该用户u_i的邻域信息。本发明一实施例中，用户u_i的邻域信息以N(v_j)＝{u₁,u₂,...,u_t}表示，u_t表示邻域信息中的第t个用户，当确定邻域信息所包含的用户后，通过嵌入检索操作获取邻域信息中每个用户的兴趣偏好，得到邻域信息N(v_j)＝{u₁,u₂,...,u_t}对应的兴趣偏好{u₁,u₂,...,u_t}，u_t表示邻域信息中的第t个用户u_t对应的兴趣偏好。

第四步，计算确定目标用户u_i与邻域信息N(v_j)＝{u₁,u₂,...,u_t}中每个用户的兴趣偏好的相似性。

本发明一实施例中，运用注意力机制模型计算目标用户u_i与其邻域信息N(v_j)＝{u₁,u₂,...,u_t}中每个用户的兴趣偏好的相似性。具体地，利用以下公式计算目标用户u_i与其邻域信息N(v_j)＝{u₁,u₂,...,u_t}中每个用户的兴趣偏好的相似性；

其中，矩阵

矩阵

为向量的点乘操作，β_t表示目标用户u_i与其邻域用户u_t的兴趣偏好的相似性的中间结果，α_t表示目标用户u_i与其邻域用户u_t的兴趣偏好的相似性的归一化结果，即α_t表示目标用户u_i与其邻域用户u_t对商品v_j的兴趣偏好的相似性分值，注意力机制模型参数需要在模型训练中进行更新优化。

第五步，根据目标用户u_i与邻域信息N(v_j)＝{u₁,u₂,...,u_t}中每个用户的兴趣偏好的相似性，对邻域信息N(v_j)＝{u₁,u₂,...,u_t}的兴趣偏好进行加权和操作的融合以得到目标用户u_i的邻域特征信息。

具体地，本发明一实施例中，利用以下公式确定目标用户u_i的邻域特征信息；

其中，向量p_i表示目标用户u_i的邻域特征信息；该步骤中，相似性分值实际可以看成每个邻域用户对应的权重值，在加权和操作过程中，与目标用户相似性较高的邻域用户会被赋予更高的权重。

第六步，设定目标用户u_i对应的邻域信息相似性门限值θ_i，将邻域信息N(v_j)＝{u₁,u₂,...,u_t}中与目标用户u_i的相似性的分值小于邻域信息相似性门限值θ_i的所有用户划分到非相似邻域并计算确定非相似邻域的相似性的均值，将邻域信息N(v_j)＝{u₁,u₂,...,u_t}中与目标用户u_i的相似性的分值大于等于邻域信息相似性门限值θ_i的所有用户划分到相似邻域并计算确定相似邻域的相似性的均值，根据非相似邻域的相似性的均值和相似邻域的相似性的均值计算确定邻域特征信息的可用性。

具体地，本发明一实施例中，利用以下公式确定邻域特征信息的可用性；

f(θ_i)＝σ((t_s-θ_i)(θ_i-t_d))-0.5

该函数的意义为将输入x映射到[0,1]之间，t_s表示相似邻域的相似性的均值，t_d表示非相似邻域的相似性的均值，相似邻域的相似性的均值为相似邻域所包含的所有用户的相似性的均值，非相似邻域的相似性的均值为非相似邻域所包含的所有用户对应的相似性的均值。

该步骤根据目标用户与其邻域信息之间的相似性对邻域特征信息可用性进行建模，其基本原理是通过相似邻域和非相似邻域的区分度来确定邻域特征信息的可用性，例如如果无法明确地将相似邻域从其邻域信息中区分出来，说明邻域信息带有很大的不确定性，邻域特征信息的可用性不高，对应的f(θ_i)数值较小，应当在推荐决策过程中降低对邻域信息的依赖；如果能够显著地区分相似邻域和非相似邻域，说明邻域信息的不确定性小，邻域特征信息的可用性很高，对应的f(θ_i)数值也较大，该步骤构成了邻域信息建模的第一步。

本发明一实施例中，每个目标用户对应一个邻域信息相似性门限值，该邻域信息相似性门限值为模型参数，需要在模型训练中进行更新优化。

第七步，基于邻域特征信息的可用性f(θ_i)，对目标用户u_i的邻域特征信息p_i和目标用户u_i的兴趣偏好u_i进行融合处理，获取基于邻域信息的目标用户特征信息。

本发明一实施例中，运用门网络机制模型对目标用户u_i的邻域特征信息p_i和目标用户u_i的兴趣偏好u_i进行融合处理，获取基于邻域信息的目标用户特征信息。首先，根据门网络机制模型来权衡目标用户u_i的兴趣偏好u_i及其邻域特征信息p_i，得到相应的门网络机制值g，该步骤构成了邻域信息建模的第二步；然后，根据得到的门网络机制值g和第六步中得到的邻域特征信息的可用性f(θ_i)，将目标用户u_i的兴趣偏好u_i及其邻域特征信息p_i进行融合，得到基于邻域信息的目标用户特征信息。

具体地，利用以下公式对目标用户u_i的邻域特征信息p_i和目标用户u_i的兴趣偏好u_i进行融合处理，获取基于邻域信息的目标用户特征信息；

其中，矩阵

矩阵

和向量b_g为门网络机制模型参数，σ为非线性变化递增函数，h_i表示基于邻域信息的目标用户特征信息，g表示门网络机制值，门网络机制模型参数需要在模型训练中进行更新优化。

利用上述公式计算目标用户特征信息h_i体现了使用双重选择性机制对邻域信息进行过滤，从而提取有效的邻域信息；一是基于邻域特征信息可用性f(θ_i)的计算，即如果目标用户的相似邻域和非相似邻域能够被显著地区分，那么f(θ_i)的数值接近0.5，即在计算目标用户特征信息h_i过程中赋予u_i和p_i同样的权重，如果无法显著区分目标用户的相似邻域和非相似邻域，那么f(θ_i)的数值接近0，那么在计算目标用户特征信息h_i过程中p_i的权重将被降低；二是门网络机制值g的计算，是根据目标用户和其邻域信息，动态地在两者之间进行权衡。

第八步，对基于邻域信息的目标用户特征信息h_i和商品v_j的属性特征v_j之间的交互进行建模，获取目标用户u_i对商品v_j的预测评分。

本发明一实施例中，运用多层神经网络模型对基于邻域信息的目标用户特征信息h_i和商品v_j的属性特征v_j之间的交互进行建模，以获取目标用户u_i对商品v_j的预测评分。具体地，利用以下公式获取目标用户u_i对商品v_j的预测评分；

其中，

为向量的点乘操作，L表示神经网络的层数，φ_l表示第l层神经网络，z_l-1表示第l-1层神经网络的输出，σ_l表示第l层神经网络的激活函数，矩阵W_l ^T和向量b_l表示第l层神经网络参数，第l层神经网络以第l-1层网络的输出z_l-1作为输入，并输出z_l，作为第l+1层神经网络的输入，以此类推，最后一层网络输出标量

作为目标用户u_i对商品v_j的预测评分，神经网络参数需要在模型训练中进行更新优化。

第九步，参照上述的第一步至第八步所述的处理方式，依次获取目标用户u_i对与其没有评分记录的所有商品的预测评分，从与目标用户u_i没有评分记录的所有商品中选择预测评分最大的若干个商品推荐给目标用户。

其中，选择推荐给目标用户u_i的商品数目可以根据实际需求进行设定。

如上述，本发明一实施例中，各个模型参数通过模型训练进行更新优化，对于如何进行模型训练以确定各个模型参数，以下进行具体说明说明。

如附图3所示，本发明一实施例中，模型训练指的是，对于每一对已有真实评分记录的用户和商品＜u_i,v_j＞，以及用户对应的邻域信息N(v_j)＝{u₁,u₂,...,u_t}，先根据初始设定的各个模型参数，输出预测评分

而后计算预测评分

和对应的真实评分r_ij之间的误差，采用优化算法，误差进行反向传播，从而调整模型参数；模型训练是一个迭代过程，通过训练集对模型进行训练，不断调整优化模型参数，使得根据更新后的模型参数所获得的预测评分和真实评分的误差达到最小值；其中，采用商品、对商品具有历史评分记录的用户及其对应的邻域信息作为训练集，训练集的数目可以根据实际推荐精度要求进行确定。

本发明一实施例中，在进行模型训练时的优化目标分为两个部分；一是计算预测评分与真实评分之间的误差，优化此目标即是最小化此项误差，等价于提高模型预测精度；本发明一实施例中，使用二分类交叉熵定义第一个优化目标，具体可表述为：

其中，D表示训练集数据。

二是计算每个用户在其邻域信息概率分布上出现的概率，优化此目标即是最大化此项概率，等价于捕获用户与其邻域信息之间的相似性，具体可表述为：

其中，D表示训练集数据。

本发明一实施例中，用一个用户的邻域特征信息预测该用户的兴趣偏好，以此来最大化该用户在其邻域上的概率分布，从而对用户与其邻域信息的关系进行显式建模。

模型训练过程就是最小化上述的优化目标，本发明一实施例采用梯度下降法对优化目标进行求解，具体可表述为：

其中，θ表示前述模型所有参数的集合，lr表示学习率，θ^t表示第t次模型迭代之后的结果，

表示优化目标关于模型参数的偏导，即优化目标关于模型参数的梯度的方向，模型训练是一个迭代的过程，模型训练过程可理解为研究优化目标梯度方向调整模型参数，最小化优化目标。

本发明一实施例提供的基于选择性邻域信息的商品推荐方法将邻域信息当作一种辅助信息，基于邻域信息的可用性，自动过滤出相似邻域信息，同时对用户与其邻域信息之间的相似性进行建模，捕获用户与其邻域信息之间兴趣偏好的一致性，能够有效缓解数据稀疏性问题，显著提高推荐精度和推荐效果。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外，本文中“前”、“后”、“左”、“右”、“上”、“下”均以附图中表示的放置状态为参照。

最后应说明的是：以上实施例仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。