CN114707066A

CN114707066A - 基于社区感知和自适应随机游走的景点推荐方法及系统

Info

Publication number: CN114707066A
Application number: CN202210352673.8A
Authority: CN
Inventors: 郭昆; 曾若澜; 王钦泽
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2022-04-01
Filing date: 2022-04-01
Publication date: 2022-07-05

Abstract

本发明涉及一种基于社区感知和自适应随机游走的景点推荐方法及系统。所述系统包括用户旅游景点推荐网络构建模块、随机游走参数自适应计算模块、随机游走模块、节点表示向量优化模块、聚类和景点推荐模块；先根据用户行为和特征构建用户旅游景点推荐网络，再使用基于度中心性的随机游走自适应策略确定随机游走参数，接着在用户旅游景点推荐网络中进行对高度节点和低度节点分别进行基于社区隶属度的随机游走和基于重启机制的启发式随机游走，利用Skip‑Gram模型训练用户节点表示向量，结合聚类算法得到相关用户形成的社区，从而用于个性化推荐以提高景点推荐的合理性和准确性。

Description

基于社区感知和自适应随机游走的景点推荐方法及系统

技术领域

本发明涉及大数据分析领域，具体涉及一种基于社区感知和自适应随机游走的景点推荐方法及系统。

背景技术

随着时代的发展和科技的进步，人们的很多日常生活逐渐从线下转移到了线上，在线旅游景点推荐就是一个很典型的例子。在线旅游景点推荐通过互联网根据用户的旅游经历和评价连接各个用户，向用户推荐其最可能喜欢的景点。然而，随着网络规模的扩大和旅游行业的迅速发展，也使得旅游景点推荐网络变得更为复杂，如何对用户进行精准的景点推荐，使得各个用户能够更大概率选择到自己喜欢的景点，这对于用户旅游景点推荐来说是非常有意义的。然而传统的景点推荐方法，没有对用户之间的高阶关系更加精准的建模，导致传统的景点推荐存在较大的误差，影响用户体验。因此，本发明在对用户之间的高阶关系进行精准建模，提高了景点推荐的准确性，进而提高用户体验，具有一定的价值。

发明内容

本发明的目的在于提供一种基于社区感知和自适应随机游走的景点推荐方法及系统，对用户旅游景点推荐网络进行了更加精细化的建模，在随机游走过程中根据具有不同度数节点的特性，进行针对性的随机游走设计，有效地提高了景点推荐的准确性。

为实现上述目的，本发明的技术方案是：一种基于社区感知和自适应随机游走的景点推荐方法，包括如下步骤：

步骤S1、根据用户特征和用户旅游记录及对旅游景点的评价来构建用户旅游景点推荐网络；

步骤S2、基于用户旅游景点推荐网络，通过一种基于节点度中心性的随机游走参数自适应计算策略来确定后续随机游走参数值；

步骤S3、基于用户旅游景点推荐网络，利用多标签传播方法生成节点社区隶属度信息，并将其转换为随机游走的转移概率矩阵；对于用户旅游景点推荐网络中的高度节点，根据随机游走的转移概率矩阵执行一种基于社区信息指导的随机游走策略；

步骤S4、对于用户旅游景点推荐网络中的低度节点，执行一种基于重启机制的启发式随机游走策略；

步骤S5、基于随机游走得到的节点序列，训练Skip-Gram模型得到网络中各个用户节点表示向量；

步骤S6、基于Skip-Gram模型训练得到的用户节点表示向量，先使用C-means算法对用户节点表示向量进行聚类，得到内部相互联系紧密的用户集合，针对要进行景点推荐的用户，从其所在社区中选择若干个在表示向量空间中距离最近的用户，根据其对旅游景点的评价选择其旅游过的最喜爱的若干个景点作为其推荐景点。

在本发明一实施例中，所述步骤S2具体为：

步骤S21、对于步骤S1得到的用户旅游景点推荐网络，计算出每个用户节点的中心性，并且将每个节点按中心性降序排列，生成一个有序的节点中心性序列S_c；

步骤S22、从节点中心性的降序序列S_c中选择前α比例的节点作为基于节点度中心性的随机游走的起始节点，构筑起始节点集合S_start；

步骤S23、以S_start中的每个节点作为社区中心分别设计两种不同类型的固定游走策略去构筑不同的节点路径集合，估计以相应节点为社区中心的最大社区半径和最小社区半径，分别将通过第一种类型和第二种类型的游走策略得到的节点路径序列集合标识为S_p1和S_p2；

步骤S24、通过步骤S23两种不同类型的固定游走策略生成两种类型游走对应的路径集合之后，计算根据第一种类型的游走策略游走路径长度的均值r₁以及根据第二种类型的游走策略游走路径长度的均值r₂，进而近似计算网络中平均最大社区半径r_max和平均最小社区半径r_min如下：

r_max＝max(r₁，r₂)

r_min＝min(r₁，r₂)

其中，len(p)为随机游走路径p的长度，n为网络中节点总数。

步骤S25、基于步骤S24得到的网络中平均最大社区半径以及平均最小社区半径，结合随机游走长度walk_length、窗口长度window_size以及每个节点随机游走次数number_walks各自的含义，自适应计算如下：

number_walks(u)＝min(d(u)，num_max)

其中，d(u)为节点u的度，num_max为事先人为设定的游走次数上限。

在本发明一实施例中，所述步骤S23具体为：两种不同类型的固定游走策略在节点跳转的时候有着不同的节点选择依据，设游走的当前的节点为u，第一种类型的游走策略每次在比节点u中心性小的邻居节点里选择与节点u中心性差值的绝对值最小的邻居节点作为下一跳节点，即每次都沿着中心性梯度减小最小的方向前进；与之相反，第二种类型的游走策略每次在比节点u中心性小的邻居节点里选择与节点u中心性差值的绝对值最大的邻居节点作为下一跳节点，即每次都沿着中心性梯度减小最大的方向前进；两种类型的游走都根据其策略选择固定的下一跳节点，直到中心性梯度不能再减小就停止，即节点邻居的中心性都大于等于当前节点。

在本发明一实施例中，所述步骤S3使用图多标签传播算法BMLPA计算节点u隶属于社区c_k的条件概率p(u|c_k)，基于该条件概率，计算节点u到其邻居v的转移概率如下：

其中，C是由多标签传播算法BMLPA得到的节点u和v公共社区标签；对于用户旅游景点推荐网络中的高度节点，根据转移概率矩阵依概率选择下一跳节点进行随机游走。

在本发明一实施例中，所述步骤S4基于重启机制的启发式随机游走策略具体为：

步骤S41、选择一个低度节点u作为源节点来开始一个随机游走过程；

步骤S42、当从低度节点u向前随机游走了t步之后，随机游走以目前生成的节点序列中低度节点u的下一跳节点v作为源节点重新启动；

步骤S43、重复步骤S42直到所有得到序列的总长度和到达确定的随机游走长度walk_length；

步骤S44、连接所有短序列得到最终完整的从低度节点u开始的随机游走路径。

在本发明一实施例中，所述步骤S5具体实现如下：

Skip-Gram模型假设网络中所有节点是互相独立的，以节点之间连乘的概率来逼近节点共现的联合概率，以最大化该概率为优化目标，如下公式所示：

其中w为窗口的大小，f(v_i)∈R^d为节点v_i的d维中心向量表示，{v_i-w，...，v_i+w}\v_i为随机游走的序列中以节点v_i为中心的窗口内不包括节点v_i的其他节点；考虑到概率计算的复杂性，引入负采样技术加快Skip-Gram模型训练过程并且利用随机梯度下降SGD来优化模型。

在本发明一实施例中，所述步骤S6具体实现如下：

使用C-means算法对用户节点的表示向量进行聚类，通过迭代优化的方法最小化代价函数得到联系紧密的用户集群，优化函数如下：

其中u_i、u_j为用户集群C中的中心表示向量；对于C-Means聚类算法，通过指定社区数k获取节点之于k个社区的隶属度矩阵U，其第i行第j列元素值u_ij表示节点v_i对社区c_j的隶属概率；接着，通过指定一个社区阈值δ来为每个节点生成隶属的社区集合，即如果节点v_i之于社区c_j的隶属度u_ij≥δ，那么将节点v_i分配到社区c_j中；如果节点v_i对于所有社区的隶属度都小于δ，那么这个节点将作为一个孤立节点，被包含在一个孤立社区中，这个社区中的成员仅包含节点v_i；

通过迭代优化得到各个用户社群集合后，针对要进行景点推荐的用户，从其所在社区集群中选择若干个距离最近的用户，以这些用户最喜欢的旅游景点作为推荐景点。

本发明还提供了一种基于社区感知和自适应随机游走的景点推荐方系统，包括用户旅游景点推荐网络构建模块、随机游走参数自适应计算模块、随机游走模块、节点表示向量优化模块、聚类和景点推荐模块，

所述用户旅游景点推荐网络构建模块从需要进行景点推荐的用户出发，根据其与其他用户的互动记录和个人特征构建用户旅游景点推荐网络；

所述随机游走参数自适应计算模块，在用户旅游景点推荐网络构建模块所构建的用户旅游景点推荐网络基础上，进行基于节点度中心性的随机游走参数自适应计算策略来确定合适的后续随机游走参数值；

所述随机游走模块，基于用户旅游景点推荐网络构建模块得到的用户旅游景点推荐网络，利用多标签传播方法生成节点社区隶属度信息，并将其转换为随机游走的转移概率矩阵；对于用户旅游景点推荐网络中的高度节点，根据转移概率矩阵执行一种基于社区信息指导的随机游走策略；对于用户旅游景点推荐网络中的低度节点，执行一种基于重启机制的启发式随机游走策略；

所述节点表示向量优化模块，基于随机游走得到的节点序列，作为Skip-Gram模型的输入，训练得到网络中各个用户节点的表示向量；

所述聚类和景点推荐模块，在节点表示向量优化模块得到的节点表示向量的基础上，先使用如C-means算法对用户节点向量进行聚类，得到联系紧密的多个用户群体，并针对要进行景点推荐的用户，从其所在的用户群体中选择若干个向量距离最近的用户，选择其最喜欢的若干个旅游景点作为其推荐景点。

在本发明一实施例中，所述随机游走模块，具体的：根据高度和低度节点的各自特征，分别设计针对性的社区感知随机游走策略；基于社区隶属度的随机游走策略能够精确捕获高度节点的社区中心特征；基于启发式策略的随机游走有助于清晰地捕获低度节点的社区边界特征。

在本发明一实施例中，所述聚类和景点推荐模块，具体的：根据用户特征和历史旅游记录以及旅游评分情况将类似的用户聚类在一起，对于需要推荐旅游景点的用户，首先找到其所在的类簇，其次寻找向量距离最接近的用户，从其旅游过的景点评分集合中找出评分最高的若干个景点，作为推荐景点。

相较于现有技术，本发明具有以下有益效果：

1、本发明在对用户之间的高阶关系进行精准建模，提高了景点推荐的准确性；

2、本发明随机游走参数确定的难点，以各个随机游走参数的含义设置自适应策略，提高了本发明使用的便利性。

附图说明

图1为本发明方法流程图。

具体实施方式

下面结合附图，对本发明的技术方案进行具体说明。

本发明一种基于社区感知和自适应随机游走的景点推荐方法，包括如下步骤：

以下为本发明具体实现过程。

请参照图1，本发明提供一种基于社区感知和自适应随机游走的景点推荐方法，提供一系统，该系统包括：用户旅游景点推荐网络构建模块、随机游走参数自适应计算模块、随机游走模块、节点表示向量优化模块、聚类和景点推荐模块；

步骤S1、根据用户特征和用户历史交互记录及对景点的评价等信息来搭建整个用户旅游景点推荐网络，以用于后续的网络分析任务；

步骤S2、在进行随机游走采集节点序列之前，执行一种基于节点度中心性的随机游走参数自适应计算策略来确定合适的后续随机游走参数值；

步骤S3、利用多标签传播方法生成节点社区隶属度信息，并将其转换为随机游走的转移概率矩阵；对于用户旅游景点推荐网络中的高度节点，根据转移概率矩阵执行依概率的随机游走，该随机游走结合了网络结构本身反映的节点社区信息；该基于社区信息的游走更偏向于高度节点局部结构的游走，从而能够有助于社区中心的捕获；

步骤S4、对于用户旅游景点推荐网络中的低度节点，执行一种基于重启机制的启发式随机游走，该重启机制更偏向于低度节点局部结构的游走，从而能够有助于社区边界的捕获；

步骤S5、降随机游走得到的节点序列作为Skip-Gram模型的训练语料库，最终得到网络中各个用户节点的表示向量；

步骤S6、基于Skip-Gram模型训练得到的节点表示向量，先使用C-means算法对用户节点的表示向量进行聚类，得到内部相互联系紧密的用户集合，针对要进行景点推荐的用户，从其所在社区中选择若干个在表示向量空间中距离最近的用户，并且根据其对景点的评价选择其最喜欢的若干个景点作为其推荐景点。

优选的，在本实施例中，步骤S2具体包括如下步骤：

步骤S22、从节点中心性的降序序列S_c中选择前α比例的节点作为基于中心性的游走的起始节点，构筑起始节点集合S_start；

步骤S23、以S_start中的每个节点作为社区中心分别设计两种不同类型的固定游走策略去构筑不同的节点路径集合，估计以该节点为社区中心的最大社区半径和最小社区半径，分别将通过第一种类型和第二种类型的游走策略得到的节点路径序列集合标识为S_p1和S_p2；

步骤S24、通过步骤S23游走策略生成两种类型游走对应的路径集合之后，计算根据第一种类型的游走策略游走路径长度的均值r₁以及根据第二种类型的游走策略的游走路径长度的均值r₂，进而可以近似计算网络中平均最大社区半径r_max和平均最小社区半径r_min如下：

r_max＝max(r₁，r₂)

r_min＝min(r₁，r₂)

其中，len(p)为随机游走路径p的长度，n为网络中节点总数。

number_walks(u)＝min(d(u)，num_max)

优选的，在本实施例中，步骤S3具体包括如下步骤：

使用传统图多标签传播算法BMLPA计算节点u隶属于社区c_k的条件概率p(u|c_k)，基于该条件概率，计算节点u到其邻居v的转移概率如下：

其中，C是由多标签传播算法BMLPA得到的节点u和v公共社区标签。对于用户旅游景点推荐网络中的高度节点，根据转移概率矩阵依概率选择下一跳节点进行随机游走；

优选的，在本实施例中，步骤S4具体包括如下步骤：

步骤S43、重复步骤S42直到所有得到序列的总长度和到达先前步骤S35自动确定的随机游走长度walk_length。

步骤S44、连接以上所有短序列得到最终完整的从低度节点u开始的随机游走路径。

优选的，在本实施例中，步骤S5具体包括如下步骤：

Skip-Gram模型假设网络中所有节点是互相独立的，以节点之间连乘的概率来逼近节点共现的联合概率，以最大化该概率为优化目标，如下公式所示

其中w为窗口的大小，f(v_i)∈R^d为节点v_i的d维中心向量表示，{v_i-w，...，v_i+w}\v_i为随机游走的序列中以节点v_i为中心的窗口内不包括节点v_i的其他节点。考虑到概率计算的复杂性，引入负采样技术加快Skip-Gram模型训练过程并且利用随机梯度下降SGD来优化模型。

优选的，在本实施例中，步骤S6具体包括如下步骤：

其中u_i、u_j为用户集群C中的中心表示向量。对于C-Means聚类算法，通过指定社区数k获取节点之于k个社区的隶属度矩阵U，其第i行第j列元素值u_ij表示节点v_i对社区c_j的隶属概率。接着，我们通过人工指定一个社区阈值δ来为每个节点生成隶属的社区集合，即如果节点v_i之于社区c_j的隶属度u_ij≥δ，那么将节点v_i分配到社区c_j中。如果节点v_i对于所有社区的隶属度都小于δ，那么这个节点将作为一个孤立节点，被包含在一个孤立社区中，这个社区中的成员仅包含节点v_i。

通过迭代优化得到各个用户社群集合后，针对要进行景点推荐的用户，从其所在社区集群中选择若干个距离最近的用户，并且根据这些用户的最喜欢的旅游景点进行推荐。

以上是本发明的较佳实施例，凡依本发明技术方案所作的改变，所产生的功能作用未超出本发明技术方案的范围时，均属于本发明的保护范围。

Claims

1.一种基于社区感知和自适应随机游走的景点推荐方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于社区感知和自适应随机游走的景点推荐方法，其特征在于，所述步骤S2具体为：

步骤S24、通过步骤S23两种不同类型的固定游走策略生成两种类型游走对应的路径集合之后，计算根据第一种类型的游走策略游走路径长度的均值r₁以及根据第二种类型的游走策略的游走路径长度的均值r₂，进而近似计算网络中平均最大社区半径r_max和平均最小社区半径r_min如下：

r_max＝max(r₁，r₂)

r_min＝min(r₁，r₂)

其中，len(p)为随机游走路径p的长度，n为网络中节点总数；

number_walks(u)＝min(d(u)，num_max)

其中，d(u)为节点u的出度，num_max为事先人为设定的游走次数上限。

3.根据权利要求2所述的基于社区感知和自适应随机游走的景点推荐方法，其特征在于，所述步骤S23具体为：两种不同类型的固定游走策略在节点跳转的时候有着不同的节点选择依据，设游走的当前的节点为u，第一种类型的游走策略每次在比节点u中心性小的邻居节点里选择与节点u中心性差值的绝对值最小的邻居节点作为下一跳节点，即每次都沿着中心性梯度减小最小的方向前进；与之相反，第二种类型的游走策略每次在比节点u中心性小的邻居节点里选择与节点u中心性差值的绝对值最大的邻居节点作为下一跳节点，即每次都沿着中心性梯度减小最大的方向前进；两种类型的游走都根据其策略选择固定的下一跳节点，直到中心性梯度不能再减小就停止，即节点邻居的中心性都大于等于当前节点。

4.根据权利要求1所述的基于社区感知和自适应随机游走的景点推荐方法，其特征在于，所述步骤S3使用图多标签传播算法BMLPA计算节点u隶属于社区c_k的条件概率p(u|c_k)，基于该条件概率，计算节点u到其邻居v的转移概率如下：

5.根据权利要求1所述的基于社区感知和自适应随机游走的景点推荐方法，其特征在于，所述步骤S4基于重启机制的启发式随机游走策略具体为：

6.根据权利要求1所述的基于社区感知和自适应随机游走的景点推荐方法，其特征在于，所述步骤S5具体实现如下：

7.根据权利要求1所述的基于社区感知和自适应随机游走的景点推荐方法，其特征在于，所述步骤S6具体实现如下：

8.一种基于社区感知和自适应随机游走的景点推荐方系统，其特征在于，包括用户旅游景点推荐网络构建模块、随机游走参数自适应计算模块、随机游走模块、节点表示向量优化模块、聚类和景点推荐模块，

9.根据权利要求8所述的一种基于社区感知和自适应随机游走的景点推荐方系统，其特征在于，所述随机游走模块，具体的：根据高度和低度节点的各自特征，分别设计针对性的社区感知随机游走策略；基于社区隶属度的随机游走策略能够精确捕获高度节点的社区中心特征；基于启发式策略的随机游走有助于清晰地捕获低度节点的社区边界特征。

10.根据权利要求8所述的一种基于社区感知和自适应随机游走的景点推荐方系统，其特征在于，所述聚类和景点推荐模块，具体的：根据用户特征和历史旅游记录以及旅游评分情况将类似的用户聚类在一起，对于需要推荐旅游景点的用户，首先找到其所在的类簇，其次寻找向量距离最接近的用户，从其旅游过的景点评分集合中找出评分最高的若干个景点，作为推荐景点。