CN112800346A

CN112800346A - 一种融入空间关系的poi推荐方法及推荐系统

Info

Publication number: CN112800346A
Application number: CN202110055564.5A
Authority: CN
Inventors: 魏海涛; 李柯; 田智慧; 赫晓慧
Original assignee: Zhengzhou University
Current assignee: Zhengzhou University
Priority date: 2021-01-15
Filing date: 2021-01-15
Publication date: 2021-05-14
Anticipated expiration: 2041-01-15
Also published as: CN112800346B

Abstract

本发明公开了一种融入空间关系的POI推荐方法及推荐系统，根据收集用户在LBSN服务平台上生成的时空信息和POI时空信息，依据所述时空信息确定所述用户签到行为受空间关系的影响模式；根据所述用户生成的时空信息，划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式，根据所述POI时空信息，使用KNN算法计算出每个POI的地理邻居，并通过POI的地理邻居构建POI与POI之间的空间关系影响模式；缓解了数据稀疏和隐性反馈问题。

Description

一种融入空间关系的POI推荐方法及推荐系统

技术领域

本发明涉及数据挖掘领域的推荐技术，具体涉及一种融入空间关系的 POI推荐方法及推荐系统。

背景技术

随着社交网络，全球定位技术和移动互联服务的发展，基于位置的社交网络(Location-Based Social Network,LBSN)服务也随之流行并改变人们的日常生活；LBSN服务通过用户的社交媒体将用户访问一个位置或签到的信息分享给社交网络好友，通过这种签到信息，可以发掘出用户与其签到位置的相互关系，并以此帮助人们寻找他们感兴趣的地方。因此导致了POI推荐技术的兴起。

POI推荐技术主要面临的两个主要问题：数据稀疏和隐性反馈。数据稀疏，难以准确的对用户行为进行建模；隐性反馈，即通过签到数据难以得知用户偏爱。这两个问题极大地影响了推荐技术的性能以及用户对推荐结果的满意度。

发明内容

为了解决上述问题，本发明提供了一种融入空间关系的矩阵分解 POI推荐方法及推荐系统，缓解了数据稀疏和隐性反馈导致的推荐性能低的问题。

本发明的目的是这样实现的：

一种融入空间关系的POI推荐方法，包括以下步骤：步骤1：根据收集用户在LBSN服务平台上生成的时空信息和POI时空信息，依据所述时空信息确定所述用户签到行为受空间关系的影响模式；步骤2：根据步骤1中所述用户生成的时空信息，划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式，根据步骤1中所述POI时空信息，使用KNN算法计算出每个POI 的地理邻居，并通过POI的地理邻居构建POI与POI之间的空间关系影响模式；步骤3：利用融入空间关系的矩阵分解方法得到用户和POI的嵌入向量、用户和POI 偏置项，通过预测公式对每个用户可能会访问的POI进行预测并将预测值按大小进行排序，进行POI推荐。

所述步骤1中用户在LBSN服务平台上生成的时空信息和POI时空信息包括：用户历史签到记录，用户唯一编号，POI唯一编号，POI经纬度坐标，用户签到时间。

所述步骤1中依据所述时空信息确定所述用户签到行为受空间关系的影响模式包括：空间关系在用户与POI之间的影响、空间关系在POI与POI之间的影响。

所述步骤2中划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式包括：

生活圈半径是通过实验调整和理论分析得到的；

用户活动中心是通过计算用户历史签到数据得到的，其计算过程为：首先，根据时空信息，统计用户访问的POI位置(经纬度)、频率，假设每个POI的权重相同，将用户访问过的POI经纬度分别累加，之后除以用户访问过的POI 个数计算出每个用户的活动中心(以经纬度表示)；

对于用户与POI之间的空间关系影响模式，使用非线性函数给予空间关系影响一个指示值，所述衡量用户与POI之间的空间关系的公式为：

其中，D_ui＝1，表示POI i在以用户u活动中心为中心的生活圈范围内，反之不在。dis(i|u)是POI i距离用户u往常活动中心的距离，d是根据生活圈理论以及实验测试所得出的生活圈半径。

所述步骤2中使用KNN算法计算出每个POI的地理邻居，并通过POI 的地理邻居构建POI与POI之间的空间关系影响模式包括：通过所述时空信息，使用KNN算法选择离POI最近的K个POI作为该POI的地理邻居；

对于POI与POI之间的空间关系影响模式，使用每个POI的K的地理邻居表示，所述衡量POI与POI之间的空间关系的公式为：

其中，

表示在所述时空信息下，POI i的地理邻居被访问频率总和，是POI i的地理邻居在历史签到记录中的总体曝光量，I_i表示使用KNN算法计算得到的POI i的地理邻居集合；

表示所有POI地理邻居被访问频率总和的均值，是衡量一个POI地理邻居总体曝光量大小的指标，I表示在所述时空信息下所有POI集合；μ表示计算系数，

表示sigmoid函数。

所述步骤3中利用融入空间关系的矩阵分解方法得到用户嵌入向量、 POI的嵌入向量、用户偏置项和POI偏置项包括步骤：

a1.利用所述时空信息，获得空间信息在用户与POI间的影响模式和空间信息在POI与POI间的影响模式；

a2.利用所述矩阵分解方法，结合空间关系的影响，学习得到用户和POI的嵌入向量。

所述步骤3中学习得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置项方法包括：

b1.进行以下更新操作，直到目标函数收敛；

b2.利用随机梯度下降法更新用户嵌入向量，所述更新用户嵌入向量的公式为：

其中，

表示融入空间关系的矩阵分解方法中得到用户向量的目标函数，w_ui表示用户u在POI i的历史签到记录频率有关的信任度，更多的签到记录意味着更大的信任度，由于用户-POI 签到矩阵中的0元素可能是未知情况，所以只有是1的元素才加入优化，

是r_ui的预测值，

越大表示用户u访问POI i的概率越大，α1表示空间距离关系影响系数，

表示距离用户u活动中心小于d km的POI集合；w_i表示

集合长度的倒数，α2表示考虑空间拓扑关系的空间距离影响系数，

表示POI i的K个地理邻居集合，w_i″表示使用 softmax函数根据空间关系影响Gi计算的权重，b_i是POI i的偏置项，b_u是用户 u的偏置项，p_u是用户u的嵌入向量，

是POI i的嵌入向量的转置，λ为正则项系数；eta为学习率。

利用随机梯度下降法更新POI嵌入向量，所述更新POI嵌入向量的公式为：

利用随机梯度下降法更新用户偏置项，所述更新用户偏置项的公式为：

利用随机梯度下降法更新POI偏置项，所述更新POI偏置项的公式为：

通过所述预测公式

对每个用户可能会访问的POI进行预测并将POI推荐给用户。

一种POI推荐系统，包括数据转化模块、分析模块和推荐模块，所述数据转化模块用于将用户在LBSN上在产生的时空信息及POI时空信息等用户签到信息转化成用户-POI矩阵；所述分析模块用于根据所述时空信息确定用户签到行为受空间关系的影响模式；所述推荐模块用于根据所述预测公式得到的预测值大小进行POI推荐。

本发明的有益效果是：本发明提出了一种融入空间关系的矩阵分解 POI推荐方法(cooperative competition matrix factorization,CC-MF)，该方法包含两项基本技术：一是从用户与POI之间和POI与POI之间两个方面考虑空间关系；二是根据空间关系对用户与POI进行特有建模，并使用加权最小二乘准则，从而缓解了数据稀疏和隐性反馈使用这两个主要问题，本发明的推荐方法在POI推荐的精确率和召回率方面，均优于现有的推荐方法。

附图说明

图1是本发明的步骤流程图；

图2是本发明实施中用户生活圈的示意图；

图3是本发明实施例中在现实世界签到Foursquare数据集上本发明与现有技术在POI推荐的精确率比较；

图4是本发明实施例中在现实世界签到Foursquare数据集上本发明与现有技术在POI推荐的召回率比较；

具体实施方式

以下结合附图和实施例对本发明作进一步说明。

实施例1：

如图1所示，一种融入空间关系的POI推荐方法，包括以下步骤：步骤1：根据收集用户在LBSN服务平台上生成的时空信息和POI时空信息，依据所述时空信息确定所述用户签到行为受空间关系的影响模式；

所述用户在LBSN服务平台上生成的时空信息和POI时空信息包括：用户历史签到记录，用户唯一编号，POI唯一编号，POI经纬度坐标，用户签到时间；依据所述时空信息确定所述用户签到行为受空间关系的影响模式包括空间关系在用户与POI之间的影响和空间关系在POI与POI之间的影响。

步骤2：根据所述用户生成的时空信息，划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式，根据所述POI时空信息，使用KNN算法计算出每个POI的地理邻居，并通过POI的地理邻居构建POI与POI之间的空间关系影响模式；

划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式包括：

生活圈半径是通过实验调整和理论分析得到的；

用户活动中心是通过计算用户历史签到数据得到的，其计算过程为：首先，根据时空信息，统计用户访问的POI位置(经纬度)、频率，假设每个POI的权重相同，将用户访问过的POI经纬度分别累加，之后除以用户访问过的POI个数计算出每个用户的活动中心(以经纬度表示)。

其中，D_ui＝1，表示POI i在以用户u活动中心为中心的生活圈范围内，反之不在。dis(i|u)是POI i距离用户u往常活动中心的距离，d是本实施例根据生活圈理论以及实验测试所得出的生活圈半径。

图2是一种用户生活圈示意图。

所述使用KNN算法计算出每个POI的地理邻居，并通过POI的地理邻居构建POI与POI之间的空间关系影响模式包括：

通过所述时空信息，使用KNN算法选择离POI最近的K个POI作为该POI 的地理邻居；

其中，

表示sigmoid函数。

步骤3：利用融入空间关系的矩阵分解方法得到用户和POI的嵌入向量、用户和POI偏置项，通过预测公式对每个用户可能会访问的POI进行预测并将预测值按大小进行排序，进行POI推荐；

利用融入空间关系的矩阵分解方法得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置项包括步骤：

所述学习得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置项方法包括：

b1.进行以下更新操作，直到目标函数收敛：

其中，

表示融入空间关系的矩阵分解方法中得到用户向量的目标函数，w_ui表示用户u在POI i的历史签到记录频率有关的信任度，更多的签到记录意味着更大的信任度，由于用户-POI签到矩阵中的0元素可能是未知情况，所以只有是1的元素才加入优化，

是r_ui的预测值，

表示距离用户u活动中心小于d km的POI集合。w_i′表示

是POI i的嵌入向量的转置，λ为正则项系数；eta为学习率。

通过所述预测公式

对每个用户可能会访问的POI进行预测并将POI推荐给用户。

下面以一个具体的实施例来做进一步的说明。

本发明方法是利用机器学习实现的，本实施例的运行环境为： Python3.7，Windows 10，Core i7-8700，32GB RAM。

数据集：

Foursquare数据集。Foursquare是目前使用较多的基于位置的社交网络服务供应平台。该Foursquare数据集中包含新加坡的2321名用户和5596个POI，共 194108个签到记录，该数据集中记录的有用户ID，兴趣点ID，POI位置(经纬度)，用户签到时间。

如步骤1所示，依据所述时空信息确定所述用户签到行为受空间关系的影响模式；

依据所述时空信息确定所述用户签到行为受空间关系的影响模式包括：

空间关系在用户与POI之间的影响；空间关系在POI与POI之间的影响。

根据步骤2和步骤3，进行POI推荐的过程如下：

首先，对空间关系在用户与POI之间的影响和空间关系在POI与POI之间的影响建模。

1)划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式包括：

生活圈半径是通过实验调整和理论分析得到的，在本实施例取d＝1.5km；用户活动中心是通过计算用户历史签到数据得到的，其计算过程为：首先，根据时空信息，统计用户访问的POI位置(经纬度)、频率，假设每个POI的权重相同，将用户访问过的POI经纬度分别累加，之后除以用户访问过的POI个数计算出每个用户的活动中心(以经纬度表示)。假设用户的签到行为是随机的，那么用户签到数据就是用户活动轨迹上的离散点，用户签到数据和用户活动轨迹服从同一分布，可以认为，通过用户签到数据能够较为准确的计算出用户的生活圈和活动中心。

2)使用KNN算法计算出每个POI的地理邻居，并通过POI的地理邻居构建POI与POI之间的空间关系影响模式包括：

通过所述时空信息，使用KNN算法选择离POI最近的K个POI作为该POI 的地理邻居。

其中，

表示所有POI地理邻居被访问频率总和的均值，是衡量一个POI地理邻居总体曝光量大小的指标，I表示在所述时空信息下所有POI集合；μ表示计算系数，本实施例取0.1，

表示 sigmoid函数。计算Gi过程中使用sigmoid函数是为了增大地理邻居访问频率总和在

附近的POI间差异，而减小地理邻居访问频率总和远大于或远小于

的 POI间的差异，可以强化考虑空间关系对位于均衡地带POI的影响，而弱化对位于特别繁华地带的POI或特别位于特别不繁华地带的POI的影响。

3)利用融入空间关系的矩阵分解方法得到用户和POI的嵌入向量、用户和POI偏置项。

融入空间关系的矩阵分解方法预测公式为：

p_u和q_i，b_u和b_i使用高斯分布进行初始化。

目标函数为：

进行以下更新操作，直到目标函数收敛：

利用随机梯度下降法更新用户嵌入向量、POI的嵌入向量、用户偏置项和POI 偏置项，所述更新公式为：

模型运行，得到输出p_u和q_i，b_u和b_i。

4)通过所述预测公式

对每个用户可能会访问的POI进行预测，并将预测值最大的k个POI推荐给用户。

为了验证本发明推荐方法的有效性和效果，将本发明提出的POI推荐方法与现有的常用的POI推荐方法进行比较。所述现有的POI推荐方法包括以下几种：

基于用户的协同过滤(user-based collaborative filtering,UCF)，UCF是一种经典的基于用户协同过滤推荐方法；

该方法记载在：Zhou D,Wang B,Rahimi S M,et al.AStudy ofRecommendingLocations on Location-based Social Network by Collaborative Filtering[C].Proceedings of the Twenty-fifth Canadian Conference on ArtificialIntelligence, Toronto,Canada,2012,Springer,Berlin,Germany。

分解个性化马尔科夫链(factorized personalized markov chain,FPMC)， FPMC是将用户偏好转化为个性化的马尔科夫链；

该方法记载在：Li X,Jiang M,Hong H,et al.A Time-aware PersonalizedPoint-of-interest Recommendation via High-order Tensor Factorization[J].ACMTrans Inf Syst,2017,35(4):1-23。

基于排序的地理因子分解方法(ranking based geographical factorizationmethod,Rank-GeoFM)，Rank-GeoFM是融合空间因素的MF模型，且运用一种排序优化算法；

该方法记载在：Li X,Cong G,Li X-L,et al.Rank-GeoFM:A Ranking BasedGeographical Factorization Method for Point of Interest Recommendation[C].Proceedings of the 38th International ACM SIGIR Conference on Research andDevelopment in Information Retrieval,Santiago,Chile,2015,ACM,New York, NY。

特征空间分离因子分解模型(feature-space separated factorization model,FSS-FM/T)，FSS＝FM/T是融入空间因素的WMF模型，运用排序优化算法；该方法记载在：CaiL,Xu J,Liu J,et al.Integrating Spatial and Temporal Contexts into AFactorization Model for POI Recommendation[J].International Journal ofGeographical Information Science,2018,32(3):524-546。

基于矩阵分解的上下文感知POI推荐模型(general matrix factorizationmodel,UCGSMF)，UCGSMF是融合地理信息的矩阵分解上下文感知的推荐算法；

该方法记载在：Peng Hongyuan,Jin Yuanyuan,Lv Xiaoqiang,et al.Context-Aware POI Recommendation Based on Matrix Factorization[J].Chinese Journal ofComputers,2019,42(08):1797-1811(彭宏伟,靳远远,吕晓强,等.一种基于矩阵分解的上下文感知POI推荐算法[J].计算机学报,2019,42(08):1 797-1 811)。

本领域两个常用的指标，即精确率和召回率(P@k和R@k)，可用这两个指标作为衡量POI推荐方法的性能。精确率指推荐正确的POI个数与推荐个数k的比值，召回率值推荐正确的POI个数与用户在测试集中实际去过的POI 个数的比值

其中，S_u表示用户在测试集中访问过的POI集合；M_u(k)表示CC-MF推荐算法得出的k个POI集合。

如图3和图4所示，与常用的方法i，在推荐个数k＝5，10，20的情况下，本发明的POI推荐方法CC-MF的推荐结果的精确率和召回率均有提高。

本实施例为一种POI推荐系统，包括：数据转化模块、分析模块和推荐模块。

数据转化模块，用于将用户在LBSN上在产生的时空信息及POI时空信息等用户签到信息转化成用户-POI矩阵。

分析模块，用于根据所述时空信息确定用户签到行为受空间关系的影响模式。

推荐模块，用于根据所述预测公式得到的预测值大小进行POI推荐。

基于实施例1的数据和步骤，利用本实施例的融入空间关系的推荐系统按照相同的方式为用户进行个性化POI推荐。

Claims

1.一种融入空间关系的POI推荐方法，其特征在于：包括以下步骤：步骤1：根据收集用户在LBSN服务平台上生成的时空信息和POI时空信息，依据所述时空信息确定所述用户签到行为受空间关系的影响模式；步骤2：根据步骤1中所述用户生成的时空信息，划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式，根据步骤1中所述POI时空信息，使用KNN算法计算出每个POI的地理邻居，并通过POI的地理邻居构建POI与POI之间的空间关系影响模式；步骤3：利用融入空间关系的矩阵分解方法得到用户和POI的嵌入向量、用户和POI偏置项，通过预测公式对每个用户可能会访问的POI进行预测并将预测值按大小进行排序，进行POI推荐。

2.根据权利要求1所述融入空间关系的POI推荐方法，其特征在于：所述步骤1中用户在LBSN服务平台上生成的时空信息和POI时空信息包括：用户历史签到记录，用户唯一编号，POI唯一编号，POI经纬度坐标，用户签到时间。

3.根据权利要求1所述融入空间关系的POI推荐方法，其特征在于：所述步骤1中依据所述时空信息确定所述用户签到行为受空间关系的影响模式包括：空间关系在用户与POI之间的影响、空间关系在POI与POI之间的影响。

4.根据权利要求1或3所述融入空间关系的POI推荐方法，其特征在于：所述步骤2中划分出用户生活圈范围，并通过此生活圈范围构建用户与POI间的空间关系影响模式包括：

生活圈半径是通过实验调整和理论分析得到的；

用户活动中心是通过计算用户历史签到数据得到的，其计算过程为：首先，根据时空信息，统计用户访问的POI位置(经纬度)、频率，假设每个POI的权重相同，将用户访问过的POI经纬度分别累加，之后除以用户访问过的POI个数计算出每个用户的活动中心(以经纬度表示)；

5.根据权利要求1或3所述融入空间关系的POI推荐方法，其特征在于：所述步骤2中使用KNN算法计算出每个POI的地理邻居，并通过POI的地理邻居构建POI与POI之间的空间关系影响模式包括：通过所述时空信息，使用KNN算法选择离POI最近的K个POI作为该POI的地理邻居；

其中，

表示sigmoid函数。

6.根据权利要求1所述融入空间关系的POI推荐方法，其特征在于：所述步骤3中利用融入空间关系的矩阵分解方法得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置项包括步骤：

7.根据权利要求6所述融入空间关系的POI推荐方法，其特征在于：所述步骤3中学习得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置项方法包括：

b1.进行以下更新操作，直到目标函数收敛；

其中，

是r_ui的预测值，

表示距离用户u活动中心小于d km的POI集合；w_i′表示

表示POI i的K个地理邻居集合，w_i″表示使用softmax函数根据空间关系影响Gi计算的权重，b_i是POI i的偏置项，b_u是用户u的偏置项，p_u是用户u的嵌入向量，

是POI i的嵌入向量的转置，λ为正则项系数；eta为学习率。

8.根据权利要求1或7所述融入空间关系的POI推荐方法，其特征在于：通过所述预测公式

对每个用户可能会访问的POI进行预测并将POI推荐给用户。

9.根据权利要求1-8任一项所述融入空间关系的POI推荐方法的POI推荐系统，其特征在于：包括数据转化模块、分析模块和推荐模块，所述数据转化模块用于将用户在LBSN上在产生的时空信息及POI时空信息等用户签到信息转化成用户-POI矩阵；所述分析模块用于根据所述时空信息确定用户签到行为受空间关系的影响模式；所述推荐模块用于根据所述预测公式得到的预测值大小进行POI推荐。