CN112800346A - 一种融入空间关系的poi推荐方法及推荐系统 - Google Patents

一种融入空间关系的poi推荐方法及推荐系统 Download PDF

Info

Publication number
CN112800346A
CN112800346A CN202110055564.5A CN202110055564A CN112800346A CN 112800346 A CN112800346 A CN 112800346A CN 202110055564 A CN202110055564 A CN 202110055564A CN 112800346 A CN112800346 A CN 112800346A
Authority
CN
China
Prior art keywords
poi
user
spatial relationship
pois
spatial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110055564.5A
Other languages
English (en)
Other versions
CN112800346B (zh
Inventor
魏海涛
李柯
田智慧
赫晓慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Priority to CN202110055564.5A priority Critical patent/CN112800346B/zh
Publication of CN112800346A publication Critical patent/CN112800346A/zh
Application granted granted Critical
Publication of CN112800346B publication Critical patent/CN112800346B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种融入空间关系的POI推荐方法及推荐系统,根据收集用户在LBSN服务平台上生成的时空信息和POI时空信息,依据所述时空信息确定所述用户签到行为受空间关系的影响模式;根据所述用户生成的时空信息,划分出用户生活圈范围,并通过此生活圈范围构建用户与POI间的空间关系影响模式,根据所述POI时空信息,使用KNN算法计算出每个POI的地理邻居,并通过POI的地理邻居构建POI与POI之间的空间关系影响模式;缓解了数据稀疏和隐性反馈问题。

Description

一种融入空间关系的POI推荐方法及推荐系统
技术领域
本发明涉及数据挖掘领域的推荐技术,具体涉及一种融入空间关系的 POI推荐方法及推荐系统。
背景技术
随着社交网络,全球定位技术和移动互联服务的发展,基于位置的 社交网络(Location-Based Social Network,LBSN)服务也随之流行并改变人们 的日常生活;LBSN服务通过用户的社交媒体将用户访问一个位置或签到的信 息分享给社交网络好友,通过这种签到信息,可以发掘出用户与其签到位置的 相互关系,并以此帮助人们寻找他们感兴趣的地方。因此导致了POI推荐技术 的兴起。
POI推荐技术主要面临的两个主要问题:数据稀疏和隐性反馈。数 据稀疏,难以准确的对用户行为进行建模;隐性反馈,即通过签到数据难以得 知用户偏爱。这两个问题极大地影响了推荐技术的性能以及用户对推荐结果的 满意度。
发明内容
为了解决上述问题,本发明提供了一种融入空间关系的矩阵分解 POI推荐方法及推荐系统,缓解了数据稀疏和隐性反馈导致的推荐性能低的问 题。
本发明的目的是这样实现的:
一种融入空间关系的POI推荐方法,包括以下步骤:步骤1:根据收集用户 在LBSN服务平台上生成的时空信息和POI时空信息,依据所述时空信息确定所 述用户签到行为受空间关系的影响模式;步骤2:根据步骤1中所述用户生成的 时空信息,划分出用户生活圈范围,并通过此生活圈范围构建用户与POI间的空 间关系影响模式,根据步骤1中所述POI时空信息,使用KNN算法计算出每个POI 的地理邻居,并通过POI的地理邻居构建POI与POI之间的空间关系影响模式;步 骤3:利用融入空间关系的矩阵分解方法得到用户和POI的嵌入向量、用户和POI 偏置项,通过预测公式对每个用户可能会访问的POI进行预测并将预测值按大小 进行排序,进行POI推荐。
所述步骤1中用户在LBSN服务平台上生成的时空信息和POI时空信息 包括:用户历史签到记录,用户唯一编号,POI唯一编号,POI经纬度坐标,用 户签到时间。
所述步骤1中依据所述时空信息确定所述用户签到行为受空间关系的 影响模式包括:空间关系在用户与POI之间的影响、空间关系在POI与POI之间的 影响。
所述步骤2中划分出用户生活圈范围,并通过此生活圈范围构建用户 与POI间的空间关系影响模式包括:
生活圈半径是通过实验调整和理论分析得到的;
用户活动中心是通过计算用户历史签到数据得到的,其计算过程为:首先, 根据时空信息,统计用户访问的POI位置(经纬度)、频率,假设每个POI的权 重相同,将用户访问过的POI经纬度分别累加,之后除以用户访问过的POI 个数计算出每个用户的活动中心(以经纬度表示);
对于用户与POI之间的空间关系影响模式,使用非线性函数给予空间关系 影响一个指示值,所述衡量用户与POI之间的空间关系的公式为:
Figure BDA0002900830020000021
其中,Dui=1,表示POI i在以用户u活动中心为中 心的生活圈范围内,反之不在。dis(i|u)是POI i距离用户u往常活动中心的 距离,d是根据生活圈理论以及实验测试所得出的生活圈半径。
所述步骤2中使用KNN算法计算出每个POI的地理邻居,并通过POI 的地理邻居构建POI与POI之间的空间关系影响模式包括:通过所述时空信息, 使用KNN算法选择离POI最近的K个POI作为该POI的地理邻居;
对于POI与POI之间的空间关系影响模式,使用每个POI的K的地理邻居 表示,所述衡量POI与POI之间的空间关系的公式为:
Figure BDA0002900830020000031
其中,
Figure BDA0002900830020000032
表示在所述时空信息下,POI i的地理邻居被访问频率总和, 是POI i的地理邻居在历史签到记录中的总体曝光量,Ii表示使用KNN算法计 算得到的POI i的地理邻居集合;
Figure BDA0002900830020000033
表示所有POI地理邻居被访问频率 总和的均值,是衡量一个POI地理邻居总体曝光量大小的指标,I表示在所述 时空信息下所有POI集合;μ表示计算系数,
Figure BDA0002900830020000034
表示sigmoid函数。
所述步骤3中利用融入空间关系的矩阵分解方法得到用户嵌入向量、 POI的嵌入向量、用户偏置项和POI偏置项包括步骤:
a1.利用所述时空信息,获得空间信息在用户与POI间的影响模式和空间信 息在POI与POI间的影响模式;
a2.利用所述矩阵分解方法,结合空间关系的影响,学习得到用户和POI的嵌 入向量。
所述步骤3中学习得到用户嵌入向量、POI的嵌入向量、用户偏置项 和POI偏置项方法包括:
b1.进行以下更新操作,直到目标函数收敛;
b2.利用随机梯度下降法更新用户嵌入向量,所述更新用户嵌入向量的公式 为:
Figure BDA0002900830020000035
其中,
Figure BDA0002900830020000036
表示融入空间关系的矩阵分解方法中得到用户向量的目标函数,wui表示用户u在POI i的历史签到记 录频率有关的信任度,更多的签到记录意味着更大的信任度,由于用户-POI 签到矩阵中的0元素可能是未知情况,所以只有是1的元素才加入优化,
Figure BDA0002900830020000041
是rui的预测值,
Figure BDA0002900830020000042
越大表示用户u访 问POI i的概率越大,α1表示空间距离关系影响系数,
Figure BDA0002900830020000043
表示距离用户u活动 中心小于d km的POI集合;wi表示
Figure BDA0002900830020000044
集合长度的倒数,α2表示考虑空间拓扑 关系的空间距离影响系数,
Figure BDA0002900830020000045
表示POI i的K个地理邻居集合,wi″表示使用 softmax函数根据空间关系影响Gi计算的权重,bi是POI i的偏置项,bu是用户 u的偏置项,pu是用户u的嵌入向量,
Figure BDA0002900830020000046
是POI i的嵌入向量的转置,λ为正则 项系数;eta为学习率。
利用随机梯度下降法更新POI嵌入向量,所述更新POI嵌入向量的 公式为:
Figure BDA0002900830020000047
利用随机梯度下降法更新用户偏置项,所述更新用户偏置项的公式为:
Figure BDA0002900830020000048
利用随机梯度下降法更新POI偏置项,所述更新POI偏置项的公式为:
Figure BDA0002900830020000049
通过所述预测公式
Figure BDA00029008300200000410
对每个用户可能会访问的POI进行预测并将POI推荐给用户。
一种POI推荐系统,包括数据转化模块、分析模块和推荐模块,所述 数据转化模块用于将用户在LBSN上在产生的时空信息及POI时空信息等用户签 到信息转化成用户-POI矩阵;所述分析模块用于根据所述时空信息确定用户签 到行为受空间关系的影响模式;所述推荐模块用于根据所述预测公式得到的预 测值大小进行POI推荐。
本发明的有益效果是:本发明提出了一种融入空间关系的矩阵分解 POI推荐方法(cooperative competition matrix factorization,CC-MF),该方法包含 两项基本技术:一是从用户与POI之间和POI与POI之间两个方面考虑空间关系; 二是根据空间关系对用户与POI进行特有建模,并使用加权最小二乘准则,从而 缓解了数据稀疏和隐性反馈使用这两个主要问题,本发明的推荐方法在POI推荐 的精确率和召回率方面,均优于现有的推荐方法。
附图说明
图1是本发明的步骤流程图;
图2是本发明实施中用户生活圈的示意图;
图3是本发明实施例中在现实世界签到Foursquare数据集上本发明与现有技术在POI推荐的精确率比较;
图4是本发明实施例中在现实世界签到Foursquare数据集上本发明与现有技术在POI推荐的召回率比较;
具体实施方式
以下结合附图和实施例对本发明作进一步说明。
实施例1:
如图1所示,一种融入空间关系的POI推荐方法,包括以下步骤:步骤1:根 据收集用户在LBSN服务平台上生成的时空信息和POI时空信息,依据所述时 空信息确定所述用户签到行为受空间关系的影响模式;
所述用户在LBSN服务平台上生成的时空信息和POI时空信息包括:用户历史 签到记录,用户唯一编号,POI唯一编号,POI经纬度坐标,用户签到时间; 依据所述时空信息确定所述用户签到行为受空间关系的影响模式包括空间关 系在用户与POI之间的影响和空间关系在POI与POI之间的影响。
步骤2:根据所述用户生成的时空信息,划分出用户生活圈范围,并 通过此生活圈范围构建用户与POI间的空间关系影响模式,根据所述POI时空 信息,使用KNN算法计算出每个POI的地理邻居,并通过POI的地理邻居构 建POI与POI之间的空间关系影响模式;
划分出用户生活圈范围,并通过此生活圈范围构建用户与POI间的空间关系影 响模式包括:
生活圈半径是通过实验调整和理论分析得到的;
用户活动中心是通过计算用户历史签到数据得到的,其计算过程为:首先,根 据时空信息,统计用户访问的POI位置(经纬度)、频率,假设每个POI的权重 相同,将用户访问过的POI经纬度分别累加,之后除以用户访问过的POI个数 计算出每个用户的活动中心(以经纬度表示)。
对于用户与POI之间的空间关系影响模式,使用非线性函数给予空间 关系影响一个指示值,所述衡量用户与POI之间的空间关系的公式为:
Figure BDA0002900830020000061
其中,Dui=1,表示POI i在以用户u活动中心为中心的生活圈范围内,反之 不在。dis(i|u)是POI i距离用户u往常活动中心的距离,d是本实施例根据生 活圈理论以及实验测试所得出的生活圈半径。
图2是一种用户生活圈示意图。
所述使用KNN算法计算出每个POI的地理邻居,并通过POI的地理 邻居构建POI与POI之间的空间关系影响模式包括:
通过所述时空信息,使用KNN算法选择离POI最近的K个POI作为该POI 的地理邻居;
对于POI与POI之间的空间关系影响模式,使用每个POI的K的地理邻居表 示,所述衡量POI与POI之间的空间关系的公式为:
Figure BDA0002900830020000062
其中,
Figure BDA0002900830020000063
表示在所述时空信息下,POI i的地理邻居被访问频率总和, 是POI i的地理邻居在历史签到记录中的总体曝光量,Ii表示使用KNN算法计 算得到的POI i的地理邻居集合;
Figure BDA0002900830020000071
表示所有POI地理邻居被访问频率 总和的均值,是衡量一个POI地理邻居总体曝光量大小的指标,I表示在所述 时空信息下所有POI集合;μ表示计算系数,
Figure BDA0002900830020000072
表示sigmoid函数。
步骤3:利用融入空间关系的矩阵分解方法得到用户和POI的嵌入向 量、用户和POI偏置项,通过预测公式对每个用户可能会访问的POI进行预测 并将预测值按大小进行排序,进行POI推荐;
利用融入空间关系的矩阵分解方法得到用户嵌入向量、POI的嵌入向量、用户 偏置项和POI偏置项包括步骤:
a1.利用所述时空信息,获得空间信息在用户与POI间的影响模式和空间信息 在POI与POI间的影响模式;
a2.利用所述矩阵分解方法,结合空间关系的影响,学习得到用户和POI的嵌 入向量。
所述学习得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置 项方法包括:
b1.进行以下更新操作,直到目标函数收敛:
b2.利用随机梯度下降法更新用户嵌入向量,所述更新用户嵌入向量的公式为:
Figure BDA0002900830020000073
其中,
Figure BDA0002900830020000074
表示融入空间关系的矩阵 分解方法中得到用户向量的目标函数,wui表示用户u在POI i的历史签到记录 频率有关的信任度,更多的签到记录意味着更大的信任度,由于用户-POI签到 矩阵中的0元素可能是未知情况,所以只有是1的元素才加入优化,
Figure BDA0002900830020000075
是rui的预测值,
Figure BDA0002900830020000076
越大表示用户u访 问POI i的概率越大,α1表示空间距离关系影响系数,
Figure BDA0002900830020000081
表示距离用户u活动 中心小于d km的POI集合。wi′表示
Figure BDA0002900830020000082
集合长度的倒数,α2表示考虑空间拓扑 关系的空间距离影响系数,
Figure BDA0002900830020000083
表示POI i的K个地理邻居集合,wi″表示使用 softmax函数根据空间关系影响Gi计算的权重,bi是POI i的偏置项,bu是用户 u的偏置项,pu是用户u的嵌入向量,
Figure BDA0002900830020000084
是POI i的嵌入向量的转置,λ为正则 项系数;eta为学习率。
利用随机梯度下降法更新POI嵌入向量,所述更新POI嵌入向量的公 式为:
Figure BDA0002900830020000085
利用随机梯度下降法更新用户偏置项,所述更新用户偏置项的公式为:
Figure BDA0002900830020000086
利用随机梯度下降法更新POI偏置项,所述更新POI偏置项的公式为:
Figure BDA0002900830020000087
通过所述预测公式
Figure BDA0002900830020000088
对每个用户可能会访 问的POI进行预测并将POI推荐给用户。
下面以一个具体的实施例来做进一步的说明。
本发明方法是利用机器学习实现的,本实施例的运行环境为: Python3.7,Windows 10,Core i7-8700,32GB RAM。
数据集:
Foursquare数据集。Foursquare是目前使用较多的基于位置的社交网络服务供应平台。该Foursquare数据集中包含新加坡的2321名用户和5596个POI,共 194108个签到记录,该数据集中记录的有用户ID,兴趣点ID,POI位置(经纬 度),用户签到时间。
如步骤1所示,依据所述时空信息确定所述用户签到行为受空间关系 的影响模式;
依据所述时空信息确定所述用户签到行为受空间关系的影响模式包括:
空间关系在用户与POI之间的影响;空间关系在POI与POI之间的影响。
根据步骤2和步骤3,进行POI推荐的过程如下:
首先,对空间关系在用户与POI之间的影响和空间关系在POI与POI之间的 影响建模。
1)划分出用户生活圈范围,并通过此生活圈范围构建用户与POI间的 空间关系影响模式包括:
生活圈半径是通过实验调整和理论分析得到的,在本实施例取d=1.5km; 用户活动中心是通过计算用户历史签到数据得到的,其计算过程为:首先,根 据时空信息,统计用户访问的POI位置(经纬度)、频率,假设每个POI的权重 相同,将用户访问过的POI经纬度分别累加,之后除以用户访问过的POI个数 计算出每个用户的活动中心(以经纬度表示)。假设用户的签到行为是随机的, 那么用户签到数据就是用户活动轨迹上的离散点,用户签到数据和用户活动轨 迹服从同一分布,可以认为,通过用户签到数据能够较为准确的计算出用户的 生活圈和活动中心。
对于用户与POI之间的空间关系影响模式,使用非线性函数给予空间 关系影响一个指示值,所述衡量用户与POI之间的空间关系的公式为:
Figure BDA0002900830020000091
其中,Dui=1,表示POI i在以用户u活动中心为中心的生活圈范围内,反之 不在。dis(i|u)是POI i距离用户u往常活动中心的距离,d是本实施例根据生 活圈理论以及实验测试所得出的生活圈半径。
2)使用KNN算法计算出每个POI的地理邻居,并通过POI的地理邻 居构建POI与POI之间的空间关系影响模式包括:
通过所述时空信息,使用KNN算法选择离POI最近的K个POI作为该POI 的地理邻居。
对于POI与POI之间的空间关系影响模式,使用每个POI的K的地理 邻居表示,所述衡量POI与POI之间的空间关系的公式为:
Figure BDA0002900830020000101
其中,
Figure BDA0002900830020000102
表示在所述时空信息下,POI i的地理邻居被访问频率总和, 是POI i的地理邻居在历史签到记录中的总体曝光量,Ii表示使用KNN算法计 算得到的POI i的地理邻居集合;
Figure BDA0002900830020000103
表示所有POI地理邻居被访问频率 总和的均值,是衡量一个POI地理邻居总体曝光量大小的指标,I表示在所述 时空信息下所有POI集合;μ表示计算系数,本实施例取0.1,
Figure BDA0002900830020000104
表示 sigmoid函数。计算Gi过程中使用sigmoid函数是为了增大地理邻居访问频率 总和在
Figure BDA0002900830020000107
附近的POI间差异,而减小地理邻居访问频率总和远大于或远小于
Figure BDA0002900830020000108
的 POI间的差异,可以强化考虑空间关系对位于均衡地带POI的影响,而弱化对位于特别繁华地带的POI或特别位于特别不繁华地带的POI的影响。
3)利用融入空间关系的矩阵分解方法得到用户和POI的嵌 入向量、用户和POI偏置项。
融入空间关系的矩阵分解方法预测公式为:
Figure RE-GDA0003000557960000131
pu和qi,bu和bi使用高斯分布进行初始化。
目标函数为:
Figure BDA0002900830020000106
进行以下更新操作,直到目标函数收敛:
利用随机梯度下降法更新用户嵌入向量、POI的嵌入向量、用户偏置项和POI 偏置项,所述更新公式为:
Figure BDA0002900830020000111
Figure BDA0002900830020000112
Figure BDA0002900830020000113
Figure BDA0002900830020000114
模型运行,得到输出pu和qi,bu和bi
4)通过所述预测公式
Figure BDA0002900830020000115
对每个用 户可能会访问的POI进行预测,并将预测值最大的k个POI推荐给用户。
为了验证本发明推荐方法的有效性和效果,将本发明提出的POI推荐 方法与现有的常用的POI推荐方法进行比较。所述现有的POI推荐方法包括以 下几种:
基于用户的协同过滤(user-based collaborative filtering,UCF),UCF是一种经典 的基于用户协同过滤推荐方法;
该方法记载在:Zhou D,Wang B,Rahimi S M,et al.AStudy ofRecommendingLocations on Location-based Social Network by Collaborative Filtering[C].Proceedings of the Twenty-fifth Canadian Conference on ArtificialIntelligence, Toronto,Canada,2012,Springer,Berlin,Germany。
分解个性化马尔科夫链(factorized personalized markov chain,FPMC), FPMC是将用户偏好转化为个性化的马尔科夫链;
该方法记载在:Li X,Jiang M,Hong H,et al.A Time-aware PersonalizedPoint-of-interest Recommendation via High-order Tensor Factorization[J].ACMTrans Inf Syst,2017,35(4):1-23。
基于排序的地理因子分解方法(ranking based geographical factorizationmethod,Rank-GeoFM),Rank-GeoFM是融合空间因素的MF模型,且运用一种 排序优化算法;
该方法记载在:Li X,Cong G,Li X-L,et al.Rank-GeoFM:A Ranking BasedGeographical Factorization Method for Point of Interest Recommendation[C].Proceedings of the 38th International ACM SIGIR Conference on Research andDevelopment in Information Retrieval,Santiago,Chile,2015,ACM,New York, NY。
特征空间分离因子分解模型(feature-space separated factorization model,FSS-FM/T),FSS=FM/T是融入空间因素的WMF模型,运用排序优化算法; 该方法记载在:CaiL,Xu J,Liu J,et al.Integrating Spatial and Temporal Contexts into AFactorization Model for POI Recommendation[J].International Journal ofGeographical Information Science,2018,32(3):524-546。
基于矩阵分解的上下文感知POI推荐模型(general matrix factorizationmodel,UCGSMF),UCGSMF是融合地理信息的矩阵分解上下文感知的推荐算 法;
该方法记载在:Peng Hongyuan,Jin Yuanyuan,Lv Xiaoqiang,et al.Context-Aware POI Recommendation Based on Matrix Factorization[J].Chinese Journal ofComputers,2019,42(08):1797-1811(彭宏伟,靳远远,吕晓强,等.一种基于矩阵 分解的上下文感知POI推荐算法[J].计算机学报,2019,42(08):1 797-1 811)。
本领域两个常用的指标,即精确率和召回率(P@k和R@k),可用这两 个指标作为衡量POI推荐方法的性能。精确率指推荐正确的POI个数与推荐个 数k的比值,召回率值推荐正确的POI个数与用户在测试集中实际去过的POI 个数的比值
Figure BDA0002900830020000121
Figure BDA0002900830020000122
其中,Su表示用户在测试集中访问过的POI集合;Mu(k)表示CC-MF推荐算法 得出的k个POI集合。
如图3和图4所示,与常用的方法i,在推荐个数k=5,10,20的情 况下,本发明的POI推荐方法CC-MF的推荐结果的精确率和召回率均有提高。
本实施例为一种POI推荐系统,包括:数据转化模块、分析模块和推 荐模块。
数据转化模块,用于将用户在LBSN上在产生的时空信息及POI时空 信息等用户签到信息转化成用户-POI矩阵。
分析模块,用于根据所述时空信息确定用户签到行为受空间关系的影 响模式。
推荐模块,用于根据所述预测公式得到的预测值大小进行POI推荐。
基于实施例1的数据和步骤,利用本实施例的融入空间关系的推荐系统 按照相同的方式为用户进行个性化POI推荐。

Claims (9)

1.一种融入空间关系的POI推荐方法,其特征在于:包括以下步骤:步骤1:根据收集用户在LBSN服务平台上生成的时空信息和POI时空信息,依据所述时空信息确定所述用户签到行为受空间关系的影响模式;步骤2:根据步骤1中所述用户生成的时空信息,划分出用户生活圈范围,并通过此生活圈范围构建用户与POI间的空间关系影响模式,根据步骤1中所述POI时空信息,使用KNN算法计算出每个POI的地理邻居,并通过POI的地理邻居构建POI与POI之间的空间关系影响模式;步骤3:利用融入空间关系的矩阵分解方法得到用户和POI的嵌入向量、用户和POI偏置项,通过预测公式对每个用户可能会访问的POI进行预测并将预测值按大小进行排序,进行POI推荐。
2.根据权利要求1所述融入空间关系的POI推荐方法,其特征在于:所述步骤1中用户在LBSN服务平台上生成的时空信息和POI时空信息包括:用户历史签到记录,用户唯一编号,POI唯一编号,POI经纬度坐标,用户签到时间。
3.根据权利要求1所述融入空间关系的POI推荐方法,其特征在于:所述步骤1中依据所述时空信息确定所述用户签到行为受空间关系的影响模式包括:空间关系在用户与POI之间的影响、空间关系在POI与POI之间的影响。
4.根据权利要求1或3所述融入空间关系的POI推荐方法,其特征在于:所述步骤2中划分出用户生活圈范围,并通过此生活圈范围构建用户与POI间的空间关系影响模式包括:
生活圈半径是通过实验调整和理论分析得到的;
用户活动中心是通过计算用户历史签到数据得到的,其计算过程为:首先,根据时空信息,统计用户访问的POI位置(经纬度)、频率,假设每个POI的权重相同,将用户访问过的POI经纬度分别累加,之后除以用户访问过的POI个数计算出每个用户的活动中心(以经纬度表示);
对于用户与POI之间的空间关系影响模式,使用非线性函数给予空间关系影响一个指示值,所述衡量用户与POI之间的空间关系的公式为:
Figure FDA0002900830010000011
其中,Dui=1,表示POI i在以用户u活动中心为中心的生活圈范围内,反之不在。dis(i|u)是POI i距离用户u往常活动中心的距离,d是根据生活圈理论以及实验测试所得出的生活圈半径。
5.根据权利要求1或3所述融入空间关系的POI推荐方法,其特征在于:所述步骤2中使用KNN算法计算出每个POI的地理邻居,并通过POI的地理邻居构建POI与POI之间的空间关系影响模式包括:通过所述时空信息,使用KNN算法选择离POI最近的K个POI作为该POI的地理邻居;
对于POI与POI之间的空间关系影响模式,使用每个POI的K的地理邻居表示,所述衡量POI与POI之间的空间关系的公式为:
Figure FDA0002900830010000021
其中,
Figure FDA0002900830010000022
表示在所述时空信息下,POI i的地理邻居被访问频率总和,是POI i的地理邻居在历史签到记录中的总体曝光量,Ii表示使用KNN算法计算得到的POI i的地理邻居集合;
Figure FDA0002900830010000023
表示所有POI地理邻居被访问频率总和的均值,是衡量一个POI地理邻居总体曝光量大小的指标,I表示在所述时空信息下所有POI集合;μ表示计算系数,
Figure FDA0002900830010000024
表示sigmoid函数。
6.根据权利要求1所述融入空间关系的POI推荐方法,其特征在于:所述步骤3中利用融入空间关系的矩阵分解方法得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置项包括步骤:
a1.利用所述时空信息,获得空间信息在用户与POI间的影响模式和空间信息在POI与POI间的影响模式;
a2.利用所述矩阵分解方法,结合空间关系的影响,学习得到用户和POI的嵌入向量。
7.根据权利要求6所述融入空间关系的POI推荐方法,其特征在于:所述步骤3中学习得到用户嵌入向量、POI的嵌入向量、用户偏置项和POI偏置项方法包括:
b1.进行以下更新操作,直到目标函数收敛;
b2.利用随机梯度下降法更新用户嵌入向量,所述更新用户嵌入向量的公式为:
Figure FDA0002900830010000031
其中,
Figure FDA0002900830010000032
表示融入空间关系的矩阵分解方法中得到用户向量的目标函数,wui表示用户u在POI i的历史签到记录频率有关的信任度,更多的签到记录意味着更大的信任度,由于用户-POI签到矩阵中的0元素可能是未知情况,所以只有是1的元素才加入优化,
Figure FDA0002900830010000033
Figure FDA0002900830010000034
是rui的预测值,
Figure FDA0002900830010000035
越大表示用户u访问POI i的概率越大,α1表示空间距离关系影响系数,
Figure FDA0002900830010000036
表示距离用户u活动中心小于d km的POI集合;wi′表示
Figure FDA0002900830010000037
集合长度的倒数,α2表示考虑空间拓扑关系的空间距离影响系数,
Figure FDA0002900830010000038
表示POI i的K个地理邻居集合,wi″表示使用softmax函数根据空间关系影响Gi计算的权重,bi是POI i的偏置项,bu是用户u的偏置项,pu是用户u的嵌入向量,
Figure FDA0002900830010000039
是POI i的嵌入向量的转置,λ为正则项系数;eta为学习率。
利用随机梯度下降法更新POI嵌入向量,所述更新POI嵌入向量的公式为:
Figure FDA00029008300100000310
利用随机梯度下降法更新用户偏置项,所述更新用户偏置项的公式为:
Figure FDA00029008300100000311
利用随机梯度下降法更新POI偏置项,所述更新POI偏置项的公式为:
Figure FDA0002900830010000041
8.根据权利要求1或7所述融入空间关系的POI推荐方法,其特征在于:通过所述预测公式
Figure FDA0002900830010000042
对每个用户可能会访问的POI进行预测并将POI推荐给用户。
9.根据权利要求1-8任一项所述融入空间关系的POI推荐方法的POI推荐系统,其特征在于:包括数据转化模块、分析模块和推荐模块,所述数据转化模块用于将用户在LBSN上在产生的时空信息及POI时空信息等用户签到信息转化成用户-POI矩阵;所述分析模块用于根据所述时空信息确定用户签到行为受空间关系的影响模式;所述推荐模块用于根据所述预测公式得到的预测值大小进行POI推荐。
CN202110055564.5A 2021-01-15 2021-01-15 一种融入空间关系的poi推荐方法及推荐系统 Active CN112800346B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110055564.5A CN112800346B (zh) 2021-01-15 2021-01-15 一种融入空间关系的poi推荐方法及推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110055564.5A CN112800346B (zh) 2021-01-15 2021-01-15 一种融入空间关系的poi推荐方法及推荐系统

Publications (2)

Publication Number Publication Date
CN112800346A true CN112800346A (zh) 2021-05-14
CN112800346B CN112800346B (zh) 2022-10-14

Family

ID=75809685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110055564.5A Active CN112800346B (zh) 2021-01-15 2021-01-15 一种融入空间关系的poi推荐方法及推荐系统

Country Status (1)

Country Link
CN (1) CN112800346B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150187024A1 (en) * 2013-12-27 2015-07-02 Telefonica Digital España, S.L.U. System and Method for Socially Aware Recommendations Based on Implicit User Feedback
CN107532920A (zh) * 2015-04-15 2018-01-02 通腾导航技术股份有限公司 获得兴趣点数据的方法
CN107657015A (zh) * 2017-09-26 2018-02-02 北京邮电大学 一种兴趣点推荐方法、装置、电子设备及存储介质
CN108460101A (zh) * 2018-02-05 2018-08-28 山东师范大学 面向位置社交网络基于地理位置正则化的兴趣点推荐方法
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐系统
US20190281407A1 (en) * 2018-03-09 2019-09-12 International Business Machines Corporation Group-based sequential recommendations
CN112069415A (zh) * 2020-08-13 2020-12-11 中国海洋大学 一种基于异构属性网络表征学习的兴趣点推荐方法
CN112199609A (zh) * 2020-11-17 2021-01-08 东北大学 自注意力下时空语义间隔感知的poi推荐系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150187024A1 (en) * 2013-12-27 2015-07-02 Telefonica Digital España, S.L.U. System and Method for Socially Aware Recommendations Based on Implicit User Feedback
CN107532920A (zh) * 2015-04-15 2018-01-02 通腾导航技术股份有限公司 获得兴趣点数据的方法
CN107657015A (zh) * 2017-09-26 2018-02-02 北京邮电大学 一种兴趣点推荐方法、装置、电子设备及存储介质
CN108460101A (zh) * 2018-02-05 2018-08-28 山东师范大学 面向位置社交网络基于地理位置正则化的兴趣点推荐方法
US20190281407A1 (en) * 2018-03-09 2019-09-12 International Business Machines Corporation Group-based sequential recommendations
CN110119475A (zh) * 2019-01-29 2019-08-13 成都信息工程大学 一种poi推荐方法及推荐系统
CN112069415A (zh) * 2020-08-13 2020-12-11 中国海洋大学 一种基于异构属性网络表征学习的兴趣点推荐方法
CN112199609A (zh) * 2020-11-17 2021-01-08 东北大学 自注意力下时空语义间隔感知的poi推荐系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XUTAO LI等: "Rank-GeoFM:A Ranking based Geographical Factorization Method for Point of Interest Recommendation", 《ACM》 *
高榕等: "一种融合情景和评论信息的位置社交网络兴趣点推荐模型", 《计算机研究与发展》 *

Also Published As

Publication number Publication date
CN112800346B (zh) 2022-10-14

Similar Documents

Publication Publication Date Title
Xu et al. A survey for mobility big data analytics for geolocation prediction
EP3241370B1 (en) Analyzing semantic places and related data from a plurality of location data reports
CN110119475B (zh) 一种poi推荐方法及推荐系统
CN109062962B (zh) 一种融合天气信息的门控循环神经网络兴趣点推荐方法
CN107341261B (zh) 一种面向位置社交网络的兴趣点推荐方法
KR20190139130A (ko) 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법
CN108829766B (zh) 一种兴趣点推荐方法、系统、设备及计算机可读存储介质
JP7175783B2 (ja) 所定圏における滞在圏人口を推定するプログラム、装置及び方法
CN108882172B (zh) 一种基于hmm模型的室内移动轨迹数据的预测方法
CN107515949B (zh) 兴趣点预测和推荐中的用户时空相似性度量方法
CN111695046B (zh) 基于时空移动数据表征学习的用户画像推断方法及装置
CN113139140B (zh) 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法
CN109948066A (zh) 一种基于异构信息网络的兴趣点推荐方法
Middya et al. Jusense: a unified framework for participatory-based urban sensing system
EP3192061B1 (en) Measuring and diagnosing noise in urban environment
KR20130077754A (ko) 위치정보 표현방법, 위치정보 처리방법, 위치정보모델 생성방법, 및 위치정보처리장치
CN110008414A (zh) 地理信息点的确定方法和装置
CN111104607A (zh) 基于签到数据的地点推荐方法及装置
Siripirote et al. Updating of travel behavior model parameters and estimation of vehicle trip chain based on plate scanning
US10600007B2 (en) Auto-analyzing spatial relationships in multi-scale spatial datasets for spatio-temporal prediction
CN112800346B (zh) 一种融入空间关系的poi推荐方法及推荐系统
CN115510317A (zh) 一种云边协同的兴趣点推荐方法及装置
Su et al. Personalized Point-of-Interest Recommendation Based on Social and Geographical Influence
Ding et al. Modeling personalized out-of-town distances in location recommendation
Zignani et al. On the key features in human mobility: relevance, time and distance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant