CN110119475B - 一种poi推荐方法及推荐系统 - Google Patents

一种poi推荐方法及推荐系统 Download PDF

Info

Publication number
CN110119475B
CN110119475B CN201910089802.7A CN201910089802A CN110119475B CN 110119475 B CN110119475 B CN 110119475B CN 201910089802 A CN201910089802 A CN 201910089802A CN 110119475 B CN110119475 B CN 110119475B
Authority
CN
China
Prior art keywords
poi
user
representing
association
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910089802.7A
Other languages
English (en)
Other versions
CN110119475A (zh
Inventor
熊熙
李元媛
乔少杰
王俊峰
陈麟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Jizhishenghuo Technology Co ltd
Original Assignee
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu University of Information Technology filed Critical Chengdu University of Information Technology
Priority to CN201910089802.7A priority Critical patent/CN110119475B/zh
Publication of CN110119475A publication Critical patent/CN110119475A/zh
Application granted granted Critical
Publication of CN110119475B publication Critical patent/CN110119475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种POI推荐方法及推荐系统,涉及推荐技术领域,该方法包括:根据从LBSN门户网站收集的用户和POI数据构建的用户‑POI关系网络,利用网络嵌入方法学习得到用户和POI的嵌入向量;根据用户和POI的嵌入向量,构建包括多个关于用户和POI的关联因子的动态因子图模型,并根据所述多个关于用户和POI的关联因子建立在时空社交网络上的联合分布,通过学习得到所述联合分布中的参数值;计算得到使联合分布概率最大的节点值,然后计算每个节点的边缘概率,并按边缘概率和倾向性的乘积大小进行POI推荐;解决了因数据质量不可靠和时空模式难以确定导致的推荐准确性低的问题,显著提高推荐性能。

Description

一种POI推荐方法及推荐系统
技术领域
本发明涉及推荐技术领域,特别是涉及一种基于时空关联因素的POI推荐方法及推荐系统。
背景技术
移动互联网技术的出现与普及彻底改变了人们的日常生活,并产生了诸多新型生活服务模式,例如基于位置的社交网络(LBSN)服务。LBSN产生的海量数据包含了用户行为和偏好的信息,可以支持基于位置的个性化服务,如兴趣点推荐。
现有技术针对数据稀疏性和冷启动等问题进行改进,取得了理想的效果,但仍然面临两个主要问题:1)数据质量不可靠,难以准确获得数据之间的关联;2)用户兴趣受多因素的影响,随时间与空间变化,难以确定其时空特征,例如人们在中午倾向于去餐厅而不是酒吧,但是深夜则更喜欢去酒吧而不是办公室。这两个问题极大地影响了推荐的准确性。
发明内容
为了解决上述问题,本发明提供一种基于时空关联因素的POI推荐方法及推荐系统,解决了因数据质量不可靠和难以确定时空特征导致的推荐准确性低的问题。
为此,本发明采用的技术方案是:
提供一种POI推荐方法,该方法包括以下步骤:
根据从LBSN门户网站收集的用户和POI数据构建的用户-POI关系网络,利用网络嵌入方法学习得到用户和POI的嵌入向量;
根据用户和POI的嵌入向量,构建包括多种关于用户和POI的关联因子的动态因子图模型,并根据所述多个关于用户和POI的关联因子建立在时空社交网络上的联合分布,通过学习得到所述联合分布中的参数值;
计算得到使联合分布概率最大的因子图节点值,然后计算每个节点的边缘概率,并按边缘概率与倾向性乘积的大小将POI推荐给用户。
进一步的,所述从LBSN门户网站收集的用户和POI数据包括:用户基本信息、POI基本信息、用户之间的好友关系、用户签到记录和用户评论,所述用户签到记录和用户评论包括文本内容、时间和地点,所述用户基本信息包括用户ID和用户名,所述POI基本信息包括POIID、POI名称和经纬度。
进一步的,所述利用网络嵌入方法学习得到用户和POI的嵌入向量包括步骤:
将所述用户-POI关系网络划分为POI的区域划分关系、用户的好友关系和用户对POI的访问记录三个子网络;
利用所述POI的区域划分关系、用户的好友关系和用户对POI的访问记录三个子网络学习得到用户和POI的嵌入向量。
进一步的,所述学习得到用户和POI的嵌入向量的方法包括:
进行以下更新操作,直到目标函数收敛:
利用负采样方法,从εvv中采样一条边以及R条负边,从εvu中采样一条边以及R条负边,更新POI的嵌入向量;所述更新POI的嵌入向量的公式为:
Figure GDA0002117605560000021
其中,
Figure GDA0002117605560000022
表示从POI区域划分关系子网络中嵌入学习得到向量
Figure GDA0002117605560000024
的目标函数,d(vi,vj)表示兴趣点vi与vj在地理上的距离,εvv表示POI区域划分关系子网络的边集,eij表示εvv中vi与vj之间的一条边,
Figure GDA0002117605560000025
Figure GDA0002117605560000026
表示
Figure GDA0002117605560000027
的转置向量;
Figure GDA0002117605560000028
表示从用户对POI的访问记录子网络中嵌入学习得到向量
Figure GDA0002117605560000029
Figure GDA00021176055600000210
的目标函数;uk表示第k个用户,
Figure GDA00021176055600000212
表示第k个用户的嵌入向量
Figure GDA00021176055600000213
的转置向量,
Figure GDA00021176055600000214
表示
Figure GDA00021176055600000215
的转置向量,
Figure GDA00021176055600000216
表示现有数据中用户uj访问vi的次数,εvu表示用户对POI的访问记录子网络的边集。
从εuu中采样一条边以及R条负边,从εuv中采样一条边以及R条负边,更新用户的嵌入向量;
Figure GDA00021176055600000217
其中,
Figure GDA00021176055600000218
表示用户的好友关系子网络中嵌入学习得到向量
Figure GDA00021176055600000219
Figure GDA00021176055600000220
的目标函数,
Figure GDA00021176055600000221
表示用户对POI的访问记录子网络中嵌入学习得到向量
Figure GDA00021176055600000222
Figure GDA00021176055600000223
的目标函数,
Figure GDA00021176055600000224
表示现有数据中用户ui与uj的交互次数,表示现有数据中用户ui访问vj的次数,εuu表示用户的好友关系子网络中的边集,εuv表示用户对POI的访问记录子网络的边集。
进一步的,构建的动态因子图模型中关于用户和POI的关联因子包括:
倾向性关联因子,表示两个不同倾向之间的关联性,所述倾向为用户在某时刻访问POI的倾向;
地理-社交关联因子,表示用户和POI在某时刻的地理-社会信息与所述倾向之间的关联性;
距离关联因子,表示用户在某时刻与POI的距离与所述倾向之间的关联性;
情感关联因子,表示用户在某时刻对POI的情感与所述倾向之间的关联性;
时序关联因子,表示用户访问POI的倾向性在不同时间段之间的关联性。
进一步的,所述用户和POI的关联因子的具体表达式为:
倾向性关联因子
Figure GDA0002117605560000031
Figure GDA0002117605560000032
Figure GDA0002117605560000033
表示在t时刻的两个倾向,α为权重,
Figure GDA0002117605560000034
为倾向性关联函数,表示倾向性之间的关联度并输出一个向量,如果两个倾向之间拥有相同的用户或者POI,则认为它们之间的关联度为1,即
Figure GDA0002117605560000035
置为1,Zα是归一化项;
地理-社交关联因子
Figure GDA0002117605560000037
表示用户和POI在t时刻的地理-社会信息,并按
Figure GDA0002117605560000038
计算,表示用户ui和兴趣点vj在t时刻的嵌入向量内积,βij为权重,
Figure GDA0002117605560000039
为指示函数,当
Figure GDA00021176055600000310
大于所有
Figure GDA00021176055600000311
的平均值时,置为1,表示
Figure GDA00021176055600000313
Figure GDA00021176055600000314
存在关联,Zβ是归一化项;
距离关联因子
Figure GDA00021176055600000316
表示用户在t时刻与POI的距离,γij为权重,为指示函数,当
Figure GDA00021176055600000318
大于恒定阈值时,置为1,表示
Figure GDA00021176055600000320
Figure GDA00021176055600000321
存在关联,Zγ是归一化项;
情感关联因子
Figure GDA00021176055600000322
表示用户在t时刻对POI的情感,δij为权重,
Figure GDA00021176055600000324
为指示函数,当
Figure GDA00021176055600000325
大于恒定阈值时,
Figure GDA00021176055600000326
置为1,表示
Figure GDA00021176055600000328
存在关联,Zδ是归一化项;
时序关联因子
Figure GDA00021176055600000340
Figure GDA00021176055600000329
是表示t′时刻用户访问POI的倾向,ηtt,为权重,
Figure GDA00021176055600000330
为时序关联函数,表示倾向性在不同时刻的关联度并输出一个向量,当
Figure GDA00021176055600000331
Figure GDA00021176055600000332
都等于1时,置为1,表示
Figure GDA00021176055600000335
存在关联,Zη是归一化项。
LBSN数据中的用户和POI数据根据时间T0划分为
Figure GDA00021176055600000336
Figure GDA00021176055600000337
两个时间区间,t表示
Figure GDA00021176055600000338
和的某时刻,t′表示
Figure GDA00021176055600000339
中的某时刻。T0为过去某一个时刻,人为划分时间区间,用于进行过去到未来的趋势预测。
进一步的,所述联合分布由所述倾向性关联因子、地理-社交关联因子、距离关联因子、情感关联因子和时序关联因子相乘得到。
进一步的,所述学习得到联合分布中的参数值的过程中采用信念传播的方法计算得到参数期望值。
进一步的,采用信念传播的方法计算得到使联合分布概率最大的因子图节点值。
POI即为兴趣点。
基于同样的发明构思,本发明还提供了一种POI推荐系统,包括:
网络嵌入模块,用于将收集的用户和POI的数据转换成用户和POI的嵌入向量;
动态因子模块,用于根据用户和POI的嵌入向量,建立动态因子模型,并学习得到参数值,进而求解得到使节点联合概率分布最大的节点值;
推荐模块,用于根据因子图节点最大联合概率分布对应的边缘概率和倾向性的乘积大小进行POI推荐。
本发明的理论过程如下:
LBSN是由用户、POI、评论等不同类型的节点构成的网络。两个节点间的关联程度可以用相似度来衡量,但是它依赖于数据完整性和路径可达性。如果推荐系统中的数据,特别是用户间的社会关系数据和POI之间的地理邻接数据,比较稀疏或存在噪声,那么这种相似度可能并不可靠,因而不能直接用于推荐系统。此外,用户的每天或每周的活动呈现一定的时间和空间规律。例如,一个人倾向于在晚餐时间去餐馆而不是酒吧,晚上喜欢待在酒吧而不是公司。并且人们更有可能去当前所处位置附近或曾经去过的地方附近的POI。因此,属性在不同时间、不同地点通常会表现出一定的关联性。然而,由于人们在选择POI时受多种因素的影响,很难找到一个通用的行为模式。为了更好地挖掘信息,表示推荐系统中数据的动态关系,进而实现有效的推荐,可以采用因子图模型(Factor GraphModel,FGM)对LBSN的动态时空特征进行建模。本方法是第一次将FGM应用于推荐系统,可有效解决上述问题。
在本发明中,学习得到用户和POI的嵌入向量的理论过程如下:
定义三个子网络为:POI的地理区域划分关系Gvv、用户的好友关系Guu和用户对POI的访问记录Guv
1)在Gvv中,兴趣点vi和vj的联合概率分布可以表示为:
其中
Figure GDA0002117605560000042
表示兴趣点vi的嵌入向量。该式子定义了空间V×V上的分布p(·,·)其真实值定义为
Figure GDA0002117605560000043
Figure GDA0002117605560000044
εvv表示POI之间的边集。可以利用下面这个目标函数来学习嵌入向量
Figure GDA0002117605560000045
Figure GDA0002117605560000046
这两个向量分别是vi和vj在低维向量上的映射。
Figure GDA0002117605560000047
其中d(·,·)表示两个分布函数之间的KL距离。通过最小化该目标函数,可以获取POI的邻接关系。该函数可以转化为:
Figure GDA0002117605560000051
通过学习
Figure GDA0002117605560000052
以最小化该目标函数,可以求出每个兴趣点υi对应的d维向量其中
Figure GDA0002117605560000054
表示POI个数。
2)类似地,可以计算Guu中的目标函数:
Figure GDA0002117605560000055
通过学习
Figure GDA0002117605560000056
以最小化该目标函数,可以求出每个兴趣点ui对应的d维向量其中
Figure GDA0002117605560000058
表示用户个数。
3)在Guv中,用户ui访访问兴趣点vj的条件概率可以表示为:
Figure GDA0002117605560000059
为学习上式的两个向量,可以定义下面的目标函数:
Figure GDA00021176055600000510
其中λi是表示ui重要性的参数。
约去常量可以得到:
Figure GDA00021176055600000511
4)在Guv中,兴趣点vi被用户uj访问的条件概率可以表示为:
Figure GDA00021176055600000512
然后得到目标函数:
Figure GDA00021176055600000513
利用上述4个目标函数构建一个完整的目标函数:
Ov=Ovv+Ouu+Ovu+Ouv
利用随机梯度下降法对各子图的边进行采样,并更新参数。梯度分别为:
Figure GDA0002117605560000061
Figure GDA0002117605560000062
Figure GDA0002117605560000063
嵌入向量按如下方式更新:
Figure GDA0002117605560000064
Figure GDA0002117605560000065
其中η是步长。
需要说明的是,下标i和j在用户u和兴趣点v中都有使用,仅仅为了显示用户和兴趣点的序号,在用户的下标中,使用i和j表示两个不同的用户,同理,在兴趣点的下标中,使用i和j表示两个不同的兴趣点。因此,作为不同参数的下标,与参数组成整体时,其指代不同,不存在不清楚的情况。
采用本技术方案的有益效果:
本发明提出了一种基于时空关联因素的POI推荐方法(Dynamic Spatial-Temporal POI Recommendation,DSTR)框架,该框架包含两项基本技术:一是采用网络嵌入方法生成低维嵌入空间中的用户向量和POI向量;二是建立了一种动态因子图模型,对包括嵌入向量相关性在内的不同关联因子进行建模,从而有效解决了数据质量不可靠和难以确定时空特征这两个主要问题,本发明的推荐方法在POI推荐的有效性和效率方面,均优于现有的推荐方法。
附图说明
下面结合附图对本发明作进一步详细说明。
图1是本发明方法一种实施例的步骤流程图;
图2是本发明方法一种实施例中动态因子模型结构示意图;
图3是本发明一种实施例中Foursquare数据集上本发明与现有技术在POI预测准确率比较;
图4是本发明一种实施例中Foursquare数据集上本发明与现有技术在POI预测召回率比较;
图5是本发明一种实施例中Foursquare数据集上本发明与现有技术在POI预测F1值比较;
图6是本发明一种实施例中Foursquare数据集上本发明与现有技术在POI预测命中率比较;
图7是本发明一种实施例中Yelp数据集上本发明与现有技术在POI预测准确率比较;
图8是本发明一种实施例中Yelp数据集上本发明与现有技术在POI预测召回率比较;
图9是本发明一种实施例中Yelp数据集上本发明与现有技术在POI预测F1值比较;
图10是本发明一种实施例中Yelp数据集上本发明与现有技术在POI预测命中率比较。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明作进一步阐述。
实施例1
在本实施例中,如图1所示,一种POI推荐方法,该方法包括以下步骤:
步骤101、根据从LBSN门户网站收集的用户和POI数据构建的用户-POI关系网络,利用网络嵌入方法学习得到用户和POI的嵌入向量;
所述从LBSN门户网站收集的用户和POI数据包括:用户基本信息、POI基本信息、用户之间的好友关系、用户签到记录和用户评论,所述用户签到记录和用户评论包括文本内容、时间和地点,所述用户基本信息包括用户的ID和用户名,所述POI基本信息包括POI的ID、POI名称和经纬度。
所述利用网络嵌入方法学习得到用户和POI的嵌入向量包括步骤:
将所述用户-POI关系网络划分为POI的区域划分关系、用户的好友关系和用户对POI的访问记录三个子网络;POI的区域划分关系表示POI之间的关系,用户的好友关系表示用户之间的关系,用户对POI的访问记录表示用户与POI之间的关系。
利用所述POI的区域划分关系、用户的好友关系和用户对POI的访问记录三个子网络学习得到用户和POI的嵌入向量。
所述学习得到用户和POI的嵌入向量方法包括:
进行以下更新操作,直到目标函数收敛:
利用负采样方法,从εvv中采样一条边以及R条负边,从εvu中采样一条边以及R条负边,更新POI的嵌入向量;所述更新POI的嵌入向量的公式为:
Figure GDA0002117605560000071
其中,
Figure GDA0002117605560000072
表示从POI区域划分关系子网络中嵌入学习得到向量
Figure GDA0002117605560000073
的目标函数,d(vi,vj)表示兴趣点vi与vi在地理上的距离,εvv表示POI区域划分关系子网络的边集,eij表示εvv中vi与vj之间的一条边,
Figure GDA0002117605560000075
表示的转置向量;
Figure GDA0002117605560000078
表示从用户对POI的访问记录子网络中嵌入学习得到向量
Figure GDA0002117605560000079
的目标函数;uk表示第k个用户,
Figure GDA00021176055600000712
表示第k个用户的嵌入向量
Figure GDA00021176055600000713
的转置向量,
Figure GDA00021176055600000714
表示
Figure GDA00021176055600000715
的转置向量,
Figure GDA00021176055600000716
表示现有数据中用户uj防问vi的次数,εvu表示用户对POI的访问记录子网络的边集。
从εuu中采样一条边以及R条负边,从εuv中采样一条边以及R条负边,更新用户的嵌入向量;
Figure GDA0002117605560000081
其中,
Figure GDA0002117605560000082
表示用户的好友关系子网络中嵌入学习得到向量
Figure GDA0002117605560000084
的目标函数,
Figure GDA0002117605560000085
表示用户对POI的访问记录子网络中嵌入学习得到向量
Figure GDA0002117605560000086
Figure GDA0002117605560000087
的目标函数,
Figure GDA0002117605560000088
表示现有数据中用户ui与uj的交互次数,
Figure GDA0002117605560000089
表示现有数据中用户ui访问vj的次数,εuu表示用户的好友关系子网络中的边集,εuv表示用户对POI的访问记录子网络的边集。
步骤102、根据用户和POI的嵌入向量,构建包括多种关于用户和POI的关联因子的动态因子图模型,并根据所述多个关于用户和POI的关联因子建立在时空社交网络上的联合分布,通过学习得到所述联合分布中的参数值;
构建的动态因子图模型中关于用户和POI的关联因子包括:
倾向性关联因子,表示两个不同倾向之间的关联性,所述倾向为用户在某时刻访问POI的倾向;
地理-社交关联因子,表示用户和POI在某时刻的地理-社会信息与所述倾向之间的关联性;
距离关联因子,表示用户在某时刻与POI的距离与所述倾向之间的关联性;
情感关联因子,表示用户在某时刻对POI的情感与所述倾向之间的关联性;
时序关联因子,表示用户访问POI的倾向性在不同时间段之间的关联性。
所述用户和POI的关联因子的具体表达式为:
倾向性关联因子
Figure GDA00021176055600000810
Figure GDA00021176055600000811
Figure GDA00021176055600000812
表示在t时刻的两个倾向,α为权重,
Figure GDA00021176055600000813
为倾向性关联函数,表示倾向性之间的关联度并输出一个向量,如果两个倾向之间拥有相同的用户或者POI,则认为它们之间的关联度为1,即
Figure GDA00021176055600000814
置为1,Zα是归一化项;
地理-社交关联因子
Figure GDA00021176055600000815
Figure GDA00021176055600000816
表示用户和POI在t时刻的地理-社会信息,并按
Figure GDA00021176055600000817
计算,表示用户ui和兴趣点vj在t时刻的嵌入向量内积,βij为权重,
Figure GDA00021176055600000818
为指示函数,当
Figure GDA00021176055600000819
大于所有
Figure GDA00021176055600000820
的平均值时,
Figure GDA00021176055600000821
置为1,表示
Figure GDA00021176055600000822
Figure GDA00021176055600000823
存在关联,Zβ是归一化项;
距离关联因子
Figure GDA00021176055600000824
表示用户在t时刻与POI的距离,γij为权重,
Figure GDA0002117605560000091
为指示函数,当大于恒定阈值时,
Figure GDA0002117605560000093
置为1,表示
Figure GDA0002117605560000094
存在关联,Zγ是归一化项;
情感关联因子
Figure GDA0002117605560000097
表示用户在t时刻对POI的情感,δij为权重,
Figure GDA0002117605560000098
为指示函数,当
Figure GDA0002117605560000099
大于恒定阈值时,
Figure GDA00021176055600000910
置为1,表示
Figure GDA00021176055600000911
Figure GDA00021176055600000912
存在关联,Zδ是归一化项;
时序关联因子
Figure GDA00021176055600000914
是表示t′时刻用户访问POI的倾向,ηtt′为权重,
Figure GDA00021176055600000915
为时序关联函数,表示倾向性在不同时刻的关联度并输出一个向量,当
Figure GDA00021176055600000916
都等于1时,
Figure GDA00021176055600000918
置为1,表示
Figure GDA00021176055600000919
Figure GDA00021176055600000920
存在关联,Zη是归一化项。
LBSN数据根据时间T0划分为[1,T0]和(T0,∞]两个时间区间,t表示[1,T0]中的某时刻,t′表示(T0,∞]中的某时刻。T0为过去某一个时刻,人为划分时间区间,用于进行过去到未来的趋势预测。
图2为一种动态因子模型图的结构示意图,图中的参数解释见上述关联因子中的参数解释。
所述联合分布由所述倾向性关联因子、地理-社交关联因子、距离关联因子、情感关联因子和时序关联因子相乘得到,具体表达式如下:
Figure GDA00021176055600000921
其中,归一化项Z=ZαZβZγZδZη,S是对所有因子函数组成的向量,θ表示所有参数组成的向量,即θ={α,βij,γii,δij,ηtt′}
Figure GDA00021176055600000922
表示用户集合,
Figure GDA00021176055600000923
表示POI集合,
Figure GDA00021176055600000924
表示在内已知的访问记录,
Figure GDA00021176055600000926
Figure GDA00021176055600000927
内的评论文本,
Figure GDA00021176055600000929
表示已知G时的条件概率,θT表示向量θ的转置。
下面表示条件概率时以省略角标,例如
Figure GDA00021176055600000931
可以简写为p(Y|G)那么定义以下的log形式的目标函数:
Figure GDA0002117605560000101
其中
Figure GDA0002117605560000102
简写为
Figure GDA0002117605560000103
表示条件下T0时刻后的访问倾向。θ的梯度为:
Figure GDA0002117605560000105
随机启动θ然后进行以下更新操作,直到目标函数收敛:
采用信念传播的方法(LBP)计算得到上式的两个期望值
Figure GDA0002117605560000106
Figure GDA0002117605560000107
然后按照上式求出最后按照公式
Figure GDA0002117605560000109
更新θ
最后求出θ={α,βij,γii,δij,ηtt,}的值,从而得到联合分布概率模型。
步骤103、计算得到使联合分布概率最大的因子图节点值,然后计算每个节点的边缘概率pij,并按边缘概率与倾向性乘积的大小
Figure GDA00021176055600001010
将POI推荐给用户。
下面以一个具体的实施例来做进一步的说明。
本发明方法是利用机器学习实现的,本实施例的运行环境为:Java(JDK 1.7),Windows 10,Corei7(7500U),8GB RAM。
两个数据集:
Foursquare的数据集。Foursquare是一个流行的LBSN,可以提供很多基于位置的服务,例如POI签到和发布针对POI的在线评论。该数据集收集自美国旧金山市的75140名用户,包含用户的个人资料、POI的详细信息(包括用经纬度表示的地理位置信息)以及用户对POI的评论内容等。
Yelp挑战赛数据集。该数据集包含来自4个国家10个城市的1,326,101名用户和174,567个POI。为了专注分析特定城市的POI,这里只使用了美国拉斯维加斯的数据,其中包括26,809个POI和1,605,396条评论。每条评论都包含文本内容和时间、地点等详细信息。用户访问POI最多的城市看作他的活动城市。经统计发现,拉斯维加斯大约有337,084个用户。
利用步骤101中网络嵌入方法学习得到用户和POI的嵌入向量
Figure GDA0002117605560000111
Figure GDA0002117605560000112
如图2的动态因子模型图,根据步骤102和103,进行POI推荐的过程如下:
首先,计算5种关联因子
1)时间段
Figure GDA0002117605560000113
和,用户u1访问过兴趣点v3和v4,用户u2访问过兴趣点v3和v4,即:
Figure GDA0002117605560000114
如果两个倾向节点开始于同一个用户或者终止与同一个POI,则这两个节点间的关联度为1,其余倾向节点间的关联因子等于0,即:
Figure GDA0002117605560000116
Figure GDA0002117605560000117
关联因子向量为:
Figure GDA0002117605560000118
α初始时为随机值,并根据下面公式计算:
Figure GDA0002117605560000119
Figure GDA00021176055600001110
Figure GDA00021176055600001111
2)时间段
Figure GDA00021176055600001112
中,利用SentiStrength情感分析工具可以提取英文短文本的情感值。例如用户u2对兴趣点v3发表了评论“Ipreferthisrestaurant.”,则分析可得:
Figure GDA00021176055600001113
如果情感阈值为0,则情感关联因子
Figure GDA00021176055600001114
基于这些情感关联因子,可以得到因子向量:
Figure GDA00021176055600001115
δ初始时为随机值,并根据下面公式计算:
Figure GDA00021176055600001116
3)时间段
Figure GDA00021176055600001117
中,已知小部分倾向,即
Figure GDA00021176055600001118
是从最接近的当前的历史数据中分裂出来的被定义为当前t′时刻用户访问POI的倾向,如图中
Figure GDA00021176055600001119
并且
Figure GDA00021176055600001120
则可知:
Figure GDA00021176055600001121
Figure GDA00021176055600001122
值的范围是[0,1],当
Figure GDA00021176055600001123
Figure GDA00021176055600001124
同时为1时,
Figure GDA00021176055600001125
等于1,即:
Figure GDA0002117605560000121
关联因子向量为:
Figure GDA0002117605560000122
ηtt′初始时为随机值,并根据下面公式计算:
Figure GDA0002117605560000123
2.结合上述所有关联因子,可以得到动态因子模型(ST-FGM)的输入S
Figure GDA0002117605560000124
模型运行以后得到输出θ。
3.已知θ的情况下,利用信念传播算法计算集合
Figure GDA0002117605560000125
中所有
Figure GDA0002117605560000126
的值,并使
Figure GDA0002117605560000127
的联合概率分布最大化。
Figure GDA0002117605560000128
Figure GDA0002117605560000129
并得到此时的边缘概率分布
Figure GDA00021176055600001210
4.对每个用户ui,将
Figure GDA00021176055600001211
值最大的k个POI推荐给他。
为了验证本发明的推荐方法的效果,将本发明提出的POI推荐方法与现有的若干主流POI推荐方法进行比较。所述的现有的POI推荐方法包括以下几种:
TrustMF结合了两种稀疏信息,即评分数据以及用户之间的信任关系,利用基于信任网络的矩阵分解方法将用户转化为低维向量,从而改善推荐效果。
该方法记载在:B.Yang,Y.Lei,J.Liu,and W.Li,“Social collaborativefiltering by trust(基于信任的社会协同过滤),”IEEE Transactions on PatternAnalysis and Machine Intelligence,vol.39,no.8,pp.1633-1647,2017。
LSARS是一种概率生成模型,它模拟了用户在本地和外地两种场景下的签到行为,其中考虑了用户兴趣漂移和人群情绪。个人兴趣的信息可以从POI信息和用户评论中提取。然而,该模型没有考虑位置因素的影响。
该方法记载在:H.Wang,Y.Fu,Q.Wang,H.Yin,C.Du,and H.Xiong,“A location-sentiment-aware recommender system for both home-town and out-of-town users,(一种本地和外地用户的位置感知推荐系统)”in Proceedings of the 23rd ACMSIGKDDInternational Conference on Knowledge Discovery and Data Mining.ACM,2017,pp.1135-1143。
MMBE是一个概率生成模型,其中考虑了用户签到行为中包含的社会关系、时间和地理位置等信息。该模型在共享的隐含主题空间中,通过网络嵌入的方式得到用户和POI的向量,有效地融合了社会影响和时间影响。
该方法记载在:L.Huang,Y.Ma,Y.Liu,and A.K.Sangaiah,“Multi-modalBayesian embedding for point-of-interest recommendation on location-basedcyber-physical-social networks,(多模态贝叶斯嵌入-基于位置的社交网络的兴趣点推荐)”Future Generation Computer Systems,2017。
HERec是一种基于异构网络推荐方法,它利用随机游走得到有序节点,然后采用多种融合函数将编码后的节点集成到一个新的矩阵分解模型中,以实现推荐。
该方法记载在:C.Shi,B.Hu,W.X.Zhao,and P.S.Yu,“Heterogeneousinformation network embedding forrecommendation(异构信息网络嵌入推荐),”IEEETransactions on Knowledge and Data Engineering,2017。
TGSC-PMF是一种上下文感知的概率矩阵分解推荐方法,它综合利用了文本内容、地理位置、社会关系、类别相关性和POI流行度等多种因素。
该方法记载在:X.Ren,M.Song,E.Haihong,and J.Song,“Context-awareprobabilistic matrix factorization modeling for point-of-interestrecommendation(上下文感知的概率矩阵分解建模及兴趣点推荐),”Neurocomputing,vol.241,no.C,pp.38-55,2017。
上述POI推荐方法包含的特性如表1所示,分别是:地理位置(Geo),时序(Temp),用户偏好(Pref),社会关系(Soc),用户行为(Beh),文本分析(Tex)以及网络嵌入(Emb)。
表1:
Figure GDA0002117605560000131
本领域四个广泛使用的指标,即准确率(Precision)、召回率(Recall)、F1值(Fl-score)和命中率(Hit-rate),可用于衡量推荐方法的效果。准确率表示推荐并真实访问的POI占推荐的POI的比例,召回率表示推荐并真实访问的POI占真实访问的POI的比例,F1值是准确率和召回率的调和平均值。
Figure GDA0002117605560000141
Figure GDA0002117605560000142
表示关于用户u访问过的POI和被推荐的POI。准确率、召回率和F1值的指标定义如下:
Figure GDA0002117605560000144
Figure GDA0002117605560000145
如果某用户的推荐列表中的POI至少被访问过一次,则称为一次命中。也就是说,对于单个测试用例,如果真实的POI出现在推荐的结果中,hit被定义为1,否则为0。命中率Hit-rate可以定义为:
其中|hit|和|Dtest|分别表示命中次数和测试用例数。
如图3-10所示,与现有的其它方法相比,在不同的推荐点个数k=I,5,10,15,20的情况下,本发明的DSTR方法的推荐效果提高了2.3%-13.0%。
实施例2
本实施例为一种POI推荐系统,包括:
网络嵌入模块,用于将收集的用户和POI的数据转换成用户和POI的嵌入向量;
动态因子模块,用于根据用户和POI的嵌入向量,建立动态因子模型,并学习得到参数值,进而求解得到使节点联合概率分布最大的节点值;
推荐模块,用于根据因子图节点最大联合概率分布对应的边缘概率和倾向性的乘积大小进行POI推荐。
基于实施例1的数据和步骤,利用本实施例的推荐系统按照同样的方式为用户进行POI推荐。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种POI推荐方法,其特征在于,该方法包括:
根据从LBSN门户网站收集的用户和POI数据构建的用户-POI关系网络,利用网络嵌入方法学习得到用户和POI的嵌入向量;
根据用户和POI的嵌入向量,构建包括多种关于用户和POI的关联因子的动态因子图模型,并根据所述多个关于用户和POI的关联因子建立在时空社交网络上的联合分布,通过学习得到所述联合分布中的参数值;
计算得到使联合分布概率最大的因子图节点值,然后计算每个节点的边缘概率,并按边缘概率与倾向性乘积的大小将POI推荐给用户;
所述利用网络嵌入方法学习得到用户和POI的嵌入向量包括步骤:
将所述用户-POI关系网络划分为POI的区域划分关系、用户的好友关系和用户对POI的访问记录三个子网络;
利用所述POI的区域划分关系、用户的好友关系和用户对POI的访问记录三个子网络学习得到用户和POI的嵌入向量;
所述学习得到用户和POI的嵌入向量方法包括:
进行以下更新操作,直到目标函数收敛:
利用负采样方法,从εvv中采样一条边以及R条负边,从εvu中采样一条边以及R条负边,更新POI的嵌入向量;所述更新POI的嵌入向量的公式为:
Figure FDA0002262745710000011
其中,表示从POI区域划分关系子网络中嵌入学习得到向量
Figure FDA0002262745710000013
Figure FDA0002262745710000014
的目标函数,d(vi,vj)表示兴趣点vi与vj在地理上的距离,εvv表示POI区域划分关系子网络的边集,eij表示εvv中vi与vj之间的一条边,
Figure FDA0002262745710000015
Figure FDA0002262745710000016
其中
Figure FDA0002262745710000017
表示的转置向量;
Figure FDA0002262745710000019
表示从用户对POI的访问记录子网络中嵌入学习得到向量
Figure FDA00022627457100000110
Figure FDA00022627457100000111
的目标函数; uk表示第k个用户,
Figure FDA00022627457100000114
表示第k个用户的嵌入向量
Figure FDA00022627457100000115
的转置向量,
Figure FDA00022627457100000116
表示
Figure FDA00022627457100000117
的转置向量,
Figure FDA00022627457100000118
表示现有数据中用户uj访问vi的次数,εvu表示用户对POI的访问记录子网络的边集;
从εuu中采样一条边以及R条负边,从εuv中采样一条边以及R条负边,更新用户的嵌入向量;
Figure FDA0002262745710000021
其中,表示用户的好友关系子网络中嵌入学习得到向量
Figure FDA0002262745710000023
Figure FDA0002262745710000024
的目标函数,
Figure FDA0002262745710000025
表示用户对POI的防问记录子网络中嵌入学习得到向量
Figure FDA0002262745710000026
Figure FDA0002262745710000027
的目标函数,
Figure FDA0002262745710000028
表示现有数据中用户ui与uj的交互次数,
Figure FDA0002262745710000029
表示现有数据中用户ui访问vj的次数,εuu表示用户的好友关系子网络中的边集,εuv表示用户对POI的访问记录子网络的边集。
2.根据权利要求1所述的方法,其特征在于:所述从LBSN门户网站收集的用户和POI数据包括:用户基本信息、POI基本信息、用户之间的好友关系、用户签到记录和用户评论,所述用户签到记录和用户评论包括文本内容、时间和地点。
3.根据权利要求1所述的方法,其特征在于:构建的动态因子图模型中关于用户和POI的关联因子包括:
倾向性关联因子,表示两个不同倾向之间的关联性,所述倾向为用户在某时刻访问POI的倾向;
地理-社交关联因子,表示用户和POI在某时刻的地理-社会信息与所述倾向之间的关联性;
距离关联因子,表示用户在某时刻与POI的距离与所述倾向之间的关联性;
情感关联因子,表示用户在某时刻对POI的情感与所述倾向之间的关联性;
时序关联因子,表示用户访问POI的倾向性在不同时间段之间的关联性。
4.根据权利要求3所述的方法,其特征在于:所述用户和POI的关联因子的具体表达式为:
倾向性关联因子
Figure FDA00022627457100000210
Figure FDA00022627457100000211
Figure FDA00022627457100000212
表示在t时刻的两个倾向,α为权重,
Figure FDA00022627457100000213
为倾向性关联函数,表示倾向性之间的关联度并输出一个向量,如果两个倾向之间拥有相同的用户或者POI,则认为它们之间的关联度为1,即置为1,Zα是归一化项;
地理-社交关联因子
Figure FDA0002262745710000031
表示用户和POI在t时刻的地理-社会信息,并按计算,表示用户ui和兴趣点vj在t时刻的嵌入向量内积,βij为权重,
Figure FDA0002262745710000034
为指示函数,当
Figure FDA0002262745710000035
大于所有
Figure FDA0002262745710000036
的平均值时,
Figure FDA0002262745710000037
置为1,表示
Figure FDA0002262745710000038
Figure FDA0002262745710000039
存在关联,Zβ是归一化项;
距离关联因子
Figure FDA00022627457100000310
Figure FDA00022627457100000311
表示用户在t时刻与POI的距离,γij为权重,
Figure FDA00022627457100000312
为指示函数,当
Figure FDA00022627457100000313
大于恒定阈值时,置为1,表示
Figure FDA00022627457100000315
Figure FDA00022627457100000316
存在关联,Zγ是归一化项;
情感关联因子
Figure FDA00022627457100000317
Figure FDA00022627457100000318
表示用户在t时刻对POI的情感,δij为权重,
Figure FDA00022627457100000319
为指示函数,当
Figure FDA00022627457100000320
大于恒定阈值时,
Figure FDA00022627457100000321
置为1,表示
Figure FDA00022627457100000322
Figure FDA00022627457100000323
存在关联,Zδ是归一化项;
时序关联因子
Figure FDA00022627457100000324
Figure FDA00022627457100000325
是表示t′时刻用户访问POI的倾向,ηtt′为权重,
Figure FDA00022627457100000326
为时序关联函数,表示倾向性在不同时刻的关联度并输出一个向量,当
Figure FDA00022627457100000327
Figure FDA00022627457100000328
都等于1时,
Figure FDA00022627457100000329
置为1,表示
Figure FDA00022627457100000330
存在关联,Zη是归一化项。
5.根据权利要求4所述的方法,其特征在于:所述联合分布由所述倾向性关联因子、地理-社交关联因子、距离关联因子、情感关联因子和时序关联因子相乘得到。
6.根据权利要求1或5所述的方法,其特征在于:所述学习得到所述联合分布中的参数值的过程中采用信念传播的方法计算得到期望值。
7.根据权利要求1所述的方法,其特征在于:采用信念传播的方法计算得到使联合分布概率最大的节点值。
8.基于权利要求1-7的任一项所述方法的一种POI推荐系统,其特征在于包括:
网络嵌入模块,用于将收集的用户和POI的数据转换成用户和POI的嵌入向量;
动态因子模块,用于根据用户和POI的嵌入向量,建立动态因子模型,并学习得到参数值,进而求解得到使节点联合概率分布最大的节点值;
推荐模块,用于根据因子图节点最大联合概率分布对应的边缘概率和倾向性的乘积大小进行POI推荐。
CN201910089802.7A 2019-01-29 2019-01-29 一种poi推荐方法及推荐系统 Active CN110119475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910089802.7A CN110119475B (zh) 2019-01-29 2019-01-29 一种poi推荐方法及推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910089802.7A CN110119475B (zh) 2019-01-29 2019-01-29 一种poi推荐方法及推荐系统

Publications (2)

Publication Number Publication Date
CN110119475A CN110119475A (zh) 2019-08-13
CN110119475B true CN110119475B (zh) 2020-01-07

Family

ID=67520421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910089802.7A Active CN110119475B (zh) 2019-01-29 2019-01-29 一种poi推荐方法及推荐系统

Country Status (1)

Country Link
CN (1) CN110119475B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10970350B2 (en) 2019-08-15 2021-04-06 Advanced New Technologies Co., Ltd. Method and apparatus for processing user interaction sequence data
CN110598847B (zh) * 2019-08-15 2020-08-28 阿里巴巴集团控股有限公司 处理交互序列数据的方法及装置
CN111428118B (zh) * 2019-11-08 2023-04-11 华东理工大学 一种检测事件可靠性的方法及电子设备
CN111241419B (zh) * 2020-01-09 2023-11-24 辽宁工程技术大学 一种基于用户关系嵌入模型的下一个兴趣点推荐方法
CN111680228B (zh) * 2020-06-11 2022-03-18 浙江工商大学 基于地理位置融合和类别流行度的兴趣点推荐方法
CN111797263A (zh) * 2020-07-08 2020-10-20 北京字节跳动网络技术有限公司 图像标签生成方法、装置、设备和计算机可读介质
CN112000763B (zh) * 2020-09-25 2023-08-29 北京百度网讯科技有限公司 兴趣点竞争关系确定方法、装置、设备和介质
CN112800346B (zh) * 2021-01-15 2022-10-14 郑州大学 一种融入空间关系的poi推荐方法及推荐系统
CN112883262B (zh) * 2021-02-04 2022-04-26 西南交通大学 一种基于深度强化学习的日程安排推荐方法
CN117591751B (zh) * 2024-01-19 2024-04-26 国网湖北省电力有限公司信息通信公司 基于图嵌入的上下文忠诚度融合的兴趣点推荐方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542489A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于用户兴趣关联的推荐方法
CN106294448A (zh) * 2015-05-28 2017-01-04 达客氏(上海)信息科技有限公司 一种用户兴趣差异性挖掘方法及系统
CN107193861A (zh) * 2017-03-31 2017-09-22 百度在线网络技术(北京)有限公司 Poi推荐方法、装置、设备及计算机可读存储介质
CN108829761A (zh) * 2018-05-28 2018-11-16 苏州大学 一种兴趣点推荐方法、系统、介质及设备
CN108985598A (zh) * 2018-06-29 2018-12-11 中国地质大学(武汉) 一种基于用户生成内容的poi空间影响力评价方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9857177B1 (en) * 2012-06-20 2018-01-02 Amazon Technologies, Inc. Personalized points of interest for mapping applications
CN107133262B (zh) * 2017-03-30 2019-09-06 浙江大学 一种基于多影响嵌入的个性化poi推荐方法
CN107633263A (zh) * 2017-08-30 2018-01-26 清华大学 基于边的网络图嵌入方法
CN108804551B (zh) * 2018-05-21 2021-06-04 辽宁工程技术大学 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN109063041B (zh) * 2018-07-17 2020-04-07 阿里巴巴集团控股有限公司 关系网络图嵌入的方法及装置
CN109213938B (zh) * 2018-08-09 2019-07-12 成都信息工程大学 一种基于异构网络的poi推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542489A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于用户兴趣关联的推荐方法
CN106294448A (zh) * 2015-05-28 2017-01-04 达客氏(上海)信息科技有限公司 一种用户兴趣差异性挖掘方法及系统
CN107193861A (zh) * 2017-03-31 2017-09-22 百度在线网络技术(北京)有限公司 Poi推荐方法、装置、设备及计算机可读存储介质
CN108829761A (zh) * 2018-05-28 2018-11-16 苏州大学 一种兴趣点推荐方法、系统、介质及设备
CN108985598A (zh) * 2018-06-29 2018-12-11 中国地质大学(武汉) 一种基于用户生成内容的poi空间影响力评价方法及系统

Also Published As

Publication number Publication date
CN110119475A (zh) 2019-08-13

Similar Documents

Publication Publication Date Title
CN110119475B (zh) 一种poi推荐方法及推荐系统
Li et al. A time-aware personalized point-of-interest recommendation via high-order tensor factorization
Zhao et al. Personalized recommendations of locally interesting venues to tourists via cross-region community matching
Zhang et al. CoRe: Exploiting the personalized influence of two-dimensional geographic coordinates for location recommendations
Compton et al. Geotagging one hundred million twitter accounts with total variation minimization
Roick et al. L ocation B ased S ocial N etworks–Definition, Current State of the Art and Research Agenda
CN109726336B (zh) 一种结合出行兴趣与社交偏好的poi推荐方法
Li et al. Towards social user profiling: unified and discriminative influence model for inferring home locations
Ying et al. A temporal-aware POI recommendation system using context-aware tensor decomposition and weighted HITS
US20100211308A1 (en) Identifying interesting locations
Li et al. Next and next new POI recommendation via latent behavior pattern inference
CN106960044B (zh) 一种基于张量分解及加权hits的时间感知个性化poi推荐方法
CN107133262A (zh) 一种基于多影响嵌入的个性化poi推荐方法
Yamaguchi et al. Landmark-based user location inference in social media
Al Hasan Haldar et al. Location prediction in large-scale social networks: an in-depth benchmarking study
Chen et al. Next POI recommendation based on location interest mining with recurrent neural networks
CN110134883B (zh) 一种异构社交网络位置实体锚链接识别方法
Ding et al. Spatial-temporal distance metric embedding for time-specific POI recommendation
Xin et al. A location-context awareness mobile services collaborative recommendation algorithm based on user behavior prediction
Chen et al. A temporal recommendation mechanism based on signed network of user interest changes
US11783436B2 (en) Magellan: a context-aware itinerary recommendation system built only using card-transaction data
Tang et al. Discovering Travel Community for POI Recommendation on Location‐Based Social Networks
Lang et al. POI recommendation based on a multiple bipartite graph network model
CN111104607A (zh) 基于签到数据的地点推荐方法及装置
Buchel et al. Geospatial analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20221117

Address after: Room 501, 502, 503, 504, Building 6, Building 6, No. 200, Tianfu 5th Street, High-tech Zone, Chengdu 610000, Sichuan Province

Patentee after: CHENGDU JIZHISHENGHUO TECHNOLOGY Co.,Ltd.

Address before: 610225, No. 24, Section 1, Xuefu Road, Southwest Economic Development Zone, Chengdu, Sichuan

Patentee before: CHENGDU University OF INFORMATION TECHNOLOGY

TR01 Transfer of patent right