CN114282120A - 融合多维关系的图嵌入兴趣点推荐算法 - Google Patents

融合多维关系的图嵌入兴趣点推荐算法 Download PDF

Info

Publication number
CN114282120A
CN114282120A CN202111482809.9A CN202111482809A CN114282120A CN 114282120 A CN114282120 A CN 114282120A CN 202111482809 A CN202111482809 A CN 202111482809A CN 114282120 A CN114282120 A CN 114282120A
Authority
CN
China
Prior art keywords
interest
user
users
trust
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111482809.9A
Other languages
English (en)
Inventor
牛磊
张秀娟
刘鹏涛
蒋宇翔
吴林泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Wanwei Information Technology Co Ltd
Original Assignee
China Telecom Wanwei Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Wanwei Information Technology Co Ltd filed Critical China Telecom Wanwei Information Technology Co Ltd
Priority to CN202111482809.9A priority Critical patent/CN114282120A/zh
Publication of CN114282120A publication Critical patent/CN114282120A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据挖掘领域,具体为融合多维关系的图嵌入兴趣点推荐算法。针对传统POI推荐算法存在的数据稀疏、冷启动以及数据隐性反馈等问题,本发明提出一种融合多维关系的图嵌入兴趣点推荐算法。算法通过分析用户与兴趣点之间的联系与区别,将用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点之间的语义关系采用图嵌入模型联合表示。之后采用随机梯度下降法求解模型获得用户偏好嵌入向量与物品特征嵌入向量。最后将用户偏好嵌入向量与物品特征嵌入向量相结合获得POI推荐列表。实验结果在真实数据集中表明,本文算法的推荐性能在各个评价指标中明显优于同类型的对比算法。

Description

融合多维关系的图嵌入兴趣点推荐算法
技术领域
本发明涉及数据挖掘领域,具体为融合多维关系的图嵌入兴趣点推荐算法。
背景技术
随着全球定位系统与移动通信信息系统的日益完善,基于位置的社交网络(location based Social Networks,LBSN)逐渐成为当前的研究热点,同时也产生了一系列的LBSN应用服务,如Wechat、 Foursquare和Yelp等。这些应用服务平台通过收集用户的签到位置信息,分析用户的签到位置信息,如酒店、旅游景点、超市等,为用户推荐心仪的兴趣点(point-of-interest)。一方面通过兴趣点推荐提高用户对应用服务的粘性,为企业带来潜在的商业利益,另一方面减少用户的搜索时间成本、增加用户的搜索体验。
与传统推荐系统(如商品推荐、电影推荐等)不同,POI推荐涉及面更广,推荐任务更加复杂。POI 推荐是以LBSN为研究基石,研究内容涵盖用户与用户之间社交关系,用户与签到点之间的牵连关系,以及POI与POI相关的语义关系,等三个方面的内容。由于在LBSN服务中涉及到的兴趣点种类繁多,而用户的签到记录相对较少,POI推荐面临着更为严重的数据稀疏、冷启动问题。此外,用户的签到数据涉及个人隐私,为保护隐私不被泄露,用户的签到数据往往不会被记录,如何处理这样的数据隐性反馈已成为当前亟待解决的重要问题。
为此,本文通过分析用户之间的社交关系,用户与签到点之间的牵连关系以及POI与POI之间的语义关系,采用图嵌入模型综合表示这三种关系,并求解该模型获得用户偏好嵌入向量与兴趣点特征嵌入向量。之后将用户偏好嵌入向量与兴趣点特征嵌入向量相结合获得最终的兴趣点推荐列表,提出融合多维关系的图嵌入兴趣点推荐算法(A graphembedding interest point recommendation algorithm fused with multi-dimensional relations,GRIPR)。本发明通过综合考虑多个方面的额外信息得到用户的推荐列表,在一定程度上避免了因数据集稀疏带来的冷启动问题,进而提高了推荐性能。
发明内容
针对传统兴趣点推荐系统的不足,本文提出融合多维关系的图嵌入兴趣点推荐算法。算法主要分为五步。(1)通过分析用户在社交网络中的交互状态,建立用户与用户之间的社交关系(2)通过分析用户的历史签到行为,本文将具有相似签到行为的用户划分为一类,建立用户对兴趣点的相似关系。(3)通过分析兴趣点的语义特征,建立兴趣点之间的语义相似关系。(4)将这三种关系采用图嵌入模型来联合表示。(5)求解模型获得最终推荐列表。
1社交关系
本文将用户交往过程中最本质的信任关系作为社交关系。由于信任关系越强的用户共同感兴趣的事物越多,本文通过分析信任的结构性与动态性,建立动态信任模型,以此提升推荐性能。
1.1建立信任值
本文将用户之间评分相似程度作为用户之间得静态信任值。
Figure RE-RE-GDA0003509952860000021
1.1动态信任值
为了提高用户信任值的准确性和动态适应能力,本文把用户在社交网络中的总体活动时间分为若干个时间窗。时间窗的长度可根据具体的活动场景来确定,每个时间窗内的用户信任值可由上一节计算得出。那么,基于x个连续时间窗用户信任值可表示为
Figure RE-RE-GDA0003509952860000022
如图1所示,T1到Tx为用户在社交网络中的总体活动时间,每一个时间间隔对应一个时间窗。
信任值的动态性体现在两个方面:信任值随正反馈行为逐渐增加,而随负反馈行为逐渐减少。如果用户在第x个时间窗内的信任值大于第x-1个时间窗的信任值,则用户在当前的时间窗内的交互为正反馈行为,反之,为负反馈行为。观察人类的信任行为发展过程,信任是缓慢累加,又是快速递减的,换句话说,人与人之间需要多次成功交互建立的信任必然会在几次失败的交互中快速消失,即信任值的增加与减少是不对称的。为此,本文引入信任奖励因子τr与惩罚因子τp分别对正负反馈行为进行奖励和惩罚。
Figure RE-RE-GDA0003509952860000023
Figure RE-RE-GDA0003509952860000024
其中σi表示前后两个时间窗内的信任值变化斜率,
Figure RE-RE-GDA0003509952860000025
分别为正、负反馈增量,初始值为1,如果连续两个时间窗的信任值均为正反馈,则
Figure RE-RE-GDA0003509952860000026
如果两个时间窗内的信任值均为负反馈,则
Figure RE-RE-GDA0003509952860000027
那么在信任奖励因子与信任惩罚因子加持下的第个x时间窗内的信任值的计算方法是:
Figure RE-RE-GDA0003509952860000028
2相似关系
依据协同过滤理论,具有共同签到点越多的用户在未来呈现越强的相关性。为此本文通过皮尔逊相关系数分析用户的历史签到记录,寻找相关性较高的用户集合,以提高推荐性能。
Figure RE-RE-GDA0003509952860000031
其中sim(i,j)为用户i与j的相似程度,其中k为用户i与j的共同评分的兴趣点集合,I(i)为用户 i的评分兴趣点集,T(j)为用户j的评分兴趣点集,Rij用户i对兴趣点j的评分,
Figure RE-RE-GDA0003509952860000032
用户i对兴趣点k 的平均评分。
3语义关系
兴趣点具有不同的语义关系,同一个如餐厅,包含火锅、川菜、粤菜等等。具有语义关系相似的POI 属于同一类的可能性较高。为此本文通过分析各个兴趣点之间语义关系,寻找具有相似语义关系的兴趣点集合,以此提高推荐性能。
给定兴趣点(pi,i=1,2,…,s)和(pj,j=1,2,…,d),其中i和j分别表示兴趣点pi和pj各自拥有的语义特征。那么pi和pj之间的相似关系可表示为cimij
Figure RE-RE-GDA0003509952860000033
式中,|P|表示语义特征数量,Sp(i,j)表示兴趣点pi和pj针对语义特征p的相似关系。
4图嵌入模型
当建立用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点与兴趣点之间的语义关系之后,由于这些关系满足二部图特征,本文采用图嵌入模型将这三种关系联合表示,求解获得用户偏好嵌入向量与兴趣点特征嵌入向量。
给定图关系模型Gvv=(VA∪VB),节点VA和VB分别表示不同类型的节点集合。在社交关系中,VA和VB表示用户;在相似关系中,VA和VB分别表示用户和兴趣点;在语义关系中,VA和VB表示兴趣点。那么本文采用负采样将关系图中节点嵌入向量的目标函数表示为:
Figure RE-RE-GDA0003509952860000034
logp(vi|vj)满足
Figure RE-RE-GDA0003509952860000035
其中vi和vj是边eij的顶点,vi∈VA,vj∈VB。vn表示为按负采样获得的顶点,
Figure RE-RE-GDA0003509952860000036
Figure RE-RE-GDA0003509952860000037
分别表示为节点的嵌入向量。σ为激活函数,k表示为负采样边数目。{Li,i=1,2,3}表示三种关系。wij表示节点之间的权重,如,在社交关系图中,wij为节点之间的信任值。
为求解目标函数,本文采用异步随机梯度下降算法。具体为,假设边eij被采样,那么节点vi的嵌入向量
Figure RE-RE-GDA0003509952860000041
的迭代梯度可表示为:
Figure RE-RE-GDA0003509952860000042
通过迭代计算,最终我们获得用户和兴趣点在低维空间中的嵌入向量表示:
Figure RE-RE-GDA0003509952860000043
5获得推荐列表
用户偏好嵌入向量表示用户对兴趣点的喜好,而兴趣点特征嵌入向量表示兴趣点的语义特征。我们将用户的偏好嵌入向量的转置与兴趣点特征嵌入向量相乘,选择排名靠前的兴趣点作为用户的推荐列表。
我们将每个用户偏好嵌入向量
Figure RE-RE-GDA0003509952860000044
组成用户偏好矩阵u,将每个物品特征嵌入向量
Figure RE-RE-GDA0003509952860000045
组成物品特征矩阵v。
list(u)=uT·v (10)
为每个用户选择list(u)中排名靠前的兴趣点作为用户的推荐列表。
本发明有益效果为:针对传统POI推荐算法存在的数据稀疏、冷启动以及数据隐性反馈等问题,本发明提出一种融合多维关系的图嵌入兴趣点推荐算法。算法通过分析用户与兴趣点之间的联系与区别,将用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点之间的语义关系采用图嵌入模型联合表示。之后采用随机梯度下降法求解模型获得用户偏好嵌入向量与物品特征嵌入向量。最后将用户偏好嵌入向量与物品特征嵌入向量相结合获得POI推荐列表。实验结果在真实数据集中表明,本文算法的推荐性能在各个评价指标中明显优于同类型的对比算法。
附图说明
图1用户活动时间间隔示意图;
图2不同维度下Recall的取值示意图;
图3Yelp数据集中各个算法的precision和recall取值示意图;
图4Foursquare数据集中各个算法的precision和recall取值示意图。
具体实施方式
本发明提出一种融合多维关系的图嵌入兴趣点推荐算法(A graph embeddinginterest point recommendation algorithm fused with multi-dimensionalrelations,GRIPR)。所提的GRIPR算法主要分为五个步骤:(1)通过分析用户在社交网络中的交互状态,建立用户与用户之间的社交关系(2)通过分析用户的历史签到行为,本文将具有相似签到行为的用户划分为一类,建立用户对兴趣点的相似关系。(3)通过分析兴趣点的语义特征,建立兴趣点之间的语义相似关系。(4)将这三种关系采用图嵌入模型来联合表示。(5)求解模型获得最终推荐列表。
1算法具体实现步骤如下:
S1:输入用户对兴趣点的评分矩阵,用户之间的社交关系、兴趣点的语义特征。
S2:建立信任值
本文将用户之间评分相似程度作为用户之间得静态信任值。
Figure RE-RE-GDA0003509952860000051
S3:按公式(2)(3)(4)计算动态信任值。
为了提高用户信任值的准确性和动态适应能力,本文把用户在社交网络中的总体活动时间分为若干个时间窗[21]。时间窗的长度可根据具体的活动场景来确定,每个时间窗内的用户信任值可由上一节计算得出。那么,基于x个连续时间窗用户信任值可表示为
Figure RE-RE-GDA0003509952860000052
如图1所示,T1到Tx为用户在社交网络中的总体活动时间,每一个时间间隔对应一个时间窗。
信任值的动态性体现在两个方面:信任值随正反馈行为逐渐增加,而随负反馈行为逐渐减少。如果用户在第x个时间窗内的信任值大于第x-1个时间窗的信任值,则用户在当前的时间窗内的交互为正反馈行为,反之,为负反馈行为。观察人类的信任行为发展过程,信任是缓慢累加,又是快速递减的,换句话说,人与人之间需要多次成功交互建立的信任必然会在几次失败的交互中快速消失,即信任值的增加与减少是不对称的。为此,本文引入信任奖励因子τr与惩罚因子τp分别对正负反馈行为进行奖励和惩罚。
Figure RE-RE-GDA0003509952860000053
Figure RE-RE-GDA0003509952860000054
其中σi表示前后两个时间窗内的信任值变化斜率,
Figure RE-RE-GDA0003509952860000055
分别为正、负反馈增量,初始值为1,如果连续两个时间窗的信任值均为正反馈,则
Figure RE-RE-GDA0003509952860000056
如果两个时间窗内的信任值均为负反馈,则
Figure RE-RE-GDA0003509952860000057
那么在信任奖励因子与信任惩罚因子加持下的第个x时间窗内的信任值的计算方法是:
Figure RE-RE-GDA0003509952860000058
S4:按公式(5)计算用户之间的相似关系
依据协同过滤理论,具有共同签到点越多的用户在未来呈现越强的相关性。为此本文通过皮尔逊相关系数分析用户的历史签到记录,寻找相关性较高的用户集合,以提高推荐性能。
Figure RE-RE-GDA0003509952860000061
其中sim(i,j)为用户i与j的相似程度,其中k为用户i与j的共同评分的兴趣点集合,I(i)为用户 i的评分兴趣点集,T(j)为用户j的评分兴趣点集,Rij用户i对兴趣点j的评分,
Figure RE-RE-GDA0003509952860000062
用户i对兴趣点k 的平均评分。
S5:按公式(6)计算兴趣点之间的语义关系
兴趣点具有不同的语义关系,同一个如餐厅,包含火锅、川菜、粤菜等等。具有语义关系相似的POI 属于同一类的可能性较高。为此本文通过分析各个兴趣点之间语义关系,寻找具有相似语义关系的兴趣点集合,以此提高推荐性能。
给定兴趣点(pi,i=1,2,…,s)和(pj,j=1,2,…,d),其中i和j分别表示兴趣点pi和pj各自拥有的语义特征。那么pi和pj之间的相似关系可表示为cimij
Figure RE-RE-GDA0003509952860000063
式中,|P|表示语义特征数量,Sp(i,j)表示兴趣点pi和pj针对语义特征p的相似关系。
S6:利用图嵌入模型联合表示用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点与兴趣点之间的语义关系。按公式(7)建立嵌入向量的目标函数。
给定图关系模型Gvv=(VA∪VB),节点VA和VB分别表示不同类型的节点集合。在社交关系中,VA和VB表示用户;在相似关系中,VA和VB分别表示用户和兴趣点;在语义关系中,VA和VB表示兴趣点。那么本文采用负采样将关系图中每个节点的嵌入向量的目标函数表示为:
Figure RE-RE-GDA0003509952860000064
logp(vi|vj)满足
Figure RE-RE-GDA0003509952860000065
其中vi和vj是边eij的顶点,vi∈VA,vj∈VB。vn表示为按负采样获得的顶点,
Figure RE-RE-GDA0003509952860000066
Figure RE-RE-GDA0003509952860000067
分别表示为节点的嵌入向量。σ为激活函数,k表示为负采样边数目。{Li,i=1,2,3}表示三种关系,wij表示节点之间的权重,如,在社交关系图中,wij为节点之间的信任值。
S7:为求解目标函数
本文采用异步随机梯度下降算法。具体为,假设边eij被采样,那么节点vi的嵌入向量
Figure RE-RE-GDA0003509952860000068
的迭代梯度可表示为:
Figure RE-RE-GDA0003509952860000071
通过迭代计算,最终我们获得用户和兴趣点在低维空间中的嵌入向量表示:
Figure RE-RE-GDA0003509952860000072
S8:获得推荐列表
用户偏好嵌入向量表示用户对兴趣点的喜好,而兴趣点特征嵌入向量表示兴趣点的语义特征。我们将用户的偏好嵌入向量的转置与兴趣点特征嵌入向量相乘,选择排名靠前的兴趣点作为用户的推荐列表。
我们将每个用户偏好嵌入向量
Figure RE-RE-GDA0003509952860000073
组成用户偏好矩阵u,将每个物品特征嵌入向量
Figure RE-RE-GDA0003509952860000074
组成物品特征矩阵v。
list(u)=uT·v (10)
为每个用户选择list(u)中排名靠前的兴趣点作为用户的推荐列表。
具体结合数据说明如下:
1、算法具体实现步骤如下:
以Foursquare数据集为例,随机抽取5个用户的相关数据信息,来详细描述所提算法的计算流程。
Figure RE-RE-GDA0003509952860000075
Figure RE-RE-GDA0003509952860000076
S1:输入用户对兴趣点的评分矩阵Rmn,用户之间的社交邻接G=(V,E,P)、兴趣点的语义特征P。
S2:计算用户之间的信任值。
本文将用户之间评分相似程度作为用户之间得静态信任值。
Figure RE-RE-GDA0003509952860000077
在Foursquare数据集中,用户之间的信任值为:
Figure RE-RE-GDA0003509952860000081
S3:按公式(2)(3)(4)计算动态信任值。
为了提高用户信任值的准确性和动态适应能力,本文把用户在社交网络中的总体活动时间分为若干个时间窗[21]。时间窗的长度可根据具体的活动场景来确定,每个时间窗内的用户信任值可由上一节计算得出。那么,基于x个连续时间窗用户信任值可表示为
Figure RE-RE-GDA0003509952860000082
如图1所示,T1到Tx为用户在社交网络中的总体活动时间,每一个时间间隔对应一个时间窗。
信任值的动态性体现在两个方面:信任值随正反馈行为逐渐增加,而随负反馈行为逐渐减少。如果用户在第x个时间窗内的信任值大于第x-1个时间窗的信任值,则用户在当前的时间窗内的交互为正反馈行为,反之,为负反馈行为。观察人类的信任行为发展过程,信任是缓慢累加,又是快速递减的,换句话说,人与人之间需要多次成功交互建立的信任必然会在几次失败的交互中快速消失,即信任值的增加与减少是不对称的。为此,本文引入信任奖励因子τr与惩罚因子τp分别对正负反馈行为进行奖励和惩罚。
Figure RE-RE-GDA0003509952860000083
Figure RE-RE-GDA0003509952860000084
其中σi表示前后两个时间窗内的信任值变化斜率,
Figure RE-RE-GDA0003509952860000085
分别为正、负反馈增量,初始值为1,如果连续两个时间窗的信任值均为正反馈,则
Figure RE-RE-GDA0003509952860000086
如果两个时间窗内的信任值均为负反馈,则
Figure RE-RE-GDA0003509952860000087
那么在信任奖励因子与信任惩罚因子加持下的第个x时间窗内的信任值的计算方法是:
Figure RE-RE-GDA0003509952860000088
在Foursquare数据集中,用户之间的动态信任值为:
Figure RE-RE-GDA0003509952860000091
Figure RE-RE-GDA0003509952860000092
Figure RE-RE-GDA0003509952860000093
S4:按公式(5)计算用户之间的相似关系
依据协同过滤理论,具有共同签到点越多的用户在未来呈现越强的相关性。为此本文通过皮尔逊相关系数分析用户的历史签到记录,寻找相关性较高的用户集合,以提高推荐性能。
Figure RE-RE-GDA0003509952860000094
其中sim(i,j)为用户i与j的相似程度,其中k为用户i与j的共同评分的兴趣点集合,I(i)为用户 i的评分兴趣点集,T(j)为用户j的评分兴趣点集,Rij用户i对兴趣点j的评分,
Figure RE-RE-GDA0003509952860000095
用户i对兴趣点k 的平均评分。
在Foursquare数据集中,用户之间的相似关系表示为:
Figure RE-RE-GDA0003509952860000096
S5:按公式(6)计算兴趣点之间的语义关系
兴趣点具有不同的语义关系,同一个如餐厅,包含火锅、川菜、粤菜等等。具有语义关系相似的POI 属于同一类的可能性较高。为此本文通过分析各个兴趣点之间语义关系,寻找具有相似语义关系的兴趣点集合,以此提高推荐性能。
给定兴趣点(pi,i=1,2,…,s)和(pj,j=1,2,…,d),其中i和j分别表示兴趣点pi和pj各自拥有的语义特征。那么pi和pj之间的相似关系可表示为cimij
Figure RE-RE-GDA0003509952860000101
式中,|P|表示语义特征数量,Sp(i,j)表示兴趣点pi和pj针对语义特征p的相似关系。
在Foursquare数据集中,兴趣点之间的语义关系表示为:
Figure RE-RE-GDA0003509952860000102
S6:利用图嵌入模型联合表示用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点与兴趣点之间的语义关系。按公式(7)建立嵌入向量的目标函数。
给定图关系模型Gvv=(VA∪VB),节点VA和VB分别表示不同类型的节点集合。在社交关系中,VA和VB表示用户;在相似关系中,VA和VB分别表示用户和兴趣点;在语义关系中,VA和VB表示兴趣点。那么本文采用负采样将关系图中每个节点的嵌入向量的目标函数表示为:
Figure RE-RE-GDA0003509952860000103
logp(vi|vj)满足
Figure RE-RE-GDA0003509952860000104
其中vi和vj是边eij的顶点,vi∈VA,vj∈VB。vn表示为按负采样获得的顶点,
Figure RE-RE-GDA0003509952860000105
Figure RE-RE-GDA0003509952860000106
分别表示为节点的嵌入向量。σ为激活函数,k表示为负采样边数目。{Li,i=1,2,3}表示三种关系。wij表示节点之间的权重,如,在社交关系图中,wij为节点之间的信任值。
S7:为求解目标函数
本文采用异步随机梯度下降算法。具体为:假设边eij被采样,那么节点vi的嵌入向量
Figure RE-RE-GDA0003509952860000107
的迭代梯度可表示为:
Figure RE-RE-GDA0003509952860000108
通过迭代计算,最终我们获得用户和兴趣点在低维空间中的嵌入向量表示:
Figure RE-RE-GDA0003509952860000111
在Foursquare数据集中,
Figure RE-RE-GDA0003509952860000112
表示为:
Figure RE-RE-GDA0003509952860000113
Figure RE-RE-GDA0003509952860000114
S8:获得推荐列表
用户偏好嵌入向量表示用户对兴趣点的喜好,而兴趣点特征嵌入向量表示兴趣点的语义特征。我们将用户的偏好嵌入向量的转置与兴趣点特征嵌入向量相乘,选择排名靠前的兴趣点作为用户的推荐列表。
我们将每个用户偏好嵌入向量
Figure RE-RE-GDA0003509952860000115
组成用户偏好矩阵u,将每个物品特征嵌入向量
Figure RE-RE-GDA0003509952860000116
组成物品特征矩阵v。
list(u)=uT·v
为每个用户选择list(u)中排名靠前的兴趣点作为用户的推荐列表。
2实验分析
(1)数据集与评价指标
由于公开数据集Yelp和Foursquare在POI推荐领域内被广泛使用,本发明利用这两个数据集来检测所提算法的准确性。Yelp数据集来自于某点评网站,包含36万个用户对6万个兴趣点的1.6亿多个签到记录,同时也包含用户和项目的属性特征,如签到时间,兴趣点内容等。Foursquare数据集来自于某社交网站,包含31540个用户对22412个兴趣点的273703个签到记录。
为评估本文算法的推荐性能,采用精确率Precision和召回率Recall作为算法的评价指标。
Figure RE-RE-GDA0003509952860000117
Figure RE-RE-GDA0003509952860000118
其中Dtest为测试集,|Top_N|表示通过所提算法为用户产生大小为N的推荐列表。
(2)实验结果与分析
为验证本文算法的可行性,本文选择同类型3个对比算法,如下所示:
GE算法。该算法是一种融合了兴趣点序列、兴趣点地理空间以及时间因素的图嵌入模型。参考文献来源:Xie M,Yin H,Wang H,Xu F,Chen W,Wang S.Learning graph-based POI embedding for location-based recommendation.In:Proc.of the 25th ACMInt’l on Conf.on Information and Knowledge Management.New York:ACM,2016.15-24.
RankGeoFM算法。该算法通过分析用户的签到频率构建用户的偏好模型,利用排序学习获得用户感兴趣的项目。参考文献来源:Li X,Cong G,Li X L,Pham TAN,Krishnaswamy S.Rank-GeoFM:A ranking based geographical factorization methodfor point of interest recommendation.In: Proc.of the 38th Int’l ACM SIGIRConf.on Research and Development in Information Retrieval.New York:ACM,2015.433-442.
TGMF算法。该算法结合用户的信任与相似关系,建立用户偏好模型,利用矩阵分解改进用户偏序关系,获得用户推荐序列。参考文献来源:张进,孙福振,王绍卿,王帅,鹿祥志.融合社交关系与地理信息的兴趣点推荐模型[J].计算机工程与应用,2020,56(05):173-178.
实验过程中,将两个数据集随机划分为不同比例的测试集与训练集,分别进行10次实验,最后取平均值。
(1)确当嵌入向量维数
嵌入向量维数的大小直接决定推荐性能的准确性。维数越大推荐性能越精确,但计算的复杂度较高,相反推荐性能越低,计算复杂度较小。为了确定嵌入向量维数的合适取值,我们测试了在不同维度下所提算法的推荐性能,如图2所示。
从图中可看出,在Yelp和Foursquare中,当嵌入向量维数在60-90之间时,随着维数增大,召回率也逐渐增加。当嵌入向量维数在90-110之间时,随着维数增大,召回率变化的趋势相反。在迭代求解模型的过程中,由于向量维数过大,当模型还没收敛时,迭代停止,因此导致召回率趋势呈现相反的趋势。综合比较,我们选择嵌入向量维数为90时,推荐效果最佳。
(2)所提算法与对比算法实验分析
实验结果如图3和4所示。从各个图中可看出,随着训练集的逐渐增多,精确度逐渐增加,而召回率逐渐减小,符合精确度与召回率相互制约的关系。本发明所提算法的精确度以及召回率与其他算法相比,明显优于对比算法。由于本发明结合了用户与用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点与兴趣点之间的语义关系等三个方面的信息,在一定程度上缓解了因数据集稀疏性导致的推荐性能不准确问题,因此表现出较好的推荐性能。
3总结
由于用户签到数据的稀疏性,传统的POI推荐算法面临冷启动以及数据隐性反馈等问题时,存在推荐不准确问题。基于此,本文提出一种融合多维关系的图嵌入兴趣点推荐算法。所提算法将用户与用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点与兴趣点之间的语义关系采用图嵌入模型综合表示,采用随机梯度下降法求解模型获得用户的POI推荐列表。实验结果在真实数据集中表明,本文算法的推荐性能在各个评价指标中明显优于同类型的对比算法。

Claims (2)

1.一种融合多维关系的图嵌入兴趣点推荐算法,其特征在于包括如下步骤:(1)通过分析用户在社交网络中的交互状态,建立用户与用户之间的社交关系;(2)通过分析用户的历史签到行为,将具有相似签到行为的用户划分为一类,建立用户对兴趣点的相似关系;(3)通过分析兴趣点的语义特征,建立兴趣点之间的语义相似关系;(4)将这三种关系采用图嵌入模型来联合表示;(5)求解模型获得最终推荐列表。
2.根据权利要求1所述的一种融合多维关系的图嵌入兴趣点推荐算法,其特征在于:
1社交关系
将用户交往过程中信任关系作为社交关系,由于信任关系越强的用户共同感兴趣的事物越多,通过分析信任的结构性与动态性,建立动态信任模型;
1.1建立信任值
将用户之间评分相似程度作为用户之间得静态信任值,
Figure FDA0003395510440000011
1.1动态信任值
把用户在社交网络中的总体活动时间分为若干个时间窗,时间窗的长度根据具体的活动场景来确定,每个时间窗内的用户信任值由上一节计算得出,那么,基于x个连续时间窗用户信任值表示为
Figure FDA0003395510440000012
T1到Tx为用户在社交网络中的总体活动时间,每一个时间间隔对应一个时间窗;
用户在第x个时间窗内的信任值大于第x-1个时间窗的信任值,则用户在当前的时间窗内的交互为正反馈行为,反之,为负反馈行为;引入信任奖励因子τr与惩罚因子τp分别对正负反馈行为进行奖励和惩罚;
Figure FDA0003395510440000013
Figure FDA0003395510440000014
其中σi表示前后两个时间窗内的信任值变化斜率,
Figure FDA0003395510440000015
分别为正、负反馈增量,初始值为1,如果连续两个时间窗的信任值均为正反馈,则
Figure FDA0003395510440000016
如果两个时间窗内的信任值均为负反馈,则
Figure FDA0003395510440000021
在信任奖励因子与信任惩罚因子加持下的第个x时间窗内的信任值的计算方法是:
Figure FDA0003395510440000022
2相似关系
依据协同过滤理论,具有共同签到点越多的用户在未来呈现越强的相关性;通过皮尔逊相关系数分析用户的历史签到记录,寻找相关性较高的用户集合,以提高推荐性能;
Figure FDA0003395510440000023
其中sim(i,j)为用户i与j的相似程度,其中k为用户i与j的共同评分的兴趣点集合,I(i)为用户i的评分兴趣点集,T(j)为用户j的评分兴趣点集,Rij用户i对兴趣点j的评分,
Figure FDA0003395510440000024
用户i对兴趣点k的平均评分;
3语义关系
兴趣点具有不同的语义关系,通过分析各个兴趣点之间语义关系,寻找具有相似语义关系的兴趣点集合;
给定兴趣点(pi,i=1,2,…,s)和(pj,j=1,2,…,d),其中i和j分别表示兴趣点pi和pj各自拥有的语义特征,那么pi和pj之间的相似关系表示为cimij
Figure FDA0003395510440000025
式中,|P|表示语义特征数量,Sp(i,j)表示兴趣点pi和pj针对语义特征p的相似关系;
4图嵌入模型
当建立用户之间的社交关系,用户对兴趣点的相似关系以及兴趣点与兴趣点之间的语义关系之后,采用图嵌入模型将这三种关系联合表示,求解获得用户偏好嵌入向量与兴趣点特征嵌入向量;
给定图关系模型Gvv=(VA∪VB),节点VA和VB分别表示不同类型的节点集合;在社交关系中,VA和VB表示用户;在相似关系中,VA和VB分别表示用户和兴趣点;在语义关系中,VA和VB表示兴趣点;那么本文采用负采样将关系图中节点嵌入向量的目标函数表示为:
Figure FDA0003395510440000031
logp(vi|vj)满足
Figure FDA0003395510440000032
其中vi和vj是边eij的顶点,vi∈VA,vj∈VB,vn表示为按负采样获得的顶点,
Figure FDA0003395510440000033
Figure FDA0003395510440000034
分别表示为节点的嵌入向量,σ为激活函数,k表示为负采样边数目,{Li,i=1,2,3}表示三种关系,wij表示节点之间的权重,在社交关系中wij为节点之间的信任值;
为求解目标函数,采用异步随机梯度下降算法,具体为边eij被采样,那么节点vi的嵌入向量
Figure FDA0003395510440000035
的迭代梯度表示为:
Figure FDA0003395510440000036
通过迭代计算,最终获得用户和兴趣点在低维空间中的嵌入向量表示:
Figure FDA0003395510440000037
5获得推荐列表
用户偏好嵌入向量表示用户对兴趣点的喜好,而兴趣点特征嵌入向量表示兴趣点的语义特征;我们将用户的偏好嵌入向量的转置与兴趣点特征嵌入向量相乘,选择排名靠前的兴趣点作为用户的推荐列表;
将每个用户偏好嵌入向量
Figure FDA0003395510440000038
组成用户偏好矩阵u,将每个物品特征嵌入向量
Figure FDA0003395510440000039
组成物品特征矩阵v;
list(u)=uT·v (10)
为每个用户选择list(u)中排名靠前的兴趣点作为用户的推荐列表。
CN202111482809.9A 2021-12-06 2021-12-06 融合多维关系的图嵌入兴趣点推荐算法 Pending CN114282120A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111482809.9A CN114282120A (zh) 2021-12-06 2021-12-06 融合多维关系的图嵌入兴趣点推荐算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111482809.9A CN114282120A (zh) 2021-12-06 2021-12-06 融合多维关系的图嵌入兴趣点推荐算法

Publications (1)

Publication Number Publication Date
CN114282120A true CN114282120A (zh) 2022-04-05

Family

ID=80871048

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111482809.9A Pending CN114282120A (zh) 2021-12-06 2021-12-06 融合多维关系的图嵌入兴趣点推荐算法

Country Status (1)

Country Link
CN (1) CN114282120A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618860A (zh) * 2022-11-14 2023-01-17 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) 融合lbs兴趣点多维属性与空间关系的词云生成方法及系统
CN117591751A (zh) * 2024-01-19 2024-02-23 国网湖北省电力有限公司信息通信公司 基于图嵌入的上下文忠诚度融合的兴趣点推荐方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115618860A (zh) * 2022-11-14 2023-01-17 深圳市规划和自然资源数据管理中心(深圳市空间地理信息中心) 融合lbs兴趣点多维属性与空间关系的词云生成方法及系统
CN117591751A (zh) * 2024-01-19 2024-02-23 国网湖北省电力有限公司信息通信公司 基于图嵌入的上下文忠诚度融合的兴趣点推荐方法及系统
CN117591751B (zh) * 2024-01-19 2024-04-26 国网湖北省电力有限公司信息通信公司 基于图嵌入的上下文忠诚度融合的兴趣点推荐方法及系统

Similar Documents

Publication Publication Date Title
Zhang et al. TICRec: A probabilistic framework to utilize temporal influence correlations for time-aware location recommendations
CN104935963B (zh) 一种基于时序数据挖掘的视频推荐方法
Li et al. Mining user similarity based on location history
Yusefi Hafshejani et al. Improving sparsity and new user problems in collaborative filtering by clustering the personality factors
CN114282120A (zh) 融合多维关系的图嵌入兴趣点推荐算法
EP2353103A2 (en) Method and system for determining topical relatedness of domain names
CN108804551A (zh) 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN112380433B (zh) 面向冷启动用户的推荐元学习方法
CN106708953A (zh) 基于离散粒子群优化的局部社区检测协同过滤推荐方法
Liu et al. Where your photo is taken: Geolocation prediction for social images
CN106599194A (zh) 标签确定方法及装置
Zhang et al. Beyond the limits of predictability in human mobility prediction: context-transition predictability
CN107145541B (zh) 基于超图结构的社交网络推荐模型构建方法
Li et al. A spatial-temporal probabilistic matrix factorization model for point-of-interest recommendation
WO2014177821A1 (en) Method of website optimisation for a website hosted on a server system, and a server system
Guo et al. Cosolorec: Joint factor model with content, social, location for heterogeneous point-of-interest recommendation
Zou et al. An innovative GPS trajectory data based model for geographic recommendation service
Gasparetti et al. Community Detection and Recommender Systems.
CN106951459B (zh) 基于熵值法的改进协同过滤推荐方法
CN110543601B (zh) 一种基于中智集的上下文感知兴趣点推荐方法及系统
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
CN115618127A (zh) 一种神经网络推荐系统协同过滤算法
Zhao et al. Exploiting homophily-based implicit social network to improve recommendation performance
Zhai et al. Point-of-interest recommendation system based on deepwalk and tensor decomposition
Yu et al. RePiDeM: A refined POI demand modeling based on multi-source data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination