CN109948066B - 一种基于异构信息网络的兴趣点推荐方法 - Google Patents

一种基于异构信息网络的兴趣点推荐方法 Download PDF

Info

Publication number
CN109948066B
CN109948066B CN201910303497.7A CN201910303497A CN109948066B CN 109948066 B CN109948066 B CN 109948066B CN 201910303497 A CN201910303497 A CN 201910303497A CN 109948066 B CN109948066 B CN 109948066B
Authority
CN
China
Prior art keywords
user
semantic
matrix
interest
context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910303497.7A
Other languages
English (en)
Other versions
CN109948066A (zh
Inventor
俞东进
徐凯辉
王东京
徐登威
完颜文博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201910303497.7A priority Critical patent/CN109948066B/zh
Publication of CN109948066A publication Critical patent/CN109948066A/zh
Application granted granted Critical
Publication of CN109948066B publication Critical patent/CN109948066B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于异构信息网络的兴趣点推荐方法。该方法使用异构信息网络以及元路径来建模基于位置的社交网络中用户的复杂行为语义,并通过矩阵分解和排序学习预测用户偏好。通过本发明方法能够有效挖掘用户行为特征,进而给用户推荐兴趣点,提高基于位置的社交网络服务的体验。

Description

一种基于异构信息网络的兴趣点推荐方法
技术领域
本发明涉及兴趣点领域,尤其涉及一种基于异构信息网络的兴趣点推荐方法。
背景技术
近年来,随着移动设备的发展,基于位置的社交网络(Location-Based SocialNetwork,LBSN)服务应运而生,如国外的Foursquare、Gowalla、Yelp和国内的冒泡、大众点评等应用。大量用户通过LBSN服务探索他们喜欢的兴趣点,例如图书馆、餐厅等,并与朋友分享他们访问这些兴趣点的体验。用户的签到行为包括时间、天气、位置等上下文信息。个性化兴趣点推荐服务旨在通过这些包含丰富信息的历史签到数据来挖掘用户偏好、帮助用户探索新的兴趣点,以此来提高基于位置的社交网络服务的体验。
相比于传统的商品、音乐、书籍等推荐系统,兴趣点推荐系统更加复杂。首先,单一用户的签到数量在兴趣点集合中往往仅占有非常小的一部分,因此用户-兴趣点签到矩阵是高度稀疏的,从而显著增加了推荐的难度。此外,LBSN场景包含着丰富的上下文信息,并且用户签到的决策过程非常复杂,可能受到许多不同因素的影响。目前已有许多研究工作在兴趣点推荐中考虑上下文的影响。例如,Ye等人认为地理信息显著影响用户的签到行为,因此将地理信息融合到协同过滤算法中进行兴趣点推荐。Gao等人提出了一个基于时间属性的兴趣点推荐框架,将用户签到的时间特征加入推荐模型中以提升效果。
然而,现有的研究缺少对用户行为语义的深度挖掘,往往只考虑单一的上下文信息,并且受限于兴趣点推荐场景的数据稀疏问题,推荐效果并不理想。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于异构信息网络的兴趣点推荐方法,可有效解决上述问题。
本发明使用异构信息网络以及元路径来建模LBSN中用户的复杂行为语义,将其表征为用户-兴趣点语义关联度矩阵,以达到精准捕获用户行为特征的目的。本发明改进了加权矩阵分解方法,在其中考虑地理位置距离的影响,从多条元路径产生的用户-兴趣点语义关联度矩阵中获取用户语义偏好。最后,本发明使用排序学习方法融合多条元路径对应的用户语义偏好,进而给用户推荐兴趣点。
本发明具体采用的技术方案如下:
一种基于异构信息网络的兴趣点推荐方法包括以下步骤:
1)输入用户签到行为记录数据,包括用户集合、兴趣点集合、兴趣点经纬度、兴趣点类型集合、朋友关系、用户签到时的上下文信息;
2)根据用户签到行为记录数据构建异构信息网络
Figure BDA0002029020750000021
其中V表示信息实体对象的集合,E表示实体对象之间的边的集合,
Figure BDA0002029020750000022
表示对象类型映射函数
Figure BDA0002029020750000023
Figure BDA0002029020750000024
表示关系类型映射函数
Figure BDA0002029020750000025
任意一个对象v对应着一个特定的对象类型A,即
Figure BDA0002029020750000026
任意一条边e都对应着一个特定的关系类型R,即
Figure BDA0002029020750000027
3)首先根据构建出的异构信息网络,设计Q条兴趣点推荐场景的元路径(M1,M2,…,Mi,…,MQ),其中第i条元路径
Figure BDA0002029020750000028
表示从信息实体对象A1到信息实体对象Al的关系,Ri表示从Ai与Ai+1之间的关系;其次根据上下文情境对用户行为进行约束,建立H条上下文约束元路径
Figure BDA0002029020750000029
其中第i条上下文约束元路径为
Figure BDA00020290207500000210
Figure BDA00020290207500000211
其中δ(R)表示在关系R上的上下文属性值,若关系R不存在上下文情境约束,则记δ(R)=R,约束S包括当前上下文约束元路径的上下文情境和相应的属性值约束信息;
4)对每一条元路径构建相应的语义关联度矩阵,元路径
Figure BDA00020290207500000212
Figure BDA00020290207500000213
对应的语义关联度矩阵表示为
Figure BDA00020290207500000214
其中
Figure BDA00020290207500000215
表示实体对象Ai和Aj之间的邻接矩阵;对每一条上下文约束元路径构建相应的语义关联度矩阵,其语义关联度矩阵为每个上下文情境属性值对应的关联度矩阵之和,具体构建方法为:
4-1)将指标的最大和最小值跨度范围切分为多个跨度片W1W2…Wn,获取每个跨度片的用户签到行为记录;
4-2)计算每个跨度片Wi下元路径
Figure BDA00020290207500000216
对应语义关联度矩阵
Figure BDA00020290207500000217
4-3)对每个跨度片Wi下元路径的语义关联度矩阵求和,将其作为上下文约束元路径的语义关联度矩阵SM
5)根据用户历史签到行为,计算用户从兴趣点i到兴趣点j的签到转移概率Pr(i,j),公式如下:
Pr(i,j)=a·d(i,j)b
计算用户u的标准化签到概率
Figure BDA0002029020750000031
公式如下:
Figure BDA0002029020750000032
其中d(i,j)表示地点i与j之间的距离,参数a与b通过线性回归学习得到,Max(Pru)表示用户u的签到行为记录中的最大签到转移概率;
6)对每一个语义关联度矩阵进行矩阵分解,将其分解成用户潜在特征矩阵X与兴趣点潜在特征矩阵Y,从而得到相应的用户语义偏好
Figure BDA0002029020750000033
矩阵分解的损失函数表示为:
Figure BDA0002029020750000034
其中:
Figure BDA0002029020750000035
Figure BDA0002029020750000036
其中,T为所有用户和兴趣点的集合,
Figure BDA0002029020750000037
表示用户偏好的置信度,其数值越高代表用户u对兴趣点i的偏好越强烈,
Figure BDA0002029020750000038
表示表示用户u对兴趣点i的语义关联度,ru,i为用户隐式反馈偏好,
Figure BDA0002029020750000039
为用户u对兴趣点i的语义偏好,xu表示用户u的特征向量,yi表示兴趣点i的特征向量,β为调节参数,λ为正则化参数,Du为用户u访问过的兴趣点集合;
然后使用最小二乘法优化所述损失函数,最终得到每一个语义关联度矩阵的用户语义偏好
Figure BDA00020290207500000310
7)将步骤6)计算得到的用户语义偏好加权求和,从而得到用户u对地点i的最终偏好
Figure BDA00020290207500000311
Figure BDA00020290207500000312
其中,θl表示元路径或上下文约束元路径l所对应的用户语义偏好的权重;
设定用户u相较于i、j两个兴趣点更偏好于兴趣点i的概率为:
Figure BDA0002029020750000041
其中,θ={θ12…θQ+H}表示权重参数,>u代表两个兴趣点的排序关系;
最大化如下后验概率,使得所有的兴趣点对都按照正确的偏好顺序排列,从而学习并得到相应的元路径对应的语义偏好权重:
p(θ|>u)∝p(>u|θ)p(θ)
其中,p(θ)为先验概率;
8)根据步骤7)学习到的语义偏好权重参数,对任一用户,遍历所有兴趣点,计算用户对兴趣点的最终偏好预测值,并选取预测值最大并且用户未访问过的若干个兴趣点推荐给用户。
基于上述方案,各步骤还可以采用如下优选方式实现。
优选的,步骤1)中所述的用户签到时的上下文信息包括时间上下文和天气上下文。
优选的,步骤2)中所述的信息实体对象包括用户、兴趣点和兴趣点类型。
进一步的,对于时间上下文,语义关联度矩阵的构建方法为:
4-1-1)将一天时间切分为多个时间片T1T2…Tn,获取每个时间片的用户签到行为记录;
4-1-2)计算每个时间片Ti下元路径
Figure BDA0002029020750000042
对应语义关联度矩阵
Figure BDA0002029020750000043
4-1-3)对每个时间片Ti下元路径的语义关联度矩阵求和,将其作为时间上下文约束元路径的语义关联度矩阵SM
进一步的,对于天气上下文,语义关联度矩阵的构建方法为:
4-2-1)将天气相关指标的最大和最小值跨度范围切分为多个跨度段F1F2…Fn,获取每个跨度段的用户签到行为记录;
4-2-2)计算每个跨度段Fi下元路径
Figure BDA0002029020750000044
对应语义关联度矩阵
Figure BDA0002029020750000045
4-2-3)对每个跨度段Fi下元路径的语义关联度矩阵求和,将其作为天气上下文约束元路径的语义关联度矩阵SM
再进一步的,所述的天气相关指标包括温度、湿度以及云量。
优选的,步骤6)中,使用最小二乘法优化所述损失函数的方法为:
6-1)随机初始化潜在特征矩阵X;
6-2)将X作为已知,通过迭代更新方程求得潜在特征矩阵Y;
6-3)将Y作为已知,通过迭代更新方程求得潜在特征矩阵X;
交替执行上述6-2)和6-3)两个过程,直到损失函数收敛。
优选的,步骤7)中,所述语义偏好权重的计算方法为:
设定先验概率p(θ)服从期望为0,协方差矩阵为∑θ=λθI的高斯分布,则兴趣点对的排序优化目标函数为:
Figure BDA0002029020750000051
其中,U为所有用户的集合,λθ为针对θ的正则化参数;
使用随机梯度下降法优化上述目标函数,对θ求偏导:
Figure BDA0002029020750000052
再使用Bootstrap Sampling方法进行采样,根据随机梯度下降法,沿着负梯度方向更新θ,以不断迭代直至结果收敛或迭代次数达到上限值结束,从而学习并得到相应的元路径对应的语义偏好权重。
本发明首先用异构信息网络的元路径表示兴趣点推荐场景的复杂行为语义关系。其次,本发明通过上下文约束元路径整合天气和时间等上下文信息,进一步挖掘细粒度的用户行为特征,并将其表征为用户-兴趣点语义关联度矩阵,用以缓解数据稀疏问题并提升推荐可解释性。此外,本发明提出在加权矩阵分解中加入地理位置距离对用户行为的影响,并从多条元路径得到的用户-兴趣点语义关联度矩阵中获取用户语义偏好。最后,本发明提出一个基于排序学习的融合方法,将不同元路径求得的用户语义偏好统一起来作为用户的最终偏好。
附图说明
图1LBSN场景异构信息网络示例;
图2算法流程图;
图3准确率实施结果对比;
图4召回率实施结果对比。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
相反,本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本发明有更好的了解,在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。
本发明所提出的基于异构信息网络的兴趣点推荐方法主要分为以下几部分内容:异构信息网络构建、语义关联度矩阵构建、用户语义偏好计算、偏好加权预测。
异构信息网络构建:根据用户签到行为数据生成与之对应的异构信息网络模型,并设计相应的符合用户行为语义的元路径以及上下文约束元路径,它是其它部分实现的基础。
语义关联度矩阵构建:根据已设计的元路径,计算用户对象与兴趣点对象之间的关联度,从而构建用户-兴趣点语义关联度矩阵,其目的在于从不同角度度量用户的行为特征。
用户语义偏好计算:是整个推荐方法的核心组成部分,其在加权矩阵分解中加入地理位置距离对用户行为的影响,从语义关联度矩阵中获取用户语义偏好。
偏好加权预测:用来对多个语义关联度矩阵得到的用户语义偏好进行加权求和,从而得到最终的兴趣点推荐结果。
下面对该方法的具体步骤进行详细描述。
为叙述方便,定义相关符号如下:
U:用户集合。
P:兴趣点集合。
C:兴趣点类型集合。
T:时间上下文。
F:天气上下文。
Figure BDA0002029020750000071
异构信息网络。
M:元路径。
Mc:上下文约束元路径。由于用户在不同上下文情境下表现出不同的签到偏好,根据上下文情境对用户行为进行约束,从而建立上下文约束元路径。
Figure BDA00020290207500000715
对象Ai和Aj之间的邻接矩阵,其中的元素表示对象间的交互次数。
SM:语义关联度矩阵。它表示用户对象与兴趣点对象之间的关联度量。元路径M=A1A2…Al对应的语义关联度矩阵为
Figure BDA0002029020750000072
如图2所示,本实施例中,一种基于异构信息网络的兴趣点推荐方法包括以下步骤:
(1)输入用户签到行为记录数据,包括用户集合、兴趣点集合、兴趣点经纬度、兴趣点类型集合、朋友关系、用户签到时的上下文信息(如时间、天气等);
(2)根据用户签到行为记录数据构建异构信息网络,以表示基于位置的社交网络的复杂语义关系,其中包括用户对象与兴趣点对象的“签到”关系,用户对象之间的“朋友关系”,兴趣点对象与类型对象的“类别”关系,如图1所示。具体而言,异构信息网络
Figure BDA0002029020750000073
其中V表示信息实体对象的集合(用户、兴趣点、兴趣点类型等),E表示实体对象之间的边的集合,
Figure BDA0002029020750000074
表示对象类型映射函数
Figure BDA0002029020750000075
Figure BDA0002029020750000076
表示关系类型映射函数
Figure BDA0002029020750000077
任意一个对象v对应着一个特定的对象类型A,即
Figure BDA0002029020750000078
任意一条边e都对应着一个特定的关系类型R,即
Figure BDA0002029020750000079
(3)首先根据构建出的异构信息网络,设计Q条兴趣点推荐场景的元路径(M1,M2,…,Mi,…,MQ),其中第i条元路径
Figure BDA00020290207500000710
表示从信息实体对象A1到信息实体对象Al的关系,Ri表示从Ai与Ai+1之间的关系。其次根据上下文情境对用户行为进行约束,建立H条上下文约束元路径
Figure BDA00020290207500000711
其中第i条上下文约束元路径为
Figure BDA00020290207500000712
Figure BDA00020290207500000713
其中δ(R)表示在关系R上的上下文属性值,若关系R不存在上下文情境约束,则记δ(R)=R,约束S包括当前上下文约束元路径的上下文情境和相应的属性值约束信息;
(4)对每一条元路径构建相应的语义关联度矩阵,元路径
Figure BDA00020290207500000714
Figure BDA0002029020750000081
对应的语义关联度矩阵表示为
Figure BDA0002029020750000082
其中
Figure BDA0002029020750000083
表示实体对象Ai和Aj之间的邻接矩阵;对每一条上下文约束元路径构建相应的语义关联度矩阵,其语义关联度矩阵为每个上下文情境属性值对应的关联度矩阵之和,具体构建方法为:
(4-1)将相关指标的最大和最小值跨度范围切分为多个跨度片W1W2…Wn,获取每个跨度片的用户签到行为记录;
(4-2)计算每个跨度片Wi下元路径
Figure BDA0002029020750000084
对应语义关联度矩阵
Figure BDA0002029020750000085
(4-3)对每个跨度片Wi下元路径的语义关联度矩阵求和,将其作为上下文约束元路径的语义关联度矩阵SM
上下文情境包括时间上下文和天气上下文,两者的SM具体构建过程为:
对于时间上下文,语义关联度矩阵的构建方法为:
(4-1-1)将一天时间切分为多个时间片T1T2…Tn,获取每个时间片的用户签到行为记录;
(4-1-2)计算每个时间片Ti下元路径
Figure BDA0002029020750000086
对应语义关联度矩阵
Figure BDA0002029020750000087
(4-1-3)对每个时间片Ti下元路径的语义关联度矩阵求和,将其作为时间上下文约束元路径的语义关联度矩阵SM
对于天气上下文,语义关联度矩阵的构建方法为:
(4-2-1)将天气相关指标的最大和最小值跨度范围切分为多个跨度段F1F2…Fn,获取每个跨度段的用户签到行为记录;
(4-2-2)计算每个跨度段Fi下元路径
Figure BDA0002029020750000088
对应语义关联度矩阵
Figure BDA0002029020750000089
(4-2-3)对每个跨度段Fi下元路径的语义关联度矩阵求和,将其作为天气上下文约束元路径的语义关联度矩阵SM
其中天气相关指标可以包括温度、湿度以及云量等。
(5)根据用户历史签到行为,计算用户从兴趣点i到兴趣点j的签到转移概率Pr(i,j),公式如下:
Pr(i,j)=a·d(i,j)b
计算用户u的标准化签到概率
Figure BDA00020290207500000810
公式如下:
Figure BDA00020290207500000811
其中d(i,j)表示地点i与j之间的距离,参数a与b通过线性回归学习得到,Max(Pru)表示用户u的签到行为记录中的最大签到转移概率;
(6)从语义关联度矩阵中提取潜在特征,并求得用户语义偏好。对每一个语义关联度矩阵进行矩阵分解,将其分解成用户潜在特征矩阵X与兴趣点潜在特征矩阵Y,从而得到相应的用户语义偏好
Figure BDA0002029020750000091
矩阵分解的损失函数表示为:
Figure BDA0002029020750000092
用户u对兴趣点i的语义偏好
Figure BDA0002029020750000093
表示为:
Figure BDA0002029020750000094
定义ru,i为用户隐式反馈偏好:
Figure BDA0002029020750000095
其中,T为所有用户和兴趣点的集合,
Figure BDA0002029020750000096
表示用户偏好的置信度,其数值越高代表用户u对兴趣点i的偏好越强烈,
Figure BDA0002029020750000097
表示表示用户u对兴趣点i的语义关联度,ru,i为用户隐式反馈偏好,
Figure BDA0002029020750000098
为用户u对兴趣点i的语义偏好,xu表示用户u的特征向量,yi表示兴趣点i的特征向量,β为调节参数,λ为正则化参数,Du为用户u访问过的兴趣点集合;
然后使用最小二乘法优化所述损失函数:
6-1)随机初始化潜在特征矩阵X;
6-2)将X作为已知,通过下文相应的迭代更新方程求得潜在特征矩阵Y;
6-3)将Y作为已知,通过下文相应的迭代更新方程求得潜在特征矩阵X;
交替执行上述6-2)和6-3)两个过程,直到损失函数收敛。xu和yi的迭代更新方程如下式所示:
Figure BDA0002029020750000099
Figure BDA00020290207500000910
Figure BDA00020290207500000911
最终得到每一个语义关联度矩阵的用户语义偏好
Figure BDA0002029020750000101
(7)基于排序学习预测用户对兴趣点的最终偏好。假设已经设计Q条元路径,H条上下文约束元路径,构建出Q+H个用户-兴趣点语义关联度矩阵
Figure BDA0002029020750000102
每一个矩阵都通过步骤(6)中的矩阵分解方法获取用户语义偏好
Figure BDA0002029020750000103
将步骤(6)计算得到的用户语义偏好加权求和,从而得到用户u对地点i的最终偏好
Figure BDA0002029020750000104
Figure BDA0002029020750000105
其中,θl表示元路径或上下文约束元路径l所对应的用户语义偏好的权重。
定义用户u相较于i、j两个兴趣点更偏好于兴趣点i的概率为:
Figure BDA0002029020750000106
其中,θ={θ12…θQ+H}表示权重参数,>u代表两个兴趣点的排序关系;
由贝叶斯公式可知,若要则要使得所有的兴趣点对都按照正确的偏好顺序排列,需最大化如下后验概率,从而学习并得到相应的元路径对应的语义偏好权重:
p(θ|>u)∝p(>u|θ)p(θ)
其中,p(θ)为先验概率;
假设用户对于兴趣点对的排序偏好相互独立,整合所有用户后,似然函数p(>u|θ)写为如下形式:
Figure BDA0002029020750000107
其中,Ru表示兴趣点对之间的排序关系集合;
定义先验概率p(θ)服从期望为0,协方差矩阵为∑θ=λθI的高斯分布,则排序优化的目标函数为:
Figure BDA0002029020750000108
其中,U为所有用户的集合,λθ为针对θ的正则化参数;
使用随机梯度下降法优化上述目标函数,对θ求偏导:
Figure BDA0002029020750000111
再使用Bootstrap Sampling方法进行采样,根据随机梯度下降法,沿着负梯度方向更新θ,以一定次数不断迭代直至结果收敛或迭代结束,从而学习并得到相应的元路径对应的语义偏好权重;
(8)根据步骤(7)学习到的语义偏好权重参数,对任一用户,遍历所有兴趣点,计算用户对兴趣点的最终偏好预测值,并选取预测值最大并且用户未访问过的若干个兴趣点推荐给该用户。具体给用户推荐的兴趣点个数K可以根据实际需要进行确定。
下面结合实施例来展示本发明的兴趣点推荐方法的效果。
实施例
本实施例的步骤与具体实施方式相同,在此不再进行赘述。下面就部分实施过程参数和实施结果进行展示:
本实施例所用的数据集为从Foursquare中获取的美国洛杉矶在2010年到2011年用户的真实签到数据,每条签到行为都包括用户ID、地点ID、经纬度和签到时间。对于每个地点都有相应的地点类型与之对应,每个用户也都包含其朋友关系信息。此外,本实例以<经度,纬度,时间戳>的形式抓取用户签到时的天气情况作为额外的上下文信息,包括温度、湿度以及云量。具体的数据统计信息下表所示。
用户数 地点数 地点类型数 签到数 数据稀疏度
2026 8270 127 51917 0.39%
本实施例用以下步骤将数据集划分为训练集Dtrain与测试集Dtest:(1)聚合每个用户对每个地点的签到记录;(2)将每个用户签到的地点以首次签到时间从远到近排序;(3)将每个用户前80%的签到地点的记录作为训练集、后20%作为测试集。在实施中,本实例将一天时间平均分为三段,将天气相关指标最小值到最大值的范围分割为三段数据,从而对上下文约束元路径构建相应语义关联度矩阵。调节参数β=0.8,正则化参数统一设置为λ=0.01,签到概率相关参数通过学习获得。
本实施例使用如下方法作为对比方法:
(1)WRMF[Hu et al.,2008]:面向隐式反馈场景的矩阵分解方法,将用户访问地点的次数作为置信度,以交替最小二乘法进行模型迭代求解;
(2)BPRMF[Rendle et al.,2009]:从相对排序的角度考虑推荐系统的隐式反馈场景,将矩阵分解的目标函数转化为优化兴趣点的相对顺序;
(3)USG[Ye et al.,2011]:将用户偏好、社交关系影响、位置影响以线性加权的方式建模;
(4)RankGeoFM[Li et al.,2015]:基于排序以及地理影响的矩阵分解方法;
(5)ASMF[Li et al.,2016]:从用户的三种朋友关系中学习潜在的兴趣点,并通过矩分解求解用户最终偏好。
本实施例(Our method)使用准确率(Precision)和召回率(Recall)作为评价指标,具体计算如下式所示,其中Ru表示用户u的TOP-K推荐结果,Tu表示用户u在Dtest中访问过的兴趣点集合。
Figure BDA0002029020750000121
Figure BDA0002029020750000122
具体的对比结果,如图3和图4所示。从图中可以看出,本发明在不同指标、不同推荐结果个数的情况下均优于其它现有方法。本发明以元路径的方法充分利用了时间、天气等上下文信息来表达用户的行为语义,并通过签到概率捕获用户地理位置距离偏好。相较于其它方法,本方法考虑更加全面,且能够更加准确地捕获用户行为偏好。不同于USG方法将信息特征以线性加权的方式建模,本发明考虑排序问题,以贝叶斯排序模型来学习不同用户地语义偏好权重,在用户偏好的预测上,相较于其它方法有着更好的表现。
以上所述的实施例只是本发明的一种较佳的方案,然其并非用以限制本发明。有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型。因此凡采取等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。

Claims (8)

1.一种基于异构信息网络的兴趣点推荐方法,其特征在于包括以下步骤:
1)输入用户签到行为记录数据,包括用户集合、兴趣点集合、兴趣点经纬度、兴趣点类型集合、朋友关系、用户签到时的上下文信息;
2)根据用户签到行为记录数据构建异构信息网络
Figure FDA0002670552900000011
其中V表示信息实体对象的集合,E表示实体对象之间的边的集合,
Figure FDA0002670552900000012
表示对象类型映射函数
Figure FDA0002670552900000013
Figure FDA0002670552900000014
表示关系类型映射函数
Figure FDA0002670552900000015
任意一个对象v对应着一个特定的对象类型A,即
Figure FDA0002670552900000016
任意一条边e都对应着一个特定的关系类型R,即
Figure FDA0002670552900000017
3)首先根据构建出的异构信息网络,设计Q条兴趣点推荐场景的元路径(M1,M2,…,Mi,…,MQ),其中第i条元路径
Figure FDA0002670552900000018
表示从信息实体对象A1到信息实体对象Al的关系,Ri表示从Ai与Ai+1之间的关系;其次根据上下文情境对用户行为进行约束,建立H条上下文约束元路径
Figure FDA0002670552900000019
其中第i条上下文约束元路径为
Figure FDA00026705529000000110
Figure FDA00026705529000000111
其中δ(R)表示在关系R上的上下文属性值,若关系R不存在上下文情境约束,则记δ(R)=R,约束S包括当前上下文约束元路径的上下文情境和相应的属性值约束信息;
4)对每一条元路径构建相应的语义关联度矩阵,元路径
Figure FDA00026705529000000112
Figure FDA00026705529000000113
对应的语义关联度矩阵表示为
Figure FDA00026705529000000114
其中
Figure FDA00026705529000000115
表示实体对象Ai和Aj之间的邻接矩阵;对每一条上下文约束元路径构建相应的语义关联度矩阵,其语义关联度矩阵为每个上下文情境属性值对应的关联度矩阵之和,具体构建方法为:
4-1)将指标的最大和最小值跨度范围切分为多个跨度片W1W2…Wn,获取每个跨度片的用户签到行为记录;
4-2)计算每个跨度片Wi下元路径
Figure FDA00026705529000000116
对应语义关联度矩阵
Figure FDA00026705529000000117
4-3)对每个跨度片Wi下元路径的语义关联度矩阵求和,将其作为上下文约束元路径的语义关联度矩阵SM
5)根据用户历史签到行为,计算用户从兴趣点i到兴趣点j的签到转移概率Pr(i,j),公式如下:
Pr(i,j)=a·d(i,j)b
计算用户u的标准化签到概率
Figure FDA0002670552900000021
公式如下:
Figure FDA0002670552900000022
其中d(i,j)表示地点i与j之间的距离,参数a与b通过线性回归学习得到,Max(Pru)表示用户u的签到行为记录中的最大签到转移概率;
6)对每一个语义关联度矩阵进行矩阵分解,将其分解成用户潜在特征矩阵X与兴趣点潜在特征矩阵Y,从而得到相应的用户语义偏好
Figure FDA0002670552900000023
矩阵分解的损失函数表示为:
Figure FDA0002670552900000024
其中:
Figure FDA0002670552900000025
Figure FDA0002670552900000026
其中,T为所有用户和兴趣点的集合,
Figure FDA0002670552900000027
表示用户偏好的置信度,其数值越高代表用户u对兴趣点i的偏好越强烈,
Figure FDA0002670552900000028
表示表示用户u对兴趣点i的语义关联度,ru,i为用户隐式反馈偏好,
Figure FDA0002670552900000029
为用户u对兴趣点i的语义偏好,xu表示用户u的特征向量,yi表示兴趣点i的特征向量,β为调节参数,λ为正则化参数,Du为用户u访问过的兴趣点集合;
然后使用最小二乘法优化所述损失函数,最终得到每一个语义关联度矩阵的用户语义偏好
Figure FDA00026705529000000210
7)将步骤6)计算得到的用户语义偏好加权求和,从而得到用户u对地点i的最终偏好
Figure FDA00026705529000000211
Figure FDA00026705529000000212
其中,θl表示元路径或上下文约束元路径l所对应的用户语义偏好权重;
设定用户u相较于i、j两个兴趣点更偏好于兴趣点i的概率为:
Figure FDA00026705529000000213
其中,θ={θ1,θ2…θQ+H}表示权重参数,>u代表两个兴趣点的排序关系;
最大化如下后验概率,使得所有的兴趣点对都按照正确的偏好顺序排列,从而学习并得到相应的元路径对应的语义偏好权重:
p(θ|>u)∝p(>u|θ)p(θ)
其中,p(θ)为先验概率;
8)根据步骤7)学习到的语义偏好权重参数,对任一用户,遍历所有兴趣点,计算用户对兴趣点的最终偏好预测值,并选取预测值最大并且用户未访问过的若干个兴趣点推荐给该用户。
2.根据权利要求1所述的一种基于异构信息网络的兴趣点推荐方法,其特征在于步骤1)中所述的用户签到时的上下文信息包括时间上下文和天气上下文。
3.根据权利要求1所述的一种基于异构信息网络的兴趣点推荐方法,其特征在于步骤2)中所述的信息实体对象包括用户、兴趣点和兴趣点类型。
4.根据权利要求2所述的一种基于异构信息网络的兴趣点推荐方法,其特征在于对于时间上下文,语义关联度矩阵的构建方法为:
4-1-1)将一天时间切分为多个时间片T1T2…Tn,获取每个时间片的用户签到行为记录;
4-1-2)计算每个时间片Ti下元路径
Figure FDA0002670552900000031
对应语义关联度矩阵
Figure FDA0002670552900000032
4-1-3)对每个时间片Ti下元路径的语义关联度矩阵求和,将其作为时间上下文约束元路径的语义关联度矩阵SM
5.根据权利要求2所述的一种基于异构信息网络的兴趣点推荐方法,其特征在于对于天气上下文,语义关联度矩阵的构建方法为:
4-2-1)将天气相关指标的最大和最小值跨度范围切分为多个跨度段F1F2…Fn,获取每个跨度段的用户签到行为记录;
4-2-2)计算每个跨度段Fi下元路径
Figure FDA0002670552900000033
对应语义关联度矩阵
Figure FDA0002670552900000034
4-2-3)对每个跨度段Fi下元路径的语义关联度矩阵求和,将其作为天气上下文约束元路径的语义关联度矩阵SM
6.根据权利要求5所述的一种基于异构信息网络的兴趣点推荐方法,其特征在于所述的天气相关指标包括温度、湿度以及云量。
7.根据权利要求1所述的一种基于异构信息网络的兴趣点推荐方法,其特征在于步骤6)中,使用最小二乘法优化所述损失函数的方法为:
6-1)随机初始化潜在特征矩阵X;
6-2)将X作为已知,通过迭代更新方程求得潜在特征矩阵Y;
6-3)将Y作为已知,通过迭代更新方程求得潜在特征矩阵X;
交替执行上述6-2)和6-3)两个过程,直到损失函数收敛。
8.根据权利要求1所述的一种基于异构信息网络的兴趣点推荐方法,其特征在于步骤7)中,所述语义偏好权重的计算方法为:
设定先验概率p(θ)服从期望为0,协方差矩阵为∑θ=λθI的高斯分布,则兴趣点对的排序优化目标函数为:
Figure FDA0002670552900000041
其中,U为所有用户的集合,λθ为针对θ的正则化参数;
使用随机梯度下降法优化上述目标函数,对θ求偏导:
Figure FDA0002670552900000042
再使用Bootstrap Sampling方法进行采样,根据随机梯度下降法,沿着负梯度方向更新θ,以不断迭代直至结果收敛或迭代次数达到上限值结束,从而学习并得到相应的元路径对应的语义偏好权重。
CN201910303497.7A 2019-04-16 2019-04-16 一种基于异构信息网络的兴趣点推荐方法 Active CN109948066B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910303497.7A CN109948066B (zh) 2019-04-16 2019-04-16 一种基于异构信息网络的兴趣点推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910303497.7A CN109948066B (zh) 2019-04-16 2019-04-16 一种基于异构信息网络的兴趣点推荐方法

Publications (2)

Publication Number Publication Date
CN109948066A CN109948066A (zh) 2019-06-28
CN109948066B true CN109948066B (zh) 2020-12-11

Family

ID=67015418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910303497.7A Active CN109948066B (zh) 2019-04-16 2019-04-16 一种基于异构信息网络的兴趣点推荐方法

Country Status (1)

Country Link
CN (1) CN109948066B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110704741B (zh) * 2019-09-30 2021-10-15 杭州电子科技大学 基于时空点过程的兴趣点预测方法
CN111026943A (zh) * 2019-11-12 2020-04-17 山东大学 利用多源社交网络的合作学习进行用户兴趣分析方法及系统
CN110929046B (zh) * 2019-12-10 2022-09-30 华中师范大学 一种基于异质网络嵌入的知识实体推荐方法及系统
EP3901884A1 (en) 2020-04-24 2021-10-27 Naver Corporation Object recommendation using ambient mindsets
CN111476322B (zh) * 2020-05-22 2022-05-20 哈尔滨工程大学 一种基于特征优化的元路径挖掘方法
CN112069415B (zh) * 2020-08-13 2023-11-24 中国海洋大学 一种基于异构属性网络表征学习的兴趣点推荐方法
CN112216108B (zh) * 2020-10-12 2021-06-29 中南大学 一种基于属性增强的时空图卷积模型的交通预测方法
CN112214677B (zh) * 2020-10-19 2023-10-27 腾讯科技(深圳)有限公司 一种兴趣点推荐方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544503A (zh) * 2013-11-14 2014-01-29 中国科学院自动化研究所 一种基于多实例马尔科夫模型的行为识别方法
CN103605729A (zh) * 2013-11-19 2014-02-26 段炼 一种基于局部随机词汇密度模型poi中文文本分类的方法
CN106650756A (zh) * 2016-12-28 2017-05-10 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于知识迁移的多模态循环神经网络的图像文本描述方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308444A (zh) * 2018-07-16 2019-02-05 重庆大学 一种室内环境下的异常行为识别方法
CN109189936B (zh) * 2018-08-13 2021-07-27 天津科技大学 一种基于网络结构和语义相关性度量的标签语义学习方法
CN109409384A (zh) * 2018-09-30 2019-03-01 内蒙古科技大学 基于细粒度图像的图像识别方法、装置、介质及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544503A (zh) * 2013-11-14 2014-01-29 中国科学院自动化研究所 一种基于多实例马尔科夫模型的行为识别方法
CN103605729A (zh) * 2013-11-19 2014-02-26 段炼 一种基于局部随机词汇密度模型poi中文文本分类的方法
CN106650756A (zh) * 2016-12-28 2017-05-10 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于知识迁移的多模态循环神经网络的图像文本描述方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"基于遗传算法与蚁群算法的多POI推荐";邢东旭;《中国优秀硕士学位论文全文数据库 信息科技辑》;20181115;全文 *
"空间信息异构网中POI推荐的研究";赵莹;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180915;全文 *

Also Published As

Publication number Publication date
CN109948066A (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN109948066B (zh) 一种基于异构信息网络的兴趣点推荐方法
CN108460101B (zh) 面向位置社交网络基于地理位置正则化的兴趣点推荐方法
Zhao et al. Personalized recommendations of locally interesting venues to tourists via cross-region community matching
CN109241454B (zh) 一种将社交网络和图像内容融合的兴趣点推荐方法
Cai et al. Integrating spatial and temporal contexts into a factorization model for POI recommendation
CN105740401B (zh) 一种基于个体行为和群体兴趣的兴趣地点推荐方法及装置
CN108829761B (zh) 一种兴趣点推荐方法、系统、介质及设备
CN112084427A (zh) 一种基于图神经网络的兴趣点推荐方法
Luan et al. MPTR: A maximal-marginal-relevance-based personalized trip recommendation method
CN104281882A (zh) 基于用户特征的预测社交网络信息流行度的方法及系统
CN110874437B (zh) 一种基于多重兴趣点对排序的个性化兴趣点推荐方法
Li et al. Location inference for non-geotagged tweets in user timelines
CN108804551A (zh) 一种兼顾多样性与个性化的空间兴趣点推荐方法
CN108280121B (zh) 一种基于k-核分解获取社交网络意见领袖的方法
CN111680228B (zh) 基于地理位置融合和类别流行度的兴趣点推荐方法
CN113139140B (zh) 基于时空感知gru并结合用户关系偏好的旅游景点推荐方法
Chen et al. Next POI recommendation based on location interest mining with recurrent neural networks
CN115270007B (zh) 一种基于混合图神经网络的poi推荐方法及系统
Xin et al. A location-context awareness mobile services collaborative recommendation algorithm based on user behavior prediction
CN109116299A (zh) 一种指纹定位方法、终端、计算机可读存储介质
Zhao et al. Annotating points of interest with geo-tagged tweets
US20170236226A1 (en) Computerized systems, processes, and user interfaces for globalized score for a set of real-estate assets
Sivaramakrishnan et al. An effective user clustering-based collaborative filtering recommender system with grey wolf optimisation
CN107145541A (zh) 基于超图结构的社交网络推荐模型构建方法
Yu et al. Point-of-interest recommendation based on user contextual behavior semantics

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant