CN109492166B - 基于签到时间间隔模式的连续兴趣点推荐方法 - Google Patents

基于签到时间间隔模式的连续兴趣点推荐方法 Download PDF

Info

Publication number
CN109492166B
CN109492166B CN201810882125.XA CN201810882125A CN109492166B CN 109492166 B CN109492166 B CN 109492166B CN 201810882125 A CN201810882125 A CN 201810882125A CN 109492166 B CN109492166 B CN 109492166B
Authority
CN
China
Prior art keywords
interest
point
user
time interval
check
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810882125.XA
Other languages
English (en)
Other versions
CN109492166A (zh
Inventor
礼欣
江明明
石雨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201810882125.XA priority Critical patent/CN109492166B/zh
Publication of CN109492166A publication Critical patent/CN109492166A/zh
Application granted granted Critical
Publication of CN109492166B publication Critical patent/CN109492166B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及一种基于签到时间间隔模式的连续兴趣点推荐方法,属于推荐系统领域;根据每个用户的签到数据,综合个性化偏好、地理距离偏好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合偏好,采用三阶张量模型来对连续签到行为进行建模;并构建一个概率模型,通过将签到时间间隔偏好视为潜在变量,来学习用户对兴趣点的综合偏好程度;在参数学习阶段,设计了期望最大化算法来优化概率模型的参数,最终实现了为用户推荐接下来要访问的兴趣点的任务;张量及矩阵中信息缺失的补充,采用张量/矩阵分解算法实现。对比现有技术,本发明方法有效解决了用户‑兴趣点签到矩阵的稀疏性问题,为用户提供准确高效的连续兴趣点推荐服务。

Description

基于签到时间间隔模式的连续兴趣点推荐方法
技术领域
本发明涉及一种连续兴趣点推荐方法,具体涉及一种基于签到时间间隔模 式的连续兴趣点推荐方法,属于推荐系统领域。
背景技术
近年来,基于位置的社交网络(Location-based Social Networks,LBSNs), 如Foursquare、Gowalla、GeoLife等,得到了快速的发展,使得用户可以在线分 享他们的签到体验。兴趣点推荐变得更加重要和实用,其不仅可以帮助用户发 现喜爱的兴趣点,而且有利于企业获得更多的目标客户。目前,已经有很多研 究机构开展了对兴趣点推荐任务的研究。然而,由于每个用户的签到数据是高 度稀疏的,实现准确的兴趣点推荐任务是具有挑战性的。当前的研究工作将所 有签到数据作为一个整体来考虑,用户签到行为的序列性信息通常被忽视。用 户签到行为的序列性对于兴趣点推荐是至关重要的,因为人们的移动方式往往 呈现出序列性的模式,在构建兴趣点推荐模型的时候应该根据用户的当前位置 进行推荐。因此,很多研究人员开展了对连续兴趣点推荐任务的研究。
本发明的连续兴趣点推荐旨在预测用户接下来要访问的兴趣点,当前的研 究工作通过融合位置社交网络中的各种情景信息,特别是时间效应,来建模用 户对兴趣点的偏好。目前,存在很多工作研究了时间效应对连续兴趣点推荐产 生的影响。一种方法是简单地探索人类移动模式的时间周期性,其依据的是人 们往往在同一时间段周期性访问某些类型的兴趣点,例如早晨上班去办公室, 晚上下班回家。另一种方法是考虑连续签到的时间属性,并利用个性化马尔科 夫链分解模型和个性化排序度量嵌入算法来实现连续兴趣点推荐。特别地,最 近的研究工作建模了用户随着时间推移的兴趣偏好,并在特定时间段内进行兴 趣点推荐,该方法可以通过枚举所有可能的时间间隔来估计用户签到的具体时间。
此外,当前的研究工作主要利用签到的时间戳(绝对时间),例如星期一上 午或星期六晚上9点,来提升推荐系统的系统。然而,这种将用户行为模式统 一建模的方式,隐含地假设了所有的签到行为都遵循相同的模式。事实上,不 同职业的用户有着不同的办公时间,其相应的行为模式也是不同的,但是当前 的研究工作并没有考虑到用户行为模式的多样性。因此,连续签到之间的时间 间隔反映出了,人们在时间上的行为模式有着更多的灵活性,而且用户的签到 行为存在着多个签到时间间隔模式,这种签到时间间隔模式对连续兴趣点推荐 有着重要影响。
发明内容
本发明的目的在于提供一种基于签到时间间隔模式的连续兴趣点推荐方法, 该方法通过建模用户在签到时间间隔模式影响下的行为模式,并计算用户在兴 趣点之间的转移概率,根据转移概率为用户推荐接下来要访问的兴趣点集合, 向用户提供准确高效的连续兴趣点推荐服务。
本发明的思想是根据每个用户的签到数据,综合个性化偏好、地理距离偏 好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合 偏好,设计过程中采用三阶张量模型来对连续签到行为进行建模。并构建一个 概率模型,通过将签到时间间隔偏好视为潜在变量,来学习用户对兴趣点的综 合偏好程度。在参数学习阶段,我们设计了期望最大化算法(Expectation Maximization,EM)来优化概率模型的参数,最终实现了为用户推荐接下来要 访问的兴趣点的任务。张量及矩阵中信息缺失的补充,通常采用张量/矩阵分解 算法实现。
本发明的目的是通过以下技术方案实现的:
一种基于签到时间间隔模式的连续兴趣点推荐方法,包括以下步骤:
每一个用户的原始数据如下所示:
Figure BDA0001754688840000031
其中,每行代表一个用户,i=1,2,…,n,共n个用户;每列代表一个 时间点,t=1,2,…,T,T为总时间,元素值lij为用户ui在时间点tj时所在 的兴趣点;
步骤一、计算用户转移频率矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户从兴趣点li转移 到兴趣点lj的频率,得到每个用户的转移频率矩阵Mfreq
Figure BDA0001754688840000032
其中,转移频率freqij的值按下述方式设置:在时间段T内若存在从兴趣点 li转移到兴趣点lj的情况,其值为频率;若在时间段T内不存在从兴趣点li转移 到兴趣点lj的情况,其值为0;其中,i,j=1,2,…,m,共m个兴趣点;
步骤二、整合多个用户的地点转移数据为频率张量χ
根据每个用户的频率矩阵Mfreq,将所有用户的频率矩阵组合起来,整合成 转移频率张量χ,其由I,J,U三个维度构成,U表示用户维度;I表示当前 兴趣点维度;J表示下一个兴趣点维度;如图1所示,其中,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量χ中的非零元 素值
Figure BDA0001754688840000041
为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点 lj的转移频率,k=1,2,…,n;
步骤三、计算用户签到时间间隔矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户位于所有的兴趣 点的签到时间间隔,得到该用户从兴趣点li转移到兴趣点lj的签到时间间隔, 所有兴趣点的签到时间间隔组合起来构成用户签到时间间隔矩阵Mspan
Figure BDA0001754688840000042
其中,时间间隔Sij的值描述如下:在时间段T内若存在从兴趣点li转移到 兴趣点lj的情况,则其值为平均时间间隔;在时间段T内若不存在从兴趣点li转移到兴趣点lj的情况,则其值为0;其中i,j=1,2,…,m,共m个兴趣点;
步骤四、整合多个用户的签到时间间隔数据形成张量Z
根据每个用户的签到时间间隔矩阵Mspan,将所有用户的签到时间间隔矩阵 组合起来,整合成签到时间间隔张量Z,其由I,J,U三个维度构成,如图2 所示,其中,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u 2,…,u n,共 n个用户;张量Z中的非零元素值
Figure BDA0001754688840000043
为某个用户uk在整个时间段T内从当前 兴趣点li转移到下一个兴趣点lj的签到时间间隔,k=1,2,…,n;
步骤五、对用户个性化偏好进行建模
1)获取缺失的用户个性化偏好:
对转移频率张量χ使用成对交互张量分解(Pairwise Interaction TensorFactorization,PITF)算法进行分解,得到的分解向量,包括:
Figure BDA0001754688840000051
表示用户-下一个兴趣点关系矩阵中用户的潜在因素向量;
Figure BDA0001754688840000052
表示用 户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure BDA0001754688840000053
表示当前兴趣 点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;
Figure BDA0001754688840000054
表示当前兴趣点 -下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure BDA0001754688840000055
表示用户-当前 兴趣点关系矩阵中用户的潜在因素向量;
Figure BDA0001754688840000056
表示用户-当前兴趣点关系矩阵中 当前兴趣点的潜在因素向量;u表示当前用户;i表示当前兴趣点;j表示下一 个兴趣点;
将分解得到的向量按照成对交互张量分解(Pairwise Interaction TensorFactorization,PITF)算法进行重组,从而得到包括缺失数据在内的所有用户在 各个地点的个性化转移频率估计值
Figure BDA0001754688840000057
Figure BDA0001754688840000058
2)获取缺失的地理距离偏好:
地理距离偏好sp(di,j)表示用户在访问当前兴趣点i之后,接下来去访问相 距di,j千米的兴趣点j的地理距离偏好,表示如下:
Figure BDA0001754688840000059
其中,ρ为参数,其最优值将在步骤七确定;di,j表示从当前兴趣点i到 下一兴趣点j的地理距离;
Figure BDA00017546888400000510
为di,j的倒数;
3)获取缺失的时间间隔偏好:
对时间间隔张量Z使用PITF算法进行分解,得到的分解向量,包括:
Figure BDA00017546888400000511
用户-下一个兴趣点关系矩阵中用户的潜在因素向量;
Figure BDA00017546888400000512
用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure BDA00017546888400000513
当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;
Figure BDA00017546888400000514
当前兴趣点-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure BDA00017546888400000515
用户-当前兴趣点关系矩阵中用户的潜在因素向量;
Figure BDA00017546888400000516
用户-当前兴趣点关系矩阵中当前兴趣点的潜在因素向量;
将分解得到的向量按照PITF算法进行重组,从而得到包括缺失数据在内 的所有用户的时间间隔估计值
Figure BDA0001754688840000061
Figure BDA0001754688840000062
步骤六、基于以上步骤所得结果,按以下线性组合的方式,获得一个考虑 综合信息的连续兴趣点推荐模型
Figure BDA0001754688840000063
Figure BDA0001754688840000064
其中,
Figure BDA0001754688840000065
表示个性化偏好;
Figure BDA0001754688840000066
表示地理距离偏好;
Figure BDA0001754688840000067
表示时 间间隔偏好;ε为高斯噪声变量,表示用户在移动过程中的非偏好性随机影响, 如天气影响、社交关系影响等;参数w和ρ的最优值将在后续参数学习阶段 确定;
步骤七、利用期望最大化算法迭代求解最优参数w和ρ;
步骤八、通过将步骤七中求解的最优参数w和ρ代入步骤六公式计算用 户对每一个兴趣点的转移概率值,即得到
Figure BDA0001754688840000068
步骤九、根据步骤八中计算得到的转移概率值对兴趣点进行排序,并将排 在前N位的兴趣点推荐给用户。
作为优选,为提高效率,所述步骤五1)中,对于用户个性化偏好,将因式 项
Figure BDA0001754688840000069
移除,因为其与下一个兴趣点j无关,且不影响转移概率的排名; 此时转移概率估计值
Figure BDA00017546888400000610
表示为:
Figure BDA00017546888400000611
作为优选,为提高效率,所述步骤五3)中,对于时间间隔偏好,将因式项
Figure BDA00017546888400000612
移除,因为其与下一个兴趣点j无关,且不影响转移概率的排名;此时 时间间隔的估计值
Figure BDA00017546888400000613
可以表示为:
Figure BDA00017546888400000614
作为优选,通过本方法可以进一步得到每一个兴趣点的不确定性程度为
Figure BDA00017546888400000615
其中
Figure BDA00017546888400000616
表示潜在转移时间间隔偏好zu,i,j的方差,
Figure BDA00017546888400000617
表示用户u 在访问兴趣点i之后转移到兴趣点j的潜在转移时间间隔偏好,潜在转移时间间 隔偏好
Figure BDA00017546888400000618
与估计的时间间隔
Figure BDA00017546888400000619
成反比;
Figure BDA00017546888400000620
表示高斯噪声变量ε的方差。
有益效果:
本发明针对位置社交网络中的连续兴趣点推荐问题,基于签到时间间隔模 式,提出了一种新的连续兴趣点推荐方法,有效解决了用户-兴趣点签到矩阵的 稀疏性问题;所提模型将时间间隔偏好视为潜在变量,设计了一个基于因子分 析的概率模型,并使用期望最大化算法(Expectation Maximization,EM)来优 化模型参数,为用户提供了准确高效的连续兴趣点推荐服务。
附图说明
图1为转移频率张量χ示意图;
图2为时间间隔张量Z示意图;
图3为本发明实施例签到时间间隔的统计分析;其中,(a)为用户偏好随 着签到时间间隔的变化示意图;(b)为签到时间间隔的累积分布函数示意图;
图4是本发明实施例中预测签到时间间隔的准确率随阈值T的变化情况示 意图;(a)为洛杉矶;(b)为纽约市;(c)为Gowalla;
图5为本发明实施例一种基于签到时间间隔模式的连续兴趣点推荐方法流 程示意图。
具体实施方式
下面结合附图与实施例对本发明进行详细介绍。
图3为Foursquare数据集中纽约市的签到数据,刻画了用户对兴趣点的偏 好程度(Probability)与时间间隔(Transition Interval(hr.))之间的关系。其中, 图3(a)显示了用户在签到工作场所(Work)之后,随着时间间隔的变化,访 问餐厅(Food)和夜店(Nightlife)的概率分布。我们发现,当时间间隔分别为 4小时,12小时和23小时的情况下,用户从工作场所转移到餐厅的概率取得极 大值。该观察结果说明了,人们通常在工作4小时之后吃午餐,工作12小时之 后吃晚餐,并在工作前1小时吃早餐。此外,用户在夜店签到的峰值发生在工 作之后的10个小时左右,这表明人们通常在工作10小时之后去夜店消费。总 而言之,每个用户的工作时间可能是不同的,但是日常活动之间的时间间隔却 遵循着相同的模式。图3(b)计算了在访问工作场所(Work)之后,接下来去 访问其他类型兴趣点的时间间隔的累积分布函数。其中的签到时间间隔模式是 显而易见的,例如,对于室外活动类兴趣点(Outdoor)对应的曲线,其斜率最 小,表明用户结束工作之后去室外活动类兴趣点(Outdoor)的时间间隔较短。
根据图3所观察到的现象,应用基于签到时间间隔模式的连续兴趣点推荐 算法为用户提供连续兴趣点推荐服务。
原始数据为用户在整个时间内的所有的兴趣点,因此需对其进行处理,以 挖掘出用户基于签到时间的兴趣点,如图5所示,具体步骤如下:
一、签到数据就是用户u从当前兴趣点i移动到下一个兴趣点j的转移频率, 可以把用户、当前兴趣点和下一个兴趣点看作是张量
Figure BDA0001754688840000081
的三个维 度,即张量中的非零元素
Figure BDA0001754688840000082
表示观测到的转移频率,其中U表示位置社交 网络中的一组用户,L表示位置社交网络中的一组兴趣点。
对于转移频率张量χ中的缺失值,先用0填充,对于这些为0的元素,可通 过后续步骤中PITF分解算法将缺失值进行填充,用于最终的预测。
二、利用用户u连续访问的兴趣点之间的时间间隔,构造当前兴趣点-下一个 兴趣点的签到时间间隔矩阵
Figure BDA0001754688840000083
所有用户的签到数据构成了签到时间间隔张量
Figure BDA0001754688840000084
其中张量中的每个元素
Figure BDA0001754688840000085
表示用户u从兴趣点i移动到 兴趣点j的时间间隔的估计值,非零元素为观测到的时间间隔。
对于时间间隔张量Z中的缺失值,先用0填充,对于这些为0的元素,可通 过后续步骤中PITF算法将缺失值进行填充,用于最终的预测;
三、对用户偏好进行建模,其中用户偏好包括个性化偏好、地理距离偏好和 时间间隔偏好。
1)对于个性化偏好,由于只能观测到转移张量
Figure BDA0001754688840000086
中的部分转移频率,因此, 可以利用类似于矩阵分解中的低秩近似技术,将那些未观测到的转移项进行填 充,从而发现用户对所有兴趣点的个性化偏好。对于三阶张量
Figure BDA0001754688840000087
的近似可以采 用成对交互张量分解(Pairwise Interaction Tensor Factorization,PITF)算法,其 中PITF分解方法只考虑张量三个维度(即用户U,当前兴趣点I,下一个兴趣 点J)的两两之间的交互,得到步骤五(1)的转移频率的估计值
Figure BDA0001754688840000091
2)对于地理距离偏好,根据用户的移动模式受地理距离的限制,人们接下 来要访问的兴趣点往往是在一天之内可以到达的地方,并且随着地理距离的增 加,用户对该兴趣点的偏好程度会减少。因此,在连续兴趣点推荐方法中融合 地理距离偏好可以提升推荐性能。地理距离偏好
Figure BDA0001754688840000092
表示用户在访问当前兴 趣点i之后,接下来去访问相距
Figure BDA0001754688840000093
千米的兴趣点j的地理距离偏好。
3)对于时间间隔偏好,为了建模用户u对接来下要访问的兴趣点的签到时 间间隔偏好,首先定义签到时间间隔张量Z。利用用户u连续访问的兴趣点之间 的时间间隔,构造当前兴趣点-下一个兴趣点的签到时间间隔矩阵
Figure BDA0001754688840000094
所有用户 的签到数据构成了签到时间间隔张量
Figure BDA0001754688840000095
其中张量中的每个元素
Figure BDA0001754688840000096
表示用户u从兴趣点i移动到兴趣点j所用时间间隔的估计值。与
Figure BDA0001754688840000097
类 似,
Figure BDA0001754688840000098
可以通过对签到时间间隔张量三个维度(即用户U,当前兴趣点点I, 下一个兴趣点J)两两之间的交互进行建模,得到步骤五(3)的时间间隔的估 计值
Figure BDA0001754688840000099
定义
Figure BDA00017546888400000910
表示用户u在访问兴趣点i之后转移到兴趣点j的潜在转 移时间间隔偏好,由于用户在兴趣点之间的转移次数随着时间间隔的增加而减 少,故潜在转移时间间隔偏好
Figure BDA00017546888400000911
与估计的时间间隔
Figure BDA00017546888400000912
成反比。由于转移时间 间隔的不确定性,假设潜在变量
Figure BDA00017546888400000913
服从期望为
Figure BDA00017546888400000914
和方差为
Figure BDA00017546888400000915
的高斯分布, 其中,
Figure BDA00017546888400000916
Figure BDA00017546888400000917
的倒数,表示如下:
Figure BDA00017546888400000918
四、模型的参数集合是
Figure BDA00017546888400000919
假设噪声变量ε服从期望为0和方差为
Figure RE-GDA00019511190700001011
高斯分布,即
Figure RE-GDA0001951119070000101
给定zu,i,j时xu,i,j的概率分布如下所示:
Figure BDA0001754688840000104
确定了观测变量
Figure BDA0001754688840000105
的条件概率分布之后,观测变量
Figure BDA0001754688840000106
的边际分布可以通过将潜在变量边缘化得来,且同样是高斯分布,表示如下:
Figure BDA0001754688840000107
在给定观测变量
Figure BDA0001754688840000108
的情况下,潜在变量
Figure BDA0001754688840000109
的条件分布可以使用贝叶斯分 析计算得来,且也服从高斯分布:
Figure BDA00017546888400001010
其中后验均值和后验方差分别为
Figure BDA00017546888400001011
Figure BDA00017546888400001012
五、将潜在变量
Figure BDA00017546888400001013
视为缺失数据,那么完整数据包括观测变量
Figure BDA00017546888400001014
与相应 的潜在变量
Figure BDA00017546888400001015
假设用户之间是相互独立的,用户的每次签到行为之间也是相 互独立,那么完整数据的对数似然函数可以由下式表示:
Figure BDA00017546888400001016
其中,
Figure BDA00017546888400001017
Figure BDA00017546888400001018
用户u在时间t之前签到的兴趣点集合由
Figure BDA00017546888400001019
来表示,即
Figure BDA00017546888400001020
其 中G表示用户u在时间t之前签到的兴趣点的数量,exp{·}表示指数函数。
模型参数集合Θ的估计可以通过迭代的方式将LC最大化得来,典型的优化 方法是使用期望最大化算法。期望最大化算法在E步和M步这两个步骤之间进 行迭代,直至参数收敛,并且保证将似然函数优化到局部最大值。在E步中, 根据潜在变量
Figure BDA0001754688840000111
的后验分布,计算出LC的期望值,在M步中,通过最大化对 数似然函数的期望来得到更新后参数Θ'。
六、连续兴趣点推荐的转移概率可以通过观测变量
Figure BDA0001754688840000112
求得。当所有参数求 得最优值后,进行连续兴趣点推荐只是通过简单的计算即可完成。此时,不仅 可以求得转移概率,而且还可以求得推荐的不确定性程度,即用户u从兴趣点i 到兴趣点j的转移概率为
Figure BDA0001754688840000113
其不确定性程度为
Figure BDA0001754688840000114
七、根据计算得到的转移概率值对兴趣点进行排序,并将排在前N位的兴 趣点推荐给用户。
评价指标:
下面对本发明连续兴趣点推荐性能和签到时间间隔的性能进行评价。通过定 义准确率来评估连续兴趣点推荐和连续新兴趣点推荐的性能:
Figure BDA0001754688840000115
Figure BDA0001754688840000116
其中
Figure BDA0001754688840000117
表示用户u访问过的兴趣点集合,
Figure BDA0001754688840000118
表示在训练集中未出 现,而只在测试集中出现的兴趣点的集合,|U|表示用户的数量,N表示候选兴 趣点的数量。将所有兴趣点按照对应的转移概率降序排列,将排名在前N位的 兴趣点组成候选集合
Figure BDA0001754688840000121
推荐给用户u。
预测签到时间间隔是一个较新的研究课题,使用以下两个指标来评估本发明 预测时间间隔的能力。
第一个评价指标是平均绝对百分比误差,其关注所有签到数据中预测时间间 隔
Figure BDA0001754688840000122
与实际时间间隔
Figure BDA0001754688840000123
之间的差值:
Figure BDA0001754688840000124
其中
Figure BDA0001754688840000125
表测试集中签到的数量,
Figure BDA0001754688840000126
表示数据集中用户u从地点i到地点j 的实际时间间隔。测试集的MAPE值可以通过计算求得,当MAPE值越小时, 签到时间间隔的预测性能越好。
MAPE可能会被个别较大的误差值所影响,因此对连续兴趣点推荐任务进行 个性化的评估。为此,第二个评价指标是评估每次时间间隔的准确性,给定为:
Figure BDA0001754688840000127
如果:
Figure RE-GDA0001823520540000124
Figure RE-GDA0001823520540000125
之差小于预定的阈值T,即
Figure RE-GDA0001823520540000126
,那么ST,u等于1, 否则等于0。
数据集:
从位置社交网络Foursquare和Gowalla中选取了三个大规模数据集进行实验。 其中,Foursquare的签到数据来自于洛杉矶和纽约市,Gowalla的数据集具有签 到数据的完整快照。我们将数据集分为两个不重叠的集合:对于每个用户,根 据签到时间的先后将签到数据分为两个部分,早期80%的签到数据作为训练集, 剩下的20%作为测试集。三个数据集的统计信息如表1所示。
表1实验数据的基本统计
Figure BDA00017546888400001210
Figure BDA0001754688840000131
实验结果:
在本发明中,同时完成了连续兴趣点推荐和签到时间间隔预测,因此,本实 验将分为两个部分,第一个部分是连续兴趣点推荐的实验结果和分析,第二部 分是签到时间间隔预测的实验结果和分析。
在连续兴趣点推荐任务中,我们将本发明(Ours)与以下算法进行对比:
(1)矩阵分解算法(MF):矩阵分解算法是将用户-项目评分矩阵进 行分解,已经被广泛应用于传统的推荐系统之中。
(2)概率矩阵分解算法(PMF):该算法假设预测评分与真实评分之 间存在高斯噪声,并假设用户特征矩阵和项目特征矩阵都服从 均值为0的高斯分布。
(3)基于局部区域的个性化马尔科夫链分解模型(FPMC-LR):此算 法采用FPMC对连续兴趣点推荐进行建模,并融入地理距离的 约束。
(4)融合地理影响的个性化排序度量嵌入算法(PRME-G):此算法 通过在PRME算法中融入地理距离影响来提升连续兴趣点推荐 的准确率。
(5)基于潜在行为模式的连续兴趣点推荐模型(LBP):此算法为在 用户潜在行为模式影响下的连续兴趣点推荐模型,该算法采用 张量模型来建模连续签到行为。
表1、表2和表3列出了连续兴趣点推荐的实验结果,表4、表5和表6列 出了连续新兴趣点推荐的实验结果。我们利用训练集优化模型参数,并将参数 的最优值用于测试集。实验结果如下:
(1)本发明和FPMC-LR,PRME-G,LBP都显著优于MF和PMF,这 表明地理距离影响在连续兴趣点推荐任务中起着重要作用。此 外,本发明始终优于FPMC-LR,PRME-G和LBP,这表明通过融 合签到时间间隔模式可以更好地建模用户的行为规律和兴趣偏 好。
(2)与其他推荐算法相比,本发明在新兴趣点推荐方面有着明显的 优势,这表明签到时间间隔模式对于新兴趣点的推荐有着重要 作用。由于个性化偏好
Figure BDA0001754688840000141
只是建模了在训练集中观测到的用 户转移,用户仅在测试集中访问的兴趣点是无法通过个性化偏 好建模的
Figure BDA0001754688840000142
因此,对于连续新兴趣点推荐任务,签 到时间间隔偏好w·zu,i,j导致了推荐性能的提升(FPMC-LR, PRME-G和LBP都采用了与本章模型类似的方法来建模地理距离 偏好)。
在签到时间间隔预测任务中,本发明与以下算法进行对比:
(1)矩阵分解算法(MF):矩阵分解算法将用户-签到时间间隔矩阵 进行分解。
(2)概率矩阵分解算法(PMF):该算法常用的推荐算法,并将用户 -签到时间间隔矩阵进行分解。
(3)个性化马尔科夫链分解模型(FPMC):此算法是由BPR优化的 先进的个性化推荐算法,该算法融合了用户偏好和个性化马尔 科夫链来预测时间间隔。
本发明在进行连续兴趣点推荐的同时,可以完成转移时间间隔的预测,而其 他模型(MF,PMF,FPMC)则只能实现兴趣点推荐。为了进行对比,我们将 用户-转移时间间隔矩阵进行矩阵分解,以此来预测转移时间间隔。也就是说, 我们分别将用户-签到矩阵和用户-转移时间间隔矩阵进行矩阵分解,然后对齐实 验结果来实现连续兴趣点推荐和签到时间间隔预测。图4和表1到表7显示了 所有算法预测签到时间间隔的能力。我们观察到:
(1)表1到表6表明,与其他算法相比,本发明总是实现了最高的 准确率,这说明所提模型不仅能够为用户提供连续兴趣点推荐, 还可以预测签到时间间隔。
(2)我们计算了预测时间间隔与实际时间间隔之间的MAPE(如表7 所示),MAPE的值越低代表模型的预测性能越好。显然,本发 明明显优于其他推荐算法。
(3)图4展示了各个模型在设定不同阈值T时的预测性能,其中, 图4(a)为洛杉矶数据集的实验结果,图4(b)为纽约市数据 集的实验结果,图4(c)为Gowalla数据集的实验结果,从中 可以发现本发明优于其他基准算法。
表2各方法在Foursquare-LA数据集上连续兴趣点推荐的准确率
评价指标 MF PMF FPMC-LR PRME-G LBP Ours
P@1 0.021 0.024 0.031 0.032 0.043 0.044
P@5 0.065 0.072 0.089 0.098 0.121 0.129
P@10 0.091 0.094 0.119 0.112 0.163 0.172
P@20 0.11 0.118 0.131 0.135 0.202 0.218
表3各方法在Foursquare-NYC数据集上连续兴趣点推荐的准确率
评价指标 MF PMF FPMC-LR PRME-G LBP Ours
P@1 0.019 0.023 0.030 0.031 0.043 0.044
P@5 0.058 0.071 0.087 0.096 0.122 0.127
P@10 0.092 0.092 0.116 0.111 0.161 0.169
P@20 0.109 0.121 0.128 0.132 0.201 0.212
表4各方法在Gowalla数据集上连续兴趣点推荐的准确率
评价指标 MF PMF FPMC-LR PRME-G LBP Ours
P@1 0.022 0.024 0.029 0.038 0.039 0.041
P@5 0.085 0.092 0.116 0.143 0.168 0.181
P@10 0.145 0.157 0.196 0.194 0.245 0.292
P@20 0.186 0.203 0.249 0.245 0.316 0.379
表5各方法在Foursquare-LA数据集上连续新兴趣点推荐的准确率
评价指标 MF PMF FPMC-LR PRME-G LBP Ours
P@1 0.01 0.011 0.026 0.031 0.032 0.036
P@5 0.039 0.042 0.091 0.112 0.129 0.141
P@10 0.065 0.069 0.122 0.138 0.181 0.201
P@20 0.106 0.111 0.151 0.172 0.218 0.242
表6各方法在Foursquare-NYC数据集上连续新兴趣点推荐的准确率
评价指标 MF PMF FPMC-LR PRME-G LBP Ours
P@1 0.012 0.013 0.025 0.029 0.033 0.036
P@5 0.037 0.041 0.089 0.109 0.128 0.142
P@10 0.067 0.071 0.119 0.134 0.182 0.202
P@20 0.104 0.112 0.152 0.169 0.216 0.245
表7各方法在Gowalla数据集上连续新兴趣点推荐的准确率
评价指标 MF PMF FPMC-LR PRME-G LBP Ours
P@1 0.006 0.007 0.013 0.015 0.017 0.021
P@5 0.032 0.034 0.174 0.198 0.204 0.265
P@10 0.057 0.066 0.237 0.276 0.298 0.358
P@20 0.106 0.114 0.316 0.342 0.386 0.451
表8各方法的MAPE值
数据集 MF PMF FPMC Ours
洛杉矶 13.79 11.45 5.68 1.75
纽约市 14.87 12.64 6.72 1.84
Gowalla 16.95 14.12 7.89 2.15
综上所述,本发明所提出的基于签到时间间隔模式的连续兴趣点推荐方法在 连续兴趣点推荐和签到时间间隔预测两个方面都优于其他对比算法,从而证明 了本发明方法的有效性,能够应用到连续兴趣点推荐任务并提供有效的兴趣点 推荐。
为了说明本发明的内容及实施方法,本说明书给出了一个具体实施例。在实 施例中引入细节的目的不是限制权利要求书的范围,而是帮助理解本发明所述 方法。本领域的技术人员应理解:在不脱离本发明及其所附权利要求的精神和 范围内,对最佳实施例步骤的各种修改、变化或替换都是可能的。因此,本发 明不应局限于最佳实施例及附图所公开的内容。

Claims (4)

1.一种基于签到时间间隔模式的连续兴趣点推荐方法,其特征在于:包括以下步骤:
步骤一、计算用户转移频率矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户从兴趣点li转移到兴趣点lj的频率,得到每个用户的转移频率矩阵Mfreq
Figure FDA0003159576440000011
其中,转移频率freqij的值按下述方式设置:在时间段T内存在从兴趣点li转移到兴趣点lj的情况,其值为频率;在时间段T内不存在从兴趣点li转移到兴趣点lj的情况,其值为0;其中,i,j=1,2,…,m,共m个兴趣点;
步骤二、整合多个用户的地点转移数据为频率张量χ
根据每个用户的频率矩阵Mfreq,将所有用户的频率矩阵组合起来,整合成转移频率张量χ,其由I,J,U三个维度构成,U表示用户维度;I表示当前兴趣点维度;J表示下一个兴趣点维度;I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量χ中的非零元素值
Figure FDA0003159576440000012
为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的转移频率,k=1,2,…,n;
步骤三、计算用户签到时间间隔矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户位于所有的兴趣点的签到时间间隔,得到该用户从兴趣点li转移到兴趣点lj的签到时间间隔,所有兴趣点的签到时间间隔组合起来构成矩阵Mspan
Figure FDA0003159576440000021
其中,时间间隔Sij的值描述如下:在时间段T内存在从兴趣点li转移到兴趣点lj的情况,其值为平均时间间隔;在时间段T内不存在从兴趣点li转移到兴趣点lj的情况,其值为0;其中i,j=1,2,…,m,共m个兴趣点;
步骤四、整合多个用户的签到时间间隔数据形成张量Z
根据每个用户的签到时间间隔矩阵Mspan,将所有用户的签到时间间隔矩阵组合起来,整合成签到时间间隔张量Z,其由I,J,U三个维度构成,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量Z中的非零元素值
Figure FDA0003159576440000022
为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的签到时间间隔,k=1,2,…,n;
步骤五、对用户个性化偏好进行建模
1)获取缺失的用户个性化偏好:
对转移频率张量χ使用成对交互张量分解PITF算法进行分解,得到的分解向量,包括:
Figure FDA0003159576440000023
表示用户-下一个兴趣点关系矩阵中用户的潜在因素向量;
Figure FDA0003159576440000024
表示用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure FDA0003159576440000025
表示当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;
Figure FDA0003159576440000026
表示当前兴趣点-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure FDA0003159576440000027
表示用户-当前兴趣点关系矩阵中用户的潜在因素向量;
Figure FDA0003159576440000028
表示用户-当前兴趣点关系矩阵中当前兴趣点的潜在因素向量;u表示当前用户;i表示当前兴趣点;j表示下一个兴趣点;
将分解得到的向量按照PITF算法进行重组,从而得到包括缺失数据在内的所有用户在各个地点的个性化转移频率估计值
Figure FDA0003159576440000031
Figure FDA0003159576440000032
2)获取缺失的地理距离偏好:
地理距离偏好sp(di,j)表示用户在访问当前兴趣点i之后,接下来去访问相距di,j千米的兴趣点j的地理距离偏好,表示如下:
Figure FDA0003159576440000033
其中,ρ为参数;di,j表示从当前兴趣点i到下一兴趣点j的地理距离;
Figure FDA0003159576440000034
为di,j的倒数;
3)获取缺失的时间间隔偏好:
对时间间隔张量Z使用PITF算法进行分解,得到的分解向量,包括:
Figure FDA0003159576440000035
用户-下一个兴趣点关系矩阵中用户的潜在因素向量;
Figure FDA0003159576440000036
用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure FDA0003159576440000037
当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;
Figure FDA0003159576440000038
当前兴趣点-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;
Figure FDA0003159576440000039
用户-当前兴趣点关系矩阵中用户的潜在因素向量;
Figure FDA00031595764400000310
用户-当前兴趣点关系矩阵中当前兴趣点的潜在因素向量;
将分解得到的向量按照PITF算法进行重组,从而得到包括缺失数据在内的所有用户的时间间隔估计值
Figure FDA00031595764400000311
Figure FDA00031595764400000312
步骤六、基于以上步骤所得结果,按以下线性组合的方式,获得一个考虑综合信息的连续兴趣点推荐模型
Figure FDA00031595764400000313
Figure FDA00031595764400000314
其中,
Figure FDA00031595764400000315
表示个性化偏好;
Figure FDA00031595764400000316
表示地理距离偏好;
Figure FDA00031595764400000317
表示时间间隔偏好;ε为高斯噪声变量,表示用户在移动过程中的非偏好性随机影响;参数w和ρ的最优值将在步骤七确定;
步骤七、利用期望最大化算法迭代求解最优参数w和ρ;
步骤八、通过将步骤七中求解的最优参数w和ρ代入步骤六公式计算用户对每一个兴趣点的转移概率值,即得到
Figure FDA00031595764400000318
步骤九、根据步骤八中计算得到的
Figure FDA0003159576440000041
对兴趣点进行排序,并将排在前N位的兴趣点推荐给用户。
2.根据权利要求1所述的一种基于签到时间间隔模式的连续兴趣点推荐方法,其特征在于:为提高效率,所述步骤五1)中,对于用户个性化偏好,将因式项
Figure FDA0003159576440000042
移除,因为其与下一个兴趣点j无关,且不影响转移概率的排名;此时转移概率估计值
Figure FDA0003159576440000043
表示为:
Figure FDA0003159576440000044
3.根据权利要求1所述的一种基于签到时间间隔模式的连续兴趣点推荐方法,其特征在于:为提高效率,所述步骤五3)中,对于时间间隔偏好,将因式项
Figure FDA0003159576440000045
移除,因为其与下一个兴趣点j无关,且不影响转移概率的排名;此时时间间隔的估计值
Figure FDA0003159576440000046
可以表示为:
Figure FDA0003159576440000047
4.根据权利要求1-3任一所述的一种基于签到时间间隔模式的连续兴趣点推荐方法,其特征在于:所述兴趣点的不确定性程度为
Figure FDA0003159576440000048
其中
Figure FDA0003159576440000049
表示潜在转移时间间隔偏好zu,i,j的方差,zu,i,j表示用户u在访问兴趣点i之后转移到兴趣点j的潜在转移时间间隔偏好,潜在转移时间间隔偏好zu,i,j与估计的时间间隔
Figure FDA00031595764400000410
成反比;
Figure FDA00031595764400000411
表示高斯噪声变量ε的方差。
CN201810882125.XA 2018-08-06 2018-08-06 基于签到时间间隔模式的连续兴趣点推荐方法 Active CN109492166B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810882125.XA CN109492166B (zh) 2018-08-06 2018-08-06 基于签到时间间隔模式的连续兴趣点推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810882125.XA CN109492166B (zh) 2018-08-06 2018-08-06 基于签到时间间隔模式的连续兴趣点推荐方法

Publications (2)

Publication Number Publication Date
CN109492166A CN109492166A (zh) 2019-03-19
CN109492166B true CN109492166B (zh) 2022-03-29

Family

ID=65689187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810882125.XA Active CN109492166B (zh) 2018-08-06 2018-08-06 基于签到时间间隔模式的连续兴趣点推荐方法

Country Status (1)

Country Link
CN (1) CN109492166B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020228B (zh) * 2019-04-08 2021-04-13 浙江大学城市学院 一种用于物联网物品信息搜索排序的相关性评估方法
CN110298687B (zh) * 2019-05-23 2021-04-16 香港理工大学深圳研究院 一种区域吸引力评估方法及设备
CN110222278B (zh) * 2019-06-18 2022-05-17 东北大学 综合因素下用户位置的获取方法
CN110399565B (zh) * 2019-07-29 2021-08-06 北京理工大学 基于时空周期注意力机制的递归神经网络兴趣点推荐方法
CN110874437B (zh) * 2019-11-14 2023-06-16 重庆邮电大学 一种基于多重兴趣点对排序的个性化兴趣点推荐方法
CN111949865A (zh) * 2020-08-10 2020-11-17 杭州电子科技大学 基于图神经网络与用户长短期偏好的兴趣点推荐方法
CN112148822B (zh) * 2020-08-28 2024-04-19 中国地质大学(武汉) 一种细粒度属性加权方法及系统
CN112487307B (zh) * 2020-12-10 2022-06-14 武汉大学 一种时间感知的poi推荐方法
CN112784177B (zh) * 2021-01-18 2022-04-15 杭州电子科技大学 一种空间距离自适应的下一个兴趣点推荐方法
CN114048391B (zh) * 2022-01-13 2022-04-19 中国测绘科学研究院 一种基于地理格网的兴趣活动推荐方法
CN114880550A (zh) * 2022-04-02 2022-08-09 哈尔滨工程大学 一种融合多方面时域信息的序列推荐方法、设备和介质
CN117633371B (zh) * 2024-01-25 2024-04-12 云南大学 基于多注意力机制的推荐方法、设备和可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106960044A (zh) * 2017-03-30 2017-07-18 浙江鸿程计算机系统有限公司 一种基于张量分解及加权hits的时间感知个性化poi推荐方法
CN107657015A (zh) * 2017-09-26 2018-02-02 北京邮电大学 一种兴趣点推荐方法、装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720844B2 (en) * 2007-07-03 2010-05-18 Vulcan, Inc. Method and system for continuous, dynamic, adaptive searching based on a continuously evolving personal region of interest
US20130267255A1 (en) * 2011-10-21 2013-10-10 Alohar Mobile Inc. Identify points of interest using wireless access points

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106960044A (zh) * 2017-03-30 2017-07-18 浙江鸿程计算机系统有限公司 一种基于张量分解及加权hits的时间感知个性化poi推荐方法
CN107657015A (zh) * 2017-09-26 2018-02-02 北京邮电大学 一种兴趣点推荐方法、装置、电子设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Adapting to User Interest Drift for POI Recommendation;Hongzhi Yin et al.;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》;20161031;第28卷(第10期);2566-2581 *
基于LBSN签到数据的用户行为预测与兴趣点推荐;王凯慈;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170215(第2017年第02期);I138-4599 *

Also Published As

Publication number Publication date
CN109492166A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN109492166B (zh) 基于签到时间间隔模式的连续兴趣点推荐方法
Li et al. Community-based seeds selection algorithm for location aware influence maximization
Ying et al. Mining user check-in behavior with a random walk for urban point-of-interest recommendations
Gao et al. Exploring temporal effects for location recommendation on location-based social networks
CN109783738B (zh) 一种基于多相似度的双极限学习机混合协同过滤推荐方法
Li et al. Point-of-interest recommender systems: A separate-space perspective
Fu et al. User preference learning with multiple information fusion for restaurant recommendation
Zhang et al. Prediction uncertainty in collaborative filtering: Enhancing personalized online product ranking
D’Silva et al. Predicting the temporal activity patterns of new venues
CN109460520B (zh) 基于地理-社会关系与深隐式兴趣挖掘的兴趣点推荐方法
Shafiei-Monfared et al. A novel approach for complexity measure analysis in design projects
Mohammadi et al. Artificial intelligence-based solution to estimate the spatial accuracy of volunteered geographic data
Park et al. Variational Bayesian inference for forecasting hierarchical time series
He et al. Next point-of-interest recommendation via a category-aware Listwise Bayesian Personalized Ranking
Zhao et al. GT-SEER: geo-temporal sequential embedding rank for point-of-interest recommendation
CN109684561B (zh) 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
Wangkhamhan Adaptive chaotic satin bowerbird optimisation algorithm for numerical function optimisation
CN113239266B (zh) 基于局部矩阵分解的个性化推荐方法及系统
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
Satman et al. Selecting location of retail stores using artificial neural networks and google places api
Pan et al. A simultaneous variable selection methodology for linear mixed models
Cao et al. Efficient fine-grained location prediction based on user mobility pattern in lbsns
Mao et al. Utilizing multi-source data in popularity prediction for shop-type recommendation
US20190342698A1 (en) Method and System for Modeling User and Location
Makropoulos et al. A neurofuzzy spatial decision support system for pipe replacement prioritisation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant