CN109492166B - 基于签到时间间隔模式的连续兴趣点推荐方法 - Google Patents
基于签到时间间隔模式的连续兴趣点推荐方法 Download PDFInfo
- Publication number
- CN109492166B CN109492166B CN201810882125.XA CN201810882125A CN109492166B CN 109492166 B CN109492166 B CN 109492166B CN 201810882125 A CN201810882125 A CN 201810882125A CN 109492166 B CN109492166 B CN 109492166B
- Authority
- CN
- China
- Prior art keywords
- interest
- point
- user
- time interval
- check
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本发明涉及一种基于签到时间间隔模式的连续兴趣点推荐方法,属于推荐系统领域;根据每个用户的签到数据,综合个性化偏好、地理距离偏好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合偏好,采用三阶张量模型来对连续签到行为进行建模;并构建一个概率模型,通过将签到时间间隔偏好视为潜在变量,来学习用户对兴趣点的综合偏好程度;在参数学习阶段,设计了期望最大化算法来优化概率模型的参数,最终实现了为用户推荐接下来要访问的兴趣点的任务;张量及矩阵中信息缺失的补充,采用张量/矩阵分解算法实现。对比现有技术,本发明方法有效解决了用户‑兴趣点签到矩阵的稀疏性问题,为用户提供准确高效的连续兴趣点推荐服务。
Description
技术领域
本发明涉及一种连续兴趣点推荐方法,具体涉及一种基于签到时间间隔模 式的连续兴趣点推荐方法,属于推荐系统领域。
背景技术
近年来,基于位置的社交网络(Location-based Social Networks,LBSNs), 如Foursquare、Gowalla、GeoLife等,得到了快速的发展,使得用户可以在线分 享他们的签到体验。兴趣点推荐变得更加重要和实用,其不仅可以帮助用户发 现喜爱的兴趣点,而且有利于企业获得更多的目标客户。目前,已经有很多研 究机构开展了对兴趣点推荐任务的研究。然而,由于每个用户的签到数据是高 度稀疏的,实现准确的兴趣点推荐任务是具有挑战性的。当前的研究工作将所 有签到数据作为一个整体来考虑,用户签到行为的序列性信息通常被忽视。用 户签到行为的序列性对于兴趣点推荐是至关重要的,因为人们的移动方式往往 呈现出序列性的模式,在构建兴趣点推荐模型的时候应该根据用户的当前位置 进行推荐。因此,很多研究人员开展了对连续兴趣点推荐任务的研究。
本发明的连续兴趣点推荐旨在预测用户接下来要访问的兴趣点,当前的研 究工作通过融合位置社交网络中的各种情景信息,特别是时间效应,来建模用 户对兴趣点的偏好。目前,存在很多工作研究了时间效应对连续兴趣点推荐产 生的影响。一种方法是简单地探索人类移动模式的时间周期性,其依据的是人 们往往在同一时间段周期性访问某些类型的兴趣点,例如早晨上班去办公室, 晚上下班回家。另一种方法是考虑连续签到的时间属性,并利用个性化马尔科 夫链分解模型和个性化排序度量嵌入算法来实现连续兴趣点推荐。特别地,最 近的研究工作建模了用户随着时间推移的兴趣偏好,并在特定时间段内进行兴 趣点推荐,该方法可以通过枚举所有可能的时间间隔来估计用户签到的具体时间。
此外,当前的研究工作主要利用签到的时间戳(绝对时间),例如星期一上 午或星期六晚上9点,来提升推荐系统的系统。然而,这种将用户行为模式统 一建模的方式,隐含地假设了所有的签到行为都遵循相同的模式。事实上,不 同职业的用户有着不同的办公时间,其相应的行为模式也是不同的,但是当前 的研究工作并没有考虑到用户行为模式的多样性。因此,连续签到之间的时间 间隔反映出了,人们在时间上的行为模式有着更多的灵活性,而且用户的签到 行为存在着多个签到时间间隔模式,这种签到时间间隔模式对连续兴趣点推荐 有着重要影响。
发明内容
本发明的目的在于提供一种基于签到时间间隔模式的连续兴趣点推荐方法, 该方法通过建模用户在签到时间间隔模式影响下的行为模式,并计算用户在兴 趣点之间的转移概率,根据转移概率为用户推荐接下来要访问的兴趣点集合, 向用户提供准确高效的连续兴趣点推荐服务。
本发明的思想是根据每个用户的签到数据,综合个性化偏好、地理距离偏 好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合 偏好,设计过程中采用三阶张量模型来对连续签到行为进行建模。并构建一个 概率模型,通过将签到时间间隔偏好视为潜在变量,来学习用户对兴趣点的综 合偏好程度。在参数学习阶段,我们设计了期望最大化算法(Expectation Maximization,EM)来优化概率模型的参数,最终实现了为用户推荐接下来要 访问的兴趣点的任务。张量及矩阵中信息缺失的补充,通常采用张量/矩阵分解 算法实现。
本发明的目的是通过以下技术方案实现的:
一种基于签到时间间隔模式的连续兴趣点推荐方法,包括以下步骤:
每一个用户的原始数据如下所示:
其中,每行代表一个用户,i=1,2,…,n,共n个用户;每列代表一个 时间点,t=1,2,…,T,T为总时间,元素值lij为用户ui在时间点tj时所在 的兴趣点;
步骤一、计算用户转移频率矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户从兴趣点li转移 到兴趣点lj的频率,得到每个用户的转移频率矩阵Mfreq:
其中,转移频率freqij的值按下述方式设置:在时间段T内若存在从兴趣点 li转移到兴趣点lj的情况,其值为频率;若在时间段T内不存在从兴趣点li转移 到兴趣点lj的情况,其值为0;其中,i,j=1,2,…,m,共m个兴趣点;
步骤二、整合多个用户的地点转移数据为频率张量χ
根据每个用户的频率矩阵Mfreq,将所有用户的频率矩阵组合起来,整合成 转移频率张量χ,其由I,J,U三个维度构成,U表示用户维度;I表示当前 兴趣点维度;J表示下一个兴趣点维度;如图1所示,其中,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量χ中的非零元 素值为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点 lj的转移频率,k=1,2,…,n;
步骤三、计算用户签到时间间隔矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户位于所有的兴趣 点的签到时间间隔,得到该用户从兴趣点li转移到兴趣点lj的签到时间间隔, 所有兴趣点的签到时间间隔组合起来构成用户签到时间间隔矩阵Mspan:
其中,时间间隔Sij的值描述如下:在时间段T内若存在从兴趣点li转移到 兴趣点lj的情况,则其值为平均时间间隔;在时间段T内若不存在从兴趣点li转移到兴趣点lj的情况,则其值为0;其中i,j=1,2,…,m,共m个兴趣点;
步骤四、整合多个用户的签到时间间隔数据形成张量Z
根据每个用户的签到时间间隔矩阵Mspan,将所有用户的签到时间间隔矩阵 组合起来,整合成签到时间间隔张量Z,其由I,J,U三个维度构成,如图2 所示,其中,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u 2,…,u n,共 n个用户;张量Z中的非零元素值为某个用户uk在整个时间段T内从当前 兴趣点li转移到下一个兴趣点lj的签到时间间隔,k=1,2,…,n;
步骤五、对用户个性化偏好进行建模
1)获取缺失的用户个性化偏好:
对转移频率张量χ使用成对交互张量分解(Pairwise Interaction TensorFactorization,PITF)算法进行分解,得到的分解向量,包括:
表示用户-下一个兴趣点关系矩阵中用户的潜在因素向量;表示用 户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示当前兴趣 点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;表示当前兴趣点 -下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示用户-当前 兴趣点关系矩阵中用户的潜在因素向量;表示用户-当前兴趣点关系矩阵中 当前兴趣点的潜在因素向量;u表示当前用户;i表示当前兴趣点;j表示下一 个兴趣点;
将分解得到的向量按照成对交互张量分解(Pairwise Interaction TensorFactorization,PITF)算法进行重组,从而得到包括缺失数据在内的所有用户在 各个地点的个性化转移频率估计值
2)获取缺失的地理距离偏好:
地理距离偏好sp(di,j)表示用户在访问当前兴趣点i之后,接下来去访问相 距di,j千米的兴趣点j的地理距离偏好,表示如下:
3)获取缺失的时间间隔偏好:
对时间间隔张量Z使用PITF算法进行分解,得到的分解向量,包括:
步骤七、利用期望最大化算法迭代求解最优参数w和ρ;
步骤九、根据步骤八中计算得到的转移概率值对兴趣点进行排序,并将排 在前N位的兴趣点推荐给用户。
作为优选,通过本方法可以进一步得到每一个兴趣点的不确定性程度为其中表示潜在转移时间间隔偏好zu,i,j的方差,表示用户u 在访问兴趣点i之后转移到兴趣点j的潜在转移时间间隔偏好,潜在转移时间间 隔偏好与估计的时间间隔成反比;表示高斯噪声变量ε的方差。
有益效果:
本发明针对位置社交网络中的连续兴趣点推荐问题,基于签到时间间隔模 式,提出了一种新的连续兴趣点推荐方法,有效解决了用户-兴趣点签到矩阵的 稀疏性问题;所提模型将时间间隔偏好视为潜在变量,设计了一个基于因子分 析的概率模型,并使用期望最大化算法(Expectation Maximization,EM)来优 化模型参数,为用户提供了准确高效的连续兴趣点推荐服务。
附图说明
图1为转移频率张量χ示意图;
图2为时间间隔张量Z示意图;
图3为本发明实施例签到时间间隔的统计分析;其中,(a)为用户偏好随 着签到时间间隔的变化示意图;(b)为签到时间间隔的累积分布函数示意图;
图4是本发明实施例中预测签到时间间隔的准确率随阈值T的变化情况示 意图;(a)为洛杉矶;(b)为纽约市;(c)为Gowalla;
图5为本发明实施例一种基于签到时间间隔模式的连续兴趣点推荐方法流 程示意图。
具体实施方式
下面结合附图与实施例对本发明进行详细介绍。
图3为Foursquare数据集中纽约市的签到数据,刻画了用户对兴趣点的偏 好程度(Probability)与时间间隔(Transition Interval(hr.))之间的关系。其中, 图3(a)显示了用户在签到工作场所(Work)之后,随着时间间隔的变化,访 问餐厅(Food)和夜店(Nightlife)的概率分布。我们发现,当时间间隔分别为 4小时,12小时和23小时的情况下,用户从工作场所转移到餐厅的概率取得极 大值。该观察结果说明了,人们通常在工作4小时之后吃午餐,工作12小时之 后吃晚餐,并在工作前1小时吃早餐。此外,用户在夜店签到的峰值发生在工 作之后的10个小时左右,这表明人们通常在工作10小时之后去夜店消费。总 而言之,每个用户的工作时间可能是不同的,但是日常活动之间的时间间隔却 遵循着相同的模式。图3(b)计算了在访问工作场所(Work)之后,接下来去 访问其他类型兴趣点的时间间隔的累积分布函数。其中的签到时间间隔模式是 显而易见的,例如,对于室外活动类兴趣点(Outdoor)对应的曲线,其斜率最 小,表明用户结束工作之后去室外活动类兴趣点(Outdoor)的时间间隔较短。
根据图3所观察到的现象,应用基于签到时间间隔模式的连续兴趣点推荐 算法为用户提供连续兴趣点推荐服务。
原始数据为用户在整个时间内的所有的兴趣点,因此需对其进行处理,以 挖掘出用户基于签到时间的兴趣点,如图5所示,具体步骤如下:
一、签到数据就是用户u从当前兴趣点i移动到下一个兴趣点j的转移频率, 可以把用户、当前兴趣点和下一个兴趣点看作是张量的三个维 度,即张量中的非零元素表示观测到的转移频率,其中U表示位置社交 网络中的一组用户,L表示位置社交网络中的一组兴趣点。
对于转移频率张量χ中的缺失值,先用0填充,对于这些为0的元素,可通 过后续步骤中PITF分解算法将缺失值进行填充,用于最终的预测。
二、利用用户u连续访问的兴趣点之间的时间间隔,构造当前兴趣点-下一个 兴趣点的签到时间间隔矩阵所有用户的签到数据构成了签到时间间隔张量其中张量中的每个元素表示用户u从兴趣点i移动到 兴趣点j的时间间隔的估计值,非零元素为观测到的时间间隔。
对于时间间隔张量Z中的缺失值,先用0填充,对于这些为0的元素,可通 过后续步骤中PITF算法将缺失值进行填充,用于最终的预测;
三、对用户偏好进行建模,其中用户偏好包括个性化偏好、地理距离偏好和 时间间隔偏好。
1)对于个性化偏好,由于只能观测到转移张量中的部分转移频率,因此, 可以利用类似于矩阵分解中的低秩近似技术,将那些未观测到的转移项进行填 充,从而发现用户对所有兴趣点的个性化偏好。对于三阶张量的近似可以采 用成对交互张量分解(Pairwise Interaction Tensor Factorization,PITF)算法,其 中PITF分解方法只考虑张量三个维度(即用户U,当前兴趣点I,下一个兴趣 点J)的两两之间的交互,得到步骤五(1)的转移频率的估计值
2)对于地理距离偏好,根据用户的移动模式受地理距离的限制,人们接下 来要访问的兴趣点往往是在一天之内可以到达的地方,并且随着地理距离的增 加,用户对该兴趣点的偏好程度会减少。因此,在连续兴趣点推荐方法中融合 地理距离偏好可以提升推荐性能。地理距离偏好表示用户在访问当前兴 趣点i之后,接下来去访问相距千米的兴趣点j的地理距离偏好。
3)对于时间间隔偏好,为了建模用户u对接来下要访问的兴趣点的签到时 间间隔偏好,首先定义签到时间间隔张量Z。利用用户u连续访问的兴趣点之间 的时间间隔,构造当前兴趣点-下一个兴趣点的签到时间间隔矩阵所有用户 的签到数据构成了签到时间间隔张量其中张量中的每个元素表示用户u从兴趣点i移动到兴趣点j所用时间间隔的估计值。与类 似,可以通过对签到时间间隔张量三个维度(即用户U,当前兴趣点点I, 下一个兴趣点J)两两之间的交互进行建模,得到步骤五(3)的时间间隔的估 计值定义表示用户u在访问兴趣点i之后转移到兴趣点j的潜在转 移时间间隔偏好,由于用户在兴趣点之间的转移次数随着时间间隔的增加而减 少,故潜在转移时间间隔偏好与估计的时间间隔成反比。由于转移时间 间隔的不确定性,假设潜在变量服从期望为和方差为的高斯分布, 其中,为的倒数,表示如下:
四、模型的参数集合是
其中,
模型参数集合Θ的估计可以通过迭代的方式将LC最大化得来,典型的优化 方法是使用期望最大化算法。期望最大化算法在E步和M步这两个步骤之间进 行迭代,直至参数收敛,并且保证将似然函数优化到局部最大值。在E步中, 根据潜在变量的后验分布,计算出LC的期望值,在M步中,通过最大化对 数似然函数的期望来得到更新后参数Θ'。
六、连续兴趣点推荐的转移概率可以通过观测变量求得。当所有参数求 得最优值后,进行连续兴趣点推荐只是通过简单的计算即可完成。此时,不仅 可以求得转移概率,而且还可以求得推荐的不确定性程度,即用户u从兴趣点i 到兴趣点j的转移概率为其不确定性程度为
七、根据计算得到的转移概率值对兴趣点进行排序,并将排在前N位的兴 趣点推荐给用户。
评价指标:
下面对本发明连续兴趣点推荐性能和签到时间间隔的性能进行评价。通过定 义准确率来评估连续兴趣点推荐和连续新兴趣点推荐的性能:
其中表示用户u访问过的兴趣点集合,表示在训练集中未出 现,而只在测试集中出现的兴趣点的集合,|U|表示用户的数量,N表示候选兴 趣点的数量。将所有兴趣点按照对应的转移概率降序排列,将排名在前N位的 兴趣点组成候选集合推荐给用户u。
预测签到时间间隔是一个较新的研究课题,使用以下两个指标来评估本发明 预测时间间隔的能力。
MAPE可能会被个别较大的误差值所影响,因此对连续兴趣点推荐任务进行 个性化的评估。为此,第二个评价指标是评估每次时间间隔的准确性,给定为:
数据集:
从位置社交网络Foursquare和Gowalla中选取了三个大规模数据集进行实验。 其中,Foursquare的签到数据来自于洛杉矶和纽约市,Gowalla的数据集具有签 到数据的完整快照。我们将数据集分为两个不重叠的集合:对于每个用户,根 据签到时间的先后将签到数据分为两个部分,早期80%的签到数据作为训练集, 剩下的20%作为测试集。三个数据集的统计信息如表1所示。
表1实验数据的基本统计
实验结果:
在本发明中,同时完成了连续兴趣点推荐和签到时间间隔预测,因此,本实 验将分为两个部分,第一个部分是连续兴趣点推荐的实验结果和分析,第二部 分是签到时间间隔预测的实验结果和分析。
在连续兴趣点推荐任务中,我们将本发明(Ours)与以下算法进行对比:
(1)矩阵分解算法(MF):矩阵分解算法是将用户-项目评分矩阵进 行分解,已经被广泛应用于传统的推荐系统之中。
(2)概率矩阵分解算法(PMF):该算法假设预测评分与真实评分之 间存在高斯噪声,并假设用户特征矩阵和项目特征矩阵都服从 均值为0的高斯分布。
(3)基于局部区域的个性化马尔科夫链分解模型(FPMC-LR):此算 法采用FPMC对连续兴趣点推荐进行建模,并融入地理距离的 约束。
(4)融合地理影响的个性化排序度量嵌入算法(PRME-G):此算法 通过在PRME算法中融入地理距离影响来提升连续兴趣点推荐 的准确率。
(5)基于潜在行为模式的连续兴趣点推荐模型(LBP):此算法为在 用户潜在行为模式影响下的连续兴趣点推荐模型,该算法采用 张量模型来建模连续签到行为。
表1、表2和表3列出了连续兴趣点推荐的实验结果,表4、表5和表6列 出了连续新兴趣点推荐的实验结果。我们利用训练集优化模型参数,并将参数 的最优值用于测试集。实验结果如下:
(1)本发明和FPMC-LR,PRME-G,LBP都显著优于MF和PMF,这 表明地理距离影响在连续兴趣点推荐任务中起着重要作用。此 外,本发明始终优于FPMC-LR,PRME-G和LBP,这表明通过融 合签到时间间隔模式可以更好地建模用户的行为规律和兴趣偏 好。
(2)与其他推荐算法相比,本发明在新兴趣点推荐方面有着明显的 优势,这表明签到时间间隔模式对于新兴趣点的推荐有着重要 作用。由于个性化偏好只是建模了在训练集中观测到的用 户转移,用户仅在测试集中访问的兴趣点是无法通过个性化偏 好建模的因此,对于连续新兴趣点推荐任务,签 到时间间隔偏好w·zu,i,j导致了推荐性能的提升(FPMC-LR, PRME-G和LBP都采用了与本章模型类似的方法来建模地理距离 偏好)。
在签到时间间隔预测任务中,本发明与以下算法进行对比:
(1)矩阵分解算法(MF):矩阵分解算法将用户-签到时间间隔矩阵 进行分解。
(2)概率矩阵分解算法(PMF):该算法常用的推荐算法,并将用户 -签到时间间隔矩阵进行分解。
(3)个性化马尔科夫链分解模型(FPMC):此算法是由BPR优化的 先进的个性化推荐算法,该算法融合了用户偏好和个性化马尔 科夫链来预测时间间隔。
本发明在进行连续兴趣点推荐的同时,可以完成转移时间间隔的预测,而其 他模型(MF,PMF,FPMC)则只能实现兴趣点推荐。为了进行对比,我们将 用户-转移时间间隔矩阵进行矩阵分解,以此来预测转移时间间隔。也就是说, 我们分别将用户-签到矩阵和用户-转移时间间隔矩阵进行矩阵分解,然后对齐实 验结果来实现连续兴趣点推荐和签到时间间隔预测。图4和表1到表7显示了 所有算法预测签到时间间隔的能力。我们观察到:
(1)表1到表6表明,与其他算法相比,本发明总是实现了最高的 准确率,这说明所提模型不仅能够为用户提供连续兴趣点推荐, 还可以预测签到时间间隔。
(2)我们计算了预测时间间隔与实际时间间隔之间的MAPE(如表7 所示),MAPE的值越低代表模型的预测性能越好。显然,本发 明明显优于其他推荐算法。
(3)图4展示了各个模型在设定不同阈值T时的预测性能,其中, 图4(a)为洛杉矶数据集的实验结果,图4(b)为纽约市数据 集的实验结果,图4(c)为Gowalla数据集的实验结果,从中 可以发现本发明优于其他基准算法。
表2各方法在Foursquare-LA数据集上连续兴趣点推荐的准确率
评价指标 | MF | PMF | FPMC-LR | PRME-G | LBP | Ours |
P@1 | 0.021 | 0.024 | 0.031 | 0.032 | 0.043 | 0.044 |
P@5 | 0.065 | 0.072 | 0.089 | 0.098 | 0.121 | 0.129 |
P@10 | 0.091 | 0.094 | 0.119 | 0.112 | 0.163 | 0.172 |
P@20 | 0.11 | 0.118 | 0.131 | 0.135 | 0.202 | 0.218 |
表3各方法在Foursquare-NYC数据集上连续兴趣点推荐的准确率
评价指标 | MF | PMF | FPMC-LR | PRME-G | LBP | Ours |
P@1 | 0.019 | 0.023 | 0.030 | 0.031 | 0.043 | 0.044 |
P@5 | 0.058 | 0.071 | 0.087 | 0.096 | 0.122 | 0.127 |
P@10 | 0.092 | 0.092 | 0.116 | 0.111 | 0.161 | 0.169 |
P@20 | 0.109 | 0.121 | 0.128 | 0.132 | 0.201 | 0.212 |
表4各方法在Gowalla数据集上连续兴趣点推荐的准确率
评价指标 | MF | PMF | FPMC-LR | PRME-G | LBP | Ours |
P@1 | 0.022 | 0.024 | 0.029 | 0.038 | 0.039 | 0.041 |
P@5 | 0.085 | 0.092 | 0.116 | 0.143 | 0.168 | 0.181 |
P@10 | 0.145 | 0.157 | 0.196 | 0.194 | 0.245 | 0.292 |
P@20 | 0.186 | 0.203 | 0.249 | 0.245 | 0.316 | 0.379 |
表5各方法在Foursquare-LA数据集上连续新兴趣点推荐的准确率
评价指标 | MF | PMF | FPMC-LR | PRME-G | LBP | Ours |
P@1 | 0.01 | 0.011 | 0.026 | 0.031 | 0.032 | 0.036 |
P@5 | 0.039 | 0.042 | 0.091 | 0.112 | 0.129 | 0.141 |
P@10 | 0.065 | 0.069 | 0.122 | 0.138 | 0.181 | 0.201 |
P@20 | 0.106 | 0.111 | 0.151 | 0.172 | 0.218 | 0.242 |
表6各方法在Foursquare-NYC数据集上连续新兴趣点推荐的准确率
评价指标 | MF | PMF | FPMC-LR | PRME-G | LBP | Ours |
P@1 | 0.012 | 0.013 | 0.025 | 0.029 | 0.033 | 0.036 |
P@5 | 0.037 | 0.041 | 0.089 | 0.109 | 0.128 | 0.142 |
P@10 | 0.067 | 0.071 | 0.119 | 0.134 | 0.182 | 0.202 |
P@20 | 0.104 | 0.112 | 0.152 | 0.169 | 0.216 | 0.245 |
表7各方法在Gowalla数据集上连续新兴趣点推荐的准确率
评价指标 | MF | PMF | FPMC-LR | PRME-G | LBP | Ours |
P@1 | 0.006 | 0.007 | 0.013 | 0.015 | 0.017 | 0.021 |
P@5 | 0.032 | 0.034 | 0.174 | 0.198 | 0.204 | 0.265 |
P@10 | 0.057 | 0.066 | 0.237 | 0.276 | 0.298 | 0.358 |
P@20 | 0.106 | 0.114 | 0.316 | 0.342 | 0.386 | 0.451 |
表8各方法的MAPE值
数据集 | MF | PMF | FPMC | Ours |
洛杉矶 | 13.79 | 11.45 | 5.68 | 1.75 |
纽约市 | 14.87 | 12.64 | 6.72 | 1.84 |
Gowalla | 16.95 | 14.12 | 7.89 | 2.15 |
综上所述,本发明所提出的基于签到时间间隔模式的连续兴趣点推荐方法在 连续兴趣点推荐和签到时间间隔预测两个方面都优于其他对比算法,从而证明 了本发明方法的有效性,能够应用到连续兴趣点推荐任务并提供有效的兴趣点 推荐。
为了说明本发明的内容及实施方法,本说明书给出了一个具体实施例。在实 施例中引入细节的目的不是限制权利要求书的范围,而是帮助理解本发明所述 方法。本领域的技术人员应理解:在不脱离本发明及其所附权利要求的精神和 范围内,对最佳实施例步骤的各种修改、变化或替换都是可能的。因此,本发 明不应局限于最佳实施例及附图所公开的内容。
Claims (4)
1.一种基于签到时间间隔模式的连续兴趣点推荐方法,其特征在于:包括以下步骤:
步骤一、计算用户转移频率矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户从兴趣点li转移到兴趣点lj的频率,得到每个用户的转移频率矩阵Mfreq:
其中,转移频率freqij的值按下述方式设置:在时间段T内存在从兴趣点li转移到兴趣点lj的情况,其值为频率;在时间段T内不存在从兴趣点li转移到兴趣点lj的情况,其值为0;其中,i,j=1,2,…,m,共m个兴趣点;
步骤二、整合多个用户的地点转移数据为频率张量χ
根据每个用户的频率矩阵Mfreq,将所有用户的频率矩阵组合起来,整合成转移频率张量χ,其由I,J,U三个维度构成,U表示用户维度;I表示当前兴趣点维度;J表示下一个兴趣点维度;I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量χ中的非零元素值为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的转移频率,k=1,2,…,n;
步骤三、计算用户签到时间间隔矩阵
根据每个用户在不同时间点所处的地点,计算出每个用户位于所有的兴趣点的签到时间间隔,得到该用户从兴趣点li转移到兴趣点lj的签到时间间隔,所有兴趣点的签到时间间隔组合起来构成矩阵Mspan:
其中,时间间隔Sij的值描述如下:在时间段T内存在从兴趣点li转移到兴趣点lj的情况,其值为平均时间间隔;在时间段T内不存在从兴趣点li转移到兴趣点lj的情况,其值为0;其中i,j=1,2,…,m,共m个兴趣点;
步骤四、整合多个用户的签到时间间隔数据形成张量Z
根据每个用户的签到时间间隔矩阵Mspan,将所有用户的签到时间间隔矩阵组合起来,整合成签到时间间隔张量Z,其由I,J,U三个维度构成,I=l1,l2,…,lm,J=l1,l2,…,lm,共m个兴趣点;U=u1,u2,…,un,共n个用户;张量Z中的非零元素值为某个用户uk在整个时间段T内从当前兴趣点li转移到下一个兴趣点lj的签到时间间隔,k=1,2,…,n;
步骤五、对用户个性化偏好进行建模
1)获取缺失的用户个性化偏好:
对转移频率张量χ使用成对交互张量分解PITF算法进行分解,得到的分解向量,包括:
表示用户-下一个兴趣点关系矩阵中用户的潜在因素向量;表示用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量;表示当前兴趣点-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量;表示用户-当前兴趣点关系矩阵中用户的潜在因素向量;表示用户-当前兴趣点关系矩阵中当前兴趣点的潜在因素向量;u表示当前用户;i表示当前兴趣点;j表示下一个兴趣点;
2)获取缺失的地理距离偏好:
地理距离偏好sp(di,j)表示用户在访问当前兴趣点i之后,接下来去访问相距di,j千米的兴趣点j的地理距离偏好,表示如下:
3)获取缺失的时间间隔偏好:
对时间间隔张量Z使用PITF算法进行分解,得到的分解向量,包括:
步骤七、利用期望最大化算法迭代求解最优参数w和ρ;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810882125.XA CN109492166B (zh) | 2018-08-06 | 2018-08-06 | 基于签到时间间隔模式的连续兴趣点推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810882125.XA CN109492166B (zh) | 2018-08-06 | 2018-08-06 | 基于签到时间间隔模式的连续兴趣点推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109492166A CN109492166A (zh) | 2019-03-19 |
CN109492166B true CN109492166B (zh) | 2022-03-29 |
Family
ID=65689187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810882125.XA Active CN109492166B (zh) | 2018-08-06 | 2018-08-06 | 基于签到时间间隔模式的连续兴趣点推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109492166B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020228B (zh) * | 2019-04-08 | 2021-04-13 | 浙江大学城市学院 | 一种用于物联网物品信息搜索排序的相关性评估方法 |
CN110298687B (zh) * | 2019-05-23 | 2021-04-16 | 香港理工大学深圳研究院 | 一种区域吸引力评估方法及设备 |
CN110222278B (zh) * | 2019-06-18 | 2022-05-17 | 东北大学 | 综合因素下用户位置的获取方法 |
CN110399565B (zh) * | 2019-07-29 | 2021-08-06 | 北京理工大学 | 基于时空周期注意力机制的递归神经网络兴趣点推荐方法 |
CN110874437B (zh) * | 2019-11-14 | 2023-06-16 | 重庆邮电大学 | 一种基于多重兴趣点对排序的个性化兴趣点推荐方法 |
CN111949865A (zh) * | 2020-08-10 | 2020-11-17 | 杭州电子科技大学 | 基于图神经网络与用户长短期偏好的兴趣点推荐方法 |
CN112148822B (zh) * | 2020-08-28 | 2024-04-19 | 中国地质大学(武汉) | 一种细粒度属性加权方法及系统 |
CN112487307B (zh) * | 2020-12-10 | 2022-06-14 | 武汉大学 | 一种时间感知的poi推荐方法 |
CN112784177B (zh) * | 2021-01-18 | 2022-04-15 | 杭州电子科技大学 | 一种空间距离自适应的下一个兴趣点推荐方法 |
CN114048391B (zh) * | 2022-01-13 | 2022-04-19 | 中国测绘科学研究院 | 一种基于地理格网的兴趣活动推荐方法 |
CN114880550A (zh) * | 2022-04-02 | 2022-08-09 | 哈尔滨工程大学 | 一种融合多方面时域信息的序列推荐方法、设备和介质 |
CN117633371B (zh) * | 2024-01-25 | 2024-04-12 | 云南大学 | 基于多注意力机制的推荐方法、设备和可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960044A (zh) * | 2017-03-30 | 2017-07-18 | 浙江鸿程计算机系统有限公司 | 一种基于张量分解及加权hits的时间感知个性化poi推荐方法 |
CN107657015A (zh) * | 2017-09-26 | 2018-02-02 | 北京邮电大学 | 一种兴趣点推荐方法、装置、电子设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720844B2 (en) * | 2007-07-03 | 2010-05-18 | Vulcan, Inc. | Method and system for continuous, dynamic, adaptive searching based on a continuously evolving personal region of interest |
US20130267255A1 (en) * | 2011-10-21 | 2013-10-10 | Alohar Mobile Inc. | Identify points of interest using wireless access points |
-
2018
- 2018-08-06 CN CN201810882125.XA patent/CN109492166B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960044A (zh) * | 2017-03-30 | 2017-07-18 | 浙江鸿程计算机系统有限公司 | 一种基于张量分解及加权hits的时间感知个性化poi推荐方法 |
CN107657015A (zh) * | 2017-09-26 | 2018-02-02 | 北京邮电大学 | 一种兴趣点推荐方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
Adapting to User Interest Drift for POI Recommendation;Hongzhi Yin et al.;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》;20161031;第28卷(第10期);2566-2581 * |
基于LBSN签到数据的用户行为预测与兴趣点推荐;王凯慈;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170215(第2017年第02期);I138-4599 * |
Also Published As
Publication number | Publication date |
---|---|
CN109492166A (zh) | 2019-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492166B (zh) | 基于签到时间间隔模式的连续兴趣点推荐方法 | |
Li et al. | Community-based seeds selection algorithm for location aware influence maximization | |
Ying et al. | Mining user check-in behavior with a random walk for urban point-of-interest recommendations | |
Gao et al. | Exploring temporal effects for location recommendation on location-based social networks | |
CN109783738B (zh) | 一种基于多相似度的双极限学习机混合协同过滤推荐方法 | |
Li et al. | Point-of-interest recommender systems: A separate-space perspective | |
Fu et al. | User preference learning with multiple information fusion for restaurant recommendation | |
Zhang et al. | Prediction uncertainty in collaborative filtering: Enhancing personalized online product ranking | |
D’Silva et al. | Predicting the temporal activity patterns of new venues | |
CN109460520B (zh) | 基于地理-社会关系与深隐式兴趣挖掘的兴趣点推荐方法 | |
Shafiei-Monfared et al. | A novel approach for complexity measure analysis in design projects | |
Mohammadi et al. | Artificial intelligence-based solution to estimate the spatial accuracy of volunteered geographic data | |
Park et al. | Variational Bayesian inference for forecasting hierarchical time series | |
He et al. | Next point-of-interest recommendation via a category-aware Listwise Bayesian Personalized Ranking | |
Zhao et al. | GT-SEER: geo-temporal sequential embedding rank for point-of-interest recommendation | |
CN109684561B (zh) | 基于用户签到行为变化的深层语义分析的兴趣点推荐方法 | |
Wangkhamhan | Adaptive chaotic satin bowerbird optimisation algorithm for numerical function optimisation | |
CN113239266B (zh) | 基于局部矩阵分解的个性化推荐方法及系统 | |
CN107909498B (zh) | 基于最大化接受者操作特征曲线下方面积的推荐方法 | |
Satman et al. | Selecting location of retail stores using artificial neural networks and google places api | |
Pan et al. | A simultaneous variable selection methodology for linear mixed models | |
Cao et al. | Efficient fine-grained location prediction based on user mobility pattern in lbsns | |
Mao et al. | Utilizing multi-source data in popularity prediction for shop-type recommendation | |
US20190342698A1 (en) | Method and System for Modeling User and Location | |
Makropoulos et al. | A neurofuzzy spatial decision support system for pipe replacement prioritisation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |