CN109492166B

CN109492166B - 基于签到时间间隔模式的连续兴趣点推荐方法

Info

Publication number: CN109492166B
Application number: CN201810882125.XA
Authority: CN
Inventors: 礼欣; 江明明; 石雨
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2018-08-06
Filing date: 2018-08-06
Publication date: 2022-03-29
Anticipated expiration: 2038-08-06
Also published as: CN109492166A

Abstract

本发明涉及一种基于签到时间间隔模式的连续兴趣点推荐方法，属于推荐系统领域；根据每个用户的签到数据，综合个性化偏好、地理距离偏好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合偏好，采用三阶张量模型来对连续签到行为进行建模；并构建一个概率模型，通过将签到时间间隔偏好视为潜在变量，来学习用户对兴趣点的综合偏好程度；在参数学习阶段，设计了期望最大化算法来优化概率模型的参数，最终实现了为用户推荐接下来要访问的兴趣点的任务；张量及矩阵中信息缺失的补充，采用张量/矩阵分解算法实现。对比现有技术，本发明方法有效解决了用户‑兴趣点签到矩阵的稀疏性问题，为用户提供准确高效的连续兴趣点推荐服务。

Description

基于签到时间间隔模式的连续兴趣点推荐方法

技术领域

本发明涉及一种连续兴趣点推荐方法，具体涉及一种基于签到时间间隔模式的连续兴趣点推荐方法，属于推荐系统领域。

背景技术

近年来，基于位置的社交网络(Location-based Social Networks，LBSNs)，如Foursquare、Gowalla、GeoLife等，得到了快速的发展，使得用户可以在线分享他们的签到体验。兴趣点推荐变得更加重要和实用，其不仅可以帮助用户发现喜爱的兴趣点，而且有利于企业获得更多的目标客户。目前，已经有很多研究机构开展了对兴趣点推荐任务的研究。然而，由于每个用户的签到数据是高度稀疏的，实现准确的兴趣点推荐任务是具有挑战性的。当前的研究工作将所有签到数据作为一个整体来考虑，用户签到行为的序列性信息通常被忽视。用户签到行为的序列性对于兴趣点推荐是至关重要的，因为人们的移动方式往往呈现出序列性的模式，在构建兴趣点推荐模型的时候应该根据用户的当前位置进行推荐。因此，很多研究人员开展了对连续兴趣点推荐任务的研究。

本发明的连续兴趣点推荐旨在预测用户接下来要访问的兴趣点，当前的研究工作通过融合位置社交网络中的各种情景信息，特别是时间效应，来建模用户对兴趣点的偏好。目前，存在很多工作研究了时间效应对连续兴趣点推荐产生的影响。一种方法是简单地探索人类移动模式的时间周期性，其依据的是人们往往在同一时间段周期性访问某些类型的兴趣点，例如早晨上班去办公室，晚上下班回家。另一种方法是考虑连续签到的时间属性，并利用个性化马尔科夫链分解模型和个性化排序度量嵌入算法来实现连续兴趣点推荐。特别地，最近的研究工作建模了用户随着时间推移的兴趣偏好，并在特定时间段内进行兴趣点推荐，该方法可以通过枚举所有可能的时间间隔来估计用户签到的具体时间。

此外，当前的研究工作主要利用签到的时间戳(绝对时间)，例如星期一上午或星期六晚上9点，来提升推荐系统的系统。然而，这种将用户行为模式统一建模的方式，隐含地假设了所有的签到行为都遵循相同的模式。事实上，不同职业的用户有着不同的办公时间，其相应的行为模式也是不同的，但是当前的研究工作并没有考虑到用户行为模式的多样性。因此，连续签到之间的时间间隔反映出了，人们在时间上的行为模式有着更多的灵活性，而且用户的签到行为存在着多个签到时间间隔模式，这种签到时间间隔模式对连续兴趣点推荐有着重要影响。

发明内容

本发明的目的在于提供一种基于签到时间间隔模式的连续兴趣点推荐方法，该方法通过建模用户在签到时间间隔模式影响下的行为模式，并计算用户在兴趣点之间的转移概率，根据转移概率为用户推荐接下来要访问的兴趣点集合，向用户提供准确高效的连续兴趣点推荐服务。

本发明的思想是根据每个用户的签到数据，综合个性化偏好、地理距离偏好和签到时间间隔偏好来联合建模形成用户对接下来要访问的兴趣点的综合偏好，设计过程中采用三阶张量模型来对连续签到行为进行建模。并构建一个概率模型，通过将签到时间间隔偏好视为潜在变量，来学习用户对兴趣点的综合偏好程度。在参数学习阶段，我们设计了期望最大化算法(Expectation Maximization，EM)来优化概率模型的参数，最终实现了为用户推荐接下来要访问的兴趣点的任务。张量及矩阵中信息缺失的补充，通常采用张量/矩阵分解算法实现。

本发明的目的是通过以下技术方案实现的：

一种基于签到时间间隔模式的连续兴趣点推荐方法，包括以下步骤：

每一个用户的原始数据如下所示：

其中，每行代表一个用户，i＝1，2，…，n，共n个用户；每列代表一个时间点，t＝1，2，…，T，T为总时间，元素值l_ij为用户u_i在时间点t_j时所在的兴趣点；

步骤一、计算用户转移频率矩阵

根据每个用户在不同时间点所处的地点，计算出每个用户从兴趣点l_i转移到兴趣点l_j的频率，得到每个用户的转移频率矩阵M_freq：

其中，转移频率freq_ij的值按下述方式设置：在时间段T内若存在从兴趣点 l_i转移到兴趣点l_j的情况，其值为频率；若在时间段T内不存在从兴趣点l_i转移到兴趣点l_j的情况，其值为0；其中，i，j＝1,2，…，m，共m个兴趣点；

步骤二、整合多个用户的地点转移数据为频率张量χ

根据每个用户的频率矩阵M_freq，将所有用户的频率矩阵组合起来，整合成转移频率张量χ，其由I，J，U三个维度构成，U表示用户维度；I表示当前兴趣点维度；J表示下一个兴趣点维度；如图1所示，其中，I＝l₁,l₂,…,l_m，J＝l₁,l₂,…,l_m，共m个兴趣点；U＝u₁,u₂,…,u_n，共n个用户；张量χ中的非零元素值

为某个用户u_k在整个时间段T内从当前兴趣点l_i转移到下一个兴趣点 l_j的转移频率，k＝1,2,…,n；

步骤三、计算用户签到时间间隔矩阵

根据每个用户在不同时间点所处的地点，计算出每个用户位于所有的兴趣点的签到时间间隔，得到该用户从兴趣点l_i转移到兴趣点l_j的签到时间间隔，所有兴趣点的签到时间间隔组合起来构成用户签到时间间隔矩阵M_span：

其中，时间间隔S_ij的值描述如下：在时间段T内若存在从兴趣点l_i转移到兴趣点l_j的情况，则其值为平均时间间隔；在时间段T内若不存在从兴趣点l_i转移到兴趣点l_j的情况，则其值为0；其中i，j＝1,2，…，m，共m个兴趣点；

步骤四、整合多个用户的签到时间间隔数据形成张量Z

根据每个用户的签到时间间隔矩阵M_span，将所有用户的签到时间间隔矩阵组合起来，整合成签到时间间隔张量Z，其由I，J，U三个维度构成，如图2 所示，其中，I＝l₁,l₂,…,l_m，J＝l₁,l₂,…,l_m，共m个兴趣点；U＝u₁,u ₂,…,u _n，共 n个用户；张量Z中的非零元素值

为某个用户u_k在整个时间段T内从当前兴趣点l_i转移到下一个兴趣点l_j的签到时间间隔，k＝1,2,…,n；

步骤五、对用户个性化偏好进行建模

1)获取缺失的用户个性化偏好：

对转移频率张量χ使用成对交互张量分解(Pairwise Interaction TensorFactorization，PITF)算法进行分解，得到的分解向量，包括：

表示用户-下一个兴趣点关系矩阵中用户的潜在因素向量；

表示用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量；

表示当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量；

表示当前兴趣点 -下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量；

表示用户-当前兴趣点关系矩阵中用户的潜在因素向量；

表示用户-当前兴趣点关系矩阵中当前兴趣点的潜在因素向量；u表示当前用户；i表示当前兴趣点；j表示下一个兴趣点；

将分解得到的向量按照成对交互张量分解(Pairwise Interaction TensorFactorization，PITF)算法进行重组，从而得到包括缺失数据在内的所有用户在各个地点的个性化转移频率估计值

2)获取缺失的地理距离偏好：

地理距离偏好sp(d_i,j)表示用户在访问当前兴趣点i之后，接下来去访问相距d_i,j千米的兴趣点j的地理距离偏好，表示如下：

其中，ρ为参数，其最优值将在步骤七确定；d_i,j表示从当前兴趣点i到下一兴趣点j的地理距离；

为d_i,j的倒数；

3)获取缺失的时间间隔偏好：

对时间间隔张量Z使用PITF算法进行分解，得到的分解向量，包括：

用户-下一个兴趣点关系矩阵中用户的潜在因素向量；

用户-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量；

当前兴趣点-下一个兴趣点关系矩阵中当前兴趣点的潜在因素向量；

当前兴趣点-下一个兴趣点关系矩阵中下一个兴趣点的潜在因素向量；

用户-当前兴趣点关系矩阵中用户的潜在因素向量；

用户-当前兴趣点关系矩阵中当前兴趣点的潜在因素向量；

将分解得到的向量按照PITF算法进行重组，从而得到包括缺失数据在内的所有用户的时间间隔估计值

步骤六、基于以上步骤所得结果，按以下线性组合的方式，获得一个考虑综合信息的连续兴趣点推荐模型

其中，

表示个性化偏好；

表示地理距离偏好；

表示时间间隔偏好；ε为高斯噪声变量，表示用户在移动过程中的非偏好性随机影响，如天气影响、社交关系影响等；参数w和ρ的最优值将在后续参数学习阶段确定；

步骤七、利用期望最大化算法迭代求解最优参数w和ρ；

步骤八、通过将步骤七中求解的最优参数w和ρ代入步骤六公式计算用户对每一个兴趣点的转移概率值，即得到

步骤九、根据步骤八中计算得到的转移概率值对兴趣点进行排序，并将排在前N位的兴趣点推荐给用户。

作为优选，为提高效率，所述步骤五1)中，对于用户个性化偏好，将因式项

移除，因为其与下一个兴趣点j无关，且不影响转移概率的排名；此时转移概率估计值

表示为：

作为优选，为提高效率，所述步骤五3)中，对于时间间隔偏好，将因式项

移除，因为其与下一个兴趣点j无关，且不影响转移概率的排名；此时时间间隔的估计值

可以表示为：

作为优选，通过本方法可以进一步得到每一个兴趣点的不确定性程度为

其中

表示潜在转移时间间隔偏好z_u,i,j的方差，

表示用户u 在访问兴趣点i之后转移到兴趣点j的潜在转移时间间隔偏好，潜在转移时间间隔偏好

与估计的时间间隔

成反比；

表示高斯噪声变量ε的方差。

有益效果：

本发明针对位置社交网络中的连续兴趣点推荐问题，基于签到时间间隔模式，提出了一种新的连续兴趣点推荐方法，有效解决了用户-兴趣点签到矩阵的稀疏性问题；所提模型将时间间隔偏好视为潜在变量，设计了一个基于因子分析的概率模型，并使用期望最大化算法(Expectation Maximization，EM)来优化模型参数，为用户提供了准确高效的连续兴趣点推荐服务。

附图说明

图1为转移频率张量χ示意图；

图2为时间间隔张量Z示意图；

图3为本发明实施例签到时间间隔的统计分析；其中，(a)为用户偏好随着签到时间间隔的变化示意图；(b)为签到时间间隔的累积分布函数示意图；

图4是本发明实施例中预测签到时间间隔的准确率随阈值T的变化情况示意图；(a)为洛杉矶；(b)为纽约市；(c)为Gowalla；

图5为本发明实施例一种基于签到时间间隔模式的连续兴趣点推荐方法流程示意图。

具体实施方式

下面结合附图与实施例对本发明进行详细介绍。

图3为Foursquare数据集中纽约市的签到数据，刻画了用户对兴趣点的偏好程度(Probability)与时间间隔(Transition Interval(hr.))之间的关系。其中，图3(a)显示了用户在签到工作场所(Work)之后，随着时间间隔的变化，访问餐厅(Food)和夜店(Nightlife)的概率分布。我们发现，当时间间隔分别为 4小时，12小时和23小时的情况下，用户从工作场所转移到餐厅的概率取得极大值。该观察结果说明了，人们通常在工作4小时之后吃午餐，工作12小时之后吃晚餐，并在工作前1小时吃早餐。此外，用户在夜店签到的峰值发生在工作之后的10个小时左右，这表明人们通常在工作10小时之后去夜店消费。总而言之，每个用户的工作时间可能是不同的，但是日常活动之间的时间间隔却遵循着相同的模式。图3(b)计算了在访问工作场所(Work)之后，接下来去访问其他类型兴趣点的时间间隔的累积分布函数。其中的签到时间间隔模式是显而易见的，例如，对于室外活动类兴趣点(Outdoor)对应的曲线，其斜率最小，表明用户结束工作之后去室外活动类兴趣点(Outdoor)的时间间隔较短。

根据图3所观察到的现象，应用基于签到时间间隔模式的连续兴趣点推荐算法为用户提供连续兴趣点推荐服务。

原始数据为用户在整个时间内的所有的兴趣点，因此需对其进行处理，以挖掘出用户基于签到时间的兴趣点，如图5所示，具体步骤如下：

一、签到数据就是用户u从当前兴趣点i移动到下一个兴趣点j的转移频率，可以把用户、当前兴趣点和下一个兴趣点看作是张量

的三个维度，即张量中的非零元素

表示观测到的转移频率，其中U表示位置社交网络中的一组用户，L表示位置社交网络中的一组兴趣点。

对于转移频率张量χ中的缺失值，先用0填充，对于这些为0的元素，可通过后续步骤中PITF分解算法将缺失值进行填充，用于最终的预测。

二、利用用户u连续访问的兴趣点之间的时间间隔，构造当前兴趣点-下一个兴趣点的签到时间间隔矩阵

所有用户的签到数据构成了签到时间间隔张量

其中张量中的每个元素

表示用户u从兴趣点i移动到兴趣点j的时间间隔的估计值，非零元素为观测到的时间间隔。

对于时间间隔张量Z中的缺失值，先用0填充，对于这些为0的元素，可通过后续步骤中PITF算法将缺失值进行填充，用于最终的预测；

三、对用户偏好进行建模，其中用户偏好包括个性化偏好、地理距离偏好和时间间隔偏好。

1)对于个性化偏好，由于只能观测到转移张量

中的部分转移频率，因此，可以利用类似于矩阵分解中的低秩近似技术，将那些未观测到的转移项进行填充，从而发现用户对所有兴趣点的个性化偏好。对于三阶张量

的近似可以采用成对交互张量分解(Pairwise Interaction Tensor Factorization，PITF)算法，其中PITF分解方法只考虑张量三个维度(即用户U，当前兴趣点I，下一个兴趣点J)的两两之间的交互，得到步骤五(1)的转移频率的估计值

2)对于地理距离偏好，根据用户的移动模式受地理距离的限制，人们接下来要访问的兴趣点往往是在一天之内可以到达的地方，并且随着地理距离的增加，用户对该兴趣点的偏好程度会减少。因此，在连续兴趣点推荐方法中融合地理距离偏好可以提升推荐性能。地理距离偏好

表示用户在访问当前兴趣点i之后，接下来去访问相距

千米的兴趣点j的地理距离偏好。

3)对于时间间隔偏好，为了建模用户u对接来下要访问的兴趣点的签到时间间隔偏好，首先定义签到时间间隔张量Z。利用用户u连续访问的兴趣点之间的时间间隔，构造当前兴趣点-下一个兴趣点的签到时间间隔矩阵

所有用户的签到数据构成了签到时间间隔张量

其中张量中的每个元素

表示用户u从兴趣点i移动到兴趣点j所用时间间隔的估计值。与

类似，

可以通过对签到时间间隔张量三个维度(即用户U，当前兴趣点点I，下一个兴趣点J)两两之间的交互进行建模，得到步骤五(3)的时间间隔的估计值

定义

表示用户u在访问兴趣点i之后转移到兴趣点j的潜在转移时间间隔偏好，由于用户在兴趣点之间的转移次数随着时间间隔的增加而减少，故潜在转移时间间隔偏好

与估计的时间间隔

成反比。由于转移时间间隔的不确定性，假设潜在变量

服从期望为

和方差为

的高斯分布，其中，

为

的倒数，表示如下：

四、模型的参数集合是

假设噪声变量ε服从期望为0和方差为

高斯分布，即

给定z_u，i，j时x_u，i，j的概率分布如下所示：

确定了观测变量

的条件概率分布之后，观测变量

的边际分布可以通过将潜在变量边缘化得来，且同样是高斯分布，表示如下：

在给定观测变量

的情况下，潜在变量

的条件分布可以使用贝叶斯分析计算得来，且也服从高斯分布：

其中后验均值和后验方差分别为

和

五、将潜在变量

视为缺失数据，那么完整数据包括观测变量

与相应的潜在变量

假设用户之间是相互独立的，用户的每次签到行为之间也是相互独立，那么完整数据的对数似然函数可以由下式表示：

其中，

用户u在时间t之前签到的兴趣点集合由

来表示，即

其中G表示用户u在时间t之前签到的兴趣点的数量，exp{·}表示指数函数。

模型参数集合Θ的估计可以通过迭代的方式将L_C最大化得来，典型的优化方法是使用期望最大化算法。期望最大化算法在E步和M步这两个步骤之间进行迭代，直至参数收敛，并且保证将似然函数优化到局部最大值。在E步中，根据潜在变量

的后验分布，计算出L_C的期望值，在M步中，通过最大化对数似然函数的期望来得到更新后参数Θ'。

六、连续兴趣点推荐的转移概率可以通过观测变量

求得。当所有参数求得最优值后，进行连续兴趣点推荐只是通过简单的计算即可完成。此时，不仅可以求得转移概率，而且还可以求得推荐的不确定性程度，即用户u从兴趣点i 到兴趣点j的转移概率为

其不确定性程度为

七、根据计算得到的转移概率值对兴趣点进行排序，并将排在前N位的兴趣点推荐给用户。

评价指标：

下面对本发明连续兴趣点推荐性能和签到时间间隔的性能进行评价。通过定义准确率来评估连续兴趣点推荐和连续新兴趣点推荐的性能：

其中

表示用户u访问过的兴趣点集合，

表示在训练集中未出现，而只在测试集中出现的兴趣点的集合，|U|表示用户的数量，N表示候选兴趣点的数量。将所有兴趣点按照对应的转移概率降序排列，将排名在前N位的兴趣点组成候选集合

推荐给用户u。

预测签到时间间隔是一个较新的研究课题，使用以下两个指标来评估本发明预测时间间隔的能力。

第一个评价指标是平均绝对百分比误差，其关注所有签到数据中预测时间间隔

与实际时间间隔

之间的差值：

其中

表测试集中签到的数量，

表示数据集中用户u从地点i到地点j 的实际时间间隔。测试集的MAPE值可以通过计算求得，当MAPE值越小时，签到时间间隔的预测性能越好。

MAPE可能会被个别较大的误差值所影响，因此对连续兴趣点推荐任务进行个性化的评估。为此，第二个评价指标是评估每次时间间隔的准确性，给定为：

如果：

与

之差小于预定的阈值T，即

，那么S_T，u等于1，否则等于0。

数据集：

从位置社交网络Foursquare和Gowalla中选取了三个大规模数据集进行实验。其中，Foursquare的签到数据来自于洛杉矶和纽约市，Gowalla的数据集具有签到数据的完整快照。我们将数据集分为两个不重叠的集合：对于每个用户，根据签到时间的先后将签到数据分为两个部分，早期80％的签到数据作为训练集，剩下的20％作为测试集。三个数据集的统计信息如表1所示。

表1实验数据的基本统计

实验结果：

在本发明中，同时完成了连续兴趣点推荐和签到时间间隔预测，因此，本实验将分为两个部分，第一个部分是连续兴趣点推荐的实验结果和分析，第二部分是签到时间间隔预测的实验结果和分析。

在连续兴趣点推荐任务中，我们将本发明(Ours)与以下算法进行对比：

(1)矩阵分解算法(MF)：矩阵分解算法是将用户-项目评分矩阵进行分解，已经被广泛应用于传统的推荐系统之中。

(2)概率矩阵分解算法(PMF)：该算法假设预测评分与真实评分之间存在高斯噪声，并假设用户特征矩阵和项目特征矩阵都服从均值为0的高斯分布。

(3)基于局部区域的个性化马尔科夫链分解模型(FPMC-LR)：此算法采用FPMC对连续兴趣点推荐进行建模，并融入地理距离的约束。

(4)融合地理影响的个性化排序度量嵌入算法(PRME-G)：此算法通过在PRME算法中融入地理距离影响来提升连续兴趣点推荐的准确率。

(5)基于潜在行为模式的连续兴趣点推荐模型(LBP)：此算法为在用户潜在行为模式影响下的连续兴趣点推荐模型，该算法采用张量模型来建模连续签到行为。

表1、表2和表3列出了连续兴趣点推荐的实验结果，表4、表5和表6列出了连续新兴趣点推荐的实验结果。我们利用训练集优化模型参数，并将参数的最优值用于测试集。实验结果如下：

(1)本发明和FPMC-LR，PRME-G，LBP都显著优于MF和PMF，这表明地理距离影响在连续兴趣点推荐任务中起着重要作用。此外，本发明始终优于FPMC-LR，PRME-G和LBP，这表明通过融合签到时间间隔模式可以更好地建模用户的行为规律和兴趣偏好。

(2)与其他推荐算法相比，本发明在新兴趣点推荐方面有着明显的优势，这表明签到时间间隔模式对于新兴趣点的推荐有着重要作用。由于个性化偏好

只是建模了在训练集中观测到的用户转移，用户仅在测试集中访问的兴趣点是无法通过个性化偏好建模的

因此，对于连续新兴趣点推荐任务，签到时间间隔偏好w·z_u,i,j导致了推荐性能的提升(FPMC-LR， PRME-G和LBP都采用了与本章模型类似的方法来建模地理距离偏好)。

在签到时间间隔预测任务中，本发明与以下算法进行对比：

(1)矩阵分解算法(MF)：矩阵分解算法将用户-签到时间间隔矩阵进行分解。

(2)概率矩阵分解算法(PMF)：该算法常用的推荐算法，并将用户 -签到时间间隔矩阵进行分解。

(3)个性化马尔科夫链分解模型(FPMC)：此算法是由BPR优化的先进的个性化推荐算法，该算法融合了用户偏好和个性化马尔科夫链来预测时间间隔。

本发明在进行连续兴趣点推荐的同时，可以完成转移时间间隔的预测，而其他模型(MF，PMF，FPMC)则只能实现兴趣点推荐。为了进行对比，我们将用户-转移时间间隔矩阵进行矩阵分解，以此来预测转移时间间隔。也就是说，我们分别将用户-签到矩阵和用户-转移时间间隔矩阵进行矩阵分解，然后对齐实验结果来实现连续兴趣点推荐和签到时间间隔预测。图4和表1到表7显示了所有算法预测签到时间间隔的能力。我们观察到：

(1)表1到表6表明，与其他算法相比，本发明总是实现了最高的准确率，这说明所提模型不仅能够为用户提供连续兴趣点推荐，还可以预测签到时间间隔。

(2)我们计算了预测时间间隔与实际时间间隔之间的MAPE(如表7 所示)，MAPE的值越低代表模型的预测性能越好。显然，本发明明显优于其他推荐算法。

(3)图4展示了各个模型在设定不同阈值T时的预测性能，其中，图4(a)为洛杉矶数据集的实验结果，图4(b)为纽约市数据集的实验结果，图4(c)为Gowalla数据集的实验结果，从中可以发现本发明优于其他基准算法。

表2各方法在Foursquare-LA数据集上连续兴趣点推荐的准确率

评价指标	MF	PMF	FPMC-LR	PRME-G	LBP	Ours
							P@1	0.021	0.024	0.031	0.032	0.043	0.044
P@5	0.065	0.072	0.089	0.098	0.121	0.129
							P@10	0.091	0.094	0.119	0.112	0.163	0.172
P@20	0.11	0.118	0.131	0.135	0.202	0.218

表3各方法在Foursquare-NYC数据集上连续兴趣点推荐的准确率

评价指标	MF	PMF	FPMC-LR	PRME-G	LBP	Ours
							P@1	0.019	0.023	0.030	0.031	0.043	0.044
P@5	0.058	0.071	0.087	0.096	0.122	0.127
							P@10	0.092	0.092	0.116	0.111	0.161	0.169
P@20	0.109	0.121	0.128	0.132	0.201	0.212

表4各方法在Gowalla数据集上连续兴趣点推荐的准确率

评价指标	MF	PMF	FPMC-LR	PRME-G	LBP	Ours
							P@1	0.022	0.024	0.029	0.038	0.039	0.041
P@5	0.085	0.092	0.116	0.143	0.168	0.181
							P@10	0.145	0.157	0.196	0.194	0.245	0.292
P@20	0.186	0.203	0.249	0.245	0.316	0.379

表5各方法在Foursquare-LA数据集上连续新兴趣点推荐的准确率

评价指标	MF	PMF	FPMC-LR	PRME-G	LBP	Ours
							P@1	0.01	0.011	0.026	0.031	0.032	0.036
P@5	0.039	0.042	0.091	0.112	0.129	0.141
							P@10	0.065	0.069	0.122	0.138	0.181	0.201
P@20	0.106	0.111	0.151	0.172	0.218	0.242

表6各方法在Foursquare-NYC数据集上连续新兴趣点推荐的准确率

评价指标	MF	PMF	FPMC-LR	PRME-G	LBP	Ours
							P@1	0.012	0.013	0.025	0.029	0.033	0.036
P@5	0.037	0.041	0.089	0.109	0.128	0.142
							P@10	0.067	0.071	0.119	0.134	0.182	0.202
P@20	0.104	0.112	0.152	0.169	0.216	0.245

表7各方法在Gowalla数据集上连续新兴趣点推荐的准确率

评价指标	MF	PMF	FPMC-LR	PRME-G	LBP	Ours
							P@1	0.006	0.007	0.013	0.015	0.017	0.021
P@5	0.032	0.034	0.174	0.198	0.204	0.265
							P@10	0.057	0.066	0.237	0.276	0.298	0.358
P@20	0.106	0.114	0.316	0.342	0.386	0.451

表8各方法的MAPE值

数据集	MF	PMF	FPMC	Ours
					洛杉矶	13.79	11.45	5.68	1.75
纽约市	14.87	12.64	6.72	1.84
					Gowalla	16.95	14.12	7.89	2.15

综上所述，本发明所提出的基于签到时间间隔模式的连续兴趣点推荐方法在连续兴趣点推荐和签到时间间隔预测两个方面都优于其他对比算法，从而证明了本发明方法的有效性，能够应用到连续兴趣点推荐任务并提供有效的兴趣点推荐。

为了说明本发明的内容及实施方法，本说明书给出了一个具体实施例。在实施例中引入细节的目的不是限制权利要求书的范围，而是帮助理解本发明所述方法。本领域的技术人员应理解：在不脱离本发明及其所附权利要求的精神和范围内，对最佳实施例步骤的各种修改、变化或替换都是可能的。因此，本发明不应局限于最佳实施例及附图所公开的内容。

Claims

1.一种基于签到时间间隔模式的连续兴趣点推荐方法，其特征在于：包括以下步骤：

步骤一、计算用户转移频率矩阵

其中，转移频率freq_ij的值按下述方式设置：在时间段T内存在从兴趣点l_i转移到兴趣点l_j的情况，其值为频率；在时间段T内不存在从兴趣点l_i转移到兴趣点l_j的情况，其值为0；其中，i，j＝1,2，…，m，共m个兴趣点；

步骤二、整合多个用户的地点转移数据为频率张量χ

根据每个用户的频率矩阵M_freq，将所有用户的频率矩阵组合起来，整合成转移频率张量χ，其由I，J，U三个维度构成，U表示用户维度；I表示当前兴趣点维度；J表示下一个兴趣点维度；I＝l₁,l₂,…,l_m，J＝l₁,l₂,…,l_m，共m个兴趣点；U＝u₁,u₂,…,u_n，共n个用户；张量χ中的非零元素值