CN107747947B

CN107747947B - 一种基于用户历史gps轨迹的协同旅行路线推荐方法

Info

Publication number: CN107747947B
Application number: CN201710993263.0A
Authority: CN
Inventors: 高建彬; 鲁威
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2017-10-23
Filing date: 2017-10-23
Publication date: 2021-04-30
Anticipated expiration: 2037-10-23
Also published as: CN107747947A

Abstract

本发明公开了一种基于用户历史GPS轨迹的协同旅行路线推荐方法，属于路线规划技术领域，其目的在于提供一种基于用户历史GPS轨迹的协同旅行路线推荐方法，通过估计旅行行为的频率来解决用户在未旅行的路段上旅行行为数据不可知的问题，为用户推荐更适合的个性化旅行路线。该推荐方法通过提取道路网络和用户的历史GPS轨迹，并构建用户旅行行为矩阵来估计旅行行为频率，根据估计的旅行行为频率计算旅行行为概率，并根据旅行行为概率来加权道路网络图，得到推荐的旅行路线，为用户推荐更适合的个性化旅行路线，推荐出来的旅行路线能够更加符合用户的需求。

Description

一种基于用户历史GPS轨迹的协同旅行路线推荐方法

技术领域

本发明属于路线规划技术领域，涉及一种路线的推荐方法，尤其涉及一种基于用于历史GPS轨迹的路线推荐方法。

背景技术

近年来，随着交通工具的普及以及人们出行尤其是远距离出行的增多，运行在各类导航仪、移动终端上的路线导航系统(包含汽车、自行车、步行导航)得到快速发展。尤其是安装在移动终端的利用GPS的电子地图程序，凭借其低廉的价格、实时更新的地图数据以及与其他应用软件方便结合的能力，给人们出行的方案带来了一场革命。用户只需要在电子地图上标出起点和终点，就可以方便的找到出行的路线。

在当前背景下，导航路线的自动、优化规划算法成为热门研究领域。国内外地图、位置、导航等领域的服务厂商均投入大量精力进行导航算法的优化改进。国外较著名的包括谷歌地图和苹果地图等，国内较著名的有百度地图、高德地图等，以及各类导航仪生产商家自己生产制作的地图服务系统。从用户体验度来说，在最短的时间内提供出使用者所认为的最优化的道路行驶方案是该领域的终极目标。

对于这个目标可从两个方面来看：根据距离计算出距离最短路径，或者根据道路情况推荐的用时最短的路径。现有的线路推荐大多要么是最短用时或者是最短路径的方案，而现实生活中，一大部分人往往更喜欢在自己喜欢或熟悉的路段行驶，现在的路径推荐服务往往都没有考虑到用户的这种偏好，没有个性化的路线推荐方案。换句话说，有的人不看重行驶的距离和时间，只想在自己喜欢的路线行驶。

个性化旅行路线推荐是一个重要的研究课题。基于道路网络和用户的旅游偏好，个性化的行驶路线的建议引用了两个地理位置之间的平均路线规划。但用户的具体旅行偏好受到许多因素的影响，如距离、交通量、旅行时间、天气、燃料消耗、安全性以及许多其他隐含和隐藏的因素。因此，难以确定综合用户旅行偏好度量以开发个性化旅行路线推荐。随着全球定位系统技术的进步和移动设备的普及，GPS轨迹中的大量人类运动数据已经被收集并可用于研究、加以利用，为提供个性化旅行路线推荐提供了重要的数据支撑。用户的历史GPS轨迹通常会包含有关旅行时间和位置的信息，这有助于了解用户的旅行行为。

数年来，国内外学者对路线轨迹推荐进行了深入的研究，取得了丰硕的成果，包括对推荐模型的讨论，提出新方案，对现有方案的分析和改进等。然而，当使用GPS轨迹进行个性化旅行路线推荐时，将会面临如下常见问题：

(1)、随着时间的推移记录GPS读数，并且由于设备故障或人类中断等行为导致GPS读数长时间丢失，可能会出现不确定性问题，这可能导致用户旅行中提取的GPS轨迹不够精确。

(2)、用户通常每天仅在几条例行路线上行驶，所以每个用户的GPS轨迹仅覆盖道路网的有限路段。因此，在从未旅行的路段上的用户旅行行为数据不可知。另外，概率估计对于路线推荐也是至关重要的，特别是对于旅行行为不可用的用户以及用户打算去不熟悉的地点的用户。此外，时间因素也在路线推荐中起着重要的作用，如何利用历史轨迹中的时间信息也值得研究。

(3)、现有的路线推荐方法太注重路线的距离，而忽略了距离与用户旅行行为概率的结合，从而不能确定旅行最可能的路线。

发明内容

本发明的目的在于：提供一种基于用户历史GPS轨迹的协同旅行路线推荐方法，通过估计旅行行为的频率来解决用户在未旅行的路段上旅行行为数据不可知的问题，为用户推荐更适合的个性化旅行路线。

本发明采用的技术方案如下：

一种基于用户历史GPS轨迹的协同旅行路线推荐方法，包括以下步骤：

S1，数据准备

将用户的历史GPS轨迹与道路网络进行匹配，提取用户的旅行行为；

S2，估计旅行行为频率

计算用户在时间间隔内各个旅行行为之间的相关性，并平滑用户旅行行为之间的频率，再采用矩阵分解方法处理用户的旅行行为以获得估计的旅行行为频率；

S3，路线计算

根据估计的旅行行为频率计算旅行行为概率，并根据旅行行为概率来加权道路网络图，得到推荐的旅行路线。

其中，步骤S1中，在进行历史GPS轨迹与道路网络匹配之前，采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹。

其中，采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹的具体步骤为：

S1.1，找到导致正常采样率和异常采样率的最大求和熵的阈值θ；

S1.2，跟踪历史GPS轨迹，当两个连续的历史GPS轨迹读数之间的时间间隔超过阈值θ时，GPS跟踪结束，产生新的GPS轨迹。

其中，步骤S1.1中，找到导致正常采样率和异常采样率的熵的KSW阈值法方法为：

有不同的采样率分别为s1,s2,s3,…,sn，f1、f2、f3、…、fn为s1,s2,s3,…,s的观测的数量，f1、f2、f3、…、fn是对应的不同采样的数量，

N为不同采样率的总数，即公式：

A为i∈{0,1,…,t}的灰度分布，B为i∈{t+1,…,N}的灰度分布，概率分布为：

A:

B:

其中

t为分割阈值；

选择阈值t区分两种采样率，则与正常采样率的分布相关的熵为:

与异常采样率分布相关的熵为:

正常采样率与异常采样率之间的阈值区别在1到n之间，找到导致正常采样率分布和异常采样率的熵的阈值:

θ＝E₁+E₂ (3)。

其中，步骤S1中，采用地图匹配方法将用户的历史GPS轨迹与道路网络进行匹配，该地图匹配方法采用ST-Matching算法。

其中，步骤S2中，估计旅行行为频率的具体步骤为：

S2.1，生成用户行为矩阵

找到n个旅行片段轨迹B＝{b1,b2,…,bn}，其中B包含所有可能的旅行行为；给定一组m个用户U＝{u1,u2,…,um}和一组旅行行为B＝{b1,b2,…,bn}，使用成对的(u,b)进行用户行为矩阵，矩阵中的元素是成对的频率pl(ui,bj)，Bi,j＝pl(ui,bj)；

S2.2，计算用户在时间间隔内各个旅行行为之间的相关性

相关联，

为矩阵分解得到的潜在特征，与用户和路段相关联，用户ui展示旅行行为bj的预测频率UB_i,j为:

其中，T为转置符号,k是向量的长度，潜在因素是用户和旅行行为之间的相互作用的基础，乘积代表列向量乘以行向量，得到的为一个具体数值，向量O_ui和m_bj的乘积越大意味着用户ui发生旅行行为bj的可能性越大。

其中，步骤S3进行路线计算的具体步骤为：

S3.1，给定时间t，起始点o和目的地d，向用户u推荐路线R＝(r1,r2,r3,…,rn)，r1.start＝o，rn.end＝d，并且沿路线的旅行行为P(R|u,t)概率最大，通过下式最大化概率：

P(R|u,t)＝P(r1,r2,r3,…,rn|u,t)＝p(r1,r2,r3,…,rn,u,t)/P(u,t) (6)

，当用户u和时间t给定时，P(u,t)是不变的，可以将其最大化：

P(r1,r2,r3,…,rn,u,t)＝P(b1,b2,b3,…,bn,u)＝P((u,b1),(u,b2),(u,b3),…,(u,bn)) (7)

其中bi＝(ri,t)；

S3.2，使用朴素贝叶斯模型最大化旅行行为概率的路线，由条件概率得：

P(u,b1)*P((u,b2)|(u,b1))*…*P((u,bn)|(u,b1),…,(u,bn-1)) (8)

旅行行为在朴素贝叶斯模型中彼此独立，公式(7)变换为：

P(u,b1)*P(u,b2)*…*P(u,bn) (9)

P(u,bi)是用户u的bi行为的估计值，需要一个确定一系类旅行行为的最大化的方程式：R＝Arg max_RCGP(R|u,t)＝Arg maxr_{1,…,rn∈G,E}P(u,b1)*P(u,b2)*…*P(u,bn) (10)

其中:R＝(r1,r2,r3,…,rn)r1.start＝o，rn.end＝d；G＝(V，E)是道路网络，bi＝(ri，t)；

S3.3，给出用户u和时间t，道路网络G中的每个路段ei对应于旅行行为bi＝(ei,t)，每个路段ei作为旅行行为概率倒数取对数的加权；在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径。

其中，若用户出现旅行行为，则根据用户旅行行为的总数来计算旅行行为的频率，给定道路网G＝(V,E)和旅行行为b，用户u的旅行行为b的概率采用公式(11)计算：

其中P(u,b)是用户u在t时刻道路片段ei旅行的概率，S是用户u的一系类旅行行为，

为用矩阵分解估计的旅行概率。

若用户没有出现旅行行为，在这种情况下，使用拉普拉斯平滑方法来估计这些旅行行为的概率，以避免为任何旅行行为分配零概率，使得用户可以行进到道路网络中的任何路段；拉普拉斯平滑法采用公式(14)进行计算：

其中d是总的旅行行为的数量a是平滑参数，这个公式可以为用户从未旅行的路段分配非零概率。

其中，使等式(10)中的P(u，b1)*P(u，b2)*...*P(u，bn)最大化，以便找到最大行程行为概率的路线；为了将乘法转换为典型路由规划算法所需的汇总格式，令

L＝1/(P(u，b1)*P(u，b2)*...*P(u，bn) (12)，

所以问题转化为L的最小化，将公式(12)两边取对数，得公式(13)：

计算旅行行为概率；用公式(12)(13)(14)最大化公式(10)得到用户u在路段b1,…,bi上的最大旅行概率。

其中，步骤S3.3中，使用启发式最短路径算法A-star算法，在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径，A-star的算法包括连续计算最短路径，该路径从起始点开始，并延伸到其他顶点，直到到达目的地。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

本发明中，通过提取道路网络和用户的历史GPS轨迹，并构建用户旅行行为矩阵来估计旅行行为频率，根据估计的旅行行为频率计算旅行行为概率，并根据旅行行为概率来加权道路网络图，得到推荐的旅行路线，为用户推荐更适合的个性化旅行路线，推荐出来的旅行路线能够更加符合用户的需求。

附图说明

图1是两个用户在某一路段和时间段的旅行特性；

图2是本发明的协同旅行路线推荐的框架说明；

图3为用户行为矩阵。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本发明提出了一种基于用户历史GPS轨迹的协同旅行路线推荐方法，为用户进行个性化旅行路线推荐。该方法可以分为三个步骤：

步骤S1，数据准备

使用了两种类型的数据集：道路网络和用户的历史GPS轨迹。首先，使用提出的基于熵的KSW阈值法将一段GPS轨迹分为片段轨迹。为了提取每个用户的旅行行为，GPS跟踪将使用ST-Matching算法与道路网络匹配。在地图匹配之后，用户轨迹在路网上被表示为用户路线。然后可以提取每个用户的旅行行为，并计算用户的旅行行为频率。

步骤S1.1，轨迹划分为GPS轨迹，由于GPS信号丢失，GPS读数可能长时间没有更新。应用轨迹分割的时间间隔阈值基本上将GPS采样率分为两类：正常采样率小于或等于阈值，异常采样率大于阈值。当两个连续GPS读数之间的时间间隔落入异常采样率时，轨迹将被划分。使用熵的KSW阈值，以确定时间间隔阈值。将采样率分为正常或异常类，使得当采样率是异常时，划分轨迹。

有不同的采样率分别为(s1,s2,s3,…sn)，则f1,f2,…,fn为s1,s2,s3,…,sn的观测值，即f1、f2、f3、…、fn是对应的不同采样的数量，

N为不同采样率的总数。有公式：

A为i∈{0,1,…,t}的灰度分布，B为i∈{t+1,…,L-1}的灰度分布，概率分布为：

A:

B:

其中

t为分割阈值；

与异常采样率分布相关的熵为:

正常采样率与异常采样率之间的KSW阈值区别在1到n之间，找到导致正常采样率分布和异常采样率的最大求和熵的阈值:

θ＝E₁+E₂ (3)。

θ可以有效区分两种采样率的分布；并且当两个连续的GPS读数之间的时间间隔超过阈值θ时，GPS跟踪结束，并且应该产生新的GPS迹线。

步骤S1.2，匹配道路网上的GPS轨迹，采用ST-Matching算法的地图匹配方法，将GPS轨迹与道路网络匹配将GPS轨迹与路网匹配后，从GPS轨迹中提取每个用户的旅行行为。

步骤S2，通过构建用户旅行行为矩阵来估计旅行行为频率

对于每个用户，许多路段和时间间隔的旅行行为频率为零。第二步是通过构建用户旅行行为矩阵来估计旅行行为频率，矩阵中的每个元素作为用户旅行行为的频率。首先，通过考虑用户在附近时间间隔内的行为与行为之间的相关性，来平滑用户行为之间的频率。然后，矩阵分解方法处理用户行进行为矩阵以获得估计的行驶行为频率，其反映用户的旅行行为概率。

步骤S2.1，生成用户行为行为矩阵，旅行行为频率估计的第一步是找到n旅行B＝{b1,b2,…,bn}，其中B包含所有可能的旅行行为。给定一组m个用户U＝{u1,u2,…,um}和一组旅行行为B＝{b1,b2,…,bn}，可以使用成对的(u,b)来用户旅行的行为矩阵。矩阵中的元素是成对的频率(u_i,b_j)。可以用pl(ui,bj)表示。Bi,j＝pl(ui,bj)。

步骤S2.2，使用衰减函数的旅行行为之间的时间相关性,用户从历史GPS轨迹中提取的旅行行为有时是非常有限的，因此用户在路段上的许多时间间隔中的旅行行为的频率是未知的。在一段时间内发生的旅行行为应该与类似时间段发生的旅行行为有一些相关性。在较短时间间隔内对旅行行为赋予更高的权重。具有旅行行为的用户u的频率可以由下等式表示：

其中，n表示一天中总时间间隔的总数，b表示在路段e上的旅行行为,ti与tj为轨迹上的两个时间点，ti与tj相隔的时间越长上式的值就越小，上式得出了旅行行为之间在一段时间间隔的相关性。

步骤S2.3，为用户和旅行行为构建用户的行为矩阵，使用矩阵分解方法来预测用户的旅行行为频率。每个用户ui与潜在因素的向量相关联

并且每个旅行行为bj与向量相关联

k是向量的长度。用户ui的旅行行为bj通过O_ui和m_bj的点积得到预测频率UB_i,j为:

其中，T为转置符号,k是向量的长度，潜在因素是用户和旅行行为之间的相互作用的基础，向量O_ui和m_bj的乘积越大意味着用户ui发生旅行行为bj的可能性越大。

步骤S3，路线计算

其基于初始贝叶斯模型搜索用户的最大概率路线。朴素的贝叶斯模型假设旅行行为是相互独立的，允许其有效地找到最大概率的路线。从估计的旅行行为频率计算旅行行为概率，其表示用户将展示该旅行行为的概率。然后从基于旅行行为概率转换的对数行驶行为概率来加权道路网络图。最后，用迪杰斯特拉算法计算最小加权路线。

步骤S3.1，给定时间t，起始点o和目的地d，向用户u推荐路线R＝(r1,r2,r3,…,rn)，r为各个代表的路段，r1.start＝o，rn.end＝d，并且其中沿路线的旅行行为P(R|u,t)概率最大，通过下式最大化概率：

P(R|u,t)＝P(r1,r2,r3,…,rn|u,t)＝p(r1,r2,r3,…,rn,u,t)/P(u,t) (6)

当用户u和时间t给定时，P(u,t)是不变的，可以将其最大化：

其中bi＝(ri,t)；

P(u,b1)*P((u,b2)|(u,b1))*…*P((u,bn)|(u,b1),…,(u,bn-1)) (8)

旅行行为在朴素贝叶斯模型中彼此独立，公式(7)变换为：

P(u,b1)*P(u,b2)*…*P(u,bn) (9)

P(u,bi)是用户u的bi行为的估计值，需要一个确定一系类旅行行为的最大化的方程式：R＝Arg max_RCGP(R|u,t)＝Argmax_{r1,…,rn∈G,E}P(u,b1)*P(u,b2)*…*P(u,bn) (10)

若用户出现旅行行为，则根据用户旅行行为的总数来计算旅行行为的频率，给定道路网G＝(V,E)和旅行行为b，用户u的旅行行为b的概率采用公式(11)计算：

为用矩阵分解估计的旅行概率。

使等式(10)中的P(u，b1)*P(u，b2)*...*P(u，bn)最大化，以便找到最大行程行为概率的路线；为了将乘法转换为典型路由规划算法所需的汇总格式，令

L＝1/(P(u，b1)*P(u，b2)*...*P(u，bn) (12)，

步骤S3.3中，使用启发式最短路径算法A-star算法，在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径，A-star的算法包括连续计算最短路径，该路径从起始点开始，并延伸到其他顶点，直到到达目的地。

实施例1

S1，数据准备

S2，估计旅行行为频率

S3，路线计算

实施例2

在实施例一的基础上，步骤S1中，在进行历史GPS轨迹与道路网络匹配之前，采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹。

实施例3

在实施例二的基础上，采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹的具体步骤为：

实施例4

在实施例三的基础上，步骤S1.1中，找到导致正常采样率和异常采样率的熵的KSW阈值法方法为：

有不同的采样率分别为s1,s2,s3,…,sn，f1、f2、f3、…、fn为s1,s2,s3,…,s的观测的数量，即f1、f2、f3、…、fn代表对应的不同采样的数量，

N为不同采样率的总数，即公式：

分割阈值为t，A为i∈{0,1,…,t}的灰度分布，B为i∈{t+1,…,N}的灰度分布，概率分布为：

A:

B:

其中

与异常采样率分布相关的熵为:

θ＝E₁+E₂ (3)。

实施例5

在上述实施例的基础上，步骤S1中，采用地图匹配方法将用户的历史GPS轨迹与道路网络进行匹配，该地图匹配方法采用ST-Matching算法。

实施例6

在上述实施例的基础上，步骤S2中，估计旅行行为频率的具体步骤为：

S2.1，生成用户行为矩阵

S2.2，计算用户在时间间隔内各个旅行行为之间的相关性

Claims

1.一种基于用户历史GPS轨迹的协同旅行路线推荐方法，其特征在于，包括以下步骤：

S1，数据准备

S2，估计旅行行为频率

S3，路线计算

2.如权利要求1所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法，其特征在于，步骤S1中，在进行历史GPS轨迹与道路网络匹配之前，采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹。

3.如权利要求2所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法，其特征在于，采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹的具体步骤为：

4.如权利要求3所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法，其特征在于，步骤S1.1中，找到导致正常采样率和异常采样率的熵的KSW阈值法方法为：

有不同的采样率分别为s1，s2，s3，....，sn，f1、f2、f3、...、fn为s1，s2，s3，....，s的观测的数量，

为不同采样率的总数，即公式：

分割阈值为t，A为i∈{0，1，...，t}的灰度分布，B为i∈{t+1，...，N}的灰度分布，概率分布为：

A：

B：

其中

选择阈值t区分两种采样率，则与正常采样率的分布相关的熵为：

与异常采样率分布相关的熵为：

正常采样率与异常采样率之间的阈值区别在1到n之间，找到导致正常采样率分布和异常采样率的熵的阈值：

θ＝E₁+E₂ (3)。

5.如权利要求1所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法，其特征在于，步骤S1中，采用地图匹配方法将用户的历史GPS轨迹与道路网络进行匹配，该地图匹配方法采用ST-Matching算法。

6.如权利要求1所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法，其特征在于，步骤S2中，估计旅行行为频率的具体步骤为：

S2.1，生成用户行为矩阵

找到n个旅行片段轨迹B＝{b1，b2，...，bn}，其中B包含所有可能的旅行行为；给定一组m个用户U＝{u1，u2，...，um}和一组旅行行为B＝{b1，b2，...，bn}，使用成对的(u，b)进行用户行为矩阵，矩阵中的元素是成对的频率pl(ui，bj)，Bi，j＝pl(ui，bj)；

S2.2，计算用户在时间间隔内各个旅行行为之间的相关性