CN107747947B - 一种基于用户历史gps轨迹的协同旅行路线推荐方法 - Google Patents
一种基于用户历史gps轨迹的协同旅行路线推荐方法 Download PDFInfo
- Publication number
- CN107747947B CN107747947B CN201710993263.0A CN201710993263A CN107747947B CN 107747947 B CN107747947 B CN 107747947B CN 201710993263 A CN201710993263 A CN 201710993263A CN 107747947 B CN107747947 B CN 107747947B
- Authority
- CN
- China
- Prior art keywords
- travel
- user
- probability
- behavior
- behaviors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/20—Instruments for performing navigational calculations
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/3453—Special cost functions, i.e. other than distance or default speed limit of road segments
- G01C21/3484—Personalized, e.g. from learned user behaviour or user-defined profiles
Abstract
本发明公开了一种基于用户历史GPS轨迹的协同旅行路线推荐方法,属于路线规划技术领域,其目的在于提供一种基于用户历史GPS轨迹的协同旅行路线推荐方法,通过估计旅行行为的频率来解决用户在未旅行的路段上旅行行为数据不可知的问题,为用户推荐更适合的个性化旅行路线。该推荐方法通过提取道路网络和用户的历史GPS轨迹,并构建用户旅行行为矩阵来估计旅行行为频率,根据估计的旅行行为频率计算旅行行为概率,并根据旅行行为概率来加权道路网络图,得到推荐的旅行路线,为用户推荐更适合的个性化旅行路线,推荐出来的旅行路线能够更加符合用户的需求。
Description
技术领域
本发明属于路线规划技术领域,涉及一种路线的推荐方法,尤其涉及一种基于用于历史GPS轨迹的路线推荐方法。
背景技术
近年来,随着交通工具的普及以及人们出行尤其是远距离出行的增多,运行在各类导航仪、移动终端上的路线导航系统(包含汽车、自行车、步行导航)得到快速发展。尤其是安装在移动终端的利用GPS的电子地图程序,凭借其低廉的价格、实时更新的地图数据以及与其他应用软件方便结合的能力,给人们出行的方案带来了一场革命。用户只需要在电子地图上标出起点和终点,就可以方便的找到出行的路线。
在当前背景下,导航路线的自动、优化规划算法成为热门研究领域。国内外地图、位置、导航等领域的服务厂商均投入大量精力进行导航算法的优化改进。国外较著名的包括谷歌地图和苹果地图等,国内较著名的有百度地图、高德地图等,以及各类导航仪生产商家自己生产制作的地图服务系统。从用户体验度来说,在最短的时间内提供出使用者所认为的最优化的道路行驶方案是该领域的终极目标。
对于这个目标可从两个方面来看:根据距离计算出距离最短路径,或者根据道路情况推荐的用时最短的路径。现有的线路推荐大多要么是最短用时或者是最短路径的方案,而现实生活中,一大部分人往往更喜欢在自己喜欢或熟悉的路段行驶,现在的路径推荐服务往往都没有考虑到用户的这种偏好,没有个性化的路线推荐方案。换句话说,有的人不看重行驶的距离和时间,只想在自己喜欢的路线行驶。
个性化旅行路线推荐是一个重要的研究课题。基于道路网络和用户的旅游偏好,个性化的行驶路线的建议引用了两个地理位置之间的平均路线规划。但用户的具体旅行偏好受到许多因素的影响,如距离、交通量、旅行时间、天气、燃料消耗、安全性以及许多其他隐含和隐藏的因素。因此,难以确定综合用户旅行偏好度量以开发个性化旅行路线推荐。随着全球定位系统技术的进步和移动设备的普及,GPS轨迹中的大量人类运动数据已经被收集并可用于研究、加以利用,为提供个性化旅行路线推荐提供了重要的数据支撑。用户的历史GPS轨迹通常会包含有关旅行时间和位置的信息,这有助于了解用户的旅行行为。
数年来,国内外学者对路线轨迹推荐进行了深入的研究,取得了丰硕的成果,包括对推荐模型的讨论,提出新方案,对现有方案的分析和改进等。然而,当使用GPS轨迹进行个性化旅行路线推荐时,将会面临如下常见问题:
(1)、随着时间的推移记录GPS读数,并且由于设备故障或人类中断等行为导致GPS读数长时间丢失,可能会出现不确定性问题,这可能导致用户旅行中提取的GPS轨迹不够精确。
(2)、用户通常每天仅在几条例行路线上行驶,所以每个用户的GPS轨迹仅覆盖道路网的有限路段。因此,在从未旅行的路段上的用户旅行行为数据不可知。另外,概率估计对于路线推荐也是至关重要的,特别是对于旅行行为不可用的用户以及用户打算去不熟悉的地点的用户。此外,时间因素也在路线推荐中起着重要的作用,如何利用历史轨迹中的时间信息也值得研究。
(3)、现有的路线推荐方法太注重路线的距离,而忽略了距离与用户旅行行为概率的结合,从而不能确定旅行最可能的路线。
发明内容
本发明的目的在于:提供一种基于用户历史GPS轨迹的协同旅行路线推荐方法,通过估计旅行行为的频率来解决用户在未旅行的路段上旅行行为数据不可知的问题,为用户推荐更适合的个性化旅行路线。
本发明采用的技术方案如下:
一种基于用户历史GPS轨迹的协同旅行路线推荐方法,包括以下步骤:
S1,数据准备
将用户的历史GPS轨迹与道路网络进行匹配,提取用户的旅行行为;
S2,估计旅行行为频率
计算用户在时间间隔内各个旅行行为之间的相关性,并平滑用户旅行行为之间的频率,再采用矩阵分解方法处理用户的旅行行为以获得估计的旅行行为频率;
S3,路线计算
根据估计的旅行行为频率计算旅行行为概率,并根据旅行行为概率来加权道路网络图,得到推荐的旅行路线。
其中,步骤S1中,在进行历史GPS轨迹与道路网络匹配之前,采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹。
其中,采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹的具体步骤为:
S1.1,找到导致正常采样率和异常采样率的最大求和熵的阈值θ;
S1.2,跟踪历史GPS轨迹,当两个连续的历史GPS轨迹读数之间的时间间隔超过阈值θ时,GPS跟踪结束,产生新的GPS轨迹。
其中,步骤S1.1中,找到导致正常采样率和异常采样率的熵的KSW阈值法方法为:
有不同的采样率分别为s1,s2,s3,…,sn,f1、f2、f3、…、fn为s1,s2,s3,…,s的观测的数量,f1、f2、f3、…、fn是对应的不同采样的数量,N为不同采样率的总数,即公式:A为i∈{0,1,…,t}的灰度分布,B为i∈{t+1,…,N}的灰度分布,概率分布为:
选择阈值t区分两种采样率,则与正常采样率的分布相关的熵为:
与异常采样率分布相关的熵为:
正常采样率与异常采样率之间的阈值区别在1到n之间,找到导致正常采样率分布和异常采样率的熵的阈值:
θ=E1+E2 (3)。
其中,步骤S1中,采用地图匹配方法将用户的历史GPS轨迹与道路网络进行匹配,该地图匹配方法采用ST-Matching算法。
其中,步骤S2中,估计旅行行为频率的具体步骤为:
S2.1,生成用户行为矩阵
找到n个旅行片段轨迹B={b1,b2,…,bn},其中B包含所有可能的旅行行为;给定一组m个用户U={u1,u2,…,um}和一组旅行行为B={b1,b2,…,bn},使用成对的(u,b)进行用户行为矩阵,矩阵中的元素是成对的频率pl(ui,bj),Bi,j=pl(ui,bj);
S2.2,计算用户在时间间隔内各个旅行行为之间的相关性
相关性的计算公式为:
其中,n表示一天中总时间间隔的总数,b表示在路段e上的旅行行为,ti与tj相隔的时间越长上式的值就越小,ti与tj为轨迹上的两个时间点;
S2.3,获得估计的旅行行为频率
其中,T为转置符号,k是向量的长度,潜在因素是用户和旅行行为之间的相互作用的基础,乘积代表列向量乘以行向量,得到的为一个具体数值,向量Oui和mbj的乘积越大意味着用户ui发生旅行行为bj的可能性越大。
其中,步骤S3进行路线计算的具体步骤为:
S3.1,给定时间t,起始点o和目的地d,向用户u推荐路线R=(r1,r2,r3,…,rn),r1.start=o,rn.end=d,并且沿路线的旅行行为P(R|u,t)概率最大,通过下式最大化概率:
P(R|u,t)=P(r1,r2,r3,…,rn|u,t)=p(r1,r2,r3,…,rn,u,t)/P(u,t) (6)
,当用户u和时间t给定时,P(u,t)是不变的,可以将其最大化:
P(r1,r2,r3,…,rn,u,t)=P(b1,b2,b3,…,bn,u)=P((u,b1),(u,b2),(u,b3),…,(u,bn)) (7)
其中bi=(ri,t);
S3.2,使用朴素贝叶斯模型最大化旅行行为概率的路线,由条件概率得:
P(u,b1)*P((u,b2)|(u,b1))*…*P((u,bn)|(u,b1),…,(u,bn-1)) (8)
旅行行为在朴素贝叶斯模型中彼此独立,公式(7)变换为:
P(u,b1)*P(u,b2)*…*P(u,bn) (9)
P(u,bi)是用户u的bi行为的估计值,需要一个确定一系类旅行行为的最大化的方程式:R=Arg maxRCGP(R|u,t)=Arg maxr1,…,rn∈G,EP(u,b1)*P(u,b2)*…*P(u,bn) (10)
其中:R=(r1,r2,r3,…,rn)r1.start=o,rn.end=d;G=(V,E)是道路网络,bi=(ri,t);
S3.3,给出用户u和时间t,道路网络G中的每个路段ei对应于旅行行为bi=(ei,t),每个路段ei作为旅行行为概率倒数取对数的加权;在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径。
其中,若用户出现旅行行为,则根据用户旅行行为的总数来计算旅行行为的频率,给定道路网G=(V,E)和旅行行为b,用户u的旅行行为b的概率采用公式(11)计算:
若用户没有出现旅行行为,在这种情况下,使用拉普拉斯平滑方法来估计这些旅行行为的概率,以避免为任何旅行行为分配零概率,使得用户可以行进到道路网络中的任何路段;拉普拉斯平滑法采用公式(14)进行计算:
其中d是总的旅行行为的数量a是平滑参数,这个公式可以为用户从未旅行的路段分配非零概率。
其中,使等式(10)中的P(u,b1)*P(u,b2)*...*P(u,bn)最大化,以便找到最大行程行为概率的路线;为了将乘法转换为典型路由规划算法所需的汇总格式,令
L=1/(P(u,b1)*P(u,b2)*...*P(u,bn) (12),
所以问题转化为L的最小化,将公式(12)两边取对数,得公式(13):
计算旅行行为概率;用公式(12)(13)(14)最大化公式(10)得到用户u在路段b1,…,bi上的最大旅行概率。
其中,步骤S3.3中,使用启发式最短路径算法A-star算法,在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径,A-star的算法包括连续计算最短路径,该路径从起始点开始,并延伸到其他顶点,直到到达目的地。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明中,通过提取道路网络和用户的历史GPS轨迹,并构建用户旅行行为矩阵来估计旅行行为频率,根据估计的旅行行为频率计算旅行行为概率,并根据旅行行为概率来加权道路网络图,得到推荐的旅行路线,为用户推荐更适合的个性化旅行路线,推荐出来的旅行路线能够更加符合用户的需求。
附图说明
图1是两个用户在某一路段和时间段的旅行特性;
图2是本发明的协同旅行路线推荐的框架说明;
图3为用户行为矩阵。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提出了一种基于用户历史GPS轨迹的协同旅行路线推荐方法,为用户进行个性化旅行路线推荐。该方法可以分为三个步骤:
步骤S1,数据准备
使用了两种类型的数据集:道路网络和用户的历史GPS轨迹。首先,使用提出的基于熵的KSW阈值法将一段GPS轨迹分为片段轨迹。为了提取每个用户的旅行行为,GPS跟踪将使用ST-Matching算法与道路网络匹配。在地图匹配之后,用户轨迹在路网上被表示为用户路线。然后可以提取每个用户的旅行行为,并计算用户的旅行行为频率。
步骤S1.1,轨迹划分为GPS轨迹,由于GPS信号丢失,GPS读数可能长时间没有更新。应用轨迹分割的时间间隔阈值基本上将GPS采样率分为两类:正常采样率小于或等于阈值,异常采样率大于阈值。当两个连续GPS读数之间的时间间隔落入异常采样率时,轨迹将被划分。使用熵的KSW阈值,以确定时间间隔阈值。将采样率分为正常或异常类,使得当采样率是异常时,划分轨迹。
有不同的采样率分别为(s1,s2,s3,…sn),则f1,f2,…,fn为s1,s2,s3,…,sn的观测值,即f1、f2、f3、…、fn是对应的不同采样的数量,N为不同采样率的总数。有公式:A为i∈{0,1,…,t}的灰度分布,B为i∈{t+1,…,L-1}的灰度分布,概率分布为:
选择阈值t区分两种采样率,则与正常采样率的分布相关的熵为:
与异常采样率分布相关的熵为:
正常采样率与异常采样率之间的KSW阈值区别在1到n之间,找到导致正常采样率分布和异常采样率的最大求和熵的阈值:
θ=E1+E2 (3)。
θ可以有效区分两种采样率的分布;并且当两个连续的GPS读数之间的时间间隔超过阈值θ时,GPS跟踪结束,并且应该产生新的GPS迹线。
步骤S1.2,匹配道路网上的GPS轨迹,采用ST-Matching算法的地图匹配方法,将GPS轨迹与道路网络匹配将GPS轨迹与路网匹配后,从GPS轨迹中提取每个用户的旅行行为。
步骤S2,通过构建用户旅行行为矩阵来估计旅行行为频率
对于每个用户,许多路段和时间间隔的旅行行为频率为零。第二步是通过构建用户旅行行为矩阵来估计旅行行为频率,矩阵中的每个元素作为用户旅行行为的频率。首先,通过考虑用户在附近时间间隔内的行为与行为之间的相关性,来平滑用户行为之间的频率。然后,矩阵分解方法处理用户行进行为矩阵以获得估计的行驶行为频率,其反映用户的旅行行为概率。
步骤S2.1,生成用户行为行为矩阵,旅行行为频率估计的第一步是找到n旅行B={b1,b2,…,bn},其中B包含所有可能的旅行行为。给定一组m个用户U={u1,u2,…,um}和一组旅行行为B={b1,b2,…,bn},可以使用成对的(u,b)来用户旅行的行为矩阵。矩阵中的元素是成对的频率(ui,bj)。可以用pl(ui,bj)表示。Bi,j=pl(ui,bj)。
步骤S2.2,使用衰减函数的旅行行为之间的时间相关性,用户从历史GPS轨迹中提取的旅行行为有时是非常有限的,因此用户在路段上的许多时间间隔中的旅行行为的频率是未知的。在一段时间内发生的旅行行为应该与类似时间段发生的旅行行为有一些相关性。在较短时间间隔内对旅行行为赋予更高的权重。具有旅行行为的用户u的频率可以由下等式表示:
其中,n表示一天中总时间间隔的总数,b表示在路段e上的旅行行为,ti与tj为轨迹上的两个时间点,ti与tj相隔的时间越长上式的值就越小,上式得出了旅行行为之间在一段时间间隔的相关性。
步骤S2.3,为用户和旅行行为构建用户的行为矩阵,使用矩阵分解方法来预测用户的旅行行为频率。每个用户ui与潜在因素的向量相关联并且每个旅行行为bj与向量相关联k是向量的长度。用户ui的旅行行为bj通过Oui和mbj的点积得到预测频率UBi,j为:
其中,T为转置符号,k是向量的长度,潜在因素是用户和旅行行为之间的相互作用的基础,向量Oui和mbj的乘积越大意味着用户ui发生旅行行为bj的可能性越大。
步骤S3,路线计算
其基于初始贝叶斯模型搜索用户的最大概率路线。朴素的贝叶斯模型假设旅行行为是相互独立的,允许其有效地找到最大概率的路线。从估计的旅行行为频率计算旅行行为概率,其表示用户将展示该旅行行为的概率。然后从基于旅行行为概率转换的对数行驶行为概率来加权道路网络图。最后,用迪杰斯特拉算法计算最小加权路线。
步骤S3.1,给定时间t,起始点o和目的地d,向用户u推荐路线R=(r1,r2,r3,…,rn),r为各个代表的路段,r1.start=o,rn.end=d,并且其中沿路线的旅行行为P(R|u,t)概率最大,通过下式最大化概率:
P(R|u,t)=P(r1,r2,r3,…,rn|u,t)=p(r1,r2,r3,…,rn,u,t)/P(u,t) (6)
当用户u和时间t给定时,P(u,t)是不变的,可以将其最大化:
P(r1,r2,r3,…,rn,u,t)=P(b1,b2,b3,…,bn,u)=P((u,b1),(u,b2),(u,b3),…,(u,bn)) (7)
其中bi=(ri,t);
S3.2,使用朴素贝叶斯模型最大化旅行行为概率的路线,由条件概率得:
P(u,b1)*P((u,b2)|(u,b1))*…*P((u,bn)|(u,b1),…,(u,bn-1)) (8)
旅行行为在朴素贝叶斯模型中彼此独立,公式(7)变换为:
P(u,b1)*P(u,b2)*…*P(u,bn) (9)
P(u,bi)是用户u的bi行为的估计值,需要一个确定一系类旅行行为的最大化的方程式:R=Arg maxRCGP(R|u,t)=Argmaxr1,…,rn∈G,EP(u,b1)*P(u,b2)*…*P(u,bn) (10)
其中:R=(r1,r2,r3,…,rn)r1.start=o,rn.end=d;G=(V,E)是道路网络,bi=(ri,t);
S3.3,给出用户u和时间t,道路网络G中的每个路段ei对应于旅行行为bi=(ei,t),每个路段ei作为旅行行为概率倒数取对数的加权;在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径。
若用户出现旅行行为,则根据用户旅行行为的总数来计算旅行行为的频率,给定道路网G=(V,E)和旅行行为b,用户u的旅行行为b的概率采用公式(11)计算:
若用户没有出现旅行行为,在这种情况下,使用拉普拉斯平滑方法来估计这些旅行行为的概率,以避免为任何旅行行为分配零概率,使得用户可以行进到道路网络中的任何路段;拉普拉斯平滑法采用公式(14)进行计算:
其中d是总的旅行行为的数量a是平滑参数,这个公式可以为用户从未旅行的路段分配非零概率。
使等式(10)中的P(u,b1)*P(u,b2)*...*P(u,bn)最大化,以便找到最大行程行为概率的路线;为了将乘法转换为典型路由规划算法所需的汇总格式,令
L=1/(P(u,b1)*P(u,b2)*...*P(u,bn) (12),
所以问题转化为L的最小化,将公式(12)两边取对数,得公式(13):
计算旅行行为概率;用公式(12)(13)(14)最大化公式(10)得到用户u在路段b1,…,bi上的最大旅行概率。
步骤S3.3中,使用启发式最短路径算法A-star算法,在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径,A-star的算法包括连续计算最短路径,该路径从起始点开始,并延伸到其他顶点,直到到达目的地。
实施例1
一种基于用户历史GPS轨迹的协同旅行路线推荐方法,包括以下步骤:
S1,数据准备
将用户的历史GPS轨迹与道路网络进行匹配,提取用户的旅行行为;
S2,估计旅行行为频率
计算用户在时间间隔内各个旅行行为之间的相关性,并平滑用户旅行行为之间的频率,再采用矩阵分解方法处理用户的旅行行为以获得估计的旅行行为频率;
S3,路线计算
根据估计的旅行行为频率计算旅行行为概率,并根据旅行行为概率来加权道路网络图,得到推荐的旅行路线。
实施例2
在实施例一的基础上,步骤S1中,在进行历史GPS轨迹与道路网络匹配之前,采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹。
实施例3
在实施例二的基础上,采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹的具体步骤为:
S1.1,找到导致正常采样率和异常采样率的最大求和熵的阈值θ;
S1.2,跟踪历史GPS轨迹,当两个连续的历史GPS轨迹读数之间的时间间隔超过阈值θ时,GPS跟踪结束,产生新的GPS轨迹。
实施例4
在实施例三的基础上,步骤S1.1中,找到导致正常采样率和异常采样率的熵的KSW阈值法方法为:
有不同的采样率分别为s1,s2,s3,…,sn,f1、f2、f3、…、fn为s1,s2,s3,…,s的观测的数量,即f1、f2、f3、…、fn代表对应的不同采样的数量,N为不同采样率的总数,即公式:分割阈值为t,A为i∈{0,1,…,t}的灰度分布,B为i∈{t+1,…,N}的灰度分布,概率分布为:
选择阈值t区分两种采样率,则与正常采样率的分布相关的熵为:
与异常采样率分布相关的熵为:
正常采样率与异常采样率之间的阈值区别在1到n之间,找到导致正常采样率分布和异常采样率的熵的阈值:
θ=E1+E2 (3)。
实施例5
在上述实施例的基础上,步骤S1中,采用地图匹配方法将用户的历史GPS轨迹与道路网络进行匹配,该地图匹配方法采用ST-Matching算法。
实施例6
在上述实施例的基础上,步骤S2中,估计旅行行为频率的具体步骤为:
S2.1,生成用户行为矩阵
找到n个旅行片段轨迹B={b1,b2,…,bn},其中B包含所有可能的旅行行为;给定一组m个用户U={u1,u2,…,um}和一组旅行行为B={b1,b2,…,bn},使用成对的(u,b)进行用户行为矩阵,矩阵中的元素是成对的频率pl(ui,bj),Bi,j=pl(ui,bj);
S2.2,计算用户在时间间隔内各个旅行行为之间的相关性
相关性的计算公式为:
其中,n表示一天中总时间间隔的总数,b表示在路段e上的旅行行为,ti与tj相隔的时间越长上式的值就越小,ti与tj为轨迹上的两个时间点;
S2.3,获得估计的旅行行为频率
其中,T为转置符号,k是向量的长度,潜在因素是用户和旅行行为之间的相互作用的基础,上述乘积代表列向量乘以行向量,得到的为一个具体数值,u用户对应旅行行为b的概率,向量Oui和mbj的乘积越大意味着用户ui发生旅行行为bj的可能性越大。
实施例7
在上述实施例的基础上,步骤S3进行路线计算的具体步骤为:
S3.1,给定时间t,起始点o和目的地d,向用户u推荐路线R=(r1,r2,r3,…,rn),r1.start=o,rn.end=d,并且沿路线的旅行行为P(R|u,t)概率最大,通过下式最大化概率:
P(R|u,t)=P(r1,r2,r3,…,rn|u,t)=p(r1,r2,r3,…,rn,u,t)/P(u,t) (6)
,当用户u和时间t给定时,P(u,t)是不变的,可以将其最大化:
P(r1,r2,r3,…,rn,u,t)=P(b1,b2,b3,…,bn,u)=P((u,b1),(u,b2),(u,b3),…,(u,bn)) (7)
其中bi=(ri,t);
S3.2,使用朴素贝叶斯模型最大化旅行行为概率的路线,由条件概率得:
P(u,b1)*P((u,b2)|(u,b1))*…*P((u,bn)|(u,b1),…,(u,bn-1)) (8)
旅行行为在朴素贝叶斯模型中彼此独立,公式(7)变换为:
P(u,b1)*P(u,b2)*…*P(u,bn) (9)
P(u,bi)是用户u的bi行为的估计值,需要一个确定一系类旅行行为的最大化的方程式:R=Arg maxRCGP(R|u,t)=Arg maxr1,…,rn∈G,EP(u,b1)*P(u,b2)*…*P(u,bn) (10)
其中:R=(r1,r2,r3,…,rn)r1.start=o,rn.end=d;G=(V,E)是道路网络,bi=(ri,t);
S3.3,给出用户u和时间t,道路网络G中的每个路段ei对应于旅行行为bi=(ei,t),每个路段ei作为旅行行为概率倒数取对数的加权;在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径。
实施例8
在实施例七的基础上,若用户出现旅行行为,则根据用户旅行行为的总数来计算旅行行为的频率,给定道路网G=(V,E)和旅行行为b,用户u的旅行行为b的概率采用公式(11)计算:
若用户没有出现旅行行为,在这种情况下,使用拉普拉斯平滑方法来估计这些旅行行为的概率,以避免为任何旅行行为分配零概率,使得用户可以行进到道路网络中的任何路段;拉普拉斯平滑法采用公式(14)进行计算:
其中d是总的旅行行为的数量a是平滑参数,这个公式可以为用户从未旅行的路段分配非零概率。
实施例9
在实施例七或实施例八的基础上,使等式(10)中的P(u,b1)*P(u,b2)*...*P(u,bn)最大化,以便找到最大行程行为概率的路线;为了将乘法转换为典型路由规划算法所需的汇总格式,令
L=1/(P(u,b1)*P(u,b2)*...*P(u,bn) (12),
所以问题转化为L的最小化,将公式(12)两边取对数,得公式(13):
计算旅行行为概率;用公式(12)(13)(14)最大化公式(10)得到用户u在路段b1,…,bi上的最大旅行概率。
实施10
在实施例七、实施例八或实施例九的基础上,步骤S3.3中,使用启发式最短路径算法A-star算法,在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径,A-star的算法包括连续计算最短路径,该路径从起始点开始,并延伸到其他顶点,直到到达目的地。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,包括以下步骤:
S1,数据准备
将用户的历史GPS轨迹与道路网络进行匹配,提取用户的旅行行为;
S2,估计旅行行为频率
计算用户在时间间隔内各个旅行行为之间的相关性,并平滑用户旅行行为之间的频率,再采用矩阵分解方法处理用户的旅行行为以获得估计的旅行行为频率;
S3,路线计算
根据估计的旅行行为频率计算旅行行为概率,并根据旅行行为概率来加权道路网络图,得到推荐的旅行路线。
2.如权利要求1所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,步骤S1中,在进行历史GPS轨迹与道路网络匹配之前,采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹。
3.如权利要求2所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,采用基于熵的KSW阈值法将GPS轨迹划分为多个片段轨迹的具体步骤为:
S1.1,找到导致正常采样率和异常采样率的最大求和熵的阈值θ;
S1.2,跟踪历史GPS轨迹,当两个连续的历史GPS轨迹读数之间的时间间隔超过阈值θ时,GPS跟踪结束,产生新的GPS轨迹。
4.如权利要求3所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,步骤S1.1中,找到导致正常采样率和异常采样率的熵的KSW阈值法方法为:
有不同的采样率分别为s1,s2,s3,....,sn,f1、f2、f3、...、fn为s1,s2,s3,....,s的观测的数量,为不同采样率的总数,即公式:分割阈值为t,A为i∈{0,1,...,t}的灰度分布,B为i∈{t+1,...,N}的灰度分布,概率分布为:
选择阈值t区分两种采样率,则与正常采样率的分布相关的熵为:
与异常采样率分布相关的熵为:
正常采样率与异常采样率之间的阈值区别在1到n之间,找到导致正常采样率分布和异常采样率的熵的阈值:
θ=E1+E2 (3)。
5.如权利要求1所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,步骤S1中,采用地图匹配方法将用户的历史GPS轨迹与道路网络进行匹配,该地图匹配方法采用ST-Matching算法。
6.如权利要求1所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,步骤S2中,估计旅行行为频率的具体步骤为:
S2.1,生成用户行为矩阵
找到n个旅行片段轨迹B={b1,b2,...,bn},其中B包含所有可能的旅行行为;给定一组m个用户U={u1,u2,...,um}和一组旅行行为B={b1,b2,...,bn},使用成对的(u,b)进行用户行为矩阵,矩阵中的元素是成对的频率pl(ui,bj),Bi,j=pl(ui,bj);
S2.2,计算用户在时间间隔内各个旅行行为之间的相关性
相关性的计算公式为:
其中,n表示一天中总时间间隔的总数,b表示在路段e上的旅行行为,ti与tj相隔的时间越长上式的值就越小,ti与tj为轨迹上的两个时间点;
S2.3,获得估计的旅行行为频率
其中,T为转置符号,k是向量的长度,潜在因素是用户和旅行行为之间的相互作用的基础,向量Oui和mbj的乘积越大意味着用户ui发生旅行行为bj的可能性越大。
7.如权利要求1所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,步骤S3进行路线计算的具体步骤为:
S3.1,给定时间t,起始点o和目的地d,向用户u推荐路线R=(r1,r2,r3,...,rn),r1.start=o,rn.end=d,并且沿路线的旅行行为P(R|u,t)概率最大,通过下式最大化概率:
P(R|u,t)=P(r1,r2,r3,...,rn|u,t)=p(r1,r2,r3,...,rn,u,t)/P(u,t) (6)
当用户u和时间t给定时,P(u,t)是不变的,将其最大化:
P(r1,r2,r3,...,rn,u,t)=P(b1,b2,b3,...,bn,u)=P((u,b1),(u,b2),(u,b3),...,(u,bn)) (7)
其中bi=(ri,t);
S3.2,使用朴素贝叶斯模型最大化旅行行为概率的路线,由条件概率得:
P(u,b1)*P((u,b2)|(u,b1))*...*P((u,bn)|(u,b1),...,(u,bn-1)) (8)
旅行行为在朴素贝叶斯模型中彼此独立,公式(7)变换为:
P(u,b1)*P(u,b2)*...*P(u,bn) (9)
P(u,bi)是用户u的bi行为的估计值,需要一个确定一系类旅行行为的最大化的方程式:
R=Arg maxRCGP(R|u,t)=Arg maxr1,...rn∈G,EP(u,b1)*P(u,b2)*...*P(u,bn) (10)
其中:R=(r1,r2,r3,....,rn),r1.start=o,rn.end=d;G=(V,E)是道路网络,bi=(ri,t);
S3.3,给出用户u和时间t,道路网络G中的每个路段ei对应于旅行行为bi=(ei,t),每个路段ei作为旅行行为概率倒数取对数的加权;在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径。
8.如权利要求7所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于:
若用户出现旅行行为,则根据用户旅行行为的总数来计算旅行行为的频率,给定道路网G=(V,E)和旅行行为b,用户u的旅行行为b的概率采用公式(11)计算:
若用户没有出现旅行行为,在这种情况下,使用拉普拉斯平滑方法来估计这些旅行行为的概率,以避免为任何旅行行为分配零概率,使得用户行进到道路网络中的任何路段;拉普拉斯平滑法采用公式(14)进行计算:
其中d是总的旅行行为的数量a是平滑参数,这个公式为用户从未旅行的路段分配非零概率。
10.如权利要求7所述的一种基于用户历史GPS轨迹的协同旅行路线推荐方法,其特征在于,步骤S3.3中,使用启发式最短路径算法A-star算法,在道路网络中以最小的旅行行为概率权重找到从起始点o到目的地点d路径最小路径,A-star的算法包括连续计算最短路径,该最短路径从起始点开始,并延伸到其他顶点,直到到达目的地。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710993263.0A CN107747947B (zh) | 2017-10-23 | 2017-10-23 | 一种基于用户历史gps轨迹的协同旅行路线推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710993263.0A CN107747947B (zh) | 2017-10-23 | 2017-10-23 | 一种基于用户历史gps轨迹的协同旅行路线推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107747947A CN107747947A (zh) | 2018-03-02 |
CN107747947B true CN107747947B (zh) | 2021-04-30 |
Family
ID=61253939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710993263.0A Active CN107747947B (zh) | 2017-10-23 | 2017-10-23 | 一种基于用户历史gps轨迹的协同旅行路线推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107747947B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108955693B (zh) * | 2018-08-02 | 2020-06-16 | 吉林大学 | 一种路网匹配的方法及系统 |
CN110873783A (zh) * | 2018-08-14 | 2020-03-10 | 上海能链众合科技有限公司 | 碳排量监测方法及装置、存储介质、终端 |
CN109579861B (zh) * | 2018-12-10 | 2020-05-19 | 华中科技大学 | 一种基于强化学习的路径导航方法及系统 |
CN110309438A (zh) * | 2019-07-04 | 2019-10-08 | 泰康保险集团股份有限公司 | 行车路径的推荐方法、装置、计算机存储介质及电子设备 |
CN111854779B (zh) * | 2020-02-25 | 2022-04-26 | 北京嘀嘀无限科技发展有限公司 | 一种路线规划方法、装置、电子设备及可读存储介质 |
CN112001538A (zh) * | 2020-08-18 | 2020-11-27 | 马上游科技股份有限公司 | 基于运动步数的旅游路线规划方法及系统 |
US20220082398A1 (en) * | 2020-09-17 | 2022-03-17 | Guangzhou Automobile Group Co., Ltd. | Method and Device for Measuring Driving Route Familiarity |
CN112539761A (zh) * | 2020-12-22 | 2021-03-23 | 北京百度网讯科技有限公司 | 数据处理方法、装置、设备、存储介质及计算机程序产品 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408203A (zh) * | 2014-12-18 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 一种预测移动对象轨迹终点的方法 |
CN104933157A (zh) * | 2015-06-26 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 用于获取用户属性信息的方法、装置及服务器 |
CN105809962A (zh) * | 2016-06-13 | 2016-07-27 | 中南大学 | 一种基于手机数据的交通出行方式划分的方法 |
CN105844362A (zh) * | 2016-03-30 | 2016-08-10 | 西南交通大学 | 城市交通综合出行决策模型 |
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
CN106383868A (zh) * | 2016-09-05 | 2017-02-08 | 电子科技大学 | 一种基于道路网络的时空轨迹聚类方法 |
CN106648862A (zh) * | 2015-12-08 | 2017-05-10 | Tcl集团股份有限公司 | 一种向用户推荐个性化调度的功能项序列的方法和系统 |
CN106875670A (zh) * | 2017-03-07 | 2017-06-20 | 重庆邮电大学 | Spark平台下基于GPS数据的出租车调配方法 |
CN107025788A (zh) * | 2017-05-17 | 2017-08-08 | 青岛海信网络科技股份有限公司 | 一种旅行时间预测方法及装置 |
-
2017
- 2017-10-23 CN CN201710993263.0A patent/CN107747947B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104408203A (zh) * | 2014-12-18 | 2015-03-11 | 西安电子科技大学宁波信息技术研究院 | 一种预测移动对象轨迹终点的方法 |
CN104933157A (zh) * | 2015-06-26 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 用于获取用户属性信息的方法、装置及服务器 |
CN106648862A (zh) * | 2015-12-08 | 2017-05-10 | Tcl集团股份有限公司 | 一种向用户推荐个性化调度的功能项序列的方法和系统 |
CN105844362A (zh) * | 2016-03-30 | 2016-08-10 | 西南交通大学 | 城市交通综合出行决策模型 |
CN105809962A (zh) * | 2016-06-13 | 2016-07-27 | 中南大学 | 一种基于手机数据的交通出行方式划分的方法 |
CN106383868A (zh) * | 2016-09-05 | 2017-02-08 | 电子科技大学 | 一种基于道路网络的时空轨迹聚类方法 |
CN106354862A (zh) * | 2016-09-06 | 2017-01-25 | 山东大学 | 一种异构网络中多维个性化推荐方法 |
CN106875670A (zh) * | 2017-03-07 | 2017-06-20 | 重庆邮电大学 | Spark平台下基于GPS数据的出租车调配方法 |
CN107025788A (zh) * | 2017-05-17 | 2017-08-08 | 青岛海信网络科技股份有限公司 | 一种旅行时间预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107747947A (zh) | 2018-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107747947B (zh) | 一种基于用户历史gps轨迹的协同旅行路线推荐方法 | |
Chen et al. | Nlpmm: A next location predictor with markov modeling | |
CN106767873B (zh) | 一种基于时空的地图匹配方法 | |
US9261376B2 (en) | Route computation based on route-oriented vehicle trajectories | |
JP4896981B2 (ja) | オープン・ワールド・モデリング法およびクローズド・ワールド・モデリング法を用いて部分的軌跡から目的地を予測する方法 | |
Ying et al. | Semantic trajectory mining for location prediction | |
CN109726336B (zh) | 一种结合出行兴趣与社交偏好的poi推荐方法 | |
US20100211308A1 (en) | Identifying interesting locations | |
Lai et al. | Urban traffic Coulomb’s law: A new approach for taxi route recommendation | |
US8412667B2 (en) | Comparing and identifying similar tracks | |
WO2016108977A1 (en) | Analyzing semantic places and related data from a plurality of location data reports | |
CN105825297A (zh) | 一种基于马尔科夫模型的位置预测方法 | |
Liu et al. | Exploiting heterogeneous human mobility patterns for intelligent bus routing | |
JP6462264B2 (ja) | 目的地予測装置、目的地予測方法、及びプログラム | |
JP2016038741A (ja) | 移動状況判定装置、移動状況判定方法及びプログラム | |
KR101639617B1 (ko) | 사용자의 실시간 이동 경로 예측 방법, 이를 수행하는 이동 경로 예측 서버 및 이를 저장하는 기록매체 | |
CN110598917A (zh) | 一种基于路径轨迹的目的地预测方法、系统及存储介质 | |
Liu et al. | Personalized route recommendation for ride-hailing with deep inverse reinforcement learning and real-time traffic conditions | |
Chen et al. | An analysis of movement patterns between zones using taxi GPS data | |
Irio et al. | An adaptive learning-based approach for vehicle mobility prediction | |
Dai et al. | Context-based moving object trajectory uncertainty reduction and ranking in road network | |
Nack et al. | Acquisition and use of mobility habits for personal assistants | |
Xie et al. | High-Accuracy off-line map-matching of trajectory network division based on weight adaptation HMM | |
Jiang et al. | A framework of travel mode identification fusing deep learning and map-matching algorithm | |
He et al. | Personalized next point-of-interest recommendation via latent behavior patterns inference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |