CN106250515B - 基于历史数据的缺失路径恢复方法 - Google Patents

基于历史数据的缺失路径恢复方法 Download PDF

Info

Publication number
CN106250515B
CN106250515B CN201610631065.5A CN201610631065A CN106250515B CN 106250515 B CN106250515 B CN 106250515B CN 201610631065 A CN201610631065 A CN 201610631065A CN 106250515 B CN106250515 B CN 106250515B
Authority
CN
China
Prior art keywords
state
path
return function
defining
road
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610631065.5A
Other languages
English (en)
Other versions
CN106250515A (zh
Inventor
孙未未
吴昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN201610631065.5A priority Critical patent/CN106250515B/zh
Publication of CN106250515A publication Critical patent/CN106250515A/zh
Application granted granted Critical
Publication of CN106250515B publication Critical patent/CN106250515B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明属于轨迹计算技术领域,具体为一种基于历史数据的缺失路径恢复方法。本发明方法的步骤包括:训练阶段,利用马尔可夫决策过程模型对轨迹进行建模,根据历史轨迹数据训练模型参数;在线查询阶段根据已训练好的模型计算道路之间的转移概率,构建图,使用转移概率的负对数为边的权重赋值,在图中使用最短路径搜索来的到概率最高的路径,并使用该路径恢复缺失部分。本发明方法可在长距离的缺失情况下也能够保持算法的可靠性和准确性。

Description

基于历史数据的缺失路径恢复方法
技术领域
本发明属于轨迹计算技术领域,具体涉及一种基于历史数据的缺失路径恢复方法。
背景技术
移动端GPS设备的普及推动了基于位置的服务的发展,轨迹计算也应运而生。轨迹数据的准确性直接影响了服务的质量,然而现实生活中由于各种因素,如设备电力、存储空间、在线传输成本等原因,GPS数据的采样并不是高频率的,即有大量轨迹数据采样间隔在1分钟以上。低采样率的GPS轨迹数据直接带来了用户行驶路径的缺失,这些数据的缺失将会极大地影响基于位置的服务质量,如路径推荐、路况预计、轨迹预测、频繁模式挖掘等与行驶路径有关的应用。对于这些缺失路径的轨迹数据,如果能够利用剩下的部分高采样率的轨迹数据对其缺失部分进行恢复,那么毫无疑问将会提高数据的利用率。
现有路径恢复技术主要归纳为非数据驱动型与数据驱动型两类:
(1)非数据驱动型的路径恢复技术:
非数据驱动型的路径恢复技术仅仅根据道路网络特征对缺失路径进行恢复。具体地,一般通过定义路段的开销,如信号灯、转弯、道路等级等道路属性,最后选取开销最小的路径来补全缺失的路径。此类方法由于没有参考历史数据,根据人为设定的道路开销很难满足一些复杂的情况。
(2)数据驱动的路径恢复技术
数据驱动型的路径恢复技术不但使用道路的固有属性,还同时参考历史轨迹数据来进行推断。本发明属于这类技术。
传统的数据驱动型的路径恢复技术分为两种,一种是扫描历史数据,通过将历史轨迹根据特定规则构建遍历图后,在图上进行最短路径查询。这种方法是基于经验式的,没有理论保障,且在某些情况下,该方法会退化为直接在原路网中使用最短路径补全,效果变差。另一种是利用最热门路径,通过从历史数据中找出需要恢复路径的首尾路段之间的最热门路径来作为缺失路径的恢复结果。这种方法在长距离的缺失下会产生一定的问题,且对历史数据的数量有一定的要求。是当路径的缺失距离变长后,历史数据中在缺失路径的首尾路段之间的轨迹数量也将减少,且路径的多样性也将会变多,导致热门路径的特异性不强,最终导致恢复结果不理想。
发明内容
本发明的目的在于针对现有技术的不足,提出一种在长距离的缺失情况下也能够保持算法的可靠性和准确性的基于历史数据的缺失路径的恢复方法。
本发明提出的基于历史数据的缺失路径的恢复方法,具体步骤如下:
1.训练阶段,根据历史数据训练模型参数
(1)定义马尔可夫决策过程(MDP)模型,将道路作为状态s,所有道路构成状态集S,相邻道路之间的转移过程定义为动作,道路转移是确定的,因此不需要定义状态转移矩阵,定义每条道路存在回报函数,定义衰减系数γ。
(2)对每个状态s,使用其道路长度的负数作为该道路的初始回报函数R(s),所有状态的回报函数构成总回报函数集合R。
(3)对于某一条历史轨迹,记其终点所在的状态为sd,将sd的回报函数设为0。
(4)对定义的MDP使用值迭代算法,得到每个状态s的最优值函数V*(s)。
(5)对于轨迹中每相邻两个状态si,sj,计算si转移到sj的Q函数Q(si→sj|R)=R(si)+γV*(sj)。
(6)计算si到sj的转移概率
Figure BDA0001069255690000021
sk为与si相邻的状态。
(7)对于历史轨迹tr=s1→s1→…→sn,其对于当前总回报函数集R下的后验概率为
Figure BDA0001069255690000022
(8)重复步骤(3)—(7),直至得到所有历史轨迹在当前总回报函数集R下的后验概率
Figure BDA0001069255690000023
公式中m表示历史轨迹的数量。
(9)对R中每个回报函数R(s)在[R(s)-δ,R(s)+δ]区间内均匀采样,得到新的回报函数集R’。
(10)根据步骤(3)—(7),计算所有历史轨迹在新回报函数集R’下的后验概率
Figure BDA0001069255690000024
公式中m表示历史轨迹的数量。
(11)根据
Figure BDA0001069255690000025
的接受概率接受R’作为新的总回报函数集R。
(12)重复步骤(8)—(11),直至马尔可夫链收敛后将当前的总回报函数集R作为模型的参数。
2.在线查询阶段,利用训练好的模型对缺失路径进行恢复
(1)定义MDP模型,将道路作为状态,所有道路构成状态集S,相邻道路之间的转移过程定义为动作,道路转移是确定的,因此不需要定义状态转移矩阵,定义每条道路存在回报函数,定义衰减系数γ;
(2)将每条道路作为MDP状态的回报函数设置成训练阶段中步骤(1)—(12)所得到的总回报函数R;
(3)记需要恢复轨迹的末端状态为sd,将sd的回报函数设为0;
(4)对定义的MDP使用值迭代算法,得到每个状态s的最优值函数V*(s);
(5)对于状态集S中每相邻两个状态si,sj,计算si转移到sj的Q函数Q(si→sj|R)=R(si)+γV*(sj);
(6)计算si到sj的对数转移概率
Figure BDA0001069255690000031
sk为与si相邻的状态;
(7)构建图G,其中顶点定义为状态集S,边定义为:如果状态si与sj在MDP中是相邻的,则在G中为si→sj建立一条边,权值为-logP(sj|si,R);
(8)记需要恢复轨迹的初始状态为so,在G中从顶点so至sd实施最短路径算法,得到的路径so→s1→…→sd,作为恢复的缺失路径。其箭头表示路径方向,下同。
本发明利用MDP模型对历史轨迹进行建模,通过将历史数据的后验概率最大化来得到模型代求参数R。在恢复缺失路径阶段,利用MDP模型得到道路之间转移的概率,对路径的概率进行马尔可夫假设,即路径的概率为相邻两条道路之间转移的概率的乘积。最终,将概率最高的路径作为缺失路径的恢复结果。
本发明方法,参考了历史数据中蕴含的丰富的信息,利用概率论的理论推导,对轨迹数据使用了合理的模型进行建模,并根据历史数据训练模型参数,并对缺失路径利用进行恢复。整个方法,通过概率模型的理论基础保障,使得在长距离的缺失情况下也能够保持算法的可靠性和准确性。
附图说明
图1中虚线轨迹tr1:s1→s5→s12→s16→s17与实线轨迹tr2:s3→s6→s9→s8为用于训练模型的历史数据。
图2中实线的两个线段代表缺失路径的首尾路段,即恢复从s1到s17的路径。
图3为实施例中几种方法在不同的缺失长度下的准确率
具体实施方式
下面结合具体实例来说明本发明的具体实施过程:
1.根据历史数据训练模型参数
(1)定义MDP模型,状态集S={s1,s2,...,s17},动作定义为相邻两个状态间的转移,如s1→s2,s13→s17,定义衰减系数γ,如γ=0.95。
(2)每个状态的初始回报函数定义为其道路长度,
即R(s1)=s1.len,R(s2)=s2.len,...,R(s17)=s17.len,
其中,s.len代表路段s的长度。总回报函数集R={R(s1),R(s2),...,R(s17)}。
(3)对虚线历史轨迹tr1进行后验概率计算
(a)将终止状态s17的回报函数置为0;
(b)对当前MDP使用值迭算法,得到每个状态s的最优值函数V*(s)。
(c)计算Q(s1→s5|R)=R(s1)+γV*(s5),
计算Q(s5→s12|R)=R(s5)+γV*(s12),
计算Q(s12→s16|R)=R(s12)+γV*(s16),
计算Q(s16→s17|R)=R(s16)+γV*(s17)。
(d)计
Figure BDA0001069255690000041
算,
计算
Figure BDA0001069255690000042
计算
Figure BDA0001069255690000043
计算
Figure BDA0001069255690000044
(e)计算P(tr1|R)=P(s5|s1,R)*P(s12|s5,R)*P(s16|s12,R)*P(s17|s16,R)。
(4)对实线历史轨迹tr2进行后验概率计算
(a)同步骤(3)得到P(tr2|R)。
(5)计算所有历史轨迹的联合后验概率P(tr1|R)*P(tr2|R)。
(6)对R的δ领域进行采样,记为R′
(a)R′(s1)~Uniform(R(s1)-δ,R(s1)+δ),
R′(s2)~Uniform(R(s2)-δ,R(s2)+δ),
R′(s17)~Uniform(R(s17)-δ,R(s17)+δ),
(b)记R′={R′(s1),R′(s2),...R′(s17)}。
(7)根据步骤(3)—(5)计算P(tr1|R’)*P(tr2|R’)
(8)按照
Figure BDA0001069255690000051
的概率决定是否接受R’代替R作为新的回报函数集。
(9)重复步骤(3)—(8)直至马尔可夫链收敛,将当前的R作为MDP的参数。
2.利用训练好的模型对缺失路径进行恢复
(1)定义MDP模型,状态集S={s1,s2,...,s17},动作定义为相邻两个状态间的转移,如s1→s2,s13→s17,定义衰减系数γ,如γ=0.95。
(2)每个状态的回报函数为步骤1中利用历史数据{tr1,tr2}训练得到的R。
(3)将R(s17)置为0。
(4)转移概率计算
(a)对当前MDP使用值迭算法,得到每个状态s的最优值函数V*(s)。
(b)对每个状态计算相邻状态的Q函数值,如Q(s1→s5|R)=R(s1)+γV*(s5)。
(c)计算每两个相邻状态之间转移的概率,如
Figure BDA0001069255690000052
(5)构建图G
(a)构建顶点集为{s1,s2,...s17},
(b)对每相邻两个状态建立一条边,边权值为转移概率的负对数,如e(s1→s2)=-logP(s2|s1,R),e(s1→s5)=-logP(s5|s1,R)。
(6)在图G中使用最短路算法(如Dijkstra算法)计算s1到s7的最短路径,如s1→s5→s12→s16→s17,则s1→s5→s12→s16→s17就是s1到s17之间缺失的路径。
下面通过真实数据集上的实验来验证路径算法的准确性,以及在长距离缺失下的有效性。我们使用葡萄牙共78万条出租车轨迹的数据集,通过对原数据进行人为消除路径后让算法进行恢复以检测其正确率。正确率的评判标准为总共恢复出的路径的长度比上总缺失的路径长度。我们使用了最短路径、最快路径、最热门路径,数据驱动型方法的最新工作(HRIS@1、5、10),以及本发明的方法。图3为这几种方法在不同的缺失长度下的准确率,可以看出,本发明方法在长距离路径缺失的情况下,依然具有很高的准确率。

Claims (2)

1.一种基于历史数据的缺失路径恢复方法,其特征在于,基本步骤如下:
(a)训练阶段,根据历史轨迹数据训练模型参数;
(b)在线查询阶段,根据已训练好的模型恢复缺失路径;
其中,训练阶段的具体操作流程如下:
(1)定义马尔可夫决策过程MDP模型,将道路作为状态s,所有道路构成状态集S,相邻道路之间的转移过程定义为动作,道路转移是确定的,不需要定义状态转移矩阵,定义每条道路存在回报函数,定义衰减系数γ;
(2)对每个状态s,使用其道路长度的负数作为该道路的初始回报函数R(s),所有状态的回报函数构成总回报函数集合R;
(3)对于某一条历史轨迹,记其终点所在的状态为sd,将sd的回报函数设为0;
(4)对定义的MDP,使用值迭代算法,得到每个状态s的最优值函数V*(s);
(5)对于轨迹中每相邻两个状态si,sj,计算si转移到sj的Q函数Q(si→sj|R)=R(si)+γV*(sj);
(6)计算si到sj的转移概率
Figure FDA0002406185410000011
sk为与si相邻的状态;
(7)对于历史轨迹tr=s1→s2→…→sn,计算其对于当前总回报函数集R下的后验概率:
Figure FDA0002406185410000012
(8)重复步骤(3)—(7),直至得到所有历史轨迹在当前总回报函数集R下的后验概率
Figure FDA0002406185410000013
公式中m表示历史轨迹的数量;
(9)对R中每个回报函数R(s)在[R(s)-δ,R(s)+δ]区间内均匀采样,得到新的回报函数集R’;
(10)根据步骤(3)—(7),计算所有历史轨迹在新回报函数集R’下的后验概率
Figure FDA0002406185410000014
公式中m表示历史轨迹的数量;
(11)根据
Figure FDA0002406185410000015
的接受概率接受R’作为新的总回报函数集R;
(12)重复步骤(8)—(11),直至马尔可夫链收敛后将当前的总回报函数集R作为模型的参数。
2.根据权利要求1所述的基于历史数据的缺失路径恢复方法,其特征在于,在线查询阶段的具体操作流程如下:
(1)定义MDP模型,将道路作为状态s,所有道路构成状态集S,相邻道路之间的转移过程定义为动作,道路转移是确定的,不需要定义状态转移矩阵,定义每条道路存在回报函数,定义衰减系数γ;
(2)将每条道路作为MDP状态的回报函数,设置成训练阶段中步骤(1)—(12)所得到的总回报函数R;
(3)记需要恢复轨迹的末端状态为sd,将sd的回报函数设为0;
(4)对定义的MDP使用值迭代算法,得到每个状态s的最优值函数V*(s);
(5)对于状态集S中每相邻两个状态si,sj,计算si转移到sj的Q函数Q(si→sj|R)=R(si)+γV*(sj);
(6)计算si到sj的对数转移概率
Figure FDA0002406185410000021
sk为与si相邻的状态;
(7)构建图G,其中顶点定义为状态集S,边定义为:如果状态si与sj在MDP中是相邻的,则在G中为si→sj建立一条边,权值为-logP(sj|si,R);
(8)记需要恢复轨迹的初始状态为so,在G中从顶点so至sd实施最短路径算法,得到的路径so→s1→…→sd,作为恢复的缺失路径。
CN201610631065.5A 2016-08-04 2016-08-04 基于历史数据的缺失路径恢复方法 Expired - Fee Related CN106250515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610631065.5A CN106250515B (zh) 2016-08-04 2016-08-04 基于历史数据的缺失路径恢复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610631065.5A CN106250515B (zh) 2016-08-04 2016-08-04 基于历史数据的缺失路径恢复方法

Publications (2)

Publication Number Publication Date
CN106250515A CN106250515A (zh) 2016-12-21
CN106250515B true CN106250515B (zh) 2020-05-12

Family

ID=58077449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610631065.5A Expired - Fee Related CN106250515B (zh) 2016-08-04 2016-08-04 基于历史数据的缺失路径恢复方法

Country Status (1)

Country Link
CN (1) CN106250515B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10298465B2 (en) * 2017-08-01 2019-05-21 Juniper Networks, Inc. Using machine learning to monitor link quality and predict link faults
CN108761196B (zh) * 2018-03-30 2020-01-21 国家电网公司 一种智能电表用户缺失电压数据修复方法
US20220083884A1 (en) * 2019-01-28 2022-03-17 Mayo Foundation For Medical Education And Research Estimating latent reward functions from experiences
CN111309780B (zh) * 2020-01-21 2023-04-25 腾讯云计算(北京)有限责任公司 一种轨迹数据处理方法及装置
CN111311910B (zh) * 2020-02-19 2020-12-22 中南大学 多层次道路级浮动车异常轨迹探测方法
CN112649010B (zh) * 2020-10-14 2022-09-20 桂林电子科技大学 路径规划方法、路径规划系统、电子设备及计算机存储介质
CN113282699B (zh) * 2021-07-22 2022-01-28 北京交通大学 针对有噪声且参数不明的自行车轨迹数据的路网匹配方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102854880A (zh) * 2012-10-08 2013-01-02 中国矿业大学 面向混合地形区域不确定环境的机器人全局路径规划方法
CN103471589A (zh) * 2013-09-25 2013-12-25 武汉大学 一种室内行人行走模式识别和轨迹追踪的方法
CN103945486A (zh) * 2014-04-02 2014-07-23 北京理工大学 基于移动节点轨迹的多目标优化数据传递方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8655705B2 (en) * 2010-01-13 2014-02-18 Lockheed Martin Corporation Systems, methods and apparatus for implementing hybrid meta-heuristic inventory optimization based on production schedule and asset routing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102854880A (zh) * 2012-10-08 2013-01-02 中国矿业大学 面向混合地形区域不确定环境的机器人全局路径规划方法
CN103471589A (zh) * 2013-09-25 2013-12-25 武汉大学 一种室内行人行走模式识别和轨迹追踪的方法
CN103945486A (zh) * 2014-04-02 2014-07-23 北京理工大学 基于移动节点轨迹的多目标优化数据传递方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于双向非线性学习的轨迹跟踪和识别;胡昭华等;《计算机学报》;20070831;第30卷(第8期);第1389-1397页 *

Also Published As

Publication number Publication date
CN106250515A (zh) 2016-12-21

Similar Documents

Publication Publication Date Title
CN106250515B (zh) 基于历史数据的缺失路径恢复方法
CN104462190B (zh) 一种基于海量空间轨迹挖掘的在线的位置预测方法
CN109405839B (zh) 一种基于多路径的交通网络离线地图匹配算法
CN110648527B (zh) 一种基于深度学习模型的交通速度预测方法
TW202011285A (zh) 樣本屬性評估模型訓練方法、裝置及伺服器
US11795804B2 (en) Automated concurrent path planning and drilling parameter optimization using robotics
CN109635748B (zh) 高分辨率影像中道路特征的提取方法
CN112015835A (zh) Geohash压缩的地图匹配方法
CN105574191A (zh) 在线社会网络多源点信息溯源系统及其方法
CN111292356B (zh) 运动轨迹与道路的匹配方法及装置
CN109063771A (zh) 一种发现车辆可疑行为的方法、装置及设备
CN110986965A (zh) 基于隐马尔可夫模型的低频浮动车轨迹数据路网匹配方法
CN115265555A (zh) 基于隐马尔科夫的多噪声感知的地图匹配校正方法及系统
CN114518755A (zh) 全局路径的规划方法、装置、设备及存储介质
CN113514072B (zh) 一种面向导航数据与大比例尺制图数据的道路匹配方法
Hou et al. Fast online map matching for recovering travelling routes from low-sampling GPS data
CN115841190B (zh) 道路pci多步预测方法及装置
CN110411450A (zh) 一种用于压缩轨迹的地图匹配方法
CN115056829B (zh) 多车型连续学习的列车运动状态估计方法
CN112229412B (zh) 一种车道定位方法、装置及存储介质和服务器
CN106276447B (zh) 电梯运行数据收集方法及装置
CN111896021B (zh) 一种无信号道路智能导航方法
CN114008638A (zh) 一种使用选择性深度生成重放模块对深度神经网络模型执行可调连续学习的方法和装置
CN114328791B (zh) 一种基于深度学习的地图匹配算法
CN118277368B (zh) 一种面向复杂形态轨迹的数据恢复方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200512