CN106297296A - 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法 - Google Patents

一种基于稀疏轨迹点数据的细粒度旅行时间分配方法 Download PDF

Info

Publication number
CN106297296A
CN106297296A CN201610890373.XA CN201610890373A CN106297296A CN 106297296 A CN106297296 A CN 106297296A CN 201610890373 A CN201610890373 A CN 201610890373A CN 106297296 A CN106297296 A CN 106297296A
Authority
CN
China
Prior art keywords
section
hourage
value
sub
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610890373.XA
Other languages
English (en)
Other versions
CN106297296B (zh
Inventor
辛欣
胡健
仇金娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201610890373.XA priority Critical patent/CN106297296B/zh
Publication of CN106297296A publication Critical patent/CN106297296A/zh
Application granted granted Critical
Publication of CN106297296B publication Critical patent/CN106297296B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0108Measuring and analyzing of parameters relative to traffic conditions based on the source of data
    • G08G1/0112Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing
    • G08G1/0129Traffic data processing for creating historical data or processing based on historical data

Abstract

本发明涉及一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,属于城市智能交通技术领域。本发明以细粒度的方式进行旅行时间分配,分析相邻交通信号间的延迟模式,再依据相邻路段之间的延迟依赖条件,对其状态转移概率进行建模,将一个交通信号周期内不同车辆等待红灯时间的差异区分开来,从而提高配时结果的精确度;针对细粒度旅行时间分配过程中,车辆在一个路段或一个子路段旅行时间及交通信号周期不容易直接得到的问题,提出了一个新隐马尔可夫模型,使得相邻路段间的延迟模式由路段间的状态转移概率决定,再用条件迭代模型来计算出隐马尔可夫模型的参数。本发明实现了细粒度旅行时间分配,从而有效提高了配时结果的精确度与正确性。

Description

一种基于稀疏轨迹点数据的细粒度旅行时间分配方法
技术领域
本发明涉及一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,属于城市智能交通技术领域。
背景技术
近年来,在一些大中型城市里城市机动车保有量和居民出行总量急剧增长,导致交通拥堵成为一个严重的问题,威胁着城市环境和交通运输效率。为了解决这个问题,人们使用各种数据来监控和预测交通状况。由于浮动车GPS稀疏轨迹点数据在高覆盖率、低成本上的优势,因而备受人们关注。这些数据已经被成功地运用在很多应用中,例如实时速度预测和预估到达时间。通常情况下,在处理稀疏轨迹点数据时,一项基础首要的工作是将两个GPS点之间的时间分配给相邻的路段,也就是旅行时间的分配。所以当利用车辆的稀疏轨迹数据来进行道路速度监控与预测时,路段的旅行时间分配是一项基础首要的工作。
本发明利用浮动车的稀疏轨迹点数据采用细粒度的方式来进行道路旅行时间分配。为了解决间接观察值问题,实现细粒度道路配时算法,本发明建立了一个新的隐马尔可夫模型。在此模型中,路段的隐含状态是指车辆在通过一个路段时等待交通信号灯周期的个数,相邻交通信号间的延迟模式用相邻路段的状态转移概率矩阵来表示,并且用一个带约束的高斯混合模型来学习交通信号周期。最终,通过一个条件迭代模型算法来训练得到模型中所有的参数,从而能够实现对路段旅行时间的细粒度分配。通过在一个为期3个月的北京路网车辆交通轨迹数据集上进行实验,实验表明,本发明提出的方法在绝对平均误差上比传统方法精确10%,在均方根误差上比传统方法精确8%。因此,本发明区别于以往粗粒度道路旅行时间分配方法,提出了一种新的细粒度道路旅行时间分配方法,提高了时间估算结果的精确度,从而提高新方法下的配时效果。
与本发明相关的文章共两篇,下文分别对其进行剖析:
文章(1):《NIPS网络分析与图形学习》2009年第12卷第1期,文章题目为:“基于全球定位系统探测车数据预测路径和旅行时间”,文章中主要根据不同交通状况下历史旅行时间概率,提出了一个针对干线公路的多概率模型,通过一个期望最大化算法并利用稀疏GPS探测车数据来估算历史路段旅行时间。
文章(2):《IEEE智能运输系统汇刊》2012年第13卷第4期,文章题目为:“基于一个动态贝叶斯网络和探测车数据研究公路干线的动态特征”,主要介绍如何利用探测车数据来预估公路干线的交通状况。文章提出了一个概率模型框架同时利用探测车稀疏观测数据来预估公路干线的旅行时间分布。文中基于流体力学交通理论提出一个用来描述干线公路路段上的车辆密度的模型,同时,该模型也能表示一个路段上车辆延迟时间的分布状况。该分布的特征本质上是使用探测车辆数据进行交通预估:探测车辆会在任意时刻报告自己的当前具体位置,并且为了与地图离散化相匹配,必须对报告位置点之间的旅行时间进行缩放。运用该模型中的动态贝叶斯网络,不仅能够表示出路网间的时空依赖性,还能通过一个复杂的框架从历史交通数据中学习交通的动态特征并且利用流数据能够进行旅行时间的实时估算。
以上文章虽然解决了利用稀疏轨迹点数据进行旅行时间分配的问题,但是,文章均是以粗粒度的方式来进行旅行时间的分配,忽略了对相邻交通信号间延迟模式的研究。在通过一个路段时,有些车辆无需等待交通信号灯,有些车辆却需要等待一整个交通信号周期,该文章中并没有对上述两种情况进行区分,这会导致在一个交通信号周期内不同车辆等待红灯时间的差别不明显,从而导致旅行时间分配结果不精确。因此,可见粗粒度的道路旅行时间分配方法有很大的改进空间。本发明的目的即是致力于解决上述粗粒度的道路旅行时间分配方法的缺陷,提出一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。
发明内容
本发明的目的是为了克服现有粗粒度旅行时间分配方法存在的旅行时间分配结果不精确的问题,提出一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。
本发明以细粒度的方式进行旅行时间分配,其核心思想为:分析相邻交通信号间的延迟模式,并基于延迟模式中相邻路段之间的延迟依赖条件,对相邻路段之间的状态转移概率进行建模,将一个交通信号周期内不同车辆等待红灯时间的差异区分开来,从而提高配时结果的精确度;针对细粒度旅行时间分配过程中,车辆在一个路段或是一个子路段上的旅行时间及交通信号周期也不容易直接得到的问题,即为了解决间接观察值的问题,提出了一个新隐马尔可夫模型,使得相邻路段间的延迟模式由路段间的状态转移概率决定,再用条件迭代模型来计算出隐马尔可夫模型的参数,即:本发明解决了间接观察值的问题,实现了以细粒度的方式进行旅行时间分配,从而有效提高了配时结果的精确度与正确性。
为实现上述目的,本发明所采用的技术方案如下:
一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,包括以下步骤:
步骤1:定义稀疏轨迹点数据集和旅行时间分配结果数据集,具体为:
1.1定义稀疏轨迹点数据集:
所述的稀疏轨迹点数据集定义为{X(i),1≤i≤U};
1.2定义旅行时间分配结果数据集:
所述的旅行时间分配结果数据集定义为{Y(i),1≤i≤U};
步骤2:定义隐马尔可夫模型变量和隐马尔可夫模型参数;
其中,隐马尔可夫模型,即描述一个含有隐含未知参数的马尔可夫过程的模型,Hidden Markov Model缩写为HMM;
步骤2定义的HMM变量为Oij和Si
其中,Oij代表子路段旅行时间,具体表示第i个路段上的第j个子路段上分配的旅行时间;
Si代表路段隐藏状态,具体表示车辆在第i个路段上等待红灯的个数;下标i代表路段编号;
步骤2所定义的隐马尔可夫模型参数,即HMM参数为以及π;
其中,代表子路段上的旅行时间分布,其中,x1代表子路段起始位置,具体表示子路段的起始点与所在路段i起点之间的距离;x2代表子路段结束位置,具体表示子路段的终点与所在路段i起点之间的距离;Si代表路段i的隐藏状态;在路段i的隐藏状态Si已知的情况下,子路段上的旅行时间、子路段起始位置x1和子路段结束位置x2这三个变量服从于一个高斯正态分布其中,子路段上的旅行时间分布是一个概率密度函数;
代表路段状态转移概率,具体表示第i-1个路段的隐藏状态Si-1与第i个路段的隐藏状态Si之间的状态转移概率,其中,路段i的隐藏状态Si取决于它前一个路段i-1的隐藏状态Si-1,我们用一阶马尔可夫性质假设对相邻路段i和i-1之间的状态转移概率进行建模,因此,对于每个路段i,都有其特定的矩阵;
π代表路段初始状态分布,具体表示第1个路段的初始状态的多重分布,其中,π是一个k维向量,用来对初始路段l1的多个状态的多重分布进行参数化设置;
步骤3:确定步骤2中HMM参数的初始值,推导出HMM变量的初始值,具体为:
其中,HMM参数,具体为和π;HMM变量,具体为Oij、Si
3.1确定HMM参数的初始值,具体为:
3.1.1对大量浮动车GPS采样数据进行数据分析,得到在特定的路段i上的旅行时间观察值集合{t(i),1≤i≤V},该数据集服从一个高斯混合模型,并且,波峰会周期性地出现,这个周期恰好与红灯信号周期吻合,用一组高斯分布来表示该高斯混合模型;
其中,d代表红灯信号周期,即是高斯混合模型中波峰出现的周期,在一般情况下,不同等级道路的红灯信号周期也各不相同,宽阔道路的红灯信号周期通常比狭窄道路的更大,由于道路等级不同,所以d的取值也不尽相同;将该组高斯分布中对应着的道路隐藏状态Si的个数记为K+1;其中,观测数据t(i)可以由高斯混合模型产生,具体为:依概率从高斯混合模型的多项分布中选择一个高斯分布分模型,再依此分模型的概率分布生成观测数据t(i)
3.1.2运用EM算法,即期望最大化算法估计高斯混合模型的参数{μ0,d,φ,σ};
其中,μ0代表高斯混合模型的均值,d代表高斯混合模型中波峰出现的周期,φ代表高斯分布分模型,σ代表高斯混合模型的方差;
其中,需要确定该高斯混合模型的对数似然函数,其计算公式为公式(1):
其中,EM算法,包括E步和M步,具体为:
E步:计算在当前模型参数下观测数据t(i)来自第j个分模型的概率即计算分模型j对观测数据t(i)的响应度其中,计算公式为公式(2):
ω j ( i ) = 1 2 π σ j exp ( - ( μ 0 + j * d - t ( i ) ) 2 2 σ j 2 ) Σ a = 0 K ( 1 2 π σ a exp ( - ( μ 0 + a * d - t ( i ) ) 2 2 σ a 2 ) ) - - - ( 2 )
M步:计算新一轮迭代的模型参数;即根据Jensen不等式,用梯度下降算法,求函数的极大值,从而得到一组最优的参数;其中,具体为公式(3):
其中,模型参数d的梯度值,记为计算公式为公式(4):
其中,模型参数σj的梯度值,记为计算公式为公式(5):
其中,模型参数μ0的梯度值,记为计算公式为公式(6):
其中,高斯分布分模型φ更新公式为公式(7):
φ j = Σ i = 1 V * ω j ( i ) Σ a = 0 K Σ i = 1 V ω a ( i ) - - - ( 7 )
重复进行算法的E步和M步,直至公式(1)的函数值收敛,即直至对数似然函数值不再有明显的变化为止;
3.1.3基于已知路段在每个状态下旅行时间分布的均值μ、方差σ2计算出在每个状态下子路段(从x1到x2)上的旅行时间分布
在交通理论中,路段上任意位置处的车辆密度满足饱和线性函数;受此理论启发,由于每单位距离长度的旅行时间与道路车辆密度成正比例,定义了一个形似车辆密度线性函数的旅行时间分配概率密度函数f(x);又因为子路段(从x1到x2)上的旅行时间也服从高斯正态分布,所以得到每个状态下子路段(从x1到x2)上的旅行时间分布,其计算公式为公式(8):
μ ( x 1 , x 2 ) = μ ∫ x 1 x 2 f ( x ) d x , σ ( x 1 , x 2 ) 2 = σ 2 ∫ x 1 x 2 f ( x ) d x - - - ( 8 )
至此,便可确定子路段上的旅行时间分布的初始值;
3.2确定HMM参数的初始值,具体为:
根据已知的路段i-1和路段i在每个路段隐藏状态下旅行时间的均值、方差,对大量车辆在路段i-1、路段i上的旅行时间观察值进行归类统计,从而分别得出车辆在路段i-1和路段i上的隐藏状态,从而得到路段i-1和路段i之间的状态转移概率矩阵由此,可以确定参数的初始值;
3.3确定HMM参数π的初始值,具体为:
根据已知的路段i在每个状态下旅行时间的均值、方差,对大量车辆在路段i上的旅行时间观察值进行归类统计,得到在特定的路段i上的旅行时间观察值集合{t(i),1≤i≤V},该数据集服从一个高斯混合模型,用一组高斯分布来表示该高斯混合模型,从该高斯混合模型中可以得出某一车辆在路段i上属于哪一类隐藏状态,从而得到路段i上车辆属于各种隐藏状态的概率矩阵,即确定了参数π的初始值;
其中,参数π是一个k维向量,其中,k是指路段i隐藏状态的类别总数;
3.4推导出变量Oij、变量Si的初始值,具体为:
根据已经确定的HMM参数π的初始值,用极大似然估计法,找到一组HMM变量{Oij,Si}的值,可以让概率似然函数的值达到最大;
其中,概率似然函数的计算公式为公式(9):
步骤4:根据步骤3确定的HMM变量的值,更新HMM参数的值;
其中,HMM参数,具体为和π;HMM变量,具体为Oij、Si
步骤4,具体为:
在给定HMM变量的值的情况下,对大量车辆在路段i上的旅行时间观察值进行归类统计,得到在特定的路段i上的旅行时间观察值集合{t(i),1≤i≤V},对此观察值集合进行分析可以直接估算出所需相应数据出现的次数,从而得到对应的概率矩阵,即得到更新后的参数π的值;
步骤5:根据步骤4更新的HMM参数的值,更新HMM变量的值;
其中,HMM参数,具体为和π;HMM变量,具体为Oij、Si
步骤5,具体为:
首先,在给定参数π、变量Oij值的情况下,用标准维特比算法来解决隐马尔可夫模型预测问题,从而求出最有可能的对应的隐藏状态序列,从而更新变量Si的值;然后,在给定参数 π的值以及更新后变量Si值的情况下,通过对带约束的二次优化问题的求解,可以得到变量Oij的最优解,从而更新变量Oij的值;
步骤6:重复进行步骤4和步骤5,直至HMM变量的值不再更新;
其中,HMM变量,具体为Oij
步骤7:根据子路段旅行时间变量值,计算得出不同路段的旅行时间分配结果数据集;
其中,不同路段的旅行时间分配结果数据集,记为:{Y(i),1≤i≤U};子路段旅行时间变量,即步骤2输出的HMM变量Oij
其中,计算公式为公式(10):
Y j = Σ i = 1 h j O j i - - - ( 10 ) ;
其中,Yj代表第j个路段的旅行时间,Oji代表第j个路段上的第i个子路段的旅行时间;
至此,从步骤1到步骤7,完成了一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。
有益效果
本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,与现有技术相比,具有如下有益效果:
1.本发明提出的方法计算得到的结果比用传统方法计算得到的结果更加精确,具体通过对北京道路交通网络的3个月交通数据集进行实验,能够证实本发明所提出的方法在平均绝对误差上比传统方法精确10%,在均方根误差上比传统方法精确8%;
2.本发明基于隐马尔可夫模型解决了间接观察值的问题,真正达到以细粒度的方式进行旅行时间分配,从而提高新方法下配时结果的精确度与正确性。
附图说明
图1是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例的流程图;
图2是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例中的元素定义示意图;
图3是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例中关于车辆密度的线性函数示意图;
图4是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例中关于旅行时间分配的概率密度函数示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例
本实施例阐述了将本发明“一种基于稀疏轨迹点数据的细粒度旅行时间分配方法”应用于对道路进行旅行时间分配下的流程。
图1为本发明所提方法及本实施例的流程图。
从图1中可以看出,本方法包含如下步骤:
步骤A:定义稀疏轨迹点数据集{X(i),1≤i≤U}和旅行时间分配数据集{Y(i),1≤i≤U};
为了更好地说明上述数据集的定义,我们将数据集定义与路段示意图相结合,结果图如图2所示。由图2可以看出,用一个包含n个点的序列{X1,X2,......,Xn}表示一段轨迹X,同时,这段轨迹X也穿过了一个包含m个路段的序列{l1,l2,......,lm}。
其中,每个路段li的长度是已知的,每个点Xi即是GPS数据采样点,因此,Xi包含了以下信息:Xi点所属路段的ID号、Xi点与所属路段起点之间的距离、时间戳。
具体到本实施例,用序列{Y1,Y2,......,Ym}表示在对应路段上分配的旅行时间,用{X(i),1≤i≤U}来表示稀疏轨迹点数据集,用{Y(i),1≤i≤U}来表示旅行时间分配数据集;
步骤B:定义隐马尔可夫模型的变量和参数;
变量Oij的定义过程与步骤2相同,具体到本实施例,由图2可以看出,GPS点把路段l1上的轨迹分成两个子路段l11和l12,则将子路段l11上的旅行时间表示为O11,将子路段l12上的旅行时间表示为O12。路段l2上没有GPS点,则O21表示在整个路段l2上的旅行时间。
变量Si的定义过程与步骤2相同,具体到本实施例,如果Si=0,表示车辆在路段i上没有等待红灯;如果Si=2,说明车辆在路段i上等了2个红灯;
步骤C:确定隐马尔可夫模型参数的初始值,推导出隐马尔可夫模型变量的初始值;
具体与步骤3相同,本实施例中设置道路红灯信号周期d的最小取值dmin=1,最大取值dmax=2,设置道路隐藏状态的个数K=6;
其中,因为道路等级不同,所以d的取值也不尽相同,但是d的取值始终在范围[dmin,dmax]内;此外,步骤3中EM算法的M步中需要对参数d值进行更新,如果更新的d的值超出了范围[dmin,dmax],则不予更新;
其中,在步骤3运用EM算法的过程中,需要确定每个路段的K值。将K值从2到10进行遍历,选择其中能使AIC(赤池信息量准则)的值最小的K值,本实施例中我们选择K的值为6;
在交通理论中,路段上任意位置处的车辆密度满足饱和线性函数。为了更好地说明该函数,我们作出函数图像,如图3所示。
由图3可以看出,横坐标表示车辆在路段上的位置,纵坐标的数值表示在路段上某一位置处的车辆密度,在路段起始位置处的车辆密度小于路段终点位置处的车辆密度,说明通常情况下大量车辆会聚集在路段终点位置处等待交通信号灯,该密度函数符合饱和线性函数图像。
为了更好地了解道路旅行时间分配,由于每单位距离长度的旅行时间与道路车辆密度成正比例,我们定义了一个形似车辆密度线性函数的旅行时间分配概率密度函数f(x),如图4所示。
由图4可以看出,横坐标表示车辆在路段上的位置,纵坐标的数值表示在路段上某一位置处的旅行时间,车辆在路段起始位置处的旅行时间小于在路段终点位置处的旅行时间,说明通常情况下车辆会花更多的时间在路段终点位置处等待交通信号灯,该密度函数符合饱和线性函数图像。
步骤D:根据隐马尔可夫模型变量的值,更新隐马尔可夫模型参数的值;
具体为:在给定变量Oij、Si值的情况下,通过对观察值进行归类统计,可以直接估算出所需相应数据出现的次数,从而得到对应的概率矩阵,即得到更新后的参数π的值。
步骤E:根据隐马尔可夫模型参数的值,更新隐马尔可夫模型变量的值;
具体为:首先,在给定参数π、变量Oij值的情况下,用标准维特比算法来解决隐马尔可夫模型预测问题,从而求出最有可能的对应的隐藏状态序列,从而更新变量Si的值;然后,在给定参数π的值以及更新后变量Si值的情况下,通过对带约束的二次优化问题的求解,可以得到变量Oij的最优解,从而更新变量Oij的值。
步骤F:判断隐马尔可夫模型变量Oij的值有无更新,并进行相应操作:
F.1若有更新,对应图1中的“是否收敛”输出的否,则跳至步骤D;
F.2若无更新,对应图1中的“是否收敛”输出的是,则根据子路段旅行时间变量值,计算得出旅行时间分配结果数据集{Y(i),1≤i≤U},完成了本方法;
至此,从步骤A到F,完成了本实施例一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。
需要说明的是,本说明书所述的只是本发明的较佳具体实施例,以上实施例仅用于说明本发明的技术方案而非对本发明的限制。凡本领域技术人员依本发明的构思通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在本发明的范围之内。

Claims (7)

1.一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,其特征在于:以细粒度的方式进行旅行时间分配,其核心思想为:分析相邻交通信号间的延迟模式,并基于延迟模式中相邻路段之间的延迟依赖条件,对相邻路段之间的状态转移概率进行建模,将一个交通信号周期内不同车辆等待红灯时间的差异区分开来,从而提高配时结果的精确度;针对细粒度旅行时间分配过程中,车辆在一个路段或是一个子路段上的旅行时间及交通信号周期也不容易直接得到的问题,即为了解决间接观察值的问题,提出了一个新隐马尔可夫模型,使得相邻路段间的延迟模式由路段间的状态转移概率决定,再用条件迭代模型来计算出隐马尔可夫模型的参数,即:本发明解决了间接观察值的问题,实现了以细粒度的方式进行旅行时间分配,从而有效提高了配时结果的精确度与正确性;
为实现上述目的,本发明所采用的技术方案如下:一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,包括以下步骤:
步骤1:定义稀疏轨迹点数据集和旅行时间分配结果数据集;
步骤2:定义隐马尔可夫模型变量和隐马尔可夫模型参数;
其中,隐马尔可夫模型,即描述一个含有隐含未知参数的马尔可夫过程的模型,HiddenMarkov Model缩写为HMM;
步骤3:确定步骤2中HMM参数的初始值,推导出HMM变量的初始值;
步骤4:根据步骤3确定的HMM变量的值,更新HMM参数的值;
步骤5:根据步骤4更新的HMM参数的值,更新HMM变量的值;
步骤6:重复进行步骤4和步骤5,直至HMM变量的值不再更新;
步骤7:根据子路段旅行时间变量值,计算得出不同路段的旅行时间分配结果数据集;
至此,从步骤1到步骤7,完成了一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。
2.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,其特征还在于:
步骤1,具体为:
1.1定义稀疏轨迹点数据集:
所述的稀疏轨迹点数据集定义为{X(i),1≤i≤U};
1.2定义旅行时间分配结果数据集:
所述的旅行时间分配结果数据集定义为{Y(i),1≤i≤U}。
3.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,其特征还在于:
步骤2定义的HMM变量为Oij和Si
其中,Oij代表子路段旅行时间,具体表示第i个路段上的第j个子路段上分配的旅行时间;
Si代表路段隐藏状态,具体表示车辆在第i个路段上等待红灯的个数;下标i代表路段编号;
步骤2所定义的隐马尔可夫模型参数,即HMM参数为以及π;
其中,代表子路段上的旅行时间分布,其中,x1代表子路段起始位置,具体表示子路段的起始点与所在路段i起点之间的距离;x2代表子路段结束位置,具体表示子路段的终点与所在路段i起点之间的距离;Si代表路段i的隐藏状态;在路段i的隐藏状态Si已知的情况下,子路段上的旅行时间、子路段起始位置x1和子路段结束位置x2这三个变量服从于一个高斯正态分布其中,子路段上的旅行时间分布是一个概率密度函数;
代表路段状态转移概率,具体表示第i-1个路段的隐藏状态Si-1与第i个路段的隐藏状态Si之间的状态转移概率,其中,路段i的隐藏状态Si取决于它前一个路段i-1的隐藏状态Si-1,我们用一阶马尔可夫性质假设对相邻路段i和i-1之间的状态转移概率进行建模,因此,对于每个路段i,都有其特定的矩阵;
π代表路段初始状态分布,具体表示第1个路段的初始状态的多重分布,其中,π是一个k维向量,用来对初始路段l1的多个状态的多重分布进行参数化设置。
4.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,其特征还在于:
步骤3中,HMM参数,具体为和π;HMM变量,具体为Oij、Si
3.1确定HMM参数的初始值,具体为:
3.1.1对大量浮动车GPS采样数据进行数据分析,得到在特定的路段i上的旅行时间观察值集合{t(i),1≤i≤V},该数据集服从一个高斯混合模型,并且,波峰会周期性地出现,这个周期恰好与红灯信号周期吻合,用一组高斯分布来表示该高斯混合模型;
其中,d代表红灯信号周期,即是高斯混合模型中波峰出现的周期,在一般情况下,不同等级道路的红灯信号周期也各不相同,宽阔道路的红灯信号周期通常比狭窄道路的更大,由于道路等级不同,所以d的取值也不尽相同;将该组高斯分布中对应着的道路隐藏状态Si的个数记为K+1;观测数据t(i)可以由高斯混合模型产生,具体为:依概率从高斯混合模型的多项分布中选择一个高斯分布分模型,再依此分模型的概率分布生成观测数据t(i)
3.1.2运用EM算法,即期望最大化算法,估计高斯混合模型的参数{μ0,d,φ,σ};
其中,μ0代表高斯混合模型的均值,d代表高斯混合模型中波峰出现的周期,φ代表高斯分布分模型,σ代表高斯混合模型的方差;
其中,需要确定该高斯混合模型的对数似然函数,其计算公式为公式(1):
其中,EM算法,包括E步和M步,具体为:
E步:计算在当前模型参数下观测数据t(i)来自第j个分模型的概率即计算分模型j对观测数据t(i)的响应度其中,计算公式为公式(2):
M步:计算新一轮迭代的模型参数;即根据Jensen不等式,用梯度下降算法,求函数的极大值,从而得到一组最优的参数;其中,具体为公式(3):
其中,模型参数d的梯度值,记为计算公式为公式(4):
其中,模型参数σj的梯度值,记为计算公式为公式(5):
其中,模型参数μ0的梯度值,记为计算公式为公式(6):
其中,高斯分布分模型φ更新公式为公式(7):
重复进行算法的E步和M步,直至公式(1)的函数值收敛,即直至对数似然函数值不再有明显的变化为止;
3.1.3基于已知路段在每个状态下旅行时间分布的均值μ、方差σ2计算出在每个状态下子路段(从x1到x2)上的旅行时间分布
在交通理论中,路段上任意位置处的车辆密度满足饱和线性函数;受此理论启发,由于每单位距离长度的旅行时间与道路车辆密度成正比例,定义了一个形似车辆密度线性函数的旅行时间分配概率密度函数f(x);又因为子路段(从x1到x2)上的旅行时间也服从高斯正态分布,所以得到每个状态下子路段(从x1到x2)上的旅行时间分布,其计算公式为公式(8):
至此,便可确定子路段上的旅行时间分布的初始值;
3.2确定HMM参数的初始值,具体为:
根据已知的路段i-1和路段i在每个路段隐藏状态下旅行时间的均值、方差,对大量车辆在路段i-1、路段i上的旅行时间观察值进行归类统计,从而分别得出车辆在路段i-1和路段i上的隐藏状态,从而得到路段i-1和路段i之间的状态转移概率矩阵由此,可以确定参数的初始值;
3.3确定HMM参数π的初始值,具体为:
根据已知的路段i在每个状态下旅行时间的均值、方差,对大量车辆在路段i上的旅行时间观察值进行归类统计,得到在特定的路段i上的旅行时间观察值集合{t(i),1≤i≤V},该数据集服从一个高斯混合模型,用一组高斯分布来表示该高斯混合模型,从该高斯混合模型中可以得出某一车辆在路段i上属于哪一类隐藏状态,从而得到路段i上车辆属于各种隐藏状态的概率矩阵,即确定了参数π的初始值;其中,参数π是一个k维向量,其中,k是指路段i隐藏状态的类别总数;
3.4推导出变量Oij、变量Si的初始值,具体为:
根据已经确定的HMM参数π的初始值,用极大似然估计法,找到一组HMM变量{Oij,Si}的值,可以让概率似然函数的值达到最大;
其中,概率似然函数的计算公式为公式(9):
5.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,其特征还在于:
步骤4中,HMM参数,具体为和π;HMM变量,具体为Oij、Si;且步骤4,具体为:
在给定HMM变量的值的情况下,对大量车辆在路段i上的旅行时间观察值进行归类统计,得到在特定的路段i上的旅行时间观察值集合{t(i),1≤i≤V},对此观察值集合进行分析可以直接估算出所需相应数据出现的次数,从而得到对应的概率矩阵,即得到更新后的参数π的值。
6.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,其特征还在于:
步骤5中,HMM参数,具体为和π;HMM变量,具体为Oij、Si;且步骤5,具体为:
首先,在给定参数π、变量Oij值的情况下,用标准维特比算法来解决隐马尔可夫模型预测问题,从而求出最有可能的对应的隐藏状态序列,从而更新变量Si的值;然后,在给定参数π的值以及更新后变量Si值的情况下,通过对带约束的二次优化问题的求解,可以得到变量Oij的最优解,从而更新变量Oij的值。
7.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法,其特征还在于:
步骤6中,HMM变量,具体为Oij
步骤7中,不同路段的旅行时间分配结果数据集,记为:{Y(i),1≤i≤U};子路段旅行时间变量,即步骤2中的HMM变量Oij
其中,计算公式为公式(10):
其中,Yj代表第j个路段的旅行时间,Oji代表第j个路段上的第i个子路段的旅行时间。
CN201610890373.XA 2016-10-12 2016-10-12 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法 Active CN106297296B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610890373.XA CN106297296B (zh) 2016-10-12 2016-10-12 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610890373.XA CN106297296B (zh) 2016-10-12 2016-10-12 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法

Publications (2)

Publication Number Publication Date
CN106297296A true CN106297296A (zh) 2017-01-04
CN106297296B CN106297296B (zh) 2019-01-01

Family

ID=57718649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610890373.XA Active CN106297296B (zh) 2016-10-12 2016-10-12 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法

Country Status (1)

Country Link
CN (1) CN106297296B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110599768A (zh) * 2019-09-07 2019-12-20 北京智数时空科技有限公司 一种基于电信大数据的高速公路车流估计方法
CN111209966A (zh) * 2020-01-07 2020-05-29 中南大学 一种基于马尔科夫链的路径行程时间确定方法及系统
CN111598114A (zh) * 2019-02-20 2020-08-28 腾讯大地通途(北京)科技有限公司 隐藏状态序列的确定方法和街区的功能类型的确定方法
CN111696342A (zh) * 2019-03-11 2020-09-22 阿里巴巴集团控股有限公司 交通信号配时优化方法、装置、电子设备及可读存储介质
CN112669600A (zh) * 2020-12-15 2021-04-16 天津职业技术师范大学(中国职业培训指导教师进修中心) 一种利用汽车电子标识信息预测路口交通流的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101794513A (zh) * 2009-12-30 2010-08-04 北京世纪高通科技有限公司 浮动车数据的预处理方法及装置
CN104537836A (zh) * 2014-12-30 2015-04-22 北京通博科技有限公司 路段行驶时间分布预测方法
CN104615897A (zh) * 2015-02-13 2015-05-13 北方工业大学 基于低频gps数据的路段行程时间估算方法
US20150268056A1 (en) * 2002-03-05 2015-09-24 Pelmorex Canada Inc. Method for predicting a travel time for a traffic route
CN104952243A (zh) * 2014-03-25 2015-09-30 高德软件有限公司 通行时长分配方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150268056A1 (en) * 2002-03-05 2015-09-24 Pelmorex Canada Inc. Method for predicting a travel time for a traffic route
CN101794513A (zh) * 2009-12-30 2010-08-04 北京世纪高通科技有限公司 浮动车数据的预处理方法及装置
CN104952243A (zh) * 2014-03-25 2015-09-30 高德软件有限公司 通行时长分配方法及装置
CN104537836A (zh) * 2014-12-30 2015-04-22 北京通博科技有限公司 路段行驶时间分布预测方法
CN104615897A (zh) * 2015-02-13 2015-05-13 北方工业大学 基于低频gps数据的路段行程时间估算方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A. HOFLEITNER 等: "Optimal decomposition of travel times measured by probe vehicles using a statistical traffic flow model", 《2011 14TH INTERNATIONAL IEEE CONFERENCE ON INTELLIGENT TRANSPORTATION SYSTEMS (ITSC)》 *
AUDE HOFLEITNER 等: "Learning the Dynamics of Arterial Traffic From Probe Data Using a Dynamic Bayesian Network", 《IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS》 *
BRUCEHELLINGA 等: "Decomposing travel times measured by probe-based traffic monitoring systems to individual road segments", 《TRANSPORTATION RESEARCH PART C: EMERGING TECHNOLOGIES》 *
MOHSENRAMEZANI 等: "On the estimation of arterial route travel time distribution with Markov chains", 《TRANSPORTATION RESEARCH PART B: METHODOLOGICAL》 *
刘国盼: "《基于手机切换定位技术的干道行程时间分配方法研究》", 《中国优秀硕士学位论文全文数据库》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598114A (zh) * 2019-02-20 2020-08-28 腾讯大地通途(北京)科技有限公司 隐藏状态序列的确定方法和街区的功能类型的确定方法
CN111598114B (zh) * 2019-02-20 2023-07-25 腾讯大地通途(北京)科技有限公司 隐藏状态序列的确定方法和街区的功能类型的确定方法
CN111696342A (zh) * 2019-03-11 2020-09-22 阿里巴巴集团控股有限公司 交通信号配时优化方法、装置、电子设备及可读存储介质
CN111696342B (zh) * 2019-03-11 2022-05-27 阿里巴巴集团控股有限公司 交通信号配时优化方法、装置、电子设备及可读存储介质
CN110599768A (zh) * 2019-09-07 2019-12-20 北京智数时空科技有限公司 一种基于电信大数据的高速公路车流估计方法
CN111209966A (zh) * 2020-01-07 2020-05-29 中南大学 一种基于马尔科夫链的路径行程时间确定方法及系统
CN111209966B (zh) * 2020-01-07 2023-09-26 中南大学 一种基于马尔科夫链的路径行程时间确定方法及系统
CN112669600A (zh) * 2020-12-15 2021-04-16 天津职业技术师范大学(中国职业培训指导教师进修中心) 一种利用汽车电子标识信息预测路口交通流的方法

Also Published As

Publication number Publication date
CN106297296B (zh) 2019-01-01

Similar Documents

Publication Publication Date Title
Sun et al. A machine learning method for predicting driving range of battery electric vehicles
CN106297296A (zh) 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法
Herring et al. Estimating arterial traffic conditions using sparse probe data
CN102592447B (zh) 一种基于fcm的区域路网的道路交通状态判别方法
CN103996289B (zh) 一种流量-速度匹配模型及行程时间预测方法及系统
CN108053645A (zh) 一种基于轨迹数据的信号交叉口周期流量估计方法
CN106384509A (zh) 考虑出租车运营状态下的城市道路行程时间分布估算方法
CN109191849B (zh) 一种基于多源数据特征提取的交通拥堵持续时间预测方法
CN104778834A (zh) 一种基于车辆gps数据的城市道路交通拥堵判别方法
CN106652441A (zh) 一种基于时空数据的城市道路交通状态预测方法
CN111197991A (zh) 基于深度神经网络的预测车辆最佳驾驶路径方法
CN105321347A (zh) 一种分层次的路网交通拥堵评价方法
CN102890862B (zh) 基于向量模式的交通状态分析装置及方法
CN110836675A (zh) 一种基于决策树的自动驾驶搜索决策方法
CN106971546B (zh) 基于公交车gps数据的路段公交车渗透率估计方法
CN105957348B (zh) 一种基于gis和pems的城市公交线路节点处排放估算方法
CN109658694A (zh) 一种卷积神经网络高危车辆交通流预测方法和系统
Cheng et al. Developing a travel time estimation method of freeway based on floating car using random forests
Mao et al. A comparison of deep reinforcement learning models for isolated traffic signal control
CN103456163A (zh) 城市快速路互通立交通行能力和运行状态判别方法与系统
CN107092988B (zh) 一种专用道公交车辆驻站时间预测方法
CN106846808B (zh) 一种基于车牌数据的车辆停车次数计算方法
CN104821086B (zh) 一种定位大规模交通网络中低效路段组合的方法
CN109447327A (zh) 一种地铁列车轨迹预测方法
Zhang et al. Traffic light optimization based on modified Webster function

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant