CN106297296A

CN106297296A - 一种基于稀疏轨迹点数据的细粒度旅行时间分配方法

Info

Publication number: CN106297296A
Application number: CN201610890373.XA
Authority: CN
Inventors: 辛欣; 胡健; 仇金娟
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2016-10-12
Filing date: 2016-10-12
Publication date: 2017-01-04
Anticipated expiration: 2036-10-12
Also published as: CN106297296B

Abstract

本发明涉及一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，属于城市智能交通技术领域。本发明以细粒度的方式进行旅行时间分配，分析相邻交通信号间的延迟模式，再依据相邻路段之间的延迟依赖条件，对其状态转移概率进行建模，将一个交通信号周期内不同车辆等待红灯时间的差异区分开来，从而提高配时结果的精确度；针对细粒度旅行时间分配过程中，车辆在一个路段或一个子路段旅行时间及交通信号周期不容易直接得到的问题，提出了一个新隐马尔可夫模型，使得相邻路段间的延迟模式由路段间的状态转移概率决定，再用条件迭代模型来计算出隐马尔可夫模型的参数。本发明实现了细粒度旅行时间分配，从而有效提高了配时结果的精确度与正确性。

Description

一种基于稀疏轨迹点数据的细粒度旅行时间分配方法

技术领域

本发明涉及一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，属于城市智能交通技术领域。

背景技术

近年来，在一些大中型城市里城市机动车保有量和居民出行总量急剧增长，导致交通拥堵成为一个严重的问题，威胁着城市环境和交通运输效率。为了解决这个问题，人们使用各种数据来监控和预测交通状况。由于浮动车GPS稀疏轨迹点数据在高覆盖率、低成本上的优势，因而备受人们关注。这些数据已经被成功地运用在很多应用中，例如实时速度预测和预估到达时间。通常情况下，在处理稀疏轨迹点数据时，一项基础首要的工作是将两个GPS点之间的时间分配给相邻的路段，也就是旅行时间的分配。所以当利用车辆的稀疏轨迹数据来进行道路速度监控与预测时，路段的旅行时间分配是一项基础首要的工作。

本发明利用浮动车的稀疏轨迹点数据采用细粒度的方式来进行道路旅行时间分配。为了解决间接观察值问题，实现细粒度道路配时算法，本发明建立了一个新的隐马尔可夫模型。在此模型中，路段的隐含状态是指车辆在通过一个路段时等待交通信号灯周期的个数，相邻交通信号间的延迟模式用相邻路段的状态转移概率矩阵来表示，并且用一个带约束的高斯混合模型来学习交通信号周期。最终，通过一个条件迭代模型算法来训练得到模型中所有的参数，从而能够实现对路段旅行时间的细粒度分配。通过在一个为期3个月的北京路网车辆交通轨迹数据集上进行实验，实验表明，本发明提出的方法在绝对平均误差上比传统方法精确10％，在均方根误差上比传统方法精确8％。因此，本发明区别于以往粗粒度道路旅行时间分配方法，提出了一种新的细粒度道路旅行时间分配方法，提高了时间估算结果的精确度，从而提高新方法下的配时效果。

与本发明相关的文章共两篇，下文分别对其进行剖析：

文章(1):《NIPS网络分析与图形学习》2009年第12卷第1期，文章题目为：“基于全球定位系统探测车数据预测路径和旅行时间”，文章中主要根据不同交通状况下历史旅行时间概率，提出了一个针对干线公路的多概率模型，通过一个期望最大化算法并利用稀疏GPS探测车数据来估算历史路段旅行时间。

文章(2):《IEEE智能运输系统汇刊》2012年第13卷第4期，文章题目为：“基于一个动态贝叶斯网络和探测车数据研究公路干线的动态特征”，主要介绍如何利用探测车数据来预估公路干线的交通状况。文章提出了一个概率模型框架同时利用探测车稀疏观测数据来预估公路干线的旅行时间分布。文中基于流体力学交通理论提出一个用来描述干线公路路段上的车辆密度的模型，同时，该模型也能表示一个路段上车辆延迟时间的分布状况。该分布的特征本质上是使用探测车辆数据进行交通预估：探测车辆会在任意时刻报告自己的当前具体位置，并且为了与地图离散化相匹配，必须对报告位置点之间的旅行时间进行缩放。运用该模型中的动态贝叶斯网络，不仅能够表示出路网间的时空依赖性，还能通过一个复杂的框架从历史交通数据中学习交通的动态特征并且利用流数据能够进行旅行时间的实时估算。

以上文章虽然解决了利用稀疏轨迹点数据进行旅行时间分配的问题，但是，文章均是以粗粒度的方式来进行旅行时间的分配，忽略了对相邻交通信号间延迟模式的研究。在通过一个路段时，有些车辆无需等待交通信号灯，有些车辆却需要等待一整个交通信号周期，该文章中并没有对上述两种情况进行区分，这会导致在一个交通信号周期内不同车辆等待红灯时间的差别不明显，从而导致旅行时间分配结果不精确。因此，可见粗粒度的道路旅行时间分配方法有很大的改进空间。本发明的目的即是致力于解决上述粗粒度的道路旅行时间分配方法的缺陷，提出一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。

发明内容

本发明的目的是为了克服现有粗粒度旅行时间分配方法存在的旅行时间分配结果不精确的问题，提出一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。

本发明以细粒度的方式进行旅行时间分配，其核心思想为：分析相邻交通信号间的延迟模式，并基于延迟模式中相邻路段之间的延迟依赖条件，对相邻路段之间的状态转移概率进行建模，将一个交通信号周期内不同车辆等待红灯时间的差异区分开来，从而提高配时结果的精确度；针对细粒度旅行时间分配过程中，车辆在一个路段或是一个子路段上的旅行时间及交通信号周期也不容易直接得到的问题，即为了解决间接观察值的问题，提出了一个新隐马尔可夫模型，使得相邻路段间的延迟模式由路段间的状态转移概率决定，再用条件迭代模型来计算出隐马尔可夫模型的参数，即：本发明解决了间接观察值的问题，实现了以细粒度的方式进行旅行时间分配，从而有效提高了配时结果的精确度与正确性。

为实现上述目的，本发明所采用的技术方案如下：

一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，包括以下步骤：

步骤1:定义稀疏轨迹点数据集和旅行时间分配结果数据集，具体为：

1.1定义稀疏轨迹点数据集：

所述的稀疏轨迹点数据集定义为{X⁽ⁱ⁾,1≤i≤U}；

1.2定义旅行时间分配结果数据集：

所述的旅行时间分配结果数据集定义为{Y⁽ⁱ⁾,1≤i≤U}；

步骤2:定义隐马尔可夫模型变量和隐马尔可夫模型参数；

其中，隐马尔可夫模型，即描述一个含有隐含未知参数的马尔可夫过程的模型，Hidden Markov Model缩写为HMM；

步骤2定义的HMM变量为O_ij和S_i；

其中，O_ij代表子路段旅行时间，具体表示第i个路段上的第j个子路段上分配的旅行时间；

S_i代表路段隐藏状态，具体表示车辆在第i个路段上等待红灯的个数；下标i代表路段编号；

步骤2所定义的隐马尔可夫模型参数，即HMM参数为以及π；

其中，代表子路段上的旅行时间分布，其中，x₁代表子路段起始位置，具体表示子路段的起始点与所在路段i起点之间的距离；x₂代表子路段结束位置，具体表示子路段的终点与所在路段i起点之间的距离；S_i代表路段i的隐藏状态；在路段i的隐藏状态S_i已知的情况下，子路段上的旅行时间、子路段起始位置x₁和子路段结束位置x₂这三个变量服从于一个高斯正态分布其中，子路段上的旅行时间分布是一个概率密度函数；

代表路段状态转移概率，具体表示第i-1个路段的隐藏状态S_i-1与第i个路段的隐藏状态S_i之间的状态转移概率，其中，路段i的隐藏状态S_i取决于它前一个路段i-1的隐藏状态S_i-1，我们用一阶马尔可夫性质假设对相邻路段i和i-1之间的状态转移概率进行建模，因此，对于每个路段i,都有其特定的矩阵；

π代表路段初始状态分布，具体表示第1个路段的初始状态的多重分布，其中，π是一个k维向量，用来对初始路段l₁的多个状态的多重分布进行参数化设置；

步骤3:确定步骤2中HMM参数的初始值，推导出HMM变量的初始值，具体为：

其中，HMM参数，具体为和π；HMM变量，具体为O_ij、S_i；

3.1确定HMM参数的初始值，具体为:

3.1.1对大量浮动车GPS采样数据进行数据分析，得到在特定的路段i上的旅行时间观察值集合{t⁽ⁱ⁾,1≤i≤V}，该数据集服从一个高斯混合模型，并且，波峰会周期性地出现，这个周期恰好与红灯信号周期吻合，用一组高斯分布来表示该高斯混合模型；

其中，d代表红灯信号周期，即是高斯混合模型中波峰出现的周期，在一般情况下，不同等级道路的红灯信号周期也各不相同，宽阔道路的红灯信号周期通常比狭窄道路的更大，由于道路等级不同，所以d的取值也不尽相同；将该组高斯分布中对应着的道路隐藏状态S_i的个数记为K+1；其中，观测数据t⁽ⁱ⁾可以由高斯混合模型产生，具体为：依概率从高斯混合模型的多项分布中选择一个高斯分布分模型，再依此分模型的概率分布生成观测数据t⁽ⁱ⁾；

3.1.2运用EM算法，即期望最大化算法估计高斯混合模型的参数{μ₀,d,φ,σ}；

其中，μ₀代表高斯混合模型的均值，d代表高斯混合模型中波峰出现的周期，φ代表高斯分布分模型，σ代表高斯混合模型的方差；

其中，需要确定该高斯混合模型的对数似然函数，其计算公式为公式(1)：

其中，EM算法，包括E步和M步，具体为：

E步：计算在当前模型参数下观测数据t⁽ⁱ⁾来自第j个分模型的概率即计算分模型j对观测数据t⁽ⁱ⁾的响应度其中，计算公式为公式(2)：

ω_{j}^{(i)} = \frac{\frac{1}{\sqrt{2 π} σ_{j}} \exp (\frac{- {(μ_{0} + j * d - t^{(i)})}^{2}}{2 σ_{j}^{2}})}{Σ_{a = 0}^{K} (\frac{1}{\sqrt{2 π} σ_{a}} \exp (\frac{- {(μ_{0} + a * d - t^{(i)})}^{2}}{2 σ_{a}^{2}}))} - - - (2)

M步：计算新一轮迭代的模型参数；即根据Jensen不等式，用梯度下降算法，求函数的极大值，从而得到一组最优的参数；其中，具体为公式(3)：

其中，模型参数d的梯度值，记为计算公式为公式(4)：

其中，模型参数σ_j的梯度值，记为计算公式为公式(5)：

其中，模型参数μ₀的梯度值，记为计算公式为公式(6)：

其中，高斯分布分模型φ更新公式为公式(7)：

φ_{j} = \frac{Σ_{i = 1}^{V} * ω_{j}^{(i)}}{Σ_{a = 0}^{K} Σ_{i = 1}^{V} ω_{a}^{(i)}} - - - (7)

重复进行算法的E步和M步，直至公式(1)的函数值收敛，即直至对数似然函数值不再有明显的变化为止；

3.1.3基于已知路段在每个状态下旅行时间分布的均值μ、方差σ²计算出在每个状态下子路段(从x₁到x₂)上的旅行时间分布

在交通理论中，路段上任意位置处的车辆密度满足饱和线性函数；受此理论启发，由于每单位距离长度的旅行时间与道路车辆密度成正比例，定义了一个形似车辆密度线性函数的旅行时间分配概率密度函数f(x)；又因为子路段(从x₁到x₂)上的旅行时间也服从高斯正态分布，所以得到每个状态下子路段(从x₁到x₂)上的旅行时间分布，其计算公式为公式(8)：

μ_{(x_{1}, x_{2})} = μ {&Integral;}_{x_{1}}^{x_{2}} f (x) d x, σ_{(x_{1}, x_{2})}^{2} = σ^{2} {&Integral;}_{x_{1}}^{x_{2}} f (x) d x - - - (8)

至此，便可确定子路段上的旅行时间分布的初始值；

3.2确定HMM参数的初始值，具体为：

根据已知的路段i-1和路段i在每个路段隐藏状态下旅行时间的均值、方差，对大量车辆在路段i-1、路段i上的旅行时间观察值进行归类统计，从而分别得出车辆在路段i-1和路段i上的隐藏状态，从而得到路段i-1和路段i之间的状态转移概率矩阵由此，可以确定参数的初始值；

3.3确定HMM参数π的初始值，具体为：

根据已知的路段i在每个状态下旅行时间的均值、方差，对大量车辆在路段i上的旅行时间观察值进行归类统计，得到在特定的路段i上的旅行时间观察值集合{t⁽ⁱ⁾,1≤i≤V}，该数据集服从一个高斯混合模型，用一组高斯分布来表示该高斯混合模型，从该高斯混合模型中可以得出某一车辆在路段i上属于哪一类隐藏状态，从而得到路段i上车辆属于各种隐藏状态的概率矩阵，即确定了参数π的初始值；

其中，参数π是一个k维向量，其中，k是指路段i隐藏状态的类别总数；

3.4推导出变量O_ij、变量S_i的初始值，具体为：

根据已经确定的HMM参数π的初始值，用极大似然估计法，找到一组HMM变量{O_ij,S_i}的值，可以让概率似然函数的值达到最大；

其中，概率似然函数的计算公式为公式(9)：

步骤4:根据步骤3确定的HMM变量的值，更新HMM参数的值；

其中，HMM参数，具体为和π；HMM变量，具体为O_ij、S_i；

步骤4，具体为：

在给定HMM变量的值的情况下，对大量车辆在路段i上的旅行时间观察值进行归类统计，得到在特定的路段i上的旅行时间观察值集合{t⁽ⁱ⁾,1≤i≤V}，对此观察值集合进行分析可以直接估算出所需相应数据出现的次数，从而得到对应的概率矩阵，即得到更新后的参数π的值；

步骤5:根据步骤4更新的HMM参数的值，更新HMM变量的值；

其中，HMM参数，具体为和π；HMM变量，具体为O_ij、S_i；

步骤5，具体为：

首先，在给定参数π、变量O_ij值的情况下，用标准维特比算法来解决隐马尔可夫模型预测问题，从而求出最有可能的对应的隐藏状态序列，从而更新变量S_i的值；然后，在给定参数 π的值以及更新后变量S_i值的情况下，通过对带约束的二次优化问题的求解，可以得到变量O_ij的最优解，从而更新变量O_ij的值；

步骤6:重复进行步骤4和步骤5，直至HMM变量的值不再更新；

其中，HMM变量，具体为O_ij；

步骤7:根据子路段旅行时间变量值，计算得出不同路段的旅行时间分配结果数据集；

其中，不同路段的旅行时间分配结果数据集，记为：{Y⁽ⁱ⁾,1≤i≤U}；子路段旅行时间变量，即步骤2输出的HMM变量O_ij；

其中，计算公式为公式(10):

Y_{j} = Σ_{i = 1}^{h_{j}} O_{j i} - - - (10);

其中，Y_j代表第j个路段的旅行时间，O_ji代表第j个路段上的第i个子路段的旅行时间；

至此，从步骤1到步骤7，完成了一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。

有益效果

本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，与现有技术相比，具有如下有益效果：

1.本发明提出的方法计算得到的结果比用传统方法计算得到的结果更加精确，具体通过对北京道路交通网络的3个月交通数据集进行实验，能够证实本发明所提出的方法在平均绝对误差上比传统方法精确10％，在均方根误差上比传统方法精确8％；

2.本发明基于隐马尔可夫模型解决了间接观察值的问题，真正达到以细粒度的方式进行旅行时间分配，从而提高新方法下配时结果的精确度与正确性。

附图说明

图1是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例的流程图；

图2是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例中的元素定义示意图；

图3是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例中关于车辆密度的线性函数示意图；

图4是本发明一种基于稀疏轨迹点数据的细粒度旅行时间分配方法及实施例中关于旅行时间分配的概率密度函数示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

实施例

本实施例阐述了将本发明“一种基于稀疏轨迹点数据的细粒度旅行时间分配方法”应用于对道路进行旅行时间分配下的流程。

图1为本发明所提方法及本实施例的流程图。

从图1中可以看出，本方法包含如下步骤：

步骤A:定义稀疏轨迹点数据集{X⁽ⁱ⁾,1≤i≤U}和旅行时间分配数据集{Y⁽ⁱ⁾,1≤i≤U}；

为了更好地说明上述数据集的定义，我们将数据集定义与路段示意图相结合，结果图如图2所示。由图2可以看出，用一个包含n个点的序列{X₁,X₂,......,X_n}表示一段轨迹X，同时，这段轨迹X也穿过了一个包含m个路段的序列{l₁,l₂,......,l_m}。

其中，每个路段l_i的长度是已知的，每个点X_i即是GPS数据采样点，因此，X_i包含了以下信息：X_i点所属路段的ID号、X_i点与所属路段起点之间的距离、时间戳。

具体到本实施例，用序列{Y₁,Y₂,......,Y_m}表示在对应路段上分配的旅行时间，用{X⁽ⁱ⁾,1≤i≤U}来表示稀疏轨迹点数据集，用{Y⁽ⁱ⁾,1≤i≤U}来表示旅行时间分配数据集；

步骤B:定义隐马尔可夫模型的变量和参数；

变量O_ij的定义过程与步骤2相同，具体到本实施例，由图2可以看出，GPS点把路段l₁上的轨迹分成两个子路段l₁₁和l₁₂，则将子路段l₁₁上的旅行时间表示为O₁₁，将子路段l₁₂上的旅行时间表示为O₁₂。路段l₂上没有GPS点，则O₂₁表示在整个路段l₂上的旅行时间。

变量S_i的定义过程与步骤2相同，具体到本实施例，如果S_i＝0，表示车辆在路段i上没有等待红灯；如果S_i＝2，说明车辆在路段i上等了2个红灯；

步骤C:确定隐马尔可夫模型参数的初始值，推导出隐马尔可夫模型变量的初始值；

具体与步骤3相同，本实施例中设置道路红灯信号周期d的最小取值d_min＝1，最大取值d_max＝2，设置道路隐藏状态的个数K＝6；

其中，因为道路等级不同，所以d的取值也不尽相同，但是d的取值始终在范围[d_min,d_max]内；此外，步骤3中EM算法的M步中需要对参数d值进行更新，如果更新的d的值超出了范围[d_min,d_max]，则不予更新；

其中，在步骤3运用EM算法的过程中，需要确定每个路段的K值。将K值从2到10进行遍历，选择其中能使AIC(赤池信息量准则)的值最小的K值，本实施例中我们选择K的值为6；

在交通理论中，路段上任意位置处的车辆密度满足饱和线性函数。为了更好地说明该函数，我们作出函数图像，如图3所示。

由图3可以看出，横坐标表示车辆在路段上的位置，纵坐标的数值表示在路段上某一位置处的车辆密度，在路段起始位置处的车辆密度小于路段终点位置处的车辆密度，说明通常情况下大量车辆会聚集在路段终点位置处等待交通信号灯，该密度函数符合饱和线性函数图像。

为了更好地了解道路旅行时间分配，由于每单位距离长度的旅行时间与道路车辆密度成正比例，我们定义了一个形似车辆密度线性函数的旅行时间分配概率密度函数f(x)，如图4所示。

由图4可以看出，横坐标表示车辆在路段上的位置，纵坐标的数值表示在路段上某一位置处的旅行时间，车辆在路段起始位置处的旅行时间小于在路段终点位置处的旅行时间，说明通常情况下车辆会花更多的时间在路段终点位置处等待交通信号灯，该密度函数符合饱和线性函数图像。

步骤D:根据隐马尔可夫模型变量的值，更新隐马尔可夫模型参数的值；

具体为：在给定变量O_ij、S_i值的情况下，通过对观察值进行归类统计，可以直接估算出所需相应数据出现的次数，从而得到对应的概率矩阵，即得到更新后的参数π的值。

步骤E:根据隐马尔可夫模型参数的值，更新隐马尔可夫模型变量的值；

具体为：首先，在给定参数π、变量O_ij值的情况下，用标准维特比算法来解决隐马尔可夫模型预测问题，从而求出最有可能的对应的隐藏状态序列，从而更新变量S_i的值；然后，在给定参数π的值以及更新后变量S_i值的情况下，通过对带约束的二次优化问题的求解，可以得到变量O_ij的最优解，从而更新变量O_ij的值。

步骤F:判断隐马尔可夫模型变量O_ij的值有无更新，并进行相应操作：

F.1若有更新，对应图1中的“是否收敛”输出的否，则跳至步骤D；

F.2若无更新，对应图1中的“是否收敛”输出的是，则根据子路段旅行时间变量值，计算得出旅行时间分配结果数据集{Y⁽ⁱ⁾,1≤i≤U}，完成了本方法；

至此，从步骤A到F，完成了本实施例一种基于稀疏轨迹点数据的细粒度旅行时间分配方法。

需要说明的是，本说明书所述的只是本发明的较佳具体实施例，以上实施例仅用于说明本发明的技术方案而非对本发明的限制。凡本领域技术人员依本发明的构思通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在本发明的范围之内。

Claims

1.一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，其特征在于：以细粒度的方式进行旅行时间分配，其核心思想为：分析相邻交通信号间的延迟模式，并基于延迟模式中相邻路段之间的延迟依赖条件，对相邻路段之间的状态转移概率进行建模，将一个交通信号周期内不同车辆等待红灯时间的差异区分开来，从而提高配时结果的精确度；针对细粒度旅行时间分配过程中，车辆在一个路段或是一个子路段上的旅行时间及交通信号周期也不容易直接得到的问题，即为了解决间接观察值的问题，提出了一个新隐马尔可夫模型，使得相邻路段间的延迟模式由路段间的状态转移概率决定，再用条件迭代模型来计算出隐马尔可夫模型的参数，即：本发明解决了间接观察值的问题，实现了以细粒度的方式进行旅行时间分配，从而有效提高了配时结果的精确度与正确性；

为实现上述目的，本发明所采用的技术方案如下：一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，包括以下步骤：

步骤1:定义稀疏轨迹点数据集和旅行时间分配结果数据集；

步骤2:定义隐马尔可夫模型变量和隐马尔可夫模型参数；

其中，隐马尔可夫模型，即描述一个含有隐含未知参数的马尔可夫过程的模型，HiddenMarkov Model缩写为HMM；

步骤3:确定步骤2中HMM参数的初始值，推导出HMM变量的初始值；

步骤4:根据步骤3确定的HMM变量的值，更新HMM参数的值；

步骤5:根据步骤4更新的HMM参数的值，更新HMM变量的值；

步骤6:重复进行步骤4和步骤5，直至HMM变量的值不再更新；

2.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，其特征还在于：

步骤1，具体为：

1.1定义稀疏轨迹点数据集：

所述的稀疏轨迹点数据集定义为{X⁽ⁱ⁾,1≤i≤U}；

1.2定义旅行时间分配结果数据集：

所述的旅行时间分配结果数据集定义为{Y⁽ⁱ⁾,1≤i≤U}。

3.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，其特征还在于：

步骤2定义的HMM变量为O_ij和S_i；

步骤2所定义的隐马尔可夫模型参数，即HMM参数为以及π；

π代表路段初始状态分布，具体表示第1个路段的初始状态的多重分布，其中，π是一个k维向量，用来对初始路段l₁的多个状态的多重分布进行参数化设置。

4.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，其特征还在于：

步骤3中，HMM参数，具体为和π；HMM变量，具体为O_ij、S_i；

3.1确定HMM参数的初始值，具体为:

其中，d代表红灯信号周期，即是高斯混合模型中波峰出现的周期，在一般情况下，不同等级道路的红灯信号周期也各不相同，宽阔道路的红灯信号周期通常比狭窄道路的更大，由于道路等级不同，所以d的取值也不尽相同；将该组高斯分布中对应着的道路隐藏状态S_i的个数记为K+1；观测数据t⁽ⁱ⁾可以由高斯混合模型产生，具体为：依概率从高斯混合模型的多项分布中选择一个高斯分布分模型，再依此分模型的概率分布生成观测数据t⁽ⁱ⁾；

3.1.2运用EM算法，即期望最大化算法，估计高斯混合模型的参数{μ₀,d,φ,σ}；

其中，EM算法，包括E步和M步，具体为：

其中，模型参数d的梯度值，记为计算公式为公式(4)：

其中，模型参数σ_j的梯度值，记为计算公式为公式(5)：

其中，模型参数μ₀的梯度值，记为计算公式为公式(6)：

其中，高斯分布分模型φ更新公式为公式(7)：

至此，便可确定子路段上的旅行时间分布的初始值；

3.2确定HMM参数的初始值，具体为：

3.3确定HMM参数π的初始值，具体为：

根据已知的路段i在每个状态下旅行时间的均值、方差，对大量车辆在路段i上的旅行时间观察值进行归类统计，得到在特定的路段i上的旅行时间观察值集合{t⁽ⁱ⁾,1≤i≤V}，该数据集服从一个高斯混合模型，用一组高斯分布来表示该高斯混合模型，从该高斯混合模型中可以得出某一车辆在路段i上属于哪一类隐藏状态，从而得到路段i上车辆属于各种隐藏状态的概率矩阵，即确定了参数π的初始值；其中，参数π是一个k维向量，其中，k是指路段i隐藏状态的类别总数；

3.4推导出变量O_ij、变量S_i的初始值，具体为：

其中，概率似然函数的计算公式为公式(9)：

5.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，其特征还在于：

步骤4中，HMM参数，具体为和π；HMM变量，具体为O_ij、S_i；且步骤4，具体为：

在给定HMM变量的值的情况下，对大量车辆在路段i上的旅行时间观察值进行归类统计，得到在特定的路段i上的旅行时间观察值集合{t⁽ⁱ⁾,1≤i≤V}，对此观察值集合进行分析可以直接估算出所需相应数据出现的次数，从而得到对应的概率矩阵，即得到更新后的参数π的值。

6.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，其特征还在于：

步骤5中，HMM参数，具体为和π；HMM变量，具体为O_ij、S_i；且步骤5，具体为：

首先，在给定参数π、变量O_ij值的情况下，用标准维特比算法来解决隐马尔可夫模型预测问题，从而求出最有可能的对应的隐藏状态序列，从而更新变量S_i的值；然后，在给定参数π的值以及更新后变量S_i值的情况下，通过对带约束的二次优化问题的求解，可以得到变量O_ij的最优解，从而更新变量O_ij的值。

7.根据权利要求1所述的一种基于稀疏轨迹点数据的细粒度旅行时间分配方法，其特征还在于：

步骤6中，HMM变量，具体为O_ij；

步骤7中，不同路段的旅行时间分配结果数据集，记为：{Y⁽ⁱ⁾,1≤i≤U}；子路段旅行时间变量，即步骤2中的HMM变量O_ij；

其中，计算公式为公式(10):

其中，Y_j代表第j个路段的旅行时间，O_ji代表第j个路段上的第i个子路段的旅行时间。