CN114462609A

CN114462609A - 一种基于隐马尔可夫模型的浮动车数据轨迹还原方法

Info

Publication number: CN114462609A
Application number: CN202111482841.7A
Authority: CN
Inventors: 李伯钊; 苏世亮; 蔡忠亮; 李霖
Original assignee: Shenzhen Research Center Of Digital City Engineering; Wuhan University WHU
Current assignee: Shenzhen Research Center Of Digital City Engineering; Wuhan University WHU
Priority date: 2021-12-07
Filing date: 2021-12-07
Publication date: 2022-05-10

Abstract

本发明提出了一种基于隐马尔可夫模型的浮动车数据轨迹还原方法。本发明从浮动车数据和城市道路数据的时空特征出发，在将浮动车数据匹配到城市道路上的同时填补浮动车途径路段的信息。具体而言，本发明具有以下创新点：在隐马尔可夫模型任一转移概率的计算中同时考虑了当前所有候选点对之间最短路径的长度；引入点线关系函数来筛选每条候选道路上的所有候选点，并用以补充隐马尔可夫模型的观测概率；在隐马尔可夫模型之外再次考虑候选点对之间的最短路径以及对应原始轨迹点之间的直线长度，以避免概率模型在其他概率较大时忽略了对连通性的考虑。本发明提出的方法可以高效、准确地还原浮动车行驶轨迹，从而提高浮动车数据的采样频率和价值。

Description

一种基于隐马尔可夫模型的浮动车数据轨迹还原方法

技术领域

本发明属于GPS轨迹处理技术领域，尤其涉及一种基于隐马尔可夫模型的浮动车数据轨迹还原方法。

背景技术

浮动车数据是交通监管和城市研究中广泛使用的数据源，但是浮动车数据普遍存在采样频率不稳定以及位置偏移较大等问题。地图匹配算法基于城市道路网可以用于修正偏移的浮动车轨迹记录，将浮动车轨迹数据匹配到临近的路段使其具有城市道路网的拓扑信息。隐马尔可夫模型常用于求解地图匹配问题，将待匹配原始轨迹点的位置、角度、行驶时间以及前后相邻轨迹记录之间的空间连通性与道路信息考虑在其概率定义当中。基于隐马尔可夫模型的地图匹配算法存在以下几点缺陷：仅在综合评价函数中考虑候选点对之间的最短路径，当位置和角度的得分较高时可能会忽略对于空间连通性的考虑，使得匹配后的记录之间连通性较弱；通常将原始轨迹点之间的直线距离作为候选点间最短路径的参照，由于GPS存在位置抖动且途径道路可能存在形状变化，从而导致匹配结果易受邻近相似道路的影响；原始轨迹点会在周围一定范围内的候选路段上，根据投影点在路段上的位置确定候选点选择投影点还是靠近原始轨迹点的路段端点，由于隐马尔可夫模型是一个概率模型，在概率累积的过程中，会出现具有偏移的候选点对之间存在比投影点对之间的概率更高的情况，导致匹配的结果在概率计算和累积中易受同一条道路多个相似候选点的影响。为了提高轨迹点匹配的精度，并在地图匹配的同时获取浮动车连贯的行驶轨迹，同时兼顾不同采样频率的浮动车数据，本发明提出了一种基于隐马尔可夫模型的浮动车数据轨迹还原方法，充分考虑了浮动车数据每一个原始轨迹点的时空特征，修改了传统基于隐马可夫模型的地图匹配算法的观测概率和转移概率，并引入了额外的算法逻辑来保证算法的精度和效率。本发明不仅将原始轨迹记录匹配到城市道路网上，同时填补浮动车行驶的关键记录，使得其能够在处理不同采样频率的浮动车数据时，均可以快速地获取连贯、准确的浮动车轨迹，进而提高多源浮动车数据的可用性和价值。

发明内容

本发明的目的在于提供一种基于隐马尔可夫模型的浮动车数据轨迹还原方法，充分考虑了浮动车数据的每个原始轨迹点的时空特性，在顾及空间连通性的同时兼顾效率和精度，不仅将原始轨迹点匹配到城市道路网上，同时还填补浮动车行驶的关键轨迹记录。

本发明的技术方案为一种基于隐马尔可夫模型的浮动车数据的轨迹还原方法，其特征在于，包括以下步骤：

步骤1，将浮动车数据进行数据预处理得到预处理后浮动车数据，将城市道路数据进行数据预处理得到预预处理后城市道路数据；

步骤2，对步骤1预处理后的浮动车数据与预处理后的城市道路数据，选择两种数据之间相应的可以用于轨迹还原的时空特征，并定义这些时空特征的概率计算方法，进而根据所有概率的乘积确定浮动车数据行驶的具体路段；

步骤3，根据浮动车原始轨迹点的空间位置概率，行驶方向的概率，原始轨迹点与候选路段之间关系的概率，浮动车候选点之间最短路径的概率以及浮动车候选点间行驶速度的概率，进一步构建隐马尔可夫模型；

步骤4，取预处理后的浮动车数据，依次遍历每一个预处理后的浮动车数据，并结合预处理后的城市道路数据，利用隐马尔可夫模型的轨迹总体概率，计算浮动车行驶的所有可能的候选路径以及路径的概率得分；

作为优选，步骤1所述浮动车数据原始格式包含车辆标识、空间位置、行驶方向角、以及记录的采集时间；

所述空间位置由经度、纬度构成；

步骤1所述将浮动车数据进行数据预处理，具体为：

多组浮动车数据根据浮动车的车辆标识分别分组至不同的浮动车数据集合，将浮动车的车辆标识相同的浮动车数据分至同一个浮动车数据集合；

在每辆浮动车数据集合中，将每辆浮动车的轨迹记录信息根据对应的记录时间按时间顺序进行排序得到排序后每辆浮动车数据集合，数据集合由p_i＝(id_i，x_i，y_i，a_i，t_i)来表示，其中i代表轨迹记录在数据集合中的顺序；

在排序后每辆浮动车数据集合中，根据相邻两个时刻每辆浮动车的位置信息计算相邻两个时刻的欧式距离；

在排序后每辆浮动车数据集合中，根据相邻两个时刻记录的时间计算时间间隔，结合相邻两个时刻的欧式距离计算相邻两个时刻浮动车的速度；

以城市最大限速120km/h作为阈值，初步筛查异常点，并在存在异常点的位置将轨迹打断，打断后得到多组满足最大限速条件的浮动车数据集合；

最后对得到的多组满足最大限速条件的浮动车数据集合进行遍历，仅保留数据集合中多于5个轨迹记录的数据集合；

步骤1所述将城市道路数据进行数据预处理，具体为：

根据城市道路数据的拓扑关系，提取城市道路数据中的道路节点，并对道路按照其折点进行打断，从中提取并分离节点(N＝[n₁...n_p])、形状点(SP＝[sp₁...sp_q])、路段(S＝[s₁...s_m])以及路(R＝[r₁...r_n])等要素。其中节点为三条及以上线段的交点，以及没有与其他线段关联的端点，节点主要用于最短路径算法中的有向图构建；路是两个节点之间的折线或者线段，与其他路之间首尾相连且没有被其他路打断；路中除了节点之外的折线的端点，代表了路的形状，主要用于候选点的计算以及轨迹还原时途经点的填补；由一个或者两个形状点构成的线段(没有形状点路在轨迹还原获取候选路段时也称为路段)。

采用R*树对路段信息进行空间索引，使得可以根据空间范围获取范围内包含或相交的路段信息；采用红黑树对道路、节点信息进行属性索引，使得可以根据要素的id或者关联id查询要素详细信息，以方便轨迹还原方法在求解中对数据的调用；

利用节点和路之间的拓扑关系，构建最短路径算法中所需的带权有向图，由节点作为带权有向图的节点，路作为带权有向图的边，权重为路的长度；

城市道路数据的预处理结果，可以在当前城市下的所有浮动车轨迹记录中重复使用，因此只需要在轨迹还原方法开始之前执行一次即可。

作为优选，所述步骤2具体分为以下步骤：

步骤2.1，计算浮动车原始轨迹点空间位置的概率；

浮动车原始轨迹点与候选点之间的距离满足正态分布，浮动车空间位置的概率函数F_d定义如下：

其中，

代表第i个原始轨迹点的第j个候选点，

代表了第i个原始轨迹点与其第j个候选路径上的候选点之间的距离，μ_d和σ_d分别代表距离的均值和标准差；

步骤2.2，计算浮动车原始轨迹点行驶方向的概率；

浮动车行驶方向与候选路段的方向之间的夹角同样满足正态分布，因此浮动车行驶方向的概率函数F_θ定义如下：

其中，

代表第i个原始轨迹点p_i的第j个候选点，

代表了浮动车第i个原始轨迹点的行驶方向与第j个候选路段的方向之间的夹角，μ_θ和σ_θ分别代表角度的均值和标准差；

步骤2.3，计算浮动车原始轨迹点与候选路段之间关系的概率

其中，

代表第i个原始轨迹点p_i的第j个候选点，

代表第i个原始轨迹点与第j个候选路段之间的点线关系函数值，点线关系函数定义如下：

其中，原始轨迹点坐标为(x，y)，线段以A(x₁，y₁)为起点以B(x₂，y₂)为终点，如果原始轨迹点可以垂直投影在线段上，则点线关系函数值的范围为[0，1]，则不对轨迹当前的概率得分的进行惩罚，否则将一定程度上降低轨迹当前的概率得分。

步骤2.4，计算浮动车候选点之间最短路径的概率

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表由候选点

到候选点

之间最短路径的概率；

代表了候选点

和

之间的最短路径距离，而原始轨迹点p_i具有多个候选点，c_i代表了p_i的所有候选点；min(c_i-1，c_i)和max(c_i-1，c_i)则分别代表了由c_i和c_i-1中的所有候选点构成的所有候选点对之间的最短路径距离的最小值和最大值，上述公式将最短路径距离归一化到|0.5，1]之间。

步骤2.5，计算浮动车候选点间行驶速度的概率

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表由候选点

到候选点

之间行驶速度的概率；

代表了从候选点

到候选点

的平均速度，具体由两个候选点之间的最短路径值除以两个原始轨迹点之间的行驶时间计算而来，v_u代表了当前行驶道路u的最大限速，而k代表候选点

与

之间最短路径途径的路段个数。

作为优选，所述步骤3具体为：

步骤3.1观测概率用于描述隐含节点的某种状态类型产生某种观测值的概率，在轨迹还原问题上，观测概率代表了浮动车行驶在当前路段上产生当前轨迹点记录的概率，因此需考虑当前原始轨迹点与候选路段之间的关系，包括位置、角度以及点线关系函数值等：

其中，

代表第i个原始轨迹点p_i的第j个候选点，

为步骤2.1所述的浮动车原始轨迹点空间位置的概率；

为步骤2.2所述的浮动车原始轨迹点行驶方向的概率；

为步骤2.3所述的浮动车原始轨迹点与候选路段之间关系的概率。

步骤3.2转移概率，转移概率用来描述从一个隐含状态到另一个隐含状态的概率，在轨迹还原问题中，转移概率代表了从一个候选路段到另一个候选路段之间的概率，因此不仅需要考虑两个候选路段之间的最短路径，同时需要考虑浮动车相邻原始轨迹点之间的行驶时间、瞬时速度与城市道路限速之间的关系：

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表有候选点

到候选点

之间的转移概率；

为步骤2.4所述的浮动车候选点之间最短路径的概率；

为步骤2.5所述的浮动车候选点间行驶速度的概率。

步骤3.3，隐马尔可夫模型的轨迹总体概率，为了弱化部分异常值对整个状态轨迹概率造成的影响，因此采用概率累加的方式来计算状态序列的最终概率值，并假定每个当前原始轨迹点的概率计算过程都是独立的；所以观测概率和转移概率，可以改称为观测得分和转移得分，按照隐马尔可夫模型的逻辑，计算隐马尔可夫模型的轨迹总体概率：

其中，

代表第i个状态节点的第j个状态类型，在地图匹配问题上，代表第i个原始轨迹点所选择的第j个候选路段，j，s，t代表了在不同原始轨迹点处所选择的候选路段的序号。

作为优选，所述步骤4具体为：

步骤4.1，候选路段获取，依次遍历所有原始轨迹点。在每轮的计算过程中，以当前遍历的原始轨迹点为圆心，搜索一定阈值范围内的路段，根据行驶方向和道路方向经过筛选后。根据原始轨迹点与候选路段的点选关系函数，确定当前候选路段的候选点。

步骤4.2，候选路段分组，根据点线关系函数以及原始轨迹点与候选点之间的距离，将候选点分别添加到候选集和备选集中。其中候选集中保留点线关系函数在[0，1]之间，或线关系函数值在[-0.1，0)∪(1，1.1]之间或者原始轨迹点与候选点之间的距离小于一定阈值的路段，候选集中确保每个道路仅保留一个匹配位置最佳的候选点，其他候选路段将暂时添加至备选集，当候选集为空或者候选集中与前一原始轨迹点的所有候选点均不连通时再进一步考虑。

步骤4.3，候选路段筛选，在候选路段分组完成之后，如果候选集中不存在任何候选路段，则将备选集中的候选路段添加到候选集当中，以应对浮动车轨迹点位置异常而导致的复杂场景。随后根据当前原始轨迹点与候选路段的位置和角度信息来对每一个候选路段进行综合评判，随后根据评价得分保留前几个候选点进入隐马尔可夫模型中进一步求解，其他候选点将放入备选集。

步骤4.4，观测概率计算，采用具有动态规划思想的Viterbi算法求解隐马尔可夫模型的预测问题。依次遍历当前原始轨迹点所有候选点，计算当前候选点的观测概率，如果不存在前序候选点，则标记当前候选点中观测概率得分最高的一项，对下一原始轨迹点执行步骤4.4；否则进入步骤4.5。

步骤4.5，最短路径求解，求解当前原始轨迹点的所有候选点与所有前序候选点之间的最短路径，最短路径算法中引入行驶时间以控制算法的解算范围。求解最短路径的同时，记录下所有候选点对最短路径长度的最大和最小值。如果寻路成功，则同时返回途径的路段信息。

步骤4.6，最短路径判断，在隐马尔可夫模型之外考虑原始轨迹点之间的直线距离，如果最短路径求解失败，或者最短路径长度与原始轨迹点直线距离之比超过一定阈值，则认为当前候选点对之间不连通。如果所有前序候选点与当前原始轨迹点的所有候选点之间均不存在最短路径，则转至步骤4.9对当前已经求解的路径进行记录，并将当前原始轨迹点视为新路径的第一个原始轨迹点由步骤4.3开始计算。

步骤4.7，转移概率计算，在当前原始轨迹点遍历完成之后，判断步骤4.6中记录的最短路径长度的最大最小值，如果最大最小值之差小于一定阈值，为了避免误差对结果的影响，则不再对当前所有候选点的最短路径进行得分计算与比较，将所有候选点的最短路径得分设置为同一分值；否则，对于每一组候选点对，按照步骤2.4计算最短路径得分。配合步骤4.5中返回的途径路段信息，按照步骤2.5计算行驶速度得分，最后根据步骤3.2计算出转移概率得分。

步骤4.8，轨迹整体概率计算及前序候选点保留：根据步骤4.4和步骤4.7中求得的观测概率得分和转移概率得分，根据步骤3.3计算当前原始轨迹点每一个候选点的得分，每一个候选点仅记录使其整体概率得分最高的前序候选点及当前最高的得分。在所有候选点中，标记具有最高得分的一项，进入步骤4.3，求解下一个原始轨迹点；如果当前是最后一个原始轨迹点，则进入步骤4.9。

步骤4.9，递归求解：从最后一个原始轨迹点中的得分最高的候选点开始不断递归其前序候选点即可得到依次每个原始轨迹点的地图匹配结果，而在获取地图匹配结果的同时，根据候选点中记录的途径道路的信息，以及浮动车在当前道路的行驶方向，按照一定顺序拼接，即可得到还原后的轨迹。

与现有技术相比，本发明的效率、精度更高，连贯性更好，适用于不同采样频率的浮动车数据，填补了浮动车途径的形状点信息，具有较好的轨迹还原效果。

附图说明

图1：轨迹还原方法逻辑流程图；

图2：Viterbi算法概率计算流程图；

图3：递归求解过程逻辑流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

下面结合图1至图3介绍本发明的具体实施方式。

一种基于隐马尔可夫模型的浮动车数据的轨迹还原方法，整体流程图如图1所示，具体包括以下步骤：

步骤1所述浮动车数据原始格式包含车辆标识、空间位置、行驶方向角、以及记录的采集时间；

所述空间位置由经度、纬度构成；

步骤1所述将浮动车数据进行数据预处理，具体为：

步骤1所述将城市道路数据进行数据预处理，具体为：

所述步骤2具体分为以下步骤：

步骤2.1，计算浮动车原始轨迹点空间位置的概率；

其中，

代表第i个原始轨迹点的第j个候选点，

代表了第i个原始轨迹点与其第j个候选路径上的候选点之间的距离，μ_d＝0代表距离的均值，σ_d＝50代表距离的标准差；

步骤2.2，计算浮动车原始轨迹点行驶方向的概率；

其中，

代表第i个原始轨迹点p_i的第j个候选点，

代表了浮动车第i个原始轨迹点的行驶方向与第j个候选路段的方向之间的夹角，μ_θ＝0代表角度的均值，σ_θ＝0.5236(30°的弧度值)代表角度的标准差；

步骤2.3，计算浮动车原始轨迹点与候选路段之间关系的概率

其中，

代表第i个原始轨迹点p_i的第j个候选点，

步骤2.4，计算浮动车候选点之间最短路径的概率

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表由候选点

到候选点

之间最短路径的概率；

代表了候选点

和

之间的最短路径距离，而原始轨迹点p_i具有多个候选点，c_i代表了p_i的所有候选点；min(c_i-1，c_i)和max(c_i-1，c_i)则分别代表了由c_i和c_i-1中的所有候选点构成的所有候选点对之间的最短路径距离的最小值和最大值，上述公式将最短路径距离归一化到[0.5，1]之间。

步骤2.5，计算浮动车候选点间行驶速度的概率

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表由候选点

到候选点

之间行驶速度的概率；

代表了从候选点

到候选点

与

之间最短路径途径的路段个数。

其中，

代表第i个原始轨迹点p_i的第j个候选点，

为步骤2.1所述的浮动车原始轨迹点空间位置的概率；

为步骤2.2所述的浮动车原始轨迹点行驶方向的概率；

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表有候选点

到候选点

之间的转移概率；

为步骤2.4所述的浮动车候选点之间最短路径的概率；

为步骤2.5所述的浮动车候选点间行驶速度的概率。

其中，

步骤4，取预处理后的浮动车数据，依次遍历每一个预处理后的浮动车数据，并结合预处理后的城市道路数据，利用隐马尔可夫模型的轨迹总体概率，计算浮动车行驶的所有可能的候选路径以及路径的概率得分，具体可细分为以下步骤：

步骤4.1，候选路段获取：依次遍历所有原始轨迹点。以当前遍历的原始轨迹点为圆心，搜索半径150米范围内的所有路段。根据原始轨迹点的行驶方向和道路的方向，将角度差超过60°的路段首先排除。随后获取候选点，如果原始轨迹点的投影点能够垂直投影到候选路段上(点线关系函数值r∈[0，1])，则选择投影点作为当前候选路段的候选点，计算公式如下：

x＝x₁+r*(x₂-x₁)

y＝y₁+r*(y₂-y₁)

步骤4.2，候选路段分组：根据点线关系函数以及原始轨迹点与候选点之间的距离，将点线关系函数值在[0，1]之间的候选路段直接添加到候选集当中；点线关系函数值在[-0.1，0)∪(1，1.1]之间或者原始轨迹点与候选点之间的距离小于50米，则需进一步判断当前候选路段所属的道路id是否已经存在候选集当中，如果不存在则添加当前候选路段到候选集，存在则比较原始轨迹点到候选点之间的距离，仅在候选集中保留距离最小的一个；其他不满足上述条件的候选路段将添加到备选集中。

步骤4.3，候选路段筛选：在候选路段分组完成之后，如果候选集中不存在任何候选路段，则将备选集中的候选路段添加到候选集当中，以应对浮动车轨迹点位置异常而导致的复杂场景。随后根据当前原始轨迹点与候选路段的位置和角度信息来对每一个候选路段进行综合评判，计算公式如下：

即在观测概率中移除了点线关系函数的概率得分。根据评价得分保留前10个候选点进入隐马尔可夫模型中进一步求解，其他候选点将放入备选集。

以下步骤4.4-4.8，详细流程图可参看图2。

步骤4.4，观测概率计算：采用具有动态规划思想的Viterbi算法求解隐马尔可夫模型的预测问题。依次遍历当前原始轨迹点所有候选点，计算当前候选点的观测概率，如果不存在前序候选点，则标记当前候选点中观测概率得分最高的一项，对下一原始轨迹点执行步骤4.4；否则进入步骤4.5。

步骤4.5，最短路径求解：计算当前原始轨迹点的所有候选点与所有前序候选点之间的最短路径，在最短路径算法中引入行驶时间因素，在拓展新节点时，如果实际代价(最短距离)超出了理论上可能的最大代价(在城市最大限速120km/h下，行驶时间能够行驶的最大距离)时，则认定最短路径寻路失败；如果寻路成功，则返回途径的路段信息。在求解最短路径的过程中，记录下所有候选点对最短路径长度的最大和最小值。

步骤4.6，最短路径判断：如果最短路径求解失败，或者最短路径长度与原始轨迹点直线距离之比超过一定阈值(本方案设为3)，则认为当前候选点对之间不连通，不再记录并保留结果；如果前后候选点为同一位置点，则对长度进行修正为一个较小的距离值(本方案设为1米)，以保证算法逻辑的正确性。随后更新当前记录的最短路径长度的最大和最小值，并记录下最短路径求解成功的候选点对；如果所有前序候选点与当前原始轨迹点的所有候选点之间均不存在最短路径，则转至步骤4.9对当前已经求解的路径进行记录，随后删除当前记录的前序候选点，并将当前原始轨迹点视为新路径的第一个原始轨迹点由步骤4.3开始计算。

步骤4.7，转移概率计算：在当前原始轨迹点遍历完成之后，判断步骤9中记录的最短路径长度的最大最小值，如果最大最小值之差小于3米，了避免误差对结果的影响，则不再对当前所有候选点的最短路径进行得分计算与比较，将所有候选点的最短路径得分设置为1；否则，对于每一组候选点对，按照步骤2.4计算最短路径得分。配合步骤8中返回的途径路段信息，按照步骤2.5计算行驶速度得分，最后根据步骤3.2计算出转移概率得分。

步骤4.9，递归求解，流程细节详见图3：从最后一个原始轨迹点中的得分最高的候选点开始不断递归其前序候选点，并且填补由步骤4.5返回的保存在当前候选点中的途径路段信息。由于递归求解得到的轨迹顺序是反向的，因此在填补形状点时，道路的遍历顺序也应当是倒序的，随后根据候选点中记录的途径道路的信息以及当前道路的具体行驶方向，按照与道路方向相反的顺序来遍历这条道路上的所有路段，并且依次添加路段某一端的形状点，例如道路正向行驶，则按照逆序遍历所有路段，并且每次添加路段的起始端点到结果集；在当前候选点的所有形状点添加完成之后要移除最后一个添加形状点，以避免同一节点重复添加。在候选点递归求解完成之后，将结果集进行翻转，即可得到还原后的轨迹结果。

本发明中所描述的具体实施案例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施案例做各种各样的修改或补充或采用类似的方式替代，但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims

1.一种基于隐马尔可夫模型的浮动车数据的轨迹还原方法，其特征在于，包括以下步骤：

步骤4，取预处理后的浮动车数据，依次遍历每一个预处理后的浮动车数据，并结合预处理后的城市道路数据，利用隐马尔可夫模型的轨迹总体概率，计算浮动车行驶的所有可能的候选路径以及路径的概率得分。

2.根据权利要求1所述的基于隐马尔可夫模型的浮动车数据的轨迹还原方法，其特征在于，步骤1所述浮动车数据原始格式包含车辆标识、空间位置、行驶方向角、以及记录的采集时间；

所述空间位置由经度、纬度构成；

步骤1所述将浮动车数据进行数据预处理，具体为：

步骤1所述将城市道路数据进行数据预处理，具体为：

根据城市道路数据的拓扑关系，提取城市道路数据中的道路节点，并对道路按照其折点进行打断，从中提取并分离节点(N＝[n₁...n_p])、形状点(SP＝[sp₁...sp_q])、路段(S＝[s₁...s_m])以及路(R＝[r₁...r_n])等要素；其中节点为三条及以上线段的交点，以及没有与其他线段关联的端点，节点主要用于最短路径算法中的有向图构建；路是两个节点之间的折线或者线段，与其他路之间首尾相连且没有被其他路打断；路中除了节点之外的折线的端点，代表了路的形状，主要用于候选点的计算以及轨迹还原时途经点的填补；由一个或者两个形状点构成的线段(没有形状点路在轨迹还原获取候选路段时也称为路段)；

3.根据权利要求1所述的基于隐马尔可夫模型的浮动车数据的轨迹还原方法，其特征在于，所述步骤2具体分为以下步骤：

步骤2.1，计算浮动车原始轨迹点空间位置的概率；

其中，

代表第i个原始轨迹点的第j个候选点，

步骤2.2，计算浮动车原始轨迹点行驶方向的概率；

其中，

代表第i个原始轨迹点p_i的第j个候选点，

步骤2.3，计算浮动车原始轨迹点与候选路段之间关系的概率

其中，

代表第i个原始轨迹点p_i的第j个候选点，

其中，原始轨迹点坐标为(x，y)，线段以A(x₁，y₁)为起点以B(x₂，y₂)为终点，如果原始轨迹点可以垂直投影在线段上，则点线关系函数值的范围为[0，1]，则不对轨迹当前的概率得分的进行惩罚，否则将一定程度上降低轨迹当前的概率得分；

步骤2.4，计算浮动车候选点之间最短路径的概率

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表由候选点

到候选点

之间最短路径的概率；

代表了候选点

和

之间的最短路径距离，而原始轨迹点p_i具有多个候选点，c_i代表了p_i的所有候选点；min(c_i-1，c_i)和max(c_i-1，c_i)则分别代表了由c_i和c_i-1中的所有候选点构成的所有候选点对之间的最短路径距离的最小值和最大值，上述公式将最短路径距离归一化到|0.5，1]之间；

步骤2.5，计算浮动车候选点间行驶速度的概率

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表由候选点

到候选点

之间行驶速度的概率；

代表了从候选点

到候选点

与

之间最短路径途径的路段个数。

4.根据权利要求1所述的基于隐马尔可夫模型的浮动车数据的轨迹还原方法，其特征在于，所述步骤3具体为：

其中，

代表第i个原始轨迹点p_i的第j个候选点，

为步骤2.1所述的浮动车原始轨迹点空间位置的概率；

为步骤2.2所述的浮动车原始轨迹点行驶方向的概率；

为步骤2.3所述的浮动车原始轨迹点与候选路段之间关系的概率；

其中，

代表第i个原始轨迹点p_i的第t个候选点，

代表有候选点

到候选点

之间的转移概率；

为步骤2.4所述的浮动车候选点之间最短路径的概率；

为步骤2.5所述的浮动车候选点间行驶速度的概率；

其中，

5.根据权利要求1所述的基于隐马尔可夫模型的浮动车数据的轨迹还原方法，其特征在于，所述步骤4具体为：

步骤4.1，候选路段获取，依次遍历所有原始轨迹点；在每轮的计算过程中，以当前遍历的原始轨迹点为圆心，搜索一定阈值范围内的路段，根据行驶方向和道路方向经过筛选后；根据原始轨迹点与候选路段的点选关系函数，确定当前候选路段的候选点；

步骤4.2，候选路段分组，根据点线关系函数以及原始轨迹点与候选点之间的距离，将候选点分别添加到候选集和备选集中；其中候选集中保留点线关系函数在[0，1]之间，或线关系函数值在[-0.1，0)∪(1，1.1]之间或者原始轨迹点与候选点之间的距离小于一定阈值的路段，候选集中确保每个道路仅保留一个匹配位置最佳的候选点，其他候选路段将暂时添加至备选集，当候选集为空或者候选集中与前一原始轨迹点的所有候选点均不连通时再进一步考虑；

步骤4.3，候选路段筛选，在候选路段分组完成之后，如果候选集中不存在任何候选路段，则将备选集中的候选路段添加到候选集当中，以应对浮动车轨迹点位置异常而导致的复杂场景；随后根据当前原始轨迹点与候选路段的位置和角度信息来对每一个候选路段进行综合评判，再根据评价得分保留前几个候选点进入隐马尔可夫模型中进一步求解，其他候选点将放入备选集；

步骤4.4，观测概率计算，采用具有动态规划思想的Viterbi算法求解隐马尔可夫模型的预测问题；依次遍历当前原始轨迹点所有候选点，计算当前候选点的观测概率，如果不存在前序候选点，则标记当前候选点中观测概率得分最高的一项，对下一原始轨迹点执行步骤4.4；否则进入步骤4.5；

步骤4.5，最短路径求解，求解当前原始轨迹点的所有候选点与所有前序候选点之间的最短路径，最短路径算法中引入行驶时间以控制算法的解算范围；求解最短路径的同时，记录下所有候选点对最短路径长度的最大和最小值；如果寻路成功，则同时返回途径的路段信息；

步骤4.6，最短路径判断，在隐马尔可夫模型之外考虑原始轨迹点之间的直线距离，如果最短路径求解失败，或者最短路径长度与原始轨迹点直线距离之比超过一定阈值，则认为当前候选点对之间不连通；如果所有前序候选点与当前原始轨迹点的所有候选点之间均不存在最短路径，则转至步骤4.9对当前已经求解的路径进行记录，并将当前原始轨迹点视为新路径的第一个原始轨迹点由步骤4.3开始计算；

步骤4.7，转移概率计算，在当前原始轨迹点遍历完成之后，判断步骤4.6中记录的最短路径长度的最大最小值，如果最大最小值之差小于一定阈值，为了避免误差对结果的影响，则不再对当前所有候选点的最短路径进行得分计算与比较，将所有候选点的最短路径得分设置为同一分值；否则，对于每一组候选点对，按照步骤2.4计算最短路径得分；配合步骤4.5中返回的途径路段信息，按照步骤2.5计算行驶速度得分，最后根据步骤3.2计算出转移概率得分；

步骤4.8，轨迹整体概率计算及前序候选点保留：根据步骤4.4和步骤4.7中求得的观测概率得分和转移概率得分，根据步骤3.3计算当前原始轨迹点每一个候选点的得分，每一个候选点仅记录使其整体概率得分最高的前序候选点及当前最高的得分；在所有候选点中，标记具有最高得分的一项，进入步骤4.3，求解下一个原始轨迹点；如果当前是最后一个原始轨迹点，则进入步骤4.9；