基于复杂轨迹网络划分模型的离线地图匹配方法和系统
技术领域
本发明涉及离线地图匹配技术,具体涉及基于复杂轨迹网络划分模型的离线地图匹配方法和系统。
背景技术
地图匹配是将具有时间和空间维度信息的一系列存在精度损失的GNSS轨迹点映射到实际的道路上,辅助解决城市计算中的相关问题,例如智能交通、用户出行、轨迹深度理解等其他基于位置的服务。地图匹配精度的提高仍旧是热点难点问题,直接影响基于位置的数据服务。复杂轨迹网离线地图匹配对精度要求更高,往往也更加耗时,需要平衡精度和时间的关系。
近年来,随着无线网络和“互联网+共享经济”的快速发展,在线旅游服务场景转向移动终端,移动终端上装载的GNSS设备每天收集大量的移动位置序列。由于传感器自身的定位误差和采样误差,以及环境噪声的影响,GNSS采集的数据与实际道路的偏差较大(从几米到几十米),定位精度较低。由于采样频率较低,特别是在复杂的城市道路网络中,当采样速度较高、采样间隔较短、采样误差较大时,容易丢失两个采样点之间的细节信息。此外,由于GNSS数据来自第三方互联网公司,安全通信等没有完美的解决方案(尤其是无线安全通信),无法全面获得原始数据,这使得它不可能充分利用原始数据来创建一个地图匹配模型,进而去实现离线地图匹配任务解决复杂轨迹地图匹配。复杂轨迹网络的离线地图匹配要求较高的精度,且往往耗时较长,需要在精度和时间之间取得有效的平衡。
发明内容
本发明所要解决的技术问题是复杂轨迹网络的离线地图匹配要求较高的精度,且往往耗时较长,需要在精度和时间之间取得有效的平衡,目的在于提供基于复杂轨迹网络划分模型的离线地图匹配方法和系统,解决上述问题。
本发明通过下述技术方案实现:
基于复杂轨迹网络划分模型的离线地图匹配方法,包括以下步骤:S1:数据预处理,自定义交叉路口轨迹划分模型,并根据所述交叉路口轨迹划分模型将复杂轨迹网络划分为单轨迹集合;S2:地图匹配,将所述单轨迹集合输入优化的权值适配隐马尔科夫模型中,通过可观察的GNSS位置序列确定隐藏的实际位置序列;所述优化的权值适配隐马尔科夫模型中的初始状态概率矩阵、观测概率矩阵和状态转移概率矩阵拟合历史的真实数据获得;其中所述状态转移概率矩阵将结合轨迹数据分析所得阈值确定,满足阈值约束条件的状态转移概率矩阵将引入方向因子进行联合计算;S3:后处理,对步骤S2输出到道路上的匹配轨迹数据进行精准匹配和映射;所述精准匹配为线段级别的匹配和点级别的精准映射。
本发明应用时,首先将离线地图中的轨迹网络划分为单轨迹集合,解决了复杂轨迹网络不能直接输入隐马尔科模型的问题;其次由于在隐马尔科夫模型中,转移概率加入了方向因子进行了修正,所以可以平衡效率和准确性间的关系,使得本发明更具实用性。而对匹配轨迹数据进行点级别的精准映射操作后,可以进一步的提高精度。在本发明的隐马尔科夫模型中初始概率代表移动对象初始时位于某个路段上的概率,使用相应GNSS样本点的观测概率来表示,观测概率表示为观测的GNSS样本点离候选路段越近,这个样本点在这个路段上的概率就越大,状态转移概率表现为前后两个样本点的距离越近,状态转移的概率就越大,真实路段上的前后两个点之间距离与观测的前后两个样本点之间距离越接近,状态转移概率就越大。本发明通过上述方式有效的平衡了效率和准确性间的关系,使得更具实用性,同时具有较高的精度,测试精度可达98%。
进一步的,步骤S1包括以下子步骤:S11:预处理所述离线的历史的复杂轨迹网络,将GNSS时序点集经自定义轨迹网络划分后生成单轨迹集合;S12:建立约束条件;所述约束条件包括在交叉路口选择方向变化相对较小的路径,干道的内角大于非主干道;S13:根据所述约束条件将离线地图中的轨迹网络划分为单轨迹集合。
本发明应用时,做了两个定义,第一个是轨迹网络,是地图上所有轨迹的集合,用无向图G=<V,E>表示。E是两个节点之间的直线段集合,也称轨迹段集合。V是所有节点的集合。根据无向图中节点度的定义,将节点细分为度为1的端点(起始点和结束点)、度为2的普通点、度大于等于3的交点。每个节点的度记为D1,D2,D3+;第二个是单轨迹,为一系列GPS时序点集,经轨迹网络划分而得,可表示为Tr={(p1,t1,D1),...,(pi,ti,D2),...,(pn,tn,D1)}.pi=(xi,yi)是每个GPS点,包含纬度xi,经度yi时间标识yi、度D(D≤2)。
同时,本发明还做了两个条件作为约束条件,交叉口是轨道划分的关键道路结构。其主要特点是断面之间的连接关系和连接方式。连接关系表示哪些部分可以通过,这些部分可以通过向量轨迹网络直接获得。线段之间的夹角用来描述连接方式,夹角可以用余弦定理来计算。基于人们的行为习惯、路网的实际情况和道路交通规划,我们对交叉口轨迹划分做出如下假设:一方面,在交叉路口,驾驶员更愿意选择方向变化不大的路径。另一方面,在真实的道路网络中,道路又分为主干道、支路、次支路,后面两项也概括为非主干道等。根据相关法律法规和行业标准,主干道一般比支路和次支路更直,主干道的内角比非主路大。
首先确定交叉路口是两条或多条道路(主干道、支路、次支路等)相交的地方。即根据第一个定义和图论,为当节点的度大于等于3时为相交节点,并基于交叉路口轨迹划分模型完成计算。
进一步的,所述轨迹网络通过无向图G=<V,E>表示,其中,E是两个节点之间的直线段集合;V是所有节点的集合,根据无向图中节点度的定义,将节点细分为度为1的端点(起始点和结束点)、度为2的普通点、度大于等于3的交点,每个节点的度记为D1、D2和D3+;
所述单轨迹是一系列GPS时序点集,经轨迹网络划分而得,可表示为Tr={(p1,t1,D1),...,(pi,ti,D2),...,(pn,tn,D1)};pi=(xi,yi)是每个GPS点,包含纬度xi、经度yi、时间标识ti和度D(D≤2);
轨迹划分是当相交节点V的度degree(V)≥3时,采用的自定义交叉路口轨迹划分模型TDM如下:
式中θ
i,j为交叉口两条边的夹角,θ
i,j根据V
i和E
i={e
1,e
2,e
3,…,e
n},n=degree(V
i)获得,且
i,j=1,2,3,…,n,i≠j,I
i={θ
i,j:{e
i,e
j}}为道路交叉口,E
i为两个节点之间的直线段集合中的元素;V
i为轨迹网络中的节点元素。
本发明应用时,交叉口由Vi和Ei={e1,e2,e3,…,en},n=degree(Vi)。两条边的夹角由余弦定理进行计算,i,j=1,2,3,…,n,i≠j.Ii={θi,j:{ei,ej}}指道路交叉口。
进一步的,
步骤S2包括以下子步骤:
观测概率根据下式获取:
其中,p(ot,i|ct,i)为观测概率,dt,i=dist(oi,ci)是观测点ot,i和候选点ct,i的欧式距离,均值u=0,标准差σ根据经验以及数据统计分析估算;
状态转移概率为从一个给定的候选点ct,i到下一个候选点ct+1,j的最短路径到需正确映射路径ot,i和ot+1,j的概率,且所述状态转移概率p(dt)根据下式获得:
其中,候选点间最短路径距离指的是
测量点间的距离是指
和
代表第i
*和j
*个候选点。
进一步的,
步骤S2包括还以下子步骤:
根据盒图分析大量轨迹数据长度的获得阈值D,需计算:
最小的估计值:
LowerLimit=Q1-k(Q3-Q1)
最大的估计值:
UpperLimit=Q3+k(Q3-Q1)
其中,k是用来确定异常的程度异常参数,k=1.5为中度异常,k=3为极端异常;
根据轨迹长度数据分析阈值并加入方向因子优化转移概率。
本发明应用时,车辆的真实轨迹由于离线轨迹无法还原。方向是行车轨迹需要考虑的重要轨迹信息包含支路的。特别是在非主干道GNSS轨道匹配时,加入方向因子计算状态转移概率,可以有效提高匹配精度。但是,如果在计算状态转移概率时考虑每个点的方向因子,则会耗费大量的时间。因此,有必要选择一个合理的轨迹长度阈值,所以本发明采用盒图(Boxplot)计算临界阈值;k=1.5是指中度异常,k=3为极端异常。
本发明使用中的实际测试数据,利用盒图计算非主干道(支路、次支路等)长度的阈值D。四分位数分别为Q1=76,Q2=112,Q3=125。在本发明中,使用中度异常k=1.5。根据试验数据,进行了计算LowerLimit=2.5和UpperLimit=198.5。因此,在本文中,D的值为198米(D∈(2.5,198.5))。
进一步的,步骤S2根据轨迹长度数据分析阈值加入方向因子优化状态转移概率:
通过轨迹划分得到的各支/次支路航向变化,其几何角度变化较大,通过添加方向因子计算发射概率公式为:
其中,λ根据测试数据和经验设定;
所述转移概率优化为公式为:
p(dt,θt)=p(dt)·p(θt)
其中,角度偏差θ
t是每个观测点o
t,i与所有候选点
的之间的夹角差值,
通过余弦定理来计算:
其中,道路数据若没有方向属性,则直接判断夹角是θ还是π-θ,可统一规范化夹角为θt∈[0,π/2]:
其中,起始观测点坐标o
t,i为
候选点c
t,i的坐标为
结束点观测点坐标o
t+1,j为
为候选点c
t+1,j的坐标;利用GNSS轨迹的起始和结束坐标
和
构造GNSS轨迹向量e
ot;使用GNSS轨迹起点和终点的道路映射坐标
和
构建道路向量e
ct。
进一步的,步骤S3后处理为对步骤S2输出到道路上的匹配轨迹数据进行线段级别的精准匹配和位置点级别的精准映射;所述位置点级别的精准映射是采用GNSS和路网统一的轨迹划分模型将交叉点映射为实际的道路交叉点。
进一步,所述的基于复杂轨迹网络划分模型的离线地图匹配方法,其特征在于,步骤S3后处理为对所述S2输出到道路上的匹配轨迹数据进行线段级别的精准匹配和位置点级别的精准映射;所述位置点级别的精准映射是采用GNSS和路网统一的轨迹划分模型将交叉点映射为实际的道路交叉点。
进一步,基于复杂轨迹网络划分模型的离线地图匹配系统,包括:
预处理模块:用于建立复杂轨迹网络划分模型,并根据所述轨迹划分模型将离线地图的历史轨迹网络划分为单轨迹集合;
地图匹配模块:实现将所述单轨迹集合输入到优化的权值适配隐马尔科夫模型中,并通过可观察的GNSS位置序列确定隐藏的实际位置序列;所述优化的权值适配隐马尔科夫模型中的初始状态概率矩阵、观测概率矩阵和状态转移概率矩阵通过一定的规则和数学模型拟合历史的真实数据获得;其中所述状态转移概率矩阵将结合轨迹数据分析所得阈值确定,满足阈值约束条件的将引入方向因子进行联合计算;
后处理模块:用于对地图匹配模型输出到道路上的匹配轨迹数据进行精准匹配和映射,包括线段级别的精准匹配和点级别的精准映射。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明基于复杂轨迹网络划分模型的离线地图匹配方法和系统,通过上述方式,解决复杂轨迹网络不能直接输入隐马尔科模型的问题,并且有效的平衡了效率和准确性间的关系,使得更具实用性,同时具有较高的精度,真实的测试数据精度可达98%。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明方法步骤示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
如图1所示,本发明基于复杂道路网络划分模型的离线地图匹配方法,包括以下步骤:S1:数据预处理,自定义交叉路口轨迹划分模型,并根据所述交叉路口轨迹划分模型将复杂轨迹网络划分为单轨迹集合;S2:地图匹配,将所述单轨迹集合输入优化的权值适配隐马尔科夫模型中,通过可观察的GNSS位置序列确定隐藏的实际位置序列;所述优化的权值适配隐马尔科夫模型中的初始状态概率矩阵、观测概率矩阵和状态转移概率矩阵通过一定的规则和数学模型拟合历史的真实数据获得;其中所述状态转移概率矩阵将结合轨迹大数据分析所得阈值确定,满足阈值约束条件的将引入方向因子进行联合计算;S3:后处理,对所述S2输出到道路上的匹配轨迹数据进行精准匹配和映射;所述精准匹配为线段级别的匹配和点级别的精准映射。
本实施例实施时,首先将离线地图中的轨迹网络划分为单轨迹集合,解决了复杂轨迹网络不能直接输入隐马尔科模型的问题;其次由于在马尔科夫模型中,转移概率加入了方向因子进行了修正,所以可以平衡效率和准确性间的关系,使得本发明更具实用性,而对匹配轨迹数据进行精准映射交叉点的操作后,可以进一步的提高精度。在本发明的隐性马尔科夫模型中初始状态概率代表移动对象初始时位于某个路段上的概率,使用相应GNSS样本点的观测概率来表示,观测概率表示为观测的GNSS样本点离候选路段越近,这个样本点在这个路段上的概率就越大,状态转移概率表现为前后两个GNSS样本点的距离越近,状态转移的概率就越大,真实路段上的前后两个点之间距离与GNSS观测的前后两个样本点之间距离越接近,状态转移概率就越大。本发明通过上述方式,有效的平衡了效率和准确性间的关系,使得更具实用性,同时具有较高的精度,真实数据的测试精度可达98%。
为了进一步的说明本实施例的工作过程,步骤S1包括以下子步骤:S11:将所述离线地图上所有轨迹的集合作为轨迹网络,并将GNSS时序点集经轨迹网络划分后作为单轨迹集合;S12:建立约束条件;所述约束条件包括在交叉路口选择方向变化相对较小的路径和主干道的内角大于非主干道;S13:根据所述约束条件将离线地图中的轨迹网络划分为单轨迹集合。
本实施例实施时,做了两个定义,第一个是轨迹网络,是地图上所有轨迹的集合,用无向图G=<V,E>表示。E是两个节点之间的直线段集合,也称轨迹段集合。V是所有节点的集合。根据无向图中节点度的定义,将节点细分为度为1的端点(起始点和结束点)、度为2的普通点、度大于等于3的交点。每个节点的度记为D1,D2,D3+;第二个是单轨迹,为一系列GPS时序点集,经轨迹网络划分而得,可表示为Tr={(p1,t1,D1),...,(pi,ti,D2),...,(pn,tn,D1)}.pi=(xi,yi)是每个GPS点,包含纬度xi,经度yi时间标识yi、度D(D≤2)。
同时,本申请还做了两个条件作为约束条件,交叉口是轨道划分的关键道路结构。其主要特点是断面之间的连接关系和连接方式。连接关系表示哪些部分可以通过,这些部分可以通过向量轨迹网络直接获得。线段之间的夹角用来描述连接方式,夹角可以用余弦定理来计算。基于人们的行为习惯、路网的实际情况和道路交通规划,我们对交叉口轨迹划分做出如下假设:一方面,在交叉路口,驾驶员更愿意选择方向变化不大的路径。另一方面,在真实的道路网络中,道路又分为主干道、支路、次支路等。根据相关法律法规和行业标准,主干道一般比支路和次支路更直,这意味着主干道的内角比非主路大。
首先确定交叉路口是两条或多条道路(主干道、支路、次支路等)相交的地方。即根据第一个定义和图论,为当节点的读大于等于3是为相交节点,并推导出交叉路口轨迹划分模型完成计算。
为了进一步的说明本实施例的工作过程,所述轨迹网络通过无向图G=<V,E>表示,其中E是两个节点之间的直线段集合,V是所有节点的集合;
所述交叉路口轨迹划分模型根据下式建立:
式中θ
i,j为交叉口两条边的夹角,θ
i,j根据V
i和E
i={e
1,e
2,e
3,…,e
n},n=degree(V
i)获得,且
i,j=1,2,3,…,n,i≠j,I
i={θ
i,j:{e
i,e
j}}为道路交叉口,V
i为轨迹网络中的节点元素;E
i为两个节点之间的直线段集合中的元素。
本实施例实施时,交叉口由V
i和E
i={e
1,e
2,e
3,…,e
n},n=degree(V
i).两条边的夹角由余弦定理进行计算,
i,j=1,2,3,…,n,i≠j.I
i={θ
i,j:{e
i,e
j}}指道路交叉口;根据轨迹划分模型TDM可以获得三条轨迹[{e
1,e
4},{e
2,e
5},{e
3}],进而构建单轨迹集合。
为了进一步的说明本申请中HMM模型中各概率的获取过程:
观察概率:
其中,dt,i=dist(oi,ci)是ot,i和ct,i的欧式距离,均值u=0,根据经验以及数据统计分析得出标准差σ=7m。
转移概率:
转移概率被定义为从一个给定的候选点ct,i到下一个候选点ct+1,j的最短路径到正确映射路径ot,i和Ot+1,j的概率。转移概率p(dt)定义如下:
这里,我们定义
其中,最短路径指的是
正确路径是指||o
t-o
t+1||
great_circle.我们利用公式(5)计算β。在公式(5)中,我们使用
和
代表候选点,i
*和j
*指的是实测的GPS点得到的真实的路段。
通过轨迹划分得到的各支/次支路均有航向变化,其几何角度变化较大。为了提高匹配精度,通过添加方向因子计算发射概率,其表达式为:
其中,根据测试数据和我们的经验,当设置λ∈(3,5)时准确率是最好的。转移概率优化为公式(7):
p(dt,θt)=p(dt)·p(θt) (7)
由于道路网的复杂性,特别是在城市地区,缓冲区半径内有许多候选路段。不需要计算每个观测点ot,i与所有候选点的之间的夹角差值,因此我们改进了角度偏差θt.
是观测点o
t,i和所有候选点
之间的夹角之差,
通过余弦定理来计算,如公式(9):
由于道路数据没有方向属性,无法直接判断夹角是θ还是π-θ。因此,夹角统一规范化为θt∈[0,π/2]:
其中,起始观测点坐标o
t,i为
候选点c
t,i的坐标为
结束点观测点坐标o
t+1,j为
为候选点c
t+1,j的坐标。我们利用GPS轨迹的起始和结束坐标
和
构造GPS轨迹向量e
ot。同样地,我们使用GPS轨迹起点和终点的道路映射坐标
和
构建道路向量e
ct
为了进一步的说明本实施例的工作过程,现举例如下:
所用的GPS数据为非实时的历史的真实数据,轨迹复杂,具有低频性、粗粒度网络的定位信息,大量数据统计结果表明GPS数据与数字地图偏差较大,约为十几米,实际地图匹配难度增加。四川省行政区划面积48.6万km2,GPS导航轨迹总长度34.4万km,道路网络总长度47万km。本实施例,综合考虑复杂情况、重要程度等,抽取成都市五个具有代表性的区域数据。测试数据包括成绵立交、金牛立交、武侯立交、双流机场和城南立交,共3320点96.04公里长度的轨迹,覆盖3.11平方公里的道路区域。
质量评估地图匹配是不容易评价。本文采用一种常用的评价方法,即正确匹配百分率(CMP)来评价准确度,如公式(13)所示。其中Nsr为正确匹配的样本数量,为Nsn错误匹配的样本数量。CMP可以表示为:
根据式(13),我们可以得到测试结果,我们观察到我们的模型平均准确率最高(超过98%),五组测试的每一个结果与HMM和经过优化的HMM相比都是最优的。我们也可以观察到我们的模型的性能是相对稳定的。
运行时间结果表明,为了进一步提高模型的精度,由于十字路口的交叉口映射后处理,我们的模型比优化后的HMM花费的时间稍微多一点。但是,我们使用了Boxplot优化来减少运行时间。离线地图匹配任务不同于实时在线任务。与运行时间相比,它更倾向于先保证精度。实验结果表明,运行时间是可以接受的。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。