CN104330089B - 一种利用历史gps数据进行地图匹配的方法 - Google Patents
一种利用历史gps数据进行地图匹配的方法 Download PDFInfo
- Publication number
- CN104330089B CN104330089B CN201410649530.9A CN201410649530A CN104330089B CN 104330089 B CN104330089 B CN 104330089B CN 201410649530 A CN201410649530 A CN 201410649530A CN 104330089 B CN104330089 B CN 104330089B
- Authority
- CN
- China
- Prior art keywords
- data
- point
- section
- elm
- increment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 238000002372 labelling Methods 0.000 claims abstract description 5
- 239000013589 supplement Substances 0.000 claims abstract description 3
- 241000208340 Araliaceae Species 0.000 claims abstract 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims abstract 2
- 235000003140 Panax quinquefolius Nutrition 0.000 claims abstract 2
- 235000008434 ginseng Nutrition 0.000 claims abstract 2
- 238000012545 processing Methods 0.000 claims description 7
- 230000007423 decrease Effects 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 4
- 238000012706 support-vector machine Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 8
- 241001269238 Data Species 0.000 description 4
- 238000013480 data collection Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 210000002364 input neuron Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/28—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network with correlation of data from several navigational instruments
- G01C21/30—Map- or contour-matching
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Automation & Control Theory (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Navigation (AREA)
Abstract
本发明公开了一种利用历史GPS数据进行地图匹配的方法,将历史GPS点记录按车辆ID、记录时间、坐标区域组织成轨迹形式,并将轨迹转换成KML文件;将对应区域的路网数据裁剪出来并转换成KML格式文件;将得到的KML文件叠加在一起,利用标记方法为轨迹中的每一个GPS点标记其所在路段ID,此部分标记数据记为数据集A;只需为其补充方向角信息即可作为训练数据,所得标记数据记为数据集B;将得到的数据集A和第四步得到的数据集B合并作为ELM算法的训练数据集,选定部分与数据集A不相交的历史数据集作为测试数据,用寻参算法寻找ELM参数,直至预测精度最高,此时对应的ELM模型即为该区域内的地图匹配模型。
Description
技术领域
本发明涉及一种地图匹配方法,涉及一种利用历史GPS数据进行地图匹配的方法。
背景技术
在车辆导航系统中,显示在电子地图上的车辆移动轨迹反映了通过GPS测量设备实时测量的结果。然而,导航效果会受到很多因素的影响,比如设备误差,信号强度,地理环境,天气等。由于GPS数据不可避免地包含了很多不确定信息,显示在地图上的车辆轨迹可能与真实轨迹不一致,因此,在进一步挖掘和分析地理信息之前,检测这些误差是很有必要的。
地图匹配就是利用软件方法来识别和纠正GPS采样点到对应空间路网位置的过程。在过去20年里,地图匹配算法被深入研究,但是仍有提高空间。首先,以往的算法并未充分利用已有信息,例如车辆方向,地图拓扑信息,历史GPS轨迹;其次,以往算法适应性较差,有时来自地图的小偏差有可能会对匹配结果产生很大的影响,例如矢量电子地图的坐标偏移。最后,一些算法的匹配过程很复杂,不太适合实时处理。
本质上,地图匹配相当于模式识别过程。通过大量历史GPS轨迹数据的学习能够总结出模式,当产生新的GPS点时能够简洁地进行匹配。考虑到数量众多的路段(标签)和历史轨迹(训练集),我们采用极限学习机(ELM)算法来获取较高的匹配精度和较快的匹配速度。ELM是基于单隐层前馈神经网络(single hidden layer feedforward neural network,SLFNs)[1]算法,相比传统的神经网络算法和支持向量机(support vector machine,SVM),ELM有更快的学习速度。在实验中,利用我们的ELM参数选择算法进行优化,基于ELM的地图匹配方法显示出明显的优势。
发明内容
本发明的目的在于克服上述技术存在的缺陷,提供一种利用历史GPS数据进行地图匹配的方法。
其具体技术方案为:
一种利用历史GPS数据进行地图匹配的方法,包括以下步骤:
第一步:将历史GPS点记录按车辆ID、记录时间、坐标区域组织成轨迹形式,并将轨迹转换成KML文件(能够直观显示在电子地图上即可);
第二步:将对应区域的路网数据(一般为GDB格式)裁剪出来并转换成KML格式文件(与第一步的格式一致);
第三步:将第一步和第二步得到的KML文件叠加在一起,利用我们提出的标记方法为轨迹中的每一个GPS点标记其所在路段ID,此部分标记数据记为数据集A(利用历史GPS数据得到的带标签数据);
第四步:路网数据本身带有很多道路的关键点信息,这些关键点包含坐标信息和路段ID,只需为其补充方向角信息即可作为我们的训练数据,具体步骤如下:
步骤1:将GDB格式的路网数据转换成JSON格式(文本格式即可,方便处理);
步骤2:提取出每一路段内的关键点坐标、路段ID和单双道标记;
步骤3:利用前后关键点的坐标信息计算航向,即方向角。
完成上述步骤以后,所得标记数据记为数据集B(利用路网得到的带标签数据);
第五步:将第三步得到的数据集A和第四步得到的数据集B合并作为ELM算法的训练数据集,选定部分与数据集A不相交的历史数据集作为测试数据(不带标签),用我们的寻参算法寻找ELM参数,直至预测精度最高。此时对应的ELM模型即为该区域内的地图匹配模型。
优选地,所述标记方法具体为:
第一步:根据当前标注点邻近点的位置分布粗略地判断当前点的位置,确定轨迹的移动趋势;
第二步:确定标记点的候选路段。在以标记点为圆心,误差距离(与GPS采样芯片有关,本文为50米)为半径的圆形区域内覆盖的路段为该标记点的候选路段。
第三步:根据标记点的方向角属性选择候选路段。假设路段i与正北方向夹角为α,当标记点的方向角与α的差值的绝对值小于15度时,则标记点所在路段ID记为i。
为路网中的关键点补充方向角属性:
第一步:将GDB格式的路网数据转换成JSON格式(文本格式即可,方便处理);
第二步:提取出每一路段内的关键点坐标、路段ID和单双道标记;
第三步:利用前后关键点的坐标信息计算航向,即方向角。记当前的经纬度为CurLongi、CurLatti,单位为度;下一点的经纬度为tgtLongi、tgtLatti,单位为度。由平面几何的知识,计算反正切atan((tgtLongi-CurLongi)/(tgtLatti-CurLatti)),再经过象限处理,就可得到目标航向,即当前点的方向角。
ELM寻找参数算法:
第一步:选择一个较小的隐层节点数(我们选取的是20),将其定义为基数;
第二步:设置一个较大的增量,定义为第一增量(我们设置的第一增量为100)。在第一增量区间内,从基数开始增加隐层节点数直到测试精度开始下降。记录该区间内达到最大测试精度的节点数,记为A1,最后的节点数记为B1;
第三步:设置一个比第一增量小的增量,定义为第二增量(我们设置的第二增量为50)。在第二增量区间内,从A1开始增加隐层节点数直到测试精度开始下降或者节点数超过B1。记录该区间内达到最大测试精度的节点数,记为A2,最后节点数记为B2;
第四步:回到第三步,直到增量为1。
与现有技术相比,本发明的有益效果为:
本发明是一种基于模式识别的方法来解决地图匹配问题。地图匹配问题可以看做是多分类问题,通过极限学习机算法完成多分类可以在十分短的时间内达到很高的精度。为了减少计算时间,我们通过网格划分使得处理过程并行化。另外,我们提出寻找ELM最优隐层节点数算法优化原始的ELM算法,通过对数据进行归一化操作提高了匹配精度,同时得到更稳定的结果。
附图说明
图1是一条出租车A的轨迹;
图2是同一辆车在十天内的轨迹;
图3是单隐层前馈神经网络(SLFNs)结构图;
图4是一个划分的网格;
图5是标签获取过程原理图;
图6是某路段上的关键点;
图7是ELM的最优参数。
具体实施方式
下面结合具体附图和实施例对本发明的技术方案作进一步详细地说明。
预备
1.1定义
定义1(路段):一个路段r是在两个道理结点间的路径。一个路段通常包括了一些其他必要的属性,比如r.id表示路段r的id,r.oneway表示路段r是单向道还是双向道。
定义2(GPS点):GPS点是通过GPS芯片得到的测量点,包括出租车ID,时间戳,出租车状态,经度,纬度,出租车速度,方向角。方向角指的是出租车行进方向与正北方向的夹角,这里角度浮动范围在0到360度,顺时针方向增加,取整数。
定义3(出租车轨迹):一条轨迹包含了同一辆车在一个连续时间段内的连续的GPS点。一辆出租车在一天内可以有多条轨迹。我们只考虑正常运营出租车的三种状态,分别是空车(0),载客(1)和泊车(3)。
下面两条观察结果有助于设计我们的地图匹配算法。为了避免采用误差的影响,我们只考虑方向角在对应路段角度上下浮动15度的GPS点。
总结1:在单向道上,车辆只能在一个方向上行驶。在这种类型的道路上,GPS点的方向角围绕一个定角小范围变化,这个定角由道路形状和道路位置决定。
总结2:在双向道上,车辆允许在两个方向上行驶。对某个道路结点,假设所在路段与正北方向夹角是α(在0-180度内变化),因此另一个夹角是α+180度。因此,在双向道上的GPS点的方向角分别在α和α+180周围小范围浮动。
1.2问题描述和精度评估标准
假设我们得到出租车A在2012年11月1日的所有轨迹。图1显示了出租车A的一条轨迹,很明显,很多GPS点并未在路段上。因此,识别和纠正GPS点到路网中对应路段位置上很关键。
通过我们的方法解决上述问题能够得到GPS点所在的路段的ID。我们采用ACCURACY指标来衡量被正确预测的GPS点数量。CORRECT表示在测试集中被正确匹配的GPS点,SUM表示测试集中输入的GPS点的总数。ACCURACY指标被定义如下:
ACCURACY=CORRECT/SUM (1)
1.3数据集
出租车GPS数据集
在本研究中,使用的历史GPS数据集是由12000辆北京出租车在2012年11月(2012年11月1日到2012年11月30日)收集到的数据,基本完整地记录了北京市出租车的移动情况。该数据集包含了16730个时间分隔的文本文件,每个文件包含超过20000条离散的GPS点记录。在每个文本文件中,这些连续的记录并不相关。表1显示了数据集中“20121110035412.txt”这个文件的部分记录。
表1:使用的样本数据
尽管每一辆出租车的采样率不尽相同,但是一条轨迹中两个连续GPS点的时间间隔大多数都小于10s,这些数据相当于高频数据。然而在实际中,低频数据更常见,因为高频数据会导致较高的数据冗余和多余的能量消耗。因此,我们将这些高频数据稀疏化,这也更符合实际。我们尝试了五种时间间隔,分别是20s,30s,40s,50s和60s。最后,我们决定用30s这个时间间隔重新采样轨迹。这个间隔确保同一轨迹内两个连续点的距离不会太大,因此能够根据邻近点的位置来判断当前点的位置。同时,在同一轨迹内的点也不会太密,可以减少计算开销。
路网数据集
另外一个数据集是北京市的路网数据集,北京路网十分复杂密集。路网是由一系列拥有不同功能,不同级别,城市中不同区域的道路组成的。路网提供了路网分析的基础,比如,寻找最优路径,创建位置服务,或者位置推荐。
基于ELM算法的地图匹配
4.1特征提取
我们分析了同一辆车在不同日期内的轨迹,发现这些轨迹在地图上呈现出一种相似性。图2显示了同一辆车在十天内的轨迹,不同的图标表示不同日期内的轨迹.。很明显,,图上有很多轨迹重叠区域,通过学习大量的出租车轨迹,我们可以总结出车辆的路段模式。从这个角度上,利用多分类算法来学习道路模式是合理的,这个模式是通过大量的不同时间、不同车辆的轨迹总结出来的。
通常,匹配到同一路段上的GPS点是聚集在一起的。在电子地图精确的情况下,分布在道路中心线两侧的点很密集。然而,在平行的、方向相反的路段上,仅仅根据坐标信息很难区分各自路段上的点。幸运的是,平行路段上的点可以利用点中的方向角信息来区分。因此,对每一条GPS点记录,提取的特征向量为<经度,纬度,方向角>。
4.2基于ELM的地图匹配
极限学习机(ELM)是一种新的基于单隐层前馈神经网络(SLFNs)算法。SLFNs的结构如图3所示。与一般的前馈神经网络相比,ELM学习算法更加简单。在ELM中,输入权重
ai(连接第i个输入神经元到隐层神经元)和隐层偏置bi(第i个隐层节点的阈值)是随机选取的。隐层节点的数量L是需要调节的唯一参数。βi是连接第i个隐层节点和输出节点的权重向量,它的值由SLFNs分析得出。
对于N个任意不同的输入样本(xi,ti),这里xi=[xi1,xi2,...,xin]T∈Rn且
ti=[ti1,ti2,...,tim]T∈Rm。隐层节点的输出由函数G(ai,bi,x)得出,如下所示:
G(ai,bi,x)=g(ai·x+bi) (2)
这里g(x)是一个激励函数,本文中,我们使用sigmoid函数g(x)=1/(1+exp(-x))作为激励函数。
SLFNs的输出是:
存在βi,ai和bi使得:
在ELM中,输入权值ai和隐元偏置bi是随机选择的,所以SLFNs可以简单地看成是线性系统,上面的N个等式可以写成如下形式:
Hβ=T (5)
这里
对于线性系统Hβ=T,它的最小标准最小二乘解是:
这里是隐层输出矩阵H的Moore-Penrose广义逆矩阵。这个特殊解不仅能够得到训练误差最小的解,还能得到最小权重的解(详细的证明过程参见[1])。这个突出的特性优于传统的梯度下降学习算法,梯度下降算法比较容易陷入局部最小值。另外,如果网络的权值越小,能够得到更好的性能,然而梯度下降算法只考虑获得最小的训练误差,并未考虑网络权值的规模。
不同于传统梯度学习算法需要考虑学习速率、过拟合和过多的人工干预等问题,ELM算法提供了更直接的解决方案。一般的前馈神经网络的参数都需要迭代地调节,而ELM能够随机产生隐层节点的参数(ai,bi)。相比于传统的前馈神经网络,比如传统的反向传播(BP)算法,支持向量机(SVM)[11]算法,ELM的学习速率十分快,同时,ELM拥有更好的可伸缩性,能够达到相似(对于回归和二值分类的情况)或更好(对于多分类的情况)的性能。
3数据预处理
3.1获取轨迹
我们知道,在多分类算法中,当训练的类别越多,需要的训练时间也会越长。因为我们的路网数据集中有433391个路段,全部一起训练的话,需要的训练时间是相当长的。因此,我们采用网格划分将数据分隔开来,每个网格内的操作能够并行处理。假设路网地图长为L,高为H。我们将整个地图划分为N×N个大小相同的网格,每一个网格长为1=L/N,高为h=H/N。假设路网地图左上角的坐标为p0(lat0,lon0),地图内任意一点的坐标为p(lat,lon),那么点p所属的网格ID由如下式子得出:
这里floor()表示取整函数。
图4展示了一个划分的网格。左上角的坐标是C0(116°42′0″E,39°56′0"N),右下角的坐标是C1(116°45′0″E,39°54′0"N)。
我们采用MapReduce计算框架来处理历史GPS点数据。对于大规模数据处理,MapReduce是一个高效的处理工具[12]。Map函数接收一对输入,产生一组中间键/值对,MapReduce框架将所有键相同的值归集在一起传递给对应的Reduce函数。我们的Map函数输出出租车ID和其对应的GPS点记录信息,Reduce函数为每一辆车归集其所有GPS点记录。在Reduce函数里,首先,我们根据路网划分结果分离不同区域的GPS数据,只提取出租车状态为0或1的点记录;然后,我们将GPS点记录按照时间排序;最后,我们得到每一辆出租车在同一天同一网格内的GPS点记录。
3.2获取类别标签
3.2.1GPS数据集中的点
由3.1节可知,我们已经得到了2012年11月里在目标网格内每一辆出租车的轨迹。我们将这些轨迹转换成能够在电子地图上直观显示的格式。为了方便标注,将路网网格和网格内的轨迹叠加显示在电子地图上。根据坐标,时间顺序和出租车的行驶方向,我们能够为每一个GPS点标注其所在路段的ID。首先,我们根据当前标注点邻近点的位置分布粗略地判断当前点的位置;然后,我们根据行驶的方向角(参见3.1节的两个总结)来确定所在路段ID。
图5显示了获取标签的过程。在这个例子中,所有的路段都是单向道,从星型图标发射出的虚线表示出租车的行驶方向。
在图5中,有四个时间连续的GPS点,分别是P1,P2,p3和p4,我们通过这些点的分布能够确定其所在轨迹的移动趋势,如空心箭头所示。因此,我们可以得到每个GPS点所在的候选路段。对于p1,这里有两个候选路段,分别是Road1和Road2。考虑到在中国车辆的行驶方向是在道路的右侧,如果p1行驶在Road1,那么p1的方向角应该是钝角,实际上p1的方向角是锐角。因此,p1行驶在Road2上,如S1所示。对于p2,候选路段是Road3,Road4和Road5。我们假设Roadi和正北方向的夹角是∠Xi。那么∠X2=2°,∠X4=70°,∠X5=260°。由于p2的方向角是15度,所以p2应该行驶在Road3上更为合理,如S2所示。其余的点以此类推,p3和p4都行驶在Road7上,如图S3,S4所示。
我们把卫星地图和矢量电子地图叠加在一起,再用上述方法标注每一个GPS点。这样有效避免了由误差导致的匹配不精确,比如原始路网地图的偏移误差。
3.2.2路网中的点
我们发现路网本身带有大量的GPS点坐标数据,这些点是每一条道路的关键坐标点,它们确定了道路的形状和位置。图6显示了我们路网数据集中的一条道路的关键点。在直路段上的关键点较少,在弯曲的路段上的关键点较多。
由于这些关键点来自路网,因此比较容易地获取其路段ID,然而,作为训练数据,这些点还少了方向角这个特征。为了解决这个问题我们设计出一种方法来计算方向角。给定一组连续的关键点,我们可以通过它们的坐标计算每一个点的方向角。假设当前点位于单向道上,其坐标为p0(lon0,lat0),它后面的点为p1(lon1,lat1)。假设p0的方向角是α,反正切由下式可得:
α=arctan(((lon1-(lon0)/(lat1-lat0)) (8)
这里arctan()是反正切函数。
最后,我们通过象限处理得到当前点的方向角。如果点在双向道上,同一个坐标对应两个点记录,差别在相反的方向角上,一个方向角为α,另一个方向角为α+180。通过这种方式,我们在一个网格区域内获取到更多的训练数据,大大地提高了匹配精度。
4实验和性能评估
4.1实验
实验中的训练集包含8678条点记录,这些记录由两部分组成,一部分是通过5.2.1介绍的方法标注的数据,包含3227条GPS点记录,它们是来自目标网格内5天的轨迹数据。另一部分是通过目标网格路网获取的数据,包含5451条点记录。训练数据集包含1334条点记录,这些点记录来自历史GPS数据集,且与训练数据集不相交。
为了分析ELM的性能,我们选取支持向量机(SVM)算法在同一数据集上做对比实验。在本文中,我们使用的SVM核函数是径向基函数。SVM算法有两个重要的参数,分别是惩罚因子c和核函数参数g。我们利用网格搜索方法[13]得到该数据集下的最优参数分别是c=32768,g=0.5。寻找最优参数花费220分钟。
我们设计了一个算法来寻找ELM的最优隐层节点数,如下所示:
步骤1:选择一个较小的隐层节点数(我们选取的是20),将其定义为基数;
步骤2:设置一个较大的增量,定义为第一增量(我们设置的第一增量为100)。在第一增量区间内,从基数开始增加隐层节点数直到测试精度开始下降。记录该区间内达到最大测试精度的节点数,记为A1,最后的节点数记为B1;
步骤3:设置一个比第一增量小的增量,定义为第二增量(我们设置的第二增量为50)。在第二增量区间内,从A1开始增加隐层节点数直到测试精度开始下降或者节点数超过B1。记录该区间内达到最大测试精度的节点数,记为A2,最后节点数记为B2;
步骤4:回到第三步,直到增量为1。
通过上述方法,得到该数据集的最佳隐层节点数为690,耗费37分钟寻找ELM的最优参数。
图7显示了ELM算法的最优参数。
4.2性能评估
设置好ELM的隐层节点数后,我们直接用ELM模型学习训练数据,但是得到的测试精度不是很高,尽管学习速度很快。随后,我们将所有输入记录的属性值(除了类别标签)进行归一化,将值归一到[-1,1]。进行归一化以后,测试精度得到明显提高,测试结果也比之前稳定了。表2显示了使用ELM算法归一和未归一的结果。
表2 ELM算法归一和未归一的结果
类型 | 隐层节点数 | 训练时间 | 测试时间 | 测试精度 |
未归一 | 690 | 183.9265s | 1.0367s | 66.12% |
归一 | 690 | 203.1113s | 3.2739s | 87.18% |
未归一 | 100 | 5.4943s | 0.2580s | 39.81% |
归一 | 100 | 14.18058s | 0.6082s | 70.31% |
表3显示了两种不同算法的性能。在本研究中,ELM算法的学习速度(调节参数时间与训练时间总和)是SVM算法的五倍。ELM算法的测试精度和SVM算法的测试精度很接近。更显著的是,ELM算法对每个GPS点的平均预测时间是0.002454s,而SVM算法是0.010714s。因此,我们的方法更适用于实时应用。
表3 ELM和SVM算法的性能比较
以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。
Claims (1)
1.一种利用历史GPS数据进行地图匹配的方法,其特征在于,包括以下步骤:
第一步:将历史GPS点记录按车辆ID、记录时间、坐标区域组织成轨迹形式,并将轨迹转换成KML文件;
第二步:将对应区域的路网数据裁剪出来并转换成KML格式文件;
第三步:将第一步和第二步得到的KML文件叠加在一起,利用标记方法为轨迹中的每一个GPS点标记其所在路段ID,此部分标记数据记为数据集A;
第四步:路网数据本身带有很多道路的关键点信息,这些关键点包含坐标信息和路段ID,只需为其补充方向角信息即可作为训练数据,所得训练数据记为数据集B;
第五步:将第三步得到的数据集A和第四步得到的数据集B合并作为ELM算法的训练数据集,选定部分与数据集A不相交的历史数据集作为测试数据,用寻参算法寻找ELM参数,直至预测精度最高,此时对应的ELM模型即为该区域内的地图匹配模型;
所述标记方法具体为:
步骤A1:根据当前标注点邻近点的位置分布粗略地判断当前点的位置,确定轨迹的移动趋势;
步骤A2:确定标记点的候选路段,在以标记点为圆心,误差距离为半径的圆形区域内覆盖的路段为该标记点的候选路段;
步骤A3:根据标记点的方向角属性选择候选路段,假设路段i与正北方向夹角为α,当标记点的方向角与α的差值的绝对值小于15度时,则标记点所在路段ID记为i;
所述方向角属性确定的步骤为:
步骤B1:将GDB格式的路网数据转换成JSON格式;
步骤B2:提取出每一路段内的关键点坐标、路段ID和单双道标记;
步骤B3:利用前后关键点的坐标信息计算航向,即方向角,记当前的经纬度为CurLongi、CurLatti,单位为度;下一点的经纬度为tgtLongi、tgtLatti,单位为度;由平面几何的知识,计算反正切atan((tgtLongi-CurLongi)/(tgtLatti-CurLatti)),再经过象限处理,就可得到目标航向,即当前点的方向角;
所述寻找ELM参数算法具体为:
步骤C1:选择一个较小的隐层节点数,将其定义为基数;
步骤C2:设置一个较大的增量,定义为第一增量,在第一增量区间内,从基数开始增加隐层节点数直到测试精度开始下降,记录该区间内达到最大测试精度的节点数,记为A1,最后的节点数记为B1;
步骤C3:设置一个比第一增量小的增量,定义为第二增量,在第二增量区间内,从A1开始增加隐层节点数直到测试精度开始下降或者节点数超过B1,记录该区间内达到最大测试精度的节点数,记为A2,最后节点数记为B2;
步骤C4:回到步骤C3,直到增量为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410649530.9A CN104330089B (zh) | 2014-11-17 | 2014-11-17 | 一种利用历史gps数据进行地图匹配的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410649530.9A CN104330089B (zh) | 2014-11-17 | 2014-11-17 | 一种利用历史gps数据进行地图匹配的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104330089A CN104330089A (zh) | 2015-02-04 |
CN104330089B true CN104330089B (zh) | 2017-12-29 |
Family
ID=52404860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410649530.9A Active CN104330089B (zh) | 2014-11-17 | 2014-11-17 | 一种利用历史gps数据进行地图匹配的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104330089B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106652440B (zh) * | 2015-10-30 | 2019-05-21 | 杭州海康威视数字技术股份有限公司 | 一种车辆的频繁活动区域的确定方法及装置 |
CN105509743B (zh) * | 2015-11-24 | 2018-12-28 | 上海汽车集团股份有限公司 | 定位处理方法、业务平台和网络系统 |
US9835460B2 (en) | 2015-12-28 | 2017-12-05 | International Business Machines Corporation | GPS map-matching based on space map-matching |
WO2017117703A1 (zh) * | 2016-01-04 | 2017-07-13 | 薛俊华 | 基于地理位置的导航广告推送系统 |
CN105628033B (zh) * | 2016-02-26 | 2019-04-02 | 广西鑫朗通信技术有限公司 | 一种基于道路连通关系的地图匹配方法 |
CN109564102A (zh) * | 2016-08-22 | 2019-04-02 | 三菱电机株式会社 | 信息提示装置、信息提示系统及信息提示方法 |
CN106407378B (zh) * | 2016-09-11 | 2020-05-26 | 复旦大学 | 一种重新表示路网轨迹数据的方法 |
CN108228632A (zh) * | 2016-12-15 | 2018-06-29 | 方正国际软件(北京)有限公司 | 一种终端轨迹绘制方法及装置 |
CN107289925B (zh) * | 2017-05-25 | 2021-03-05 | 北京奇鱼时代科技有限公司 | 一种绘制用户轨迹的方法和装置 |
US11410074B2 (en) | 2017-12-14 | 2022-08-09 | Here Global B.V. | Method, apparatus, and system for providing a location-aware evaluation of a machine learning model |
CN108616816B (zh) * | 2018-05-07 | 2020-07-03 | 重庆邮电大学 | 一种基于极限学习的车辆轨迹预测和mec应用迁移方法 |
CN109033239B (zh) * | 2018-06-23 | 2022-08-19 | 北京航空航天大学 | 一种基于最小二乘优化的路网结构生成方法 |
CN109405839B (zh) * | 2018-10-23 | 2022-04-12 | 南京林业大学 | 一种基于多路径的交通网络离线地图匹配算法 |
CN109596131A (zh) * | 2018-11-16 | 2019-04-09 | 浩鲸云计算科技股份有限公司 | 一种公交线路与路段关系识别的方法 |
CN111721306B (zh) * | 2019-03-20 | 2022-07-05 | 北京嘀嘀无限科技发展有限公司 | 道路匹配方法、装置、电子设备及可读存储介质 |
CN110503685B (zh) * | 2019-08-14 | 2022-04-15 | 腾讯科技(深圳)有限公司 | 一种数据处理方法以及设备 |
CN110928974A (zh) * | 2019-12-02 | 2020-03-27 | 成都信息工程大学 | 基于Kml生成及融点简化路网的方法 |
CN112506001B (zh) * | 2020-12-16 | 2024-01-05 | 上海华力集成电路制造有限公司 | 过滤光刻模型中特定图形无效量测数据的方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197628A (zh) * | 2007-12-29 | 2008-06-11 | 中国移动通信集团湖北有限公司 | 一种无线系统网元信息呈现方法 |
CN101324440A (zh) * | 2008-07-29 | 2008-12-17 | 光庭导航数据(武汉)有限公司 | 基于预测思想的地图匹配方法 |
CN102147261A (zh) * | 2010-12-22 | 2011-08-10 | 南昌睿行科技有限公司 | 一种交通车辆gps数据地图匹配的方法与系统 |
CN102435197A (zh) * | 2011-08-05 | 2012-05-02 | 刘建勋 | 一种基于mbr的gps轨迹地图匹配方法 |
CN102436598A (zh) * | 2011-09-08 | 2012-05-02 | 崔志明 | 一种基于交通图像信息的车辆最优路径挖掘方法 |
CN103018181A (zh) * | 2012-12-14 | 2013-04-03 | 江苏大学 | 基于相关性分析和elm神经网络的软测量方法 |
CN103698785A (zh) * | 2013-12-13 | 2014-04-02 | 合肥工业大学 | 基于贯序极限学习机的卫星信号周跳探测与修复方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8355864B2 (en) * | 2007-03-27 | 2013-01-15 | Nec Corporation | Map matching system, map matching method and program |
-
2014
- 2014-11-17 CN CN201410649530.9A patent/CN104330089B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101197628A (zh) * | 2007-12-29 | 2008-06-11 | 中国移动通信集团湖北有限公司 | 一种无线系统网元信息呈现方法 |
CN101324440A (zh) * | 2008-07-29 | 2008-12-17 | 光庭导航数据(武汉)有限公司 | 基于预测思想的地图匹配方法 |
CN102147261A (zh) * | 2010-12-22 | 2011-08-10 | 南昌睿行科技有限公司 | 一种交通车辆gps数据地图匹配的方法与系统 |
CN102435197A (zh) * | 2011-08-05 | 2012-05-02 | 刘建勋 | 一种基于mbr的gps轨迹地图匹配方法 |
CN102436598A (zh) * | 2011-09-08 | 2012-05-02 | 崔志明 | 一种基于交通图像信息的车辆最优路径挖掘方法 |
CN103018181A (zh) * | 2012-12-14 | 2013-04-03 | 江苏大学 | 基于相关性分析和elm神经网络的软测量方法 |
CN103698785A (zh) * | 2013-12-13 | 2014-04-02 | 合肥工业大学 | 基于贯序极限学习机的卫星信号周跳探测与修复方法 |
Non-Patent Citations (4)
Title |
---|
Modular Neural Networks for Map-Matched GPS Positioning;Marylin Winter等;《Proceedings of the Fourth International Conference on Web Information Systems Engineering Workshops(WISEW03)》;20041231;全文 * |
一种自适应轨迹曲线地图匹配算法;唐进君等;《测绘学报》;20080831;第37卷(第3期);全文 * |
利用ArcGIS Silverlight 实现的车辆监控技术;何超等;《自动化仪表》;20130731;第34卷(第7期);全文 * |
基于SVM多分类器的FCD地图匹配算法;杨喆等;《电子技术》;20101231(第10期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN104330089A (zh) | 2015-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104330089B (zh) | 一种利用历史gps数据进行地图匹配的方法 | |
CN110264709B (zh) | 基于图卷积网络的道路的交通流量的预测方法 | |
CN105788273B (zh) | 基于低精度时空轨迹数据的城市交叉口自动识别的方法 | |
Karagiorgou et al. | On vehicle tracking data-based road network generation | |
Biljecki et al. | Transportation mode-based segmentation and classification of movement trajectories | |
CN109410586A (zh) | 一种基于多元数据融合的交通状态检测方法 | |
Rogers et al. | Mining GPS data to augment road models | |
CN107766808A (zh) | 道路网络空间中车辆对象移动轨迹聚类的方法及系统 | |
CN105241465B (zh) | 一种道路更新的方法 | |
CN110310474A (zh) | 一种基于时空残差网络的车流量预测方法及装置 | |
CN106710208A (zh) | 交通状态的获取方法及装置 | |
Zhang et al. | Recommending pick-up points for taxi-drivers based on spatio-temporal clustering | |
CN110909788A (zh) | 一种基于统计聚类的轨迹数据中道路交叉口位置识别方法 | |
Zhang et al. | Efficient vehicles path planning algorithm based on taxi GPS big data | |
CN113724489A (zh) | 基于多源数据的交通拥堵溯源方法 | |
CN110413855B (zh) | 一种基于出租车下客点的区域出入口动态提取方法 | |
CN105355047B (zh) | 多交通检测源动态时间粒度的数据融合处理方法 | |
CN105489004A (zh) | 面向道路实时速度计算的卡口与浮动车数据融合方法 | |
CN108765961A (zh) | 一种基于改进型限幅平均滤波的浮动车数据处理方法 | |
CN105740505A (zh) | 一种基于gps-rtk技术的道路空间线形恢复方法 | |
Soe et al. | Haversine formula and RPA algorithm for navigation system | |
CN109800903A (zh) | 一种基于出租车轨迹数据的盈利路线规划方法 | |
CN112598896B (zh) | 一种基于gps数据的工业园区物流关键路段识别方法 | |
CN112562311B (zh) | 基于gis大数据的工况权重因子获取方法及装置 | |
Liu et al. | Determination of routing velocity with GPS floating car data and webGIS-based instantaneous traffic information dissemination |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
DD01 | Delivery of document by public notice |
Addressee: Northeastern University Person in charge of patents Document name: payment instructions |
|
DD01 | Delivery of document by public notice | ||
DD01 | Delivery of document by public notice |
Addressee: Northeastern University Person in charge of patents Document name: Notice of Termination of Patent Rights |