CN111858817B - 一种用于稀疏轨迹的BiLSTM-CRF路径推断方法 - Google Patents
一种用于稀疏轨迹的BiLSTM-CRF路径推断方法 Download PDFInfo
- Publication number
- CN111858817B CN111858817B CN202010716829.7A CN202010716829A CN111858817B CN 111858817 B CN111858817 B CN 111858817B CN 202010716829 A CN202010716829 A CN 202010716829A CN 111858817 B CN111858817 B CN 111858817B
- Authority
- CN
- China
- Prior art keywords
- bilstm
- point
- track
- candidate
- crf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/3446—Details of route searching algorithms, e.g. Dijkstra, A*, arc-flags, using precalculated routes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Remote Sensing (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Radar, Positioning & Navigation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Automation & Control Theory (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明给出了一种用于稀疏轨迹的双向长短时记忆‑条件随机场模型(BiLSTM‑CRF)的路径推断方法,(1)建立路网,得到训练集;(2)然后计算单个轨迹点的低级特征并将低级特征输入至BiLSTM中,得到各点的隐层状态;(3)将隐层状态和权重矩阵相乘,得到状态特征,计算轨迹点间的转移特征A;通过维特比算法求解出最优推断匹配点集合(4)进行后向传播更新参数(5)重复迭代更新参数并预测推断路径。本发明使用BiLSTM和CRF,能够通过BiLSTM自动获取较为高级的特征并且动态自适应调整相关权重,还可以兼顾当前轨迹点的前后轨迹信息。避免了采用传统方法的规则覆盖不全、权重选取困难的缺点。
Description
技术领域
本发明属于导航和智能交通领域,具体涉及一种用于稀疏轨迹的BiLSTM-CRF路径推断方法。
背景技术
随着智慧城市与智慧交通的提出,轨迹数据的重要性益发重要。得益于GPS移动设备的逐步普及,可以获取到大量的GPS轨迹数据。但由于GPS设备本身的局限性以及城市交通环境的影响,通常会存在GPS定位误差。如果直接使用这些未经处理的GPS轨迹数据,会造成较大误差。因此,在处理这些数据前通常会将其与高精密城市路网相匹配,而高效准确地匹配也成为了一项极具现实意义的工作。
直观地看,将GPS轨迹点匹配至路网最简单的方法就是将轨迹点匹配到最近的路段。但事实上会存在诸多因素影响匹配准确率。首先,GPS数据的采样率对匹配准确率有非常大的影响。当处理采样率为每分钟或甚至更长时间的低采样率GPS数据时,位置的不确定性随着采样率的降低而增加。这种不确定性使得正确匹配低采样率轨迹这项工作十分具有挑战性。第二个因素是道路网络的复杂性,这样会更容易产生模糊的匹配而影响匹配结果。
基于条件随机场的低采样率数据的地图匹配算法采用了预设的路网标准差,但是这并非固定值,在不同的环境下可能会略有不同。因此能够自适应地改变参数成为一个难点。此外,挑选出合适的特征对该方法的匹配效果影响较大,而找到合适的人工特征往往需要大量的工作。本发明引入循环神经网络,能够自适应地调整参数与选取隐藏特征。
发明内容
(一)要解决的技术问题
为了解决现有地图匹配方法存在的问题,本发明给出了一种用于稀疏轨迹的BiLSTM-CRF路径推断方法。
(二)技术方案
本发明包含以下步骤:
一种用于稀疏轨迹的BiLSTM-CRF路径推断方法,其特征在于,包括以下步骤:
(1)构建路网,获取路网中的拓扑关系信息;标定轨迹点对应匹配路段和匹配点数据,得到训练集Ttrn;
(2)初始化模型参数集{θ};计算轨迹点到路网中各路段的低级特征Psti,选择低级特征Psti最小的q条路段作为候选路段;依时间顺序输入相邻轨迹点对应的候选路段的低级特征集合Ps至BiLSTM层,获取BiLSTM隐层状态h;
其中,{θ}表示训练参数,包括低级特征Psti中dt和at的权重,此外步骤(3)中di,j和θi,j的权重和注意力矩阵W也是训练参数;q值根据维度和候选点选取要求,其值最小等于轨迹点对应的候选点个数中的最小值,最大等于轨迹点对应的候选点个数中的最大值;低级特征Psti为轨迹点到该轨迹点对应候选路段的垂直距离dt与轨迹点对应车辆的方位角和对应候选匹配路段方位角差值at的加权平均值;BiLSTM代表双向循环神经网络;
(3)构建CRF,将步骤(2)所得的隐层状态h与注意力矩阵W对应位置元素相乘,得到状态特征S;计算轨迹点间的转移特征A;通过维特比算法求解出最优匹配点集合,得到最优推断路径y;
其中,CRF代表条件随机场;W的维数与h一致;转移特征A为相邻轨迹点连线与对应的匹配点的连线的方位角之差θi,j以及相邻轨迹点对应的匹配点在路网上的最短路径的长度di,j的加权平均值;
(4)根据步骤(1)得到的训练集Ttrn中的匹配点集所构成的路径与步骤(3)中求得的最优推断路径y求得误差值,并通过后向传播算法更新模型参数集{θ},其中包括CRF的后向传播以及BiLSTM的后向传播;
(5)重复步骤(2)到步骤(4),直到模型训练完成,将需要预测的轨迹点输入至训练完成的模型进行预测,得到预测路径。
(三)有益效果
本发明的优点体现在:
本发明引入了双向循环神经网络(BiLSTM),不仅可以获取轨迹点的隐藏信息,还能够得到轨迹点前后之间潜在的关系,而且还能够综合考虑当前轨迹点的前后信息,大大减少人工找寻特征的工作量和时间。此外,该方法还能自适应性地改变模型参数,使其与地图匹配问题更加吻合。其中循环神经网络(BiLSTM)求解的最优化目标是单个轨迹点的最可能的匹配点,其他时刻的匹配点对当前匹配结果没有影响。因而损失了这部分的信息,而CRF可以较好地利用已经匹配出的结果来提高后续匹配的准确率。本发明使用BiLSTM和CRF,能够通过BiLSTM自动获取较为高级的特征并且动态自适应调整相关权重,还可以兼顾当前轨迹点的前后轨迹信息。避免了采用传统方法的规则覆盖不全、权重选取困难的缺点。
附图说明
图1为本发明实施的步骤流程图。
图2为CRF与BiSLTM-CRF在测试样本上的匹配结果对比图。
具体实施方式
为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述:
参照图1,本发明的具体实施步骤为:
1.初始化模型参数集{θ},数据预处理
1.1初始化模型参数集{θ}
{θ}表示训练参数,包括低级特征Psti中dt和at的权重,此外步骤(3)中di,j和θi,j的权重和注意力矩阵W也是训练参数;模型参数集{θ}中所有参数赋随机初始值。
1.2建立路网模型
路网定义为一个有向图R(N,E),其中N是路网的连接节点,E为节点间的路段。每一路段包括道路的起始节点和终止节点id、路网中各点的经纬度坐标、道路的长度以及道路的通行时间,中间的节点包含节点的经纬度以及id信息。并选取候选路段集R,并得到轨迹点投影至候选路段的候选点集。对于时刻t的GPS轨迹点xt,选取以该轨迹点为中心,边长m为的正方形范围内的所有路段作为候选路段,组成候选路段集R。
1.3划分车辆轨迹序列:对于每辆车辆V,都有n个轨迹点,轨迹点依照时间顺序排列。而后对低频车辆轨迹点进行划分,以20个轨迹点组成的轨迹序列作为一个批次。每个训练批次中的轨迹点的信息要包括id、经度、纬度、匹配路网id。各训练批次组合形成训练数据集Ttrn。然后将整个训练数据分成多个批次,并且每次只处理一个批次。每批次包括一个轨迹点列表,其大小由批次大小这个参数所确定。
1.4选定候选路段与候选点:对于每个轨迹点xt(xx,yx),以轨迹点为中心做一个直径为30m的圆,计算轨迹点xt到圆内所有路段的最短垂直距离,之后按距离从小到大排序,选取距离最小的q条路径作为候选路段,轨迹点在每条候选路段最短垂直距离所对应的垂足选作为候选点ci(xc,yc)。
其中q值根据维度和候选点选取要求,其值最小等于轨迹点对应的候选点个数中的最小值,最大等于轨迹点对应的候选点个数中的最大值。
2获得BiLSTM的隐层状态
2.1计算轨迹点至候选点集的距离dt
对于每个轨迹点,都有候选点与之对应,而后通过两点间距离距离公式便可求得距离dt
2.2计算轨迹点对应车辆的方位角av与各候选路段方位角ar的差值at
at=|av-ar|%π
其中%代表取余运算
2.3计算轨迹点到路网中各路段的低级特征Psti
由于车辆行驶于道路上,故车辆于轨迹点处的方位角应与道路方位角相差较小,而且轨迹点距离路网的距离也应该较小。故确定轨迹点xt对于第i个候选点ci的低级特征Psti为:
其中α为低级特征的权重,α1、α2为低级特征中分量的权重,其值为训练参数。di为轨迹点xt与第i个候选点ci之间的距离,ai为车辆于轨迹点xt处的方位角与第i个候选路段间方位角差。
而后将轨迹点xt对于所有候选点的低级特征拼接即形成向量Pst
Pst=[pst1,pst2…pstq]T
其中q为xt的所有候选点的数量
最后将所有轨迹点的低级特征向量拼接即形成单点特征集合Ps:
其中r为轨迹点xt的数量,Ps是q*r的矩阵。
2.4将步骤2.3所计算的低级特征集合Ps输入至BiLSTM层中,得到其隐藏层的输出h。前向LSTM网络依次在第1个时刻至第r个时刻接受Ps1到Psr输入,并依次计算前向隐层状态后向的LSTM网络同样接受第r时刻到第1个时刻的输入Psr到Ps1,然后就可以计算出相应的后向隐层状态这样就求得了每个时刻前向和后向的特征,对两个方向上的特征进行拼接得到一个双向特征的表达公式:
h=[h1,h2…,hr]
3计算状态特征S和转移特征A
3.1将步骤2.4得到的隐层状态h与注意力矩阵W对应位置元素相乘得到状态特征S。
其中W的维数与h一致。
3.2计算相邻两轨迹点间的最短路径:由于车辆司机一般会选择最近的道路行使,因此路径的长度较小者更可能是出租车真实的行驶路径。一般可以采用迪杰斯特拉算法来计算相邻两轨迹点的候选点的最短路径长度di,j。
3.3计算相邻两轨迹点组成的直线与相对应的候选点所组成的直线的夹角θi,j。
3.3.1首先求得相邻两轨迹点xt-1与xt组成的直线的方位角atx(方向从xt-1至xt)
3.3.2然后求解两轨迹点相对应的候选点ct-1,i与ct,j组成的直线的方位角atc(方向从ct-1,i至ct,j)
3.3.3求得方位角之差θi,j:
θi,j=|atx-atc|
3.4得到转移特征A
对于两个相邻的轨迹点xt-1与xt来说,通过3.1求得的候选点最短路径长度di,j与3.2.3求得的方位角之差θi,j,可以求得相邻轨迹点的转移特征Ai,j:
其中β1,β2为转移特征各分量的权重,β为转移特征的权重。β,β1,β2都由训练所得。
将所有相邻轨迹点的转移特征组合得到转移矩阵:
A矩阵为(r-1)*(q-1)的矩阵。
3.5考虑3.1得到的状态特征S以及3.4得到的转移特征A通过维特比算法得到最优推断路径y。
维特比算法是一种常用的动态规划算法,它的作用是来寻找能够生成观测事件序列的最可能路径。该算法的思路就是针对多步骤每步多选择模型的最优选择问题,它在每一步的选择都保存了前续所有步骤到当前步骤当前选择的最小总代价(或者最大价值)以及当前代价的情况下前续步骤的选择。依次计算完所有的步骤之后,通过回溯的方法就能够找到最优推断路径y=(y1,y2…yn)。并得到求解所得的最优路径的得分g(X,y)。
4后向传播并更新参数
4.1得到损失函数并进行模型的后向传播。
将3.2.5计算所得的最优路径y与训练集Ttrain中的匹配路径进行对比计算其误差值。损失函数L的公式为:
4.2更新参数,其中包括双向LSTM的参数以及权重大小。
训练目标为最大化损失函数L(即真实标记应该对应最大概率值),对上式取负然后最小化之,然后使用梯度下降等优化方法来求解参数。在这个过程中,模型参数集{θ}自动更新。
5重复步骤2到步骤4直到训练完成;将需要预测的轨迹点输入至训练完毕的模型进行预测,得到预测路径。
实验结果:
本实施例随机选取100条轨迹作为训练集,11条轨迹作为测试样本。选取CRF与BiLSTM-CRF两种方法做对比实验,对测试样本进行预测,以两种方法匹配正确率作为评判指标,实验对比结果请见图2。
从实验结果可以看出,本发明给出的BiLSTM-CRF路径推断方法整体正确率要高于CRF方法的地图匹配结果,可以较为准确地将轨迹点匹配至路网。
如上所述,本发明的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求保护范围内,对本发明做出的任何修改和改变,都落入本发明的保护范围。
Claims (1)
1.一种用于稀疏轨迹的BiLSTM-CRF路径推断方法,其特征在于,包括以下步骤:
(1)构建路网,获取路网中的拓扑关系信息;标定轨迹点对应匹配路段和匹配点数据,得到训练集Ttrn;
(2)初始化模型参数集{θ};计算轨迹点到路网中各路段的低级特征Psti,选择低级特征Psti最小的q条路段作为候选路段;依时间顺序输入相邻轨迹点对应的候选路段的低级特征集合Ps至BiLSTM层,获取BiLSTM隐层状态h;
其中,{θ}表示训练参数,包括低级特征Psti中dt和at的权重,此外步骤(3)中di,j和θi,j的权重和注意力矩阵W也是训练参数;q值根据维度和候选点选取要求,其值最小等于轨迹点对应的候选点个数中的最小值,最大等于轨迹点对应的候选点个数中的最大值;低级特征Psti为轨迹点到该轨迹点对应候选路段的垂直距离dt与轨迹点对应车辆的方位角和对应候选匹配路段方位角差值at的加权平均值;BiLSTM代表双向循环神经网络;
(3)构建CRF,将步骤(2)所得的隐层状态h与注意力矩阵W对应位置元素相乘,得到状态特征S;计算轨迹点间的转移特征A;通过维特比算法求解出最优匹配点集合,得到最优推断路径y;
其中,CRF代表条件随机场;W的维数与h一致;转移特征A为相邻轨迹点连线与对应的匹配点的连线的方位角之差θi,j以及相邻轨迹点对应的匹配点在路网上的最短路径的长度di,j的加权平均值;
(4)根据步骤(1)得到的训练集Ttrn中的匹配点集所构成的路径与步骤(3)中求得的最优推断路径y求得误差值,并通过后向传播算法更新模型参数集{θ},其中包括CRF的后向传播以及BiLSTM的后向传播;
(5)重复步骤(2)到步骤(4),直到模型训练完成,将需要预测的轨迹点输入至训练完成的模型进行预测,得到预测路径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010716829.7A CN111858817B (zh) | 2020-07-23 | 2020-07-23 | 一种用于稀疏轨迹的BiLSTM-CRF路径推断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010716829.7A CN111858817B (zh) | 2020-07-23 | 2020-07-23 | 一种用于稀疏轨迹的BiLSTM-CRF路径推断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111858817A CN111858817A (zh) | 2020-10-30 |
CN111858817B true CN111858817B (zh) | 2021-05-18 |
Family
ID=72950317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010716829.7A Active CN111858817B (zh) | 2020-07-23 | 2020-07-23 | 一种用于稀疏轨迹的BiLSTM-CRF路径推断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111858817B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112884837B (zh) * | 2021-03-16 | 2023-06-20 | 百度在线网络技术(北京)有限公司 | 道路定位方法、装置、设备及存储介质 |
CN115206099B (zh) * | 2022-07-15 | 2023-06-20 | 中国石油大学(华东) | 一种车辆gps轨迹的自适应路径推断方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102278995A (zh) * | 2011-04-27 | 2011-12-14 | 中国石油大学(华东) | 基于gps探测的贝叶斯路径规划装置及方法 |
CN109614457A (zh) * | 2018-11-28 | 2019-04-12 | 武汉大学 | 一种基于深度学习的地理信息的识别方法及装置 |
CN110008469A (zh) * | 2019-03-19 | 2019-07-12 | 桂林电子科技大学 | 一种多层次命名实体识别方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11055527B2 (en) * | 2019-02-01 | 2021-07-06 | Intuit Inc. | System and method for information extraction with character level features |
-
2020
- 2020-07-23 CN CN202010716829.7A patent/CN111858817B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102278995A (zh) * | 2011-04-27 | 2011-12-14 | 中国石油大学(华东) | 基于gps探测的贝叶斯路径规划装置及方法 |
CN109614457A (zh) * | 2018-11-28 | 2019-04-12 | 武汉大学 | 一种基于深度学习的地理信息的识别方法及装置 |
CN110008469A (zh) * | 2019-03-19 | 2019-07-12 | 桂林电子科技大学 | 一种多层次命名实体识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111858817A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106912018B (zh) | 基于信令轨迹的地图匹配方法及系统 | |
CN110260870B (zh) | 基于隐马尔可夫模型的地图匹配方法、装置、设备和介质 | |
CN110264721B (zh) | 一种城市交叉口周边车辆轨迹预测方法 | |
CN104900059B (zh) | 一种增强手机基站定位精度的方法 | |
CN111709517B (zh) | 一种基于置信度预测系统的冗余融合定位增强的方法和装置 | |
CN108253976B (zh) | 一种充分借助车辆航向的三阶段在线地图匹配算法 | |
WO2021178909A1 (en) | Learning point cloud augmentation policies | |
US11704554B2 (en) | Automated training data extraction method for dynamic models for autonomous driving vehicles | |
CN109491377A (zh) | 用于自动驾驶车辆的基于dp和qp的决策和规划 | |
CN110488842B (zh) | 一种基于双向内核岭回归的车辆轨迹预测方法 | |
CN111858817B (zh) | 一种用于稀疏轨迹的BiLSTM-CRF路径推断方法 | |
WO2016187746A1 (zh) | 提高人工神经网络定位性能的方法和装置 | |
CN105957342A (zh) | 基于众包时空大数据的车道级道路测图方法及系统 | |
CN112050821B (zh) | 一种车道线聚合方法 | |
CN111190211B (zh) | 一种gps失效位置预测定位方法 | |
CN106469505B (zh) | 一种浮动车轨迹纠偏方法和装置 | |
CN110389995B (zh) | 车道信息检测方法、装置、设备和介质 | |
CN112884837B (zh) | 道路定位方法、装置、设备及存储介质 | |
Xiao et al. | Vehicle trajectory interpolation based on ensemble transfer regression | |
CN112530158B (zh) | 一种基于历史轨迹的路网补充方法 | |
Dogramadzi et al. | Accelerated map matching for GPS trajectories | |
WO2023201938A1 (zh) | 缺失轨迹填补方法及系统 | |
CN115206099A (zh) | 一种车辆gps轨迹的自适应路径推断方法 | |
CN114169463A (zh) | 一种自主预测车道信息模型训练方法及装置 | |
CN106855878A (zh) | 基于电子地图的历史行车轨迹显示方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |