CN113704377B - 一种结合人工交互与主动学习的路网匹配方法 - Google Patents

一种结合人工交互与主动学习的路网匹配方法 Download PDF

Info

Publication number
CN113704377B
CN113704377B CN202111003704.0A CN202111003704A CN113704377B CN 113704377 B CN113704377 B CN 113704377B CN 202111003704 A CN202111003704 A CN 202111003704A CN 113704377 B CN113704377 B CN 113704377B
Authority
CN
China
Prior art keywords
road
matching
roads
probability
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111003704.0A
Other languages
English (en)
Other versions
CN113704377A (zh
Inventor
禹文豪
刘梦琪
张一帆
黄雅雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202111003704.0A priority Critical patent/CN113704377B/zh
Publication of CN113704377A publication Critical patent/CN113704377A/zh
Application granted granted Critical
Publication of CN113704377B publication Critical patent/CN113704377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Remote Sensing (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种结合人工交互与主动学习的路网匹配方法,对原始路网数据进行数据预处理得到路网信息;利用缓冲区分析筛选出候选匹配道路,根据两条道路之间的几何差异值构建初始匹配概率矩阵;更新初始匹配概率矩阵,使道路匹配达到全局最优;由查询函数计算道路匹配概率的熵值,选取未被标注匹配对象且熵值最大的道路交给人工进行处理,构建匹配约束集;最后基于人工交互的匹配约束集,优化概率松弛匹配结果,提高最终道路匹配精度。本发明通过主动学习的方法能明显地提升道路网匹配的精度,克服了利用概率松弛算法在复杂道路网匹配中因道路结构相似度过高出现错误匹配的问题,可使稳健匹配对更符合实际情况,匹配更精确。

Description

一种结合人工交互与主动学习的路网匹配方法
技术领域
本发明涉及一种结合人工交互与主动学习的路网匹配方法,属于空间数据集成技术领域。
背景技术
空间数据集成(spatial data integration)是指将多源空间数据进行匹配、转化和综合处理的过程。随着3S技术(GIS、RS、GPS)的发展和集成,通过不同手段获取的空间矢量数据迅速增加,各种数据存在着精度不同、比例尺不同、语义表达不同等差异,造成了空间数据重复采集,导致数据的共享困难,更新不及时。如何快速、高效地整合、处理多源、多维异构的空间数据,提升数据的价值和利用率已成为地理信息科学领域的重要课题。
目标匹配是空间数据集成的关键技术之一。由于地图比例尺不同和地图综合的差异,同一地理实体在不同来源的地图上表现形式存在多样性,例如在小比例尺地图上,某一建筑物的表达形式为点数据,而在大比例尺地图上其表现为面数据。针对同一区域的相同目标建立匹配关系是多源空间数据集成的首要步骤,根据同一地理实体的匹配结果,可以快速实现数据的更新。路网作为一个城市的骨架,在空间数据集成中发挥着重要作用。局部区域道路拓扑关系复杂,其结构多样化,部分不同道路的相似度高,增加了道路网自动匹配的不确定性。
道路网的匹配的主要思想是计算匹配目标之间的相似度。已有方法可分为四类:(1)基于属性特征的匹配方法,即计算目标的名称、等级等方面的相似性;(2)基于几何特征的匹配方法,即通过候选匹配路段节点的距离、路段长度和方向差异来计算相似度;(3)基于拓扑关系的匹配方法,即根据候选匹配道路的邻接路段计算当前匹配道路的相似性;(4)综合多项指标的匹配方法,即结合以上多种方法,得到最优道路匹配结果。基于传统Hausdorff(豪斯多夫)距离算法的道路匹配利用道路的几何特征,将道路的折点分解为离散的点集,通过点集的Hausdorff距离判断道路的相似性,进而判断目标是否为同名实体,该方法原理简单,易于操作,但是匹配精度容易受到噪声点影响而降低;基于图文法的道路匹配利用路网的拓扑关系,将交叉路口的结构模式用图文法进行描述,通过计算最大公共子图和最小编辑距离衡量道路节点的匹配程度,寻找结构形态最相似的道路结点进行匹配,该方法不依赖任何非空间语义信息,但是要求道路的路段和交叉路口有较好的拓扑关系,在匹配前需要耗费大量的时间进行数据预处理工作。
综上所述,现有算法可处理简单道路网的匹配问题,但是部分路网结构具有较高的复杂性,如双线路网、十字交叉口等,导致自动匹配结果准确度不高、效率较低,难以处理多对多的匹配关系。
发明内容
为了解决现有技术的不足,本发明提供了一种结合人工交互与主动学习的路网匹配方法,能够充分地利用道路的几何特征和拓扑关系,构建道路匹配的概率松弛模型,通过主动学习不断训练该模型,提升道路匹配精度,克服因道路结构复杂和不同弧段相似度过高而造成的错误匹配等问题。
本发明为解决其技术问题所采用的技术方案是:提供了一种结合人工交互与主动学习的路网匹配方法,包括以下步骤:
S1、对原始道路网数据进行预处理,得到原始道路网数据中每个道路的几何信息和拓扑关系,配对候选道路,构建初始概率矩阵;
S2、通过道路的拓扑关系计算配对得到的候选匹配道路的兼容系数,利用兼容系数对初始概率矩阵进行松弛迭代,得到最终匹配概率矩阵;
S3、构造基于主动学习的查询函数,筛选出未被人工确定匹配关系且匹配概率信息熵最大的道路交由人工处理,通过添加或删除候选匹配对,构建匹配约束集;
S4、基于最终匹配概率矩阵和人工交互结果完成按比例匹配的选取,若匹配结果的精度符合预设,则输出匹配结果,否则返回步骤S3。
步骤S1所述的配对候选道路,得到候选匹配道路,构建初始概率矩阵,具体包括以下过程:
S1.1、利用缓冲区分得到候选匹配道路,候选匹配道路为另一道路集当中与当前道路缓冲区相交的道路;
S1.2、计算候选匹配道路的几何相似性,分别以节点距离、道路方向以及路段长度为指标构建双向匹配概率矩阵,并计算联合概率矩阵;
S1.3、综合各项指标,通过加权平均得到综合的初始概率矩阵。
步骤S1.2具体包括以下过程:
S1.2.1、对于每对候选匹配道路,即第一路网中任意一条道路i和第二路网中任意一条道路j,比较该两条道路两端节点的距离,将距离较短的节点设为起点FN,距离较长的节点设为终点TN;
S1.2.2、设两条道路中起点到下一节点的距离分别为s1和s′1,且s1>s′1,则在较长道路上与起点距离s′1处插入一虚拟节点,以此类推,直至到达长度较短道路的终点为止;
S1.2.3、根据处理过的道路节点,计算候选匹配道路对应节点间的平均距离差异ddis(i,j)、对应路段的平均方向差异ddir(i,j)以及两条道路的长度差异dlen(i,j);
S1.2.4、通过以下公式计算在三个几何特征指标下不同匹配方向的误差因子组{βdis,β′disdir,β′dirlen,β′len}:
式中,Si表示待匹配的第一路网中所有道路的集合,Sj表示待匹配的第二路网中所有道路的集合,CSi表示道路i的所有候选匹配道路,CSj表示道路j的所有候选匹配道路;按照以下公式计算不同几何特征指标下道路的匹配概率:
其中表示在考虑平均距离差异ddis(i,j)时,道路j匹配道路i的概率;表示在考虑平均方向差异ddir(i,j)时,道路j匹配道路i的概率;/>表示在考虑长度差异dlen(i,j)时,道路j匹配道路i的概率;j=-1代表道路i没有对应匹配道路的情况;
根据下式求出候选匹配道路基于不同匹配方向和各项几何特征指标下的匹配概率:
其中pdis(i,j)表示在考虑距离特征下,平均双向匹配误差后道路i和道路j的匹配概率;pdir(i,j)表示在考虑方向特征下,平均双向匹配误差后道路i和道路j的匹配概率;plen(i,j)表示在考虑长度特征下,平均双向匹配误差后道路i和道路j的匹配概率;
将pdis(i,j)、pdir(i,j)和plen(i,j)加权平均,得到综合匹配概率p(i,j),利用每对候选匹配道路的综合匹配概率构建初始概率矩阵。
步骤S2具体包括以下过程:
S2.1、根据道路的拓扑关系,计算出当前道路匹配对(i,j)和邻接道路匹配对(h,k)的兼容系数C(i,j;h,k),其中道路h为第一路网中与道路i在起点FN或终点TN处接的邻接道路,道路k为第二路网中与道路j在起点FN或终点TN处相接的邻接道路;
S2.2、根据兼容系数,分别计算道路j匹配到道路i时,道路i起点FN和终点TN处的支持系数以及道路i匹配到道路j时,道路j起点FN和终点TN处的支持系数/>其中r代表迭代次数,综合各节点处的支持系数计算得到最终匹配支持系数q(r)(i,j);
S2.3、利用最终匹配支持系数q(r)(i,j)更新初始匹配概率,直到概率矩阵变化量小于阈值ε,得到最终的道路匹配概率矩阵。
步骤S2.1具体包括以下过程:
S2.1.1、筛选出同侧的邻接道路:若道路h为道路i的邻接道路,且公共节点为i的起点FN,则在道路j的起点FN处筛选邻接的道路k;
S2.1.2、通过以下公式计算道路i、道路j、道路h和道路k的相对位置和相对方向上的差异性指标:
式中d1为邻接匹配对(h,k)的公共节点与当前匹配对(i,j)的公共节点间的距离,d2为邻接匹配对(h,k)的另一端节点与当前匹配对(i,j)的另一端节点间的距离,α为邻接的道路i和道路j的夹角,β为邻接的道路h和道路k的夹角;
S2.1.3、按以下公式计算兼容系数C(i,j;h,k):
其中ratio为道路h与道路k长度的比值。
步骤S2.2具体包括以下过程:
S2.2.1、通过以下公式计算道路i起点FN处的支持系数
其中函数SF表示道路i起点FN处的邻接道路,QF表示道路j起点FN处的邻接道路,q1表示完全匹配支持系数,q2表示不完全匹配支持系数,若q1>q2则代表该路段为完全匹配,否则为不完全匹配;函数p(r)(a,b)表示第r次迭代后的道路匹配对(a,b)的综合匹配概率,当r=1时,p(r)(i,j)=p(i,j);
用相同方式计算道路i终点TN处的支持系数道路j起点FN处的支持系数和道路j终点TN处的支持系数/>
S2.2.2、计算与/>的和/>以及/>与/>的和
S2.2.3、综合双向的支持系数计算综合支持系数q(r)(i,j):
其中ηi为道路i与其所有候选匹配道路中几何差异最小值与两个路网中所有候选匹配道路间最大几何差异值的比值。
步骤S2.3具体包括以下过程:
S2.3.1、利用综合综合支持系数q(r)(i,j)更新道路i和道路j之间的双向匹配概率:
S2.3.2、利用双向匹配概率更新综合匹配概率:
比较p(r+1)(i,j)与p(r)(i,j)的差值,若所有差值均小于预设阈值ε则停止迭代,利用利用每对候选匹配道路的综合匹配概率p(r+1)(i,j)构建最终匹配概率矩阵;否则返回步骤S2.3.1对迭代次数r累加1继续更新。
步骤S2.2.1计算支持系数的过程中,若出现不完全匹配情况,则返回步骤S2.1.3按一下过程重新计算兼容系数:设道路i的长度大于道路j,将道路i分为两段,其中第一段与道路j长度相同,设为道路i1,剩余部分为第二段,设为道路i2,利用公式(5)计算C(i1,j;i2,k)作为兼容系数。
步骤S3具体包括以下过程:
S3.1、计算每条道路的匹配概率的信息熵:
S3.2、将道路按照匹配概率熵值从大到小进行排序,由查询函数在未被人工处理过的道路集中提取熵值最大的道路交由人工处理;
S3.3、由人工对抽取出的道路进行处理,选择相应的道路进行匹配或者删除匹配对,修正最不确定的道路匹配对象。
步骤S4具体包括以下过程:
S4.1、由迭代后的概率矩阵计算匹配道路的结构相似性,选取结构相似性最大的匹配对为稳健匹配对;
S4.2、结合S3中对熵值最大的道路进行的添加或删除匹配对操作,对程序自动筛选出的稳健匹配对序列进行修改;
S4.3、对稳健匹配对进行1:1检测,满足条件的匹配对即为1:1匹配对,对非1:1匹配对进行延长匹配;
S4.4、对于非1:1匹配对,在不匹配的节点处选取结构相似性最大的邻接道路进行延长,若延长后端点的距离减小即为正确延长,保留延长结果,否则为错误延长,取消延长结果。
S4.5、检查最终匹配结果,若符合精度要求,则输出,否则返回步骤S3.2,直至匹配精度符合要求为止。
本发明基于其技术方案所具有的有益效果在于:
本发明提供的一种结合人工交互与主动学习的路网匹配方法,利用缓冲区分析通过设定的不同缓冲区半径提取目标的候选匹配道路,计算目标与候选匹配道路之间多个指标的几何相似性,引入互误差因子减小匹配误差,构建双向匹配概率矩阵,通过调和平均和加权平均的计算方法得到初始匹配概率矩阵。其次通过路网的拓扑关系,计算邻接匹配对与当前匹配对之间的兼容系数,构建支持系数矩阵,以此更新初始概率矩阵,得到最终路网匹配的概率矩阵,此过程需要进行多次迭代,迭代次数越多,概率矩阵越稳定,结果越接近实际匹配状况。随后通过人工交互与主动学习的方式,可利用ME法(Maximum Enreopy,最大熵值法)构建查询函数,由查询函数选取当前路网中匹配概率的熵值最大的道路,人工对其进行处理,对匹配结果进一步修正,固定稳健匹配对,排除不可能匹配对,此过程可以提升道路匹配的精度,避免因为节点处结构相似性过高而导致错误匹配。最后通过KM算法(KuhnMunkres,匈牙利算法)计算匹配对的结构相似性并选取稳健匹配对,融合筛选出的稳健匹配对与人工交互添加或删除的匹配对,得到最终稳健匹配对队列,以节点的结构相似性为基础进行1:1匹配对的提取以及延长匹配,最终检查匹配结果,若精度符合要求,则输出,否则选取未被人工处理过且熵值最大的道路进行人工交互操作,重新进行稳健匹配对队列的构建以及延长匹配操作,直至精度符合要求。
附图说明
图1是本发明的处理流程示意图。
图2是两道路网经过数据预处理后的示意图。
图3是对路网一数据进行50米缓冲区处理的结果图。
图4是对候选道路匹配对等距离插入虚拟节点的示意图。
图5是兼容系数计算示意图,其中图5(a)是计算邻接道路的兼容系数示意图,图5(b)是计算自兼容系数的示意图。
图6是实施例中待匹配的两个路网数据,其中图6(a)是路网一的示意图;图6(b)是路网二的示意图。
图7是道路17—道路107的局部匹配结果示意图,其中图7(a)是未经过人工交互处理的局部匹配结果图;图7(b)是人工添加匹配对后的结果示意图。
图8是道路16—道路143的局部匹配结果示意图,其中图8(a)是未经过人工交互处理的局部匹配结果图;图8(b)是人工删除匹配对后的结果示意图。
图9是道路11—道路77的局部匹配结果示意图,其中图9(a)是未经过人工交互处理的局部匹配结果图;图9(b)是人工删除匹配对后的结果示意图。
图10本实施例全局匹配结果示意图,其中图10(a)是未经过处理得到的路网全局匹配结果图;图10(b)是经过人工交互处理后的路网全局匹配结果图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
一、工作原理:
参照图1,本发明的主要处理流程及原理为:
1、初始概率矩阵的构建:
对原始数据进行必要的预处理工作,如投影转换、拓扑关系一致性检测等。在道路匹配中,几何特征越相似的道路匹配概率越高。该方法利用缓冲分析提取候选匹配对后,通过候选匹配对的几何相似性构建初始概率矩阵。
通过插入虚拟节点使候选匹配对的对应路段长度相等,计算节点的平均距离,该距离代表了两条道路在地理位置上的相似性;通过计算对应路段方向差异的平均值和道路长度差异来描述道路在形态上的相似性。基于以上三个几何特征指标,结合匹配误差因子,计算双向匹配概率矩阵,为进一步减小匹配误差,用调和平均值的方法将双向匹配概率矩阵融合为基于单个几何指标的概率矩阵,最终通过加权平均的方式得到初始概率矩阵。
2、概率矩阵的迭代
初始概率矩阵能从几何上表示道路的匹配概率,为了进一步提高精度,考虑道路的拓扑关系,采用概率松弛的方法对初始概率矩阵进行迭代,融合多项指标后的最终匹配概率矩阵能更加精确的表示道路的匹配关系。
对初始矩阵进行迭代首先需要计算邻接道路和当前参考道路的兼容系数C(i,j;h,k)。候选匹配对(i,j)和(h,k)为邻接关系,邻接道路i,h与j,k在总体形态和相对位置上越相似,越印证道路(i,j)的匹配关系,分别利用i,h和j,k的夹角差、节点距离、以及h,k的长度差异值构建兼容系数计算模型。分道路完全匹配和不完全匹配两种情况,结合概率矩阵,计算所有邻接道路对当前道路的支持系数。支持系数作为概率矩阵更新的重要依据,每次迭代后概率矩阵的数值会相应的改变,改变后的矩阵在下次迭代过程中会更新支持系数,此过程不断重复,直至两次迭代过程中概率矩阵数值变化小于某一阈值。
3、查询函数的构建以及人工交互
道路的匹配存在多种形式,因其复杂的结构特征,难免会出现错误匹配的情况。通过人工交互的过程,预先确定或排除某些匹配对,可以提升后续步骤的效率,提高结果的准确度。主动学习可以通过人工标注少量的样本,极大地提高最终结果的精度,采用Pool-based Active Learning(离线批量的主动学习),初始状态下,将所有道路设置未标注对象集,通过查询函数,提取与匹配概率熵值最大的道路进行人工处理。分别构建两个List容器,用于存储人工输入的“确定匹配对”和“确定不匹配对”。将“确定匹配对”加入稳健匹配对队列中,并对比“确定不匹配对”与现有稳健匹配对队列中的元素,若存在相同的匹配对,则从稳健匹配对队列中删除该匹配对。道路经过人工处理后,则从未标注样本集中删除,是为已标注样本,不会再次被人工处理。
4、匹配对的确定
多源路网数据中的匹配对主要通过结构相似性和延长匹配的方法确定。分别对迭代后的概率矩阵的行和列进行二值化,再将两个矩阵相加,计算矩阵中数值大于0的匹配对的结构相似性。利用KM算法计算道路两端节点处的最佳匹配关系,分别计算两端节点处的结构相似性,将其和与当前道路的匹配概率相加得到当前道路的结构相似性。选取结构相似性最大的匹配对加入稳健匹配对队列中,检测队列中匹配对两端节点的结构相似性,若达到最大,则无须进行延长,否则从该节点寻找结构相似性最大的道路进行延长,直到节点匹配为止。观察最终匹配结果,符合要求则删除,否则从为标记样本集中选取熵值最大的道路进行人工修改,重新进行匹配对的确定工作,不断进行迭代,直至结果符合要求为止。
二、实施例:
参照图2,本实施例采用的数据集是从OSM志愿地理信息平台(https://www.openstreetmap.org/)上下载的北京道路网数据。其中一份路网数据由18条主干道路组成,另一份数由155条道路据组成。利用本发明提供的一种交互式的概率松弛路网匹配方法进行处理,包括以下步骤:
S1、对原始道路网数据进行预处理,得到原始道路网数据中每个道路的几何信息和拓扑关系,配对候选道路,构建初始概率矩阵pi,j∈P(m+1)×(n+1),其中m和n分别代表两个路网数据中道路的数量,pi,j表示道路i和道路j的匹配概率,矩阵中的最后一行和最后一列分别表示该道路1:0的概率。具体包括以下过程:
S1.1、参照图3,利用缓冲区分得到候选匹配道路,候选匹配道路为另一道路集当中与当前道路缓冲区相交的道路;
S1.2、计算候选匹配道路的几何相似性,分别以节点距离、道路方向以及路段长度为指标构建双向匹配概率矩阵,并计算联合概率矩阵。
S1.2.1、对于每对候选匹配道路,即第一路网中任意一条道路i和第二路网中任意一条道路j,比较该两条道路两端节点的距离,将距离较短的节点设为起点FN,距离较长的节点设为终点TN;
S1.2.2、参照图4,设两条道路中起点到下一节点的距离分别为s1和s′1,且s1>s′1,则在较长道路上与起点距离s′1处插入一虚拟节点,以此类推,直至到达长度较短道路的终点为止;
S1.2.3、根据处理过的道路节点,计算候选匹配道路对应节点间的平均距离差异ddis(i,j)、对应路段的平均方向差异ddir(i,j)以及两条道路的长度差异dlen(i,j);
S1.2.4、通过以下公式计算在三个几何特征指标下不同匹配方向的误差因子组{βdis,β′disdir,β′dirlen,β′len}:
式中,Si表示待匹配的第一路网中所有道路的集合,Sj表示待匹配的第二路网中所有道路的集合,CSi表示道路i的所有候选匹配道路,CSj表示道路j的所有候选匹配道路;按照以下公式计算不同几何特征指标下道路的匹配概率:
其中表示在考虑平均距离差异ddis(i,j)时,道路j匹配道路i的概率;表示在考虑平均方向差异ddir(i,j)时,道路j匹配道路i的概率;/>表示在考虑长度差异dlen(i,j)时,道路j匹配道路i的概率;j=-1代表道路i没有对应匹配道路的情况;
根据下式求出候选匹配道路基于不同匹配方向和各项几何特征指标下的匹配概率:
其中pdis(i,j)表示在考虑距离特征下,平均双向匹配误差后道路i和道路j的匹配概率;pdir(i,j)表示在考虑方向特征下,平均双向匹配误差后道路i和道路j的匹配概率;plen(i,j)表示在考虑长度特征下,平均双向匹配误差后道路i和道路j的匹配概率;
S1.3、综合各项指标,通过加权平均得到综合的初始概率矩阵;即将pdis(i,j)、pdir(i,j)和plen(i,j)加权平均,得到综合匹配概率p(i,j),利用每对候选匹配道路的综合匹配概率构建初始概率矩阵。
S2、通过道路的拓扑关系计算配对得到的候选匹配道路的兼容系数,利用兼容系数对初始概率矩阵进行松弛迭代,得到最终匹配概率矩阵。具体包括以下过程:
S2.1、根据道路的拓扑关系,计算出当前道路匹配对(i,j)和邻接道路匹配对(h,k)的兼容系数C(i,j;h,k),其中道路h为第一路网中与道路i在起点FN或终点TN处接的邻接道路,道路k为第二路网中与道路j在起点FN或终点TN处相接的邻接道路。具体包括以下过程:
S2.1.1、筛选出同侧的邻接道路:若道路h为道路i的邻接道路,且公共节点为i的起点FN,则在道路j的起点FN处筛选邻接的道路k;
S2.1.2、通过以下公式计算道路i、道路j、道路h和道路k的相对位置和相对方向上的差异性指标:
式中d1为邻接匹配对(h,k)的公共节点与当前匹配对(i,j)的公共节点间的距离,d2为邻接匹配对(h,k)的另一端节点与当前匹配对(i,j)的另一端节点间的距离,α为邻接的道路i和道路j的夹角,β为邻接的道路h和道路k的夹角;
S2.1.3、按以下公式计算兼容系数C(i,j;h,k):
其中ratio为道路h与道路k长度的比值。
S2.2、根据兼容系数,分别计算道路j匹配到道路i时,道路i起点FN和终点TN处的支持系数以及道路i匹配到道路j时,道路j起点FN和终点TN处的支持系数/>其中r代表迭代次数,综合各节点处的支持系数计算得到最终匹配支持系数q(r)(i,j)。具体包括以下过程:
S2.2.1、通过以下公式计算道路i起点FN处的支持系数
其中函数SF表示道路i起点FN处的邻接道路,QF表示道路j起点FN处的邻接道路,q1表示完全匹配支持系数,q2表示不完全匹配支持系数,若q1>q2则代表该路段为完全匹配,否则为不完全匹配;函数p(r)(a,b)表示第r次迭代后的道路匹配对(a,b)的综合匹配概率,当r=1时,p(r)(i,j)=p(i,j)。
计算支持系数的过程中,若出现不完全匹配情况,则返回步骤S2.1.3按一下过程重新计算兼容系数:设道路i的长度大于道路j,将道路i分为两段,其中第一段与道路j长度相同,设为道路i1,剩余部分为第二段,设为道路i2,利用公式(5)计算C(i1,j;i2,k)作为兼容系数,如图5所示。
用相同方式计算道路i终点TN处的支持系数道路j起点FN处的支持系数和道路j终点TN处的支持系数/>/>
S2.2.2、计算与/>的和/>以及/>与/>的和
S2.2.3、综合双向的支持系数计算综合支持系数q(r)(i,j):
其中ηi为道路i与其所有候选匹配道路中几何差异最小值与两个路网中所有候选匹配道路间最大几何差异值的比值。
S2.3、利用最终匹配支持系数q(r)(i,j)更新初始匹配概率,直到概率矩阵变化量小于阈值ε,得到最终的道路匹配概率矩阵:
S2.3.1、利用综合综合支持系数q(r)(i,j)更新道路i和道路j之间的双向匹配概率:
S2.3.2、利用双向匹配概率更新综合匹配概率:
比较p(r+1)(i,j)与p(r)(i,j)的差值,若所有差值均小于预设阈值ε则停止迭代,利用利用每对候选匹配道路的综合匹配概率p(r+1)(i,j)构建最终匹配概率矩阵;否则返回步骤S2.3.1对迭代次数r累加1继续更新。
S3、构造基于主动学习的查询函数,筛选出未被人工确定匹配关系且匹配概率信息熵最大的道路交由人工处理,通过添加或删除候选匹配对,构建匹配约束集。具体包括以下过程:
S3.1、计算每条道路的匹配概率的信息熵:
S3.2、将道路按照匹配概率熵值从大到小进行排序,由查询函数在未被人工处理过的道路集中提取熵值最大的道路交由人工处理;
S3.3、由人工对抽取出的道路进行处理,选择相应的道路进行匹配或者删除匹配对,修正最不确定的道路匹配对象。
S4、基于最终匹配概率矩阵和人工交互结果完成按比例匹配的选取,若匹配结果的精度符合预设,则输出匹配结果,否则返回步骤S3。具体包括以下过程:
S4.1、由迭代后的概率矩阵计算匹配道路的结构相似性,选取结构相似性最大的匹配对为稳健匹配对;
S4.2、结合S3中对熵值最大的道路进行的添加或删除匹配对操作,,对程序自动筛选出的稳健匹配对序列进行修改;
S4.3、对稳健匹配对进行1:1检测,满足条件的匹配对即为1:1匹配对,对非1:1匹配对进行延长匹配;
S4.4、对于非1:1匹配对,在不匹配的节点处选取结构相似性最大的邻接道路进行延长,若延长后端点的距离减小即为正确延长,保留延长结果,否则为错误延长,取消延长结果。
S4.5、检查最终匹配结果,若符合精度要求,则输出,否则返回步骤S3.2,直至匹配精度符合要求为止。
三、实验对比:
实验中,利用如图6所示的两个不同的路网数据基于概率松弛算法进行匹配,不通过主动学习和人工交互干预匹配过程,最终可能出现错误匹配,如图7、图8和图9。在图7(a)中,路网二中的道路68和62因两端的结构相似度过高,导致路网一中的道路17与路网二中的道路62相匹配,与实际情况不一致,人工将道路17与道路107相匹配,可以避免道路62被匹配两次,且不影响道路的延长匹配,结合人工交互与主动学习的匹配算法结果如图7(b)所示。在图8(a)中,错误地延长匹配导致道路16与道路143匹配,其公共节点与道路15和道路16的公共节点不匹配,因此删除错误匹配,得到正确的匹配结果,如图8(b)所示。在图9(a)中,在延长匹配的过程出现了错误,导致匹配不完全,经人工处理,将道路11与道路72匹配后,实现了道路的正确延长匹配,如图9(b)所示。
经过多次主动学习的迭代过程,可得到最终的路网匹配结果图,如图9(b)所示。从最终结果图中可以看出匹配的精度较高,可以实现道路的1:1匹配、1:N匹配,以及M:N匹配,在概率松弛基础上添加主动学习与人工交互的步骤使在代码运行时间开销上多花费0.9%的时间,精度提升了约8%。
本发明提供的一种结合人工交互与主动学习的路网匹配方法可以通过人工交互的过程处理克服传统方法对复杂道路的错误匹配问题。通过道路间的几何相似性构建初始概率矩阵,利用邻接道路的相对位置和形状计算兼容系数以及支持系数,迭代更新概率矩阵。利用主动学习改进算法,用较少的人工操作最大程度提升路网匹配的精度,选取最大熵值的查询策略,综合考虑了所有候选匹配道路,经过人工交互进行修改后,能使匹配结果在全局上更加精确。从概率矩阵提取概率值,利用KM算法计算道路节点的结构相似性,从而选取稳健匹配对以及完成匹配增长过程。通过主动学习的方法有效地提高了道路匹配精度,避免了结构复杂区域的错误匹配,且不影响道路的延长匹配操作。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

Claims (7)

1.一种结合人工交互与主动学习的路网匹配方法,其特征在于包括以下步骤:
S1、对原始道路网数据进行预处理,得到原始道路网数据中每个道路的几何信息和拓扑关系,配对候选道路,构建初始概率矩阵;所述的配对候选道路,得到候选匹配道路,构建初始概率矩阵,具体包括以下过程:
S1.1、利用缓冲区分得到候选匹配道路,候选匹配道路为另一道路集当中与当前道路缓冲区相交的道路;
S1.2、计算候选匹配道路的几何相似性,分别以节点距离、道路方向以及路段长度为指标构建双向匹配概率矩阵,并计算联合概率矩阵;
S1.3、综合各项指标,通过加权平均得到综合的初始概率矩阵;
S2、通过道路的拓扑关系计算配对得到的候选匹配道路的兼容系数,利用兼容系数对初始概率矩阵进行松弛迭代,得到最终匹配概率矩阵;
S3、构造基于主动学习的查询函数,筛选出未被人工确定匹配关系且匹配概率信息熵最大的道路交由人工处理,通过添加或删除候选匹配对,构建匹配约束集,具体包括以下过程:
S3.1、计算每条道路的匹配概率的信息熵:
其中p(i,j)表示第一路网中任意一条道路i和第二路网中任意一条道路j的综合匹配概率;
S3.2、将道路按照匹配概率熵值从大到小进行排序,由查询函数在未被人工处理过的道路集中提取熵值最大的道路交由人工处理;
S3.3、由人工对抽取出的道路进行处理,选择相应的道路进行匹配或者删除匹配对,修正最不确定的道路匹配对象;
S4、基于最终匹配概率矩阵和人工交互结果完成按比例匹配的选取,若匹配结果的精度符合预设,则输出匹配结果,否则返回步骤S3,具体包括以下过程:
S4.1、由迭代后的概率矩阵计算匹配道路的结构相似性,选取结构相似性最大的匹配对为稳健匹配对;
S4.2、结合S3中对熵值最大的道路进行的添加或删除匹配对操作,对程序自动筛选出的稳健匹配对序列进行修改;
S4.3、对稳健匹配对进行1:1检测,满足条件的匹配对即为1:1匹配对,对非1:1匹配对进行延长匹配;
S4.4、对于非1:1匹配对,在不匹配的节点处选取结构相似性最大的邻接道路进行延长,若延长后端点的距离减小即为正确延长,保留延长结果,否则为错误延长,取消延长结果;
S4.5、检查最终匹配结果,若符合精度要求,则输出,否则返回步骤S3.2,直至匹配精度符合要求为止。
2.根据权利要求1所述的结合人工交互与主动学习的路网匹配方法,其特征在于:步骤S1.2具体包括以下过程:
S1.2.1、对于每对候选匹配道路,即第一路网中任意一条道路i和第二路网中任意一条道路j,比较两条道路两端节点的距离,将距离较短的节点设为起点FN,距离较长的节点设为终点TN;
S1.2.2、设两条道路中起点到下一节点的距离分别为s1和s1',且s1>s1',则在较长道路上与起点距离s1'处插入一虚拟节点,以此类推,直至到达长度较短道路的终点为止;
S1.2.3、根据处理过的道路节点,计算候选匹配道路对应节点间的平均距离差异ddis(i,j)、对应路段的平均方向差异ddir(i,j)以及两条道路的长度差异dlen(i,j);
S1.2.4、通过以下公式计算在三个几何特征指标下不同匹配方向的误差因子组{βdisdisdirdirlenlen}:
式中,Si表示待匹配的第一路网中所有道路的集合,Sj表示待匹配的第二路网中所有道路的集合,CSi表示道路i的所有候选匹配道路,CSj表示道路j的所有候选匹配道路;按照以下公式计算不同几何特征指标下道路的匹配概率:
其中表示在考虑平均距离差异ddis(i,j)时,道路j匹配道路i的概率;/>表示在考虑平均方向差异ddir(i,j)时,道路j匹配道路i的概率;/>表示在考虑长度差异dlen(i,j)时,道路j匹配道路i的概率;j=-1代表道路i没有对应匹配道路的情况;
根据下式求出候选匹配道路基于不同匹配方向和各项几何特征指标下的匹配概率:
其中pdis(i,j)表示在考虑距离特征下,平均双向匹配误差后道路i和道路j的匹配概率;pdir(i,j)表示在考虑方向特征下,平均双向匹配误差后道路i和道路j的匹配概率;plen(i,j)表示在考虑长度特征下,平均双向匹配误差后道路i和道路j的匹配概率;
将pdis(i,j)、pdir(i,j)和plen(i,j)加权平均,得到综合匹配概率p(i,j),利用每对候选匹配道路的综合匹配概率构建初始概率矩阵。
3.根据权利要求1所述的结合人工交互与主动学习的路网匹配方法,其特征在于:步骤S2具体包括以下过程:
S2.1、根据道路的拓扑关系,计算出当前道路匹配对(i,j)和邻接道路匹配对(h,k)的兼容系数C(i,j;h,k),其中道路h为第一路网中与道路i在起点FN或终点TN处接的邻接道路,道路k为第二路网中与道路j在起点FN或终点TN处相接的邻接道路;
S2.2、根据兼容系数,分别计算道路j匹配到道路i时,道路i起点FN和终点TN处的支持系数以及道路i匹配到道路j时,道路j起点FN和终点TN处的支持系数其中r代表迭代次数,综合各节点处的支持系数计算得到最终匹配支持系数q(r)(i,j);
S2.3、利用最终匹配支持系数q(r)(i,j)更新初始匹配概率,直到概率矩阵变化量小于阈值ε,得到最终的道路匹配概率矩阵。
4.根据权利要求3所述的结合人工交互与主动学习的路网匹配方法,其特征在于:步骤S2.1具体包括以下过程:
S2.1.1、筛选出同侧的邻接道路:若道路h为道路i的邻接道路,且公共节点为i的起点FN,则在道路j的起点FN处筛选邻接的道路k;
S2.1.2、通过以下公式计算道路i、道路j、道路h和道路k的相对位置和相对方向上的差异性指标:
式中d1为邻接匹配对(h,k)的公共节点与当前匹配对(i,j)的公共节点间的距离,d2为邻接匹配对(h,k)的另一端节点与当前匹配对(i,j)的另一端节点间的距离,α为邻接的道路i和道路j的夹角,β为邻接的道路h和道路k的夹角;
S2.1.3、按以下公式计算兼容系数C(i,j;h,k):
其中ratio为道路h与道路k长度的比值。
5.根据权利要求3所述的结合人工交互与主动学习的路网匹配方法,其特征在于:步骤S2.2具体包括以下过程:
S2.2.1、通过以下公式计算道路i起点FN处的支持系数
其中函数SF表示道路i起点FN处的邻接道路,QF表示道路j起点FN处的邻接道路,q1表示完全匹配支持系数,q2表示不完全匹配支持系数,若q1>q2则代表该路段为完全匹配,否则为不完全匹配;函数p(r)(a,b)表示第r次迭代后的道路匹配对(a,b)的综合匹配概率,当r=1时,p(r)(i,j)=p(i,j);
用相同方式计算道路i终点TN处的支持系数道路j起点FN处的支持系数和道路j终点TN处的支持系数/>
S2.2.2、计算与/>的和/>以及/>与/>的和/>
S2.2.3、综合双向的支持系数计算综合支持系数q(r)(i,j):
其中ηi为道路i与其所有候选匹配道路中几何差异最小值与两个路网中所有候选匹配道路间最大几何差异值的比值。
6.根据权利要求4所述的结合人工交互与主动学习的路网匹配方法,其特征在于:步骤S2.3具体包括以下过程:
S2.3.1、利用综合综合支持系数q(r)(i,j)更新道路i和道路j之间的双向匹配概率:
S2.3.2、利用双向匹配概率更新综合匹配概率:
比较p(r+1)(i,j)与p(r)(i,j)的差值,若所有差值均小于预设阈值ε则停止迭代,利用利用每对候选匹配道路的综合匹配概率p(r+1)(i,j)构建最终匹配概率矩阵;否则返回步骤S2.3.1对迭代次数r累加1继续更新。
7.根据权利要求4至6任一项所述的结合人工交互与主动学习的路网匹配方法,其特征在于:步骤S2.2.1计算支持系数的过程中,若出现不完全匹配情况,则返回步骤S2.1.3按一下过程重新计算兼容系数:设道路i的长度大于道路j,将道路i分为两段,其中第一段与道路j长度相同,设为道路i1,剩余部分为第二段,设为道路i2,利用公式(5)计算C(i1,j;i2,k)作为兼容系数。
CN202111003704.0A 2021-08-30 2021-08-30 一种结合人工交互与主动学习的路网匹配方法 Active CN113704377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111003704.0A CN113704377B (zh) 2021-08-30 2021-08-30 一种结合人工交互与主动学习的路网匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111003704.0A CN113704377B (zh) 2021-08-30 2021-08-30 一种结合人工交互与主动学习的路网匹配方法

Publications (2)

Publication Number Publication Date
CN113704377A CN113704377A (zh) 2021-11-26
CN113704377B true CN113704377B (zh) 2024-03-01

Family

ID=78656720

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111003704.0A Active CN113704377B (zh) 2021-08-30 2021-08-30 一种结合人工交互与主动学习的路网匹配方法

Country Status (1)

Country Link
CN (1) CN113704377B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116429125B (zh) * 2023-06-09 2023-08-11 高德软件有限公司 道路匹配方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768797A (zh) * 2012-01-12 2012-11-07 北京中广睛彩导航科技有限公司 一种城市路况信息评价方法及装置
CN104268710A (zh) * 2014-10-10 2015-01-07 北京交通大学 轨道交通路网动态应急处置方案生成方法
CN108074253A (zh) * 2017-12-25 2018-05-25 中国地质大学(武汉) 一种基于Delaunay三角剖分的多层级矢量道路网匹配方法
CN109522385A (zh) * 2018-11-22 2019-03-26 首都师范大学 一种多尺度道路网m-n匹配模式的判定方法
CN111556432A (zh) * 2020-04-21 2020-08-18 西安交通大学 一种基于地图信息筛选匹配的众包指纹库构建方法
AU2020103470A4 (en) * 2020-11-16 2021-01-28 Guilin University Of Technology Shadow Detection for High-resolution Orthorectificed Imagery through Multi-level Integral Relaxation Matching Driven by Artificial Shadows
CN113076387A (zh) * 2021-04-08 2021-07-06 北京星天地信息科技有限公司 一种基于多基元图谱匹配的道路路网匹配方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201703342VA (en) * 2014-10-28 2017-05-30 Univ Singapore Method and device for real-time error-bounded and delay-bounded map matching
US10415984B2 (en) * 2017-12-29 2019-09-17 Uber Technologies, Inc. Measuring the accuracy of map matched trajectories
US10598499B2 (en) * 2018-07-25 2020-03-24 Kabushiki Kaisha Toshiba Method and device for accelerated map-matching

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768797A (zh) * 2012-01-12 2012-11-07 北京中广睛彩导航科技有限公司 一种城市路况信息评价方法及装置
CN104268710A (zh) * 2014-10-10 2015-01-07 北京交通大学 轨道交通路网动态应急处置方案生成方法
CN108074253A (zh) * 2017-12-25 2018-05-25 中国地质大学(武汉) 一种基于Delaunay三角剖分的多层级矢量道路网匹配方法
CN109522385A (zh) * 2018-11-22 2019-03-26 首都师范大学 一种多尺度道路网m-n匹配模式的判定方法
CN111556432A (zh) * 2020-04-21 2020-08-18 西安交通大学 一种基于地图信息筛选匹配的众包指纹库构建方法
AU2020103470A4 (en) * 2020-11-16 2021-01-28 Guilin University Of Technology Shadow Detection for High-resolution Orthorectificed Imagery through Multi-level Integral Relaxation Matching Driven by Artificial Shadows
CN113076387A (zh) * 2021-04-08 2021-07-06 北京星天地信息科技有限公司 一种基于多基元图谱匹配的道路路网匹配方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Lipka Deka.Network-level accident-mapping:Distance based pattern matching using artificial neural network.Science Direct.2014,第65卷105-113. *
一种顾及道路交通流量语义信息的路网选取方法;邓敏 等;武汉大学学报• 信息科学版;第45卷(第9期);1438-1447 *
利用概率松弛法的城市路网自动匹配;张云菲 等;测绘学报;第41卷(第6期);933-939 *

Also Published As

Publication number Publication date
CN113704377A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN112013862B (zh) 一种基于众包轨迹的行人路网提取及更新方法
CN113704377B (zh) 一种结合人工交互与主动学习的路网匹配方法
CN111209805B (zh) 车道线众包数据的多道路片段数据的快速融合优化方法
CN109214314B (zh) 一种车道线自动融合匹配算法
Yang et al. A pattern‐based approach for matching nodes in heterogeneous urban road networks
CN109299097A (zh) 一种基于哈希学习的在线高维数据最近邻查询方法
CN112084289A (zh) 一种轨迹融合方法及装置
CN111292356A (zh) 运动轨迹与道路的匹配方法及装置
CN109522385B (zh) 一种多尺度道路网m-n匹配模式的判定方法
CN109545283A (zh) 一种基于序列模式挖掘算法的系统发生树构建方法
CN106844419B (zh) 一种基于海量不完备数据集的skyline偏好查询方法
CN114168694A (zh) 路网融合方法、装置、计算机设备和存储介质
CN112948717B (zh) 一种基于多因素约束的海量空间poi搜索方法及系统
Kieler et al. Matching river datasets of different scales
CN116501834A (zh) 地址信息处理方法、装置、移动终端及存储介质
CN112269845B (zh) 面向异源数据的电子道路地图与公交线路的快速匹配方法
CN116071455A (zh) 一种基于同尺度相似关系的道路网stroke生成方法
CN114490903A (zh) 一种道路匹配方法、装置、电子设备及存储介质
CN113569946A (zh) 开源地图与专业数据源路网自适应匹配法
Ye et al. Efficient covisibility-based image matching for large-scale sfm
CN112287005A (zh) 一种数据处理方法、装置、服务器及介质
CN111985366A (zh) 一种道路中心线及桩号识别方法、装置
CN116303376B (zh) 一种基于资产大数据平台的资产管理优化方法及系统
JP7082542B2 (ja) 軌跡検索装置及び軌跡検索プログラム
Dehghani et al. Matching of urban pathways in a multi-scale database using fuzzy reasoning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant