CN113902034A - 一种矢量道路数据变化信息识别与提取方法和装置 - Google Patents

一种矢量道路数据变化信息识别与提取方法和装置 Download PDF

Info

Publication number
CN113902034A
CN113902034A CN202111281235.9A CN202111281235A CN113902034A CN 113902034 A CN113902034 A CN 113902034A CN 202111281235 A CN202111281235 A CN 202111281235A CN 113902034 A CN113902034 A CN 113902034A
Authority
CN
China
Prior art keywords
matching
similarity
target
road
matched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111281235.9A
Other languages
English (en)
Inventor
王帅
王厚之
李海亭
郭明武
刘剑
王诗云
李博闻
段梦梦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Geomatics Institute
Original Assignee
Wuhan Geomatics Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Geomatics Institute filed Critical Wuhan Geomatics Institute
Priority to CN202111281235.9A priority Critical patent/CN113902034A/zh
Publication of CN113902034A publication Critical patent/CN113902034A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开的一种矢量道路数据变化信息识别与提取方法和装置,该方法包括:确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据;将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象;确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标;基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。

Description

一种矢量道路数据变化信息识别与提取方法和装置
技术领域
本发明涉及数据处理技术领域,更具体地说,涉及一种矢量道路数据变化信息识别与提取方法和装置。
背景技术
通过对统一区域不同版本矢量道路网数据进行同名实体匹配,是找出数据增量变化的基础,道路同名实体匹配就是在同一区域不同版本的矢量地图上找出现实时间里所表达的道路实体为同一要素,并建立匹配关系。然而,由于城市道路网结构复杂,其中,还涉及到几何、拓扑、属性、上下文、以及语义等一系列特征,这些特征均会随着主观、以及客观原因造成不同程度的变化。例如,由于道路空间数据在采集和应用的过程,因为受到现实世界变化导致差异和数据应用需要导致差异的影响,两个不同版本矢量地图里的道路网同名实体会在几何特征、拓扑特征和属性特征方面发生变化,这种变化差异将会给不同版本矢量道路网数据的同名实体匹配带来困难。
发明内容
本发明要解决的技术问题在于,针对现有的技术方案存在对不同版本矢量道路网数据的同名实体之间的匹配带来影响的技术问题,提供一种矢量道路数据变化信息识别与提取方法和装置。
本发明解决其技术问题所采用的技术方案是:构造一种矢量道路数据变化信息识别与提取方法,包括:
S1、确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据;
S2、将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象;
S3、确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标;
S4、基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
本申请公开的一种矢量道路数据变化信息识别与提取装置,装置包括第一确定模块、筛选模块、第二确定模块、以及匹配模块,其中:
第一确定模块,用于确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据;
筛选模块,用于将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象;
第二确定模块,用于确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标;
匹配模块,用于基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
本申请公开的一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
S1、确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据;
S2、将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象;
S3、确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标;
S4、基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
本申请公开的一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
S1、确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据;
S2、将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象;
S3、确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标;
S4、基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
实施本发明的一种矢量道路数据变化信息识别与提取方法、装置、计算机设备和存储介质,通过对异构矢量道路网实体之间的差异进行分析和总结,以分析处道路网空间数据变化的内在规律,同时,通过选取合适的实体特征指标,以此来计算同名实体在不同版本数据中的相似度,提高了变化信息识别准确度,使得源匹配集和目标匹配集中的道路同名实体匹配结果更加有效。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明的一个实施例中的一种矢量道路数据变化信息识别与提取方法的流程图;
图2是本发明的一个实施例中矢量道路数据整体匹配、以及部分匹配的流程示意图;
图3是本发明的一个实施例中近似缓冲区的效果示意图;
图4是本发明的一个实施例中的一种矢量道路数据变化信息识别与提取装置的系统结构图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
在本发明的一个或多个实施例中,如图1所示,提供了的一种矢量道路数据变化信息识别与提取方法,以该方法应用于计算机设备(该计算机设备具体可以是终端或服务器,终端具体可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群)为例进行说明,包括以下步骤:
S1、确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据。
S2、将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象。
具体的,计算机设备从源匹配集中选择匹配对象,并从目标匹配集中选择对应的被匹配对象(即需要找出差异的对象),需要说明的是,匹配对象以及被匹配对象都是矢量到数据,两者只是上存在版本不同,当前实施例中,需要从匹配对象以及被匹配对象中,找出差异数据,以确定两者之间的匹配关系。
在其中一个实施例中,请参考图2,对于源匹配集中的每项道路网数据s,计算机设备将使用空间索引技术在目标匹配集中查找相应的候选匹配集合setA。接着,再对数据对象s建立近似缓冲区,并从该近似缓冲区中选择setA落入缓冲区内的集合setB,其中,该集合setB将被作为被匹配对象,此时即完成了被匹配对象的筛选。需要说明的是,再整体匹配的迭代操作中,常会用到缓冲区叠加算法,当前实施例中,为了提高搜索效率,采用近似缓冲区进行候选匹配集的搜索。其中,近似缓冲区的效果示意图如图3所示,其形成原理包括但不限于以下方式:针对道路线段,先利用道格拉斯-普克算法进行数据压缩,随后,再对压缩得到的道路线段进行矩形扩展,扩展完成之后,将得到相应的“近似缓冲区”矩形,该矩形将作为近似缓冲区,以使得能够再目标数据集中粗略的搜索处候选匹配集。
S3、确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标。
具体的,计算机设备通过对几何指标的选取与权重赋值来计算几何特征相似度,以使得道路同名实体的计算结果更为准确。需要说明的是,几何相似度是用来量化地理空间中stroke的某些形态特征的大小。其中,主要的几何度量指标包括长度、角度、形状、面积和距离等。然而,在计算几何相似度时,并不会把上述的各项指标均考虑在内,当前实施例中为了保证计算的有效性,即量化的几何相似度符合人类空间认知规律,在计算几何相似度时采用了长度、角度和空间距离这三项几何指标。
S4、基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
具体的,在整个匹配过程中,计算机设备首先通过对匹配对象和被匹配对象之间的几何特征的相似度进行计算,并基于阈值比较方式,基于得到的几何特征相似特征度,获取较为准确的初始匹配关系。但是,由于道路网络是一个复杂的网络,其路段所在的位置与邻域空间也有一定的联系,若仅仅通过几何特征相似度来确定匹配关系是远远不够的。当前实施例中,为了提高匹配精度,通过对道路的拓扑关系进行分类,并对空间场景结构相似度的计算方式进行改进,从道路单纯的几何特征相似度局部匹配,扩展到空间场景结构相似度的全局匹配。
上述矢量道路数据变化信息识别与提取方法,通过对异构矢量道路网实体之间的差异进行分析和总结,以分析处道路网空间数据变化的内在规律,同时,通过选取合适的实体特征指标,以此来计算同名实体在不同版本数据中的相似度,提高了变化信息识别准确度,使得源匹配集和目标匹配集中的道路同名实体匹配结果更加有效。
在本发明的一个或多个实施例中,步骤S1中,确定源匹配集、以及目标匹配集,包括:
S11、获取道路网数据源;道路网数据源包括用于确定源匹配集的第一数据源、以及用于确定目标匹配集的第二数据源。
S12、根据预设的预处理方式,分别对第一数据源和第二数据源进行处理,以将第一数据源转化为相应的源匹配集,以及将第二数据源转化为相应的目标匹配集;预处理方式包括等距离插值加密操作、道路stroke迭代连接操作以及数据的空间索引建立操作中的至少一种。
需要说明的是,当前实施例中进行等距离插值加密操作的原因是由于道路数据在生产加工的时候,在不改变道路几何形态的前提下为了压缩数据空间,而尽可能的少存储点,如此会导致道路弧段长度的不一致。但是在道路同名实体的匹配过程中,匹配实体往往被看作为一系列的顶点集合,在一些实施例中,一般会通过顶点距离来计算道路线的距离。如果,道路线所表达的顶点集合过于稀疏,就会造成计算得到的空间距离过大,此种情况,将不利于匹配算法的执行,其计算结果的准备性,也将无法保证。因此,当前实施例中,通过计算机设备对道路线以等距离插值算法进行顶点加密操作,使得稀疏的道路线顶点分布更加均匀。
另外,为了在算法的执行过程中减少不必要的数据检索操作,同时提高数据的检索效率,当前实施例中,计算机设备将会对道路网数据建立空间索引。在一个实施例中,计算机设备采用经典的空间格网索引技术来对道路网数据进行数据组织,其中,每一条道路线段所经过的格网区域都会被记录,而线段如果穿过格网,相应地,则需要计算出交叉点。
在本发明的一个或多个实施例中,步骤S4中,基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系,包括:
S41、将匹配对象与被匹配对象进行初匹配,且,初匹配过程中,基于相似性度量指标,计算匹配对象与被匹配对象之间的几何特征相似度。
具体的,计算机设备基于所确定的相似性度量指标,将基于上述的各项度量指标,进行几何相似度的计算。其中,请参考图2,其中涉及到的整体匹配包括正向匹配以及反向匹配,在进行正向匹配时,包括:从源匹配集中确定匹配对象,以及搜索候选匹配集(即搜索目标匹配集);之后,再基于搜索到的候选匹配集进行对应被匹配对象的确定;在将匹配对象与被匹配对象进行初匹配,进行几何相似度的计算。
S42、基于计算得到的几何特征相似度,从各个匹配对中,筛选出几何特征不匹配的特征不匹配对。
具体的,计算机设备将得到的几何特征相似度与预设的几何特征相似阈值进行比较,后续,将基于得到的比较结果进行特征不匹配对的筛选。例如,在计算机设备基于得到的比较结果,确定几何特征相似度小于该几何特征相似阈值时,将认为对应匹配对中包括的匹配对象以及被匹配对象之间的几何特征相匹配,该匹配对将被作为特征匹配对进行输出。反之,可以通过上述的推理过程,进一步确定特征不匹配对的筛选方式,本申请实施例对此不作过多说明。
S43、对特征不匹配对中包括的目标匹配对象、以及目标被匹配对象,进行再次匹配,且,再次匹配过程中,进行空间场景结构相似度的计算。
具体的,请参考图2,计算机设备在对特征不匹配对中包括的目标匹配对象、以及目标被匹配对象进行再次匹配时,将结合上一步骤中计算得到的几何相似度进行空间场景结构相似度的计算,由于后续将对空间场景结构相似度的计算过程进行说明,本申请实施例在此不作过多说明。
S44、基于得到的空间场景结构相似度,确定目标匹配对象、以及目标被匹配对象之间的匹配关系。
具体的,计算机设备基于得到的空间场景结构相似度,将该空间场景结构相似度与给定的阈值进行比较,并基于得到的比较结果,例如,基于得到的比较结果,在确定该空间场景结构相似度小于给定的阈值,确定目标匹配对象与目标被匹配对象之间为特征相匹配的匹配关系。
上述实施例中,从单纯的几何特征相似度局部匹配,扩展到空间场景结构相似度的全局匹配,以使得源匹配集与目标匹配集中的道路同名实体间的匹配结果更加有效。
在本发明的一个或多个实施例中,步骤S41中,基于相似性度量指标,计算匹配对象与被匹配对象之间的几何特征相似度,包括:
S411、通过下述的公式(1),计算匹配对象与被匹配对象之间的空间距离:
Figure BDA0003331048050000081
其中,MHD(pA,pB)为求得的空间距离;h(pA,pB)表示点集合pA中任意一点到点集合pB相连的欧式距离最小值的之和的平均值;h(pB,pA)表示点集合pB中任意一点到点集合pA相连的欧式距离最小值的之和的平均值;||pai-pbj||为点pai到点pbj的欧氏距离;pai为包含在点集合pA中的一个目标点,pbj为包含在点集合pB中的一个目标点。
S412、根据下述的公式(2),计算匹配对象与被匹配对象之间的几何特征相似度:
Figure BDA0003331048050000091
其中,s1表示匹配对象,s2表示被匹配对象;ω1、ω2和ω3表示权重参数,且均为正数,ω123=1;LR(s1,s2)表示s1与s2之间的长度比值;AT表示预设的夹角阈值,A(s1,s2)表示s1与s2之间的夹角;HT表示预设的距离阈值,H(s1,s2)表示基于公式(1)求得的空间距离;SI(s1,s2)表示所得的几何特征相似度。
需要说明的是,由于一个stroke是由许多离散的线段所组成的,所以不同stroke的长度具有高度的差异性,这是stroke的一个非常重要的几何特征。stroke之间的夹角是连接两个stroke的第一个和最后一个节点的两条线之间的夹角。stroke的长度一般不短。因此,在长度满足条件的情况下,连接第一个节点和最后一个节点的线形成的角度,也满足条件的情况很少见。因此,空间距离是一个不可缺少的几何指标,因为两个stroke的相似度越高,关联越大。
在一个实施例中,为了描述空间距离,通常使用Hausdorff距离(HD)来进行计算,它是通过一个数学结构来度量度量空间子集中两组点的邻近程度。而当前实施例中,则考虑在Hausdorff距离的基础上进行改进,采用了改进的对噪点不敏感的Hausdorff距离(MHD)算法(具体可以参考公式(2))计算stroke间的空间距离。
在本发明的一个或多个实施例中,步骤S43中,再次匹配过程中,进行空间场景结构相似度的计算,包括:
S431、根据目标匹配对象、以及目标被匹配对象之间的领域拓扑关系,确定空间场景结构;领域拓扑关系包括道路首结点与尾节点相连的第一领域拓扑关系、道路内部相连的第二领域拓扑关系、以及道路内部相交的第三领域拓扑关系。
S432、通过下述的公式(3),在对目标匹配对象、以及目标被匹配对象进行匹配的过程中,进行空间场景结构相似度的计算:
Figure BDA0003331048050000101
其中,len(j)表示计算第j个匹配对中,两条相互匹配的道路线实体的长度之和;SI(j)为计算第j个匹配对中,两条相互匹配的道路线实体的几何相似度;f为补偿函数;SIM(s1,s2)为所得的空间场景结构相似度。
需要说明的是,假设某一stroke道路是小比例尺地图上的S。同样,在大比例尺地图上与S匹配的候选stroke道路是S'。其中,S和S'的stroke可分为匹配对和非匹配对,当前实施例中,需要搜索具有相同类型(A、B或C)的弧段,并将上述的各个弧段分别连接到S和S'。其中,计算机设备将通过上述的公式(2)计算几何相似度,以及,S和S'之间的空间场景结构相似度计算方法如上述公式(3)所示,本申请实施例在此不做过多描述。
在一个实施例中,参照人类识图的思维习惯,当某条stroke与其邻域范围内具有直接拓扑关系的道路stroke时,在匹配的过程中匹配数量越多,则认为该条stroke就是目标匹配集中所要搜集的道路stroke,这个结论就越正确。基于这样的考虑,在计算过程中引入补偿函数f。也就是说源匹配集和目标数据集中的两个空间场景,在匹配的过程中匹配数量越多,则这两个空间场景结构的相似度就越高。其中,对于补偿函数f的定义方法如下述公式(4)所示:
Figure BDA0003331048050000111
其中,T为S和S'两个空间场景的stroke总数,两个空间场景匹配成功的stroke对为:n+m+k。
在本发明的一个或多个实施例中,步骤S44之后,方法还包括:
S45、在确定目标匹配对象、以及目标被匹配对象仍不匹配时,基于道路弧段分解的第一部分匹配方式和基于顶点分解的第二部分匹配方式,重新确定目标匹配对象与目标被匹配对象之间的匹配关系,以使得最大限度的从各个匹配对中筛选处相匹配的矢量道路数据对。
具体的,在执行完stroke整体匹配之后,可能会出现不匹配的stroke,但是stroke中的部分道路可以与另一地图上的其他道路相匹配。因此,当前实施例中,计算机设备首先将基于道路弧段分解的第一部分匹配方式,对于要匹配的stroke集合对,它们分别表示为集合Str和集合CanStr。其中,假设Str由N条路组成,即Str={Str1,Str2,...,StrN},以及,假设CanStr由NC条道路组成,在计算过程中,设HT为Hausdorff距离阈值。当前实施例中,在获取每条道路Stri和CanStrj的空间距离HD后,将判断Stri里的每条弧段是否可以在CanStrj中找到相匹配的弧段。其中,针对空间距离HD大于Hausdorff距离阈值HT这一情况,则意味着在集合Stri和几何CanStrj中不存在部分匹配对象。此时,集合Stri的空间距离属性值HAtti将设置为FALSE。否则,将其距离属性值HAtti设置为TRUE。其中,集合Stri中的每一弧段,经过计算后都可以得到一个布尔类型的空间距离属性值集合PStri,其具体形式如下所示:
PStr={HAtt1,HAtt2,...,HAttN}。
同理,集合CanStrj的每条弧段对应布尔类型的空间距离属性值集合PCanStrj为:
PCanStrj={HAtt1,HAtt2,...,HAttNC}。
当前实施例中,通过对PStr和PCanStr的元素值进行了比较分析。如果确定一些连续道路的元素值从左至右的值始终为TRUE,则会形成一个匹配体(即源匹配集中某stroke道路的一部分路段已经可以在目标匹配集中找到匹配对象)。然后,将Str或CanStr中的这些stroke部分连接起来形成一个新的stroke。在此基础上,得到了Str和CanStr中部分匹配的stroke的初步结果。最后,计算了新生成的stroke之间的长度比和角度。如果长度比和角度都满足阈值条件,则认为部分匹配是成功的。所有部分匹配成功的道路都标记为匹配。如果,其中任意一个长度比或角度不满足阈值条件,则按照顺序(从第一个到最后一个)删除较长的一条路。剩下的道路形成了一个新的stroke。然后计算出匹配对中较短的长度比和角度,直到满足阈值条件或完全去除所有道路。
在一个实施例中,基于顶点分解的第二部分匹配方式,重新确定目标匹配对象与目标被匹配对象之间的匹配关系,具体可以理解为:对stroke进行了顶点分解,在更大程度上寻找存在局部匹配关系的路段。其中,假设某条stroke由k条弧段组成,定义为S={s1,s2,…,sk},另一候选匹配道路stroke′定义为S′={s1′,s2′,…,s′k}。首先,将获取在S到S′中每个顶点pi(其中1≤i≤n)的最短距离,并根据最短距离确定顶点pi的布尔空间距离属性集合。同理,对道路S′中每个结点pj′(其中1≤j≤m)求到道路的最短距离,并根据该最短距离计算得到pj′的布尔空间距离属性集合。之后,再将上述求得的两个布尔空间距离属性集合中的元素,结合在一起形成一个匹配体。如果元素的下标值依次从小到大排列,且相对应的布尔类型空间距离属性值依次为TRUE,那么这些依次排序的道路顶点集合就会构成一个匹配体,以此便会得到道路stroke部分匹配结果。
请参考图4,本申请公开了一种矢量道路数据变化信息识别与提取装置400,装置400包括第一处理模块401、第二处理模块402、匹配模块403、以及数据更新模块404,其中:
第一确定模块401,用于确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据。
筛选模块402,用于将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象。
第二确定模块403,用于确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标。
匹配模块404,用于基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
在其中一个实施例中,第一确定模块401还用于获取道路网数据源;道路网数据源包括用于确定源匹配集的第一数据源、以及用于确定目标匹配集的第二数据源;根据预设的预处理方式,分别对第一数据源和第二数据源进行处理,以将第一数据源转化为相应的源匹配集,以及将第二数据源转化为相应的目标匹配集;预处理方式包括等距离插值加密操作、道路stroke迭代连接操作以及数据的空间索引建立操作中的至少一种。
在其中一个实施例中,匹配模块404还用于将匹配对象与被匹配对象进行初匹配,且,初匹配过程中,基于相似性度量指标,计算匹配对象与被匹配对象之间的几何特征相似度;基于计算得到的几何特征相似度,从各个匹配对中,筛选出几何特征不匹配的特征不匹配对;对特征不匹配对中包括的目标匹配对象、以及目标被匹配对象,进行再次匹配,且,再次匹配过程中,进行空间场景结构相似度的计算;基于得到的空间场景结构相似度,确定目标匹配对象、以及目标被匹配对象之间的匹配关系。
在其中一个实施例中,匹配模块404还用于通过下述的公式(1),计算匹配对象与被匹配对象之间的空间距离:
Figure BDA0003331048050000141
其中,MHD(pA,pB)为求得的空间距离;h(pA,pB)表示点集合pA中任意一点到点集合pB相连的欧式距离最小值的之和的平均值;h(pB,pA)表示点集合pB中任意一点到点集合pA相连的欧式距离最小值的之和的平均值;||pai-pbj||为点pai到点pbj的欧氏距离;pai为包含在点集合pA中的一个目标点,pbj为包含在点集合pB中的一个目标点;根据下述的公式(2),计算匹配对象与被匹配对象之间的几何特征相似度:
Figure BDA0003331048050000142
其中,s1表示匹配对象,s2表示被匹配对象;ω1、ω2和ω3表示权重参数,且均为正数,ω123=1;LR(s1,s2)表示s1与s2之间的长度比值;AT表示预设的夹角阈值,A(s1,s2)表示s1与s2之间的夹角;HT表示预设的距离阈值,H(s1,s2)表示基于公式(1)求得的空间距离;SI(s1,s2)表示所得的几何特征相似度。
在其中一个实施例中,匹配模块404还用于根据目标匹配对象、以及目标被匹配对象之间的领域拓扑关系,确定空间场景结构;领域拓扑关系包括道路首结点与尾节点相连的第一领域拓扑关系、道路内部相连的第二领域拓扑关系、以及道路内部相交的第三领域拓扑关系;通过下述的公式(3),在对目标匹配对象、以及目标被匹配对象进行匹配的过程中,进行空间场景结构相似度的计算:
Figure BDA0003331048050000151
其中,len(j)表示计算第j个匹配对中,两条相互匹配的道路线实体的长度之和;SI(j)为计算第j个匹配对中,两条相互匹配的道路线实体的几何相似度;f为补偿函数;SIM(s1,s2)为所得的空间场景结构相似度。
在其中一个实施例中,该装置400还包括部分匹配模块,其中:
部分匹配模块,用于在确定目标匹配对象、以及目标被匹配对象仍不匹配时,基于道路弧段分解的第一部分匹配方式和基于顶点分解的第二部分匹配方式,重新确定目标匹配对象与目标被匹配对象之间的匹配关系,以使得最大限度的从各个匹配对中筛选处相匹配的矢量道路数据对。
上述矢量道路数据变化信息识别与提取装置,通过对异构矢量道路网实体之间的差异进行分析和总结,以分析处道路网空间数据变化的内在规律,同时,通过选取合适的实体特征指标,以此来计算同名实体在不同版本数据中的相似度,提高了变化信息识别准确度,使得源匹配集和目标匹配集中的道路同名实体匹配结果更加有效。
在本发明的一个或多个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
上述计算机设备,通过对异构矢量道路网实体之间的差异进行分析和总结,以分析处道路网空间数据变化的内在规律,同时,通过选取合适的实体特征指标,以此来计算同名实体在不同版本数据中的相似度,提高了变化信息识别准确度,使得源匹配集和目标匹配集中的道路同名实体匹配结果更加有效。
在本发明的一个或多个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
上述存储介质,通过对异构矢量道路网实体之间的差异进行分析和总结,以分析处道路网空间数据变化的内在规律,同时,通过选取合适的实体特征指标,以此来计算同名实体在不同版本数据中的相似度,提高了变化信息识别准确度,使得源匹配集和目标匹配集中的道路同名实体匹配结果更加有效。
以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种矢量道路数据变化信息识别与提取方法,其特征在于,包括:
S1、确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据;
S2、将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象;
S3、确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标;
S4、基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
2.根据权利要求1的方法,其特征在于,步骤S1中,确定源匹配集、以及目标匹配集,包括:
S11、获取道路网数据源;道路网数据源包括用于确定源匹配集的第一数据源、以及用于确定目标匹配集的第二数据源;
S12、根据预设的预处理方式,分别对第一数据源和第二数据源进行处理,以将第一数据源转化为相应的源匹配集,以及将第二数据源转化为相应的目标匹配集;预处理方式包括等距离插值加密操作、道路stroke迭代连接操作以及数据的空间索引建立操作中的至少一种。
3.根据权利要求1的方法,其特征在于,步骤S4中,基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系,包括:
S41、将匹配对象与被匹配对象进行初匹配,且,初匹配过程中,基于相似性度量指标,计算匹配对象与被匹配对象之间的几何特征相似度;
S42、基于计算得到的几何特征相似度,从各个匹配对中,筛选出几何特征不匹配的特征不匹配对;
S43、对特征不匹配对中包括的目标匹配对象、以及目标被匹配对象,进行再次匹配,且,再次匹配过程中,进行空间场景结构相似度的计算;
S44、基于得到的空间场景结构相似度,确定目标匹配对象、以及目标被匹配对象之间的匹配关系。
4.根据权利要求3的方法,其特征在于,步骤S41中,基于相似性度量指标,计算匹配对象与被匹配对象之间的几何特征相似度,包括:
S411、通过下述的公式(1),计算匹配对象与被匹配对象之间的空间距离:
Figure FDA0003331048040000021
其中,MHD(pA,pB)为求得的空间距离;h(pA,pB)表示点集合pA中任意一点到点集合pB相连的欧式距离最小值的之和的平均值;h(pB,pA)表示点集合pB中任意一点到点集合pA相连的欧式距离最小值的之和的平均值;||pai-pbj||为点pai到点pbj的欧氏距离;pai为包含在点集合pA中的一个目标点,pbj为包含在点集合pB中的一个目标点;
S412、根据下述的公式(2),计算匹配对象与被匹配对象之间的几何特征相似度:
Figure FDA0003331048040000022
其中,s1表示匹配对象,s2表示被匹配对象;ω1、ω2和ω3表示权重参数,且均为正数,ω123=1;LR(s1,s2)表示s1与s2之间的长度比值;AT表示预设的夹角阈值,A(s1,s2)表示s1与s2之间的夹角;HT表示预设的距离阈值,H(s1,s2)表示基于公式(1)求得的空间距离;SI(s1,s2)表示所得的几何特征相似度。
5.根据权利要求3的方法,其特征在于,步骤S43中,再次匹配过程中,进行空间场景结构相似度的计算,包括:
S431、根据目标匹配对象、以及目标被匹配对象之间的领域拓扑关系,确定空间场景结构;领域拓扑关系包括道路首结点与尾节点相连的第一领域拓扑关系、道路内部相连的第二领域拓扑关系、以及道路内部相交的第三领域拓扑关系;
S432、通过下述的公式(3),在对目标匹配对象、以及目标被匹配对象进行匹配的过程中,进行空间场景结构相似度的计算:
Figure FDA0003331048040000031
其中,len(j)表示计算第j个匹配对中,两条相互匹配的道路线实体的长度之和;SI(j)为计算第j个匹配对中,两条相互匹配的道路线实体的几何相似度;f为补偿函数;SIM(s1,s2)为所得的空间场景结构相似度。
6.根据权利要求3的方法,其特征在于,步骤S44之后,方法还包括:
S45、在确定目标匹配对象、以及目标被匹配对象仍不匹配时,基于道路弧段分解的第一部分匹配方式和基于顶点分解的第二部分匹配方式,重新确定目标匹配对象与目标被匹配对象之间的匹配关系,以使得最大限度的从各个匹配对中筛选处相匹配的矢量道路数据对。
7.一种矢量道路数据变化信息识别与提取装置,其特征在于,装置包括第一确定模块、筛选模块、第二确定模块、以及匹配模块,其中:
第一确定模块,用于确定源匹配集、以及目标匹配集,其中,源匹配集和目标匹配集中均包括多条道路网数据;
筛选模块,用于将源匹配集中包括各项道路网数据作为匹配对象,并利用空间格网索引技术和近似缓冲区叠加算法,从目标匹配集中筛选出与匹配对象相对应的被匹配对象;
第二确定模块,用于确定相似性度量指标,相似性度量指标包括长度、角度以及空间距离中的至少一种几何指标;
匹配模块,用于基于相似性度量指标,结合几何特征相似度、以及空间场景结构相似度度量方式,确定匹配对象与被匹配对象之间的匹配关系。
8.根据权利要求7的装置,其特征在于,第一确定模块还用于获取道路网数据源;道路网数据源包括用于确定源匹配集的第一数据源、以及用于确定目标匹配集的第二数据源;根据预设的预处理方式,分别对第一数据源和第二数据源进行处理,以将第一数据源转化为相应的源匹配集,以及将第二数据源转化为相应的目标匹配集;预处理方式包括等距离插值加密操作、道路stroke迭代连接操作以及数据的空间索引建立操作中的至少一种。
9.一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,其特征在于,处理器执行计算机程序时实现权利要求1至6中任一项的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现权利要求1至6中任一项的方法的步骤。
CN202111281235.9A 2021-11-01 2021-11-01 一种矢量道路数据变化信息识别与提取方法和装置 Pending CN113902034A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111281235.9A CN113902034A (zh) 2021-11-01 2021-11-01 一种矢量道路数据变化信息识别与提取方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111281235.9A CN113902034A (zh) 2021-11-01 2021-11-01 一种矢量道路数据变化信息识别与提取方法和装置

Publications (1)

Publication Number Publication Date
CN113902034A true CN113902034A (zh) 2022-01-07

Family

ID=79027960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111281235.9A Pending CN113902034A (zh) 2021-11-01 2021-11-01 一种矢量道路数据变化信息识别与提取方法和装置

Country Status (1)

Country Link
CN (1) CN113902034A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113689573A (zh) * 2021-08-30 2021-11-23 中国矿业大学(北京) 面向地理全要素的dggs互操作质量评价方法
CN116051614A (zh) * 2023-03-29 2023-05-02 航天宏图信息技术股份有限公司 一种线状要素的多维度综合形状匹配度计算方法和装置
CN116127330A (zh) * 2022-09-14 2023-05-16 兰州交通大学 一种路网语义相似性度量模型

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113689573A (zh) * 2021-08-30 2021-11-23 中国矿业大学(北京) 面向地理全要素的dggs互操作质量评价方法
CN116127330A (zh) * 2022-09-14 2023-05-16 兰州交通大学 一种路网语义相似性度量模型
CN116127330B (zh) * 2022-09-14 2023-11-03 兰州交通大学 一种路网语义相似性度量模型
CN116051614A (zh) * 2023-03-29 2023-05-02 航天宏图信息技术股份有限公司 一种线状要素的多维度综合形状匹配度计算方法和装置
CN116051614B (zh) * 2023-03-29 2023-11-28 航天宏图信息技术股份有限公司 一种线状要素的多维度综合形状匹配度计算方法和装置

Similar Documents

Publication Publication Date Title
US11195312B1 (en) Gragnostics rendering
CN113902034A (zh) 一种矢量道路数据变化信息识别与提取方法和装置
Xie et al. Point clouds learning with attention-based graph convolution networks
EP2945071B1 (en) Index generating device and method, and search device and search method
Lu et al. Deep ranking: Triplet MatchNet for music metric learning
CN111651641B (zh) 一种图查询方法、装置及存储介质
CN111460234A (zh) 图查询方法、装置、电子设备及计算机可读存储介质
CN114238329A (zh) 向量相似度计算方法、装置、设备及存储介质
CN110188131A (zh) 一种频繁模式挖掘方法及装置
Chen et al. Finger: Fast inference for graph-based approximate nearest neighbor search
CN114332519A (zh) 一种基于外部三元组和抽象关系的图像描述生成方法
Yousaf et al. An extended isomap approach for nonlinear dimension reduction
CN109542949B (zh) 一种基于形式向量的决策信息系统知识获取方法
CN112766385B (zh) 一种众源矢量线数据几何匹配与属性融合方法
CN107610120B (zh) 一种多尺度建筑物面实体匹配方法及系统
CN110502669B (zh) 基于n边dfs子图轻量级无监督图表示学习的社交媒体数据分类方法及装置
CN108198084A (zh) 一种复杂网络重叠社区发现方法
Morrison et al. Inexact graph matching using a hierarchy of matching processes
CN113568987B (zh) 知识图谱嵌入模型的训练方法、装置、计算机设备
CN105162648A (zh) 基于骨干网络扩展的社团检测方法
Kalaivani et al. A novel hyperparameter tuned deep learning model for content based image retrieval
Ngo et al. Similarity Shape Based on Skeleton Graph Matching.
CN115146022A (zh) 用于知识图中的关键词搜索的计算机实现方法
CN113988184A (zh) 一种矢量道路数据匹配与更新方法、装置和计算机设备
CN113515662A (zh) 一种相似歌曲检索方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination