CN112307079B - 一种众源地理信息线状要素的综合质量评价方法 - Google Patents

一种众源地理信息线状要素的综合质量评价方法 Download PDF

Info

Publication number
CN112307079B
CN112307079B CN202011058713.5A CN202011058713A CN112307079B CN 112307079 B CN112307079 B CN 112307079B CN 202011058713 A CN202011058713 A CN 202011058713A CN 112307079 B CN112307079 B CN 112307079B
Authority
CN
China
Prior art keywords
geographic information
evaluation
linear element
index
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011058713.5A
Other languages
English (en)
Other versions
CN112307079A (zh
Inventor
吴浩
林安琪
宋旦霞
吴霞
涂振发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central China Normal University
Original Assignee
Central China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central China Normal University filed Critical Central China Normal University
Priority to CN202011058713.5A priority Critical patent/CN112307079B/zh
Publication of CN112307079A publication Critical patent/CN112307079A/zh
Application granted granted Critical
Publication of CN112307079B publication Critical patent/CN112307079B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Instructional Devices (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种众源地理信息线状要素的综合质量评价方法,即:先对众源地理信息和权威参考线状要素进行数据预处理,生成评价基本单元;然后,在每个评价基本单元内,计算这两类线状要素的分形维数之差,作为完整性指标;接着,在每个评价基本单元内,创建这两类线状要素的双缓冲区,计算其重叠比率,作为位置精度指标;最后将完整性指标和位置精度指标进行标准化处理,并在地图中分级显示评价结果。本发明提出的基于分形维数的完整性指标和基于双缓冲区的位置精度指标,有效弥补了传统质量评价方法在刻画线状要素的空间结构局部特征和几何形态细微差异的不足,对众源地理信息中复杂线状要素的适应性更强,更全面和精准的反映出数据质量问题。

Description

一种众源地理信息线状要素的综合质量评价方法
技术领域
本发明属于地理信息时空大数据领域,特别是一种众源地理信息线状要素的综合质量评价方法。
背景技术
众源地理信息是伴随Web2.0技术兴起的新型数据来源,由大量志愿者产生并通过互联网进行公开分享和传播,具有数据量大、采集成本低、覆盖范围广、更新速度快等优势。
众源地理信息数据主要包括点、线、面三大类型,其中线状要素,例如道路、管道等,已经广泛应用在地图更新与导航、应急管理和城市规划等众多领域,成为了专业地理信息数据的重要补充。然而,这类数据主要由非专业人士自发提供,缺乏标准化的制图规范和测绘设备,导致数据质量参差不齐,其数据利用率和应用可靠性较低,严重制约着其更大范围的应用。因此,有必要对众源地理信息线状要素进行综合、全面的质量评价,从而精确认知数据质量问题并制定质量控制策略,确保其应用可靠性。
在评价众源地理信息线状要素质量方面,国内外学者已经贡献了大量的评估方法和模型,主要围绕数据完整性和位置精度展开,分为参考对比法和间接指示器法两大类。
参考对比法是将众源地理信息与权威参考数据进行对比,以两者差异程度的高低作为评判众源地理信息数据质量的依据。由于权威参考数据通常能够更精确的表达实体道路或其他线性结构,所以众源地理信息数据与其差异性越小,说明数据质量越好。OpenStreetMap(OSM)作为目前用户最多,数据覆盖范围最广的众源地理信息平台,OSM路网已经成为了该领域的重点研究对象。英国学者Haklay在2010年通过对比伦敦地区OSM和官方Ordnance Survey的路网总长度,评估了该地区OSM道路的完整性。长度指标之后成为最常用的完整性评价指标,相继应用在德国、法国、中国等多个国家的OSM路网完整性评价中。Forghani等人在2014年使用了最小外接多边形和平均中心点指标评估德黑兰的OSM道路完整性。Mobasheri等人在2018年提出基于道路围合多边形的评价指标,来对比OSM数据和GPS轨迹,从而评价OSM人行道的完整性。对于线状要素的位置精度,Goodchild于1997年提出的缓冲区法是最经典的评价指标,该方法通过不断修改权威参考线性要素的缓冲区大小,找到恰好能覆盖住所有被检测道路的缓冲区尺寸,即为道路的位置精度。Girres等人在2010年使用Hausdorff平均距离指标进行线性要素的位置精度评价。虽然已经有大量指标应用于众源地理信息线状要素的评价,但是这些指标并未充分考虑到复杂线状结构的空间分布特征或是几何形态特征,导致最终数据评价结果不能全面反映出数据质量问题。
间接指示器法是在没有参考数据的情况下,通过对数据固有信息和关联因素进行深入分析,以获得能够反映众源地理信息数据质量的对应关系。Barrington等人研究发现在全球范围内,治安良好、网络发达的地区OpenStreetMap路网完整性更好。Exel指出志愿者背景、经历和认知对众源地理信息数据质量有显著影响。Camboim验证了众源地理信息数据质量和GPD之间的相关关系。Mobasheri证明了高速公路里程、建筑物数、志愿者数量可以作为OpenStreetMap人行道完整性的指示器。此类方法虽然不受权威参考数据的限制,但存在着评价结果难以量化,选择潜在影响因子主观性强,评价单元尺度过大等问题,因此并未成为众源地理信息线性要素质量评价的主流方法。同时,随着越来越多的政府和组织逐步开放城市的各类基础数据,获取权威参考数据也不再是参考对比方法的最大难题。众源地理信息线状要素的质量评价难点在于,面对越来越复杂的城市道路网络,如何设计合理的评价指标与模型。
随着众源地理信息数据量和数据来源的不断丰富,由于多源数据融合、更新频率加快等导致的数据质量问题也越来越凸显,传统的指标难以满足精准的质量评价需求。线状要素的长度对比和单缓冲区法等经典指标仅从数据分布的全局考虑,忽略了空间几何要素的局部微小特征,无法全面彻底的反映众源地理信息和权威参考数据之间的差异,从而导致数据完整性和位置精度评价结果有所偏差。
对于完整性来说,现有研究指出,众源地理信息中存在数据溢出和数据缺失两类数据完整性错误,且这两类错误通常表现为同一区域内混杂出现的微小误差。使用传统的长度对比方法,难以区分这两类错误,特别是在复杂线型结构中,经常出现数据溢出与数据缺失的线性要素长度相近的情况,此时长度对比方法完全失灵,会错误判断出数据完整性高。所提出的基于分形维数的完整性评价方法,利用盒维数以非整数维形式描述充填空间形态特征的优势,能够对线状要素的空间占有状态进行细致刻画,从而考察数据完整性。因此,通过对比众源地理信息与权威参考数据的盒维数,可以将两者的细微误差反应到最终的完整性评价结果中,相较传统的长度对比方法,该指标更加灵敏,面对复杂线型结构的适应性更强。
对于位置精度来说,经典的单缓冲区法可以满足大部分直线型道路的位置精度评价需求,但是在复杂路况下,该方法只考虑一定缓冲区范围内的要素是否全部覆盖,而忽略了弯道、转盘、立交接口等非直线型线状要素几何形状的精准程度,这将对位置精度评价造成极大影响。特别是众源地理信息,主要是由缺乏测绘背景和统一制图标准的普通用户通过上传GPS轨迹或者在平台上对照遥感影像进行数字化的方式产生数据,容易在道路复杂地区出现曲线过于粗糙的现象,造成位置精度偏低的情况。设计的双缓冲区法,能够保持众源地理信息和权威参考要素的相对位置不变,又将线要素转化为面要素,放大曲折线要素的细微几何特征。因此,通过计算众源地理信息与权威参考数据缓冲区的重叠比率,既体现了要素之间的距离,也量化了其形状上的差异,比单缓冲区法更加全面和科学。
本发明提出的基于分形维数的完整性指标和基于双缓冲区法的位置精度指标,有效弥补了传统数据质量评价方法在刻画线状要素的空间结构局部特征和检测几何形态细微差异的不足,指标更加灵敏,对众源地理信息中复杂线状要素的适应性更强,能够全面和精准的反映出数据质量问题。更为重要的是,该方法适用于众源地理信息中大量的道路、管道、水系等各种类型的线状要素,实现数据质量又快又好的检验,对拓展地理信息时空大数据的应用领域具有重要意义。
发明内容
本发明需要解决的技术问题是:为了深入挖掘众源地理信息线状要素的质量问题,提出了一种众源地理信息线状要素的综合质量评价方法,能够从数据完整性和位置精度两方面,有效识别复杂线状要素的质量问题,是对传统数据质量评价指标的有益补充。
本发明解决其技术问题采用以下的技术方案:
本发明提供的众源地理信息线状要素的综合质量评价方法,具体是:首先对众源地理信息和权威参考线状要素进行数据预处理,生成质量评价的基本单元;然后,在每个质量评价基本单元内,计算众源地理信息和权威参考线状要素的分形维数之差,作为完整性评价指标;接着,在每个评价基本单元内,创建众源地理信息和权威参考线状要素的双缓冲区,计算二者的重叠比率,作为位置精度评价指标;最后将上述完整性指标和位置精度指标进行数据标准化处理,并将最终评价结果在地图中分级显示。
上述方法中,可以采用以下方法生成质量评价基本单元:将众源地理信息线状要素与权威参考线状要素进行坐标转换、范围裁剪和格网划分,设置格网尺寸为100-2000米,保证研究区的格网数量不少于300个,作为质量评价的基本单元。
上述方法中,可以采用以下方法建立完整性评价指标:根据设置好的格网尺寸,分割众源地理信息线状要素与权威参考线状要素,在每个质量评价基本单元内,采用分形几何中的盒维数方法,分别评估众源地理信息线状要素与权威参考线状要素的空间占有能力,再计算二者盒维数的差值,作为数据的完整性评价指标。
上述方法中,可以批量计算所有质量评价基本单元内众源地理信息线状要素与权威参考线状要素的盒维数,其步骤包括:
(1)编写Python语言程序,调用arcpy.Split_analysis函数,按照权利要求2中设置的格网尺寸,分别将众源地理信息线状要素与权威参考线状要素的矢量数据按照权利进行数据分割;
(2)编写Python语言程序,调用arcpy.FeatureToRaster_conversion函数,将按照格网分割后shp格式的矢量线状要素,批量转化为tif格式的栅格图像,生成的图像中线状要素为黑色,背景为白色,分辨率为100dpi;
(3)在Matlab软件中,读取tif格式的线状要素数据,进行图像二值化处理,其中黑色像素值设为1,白色像素值设为0;
(4)编写Matlab程序,调用Fraclab工具包中的DimensionCalculation方法,设置盒子尺寸S=[1/2,1/4,1/8,1/16,1/32,1/64,1/128,1/256,1/512,1/1024,1/2048,1/4096],即使用10个不同尺寸的正方形网格去覆盖被测线状要素,将一系列不同格网边长S与其对应的非空格网数N进行双对数线性拟合,所得直线斜率即为盒维数。
上述方法中,可以建立的完整性评价指标,是计算众源地理信息与权威参考线状要素的盒维数差异值,公式如下:
CVGI=|DVGI-DREF|
式中,CVGI为数据完整性指标,DVGI是众源地理信息线状要素的盒维数,DREF是权威参考线状要素的盒维数。
上述方法中,可以采用以下方法建立位置精度评价指标:在每个质量评价基本单元内,创建众源地理信息和权威参考线状要素的双缓冲区,得到缓冲区交集和并集的面积,计算其重叠比率,作为位置精度评价指标。
上述方法中,可以计算双缓冲区交集与并集的面积,其步骤包括:
(1)编写Python语言程序,调用Buffer_analysis函数,分别创建众源地理信息线状要素与权威参考线状要素的缓冲区,半径设置为5米,末端形状设置为圆形;
(2)编写Python语言程序,调用arcpy.Split_analysis函数,按照权利要求2中设置的格网尺寸,将上一步生成的缓冲区进行数据分割;
(3)编写Python语言程序,调用arcpy.Intersect_analysis和arcpy.Union_analysis函数,批量生成所有基本单元内众源地理信息线状要素与权威参考线状要素的缓冲区的缓冲区交集与并集,然后调用arcpy.CalculateField_management函数计算交集与并集的面积。
上述方法中,可以建立的位置精度评价指标,计算公式为:
AVGI=1-S(VGI∩REF)/S(VGI∪REF)
式中,AVGI为位置精度,S(VGI∩REF)是众源地理信息线状要素与权威参考线状要素缓冲区的交集面积,S(VGI∪REF)是二者的并集面积。
上述方法中,可以采用以下方法评价结果标准化与可视化:将完整性指标和位置精度指标进行数据标准化处理(指标值∈[0,1]),然后按照每个基本单元对应的评价结果在地图上进行分级显示,分别生成众源地理信息线状要素数据完整性指标和位置精度指标的评价结果专题图。
本发明提供的上述众源地理信息线状要素的综合质量评价方法,用于深入挖掘众源地理信息线状要素的质量问题。
本发明与现有技术相比具有以下主要的技术效果:
(1)在开展数据数据完整性评价时,采用传统的长度对比方法,无法区分众源地理信息中数据溢出和数据缺失这两类错误,尤其是当溢出数据与缺失数据的长度相近时,长度对比方法将错误判断出数据完整性高。本发明所提出的基于分形维数的完整性评价方法,利用分形几何中的盒维数以非整数维形式描述充填空间形态特征的优势,能够对线状要素的空间占有状态,即空间分布格局进行细致刻画,从而考察数据完整性。因此,通过对比众源地理信息与权威参考数据的盒维数,可以将两类数据的细微误差反应到最终的完整性评价结果中,相较传统的长度对比法,该指标对数据完整性的评价更加准确和灵敏,面对复杂线性结构的适应性更强。
(2)在开展位置精度评价时,经典的单缓冲区法可以满足大部分直线型道路的位置精度评价需求,但是该方法只考虑一定缓冲区范围内的要素是否被缓冲区全部覆盖,而忽略了弯道、转盘、立交接口等非直线型线状要素几何形状的精准程度,导致位置精度评价结果不够准确。本发明中设计的双缓冲区法,在保持众源地理信息和权威参考要素的相对位置不变情况下,又将线要素转化为面要素,放大曲折线要素的细微几何特征。通过计算众源地理信息与权威参考数据缓冲区的重叠比率,既体现了要素之间的距离,也量化了其形状上的差异,比单缓冲区法更加全面和科学,更适用于考察众源地理信息中弯曲道路过于粗糙的情况。
(3)将研究区域划分格网进行数据质量评价,通常会对1000个以上的评价单元进行指标计算,包含线状要素的数据格式转换、分形维数计算、缓冲区创建、缓冲区交集与并集面积计算等一系列操作步骤。如果完全采用ArcMap软件或其他地理信息专业软件进行数据操作,整个流程复杂、步骤繁琐且工作量庞大。本发明中利用编写的Python和MatLab程序,规范了数据处理与计算的全过程,实现了评价指标的批量运算,满足了自动、高效的大范围线状要素质量检测工作要求。
附图说明
图1是本发明的方法流程图。
图2是众源地理信息路网分布图。
图3是双缓冲区法原理示意图,其中:图(a)是众源地理信息与权威参考数据的原始路网图,图(b)是众源路网与权威路网的双缓冲区图,图(c)是缓冲区的交集与并集叠加示意图。
图4是数据完整性指标和位置精度指标的评价结果专题图,其中:图(a)是完整性评价结果图,图(b)是位置精度评价结果图。
具体实施方式
下面结合应用实施例及附图对本发明作进一步说明,但并不局限于下面所述内容。
本发明提供的众源地理信息线状要素的综合质量评价方法,具体是:首先对众源地理信息和权威参考线状要素进行数据预处理,生成质量评价的基本单元;然后,在每个评价基本单元内,计算众源地理信息和权威参考线状要素的分形维数之差,作为完整性评价指标;接着,在每个评价基本单元内,创建众源地理信息和权威参考线状要素的双缓冲区,计算二者的重叠比率,作为位置精度评价指标;最后将上述完整性指标和位置精度指标进行数据标准化处理,并将最终评价结果在地图中分级显示。
上述众源地理信息线状要素的综合质量评价方法包括以下步骤:
1.生成评价基本单元:
将众源地理信息线状要素与权威参考线状要素进行坐标转换、范围裁剪和格网划分,设置格网尺寸为100-2000米,保证研究区的格网数量不少于300个,作为质量评价的基本单元。
2.建立完整性评价指标:
根据设置好的格网尺寸,将众源地理信息线状要素与权威参考线状要素进行数据分割,在每个评价基本单元内,采用分形几何中的盒维数方法,分别评估众源地理信息线状要素与权威参考线状要素的空间占有能力,再计算二者盒维数的差值,作为数据的完整性评价指标。
步骤2中,批量计算所有评价基本单元内众源地理信息线状要素与权威参考线状要素的盒维数,其步骤包括:
(1)编写Python语言程序,调用arcpy.FeatureToRaster_conversion函数,将按照格网分割后shp格式的矢量线状要素,批量转化为tif格式的栅格图像,生成的正方形图像中线状要素为黑色,背景为白色,分辨率为100dpi;
(2)在Matlab软件中,利用imread函数读取tif格式的线状要素图像文件,利用im2bw函数进行图像二值化处理,其中黑色像素(线状要素)值设为1,白色(背景)像素值设为0;
(3)编写Matlab程序,调用Fraclab工具包中的DimensionCalculation方法,设置盒维数的盒子尺寸S=[1/2,1/4,1/8,1/16,1/32,1/64,1/128,1/256,1/512,1/1024,1/2048,1/4096],即使用10个不同尺寸的正方形网格去覆盖被测线状要素,将一系列不同格网边长S与对应的非空格网数N(S)进行双对数线性拟合,所得直线斜率即为盒维数;
步骤2中:建立的完整性评价指标,是计算众源地理信息与权威参考线状要素的盒维数差异值,公式如下:
CVGI=|DVGI-DREF| (1)
式中,CVGI为数据完整性指标,DVGI是众源地理信息线状要素的盒维数,DREF是权威参考线状要素的盒维数。CVGI越小,代表二者分形维数越接近,则其空间分布程度越相似,说明数据完整性越高;反之,二者分形维数差值越大,则其空间分布程度差异越大,说明数据完整性越低。
3.建立位置精度评价指标:
在每个评价基本单元内,创建众源地理信息和权威参考线状要素的双缓冲区,得到缓冲区交集和并集的面积,计算其重叠比率,作为位置精度评价指标。
步骤3中:计算双缓冲区交集与并集的面积,其步骤包括:
(1)编写Python语言程序,调用Buffer_analysis函数,分别创建众源地理信息线状要素与权威参考线状要素的缓冲区,半径设置为5米,末端形状设置为圆形;
(2)编写Python语言程序,调用arcpy.Split_analysis函数,按照权利要求2中设置的格网尺寸,将上一步生成的缓冲区进行数据分割;
(3)编写Python语言程序,调用arcpy.Intersect_analysis函数,利用循环语句,批量生成所有基本单元内,众源地理信息线状要素与权威参考线状要素的缓冲区交集。同理,调用arcpy.Union_analysis函数,批量生产二者缓冲区并集。最后,调用arcpy.CalculateField_management函数,将交集与并集的面积分别保存在新创建的InterArea和UnionArea字段下。
步骤3中,建立的位置精度评价指标,计算公式为:
AVGI=1-S(VGI∩REF)/S(VGI∪REF) (2)
式中,AVGI为位置精度,VGI代表众源地理信息线状要素的缓冲区,REF代表权威参考线状要素缓冲区,S(VGI∩REF)是众源地理信息线状要素与权威参考线状要素缓冲区的交集面积,S(VGI∪REF)是二者的并集面积。AVGI值越大,说明众源地理信息线状要素与权威参考线状要素的缓冲区重叠比越小,则位置精度越低;反之,精度越高。当众源地理信息线状要素与权威参考线状要素的缓冲区完全重合时,AVGI=0,此时位置精度最高。
4.评价结果标准化与可视化:
分别将步骤2和步骤3中的得到的数据完整性指标和位置精度指标采用归一化公式进行标准化处理,数据范围保持在[0,1],得到最终的数据完整性和位置精度的评价结果。然后,将结果关联到步骤1中用生成的格网的属性表中,采用“分位数”分类方法,将评价结果分为4类,并分级显示每个格网的质量评价结果,生成数据完整性指标和位置精度指标的评价结果专题图。
经过上述步骤,得到所述众源地理信息线状要素的综合质量评价结果。
本发明提供的上述众源地理信息线状要素的综合质量评价方法,能够从数据完整性和位置精度两方面,有效弥补了传统数据质量评价方法在刻画线状要素的空间结构局部特征和检测几何形态细微差异的不足,指标更加灵敏,对众源地理信息中复杂线状要素的适应性更强,能够全面和精准的反映出数据质量问题。
应用案例:
本案例选择了2018年7月获取的美国阿勒格尼县OpenStreetMap(OSM)道路数据作为众源地理信息线状要素,进行质量评价,并结合附图对本发明作进一步的说明。该区域测试道路数据约1560千米。用于对比的权威参考数据采用Western Pennsylvania区域数据中心提供的路网数据。
具体处理步骤(图1)如下:
步骤1,将众源地理信息线状要素(OSM路网)与权威参考线状要素进行坐标投影转换、范围裁剪和格网划分,生成质量评价的基本单元(图2),具体包括:
(1)将OSM路网、权威参考路网和阿勒格尼县的边界数据(shp格式)依次导入ArcMap软件,使用Arc Toolbox中的Project工具,选择输入图层为OSM路网,输出图层的坐标投影与权威参考路网的坐标投影一致,即:
NAD_1983_StatePlane_Pennsylvania_South_FIPS_3702_Feet,生成新的OSM路网图层。
(2)使用Arc Toolbox中的Clip工具,选择输入图层为OSM路网,裁剪范围为阿勒格尼县的边界,生成县界范围内的OSM路网。同理,裁剪权威参考路网,使OSM路网与权威参考路网数据范围保持一致。
(3)使用Arc Toolbox中的Create Fishnet工具,设置格网范围为阿勒格尼县的边界,cell size设为1km,除去无数据单元后,生成格网共计1849个,作为众源地理信息质量评价的基本单元。该单元满足尺寸在100米-2000米,区域内生成不少于300个格网单元的实验要求。
步骤2,在每个评价基本单元内,分别计算众源地理信息线状要素和权威参考线状要素的盒维数,建立基于分形维数的线状要素完整性评价方法,即将二者之差作为众源地理信息线状要素的完整性评价指标,公式如下:
CVGI=|DVGI-DREF| (1)
式中,CVGI为完整性指标,DVGI是众源地理信息线状要素的盒维数,DREF是权威参考线状要素的盒维数。CVGI越小,代表二者分形维数越接近,则其空间分布程度越相似,说明数据完整性越高;反之,二者分形维数差值越大,则其空间分布程度差异越大,说明数据完整性越低。具体包括:
(1)运用python编程语言,调用arcpy中Split工具,按照步骤1中生成的格网,将OSM路网与权威参考路网数据分别进行分割,生成1km*1km正方形大小的OSM路网和权威参考路网,具体代码如下:
import arcpy
from arcpy import env
env.workspace="D:/OSMProject/allen/processeddata"
arcpy.Split_analysis("osmClip.shp","AllenFishDel.shp","idText","D:/OSMProject/allen/processeddata/osmClipSplit")
arcpy.Split_analysis("refClip.shp","AllenFishDel.shp","idText","D:/OSMProject/allen/processeddata/refClipSplit")
(2)将分割好的OSM路网和权威参考路网矢量数据,转化为tif格式的图形数据,由于计算量大,OSM和权威参考数据的批量转化在独立的python程序中进行,批量转化后生成的tif文件分别保存在osmRaster文件夹和refRaster文件夹中,Python代码如下:
Figure BDA0002711580860000111
Figure BDA0002711580860000121
(3)在Matlab软件中,主要利用fraclab工具包中的DimensionCalculation方法,批量计算全部块OSM路网与权威参考路网的盒维数,代码如下:
Figure BDA0002711580860000122
Figure BDA0002711580860000131
Figure BDA0002711580860000141
(4)分别将所有OSM路网与权威参考路网基本单元的盒维数计算结果复制到同一个excel表的两列,相减并取绝对值,即得到数据的完整性评价结果。
步骤3,在每个基本单元内,分别创建OSM路网与权威参考路网的缓冲区,建立基于双缓冲区的位置精度评价方法,即将二者缓冲区的重叠比率作为众源地理信息线状要素的位置精度评价指标(图3),具体包括:
(1)分别生成OSM路网与权威线状路网半径为“5m”的缓冲区面状要素,Python代码如下:
#Generate buffer
import arcpy
from arcpy import env
env.workspace="D:/OSMProject/allen/processeddata"
arcpy.Buffer_analysis("refClip.shp","ref_buf","5Meter","FULL","ROUND","ALL")
arcpy.Merge_management("ref_buf.shp","ref_buf_Mg")
arcpy.Clip_analysis("osmClip.shp","ref_buf_Mg.shp","osmClip_ref_clip.shp")
arcpy.Buffer_analysis("osmClip_ref_clip.shp","osm_buf","5Meter","FULL","ROUND","ALL")
arcpy.Merge_management("osm_buf.shp","osm_buf_Mg")
(2)将上一步生成的OSM路网和权威参考路网的缓冲区按照格网分割为1849块,Python代码如下:
#Split buffer by grid
import arcpy
from arcpy import env
env.workspace="D:/OSMProject/allen/processeddata"
arcpy.Split_analysis("ref_buf_Mg.shp","AllenFishDel.shp","idText",
"D:/OSMProject/allen/processeddata/ref_buf_split")
arcpy.Split_analysis("osm_buf_Mg.shp","AllenFishDel.shp","idText",
"D:/OSMProject/allen/processeddata/osm_buf_split")
(3)批量计算每个格网内OSM路网和权威参考路网的交集和并集的面积,Python代码如下:
Figure BDA0002711580860000151
Figure BDA0002711580860000161
(4)将全部格网单元的缓冲区交集和并集汇总到Excel表格中,并利用如下公式计算众源线状要素的位置精度AVGI
AVGI=1-S(VGI∩REF)/S(VGI∪REF) (2)
式中,S(VGI∩REF)是众源地理信息线状要素与权威参考线状要素缓冲区的交集面积,S(VGI∪REF)是二者的并集面积。AVGI值越大,说明众源地理信息线状要素与权威参考线状要素的缓冲区重叠比越小,则位置精度越低;反之,精度越高。当众源地理信息线状要素与权威参考线状要素的缓冲区完全重合时,AVGI=0,此时位置精度最高。
步骤4,分别将步骤2和步骤3中的得到的数据完整性指标和位置精度指标采用归一化公式进行标准化处理,数据范围保持在[0,1],得到最终的OSM完整性和位置精度的评价结果。然后,将结果关联到步骤1中用生成的格网的属性表中,采用“分位数”分类方法,将评价结果分为4类,并分级显示每个格网的质量评价结果(颜色越深的格网数据质量越差),生成数据完整性指标和位置精度指标的评价结果专题图(见图4)。
本发明提供的众源地理信息线状要素的综合质量评价方法,具有以下特点:
(1)不仅弥补了传统的线状要素质量评价方法在刻画空间结构局部特征上的不足,而且考察了线性要素几何形态的细微差异,更好的适应于众源地理信息中复杂线状结构,实现对数据全面、精确的质量评价。
(2)针对众源地理信息数据量大、更新速度快的特点,设计了Python程序和Matlab程序,完成数据完整性评价指标和位置精度评价指标批量化、标准化的计算工作,以满足自动、高效的大范围线状要素质量检测工作要求。

Claims (6)

1.一种众源地理信息线状要素的综合质量评价方法,其特征是:首先对众源地理信息和权威参考线状要素进行数据预处理,生成质量评价的基本单元;然后,在每个质量评价基本单元内,计算众源地理信息和权威参考线状要素的分形维数之差,作为完整性评价指标;接着,在每个评价基本单元内,创建众源地理信息和权威参考线状要素的双缓冲区,计算二者的重叠比率,作为位置精度评价指标;最后将上述完整性指标和位置精度指标进行数据标准化处理,并将最终评价结果在地图中分级显示;
采用以下方法建立完整性评价指标:根据设置好的格网尺寸,分割众源地理信息线状要素与权威参考线状要素,在每个质量评价基本单元内,采用分形几何中的盒维数方法,分别评估众源地理信息线状要素与权威参考线状要素的空间占有能力,再计算二者盒维数的差值,作为数据的完整性评价指标;
批量计算所有质量评价基本单元内众源地理信息线状要素与权威参考线状要素的盒维数,其步骤包括:
(1)编写Python语言程序,调用arcpy.Split_analysis函数,设置的格网尺寸100-2000米,分别将众源地理信息线状要素与权威参考线状要素的矢量数据按照权利进行数据分割,
(2)编写Python语言程序,调用arcpy.FeatureToRaster_conversion函数,将按照格网分割后shp格式的矢量线状要素,批量转化为tif格式的栅格图像,生成的图像中线状要素为黑色,背景为白色,分辨率为100dpi,
(3)在Matlab软件中,读取tif格式的线状要素数据,进行图像二值化处理,其中黑色像素值设为1,白色像素值设为0,
(4)编写Matlab程序,调用Fraclab工具包中的DimensionCalculation方法,设置盒子尺寸S=[1/2,1/4,1/8,1/16,1/32,1/64,1/128,1/256,1/512,1/1024,1/2048,1/4096],即使用10个不同尺寸的正方形网格去覆盖被测线状要素,将一系列不同格网边长S与其对应的非空格网数N进行双对数线性拟合,所得直线斜率即为盒维数;
采用以下方法建立位置精度评价指标:在每个质量评价基本单元内,创建众源地理信息和权威参考线状要素的双缓冲区,得到缓冲区交集和并集的面积,计算其重叠比率,作为位置精度评价指标;
计算双缓冲区交集与并集的面积,其步骤包括:
(1)编写Python语言程序,调用Buffer_analysis函数,分别创建众源地理信息线状要素与权威参考线状要素的缓冲区,半径设置为5米,末端形状设置为圆形,
(2)编写Python语言程序,调用arcpy.Split_analysis函数,设置的格网尺寸100-2000米,将上一步生成的缓冲区进行数据分割,
(3)编写Python语言程序,调用arcpy.Intersect_analysis和arcpy.Union_analysis函数,批量生成所有基本单元内众源地理信息线状要素与权威参考线状要素的缓冲区的缓冲区交集与并集,然后调用arcpy.CalculateField_management函数计算交集与并集的面积。
2.根据权利要求1所述的众源地理信息线状要素的综合质量评价方法,其特征在于,采用以下方法生成质量评价基本单元:将众源地理信息线状要素与权威参考线状要素进行坐标转换、范围裁剪和格网划分,设置格网尺寸为100-2000米,保证研究区的格网数量不少于300个,作为质量评价的基本单元。
3.如权利要求1所述的众源地理信息线状要素的综合质量评价方法,其特征在于,建立的完整性评价指标,是计算众源地理信息与权威参考线状要素的盒维数差异值,公式如下:
CVGI=|DVGI-DREF|
式中,CVGI为数据完整性指标,DVGI是众源地理信息线状要素的盒维数,DREF是权威参考线状要素的盒维数。
4.根据权利要求1所述的众源地理信息线状要素的综合质量评价方法,其特征在于,建立的位置精度评价指标,计算公式为:
AVGI=1-S(VGI∩REF)/S(VGI∪REF)
式中,AVGI为位置精度,S(VGI∩REF)是众源地理信息线状要素与权威参考线状要素缓冲区的交集面积,S(VGI∪REF)是二者的并集面积。
5.根据权利要求1所述的众源地理信息线状要素的综合质量评价方法,其特征在于,采用以下方法评价结果标准化与可视化:将完整性指标和位置精度指标进行数据标准化处理指标值∈[0,1],然后按照每个基本单元对应的评价结果在地图上进行分级显示,分别生成众源地理信息线状要素数据完整性指标和位置精度指标的评价结果专题图。
6.权利要求1至5中任一所述的方法,其特征在于,用于深入挖掘众源地理信息线状要素的质量问题。
CN202011058713.5A 2020-09-30 2020-09-30 一种众源地理信息线状要素的综合质量评价方法 Active CN112307079B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011058713.5A CN112307079B (zh) 2020-09-30 2020-09-30 一种众源地理信息线状要素的综合质量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011058713.5A CN112307079B (zh) 2020-09-30 2020-09-30 一种众源地理信息线状要素的综合质量评价方法

Publications (2)

Publication Number Publication Date
CN112307079A CN112307079A (zh) 2021-02-02
CN112307079B true CN112307079B (zh) 2022-05-27

Family

ID=74489546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011058713.5A Active CN112307079B (zh) 2020-09-30 2020-09-30 一种众源地理信息线状要素的综合质量评价方法

Country Status (1)

Country Link
CN (1) CN112307079B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880754A (zh) * 2012-09-21 2013-01-16 武汉理工大学 基于遗传算法的土地利用分形维数作用尺度的识别方法
CN103220241A (zh) * 2013-03-29 2013-07-24 南京信息职业技术学院 一种低信噪比条件下信号盒维数特征提取方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8464304B2 (en) * 2011-01-25 2013-06-11 Youtoo Technologies, LLC Content creation and distribution system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880754A (zh) * 2012-09-21 2013-01-16 武汉理工大学 基于遗传算法的土地利用分形维数作用尺度的识别方法
CN103220241A (zh) * 2013-03-29 2013-07-24 南京信息职业技术学院 一种低信噪比条件下信号盒维数特征提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Pattern-mining approach for conflating crowdsourcing road networks with POIs;Bisheng Yang等;《International Journal of Geographical Information Science》;20151231;全文 *
众源地理数据质量评价系统设计与实现;李小雨等;《地理空间信息》;20200328;全文 *

Also Published As

Publication number Publication date
CN112307079A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN106529410B (zh) 一种基于监控视频的灰霾扩散路径绘制与来源确定方法
Podobnikar Methods for visual quality assessment of a digital terrain model
CN109949326B (zh) 基于背包式三维激光点云数据的建筑物轮廓线提取方法
CN101957309B (zh) 一种能见度的全天候视频测量方法
CN106524920A (zh) 基于三维激光扫描实测实量在建筑工程中的应用
CN105045950A (zh) 一种基于三维激光扫描的桥梁安全评估系统
CN105550428A (zh) 一种基于tls技术的桥梁安全评估方法
Sreelekha et al. Assessment of topological pattern of urban road transport system of Calicut city
CN111797188B (zh) 一种基于开源地理空间矢量数据的城市功能区定量识别方法
CN105930865B (zh) 城市建设用地分类提取及评估方法
CN110489896A (zh) 一种基于多源数据融合技术的临建工程选址及设计方法
CN105737971A (zh) 一种城市噪声3d数字地图制作方法
Khayyal et al. Creation and spatial analysis of 3D city modeling based on GIS data
Wysocki et al. Refinement of semantic 3D building models by reconstructing underpasses from MLS point clouds
Wong et al. Using geometry-based metrics as part of fitness-for-purpose evaluations of 3D city models
CN112307079B (zh) 一种众源地理信息线状要素的综合质量评价方法
CN112287425A (zh) 一种市政工程测量定位方法及系统
CN114088015A (zh) 一种岩体三维裂隙网络模型快速智能生成和剖切方法
Eslamirad et al. Geoprocess of geospatial urban data in Tallinn, Estonia
CN114119355A (zh) 一种盾构隧道掉块风险预警方法与系统
CN111858808B (zh) 基于海量实测点的地形图特征地物精度自动评价方法
CN114626750A (zh) 基于多要素分析的生态保护重要性评估方法及其集成系统
Muñumer Herrero et al. Testing the Impact of 2D Generalisation on 3D Models–Exploring Analysis Options With an Off-the-shelf Software Package
Olsson et al. Identifying areas of a map that are difficult to read
Habib Fit-for-purpose conformal mapping for sustainable land administration in war-ravaged Syria

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant