CN112396128A - 一种铁路外部环境风险源样本自动标注方法 - Google Patents

一种铁路外部环境风险源样本自动标注方法 Download PDF

Info

Publication number
CN112396128A
CN112396128A CN202011425702.6A CN202011425702A CN112396128A CN 112396128 A CN112396128 A CN 112396128A CN 202011425702 A CN202011425702 A CN 202011425702A CN 112396128 A CN112396128 A CN 112396128A
Authority
CN
China
Prior art keywords
sample
data
image
vector
tile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011425702.6A
Other languages
English (en)
Other versions
CN112396128B (zh
Inventor
王大刚
孙新宇
甘俊
张冠军
赵振洋
周文明
李平苍
赵梦杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Railway Design Corp
China State Railway Group Co Ltd
Original Assignee
China Railway Design Corp
China State Railway Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Railway Design Corp, China State Railway Group Co Ltd filed Critical China Railway Design Corp
Priority to CN202011425702.6A priority Critical patent/CN112396128B/zh
Publication of CN112396128A publication Critical patent/CN112396128A/zh
Application granted granted Critical
Publication of CN112396128B publication Critical patent/CN112396128B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/56Information retrieval; Database structures therefor; File system structures therefor of still image data having vectorial format
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/587Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/40Image enhancement or restoration using histogram techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/181Segmentation; Edge detection involving edge growing; involving edge linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30248Vehicle exterior or interior
    • G06T2207/30252Vehicle exterior; Vicinity of vehicle
    • G06T2207/30261Obstacle

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种铁路外部环境风险源样本自动标注方法,包括:1.区域范围内DOM数据和DLG采集成果数据整理及质量检查;2.关注风险源目标要素信息提取与筛选;3.矢量多边形要素拓扑错误检查和修复;4.数字正射影像匀色处理;5.数字正射影像规则瓦片格网计算与样本数据裁剪输出;6.样本标注范围空间分析运算;7.正样本矢量多边形空间位置修正;8.标注成果生成及中间成果生成;9.标注数据检查局部修复;10.样本库数据整理与统一输出。本发明实现了大幅面数字正射影像数据批量快速生成深度学习样本库,有效提高了样本标注效率,能根据样本数据自动修正矢量采集和影像表征地物边界存在的偏移,提高了样本标注精度。

Description

一种铁路外部环境风险源样本自动标注方法
技术领域
本发明涉及铁路运营管理的路外环境整治领域,特别是涉及一种利用高分辨率遥感航测数据及矢量采集成果数据自动开展铁路沿线外部环境风险源样本标注的方法。
背景技术
我国铁路运营里程在2020年7月底达到14万公里,其中高铁里程超过3.6万公里,铁路周边大量的人类活动对铁路安全运营产生大量的安全威胁。以彩钢房为主的违法建筑多次导致铁路行车安全事故发生,铁路外部环境的复杂性给铁路安全运营整治工作带来较大压力和挑战。采用人工现场排查的作业模式存在巡检效率低、巡视范围受限、易受地形交通因素影响等弊端,国内外已经开展利用高分卫星遥感技术开展铁路周边风险源建档和变化检测工作,其技术方案切实可行并且具备一定的技术优势,可借助空间遥感和地理信息技术实现铁路周边环境问题的排查、建档和辅助整治工作。
国铁集团发布的《关于建立高速铁路沿线环境综合整治长效机制的意见》、《国铁集团安全生产专项整治三年行动计划》等文件中明确了铁路外部环境整治的作业范围、关注对象和整治方法。其中最为典型的硬漂浮物、轻漂浮物、违法堆放及违法施工均可采用遥感技术手段开展有效识别和排查,大多数风险源隐患目标数据均可通过遥感技术手段开展大范围检测和识别工作。其中危险品类、抽取地下水类从遥感影像中无法解译,需要调查取证,树木种植类需要根据高度、线位距离评估铁路侵线风险判别,故不列入遥感技术识别和风险源样本库建设范围内。
依靠人工解译和圈绘的作业方法自动化程度低,借助深度学习技术,可以有效识别铁路沿线指定范围内的违法建筑、彩钢房、违法施工等关注目标,但深度学习模型的识别精度依赖于训练样本的质量和规模,样本库的建设至关重要,当前国内外缺乏铁路风险源专用样本库,传统的通用建筑样本库在铁路风险源识别工作中不具有代表性,不能满足用于深度学习模型分析和参数调优的要求。
常规样本标注方法采用样本标注软件进行手动标注,在遥感影像处理中通常采用先裁剪再逐一手动标注的策略,作业耗时费力,自动化程度低,并且多类别风险源样本库的建立过程操作重复,效率较低。
发明内容
针对现有手动标注方法建立样本库的不足,本发明提供一种能大范围批量处理且自动化程度和样本标注效率较高的铁路外部环境风险源样本自动标注方法。
为此,本发明的技术方案如下:
一种铁路外部环境风险源样本自动标注方法,包括以下步骤:
S1、对区域范围内原始DOM数据和DLG采集成果数据整理及质量检查:检查覆盖区域内DOM数据和DLG数据的质量和二者坐标参考系统和空间范围的一致性以及点位坐标误差,对获取质量较差的影像予以剔除,对坐标偏移过大的矢量成果进行采集修复处理;
S2、风险源目标要素信息提取与筛选:按照铁路外部环境风险源目标样本标注的类别和规范要求,从步骤S1得到的数据中提取所要标注类别的样本要素,通过图层筛选、要素编码筛选、矢量空间特征筛选方法剔除无关采集要素类及点、线状地物目标,将提取后的矢量成果转换为shpfile数据格式;
S3、矢量多边形要素拓扑错误检查和修复:对步骤S2得到的矢量数据成果进行拓扑错误检查和修复;
S4、数字正射影像匀色处理:对步骤S1中数字正射影像进行色彩归一化处理,完成彩色RGB影像灰度直方图的正态分布映射,消除影像曝光不足或者过度曝光的情况,使得映射效果更接近于模板影像;
S5、数字正射影像规则瓦片格网计算与样本数据裁剪输出:对S4处理后的数字正射影像进行自动样本生成处理,由区域数字正射影像空间范围计算规则索引格网,裁剪生成散列瓦片样本,具体计算方法如下:
S5-1、由区域数字正射影像像素尺寸和标注样本规格计算瓦片影像数量,向上取整,行列均按照0,1,2…依次编号,建立每一幅瓦片样本数据的索引;
S5-2、由瓦片数据规格和行列索引号,计算每个瓦片样本像素坐标行列号,建立瓦片数据索引表;
S5-3、判断每个瓦片数据背景值区域面积,对背景区域超过50%瓦片数据、未采集矢量的瓦片数据进行丢弃;
S5-4、由数字正射影像的空间地理坐标参数和瓦片样本数据的左上角像素号索引,推算每个瓦片影像数据的地理坐标参数文件;
S5-5、从原始数字正射影像中按照计算的瓦片索引逐块区域影像数据子集,按照512×512标准尺寸提取影像中RGB三波段数据,转换为8位彩色样本数据作为样本,按照PNG格式存储,按照影像编号、类别和行列号三级进行标准化命名存储,同时生成一一对应的带有空间地理坐标信息的单波段二值样本标注成果数据,像素值全为0;
S6、样本标注范围空间分析运算:
根据S5-5中计算得到的二值样本标注成果数据计算其空间坐标四至范围,将S3得到的空间矢量多边形和区域内DLG整体进行空间求交分析运算得到每一幅样本数据对应的正样本初步空间范围;
S7、正样本矢量多边形空间位置修正:在利用非真正射影像数据进行样本生成的情况下,在S6得到单幅正样本矢量范围的基础上进行样本位置的修正,修正的方法为:
S7-1、通过MeanShift分割算法进行样本影像分割,设置空间带宽和颜色带宽参数,得到分割后的同质区域对象,在此基础上进行细碎图斑的合并。
S7-2、通过S6得到的风险源样本矢量多边形范围线和分割后的图斑矢量边界分析,求解待标注范围内的分割图斑,然后将范围内矢量图斑合并为一个多边形要素面元,查找并计算该多边形面元外轮廓线,提取地物目标的像素边界;然后采用Douglas-Peucker算法进行精化,在设置阈值后剔除冗余节点,重复迭代至收敛为止,保留关键节点。
S7-3、分别求解同一风险源目标立体采集的矢量多边形和MeanShift分割得到的多边形的重心点,计算重心点偏移向量,修正立体采集的矢量多边形,作为最终多边形矢量范围。
当矢量多边形与影像存在偏移时,亦可采用手动纠偏的方式进行。
如S1中采用的数字正射影像为真正射影像(TDOM)数据,则不用执行该步修正操作。
S8、标注成果生成及中间成果生成:对瓦片数据的空间范围内经步骤S7算法修正后的多边形边界,执行矢量栅格化操作,以S5-5生成的带有空间地理坐标的空样本标注数据为底图,将正样本多边形矢量转换为白色面元栅格阵列,未采集数据区域为负样本数据区域,存储每个正样本区域多边形边界的节点像素坐标,转换为Xml文件存储,用于后续检查中快速局部修正;
S9、标注数据检查与局部修复:对于自动生成的样本数据,在前期预判的基础上,根据标注的中间成果开展快速的标注质量检查和二次编辑工作;
S10、样本库数据整理与统一输出:按照目标要素类别、影像数据或传感器类型对标注成果进行整理和输出。
其中,步骤S1中,所采用的DOM影像数据和DLG矢量数据,应为同期观测及处理成果,即DLG矢量数据应是以一同处理的DOM影像数据作为地图采集的风险源建档数据或地形图数据。
步骤S3中,通过空间分析手段查找和修复空间矢量多边形中的自相交错误、重叠错误及多段线不闭合错误。
步骤S5中,通过原始数字正射影像数据特征自动计算瓦片数据行列号索引和空间地理坐标索引,获得整体区域内互不重叠、完整覆盖的规则样本数据集,样本命名方式应统一为:影像编号+类别+Tile行号+Tile列号,实现样本数据的批量自动输出。
步骤S6中,通过整个矢量采集成果DLG和S5中生成的带有地理坐标的空样本标注成果影像,批量执行空间分析运算,进而获得单幅样本数据范围内样本矢量标注范围。
步骤S7中,通过MeanShift分割方法得到影像同质区域图斑,再根据图斑的空间位置和光谱特征相似性进行合并,进而求解目标地物表征边界,通过对比精化后的表征边界和采集边界多边形求解偏移向量,进而修正正样本标注区域边界。
步骤S8中,通过执行矢量栅格化运算,对正样本区域栅格化后映射为白色区域(255像素值),对负样本数据区域位置不变,实现样本标注成果的批量自动输出。
本发明的样本库自动标注方法与传统手动标注方法相比具有以下有益效果:
(1)本方法通过高分辨率数字正射影像和同区域内航飞建档成果(或数字线划图成果),借助空间分析、瓦片数据生成和矢量栅格化的技术手段,可完成区域范围内多类别风险源目标标准规格样本标注数据的批量处理和生成,相比手动标注的样本标注模式,可大幅度提升自动化程度,平均提升样本标注效率可达60%以上,减少了人工作业负担,降低了样本标注的人工作业成本和干预程度,实现了对数据成果的充分利用。
(2)本发明设计和提出了一种基于影像分割正样本数据偏移分析方法,在非真正射影像数据中,有效减少和消除了建筑高度引起的像点位移的影响,提高了自动标注精度。
(3)本发明在基于自动生成的样本库数据的基础上结合人机交互手段,实现了对批量生成的样本数据进行人工快速检查和修正。
附图说明
图1为本发明的铁路外部环境风险源样本自动标注方法的实施流程图;
图2为本发明中原始矢量成果及栅格成果叠加的效果图;
图3为本发明中数字正射影像计算样本数据瓦片格网范围示意图;
图4为本发明中计算单幅样本数据的正样本边界矢量范围;
图5为本发明中基于MeanShift图割的地物目标边界提取及边界精化图;
图6为修正前后的样本标注边界对比图;
图7为批量构建样本库及标注成果数据;
图8为生成的样本及样本标注成果局部细节图。
具体实施方式
本发明的铁路外部环境风险源样本自动标注方法支持多源光学遥感影像、航飞影像和无人机影像数据,输入数据为区域正射影像数据集和区域内地物要素矢量采集成果,输出成果为规则且标准的深度学习样本库数据集和标注数据成果集(均为栅格格式),以及自动标注成果中间过程数据(Xml格式),其整体实施流程如图1所示。为满足铁路外部环境风险源的检测需求,本方法所采用的影像数据分辨率一般不应低于1米,最好利用铁路沿线首次建档成果,也可利用铁路勘察设计阶段、施工阶段比例尺不小于1:2000的数字线划地形图,其DLG成果应当为以一同输入的影像数据集作为底图采集的矢量成果数据,以保证数据成果的现势性和匹配程度。在区域内无矢量采集成果的情况下,可先通过在GIS、AutoCAD数据处理软件中进行区域范围内整体矢量采集,再进行后续处理。其具体步骤如下:
S1、区域范围内DOM数据和DLG采集成果数据整理及质量检查:
检查覆盖区域内原始数字正射影像(DOM)数据和风险源建档矢量成果(DLG)数据(或同区域内采集的数字线划图数据)的质量,包括影像清晰度、色调,矢量数据采集完整性和合理性,以及二者坐标参考系统和空间范围的一致性及点位坐标误差检查。如图2所示,矢量采集成果在叠合影像数据后应当具有良好的吻合程度,矢量边界特征点与DOM对应位置不应大于5个像素,对获取质量较差的影像予以剔除,对坐标偏移较大的矢量采集成果进行采集修复处理。
S2、风险源目标要素信息提取与筛选:
对经S1检查后的矢量数据进行目标要素提取和筛选,航飞首次建档数据成果一般为ESRI shpfile格式(shp)数据或者AutoCAD格式(DWG/DXG)数据,数字线划图一般为AutoCAD格式数据。需要按照样本库建设需求,从矢量采集要素中提取所要标注类别的样本的要素,通过图层筛选、要素编码筛选、矢量空间特征筛选方法剔除采集的点状、线状要素等无关图层,清洗数据,将提取后的矢量成果转换为shpfile数据格式。具体实现方式有以下两种:
①利用ArcGIS属性选择器、AutoCAD图层管理器和特征选择工具筛选目标类别要素图层或特征集合,并进行单独导出;
②利用FME软件ETL转换工具,设置图层或要素类别筛选工具,统一转换标准格式输出。
S3、矢量多边形要素拓扑错误检查和修复:
在S2目标矢量成果提取完成后,在执行矢量数据栅格化方法样本标注成果前,需要对矢量数据成果进行拓扑错误检查和修复,主要检查项和修复项有:
检查并修复采集时应闭合而未正常闭合的矢量多边形;
检查并修复自相交空间矢量多边形;
剔除矢量多边形中的填充要素,如房屋填充线,大棚对角线等;
检查并修复存在重写的空间矢量多边形,避免样本标注二义性及多义性。
S4、数字正射影像匀色处理:
对S1中数字正射影像整体进行匀色处理,使影像色调均一、自然,保证样本数据成果的数据质量,对数字正射影像色彩归一化处理,完成彩色RGB影像灰度直方图的正态分布映射,消除影像曝光不足或者过度曝光的情况。对于存在红外波段的航飞影像或者遥感影像,应将红外波段丢弃。
S5、数字正射影像规则瓦片格网计算与样本数据裁剪输出:
为提高样本的数据标注工作的自动化程度,对S4处理后的正射影像进行自动处理,从大幅面连续范围的数字正射影像自动生成样本数据,将传统手动作业的方法改用算法设计自动实现,由此达到超大数据集的自动化处理的效果,从而提升样本库数据规模,大幅度提升样本标注效率。该步骤执行大量的数据存取操作,可采用多线程方式执行运算处理,具体步骤如下:
S5-1、如图3所示,由区域内数字正射影像像素尺寸计算瓦片样本数量,向上取整,按照行列方向依次从0开始编号,建立瓦片索引;
S5-2、由瓦片规格和瓦片数据索引计算每个瓦片的起止行列号像素坐标,建立待标注正射影像瓦片数据索引列表;
Figure BDA0002824735760000061
其中patchsize表示样本尺寸大小,Rowi和Coli表示瓦片数据的行列号。
S5-3、由瓦片数据的像素值判断瓦片数据背景区域占比,丢弃背景值超过50%及未采集矢量数据的样本数据;
S5-4、求解并计算每个瓦片影像数据的地理坐标六参数,记录左上角像素坐标信息;原始数字正射影像的地理坐标和瓦片影像数据像素坐标的推算关系如式(2)所示:
Figure BDA0002824735760000071
其中,(Xg,Yg)表示瓦片影像左上角点的地理坐标,(Xp,Yp)表示在原始数字正射影像中的像素坐标,gx,gy分别表示原始数字正射影像左上角点像素中心地理坐标。px,py分别表示X,Y方向的像素分辨率,rx,ry表示旋转系数。
S5-5、通过S5-2计算的瓦片索引信息批量进行原始数字正射影像数据子集数据块提取和写出,为满足神经网路多层卷积的运算特性,一般生成512×512标准尺寸规则风险源样本彩色影像数据,按照PNG格式存储。样本数据命名方式可统一为:影像编号+类别+Tile行号+Tile列号存储。同时根据S5-4计算的瓦片地理坐标参数生成与样本数据的同等大小和坐标位置的单波段背景影像,用于执行S8标注成果矢量栅格化。
S6、样本标注范围空间分析运算:
通过读取数字正射影像坐标参数文件,计算每一个瓦片影像的地理空间坐标范围,以此和矢量建档成果(或数字地形图成果)进行空间分析,将二者的交集作为该幅样本数据范围的正样本数据边界成果,如图4所示,从图中可以看出,将S3得到的全幅矢量数据和S5中单幅样本数据进行逐幅空间分析运算遍历,得到每一幅样本数据对应的正样本初步空间范围。
S7、正样本矢量多边形空间位置修正:
在利用非真正射影像数据进行样本生成的情况下,在S6得到单幅正样本矢量范围的基础上需要进行样本位置的修正,具体地:
S7-1、通过MeanShift算法执行样本影像分割,通过设置颜色和空间带宽两项分割参数,分割得到矢量斑块同质区域对象,其计算原理为,通过计算窗口中心点的均值漂移矢量,沿梯度上升方向进行逐步迭代至新位置,步长逐步减小,直至局部极大值点接近零。:
假设{xi|i∈1,2,3}表示三维欧式空间R3的任意n个点组成的样本点集合Sn,在样本点x处,以核函数K(x)和窗口宽h估计的核密度函数来计算邻域各个样本点对中心点特征贡献:
Figure BDA0002824735760000072
其中ck,d为满足轮廓函数k(x)积分倒数为1常系数,n为样本数量,h为带宽大小,在图像分析中为局部邻域的大小,xi为第i个样本参考点,x为核函数的中心点。
S7-2、由S6中求解得到的正样本矢量数据范围和S7-1分割后得到的矢量图斑进行矢量范围分析,得到样本范围内矢量图斑,对其进行合并后,得到分割后的风险源目标像初始外部轮廓。对合并后的矢量边界采用Douglas-Peucker算法迭代精化的方式保留关键节点数据,影像分割、边界点提取及精化结果如图5所示,图中,(a)为分割后的影像数据;(b)为分割后的影像图斑边界提取结果;(c)为风险源目标合并后的图斑提取的像素边界(2个像素宽度突出显示),其初步提取边界较为曲折;(d)图为通过Douglas-Peucker算法精化后的边界,从图中可以看出,精化后的矢量边界仅保留了关键节点信息,边界矢量更接近于真实目标边界。
S7-3、通过对比S7-2得到的矢量多边形面斑和S6裁剪得到的正样本矢量多边形范围进行重心计算,开展多边形重心偏移,作为最终矢量栅格化的范围,偏移效果如图6所示,(a)图为偏移前矢量数据,(b)图为经过修正后的矢量边界,从图中可以看出,经过偏移后的矢量和影像风险源目标的表征边界具备良好的吻合程度。由分割法求解多边形重心坐标,如式(4)所示:
Figure BDA0002824735760000081
其中(Cx[i],Cy[i]),s[i]分别是矢量多边形按照某一个顶点所划分的第i个三角形的重心坐标和面积。
当矢量多边形与影像存在偏移时,亦可采用手动纠偏的方式进行。
如S1中采用的数字正射影像为真正射影像(TDOM)数据,则不用执行该步修正操作。
S8、标注成果生成及中间成果生成:
将修正后的正样本矢量多边形按照地理坐标范围,以S5-5中生成的背景空影像数据作为底图,执行矢量栅格化,将步骤S7-3中得到的修正后正样本矢量边界按照空间坐标投影到样本标注成果影像上,形成白色的正样本栅格区域面元。在该步骤中,取代了传统手动将单幅样本数据内正样本区域多边形注逐一手动圈绘后生成样本标注成果数据的作业方法,由区域内整体的矢量数据和S5中生成的空背景影像数据逐幅进行空间分析运算,避免了大量的手动标注操作,通过空间分析的数据生成模式,充分利用了数字正射影像的地理空间坐标特性,同时也不用考虑单个风险源目标分布于多个样本数据的情况,自动完成样本标注成果的映射。为保证边界拟合精度,像素重采样方法宜采用双线性内插法或双三次卷积法,保证边界点精度。将修正后的正样本多边形数据转换为像素坐标,写入到Xml数据。
S9、标注数据检查与局部修复:
借助于自动标注成果修复工具,读取步骤S8得到的Xml数据和原始样本数据,将样本标注多边形自动展绘叠加到样本上去,并保持编辑状态,用于更改和实时更新,具体地:
①自动识别和计算当前数据集标注样本数,加载样本数据、标注多边形Xml数据和成果数据;
②单个标注样本,自动读取自动标注成果,将多边形叠加绘制到样本影像,便捷挪动角点、增加和删除节点,实时更新样本标注数据;
③快速样本组切换和更新。
S10、样本库数据整理与统一输出:
按照类别、图幅范围或传感器类型,统一整理和输出生成样本成果,批量生成的样本库成果如图7所示,其中彩色影像为标准样本数据,对应的灰度图像为样本标注成果数据,图8为样本及标注成果数据标注细节,从图中可以看出,样本数据成果和样本标注成果具有良好的匹配程度。

Claims (7)

1.一种铁路外部环境风险源样本自动标注方法,其特征在于,包括以下步骤:
S1、对区域范围内原始DOM数据和DLG采集成果数据整理及质量检查:检查覆盖区域内DOM数据和DLG数据的质量和二者坐标参考系统和空间范围的一致性以及点位坐标误差,对获取质量较差的影像予以剔除,对坐标偏移过大的矢量成果进行采集修复处理;
S2、风险源目标要素信息提取与筛选:按照铁路外部环境风险源目标样本标注的类别和规范要求,从步骤S1得到的数据中提取所要标注类别的样本要素,通过图层筛选、要素编码筛选、矢量空间特征筛选方法剔除无关采集要素类及点、线状地物目标,将提取后的矢量成果转换为shpfile数据格式;
S3、矢量多边形要素拓扑错误检查和修复:对步骤S2得到的矢量数据成果进行拓扑错误检查和修复;
S4、数字正射影像匀色处理:对步骤S1中数字正射影像进行色彩归一化处理,完成彩色RGB影像灰度直方图的正态分布映射,消除影像曝光不足或者过度曝光的情况,使得映射效果更接近于模板影像;
S5、数字正射影像规则瓦片格网计算与样本数据裁剪输出:对S4处理后的数字正射影像进行自动样本生成处理,由区域数字正射影像空间范围计算规则索引格网,裁剪生成散列瓦片样本,具体计算方法如下:
S5-1、由区域数字正射影像像素尺寸和标注样本规格计算瓦片影像数量,向上取整,行列均按照0,1,2…依次编号,建立每一幅瓦片样本数据的索引;
S5-2、由瓦片数据规格和行列索引号,计算每个瓦片样本像素坐标行列号,建立瓦片数据索引表;
S5-3、判断每个瓦片数据背景值区域面积,对背景区域超过50%瓦片数据、未采集矢量的瓦片数据进行丢弃;
S5-4、由数字正射影像的空间地理坐标参数和瓦片样本数据的左上角像素号索引,推算每个瓦片影像数据的地理坐标参数文件;
S5-5、从原始数字正射影像中按照计算的瓦片索引逐块区域影像数据子集,按照512×512标准尺寸提取影像中RGB三波段数据,转换为8位彩色样本数据作为样本,按照PNG格式存储,按照影像编号、类别和行列号三级进行标准化命名存储,同时生成一一对应的带有空间地理坐标信息的单波段二值样本标注成果数据,像素值全为0;
S6、样本标注范围空间分析运算:
根据S5-5中计算得到的二值样本标注成果数据计算其空间坐标四至范围,将S3得到的空间矢量多边形和区域内DLG整体进行空间求交分析运算得到每一幅样本数据对应的正样本初步空间范围;
S7、正样本矢量多边形空间位置修正:在利用非真正射影像数据进行样本生成的情况下,在S6得到单幅正样本矢量范围的基础上进行样本位置的修正,修正的方法为:
S7-1、通过MeanShift分割算法进行样本影像分割,设置空间带宽和颜色带宽参数,得到分割后的同质区域对象,在此基础上进行细碎图斑的合并。
S7-2、通过S6得到的风险源样本矢量多边形范围线和分割后的图斑矢量边界分析,求解待标注范围内的分割图斑,然后将范围内矢量图斑合并为一个多边形要素面元,查找并计算该多边形面元外轮廓线,提取地物目标的像素边界;然后采用Douglas-Peucker算法进行精化,在设置阈值后剔除冗余节点,重复迭代至收敛为止,保留关键节点。
S7-3、分别求解同一风险源目标立体采集的矢量多边形和MeanShift分割得到的多边形的重心点,计算重心点偏移向量,修正立体采集的矢量多边形,作为最终多边形矢量范围。
当矢量多边形与影像存在偏移时,亦可采用手动纠偏的方式进行。
如S1中采用的数字正射影像为真正射影像(TDOM)数据,则不用执行该步修正操作。
S8、标注成果生成及中间成果生成:对瓦片数据的空间范围内经步骤S7算法修正后的多边形边界,执行矢量栅格化操作,以S5-5生成的带有空间地理坐标的空样本标注数据为底图,将正样本多边形矢量转换为白色面元栅格阵列,未采集数据区域为负样本数据区域,存储每个正样本区域多边形边界的节点像素坐标,转换为Xml文件存储,用于后续检查中快速局部修正;
S9、标注数据检查与局部修复:对于自动生成的样本数据,在前期预判的基础上,根据标注的中间成果开展快速的标注质量检查和二次编辑工作;
S10、样本库数据整理与统一输出:按照目标要素类别、影像数据或传感器类型对标注成果进行整理和输出。
2.如权利要求1所述的一种铁路外部环境风险源样本自动标注方法,其特征在于:步骤S1中,所采用的DOM影像数据和DLG矢量数据,应为同期观测及处理成果,即DLG矢量数据应是以一同处理的DOM影像数据作为地图采集的风险源建档数据或地形图数据。
3.如权利要求1所述的一种铁路外部环境风险源样本自动标注方法,其特征在于:步骤S3中,通过空间分析手段查找和修复空间矢量多边形中的自相交错误、重叠错误及多段线不闭合错误。
4.如权利要求1所述的一种铁路外部环境风险源样本自动标注方法,其特征在于:步骤S5中,通过原始数字正射影像数据特征自动计算瓦片数据行列号索引和空间地理坐标索引,获得整体区域内互不重叠、完整覆盖的规则样本数据集,样本命名方式应统一为:影像编号+类别+Tile行号+Tile列号,实现样本数据的批量自动输出。
5.如权利要求1所述的一种铁路外部环境风险源样本自动标注方法,其特征在于:步骤S6中,通过整个矢量采集成果DLG和S5中生成的带有地理坐标的空样本标注成果影像,批量执行空间分析运算,进而获得单幅样本数据范围内样本矢量标注范围。
6.如权利要求1所述的一种铁路外部环境风险源样本自动标注方法,其特征在于:步骤S7中,通过MeanShift分割方法得到影像同质区域图斑,再根据图斑的空间位置和光谱特征相似性进行合并,进而求解目标地物表征边界,通过对比精化后的表征边界和采集边界多边形求解偏移向量,进而修正正样本标注区域边界。
7.如权利要求1所述的一种铁路外部环境风险源样本自动标注方法,其特征在于:步骤S8中,通过执行矢量栅格化运算,对正样本区域栅格化后映射为白色区域(255像素值),对负样本数据区域位置不变,实现样本标注成果的批量自动输出。
CN202011425702.6A 2020-12-08 2020-12-08 一种铁路外部环境风险源样本自动标注方法 Active CN112396128B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011425702.6A CN112396128B (zh) 2020-12-08 2020-12-08 一种铁路外部环境风险源样本自动标注方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011425702.6A CN112396128B (zh) 2020-12-08 2020-12-08 一种铁路外部环境风险源样本自动标注方法

Publications (2)

Publication Number Publication Date
CN112396128A true CN112396128A (zh) 2021-02-23
CN112396128B CN112396128B (zh) 2022-06-03

Family

ID=74605801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011425702.6A Active CN112396128B (zh) 2020-12-08 2020-12-08 一种铁路外部环境风险源样本自动标注方法

Country Status (1)

Country Link
CN (1) CN112396128B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033701A (zh) * 2021-04-20 2021-06-25 北部湾大学 基于gis空间数据制作遥感影像深度学习样本的优化方法
CN113220920A (zh) * 2021-06-01 2021-08-06 中国电子科技集团公司第五十四研究所 一种基于微服务架构的卫星遥感影像样本标注系统及方法
CN113673596A (zh) * 2021-08-20 2021-11-19 自然资源部国土卫星遥感应用中心 一种基于历遍源目标的遥感影像目标检测样本生成方法
CN113689380A (zh) * 2021-07-20 2021-11-23 中国铁路设计集团有限公司 基于深度学习的桁架桥梁铆钉锈蚀病害智能识别方法
CN113822900A (zh) * 2021-07-09 2021-12-21 武汉大学 基于矢量约束面向对象的新影像样本自动选择方法及系统
CN114357062A (zh) * 2021-04-22 2022-04-15 星杓(成都)信息科技有限公司 一种基于空间位置分割的矢量数据重叠或缝隙检查方法
CN116842117A (zh) * 2023-06-19 2023-10-03 重庆市规划和自然资源信息中心 一种基于geotools工具修复自相交的地理图像输出方法
CN117291503A (zh) * 2023-09-28 2023-12-26 佳康捷科技(江苏)有限公司 一种智能仓储管理方法、装置及电子设备
CN118520132A (zh) * 2024-07-25 2024-08-20 山东省交通规划设计院集团有限公司 适用于公路设计的gis数据tms瓦片生成方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942331A (zh) * 2014-04-30 2014-07-23 中南大学 一种土地利用矢量数据库增量更新处理的自动化方法
US20180060719A1 (en) * 2016-08-29 2018-03-01 International Business Machines Corporation Scale-space label fusion using two-stage deep neural net
CN107924579A (zh) * 2015-08-14 2018-04-17 麦特尔有限公司 生成个性化3d头部模型或3d身体模型的方法
CN110706211A (zh) * 2019-09-17 2020-01-17 中国矿业大学(北京) 基于卷积神经网络的铁路路基病害雷达图实时检测方法
CN111489086A (zh) * 2020-04-13 2020-08-04 中国铁路设计集团有限公司 铁路外部环境风险源建档方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942331A (zh) * 2014-04-30 2014-07-23 中南大学 一种土地利用矢量数据库增量更新处理的自动化方法
CN107924579A (zh) * 2015-08-14 2018-04-17 麦特尔有限公司 生成个性化3d头部模型或3d身体模型的方法
US20180060719A1 (en) * 2016-08-29 2018-03-01 International Business Machines Corporation Scale-space label fusion using two-stage deep neural net
CN110706211A (zh) * 2019-09-17 2020-01-17 中国矿业大学(北京) 基于卷积神经网络的铁路路基病害雷达图实时检测方法
CN111489086A (zh) * 2020-04-13 2020-08-04 中国铁路设计集团有限公司 铁路外部环境风险源建档方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
付可嘉等: ""多规合一"信息平台的空间基础数据处理", 《城市建设理论研究(电子版)》 *
李平仓: ""轻小型激光雷达在铁路勘测中的应用研究"", 《铁路勘察》 *
郑平: "海外公路项目前期技术风险分析", 《华东公路》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113033701A (zh) * 2021-04-20 2021-06-25 北部湾大学 基于gis空间数据制作遥感影像深度学习样本的优化方法
CN114357062A (zh) * 2021-04-22 2022-04-15 星杓(成都)信息科技有限公司 一种基于空间位置分割的矢量数据重叠或缝隙检查方法
CN113220920A (zh) * 2021-06-01 2021-08-06 中国电子科技集团公司第五十四研究所 一种基于微服务架构的卫星遥感影像样本标注系统及方法
CN113822900A (zh) * 2021-07-09 2021-12-21 武汉大学 基于矢量约束面向对象的新影像样本自动选择方法及系统
CN113822900B (zh) * 2021-07-09 2023-09-22 武汉大学 基于矢量约束面向对象的新影像样本自动选择方法及系统
CN113689380A (zh) * 2021-07-20 2021-11-23 中国铁路设计集团有限公司 基于深度学习的桁架桥梁铆钉锈蚀病害智能识别方法
CN113673596A (zh) * 2021-08-20 2021-11-19 自然资源部国土卫星遥感应用中心 一种基于历遍源目标的遥感影像目标检测样本生成方法
CN116842117A (zh) * 2023-06-19 2023-10-03 重庆市规划和自然资源信息中心 一种基于geotools工具修复自相交的地理图像输出方法
CN116842117B (zh) * 2023-06-19 2024-03-12 重庆市规划和自然资源信息中心 一种基于geotools工具修复自相交的地理图像输出方法
CN117291503A (zh) * 2023-09-28 2023-12-26 佳康捷科技(江苏)有限公司 一种智能仓储管理方法、装置及电子设备
CN118520132A (zh) * 2024-07-25 2024-08-20 山东省交通规划设计院集团有限公司 适用于公路设计的gis数据tms瓦片生成方法及系统
CN118520132B (zh) * 2024-07-25 2024-10-01 山东省交通规划设计院集团有限公司 适用于公路设计的gis数据tms瓦片生成方法及系统

Also Published As

Publication number Publication date
CN112396128B (zh) 2022-06-03

Similar Documents

Publication Publication Date Title
CN112396128B (zh) 一种铁路外部环境风险源样本自动标注方法
CN113128405B (zh) 一种结合语义分割与点云处理的植物识别与模型构建方法
CN113034689B (zh) 基于激光点云的地形三维模型及地形图构建方法和系统、存储介质
CN116310192B (zh) 一种基于点云的城市级建筑物三维模型单体重建方法
CN112287807B (zh) 一种基于多分支金字塔神经网络的遥感影像道路提取方法
Heitzler et al. Cartographic reconstruction of building footprints from historical maps: A study on the Swiss Siegfried map
CN110263717B (zh) 一种融入街景影像的土地利用类别确定方法
CN111738165B (zh) 一种从高分辨率无人机可见光遥感影像中提取单株植物冠层的方法
CN111859805B (zh) 基于人工智能的电力图纸拓扑关系的检测方法
Peeters et al. Automated recognition of urban objects for morphological urban analysis
CN110619258A (zh) 一种基于高分辨率遥感影像的道路轨迹核查方法
CN116704333B (zh) 一种基于激光点云数据的单株林木检测方法
Oka et al. Vectorization of contour lines from scanned topographic maps
CN113063375A (zh) 一种直线型耕作田埂的无人机遥感提取方法
Wu et al. Automatic building rooftop extraction using a digital surface model derived from aerial stereo images
Muhs et al. Automatic delineation of built-up area at urban block level from topographic maps
Karsli et al. Automatic building footprint extraction from photogrammetric and LiDAR point clouds using a novel improved-Octree approach
CN113095309A (zh) 一种基于点云的道路场景地面标识物的提取方法
Peller From paper map to geospatial vector layer: Demystifying the process
CN114596490A (zh) 丘陵地形特征线提取方法、丘陵地dem精细化生产方法
CN117315514B (zh) 一种无人农机人机协作模式工作区域划分方法
CN118031912B (zh) 一种用于自然资源研究的测绘方法
CN118229842A (zh) 一种地形图变化修测方法、服务器及存储介质
CN117523384A (zh) 一种基于点云数据的风蚀坑识别方法
Kesidis Convolutional Neural Network for Detection of Building Contours Using Multisource Spatial Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant