CN110751111B - 基于高阶空间信息全局自动感知的道路提取方法和系统 - Google Patents

基于高阶空间信息全局自动感知的道路提取方法和系统 Download PDF

Info

Publication number
CN110751111B
CN110751111B CN201911016522.XA CN201911016522A CN110751111B CN 110751111 B CN110751111 B CN 110751111B CN 201911016522 A CN201911016522 A CN 201911016522A CN 110751111 B CN110751111 B CN 110751111B
Authority
CN
China
Prior art keywords
road
feature
spatial information
resource pool
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911016522.XA
Other languages
English (en)
Other versions
CN110751111A (zh
Inventor
解岩
苗放
周凯
彭京
葛城
吴志强
钟波
罗曦
刘力
廖家伟
向飞
郑建波
包婕瑜
王冠立
李成富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Dacheng Juntu Technology Co ltd
Original Assignee
Chengdu Dacheng Juntu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Dacheng Juntu Technology Co ltd filed Critical Chengdu Dacheng Juntu Technology Co ltd
Priority to CN201911016522.XA priority Critical patent/CN110751111B/zh
Publication of CN110751111A publication Critical patent/CN110751111A/zh
Application granted granted Critical
Publication of CN110751111B publication Critical patent/CN110751111B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/182Network patterns, e.g. roads or rivers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了基于高阶空间信息全局自动感知的道路提取方法,包括根据预设的深度卷积分层模型编码生成空间特征;采用双线性池化生成道路提取特征资源池;根据道路提取特征资源池进行带权重的特征空间再分配;带权重的特征空间再分配为根据道路和背景每个局部特征位置的需求从整个道路提取特征资源池中互补性地选择特征进行再分配。本发明还公开了基于高阶空间信息全局自动感知的道路提取系统。本发明将编码生成的特征和全局空间信息整体有机地结合起来,避免了局部空间信息学习中造成的空间信息损失和不连续问题,有效地提高了道路提取评价指标,同时减少了模型参数,降低运行时间,实现道路区域的智能分割提取,本发明也适合其他对象语义分割。

Description

基于高阶空间信息全局自动感知的道路提取方法和系统
技术领域
本发明涉及遥感影像处理技术、神经网络算法、计算机视觉语义分割技术,具体涉及基于高阶空间信息全局自动感知的道路提取方法和系统。
背景技术
本文涉及的问题领域是从遥感影像中提取道路区域。基于遥感影像的道路分割在数字化地图生成、道路网络更新、城市规划、自动驾驶、路径规划、道路导航、道路破损检测、自然灾害、应急救援等领域有广泛的应用场景。
道路的语义分割是一项具有挑战性的任务。不同于提取道路骨架信息,需要将每个属于道路的像素点标注为道路,剩余的标注为背景,属于二元语义分割问题。相比一般的语义分割对象,道路分割提取有其独特性和困难性,具体属性表现:(1)道路狭长,虽占据整张影像比例偏小,但往往整体跨度覆盖整张影像;(2)几何特征与河流、铁路、沟壑等相似,专业人员也难以判别;(3)纹理特征容易与周边背景环境混淆;(4)因树木、阴影、建筑物等遮挡造成提取的道路不连通;(5)拓扑关系复杂,特别在多条道路相互交叉处,仅这一点对于道路提取的精度就是挑战。这些属性给遥感影像道路提取带来困难,也使得众多语义分割方法在道路语义分割任务中适用性变弱。
FCN因较小的有效感知域的限制,在捕获长距离信息和上下文语义关系方面的能力相对较弱。为此,诸多工作者提出了高效的多尺度上下文语义特征融合模块,像Deeplab的空洞卷积、PSPNet的金字塔池化模块,以及不同分辨率下低维与高维特征有效融合的端到端(Encoder-Decoder)网络,像U-Net、和在计算和内存方面表现高效的LinkNet等等。然而,上述方法的共同特点是学习了部分空间信息获取局部关联特征,不利于大跨度、背景复杂、拓扑连通难的道路分割任务。同时,道路分割的场景应用越来越广泛,随着边缘、端侧需求的快速增长,分割模型部署到终端的需求增多,对模型大小要求严格。
遥感影像道路区域提取困难,但在传统方法、机器学习、深度学习(热点方向)不断发展过程中,也积累了一些成果。传统方法中,利用手工设计的有限元模型,通过结合上下文先验来增强道路连接性,比如High-order CRF、Junction-point processes等等。机器学习方面,Song和Civco提出了一种利用形状指数特征和SVM检测道路区域的方法。Das等人利用道路的两个显著特征,设计了一个多级框架,利用支持向量机从高分辨率多光谱图像中提取道路。Alshehhi和Marpu提出了一种基于分层图像分割的无监督道路提取方法。这些基于先验知识的设计方法随着神经网络、深度学习的不断发展也开启了自主学习的道路。
深度学习方面,Mnih and Hinton率先尝试使用限制波尔兹曼机(RBMs)作为基本块构建深度神经网络从高分辨率遥感影像中分割道路区域,并结合预处理和后处理提高分割精度。不同于Mnih和Hinton的成果,Saito使用CNN直接从原始影像中提取道路,在Massachusetts Roads Dataset得到更好的结果。由Bastani提出的RoadTracer采用基于CNN决策函数的迭代搜索过程,直接从CNN输出路网。还有学者考虑道路拓扑特征提高道路提取精度,初步尝试以约束模型生成拓扑连通的路网。Encoder-Decoder的深度神经网络为道路的语义分割提供了新的研究方向,例如U-Net和LinkNet等将不同分辨率的特征图拼接起来融合了低层细节信息和高层语义信息,区别于FCN使用跳跃连接的方法。D-LinkNet利用空洞卷积扩大感受野、保存空间信息,通过多尺度融合上下文语义信息,目前仍是道路提取综合效果最好的,但存在两个潜在的问题。第一,使用空洞卷积因核(kernel)不连续,导致并不是所有的像素都参与计算,损失信息连续性和全局性;第二,多尺度特征融合模块造成模型参数增加。考虑到网络模型需要在实际应用中使用,在构建网络模型的时候必须兼顾模型的准确率和前向计算时间,尽可能前者高后者低。为此,本发明试图解决空洞卷积带来的两个问题,同时尽可能学习并记录全局和长距离关系、高阶信息以及不同特征通道间的依赖关系。
本发明提出了以LinkNet为基础体系结构的高阶空间信息全局自动感知的道路提取网络,以弥补空洞卷积等方法造成信息丢失的不足,该道路提取网络由编码器、中间块、解码器三部分组成。
发明内容
本发明所要解决的技术问题是现有技术从遥感影像中提取道路区域时损失了空间信息,造成信息不连续性,导致提取精度有待进一步提高,以及并未充分利用不同特征通道间的依赖关系,目的在于提供基于高阶空间信息全局自动感知的道路提取方法和系统,解决上述问题。
本发明通过下述技术方案实现:
基于高阶空间信息全局自动感知的道路提取方法,包括以下步骤:S1:根据预设的深度分层卷积神经网络模型编码遥感影像道路提取所需的空间信息特征,生成不同分辨率的通用特征、过渡特征和特定特征;S2:根据步骤S1编码生成的高维特定特征采用双线性池化构建道路提取特征资源池,捕获全局的、二阶的、长距离的空间信息和不同特征通道的依赖关系;S3:根据生成的道路提取特征资源池进行带权重的特征分配并输出结果;所述带权重的特征分配为根据道路与背景的局部空间位置的需求互补性地选择特征资源池内的空间特征;S4:将所述S3的输出结果编码映射回所述输入特定特征/影像的大小;S5:根据预设的分层模型解码恢复遥感影像大小,所述解码过程融合编码阶段生成的不同分辨率的空间特征;并进行像素级别的道路对象分类分割。
本发明应用时,首先通过编码学习空间特征,特别是决定道路分割任务的高层特定特征的编码学习,编码器可以采用在ImageNet数据集上预训练的ResNet34或其他基础模型,通过迁移学习提高模型的收敛速度。随着神经网络加深分别学习对象的通用、过渡和特定特征。本发明重点关注最后编码阶段学习的对分割起决定作用的特定特征提取层,同时考虑到道路的大跨度、细长、连通、背景复杂等特点。其次生成道路提取特征资源池,该特征资源池是基于双线性池化(bilinearpooling)求出带有权重的空间信息特征分布,记录全局、二阶空间信息,自适应地聚合长距离上下文语义信息和不同特征通道间的依赖关系,提高道路分割的特征表示能力。本发明通过这种方式,就可以将整个图像的空间信息特征整体有机的结合起来,避免了在现有技术中空间信息损失连续性和全局性欠考虑的问题,有效的提高了图像语义分割领域的评价指标,像平均交并比、精度和召回率等,并减少了模型参数。
进一步的,
步骤S2包括以下子步骤:
设输入的道路提取特定特征数组
Figure BDA0002245876800000031
为时空卷积层的输入张量,其中c为通道数,h和w为输入特征图的空间维数,每个输入位置用i=1,...,hw表示;
建立特征数组A和特征数组B,且所述特征数组A和特征数组B由不同的1×1×1卷积在输入特征数组X上运算生成;
将所述特征数组A和特征数组B中所有特征向量对(ai,bi)进行外积运算,获得道路提取特征资源池;其中,ai和bi分别为特征数组A和B中的元素;A和B是两个不同的特征图,A=φ(X;Wφ),B=softmax(θ(X;Wθ)),分别带有卷积核参数Wφ和Wθ
进一步的,
根据全局特征资源池的生成公式生成道路提取的特征资源池:
Figure BDA0002245876800000032
式中,Fg-bilinear为聚合了全局的、二阶的、长距离的空间信息,且融合了不同特征通道间依赖关系的道路提取特征资源池;A为特征数组,且
Figure BDA0002245876800000033
B为特征数组,且
Figure BDA0002245876800000034
进一步的,
步骤S3包括以下子步骤:
Figure BDA0002245876800000041
中选取特征向量子集,根据道路和背景特征每个位置vi的需求从整个空间中互补性的选择特征资源进行特征的再分配
Figure BDA0002245876800000042
在道路和背景特征选择过程中,聚焦注意力权重的向量V=softmax(υ(X;Wυ)),带有卷积核参数Wυ
进一步的,
步骤S3包括以下子步骤:
结合特征编码及双线性池化聚合生成的道路提取特征资源池进行道路特征和背景特征选择性再分配,输出结果Z的通用公式:
Z=φ(X;Wφ)softmax(θ(X;Wθ))Tsoftmax(υ(X;Wυ))。
进一步的,
步骤S4包括以下子步骤:
添加一个特征数组ψ(Z;Wψ)扩展输出Z的通道数(Wψ为参数集),并将其编码反映射回输入X的尺寸,得到输出Y:
Y=X+ψ(Z;Wψ)。
基于高阶空间信息全局自动感知的道路提取系统,包括:
编码器:用于获取需要提取道路的遥感影像中低维和高维的通用特征、过渡特征和特定特征,尤其用于根据预设模型的深度卷积层编码生成特定特征;
中间块:用于根据所述编码生成的特定特征采用双线性池化形成道路提取特征资源池,捕获空间信息和不同特征通道间的依赖关系;所述空间信息具备全局性、高阶性和长距离信息聚合特点;
所述中间块还用于根据所述道路提取特征资源池进行带权重的特征分配;所述带权重的特征分配为根据道路和背景每个局部特征位置的需求从道路提取特征资源池中互补性的选择特征进行再分配;
解码器:解码恢复遥感影像/输入的大小;所述解码过程融合编码阶段生成的不同分辨率的空间特征;
道路提取:解码输出,进行像素级别的道路对象分类分割。
所述解码器采用反卷积进行上采样,将编码阶段的低分辨率恢复到原输入影像的分辨率大小。
本发明应用时,体系框架包括编码器(Encoder),中间块(Middle)和解码器(Decoder)三个部分。本发明所提道路提取网络是以LinkNet为基础体系结构,一方面LinkNet在内存和计算方面表现优秀,同时也是为了比较目前综合表现优秀的D-LinkNet道路提取网络,弥补空洞卷积局部特征学习造成信息丢失的不足。本发明所提道路提取网络首先将整个空间的关键特征通过编码器映射成一个紧凑的道路提取特征资源池;利用引入的中间块增强道路提取中全局信息学习能力,对空间上下文语义及依赖关系进行建模;通过解码器反映射回输入图像大小,并实现道路语义分割提取任务。
编码器采用在ImageNet数据集上预训练的ResNet34或其他基础模型,通过迁移学习提高模型的收敛速度。Yosinski and Bengio等人证明随着神经网络加深分别学习对象的通用特征、过渡特征和特定特征。我们重点关注最后编码阶段学习的对分割起决定作用的特定特征提取层,同时考虑到道路的大跨度、细长、连通、复杂性等,接入Middle中间块。
中间块是全像素计算的高阶空间信息全局感知模块,设计灵感来自于现在图像语义分割领域流行的注意力机制,像Liu和Yin提出的cross attention network,Fu提出的dual attention network,Hu提出的squeeze and excitation network等等,特别是Wang提出的non-local neural networks和Chen提出的double attention networks。同时,结合双线性池化(bilinearpooling)的发展,求出带有权重的空间信息特征分布,记录全局、二阶空间信息,自适应地聚合长距离上下文语义关系和不同特征通道间的依赖关系,提高道路分割的特征表示能力。
解码器与LinkNet的保持一致,采用反卷积进行上采样,将特征图从低分辨率恢复到原始输入影像的大小,比如从32×32恢复到1024×1024。
中间块主要包括三个重要步骤:基于双线性池化采用外积运算方式形成道路提取特征资源池,对二阶信息、长距离信息、空间上下文语义关系、不同特征通道的依赖关系进行建模;有选择性的进行特征权重再分配,使得每个像素位置都能根据各自的需求获取互补性特征;通过添加扩充运算,将编码输出反映射回输入图像尺寸。综上,本发明以LinkNet为基础体系结构,在Encoder-Decoder间加一个Middle中间块,学习形成道路提取特征资源池,再进行特征权重再分配,自适应地聚合全局、长距离、不同通道特征融合的空间信息,解决道路提取面临的问题。实验结果表明,相比目前综合表现优秀的D-LinkNet,本发明方法更优,(1)获得了71.1%的mIoU,(2)模型参数较减少了约1/4,(3)运行时间略低。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明基于高阶空间信息全局自动感知的道路提取方法和系统,通过这种方式,就可以学习聚合整个图像的高阶、全局、长距离空间信息和不同特征通道间的依赖关系,更加有利于道路对象提取。避免了在现有技术中损失空间信息造成信息不连续性的问题,有效提高了道路提取精度,并减少了模型参数。当然,认为本项发明成果对其他对象语义分割也是有效的。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明体系框架图;
图2为本发明中间块示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
实施例
本发明基于高阶空间信息全局自动感知的道路提取方法,包括以下步骤:S1:根据预设的深度分层卷积神经网络模型编码遥感影像道路提取所需的空间信息特征,生成不同分辨率的通用特征、过渡特征和特定特征;S2:根据步骤S1编码生成的高维特定特征采用双线性池化构建道路提取特征资源池,捕获全局的、二阶的、长距离的空间信息和不同特征通道的依赖关系;S3:根据生成的道路提取特征资源池进行带权重的特征分配并输出结果;所述带权重的特征分配为根据道路与背景的局部空间位置的需求互补性地选择特征资源池内的空间特征;S4:将所述S3的输出结果编码映射回所述输入特定特征/影像的大小;S5:根据预设的分层模型解码恢复遥感影像大小,所述解码过程融合编码阶段生成的不同分辨率的空间特征;并进行像素级别的道路对象分类分割。
本实施例实施时,首先编码生成空间特征,特别关注高层编码生成的特定特征。编码器可采用在ImageNet数据集上预训练的ResNet34或其他基础模型,通过迁移学习提高模型的收敛速度。随着神经网络加深分别学习对象的通用、过渡和特定特征。本发明重点关注最后编码阶段学习的对分割起决定作用的特定特征提取层的输出,同时考虑道路的大跨度、细长、连通、复杂性等。其次生成道路提取特征资源池,道路提取特征资源池是基于双线性池化求出的带有权重的空间信息特征分布,记录全局、二阶空间信息,自适应地聚合长距离上下文语义关系和不同特征通道间的依赖关系,提高道路分割的特征表示能力。本发明通过这种方式,就可以将整个图像的空间信息特征整体有机的结合起来,避免了在现有技术中损失空间信息的连续性和全局性的问题,有效的提高了提取精度,并减少了模型参数。
如图1和图2所示,本发明基于高阶空间信息全局自动感知的道路提取系统,包括:
编码器:用于获取需要提取道路的遥感影像中低维和高维的通用特征、过渡特征和特定特征,尤其用于根据预设模型的深度卷积层编码生成特定特征;
中间块:用于根据所述编码生成的特定特征采用双线性池化形成道路提取特征资源池,捕获空间信息和不同特征通道间的依赖关系;所述空间信息具备全局性、高阶性和长距离信息聚合特点;
所述中间块还用于根据所述道路提取特征资源池进行带权重的特征再分配;所述带权重的特征再分配为根据道路和背景每个局部特征位置的需求从道路提取特征资源池中互补性的选择特征进行再分配;
解码器:解码恢复遥感影像/输入的大小;所述解码过程融合编码阶段生成的不同分辨率的空间特征;
道路提取:解码输出,进行像素级别的道路对象分类分割。
所述解码器采用反卷积进行上采样,将编码阶段的低分辨率恢复到原输入影像的高分辨率,像将特征图的分辨率从32×32恢复到1024×1024。
本实施例实施时,体系框架包括编码器(Encoder),中间块(Middle)和解码器(Decoder)三个部分。本发明所提道路提取网络以LinkNet为基础体系结构,一方面LinkNet在内存和计算方面表现优秀,同时也是为了比较目前综合表现优秀的D-LinkNet道路提取网络,弥补空洞卷积局部学习造成空间信息丢失的不足。本发明所提道路提取网络首先将整个空间的关键特征通过编码器映射成一个紧凑的特征资源池;利用引入的Middle中间块增强道路提取中全局信息学习能力,对空间上下文语义及依赖关系进行建模;通过解码器反映射回输入图像大小,并实现道路分割提取。
编码器采用在ImageNet数据集上预训练的ResNet34或其他基础模型,通过迁移学习提高模型的收敛速度。Yosinskiand Bengio等人证明随着神经网络加深分别学习对象的通用、过渡和特定特征。我们重点关注最后编码阶段学习的对分割起决定作用的特定特征提取层,同时考虑到道路的大跨度、细长、连通、复杂性等,接入Middle中间块。
中间块是全像素计算的高阶空间信息全局空间信息感知模块,基于双线性池化求出带有权重的空间信息特征分布,记录全局、二阶空间信息,自适应地聚合长距离上下文语义关系和不同特征通道间的依赖关系,提高道路分割的特征表示能力。
解码器与LinkNet的保持一致,采用反卷积进行上采样,将特征图的分辨率从32×32恢复到1024×1024。
中间块主要包括三个重要步骤:基于双线性池化采用外积运算方式形成道路提取特征资源池,对二阶信息、长距离信息、空间上下文语义关系、不同特征通道的依赖关系进行建模;有选择性的进行特征再分配,使得道路和背景每个像素位置都能根据各自的需求获取互补性选择特征;通过添加扩充运算,将输出特征编码反映射回输入图像尺寸。区别于D-LinkNet使用的空洞卷积,本发明学习二阶信息和全局信息,自适应地聚合长距离、不同通道特征融合的信息,解决道路提取难的问题。实验结果表明,相比目前综合表现优秀的D-LinkNet,本发明更优,(1)获得了71.1%的mIoU,(2)模型参数减少了约1/4,(3)运行时间略低。进一步说明,对比空洞卷积等局部特征的学习,二阶信息、全局特征及空间依赖关系的学习,更加有利于道路对象提取。当然,认为本发明的成果对其他对象分割也是有效的。
为了进一步说明本发明的工作过程,采用两个公开数据集进行测试:
DeepGlobe:该数据集来自三个不同区域的像素级标注,每张图片分辨率为1024×1024,路面分辨率为0.5米/像素。我们从原DeepGlobe的训练集中,以8:1:1的比例,随机分出了4971张图片作为训练集,622张图片作为验证集,622张图片作为测试集。
SpaceNet:该数据集提供4个城市的影像。每张大小为1300×1300,路面分辨率为0.3米/像素。其标注为道路中心线,以line string的形式表示。我们将11-bits图片转化为8-bits图片,创建高斯道路掩码(Gaussian Road Masks),生成新的数据集,包含2213张训练集,567张测试集。对于训练集,我们做了650×650的裁剪(crops)和215像素的重叠(overlapping);验证集做了650×650的crops,不做overlapping。最终我们得到约35k的训练图片和约2k的测试图片,输入网络的图片缩放为512×512的分辨率。
两个数据集均采用水平翻转、垂直翻转、对角线翻转、大幅颜色抖动、图像移动、缩放的数据增强方式。
然后使用BCE(binary cross entropy)+dice coefficient loss作为损失函数,选择Adam作为optimizer。batch size设为16,初始学习率设为2e-4。当训练集的loss连续3个epochs大于最佳训练loss,学习率除以5。在训练中,训练会被终止如果发生以下两种情况中任意一种:(1)调整后的学习率低于5e-7;(2)训练集当前输出loss连续6次大于历史最佳训练loss。
得出的结果如下:
在DeepGlobe和SpaceNet进行测试时,对比分析U-net,LinkNet,D-LinkNet。本发明方法最优,网络参数较D-LinkNet降低了约1/4,运行时间也略低。进一步,通过P-R曲线的评价,得出本发明模型在正确性和完整性上均优于其他方法。
在分析具有大跨度、纹理相似、图像掩盖、拓扑复杂的道路对象时,上下文语义信息和依赖关系非常重要。本发明网络通过增强全局信息、二阶信息、不同特征通道关系的学习能力,进而提高分割准确率。由于道路转弯、被树木阴影和建筑物遮挡等因素致使使用局部信息学习的方法难以识别,保障道路的连通性,而本发明方法成功识别,即便道路与背景的颜色纹理非常相似,本发明方法也依旧有效;在复杂的道路拓扑连通关系上,本发明方法也表现出优秀的推理识别能力。
同时本发明道路聚类效果更好。背景的聚类结果相对发散,进一步说明一条道路通常会穿越具有不同场景的区域,背景信息复杂增大道路识别难度,所以,进一步说明全局、二阶、长距离及不同特征通道依赖关系的学习很重要,说明本发明方法的有效性。
并且本发明的模型学到了更多的特征信息,学习到的特征边界也更加清晰,冗余信息更少,利于分割,弥补了空洞卷积局部特征学习造成信息丢失、效果欠佳的不足。所得结论是对比了D-LinkNet在编码和解码中间加入空洞卷积前后的结果,以及本发明嵌入中间块前后的结果。D-LinkNet加入了4个膨化率为1,2,4,8的膨化卷积层。分别获得3*3,7*7,15*15,31*31的感受野,再将不同尺度下的特征图进行融合,优势在此弊端也在此。空洞卷积的加入一定程度扩大了感受野、保存了部分空间信息,然而因kernel不连续,不是所有的pixel都用来计算,损失信息。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,包括基础模型是可以替代的,应用语义分割对象是通用的,Middle中间块可以用于编码的任何阶段等,所以并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.基于高阶空间信息全局自动感知的道路提取方法,其特征在于,包括以下步骤:
S1:根据预设的深度分层卷积神经网络模型编码遥感影像道路提取所需的空间信息特征,生成不同分辨率的通用特征、过渡特征和特定特征;
S2:根据步骤S1编码生成的高维特定特征采用双线性池化构建道路提取特征资源池,捕获全局的、二阶的、长距离的空间信息和不同特征通道的依赖关系;
S3:根据生成的道路提取特征资源池进行带权重的特征分配并输出结果;所述带权重的特征分配为根据道路与背景的局部空间位置的需求互补性地选择特征资源池内的空间特征;
S4:将S3的输出结果编码映射回输入特定特征/影像的大小;
S5:根据预设的分层模型解码恢复遥感影像大小,所述解码过程融合编码阶段生成的不同分辨率的空间特征;并进行像素级别的道路对象分类分割。
2.根据权利要求1所述的基于高阶空间信息全局自动感知的道路提取方法,其特征在于,步骤S2包括以下子步骤:
设输入特征数组
Figure FDA0002973935080000011
为时空卷积层的输入张量,其中c为通道数,h和w为输入特征图的空间维数,每个输入位置i=1,...,hw;
建立特征数组A和特征数组B,且所述特征数组A和特征数组B由不同的1×1×1卷积在输入特征数组X上运算生成;
将所述特征数组A和特征数组B中所有特征向量对(ai,bi)进行外积运算,获得道路提取特征资源池;其中ai和bi分别为特征数组A和B中的元素;A=φ(X;Wφ);B=softmax(θ(X;Wθ)),分别带有卷积核参数Wφ和Wθ
3.根据权利要求2所述的基于高阶空间信息全局自动感知的道路提取方法,其特征在于,根据全局特征资源池的生成公式生成特征资源池:
Figure FDA0002973935080000012
式中,Fg-bilinear为聚合了全局的、二阶的、长距离的空间信息,且融合了不同特征通道间依赖关系的道路提取特征资源池;A为特征数组,且
Figure FDA0002973935080000013
B为特征数组,且
Figure FDA0002973935080000014
4.根据权利要求3所述的基于高阶空间信息全局自动感知的道路提取方法,其特征在于,步骤S3包括以下子步骤:
Figure FDA0002973935080000021
中选取特征向量子集,根据道路和背景特征每个位置vi的需求从整个空间中选择互补性的特征资源进行特征的再分配:
Figure FDA0002973935080000022
在道路和背景特征选择过程中,聚焦注意力权重的向量V=softmax(υ(X;Wυ)),带有卷积核参数Wυ
5.根据权利要求4所述的基于高阶空间信息全局自动感知的道路提取方法,其特征在于,步骤S3包括以下子步骤:
结合特征编码及双线性池化聚合生成的道路提取特征资源池进行道路特征和背景特征选择性再分配,输出结构Z的通用公式:
Figure FDA0002973935080000023
6.根据权利要求1所述的基于高阶空间信息全局自动感知的道路提取方法,其特征在于,步骤S4包括以下子步骤:
添加一个特征数组ψ(Z;Wψ)扩展输出Z的通道数,Wψ为参数集,并将其编码反映射回输入X的尺寸,得到输出Y:
Y=X+ψ(Z;Wψ)。
7.基于高阶空间信息全局自动感知的道路提取系统,其特征在于,包括:
编码器:用于获取需要提取道路的遥感影像中低维和高维的通用特征、过渡特征和特定特征,还用于根据预设模型的深度卷积层编码生成特定特征;
中间块:用于根据所述编码生成的特定特征采用双线性池化形成道路提取特征资源池,捕获空间信息和不同特征通道的依赖关系;所述空间信息具备全局性、高阶性和长距离信息聚合特点;
所述中间块还用于根据所述道路提取特征资源池进行带权重的特征再分配;所述带权重的特征再分配为根据道路和背景每个局部特征位置的需求从道路提取特征资源池中互补性的选择特征进行再分配;
解码器:解码恢复遥感影像/输入的大小;所述解码过程融合编码阶段生成的不同分辨率的空间特征;
道路提取:解码输出,进行像素级别的道路对象分类分割。
8.根据权利要求7所述的基于高阶空间信息全局自动感知的道路提取系统,其特征在于,所述解码器采用反卷积进行上采样,将编码阶段的低分辨率恢复到原输入影像的分辨率大小。
CN201911016522.XA 2019-10-24 2019-10-24 基于高阶空间信息全局自动感知的道路提取方法和系统 Active CN110751111B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911016522.XA CN110751111B (zh) 2019-10-24 2019-10-24 基于高阶空间信息全局自动感知的道路提取方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911016522.XA CN110751111B (zh) 2019-10-24 2019-10-24 基于高阶空间信息全局自动感知的道路提取方法和系统

Publications (2)

Publication Number Publication Date
CN110751111A CN110751111A (zh) 2020-02-04
CN110751111B true CN110751111B (zh) 2021-04-27

Family

ID=69279737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911016522.XA Active CN110751111B (zh) 2019-10-24 2019-10-24 基于高阶空间信息全局自动感知的道路提取方法和系统

Country Status (1)

Country Link
CN (1) CN110751111B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111353441B (zh) * 2020-03-03 2021-04-23 成都大成均图科技有限公司 基于位置数据融合的道路提取方法和系统
CN113515969B (zh) * 2020-04-09 2023-04-07 广西壮族自治区自然资源信息中心 基于卷积神经网络的多时态遥感影像地表覆盖分类方法
CN112037226A (zh) * 2020-08-27 2020-12-04 海南大学 一种基于深度学习的卫星图像道路分割方法及系统
CN112528803B (zh) * 2020-12-03 2023-12-19 中国地质大学(武汉) 道路特征提取方法、装置、设备及存储介质
CN112634289B (zh) * 2020-12-28 2022-05-27 华中科技大学 一种基于非对称空洞卷积的快速可行域分割方法
CN112634273B (zh) * 2021-03-10 2021-08-13 四川大学 一种基于深度神经网络的脑转移瘤分割系统及其构建方法
CN116883679B (zh) * 2023-07-04 2024-01-12 中国科学院地理科学与资源研究所 基于深度学习的地物目标提取方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646402A (zh) * 2013-12-20 2014-03-19 中国科学院遥感与数字地球研究所 检测遥感道路图像精度的方法及装置
CN109800736A (zh) * 2019-02-01 2019-05-24 东北大学 一种基于遥感影像和深度学习的道路提取方法
CN110348383A (zh) * 2019-07-11 2019-10-18 重庆市地理信息中心 一种基于卷积神经网络回归的道路中心线和双线提取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10365658B2 (en) * 2016-07-21 2019-07-30 Mobileye Vision Technologies Ltd. Systems and methods for aligning crowdsourced sparse map data
CN109886125A (zh) * 2019-01-23 2019-06-14 青岛慧拓智能机器有限公司 一种构建道路检测模型的方法及道路检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103646402A (zh) * 2013-12-20 2014-03-19 中国科学院遥感与数字地球研究所 检测遥感道路图像精度的方法及装置
CN109800736A (zh) * 2019-02-01 2019-05-24 东北大学 一种基于遥感影像和深度学习的道路提取方法
CN110348383A (zh) * 2019-07-11 2019-10-18 重庆市地理信息中心 一种基于卷积神经网络回归的道路中心线和双线提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hierarchical graph-based segmentation for extracting road networks from high-resolution satellite images;Rasha Alshehhi et al.;《ISPRS Journal of Photogrammetry and Remote Sensing》;20170308;第126卷;第245-260页 *
基于深度学习的高分辨率遥感影像道路自动提取研究;钟传琦;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180815;第2018年卷(第8期);第I140-450页 *

Also Published As

Publication number Publication date
CN110751111A (zh) 2020-02-04

Similar Documents

Publication Publication Date Title
CN110751111B (zh) 基于高阶空间信息全局自动感知的道路提取方法和系统
CN108062754B (zh) 基于密集网络图像的分割、识别方法和装置
Lateef et al. Survey on semantic segmentation using deep learning techniques
CN111210443B (zh) 基于嵌入平衡的可变形卷积混合任务级联语义分割方法
CN113298818B (zh) 基于注意力机制与多尺度特征的遥感图像建筑物分割方法
CN111047551B (zh) 一种基于U-net改进算法的遥感影像变化检测方法及系统
CN111259905B (zh) 一种基于下采样的特征融合遥感图像语义分割方法
CN112396607B (zh) 一种可变形卷积融合增强的街景图像语义分割方法
CN110889449A (zh) 一种增强边缘的、多尺度的遥感影像建筑物语义特征提取方法
CN111191654B (zh) 道路数据生成方法、装置、电子设备及存储介质
CN113780149A (zh) 一种基于注意力机制的遥感图像建筑物目标高效提取方法
CN112258526A (zh) 一种基于对偶注意力机制的ct肾脏区域级联分割方法
CN111899169B (zh) 一种基于语义分割的人脸图像的分割网络的方法
CN116453121B (zh) 一种车道线识别模型的训练方法及装置
CN116797787B (zh) 基于跨模态融合与图神经网络的遥感影像语义分割方法
CN111488884A (zh) 低计算量及高度特征融合的实时语义分割方法
CN113903022B (zh) 基于特征金字塔与注意力融合的文本检测方法及系统
CN114092824A (zh) 结合密集注意力和并行上采样的遥感图像道路分割方法
CN116645592A (zh) 一种基于图像处理的裂缝检测方法和存储介质
CN115424059A (zh) 一种基于像素级对比学习的遥感土地利用分类方法
CN112861911A (zh) 一种基于深度特征选择融合的rgb-d语义分割方法
CN115035402B (zh) 一种用于土地覆盖分类问题的多级特征聚合系统及方法
CN116051850A (zh) 神经网络目标检测方法、装置、介质和嵌入式电子设备
CN112686828B (zh) 视频去噪方法、装置、设备及存储介质
CN113628107A (zh) 人脸图像超分辨率方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Road extraction method and system based on global automatic perception of high-order spatial information

Effective date of registration: 20220718

Granted publication date: 20210427

Pledgee: Chengdu financial holding Financing Guarantee Co.,Ltd.

Pledgor: CHENGDU DACHENG JUNTU TECHNOLOGY CO.,LTD.

Registration number: Y2022510000215

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20230901

Granted publication date: 20210427

Pledgee: Chengdu financial holding Financing Guarantee Co.,Ltd.

Pledgor: CHENGDU DACHENG JUNTU TECHNOLOGY CO.,LTD.

Registration number: Y2022510000215

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Road extraction method and system based on global automatic perception of high-order spatial information

Effective date of registration: 20230907

Granted publication date: 20210427

Pledgee: Chengdu financial holding Financing Guarantee Co.,Ltd.

Pledgor: CHENGDU DACHENG JUNTU TECHNOLOGY CO.,LTD.

Registration number: Y2023510000213

PE01 Entry into force of the registration of the contract for pledge of patent right