CN116343063A

CN116343063A - 一种路网提取方法、系统、设备及计算机可读存储介质

Info

Publication number: CN116343063A
Application number: CN202310601902.XA
Authority: CN
Inventors: 盛庆红; 曾玉娟; 杜阳; 李俊; 吴沣原; 贾志强; 陈志起
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-05-26
Filing date: 2023-05-26
Publication date: 2023-06-27
Anticipated expiration: 2043-05-26
Also published as: CN116343063B

Abstract

本发明公开了一种路网提取方法，包括获取待提取道路检测区域的遥感卫星影像；使用道路提取网络对待检测的遥感影像进行路网提取工作，输出路网提取结果；其中道路提取网络通过以下步骤得到：获取多光谱和全色遥感影像；利用神经网络模型进行卷积和池化操作得到空间特征和光谱特征；通过局部对称性特征融合模块和全局非对称性语义融合模块进行双路特征融合，利用通道注意力模块区分重要特征和非重要特征；计算多路监督损失，优化网络参数，得到训练完成的道路提取网络。本发明获取待检测地区的多光谱和全色遥感影像；使用道路提取网络对待处理的遥感卫星影像进行路网提取，输出提取结果；提升网络的检测能力，具有道路提取精度高、误差小优点。

Description

一种路网提取方法、系统、设备及计算机可读存储介质

技术领域

本发明属于遥感影像信息提取技术领域，尤其涉及一种路网提取方法、系统、设备及计算机可读存储介质。

背景技术

道路是保证整个人类社会正常运行的关键基础设施，在灾害管理、城市规划以及自动驾驶等众多领域扮演者重要的基础性角色。同时由于高分辨率遥感影像中包含了丰富的地物细节，也为目标地物的精细化自动解译提供了数据基础。因此，道路作为遥感影像中的一种典型地物，自动提取工作一直以来都备受关注。

道路提取方法，整体上可以分为模板匹配、面向对象、知识驱动和深度学习4类。模板匹配方法一般需要经过模板设计、测度分析和位置更新三个阶段。在人机交互式的工作模式下，基于模板设计的方法具有较强的纠错能力，被广泛应用于多款商业软件中，如Erdas easytrace、Feature Analyst。面向对象方法将道路视为具有一定几何纹理规律性的区域，通过影像处理得到分割区域结果，具有良好的抗噪声能力和适用性，在eCognition软件中也有应用。而知识驱动的方法着重于建立知识与道路属性的先验条件，常用于对前面两种方法补充。总体而言，高分辨率遥感影像中丰富的地物细节，使道路的自动化提取成为了可能，但其中伴随着更为复杂的空间地理关系和空间异质性，使得上述方法难以应对。

随着人工智能技术的发展，基于深度学习的遥感影像道路提取受到越来越多的关注。但是面对遥感影像道路提取这种相对简单的二元语义分割问题，基于深度学习的方法仍一直具有挑战性和局限性。早期阶段，大多数的网络采用编码-解码的结构，通过编码器和解码器分别获取高级语义信息和预测相应的道路区域。随后为了促进网络性能的进一步提升，在神经网络中使用注意力机制和其他辅助信息成为了一种研究热点。但现今的基于深度学习的道路提取任务，由于多光谱影像与融合影像相比有着更低的分辨率，在一定程度上忽略了多光谱数据的作用。

多光谱影像相比于融合影像，虽然在分辨率上有所差距，但多光谱影像能够在较小尺寸的影像上，获得与融合影像相同的场景范围。即在一个像素内，能够集成融合影像中16个像素所表示的真实地面信息（一般情况下，融合影像的分辨率为多光谱影像的4倍）。与此同时，考虑到深度学习的范式，即多个卷积层之间嵌套池化操作，需要不断提升网络的感受域，即在深度学习挖掘影像规律的同时，也需要使用更深层次的抽象特征，来表达较浅区域中的像素内容。但是网络模型中的这种表达方式，需要经过多次运算和迭代，使其中的误差远大于多光谱影像直接获取。

发明内容

发明目的：本发明的第一目的是提供一种顾及遥感数据特性和神经网络范式的路网提取方法。

本发明的第二目的是提供一种顾及遥感数据特性和神经网络范式的路网提取系统。

本发明第三目的是提供一种路网提取设备。

本发明第四目的是提供一种计算机可读存储介质。

技术方案：为实现以上目的，本发明公开了一种路网提取方法包括以下步骤：

（1）获取待提取道路检测区域的遥感卫星影像，并将其裁剪为统一尺度的若干个小块；

（2）使用训练完成的道路提取网络对待检测的遥感影像进行路网提取工作，输出路网提取结果；

其中训练完成的道路提取网络，通过以下步骤得到：

（2.1）获取卫星上相同区域的多光谱和全色遥感影像，通过预处理获得相应的训练集和测试集；

（2.2）利用预先构建的神经网络模型对获取到的影像进行卷积和池化操作，得到两条支路、不同尺度的空间特征和光谱特征；

构建的卷积神经网络包括多光谱影像特征提取分支和融合影像特征提取分支，并且两条支路的深度相同；多光谱影像特征提取分支和融合影像特征提取分支分别对相应的影像进行卷积、激活函数和池化操作，获取融合影像所在支路的输出特征与多光谱所在支路的输出特征；

（2.3）通过预先设计的局部对称性特征融合模块和全局非对称性语义融合模块进行双路特征融合，最后利用通道注意力模块区分重要特征和非重要特征；

（2.4）基于网络提取出的特征图和对应的标签图，通过解码器计算多路监督损失，通过不断迭代优化预设的道路提取网络的网络参数；

（2.5）利用训练集和测试集对优化后的道路提取网络进行训练和测试，得到训练完成的道路提取网络。

其中步骤（2.1）中对获取到的影像进行预处理包括：

对获取到的影像进行切分为统一尺度的小块；

对小块中的道路区域进行标注，将标注的二值影像块放入有标签文件夹GT，将融合影像的小块影像块放入融合文件夹Fuse，相应的多光谱小块影像放入多光谱文件夹Multi；

对三个文件夹中，相应的所有影像，按对应的编号，随机抽取20%作为测试集，剩余的80%作为训练集。

进一步，步骤（2.3）中双路特征融合的具体融合策略分为：（a）分别对融合影像的第3-5个特征空间和融合影像的第1-3个特征空间，进行局部对称性特征融合；（b）对融合影像的第6个特征空间和融合影像的第4-6个语义空间，进行全局非对称性语义融合。

优选的，步骤（2.3）中预先构建的局部对称性特征融合模块包括特征聚合、缩放型Softmax激活函数和门控残差连接；

局部对称性特征融合模块利用卷积操作，将多光谱影像输出特征进行特征聚合，即聚合为单一通道的特征图；利用缩放型Softmax激活函数，对单通道特征图进行粗略的道路区域概率预测，得到粗略的概率预测结果；基于粗略的概率预测结果，利用门控残差连接，对融合影像的特征图进行融合，获得更准确的道路提取特征图；

局部对称性特征融合模块相应的计算公式可以被表述为：

，

，其中Conv表示卷积操作，Softmax _scaled表示缩放型Softmax激活函数，/>

表示融合影像经过第i个特征提取单元之后的输出特征，/>

表示多光谱影像经过第i个特征提取单元之后的输出特征，下角标F表示融合影像，下角标M表示多光谱影像，c表示特征通道数，h表示特征图的长，w表示特征图的宽，M _{M_i-2_s}表示粗略的道路概率预测结果；/>

表示融合影像的特征空间，/>

表示多光谱影像的特征空间；X _{F_i_out}表示经过两条支路上的特征图，经过局部对称性特征融合之后的结果。

再者，步骤（2.3）中预先构建的全局非对称性语义融合模块包括金字塔池化和自注意力单元；

全局非对称性语义融合模块对于多光谱影像的多尺度特征图

，利用金字塔池化，将其缩放为不同尺度的特征图并按行展开为一维序列；并将其特征图也进行序列展开，对所有的一维序列进行拼接，获得两组一维序列/>

c=1,n=(1+16)+(16+49)+(1+81)=169表示序列长度；对于融合影像的特征图

，直接对其进行序列化展开，获得一维序列Q/>

,c=1,n=169；对于多光谱和融合影像的一维序列，进行自注意力运算，并还原成相应尺寸的特征图，最为获得最终的特征提取结果Final _out，相应的计算公式为：

。

进一步，步骤（2.3）中预先构建的通道注意力模块包括全局均值池化、1×1卷积和缩放型Sigmoid激活函数；

通道注意力模块对于特征提取结果Final _out，利用全局均值池化，获得多个通道的1×1特征；利用1×1卷积和缩放型Sigmoid函数提升网络的非线性能力；利用点乘的方法，实现对每张特征图的权重赋值。

优选的，步骤（2.4）中计算多路监督损失，通过下式进行计算：

，

，/>

，上式中，Loss表示整个网络的所有监督损失之和，/>

表示融合影像所在支路的损失值，/>

表示融合影像所在支路的损失值，/>

表示二值交叉熵损失，/>

表示结构相似性损失，/>

表示注意力通道相应的操作，/>

表示人工标注的道路标签。

本发明公开了一种路网提取系统，包括：

获取模块：用于获取有待道路检测区域的遥感卫星影像，并将其裁剪为统一尺度的若干个小块；

输出模块：用于使用训练完成的道路提取网络对待检测的遥感影像进行路网提取工作，并输出路网提取结果；

其中，所述输出模块包括用于训练道路提取网络的网络处理模块，所述网络处理模块包括：

预处理模块：用于获取卫星上相同区域的多光谱遥感影和全色遥感影像，并对获取到的影像进行预处理，得到训练集和测试集；

采样模块：用于利用预先构建的神经网络模型对获取到的影像进行卷积和池化操作，得到两条支路、不同尺度的空间特征和光谱特征；

特征融合模块：用于利用预先构建的局部对称性特征融合模块和全局非对称性语义融合模块，对两条支路上的特征进行融合，再利用通道注意力模块区分重要特征和非重要特征；

优化模块：用于利用标签和网络提取结果，计算多路监督损失，优化预设的道路提取网络的网络参数；

训练测试模块：用于利用训练集和测试集对优化后的道路提取网络进行训练和测试，得到训练完成的道路提取网络。

本发明公开了一种路网提取设备，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行上述一种路网提取方法的步骤。

本发明公开了计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述一种路网提取方法的步骤。

有益效果：与现有技术相比，本发明具有以下显著优点：本发明获取待检测地区的多光谱和全色遥感影像；使用训练完成的道路提取网络对待处理的遥感卫星影像进行路网提取，输出道路提取结果；能够提升网络的检测能力，具有道路提取精度高、误差小等优点；本发明在训练道路提取网络的过程中，利用预先构建的卷积神经网络对获取到的影像进行采样，得到多光谱和融合影像在不同尺度下的空间特征；本发明利用卷积神经网络代替了人工设计的影像重采样方法，对多光谱影像各波段可根据目标自动学习最优的影像采样参数，并能将不同分辨率多光谱和融合影像的特征空间进行融合；本发明利用预先构建的两条支路网络，分别获得不同尺度下的多光谱和融合影像的特征空间，并利用局部对称性特征融合和全局非对称性语义融合模块将得到的两组特征空间进行融合，获得更精准的道路提取特征图；能够从数据输入端获得多尺度特征，并能够进一步对特征进行融合；本发明预先构建的道路提取网络还包括通道注意力，通道注意力模块是对全局非对称性语义融合模块的补充，全局非对称性语义融合模块本质上是一种空间注意力机制，因此使用通道注意力有利于提升网络对道路区域的关注度；从而进一步提升对路网的提取精度。本发明基于多光谱影像特征和融合影像特征，通过与人工标注的标签比对，计算多路监督损失，优化预设的道路提取网络的网络参数；能够实现两种不同分辨率影像的道路提取进行监督，提升所述顾及遥感数据特性和神经网络范式的路网提取方法在遥感影像上的路网提取能力。

附图说明

图1为本发明实施例一提供的一种顾及遥感数据特性和神经网络范式的路网提取方法的流程图；

图2为本发明实施例一提供的一种顾及遥感数据特性和神经网络范式的路网提取方法的网络结构图；

图3为本发明实施例一提供的一种顾及遥感数据特性和神经网络范式的路网提取方法的特征提取单元结构图；

图4为本发明实施例一提供的一种顾及遥感数据特性和神经网络范式的路网提取方法中局部对称性特征融合模块结构示意图；

图5为本发明实施例一提供的一种顾及遥感数据特性和神经网络范式的路网提取方法中全局非对称性语义融合模块结构示意图；

图6为本发明实施例二提供的一种顾及遥感数据特性和神经网络范式的路网提取系统的结构图。

实施方式

下面结合附图对本发明的技术方案作进一步说明。

实施例

如图1所示，本发明一种顾及遥感数据特性和神经网络范式的路网提取方法，包括如下步骤：

（1）获取待提取区域的遥感卫星影像，并将其裁剪为400*400像素大小的若干个小块；

在高性能计算机训练道路提取网络，计算机的配置为：AMDRyzen9 5900X 12核24线程处理器，主频 4.2GHz，Nvidia GeForceRTX3080ti图形处理器,12G显存，内存32GB，操作系统为windows11；顾及遥感数据特性和神经网络范式的路网提取网络的实现基于Pytorch深度学习框架工具包。

其中训练完成的道路提取网络，通过以下步骤得到：

（2.1）获取待检测区域某颗光学遥感卫星上的多光谱和全色遥感影像，通过预处理获得相应的训练集和测试集；

所述对获取到的影像进行预处理包括：

获取3幅17600×17600像素的高分2号卫星全色和四分之一大小的多光谱影像，利用ENVI等专业软件，获得兼具多光谱和高分辨率的融合影像，并通过python编程，将融合影像和多光谱影像按400×400像素和100×100像素大小进行等比例裁剪。对小块中的道路区域进行标注，将标注的二值影像块放入有标签文件夹GT，将融合影像的小块影像块放入融合文件夹Fuse，相应的多光谱小块影像放入多光谱文件夹Multi，共计5000组训练数据切片；

对三个文件夹中，相应的所有影像，按对应的编号，将最终的数据，按4:1的比例进行随机划分为训练集和测试集，即随机抽取80%作为训练集，剩余的20%作为测试集；

（2.2）利用预先构建的神经网络模型对获取到的影像进行卷积和池化操作，得到两条支路、不同尺度的空间特征和光谱特征；利用卷积神经网络代替了人工设计的影像重采样方法，对多光谱影像各波段可根据目标自动学习最优的影像采样参数，并能将不同分辨率多光谱和融合影像的特征空间进行融合；

构建的卷积神经网络包括多光谱影像特征提取分支和融合影像特征提取分支，并且两条支路的深度相同，以保证多光谱影像能够获得更高级的语义信息，融合影像则负责提供详细的细节特征；多光谱影像特征提取分支和融合影像特征提取分支分别对相应的影像进行卷积、激活函数和池化操作，获取融合影像所在支路的输出特征与多光谱所在支路的输出特征，如图2所示；

如图3所示，为特征提取单元的结构，两个支路网络的特征提取单元均保持一致。由于多光谱影像的尺寸天然是融合影像的1/4，因此为保证二者的尺寸一致，对融合影像采用了三次特征提取单元，而多光谱影像则只用了一次，为了融合两条支路的特征，双路特征融合的具体融合策略分为：（a）分别对融合影像的第3-5个特征空间和融合影像的第1-3个特征空间，进行局部对称性特征融合；（b）对融合影像的第6个特征空间和融合影像的第4-6个语义空间，进行全局非对称性语义融合；

（2.3.1）预先构建的局部对称性特征融合模块包括特征聚合、缩放型Softmax激活函数（Scaled Softmax）和门控残差连接（gated residue connection），如图4所示，为局部对称性特征融合结构图

利用卷积操作，将多光谱影像输出特征进行特征聚合，即聚合为单一通道的特征图；

利用缩放型Softmax激活函数，对单通道特征图进行粗略的道路区域概率预测，得到粗略的概率预测结果；

基于粗略的概率预测结果，利用门控残差连接，对融合影像的特征图进行融合，获得更准确的道路提取特征图；

局部对称性特征融合模块相应的计算公式可以被表述为：

，

，

其中Conv表示卷积操作，Softmax _scaled表示缩放型Softmax激活函数，

表示融合影像经过第i个特征提取单元之后的输出特征，/>

表示融合影像的特征空间，/>

表示多光谱影像的特征空间；X _{F_i_out}表示经过两条支路上的特征图，经过局部对称性特征融合之后的结果；

（2.3.2）预先构建的全局非对称性语义融合模块包括金字塔池化和自注意力（self-attention）单元，如图5所示；

对于多光谱影像的多尺度特征图

c=1,n=(1+16)+(16+49)+(1+81)=169表示序列长度；

对于融合影像的特征图

，直接对其进行序列化展开，获得一维序列Q/>

,c=1,n=169；

对于多光谱和融合影像的一维序列，进行自注意力运算，并还原成相应尺寸的特征图，最为获得最终的特征提取结果Final _out，相应的计算公式为：

；

如图5所示，首先对多光谱特征空间

，分别进行金字塔池化，三层金字塔池化的尺度分别为9×9，4×4，1×1三种尺度；其次对其进行序列展开，获得81,16和1三种一维向量；然后，通过与原特征图的序列展开向量进行拼接，得到一个新的1×[(1+16)+ (16+49)+(1+81)]的向量K，并以此为基础创建向量V，相应的Q向量则是融合影像的特征图序列展开；最后通过Q×K^T×V获得最终的语义融合特征图。

由于全局非对称性语义融合模块是一种空间注意力模式，因此为了更好的处理语义融合特征图，还额外添加了通道注意力模块，从另一个方向提升语义融合特征图的准确性。具体来说，通过对语义融合特征图，使用一个1×1卷积和缩放的Sigmoid函数，获取不同通道的重要程度，并分别对语义特征融合图的不同通道进行赋值。

上述两种方法，不仅兼顾了网络的全局语义和局部细节特征，而且设计了空间和通道双重注意力机制，以此确保网络提取特征的准确性，从而提升道路提取网络的性能。

（2.3.3）预先构建的通道注意力模块包括全局均值池化、1×1卷积和缩放型Sigmoid激活函数（Scaled Sigmoid）；

对于特征提取结果Final _out，利用全局均值池化，获得多个通道的1×1特征；

利用1×1卷积和缩放型Sigmoid函数提升网络的非线性能力；

利用点乘的方法，实现对每张特征图的权重赋值；

（2.4）基于网络提取出的特征图和对应的标签图，通过解码器计算多路监督损失，通过不断迭代优化预设的道路提取网络的网络参数；解码器与“U²net：Going Deeper withNested U-Structure for Salient Object Detection”文章的设定保持一致；

计算多路监督损失，通过下式进行计算：

，

，/>

，上式中，Loss表示整个网络的所有监督损失之和，/>

表示融合影像所在支路的损失值，/>

表示融合影像所在支路的损失值，/>

表示二值交叉熵损失，/>

表示结构相似性损失，/>

表示注意力通道相应的操作，/>

表示人工标注的道路标签；

具体的，将多光谱影像和融合影像的特征图，放入局部对称性特征融合和全局非对称性语义融合通道中，然后通过解码器获取最终的道路提取结果。本发明所述方法的整体结构基于U²Nett结构，反卷积过程和融合影像的特征提取分支对应，通过设置不同步长的反卷积来到不同分辨率的提取结果。本发明使用二值交叉熵误差和结构相似性误差作为最终的损失函数。通过将不同分辨率的路网提取结果和道路标签一起代入损失函数，分别为获得Loss _Fused和Loss _Multi；最后利用反向传播算法，优化网络参数。该步骤能够实现对多种不同尺度的道路提取结果进行监督，提升所述顾及遥感数据特性和神经网络范式的路网提取方法在高分辨率遥感影像上的处理能力。

（2.5）利用训练集和测试集对优化后的道路提取网络进行训练和测试，得到训练完成的道路提取网络；包括如下具体步骤：利用步骤（2.1）中的训练数据，训练道路提取网络，网络中所有卷积核的初始化采用均值为0、方差为0.01的高斯分布，偏置的初始化采用固定值0.0，采用Adam优化算法，批次大小为8，初始学习率设为0.0001，前50个epoch保持不变，50个epoch后每15次减小为0.98，实际训练时每隔20个epoch，进行一次模型精度验证，共训练300个epoch后模型基本收敛。

根据以上步骤以卷积网络为基础，以利用多光谱影像和融合影像特征检测遥感影像中的道路为目标，建立一个有效的道路提取网络，达到了很好的路网提取精度。

以上所述发明同样可以推广到其他同类型多源数据道路提取任务，只需设置合适的采样参数。根据任务情况判断道路提取网络是否需要进行重新训练。若需要则按照步骤（2.1）建立多光谱影像和融合影像的训练数据，对网络重新进行训练，即可得到适用于多源遥感影像的道路提取网络。为了充分融合遥感影像数据和网路范式的优势，本发明提出了一种从上下文局部感知到全局的受多光谱影像引导的道路提取网络，以改善道路提取细节缺失现象，从而提高道路提取精度。

如图6所示，本发明实施例提供一种顾及遥感数据特性和神经网络范式的路网提取系统，包括：

本发明实施例提供一种顾及遥感数据特性和神经网络范式的路网提取设备，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行实施例一所述方法的步骤。

本发明实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现实施例一所述方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。