CN116778318A - 一种卷积神经网络遥感影像道路提取模型及方法 - Google Patents
一种卷积神经网络遥感影像道路提取模型及方法 Download PDFInfo
- Publication number
- CN116778318A CN116778318A CN202310582386.0A CN202310582386A CN116778318A CN 116778318 A CN116778318 A CN 116778318A CN 202310582386 A CN202310582386 A CN 202310582386A CN 116778318 A CN116778318 A CN 116778318A
- Authority
- CN
- China
- Prior art keywords
- features
- road
- module
- remote sensing
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 54
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 24
- 238000000034 method Methods 0.000 title claims description 20
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 239000000284 extract Substances 0.000 claims abstract description 9
- 238000012795 verification Methods 0.000 claims abstract description 7
- 238000011176 pooling Methods 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims description 2
- 230000004927 fusion Effects 0.000 abstract 1
- 230000006870 function Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/182—Network patterns, e.g. roads or rivers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种卷积神经网络遥感影像道路提取模型,其中编码器提取影像的不同层次的道路特征;多尺度特征编码模块利用不同尺度的卷积层提取道路特征的不同尺度的特征,对不同尺度的特征进行聚合;长距离上下文感知模块分别在空间维度和通道维度获取长距离上下文,融合后输出至解码器;解码器将特征图恢复至输入原始影像的尺寸。本发明还公开一种卷积神经网络遥感影像道路提取方法,利用测试集和验证集对卷积神经网络遥感影像道路提取模型进行训练,得到训练好的模型;利用训练好的模型,对测试集中的影像进行预测,得到该影像的道路提取结果。本发明能够有效提高遥感影像道路提取精度,为城市规划、路网更新等遥感应用提供技术支持。
Description
技术领域
本发明属于及遥感影像地物信息提取技术领域,具体涉及利用一种卷积神经网络遥感影像道路提取模型及方法,利用卷积神经网络来提取遥感影像中的道路。
背景技术
高分辨率遥感技术的快速发展为地物提取提供了海量的数据支撑,促进了地物提取技术的发展。道路提取是遥感影像解译的研究热点,对于城市规划、路网信息更新、车辆导航、应急救灾等多个领域至关重要。
遥感影像背景复杂以及影像中道路复杂多样等因素使得现有遥感影像道路提取方法存在难以克服的技术问题,主要表现为:遥感影像中的道路跨度长,形状不规则,粗细不一;影像中道路容易被树木、建筑物遮挡,难以保持自然连通性,这些问题最终会导致传统提取方法精度较低,不能满足当前城市规划、路网更新等领域的遥测应用需求。
发明内容
本发明的目的在于克服上述缺陷,提供一种卷积神经网络遥感影像道路提取模型及方法,解决了传统卷积神经网络方法提取遥感影像道路精度较低的技术问题,本发明能够有效提高遥感影像道路提取精度,为城市规划、路网更新等遥感应用提供技术支持。
为实现上述发明目的,本发明提供如下技术方案:
一种卷积神经网络遥感影像道路提取模型,包括编码器、多尺度特征编码模块、长距离上下文感知模块和解码器;
编码器用于提取影像的不同层次的道路特征,将道路特征输出至多尺度特征编码模块;
多尺度特征编码模块利用不同尺度的卷积层提取道路特征的不同尺度的特征,对不同尺度的特征进行聚合后得到聚合后的多尺度特征,将聚合后的多尺度特征输出至长距离上下文感知模块;
长距离上下文感知模块基于聚合后的多尺度特征,分别在空间维度和通道维度获取长距离上下文,将在空间维度和通道维度获取的长距离上下文相加融合后所得特征图输出至解码器;
解码器将由长距离上下文感知模块输入的特征图恢复至输入编码器影像的尺寸。
进一步的,编码器采用特征提取网络ResNet34,ResNet34网络结构的四个阶段分别作为四个编码器子模块。
进一步的,多尺度特征编码模块包含三个分支,三个分支分别利用1×1、3×3和5×5三个不同尺度的卷积层提取道路特征的不同尺度的特征。
进一步的,多尺度特征编码模块对不同尺度的特征进行聚合的方法包括:
三个分支中,前一分支的输出特征与当前分支的第一个卷积层的输出特征进行融合,融合后的特征通过当前分支的第二个卷积层进行特征优化,得到当前分支的输出特征;
将各分支的输出特征级联后通过1×1卷积层进行维度约减,最后以残差连接的方式将维度约减后的特征与输入多尺度特征编码模块特征相加得到多尺度特征编码模块的输出特征。
进一步的,长距离上下文感知模块包括并联的条带池化模块SPM和通道注意力模块CAM,条带池化模块SPM和通道注意力模块CAM的输入特征均为由多尺度特征编码模块输入的聚合后的多尺度特征,条带池化模块SPM和通道注意力模块CAM的输出特征分别为在空间维度和通道维度获取的长距离上下文。
进一步的,条带池化模块SPM包含两条并行的路径;
第一条路径依次执行垂直的H×1条带池化操作和3×1的一维卷积扩展为H×W的特征;
第二条路径依次执行水平的1×W条带池化操作和1×3的一维卷积扩展为H×W的特征;
将两条路径所得特征相加并经过1×1卷积层和Sigmoid函数后,与条带池化模块SPM的输入特征进行相乘得到条带池化模块SPM的输出特征。
进一步的,通道注意力模块CAM的输入特征分别通过全局平均池化和全局最大池化后,输入到两个1×1卷积层中,所得输出结果相加后输入到Sigmoid函数得到通道注意力权重,将通道注意力权重与通道注意力模块CAM的输入特征相乘得到通道注意力模块CAM的输出特征。
进一步的,解码器包括1×1卷积层、3×3的转置卷积层和1×1卷积层。
一种卷积神经网络遥感影像道路提取方法,采用上述一种卷积神经网络遥感影像道路提取模型实现,包括:
将原始数据集划分为训练集、验证集和测试集;原始数据集包括影像及其对应的标签;
将训练集和验证集中的影像及其对应的标签进行裁剪,得到裁剪后的影像及其对应的标签;
利用裁剪后的影像及其对应的标签对卷积神经网络遥感影像道路提取模型进行训练,得到训练好的模型;
利用训练好的模型,对测试集中的影像进行预测,得到该影像的道路提取结果。
进一步的,原始数据集采用DeepGlobe数据集;
所述提取方法还包括根据影像的道路提取结果进行精度评价,精度评价指标包括交并比IoU、精确率Precision、查全率Recall或F1值。
本发明与现有技术相比具有如下至少一种有益效果:
(1)本发明创造性的提出了一种卷积神经网络遥感影像道路提取模型,采用多尺度特征编码模块来聚合道路的多尺度特征,以适应不同尺度道路的差异性变化,提高道路提取精度;
(2)本发明设计了长距离上下文感知模块,该模块从空间和通道两个维度获取长距离上下文,以提高道路提取结果的连续性;
(3)本发明能够有效提高遥感影像道路提取精度,为城市规划、路网更新等遥感应用提供技术支持。
附图说明
图1为本发明遥感影像道路提取方法的流程图;
图2为本发明提供的一种新型卷积神经网络遥感影像道路提取模型结构图;
图3为本发明提供的多尺度特征编码模块结构图;
图4为本发明提供的长距离上下文感知模块结构图;
图5为本发明提供的道路提取方法使用的DeepGlobe数据集中的遥感影像;
图6为本发明提供的道路提取方法使用的DeepGlobe数据集中的标签;
图7为本发明提供的道路提取方法的道路提取结果。
具体实施方式
下面通过对本发明进行详细说明,本发明的特点和优点将随着这些说明而变得更为清楚、明确。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
本发明针对遥感影像道路提取难点和挑战,围绕道路对象在遥感影像中的目标特性,突破传统卷积神经网络方法的局限,引入多尺度特征编码以有效融合不同尺度的道路特征,并在空间、通道两个维度获取长距离上下文以改善道路被遮挡问题,弥补基础卷积神经网络方法的不足,提高遥感影像道路提取精度,为城市规划、路网更新等遥感应用提供技术支持。
本发明卷积神经网络遥感影像道路提取方法如下:
步骤1:遥感影像道路数据集构建
(1)数据划分。在一种具体实施方式中,本发明以DeepGlobe数据集为实验数据。将原数据集影像和标签按比例随机划分为训练集、验证集和测试集。
(2)数据裁剪。将训练集和验证集中原始尺寸的影像和标签裁剪为小尺寸的影像和标签。
步骤2:道路提取网络模型搭建
本发明提出的道路提取网络模型由编码器、多尺度特征编码模块、长距离上下文感知模块和解码器构成。
(1)编码器。采用ResNet34作为编码器来提取影像中的道路特征。ResNet34可以提取不同层次的特征信息,浅层特征包含更多道路细节信息,深层特征包含更多的语义信息。ResNet34网络结构的四个阶段作为四个编码器子模块。
(2)多尺度特征编码模块。多尺度特征编码模块(Multi-scale Feature EncodingModule,MFEM)的核心思想是利用1×1、3×3和5×5三个不同尺寸的卷积核来聚合多尺度特征。不同大小的卷积核可以提取不同尺度的特征,将其聚合后可以为下一阶段提供多尺度的特征表示。将多尺度特征编码模块添加在了跳跃连接部分,目的是在骨干网络的不同阶段提取并聚合多尺度特征,然后为解码过程提供具有不同尺度的特征信息,从而增强网络对不同大小道路的提取能力。
(3)长距离上下文感知模块。长距离上下文感知模块(Long-range Context AwareModule,LCAM)由条带池化模块(Strip Pooling Module,SPM)和通道注意力模块(ChannelAttention Module,CAM)并联而成。SPM用来在空间维度获取长距离上下文,CAM的作用是在通道维度获取长距离上下文。将特征分别输入到SPM模块和CAM模块,并将结果相加融合后得到LCAM模块的输出特征。
(4)解码器。解码器由多个子解码器模块构成,通过多次上采样操作将分辨率降低后的特征图恢复至输入影像的尺寸。
步骤3:网络模型训练
模型训练时对输入数据进行镜像、旋转等方式的在线数据增强处理,然后利用增强后的数据来训练网络模型。训练网络模型时,首先初始化网络参数,然后前向传播计算模型预测结果和标签之间的损失函数,然后利用损失函数对模型的权重参数进行逐层更新。通过反复迭代训练实现模型参数的最优化。
步骤4:模型预测
模型预测是将一张影像输入到训练好的网络模型,输出模型对影像的道路提取结果。
步骤5:模型精度评价
对测试集全部影像进行预测得到预测结果,并利用测试集标签进行精度评价。评价指标包括交并比(IoU)、精确率(Precision)、查全率(Recall)、F1值。
本发明在编码器-解码器网络结构的基础上,提出了多尺度特征编码模块来提取不同尺度的道路特征,以适应不同尺寸的道路;同时,本发明提出了长距离上下文感知模块,该模块由条带池化模块和通道注意力模块并联而成,分别从空间维度和通道维度来获取长距离上下文,以提高道路提取结果的连续性。
实施例:
本实施例提供了一种新型卷积神经网络遥感影像道路提取方法,该方法的操作流程如图1所示,具体包括以下步骤:
S1:对数据集的影像进行预处理,构建用于训练、测试的遥感影像道路数据集。
S2:对基础网络模型LinkNet34进行改进,添加多尺度特征编码模块和长距离上下文感知模块,构建本发明道路提取网络模型。
S3:结合数据集对所述网络模型进行训练
S4:利用训练完成后的网络模型对测试集影像进行预测,得到预测结果。
S5:利用测试集标签对测试集预测结果进行精度评价。
具体的,步骤S1的实施方式如下:
首先,将如图5和图6的DeepGlobe道路数据集中6226张1024×1024的影像进行划分,得到3756张训练影像、940张验证影像和1530张测试影像。为了在有限的显存条件下训练模型,将训练集和验证集影像裁剪为512×512尺寸的小图,测试集影像保持原始尺寸。最终,该数据集包含15024张训练小图,3760张验证小图和1530张原始尺寸的测试影像。
具体的,步骤S2的实施方式如下:
如图2,本发明道路提取网络模型由编码器、多尺度特征编码模块、长距离上下文感知模块和解码器构成。基础模型为LinkNet34,编码器由特征提取网络ResNet34构成。解码器子模块由Conv 1×1、用于上采样的转置卷积和Conv 1×1组合而成。
如图3,多尺度特征编码模块包含三个分支,在三个分支中,输入特征首先分别通过1×1、3×3和5×5的卷积层来提取不同尺度的特征。为了实现不同尺度特征的有效聚合,前一分支的输出特征与当前分支的第一个卷积层的输出特征进行融合,融合后的特征通过当前分支的第二个卷积层进行特征优化,得到当前分支的输出特征,例如第一分支包含一个1×1卷积层,第二分支包含两个3×3卷积层,第三分支包含两个5×5卷积层,第一分支的输出特征与当前分支第二分支的第一个3×3卷积层的输出特征进行融合,融合后的特征通过第二分支的第二个3×3卷积层进行特征优化,得到第二分支的输出特征,第二分支的输出特征与第三分支的第一个5×5卷积层的输出特征进行融合,融合后的特征通过第三分支的第二个5×5卷积层进行特征优化,得到第三分支的输出特征,第一分支的输出特征为多尺度特征编码模块的输入特征通过一个1×1卷积层进行特征优化后得到的特征。再将各分支输出特征级联后通过1×1卷积层进行维度约减,最后以残差连接的方式将维度约减所得特征与输入多尺度特征编码的特征相加得到该模块的输出特征。
如图4,长距离上下文感知模块的SPM模块由两条并行的路径构成,分别包含垂直的H×1和水平的1×W条带池化操作,在条带池化之后分别是3×1和1×3的一维卷积。然后,分别扩展为H×W的特征后相加,并经过1×1卷积层与Sigmoid函数后与SPM模块的输入特征进行相乘得到SPM模块的输出特征。CAM模块输入特征分别通过全局平均池化和全局最大池化后,输入到两个1×1卷积层中,并将输出结果相加后输入到Sigmoid函数得到通道注意力权重,然后与CAM模块输入特征相乘得到CAM模块的输出特征。SPM模块和CAM模块的输出特征相加后,得到长距离上下文感知模块的输出特征。
解码器模块由1×1卷积、3×3的转置卷积和1×1卷积构成。
具体的,步骤S3的实施方式如下:
为了增强模型的泛化能力,对训练数据进行随机地旋转、水平镜像、垂直镜像、高斯模糊以实现数据增强。优化器为SGD,batch size设置为4。初始学习率设置为0.01,并且采用了“poly”学习率下降策略。
模型训练采用的损失函数为LossBCE+LossDice。LossBCE是二分类语义分割任务常用的损失函数,计算公式如下:
其中,N表示图像像素数量,gi表示第i个像素标签的值,pi表示对应像素的预测概率值。
为了改善样本不均衡的问题,在LossBCE的基础上综合了损失函数LossDice。LossDice的计算公式如下:
其中,N表示图像像素数量,gi表示第i个像素标签的值,pi表示对应像素的预测概率值。
具体的,步骤S4的实施方式如下:
将待测试影像输入到训练好的网络模型中,对输入影像进行预测,预测阈值为0.5,预测结果为包含0和255两个像素值的二值影像。如图7,白色表示道路,黑色表示背景。
具体的,步骤S5的实施方式如下:
本发明使用四个评估指标来衡量各模型道路提取结果的精度,包括IoU、Precision、Recall和F1值。IoU表示预测结果和标签的交集与并集之比。Precision表示在预测为道路的像素中正确预测的比例。Recall表示正确预测为道路的像素在所有道路像素中所占的比例。F1值是Precision和Recall的调和平均数。以上四个指标的计算公式分别如下所示:
其中,TP(True Positives)表示被正确预测为道路类别的道路像素数量,FP(False Positives)表示被错误预测为道路类别的背景像素数量,FN(False Negatives)表示被错误预测为背景类别的道路像素数量。
本发明提出的道路提取方法在DeepGlobe测试集上的精度如表1所示,表明采用本发明方法可以获得较高的提取精度:
表1本发明方法所得道路提取精度
IoU | Precision | Recall | F1 |
0.6515 | 0.7839 | 0.7941 | 0.789 |
以上结合具体实施方式和范例性实例对本发明进行了详细说明,不过这些说明并不能理解为对本发明的限制。本领域技术人员理解,在不偏离本发明精神和范围的情况下,可以对本发明技术方案及其实施方式进行多种等价替换、修饰或改进,这些均落入本发明的范围内。本发明的保护范围以所附权利要求为准。
本发明说明书中未作详细描述的内容属本领域技术人员的公知技术。
Claims (10)
1.一种卷积神经网络遥感影像道路提取模型,其特征在于,包括编码器、多尺度特征编码模块、长距离上下文感知模块和解码器;
编码器用于提取影像的不同层次的道路特征,将道路特征输出至多尺度特征编码模块;
多尺度特征编码模块利用不同尺度的卷积层提取道路特征的不同尺度的特征,对不同尺度的特征进行聚合后得到聚合后的多尺度特征,将聚合后的多尺度特征输出至长距离上下文感知模块;
长距离上下文感知模块基于聚合后的多尺度特征,分别在空间维度和通道维度获取长距离上下文,将在空间维度和通道维度获取的长距离上下文相加融合后所得特征图输出至解码器;
解码器将由长距离上下文感知模块输入的特征图恢复至输入编码器影像的尺寸。
2.根据权利要求1所述的一种卷积神经网络遥感影像道路提取模型,其特征在于,编码器采用特征提取网络ResNet34,ResNet34网络结构的四个阶段分别作为四个编码器子模块。
3.根据权利要求1所述的一种卷积神经网络遥感影像道路提取模型,其特征在于,多尺度特征编码模块包含三个分支,三个分支分别利用1×1、3×3和5×5三个不同尺度的卷积层提取道路特征的不同尺度的特征。
4.根据权利要求3所述的一种卷积神经网络遥感影像道路提取模型,其特征在于,多尺度特征编码模块对不同尺度的特征进行聚合的方法包括:
三个分支中,前一分支的输出特征与当前分支的第一个卷积层的输出特征进行融合,融合后的特征通过当前分支的第二个卷积层进行特征优化,得到当前分支的输出特征;
将各分支的输出特征级联后通过1×1卷积层进行维度约减,最后以残差连接的方式将维度约减后的特征与输入多尺度特征编码模块特征相加得到多尺度特征编码模块的输出特征。
5.根据权利要求1所述的一种卷积神经网络遥感影像道路提取模型,其特征在于,长距离上下文感知模块包括并联的条带池化模块SPM和通道注意力模块CAM,条带池化模块SPM和通道注意力模块CAM的输入特征均为由多尺度特征编码模块输入的聚合后的多尺度特征,条带池化模块SPM和通道注意力模块CAM的输出特征分别为在空间维度和通道维度获取的长距离上下文。
6.根据权利要求5所述的一种卷积神经网络遥感影像道路提取模型,其特征在于,条带池化模块SPM包含两条并行的路径;
第一条路径依次执行垂直的H×1条带池化操作和3×1的一维卷积扩展为H×W的特征;
第二条路径依次执行水平的1×W条带池化操作和1×3的一维卷积扩展为H×W的特征;
将两条路径所得特征相加并经过1×1卷积层和Sigmoid函数后,与条带池化模块SPM的输入特征进行相乘得到条带池化模块SPM的输出特征。
7.根据权利要求5所述的一种卷积神经网络遥感影像道路提取模型,其特征在于,通道注意力模块CAM的输入特征分别通过全局平均池化和全局最大池化后,输入到两个1×1卷积层中,所得输出结果相加后输入到Sigmoid函数得到通道注意力权重,将通道注意力权重与通道注意力模块CAM的输入特征相乘得到通道注意力模块CAM的输出特征。
8.根据权利要求1所述的一种卷积神经网络遥感影像道路提取模型,其特征在于,解码器包括1×1卷积层、3×3的转置卷积层和1×1卷积层。
9.一种卷积神经网络遥感影像道路提取方法,其特征在于,采用权利要求1-8任一项所述的一种卷积神经网络遥感影像道路提取模型实现,包括:
将原始数据集划分为训练集、验证集和测试集;原始数据集包括影像及其对应的标签;
将训练集和验证集中的影像及其对应的标签进行裁剪,得到裁剪后的影像及其对应的标签;
利用裁剪后的影像及其对应的标签对卷积神经网络遥感影像道路提取模型进行训练,得到训练好的模型;
利用训练好的模型,对测试集中的影像进行预测,得到该影像的道路提取结果。
10.根据权利要求9所述的一种卷积神经网络遥感影像道路提取方法,其特征在于,原始数据集采用DeepGlobe数据集;
所述提取方法还包括根据影像的道路提取结果进行精度评价,精度评价指标包括交并比IoU、精确率Precision、查全率Recall或F1值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310582386.0A CN116778318A (zh) | 2023-05-22 | 2023-05-22 | 一种卷积神经网络遥感影像道路提取模型及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310582386.0A CN116778318A (zh) | 2023-05-22 | 2023-05-22 | 一种卷积神经网络遥感影像道路提取模型及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116778318A true CN116778318A (zh) | 2023-09-19 |
Family
ID=87988663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310582386.0A Pending CN116778318A (zh) | 2023-05-22 | 2023-05-22 | 一种卷积神经网络遥感影像道路提取模型及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116778318A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117593639A (zh) * | 2023-11-21 | 2024-02-23 | 北京天鼎殊同科技有限公司 | 公路及其附属物的提取方法、装置、设备及介质 |
CN117809181A (zh) * | 2023-12-27 | 2024-04-02 | 太原理工大学 | 一种高分遥感影像水体提取网络模型及方法 |
CN117975295A (zh) * | 2024-04-01 | 2024-05-03 | 南京信息工程大学 | 一种基于多尺度特征感知神经网络的积雪深度预测方法 |
-
2023
- 2023-05-22 CN CN202310582386.0A patent/CN116778318A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117593639A (zh) * | 2023-11-21 | 2024-02-23 | 北京天鼎殊同科技有限公司 | 公路及其附属物的提取方法、装置、设备及介质 |
CN117593639B (zh) * | 2023-11-21 | 2024-05-28 | 北京天鼎殊同科技有限公司 | 公路及其附属物的提取方法、装置、设备及介质 |
CN117809181A (zh) * | 2023-12-27 | 2024-04-02 | 太原理工大学 | 一种高分遥感影像水体提取网络模型及方法 |
CN117975295A (zh) * | 2024-04-01 | 2024-05-03 | 南京信息工程大学 | 一种基于多尺度特征感知神经网络的积雪深度预测方法 |
CN117975295B (zh) * | 2024-04-01 | 2024-06-18 | 南京信息工程大学 | 一种基于多尺度特征感知神经网络的积雪深度预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110136170B (zh) | 一种基于卷积神经网络的遥感影像建筑物变化检测方法 | |
CN116778318A (zh) | 一种卷积神经网络遥感影像道路提取模型及方法 | |
CN112668494A (zh) | 基于多尺度特征提取的小样本变化检测方法 | |
CN113642390B (zh) | 一种基于局部注意力网络的街景图像语义分割方法 | |
CN110853057B (zh) | 基于全局和多尺度全卷积网络的航拍图像分割方法 | |
CN113780296A (zh) | 基于多尺度信息融合的遥感图像语义分割方法及系统 | |
CN114359130B (zh) | 一种基于无人机影像的道路裂缝检测方法 | |
CN112381097A (zh) | 一种基于深度学习的场景语义分割方法 | |
CN111259853A (zh) | 一种高分辨率遥感图像变化检测方法、系统及装置 | |
CN114821342B (zh) | 一种遥感影像道路提取方法及系统 | |
CN112489054A (zh) | 一种基于深度学习的遥感图像语义分割方法 | |
CN112163520B (zh) | 一种基于改进损失函数的mdssd人脸检测方法 | |
CN116524361A (zh) | 基于双孪生分支的遥感图像变化检测网络及检测方法 | |
CN116206112A (zh) | 基于多尺度特征融合和sam的遥感图像语义分割方法 | |
CN113066089B (zh) | 一种基于注意力引导机制的实时图像语义分割方法 | |
CN113887472B (zh) | 基于级联颜色及纹理特征注意力的遥感图像云检测方法 | |
CN113658200A (zh) | 基于自适应特征融合的边缘感知图像语义分割方法 | |
CN115471754A (zh) | 一种基于多维多尺度U-net网络的遥感图像道路提取方法 | |
CN115984714B (zh) | 一种基于双分支网络模型的云检测方法 | |
CN116310339A (zh) | 基于矩阵分解增强全局特征的遥感图像分割方法 | |
CN115937693A (zh) | 一种基于遥感图像的道路识别方法及系统 | |
CN117351372A (zh) | 一种基于改进DeeplabV3+的遥感图像道路分割方法 | |
CN116309485A (zh) | 一种改进UNet网络结构的路面裂缝检测方法 | |
CN116363361A (zh) | 基于实时语义分割网络的自动驾驶方法 | |
CN114155524A (zh) | 单阶段3d点云目标检测方法及装置、计算机设备、介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |