CN115115647A - 一种融合注意力机制和残差aspp的遥感影像语义分割方法 - Google Patents

一种融合注意力机制和残差aspp的遥感影像语义分割方法 Download PDF

Info

Publication number
CN115115647A
CN115115647A CN202210691801.1A CN202210691801A CN115115647A CN 115115647 A CN115115647 A CN 115115647A CN 202210691801 A CN202210691801 A CN 202210691801A CN 115115647 A CN115115647 A CN 115115647A
Authority
CN
China
Prior art keywords
residual
aspp
remote sensing
attention mechanism
sensing image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210691801.1A
Other languages
English (en)
Other versions
CN115115647B (zh
Inventor
刘润瑞
周侗
吕亚乔
秦广辉
徐林飞
陶菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong University
Original Assignee
Nantong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong University filed Critical Nantong University
Priority to CN202210691801.1A priority Critical patent/CN115115647B/zh
Publication of CN115115647A publication Critical patent/CN115115647A/zh
Application granted granted Critical
Publication of CN115115647B publication Critical patent/CN115115647B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10032Satellite or aerial image; Remote sensing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种融合注意力机制和残差ASPP的遥感影像语义分割方法,包括以下方法;步骤S1:构建融合注意力机制和残差ASPP的神经网络;步骤S2:训练步骤S1中构建的融合注意力机制和残差ASPP的神经网络;步骤S3:利用步骤S2中训练好的模型,进行遥感影像语义分割,具体的,通过将获取的遥感图像输入到步骤S2训练好的融合注意力机制和残差ASPP的语义分割模型中进行遥感图像语义分割。本发明采用注意力机制与残差结构对现有模型进行改进,提出了一种融合注意力机制和残差ASPP的遥感影像语义分割算法模型,其采用训练集和验证集对该模型进行训练、验证,高效、准确地分割遥感影像的地物类别,实现注意力机制与残差结构在ASPP模型之中的嵌入式使用,提高语义分割的准确率。

Description

一种融合注意力机制和残差ASPP的遥感影像语义分割方法
技术领域
本发明涉及一种融合注意力机制和残差ASPP的遥感影像语义分割方法,属于自然资源管理和城市规划领域。
背景技术
随着遥感技术的发展,遥感影像提供的覆盖范围越来越广,空间分辨率越来越高,近年来遥感图像的分辨率已经达到了厘米级别。技术进步产生了更多的冗余图像信息和噪声,遥感影像语义分割的任务变得更有挑战性,传统的语义分割方法只考虑每个像素的数字值,与周围的其他像素分开,存在分类精度低和难以适应复杂样例的局限性。
发明内容
针对上述现有技术存在的问题,本发明提供一种融合注意力机制和残差ASPP的遥感影像语义分割方法,从而解决上述技术问题。
为了实现上述目的,本发明采用的技术方案是:一种融合注意力机制和残差ASPP的遥感影像语义分割方法,其特征在于,包括以下方法;
步骤S1:构建融合注意力机制和残差ASPP的神经网络;
步骤S2:训练步骤S1中构建的融合注意力机制和残差ASPP的神经网络;
步骤S3:利用步骤S2中训练好的模型,进行遥感影像语义分割,具体的,通过将获取的遥感图像输入到步骤S2训练好的融合注意力机制和残差ASPP的语义分割模型中进行遥感图像语义分割。
进一步的,所述步骤S1中融合注意力机制和残差ASPP的神经网络的构建以编码器-解码器作为基础结构,其中模型内融合有ASPP模块,注意力机制和残差结构;。
进一步的,所述编码器利用注意力机制和残差结构对所述ASPP模块进行了改进进而形成包含5个空洞卷积注意力单元和1个残差单元的残差ASPP模块;所述解码器用于接收编码器输出的浅层和深层特征,具体的,将浅层特征输入注意力模块,并使用1×1卷积进行处理,将深层特征进行8倍上采样处理,然后将处理后的浅层特征与深层特征融合,融合后的特征用3×3卷积进行处理,进行8倍上采样处理,经过卷积与上采样处理最终得到网络的预测依据。
进一步的,所述注意力机制采用Dual Attention(DA)模块来预测道路,荒地和森林;通过采用The convolutional block attention module(CBAM)模块来预测背景,水体,建筑。
进一步的,所述步骤S2的具体方法为:
S21:从开源的遥感影像数据集(LoveDA)获取遥感影像的数据集,并将其按8:1:1的比例划分为训练集、验证集和测试集。
S22:将数据预处理后的遥感图像输入步骤S1构建的融合注意力机制和残差ASPP的模型中进行训练。
进一步的,所述步骤S22的具体方法为:
S221:遥感图像输入融合注意力机制和残差ASPP的语义分割网络模型中,前向传播获得语义分割网络模型输出的遥感影像样本地物类型的形状信息;
S222:采用损失函数计算预测结果与实际结果之间的损失并通过反向传播算法来不断优化模型的参数,损失函数使用DiceLoss+CELoss;
其损失函数计算公式如下:
Figure BDA0003700205340000021
Figure BDA0003700205340000022
Figure BDA0003700205340000023
Figure BDA0003700205340000024
Total Loss=LCE+Ldice (5)。
本发明的有益效果是:与现有技术相比,本发明采用注意力机制与残差结构对现有模型进行改进,提出了一种融合注意力机制和残差ASPP的遥感影像语义分割算法模型。采用训练集和验证集对该模型进行训练、验证,高效、准确地分割遥感影像的地物类别,实现注意力机制与残差结构在ASPP模型之中的嵌入式使用,提高语义分割的准确率。
附图说明
图1为本发明提供的一种融合注意力机制和残差ASPP的遥感影像语义分割方法流程图;
图2是本发明实施例中构建的融合注意力机制和残差ASPP的遥感影像语义分割算法模型的结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面通过附图及实施例,对本发明进行进一步详细说明。但是应该理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限制本发明的范围。
除非另有定义,本文所使用的所有的技术术语和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同,本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
如图1所示,本实施例提供的一种融合注意力机制和残差ASPP的遥感影像语义分割方法(RAANet),包括以下步骤:
S1.构建融合注意力机制和残差ASPP的神经网络。
基于编码器-解码器的基础架构,在编码器中采用Xception NetWork作为骨干网络,将输入的特征分为浅层特征和深层特征。其深层特征通过一个注意力模块(CBAM),再将其分别输入到残差单元和五个空洞卷积率为3,6,12,18,24的注意力空洞卷积单元,将每个空洞卷积注意力单元的输出与残差单元的输出进行矩阵加法,再将五个空洞卷积注意力单元的结果堆叠起来,然后1×1卷积整合特征并输出。
在解码器中,先将编码器输出的浅层特征输入至注意力模块中,用1×1卷积整合特征,再将编码器中最后输出的深层特征进行8倍上采样,堆叠组合后经过卷积核大小为3×3的卷积层,再进行8倍上采样。
S2.训练融合注意力机制和残差ASPP的神经网络。
S21.从开源的LoveDA中获取遥感影像的数据集,并将其按8:1:1的比例划分为训练集、验证集和测试集。
S22.选用Adam作为优化器,并设置等间隔调整学习率,调整间隔为1,学习率调整倍数为0.92,损失函数使用DiceLoss+CELoss。
其损失函数计算公式如下:
Figure BDA0003700205340000041
Figure BDA0003700205340000042
Figure BDA0003700205340000043
Figure BDA0003700205340000044
Total Loss=LCE+Ldice (5)。
S23.将从数据集中获取的数据输入至S1中所构建的融合注意力机制和残差ASPP的神经网络模型之中,然后再利用反向传播算法,对模型进行训练。
S3.利用训练好的融合注意力机制和残差ASPP的神经网络进行遥感图像语义分割。
S31.将遥感图像输入步骤S2训练好的融合注意力机制和残差ASPP的语义分割模型中进行遥感图像语义分割。进行语义分割后,利用精度,召回率,和交并比三个指标对模型进行评估。各地物类型的评价结果如表1所示,对比PSPNet,U-Net和DeeplabV3plus都有较大提升,由此可见本模型在遥感影像语义分割上效果出色。
表1
Figure BDA0003700205340000051
本发明实施例中所采集的遥感影像样本来自LovaDA数据集,遥感影像数据共包含5987张3米分辨率的遥感影像。具体环境为Pycharm和ArcGIS软件平台以及GeForce RTX3060GPU等硬件平台,利用Python及其相关库进行开发实验,如Numpy、Pytorch、PIL、Opencv等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种融合注意力机制和残差ASPP的遥感影像语义分割方法,其特征在于,包括以下方法;
步骤S1:构建融合注意力机制和残差ASPP的神经网络;
步骤S2:训练步骤S1中构建的融合注意力机制和残差ASPP的神经网络;
步骤S3:利用步骤S2中训练好的模型,进行遥感影像语义分割,具体的,通过将获取的遥感图像输入到步骤S2训练好的融合注意力机制和残差ASPP的语义分割模型中进行遥感图像语义分割。
2.根据权利要求1所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法,其特征在于,所述步骤S1中融合注意力机制和残差ASPP的神经网络的构建以编码器-解码器作为基础结构,其中模型内融合有ASPP模块,注意力机制和残差结构。
3.根据权利要求2所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法,其特征在于,所述编码器利用注意力机制和残差结构对所述ASPP模块进行了改进,进而形成包含5个空洞卷积注意力单元和1个残差单元的残差ASPP模块;所述解码器用于接收编码器输出的浅层和深层特征,具体的,将浅层特征输入注意力模块,并使用1×1卷积进行处理,将深层特征进行8倍上采样处理,然后将处理后的浅层特征与深层特征融合,融合后的特征用3×3卷积进行处理,进行8倍上采样处理,经过卷积与上采样处理最终得到网络的预测依据。
4.根据权利要求2所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法,其特征在于,所述注意力机制采用DualAttention(DA)模块来预测道路,荒地和森林;通过采用The convolutional block attention module(CBAM)模块来预测背景,水体,建筑。
5.根据权利要求1所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法,其特征在于,所述步骤S2的具体方法为:
S21:从开源的遥感影像数据集(LoveDA)获取遥感影像的数据集,并将其按8:1:1的比例划分为训练集、验证集和测试集。
S22:将数据预处理后的遥感图像输入步骤S1构建的融合注意力机制和残差ASPP的模型中进行训练。
6.根据权利要求5所述的一种融合注意力机制和残差ASPP的遥感影像语义分割方法,其特征在于,所述步骤S22的具体方法为:
S221:遥感图像输入融合注意力机制和残差ASPP的语义分割网络模型中,前向传播获得语义分割网络模型输出的遥感影像样本地物类型的形状信息;
S222:采用损失函数计算预测结果与实际结果之间的损失并通过反向传播算法来不断优化模型的参数,损失函数使用DiceLoss+CELoss;
其损失函数计算公式如下:
Figure FDA0003700205330000021
Figure FDA0003700205330000022
Figure FDA0003700205330000023
Figure FDA0003700205330000024
Total Loss=LCE+Ldice (5)
上式中,N代表样本的总数,ti代表目标值;yi代表预测值;I代表目标值乘预测值的和;U代表;U表示预测值和目标值的和,ε表示平滑系数,在本发明中取1e-5,K表示类别数,
Figure FDA0003700205330000025
是预测的可能类别分布,y是真实类别分布。
CN202210691801.1A 2022-06-17 2022-06-17 一种融合注意力机制和残差aspp的遥感影像语义分割方法 Active CN115115647B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210691801.1A CN115115647B (zh) 2022-06-17 2022-06-17 一种融合注意力机制和残差aspp的遥感影像语义分割方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210691801.1A CN115115647B (zh) 2022-06-17 2022-06-17 一种融合注意力机制和残差aspp的遥感影像语义分割方法

Publications (2)

Publication Number Publication Date
CN115115647A true CN115115647A (zh) 2022-09-27
CN115115647B CN115115647B (zh) 2024-09-27

Family

ID=83328418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210691801.1A Active CN115115647B (zh) 2022-06-17 2022-06-17 一种融合注意力机制和残差aspp的遥感影像语义分割方法

Country Status (1)

Country Link
CN (1) CN115115647B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115546647A (zh) * 2022-10-21 2022-12-30 河北省科学院地理科学研究所 一种基于遥感影像的语义分割模型
CN116844051A (zh) * 2023-07-10 2023-10-03 贵州师范大学 一种融合aspp和深度残差的遥感图像建筑物提取方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807210A (zh) * 2021-08-31 2021-12-17 西安理工大学 一种基于金字塔切分注意力模块的遥感图像语义分割方法
WO2022100495A1 (zh) * 2020-11-11 2022-05-19 上海健康医学院 一种磨玻璃样肺结节自动分割方法及计算机设备
CN114596500A (zh) * 2022-01-12 2022-06-07 南通大学 一种基于通道-空间注意力和DeeplabV3plus的遥感影像语义分割方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022100495A1 (zh) * 2020-11-11 2022-05-19 上海健康医学院 一种磨玻璃样肺结节自动分割方法及计算机设备
CN113807210A (zh) * 2021-08-31 2021-12-17 西安理工大学 一种基于金字塔切分注意力模块的遥感图像语义分割方法
CN114596500A (zh) * 2022-01-12 2022-06-07 南通大学 一种基于通道-空间注意力和DeeplabV3plus的遥感影像语义分割方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115546647A (zh) * 2022-10-21 2022-12-30 河北省科学院地理科学研究所 一种基于遥感影像的语义分割模型
CN116844051A (zh) * 2023-07-10 2023-10-03 贵州师范大学 一种融合aspp和深度残差的遥感图像建筑物提取方法
CN116844051B (zh) * 2023-07-10 2024-02-23 贵州师范大学 一种融合aspp和深度残差的遥感图像建筑物提取方法

Also Published As

Publication number Publication date
CN115115647B (zh) 2024-09-27

Similar Documents

Publication Publication Date Title
WO2023077816A1 (zh) 边界优化的遥感图像语义分割方法、装置、设备及介质
CN109145939B (zh) 一种小目标敏感的双通道卷积神经网络语义分割方法
CN111612066B (zh) 基于深度融合的卷积神经网络的遥感图像分类方法
CN115115647A (zh) 一种融合注意力机制和残差aspp的遥感影像语义分割方法
CN110705457A (zh) 一种遥感影像建筑物变化检测方法
CN109101975A (zh) 基于全卷积神经网络的图像语义分割方法
CN108399428A (zh) 一种基于迹比准则的三元组损失函数设计方法
CN111325750B (zh) 一种基于多尺度融合u型链神经网络的医学图像分割方法
CN110853057B (zh) 基于全局和多尺度全卷积网络的航拍图像分割方法
CN113012172A (zh) 一种基于AS-UNet的医学图像分割方法及系统
CN114943963A (zh) 一种基于双分支融合网络的遥感图像云和云影分割方法
CN108986453A (zh) 一种基于情境信息的交通状况预测方法、系统及装置
CN111797920B (zh) 门控特征融合的深度网络不透水面遥感提取方法及系统
Zhou et al. Convolutional neural networks–based model for automated sewer defects detection and classification
CN114283315A (zh) 一种基于交互式引导注意力和梯形金字塔融合的rgb-d显著性目标检测方法
Cui et al. Improved genetic algorithm to optimize the Wi-Fi indoor positioning based on artificial neural network
CN117217368A (zh) 预测模型的训练方法、装置、设备、介质及程序产品
CN113096070A (zh) 一种基于MA-Unet的图像分割方法
CN118010009B (zh) 一种教育机器人在复杂环境下的多模态导航系统
CN115829163A (zh) 基于多模式集成的长江中下游流域径流预测方法和系统
CN115512222A (zh) 一种线下训练-线上学习的灾害场景地物损毁评估方法
CN117787601A (zh) 一种基于ai的家政上门服务调度方法、介质及系统
CN116933946A (zh) 一种基于客流去向结构的轨道交通od客流预测方法及系统
CN115035193A (zh) 一种基于双目视觉与图像分割技术的散装粮随机扦样方法
Liu et al. Research on driving obstacle detection technology in foggy weather based on GCANet and feature fusion training

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant