CN114694031A - 一种基于多任务注意力机制的遥感图像典型地物提取方法 - Google Patents

一种基于多任务注意力机制的遥感图像典型地物提取方法 Download PDF

Info

Publication number
CN114694031A
CN114694031A CN202210450474.0A CN202210450474A CN114694031A CN 114694031 A CN114694031 A CN 114694031A CN 202210450474 A CN202210450474 A CN 202210450474A CN 114694031 A CN114694031 A CN 114694031A
Authority
CN
China
Prior art keywords
edge
loss
attention
remote sensing
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210450474.0A
Other languages
English (en)
Other versions
CN114694031B (zh
Inventor
李玉霞
司宇
何磊
任俊玫
龚钰姝
童忠贵
张靖霖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Chengdu University of Information Technology
Original Assignee
University of Electronic Science and Technology of China
Chengdu University of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China, Chengdu University of Information Technology filed Critical University of Electronic Science and Technology of China
Priority to CN202210450474.0A priority Critical patent/CN114694031B/zh
Publication of CN114694031A publication Critical patent/CN114694031A/zh
Application granted granted Critical
Publication of CN114694031B publication Critical patent/CN114694031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多任务注意力机制的遥感图像典型地物提取方法,利用四个注意力模块从内部和外部融合全局特征,增大了模型的感受野,从而解决地物要素分布范围广、区域面积大的问题;利用多任务机制构建多解码器结构,从而降低不同地物类型对模型参数的竞争,从而较少相似地物的误判;利用边缘提取任务和距离图提取任务,增加了边缘约束,从而提升了边缘提取的效果,最终实现了对多类典型地物要素的智能提取,且提取精度较高。

Description

一种基于多任务注意力机制的遥感图像典型地物提取方法
技术领域
本发明属于遥感图像处理技术领域,更为具体地讲,涉及一种基于多任务注意力机制的遥感图像典型地物提取方法。
背景技术
随着遥感图像的空间分辨率越来越高,遥感图像上地物的结构、形状、纹理等细节信息在肉眼看来都变得清晰可分辨,这使得利用遥感图像得到典型地物信息的空间分布成为了可能。典型地物提取是高分辨率遥感应用服务链的核心技术之一,在全球变化,灾害检测,资源管控等多个领域都发挥了巨大作用。在全球变化领域,提取到建筑,森林,草地,农田,水体等地物类型的空间分布,有助于了解各地物的变化情况;在灾害检测领域,遥感图像能够帮助政府实时动态检测灾害地点和面积,为救灾方案的制订提供信息支持;在资源管控领域,遥感技术能够实时提供资源类型的分布情况,有助于实现资源的精细化管理。
为了得到地物分类空间分布信息,最精准的方法是采用人工标注。然而这种方式成本高,效率低,无法大规模应用。因此,需要设计针对性的算法,利用计算机来实现遥感图像地物分类的自动化、智能化与高效化。
近年来,随着深度学习的不断发展,计算机视觉领域也不断取得重大突破,对于日常生活中的简单图像分类场景,深度学习模型已经能够媲美人类。而对于遥感图像的典型地物要素提取任务所属的语义分割任务,在深度学习技术的支持下也取得了精度上的巨大提升。2015年之前,深度学习技术仅在图像分类与检测中得到了广泛的应用,而在图像分割领域,由于密集预测任务时间复杂度较高,难以得到真正的应用。直到FCN的出现,利用一个端到端的全卷积神经网络,实现了高效的图像分割。模型利用反卷积对最后一个卷积层的结果做上采样,将输出图像尺寸恢复到与输入图像相同的尺寸,而输出图像的每一个点正是输入图像的类别预测结果。该模型充分利用的神经网络自动学习特征的特性,大大提升了图像分割的精度。随后出现了一系列的网络对FCN结构做了改进,例如UNet、采用编码器-解码器结构、编码器部分提取特征、解码器部分解译特征,利用卷积神经网络的反向传播技术自动训练参数,得到高精度的语义分割模型。但经典的UNet等模型感受野受限,在提取遥感图像中的大范围地物目标时通常精度较低;另外,遥感图像中的部分地物种类特征较为相似,需要结合周边上下文信息综合判断,这为深度学习模型的全局特征获取能力带来了挑战;此外,深度学习模型在不同地物类别的边缘提取效果通常较差,边界通常不够清晰。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于多任务注意力机制的遥感图像典型地物提取方法,利用多解码器四重注意力提取模型自动从遥感图像中学习多种典型地物的特征,进而实现了对多类典型地物要素的智能提取,且提取精度较高。
为实现上述发明目的,本发明一种基于多任务注意力机制的遥感图像典型地物提取方法,其特征在于,包括以下步骤:
(1)、构建训练数据集;
(1.1)、下载多张遥感图像,将每一张遥感图像均裁剪为m*n大小的图块;
(1.2)、利用语义分割标注工具将遥感图像中的典型地物用不同形状标记,其中,典型地物包括背景、不透水地面、车辆、树木、草地和建筑;
(1.3)、将各个典型地物对应的像素值设为0、1、2、3、4、5,从而生成标签图像,其中,背景区域的像素值设为0,不透水地面的像素值设为1,以此类推;
(1.4)、记标签图像为label,在每一张label中,将不同地物相邻区域的像素值设置为255,其余部分设置为0,得到边缘二值图labeledge
(1.5)、对边缘二值图labeledge做进一步的距离变换,得到距离图labeldis
(1.6)、将每一张遥感图像与对应的标签图像、边缘二值图和距离图作为一组训练数据,从而构成训练数据集;
(2)、搭建并训练多解码器四重注意力网络;
以一组训练数据作为多解码器四重注意力网络的输入;
多解码器四重注意力网络以编码器作为开始,编码器包含两个卷积模块和4 个级联的下采样单元;其中,每个卷积模块包含了一个3x3的卷积层,一个批标准化层以及一个Relu激活函数;每个下采样单元包含了一个2x2的池化层和两个卷积模块组成;
遥感图像通过编码操作后,得到编码特征图FC×H×W,其中,C、H、W分别表示编码特征图的通道数、高和宽;再将FC×H×W输入到解码器进行解码操作;
多解码器四重注意力网络共计包含6个结构相同的解码器,每一类典型地物分配一个解码器,每个解码器输出对应典型地物的分类概率权重图;
其中,每个解码器包含四个并联的注意力模块,记为PAM、CAM、LAM 和EAM;在PAM中,FC×H×W经过3个卷积操作得到三个分支,三个分支的结果分别记为
Figure BDA0003618382680000031
Figure BDA0003618382680000032
Figure BDA0003618382680000033
点乘后进行softmax 运算,再与
Figure BDA0003618382680000034
点乘,得到PAM的输出结果,记为
Figure BDA0003618382680000035
在CAM中,FC×H×W同样经过3个卷积操作得到三个分支,三个分支的结果分别记为
Figure BDA0003618382680000036
Figure BDA0003618382680000037
Figure BDA0003618382680000038
Figure BDA0003618382680000039
点乘后进行softmax运算,再与
Figure BDA00036183826800000310
点乘,得到CAM 的输出结果,记为
Figure BDA00036183826800000311
在LAM中,FC×H×W经过2个卷积操作得到两个分支,两个分支的结果分别记为
Figure BDA00036183826800000312
Figure BDA00036183826800000313
进行softmax运算,得到LAM 的注意力概率图attL,再与
Figure BDA00036183826800000314
求和后得到LAM的输出结果,记为
Figure BDA00036183826800000315
在 EAM中,FC×H×W同样经过2个卷积操作得到两个分支,两个分支的结果分别记为
Figure BDA00036183826800000316
Figure BDA00036183826800000317
进行softmax运算,得到EAM的注意力概率图attE,再与
Figure BDA00036183826800000318
求和后得到LAM的输出结果,记为
Figure BDA00036183826800000319
然后将PAM和CAM的输出结果
Figure BDA00036183826800000320
Figure BDA00036183826800000321
求和后经过一层卷积模块,得到单通道的输出特征图,再与LAM和EAM的输出结果
Figure BDA00036183826800000322
求和,最后经过上采样得到解码器的输出结果;
接着,解码器的输出结果再输入到三个分支:地物提取分支、边缘提取分支、距离图提取分支;
其中,地物提取分支对输入的多个类别的分类概率图进行合并操作,得到一个多通道的分类概率权重图P;边缘提取分支将输入的多个类别的分类概率权重图输入到两个级联的卷积模块提取边缘特征,得到边缘特征图Pedge;距离图提取分支与边缘提取分支结构相同,用于提取距离特征,得到距离特征图Pdis
计算本轮训练后的多解码器四重注意力网络的损失函数值Losstotal
Losstotal=Lossatt+Lossseg+LossMSE+Lossdt
其中,Lossatt为LAM和EAM的注意力损失值,Lossseg为地物提取分支的损失值,LossMSE为边缘提取分支的损失值,Lossdt为距离图提取分支的损失值;
最后,利用每一组训练数据对多解码器四重注意力网络进行训练,至当损失函数收敛,则停止训练,从而得到训练完成的多解码器四重注意力网络;
(3)、遥感图像典型地物可视化提取;
将待提取的遥感图像裁剪为m*n大小的图块,然后再输入至训练完成的多解码器四重注意力网络,从而输出遥感图像中各个典型地物对应的标签值0、1、 2、3、4、5,再将标签值映射到彩色范围,形成可视化图像。
本发明的发明目的是这样实现的:
本发明一种基于多任务注意力机制的遥感图像典型地物提取方法,利用四个注意力模块从内部和外部融合全局特征,增大了模型的感受野,从而解决地物要素分布范围广、区域面积大的问题;利用多任务机制构建多解码器结构,从而降低不同地物类型对模型参数的竞争,从而较少相似地物的误判;利用边缘提取任务和距离图提取任务,增加了边缘约束,从而提升了边缘提取的效果,最终实现了对多类典型地物要素的智能提取,且提取精度较高。
同时,本发明一种基于多任务注意力机制的遥感图像典型地物提取方法还具有以下有益效果:
(1)、本发明基于编码器-解码器结构,新增了多个注意力模块,融合了全局特征,用于改善大范围地物目标的提取精度以及不同地物边缘的提取效果;
(2)、针对遥感图像中的地物目标通常分布范围广,区域面积大的问题,本发明引入了四重注意力机制,提取更多全局特征;
(3)、针对遥感图像中的相似地物误判问题,本发明引入了多任务机制,将一个多分类地物提取问题转化为多个二分类地物提取问题,降低不同类别间的参数竞争关系,将模型的多分类解码器替换为多个二分类解码器,每个解码器依然由四个注意力模块组成;
(4)、针对边缘区域的误判问题,本发明引入额外的边缘提取任务,优化边缘提取任务的损失函数,并新增了边缘注意力模块,增强模型对边缘信息的注意力。
附图说明
图1是本发明多解码器四重注意力网络的整体结构图;
图2单个解码器结构图;
图3为PAM结构图;
图4为CAM结构图;
图5为LAM结构图;
图6为EAM结构图;
图7为实验结果图,(a)图为原始图像,(b)图为标签图像,(c)图为UNet 实验结果图,(d)图为MD QANet实验结果图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
为了方便描述,先对具体实施方式中出现的相关专业术语进行说明:
FCN(Fully Convolutional Network):全卷积神经网络
PAM(Position Attention Module):位置注意力模块
CAM(Channel Attention Module):通道注意力模块
LAM(Label Attention Module):标签注意力模块
EAM(Edge Attention Module):边缘注意力模块
MD QANet(Multi-Decoder Quadruple Attention Network):多解码器四重注意力网络
在本实施例中,一种基于多任务注意力机制的遥感图像典型地物提取方法,包括以下步骤:
(1)、构建训练数据集;
(1.1)、下载多张遥感图像,将每一张遥感图像均裁剪为m*n大小的图块,在本实施例中,裁剪为1024*1024大小的图块;
(1.2)、利用语义分割标注工具将遥感图像中的典型地物用不同形状标记,其中,典型地物包括背景、不透水地面、车辆、树木、草地和建筑;
(1.3)、将各个典型地物对应的像素值设为0、1、2、3、4、5,从而生成标签图像,其中,背景区域的像素值设为0,不透水地面的像素值设为1,以此类推;
(1.4)、记标签图像为label,在每一张label中,将不同地物相邻区域的像素值设置为255,其余部分设置为0,得到边缘二值图labeledge
(1.5)、对边缘二值图labeledge做进一步的距离变换,得到距离图labeldis
(1.6)、将每一张遥感图像与对应的标签图像、边缘二值图和距离图作为一组训练数据,从而构成训练数据集;
(2)、搭建并训练多解码器四重注意力网络;
以一组训练数据作为多解码器四重注意力网络的输入;
多解码器四重注意力网络以编码器作为开始,编码器包含两个卷积模块和4 个级联的下采样单元;其中,每个卷积模块包含了一个3x3的卷积层,一个批标准化层以及一个Relu激活函数;每个下采样单元包含了一个2x2的池化层和两个卷积模块组成;
遥感图像通过编码操作后,得到编码特征图FC×H×W,其中,C、H、W分别表示编码特征图的通道数、高和宽;再将FC×H×W输入到解码器进行解码操作;
在多解码器四重注意力网络中,解码器数量与典型地物要素类别数相同,共计包含6个结构相同的解码器,每一类典型地物分配一个解码器,每个解码器输出对应典型地物的分类概率权重图;
其中,如图2所示,每个解码器包含四个并联的注意力模块,记为PAM、 CAM、LAM和EAM;
在PAM中,如图3所示,FC×H×W经过3个卷积操作得到三个分支,三个分支的结果分别记为
Figure BDA0003618382680000061
Figure BDA0003618382680000062
Figure BDA0003618382680000063
点乘后进行 softmax运算,再与
Figure BDA0003618382680000064
点乘,得到PAM的输出结果,记为
Figure BDA0003618382680000065
在CAM中,如图4所示,FC×H×W同样经过3个卷积操作得到三个分支,三个分支的结果分别记为
Figure BDA0003618382680000071
Figure BDA0003618382680000072
Figure BDA0003618382680000073
点乘后进行 softmax运算,再与
Figure BDA0003618382680000074
点乘,得到CAM的输出结果,记为
Figure BDA0003618382680000075
在LAM中,如图5所示,FC×H×W经过2个卷积操作得到两个分支,两个分支的结果分别记为
Figure BDA0003618382680000076
Figure BDA0003618382680000077
进行softmax运算,得到LAM的注意力概率图attL,再与
Figure BDA0003618382680000078
求和后得到LAM的输出结果,记为
Figure BDA0003618382680000079
在EAM中,如图6所示,FC×H×W同样经过2个卷积操作得到两个分支,两个分支的结果分别记为
Figure BDA00036183826800000710
Figure BDA00036183826800000711
进行softmax运算,得到EAM 的注意力概率图attE,再与
Figure BDA00036183826800000712
求和后得到LAM的输出结果,记为
Figure BDA00036183826800000713
然后将PAM和CAM的输出结果
Figure BDA00036183826800000714
Figure BDA00036183826800000715
求和后经过一层卷积模块,得到单通道的输出特征图,再与LAM和EAM的输出结果
Figure BDA00036183826800000716
求和,最后经过上采样得到解码器的输出结果;
接着,解码器的输出结果再输入到三个分支:地物提取分支、边缘提取分支、距离图提取分支;
其中,地物提取分支对输入的多个类别的分类概率图进行合并操作,得到一个多通道的分类概率权重图P;边缘提取分支将输入的多个类别的分类概率权重图输入到两个级联的卷积模块提取边缘特征,得到边缘特征图Pedge;距离图提取分支与边缘提取分支结构相同,用于提取距离特征,得到距离特征图Pdis
计算本轮训练后的多解码器四重注意力提取模型的损失函数值Losstotal
Losstotal=Lossatt+Lossseg+LossMSE+Lossdt
其中,Lossatt为LAM和EAM的注意力损失值,Lossseg为地物提取分支的损失值,LossMSE为边缘提取分支的损失值,Lossdt为距离图提取分支的损失值;
最后,利用每一组训练数据对多解码器四重注意力网络进行训练,至当损失函数收敛,则停止训练,从而得到训练完成的多解码器四重注意力网络;
(3)、遥感图像典型地物可视化提取;
将待提取的遥感图像裁剪为m*n大小的图块,然后再输入至训练完成的多解码器四重注意力网络,从而输出遥感图像中各个典型地物对应的标签值0、1、 2、3、4、5,再将标签值映射到彩色范围,形成可视化图像。
如图7所示,通过对输出图像的分析,可以看出本发明切实提升了对遥感图像典型地物的提取精度。
其中,在图7中,(a)是待提取典型地物的遥感图像,(b)是制作好的标签图像,(c)是UNet模型的提取结果图,(d)是MD QANet模型的提取结果图。从提取结果图中可以看出,图中第一行对于大范围的建筑区域,MD QANet的提取效果明显由于UNet,连贯性更好,且地物的边缘更加清晰准确。第二行与第三行中,UNet在部分相似地物间产生了误判,而MDQANet较好的解决了该问题。
综述,本发明针对遥感图像中的地物目标通常分布范围广,区域面积大的问题,本发明引入了四重注意力机制,提取更多全局特征。具体来说,将经典深度学习网络模型的解码器替换为多个注意力模块并联,包括两个自注意力模块(位置注意力和通道注意力)和一个标签注意力模块,分别从内部和外部提取信息,优化全局特征的提取。针对遥感图像中的相似地物误判问题,本发明引入了多任务机制,将一个多分类地物提取问题转化为多个二分类地物提取问题,降低不同类别间的参数竞争关系,将模型的多分类解码器替换为多个二分类解码器,每个解码器依然由四个注意力模块组成。针对边缘区域的误判问题,本发明引入额外的边缘提取任务,优化边缘提取任务的损失函数,增强模型对边缘信息的注意力。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (5)

1.一种基于多任务注意力机制的遥感图像典型地物提取方法,其特征在于,包括以下步骤:
(1)、构建训练数据集;
(1.1)、下载多张遥感图像,将每一张遥感图像均裁剪为m*n大小的图块;
(1.2)、利用语义分割标注工具将遥感图像中的典型地物用不同形状标记,其中,典型地物包括背景、不透水地面、车辆、树木、草地和建筑;
(1.3)、将各个典型地物对应的像素值设为0、1、2、3、4、5,从而生成标签图像,其中,背景区域的像素值设为0,不透水地面的像素值设为1,以此类推;
(1.4)、记标签图像为label,在每一张label中,将不同地物相邻区域的像素值设置为255,其余部分设置为0,得到边缘二值图labeledge
(1.5)、对边缘二值图labeledge做进一步的距离变换,得到距离图labeldis
(1.6)、将每一张遥感图像与对应的标签图像、边缘二值图和距离图作为一组训练数据,从而构成训练数据集;
(2)、搭建并训练多解码器四重注意力网络;
以一组训练数据作为多解码器四重注意力提取模型的输入;
多解码器四重注意力网络以编码器作为开始,编码器包含两个卷积模块和4个级联的下采样单元;其中,每个卷积模块包含了一个3x3的卷积层,一个批标准化层以及一个Relu激活函数;每个下采样单元包含了一个2x2的池化层和两个卷积模块组成;
遥感图像通过编码操作后,得到编码特征图FC×H×W,其中,C、H、W分别表示编码特征图的通道数、高和宽;再将FC×H×W输入到解码器进行解码操作;
多解码器四重注意力网络共计包含6个结构相同的解码器,每一类典型地物分配一个解码器,每个解码器输出对应典型地物的分类概率权重图;
其中,每个解码器包含四个并联的注意力模块,记为PAM、CAM、LAM和EAM;在PAM中,FC ×H×W经过3个卷积操作得到三个分支,三个分支的结果分别记为
Figure FDA0003618382670000011
Figure FDA0003618382670000012
Figure FDA0003618382670000013
点乘后进行softmax运算,再与
Figure FDA0003618382670000014
点乘,得到PAM的输出结果,记为
Figure FDA0003618382670000015
在CAM中,FC×H×W同样经过3个卷积操作得到三个分支,三个分支的结果分别记为
Figure FDA0003618382670000021
Figure FDA0003618382670000022
Figure FDA0003618382670000023
Figure FDA0003618382670000024
点乘后进行softmax运算,再与
Figure FDA0003618382670000025
点乘,得到CAM的输出结果,记为
Figure FDA0003618382670000026
在LAM中,FC×H×W经过2个卷积操作得到两个分支,两个分支的结果分别记为
Figure FDA0003618382670000027
Figure FDA0003618382670000028
进行softmax运算,得到LAM的注意力概率图attL,再与
Figure FDA0003618382670000029
求和后得到LAM的输出结果,记为
Figure FDA00036183826700000210
在EAM中,FC×H×W同样经过2个卷积操作得到两个分支,两个分支的结果分别记为
Figure FDA00036183826700000211
Figure FDA00036183826700000212
进行softmax运算,得到EAM的注意力概率图attE,再与
Figure FDA00036183826700000213
求和后得到LAM的输出结果,记为
Figure FDA00036183826700000214
然后将PAM和CAM的输出结果
Figure FDA00036183826700000215
Figure FDA00036183826700000216
求和后经过一层卷积模块,得到单通道的输出特征图,再与LAM和EAM的输出结果
Figure FDA00036183826700000217
求和,最后经过上采样得到解码器的输出结果;
接着,解码器的输出结果再输入到三个分支:地物提取分支、边缘提取分支、距离图提取分支;
其中,地物提取分支对输入的多个类别的分类概率图进行合并操作,得到一个多通道的分类概率权重图P;边缘提取分支将输入的多个类别的分类概率权重图输入到两个级联的卷积模块提取边缘特征,得到边缘特征图Pedge;距离图提取分支与边缘提取分支结构相同,用于提取距离特征,得到距离特征图Pdis
计算本轮训练后的多解码器四重注意力提取模型的损失函数值Losstotal
Losstotal=Lossatt+Lossseg+LossMSE+Lossdt
其中,Lossatt为LAM和EAM的注意力损失值,Lossseg为地物提取分支的损失值,LossMSE为边缘提取分支的损失值,Lossdt为距离图提取分支的损失值;
最后,利用每一组训练数据对多解码器四重注意力网络进行训练,至当损失函数收敛,则停止训练,从而得到训练完成的多解码器四重注意力网络;
(3)、遥感图像典型地物可视化提取;
将待提取的遥感图像裁剪为m*n大小的图块,然后再输入至训练完成的多解码器四重注意力网络,从而输出遥感图像中各个典型地物对应的标签值0、1、2、3、4、5,再将标签值映射到彩色范围,形成可视化图像。
2.根据权利要求1所述的基于多任务注意力机制的遥感图像典型地物提取方法,其特征在于,所述Lossatt满足:
Figure FDA0003618382670000031
其中,li表示标签图像label中第i个像素点的值,
Figure FDA0003618382670000032
表示注意力概率图attL中第i个像素点的值,
Figure FDA0003618382670000033
表示注意力概率图attE中第i个像素点的值,N表示像素点总数,N=m*n。
3.根据权利要求1所述的基于多任务注意力机制的遥感图像典型地物提取方法,其特征在于,所述Lossseg满足:
Figure FDA0003618382670000034
其中,pi表示分类概率权重图P中第i个像素点的值。
4.根据权利要求1所述的基于多任务注意力机制的遥感图像典型地物提取方法,其特征在于,所述LossMSE满足:
Figure FDA0003618382670000035
其中,pdis[i]表示距离特征图Pdis中第i个像素点的值,ldis[i]表示距离图labeldis中第i个像素点的值。
5.根据权利要求1所述的基于多任务注意力机制的遥感图像典型地物提取方法,其特征在于,所述Lossdt满足:
Figure FDA0003618382670000036
θ={i∈A|pedge[i]≥0.5&ledge[i]<0.5,pedge[i]<0.5&ledge[i]≥0.5}
其中,ledge[i]表示边缘二值图labeledge中第i个像素点的值,pedge[i]表示边缘特征图Pedge中第i个像素点的值,θ表示i的取值范围集合,A表示所有像素的集合,&表示与运算。
CN202210450474.0A 2022-04-24 2022-04-24 一种基于多任务注意力机制的遥感图像典型地物提取方法 Active CN114694031B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210450474.0A CN114694031B (zh) 2022-04-24 2022-04-24 一种基于多任务注意力机制的遥感图像典型地物提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210450474.0A CN114694031B (zh) 2022-04-24 2022-04-24 一种基于多任务注意力机制的遥感图像典型地物提取方法

Publications (2)

Publication Number Publication Date
CN114694031A true CN114694031A (zh) 2022-07-01
CN114694031B CN114694031B (zh) 2023-05-02

Family

ID=82145805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210450474.0A Active CN114694031B (zh) 2022-04-24 2022-04-24 一种基于多任务注意力机制的遥感图像典型地物提取方法

Country Status (1)

Country Link
CN (1) CN114694031B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152616A (zh) * 2023-09-12 2023-12-01 电子科技大学 一种基于光谱增强和双路编码的遥感图像典型地物提取方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170076438A1 (en) * 2015-08-31 2017-03-16 Cape Analytics, Inc. Systems and methods for analyzing remote sensing imagery
CN110807376A (zh) * 2019-10-17 2020-02-18 北京化工大学 基于遥感图像的城外道路提取方法及装置
CN112733800A (zh) * 2021-01-22 2021-04-30 中国科学院地理科学与资源研究所 基于卷积神经网络的遥感图像道路信息提取方法和装置
CN113343789A (zh) * 2021-05-20 2021-09-03 武汉大学 一种基于局部细节增强与边缘约束的高分辨率遥感影像土地覆盖分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170076438A1 (en) * 2015-08-31 2017-03-16 Cape Analytics, Inc. Systems and methods for analyzing remote sensing imagery
CN110807376A (zh) * 2019-10-17 2020-02-18 北京化工大学 基于遥感图像的城外道路提取方法及装置
CN112733800A (zh) * 2021-01-22 2021-04-30 中国科学院地理科学与资源研究所 基于卷积神经网络的遥感图像道路信息提取方法和装置
CN113343789A (zh) * 2021-05-20 2021-09-03 武汉大学 一种基于局部细节增强与边缘约束的高分辨率遥感影像土地覆盖分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"triple attention network for multi-class semantic segmentation in aerial iamges" *
"基于深度学习的遥感图像多类地物要素提取与识别" *
金飞;王龙飞;刘智;王番;贾桂芬;: "一种双U-Net的遥感影像道路提取方法" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152616A (zh) * 2023-09-12 2023-12-01 电子科技大学 一种基于光谱增强和双路编码的遥感图像典型地物提取方法

Also Published As

Publication number Publication date
CN114694031B (zh) 2023-05-02

Similar Documents

Publication Publication Date Title
CN109934153B (zh) 基于门控深度残差优化网络的建筑物提取方法
CN109871798A (zh) 一种基于卷积神经网络的遥感影像建筑物提取方法
CN114255238A (zh) 一种融合图像特征的三维点云场景分割方法及系统
CN108647568B (zh) 基于全卷积神经网络的草地退化自动提取方法
CN113256649B (zh) 一种基于深度学习的遥感图像选站选线语义分割方法
CN111860233B (zh) 基于选择注意力网络的sar图像复杂建筑物提取方法及系统
CN114943876A (zh) 一种多级语义融合的云和云影检测方法、设备及存储介质
CN113012177A (zh) 基于几何特征提取和边缘感知编码的三维点云分割方法
CN112419333B (zh) 一种遥感影像自适应特征选择分割方法及系统
CN112950780A (zh) 一种基于遥感影像的网络地图智能生成方法及系统
CN109523558A (zh) 一种人像分割方法及系统
CN114943902A (zh) 基于多尺度特征感知网络的城市植被无人机遥感分类方法
CN113239736A (zh) 一种基于多源遥感数据的土地覆盖分类标注图获取方法、存储介质及系统
CN115497002A (zh) 一种多尺度特征融合的激光雷达遥感分类方法
CN112149526A (zh) 一种基于长距离信息融合的车道线检测方法及系统
CN115527113A (zh) 一种遥感图像裸土地分类方法及装置
CN114694031A (zh) 一种基于多任务注意力机制的遥感图像典型地物提取方法
CN116543165B (zh) 一种基于双通道复合深度网络的遥感图像果树分割方法
CN117058367A (zh) 高分辨率遥感影像建筑物语义分割方法及装置
CN115797184B (zh) 一种地表水体超分辨率提取方法
CN115984714B (zh) 一种基于双分支网络模型的云检测方法
CN115546649B (zh) 一种单视遥感影像高度估计和语义分割多任务预测方法
CN115631434A (zh) 一种基于遥感影像的土地利用分类方法
CN117557775B (zh) 基于红外和可见光融合的变电站电力设备检测方法及系统
CN117152616A (zh) 一种基于光谱增强和双路编码的遥感图像典型地物提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant