CN111274869B - 基于并行注意力机制残差网进行高光谱图像分类的方法 - Google Patents

基于并行注意力机制残差网进行高光谱图像分类的方法 Download PDF

Info

Publication number
CN111274869B
CN111274869B CN202010014471.3A CN202010014471A CN111274869B CN 111274869 B CN111274869 B CN 111274869B CN 202010014471 A CN202010014471 A CN 202010014471A CN 111274869 B CN111274869 B CN 111274869B
Authority
CN
China
Prior art keywords
network
data
image classification
spatial
attention mechanism
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010014471.3A
Other languages
English (en)
Other versions
CN111274869A (zh
Inventor
董志敏
蔡之华
蔡耀明
龚赛
刘小波
尹旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202010014471.3A priority Critical patent/CN111274869B/zh
Publication of CN111274869A publication Critical patent/CN111274869A/zh
Application granted granted Critical
Publication of CN111274869B publication Critical patent/CN111274869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于并行注意力机制残差网进行高光谱图像分类的方法,首先构建残差块,所述残差块嵌入两条并行的注意分支网络支路,所述两条并行的注意分支网络支路分别在应用光谱注意力机制及空间注意力机制后,对输入数据的空间特征信息和光谱特征信息进行识别学习;其次,利用构建的若干个依次连接的残差块构成的高光谱图像分类网络,对输入的训练数据集进行训练;其中,所述高光谱图像分类网络还包括依次连接的3D平均池化层和全连接层,所述3D平均池化层连接到与其相邻的残差块,用于对当前残差块输出的数据进行空间维度的调整,来降低整个网络的计算开销;最后,将特征信息输入到高光谱图像分类网络地全连接层中,得到图像分类结果。

Description

基于并行注意力机制残差网进行高光谱图像分类的方法
技术领域
本发明涉及遥感图像分类领域,更具体地说,涉及一种基于并行注意力机制的残差网进行高光谱图像分类方法。
背景技术
高光谱图像分类技术是上世纪80年代发展起来的一种新兴的遥感技术,高光谱遥感利用很多窄的电磁波段从感兴趣的物体中获取图像数据,一般它是在电磁波谱的可见光、近红外、中红外和热红外波段范围内,设置了几十甚至几百个连续波段,其光谱分辨率可高达纳米数量级。
现有的高光谱遥感图像分类方法大多基于两种处理方式:
(1)对光谱维度进行降维处理,将单个样本所对应的光谱向量输入到分类器进行分类;
(2)取待分类像素点的邻域信息,将邻域信息与光谱向量结合并输入到分类器进行分类,这种综合利用空谱特征信息的方法一般称其为“空谱结合”分类方法。
近年来,基于深度学习的方法在高光谱图像分类中取得了很大进展。但是与普通图像不同,高光谱图像数据的内在复杂性仍然限制了许多常见卷积神经网络CNN(Convolutional Neural Networks)模型的性能。
因此,为了进一步提取具有鉴别性的空谱特征,在进行网络架构设计时变得越来越复杂。例如,三维卷积神经网络3D-CNN(3D Convolutional Neural 25 Networks)通常具有大量的可训练参数,这也增加了高光谱图像分类过程的计算复杂度;其主要原因是多数现有的深度学习网络不能针对性的弱化高光谱图像数据中冗余的特征信息,致使有用的特征信息无法充分利用。而且高光谱图像分类中已有的残差网络往往一味的依赖残差连接的加入靠线性堆叠更多的网络层来对空谱信息学习处理,这些网络对高光谱的空谱特征信息处理时虽然是分别处理,但整体是线性的前后结合而成,造成光谱或空间特征学习时已经一部分特征信息丢失。
所以在有限的网络层中高效的学习重要的空谱特征,来提高分类精度、减少训练集所需样本、并且保证模型训练时间是一项充满挑战的任务。
发明内容
本发明要解决的技术问题在于,针对现有技术的未解决网络繁杂的问题,不能针对性的弱化高光谱图像数据中冗余特征信息,致使有用的特征信息无法充分利用的缺陷,提供一种基于并行注意力机制的残差网进行高光谱图像分类方法。
本发明解决其技术问题所采用的技术方案是:构造一种基于并行注意力机制残差网进行高光谱图像分类的方法,包括以下步骤:
S1、构建残差块,所述残差块嵌入两条并行的注意分支网络支路,对输入的数据,进行空间特征信息和光谱特征信息的识别;所述两条并行的注意分支网络支路分为第一网络支路和第二网络支路,所述第一网络支路应用光谱注意力机制,所述第二网络支路应用空间注意力机制;
S2、利用步骤S1构建的残差块来构建高光谱图像分类网络,所述高光谱图像分类网络包括若干个依次连接的残差块;其中,排列在第一位的残差块,其输入的数据包括高光谱图像数据集;所述高光谱图像分类网络还包括依次连接在所述若干个依次连接的残差块之后的3D平均池化层和全连接层,所述平均池化层用于对当前残差块输出的数据进行空间维度的调整,降低整个网络的计算开销;所述全连接层用于处理经空间维度调整后的特征向量,得到输入样本类别;
S3、将高光谱原始3D立方体数据输入到步骤S2构建好的高光谱图像分类网络中,得到图像分类结果。
本发明所述的一种基于并行注意力机制残差网进行高光谱图像分类的方法,首先,针对高光谱特性提出来的并行注意力机制;其次,基于并行注意力机制,进行残差块的改进;最后,基于改进后的残差块构成的并行注意力残差网架构,进行图像分类。
实施本发明公开的一种基于并行注意力机制残差网进行高光谱图像分类的方法,具有以下有益效果:
1、首先针对高光谱图像数据自身的特点,本发明首次针对性的设计了符合一般高光谱图像数据构造的并行注意力机制,通过两个并行的分支同步的学习光谱特征信息和空间特征信息,尽可能的使网络学习辨别性强的空谱特征。
2、本发明将并行注意力机制与残差网构造特性结合,重新设计了残差块的构造;
3、本发明通过在多组标准数据集的多次实验下表明,本发明的网络具有训练集需求少和分类精度高的特点。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明公开的一种基于并行注意力机制残差网进行图像分类的方法流程图;
图2是整体实施流程图;
图3是本发明提出的嵌入并行注意力机制的残差块网络结构图;
图4是本发明提出的本发明提出的总体网络架构图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
请参考图1,其为本发明公开的一种基于并行注意力机制残差网进行图像分类的方法流程图,具体包括以下步骤:
S1、构建残差块,所述残差块嵌入两条并行的注意分支网络支路,所述两条并行的注意分支网络支路分别在应用光谱注意力机制及空间注意力机制后,对输入数据的光谱特征信息和空间特征信息进行识别学习;其中:
步骤S1中构建残差块的步骤包括:
S11、训练残差块网络,获取训练数据集:
本发明中,在训练残差块网络时,对于输入的训练数据要求是包括高光谱图像的原始3D立方体数据块,在不经过任何降维处理,而直接使用原始数据,既保护了原始数据间的结构关系,又简化了网络处理流程。
本实施例中,输入的样本数据要以原始数据立方体的形式输入网络,以像元p为例,以像元p为中心沿着上、下、左、右方向各延伸4个像元单位后,以像元p为中心组成一个9×9的空间平面,再将所述空间平面中相应的光谱波段数全部取出后,进一步构成一个大小为d×d×B的立方体,所述原始数据立方体即为本实施例中要输入到网络的原始数据,其中,参数d表示当前构建的空间平面尺寸,所述尺寸包括平面的长和宽,本实施例中d取值为9,即取平面的长和宽为9;参数B代表输入数据的波段数,所述波段数因数据集的不同而有所区别。
在输入立方体原始数据到上述构建的残差块网络中,进行网络训练时,以中心像元p所属的类别为整体所属的类别;本实施例中将空间平面的大小设置为:9×9×B的原始立方体,让残差块网络既可以充分学习识别中心像元p与周围像元的空间特征信息,又可以充分利用整体的光谱波段特征信息。
S12、将获取到的原始数据输入到两条并行的注意分支网络支路中,进行特征识别学习;其中,第一网络支路采用光谱注意力机制,其针对高光谱图像数据的光谱波段,进行光谱特征信息的识别学习;第二网络支路采用空间注意力机制,对输入的高光谱图像数据空间信息进行识别学习;具体的:
本步骤中,在原始立方体数据块输入到注意分支网络支路后,通过当前构建的残差块网络的并行注意分支进行特征学习,请参考图3,图3所示的即为嵌入并行注意力机制后的残差块网络结构;本实施例在对传统的残差块网络进行改进后,可以有效的对输入数据的特征信息进行利用;
在输入的立方体原始数据到残差块网络时,可参考图3,首先,要经过两条并行的注意分支网络支路,如图3所示的残差块网络结构,沿其从上到下的顺序,依次为嵌入光谱注意力机制和空间注意力机制网络支路;其中,所述嵌入光谱注意力机制网络支路,是针对输入数据的光谱波段进行识别学习,尽可能对识别可辨别性强的光谱特征信息;所述嵌入空间注意力机制网络支路,是针对输入数据空间信息进行识别学习,尽可能多的对重要的空间信息学习,弱化无用信息;其中,两条注意力机制学习过程是独立的运行,但是时间上是同步进行;具体的:
在嵌入光谱注意力机制网络支路中,所述原始立方体数据块在输入到当前网络支路时,通过3D平均池化层来对空间纬度降维使空间尺寸减半,保证后续光谱特征的高效学习,而本实施例中使用到的3D平均池化层的平均池化窗口大小为5×5×1,步幅为(1,1,1)。
在依据上述步骤对输入数据的空间尺寸做减半处理后,得到图3中所示的标记为①的数据信息,此时①的尺寸为5×5×B(B代表输入数据的波段数),接着,通过3D卷积层和归一化层对当前输出的光谱波段信息进行学习后,得到图3中的②,此时②的尺寸为
Figure GDA0003955365340000061
本实施例中,所述3D卷积层由24个尺寸大小为1×1×2的3D卷积核组成,每个3D卷积核步幅为(1,1,2),在应用3D卷积核后,有助于捕获更为全面的波段信息;当前,通过步幅(1,1,2)的3D卷积核,针对波段维度进行步进卷积后,对波段信息进行下采样,有效的将数据波段维数减半。当前之所以这样处理,主要是由于高光谱自身的波段冗余性,加之本发明的残差块网络特点,随着特征学习的进行,残差块网络后半部分的特征是由前面层习得到的加权特征图,所以有效的进行波段降维,通过更小规模的数据可以使的有价值的信息被识别捕获到。
最后再通过一个平均池化窗口大小为5×5×1,步幅为(1,1,1)的3D平均池化层进行空间纬度降维,得到图3中所示的标记为③的数据信息,此时③的尺寸为
Figure GDA0003955365340000062
当前,针对卷积计算后的特征信息,将所述特征信息经过非线性激活函数softmax处理,其中,softmax函数的输出可视为一组条件概率,本实施例中,通过选择softmax函数来加强有用的特征信息的识别,且抑制不重要的特征信息。
本实施例下,应用光谱注意力机制网络支路,进行光谱特征信息识别学习,其用公式表示如式(1):
Fspectral=σ(AvgPool(f1(AvgPool(F)))) (1);
其中,σ代表softmax非线性激活函数,AvgPool代表平均池化层,f1(·)代表对“·”进行卷积层计算,F代表输入到网络的数据;
与此同时,应用空间注意力机制网络支路,针对输入的原始立方体数据块,通过3D卷积层和归一化层,对光谱波段信息进行学习,得到图3中标记为④的数据信息,此时④的尺寸为9×9×1,3D卷积层由24个尺寸大小为1×1×B的3D卷积核,步幅为(1,1,1);利用3D卷积层在波段维上进行降维处理,使得接下来的特征学习仅集中在空间信息。
接着上一处理步骤,通过包含24个尺寸大小为5×5×1,步幅为(1,1,1)的3D卷积核,来对输入数据得空间信息特征进行学习,得到图3中标记为得数据信息,此时的尺寸为9×9×1。
应用空间注意力机制网络支路,进行空间特征信息识别学习的过程,其用公式表示如式(2):
Fspatial=σ(f3(f2(F))) (2);
其中,参数σ代表softmax非线性激活函数,f2,f3代表卷积层计算,F代表原始立方体数据块。
S13、将两个并行注意分支网络的输出,通过逐元素相乘融合在一起,形成与原始输入数据空间大小相同,且波段减半的概率分布立方体Fatt;具体的:
将两个并行注意分支网络的输出通过逐元素相乘融合在一起,形成与原始立方体数据块空间大小相同,波段减半的概率分布立方体⑥,如式子(3)所示:
Figure GDA0003955365340000071
S14、对原始输入数据进行线性卷积变换,将其变换后的数据波段与Fatt的波段进行统一;其中,在进行波段统一后,将Fatt与线性变换后的原始输入数据通过逐元素相乘的方式进行融合,得到特征融合数据;具体的:
得到概率分布立方体后,需要把概率分布数据与原始立方体数据块融合,由于此时概率分布立方体相对原始立方体数据块空间大小相同,波段减半,所以需要对原始立方体数据块,通过不加激活函数的卷积层来对立方体数据进行线性卷积变换,将其变换后的数据波段与Fatt的波段进行统一。
S15、加入残差连接,将所述特征融合数据与经过线性卷积变换后的原始输入数据进行逐元素相加,得到嵌入并行注意力机制的残差块;具体的:
为了使特征信息得到充分利用,请参考图3,本实施例中,接着上一步骤再加入残差连接,将概率分布数据与经过线性卷积变换后的原始输入数据进行逐元素相乘;当前得到的结果再与经过线性卷积变换后的原始输入数据进行逐元素相加,最终得到尺寸大小为的
Figure GDA0003955365340000081
残差块,如式(4)所示:
Figure GDA0003955365340000082
其中,Fout代表残差块的输出,f0代表线性卷积变换。
S2、利用步骤S1构建的残差块,构建包括若干个依次连接的残差块的高光谱图像分类网络,本实施例中采用3个残差块,对输入的训练集信息特征训练;
所述高光谱图像分类网络还包括依次连接的3D平均池化层和全连接层,所述3D平均池化层还连接到与其相邻的残差块,用于对当前残差块输出的数据进行空间维度的调整,来降低整个网络的计算开销;具体的:
本实施例中利用三个残差块构成的网络,对训练集进行训练,当前的网络结果请参考图4。
以上介绍了并行注意力机制对于高光谱图像数据的工作原理与步骤以及改进后的残差块对高光谱图像数据的计算步骤。
改进后的残差块最为本发明网络中主要基本单元,总体网络如图4所示,当前构建的高光谱图像分类网络下,共由三个这样的残差块、一个3D平均池化层和一个全连接层依次连接构成;而,该网络下的每个残差块的运作机理相同,输出的数据块相对于输入的数据块空间大小相同,波段数减半。例如本发明的网络三个残差块的输出数据块尺寸大小分别为
Figure GDA0003955365340000091
这样保证了网络对特征信息高效学习的同时,均衡了训练网络所需的时间开销;当前排序为第三的残差块,将输出数据输入到一个平均池化窗口大小为5×5×1,步幅为(1,1,1)的3D平均池化层,来对特征信息的空间纬度做降维减半处理,当前的降维处理可以有效的减小全连接层的计算开销;
最后,将处理得到的特征向量数据经过包含有64个神经元的全连接层和softmax函数后,得到预测的输入样本类别。
S3、将待分类的高光谱图像(特征信息)输入到步骤S2训练好的高光谱图像分类网络中,得到图像分类结果;而本实施例为了保证图像分类精度,在进行最终的图像分类前,通过构建测试集对当前训练好的高光谱图像分类网络进行检验,具体的,本实施例中,将测试集样本以和训练集输入到分类网络时相同的块大小格式,输入到训练好的分类网络模型中实现分类计算。
还需要在进一步说明的是:本实施例中提到的高光谱遥感图像,具体指的是通过高光谱仪获取,光谱分辨率一般都在10-2λ数量级的范围内,光谱波段数可达几十个甚至几百个的图像。
还需要在进一步说明的是:高光谱遥感图像可以将目标的空间信息和光谱信息相结合,类似于一个三维立方体,自上而下对应多个波段,每个波段所采集的平面信息,一般称其为空间信息;每个波段中同一位置的像素点所组成的向量,一般称其为光谱信息。
还需要在进一步说明的是:本实施例中提到的注意力机制,具体指的是机器学习中的一种数据处理方法,广泛应用在自然语言处理、图像识别及语音识别等各种不同类型的机器学习任务中。根据具体任务目标,通过对关注的方向和加权模型进行调整,强化有用的特征信息,并使不符合注意力模型的内容弱化,让深度神经网络学到图像数据中需要关注的区域。
还需要在进一步说明的是:本实施例中提到的残差网,具体指的是相对于常规卷积神经网络引入了跳跃连接也就是直接映射部分,由若干残差块组成,残差块分成两部分直接映射部分和残差部分,残差部分一般主要由两个或者三个卷积操作构成。直接映射部分用于把网络前端层的输出特征信息隔层跳跃传给后端层重新处理,这样也缓解了在深度神经网络中增加深度带来的梯度消失问题。
请参考图2,其为整体实施流程图,结合前述的图像分类的方法,整体实施流程具体可分为以下几项步骤:
首先,将高光谱原始3D立方体数据块输入到待测网络下;
其次,嵌入并行注意力机制的残差块;
其次,利用3个残差块构成改进的残差网;
其次,将当前构建的残差网依次连接到一个3D平均池化层和一个全连接层;
其次,将所需分类的图像数据输入到当前构建的图像分类网络下,得到分类结果;
其次,依据分类结果对网络分类精度做进一步判断,在分类精度不满足预设条件时,则进行网络训练,直到得到一个分类精度较高的网络,用于后续步骤;
最后,利用测试集进行网络评估。
本发明公开的一种基于并行注意力机制残差网进行高光谱图像分类的方法,针对高光谱图像数据自身的特点,本发明首次针对性的设计了符合一般高光谱图像数据构造的并行注意力机制,通过两个并行的分支同步的学习光谱特征信息和空间特征信息,尽可能的使网络学习辨别性强的空谱特征;再将并行注意力机制与残差网构造特性结合,重新设计了残差块的构造;其有效的提高的图像分类精度,适合长远的推广及应用。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (7)

1.一种基于并行注意力机制残差网进行高光谱图像分类的方法,其特征在于,包括以下步骤:
S1、构建残差块,所述残差块嵌入两条并行的注意分支网络支路,对输入的数据,进行空间特征信息和光谱特征信息的识别;所述两条并行的注意分支网络支路分为第一网络支路和第二网络支路,所述第一网络支路应用光谱注意力机制,所述第二网络支路应用空间注意力机制;
S11、获取数据集;
S12、将获取到的数据集输入到注意分支网络支路中,并经进行特征学习;其中,第一网络支路采用光谱注意力机制,针对输入数据的光谱波段,进行光谱特征信息识别学习;第二网络支路采用空间注意力机制,针对输入数据的空间信息,进行空间特征信息的识别学习;
S13、将两个注意分支网络支路的输出,通过逐元素相乘融合在一起,形成与原始输入数据空间大小相同,波段减半的概率分布立方体Fatt
S14、对原始输入数据进行线性卷积变换,将其变换后的数据波段与Fatt的波段进行统一;在进行波段统一后,将Fatt与线性变换后的原始输入数据通过逐元素相乘的方式进行融合,得到特征融合数据;
S15、加入残差连接,将所述特征融合数据与经过线性卷积变换后的原始输入数据进行逐元素相加,得到嵌入并行注意力机制的残差块;
S2、利用步骤S1构建的残差块来构建高光谱图像分类网络,所述高光谱图像分类网络包括若干个依次连接的残差块;其中,排列在第一位的残差块,其输入的数据包括高光谱图像数据集;所述高光谱图像分类网络还包括依次连接在所述若干个依次连接的残差块之后的3D平均池化层和全连接层,所述3D平均池化层用于对当前残差块输出的数据进行空间维度的调整,降低整个网络的计算开销;所述全连接层用于处理经空间维度调整后的特征向量,得到输入样本类别;
S3、将高光谱原始3D立方体数据输入到步骤S2构建好的高光谱图像分类网络中,得到图像分类结果。
2.根据权利要求1所述的高光谱图像分类的方法,其特征在于,步骤S12中,基于光谱注意力机制的处理过程,用数据公式表示为
Fspectral=σ(AvgPool(f1(AvgPool(F))));
其中,σ代表softmax非线性激活函数,AvgPool代表平均池化层,f1(·)代表对“·”进行卷积层计算,F代表输入到网络的数据;
基于空间注意力机制的处理过程,用数学公式表示为:
Fspatial=σ(f3(f2(F)));
σ代表softmax非线性激活函数,f2,f3代表卷积层计算,F代表输入到网络的数据。
3.根据权利要求1所述的高光谱图像分类的方法,其特征在于,步骤S12中,所述获取到的数据以原始数据的立方体形式,输入到注意分支网络支路,进行特征学习;其中:
以像元p为中心,沿上、下、左、右四个方向各延伸m个像元单位,组成一个(2m+1)×(2m+1)的空间平面;
将所述空间平面中的光谱波段数全部取出,构成一个大小为d×d×B的立方体,其中,d表示空间3D立方体的空间尺寸长和宽,B代表高光谱图像数据的波段数。
4.根据权利要求3所述的高光谱图像分类的方法,其特征在于,在将原始数据以立方体形式输入到高光谱图像分类网络时,以中心像元p所属的类别作为样本所属的类别;通过学习识别中心像元p与其周围像元的空间特征信息,并利用整体的光谱波段特征信息,进行光谱特征信息的识别学习。
5.根据权利要求1所述的高光谱图像分类的方法,其特征在于,步骤S15中,加入残差连接,将Fatt与原始输入数据f0(F)通过逐元素相乘进行融合,并将得到的特征融合数据与f0(F)进行逐元素相加,其数学表达式为:
其中,Fout代表残差块的输出,f0代表线性卷积变换;在经过上述处理操作后,得到嵌入并行注意力机制的残差块;“A⊕B”表示将参数A和B进行逐元素相加;表示将参数A和B进行逐元素相乘。
6.根据权利要求1所述的高光谱图像分类的方法,其特征在于,步骤S2中,每个残差块的运作机理相同,其中,每个残差块输出的数据块相对于输入的数据块,其空间大小相同,波段数减半,保证了网络对特征信息学习的同时,均衡了训练网络所需的时间开销;
最后,将3D平均池化层输出的特征向量,经过一个包含有χ个神经元的全连接层和softmax函数后,得到预测的输入样本类别。
7.根据权利要求1所述的高光谱图像分类的方法,其特征在于,在进行最终的图像分类前,输入测试数据集对高光谱图像分类网络的分类精度进行检验,其中,将测试集样本以和在进行网络训练时的训练数据集输入到网络时,相同的块大小格式输入到高光谱图像分类网络模型中,进行分类计算。
CN202010014471.3A 2020-01-07 2020-01-07 基于并行注意力机制残差网进行高光谱图像分类的方法 Active CN111274869B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010014471.3A CN111274869B (zh) 2020-01-07 2020-01-07 基于并行注意力机制残差网进行高光谱图像分类的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010014471.3A CN111274869B (zh) 2020-01-07 2020-01-07 基于并行注意力机制残差网进行高光谱图像分类的方法

Publications (2)

Publication Number Publication Date
CN111274869A CN111274869A (zh) 2020-06-12
CN111274869B true CN111274869B (zh) 2023-04-07

Family

ID=71111835

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010014471.3A Active CN111274869B (zh) 2020-01-07 2020-01-07 基于并行注意力机制残差网进行高光谱图像分类的方法

Country Status (1)

Country Link
CN (1) CN111274869B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860398B (zh) * 2020-07-28 2022-05-10 河北师范大学 遥感图像目标检测方法、系统及终端设备
CN112116064A (zh) * 2020-08-11 2020-12-22 西安电子科技大学 光谱超分辨自适应加权注意力机制深层网络数据处理方法
CN112052755B (zh) * 2020-08-24 2023-06-02 西安电子科技大学 基于多路注意力机制的语义卷积高光谱图像分类方法
CN112052758B (zh) * 2020-08-25 2023-05-23 西安电子科技大学 基于注意力机制和循环神经网络的高光谱图像分类方法
CN112232343B (zh) * 2020-09-03 2023-11-21 国家粮食和物资储备局科学研究院 一种粮食霉变粒识别神经网络和识别方法
CN112287978B (zh) * 2020-10-07 2022-04-15 武汉大学 一种基于自注意力上下文网络的高光谱遥感图像分类方法
CN112580480B (zh) * 2020-12-14 2024-03-26 河海大学 一种高光谱遥感影像分类方法及装置
CN112633401B (zh) * 2020-12-29 2022-11-08 中国科学院长春光学精密机械与物理研究所 一种高光谱遥感图像分类方法、装置、设备及存储介质
CN112819910B (zh) * 2021-01-08 2022-12-27 上海理工大学 基于双鬼注意力机制网络的高光谱图像重建方法
CN113223000A (zh) * 2021-04-14 2021-08-06 江苏省基础地理信息中心 一种提高小目标分割精度的综合方法
CN113139902A (zh) * 2021-04-23 2021-07-20 深圳大学 一种高光谱图像超分辨率重建方法、装置及电子设备
CN113284102B (zh) * 2021-05-14 2022-11-01 国网新源张家口风光储示范电站有限公司 一种基于无人机的风机叶片损伤智能检测方法及装置
CN114067153B (zh) * 2021-11-02 2022-07-12 暨南大学 基于并行双注意力轻量残差网络的图像分类方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871830A (zh) * 2019-03-15 2019-06-11 中国人民解放军国防科技大学 基于三维深度残差网络的空谱融合高光谱图像分类方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631480B (zh) * 2015-12-30 2018-10-26 哈尔滨工业大学 基于多层卷积网络与数据重组折叠的高光谱数据分类方法
CN106469316B (zh) * 2016-09-07 2020-02-21 深圳大学 基于超像素级信息融合的高光谱图像的分类方法及系统
CN109376804B (zh) * 2018-12-19 2020-10-30 中国地质大学(武汉) 基于注意力机制和卷积神经网络高光谱遥感图像分类方法
CN110348399B (zh) * 2019-07-15 2020-09-29 中国人民解放军国防科技大学 基于原型学习机制和多维残差网络的高光谱智能分类方法
CN110516596B (zh) * 2019-08-27 2023-03-24 西安电子科技大学 基于Octave卷积的空谱注意力高光谱图像分类方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109871830A (zh) * 2019-03-15 2019-06-11 中国人民解放军国防科技大学 基于三维深度残差网络的空谱融合高光谱图像分类方法

Also Published As

Publication number Publication date
CN111274869A (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN111274869B (zh) 基于并行注意力机制残差网进行高光谱图像分类的方法
CN108537742B (zh) 一种基于生成对抗网络的遥感图像全色锐化方法
Mascarenhas et al. A comparison between VGG16, VGG19 and ResNet50 architecture frameworks for Image Classification
CN111368896B (zh) 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法
WO2021042828A1 (zh) 神经网络模型压缩的方法、装置、存储介质和芯片
CN111695467B (zh) 基于超像素样本扩充的空谱全卷积高光谱图像分类方法
Heydari et al. Meta-analysis of deep neural networks in remote sensing: A comparative study of mono-temporal classification to support vector machines
CN111783831B (zh) 基于多源多标签共享子空间学习的复杂图像精确分类方法
CN112200090B (zh) 基于交叉分组空谱特征增强网络的高光谱图像分类方法
CN107145830A (zh) 基于空间信息增强和深度信念网络的高光谱图像分类方法
CN111401426B (zh) 基于伪标签学习的小样本高光谱图像分类方法
CN113139512B (zh) 基于残差和注意力的深度网络高光谱影像分类方法
CN112347888A (zh) 基于双向特征迭代融合的遥感图像场景分类方法
CN110188827A (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN115205590A (zh) 一种基于互补集成Transformer网络的高光谱图像分类方法
CN115131313A (zh) 基于Transformer的高光谱图像变化检测方法及装置
Piat et al. Image classification with quantum pre-training and auto-encoders
CN111325259A (zh) 一种基于深度学习和二进制编码的遥感图像分类方法
CN111310820A (zh) 基于交叉验证深度cnn特征集成的地基气象云图分类方法
CN116563683A (zh) 一种基于卷积神经网络和多层感知机的遥感影像场景分类方法
CN113989528B (zh) 基于深度联合稀疏-协同表示的高光谱图像特征表示方法
CN113450313B (zh) 一种基于区域对比学习的图像显著性可视化方法
CN113313185B (zh) 一种基于自适应空谱特征提取的高光谱图像分类方法
CN114627370A (zh) 一种基于transformer特征融合的高光谱影像分类方法
CN117392392B (zh) 一种割胶线识别与生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant