CN114998725A - 基于自适应空谱注意力核生成网络的高光谱图像分类方法 - Google Patents

基于自适应空谱注意力核生成网络的高光谱图像分类方法 Download PDF

Info

Publication number
CN114998725A
CN114998725A CN202210538476.5A CN202210538476A CN114998725A CN 114998725 A CN114998725 A CN 114998725A CN 202210538476 A CN202210538476 A CN 202210538476A CN 114998725 A CN114998725 A CN 114998725A
Authority
CN
China
Prior art keywords
attention
feature
spatial
hyperspectral
kernel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210538476.5A
Other languages
English (en)
Other versions
CN114998725B (zh
Inventor
张彦梅
徐雁冰
余诚诚
岳亭轩
李欢
赵桂宸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202210538476.5A priority Critical patent/CN114998725B/zh
Publication of CN114998725A publication Critical patent/CN114998725A/zh
Application granted granted Critical
Publication of CN114998725B publication Critical patent/CN114998725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,首先通过光谱注意力核函数s实现光谱特征信息的有效选择,然后通过能够捕捉不同空间分布关系的空间注意力核函数集合W实现对不同像素邻域内空间特征的有效提取,使得本发明即使在小样本情况下也可以得到很高的分类精度,并能够产生更加均匀平滑且边界清晰的分类结果图。

Description

基于自适应空谱注意力核生成网络的高光谱图像分类方法
技术领域
本发明属于遥感图像处理领域,尤其涉及一种基于自适应空谱注意力核生成网络的高光谱图像分类方法。
背景技术
高光谱图像是由数百个光谱波段组成的三维图像数据,具有丰富的光谱信息和空间信息,既可以描述地面目标的物理特性又可以反映空间分布情况,因此被广泛应用在城市发展、地质勘探、环境监管等领域。高光谱图像分类的目的在于根据获得的样本特征将图像中的每个像素点划分到一个特定的地物类别,并根据地物类别的不同生成对应的分类结果图。
随着近年来深度学习理论的快速发展,以卷积神经网络(CNN)为主的深度学习方法在高光谱图像分类领域得到了广泛的应用,并取得了不错的进展。虽然基于CNN的高光谱分类方法已经取得了优秀的分类表现,但是这些分类方法往往需要大量的标记样本对模型进行参数优化,以获得良好的分类性能,当标记样本数量受限时,分类性能会出现断崖式下降。然而在高光谱图像处理领域,获得大规模的可用标记样本的成本是高昂的。因此,如何提高模型在小样本情况下的分类精度是高光谱图像应用领域的一个严峻挑战。
发明内容
为解决现有高光谱分类方法依赖于训练样本数量的局限性,本发明提供一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,能够利用极少的标记样本实现高光谱图像分类。
一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,采用基于自适应光谱-空间注意力核的网络模型对高光谱图像所包含的地物类别进行分类,其中,网络模型包括:
光谱注意力核生成模块,用于获取可以对高光谱像素邻域立方体X的光谱特征信息进行自适应选择的光谱注意力核函数s;
光谱特征选择模块,用于计算高光谱像素邻域立方体X各像素点与光谱注意力核函数S的哈达玛积,得到具有波段选择性的特征图M;
空间注意力核生成模块,用于获取可以捕捉特征图M中不同空间分布关系的空间注意力核函数集合W;
空间特征提取模块,用于利用空间注意力核函数集合W捕捉特征图M中不同像素邻域内的空间分布关系,得到具有空间相关性的特征图H;
光谱-空间特征分类模块,用于根据光谱-空间特征图H获取高光谱图像所包含的地物类别。
进一步地,所述光谱注意力核生成模块获取光谱注意力核函数s的方法为:
分别使用全局平均池化层和全局最大池化层从高光谱像素邻域立方体X中提取全局平均特征xavg和全局最大特征xmax,并将两者送入卷积层进行特征映射时自适应生成的光谱注意力权重savg与smax的和值作为光谱注意力核函数s。
进一步地,所述高光谱像素邻域立方体X的获取方法为:
假设待分类的高光谱图像包含C个波段,每个波段包含H×W个像素点,其中,H、W分别为高光谱图像的高度和宽度;使用空间尺寸为S×S的滑动窗口逐像素点对高光谱图像进行采样,且采样过程中采用边界补零策略,得到H×W个维度大小为S×S×C的高光谱像素邻域立方体X。
进一步地,所述空间注意力核生成模块获取空间注意力核函数集合W的方法为:
逐像素点对特征图M进行滑动窗口采样,得到多个以特征图M各像素点为中心像素点的像素邻域立方体,并将各像素邻域立方体组成特征集合
Figure BDA0003647382500000031
Figure BDA0003647382500000032
其中,i=1,2,…,SS,SS为特征图M像素点的个数;
分别将各像素邻域立方体Di输入全局平均池化层和全局最大池化层,得到各像素邻域立方体Di对应的全局特征平均Di avg和全局最大特征Di max
将全局特征平均Di avg和全局最大特征Di max的和值分别作为各像素邻域立方体Di对应的全局特征表示,并将全局特征表示通过卷积层映射到维度更高的特征空间Qi
将各像素邻域立方体Di与特征空间Qi的维度分别重塑为(K×K)×C和G×C,其中,K×K为空间注意力核函数Wi感受野的设定尺寸,G为空间注意力核函数Wi中空间注意力核的设定数量,然后根据如下公式分别计算各像素邻域立方体Di对应的空间注意力核函数Wi
Figure BDA0003647382500000033
其中,‖·‖2表示沿着高光谱图像的空间特征维度计算L2范数,sfm-1(·)表示沿着高光谱图像的第一个维度进行softmax归一化,T表示转置;
将各高光谱像素邻域立方体对应的空间注意力核函数组成空间注意力核函数集合W={W1,W2,…,Wi,…,Wss}。
进一步地,所述空间特征提取模块获取光谱-空间特征图H的方法为:
将每一个高光谱像素邻域立方体Di分别沿着各自的光谱特征维度平均划分为G组,且每一组均包含多个光谱特征通道,同时,高光谱像素邻域立方体Di的第g组光谱特征通道对应空间注意力核函数Wi的第g个空间注意力核
Figure BDA0003647382500000041
其中,g=1,2,…,G;
将各光谱特征通道分别与各自对应的空间注意力核
Figure BDA0003647382500000042
计算哈达玛积;
分别将每一个光谱特征通道内的所有像素点对应的哈达玛积沿着空间维度相加,则同属于一个高光谱像素邻域立方体Di的所有光谱特征通道对应的和值为关于高光谱像素邻域立方体Di的空间特征向量hi,进而得到光谱-空间特征图H={h1,h2,…,hi,…,hSS}。
进一步地,所述网络模型还包括:
样本获取模块,用于获取高光谱数据集,并将高光谱数据集按照设定比例划分为训练集和验证集,其中,所述高光谱数据集中的每一条样本均由高光谱像素邻域立方体及其中心像素对应的类别标签构成;
反向传播模块,用于当训练集中的高光谱像素邻域立方体依次经过光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块的操作后,将得到的各样本的地物类别与对应的类别标签构建交叉熵损失函数,使得光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块根据交叉熵损失函数调节自身的可学习参数,直至得到符合设定要求的网络模型。
进一步地,所述设定要求为:所有训练轮次中,总体分类精度OA最高,其中,训练轮次至少为200次,且每个训练轮次的总体分类精度OA的获取方法为:
每个训练轮次结束后,将验证集的高光谱像素邻域立方体依次经过当前网络模型所包含的光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块的操作后,根据得到的验证集各样本的地物类别的预测值与对应的类别标签真实值计算总体分类精度OA。
进一步地,所述高光谱数据集中每一条样本的高光谱像素邻域立方体以其中心像素对应的类别标签获取方法为:
对于待分类的高光谱图像I∈RH×W×C,其中,H、W分别为高光谱图像的高度和宽度,C为波段数,同时,假设高光谱图像I包含N个标记样本,以N个标记样本为中心像素,使用空间尺寸为S×S的滑动窗口逐个中心像素进行采样,且采样过程中采用边界补零策略,得到N个维度大小为S×S×C的像素邻域立方体,并组成高光谱图像样本集χ={X1,X2,…,Xk,…,XN},其中Xk∈RS×S×C;每个像素邻域立方体Xk的类别标签由其中心像素xk决定,与χ对应的类别标签集合
Figure BDA0003647382500000051
其中Yk∈{1,2,…,M},M为地物类别数;最后,由χ和
Figure BDA0003647382500000052
组成高光谱图像数据集
Figure BDA0003647382500000053
有益效果:
1、本发明提供一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,首先通过光谱注意力核函数s实现光谱特征信息的有效选择,然后通过能够捕捉不同空间分布关系的空间注意力核函数集合W实现对不同像素邻域内空间特征的有效提取,使得本发明即使在小样本情况下也可以得到很高的分类精度,并能够产生更加均匀平滑且边界清晰的分类结果图。
2、本发明提供一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,光谱注意力核生成模块获取光谱注意力核函数s时,将全局平均特征xavg和全局最大特征xmax送入卷积层进行特征映射,能够实现光谱特征的自适应选择。
3、本发明提供一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,空间注意力核生成模块获取空间注意力核函数Wi时,将全局特征平均Di avg和全局最大特征Di max的和值分别作为各像素邻域立方体Di对应的全局特征表示,再将全局特征表示通过卷积层映射到维度更高的特征空间Qi,能够增加空间注意力核函数的多样性,提高分类精度。
4、本发明提供一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,采用像素邻域立方体作为网络模型的训练样本,能够充分利用像素邻域立方体内丰富的光谱-空间信息,有效提高分类精度。
附图说明
图1为本发明提供的基于自适应空谱注意力核生成网络的网络模型的原理框图;
图2为本发明提供的网络模型的训练流程示意图;
图3为本发明提供的Indian Pines数据集分类结果图;其中,(a)为伪彩色图,(b)为地面真值图,(c)为分类结果图;
图4为本发明提供的Pavia University数据集分类结果图;其中,(a)为伪彩色图,(b)为地面真值图,(c)为分类结果图;
图5为本发明提供的Salinas数据集分类结果图;其中,(a)为伪彩色图,(b)为地面真值图,(c)为分类结果图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本发明提供的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,采用基于自适应光谱-空间注意力核的网络模型对高光谱图像所包含的地物类别进行分类,其中,如图1所示,网络模型包括:光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块;其中,各模块的功能具体如下:
光谱注意力核生成模块,用于获取可以对高光谱像素邻域立方体X的光谱特征信息进行自适应选择的光谱注意力核函数s,具体的:分别使用全局平均池化层和全局最大池化层从高光谱像素邻域立方体X中提取全局平均特征xavg和全局最大特征xmax,并将两者送入卷积层进行特征映射时自适应生成的光谱注意力权重savg与smax的和值作为光谱注意力核函数s。
需要说明的是,高光谱像素邻域立方体X的获取方法为:将待分类的高光谱图像记为I∈RH×W×C,其中,高光谱图像I每个波段包含H×W个像素点,共有C个波段,其中H、W分别为高光谱图像的高度和宽度;使用设定空间尺寸,如9×9的滑动窗口逐像素点对高光谱图像I进行采样,且采样过程中采用边界补零策略,则可以得到H×W个维度大小为9×9×C的像素邻域立方体。
进一步地,全局平均特征xavg和全局最大特征xmax可以用数学表达式表示为:
Figure BDA0003647382500000081
xmax=max(X)∈R1×1×C
其中,x(i,j)表示像素邻域立方体中位于(i,j)位置处的像素向量;为了实现光谱特征的自适应选择,将xavg和xmax送入两个1×1卷积层进行特征映射,自适应地生成光谱注意力权重savg和smax,可以用数学表达式表示为:
Figure BDA0003647382500000082
Figure BDA0003647382500000083
其中,
Figure BDA0003647382500000084
表示1×1卷积操作,W1∈R(C/r)×C,W2∈RC×(C/r)分别是卷积层
Figure BDA0003647382500000085
的权重参数,σ(·)和δ(·)分别表示ReLu和sigmoid激活函数,r表示通道降维的比例;将savg和smax相加得到最终的自适应光谱注意力核函数s,用于实现光谱特征的自适应选择。
光谱特征选择模块,用于计算高光谱图像X各像素点与光谱注意力核函数s的哈达玛积,得到具有波段选择性的特征图M。
需要说明的是,基于前面得到的高光谱图像X的像素邻域立方体,且为了实现对光谱信息的自适应选择,本发明将高光谱像素邻域立方体X逐像素点与自适应光谱注意力核s∈R1×1×C计算哈达玛积,得到具有波段选择性的输出特征图M∈RS×S×C,矩阵向量M中位于(i,j)处的像素向量m(i,j)可以用数学表达式表示为:
m(i,j)=s·x(i,j)∈R1×1×C
空间注意力核生成模块,用于获取可以捕捉特征图M中不同空间分布关系的空间注意力核函数W,具体如下:
对于输入特征图M∈RS×S×C,逐像素点进行滑动窗口采样,得到S×S个像素邻域立方体,并组成新的特征集合
Figure BDA0003647382500000091
其中Di∈RK×K×C,K×K表示空间注意力核的感受野;将Di分别输入全局平均池化层和全局最大池化层,得到关于Di的全局特征平均Di avg和全局最大特征Di max,可以用数学表达式表示为:
Figure BDA0003647382500000092
Di max=max(Di)∈R1×1×C
其中,d(i,j)表示Di中位于(i,j)位置处的像素向量;为了增加空间注意力核函数的多样性,将Di avg和Di max相加得到关于Di的全局特征表示di∈R1×1×C,并通过1×1卷积层映射到高维特征空间Qi∈R1×1×CG;将Di和Qi的维度分别重塑为KK×C和G×C,其中,KK=K×K为空间注意力核函数Wi感受野的设定尺寸,G为空间注意力核函数Wi中空间注意力核的设定数量,则与邻域立方体Di所对应的自适应空间注意力核函数Wi可以用数学表达式表示为:
Figure BDA0003647382500000093
其中,‖·‖2表示沿着高光谱图像的空间特征维度计算L2范数,sfm-1(·)表示沿着第一维度,即维度值为KK的维度,进行softmax归一化,T表示转置。此外,本发明将各高光谱像素邻域立方体对应的空间注意力核函数组成核函数集合W={W1,W2,…,Wi,…,Wss},其中,i=1,2,…,SS,SS=S×S为特征图M像素点的个数。
对Wi进行维度重塑,得到与邻域立方体Di一一对应的自适应空间注意力核Wi∈RK ×K×C
空间特征提取模块,用于利用空间注意力核函数W捕捉特征图M中不同像素邻域内的空间分布关系,得到具有强空间相关性的特征图H,具体如下:
将每一个高光谱像素邻域立方体Di分别沿着各自的光谱特征维度平均划分为G组,且每一组均包含多个光谱特征通道,同时,高光谱像素邻域立方体Di的第g组光谱特征通道对应空间注意力核函数Wi的第g个空间注意力核
Figure BDA0003647382500000101
其中,g=1,2,…,G;
将各光谱特征通道分别与各自对应的空间注意力核
Figure BDA0003647382500000102
计算哈达玛积;
分别将每一个光谱特征通道内的所有像素点对应的哈达玛积沿着空间维度相加,则同属于一个高光谱像素邻域立方体Di的所有光谱特征通道对应的和值为关于高光谱像素邻域立方体Di的空间特征向量hi,进而得到光谱-空间特征图H={h1,h2,…,hi,…,hSS}。
也就是说,本发明将每一个像素邻域立方体Di沿着高光谱图像的光谱特征维度平均划分为G组,每一组
Figure BDA0003647382500000103
分别与对应的
Figure BDA0003647382500000104
逐通道计算哈达玛积,然后分别将各光谱特征通道内所有像素点对应的哈达玛积沿着空间维度相加,得到关于像素邻域立方体Di的空间特征向量hi∈R1×1×C,hi中第m个通道的元素值
Figure BDA0003647382500000105
可以由数学表达式表示为:
Figure BDA0003647382500000106
其中,
Figure BDA0003647382500000107
表示向上取整,
Figure BDA0003647382500000108
表示自适应空间注意力核Wi中位于
Figure BDA0003647382500000109
处的元素值,di(u,v,m)表示邻域Di中位于(u,v,m)处的元素值;对S×S个像素邻域立方体Di逐一计算对应的空间特征向量hi,得到特征向量集合H={h1,h2,…,hi,…,hSS},并进行维度重塑得到与输入特征图M具有相同维度的特征图H∈RS×S×C
例如,假设一个高光谱像素邻域立方体有C个光谱特征通道,被分成了G组,每一组光谱特征通道中的各光谱特征通道均与同一个空间注意力核
Figure BDA0003647382500000111
计算哈达玛积,然后再分别将每一个光谱特征通道中的所有像素点对应的哈达玛积相加,若一个光谱特征通道的空间尺寸为K×K,则将K×K个哈达玛积相加,每一个光谱特征通道对应一个和值,则C个和值构成一个高光谱像素邻域立方体的空间特征向量hi
光谱-空间特征分类模块,用于根据光谱-空间特征图H获取高光谱图像所包含的地物类别。具体的,光谱-空间特征分类模块将光谱-空间特征图H∈RS×S×C输入全局平均池化层进行全局平均池化,得到类别特征向量p∈R1×1×C;将类别特征向量p输入带有softmax分类器的全连接分类层产生最终的高光谱图像分类结果。
基于上述网络模型对高光谱图像所包含的地物类别进行分类的具体过程,下面详细介绍基于自适应光谱-空间注意力核的网络模型的训练获取方法;所述网络模型还包括样本获取模块和反向传播模块。
其中,样本获取模块,用于获取高光谱数据集,并将高光谱数据集按照设定比例划分为训练集和验证集,其中,所述高光谱数据集中的每一条样本均由高光谱像素邻域立方体以及高光谱像素邻域立方体的中心像素对应的类别标签构成;同时,所述高光谱数据集中每一条样本的高光谱像素邻域立方体以及高光谱像素邻域立方体对应的类别标签获取方法为:
对于待分类的高光谱图像I∈RH×W×C,其中,H、W分别为高光谱图像的高度和宽度,C为波段,同时,假设高光谱图像I包含N个标记样本,以N个标记样本为中心像素,使用空间尺寸为S×S的滑动窗口逐个中心像素进行采样,且采样过程中采用边界补零策略,得到N个维度大小为S×S×C的像素邻域立方体,并组成高光谱图像样本集χ={X1,X2,…,Xk,…,XN},其中Xk∈RS×S×C;每个像素邻域立方体Xk的类别标签由其中心像素xk决定,与χ对应的类别标签集合
Figure BDA0003647382500000121
其中Yk∈{1,2,…,M},M为地物类别数;最后,将由χ和
Figure BDA0003647382500000122
组成的高光谱图像数据集
Figure BDA0003647382500000123
按照一定的比例对各个样本类别进行随机采样,将200个样本划分为训练集,400个样本划分为验证集,剩余标记样本划分为测试集。
反向传播模块,用于当训练集中的高光谱图像依次经过光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块的操作后,将得到的各样本的地物类别与对应的类别标签构建交叉熵损失函数,使得光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块根据交叉熵损失函数调节自身的可学习参数,直至得到符合设定要求的网络模型。其中,所述设定要求为:所有训练轮次中,总体分类精度OA最高,其中,训练轮次至少为200次,且每个训练轮次的总体分类精度OA的获取方法为:
每个训练轮次结束后,将验证集的高光谱像素邻域立方体依次经过当前网络模型所包含的光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块的操作后,根据得到的验证集各样本的地物类别的预测值与对应的类别标签真实值计算总体分类精度OA。
也就是说,整个网络模型的训练过程需至少迭代200个训练轮次,每个训练轮次结束后,将验证集的样本送入当前训练轮次得到的网络模型,再根据得到样本类别标签的预测值来计算总体分类精度,所有训练轮次迭代完毕后,选择在验证集上得到最高总体分类精度OA的训练轮次产生的模型参数作为最终的网络模型参数。
需要说明的是,本发明采用He正态分布对网络模型中所有可训练参数进行初始化;同时,本发明用来监督网络训练结果的交叉熵损失函数用数学表达式表示为:
Figure BDA0003647382500000131
其中,l(·)表示指示函数,当j=Yi时,l(Yi,j)=1,否则l(Yi,j)=0,Yi表示第i个标记样本的真实标签值,
Figure BDA0003647382500000132
表示第i个标记样本被分为第j类的分类概率;采用Adam优化器优化模型中所有的可学习参数。
需要说明的是,在本发明中,设置三个超参数,即光谱注意力核的通道降维比例r,空间注意力核的感受野K×K以及空间注意力核的数量G;例如,面对不同的数据集时,本发明给出了最优超参数设置如表1所示。
表1:不同数据集的超参数设置
Figure BDA0003647382500000133
由此可见,如图2所示,本发明的基于卷积神经网络的网络模型的获取方法可以总结如下:
步骤1:读取待分类高光谱图像,以标记样本为中心像素逐像素点采样,获得尺寸为S×S×C的像素邻域立方体,组成标记样本集合,像素邻域立方体的类别标签由中心像素决定;将标记样本集合与中心像素所对应的类别标签集合组合得到高光谱图像数据集;按照一定的比例对各个样本类别进行随机采样,得到总共200个标记样本作为训练集,400个样本作为验证集,剩余的标记样本作为验证集。
步骤2:构建自适应光谱注意力核生成模块,生成可以对光谱特征信息进行自适应选择的光谱注意力核。
步骤3:构建光谱特征选择模块,利用生成的光谱注意力核实现对光谱特征信息的有效选择,获得紧凑而有效的光谱特征表示。
步骤4:构建自适应空间注意力核生成模块,充分利用不同像素邻域立方体内上下文信息的多样性,动态生成可以捕捉不同空间分布关系的空间注意力核。
步骤5:构建空间特征提取模块,利用生成的空间注意力核对不同的像素邻域立方体进行空间特征提取,得到用于分类的样本特征。
步骤6:构建光谱-空间特征分类模块,对输入的光谱-空间特征的进行分类,得到高光谱图像分类结果。
步骤7;模型初始化与训练优化,采用He正态分布初始化模型中所有CNN的训练参数,将训练集数据分批次输入模型进行训练,通过交叉熵损失函数对模型的分类结果进行监督,并通过Adam优化器对模型的所有训练参数进行优化。
步骤8:将验证集数据送入训练好的模型进行分类并计算分类精度,生成分类结果图。
进一步地,使用本发明对Indian Pines、Pavia University以及Kennedy SpaceCenter三个公开的高光谱图像数据集进行分类,三个数据集中各个类别的样本采样数量如表2、表3、表4所示,不同数据集的总体分类精度(OA),平均分类精度(AA)以及卡帕系数(κ)如表5所示,可知本发明在使用200个标记样本进行模型训练的小样本情况下,在IndianPines、Pavia University和Kennedy Space Center三个公开高光谱数据集上分别实现了94.82%、98.48%和98.57%的总体分类精度。同时,三个数据集的分类结果图分别如图3中的(a)~(c)、图4中的(a)~(c)、图5中的(a)~(c)所示,说明本发明不仅可以在小样本情况下得到更高的分类精度,而且可以产生更加均匀平滑,且边界清晰的分类结果图。
表2:Indian Pines数据集各类别的样本采样数量
Figure BDA0003647382500000151
表3:Pavia University数据集各类别的样本采样数量
Figure BDA0003647382500000161
表4:Kennedy Space Center数据集各类别的样本采样数量
Figure BDA0003647382500000162
表5:不同数据集分类精度
Figure BDA0003647382500000163
综上所述,本发明通过对不同通道内的光谱特征施加自适应注意力权重,来实现光谱特征信息的有效选择;同时,通过利用不同像素邻域内上下文信息的差异性,在不同空间位置处生成该位置特有的具有更强空间相关性的空间注意力特征核,也即空间注意力核不是静态不变,而是随着空间位置的变化而动态变化,以此实现对不同像素邻域内空间特征的有效提取,提高了分类精度。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当然可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (8)

1.一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,采用基于自适应光谱-空间注意力核的网络模型对高光谱图像所包含的地物类别进行分类,其中,网络模型包括:
光谱注意力核生成模块,用于获取可以对高光谱像素邻域立方体X的光谱特征信息进行自适应选择的光谱注意力核函数s;
光谱特征选择模块,用于计算高光谱像素邻域立方体X各像素点与光谱注意力核函数s的哈达玛积,得到具有波段选择性的特征图M;
空间注意力核生成模块,用于获取可以捕捉特征图M中不同空间分布关系的空间注意力核函数集合W;
空间特征提取模块,用于利用空间注意力核函数集合W捕捉特征图M中不同像素邻域内的空间分布关系,得到具有空间相关性的特征图H;
光谱-空间特征分类模块,用于根据光谱-空间特征图H获取高光谱图像所包含的地物类别。
2.如权利要求1所述的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,所述光谱注意力核生成模块获取光谱注意力核函数s的方法为:
分别使用全局平均池化层和全局最大池化层从高光谱像素邻域立方体X中提取全局平均特征xavg和全局最大特征xmax,并将两者送入卷积层进行特征映射时自适应生成的光谱注意力权重savg与smax的和值作为光谱注意力核函数s。
3.如权利要求1所述的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,所述高光谱像素邻域立方体X的获取方法为:
假设待分类的高光谱图像包含C个波段,每个波段包含H×W个像素点,其中,H、W分别为高光谱图像的高度和宽度;使用空间尺寸为S×S的滑动窗口逐像素点对高光谱图像进行采样,且采样过程中采用边界补零策略,得到H×W个维度大小为S×S×C的高光谱像素邻域立方体X。
4.如权利要求1所述的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,所述空间注意力核生成模块获取空间注意力核函数集合W的方法为:
逐像素点对特征图M进行滑动窗口采样,得到多个以特征图M各像素点为中心像素点的像素邻域立方体,并将各像素邻域立方体组成特征集合
Figure FDA0003647382490000022
Figure FDA0003647382490000023
其中,i=1,2,…,SS,SS为特征图M像素点的个数;
分别将各像素邻域立方体Di输入全局平均池化层和全局最大池化层,得到各像素邻域立方体Di对应的全局特征平均Di avg和全局最大特征Di max
将全局特征平均Di avg和全局最大特征Di max的和值分别作为各像素邻域立方体Di对应的全局特征表示,并将全局特征表示通过卷积层映射到维度更高的特征空间Qi
将各像素邻域立方体Di与特征空间Qi的维度分别重塑为(K×K)×C和G×C,其中,K×K为空间注意力核函数Wi感受野的设定尺寸,G为空间注意力核函数Wi中空间注意力核的设定数量,然后根据如下公式分别计算各像素邻域立方体Di对应的空间注意力核函数Wi
Figure FDA0003647382490000021
其中,‖·‖2表示沿着高光谱图像的空间特征维度计算L2范数,sfm-1(·)表示沿着高光谱图像的第一个维度进行softmax归一化,T表示转置;
将各高光谱像素邻域立方体对应的空间注意力核函数组成空间注意力核函数集合W={W1,W2,…,Wi,…,Wss}。
5.如权利要求4所述的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,所述空间特征提取模块获取光谱-空间特征图H的方法为:
将每一个高光谱像素邻域立方体Di分别沿着各自的光谱特征维度平均划分为G组,且每一组均包含多个光谱特征通道,同时,高光谱像素邻域立方体Di的第g组光谱特征通道对应空间注意力核函数Wi的第g个空间注意力核
Figure FDA0003647382490000031
其中,g=1,2,…,G;
将各光谱特征通道分别与各自对应的空间注意力核
Figure FDA0003647382490000032
计算哈达玛积;
分别将每一个光谱特征通道内的所有像素点对应的哈达玛积沿着空间维度相加,则同属于一个高光谱像素邻域立方体Di的所有光谱特征通道对应的和值为关于高光谱像素邻域立方体Di的空间特征向量hi,进而得到光谱-空间特征图H={h1,h2,…,hi,…,hSS}。
6.如权利要求1~5任意一个权利要求所述的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,所述网络模型还包括:
样本获取模块,用于获取高光谱数据集,并将高光谱数据集按照设定比例划分为训练集和验证集,其中,所述高光谱数据集中的每一条样本均由高光谱像素邻域立方体及其中心像素对应的类别标签构成;
反向传播模块,用于当训练集中的高光谱像素邻域立方体依次经过光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块的操作后,将得到的各样本的地物类别与对应的类别标签构建交叉熵损失函数,使得光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块根据交叉熵损失函数调节自身的可学习参数,直至得到符合设定要求的网络模型。
7.如权利要求6所述的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,所述设定要求为:所有训练轮次中,总体分类精度OA最高,其中,训练轮次至少为200次,且每个训练轮次的总体分类精度OA的获取方法为:
每个训练轮次结束后,将验证集的高光谱像素邻域立方体依次经过当前网络模型所包含的光谱注意力核生成模块、光谱特征选择模块、空间注意力核生成模块、空间特征提取模块以及光谱-空间特征分类模块的操作后,根据得到的验证集各样本的地物类别的预测值与对应的类别标签真实值计算总体分类精度OA。
8.如权利要求6所述的一种基于自适应空谱注意力核生成网络的高光谱图像分类方法,其特征在于,所述高光谱数据集中每一条样本的高光谱像素邻域立方体以其中心像素对应的类别标签获取方法为:
对于待分类的高光谱图像I∈RH×W×C,其中,H、W分别为高光谱图像的高度和宽度,C为波段数,同时,假设高光谱图像I包含N个标记样本,以N个标记样本为中心像素,使用空间尺寸为S×S的滑动窗口逐个中心像素进行采样,且采样过程中采用边界补零策略,得到N个维度大小为S×S×C的像素邻域立方体,并组成高光谱图像样本集χ={X1,X2,…,Xk,…,XN},其中Xk∈RS×S×C;每个像素邻域立方体Xk的类别标签由其中心像素xk决定,与χ对应的类别标签集合
Figure FDA0003647382490000051
其中Yk∈{1,2,…,M},M为地物类别数;最后,由χ和
Figure FDA0003647382490000052
组成高光谱图像数据集
Figure FDA0003647382490000053
CN202210538476.5A 2022-05-17 2022-05-17 基于自适应空谱注意力核生成网络的高光谱图像分类方法 Active CN114998725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210538476.5A CN114998725B (zh) 2022-05-17 2022-05-17 基于自适应空谱注意力核生成网络的高光谱图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210538476.5A CN114998725B (zh) 2022-05-17 2022-05-17 基于自适应空谱注意力核生成网络的高光谱图像分类方法

Publications (2)

Publication Number Publication Date
CN114998725A true CN114998725A (zh) 2022-09-02
CN114998725B CN114998725B (zh) 2024-07-19

Family

ID=83027281

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210538476.5A Active CN114998725B (zh) 2022-05-17 2022-05-17 基于自适应空谱注意力核生成网络的高光谱图像分类方法

Country Status (1)

Country Link
CN (1) CN114998725B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115222946A (zh) * 2022-09-19 2022-10-21 南京信息工程大学 一种单阶段实例图像分割方法、装置以及计算机设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110516596A (zh) * 2019-08-27 2019-11-29 西安电子科技大学 基于Octave卷积的空谱注意力高光谱图像分类方法
US20200026953A1 (en) * 2018-07-23 2020-01-23 Wuhan University Method and system of extraction of impervious surface of remote sensing image
CN111914907A (zh) * 2020-07-13 2020-11-10 河海大学 一种基于深度学习空谱联合网络的高光谱图像分类方法
CN112116563A (zh) * 2020-08-28 2020-12-22 南京理工大学 一种基于谱维与空间协作邻域注意力的高光谱图像目标检测方法与系统
US20210089807A1 (en) * 2019-09-25 2021-03-25 Samsung Electronics Co., Ltd. System and method for boundary aware semantic segmentation
CN112836773A (zh) * 2021-04-08 2021-05-25 河海大学 一种基于全局注意力残差网络的高光谱图像分类方法
CN113095409A (zh) * 2021-04-13 2021-07-09 西安电子科技大学 基于注意力机制和权值共享的高光谱图像分类方法
CN113705526A (zh) * 2021-09-07 2021-11-26 安徽大学 一种高光谱遥感影像分类方法
CN113963182A (zh) * 2021-10-22 2022-01-21 河海大学 基于多尺度空洞卷积注意力网络的高光谱影像分类方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200026953A1 (en) * 2018-07-23 2020-01-23 Wuhan University Method and system of extraction of impervious surface of remote sensing image
CN110516596A (zh) * 2019-08-27 2019-11-29 西安电子科技大学 基于Octave卷积的空谱注意力高光谱图像分类方法
US20210089807A1 (en) * 2019-09-25 2021-03-25 Samsung Electronics Co., Ltd. System and method for boundary aware semantic segmentation
CN111914907A (zh) * 2020-07-13 2020-11-10 河海大学 一种基于深度学习空谱联合网络的高光谱图像分类方法
CN112116563A (zh) * 2020-08-28 2020-12-22 南京理工大学 一种基于谱维与空间协作邻域注意力的高光谱图像目标检测方法与系统
CN112836773A (zh) * 2021-04-08 2021-05-25 河海大学 一种基于全局注意力残差网络的高光谱图像分类方法
CN113095409A (zh) * 2021-04-13 2021-07-09 西安电子科技大学 基于注意力机制和权值共享的高光谱图像分类方法
CN113705526A (zh) * 2021-09-07 2021-11-26 安徽大学 一种高光谱遥感影像分类方法
CN113963182A (zh) * 2021-10-22 2022-01-21 河海大学 基于多尺度空洞卷积注意力网络的高光谱影像分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115222946A (zh) * 2022-09-19 2022-10-21 南京信息工程大学 一种单阶段实例图像分割方法、装置以及计算机设备
CN115222946B (zh) * 2022-09-19 2022-11-25 南京信息工程大学 一种单阶段实例图像分割方法、装置以及计算机设备

Also Published As

Publication number Publication date
CN114998725B (zh) 2024-07-19

Similar Documents

Publication Publication Date Title
CN111368896B (zh) 基于密集残差三维卷积神经网络的高光谱遥感图像分类方法
CN110135267B (zh) 一种大场景sar图像细微目标检测方法
CN110210313B (zh) 基于多尺度pca-3d-cnn空谱联合的高光谱遥感影像分类方法
CN111695467B (zh) 基于超像素样本扩充的空谱全卷积高光谱图像分类方法
CN108491849B (zh) 基于三维稠密连接卷积神经网络的高光谱图像分类方法
CN111191736A (zh) 基于深度特征交叉融合的高光谱图像分类方法
CN110084159A (zh) 基于联合多级空谱信息cnn的高光谱图像分类方法
CN114842264B (zh) 一种基于多尺度空谱特征联合学习的高光谱图像分类方法
CN112308152B (zh) 基于光谱分割与同质区域检测的高光谱图像地物分类方法
CN109190511B (zh) 基于局部与结构约束低秩表示的高光谱分类方法
CN109344891A (zh) 一种基于深度神经网络的高光谱遥感数据分类方法
CN113139512B (zh) 基于残差和注意力的深度网络高光谱影像分类方法
CN111626267B (zh) 一种利用空洞卷积的高光谱遥感图像分类方法
CN114155443B (zh) 一种基于多感受野图注意力网络的高光谱图像分类方法
CN113705641A (zh) 基于富上下文网络的高光谱图像分类方法
CN115564996A (zh) 一种基于注意力联合网络的高光谱遥感图像分类方法
CN113344045B (zh) 一种结合hog特征提高sar船只分类精度的方法
CN114780767A (zh) 一种基于深度卷积神经网络的大规模图像检索方法及系统
CN116977723A (zh) 基于空间-光谱混合自注意力机制的高光谱图像分类方法
CN109344777A (zh) 基于elm的高光谱遥感影像土地利用覆盖的优化分类方法
CN115272766A (zh) 一种基于混合傅立叶算子Transformer网络的高光谱图像分类方法
CN111639697A (zh) 基于非重复采样与原型网络的高光谱图像分类方法
CN113469084B (zh) 基于对比生成对抗网络的高光谱图像分类方法
CN114998725B (zh) 基于自适应空谱注意力核生成网络的高光谱图像分类方法
CN105678798A (zh) 一种结合局部空间信息的多目标模糊聚类图像分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant