CN109978041B

CN109978041B - 一种基于交替更新卷积神经网络的高光谱图像分类方法

Info

Publication number: CN109978041B
Application number: CN201910208682.8A
Authority: CN
Inventors: 窦曙光; 王文举; 姜中敏
Original assignee: University of Shanghai for Science and Technology
Current assignee: University of Shanghai for Science and Technology
Priority date: 2019-03-19
Filing date: 2019-03-19
Publication date: 2022-11-29
Anticipated expiration: 2039-03-19
Also published as: CN109978041A

Abstract

本发明提供一种基于交替更新卷积神经网络的高光谱图像分类方法，包括如下步骤：提取原始数据块作为交替更新谱间块的输入；采用交替更新谱间块进行学习，提取精炼过的谱间特征；采用降维层连接交替更新谱间块和交替更新空间块，对谱间特征进行压缩，得到压缩特征；采用交替更新空间块对压缩特征进行学习，提取精炼过的空间特征；将谱间特征和空间特征通过池化层、压缩层和全连接层，得到预测值；确定优化目标函数；采用优化目标函数计算预测值与实际值之间的损失，得到迭代训练的损失；根据迭代训练的损失，对待优化模型参数进行多次优化，得到迭代训练的损失最小时的预测值，而后将未知高光谱数据输入训练完的模型，即得到高光谱图像的分类结果。

Description

一种基于交替更新卷积神经网络的高光谱图像分类方法

技术领域

本发明属于高光谱图像领域，具体涉及一种基于交替更新卷积神经网络的高光谱图像分类方法。

背景技术

高光谱图像包含光谱和空间信息，通常由同一观测场景的数百个光谱带组成(Willett R M,Duarte M F,Davenport MA,et al.Sparsity and structure inhyperspectral imaging:Sensing,reconstruction,and target detection[J].IEEESignal Processing Magazine,2014,31(1):116-126.)。由于它们包含大量的信息，近年来高光谱在许多领域有重要的应用，例如食品材料的非接触分析(Caporaso N,Whitworth MB,Grebby S,et al.Non-destructive analysis ofsucrose,caffeine and trigonellineon single green coffee beans by hyperspectral imaging[J].Food ResearchInternational,2018,106:193-203.)。在所有这些高光谱图像应用中，高光谱图像分类是核心技术。然而，由于高光谱具有高维结构的特点，高光谱图像分类在遥感界仍然是一个具有挑战性的任务。

传统的高光谱图像分类方法包括特征工程和分类器。特征工程的本质是一种工程活动，其目的是最大限度地从原始的高光谱图像数据中提取或选择用于分类模型的特征。在高光谱图像分类任务中，如果可以从高光谱图像中提取和选择重要特征，则后续的分类训练过程只需要在一部分特征上建立模型。在高光谱图像分类特征工程的探索阶段，采用线性判别分析(LDA)对高光谱图像分类进行分析，其结果引入并证明了正则化LDA的有效性。然而，当正则化LDA应用于高光谱图像分类时，正则化LDA对正则化参数的调整高度敏感(Bandos T V,Bruzzone L,Camps-Valls G.Classification ofHyperspectral ImagesWith Regularized Linear Discriminant Analysis[J].Ieee Transactions onGeoscienceAnd Remote Sensing,2009,47(3):862-873.)。独立分量分析(ICA)(DallaMuraM,VillaA,Benediktsson JA,et al.Classification of Hyperspectral Images byUsing Extended Morphological Attribute Profiles and Independent ComponentAnalysis[J].Ieee Geoscience And Remote Sensing Letters,2011,8(3):542-546.)和主成分分析(PCA)也被应用于高光谱图像分类中，并且非线性PCA比线性PCA具有更好的分类精度(Licciardi G,Marpu P R,Chanussot J,et al.Linear Versus Nonlinear PCAfor the Classification ofHyperspectral Data Based on the ExtendedMorphological Profiles[J].Ieee Geoscience And Remote Sensing Letters,2012,9(3):447-451.)。近年来，流形学习(Lunga D,Prasad S,Crawford M M,et al.Manifold-Learning-Based Feature Extraction for Classification of Hyperspectral Data[J].Ieee Signal Processing Magazine,2014,31(1):55-66.)和局部二进制模式(LBP)(Li W,Chen C,Su H,et al.Local Binary Patterns and Extreme Learning Machinefor Hyperspectral Imagery Classification[J].IEEE Transactions on Geoscienceand Remote Sensing,2015,53(7):3681-3693.)对于HSI特征提取非常有用。

另一方面，分类器通常基于使用特征工程处理后的低维特征，以获得分类结果。在本世纪头十年，由于高维数据的低灵敏度，支持向量机(SVM)成为HSI分类中常用的有效方法之一。作为分类器，支持向量机比非参数分类器的径向基函数(RBF)和K近邻(KNN)更有效(Melgani F,Bruzzone L.Classification of hyperspectral remote sensing imageswith support vector machines[J].IEEE Transactions on Geoscience and RemoteSensing,2004,42(8):1778-1790.)。SVM在接收到光谱信息和空间信息后，可以得到很好的分类结果(Fauvel M,Benediktsson J A,Chanussot J,et al.Spectral and SpatialClassification ofHyperspectral Data Using SVMs and Morphological Profiles[J].IEEE Transactions on Geoscience And Remote Sensing,2008,46(11):3804-3814.)。最近，SVM还被用于结合来自高分辨率遥感图像的光谱、结构和语义特征的集合(Huang X,Zhang L P.An SVM Ensemble Approach Combining Spectral,Structural,and SemanticFeatures for the Classification of High-Resolution Remotely Sensed Imagery[J].IEEE Transactions on Geoscience And Remote Sensing,2013,51(1):257-272.)。除了支持向量机，之外人工神经网络(ANN)、多项式logistic回归(MLR)(Khodadadzadeh M,Li J,PlazaA,et al.A Subspace-Based Multinomial Logistic Regression forHyperspectral Image Classification[J].Ieee Geoscience And Remote SensingLetters,2014,11(12):2105-2109.)和基于稀疏表示的分类器(SRC)(TangYY,Yuan H L,LiL Q.Manifold-Based Sparse Representation for Hyperspectral ImageClassification[J].Ieee Transactions on Geoscience And Remote Sensing,2014,52(12):7606-7618.)也还广泛用于高光谱图像分类。

自2014年以来，深度学习，一个包括遥感在内的许多研究领域的热门话题，已经被用于高光谱图像分类(ChenY,Lin Z,Zhao X,et al.Deep Learning-BasedClassification of Hyperspectral Data[J].IEEE Journal of Selected Topics inApplied Earth Observations and Remote Sensing,2014,7(6):2094-2107.)。传统的特征提取方法大多没有从HSI中提取高层特征，但随后，哈工大的陈雨时提出了一种深度学习框架，它使用堆叠式自编码器(SAE)来获得有用的深度特征。基于深度学习的方法可以从高光谱图像中提取深度光谱和空间特征，以获得比大多数传统方法更高的分类精度(ZhangL,Zhang L,Du B.Deep Learning for Remote Sensing Data:A Technical Tutorial onthe State ofthe Art[J].IEEE Geoscience and Remote Sensing Magazine,2016,4(2):22-40.)。因此，近年来，出现了许多基于深度学习的高光谱图像分类方法(Ghamisi P,Maggiori E,Li S,et al.New Frontiers in Spectral-Spatial Hyperspectral ImageClassification:The Latest Advances Based on Mathematical Morphology,MarkovRandom Fields,Segmentation,Sparse Representation,and Deep Learning[J].IEEEGeoscience and Remote Sensing Magazine,2018,6(3):10-43.)。例如，深层信念网络(DBN)将PCA与logistic回归相结合以获得具有竞争性的分类精度(Chen Y S,Zhao X,JiaX P.Spectral-Spatial Classification of Hyperspectral Data Based on DeepBelief Network[J].Ieee Journal Of Selected Topics In Applied EarthObservations And Remote Sensing,2015,8(6):2381-2392.)。

在基于深层学习的方法中，深层卷积神经网络(CNN)方法可以实现最先进的分类精度。一种深度监督方法，使用随机PCA来降低原始HSI的维数，使用二维CNN来编码光谱和空间信息，以及使用多层感知器(MLP)来完成分类任务(Makantasis K,Karantzalos K,Doulamis A,et al.:DEEP SUPERVISED LEARNING FOR HYPERSPECTRAL DATACLASSIFICATION THROUGH CONVOLUTIONAL NEURAL NETWORKS,2015Ieee InternationalGeoscience And Remote Sensing Symposium,New York:Ieee,2015:4959-4962.)。三维(3D)CNN也可以用作特征提取模型，从高光谱图像中提取光谱空间特征(Chen Y,Jiang H,Li C,et al.Deep Feature Extraction and Classification of Hyperspectral ImagesBased on Convolutional Neural Networks[J].IEEE Transactions on Geoscience andRemote Sensing,2016,54(10):6232-6251.)。此外，两层3D-CNN的性能远远优于基于2D-CNN的方法(Li Y,Zhang H,Shen Q.Spectral-spatial classification ofhyperspectral imagery with 3D convolutional neural network[J].Remote Sensing,2017,9(1).)。

最近出现了两个深度卷积空谱网络，空谱残差网络(SSRN)(Zhong Z L,Li J,LuoZ M,et al.Spectral-Spatial Residual Network for Hyperspectral ImageClassification:A 3-D Deep Learning Framework[J].Ieee Transactions onGeoscience And Remote Sensing,2018,56(2):847-858.)和快速密集空谱卷积网络(FDSSC)(Wang W J,Dou S G,Jiang Z M,et al.A Fast Dense Spectral-SpatialConvolution Network Framework for Hyperspectral Images Classification[J].Remote Sensing,2018,10(7).)。由于这两种基于3D-CNN的方法具有比其他基于CNN的方法更深的CNN结构，所以已经获得了最先进的分类精度。对于三个广泛使用的高光谱图像数据集，SSRN和FDSSC实现了超过99％的总体精度、平均精度和kappa系数。高光谱图像分类似乎没有改进的余地。然而，深度学习的方法离不开数据的支持。如果没有燃料，深层学习就不能飞翔，因为数据是深层学习的核心。上文提到的SAE-LR方法需要标记样本总数的60％来训练；DBN和3D-CNN要求总数的50％；SSRN和FDSSC只需要20％或10％。即使SSRN和FDSSC要求最小比例的训练样本，训练标记的样本数量也大于1000个。由于基于深度学习的方法过于依赖数据，在遥感中标记样本的标记成本很高。因此，如何减少对标记数据的依赖性已成为一个紧迫的问题。

半监督方法用于高光谱图像分类时，只需要有限的标记训练样本。最近，一种半监督分类方法被引入，它基于局部、全局和自决策对未标记样本进行标记，并且基于多个决策对样本进行标记(Ma X,Wang H,Wang J.Semisupervised classification forhyperspectral image based on multi-decision labeling and deep featurelearning[J].ISPRS Journal ofPhotogrammetry and Remote Sensing,2016,120:99-107.)。生成对抗网络(GAN)也可以用于高光谱图像分类。由生成网络生成的真实标记的高光谱图像和伪数据可以用作鉴别网络的输入。训练好的鉴别网络可以对测试集中的未标记样本进行分类(Zhu L,Chen Y S,Ghamisi P,et al.Generative Adversarial Networksfor Hyperspectral Image Classification[J].Ieee Transactions on Geoscience AndRemote Sensing,2018,56(9):5046-5063.)。虽然GAN只需要200个实际标记样本进行训练，但GAN的分类精度有待提高。

已有高光谱图像分类方法中，传统机器学习方法无法与基于深度学习的方法相比，但基于深度学习的方法严重依赖于数据或者使用有限数据时精度不高。

发明内容

本发明是为了解决上述问题而进行的，目的在于提供一种基于交替更新卷积神经网络的高光谱图像分类方法。

本发明提供了一种基于交替更新卷积神经网络的高光谱图像分类方法，具有这样的特征，包括如下步骤：步骤1，在大小为H×W、通道数为L的高光谱图像中以目标像素为中心提取原始数据块，并将该原始数据块作为交替更新卷积神经网络的交替更新谱间块的输入；步骤2，采用交替更新谱间块进行学习，提取高光谱图像中多通道之间的精炼过的谱间特征；步骤3，采用降维层连接交替更新谱间块和交替更新空间块，对所述谱间特征进行压缩，得到压缩特征；步骤4，采用交替更新空间块对压缩特征进行学习，提取高光谱图像中空间域上的精炼过的空间特征；步骤5，将精炼过的谱间特征和精炼过的空间特征通过池化层、压缩层以及全连接层，得到1×1×C的预测标量，该预测标量为预测值，C为待分类的类别数；步骤6，将在交叉熵损失函数的基础上加上中心损失函数和最小平方损失函数后得到的函数作为优化目标函数；步骤7，采用优化目标函数计算预测值与人为标注的分类结果即实际值之间的损失，得到迭代训练的损失；步骤8，根据迭代训练的损失，对待优化的模型参数通过反向传播的方法进行多次优化，得到迭代训练的损失最小时的预测值，而后将未知高光谱数据输入训练完的模型，即得到高光谱图像的分类结果。

在本发明提供的基于交替更新卷积神经网络的高光谱图像分类方法中，还可以具有这样的特征：其中，步骤1中，原始数据块为大小为s×s×L和数量n的特征图，记为

下标0表示交替更新谱间块的起始位置的特征图，上标1表示整个网络的交替更新谱间块中的特征图。

在本发明提供的基于交替更新卷积神经网络的高光谱图像分类方法中，还可以具有这样的特征：其中，步骤2中，交替更新谱间块的三维卷积层的卷积核的大小为1×1×m，数量为k。

在本发明提供的基于交替更新卷积神经网络的高光谱图像分类方法中，还可以具有这样的特征：其中，步骤4中，交替更新空间块的三维卷积层具有两个不同的卷积核，两个卷积核的大小分别为a×1×1和1×a×1，数量均为k。

在本发明提供的基于交替更新卷积神经网络的高光谱图像分类方法中，还可以具有这样的特征：其中，步骤6中的交叉熵损失函数为：

中心损失函数为：

最小平方损失函数为：

目标函数为：

式(1)-式(4)中，m是批处理的数量，n是待分类的类数，x_i是属于y_i ^th类的第i^th个深特征，i为m个样本中第i个样本，y_i是指第i个样本的分类结果，即模型的输出，W_j是最后一个完全连接的层中的权重W的第j列，b是偏置项，λ₁和λ₂分别控制中心损失和L2损失的比例，λ₁∈[0,1)，λ₂∈[0,1)。。

发明的作用与效果

根据本发明所涉及的基于交替更新卷积神经网络的高光谱图像分类方法，交替更新谱间块和空间块由于通过循环结构获得的精细化的光谱和空间特征而实现谱间和空间注意。前向和反馈紧密相连的结构使得谱间和空间信息在卷积层中流动。交替更新谱间块和空间块的显著特征是权重共享。在第一阶段，随着卷积层数的增加，权重线性增加。然而，因为权重在阶段Ⅱ中共享，所以权重是固定的。一方面，阶段Ⅰ的部分权重在阶段Ⅱ中被重复使用。另一方面，当特征在阶段Ⅱ中重复循环时，阶段Ⅱ的参数数量保持不变。

此外，本方法充分利用高光谱图像中的信息，不同于其他基于深度学习的方法，本发明不仅学习高光谱图像中的深度谱间和空间特征，并在其上通过交替更新块来精炼深度特征来学习到精炼谱间和空间特征，从而达到最先进的高光谱图像分类精度，特别是在使用非常有限的训练标记数据的条件下。

附图说明

图1(a)是高光谱图像数据集的三波段假彩色合成图；

图1(b)是高光谱图像数据集的分类结果示意图；

图2(a)是基于3D-CNN方法的没有具体结构的卷积核架构；

图2(b)是基于SSRN方法的没有具体结构的卷积核架构；

图2(c)是本实施例的没有具体结构的卷积核架构；

图3是本发明的实施例中当卷积层数为3时交替更新谱间块的两个阶段示意图；

图4是本发明的实施例中降维层的示意图；

图5是本发明的实施例中当卷积层数为3时具有两个不同卷积核的交替更新空间块；

图6是本发明的实施例中基于交替更新卷积神经网络的高光谱分类的流程图。

具体实施方式

为了使本发明实现的技术手段与功效易于明白了解，以下结合实施例及附图对本发明作具体阐述。

实施例：

本实施例的一种基于交替更新卷积神经网络的高光谱图像分类方法，包括如下步骤：

步骤1，图像预处理：导入高光谱图像数据集和其对应的真实标签。

对于具有L个通道大小为H×W的高光谱图像，首先进行零填充，目的在于能对三维高光谱图像块的边缘像素进行提取，从而提取出原始像素块；填充之后，以目标像元为中心提取大小为9×9×L的原始数据块，其中L为高光谱图像的通道数；最后，再将数据块进行划分，200个样本为训练集，100个样本为验证集，其余的为测试集。

卷积核架构的确定：采用针对高光谱图像的非对称拆分卷积核的方法，使用三种一维的卷积核。

对于高光谱图像分类，基于深度CNN的方法通常首先使用PCA等预处理技术，然后使用具有若干激活函数的卷积层，最后使用分类器来获得分类结果。卷积层和激活函数可以公式化为：

其中，

是第(l+1)层的第i个输入特征图，N是第(l+1)层的特征图的数目，*是卷积运算，f(·)是激活函数，

和

是可以通过反向传播(BP)算法优化的可学习参数。

基于端到端3D-CNN的框架优于基于2D-CNN的具有预处理或后处理方法以及其他基于深度学习的方法。一个原因是，端到端框架可以减少预处理和后续处理，从而使得从原始输入到最终输出的连接尽可能接近，模型具有更大可以由数据自动调整的空间，从而提高了整个模型的适应度。另一个原因是，对于具有维度结构的HSI，1D卷积运算关注谱间特征，2D卷积运算关注空间特征，只有3D卷积运算才能同时学习空间和谱间特征。

因此，本方法设计了一个具有最小卷积核的基于端到端3D-CNN的网络。如图1和图2所示，只从卷积核的角度来看待用于高光谱图像分类的网络，而忽略了其他特定的结构。3D-CNN使用大小为a×a×m₁和a×a×m₂的两种相似的卷积核，并且这两个卷积核仅在谱间维度上不同。SSRN使用谱间卷积核1×1×m和空间卷积核a×a×d分别学习谱间和空间特征。卷积核决定了CNN学习什么特征以及模型的参数。与这些方法相比，本方法将较大的三维卷积核a×a×m分成三个较小的一维卷积核1×1×m、1×a×1和a×1×1。一方面，这大大减少了参数的数量，加速了操作，并减少了过拟合的可能性。例如，大小为3×3×7的卷积核可分为1×1×7、1×3×1和3×1×1或大小为3×3×3的两个卷积核。前者显然比后者更节省参数。另一方面，它增加了模型的非线性表征能力，因为它可以使用更多非线性激活函数。这种卷积核的非对称分裂方法比对称分裂成几个相同的小卷积核更有效，而且我们的方法可以处理更丰富的谱间和空间特征。

步骤2，采用交替更新谱间块来学习提取高光谱图像中多通道之间的精炼过的谱间特征。

在交替更新块中有两个阶段。如图3所示，三维卷积层使用64个大小为1×1×7的卷积核来在阶段Ⅰ学习的深度的谱间特征和在阶段Ⅱ级的精炼的谱间特征。

第一阶段是初始化阶段。具有大小9×9×b和数量64的特征图是交替更新的频谱块的输入。输入表示为

其中下标0表示交替更新的频谱块的起始位置的特征图，上标1表示整个网络的交替更新的频谱块中的特征图。在第一阶段，每个卷积层的输入是所有先前卷积层的输出。第一阶段可公式化表示如下：

其中，

是交替更新谱间块阶段Ⅰ中的第l(l≥1)层卷积层的输出，f(·)是非线性激活函数，*是三维卷积运算，

为权重且在阶段Ⅱ中被再次使用，上标1表示其是交替更新谱间块中的权重。

第二阶段是循环阶段。在阶段Ⅱ中，除了输入卷积层之外，每个卷积层由同一环次循环中的先前卷积层和上一次循环中的后续卷积层交替更新。因此，交替更新谱间块中的任意两个其他卷积层是双向连接的。第二阶段可公式化如下：

其中，r≥2，因为特征图处于第二阶段，并且可以通过循环结构多次更新。

步骤3，采用降维层连接交替更新谱间块和交替更新空间块，得到压缩特征。

降维层的目的是压缩模型，从而降低特征图的高维性。在交替更新谱间块和交替更新空间块中，三维卷积层的填充方式是“相同”，即其输入和输出大小是不变的。然而，在降维层中，三维卷积层的填充方式是“有效”，可以用来改变特征图的大小。

如图4所示，在经过交替更新谱间块的两个阶段学习特征后，其输出与每一层的输出融合为136个大小为9×9×b的特征图进行三维卷积，其卷积核大小为1×1×b，卷积核数为48。由于三维卷积层采用“有效”填充方法，得到大小为9×9×1，数量为48的特征图。通过重塑操作后，48通道的大小为9×9×1特征图成为仅有一个通道的大小为9×9×48的特征图。最后，具有卷积核大小为3×3×p和核数64的卷积层输出大小为7×7×1通道数为64的特征图作为交替更新空间块的输入。

步骤4，采用交替更新空间块对压缩特征图进行学习，提取高光谱图像中空间域上的精炼过的空间特征。

如图5所示，在交替更新空间块中有两个不同的卷积核。三维卷积层使用36个3×1×1和36个1×3×1卷积核，利用与交替更新谱间块相同的交替更新的结构学习深度精细的空间特征。对于交替更新空间块的输入，两个不同的卷积核并行地而不是串行地学习空间特征。交替更新的空间块的卷积关系的表达公式如下：

其中，W的上标2和3分别表示其为3×1×1和1×3×1的权重。

步骤5，将精炼过的谱间特征和精炼过的空间特征通过池化层、压缩层以及全连接层，得到1×1×C的预测标量，该预测标量为预测值，C为待分类的类别数。

如图6所示，原始高光谱图像输入大小为9×9×L流入第一层卷积层，卷积层的卷积核大小为(1,1,7)，步长为(1,1,2)，生成64个大小为9×9×b特征图。对于交替更新谱间块中的所有卷积层，其卷积核数为36，大小为1×1×7，并且卷积的填充方式为“相同”。因此，每一层的输出为36个9×9×b的特征图，其大小与数量在阶段Ⅰ和阶段Ⅱ中保持不变。合并输入特征图和所有更新过的特征图，交替更新特征图的输出为136个9×9×b的特征图。

在交替更新谱间块和交替更新空间块之间是降维层，经过降维层的处理后，64个大小7×7×1的特征图作为交替更新空间块的输入。与交替更新谱间块相似的结构，交替更新空间块有1×3×1和3×1×1两种卷积核。在阶段Ⅰ和阶段Ⅱ中每一层的输出为36个大小为1×7×1的特征图。这两个卷积核的结果被合并为272个大小为7×7×1的特征图。最后，输出通过三维平均池化层成为272个1×1×1特征图。在经过经过变平操作后，通过完全连接层产生1×1×C的向量，其中C是类别的数目。

步骤6，优化目标函数的确定：采用在交叉熵损失函数的基础上加上中心损失函数和最小平方损失函数作为优化目标函数。

高光谱图像分类本质上是一个多分类问题，softmax交叉熵损失是应对该问题的一个众所周知的目标函数。softmax交叉熵损失函数为：

其中，m是批处理的数量，n是待分类的类数，x_i是属于y_i ^th类的第ith个深特征，W_j是最后一个完全连接的层中的权重W的第j列，b是偏置项。

对于高光谱图像分类，基于CNN的模型的最后一层通常是全连接层，因为如果没有全连接层，很难使最后一层的输出大小等于类别的数量。直观地，人们期望让模型学习更多的具有鉴别力的特征从而提高模型的泛化性能。为了增加由模型获取的特征的判别力，我们引入辅助损失函数，其公式如下：

其中，

是y_i ^th类的特征的中心。损失函数减小了从每个样本在同一批次中的特征到的特征中心距离的二次平方的和，这意味着减少了类内距离。特征中心

可以通过迭代训练进行更新。

当将两个损失函数结合起来进行高光谱图像分类时，交叉熵损失用于增加类间距离，而中心损失用于减少类内距离，因此，学习的特征具有更高的判别度。此外，本方法增加了最小平方损失函数L2损失来降低模型的复杂度，以防止过拟合。其公式如下：

因此，模型的目标函数是以以下形式编写的：

其中，λ₁＝0.0001和λ₂＝0.001分别控制中心损失和最小平方损失的比例。综上，交叉熵损失是主要的目标函数，这意味着我们将增大类间距离作为主要的方面。同时，中心损失和最小平方损失分别是减少类内距离和增强泛化能力的辅助项和正则项。

步骤7，采用优化目标函数计算预测值与人为标注的分类结果即实际值之间的损失，得到迭代训练的损失。

步骤8，根据迭代训练的损失，对待优化的模型参数通过反向传播的方法进行多次优化，当训练次数为400次时，得到迭代训练的损失最小时的预测值，该模型参数达到最优，即该模型训练完成，而后将未知高光谱数据输入训练完的模型，即得到高光谱图像的分类结果。

实施例的作用与效果

根据本实施例所涉及的基于交替更新卷积神经网络的高光谱图像分类方法，交替更新谱间块和空间块由于通过循环结构获得的精细化的光谱和空间特征而实现谱间和空间注意。前向和反馈紧密相连的结构使得谱间和空间信息在卷积层中流动。交替更新谱间块和空间块的显著特征是权重共享。在第一阶段，随着卷积层数的增加，权重线性增加。然而，因为权重在阶段Ⅱ中共享，所以权重是固定的。一方面，阶段Ⅰ的部分权重在阶段Ⅱ中被重复使用。另一方面，当特征在阶段Ⅱ中重复循环时，阶段Ⅱ的参数数量保持不变。

上述实施方式为本发明的优选案例，并不用来限制本发明的保护范围。

Claims

1.一种基于交替更新卷积神经网络的高光谱分类方法，其特征在于，包括如下步骤：

步骤1，在大小为H×W、通道数为L的高光谱图像中以目标像素为中心提取原始数据块，并将该原始数据块作为交替更新卷积神经网络的交替更新谱间块的输入；

步骤2，采用交替更新谱间块的多层三维卷积层学习深度的谱间特征作为初始化阶段，并提取高光谱图像中多通道之间的精炼过的谱间特征作为循环阶段，

其中，在初始化阶段时，每个卷积层的输入是所有前卷积层的输出，在循环阶段时，除输入卷积层之外，每个卷积层由同一环次循环中的先前卷积层和上一次循环中的后需卷积层交替更新；

步骤3，采用降维层连接所述交替更新谱间块和交替更新空间块，对所述谱间特征进行压缩，得到压缩特征；

步骤4，采用所述交替更新空间块的三维卷积层对所述压缩特征进行学习，并利用与所述交替更新谱间块相同的交替更新的结构提取所述高光谱图像中空间域上的精练过的空间特征；

步骤5，将精练过的所述谱间特征和精练过的所述空间特征通过池化层、压缩层以及全连接层，得到1×1×C的预测标量，该预测标量为预测值，C为待分类的类别数；

步骤6，将在交叉熵损失函数的基础上加上中心损失函数和最小平方损失函数后得到的函数作为优化目标函数；

步骤7，采用所述优化目标函数计算所述预测值与人为标注的分类结果即实际值之间的损失，得到迭代训练的损失；

步骤8，根据迭代训练的损失，对待优化的模型参数通过反向传播的方法进行多次优化，得到迭代训练的损失最小时的预测值，而后将未知高光谱数据输入训练完的模型，即得到高光谱图像的分类结果。

2.根据权利要求1所述的基于交替更新卷积神经网络的高光谱图像分类方法，其特征在于：

其中，所述步骤1中，原始数据块为大小为s×s×L和数量n的特征图，记为X₀ ¹，下标0表示交替更新谱间块的起始位置的特征图，上标1表示整个网络的交替更新谱间块中的特征图。

3.根据权利要求1所述的基于交替更新卷积神经网络的高光谱图像分类方法，其特征在于：

其中，所述步骤2中，交替更新谱间块的三维卷积层的卷积核的大小为1×1×m，数量为k。

4.根据权利要求1所述的基于交替更新卷积神经网络的高光谱图像分类方法，其特征在于：

其中，所述步骤4中，交替更新空间块的三维卷积层具有两个不同的卷积核，两个卷积核的大小分别为a×1×1和1×a×1，数量均为k。

5.根据权利要求1所述的基于交替更新卷积神经网络的高光谱图像分类方法，其特征在于：

其中，所述步骤6中的所述交叉熵损失函数为：

所述中心损失函数为：

所述最小平方损失函数为：

所述目标函数为：

式(1)-式(4)中，m是批处理的数量，n是待分类的类数，x_i是属于y_i ^th类的第i^th个深特征，i为m个样本中第i个样本，y_i是指第i个样本的分类结果，即模型的输出，W_j是最后一个完全连接的层中的权重W的第j列，b是偏置项，λ₁和λ₂分别控制中心损失和L2损失的比例，λ₁∈[0,1)，λ₂∈[0,1)。