CN113111863B

CN113111863B - 基于微型批处理与级联融合的图卷积网络高光谱分类方法

Info

Publication number: CN113111863B
Application number: CN202110520751.6A
Authority: CN
Inventors: 吕欢欢; 白爽; 张辉; 黄煜铖; 王琢璐
Original assignee: Liaoning Technical University
Current assignee: Liaoning Technical University
Priority date: 2021-05-13
Filing date: 2021-05-13
Publication date: 2023-11-24
Anticipated expiration: 2041-05-13
Also published as: CN113111863A

Abstract

本发明提供一种基于微型批处理与级联融合的图卷积网络高光谱分类方法，涉及高光谱图像处理与应用技术领域。将输入的高光谱影像数据集进行微型批量处理,CNN使用minibatch策略进行培训，得到数据集的所有子集，构造高光谱影像数据集的邻接矩阵，构建拉普拉斯矩阵，进行谱域中的图卷积，将通过傅里叶变换后的图信号进行卷积处理，从而提取特征，将miniGCNs与CNNs级联融合后，输出样本类别。本发明利用一种新的有监督的miniGCN进行网络训练，具有更大的灵活性，同时融合了卷积神经网络为HS图像分类任务提取更多样化和更具鉴别能力的特征表示，方法更具有有效性和优越性。

Description

基于微型批处理与级联融合的图卷积网络高光谱分类方法

技术领域

本发明涉及高光谱图像处理与应用技术领域，尤其涉及一种基于微型批处理与级联融合的图卷积网络高光谱分类方法。

背景技术

高光谱图像具有丰富而详细的光谱信息，通过捕捉与像素相关联的光谱特征曲线中连续形状的更细微差异，可以更有效的识别感兴趣的物体(特别是光谱相似类的物体)。与RGB和多光谱(MS)数据相比，高光谱图像能够以更精细和更准确的探测和识别地球表面的物质。然而，地物之间的高度光谱混合性和光谱可变性、复杂的噪声效应给高光谱数据的有效判别信息提取带来了困难。

在过去的几十年里，各种手工处理和基于学习的特征提取(FE)算法(非监督或监督)已经成功地设计并应用于(高光谱)HS图像分类。其中形态学(MPs)是一种有效的工具，它可以从HS图像中手动提取空间光谱特征。将MPs提取的特征作为支持向量机(SVM)分类器的输入向量，获得了满意的分类结果。在此基础上最大稳定极值区域引导MPs被提出，并且在MS图像上获得了高分类性能。为了进一步增强特征表示，研究人员还提出了其他形态学处理方法在图像分类上的研究，包括属性轮廓(APs)和不变APs。另一种典型的FE学习策略是基于子空间的学习，如稀疏矩阵和流形学习。这些方法通过使用新的、潜在的、低维的子空间表示来管理高维原始空间，从而学习获得变换或投影。尽管上述方法已经被证明在HS分类任务中是有效的，但是由于缺乏强大的数据拟合和表示能力，特征识别仍然有限。

受深度学习(DL)技术的启发，堆叠式自动编码器被应用于通过主成分分析(PCA)获得的降维HS图像来实现HS图像分类。卷积神经网络(CNNs)被证明能够从HS图像中更有效地提取空间光谱特征，从而产生更高的分类性能。递归神经网络可以将光谱特征作为序列数据进行处理。

在上述研究的基础上，图卷积网络(GCNs)是一个热点和新兴的网络体系结构，它能够通过对样本(或顶点)之间的关系进行建模来有效地处理图结构数据。因此，可以使用GCNs来模拟HS图像中的像素之间存在的空间关系，从而改进CNNs中存在的问题。

发明内容

本发明要解决的技术问题是针对上述现有技术的不足，提供一种基于微型批处理与级联融合的图卷积网络高光谱分类方法，对高光谱图像进行分类，提高高光谱数据的分类精度。

为解决上述技术问题，本发明所采取的技术方案是：

一种基于微型批处理与级联融合的图卷积网络高光谱分类方法，包括以下步骤：

步骤1：输入待分类的原始高光谱影像数据集X，其中，n＝a₁×b为一个a₁行b列的高光谱影像的像素点个数，d表示高光谱影像的波段数，x_nd表示第d个波段第n个像素点；d个波段也代表具有d个特征；

步骤2：将输入的数据集进行微型批量处理，得到数据集的所有子集m₁m₂...m_n；

步骤3：对所输入的高光谱影像数据集X，构造其邻接矩阵A定义顶点即邻接矩阵中的每个节点之间的关系或边；邻接矩阵A的形式如下：

A中的每个元素通过以下基函数RBF进行计算：

其中，i、j的取值范围为1～n，n是第n个像素点，σ是控制RBF宽度的参数；向量x_i和x_j表示与顶点v_i和v_j相关的谱特征；

步骤4：构建拉普拉斯矩阵，具体方法如下：

步骤4.1：在给定邻接矩阵A的情况下，创建相应的图拉普拉斯矩阵L，L＝D-A，其中，D是表示A的度数的对角矩阵，即D_i,i＝∑_jA_i,j；

步骤4.2：使用对称归一化拉普拉斯矩：

其中，I是单位矩阵；

步骤4.3：对L进行谱分解，L＝UΛU^-1，其中，U＝(u₁,u₂,...u_n)是L的特征集；Λ为L的特征值的对角阵；

步骤5：进行谱域中的图卷积，具体步骤如下：

步骤5.1：给定两个函数f和g，卷积写为：

其中，τ是移动距离，*表示卷积算子；

步骤5.2：图上的傅里叶变换，将图上的卷积运算转换为定义傅里叶变换或找到一组基函数；

步骤6：将通过傅里叶变换后的图信号进行卷积处理，从而提取特征；

步骤7：将微型批量处理GCN(即miniGCNs)与CNNs使用端到端的融合即FuNet，使用级联融合策略：级联(C)，表示为：

其中，运算符[·,·]表示级联；和/>分别表示为从CNNs和miniGCNs中提取的l层特征；

步骤8：输出结果：输出样本类别。

进一步地，所述步骤2包括以下步骤：

步骤2.1：将输入的数据集进行微型批量处理，即miniGCNs，具体步骤如下：

步骤2.1.1：给定一个标集上|V|＝N的全图G，其中V是顶点，N是节点个数，构造一个预算为M的随机节点采样器，M<<N，表示小批量的大小；在训练每个时期之前，对全图G重复应用采样器，直到完成每个节点的采样，得到一组子图，其中，/>表示上限操作，G_s、V_s、ε_s分别表示子图、子图中的顶点、子图中的边；M是采样器选择的M个节点；

步骤2.1.2：通过命题：给定一个从某个子图G_s中抽样的节点v，即v∈Vs，通过将v与第l卷积层所有节点u∈Vs的特征集合起来，计算出第l+1miniGCN层中节点v的无偏估计量z_v ^(l+1)：

其中，和/>分别定义为A和D的重正化项，以增强网络训练中的稳定性；上式代表对称归一化后的拉普拉斯矩阵，e_uv是规范化常数W^(l)代表第l个miniGCN层的权重，b_u ^(l)代表第l个miniGCN层节点的偏差；

即如果规范化e_uv的常数设置为C_uv/C_v，其中C_uv和C_v被定义为节点或边在所有采样子图中出现的次数，即e_uv＝1；

直接给出批处理中的更新规则，其中s不仅表示第s个子图，而且是网络训练中的第s次微型批处理；

步骤2.1.3：通过简单地设置C_uv＝C_v＝1，即e_uv＝1，进行没有替换的随机节点抽样；通过收集所有批次即每一次批处理的结果的输出，第l+1层中的最终输出可以重新表示为：

步骤2.2：卷积神经网络CNN使用minibatch策略进行培训，得到数据集的所有子集m₁m₂…m_n。

进一步地，所述步骤5.2的具体方法为：

两个函数f和g的卷积的Fourier变换是它们相应Fourier变换的乘积，表述为：

F[f(t)*g(t)]＝F[f(t)·F[g(t)]]；

其中，F和·分别表示傅里叶变换和逐点乘法；

两个函数f和g的卷积的傅里叶逆变换F^-1等于2π乘以它们相应的傅里叶逆变换的乘积：

F^-1[f(t)*g(t)]＝2πF^-1[f(t)]·F^-1[g(t)]；

借助于上述两式所示的定理，卷积推广到图信号：

f(t)*g(t)＝F^-1{F[f(t)]·F[g(t)]}。

所述步骤6的具体方法为：

步骤6.1：通过引理：F的基函数可以等价地表示为L的一组特征向量，L＝UΛU^-1其中，U＝(u₁,u₂,...u_n)是L的特征向量集，即F的基；

步骤6.2：由于U是正交矩阵，即UU^T＝E，或写成L＝UΛU-¹＝UΛU^T

步骤6.3：f在图上的F为GF[f]＝U^Tf，逆变换为f＝UGF[f]；f和g在图上的卷积表示为G[f*g]＝U{[U^Tf]·[U^Tg]}；

步骤6.4：把U^Tg写成gθ，图上的卷积最终表示为G[f*gθ]＝UgθU^Tf，gθ视为L的特征值(Λ)相对于变量θ的函数，即gθ(Λ)；

步骤6.5：通过应用Chebyshev多项式的第k阶截断展开来近似拟合gθ，卷积表达式为：式中T_k(·)和θ_k'是关于该变量的Chebyshev多项式和切比雪夫系数；/>表示归一化L；

步骤6.6：通过限制K＝1并指定最大特征值λ_max，赋值为2，进一步限制参数的数量以解决过拟合并最小化每层的操作数量，进一步简化为：

步骤6.7：通过卷积计算得到激活层传播规则为：

其中，和/>分别定义为A和D的重正化项。此外，H^(l)为第l层输出。h(·)为激活函数关于要学习的权重/>和所有层的偏差/>

采用上述技术方案所产生的有益效果在于：本发明提供的基于微型批处理与级联融合的图卷积网络高光谱分类方法，利用一种新的有监督的miniGCN进行网络训练，具有更大的灵活性，同时融合了卷积神经网络为HS图像分类任务提取更多样化和更具鉴别能力的特征表示，方法更具有有效性和优越性。

附图说明

图1为本发明实施例提供的基于微型批处理与级联融合的图卷积网络高光谱分类方法的流程图；

图2为本发明实施例提供的仿真实验选取的高光谱图像数据集的伪彩色影像；

图3为本发明实施例提供的仿真实验选取的高光谱图像数据集的地面参考数据；

图4为本发明实施例提供的采用四种方法进行仿真实验的分类结果图；其中，(a)为采用KNN方法的分类结果图，(b)为采用2D CNN方法的分类结果图，(c)为采用miniGCN方法的分类结果图，(d)为采用本发明方法的分类结果图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

本实施例以某高光谱遥感影像为例，使用本发明的一种基于微型批处理与级联融合的图卷积网络高光谱分类方法对该高光图像中的地物进行分类。

如图1所示，本实施例的方法如下所述。

步骤1：输入待分类的原始高光谱影像数据集X，其中，n＝a₁×b为一个a₁行b列的高光谱影像的像素点个数，d表示高光谱影像的波段数，x_nd表示第d个波段第n个像素点；d个波段也代表具有d个特征。

本实施例中，选取由来源于AVIRIS传感器的高光谱遥感影像数据集IndianPines，反映美国印第安纳西北部地区的植被种植情况，该场景由145×145像素组成，地面采样距离(GSD)为20m，220个光谱波段，波长范围为400至2500nm，光谱分辨率为10nm。通过去除20个噪声和吸水带(即104-108、150-163和220)保留了200个通道。表1列出了本研究场景中涉及的16种主要土地覆盖类型，以及用于分类任务的训练和测试样本数量。相应地，图2给出了该场景的假彩色图像以及训练和测试样本的空间分布。图3给出了高光谱图像数据集的地面参考数据。

表1土地覆盖类型

步骤2：将输入的数据集进行微型批量处理，得到数据集的所有子集m₁m₂...m_n。

步骤2.1：由于GCN的计算成本随着图形大小的增加而增加。为了避免大型图的计算负担，一个可行的解决方案(类似于CNNs)是使用小批量处理，即miniGCNs。将输入的数据集进行微型批量处理，即miniGCNs，具体步骤如下：

步骤2.1.2：通过命题：给定一个从某个子图G_s中抽样的节点v，即v∈Vs，通过将v与第l卷积层所有节点u∈Vs的特征集合起来，可以计算出第l+1miniGCN层中节点v的无偏估计量z_v ^(l+1)：

即如果规范化e_uv的常数设置为C_uv C_v，其中C_uv和C_v被定义为节点或边在所有采样子图中出现的次数，即e_uv＝1；

可以直接给出批处理中的更新规则，其中s不仅表示第s个子图，而且是网络训练中的第s次微型批处理；

步骤3：对所输入的高光谱影像数据集X，构造其邻接矩阵A定义顶点即邻接矩阵中的每个节点之间的关系或边，A中每个节点都是高光谱影像的像素点，A∈R^n*n表示一张图的结构特性，A的值只有1或0，其中0代表两个点没有关系，1代表两个点直接有特征关系；邻接矩阵A的形式如下：

A中的每个元素通过以下基函数RBF进行计算：

其中，i、j的取值范围为1～n，n是第n个像素点，σ是控制RBF宽度的参数；向量x_i和x_j表示与顶点v_i和v_j相关的谱特征，顶点就是像素点，邻接矩阵A表示的是顶点之间的关系。

步骤4：构建拉普拉斯矩阵。

由于拉普拉斯矩阵是对称矩阵，可以进行特征分解(谱分解)，同时拉普拉斯矩阵具有只在中心顶点和一阶相连的顶点上有非0元素，其余地方均为0的特征。具体方法如下：

步骤4.2：为了增强图的泛化能力，使用对称归一化拉普拉斯矩：

其中，I是单位矩阵；

步骤4.3：对L进行谱分解，L＝UΛU-¹，其中，U＝(u₁,u₂,...u_n)是L的特征集；Λ为L的特征值的对角阵。

步骤5：进行谱域中的图卷积，具体步骤如下：

步骤5.1：给定两个函数f和g，它们的卷积写为：

其中，τ是移动距离，*表示卷积算子；

步骤5.2：图上的傅里叶变换，将图上的卷积运算转换为定义傅里叶变换或找到一组基函数；具体方法为：

两个函数f和g的卷积的Fourier变换是它们相应Fourier变换的乘积，这可以表述为：

F[f(t)*g(t)]＝F[f(t)·F[g(t)]]

其中，F和·分别表示傅里叶变换和逐点乘法；

F^-1[f(t)*g(t)]＝2πF^-1[f(t)]·F^-1[g(t)]

借助于上述两式所示的定理，卷积可以推广到图信号：

f(t)*g(t)＝F^-1{F[f(t)]·F[g(t)]}。

因此，可以将图上的卷积运算转换为定义傅里叶变换(F)或找到一组基函数。

步骤6：将通过傅里叶变换后的图信号进行卷积处理，从而提取特征。具体方法为：

步骤6.2：由于U是正交矩阵，即UU^T＝E，或写成L＝UΛU^-1＝UΛU^T

步骤6.3：f在图上的F为GF[f]＝U^Tf，逆变换为f＝UGF[f]；f和g在图上的卷积可以表示为G[f*g]＝U{[U^Tf]·[U^Tg]}；

步骤6.4：把U^Tg写成gθ，则图上的卷积最终表示为G[f*gθ]＝UgθU^Tf，gθ视为L的特征值(Λ)相对于变量θ的函数，即gθ(Λ)；

步骤6.5：为了降低计算复杂度，通过应用Chebyshev多项式的第k阶截断展开来近似拟合gθ，卷积表达式为：式中T_k(·)和θ_k'是关于该变量的Chebyshev多项式和切比雪夫系数；/>表示归一化L；

步骤6.7：通过卷积计算得到激活层传播规则为：

步骤7：将miniGCNs与CNNs级联融合。

不同的网络结构能够提取HS图像的不同表示，例如CNNs中的空间-光谱特征或GCNs中样本之间的拓扑关系。一般来说，由于缺乏特征多样性，单个模型可能无法提供最佳的性能结果。

将微型批量处理GCN(即miniGCNs)与CNNs使用端到端的融合即FuNet，使用级联融合策略：级联(C)，表示为：

步骤8：输出结果：输出样本类别。

由于GCNs的性能在一定程度上取决于邻接矩阵的质量，即因此本实施例研究通过调整/>邻接矩阵的邻接数(K)和RBF函数的宽度(σ)来获得的性能增益非常重要。参数K(在很大程度上)支配性能增益，随着K值的增加，GCNs和miniGCNs的OAs保持稳定。另一方面，改变参数σ只会产生轻微的性能波动，这表明该参数可能没有得到正确的微调。最重要的是，随着这两个参数的逐渐变化，miniGCNs的性能增益或减损相对缓慢而平缓。反过来，在不同的参数组合下，GCN产生的结果相对更受干扰。此外，由于GCNs的整批训练策略往往无法找到较好的局部最优解，使得GCNs的整体分类性能也出现了瓶颈。综合而言，在本实施例中，(K，σ)的参数组合被设置为(10,1)，因为这个参数范围相对稳定。

本实施例中，还给出了采用本发明方法、KNN方法、二维CNN方法及miniGCN四种不同方法对Indian Pines数据集进行分类的对比，各方法对应的各类地物分类精度、OA(总体分类精度)、AA(平均分类精度)和Kappa系数如表1所示，图4给出了随机一次的分类结果图。其中，本发明方法的分类结果OA、AA和Kappa系数分别约为80.01％、91.23％和77.97％，相比KNN方法、二维CNN方法及miniGCN方法的分类结果均有所提高，OA分别提高了约20.84％、5.03％和3.12％，AA分别提高了约27.33％、5.71％和12.75％，Kappa系数分别提高了约23.87％、6.08％和6.41％。

由图4可以看出，KNN由于仅利用了光谱特征，分类结果图中出现严重的“椒盐现象”，三维CNN增加了局部卷积，能更有效地从HS图像中提取空间光谱信息，获得更高的分类精度，miniGCN通过局部保留图(或流形)结构来提取HS特征实现了稳定的性能改进，这意味着与全图保留相比，本发明提出方法采用的批处理策略可以消除由手动计算邻接矩阵引起的错误，并进一步减少错误在层与层之间的累积和传播。与其他方法相比，本发明方法的融合策略获得了更平滑、更精确的分类结果，这主要是由于有效地结合了不同的特征，进一步增强了HS的特征表示能力。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims

1.一种基于微型批处理与级联融合的图卷积网络高光谱分类方法，其特征在于：该方法包括以下步骤：

A中的每个元素通过以下基函数RBF进行计算：

步骤4：构建拉普拉斯矩阵，具体方法如下：

步骤4.2：使用对称归一化拉普拉斯矩：

其中，I是单位矩阵；

步骤5：进行谱域中的图卷积，具体步骤如下：

步骤5.1：给定两个函数f和g，卷积写为：

其中，τ是移动距离，*表示卷积算子；

步骤7：将微型批量处理GCN与CNNs使用端到端的融合即FuNet，使用级联融合策略：级联(C)，表示为：

步骤8：输出结果：输出样本类别。

2.根据权利要求1所述的基于微型批处理与级联融合的图卷积网络高光谱分类方法，其特征在于：所述步骤2包括以下步骤：

步骤2.1.2：通过命题：给定一个从某个子图G_s中抽样的节点v，即v∈Vs，通过将v与第l卷积层所有节点u∈Vs的特征集合起来，计算出第l+1miniGCN层中节点v的无偏估计量z_v ^(l ⁺¹⁾：

其中，和/>分别定义为A和D的重正化项，以增强网络训练中的稳定性；上式代表对称归一化后的拉普拉斯矩阵，e_uv是规范化常数，W^(l)代表第l个miniGCN层的权重，b_u ^(l)代表第1个miniGCN层节点的偏差；

即规范化e_uv的常数设置为C_uv/C_v，其中C_uv和C_v被定义为节点或边在所有采样子图中出现的次数，即e_uv＝1；

步骤2.2：卷积神经网络CNN使用minibatch策略进行培训，得到数据集的所有子集m₁ m₂... m_n。

3.根据权利要求2所述的基于微型批处理与级联融合的图卷积网络高光谱分类方法，其特征在于：所述步骤5.2的具体方法为：

F[f(t)*g(t)]＝F[f(t)·F[g(t)]]；

其中，F和·分别表示傅里叶变换和逐点乘法；

F^-1[f(t)*g(t)]＝2πF^-1[f(t)]·F^-1[g(t)]；

借助于上述两式所示的定理，卷积推广到图信号：

f(t)*g(t)＝F^-1{F[f(t)]·F[g(t)]}。

4.根据权利要求3所述的基于微型批处理与级联融合的图卷积网络高光谱分类方法，其特征在于：所述步骤6的具体方法为：

步骤6.5：通过应用Chebyshev多项式的第k阶截断展开来近似拟合gθ，卷积表达式为：式中T_k(·)和θ′_k是关于该变量的Chebyshev多项式和切比雪夫系数；/>表示归一化L；

步骤6.7：通过卷积计算得到激活层传播规则为：

其中，和/>分别定义为A和D的重正化项；此外，H^(l)为第l层输出；h(·)为激活函数关于要学习的权重/>和所有层的偏差/>