CN116152544A

CN116152544A - 基于残差增强空谱融合超图神经网络的高光谱图像分类方法

Info

Publication number: CN116152544A
Application number: CN202211378204.XA
Authority: CN
Inventors: 杨延红; 李丹阳; 颜磊; 陈胜勇
Original assignee: Tianjin Testing & Measure Technology Co ltd; Tianjin University of Technology
Current assignee: Tianjin Testing & Measure Technology Co ltd; Tianjin University of Technology
Priority date: 2022-11-04
Filing date: 2022-11-04
Publication date: 2023-05-23

Abstract

一种基于残差增强空谱融合超图神经网络的高光谱图像分类方法，包括以下步骤：S1：通过不同的特征提取策略分别提取高光谱图像的光谱‑空间特征，即将原始图像展平成矩阵计算光谱特征，由像素的水平和垂直坐标生成空间特征；S2：将不同模态的特征分别生成超图并进行融合，生成多模态超图关联矩阵；并且根据超图结构计算出超边和顶点；S3：将超图和高光谱原始特征输入到残差增强的超图神经网络进行训练，通过反向传播动态更新超图，得到每个像素的预测分类标签。本发明可以充分表示高光谱图像中丰富且复杂的信息，而且解决了高光谱在传统深度学习中随着深度增加带来的性能显著下降问题，以达到最好的训练效果。

Description

基于残差增强空谱融合超图神经网络的高光谱图像分类方法

技术领域

本发明涉及计算机视觉、遥感图像数据处理等技术领域，具体涉及一种基于残差增强空谱融合超图神经网络的高光谱图像分类方法。

技术背景

高光谱遥感图像与传统的全色图像或多光谱图像相比具有大量的光谱信息。因此，在经典的土地覆盖分类任务中具有令人满意的性能和更大的研究价值，但大量光谱信息同时带来信息冗余问题。如何精准有效的提取高光谱数据信息并发掘潜在特征已成为高光谱图像分类任务的关键。

传统依赖光谱特征的机器学习分类方法(如支持向量机、神经网络、核方法、多项式逻辑回归等及其变种)存在Hughes现象且对噪声比较敏感，导致分类精度较低。由于深度学习已经在计算机视觉方面取得了很好的效果，我们想以深度模型分布式特征表达替代传统人工设计的特征提取方式，解决高光谱数据结构多样化及复杂噪声影响所带来的多种问题。空谱融合策略能充分挖掘和利用高光谱图像内局部像元依赖关系，通过利用地物邻域聚集属性提升高光谱图像监督分类性能。超图结构可以表示更多复杂信息，但传统超图神经网络存在过度平滑问题，即当层堆叠时，其性能显著下降。

发明内容

为了克服现有技术的不足，本发明提供一种基于残差增强空谱融合超图神经网络的高光谱图像分类方法，能够精准有效的提取高光谱图像信息并挖掘高光谱数据的潜在特征，以解决传统超图神经网络随着深度增加带来的性能显著下降问题，具有较好的实用性和鲁棒性。

为了解决上述技术问题本发明提供如下的技术方案：

一种基于残差增强空谱融合超图神经网络的高光谱图像分类方法，包括以下步骤：

步骤S1：通过不同的特征提取策略分别提取高光谱图像的光谱-空间特征，即将原始图像展平成矩阵计算光谱特征，由像素的水平和垂直坐标生成空间特征；

步骤S2：将不同模态的特征分别生成超图并进行融合，生成多模态超图关联矩阵；并且根据超图结构计算出超边和顶点；

步骤S3：将超图和高光谱原始特征输入到残差增强的超图神经网络进行训练，通过反向传播动态更新超图，得到每个像素的预测分类标签。

进一步，所述步骤S1包含以下步骤：

步骤S11：高光谱图像数据集读取：读取预处理后的训练集和带有标注信息的测试集，对每个分类类别选取5-15个测试样本；

步骤S12：光谱特征提取：将原始图像

展平计算得到光谱特征X_spe，具体细节是读取图像/>

N表示图像像素个数，d表示光谱通道数，选取最后两个通道前的所有通道，计算其距离矩阵得到光谱特征X_spe；

步骤S13：空间特征提取：通过像素坐标获得空间特征

参照公式(1):

X_spa[i]＝[x(i),y(j)] (1)

其中，x(i)和y(i)分别表示像素i的水平和垂直坐标。

再一步，所述步骤S2包含以下步骤：

步骤S21：生成超图关联矩阵：对步骤S1得到的光谱特征X_spe和空间特征X_spa通过公式(2)分别构造超图H_spe和H_spa：

其中，X_i∈Ν_k(X_j)表示顶点X_i是顶点X_j的k个最近邻，mean表示所有k最近邻顶点之间的平均欧氏距离，σ为可调节超参数，e为超边；

步骤S22：由超图计算超边和顶点，参照公式(3)：

其中，d(v)表示顶边度的对角矩阵，w(e)是超边权重参数，δ(e)表示边度的对角矩阵。

更进一步，所述步骤S3中，构建残差增强的超图神经网络包括以下步骤：

步骤S31：超图拉普拉斯矩阵生成：拉普拉斯矩阵是图的一种矩阵表示，传统图的拉普拉斯矩阵定义为：

L＝D-A (4)

其中，D为图的度矩阵，A为图的邻接矩阵，超图的邻接矩阵可定义为：

超图拉普拉斯矩阵有如下变换：

因此，经过推导对给定图像特征X，超图上的卷积操作可以定义为：

其中，D_v表示超边度矩阵，D_e表示顶点度矩阵，H为原始超图的关联矩阵，W表示超边的权重矩阵，其对角线上的元素表示每条超边的权值，Θ表示超参数；

步骤S32：残差增强的超图神经网络构造：整个网络的开头和结尾都分别增加一个线性层，将处理好的数据先通过一个线性层实现数据的线性组合，采用非线性激活函数，在激活函数前后分别使用一次归一化操作；操作是将超图和高光谱图像同时输入到网络中，首先是对高光谱原始特征进行归一化和Dropout处理，防止过拟合；随后传入残差增强的超图卷积层中，在第l层的传播过程定义为：

X^(l+1)＝σ(((1-α_l)YX^l+α_lX⁽⁰⁾)((1-β_l)I+βW^(l))) (8)

其中，α_l、β_l是超参数，分别设置为0.5和0.1，I是单位矩阵。

本发明中，残差的引入可以有效避免传统超图神经网络引起的过度平滑问题，同时基于残差增强的超图神经网络可以有效融合多个超图信息。因此本发明在计算机视觉领域和遥感领域具有重要意义。

本发明的有益效果表现在：能够精准有效的提取高光谱图像信息并挖掘高光谱数据的潜在特征，以解决传统超图神经网络随着深度增加带来的性能显著下降问题，具有较好的实用性和鲁棒性。

附图说明

图1为一种基于残差增强空谱融合超图神经网络的高光谱图像分类方法的流程示意图；

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

参照图1，一种基于残差增强空谱融合超图神经网络的高光谱图像分类方法，所述方法一共包含三个模块，分别为高光谱空谱特征提取、超图生成、超图动态更新和特征图像分类，所述方法包括以下步骤：

步骤S1：通过不同的特征提取策略分别提取高光谱图像的光谱-空间特征，即将原始图像展平成矩阵计算光谱特征，由像素的水平和垂直坐标生成空间特征；过程如下：

步骤S11：高光谱图像数据集读取：读取预处理后的训练集和带有标注信息的测试集，对每个分类类别选取5-15个测试样本，其中对于标记样本数量较大的图像均分成四部分进行分类。读取的原始图像为

其中n，m，d分别为空间维度上的长和宽以及光谱通道数；

步骤S12：光谱特征提取：将原始图像

展平计算得到光谱特征X_spe，具体细节是读取图像/>

步骤S13：空间特征提取：通过像素坐标获得空间特征

参照公式(1):

X_spa[i]＝[x(i),y(j)] (1)

其中，x(i)和y(i)分别表示像素i的水平和垂直坐标。

图1中空谱特征提取完成之后，融合空谱特征来进行超图生成。

步骤S2：将不同模态的特征分别生成超图并进行融合，生成多模态超图关联矩阵；并且根据超图结构计算出超边和顶点，过程如下：

步骤S21：生成超图关联矩阵：超图定义为G(V，E，W)，W是超边权重矩阵，在具体实现中，我们使用关联矩阵H表示超图，H的大小为|V|×|E|，V和E分别表示超图的顶点和超边。对步骤S1得到的光谱特征X_spe和空间特征X_spa通过公式(2)分别构造超图H_spe和H_spa：

其中，X_i∈Ν_k(X_j)表示顶点X_i是顶点X_j的k个最近邻，mean表示所有k最近邻顶点之间的平均欧氏距离，σ为可调节超参数，e为超边；优选的，设置光谱和空间超图的最近邻k均为16；

步骤S22：由超图计算超边和顶点，参照公式(3)：

其中，d(v)表示顶边度的对角矩阵，w(e)是超边权重参数，δ(e)表示边度的对角矩阵；

步骤S3：将超图和高光谱原始特征输入到残差增强的超图神经网络进行训练，通过反向传播动态更新超图，得到每个像素的预测分类标签，过程如下：

步骤S31：超图拉普拉斯矩阵生成：由步骤(1)生成的多模态特征X[X₁,X₂,X₃,…,X_m]，使用公式(2)计算每个X_i的超图关联矩阵H_i，并进行串联生成H[H₁,H₂,H₃,…,H_m]。传统图的拉普拉斯矩阵定义为：

L＝D-A (4)

其中，D为图的度矩阵，A为图的邻接矩阵，超图的邻接矩阵又可定义为：

超图拉普拉斯矩阵有如下变换：

步骤S32：残差增强的超图神经网络构造：整个网络的开头和结尾都分别增加一个线性层，将处理好的数据先通过一个线性层实现数据的线性组合，采用非线性激活函数，在激活函数前后分别使用一次归一化操作；操作是将超图和高光谱图像同时输入到网络中，首先是对高光谱原始特征进行归一化和Dropout处理，防止过拟合；随后传入残差增强的超图卷积层中，虽然ResNet中的残差连接解决了网络深度训练问题，但它只能缓解过平滑问题，这里的残差卷积使用了初始残差和恒等映射两种操作，不仅解决了过平滑问题，且随着网络深度的增加还可以不断提高分类效果，在第l层的传播过程定义为：

X^(l+1)＝σ(((1-α_l)YX^l+α_lX⁽⁰⁾)((1-β_l)I+βW^(l))) (8)

初始残差：为了模拟ResNet中的跳转连接，将平滑表示YX^(l)与第一层X⁽⁰⁾的初始连接进行组合，初始残差连接可以使每层网络输出的结果至少保留初始输入特征的一小部分；

恒等映射：在第l层，将单位矩阵I添加到权重矩阵W^(l)中。β_l可以确保权重矩阵的衰减随着层数的增加进行自适应增加。具体的，β_l＝log(λ/(l+1)+1)，λ表示超参数，设置为0.1；

为了增加神经网络各层之间的非线性关系，每一层增加一个Relu操作。在网络的最后一层添加一个线性层，用于数据像素预测标签输出，从而实现下层分类任务。整个网络全梯度下降，学习率可动态调节，学习率初始值设置为0.01，每经过30个训练批次动态减半。

本说明书的实施例所述的内容仅仅是对发明构思的实现形式的列举，仅作说明用途。本发明的保护范围不应当被视为仅限于本实施例所陈述的具体形式，本发明的保护范围也及于本领域的普通技术人员根据本发明构思所能想到的等同技术手段。