CN116665063B

CN116665063B - 基于自注意力和深度卷积并行的高光谱重建方法

Info

Publication number: CN116665063B
Application number: CN202310926894.6A
Authority: CN
Inventors: 黄凯宣; 黄俊茹; 孙玉宝
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2023-07-27
Filing date: 2023-07-27
Publication date: 2023-11-03
Anticipated expiration: 2043-07-27
Also published as: CN116665063A

Abstract

本发明公开了基于自注意力和深度卷积并行的高光谱重建方法，属于计算机视觉图像处理技术领域。包括以下步骤：在编码阶段，利用CASSI光学系统进行压缩采样得到二维测量值，再经过反转色散过程，获得初始化信号；解码阶段，采用本方法提出的基于transformer和CNN并行架构的重建算法将2D压缩图像重建为3D高光谱图像，通过训练网络学习二维压缩测量数据到原始数据的逆变换，进一步使用训练好的模型重建压缩感知高光谱图像，实现了压缩感知高光谱图像的快速、精确重建，与传统迭代重建算法相比，在重建质量上有所提高，并且在重建高光谱数据上的计算时间上有显著提高，远快于传统算法。

Description

基于自注意力和深度卷积并行的高光谱重建方法

技术领域

本发明属于计算机视觉图像处理领域，具体涉及基于自注意力和深度卷积并行的高光谱重建方法。

背景技术

高光谱成像是近年来计算机视觉领域的一个热门研究方向，但高维高光谱数据的存储和传输带来了挑战。为了应对这个问题，压缩感知成为一种新兴的采样方法，它通过线性投影同时采样和压缩信号，从而降低了数据的编码复杂度。压缩感知的目标是利用少量的压缩测量来重建原始高维信号，以实现高光谱数据的有效传输和处理。

传统的压缩感知采样方法使用固定的变换函数和有限尺寸的光学编码器对高维信号进行采样和压缩。然后，经典的重建算法依赖于信号在某种变换域具有稀疏性的假设，通过求解稀疏编码问题来还原原始信号。然而，这些传统方法需要耗费大量时间来进行迭代优化，并且在低采样率下重建质量较差。近年来，受深度学习方法的启发，学者们提出了基于深度学习的压缩感知图像重建方法。这些方法通过数据驱动的方式，让深度神经网络直接学习从稀疏先验到深度网络先验的映射关系，从而实现从稀疏先验到深度网络先验的转变。通过这种方式，重建过程更加高效，并且在低采样率下也能获得更好的重建质量。

这种基于深度学习的方法，主要采用掩模和偏移测量之间的内积作为输入。该方法破坏了输入的高光谱信息，并且没有充分探索掩码的引导效果，导致改进有限。近年来，Transformer已被引入计算机视觉领域。Transformer中的多头自注意模块擅长捕捉非局部相似性和长期依赖性。这一优势可以很好的解决高光谱图像重建中上述基于深度学习方法的局限性。虽然已经获得较好的重建效果,但重建性能仍有较大的提升空间，仍需要进行进一步研究。

上述现有技术还存在以下问题：

1.高光谱图像具有丰富的图像信息。在计算自我注意力时，如果没有足够指导的原始Transformer可能很容易处理许多低保真度和信息量较小的图像区域，这可能会降低模型效率，从而影响特征提取的能力。

2.高光谱图像具有丰富的图像信息。虽然Transformer局部窗口自我注意在视觉任务中表现显著，但它仍存在接受域有限和建模能力弱的问题。

发明内容

本发明针对现有技术中的问题，提供了基于自注意力和深度卷积并行的高光谱重建方法，显著提高光谱图的重建质量，并且在计算时间上比传统算法更有优势。为解决以上技术问题，本发明提供如下技术方案：基于自注意力和深度卷积并行的高光谱重建方法，包括如下步骤：

S1、编码阶段：对原始高光谱图像压缩采样得到的二维测量值Y进行反转色散，将该二维测量Y值向后偏移，获得初始化信号；

S2、解码阶段：包括：

S2-1、构建基于transformer和CNN并行架构的编码器，将初始化信号输入至该编码器中提取特征并融合，得到特征图；

S2-2、将特征图输入至瓶颈网络中，进一步提取特征并融合，得到最终特征图；

S2-3、将最终的特征图输入至解码器中得到重建后的高光谱图像。

进一步地，前述的步骤S1包括如下子步骤：

S101、利用CASSI光学系统中二维编码孔径M对原始高光谱图像预设波长的HSI信号进行编码得到 />，如下式：

，

其中，表示调制后的HSIs, />表示光谱通道，⊙表示元素乘法；H代表输入的三维HSI立方体的高，W代表输入的三维HSI立方体的宽，/>代表输入的三维HSI立方体的波长数；/>；

S102、然后利用CASSI光学系统中分散器对沿y轴剪切信号得到/>，如下式：，

其中，(u, v)为定位探测器平面上的坐标系，为第n个通道的波长，/>表示锚定波，/>为第n个通道在/>上的空间移动偏移量；

S103、整合有通道，将压缩为二维测量值Y，如下式：/>,

其中，，为CASSI光学系统获取到的二维测量值；/>，为传感探测器上成像过程中的二维测量噪声；

S104、将二维测量Y值向后偏移，获得初始化信号T，如下式：

。

进一步地，前述的步骤S2-1中，基于transformer和CNN并行架构的编码器包括3个顺序连接的特征提取模块，所述特征提取模块为：transformer模块连接的下采样模块；所述transformer模块是基于MSAB模块和CNN模块并行的架构，所述MSAB模块是顺序连接的第一Layer Norm模块、MSA模块、第二Layer Norm模块、Mask Attention模块，所述CNN模块是依次连接的三层卷积层。

进一步地，前述的transformer模块是基于MSAB模块和CNN模块并行的架构，如下式：

,

，

其中，MIX表示在MSAB分支和CNN分支之间实现特征混合的函数，表示Layer Norm层，/>为输入到transformer模块的特征信息，/>为MSAB模块和CNN模块特征混合后的特征信息，FFN表示前馈网络，它由两个线性层组成且中间有一个GELU层，而为transformer模块的输出特征信息。

进一步地，前述的CNN模块是依次连接的三层卷积层具体为：第一层卷积卷积核大小为1×1，激活函数为GELU；第二层卷积卷积核大小为5×5，激活函数为GELU；第三层卷积卷积核大小为1×1，激活函数为GELU。

进一步地，前述的MSA模块采用光谱式多头自注意机制，用于接收来自第一LayerNorm模块输出的特征图并进一步提取特征，包括如下步骤：

S2-A1、输入,被重塑为令牌X，然后将X线性投影到/>，, />:

,/>,/> ,其中，/> 是可学习参数；

S2-A2、沿着光谱通道维度将Q、K、V分别拆分为N个头如下：

，并计算每个头的自我注意力，如下：

,

其中表示/>的转置矩阵，/>是可学习参数，用于通过重新加权/>内的矩阵乘法/>来调整自注意/>；

S2-A3、将N个头的输出在频谱上进行级联操作，以进行线性投影，再添加位置嵌入，如下：

,

其中是可学习参数，/>是生成位置嵌入的函数，它包括两层3×3的卷积层、一个GELU激活层、以及重塑操作层；

S2-A4、将得到的MSA(X)进行重塑操作，得到MSA模块的输出特征图。

进一步地，前述的Mask Attention模块用于接收第二Layer Norm模块输出的特征图，并进行特征提取，具体包括如下子步骤：

S2-B1、给定掩码，采用色散过程移动M：

,

其中表示M的移位版本；

S2-B2、将输入至两个路径：下部路径是身份映射，以保留原始保真度信息；上部路径依次经历了两次3×3卷积层和GELU层，随后经历了1个5×5深度卷积层和1个sigmoid激活函数，以及与下部路径的内积，所述上部路径为：

，

其中，代表sigmoid激活函数，/>表示深度方向conv3×3层的映射函数，表示深度方向conv5×5层的映射函数，/>表示中间特征图；

S2-B3、进行反转色散过程并将向后移位，得到掩模注意力映射/>：

,

其中，索引频谱通道以匹配/>的维度。

进一步地，前述的步骤S2-2中的瓶颈网络是两个依次连接的transformer模块。

进一步地，前述的步骤S2-3中，所述解码器包括顺序连接的3个block，且3个block与所述特征提取模块一一对应；每个block依次为：上采样模块连接transformer模块；所述上采样模块与特征提取模块中的transformer模块对应。

进一步地，前述的步骤S2-3具体为：将得到的最终特征图输入到上采样模块中,用来提升特征图的大小，之后再将特征图输入到transformer模块中，得到特征图，之后再经过conv3×3卷积层生成残差高光谱图像/>，最后重构的高光谱图像,由R和T加和得到，即/>。

相较于现有技术，本发明采用以上技术方案的有益技术效果如下：本发明提出的基于自注意力和深度卷积并行的高光谱重建方法与之前传统的压缩感知重建算法相比,首先利用CASSI光学系统压缩采样，得到二维测量值，并经过反转色散过程，将测量值向后偏移，获得初始化信号；随后，在解码阶段将得到的初始化信号输入到压缩重建网络的编码器中提取特征并融合，得到特征图；接下来，将特征图信息再输入到瓶颈模块中进一步提取关注特征并融合，得到最终特征图；最后，在解码器中将最终特征图依次输入到上采样模块、transformer模块中进行解码，之后再经过conv3×3卷积层生成残差高光谱图像，最终得到重建后的高光谱图像。方法中使用多个模块进行重建可显著提高重建性能，采用局部窗口自注意与深度卷积相结合，在并行分支中窗口内和窗口之间捕获的关系被连接并发送到前馈网络以获得输出特征的结构。通道交互和空间交互是提出的双向交互，这为两个分支中更好的表示学习提供了补充线索。同时我们引入了掩码引导机制，保留了所有输入的高光谱图像信息，实现了压缩感知高光谱图像的快速、精确重建。与传统迭代重建算法相比，在重建质量上有所提高，并且在重建高光谱数据上的计算时间上有显著提高，远快于传统算法。

附图说明

图1是本发明实施方式中基于transformer和CNN并行架构的图像压缩感知重建方法的流程图。

图2是本发明实施方式中通过CASSI光学系统压缩采样，获得二维测量，经过反转色散过程，获得初始化信号的过程图。

图3是本发明的基于transformer和CNN并行架构的图像压缩感知重建网络图。

图4是本发明的transformer模块示意图。

图5是本发明实施方式中MSAB模块示意图。

图6是本发明实施方式中CNN模块示意图。

图7是本发明MSAB模块中MSA示意图。

图8是本发明MSAB模块中掩码引导机制示意图。

具体实施方式

为了更了解本发明的技术内容，特举具体实施例并配合所附图式说明如下。

在本发明中参照附图来描述本发明的各方面，附图中示出了许多说明性实施例。本发明的实施例不局限于附图所述。应当理解，本发明通过上面介绍的多种构思和实施例，以及下面详细描述的构思和实施方式中的任意一种来实现，这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外，本发明公开的一些方面可以单独使用，或者与本发明公开的其他方面的任何适当组合来使用。

如图1所示，基于自注意力和深度卷积并行的高光谱重建方法，包括如下步骤：

S2、解码阶段：参考图3的基于transformer和CNN并行架构的图像压缩感知重建网络图，包括：

步骤S1中，参考图2，步骤S1包括如下子步骤：

，

S103、整合有通道，将压缩为二维测量值Y，如下式：/>,

S104、将二维测量Y值向后偏移，获得初始化信号T，如下式：

。

S2-1、在解码阶段，构建基于transformer和CNN并行架构的编码器，将初始化信号输入至该编码器中提取特征并融合，同时建模窗口内和窗口间的关系来扩大感受野，得到特征图；

基于transformer和CNN并行架构的编码器包括3个顺序连接的特征提取模块，所述特征提取模块为：transformer模块连接的下采样模块；参考图4，所述transformer模块是基于MSAB模块和CNN模块并行的架构：

,

，

参考图5，所述MSAB模块是顺序连接的第一Layer Norm模块、MSA模块、第二LayerNorm模块、Mask Attention模块，本发明引入了掩码引导机制，保留了所有输入的高光谱图像信息，从而提高图像的重构质量。生成特征信息与CNN模块所产生特征信息进行级联操作，然后发送到前馈网络，得到特征图的输出。

参考图3，瓶颈网络阶段经历了两次transformer模块；解码器中一共分为3个Block，与编码器一一对应，每个Block的结构依次为：上采样模块-transformer模块。在瓶颈模块中，我们将步骤S2-1得到的特征图X₃依次通过两个transformer模块，其内部结构与编码器中一致。即X^' ₃为最终精细化输出，即得到最终特征图。

参考图6，CNN模块是依次连接的三层卷积层，第一层卷积卷积核大小为1×1，激活函数为GELU，第二层卷积卷积核大小为5×5，激活函数为GELU，第三层卷积卷积核大小为1×1，激活函数为GELU。

如图7所示，MSA模块采用光谱式多头自注意机制，用于接收来自第一Layer Norm模块输出的特征图并进一步提取特征，包括如下步骤S2-A1至S2-A4：

S2-A1、输入,被重塑为令牌X，然后将X线性投影到/>，, />:

,/>,/>,其中，/>是可学习参数；

S2-A2、沿着光谱通道维度将Q、K、V分别拆分为N个头如下：

，并计算每个头的自我注意力，如下：

,

参考图8，Mask Attention模块用于接收第二Layer Norm模块输出的特征图，并进行特征提取，具体包括如下子步骤：

S2-B1、给定掩码，采用色散过程移动M：

,

其中表示M的移位版本；

，

,

其中，索引频谱通道以匹配/>的维度。

步骤S2-3中，遵循U-Net的设计理念，设计了一个对称结构作为解码器。在解码器中设置3个Block，分别与编码器中的3个Block一一对应，每个Block的结构依次为：上采样模块-transformer模块，特别的是，跳过连接被用于编码器和解码器之间的特征聚合，以减轻由下采样操作引起的信息损失。将得到的最终特征图输入到上采样模块中,用来提升特征图的大小，之后再将特征图输入到transformer模块中，得到特征图，之后再经过conv3×3卷积层生成残差高光谱图像/>，最后重构的高光谱图像/>由R和T加和得到，即/>。

本发明与传统迭代重建算法对比实验结果如表1所示。

表1

从表中可以看出，与传统迭代重建算法相比，在重建质量上有所提高，并且在重建高光谱数据上的计算时间上有显著提高，远快于传统算法。

虽然本发明已以较佳实施例阐述如上，然其并非用以限定本发明。本发明所属技术领域中具有通常知识者，在不脱离本发明的精神和范围内，当可作各种的更动与润饰。因此，本发明的保护范围当视权利要求书所界定者为准。

Claims

1.基于自注意力和深度卷积并行的高光谱重建方法，其特征在于，包括如下步骤：

S1、编码阶段：对原始高光谱图像压缩采样得到的二维测量值Y进行反转色散，将该二维测量Y值向后偏移，获得初始化信号；步骤S1包括如下子步骤：

，

其中，(u, v)为定位探测器平面上的坐标系，为第n个通道的波长，/>表示锚定波，为第n个通道在/>上的空间移动偏移量；

S103、整合有通道，将压缩为二维测量值Y，如下式：/>,

S104、将二维测量Y值向后偏移，获得初始化信号T，如下式：

，

S2、解码阶段：包括：

S2-1、构建基于transformer和CNN并行架构的编码器，将初始化信号输入至该编码器中提取特征并融合，得到特征图；具体为：基于transformer和CNN并行架构的编码器包括3个顺序连接的特征提取模块，所述特征提取模块为：transformer模块连接的下采样模块；

所述transformer模块是基于MSAB模块和CNN模块并行的架构，所述MSAB模块是顺序连接的第一Layer Norm模块、MSA模块、第二Layer Norm模块、Mask Attention模块，所述CNN模块是依次连接的三层卷积层；

其中，所述transformer模块是基于MSAB模块和CNN模块并行的架构，如下式：

,

，

其中，MIX表示在MSAB分支和CNN分支之间实现特征混合的函数，表示LayerNorm层，/>为输入到transformer模块的特征信息，/>为MSAB模块和CNN模块特征混合后的特征信息，FFN表示前馈网络，它由两个线性层组成且中间有一个GELU层，而/>为transformer模块的输出特征信息；

所述CNN模块是依次连接的三层卷积层具体为：第一层卷积卷积核大小为1×1，激活函数为GELU；第二层卷积卷积核大小为5×5，激活函数为GELU；第三层卷积卷积核大小为1×1，激活函数为GELU；

所述MSA模块采用光谱式多头自注意机制，用于接收来自第一Layer Norm模块输出的特征图并进一步提取特征，包括如下步骤：

S2-A1、输入,被重塑为令牌X，然后将X线性投影到/>，, />:

,/>,/> ,其中，/> 是可学习参数；

S2-A2、沿着光谱通道维度将Q、K、V分别拆分为N个头如下：

，并计算每个头的自我注意力，如下：

,

S2-A4、将得到的MSA(X)进行重塑操作，得到MSA模块的输出特征图；

所述Mask Attention模块用于接收第二Layer Norm模块输出的特征图，并进行特征提取，具体包括如下子步骤：

S2-B1、给定掩码，采用色散过程移动M：

,

其中表示M的移位版本；

，

其中，代表sigmoid激活函数，/>表示深度方向conv3×3层的映射函数，/>表示深度方向conv5×5层的映射函数，/>表示中间特征图；

,

其中，索引频谱通道以匹配/>的维度；

S2-2、将特征图输入至瓶颈网络中，进一步提取特征并融合，得到最终特征图；所述瓶颈网络是两个依次连接的transformer模块；

S2-3、将最终的特征图输入至解码器中得到重建后的高光谱图像，所述解码器包括顺序连接的3个block，且3个block与所述特征提取模块一一对应；每个block依次为：上采样模块连接transformer模块；所述上采样模块与特征提取模块中的transformer模块对应，具体为：将得到的最终特征图输入到上采样模块中,用来提升特征图的大小，之后再将特征图输入到transformer模块中，得到特征图，之后再经过conv3×3卷积层生成残差高光谱图像/>，最后重构的高光谱图像 />由R和T加和得到，即/>。