CN116228572A

CN116228572A - 一种基于Transformer和CNN的散射成像装置系统

Info

Publication number: CN116228572A
Application number: CN202310086904.XA
Authority: CN
Inventors: 沈丽华; 戚伯特; 米仕轩; 王国臣; 陈瑞品
Original assignee: Zhejiang Sci Tech University ZSTU
Current assignee: Zhejiang Sci Tech University ZSTU
Priority date: 2023-02-09
Filing date: 2023-02-09
Publication date: 2023-06-06

Abstract

本发明公开了一种基于Transformer和CNN的散射成像装置系统，包括散斑图像采集装置、深度学习图像复原方法和散斑图像复原方法，所述散斑图像采集装置包括激光器、透镜A、透镜B、空间光调制器、目标图像、物镜、散射介质、物镜、物镜、CMOS相机和电脑，所述空间光调制器和CMOS相机的输出端通过导线连接电脑并通过Matlab程序同时控制连续拍照收集的散斑图像，所述散斑图复原系统包括基于PyTorch框架的基于Transformer和CNN的散斑图复原网络。以往通过深度学习进行散射成像的方法中，主要依靠卷积神经网络进行散斑图像重建，卷积神经网络性能卓越，特征提取能力十分出众。

Description

一种基于Transformer和CNN的散射成像装置系统

技术领域

本发明涉及计算光学成像领域和散射成像技术领域，特别涉及一种基于Transformer和CNN的散射成像装置系统。

背景技术

当光透过不均匀散射介质时，由于散射介质的影响，无法清晰成像，例如在浑浊水下、雨天、雾天无法看清目标物，因此透过散射介质实现清晰成像是个需要解决的问题传统的实现散射图像复原技术主要基于物理方法实现，包括波前整形技术、光学相位共轭、光学传输矩阵等技术，但是这些技术存在计算量大，移值性差且恢复性差等缺点，为了克服这些缺点，深度学习方法被引入来解决散斑图像复原问题，光透过散射介质的散射过程是一个确定的过程，经过多次散射得到的输出光场仍然保留了入射光场的信息，神经网络依靠强大的数据挖掘能力可以学习出输入光场和输出光场之间的复杂关系并实现散斑图案的重建。

现有的基于深度学习的散射成像装置系统存在以下缺点：以往通过深度学习进行散射成像的方法中，主要依靠卷积神经网络进行散斑图像重建，卷积神经网络性能卓越，特征提取能力十分出众，但也存在一些局限性，如在提取非局部特征方面能力不足。为此，我们提出一种基于Transformer和CNN的散射成像装置系统。

发明内容

本发明的主要目的在于提供一种基于Transformer和CNN的散射成像装置系统，可以有效解决背景技术中的问题。

为实现上述目的，本发明采取的技术方案为：

一种基于Transformer和CNN的散射成像装置系统，包括散斑图像采集装置、深度学习图像复原方法和散斑图像复原方法，所述散斑图像采集装置包括激光器、透镜A、透镜B、空间光调制器、目标图像、物镜、散射介质、物镜、物镜、CMOS相机和电脑，所述空间光调制器和CMOS相机的输出端通过导线连接电脑并通过Matlab程序同时控制连续拍照收集的散斑图像，所述散斑图复原系统包括基于PyTorch框架的基于Transformer和CNN的散斑图复原网络。

进一步的；在PyTorch基础上搭建基于Transformer和CNN的散斑图复原网络，包括以下步骤：

步骤1、图像输入到网络后，分别进入到CNN编码路径和Transformer编码路径中，输入大小为x∈R^H×W×C，其中H,W表示图片长和宽，C表示图片通道数；

步骤2、在CNN编码路径中，包含4个子模块，每个子模块包含2个3×3卷积、Relu激活函数和2×2的最大池化层进行下采样；

步骤3、在Transformer编码路径中，将输入大小为x∈R^H×W×C的散斑图像分成维度为P×P的N个patch，即

为了保持位置信息，将这些patch投影到一个K维的嵌入空间中，并添加了一个用于patch嵌入的位置嵌入W_pos以保留每个patch的空间信息，patch嵌入的公式为:

其中

表示patch的投影嵌入，然后，使用包含多头自注意(MSA)和多层感知器的Transformer模块来学习全局上下文表示，MSA层由M个平行的自注意头部组成，以缩放嵌入的Patch,MLP模块则学习长距离上下文依赖性，其中MSA和MLP的公式表示为：t_i ^′＝MSA(Norm(t_i-1))+t_i-1，t_i＝MLP(Norm(t_i ^′)+t_i ^′，其中Norm()表示层归一化[25]，t_i ^′和t_i为Transformer编码第i层的MSA和MLP的输出表示；

步骤4、在两个编码路径后，CNN的编码信息与来自Transformer编码后的信息通过加法路径相加融合进入解码器中，解码器由4个子模块组成，每个子模块包含2×2反卷积、2个3×3卷积和Relu激活函数从而进行特征上采样，将特征解码为高分辨率图像；

步骤5、损失函数设置为负皮尔逊相关系数(NPCC)，其公式为：

式中，M(i,j)表示网络复原的图像，N(i,j)表示原始目标，

和

表示网络复原的图像和原始目标的均值。

进一步的；Transformer和CNN的散射成像装置系统，包括以下步骤：

步骤1、采集散斑图像，将MNIST手写数字图用于采集散斑图像作为目标图像，上采样到1024×1024后显示在空间光调制器上，携带了物体信息的SLM出射光通过散射介质并由CMOS相机采集散斑图像；

步骤2、建立数据集，首先将采集到的散斑图像进行处理，截取中心方形区域以保留有用的散斑信息，并更改大小到256×256作为网络模型的输入图像，将MNIST手写数字图上采样到256×256作为数据集的标签图，将得到的图像按0.8：0.1：0.1的比例分为训练集，验证集，测试集；

步骤3、将散斑图像作为输入图，目标图像作为标签图输入网络中训练，得到图像复原网络的权重文件，再将散斑图像输入到训练好的权重文件中进行测试，重建出目标图像。

与现有技术相比，本发明具有如下有益效果：

1.本发明能够对散斑图像进行有效复原，且复原图像质量较高，对图像细节部分恢复得较好，为了评估网络对光散斑图像的复原效果，使用峰值信噪比和结构相似性衡量网络复原效果。

2.以往通过深度学习进行散射成像的方法中，主要依靠卷积神经网络进行散斑图像重建，卷积神经网络性能卓越，特征提取能力十分出众，基于Transformer和CNN的散射成像装置系统，方便操作，精度高，实用性强，效果显著，适合广泛推广使用。

附图说明

图1为本发明一种基于Transformer和CNN的散射成像装置系统的整体流程图。

图2为本发明一种基于Transformer和CNN的散射成像装置系统的光学装置示意图。

图3为本发明一种基于Transformer和CNN的散射成像装置系统的散斑图像复原网络示意图。

图4为本发明一种基于Transformer和CNN的散射成像装置系统的效果图。

图中：1、激光器；2、透镜A；3、透镜B；4、空间光调制器；5、目标图像；6、物镜；7、电脑；8、散射介质；9、物镜；10、CMOS相机；11、散斑图像。

具体实施方式

为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合具体实施方式，进一步阐述本发明。

如图1-4所示；一种基于Transformer和CNN的散射成像装置系统，包括散斑图像采集装置、深度学习图像复原方法和散斑图像复原方法，所述散斑图像采集装置包括激光器1、透镜A2、透镜B3、空间光调制器4、目标图像5、物镜6、散射介质8、物镜6、物镜9、CMOS相机10和电脑7，所述空间光调制器4和CMOS相机10的输出端通过导线连接电脑7并通过Matlab程序同时控制连续拍照收集的散斑图像11，所述散斑图复原系统包括基于PyTorch框架的基于Transformer和CNN的散斑图复原网络。

其中；在PyTorch基础上搭建基于Transformer和CNN的散斑图复原网络，包括以下步骤：

步骤3、在Transformer编码路径中，将输入大小为x∈R^H×W×C的散斑图像11分成维度为P×P的N个patch，即

其中

表示patch的投影嵌入，然后，使用包含多头自注意(MSA)和多层感知器MLP的Transformer模块来学习全局上下文表示，MSA层由M个平行的自注意头部组成，以缩放嵌入的Patch,MLP模块则学习长距离上下文依赖性，其中MSA和MLP的公式表示为：t_i ^′＝MSA(Norm(t_i-1))+t_i-1，t_i＝MLP(Norm(t_i ^′)+t_i ^′，其中Norm()表示层归一化[25]，t_i ^′和t_i为Transformer编码第i层的MSA和MLP的输出表示；

步骤5、损失函数设置为负皮尔逊相关系数(NPCC)，其公式为：

式1中，M(i,j)表示网络复原的图像，N(i,j)表示原始目标，

和

表示网络复原的图像和原始目标的均值。

其中；Transformer和CNN的散射成像装置系统，包括以下步骤：

步骤1、采集散斑图像11，将MNIST手写数字图用于采集散斑图像11作为目标图像5，上采样到1024×1024后显示在空间光调制器4上，携带了物体信息的SLM出射光通过散射介质8并由CMOS相机10采集散斑图像11；

步骤2、建立数据集，首先将采集到的散斑图像11进行处理，截取中心方形区域以保留有用的散斑信息，并更改大小到256×256作为网络模型的输入图像，将MNIST手写数字图上采样到256×256作为数据集的标签图，将得到的图像按0.8：0.1：0.1的比例分为训练集，验证集，测试集；

步骤3、将散斑图像11作为输入图，目标图像5作为标签图输入网络中训练，得到图像复原网络的权重文件，再将散斑图像11输入到训练好的权重文件中进行测试，重建出目标图像。

需要说明的是，本发明为一种基于Transformer和CNN的散射成像装置系统，工作时，在Transformer编码路径中，将输入大小为x∈R^H×W×C的散斑图像11分成维度为P×P的N个patch，即

其中

表示patch的投影嵌入，然后，使用包含多头自注意(MSA)和多层感知器MLP的Transformer模块来学习全局上下文表示，MSA层由M个平行的自注意头部组成，以缩放嵌入的Patch,MLP模块则学习长距离上下文依赖性，其中MSA和MLP的公式表示为：t_i ^′＝MSA(Norm(t_i-1))+t_i-1，t_i＝MLP(Norm(t_i ^′)+t_i ^′，其中Norm()表示层归一化[25]，t_i ^′和t_i为Transformer编码第i层的MSA和MLP的输出表示，在两个编码路径后，CNN的编码信息与来自Transformer编码后的信息通过加法路径相加融合进入解码器中，解码器由4个子模块组成，每个子模块包含2×2反卷积、2个3×3卷积和Relu激活函数从而进行特征上采样，将特征解码为高分辨率图像，以往通过深度学习进行散射成像的方法中，主要依靠卷积神经网络进行散斑图像重建，卷积神经网络性能卓越，特征提取能力十分出众，基于Transformer和CNN的散射成像装置系统，方便操作，精度高，实用性强，效果显著，适合广泛推广使用。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims

1.一种基于Transformer和CNN的散射成像装置系统，包括散斑图像采集装置、深度学习图像复原方法和散斑图像复原方法，其特征在于：所述散斑图像采集装置包括激光器(1)、透镜A(2)、透镜B(3)、空间光调制器(4)、目标图像(5)、物镜(6)、散射介质(8)、物镜(6)、物镜(9)、CMOS相机(10)和电脑(7)，所述空间光调制器(4)和CMOS相机(10)的输出端通过导线连接电脑(7)并通过Matlab程序同时控制连续拍照收集的散斑图像(11)，所述散斑图复原系统包括基于PyTorch框架的基于Transformer和CNN的散斑图复原网络。

2.根据权利要求1所述的一种基于Transformer和CNN的散射成像装置系统的深度学习图像复原方法，其特征在于：在PyTorch基础上搭建基于Transformer和CNN的散斑图复原网络，包括以下步骤：

步骤3、在Transformer编码路径中，将输入大小为x∈R^H×W×C的散斑图像(11)分成维度为P×P的N个patch，即

其中

表示patch的投影嵌入，然后，使用包含多头自注意(MSA)和多层感知器(MLP)的Transformer模块来学习全局上下文表示，MSA层由M个平行的自注意头部组成，以缩放嵌入的Patch,MLP模块则学习长距离上下文依赖性，其中MSA和MLP的公式表示为：t_i ^′＝MSA(Norm(t_i-1))+t_i-1，t_i＝MLP(Norm(t_i ^′)+t_i ^′，其中Norm()表示层归一化[25]，t_i ^′和t_i为Transformer编码第i层的MSA和MLP的输出表示；

步骤5、损失函数设置为负皮尔逊相关系数(NPCC)，其公式为：

式(1)中，M(i,j)表示网络复原的图像，N(i,j)表示原始目标，

和

表示网络复原的图像和原始目标的均值。

3.根据权利要求1所述的一种基于Transformer和CNN的散射成像装置系统的散斑图像复原方法，其特征在于：Transformer和CNN的散射成像装置系统，包括以下步骤：

步骤1、采集散斑图像(11)，将MNIST手写数字图用于采集散斑图像(11)作为目标图像(5)，上采样到1024×1024后显示在空间光调制器(4)上，携带了物体信息的SLM出射光通过散射介质(8)并由CMOS相机(10)采集散斑图像(11)；

步骤2、建立数据集，首先将采集到的散斑图像(11)进行处理，截取中心方形区域以保留有用的散斑信息，并更改大小到256×256作为网络模型的输入图像，将MNIST手写数字图上采样到256×256作为数据集的标签图，将得到的图像按0.8：0.1：0.1的比例分为训练集，验证集，测试集；

步骤3、将散斑图像(11)作为输入图，目标图像(5)作为标签图输入网络中训练，得到图像复原网络的权重文件，再将散斑图像(11)输入到训练好的权重文件中进行测试，重建出目标图像。