CN116523800A

CN116523800A - 基于残差密集网络与注意力机制的图像降噪模型及方法

Info

Publication number: CN116523800A
Application number: CN202310796816.9A
Authority: CN
Inventors: 喻春雨; 童亦新; 马荣恒; 韩鼎
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2023-07-03
Filing date: 2023-07-03
Publication date: 2023-08-01
Anticipated expiration: 2043-07-03
Also published as: CN116523800B

Abstract

本发明公开了一种基于残差密集网络与注意力机制的图像降噪模型及方法，属于人工智能技术领域，图像降噪模型包括：膨胀模块用以扩展原始噪声图像的图像通道，以获得比像素域更精细的图像特征；残差密集U型子网络用于获取不同分辨率的特征信息；双元素卷积通道注意力模块用于实现多尺度特征融合，降低低频信息损失，以得到理想的降噪效果；重构模块用于对扩展后的特征图像进行复原，使其重建为像素域图像。本发明通过残差密集子网络作为主干网络用来获取不同分辨率的特征信息，同时引入全局残差与局部残差、层归一化，防止梯度在反向传播过程中消失或爆炸，使网络训练更加稳定，最终使网络能够极大地减少特征图信息的丢失。

Description

基于残差密集网络与注意力机制的图像降噪模型及方法

技术领域

本发明涉及一种基于残差密集网络与注意力机制的图像降噪模型及方法，属于人工智能技术领域。

背景技术

目前，基于深度学习的图像降噪技术在稳步发展，该技术主要基于卷积神经网络进行，利用卷积神经网络进行图像降噪的大致步骤为：首先，准备一批有噪声的图像和相应的清晰图像作为训练数据，并将数据集分为训练集和测试集；其次，设计一个适合降噪的卷积神经网络，通常包括输入层、卷积层、池化层、反卷积层、输出层等，其中，卷积层用于提取图像特征，池化层用于降低维度，反卷积层用于恢复图像尺寸，输出层用于生成降噪后的图像；然后，使用准备好的图像数据集训练卷积神经网络模型，通过反向传播算法和梯度下降法等优化算法，不断调整卷积神经网络模型参数，以逐步提高模型性能，之后使用一部分独立的数据集对卷积神经网络模型进行验证和测试，评估模型在降噪任务中的性能，如使用PSNR（峰值信噪比）、SSIM（结构相似性指标）等指标进行评估。

其代表有降噪卷积神经网络(Denoisig Co-nvolutional Neural Network，DnCNN)，该网络通过引入残差学习和批量归一化提高网络降噪性能。快速灵活的降噪神经网络(Fast and Flexible Denoising Neural Network，FFDNet)，其降噪网络结构与DnCNN一致，但它将估计的噪声水平和图像下采样后的多张噪声子图像作为输入，在消除高斯噪声的能力上强于降噪卷积神经网络。面向真实照片卷积盲降噪神经网络(ConvolutionalBlind Denoising Neural Network，CBDNet)，卷积盲降噪神经网络由噪声估计子网络与非盲降噪子网络构成，通过添加噪声估计网络提高了网络性能与泛化能力，在DeamNet架构引入双元素级注意机制(Dual Element-wise Attention Mechanism，Deam)的多尺度注意力机制，能很好地处理多尺度特征信息，减少模型在降噪过程中的特征损失。深度降噪网络DRUNet通过单一模型以噪声水平映射为输入处理程度更广的噪声。然而，现有的图像降噪技术中仍然存在随模型深度的加深，模型随之可能出现梯度不稳定、模型退化等问题，使得图像降噪性能降低。

有鉴于此，确有必要提出一种基于残差密集网络与注意力机制的图像降噪模型及方法，以解决上述问题。

发明内容

本发明的目的在于提供一种基于残差密集网络与注意力机制的图像降噪模型及方法，以解决现有技术中随着模型深度的加深，模型梯度不稳定，图像降噪性能较低的问题。

为实现上述目的，本发明提供一种基于残差密集网络与注意力机制的图像降噪模型，包括：

膨胀模块，用以扩展原始噪声图像的图像通道，以获得比像素域更精细的图像特征；

残差密集U型子网络，用于获取不同分辨率的特征信息；

双元素卷积通道注意力模块，用于实现多尺度特征融合，降低低频信息损失，以得到理想的降噪效果；

重构模块，用于对扩展后的特征图像进行复原，使其重建为像素域图像。

作为本发明的进一步改进，所述膨胀模块包括：

一个含3×3卷积核的卷积层，用于将输入图像x扩展成通道数为64的图像特征，；

一个包含两个3×3Conv层及一个ReLU层残差单元的卷积核，用于生成初始元素的特征权重X ₀，，其中，δ用于表示ReLU函数。

作为本发明的进一步改进，所述残差密集U型子网络包括下采样阶段的全局残差块，双元素卷积注意力模块和上采样阶段的全局残差块。

作为本发明的进一步改进，所述下采样阶段的全局残差块包括：

局部残差块，包括一个层归一化层、两组3×3卷积核的卷积层ReLU激活层密集链接，最后采用concat层与含1×1卷积核的卷积层进行局部特征融合；

扩展局部残差块，用于将局部残差块中的两组3×3卷积核的普通卷积层改为两个3×3卷积的空洞卷积层，并将普通卷积层的扩张系数设置为2。

作为本发明的进一步改进，所述双元素卷积注意力模块与所述双元素卷积通道注意力模块结构相同，均包括通道注意力模块CAM和Deam注意力网络。

作为本发明的进一步改进，所述上采样阶段的全局残差块包括两个局部残差块。

作为本发明的进一步改进，所述重构模块包括：

一个包含两个3×3Conv层及一个ReLU层残差单元的卷积核，用于生成初始元素的特征权重，/>，其中，δ用于表示ReLU函数；

一个含3×3卷积核的卷积层，用于将输入图像x从特征域输出为像素域y，。

为实现上述目的，本发明还提供了一种基于残差密集网络与注意力机制的图像降噪方法，包括：

膨胀模块将噪声图膨胀至64通道；

将所述膨胀模块的输出结果X₀送入残差密集U型子网络进行初步降噪；

将初步降噪结果与所述膨胀模块的输出结果X₀一起输入双元素卷积注意力模块进行特征融合，得到特征图X_i；

重复四次初步降噪和特征融合步骤，最终输出64通道的特征图X₄；

重构模块将特征图X₄重构为干净图像，完成降噪。

作为本发明的进一步改进，所述双元素卷积注意力模块进行特征融合的具体步骤为：

双元素卷积注意力模块对特征图X_i分别进行平均池化和最大池化生成两个不同的特征和/>；

将和/>送入一个包含一个隐藏层的多层感知机中生成/>，其中隐藏的激活大小设置为R^C/r×1×1，其中r为衰减率；

计算通道注意力的权重矩阵，

其中，sigmoid表示神经网络中的激活函数，MLP表示神经网络中的多层感知器；

输出细化特征图、/>:

其中，f_l表示输入的低级特征，f_h分别表示输入的高级特征，M_c表示多层感知器的输出；

将、/>在Concat层拼接，得到特征/>，/>特征大小为W×H×2C；

将通过1×1的Conv层来降低维度，并通过两个卷积核为3×3的Conv层和一个ReLU层单元来生成初始元素的特征权重，通过sigmoid激活层将权重归一化后生成权重张量a；

其中，σ表示sigmoid函数；

利用双权重生成器模块分别生成低等级特征和高等级特征/>的权重张量a₁和a₂，其中，a₁=a、a₂=1-a；

双元素卷积注意力模块的输出为：

。

作为本发明的进一步改进，图像降噪过程使用峰值信噪比作为损失函数的度量，峰值信噪比L_psnr的表达式为：

其中，MaxValue为图像最大像素值；MSE表示均方差误差，

均方差误差的表达式为：

其中，ŷ是图像预测值；y是图像真实值。

本发明的有益效果是：本发明通过残差密集子网络作为主干网络用来获取不同分辨率的特征信息，同时引入全局残差与局部残差、层归一化，防止梯度在反向传播过程中消失或爆炸，使网络训练更加稳定，最终使网络能够极大地减少特征图信息的丢失；同时，通过改良Deam注意力机制，提高了该注意力机制对于通道信息的关注，可以有效消除图像噪声的同时有效保留图像细节纹理。

附图说明

图1是本发明中基于残差密集网络与注意力机制的图像降噪模型的神经网络结构图。

图2是本发明基于残差密集网络与注意力机制的图像降噪模型中膨胀模块的结构示意图。

图3是本发明基于残差密集网络与注意力机制的图像降噪模型中残差密集U型子网络模块的结构示意图。

图4是本发明基于残差密集网络与注意力机制的图像降噪模型中局部残差块的结构示意图。

图5是本发明基于残差密集网络与注意力机制的图像降噪模型中扩张局部残差块的结构示意图。

图6是本发明基于残差密集网络与注意力机制的图像降噪模型中双元素卷积注意力模块的结构示意图。

图7是本发明基于残差密集网络与注意力机制的图像降噪模型中重构模块的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

请参阅图1所示，本发明提供了基于残差密集网络与注意力机制的图像降噪模型，用于对图像进行降噪，以在有效的消除图像噪声的同时有效的保留图像细节纹理，图像降噪模型包括：

请参阅图2所示，膨胀模块，用以扩展原始噪声图像的图像通道，以获得比像素域更精细的图像特征。

具体的，膨胀模块将原来1通道或3通道的噪声图膨胀至64通道，具体包括：

一个包含两个3×3Conv层及一个ReLU层残差单元的卷积核，用于生成初始元素的特征权重X ₀，以实现模块的稳定性和非线性，，其中，δ用于表示ReLU函数。

膨胀模块通过扩展源图像的通道，使后续特征提取网络获得比像素域更精细的图像特征，并且在过程中将源图像从空间域转换到特征域更有助于降噪处理。

请参阅图3所示，残差密集U型子网络，用于获取不同分辨率的特征信息。

具体包括：下采样阶段的全局残差块，双元素卷积注意力模块和上采样阶段的全局残差块。

在当前比例尺的下采样阶段，使用步幅为2、卷积核为3 ×3的卷积层对特征图进行下采样，然后将其输入到下一个比例尺的下采样阶段。当编码网络到达第四尺度特征图即最小尺度特征图时，则从下采样阶段转到上采样阶段，在此阶段由比例系数为2的双线性插值和步幅为1的卷积组成。

下采样阶段的全局残差块包括一个局部残差块和一个扩张局部残差块，上采样阶段的全局残差块包括两个局部残差块。其中，

请参阅图4所示，局部残差块，包括一个层归一化层、两组3×3卷积核的卷积层ReLU激活层密集链接，最后采用concat层与含1×1卷积核的卷积层进行局部特征融合；

请参阅图5所示，扩展局部残差块，用于将局部残差块中的两组3×3卷积核的普通卷积层改为两个3×3卷积的空洞卷积层，并将普通卷积层的扩张系数设置为2。

请参阅图6所示，双元素卷积注意力模块与双元素卷积通道注意力模块结构相同，均包括通道注意力模块CAM和Deam注意力网络，具体的，将通道注意力模块CAM加入Deam注意力网络以得到双元素卷积注意力模块。

请参阅图7所示，重构模块，用于对扩展后的特征图像进行复原，使其重建为像素域图像。重构模块包括：

本发明还提供了一种基于残差密集网络与注意力机制的图像降噪方法，用于对噪声图进行降噪，包括如下步骤：

采用BSD200，Div2K数据集用于训练，以对图像降噪模型进行预处理。

膨胀模块将噪声图膨胀至64通道。

具体的，膨胀模块将原来1通道或3通道的噪声图膨胀至64通道。

将膨胀模块的输出结果X₀送入残差密集U型子网络进行初步降噪；

将初步降噪结果与所述膨胀模块的输出结果X₀一起输入双元素卷积注意力模块进行特征融合，得到特征图X_i。

重复四次初步降噪和特征融合步骤，最终输出64通道的特征图X₄。

具体的，双元素卷积注意力模块对特征图X_i分别进行平均池化和最大池化，生成两个不同的特征和/>；

将和/>送入一个包含一个隐藏层的多层感知机中生成/>，其中隐藏的激活大小设置为RC/r×1×1，其中r为衰减率；

通道注意力的权重矩阵为，

。

其中，sigmoid表示神经网络中的激活函数，MLP表示神经网络中的多层感知器。

输出细化特征图、/>，具体为:

其中，f_l表示输入的低级特征，f_h分别表示输入的高级特征，M_c表示多层感知器的输出。

将、/>在Concat层拼接，得到特征/>，/>特征大小为W×H×2C；

将通过1×1的Conv层来降低维度，并通过两个卷积核为3×3的Conv层和一个ReLU层单元来生成初始元素的特征权重，通过sigmoid激活层将权重归一化后生成权重张量，权重张量a的计算公式如下：

。

其中，σ表示sigmoid函数。

利用双权重生成器(DWG)模块分别生成低等级特征和高等级特征/>的权重张量a1和a2，其中a1=a、a2=1-a；

双元素卷积注意力模块的输出：

。

重构模块将特征图X₄重构为干净图像，完成降噪。

具体的，重构模块与膨胀模块相似，但排列顺序不同，重构模块的运算公式为：

重构模块则是对扩展后的特征图像进行复原，使其重建回空间域。

图像降噪过程使用峰值信噪比作为损失函数的度量，峰值信噪比L_psnr的表达式为：

其中，MaxValue²为图像最大像素值；MSE表示均方差误差，均方差误差的表达式为：

其中，ŷ是图像预测值；y是图像真实值。

将本发明中基于残差密集网络与注意力机制的图像降噪方法处理后的图像在PSNR上与CBDNET和DeamNet进行对比，对比结果为本发明处理后的图像比CBDNET和DeamNet分别提高6.28dB、0.21dB，也就是说，本发明能够有效的消除图像噪声的同时有效保留图像细节纹理。

综上所述，本发明提供了一种基于残差密集网络与注意力机制的图像降噪模型及方法，通过残差密集子网络作为主干网络用来获取不同分辨率的特征信息，同时引入全局残差与局部残差、层归一化，防止梯度在反向传播过程中消失或爆炸，使网络训练更加稳定，最终使网络能够极大地减少特征图信息的丢失；同时，通过改良Deam注意力机制，提高了该注意力机制对于通道信息的关注，可以有效消除图像噪声的同时有效保留图像细节纹理。

以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围。

Claims

1.一种基于残差密集网络与注意力机制的图像降噪模型，其特征在于，包括：

残差密集U型子网络，用于获取不同分辨率的特征信息；

2.根据权利要求1所述的基于残差密集网络与注意力机制的图像降噪模型，其特征在于，所述膨胀模块包括：

3.根据权利要求1所述的基于残差密集网络与注意力机制的图像降噪模型，其特征在于：所述残差密集U型子网络包括下采样阶段的全局残差块，双元素卷积注意力模块和上采样阶段的全局残差块。

4.根据权利要求3所述的基于残差密集网络与注意力机制的图像降噪模型，其特征在于，所述下采样阶段的全局残差块包括：

5.根据权利要求3所述的基于残差密集网络与注意力机制的图像降噪模型，其特征在于：所述双元素卷积注意力模块与所述双元素卷积通道注意力模块结构相同，均包括通道注意力模块CAM和Deam注意力网络。

6.根据权利要求3所述的基于残差密集网络与注意力机制的图像降噪模型，其特征在于：所述上采样阶段的全局残差块包括两个局部残差块。

7.根据权利要求1所述的基于残差密集网络与注意力机制的图像降噪模型，其特征在于：所述重构模块包括：

8.一种基于残差密集网络与注意力机制的图像降噪方法，其特征在于，包括：

膨胀模块将噪声图膨胀至64通道；

重构模块将特征图X₄重构为干净图像，完成降噪。

9.根据权利要求8所述的基于残差密集网络与注意力机制的图像降噪方法，其特征在于，所述双元素卷积注意力模块进行特征融合的具体步骤为：

计算通道注意力的权重矩阵，

其中，sigmoid表示神经网络中的激活函数，

MLP表示神经网络中的多层感知器；

输出细化特征图、/>:

将、/>在Concat层拼接，得到特征/>，/>特征大小为W×H×2C；

其中，σ表示sigmoid函数；

双元素卷积注意力模块的输出为：

。

10.根据权利要求8所述的基于残差密集网络与注意力机制的图像降噪方法，其特征在于：图像降噪过程使用峰值信噪比作为损失函数的度量，峰值信噪比L_psnr的表达式为：

其中，MaxValue为图像最大像素值；MSE表示均方差误差，

均方差误差的表达式为：

其中，ŷ是图像预测值；y是图像真实值。