CN117611484B

CN117611484B - 一种基于去噪自解码网络的图像去噪方法及系统

Info

Publication number: CN117611484B
Application number: CN202410082480.4A
Authority: CN
Inventors: 归子涵; 刘瑨玮; 袁程浩; 杨光义; 贺威
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2024-01-19
Filing date: 2024-01-19
Publication date: 2024-04-02
Anticipated expiration: 2044-01-19
Also published as: CN117611484A

Abstract

本发明公开了一种基于去噪自解码网络的图像去噪方法及系统，首先将噪声图像进行预处理，然后将预处理后的图像输入去噪自解码网络中，得到去噪图像；去噪自解码网络包括迭代步数生成模块、噪声生成模块、去噪自解码器；迭代步数生成模块包括残差神经网络、线性层、归一化层；噪声生成模块包括下采样层、卷积层、上采样层，每层包含4个基本网络结构，每个基本网络结构均含有2个残差块、一个自注意力层，上采样层和下采样层的基本网络结构还包含一个采样函数。本发明基于严格的数学建模构造网络，使得模型具有严谨的可解释性，基于理论推导，能够对所有加性高斯噪声进行完全去噪。

Description

一种基于去噪自解码网络的图像去噪方法及系统

技术领域

本发明涉及图像增强领域，尤其涉及一种基于去噪自解码网络的图像去噪方法及系统。

背景技术

数字图像是融媒体时代最重要的信息载体之一，但图像在产生、传输过程中，由于信道特性，会不可避免地受到噪声的干扰，对后续的诸多图像处理任务产生影响。因此，图像去噪的研究具有重要的意义。

早期的通信工程中，存在诸多传统方法去除噪声，例如基于线性、非线性滤波器的调制解调方法等。然而，传统的基于调制解调的去噪方法会极大增加带宽，降低信息的传输速率，且去噪效果有限。

随着机器学习、深度学习的发展，许多基于卷积神经网络的去噪算法相继被提出。DNCNN基于残差神经网络构建去噪模型，相比传统滤波算法取得了更好的去噪性能。在此基础上，RDN将多个残差块叠加，实现浅层特征和深层特征的充分复用，提高了残差神经网络的特征利用效率。但这些方法均是基于纯数据驱动，将卷积神经网络当作一个黑匣子使用，没有可解释性较强的数学模型作支撑。随着对噪声分布研究的不断深入，Guo等人提出CBDNet，通过训练网络估计噪声分布，再将此分布与噪声图像一起放入网络训练，从而适应更加复杂的图像去噪问题。与传统方法相比，基于深度学习的方法去噪效果好，泛化能力强，能够尽可能地保留图像细节。

然而，目前基于深度学习的方法对噪声图像的数学建模仍然不够完善，模型缺乏可解释性，无法进一步深入研究。相比目前的方法，近几年较为前沿的去噪扩散概率模型将图像的加噪过程定义为一个初始高斯噪声在图像中的扩散，能够对加性高斯噪声图像进行较为严谨的数学建模，为图像去噪方法的研究提出了一种新的方向。

发明内容

本发明的目的在于解决当前深度学习去噪算法可解释性差，模型参数规模大，训练难度高的问题，并提出了一种基于去噪自解码网络的图像去噪方法及系统，以增强深度学习去噪算法的可解释性，便于开展进一步研究。该方法根据去噪扩散概率模型对噪声图像的数学建模，通过残差神经网络获取迭代步数，并采用U-Net结构获取图像的单位基本噪声，即扩散模型中定义的用于扩散的初始噪声，最后通过去噪解码器，依据迭代步数和单位基本噪声，对输入图像进行去噪，得到去噪图像。

本发明的上述技术问题主要是通过下述技术方案得以解决的：一种基于去噪自解码网络的图像去噪方法，具体步骤如下：

步骤1，对噪声图像进行预处理；

步骤2，将预处理后的噪声图像输入去噪自解码网络，得到去噪图像；

所述去噪自解码网络包括迭代步数生成模块、噪声生成模块、去噪自解码器；

所述迭代步数生成模块，包括卷积神经网络、线性层和归一化层，其中归一化层的输入通道数为特征维度，输出通道数为最大迭代步数；

所述噪声生成模块，采用U-Net结构，包括下采样层、卷积层和上采样层，噪声生成模块的输入维度、输出维度、输入通道数、输出通道数均与输入的噪声图像相同；

所述去噪自解码器，其输入为迭代步数、噪声图像、噪声，输出为去噪图像；

噪声图像输入迭代步数模块和噪声生成模块，生成对应的迭代步数和单位基本噪声，迭代步数、单位基本噪声、噪声图像一并输入到去噪自解码器中，计算得到去噪图像。

进一步的，步骤1中，对噪声图像进行预处理，包括噪声图像的归一化，所述归一化利用尺度放缩归一化将样本数据全部放缩到相同尺度下，且关于0对称分布，具体归一化函数为：

其中，为归一化后的图像，/>为噪声图像。

进一步的，步骤2中，所述迭代步数生成模块，首先基于残差神经网络对与预处理后的噪声图像进行特征提取，然后经过线性层和归一化层得到不同迭代步数的概率序列，将概率序列的最大值对应的序列位置索引作为迭代步数输出。

进一步的，步骤2中，下采样层用于降低维度，便于卷积层进行特征提取，上采样层用于恢复维度，确保噪声生成模块的生成与输入维度相同；下采样层、卷积层和上采样层均由4个基本网络结构组成，其中，基本网络结构包括2个残差块、1个自注意力层，上采样层中还包括一个上采样函数，上采样函数由一个卷积和一个2倍的Upsample函数组成，通过插值算法进行上采样；下采样层中还包括一个下采样函数，下采样函数由一个卷积和一个Rearrange函数组成，通过维度合并进行下采样；每个残差块由2个卷积层组成，残差块计算单元表示为：

其中，为残差块的输出，/>为残差块中第2个卷积层的输出，/>为残差块的输入。

进一步的，自注意力层中包含3个可进行参数优化的权重矩阵、/>、/>，用于同输入图像做矩阵乘法得到3个参数矩阵/>、/>、/>，具体计算公式为：

其中，为基本网络结构中第二个残差块的输出特征；

整幅图像的权重矩阵计算公式为：

其中，为/>的方差，/>为归一化函数，归一化计算公式为：

其中，为求集合/>中元素的最大值，/>和/>为集合A中的元素，/>为归一化后的值。

进一步的，步骤2中，所述去噪自解码器为一个单步计算单元，计算公式推导过程为：

首先，定义噪声图像的加噪过程；对原始图像不断添加一个小的随机标准高斯噪声，共添加步，/>为迭代步数，得到一系列噪声图像，考虑加噪的中间过程，设加入第/>步噪声后的样本图像为/>，则第/>步的样本图像为：

其中，/>为定义在0.0001~0.2上的线性序列，序列的第/>个元素取值为；/>与/>的作用是控制样本图像/>与所添加噪声/>的比例；

为了优化算法的时间复杂度，根据递推公式(8)求出的通项公式：

则根据公式，反向计算出去噪图像，即单步计算单元的表达式为：

其中，表示去噪图像，/>表示噪声图像，/>为迭代步数，/>为单位基本噪声，/>为序列{/>}前/>项的累乘。

进一步的，步骤2中，所述去噪自解码网络是经过参数优化后的去噪自解码网络：参数优化过程包括以下子步骤：

步骤S1，导入噪声图像数据集；

噪声图像数据集使用伯克利分割数据集；

步骤S2，对噪声图像和原始图像分别进行相同的预处理；

对噪声图像和原始图像进行相同的预处理，预处理方式与步骤1 所述预处理方式相同，以保证训练环境和应用环境的一致性；

步骤S3，将噪声图像和原始图像分别输入迭代步数生成模块和噪声生成模块，在一定条件下训练，得到两个预训练模块；

采用分治思想，对迭代步数生成模块和噪声生成模块分别进行预训练，得到两个预训练模型；预训练过程包含以下三个步骤：

第一步，将预处理原始图像输入噪声编码器得到模拟噪声图像；

噪声编码器为一个单步计算单元，其随机生成一个高斯噪声，接受一个随机生成的迭代步数和原始图像，计算得到噪声图像；

第二步，将噪声图像输入迭代步数生成模块进行训练，通过梯度下降和反向传播不断优化模型参数，使得迭代步数生成模块能生成与模拟噪声图像对应的迭代步数；

第三步，将模拟噪声图像输入噪声生成模块，通过梯度下降和反向传播不断优化模型参数，使得噪声生成模块能得到与输入模拟噪声图像对应的高斯噪声；

步骤S4，以预训练的迭代步数生成模块和噪声生成模块构建去噪自解码网络；

步骤S5，将训练数据输入去噪自解码网络中进行训练，通过梯度下降和反向传播不断优化模型参数。

进一步的，步骤S3、S5中，训练过程采用最小绝对值偏差损失函数，训练至网络收敛，即损失函数曲线保持平稳不再下降，最终使得模型输出去噪后的图像。

本发明还提供一种基于去噪自解码网络的图像去噪系统，包括以下单元：

预处理单元，用于对输入图像进行预处理，得到归一化后的图像；

去噪自解码单元，用于对预处理后的图像输入去噪自解码网络，得到去噪后的图像；

所述去噪自解码网络，包括迭代步数生成模块、噪声生成模块、去噪自解码器；

所述噪声生成模块，采用U-Net结构，包括下采样层、卷积层和上采样层，整个模块的输入维度、输出维度、输入通道数、输出通道数均与输入图像相同；

本发明采用基于去噪自解码网络的图像去噪模型对噪声图像进行去噪。该技术结合了去噪扩散概率模型与深度学习算法，首先利用残差神经网络对输入噪声图像进行特征提取，并经过线性层和归一化层得到迭代步数。再通过U-Net结构提取图像的单位基本噪声，其中，U-Net结构引入包含自注意力机制和跳跃连接，对输入图像进行权重化处理，并对浅层和深层特征进行特征复用，增加了特征提取的效率，能够突出筛选有效特征。最后将输入图像、单位基本噪声、迭代步数一并输入去噪自解码器计算单元进行计算，得到去噪图像。与传统的深度学习去噪算法相比，本发明具有严格推导的数学模型，对加性高斯噪声图像的去噪具有严谨的可解释性，便于开展进一步研究和优化。基于理论推导，本发明提供的方法能够对所有加性高斯噪声进行完全去噪。

附图说明

下面使用实施例，以及具体实施方式作进一步说明本文的技术方案。另外，在说明技术方案的过程中，也使用了一些附图。对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图以及本发明的意图。

图1为本发明实施例的方法流程图；

图2为本发明实施例的去噪自解码网络模型结构图；

图3为本发明实施例的去噪自解码网络模型训练流程图；

图4为本发明实施例的去噪自编码器网络的分治预训练流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

本实施例以给定的噪声图像为例，对本发明做进一步的阐述，请见图1，本实施例提供的一种基于去噪自解码网络的图像去噪方法，包括以下步骤：

步骤1，对噪声图像进行预处理；

步骤2，将预处理后的图像输入去噪自解码网络，得到去噪图像；

请见图2，所述去噪自解码网络，包括迭代步数生成模块、噪声生成模块、去噪自解码器；

在一种实施方式中，所述迭代步数生成模块，包括卷积神经网络、线性层和归一化层，其中归一化层的输入通道数为特征维度，输出通道数为最大迭代步数；

所述下采样层、卷积层和上采样层，每层均包含4个基本网络结构，每个基本网络结构包括2个残差块、1个自注意力层，上采样和下采样的基本结构还包括采样函数；

噪声图像输入迭代步数模块和噪声生成模块，生成对应的迭代步数和单位基本噪声，迭代步数、单位基本噪声、待去噪图像一并输入到去噪自解码器中，计算得到去噪图像。

在一种实施方式中，步骤1中，对噪声图像进行预处理，包括噪声图像的归一化，所述归一化利用尺度放缩归一化将样本数据全部放缩到相同尺度下，且关于0对称分布，具体归一化函数为：

其中，为归一化后的图像，/>为输入噪声图像。

在一种实施方式中，步骤2中，所述迭代步数生成模块，首先基于残差神经网络对预处理后的图像进行特征提取，然后经过线性层和归一化层得到不同迭代步数的概率序列，将概率序列的最大值对应的序列位置索引为迭代步数输出。

在一种实施方式中，步骤2中，所述噪声生成模块采用U-Net结构，对预处理后的图像进行下采样、卷积和上采样，生成与输入图像通道数和维度均一致的单位基本噪声。

在一种实施方式中，步骤2中，所述噪声生成模块中，其下采样层、卷积层和上采样层均由4个基本网络结构组成，下采样层用于降低维度，便于卷积层进行特征提取，上采样层用于恢复维度，确保噪声生成模块的生成与输入维度相同；其中，基本网络结构包括2个残差块、1个自注意力层，上下采样层的基本网络结构中还包含一个采样函数；下采样过程中，输入图像经过残差块进行通道扩展，再通过自注意力层分配空间权重，最后经过下采样函数，得到适合进行特征提取的多通道低维信息，上采样过程则与之相反；其中，上采样函数由一个卷积和一个2倍的Upsample函数组成，通过插值算法进行上采样；下采样函数由一个卷积和一个Rearrange函数组成，通过维度合并进行下采样；每个残差块由2个卷积层组成，残差块计算单元可以表示为：

其中，为残差块的输出，/>为残差块中第2个卷积层的输出，/>为残差块的输入，采用残差结构，使得网络在深度较深时“短路”某些层以防止网络退化。

在一种实施方式中，步骤2中，所述噪声生成模块，其下采样层、卷积层和上采样层均加入了自注意力层，自注意力层包含3个可进行参数优化的权重矩阵、/>、/>，用于同输入图像做矩阵乘法得到3个参数矩阵/>、/>、/>，具体计算公式为：

其中，为噪声生成模块的基本网络结构中，第二个残差块的输出特征；

于是整幅图像的权重矩阵计算公式为：

其中，为/>的方差，/>为归一化函数，归一化计算公式为：

在一种实施方式中，步骤2中，所述去噪自解码器为一个单步计算单元，将迭代步数、噪声图像、噪声一并输入去噪自解码器后，输出得到去噪图像。去噪自解码器的计算公式推导过程为：

首先，定义噪声图像的加噪过程；对原始图像不断添加一个小的随机标准高斯噪声，共添加步，/>为迭代步数，得到一系列噪声图像。考虑加噪的中间过程，设加入第/>步噪声后的样本图像为/>，则第/>步的样本图像为：

其中，/>为定义在0.0001~0.2上的线性序列，序列长度为预设值1000，序列的第/>个元素取值为/>，/>与/>的作用是控制样本图像/>与所添加噪声/>的比例，使得每一步添加噪声均能使得样本图像的失真程度发生明显变化；

为了优化算法的时间复杂度，可以根据递推公式(8)求出的通项公式：

其中，表示去噪图像，/>表示噪声图像，/>为迭代步数，/>为单位基本噪声，/>为序列{/>}前/>项的累乘；

则根据公式，可以反向计算出去噪图像，即去噪解码计算单元的表达式为：

请见图3，在一种实施方式中，步骤2中，所述去噪自解码网络，是经过参数优化后的去噪自解码网络：参数优化过程包括以下子步骤：

步骤S1，导入噪声图像数据集；

噪声图像数据集使用伯克利分割数据集（BSD500）；

步骤S2，对噪声图像和无噪声图像分别进行相同的预处理；

请见图4，由于两个模块均具有相对较大规模的参数量，整体端到端训练时，受限于数据集大小，模型很难收敛到一个相对良好的性能；因此采用分治思想，对迭代步数生成模块和噪声生成模块分别进行预训练，得到两个预训练模型；预训练过程包含以下三个步骤：

噪声编码器为一个单步计算单元，其随机生成一个高斯噪声，接受一个随机生成的迭代步数和原始图像，计算得到噪声图像，具体计算公式与公式(9)相同；

在一种实施方式中，步骤S3、S5中，训练过程采用最小绝对值偏差损失函数，训练至网络收敛，即损失函数曲线保持平稳不再下降，最终使得模型输出去噪后的图像。

在一种实施方式中，对输出去噪后的图像进行客观质量评价，以反映本发明实施例的性能，具体使用指标为峰值信噪比（PSNR）和结构相似度（SSIM），具体计算公式为：

其中，为常用对数，/>为均方误差，计算方法为：

其中，为图像的像素数量，/>、/>为无噪声图像与模型输出的去噪后图像。

其中，分别为无噪声图像与模型输出的去噪后图像，/>分别为/>的均值，/>为/>的协方差，/>分别为/>的方差。/>是常数，用于防止分母为0，经验上取/>，取/>。

在一种实施方式中，在PolyU自然噪声图像数据集上对模型性能进行评估，得到的实验结果如表1所示。通过与目前主流的传统去噪方法和基于深度学习的去噪方法进行对比，本发明的性能表现均为最优。

表1. PolyU数据集上各去噪方法性能对比，性能最高的指标用加粗表示

其中算法LCSD、TWSC、M-SVD、CM3D_best、DnCNN、CBDNet、DRUNet分别参考文献Rizkinia M, Baba T, Shirai K, et al. Local spectral component decompositionfor multi-channel image denoising[J]. IEEE transactions on image processing,2016, 25(7): 3208-3218，Xu J, Zhang L, Zhang D. A trilateral weighted sparsecoding scheme for real-world image denoising[C]//Proceedings of the Europeanconference on computer vision (ECCV). 2018: 20-36，Kong Z, Yang X. Color imageand multispectral image denoising using block diagonal representation[J].IEEE transactions on image processing, 2019, 28(9): 4247-4259，Dabov K, Foi A,Katkovnik V, et al. Color image denoising via sparse 3D collaborativefiltering with grouping constraint in luminance-chrominance space[C]//2007IEEE international conference on image processing. IEEE, 2007, 1: I-313-I-316，Zhang K, Zuo W, Chen Y, et al. Beyond a gaussian denoiser: Residuallearning of deep cnn for image denoising[J]. IEEE transactions on imageprocessing, 2017, 26(7): 3142-3155，Guo S, Yan Z, Zhang K, et al. Towardconvolutional blind denoising of real photographs[C]//Proceedings of theIEEE/CVF conference on computer vision and pattern recognition. 2019: 1712-1722，Zhang K, Li Y, Zuo W, et al. Plug-and-play image restoration with deepdenoiser prior[J]. IEEE Transactions on Pattern Analysis and MachineIntelligence, 2021, 44(10): 6360-6376。

本发明实施例还提供一种基于去噪自解码网络的图像去噪系统，包括以下单元：

各单元的具体实现方式与各步骤相同，本发明不予撰述。

本发明实施例还提供一种基于去噪自解码网络的图像去噪设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述方案所述的一种基于去噪自解码网络的图像去噪方法。

本发明基于数学建模方法构造模型，使得模型的每个模块都有明确的物理意义，具有严谨的理论基础，提高了模型的可解释性，便于进一步研究和改进。基于理论推导，本发明提供的方法能够对所有加性高斯噪声进行完全去噪。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换和变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种基于去噪自解码网络的图像去噪方法，其特征在于，包括以下步骤：

步骤1，对噪声图像进行预处理；

噪声图像输入迭代步数模块和噪声生成模块，生成对应的迭代步数和单位基本噪声，迭代步数、单位基本噪声、噪声图像一并输入到去噪自解码器中，计算得到去噪图像；

步骤2中，所述去噪自解码器为一个单步计算单元，计算公式推导过程为：

其中，/>为定义在0.0001~0.2上的线性序列，序列的第/>个元素取值为/>；/>与/>的作用是控制样本图像/>与所添加噪声/>的比例；

2.根据权利要求1所述的一种基于去噪自解码网络的图像去噪方法，其特征在于：步骤1中，对噪声图像进行预处理，包括噪声图像的归一化，所述归一化利用尺度放缩归一化将样本数据全部放缩到相同尺度下，且关于0对称分布，具体归一化函数为：

其中，为归一化后的图像，/>为噪声图像。

3.根据权利要求1所述的一种基于去噪自解码网络的图像去噪方法，其特征在于：步骤2中，所述迭代步数生成模块，首先基于残差神经网络对与预处理后的噪声图像进行特征提取，然后经过线性层和归一化层得到不同迭代步数的概率序列，将概率序列的最大值对应的序列位置索引作为迭代步数输出。

4.根据权利要求1所述的一种基于去噪自解码网络的图像去噪方法，其特征在于：步骤2中，下采样层用于降低维度，便于卷积层进行特征提取，上采样层用于恢复维度，确保噪声生成模块的生成与输入维度相同；下采样层、卷积层和上采样层均由4个基本网络结构组成，其中，基本网络结构包括2个残差块、1个自注意力层，上采样层中还包括一个上采样函数，上采样函数由一个卷积和一个2倍的Upsample函数组成，通过插值算法进行上采样；下采样层中还包括一个下采样函数，下采样函数由一个卷积和一个Rearrange函数组成，通过维度合并进行下采样；每个残差块由2个卷积层组成，残差块计算单元表示为：

5.根据权利要求4所述的一种基于去噪自解码网络的图像去噪方法，其特征在于：自注意力层中包含3个可进行参数优化的权重矩阵、/>、/>，用于同输入图像做矩阵乘法得到3个参数矩阵/>、/>、/>，具体计算公式为：

其中，为基本网络结构中第二个残差块的输出特征；

整幅图像的权重矩阵计算公式为：

其中，为/>的方差，/>为归一化函数，归一化计算公式为：

6.根据权利要求1所述的一种基于去噪自解码网络的图像去噪方法，其特征在于：步骤2中，所述去噪自解码网络是经过参数优化后的去噪自解码网络：参数优化过程包括以下子步骤：

步骤S1，导入噪声图像数据集；

噪声图像数据集使用伯克利分割数据集；

步骤S2，对噪声图像和原始图像分别进行相同的预处理；

7.根据权利要求6所述的一种基于去噪自解码网络的图像去噪方法，其特征在于：步骤S3、S5中，训练过程采用最小绝对值偏差损失函数，训练至网络收敛，即损失函数曲线保持平稳不再下降，最终使得模型输出去噪后的图像。

8.一种基于去噪自解码网络的图像去噪系统，其特征在于，包括以下单元：

所述去噪自解码器为一个单步计算单元，计算公式推导过程为：