CN112634175A

CN112634175A - 基于双重卷积网络的手机拍摄图像去噪方法

Info

Publication number: CN112634175A
Application number: CN202110006550.4A
Authority: CN
Inventors: 罗仁泽; 黄雪霁; 郭亮; 庹娟娟
Original assignee: Southwest Petroleum University
Current assignee: Southwest Petroleum University
Priority date: 2021-01-05
Filing date: 2021-01-05
Publication date: 2021-04-09

Abstract

本发明公开了一种基于双重卷积网络的手机拍摄图像去噪方法，本发明改进了FFDNet的不足，添加了一个噪声估计子网络，构建了冗余链接块结构，更好的保存了原始图像的结构性，解决了FFDNet主观估计噪声水平错误导致去噪效果大幅降低的问题。

Description

基于双重卷积网络的手机拍摄图像去噪方法

技术领域

本发明涉及图像去噪领域，特别是涉及手机拍摄图像，具体涉及一种基于双重卷积网络的手机拍摄图像去噪方法。

背景技术

今天智能手机被大家公认是影响我们普通人日常生活最重要的科技产品，在智能手机的各个功能中，拍照是一项非常重要的组成部分。虽然人们越来越习惯于使用轻便的智能手机拍照而不是笨重的数码单反相机，但是因为手机内部空间的限制，导致其传感器尺寸、光圈大小等硬件配置和数码单反相机仍然有差距。智能手机相比于数码单反的优势在其拥有强大的芯片和神经网络处理器，智能手机利用其芯片的强大运算能力，可以很好的解决拍摄图像不清晰、细节模糊等问题。

传统的图像去噪算法是在含有噪声的图像中寻找出一定规律后再进行相对应的图像去噪处理，如果含有噪声的图片本身没有办法找到有用的规律，去噪的效果就会大大降低。深度学习的图像去噪方法是最近兴起的一种属于数据驱动的方法，大部分图像去噪的实验数据是充足的，这为深度学习的图像去噪方法提供了坚实的基础，所以当前深度学习方法在许多场景下的去噪效果已经超越块匹配和3D滤波算法(Block-matching and 3Dfiltering，BM3D)，该方法是Dabov K在2007年发表的论文Image denoising by sparse 3-D transform-domain collaborative filtering[J].IEEE Transactions on imageprocessing,2007,16(8):2080-2095。但是智能手机的拍照环境多变且复杂，产生的图像噪声随机性强且通常与信号相关，受环境因素影响大，没有明确的分布可以描述。目前的一些基于深度学习的图像去噪方法应用于手机拍摄图像去噪时通常会出现去噪图像细节模糊、峰值信噪比低等问题，如何解决常规深度学习的图像去噪方法应用在智能手机拍摄图像上的缺陷是本论文研究目的和意义。

发明内容

为了解决现有技术的缺陷，改善常规深度学习方法无法有效估计手机拍摄图像噪声水平，导致去噪图像峰值信噪比低的问题，提出了一种双重卷积网络(TwiceConvolutional Neural Networks,T-CNN)去噪方法，本发明可以提高手机拍摄图像的去噪效果。

本发明涉及一种基于双重卷积去噪网络的手机拍摄图像去噪方法，其特征在于包括以下步骤：

1.构建双重卷积去噪网络模型；

1)构建噪声估计子网络：

构建三个网络层，输入层、隐藏层、输出层；输入层是手机拍摄图像的输入；输出层是输出已估计的噪声；隐藏层分为5个部分：隐藏层中第一部分为卷积层，该卷积层包含了64个卷积核，尺寸为3x3，步长为1，填充为1，激活函数为线性整流函数；隐藏层中第二部分为3个冗余链接块，每个冗余链接块中包含两次批量标准化、两个卷积层，第一个卷积层的卷积核尺寸为1x1，步长为1，填充为1，激活函数为线性整流函数，第二个卷积层的卷积核尺寸为3x3，步长为1，填充为1，激活函数为线性整流函数，其中增长率为64；隐藏层中第三部分为过渡块，一个过渡块包含批量标准化，线性整流函数和卷积层，卷积层中包含64个卷积核，尺寸为1x1，步长为1，填充为1；隐藏层中第四部分为3个冗余链接块，每个冗余链接块中包含两次批量标准化、两个卷积层，第一个卷积层的卷积核尺寸为1x1，步长为1，填充为1，激活函数为线性整流函数，第二个卷积层的卷积核尺寸为3x3，步长为1，填充为1，激活函数为线性整流函数，其中增长率为64；隐藏层中第五部分为过渡块，一个过渡块包含批量标准化，线性整流函数和卷积层，卷积层包含64个卷积核，尺寸为1x1，步长为1，填充为1；其中线性整流函数的表达式为f(x)＝max(0,x)，x取值为任意实数；

2)构建去噪子网络：

构建三个网络层，输入层、隐藏层、输出层；输入层由1个卷积层组成，输入是手机拍摄图像和已估计噪声的拼接，拼接是指两张相同尺寸的3通道图像合成为一张长宽不变的6通道图像，卷积层包含批量标准化、卷积运算和激活函数运算，其中，卷积核尺寸为3x3，步长为1，填充为1，激活函数为渗漏整流线性函数；隐藏层由13个卷积层组成，卷积层包含卷积运算和激活函数运算，其中，卷积核尺寸为3x3，步长为1，填充为1，激活函数为渗漏整流线性函数；输出层由1个卷积层组成，输出已去噪的手机拍摄图像，卷积层包含批量标准化、卷积运算和激活函数运算，其中，卷积核尺寸为3x3，步长为1，填充为1，激活函数为渗漏整流线性函数；线性整流函数的表达式为f(x)＝max(0,x)，x取值为任意实数；渗漏整流线性函数的表达式为：x>0时，g(x)＝x，x≤0时，g(x)＝λx，x为输入量，λ为(0,1)之间的常数；

2.训练网络执行如下步骤：

第一步，准备数据集，把高像素图像剪裁为合适的尺寸，设定损失函数阈值和最大训练次数，初始化训练参数；

第二步，把手机拍摄图像输入噪声估计子网络，输出噪声估计图像；

第三步，计算噪声估计子网络的损失函数，损失函数为噪声估计图像和手机拍摄图像的均方误差；

第四步，若损失函数大于噪声估计子网络的损失函数阈值或未达到最大训练次数，则重复第二步至第三步；

第五步，把噪声估计图像与手机拍摄图像拼接后输入去噪子网络，拼接是指两张相同尺寸的3通道图像合成为一张长宽不变的6通道图像；

第六步，计算去噪子网络的损失函数，损失函数为输入图像和干净图像的均方误差；

第七步，若损失函数大于去噪子网络的损失函数阈值或未达到最大训练次数，则重复第五步至第六步；

3.进行双重卷积去噪网络的参数更新；

网络参数使用自适应矩估计算法进行优化，优化方法如下：

输入为手机拍摄图像数据集X＝{x₁,x₂,…,x_n}，输出为去噪后图像

标签数据集Y＝{y₁,y₂,…,y_n}，输入信号经过双重卷积去噪网络后输出

优化双重卷积去噪网络参数w，使

取出m个样本进入网络训练，m与n均为正整数，m≤n，L为损失函数，数据梯度均值为g，定义为：

表示损失函数L(y_j,F(x_j；w))对w求偏导数；设定参数β₁和β₂，取值范围为(0,1)，设定e为平滑参数，取值范围为(0,1)，计算衰减梯度为v_i，i＝1,2,…,t，v_t＝β₁·v_t-1+(1-β₁)g，计算衰减学习率为r_i，i＝1,2,…,t，r_t＝β₂·r_t-1+(1-β₂)g²；再对r和v进行偏置校正，

其中t为训练次数，(β₁)^t表示β₁的t次方，(β₂)^t表示β₂的t次方；更新双重卷积去噪网络参数w_i，i＝1,2,…,t，

4.向构建好的网络模型F(X；w)中输入含有噪声的手机拍摄图像X，网络输出为去噪后的手机拍摄图像

本发明的创新点：

与FFDNet相比较，本发明添加了一个新型噪声估计子网络，构造了冗余连接结构，该结构可以使不同模块在通道上连接，再通过1x1卷积层来减少通道数，降低模型复杂度；这种结构可以更好的保存了原始图像的结构性，解决了FFDNet主观估计噪声水平错误导致去噪效果大幅降低的问题。

以上所述FFDNet为Zhang K等2018年发表的论文FFDNet:Toward a fast andflexible solution for CNN-based image denoising[J].IEEE Transactions on ImageProcessing,2018,27(9):4608-4622.以上所述的DnCNN为Zhang K等在2017年发表的论文Beyond a gaussian denoiser:Residual learning of deep cnn for image denoising[J].IEEE Transactions on Image Processing,2017,26(7):3142-3155.

附图说明

图1是噪声估计子网络结构示意图，输入层是手机拍摄图像的输入；输出层是输出已估计的噪声；隐藏层分为5个部分：隐藏层中第一部分为卷积层；隐藏层中第二部分为3个冗余链接块；隐藏层中第三部分为过渡块；隐藏层中第四部分为3个冗余链接块；隐藏层中第五部分为过渡块。

图2是去噪子网络结构示意图，输入层由1个卷积层组成，输入是手机拍摄图像和已估计噪声的拼接；隐藏层由13个卷积块组成；输出层由1个卷积层组成，输出已去噪的手机拍摄图像。

图3是冗余链接块结构示意图，每个冗余链接块中包含两次批量标准化、两个卷积层和两个线性整流函数，第一个卷积层的卷积核尺寸为1x1，步长为1，填充为0，第二个卷积层的卷积核尺寸为3x3，步长为1，填充为1，其中通道数为64；

图4是过渡块结构示意图，一个过渡块包含批量标准化、线性整流函数和卷积运算，其中卷积运算包含64个卷积核，尺寸为1x1，步长为1，填充为0。

图5是卷积块结构示意图，卷积块包含卷积运算、批量标准化和激活函数运算，其中，卷积核尺寸为3x3，步长为1，填充为1，激活函数为渗漏整流线性函数，渗漏整流线性函数可以避免某些神经元可能永远不会被激活，导致相应的参数永远不能被更新的问题。

图6是本发明的方法流程图，把待去噪图像输入噪声估计子网络，输出为噪声估计，把噪声估计与待去噪图像进行拼接，拼接是指两张相同尺寸的3通道图像合成为一张长宽不变的6通道图像，拼接后输入去噪子网络中，得到去噪图像。

图7是本发明与其它方法的去噪效果对比图，图中(a)是干净图片，(b)是含有噪声的图片，(c)是使用FFDNET去噪后的图片，(d)是通过双重卷积网络进行去噪得到的图片，其中(c)的峰值信噪比(PSNR)与结构相似性(SSIM)分别为37.7123和0.8978，其中(d)的峰值信噪比(PSNR)与结构相似性(SSIM)分别为39.0592和0.9463，可以看出双重卷积网络比FFDNET的去噪效果更好。

具体实施方式

下面对本发明的技术方案的主要实现原理、具体实施方式等进行详细描述。

1.构建双重卷积去噪网络模型；

1)构建噪声估计子网络：

2)构建去噪子网络：

2.训练网络通过以下步骤完成：

第一步，准备数据集，把高像素图像剪裁为合适的尺寸，以华为mate20pro所拍摄的一张尺寸为2736x3648x3的3通道RGB图像为例，剪裁为多个512x512x3尺寸的图像，这有助于加快网络训练速度，设定损失函数阈值为1*10^-4，最大训练次数为10000，初始化训练参数；

第二步，把手机拍摄图像输入噪声估计子网络，尺寸为512x512x3，输出噪声估计图像，尺寸为512x512x3；

第五步，把噪声估计图像与手机拍摄图像拼接后输入去噪子网络，拼接后的图像尺寸为512x512x6；

3.进行双重卷积去噪网络的参数更新；

网络参数使用自适应矩估计算法进行优化，优化方法如下：

优化双重卷积去噪网络参数w使

取出10个样本进入网络训练，L为损失函数，数据梯度均值为g，定义为：

表示损失函数L(y_j,F(x_j；w))对w求偏导数；设定参数β₁和β₂，β₁＝0.9，β₂＝0.99，设定e为平滑参数，e＝1*10^-4，计算衰减梯度为v_i，i＝1,2,…,t，v_t＝β₁·v_t-1+(1-β₁)g，计算衰减学习率为r_i，i＝1,2,…,t，r_t＝β₂·r_t-1+(1-β₂)g²；再对r和v进行偏置校正，

通过客观数据分析，由下表可以看出，在不同的拍摄参数下，双重卷积去噪网络(T-CNN)所生成去噪图像的峰值信噪比(PSNR)与结构相似性(SSIM)都优于EPLL，DnCNN和FFDNet方法。

以上所述FFDNet为Zhang K等2018年发表的论文FFDNet:Toward a fast andflexible solution for CNN-based image denoising[J].IEEE Transactions on ImageProcessing,2018,27(9):4608-4622.以上所述的DnCNN为Zhang K等在2017年发表的论文Beyond a gaussian denoiser:Residual learning of deep cnn for image denoising[J].IEEE Transactions on Image Processing,2017,26(7):3142-3155.以上所述的EPLL为Sulam J等2015年发表的论文Expected patch log likelihood with a sparse prior[C]//International Workshop on Energy Minimization Methods in Computer Visionand Pattern Recognition.Springer,Cham,2015:99-111.

场景

ISO

快门速度(秒)

环境亮度

去噪方法

PSNR(dB)

SSIM

玩具车

800

1/800

亮

噪声图像

31.3107

0.8771

玩具车

800

1/800

亮

EPLL

35.4541

0.8831

玩具车

800

1/800

亮

DnCNN

37.1245

0.9541

玩具车

800

1/800

亮

FFDNet

37.7123

0.8978

玩具车

800

1/800

亮

T-CNN

39.0592

0.9463

玩具车

800

1/800

暗

噪声图像

32.0370

0.7086

玩具车

800

1/800

暗

EPLL

37.4254

0.8710

玩具车

800

1/800

暗

DnCNN

37.7642

0.9183

玩具车

800

1/800

暗

FFDNet

38.3650

0.8911

玩具车

800

1/800

暗

T-CNN

38.7589

0.9212

Claims

1.本发明涉及一种基于双重卷积去噪网络的手机拍摄图像去噪方法，其特征在于包括以下步骤：

步骤1.构建双重卷积去噪网络模型；

1)构建噪声估计子网络：

构建三个网络层，输入层、隐藏层、输出层；输入层是手机拍摄图像的输入；输出层是输出已估计的噪声；隐藏层分为5个部分：隐藏层中第一部分为卷积层，该卷积层包含了64个卷积核，尺寸为3x3，步长为1，填充为1，激活函数为线性整流函数；隐藏层中第二部分为3个冗余链接块，每个冗余链接块中包含两次批量标准化、两个卷积层，第一个卷积层的卷积核尺寸为1x1，步长为1，填充为1，激活函数为线性整流函数，第二个卷积层的卷积核尺寸为3x3，步长为1，填充为1，激活函数为线性整流函数，其中增长率为64；隐藏层中第三部分为过渡块，一个过渡块包含批量标准化、线性整流函数和卷积运算，其中卷积运算包含64个卷积核，尺寸为1x1，步长为1，填充为1；隐藏层中第四部分为3个冗余链接块，每个冗余链接块中包含两次批量标准化、两个卷积层，第一个卷积层的卷积核尺寸为1x1，步长为1，填充为1，激活函数为线性整流函数，第二个卷积层的卷积核尺寸为3x3，步长为1，填充为1，激活函数为线性整流函数，其中增长率为64；隐藏层中第五部分为过渡块，一个过渡块包含批量标准化、线性整流函数和卷积运算，其中卷积运算包含64个卷积核，尺寸为1x1，步长为1，填充为1；其中线性整流函数的表达式为f(x)＝max(0,x)，x取值为任意实数；

2)构建去噪子网络：

构建三个网络层，输入层、隐藏层、输出层；输入层由1个卷积层组成，输入是手机拍摄图像和已估计噪声的拼接，拼接是指两张相同尺寸的3通道图像合成为一张长宽不变的6通道图像，卷积层包含批量标准化、卷积运算和激活函数运算，其中，卷积核尺寸为3x3，步长为1，填充为1，激活函数为渗漏整流线性函数；隐藏层由13个卷积块组成，卷积块包含卷积运算和激活函数运算，其中，卷积核尺寸为3x3，步长为1，填充为1，激活函数为渗漏整流线性函数；输出层由1个卷积层组成，输出已去噪的手机拍摄图像，卷积层包含批量标准化、卷积运算和激活函数运算，其中，卷积核尺寸为3x3，步长为1，填充为1，激活函数为渗漏整流线性函数；线性整流函数的表达式为f(x)＝max(0,x)，x取值为任意实数；渗漏整流线性函数的表达式为：x＞0时，g(x)＝x，x≤0时，g(x)＝λx，x为输入量，λ为(0，1)之间的常数；

步骤2.训练网络执行如下步骤：

步骤3.进行双重卷积去噪网络的参数更新；

网络参数使用自适应矩估计算法进行优化，优化方法如下：

输入为手机拍摄图像数据集X＝{x₁，x₂，...，x_n}，输出为去噪后图像

标签数据集Y＝{y₁，y₂，...，y_n}，输入信号经过双重卷积去噪网络后输出

优化双重卷积去噪网络参数w，使

表示损失函数L(y_j，F(x_j；w))对w求偏导数；设定参数β₁和β₂，取值范围为(0，1)，设定e为平滑参数，取值范围为(0，1)，计算衰减梯度为v_i，i＝1，2，...，t，v_t＝β₁·v_t-1+(1-β₁)g，计算衰减学习率为r_i，i＝1，2，...，t，r_t＝β₂·r_t-1+(1-β₂)g²；再对r和v进行偏置校正，

其中t为训练次数，(β₁)^t表示β₁的t次方，(β₂)^t表示β₂的t次方；更新双重卷积去噪网络参数w_i，i＝1，2，...，t，

步骤4.向构建好的网络模型F(X；w)中输入含有噪声的手机拍摄图像X，网络输出为去噪后的手机拍摄图像