CN113160086A

CN113160086A - 基于深度学习的图像去摩尔纹方法

Info

Publication number: CN113160086A
Application number: CN202110466878.4A
Authority: CN
Inventors: 李春国; 刘茵茵; 刘周勇; 杨绿溪
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2021-07-23
Anticipated expiration: 2041-04-28
Also published as: CN113160086B

Abstract

本发明公开了一种基于深度学习的图像去摩尔纹方法，属于图像处理领域。本发明将图像去摩尔纹的任务分为两个子任务，纹理去除和颜色纠正，针对每个子任务设计专门的模块。对于纹理去除，使用卷积网络拟合一个滤波器；对于颜色纠正，基于通道注意力提升网络在色彩调整上的效果。网络整体使用多分辨率的结构，共六个分支，结合频域和空间域两个方面的特征，最终完成了对高分辨率图像的去摩尔纹工作。

Description

基于深度学习的图像去摩尔纹方法

技术领域

本发明涉及图像处理技术领域，尤其是基于深度学习的图像去摩尔纹方法。

背景技术

图像摩尔纹是一种出现在图片上的彩色的不规律条纹，是差拍原理的一种表现。简单地说，当两个不同频率的等幅正弦波叠加时，合成信号的幅度会按照两个频率之差变化，当两者的频率接近时，就会出现摩尔纹。所以如果感光元件里面像素的空间频率与影像中条纹的空间频率接近，就很容易产生摩尔纹。

这种彩色的不规律条纹会严重影响图片的观感，降低图片的质量，严重时还会模糊图片中包含的信息，如图1所示。所以，我们需要一种方法，在保证图片原有信息的同时，去除摩尔纹。

相比较于传统的图像恢复任务，类似于去噪去雾等，去摩尔纹更加困难。因为，在空间上，摩尔纹覆盖面积广，同时，不同区域的摩尔纹形状颜色会各不相同；在频域上，摩尔纹出现的频段不固定，并且通常一张图片中的摩尔纹会占据好几个频段，如图2的小波变换图所示。摩尔纹的这些特性使得传统的图像恢复方法并不使用于图像去摩尔纹，我们需要设计一个新的针对性的方案，专门用于摩尔纹的去除任务。

随着神经网络的发展和应用的推广，越来越多的问题都可以用它解决，并且取得良好的效果，图像去摩尔纹任务也不例外。2017年，Anselm等人使用一个简单的全卷积网络增强图像的质量，去除图像上大规模分布的摩尔纹。他们设计的网络由一个输入层、五个隐藏层和一个输出层组成，激活函数选择使用ReLU函数，考虑到摩尔纹在空间上的分布广泛，卷积核的大小K被设置为一个固定的值11。该网络结构简单，因此很容易移植到GPU或者硬件上，成为相机内的一个处理步骤，但它对于去除摩尔纹的效果非常有限。

2018年Sun等人使用全卷积网络在不同的分辨率图片中去摩尔纹，最上层的分支处理原图分辨率的图片，越往下层处理的图片分辨率越小，一共有五个分支。降采样使用的是两层卷积神经网络，两层卷积神经网络后接的是五层不改变分辨率大小的卷积神经网络，它的作用是消除特定频率段的摩尔纹。在这之后，采用反卷积神经网络对不同分辨率的图片进行放大，使得它们都和原图大小一致，并添加一层卷积神经网络被用来改变通道数量。最后五个分支的结果都被简单的加和，得到最终的输出。虽然该网络使用了多分支的结构，但是对于不同分支不同分辨率的图片所采用的处理网络结构相同，但不同分辨率的图片所蕴含的信息是有差异的。所以，该网络对于小尺度的摩尔纹的去除效果非常好，但是当遇到非常大尺度的摩尔纹，该网络的处理效果就会变得特别有限。

同年Liu等人设计了一个深度卷积神经网络DCNN，由粗调整和细节优化两部分组成。粗调整部分的主体是16个残差网络结构，处理的是降采样后的图像；细节优化部分首先是残差学习阶段，目的是将粗调整后的图像升采样，并且使用VDSR得到高分辨率的图像；检索阶段接收残差学习阶段的输出，与原始的输入合并后使用两个卷积层处理得到最终的结果。Liu等人将GAN引入到网络的训练过程中，目的是让网络输出的结果更加接近真实的相机拍摄的图片。这个结构能够有效地去除摄像机获得的图像的摩尔纹，但是这一结构使用了多层残差结构，网络层数多，损失函数单一，训练方法复杂，图片处理需要很长的时间。

2019年Gao等人受U-Net启发，提出了多尺度特征强化网络MSFE。这一网络结构由四层的编码器和四层的解码器，不论是编码器还是解码器主体都是改进后的残差结构，编码器中使用最大池化降采样，相对的解码器每一层分支输出升采样，最后求和得到网络结构的输出。类似于U-Net中编码器和解码器之间的连接，MSFE构建了一个特征强化分支，用于在低层次特征层嵌入高层次特征时强化高层次的特征，防止高层次特征被低层次特征模糊。最后，在解码器的每一层都输出一个分支结果，为了使得分支结果可以与MSFE的输出层结果融合，还需使用了反卷积升采样。这一论文再次指出了多尺度在图像去摩尔纹中的重要作用，但这种基于U-net的多分支网络结构，每个分支的网络结构过于简单，训练使用的损失函数也很单一，这些不足成为制约网络性能的重要原因。

随后，Cheng等人将输入的摩尔纹图像降采样为不同的分辨率，对于不同的分辨率进行去摩尔纹操作。和前文相似的是本文依然选择残差结构构建主网络，在残差结构中加入通道注意力机制。但该通道注意力机制较为单一，提取的特征也有限，制约了网络的性能的提升。另一方面，该网络的计算无摩尔纹的清晰RGB图片和网络恢复出来的RGB图片的L2损失，损失函数过于单一，也是制约网络性能提升的一个因素。

图像去摩尔纹算法集中在三个方面：多尺度信息融合、注意力机制、损失函数的设计。

摩尔纹分布在不同的空间和频率范围内，是一种动态纹理，具有不同的颜色和形状。针对摩尔纹的特性，需要设计一种多分辨率图像处理网络，获得不同频段的特征，联合去除不同区域的摩尔纹。但是多分辨率的图像处理网络具体的分支个数，并不是越多越好。因为，每个分支需要处理的图片分辨率不同，网络结构都应该不同，相同的网络结构不利于提取不同分辨率下的不同图像特征和细节信息。当网络的分支越多，最底层分支所需要处理的图像的分辨率越小，需要我们使用的去摩尔纹并且恢复细节信息的网络也越复杂。一方面，会增加网络的复杂度，消耗更多的处理时间，另一方面，在恢复细节信息时的损耗也难以避免，导致最终融合所有分支结果时，引入不必要的细节损失，降低性能。所以分支的数量也是我们需要考量的一个重要参数。

2.注意力机制最早在自然语言处理和机器翻译对齐文本中提出并使用，并取得了不错的效果。在计算机视觉领域，也有一些学者探索了在视觉和卷积神经网络中使用注意力机制来提升网络性能的方法。类似于空间注意力、通道注意力等，都被证实有利于提高网络性能。现有的网络结构中已经对注意力机制的应用做出了尝试，但他们采用的注意力结构简单，作用有限，设计一种针对动态摩尔纹的注意力机制，有利于简化网络提升效果。

3.Zhao等人提出，在目前的图像恢复任务中主要使用的还是L2损失函数，L2损失的好处有很多，例如可以直接提高PSNR等指标。但是L2指标与人类感知的图像质量相关性较差，例如其假设噪声与图像的局部区域无关。在有些情况下，L1损失函数获得的图像质量会更好。去摩尔纹任务是一个相对比较复杂的图像恢复任务，组合型的损失函数有利于网络从不同的角度接近无摩尔纹的原图。

发明内容

本发明要解决的技术问题是提出基于深度学习的图像去摩尔纹方法，本发明基于深度学习的图像去摩尔纹方法是一种多分辨率图像处理网络，可以通过控制分支的数量在图片的细节恢复和摩尔纹去除两个目标上寻求最佳的结果；设计了一种针对动态摩尔纹的注意力机制，有利于简化网络提升效果；且采用了组合型的损失函数有利于网络从不同的角度接近无摩尔纹的原图。

本发明提出了基于深度学习的图像去摩尔纹方法，所述基于深度学习的图像去摩尔纹方法是一种多分辨率网络结构，包括去除纹理模块和色彩均衡模块。本发明的多分辨率网络有多个分支，将输入的图像降采样，得到不同的分辨率图片，分别进行去摩尔纹操作，最后融合的呢分支处理后的图像，获得最终的结果。

本发明基于深度学习的图像去摩尔纹方法，具体包括如下步骤：

步骤1：构建网络模型

对输入的图像首先进行空间域到频域上的变换，所述网络模型是一个多分辨率网络，第一个分支的输入不需要改变图像分辨率、后面的分支的输入都需要进行降采样，得到不同的分辨率图片，每个分支中均包括去处纹理模块和颜色均衡模块，但对于不同的分支，模块的数量不同，具体为

R_i＝[(Filter+CCM+conv+relu)_×i(relu(conv(I_i)))]+I_i

R_i表示的是第i个分支经过了纹理去除和颜色纠正之后的输出，I_i表示的是第i个分支的输入。Filter代表了去除纹理模块，CCM代表的是颜色均衡模块，处纹理模块和颜色均衡模块串联在一起加上一层卷积作为一次处理，第i个分支中进行处理i次。

将分支中经过了纹理去除和颜色纠正之后的低分辨率的图像分别进行升采样，将图像分辨率恢复至和原图一致，具体为

O_i＝ScaleLayer{conv[(conv+PixelShuffle+relu)_×(i-1)(R_i)]}

R_i表示的是经过了纹理去除和颜色纠正之后的输出，Oi表示的是每个分支的输出。(conv+PixelShuffle+relu)_×(i-1)表示第i个分支需要i-1次升采样。

将每个分支的输出加和，

其中n表示共有n个分支，

对加和后的图像进行频域到空间域的变换，得到最终的结果；

步骤2，选取数据集图像，将数据集图像分为训练集、测试集和验证集，通过数据集图像对网络模型进行训练，得到训练后的网络模型；

步骤3，将待处理图像输入到训练后的网络模型中，进行图像去摩尔纹。

进一步的，步骤1中去处纹理模块是利用CNN构建的滤波器，滤波器主体是Denseblock结构，该结构中每层提取出来的特征映射都可以供后续层使用，在Denseblock之后是两层卷积网络和一个特征尺度层，在滤波器中增加残差的结构，用于去除卷积域的摩尔纹。在Denseblock结构中引入了空洞卷积。

进一步的，步骤1中颜色均衡模块由两个通道注意力结构组成，该结构首先对输入进行两层卷积操作，随后分别对卷积后的结果执行最大池化和平均池化，将两个池化的结果叠加，送入两层1×1的卷积层中，整个结构使用残差结构改善网络退化问题。

有益效果：

与现有技术相比，本发明具有如下优点和有益效果：

1.本发明采用了多分辨率网络，高分辨率的图像，神经网络的感受野相对于整个图片较小，可以提取到更多小物体的特征；而低分辨率的图像可以提取到大物体的特征。相对应的高分辨率的图像有利于去除小尺度的摩尔纹，低分率的图像在去除大尺度的摩尔纹中发挥着作用。

2.本发明采用滤波器滤除纹理，颜色均衡模块调整图像色彩，将去摩尔纹的任务分成两个子任务，针对不同的任务分别处理。

附图说明

图1是摩尔纹对于图片质量的影响图。

图2是摩尔纹小波变换后在频域分布图。

图3是整体网络结构图。

图4是滤波器结构图。

图5是颜色均衡模块结构图。

图6是本发明与现有技术在LCDMoire验证集上结果对比图。

图7是图像原有纹理与摩尔纹发生混叠情况下图像去摩尔纹效果对比图。

具体实施方式

本发明的基于深度学习的图像去摩尔纹方法，如图3所示，具体包括如下步骤：

步骤1：图像预处理

首先需要将空间域的输入转化到频域上，选择的方式是小波变换。所有的输入图像的大小都是固定的1024×1024×3，对每个通道分别进行了小波变换后，拼接三个通道的结果，得到了512×512×12的一组频域图。将这组频域图送入网络中，执行后续操作。

步骤2：图像降采样

本发明的网络模型是一个多分辨率网络，第一个分支的输入不需要任何改变分辨率的操作，直接进行后续操作。后面的分支的输入都需要进行降采样，使用的降采样方式是非线性的三层卷积神经网络：

I_i+1＝conv(conv(relu(conv(I_i))))

I_i表示第i个分支的输入，I_i+1表示第i+1个分支的输入。每次对图像做一次降采样都会使得分辨率减半。从上到下，第六层分支需要做五次降采样。

步骤3：去除纹理

利用CNN构建一个滤波器，在频域上滤除摩尔纹的纹理，这就需要先将原来的RGB图像转换到频域上，然后输入到设计好的滤波器中。但是，摩尔纹会出现在多个频段，单一的滤波器无法滤除各个频段的摩尔纹，这时多分辨率的好处就体现出来了。在不同的分辨率分支中使用多个数量的滤波器，从而达到滤除不同频段的摩尔纹的目的。

具体结构如图4所示，滤波器主体是一个Denseblock结构，它的好处在于每层提取出来的特征映射都可以供后续层使用，以此增强了特征的传递，并且可以缓解梯度消失的问题，Denseblock一共有K层，增长率为GR，在本发明中K＝5，GR＝64。除此之外，为了扩大网络的感受野，引入了空洞卷积。在Denseblock之后是两层卷积网络和一个特征尺度层。特征尺度层的作用是线性约束输出，防止出现较大的局部值和梯度值。最后一个残差的结构，被用于去除卷积域的摩尔纹。

步骤4：颜色纠正

去除纹理模块完成了图片纹理的去除，但摩尔纹造成的图片色彩的偏差仍未解决，因此需要一个颜色均衡模块。为了减小计算负荷，仍在频域上进行操作，因此滤除摩尔纹的频率信息后，加入一个颜色均衡模块，最后再反变换到空间域。

具体的结构如图5所示，注意力机制被证明在很多的任务中起到非常好的作用，颜色均衡模块就是使用了通道注意力。通道注意力实际上就是赋予每个特征层一个权值，从而决定我关注哪几层的特征。而图片的色彩信息刚好就与通道相关，所以可以认为通道注意力在色彩的调节方面有一些作用。首先对输入进行两层卷积操作，随后分别对卷积后的结果执行最大池化和平均池化，将两个池化的结果叠加，送入两层1×1的卷积层中，继续使用残差结构，消除卷积域的摩尔纹。两个通道注意力的结构串联在一起，构成了颜色均衡模块。

步骤5：合并每个分支的结果

每个分支都会执行纹理去除和颜色纠正，但对于不同的分支，模块的数量会略有不同。分辨率越小的图片采用更深层次的网络去恢复更多的细节信息：

R_i＝[(Filter+CCM+conv+relu)_×i(relu(conv(I_i)))]+I_i

R_i表示的是第i个分支经过了纹理去除和颜色纠正之后的输出，I_i表示的是第i个分支的输入。Filter代表了去除纹理模块，CCM代表的是颜色均衡模块，这两个模块串联在一起加上一层卷积作为一次处理，第i个分支就处理i次。

在最终合并前，还需要将低分辨率的图片的分辨率恢复至和原图一致。除了第一分支的分辨率没有改变，其他的五个分支都需要升采样：

O_i＝ScaleLayer{conv[(conv+PixelShuffle+relu)_×(i-1)(R_i)]}

R_i表示的是经过了纹理去除和颜色纠正之后的输出，O_i表示的是每个分支的输出。(conv+PixelShuffle+relu)_×(i-1)表示第i个分支需要i-1次升采样。

现在每个分支输出的大小都是512×512×12的大小，将每个分支的输出加和，得到最终的结果：

以上就是搭建神经网络的整个流程，接下来需要对网络模型进行训练。在LCDMoire数据集中进行了训练，LCDMoire数据集是AIM2019研讨会提供的一个数据集。它包括10200个生成的图片对，一张清晰的原图和一张含有摩尔纹的图像。其中，10000个图像对是训练集，100个是测试集，剩下的100张是验证集，每张都是1024×1024高分辨率的图片。

在本文中，使用L1损失作为最基本的损失函数，因为Zhao等人表示，对于图像恢复任务，L1损失比L2损失更加有效。为了从不同的维度贴近真值，L1损失由三个部分组成：

L1＝aL_RGB+bL_YUV+cL_Wave

a、b和c分别是三个部分对L1损失的贡献，皆为常数，在训练中赋值为1。

训练优化器使用Adam，学习率初始化0.0001。训练过程中对学习率进行优化，如果连续三个epoch验证集的损失都没有减小则将学习率降低为原来的一半，batch的大小设置为1。使用NVidia RTX3090Ti GPU训练网络结构，训练50个epoch。当验证集的PSNR提升时保存模型，并且记录本次模型参数在验证集上的PSNR和SSIM。

如图6第一组的图片，地板的花纹与摩尔纹非常相像的这种特殊情况，本发明的网络具有更好的效果，

如图6第二组图片所示，对于这种大尺度的摩尔纹，本发明的网络显然有更佳的效果。

如图6第三组图片所示，对于图像颜色的恢复问题，本发明的网络具有更好的效果。

本发明在一些复杂的情况，细节的对比如图7所示。本发明的网络面对图像原有纹理与摩尔纹混叠时也能很好的恢复原图。

本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段，还包括由以上技术特征任意组合所组成的技术方案。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.深度学习的图像去摩尔纹方法，其特征在于，具体包括如下步骤：

步骤1：构建网络模型

R_i＝[(Filter+CCM+conv+relu)_×i(relu(conv(I_i)))]+I_i

R_i表示的是第i个分支经过了纹理去除和颜色纠正之后的输出，I_i表示的是第i个分支的输入；Filter代表了去除纹理模块，CCM代表的是颜色均衡模块，去除纹理模块和颜色均衡模块串联在一起加上一层卷积作为一次处理，第i个分支中进行处理i次；

O_i＝ScaleLayer{conv[(conv+PixelShuffle+relu)_×(i-1)(R_i)]}

R_i表示的是经过了纹理去除和颜色纠正之后的输出，O_i表示的是每个分支的输出；(conv+PixelShuffle+relu)_×(i-1)表示第i个分支需要i-1次升采样；

将每个分支的输出加和，

其中n表示共有n个分支，

2.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，步骤1中降采样方式是非线性的三层卷积神经网络：

I_i+1＝conv(conv(relu(conv(I_i))))

I_i表示第i个分支的输入，I_i+1表示第i+1个分支的输入。

3.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，步骤1中的将图像从空间域转化到频域上具体采用小波变换的方式。

4.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，步骤1中去处纹理模块是利用CNN构建的滤波器，滤波器主体是Denseblock结构，该结构中每层提取出来的特征映射都可以供后续层使用，在Denseblock之后是两层卷积网络和一个特征尺度层，在滤波器中增加残差的结构，用于去除卷积域的摩尔纹。

5.根据权利要求4所述深度学习的图像去摩尔纹方法，其特征在于，在Denseblock结构中引入了空洞卷积。

6.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，步骤1中颜色均衡模块由两个通道注意力结构组成，该结构首先对输入进行两层卷积操作，随后分别对卷积后的结果执行最大池化和平均池化，将两个池化的结果叠加，送入两层1×1的卷积层中，整个结构使用残差结构改善网络退化问题。

7.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，步骤2中选用LCDMoire数据集对网络模型进行训练。

8.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，在步骤2对网络模型进行训练过程中，使用L1损失作为最基本的损失函数，L1损失由三个部分组成：

L1＝aL_RGB+bL_YUV+cL_Wave

a、b和c分别是三个部分对L1损失的贡献，皆为常数。

9.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，在步骤2对网络模型进行训练过程中，训练优化器使用Adam，学习率初始化0.0001；训练过程中对学习率进行优化，如果连续三个epoch验证集的损失都没有减小则将学习率降低为原来的一半，batch的大小设置为1。

10.根据权利要求1所述深度学习的图像去摩尔纹方法，其特征在于，在步骤2对网络模型进行训练过程中，使用NVidia RTX3090Ti GPU训练网络结构，训练50个epoch，当验证集的PSNR提升时保存模型，并且记录本次模型参数在验证集上的PSNR和SSIM。