CN114972073A

CN114972073A - 基于超分辨率生成对抗网络srgan的图像去马赛克方法

Info

Publication number: CN114972073A
Application number: CN202210448725.1A
Authority: CN
Inventors: 郭羽萱; 张学敏; 金光; 戴小兵
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2022-04-24
Filing date: 2022-04-24
Publication date: 2022-08-30
Anticipated expiration: 2042-04-24
Also published as: CN114972073B

Abstract

本发明公开了一种基于超分辨率生成对抗网络SRGAN的马赛克去除方法，首先构建数据集，并对训练和测试数据进行预处理，然后生成"RGGB"Bayer模式。然后构建超分辨率生成式对抗网络SRGAN，其次，将上述构建完成的训练数据集输入进生成对抗网络中，对于训练数据，网络每次随机选取一批图像进行学习，分别对判别器和生成器进行交替训练，然后将含有马赛克的测试数据输入生成器中，输出的图像被认为就是去马赛克后的图像。本发明与现有技术相比的优点在于：该方法将单波段Bayer灰度图像的去马赛克问题转化成压缩后4波段（rggb）子图像的2倍超分重建问题，使用超分辨率生成对抗网络SRGAN对Bayer图像进行彩色复原，使得生成图像更加接近原始真实图像。

Description

基于超分辨率生成对抗网络SRGAN的图像去马赛克方法

技术领域

本发明涉及一种图像去马赛克方法，具体是指基于超分辨率生成对抗网络SRGAN的图像去马赛克方法，属于图像处理、深度学习和卷积神经网络领域。

背景技术

去马赛克是图像信号处理过程中的第一步，直接影响到图像的整体质量。由于拜尔图像每个像素只有一个颜色测量值，因此需要一个Bayer插值过程来恢复完整的彩色图像，这个过程也被称为去马赛克。因为传感器上的每个像素都在一个彩色滤光片后面，输出是一个像素值的矩阵，每个像素代表三种滤光片颜色之一的原始强度，去马赛克算法需要估计每种颜色的每个像素的颜色水平，而不仅仅是一种颜色的组成部分。由于亮度（绿色）通道的采样频率高于色度（红色和蓝色）通道，红色和蓝色通道自然会产生混叠问题。Bayer插值往往会在图像的边缘和细节上产生严重的假彩色伪影，如锯齿或拉链（相邻像素的突然和不自然的强度变化，有拉链状的图案）和紫色边缘。因此，要从CFA图像中恢复高质量的彩色图像，去马赛克方法的设计与选择尤为重要。

发明内容

本发明提供一种基于超分辨率生成对抗网络SRGAN的图像去马赛克方法，该方法旨在减少去马赛克图像的伪影现象，更好的恢复图像中高频部分(边缘或细节)的纹理信息，提升数字图像的视觉质量。

本发明的技术解决方案是：本发明提供了一种基于超分辨率生成对抗网络SRGAN的马赛克去除方法，首先构建数据集，并对训练和测试数据进行预处理，使用Bicubic插值对原始高分辨率图像进行2倍的降采样，然后生成 "RGGB "Bayer模式。然后构建超分辨率生成式对抗网络SRGAN ，由两部分构成：生成器和判别器；生成器的目的是将4通道压缩的CFA图像转换成3通道输出的全彩图像。鉴别器网络结构使用卷积层，然后进行批量归一化和LeakyReLU激活（α=0.2），并在整个鉴别器网络中避免最大池。其次，将上述构建完成的训练数据集输入进生成对抗网络中，对于训练数据，网络每次随机选取一批图像进行学习，分别对判别器和生成器进行交替训练，训练过程采用随机梯度下降法SGD (Stochasticgradient descent)，利用Adam(adaptive moment estimation)优化器进行最优化。感知损失函数为内容损失和对抗损失的加权和，内容损失由MSE损失和VGG特征损失组成。训练之后就可以测试网络性能，对于测试数据集，利用与训练数据同样的预处理方法，然后将含有马赛克的测试数据输入生成器中，输出的图像被认为就是去马赛克后的图像，通过计算去马赛克后的输出图像与不含马赛克的原始图像之间的峰值功率信噪比PSNR(Peak SignaltoNoise Ratio)来衡量去马赛克效果。

本发明与现有技术相比的优点在于：该方法将单波段Bayer灰度图像的去马赛克问题转化成压缩后4波段（rggb）子图像的2倍超分重建问题，使用超分辨率生成对抗网络SRGAN对Bayer图像进行彩色复原，结合生成对抗网络中博弈对抗的特点，在损失函数中同时兼顾像素级MSE损失和特征级VGG损失，使得生成图像更加接近原始真实图像。

附图说明

图1是本发明的结构示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语 “连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

一种基于超分辨率生成对抗网络SRGAN的马赛克去除方法，具体按照以下步骤实施：

1.构建数据集：

用VOC2012数据集来训练网络，其中包括16700张用于训练的图像和426张用于验证的图像。所有的训练图像都被随机裁剪成88×88像素大小的斑块。对于测试集，使用柯达和麦克马斯特（Kodak和McMaster）数据集，这些数据集被广泛用作去马赛克解决方案的测试集。柯达数据集由24幅图像组成，每幅图像的分辨率为768×512。麦克马斯特数据集由18张图像组成，每张图像都是从500×500的高分辨率图像中提取的。为了对训练和测试数据进行预处理，使用Bicubic插值对原始高分辨率图像进行2倍的降采样，然后生成 "RGGB "Bayer模式。

2.构建超分辨率生成对抗网络SRGAN：

生成对抗网络由两部分构成：生成器和判别器；生成器的目的是将4通道压缩的CFA图像转换成3通道输出的全彩图像。我们对G使用SRGAN模型，包含4个卷积块，16个残差块（ResBlocks）和一个子像素卷积层。具体来说，我们使用了两个具有3×3小核和64个特征图的卷积层，然后是批量规范化层和ParametricReLU[作为激活函数。用两个训练有素的子像素卷积层提高输入图像的分辨率。此外，我们在子像素层之前引入一个跳过连接来引导输出。

鉴别器网络结构使用卷积层，然后进行批量归一化和LeakyReLU激活（α=0.2），并在整个鉴别器网络中避免最大池。它包含8个卷积层，3×3滤波核的数量不断增加，与VGG网络一样，从64核增加到512核，增加了2倍。每当特征数量增加一倍时，就会使用分层卷积来降低图像分辨率。所得的512个特征图之后是两个密集层和一个最后的sigmoid激活函数，以获得样本分类的概率。

3.训练超分辨率生成对抗网络SRGAN：

将上述构建完成的训练数据集输入进生成对抗网络中，对于训练数据，网络每次随机选取一批图像进行学习，分别对判别器和生成器进行交替训练，训练过程采用随机梯度下降法SGD (Stochastic gradient descent)，利用Adam(adaptive momentestimation)优化器进行最优化。

感知损失函数为内容损失和对抗损失的加权和，内容损失由MSE损失和VGG特征损失组成：

。

4.测试超分辨率生成对抗网络SRGAN：

对于测试数据集，利用与训练数据同样的预处理方法，然后将含有马赛克的测试数据输入生成器中，输出的图像被认为就是去马赛克后的图像，通过计算去马赛克后的输出图像与不含马赛克的原始图像之间的峰值功率信噪比PSNR(Peak Signal to NoiseRatio)来衡量去马赛克效果。

以上对本发明及其实施方式进行了描述，这种描述没有限制性，附图中所示的也只是本发明的实施方式之一，实际的结构并不局限于此。总而言之如果本领域的普通技术人员受其启示，在不脱离本发明创造宗旨的情况下，不经创造性的设计出与该技术方案相似的结构方式及实施例，均应属于本发明的保护范围。

Claims

1.基于超分辨率生成对抗网络SRGAN的图像去马赛克方法，其特征在于：包括以下步骤：

S1：构建数据集

用VOC2012数据集来训练网络，其中包括16700张用于训练的图像和426张用于验证的图像；所有的训练图像都被随机裁剪成88×88像素大小的斑块；对于测试集，使用柯达和麦克马斯特数据集，柯达数据集由24幅图像组成，每幅图像的分辨率为768×512；麦克马斯特数据集由18张图像组成，每张图像都是从500×500的高分辨率图像中提取的；为了对训练和测试数据进行预处理，使用Bicubic插值对原始高分辨率图像进行2倍的降采样，然后生成 "RGGB "Bayer模式；

S2：构建超分辨率生成对抗网络SRGAN

生成对抗网络由两部分构成：生成器和判别器；生成器的目的是将4通道压缩的CFA图像转换成3通道输出的全彩图像，对G使用SRGAN模型，包含4个卷积块，16个残差块（ResBlocks）和一个子像素卷积层；

鉴别器网络结构使用卷积层，然后进行批量归一化和LeakyReLU激活（α=0.2），并在整个鉴别器网络中避免最大池，它包含8个卷积层，3×3滤波核的数量不断增加，与VGG网络一样，从64核增加到512核，增加了2倍；每当特征数量增加一倍时，就会使用分层卷积来降低图像分辨率；所得的512个特征图之后是两个密集层和一个最后的sigmoid激活函数，以获得样本分类的概率；

S3：训练超分辨率生成对抗网络SRGAN

将上述构建完成的训练数据集输入进生成对抗网络中，对于训练数据，网络每次随机选取一批图像进行学习，分别对判别器和生成器进行交替训练，训练过程采用随机梯度下降法SGD (Stochastic gradient descent)，利用Adam(adaptive moment estimation)优化器进行最优化；

S4：测试超分辨率生成对抗网络SRGAN

对于测试数据集，利用与训练数据同样的预处理方法，然后将含有马赛克的测试数据输入生成器中，输出的图像被认为就是去马赛克后的图像，通过计算去马赛克后的输出图像与不含马赛克的原始图像之间的峰值功率信噪比PSNR(Peak Signal to Noise Ratio)来衡量去马赛克效果。

2.根据权利要求1所述的基于超分辨率生成对抗网络SRGAN的图像去马赛克方法，其特征在于：所述的步骤S2中，使用两个具有3×3小核和64个特征图的卷积层，然后是批量规范化层和ParametricReLU[作为激活函数，用两个训练有素的子像素卷积层提高输入图像的分辨率，此外，在子像素层之前引入一个跳过连接来引导输出。