CN109191378A

CN109191378A - 基于ergan网络单幅图像超分辨重建方法

Info

Publication number: CN109191378A
Application number: CN201810830164.5A
Authority: CN
Inventors: 李孝杰; 伍贤宇; 何嘉; 吴锡; 周激流; 史沧红; 郭峰; 罗超; 张宪; 刘书樵; 李俊良
Original assignee: Chengdu University of Information Technology
Current assignee: Chengdu University of Information Technology
Priority date: 2018-07-25
Filing date: 2018-07-25
Publication date: 2019-01-11

Abstract

本发明涉及一种基于ERGAN网络单幅图像超分辨重建方法。本发明包括以下步骤：输入待重建图像I；将待重建图像I分为大小为m*m的图像块集合，每一个图像块用表示，i＝1，2，...，s；将处理成n*n大小的低分辨率图像将低分辨率图像输入到生成器G中进行训练；将生成器G输出的结果G(z)和一同输入到鉴别器D中；将需要重建的图像再经过生成器G网络超分辨重建。本发明提出了基于生成对抗网络，增强对称残差单位的单图像超分辨率(ERGAN)，在训练的过程中保留了高频特征，减轻深层网络训练的难度。

Description

基于ERGAN网络单幅图像超分辨重建方法

技术领域

本发明涉及图像重建技术领域，具体的说是一种基于ERGAN网络单幅图像超分辨重建方法。

背景技术

超分辨率(SR)技术用于从低分辨率(LR)图像或图像序列重建高分辨率(HR)图像。图像超分辨率重建的核心概念是利用时间带宽(同一场景的多帧图像序列)来实现时间分辨率到空间分辨率的转换。目前的图像超分辨率方法可分为三大类：基于插值的，基于的重建，以及基于学习的。虽然已有许多基于非神经网络的重建方法，但其效果不如基于深度学习的超分辨率技术。

基于生成对抗网络(GAN)由两部分组成：生成器G和鉴别器D。生成器G可以用来生成与原始图像接近的超分辨率图像G(z)。判别器D可以区分是来自生成网络或训练数据X上的图像。我们知道，生成器的目标是在训练数据X上学习分布p_g。因此，生成器输入的是随机向量z满足高斯分布P_z(z)，然后将输入z映射到数据空间G(z；θ_g)。另一方面，鉴别器网络可以被认为是从图像数据映射到图像来自真实数据分布p_g，而不是生成器分布的概率的函数。

深度学习为重建超分辨率图像提供了许多良好的训练方法。SRCNN是首次提出的用神经网络方法中。然而，SRCNN网络是不稳定的，很难以训练。此外，通过最小化均方误差(MSE)获得的图像太平滑，这也显著地降低了峰值信噪比(PSNR)。提出的MDSR，在传统的残差网络中去掉不必要的模块(例如，批归一化)，并设置了多尺度的深度超分辨率系统和训练方法。它对每个单尺度超分辨率图像的管理都有很好的效果。基于Laplacian金字塔的方法，提出了LapSRN图像超分辨率结构。金字塔的每一级以粗分辨率的特征映射作为输入，并使用反卷积以获得更精细的特征映射。此外，使用健壮的Charbonnier函数对网络进行训练，获得更好的超分辨效果。

发明内容

针对现有技术中存在的上述不足之处，本发明要解决的技术问题是提供一种基于ERGAN网络单幅图像超分辨重建方法。

本发明为实现上述目的所采用的技术方案是：一种基于ERGAN网络单幅图像超分辨重建方法，包括以下步骤：

输入待重建图像I；

将待重建图像I分为大小为m*m的图像块集合，每一个图像块用表示，i＝1，2，...，s；

将处理成n*n大小的低分辨率图像

将低分辨率图像输入到生成器G中进行训练；

将生成器G输出的结果G(z)和一同输入到鉴别器D中；

将需要重建的图像再经过生成器G网络超分辨重建。

所述将低分辨率图像输入到生成器G中进行训练，包括以下步骤：

用大小为3×3的卷积核对低分辨率图像做卷积处理；

对上一步骤输出的特征图进行残差处理；

对上一步骤输出的特征图用大小为3×3的卷积核做卷积处理；

对上一步骤输出的特征图进行残差处理；

残差单元对称跳跃连接；

经过两层子像素卷积，生成结果G(z)。

所述卷积处理和残差处理循环16轮。

所述残差单元对称跳跃连接具体为：从低层残差输出的结果连接到对应的高层的残差结果。

所述将生成器G输出的结果G(z)和一同输入到鉴别器D中，包括以下步骤：

用大小为4*4的卷积核对图像做卷积处理；

将上一步得到的结果经过LeakyReLU激活函数；

经过降维处将数组返回一个折叠成一维的数组；

DenseLayer操作，构造一个全连接隐藏层，再经过一个denselayer全连接层；

将上一步得到的结果进行非线性激活；

输出结果，判断图像是来自生成器还是图像块

本发明具有以下优点及有益效果：

1、本发明提出了基于生成对抗网络，增强对称残差单位的单图像超分辨率(ERGAN)，在训练的过程中保留了高频特征，减轻深层网络训练的难度。

2、本发明构造了对称跳跃连接在残差单元中，重建出原始图像的长度和宽度的四倍大小的超分辨率图像，并表现出优异的视觉性能。

附图说明

图1为本发明的方法流程图；

图2为ERGAN网络在DIV2K数据集上超分辨重建的结果图与原始图像对比；

图3为ERGAN网络与现有的超分辨技术在BSD100数据集上超分辨重建的结果对比。

具体实施方式

下面结合附图及实施例对本发明做进一步的详细说明。

如图1所示，本发明提出的一种基于ERGAN网络单幅图像超分辨重建方法，在实施例中包括以下步骤：

(1)输入一张图像I。

(2)利用ERGAN结构对图像I进行超分辨重建。

a.将图像I分为大小为384*384的图像块集合，每一块用i＝1，2，...，s表示。

b.将处理成96*96大小的低分辨率图像

(3)将得到的输入到生成器G中进行训练。

c.用大小为3×3，步长为1，输出为64个特征图，每个卷积层的输出通过ReLU激活函数，ReLU函数如下表示：

f(x)＝max(0，x) (1)

当输入信号小于0时，输出为0，当输入信号大于0时，输出等于输入。ReLU的收敛速度大于其它激活函数的收敛速度。ReLU只需要一个阈值来获得激活值，并且计算复杂度较低。

d.上一步的输出进入一个残差单元，残差的操作包括CONV-BN-ReLU-CONV-BN，最后输出的结果加上输入。卷积操作也是大小为3×3，步长为1，最后残差输出的结果为64个特征图。残差的公式可以表示如下：

R^b＝F(R^b-1，W)+R^b-1 (2)

e.上一步输出的特征图进入下一个大小为3×3，步长为1的卷积操作。

f.残差单元对称连接，经过多次的残差，卷积操作以后，输出的特征图进入两层subpixel(子像素卷积，等同于普通卷积，最大好处是效率高)，输出结果G(z)。残差单元对称跳跃连接具体为：从低层残差输出的结果连接到对应的高层的残差结果，将学习到更多的高频信息。生成网络的损失函数为：

G_loss＝G_adv+G_MSE+G_VGG (3)

其中G_adv表示对抗损失，G_MSE表示像素均方误差(mean squared error)，G_VGG表示高维均方误差(high dimensional mean square error)。具体公式如下：

c-f步骤所述的卷积——残差处理需要经过若干轮，优选为16轮。

(4)将生成网络的输出结果G(z)和一起输入到鉴别网络。

g.用大小为4*4，步长为2，输出为64个特征图。

经过多次卷积操作以后，进入经过LeakyReLU激活函数。卷积操作包括8个卷积。鉴别网络D总共2000次迭代结束，生成网络同杆2000次迭代。LeakyReLU激活函数是Relu的改进版本，引入负的非零梯度，其数学表达式为：

其中，a_i是1到正无穷区间内的固定参数，x_i是输入，y_i是输出结果。

h.经过Flantten(降维)处理，将数组返回一个折叠成一维的数组，一共有16*18432。

Dense操作，即构造一个全连接隐藏层，输出16*1024；再经过一个denselayer全连接层，输出16*1；

i.sigmoid操作；sigmoid操作是常用的非线性激活函数，输出结果是0和1，在这里用来判定输入的图像是来自生成器还是训练图像其数学表达式为：

其中，x是输入，y是输出结果。

j.输出结果，判断图像是来自生成器G还是训练数据鉴别网络的损失函数为对抗损失函数，如下表示：

如图2所示，左边是原图，右边是本发明在DIV2K数据集上4倍超分辨率的结果。可以看出，我们的结果能生成近似于原始图像的效果。

表1四种公共数据集(Set5，Set14，BSD100，Urban100)的测试结果

表1中，PSNR表示峰值信噪比，是一种评价图像的客观标准。SSIM表示结构相似性，是一种衡量两幅图像相似度的指标。两个指标越高越奸，越接近原图。A+，SRCNN，SelfExSR是现有的最先进的效果很好的图像超分辨技术，ERGAN是本发明提出的方法。由表1可见，通过与Bicubic，A+，SRCNN，SelfExSR方法相比，ERGAN在两种指标上的效果比它们都高。图2是ERGAN网络在DIV2K数据集上超分辨重建的结果图与原始图像对比，可以看出我们方法重建的结果近似原始图像，几乎难以分辨。图3为ERGAN网络与Bicubic，A+，SRCNN，SelfExSR在BSD100数据集上超分辨重建的结果对比，可以看出其他方法相对模糊，而ERGAN保留了更多的细节信息。

本发明可将低分辨率图像重建成原始图像的长度和宽度的四倍，并具有良好的视觉性能。实验结果表明，我们的方法在精度和视觉方面明显优于目前最先进的方法。在末来的工作中，我们可以进一步升级技术来训练我们的模型，来达到更好的视觉效果。

Claims

1.一种基于ERGAN网络单幅图像超分辨重建方法，其特征在于，包括以下步骤：

输入待重建图像I；

将处理成n*n大小的低分辨率图像

将低分辨率图像输入到生成器G中进行训练；

将生成器G输出的结果G(z)和一同输入到鉴别器D中；

将需要重建的图像再经过生成器G网络超分辨重建。

2.根据权利要求1所述的基于ERGAN网络单幅图像超分辨重建方法，其特征在于，所述将低分辨率图像输入到生成器G中进行训练，包括以下步骤：

用大小为3×3的卷积核对低分辨率图像做卷积处理；

对上一步骤输出的特征图进行残差处理；

对上一步骤输出的特征图用大小为3×3的卷积核做卷积处理；

对上一步骤输出的特征图进行残差处理；

残差单元对称跳跃连接；

经过两层子像素卷积，生成结果G(z)。

3.根据权利要求2所述的基于ERGAN网络单幅图像超分辨重建方法，其特征在于，所述卷积处理和残差处理循环16轮。

4.根据权利要求2所述的基于ERGAN网络单幅图像超分辨重建方法，其特征在于，所述残差单元对称跳跃连接具体为：从低层残差输出的结果连接到对应的高层的残差结果。

5.根据权利要求1所述的基于ERGAN网络单幅图像超分辨重建方法，其特征在于，所述将生成器G输出的结果G(z)和一同输入到鉴别器D中，包括以下步骤：

用大小为4*4的卷积核对图像做卷积处理；

将上一步得到的结果经过LeakyReLU激活函数；

经过降维处将数组返回一个折叠成一维的数组；

将上一步得到的结果进行非线性激活；

输出结果，判断图像是来自生成器还是图像块