WO2020063648A1

WO2020063648A1 - 生成对抗网络训练方法、图像处理方法、设备及存储介质

Info

Publication number: WO2020063648A1
Application number: PCT/CN2019/107761
Authority: WO
Inventors: 刘瀚文; 朱丹; 那彦波
Original assignee: 京东方科技集团股份有限公司
Priority date: 2018-09-30
Filing date: 2019-09-25
Publication date: 2020-04-02
Also published as: JP2022501661A; AU2019350918B2; JP7446997B2; JP2022501662A; US20210334642A1; WO2020062846A1; WO2020062957A1; JP7415251B2; RU2762144C1; BR112020022560A2; MX2020013580A; EP3859655A1; EP3857503A4; US11615505B2; US20210365744A1; US11449751B2; US11348005B2; US20210342976A1; JP2022501663A; KR102389173B1

Abstract

一种生成对抗网络的训练方法、图像处理方法、计算机设备和计算机可读存储介质，所述训练方法包括生成网络训练步骤，生成网络训练步骤包括：从第二分辨率样本图像中提取第一分辨率样本图像（S1）；分别将第一输入图像和第二输入图像提供给生成网络，以分别生成基于第一输入图像的第一输出图像和基于第二输入图像的第二输出图像（S2）；分别将第一输出图像和第二分辨率样本图像提供给鉴别网络，鉴别网络输出基于第一输出图像的第一鉴别结果和基于第二分辨率样本图像的第二鉴别结果（S3）；通过调整生成网络的参数以减小生成网络的损失函数（S4），从而得到所需要求的图像。

Description

生成对抗网络训练方法、图像处理方法、设备及存储介质

相关申请的交叉引用

本申请要求2018年9月30日提交中国知识产权局的、名称为“生成对抗网络训练方法、图像处理方法、设备及存储介质”的中国专利申请201811155930.9的优先权；本申请要求2018年9月30日提交中国知识产权局的、名称为“图像鉴别方法、鉴别器和计算机可读存储介质”的中国专利申请201811155326.6的优先权；本申请要求2018年9月30日提交中国知识产权局的、名称为“图像处理方法及系统、分辨率提升方法、可读存储介质”的中国专利申请201811155147.2的优先权；以及本申请要求2018年9月30日提交中国知识产权局的、名称为“训练图像的预处理方法及模块、鉴别器、可读存储介质”的中国专利申请201811155252.6的优先权，在此通过引用方式将该申请的公开内容并入本文。

技术领域

本公开涉及但不限于图像处理领域，具体涉及一种生成对抗网络的训练方法、利用所述训练方法得到的生成对抗网络的图像处理方法、计算机设备以及计算机可读存储介质。

背景技术

卷积神经网络是一种常见的深度学习网络，目前已被大量应用于图像处理领域，以实现图像识别、图像分类和图像超分辨率重构等。

在目前的超分辨率重构的方法中，基于第一分辨率图像而重构的第二分辨率图像(第二分辨率图像的分辨率大于第一分辨率图像的分辨率)往往缺少细节信息，导致第二分辨率图像看起来不真实。

发明内容

本公开旨在至少解决现有技术中存在的技术问题之一，提出了一种生成对抗网络的训练方法、利用所述训练方法得到的生成对抗网络的图像处理方法、计算机设备和计算机可读存储介质。

为了解决上述技术问题之一，本公开提供一种生成对抗网络的训练方法，所述生成对抗网络包括生成网络和鉴别网络，所述生成网络用于将第一分辨率图像转化为第二分辨率图像，第二分辨率图像的分辨率大于第一分辨率图像的分辨率，所述训练方法包括生成网络训练步骤，所述生成网络训练步骤包括：

从第二分辨率样本图像中提取第一分辨率样本图像，所述第二分辨率样本图像的分辨率高于所述第一分辨率样本图像的分辨率；

分别将第一输入图像和第二输入图像提供给生成网络，以分别生成基于第一输入图像的第一输出图像和基于第二输入图像的第二输出图像；其中，第一输入图像包括所述第一分辨率样本图像和第一幅度的噪声样本所对应的第一噪声图像；所述第二输入图像包括所述第一分辨率样本图像和第二幅度的噪声样本所对应的第二噪声图像；所述第一幅度大于0，所述第二幅度等于0；

分别将所述第一输出图像和所述第二分辨率样本图像提供给鉴别网络，所述鉴别网络输出基于所述第一输出图像的第一鉴别结果和基于所述第二分辨率样本图像的第二鉴别结果；

调整所述生成网络的参数以减小生成网络的损失函数；其中，所述生成网络的损失函数包括第一损失、第二损失和第三损失，所述损失函数的第一损失基于所述第二输出图像和所述第二分辨率样本图像之间的重构误差；所述损失函数的第二损失基于所述第一输出图像与所述第二分辨率样本图像之间的感知误差；所述损失函数的第三损失基于所述第一鉴别结果和第二鉴别结果。

可选地，根据所述第二输出图像与所述第二分辨率样本图像的差值图像矩阵的L1泛数、所述第二输出图像与所述第二分辨率样本图像之间的均方误差、所述第二输出图像与所述第二分辨率样本图像之间的结构相似性中的任意一者确定所述第二输出图像和所述第二分辨率样本图像之间的重构误差。

可选地，所述第一输出图像和所述第二输出图像均由所述生成网络通过分辨率提升步骤的迭代处理生成；所述生成网络的损失函数的第一损失为λ ₁L _rec(X，Y _n＝0)，其中：

其中，X为所述第二分辨率样本图像；

Y _n＝0为所述第二输出图像；

L _rec(X，Y _n＝0)为所述第二输出图像与所述第二分辨率样本图像之间的重构误差；

L为所述迭代处理中分辨率提升步骤的总次数；L≥1；

为所述生成网络基于所述第二输入图像进行的迭代处理中第l次分辨率提升步骤结束时生成的图像；l≤L；

LR为所述第一分辨率样本图像；

为对

进行下采样后得到的与第一分辨率样本图像分辨率相同的图像；

HR ^l为所述第二分辨率样本图像进行下采样后得到的与

分辨率相同的图像；

E[]为对矩阵能量的计算；以及

λ ₁为预设的权值。

可选地，所述生成网络的损失函数的第二损失为λ ₂L _per(X，Y _n＝1)，其中：

其中，Y _n＝1为所述第一输出图像；

L _per(X，Y _n＝1)为所述第一输出图像与所述第二分辨率样本图像之间的感知误差；

为所述生成网络基于所述第一输入图像进行的迭代处理中第l次分辨率提升步骤结束时生成的图像；

为对

进行下采样后得到的与第一分辨率样本图像的分辨率相同的图像；

L _CX()为感知损失计算函数；以及

λ ₂为预设的权值。

可选地，所述生成网络的损失函数的第三损失为λ ₃L _GAN(Y _n＝1)，其中，

其中，

为所述生成网络基于所述第一输入图像进行迭代处理时生成图像组，该图像组包括各次分辨率提升步骤结束时生成的图像；

HR ^1，2，...L为对第二分辨率样本图像进行下采样后得到的与

中各个图像一一对应的分辨率相同的图像；

为所述第一鉴别结果；

D(HR ^1，2，...L)为所述第二鉴别结果；以及

λ ₃为预设的权值。

可选地，λ ₁：λ ₂：λ ₃＝10：0.1：0.001。

可选地，所述噪声样本为随机噪声。可选地，所述训练方法还包括鉴别网络训练步骤，该鉴别网络训练步骤包括：将所述第一输出图像和所述第二分辨率样本图像分别提供给所述鉴别网络，使所述鉴别网络分别输出基于所述第一输出图像的鉴别结果和基于所述第二分辨率样本图像的鉴别结果；并通过调整所述鉴别网络的参数，以减小所述鉴别网络的损失函数；

所述鉴别网络训练步骤与所述生成网络训练步骤交替进行，直至达到预设训练条件。

可选地，所述第一输出图像和所述第二输出图像均由所述生成网络通过分辨率提升步骤的迭代处理生成，所述迭代处理中的分辨率提升步骤的总次数为L；当L大于1时，所述生成网络基于第一输入图像进行迭代处理中的前L-1次分辨率提升步骤中，每进行一次分辨率提升，生成网络均生成一个中间图像。

在所述鉴别网络训练步骤中，将所述第一输出图像提供给所述鉴别网络的同时，还将生成网络基于所述第一输入图像生成的各个中间图像提供给生成网络；将所述第二分辨率样本图像提供给所述鉴别网络的同时，还将对所述第二分辨率样本图像进行下采样后得到的与各个中间图像一一对应的分辨率相同的第三分辨率样本图像提供给所述鉴别网络。

相应地，本公开还提供一种利用上述训练方法得到的生成对抗网络中的生成网络的图像处理方法，所述图像处理方法用于提升图像的分辨率，所述图像处理方法包括：

将输入图像和参考噪声所对应的噪声图像提供给所述生成网络，以使所述生成网络生成基于所述输入图像的第二分辨率图像。

可选地，所述参考噪声的幅度在0到所述第一幅度之间。

可选地，所述参考噪声为随机噪声。

相应地，本公开还提供一种计算机设备，包括存储器和处理器，所述存储器上存储有计算机程序，所述计算机程序被所述处理器执行时实现上述训练方法。

相应地，本公开还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述训练方法。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1为重构失真和感知失真之间的关系示意图；

图2为本公开实施例中的生成网络训练步骤的流程图。

图3为本公开实施例中的生成网络的结构示意图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。

图像超分辨率重构是对初始图像进行分辨率提升，以获得更高分辨率的图像的技术。在图像超分辨率重构中，重构失真和感知失真用来评估超分辨率的重构效果。重构失真用来衡量重构图像和参考图像之间的差异程度，具体评价标准包括均方误差(MSE)、相似度(SSIM)、峰值信噪比(PSNR)等；感知失真更关注于使图像看起来和自然图像更像。图1为重构失真和感知失真之间的关系示意图。如图1所示，当重构失真较小时，则感知失真较大。此时，重构图像看起来更平滑而缺少细节。当感知失真较小时，重构失真较大。此时，重构图像的细节更丰富。目前的图像超分辨率重构方法往往追求较小的重构失真，但是，在一些应用场景下，人们往往更希望获得细节丰富的重构图像。

本公开提供一种生成对抗网络的训练方法，生成对抗网络包括生成网络和鉴别网络，生成网络用于将第一分辨率图像转化为第二分辨率图像，以获得目标分辨率的第二分辨率图像，第二分辨率图像的分辨率大于第一分辨率图像的分辨率。生成网络可以通过分辨率提升步骤的一次处理或多次迭代处理来获得第二分辨率图像。以待处理图像(即第一分辨率图像)的分辨率为128*128、目标分辨率为1024*1024为例，生成网络可以通过一次提升倍数为8倍的分辨率提升步骤来获得1024*1024的第二分辨率图像；也可以通过提升倍数为2倍的分辨率提升步骤进行三次迭代处理来依次获得分辨率为256*256、512*512、1024*1024的图像。

生成对抗网络的训练方法包括生成网络训练步骤。图2为本公开实施例中的生成网络训练步骤的流程图。如图2所示，生成网络训练步骤包括：

S1、从第二分辨率样本图像中提取第一分辨率样本图像，第二分辨率样本图像的分辨率高于第一分辨率样本图像的分辨率。具体地，第一分辨率样本图像可以通过对第二分辨率样本图像进行下采样后得到。

S2、分别将第一输入图像和第二输入图像提供给生成网络，以分别生成基于第一输入图像的第一输出图像和基于第二输入图像的第二输出图像；其中，第一输入图像包括第一分辨率样本图像和第一幅度的噪声样本所对应的第一噪声图像；第二输入图像包括第一分辨率样本图像和第二幅度的噪声样本所对应的第二噪声图像。第一幅度大于0，第二幅度等于0。

其中，噪声样本的幅度为噪声样本的平均波动幅度。例如，噪声样本为随机噪声，噪声样本所对应的图像均值为μ，方差为σ，即，噪声样本所对应的图像中各像素值大部分在μ-σ～μ+σ之间波动；此时，噪声幅度为μ。可以理解的是，在图像处理过程中，图像均以矩阵表示，上述像素值则表示图像矩阵中的元素值。而当噪声样本的幅度为0时，由于图像矩阵中的各元素的值不小于0，则可以看作图像矩阵的各元素值均为0。

另外需要说明的是，在生成对抗网络的训练方法中有多个生成网络训练步骤；在同一个生成网络训练步骤中，第一分辨率样本图像为同一个，且接收第一输入图像和第二输入图像的生成网络的模型参数是相同的。

S3、分别将第一输出图像和第二分辨率样本图像提供给鉴别网络，鉴别网络输出基于第一输出图像的第一鉴别结果和基于第二分辨率样本图像的第二鉴别结果。第一鉴别结果用于表征第一输出图像与第二分辨率样本图像之间的匹配度，例如，第一鉴别结果用于表征鉴别网络判断第一输出图像为第二分辨率样本图像的概率；第二鉴别结果用于表征鉴别网络判断第二分辨率样品图像确实为第二分辨率样本图像的概率。

这里，鉴别网络可以看作具有打分功能的分类器。该鉴别网络可以对接收到的待鉴别图像进行打分，输出的分数则表示待鉴别图像(第一输出图像)为第二分辨率样本图像的概率，即，上述匹配度，其中，匹配度可以在0～1之间。当鉴别网络的输出为0或接近0时，表示鉴别网络将其接收到的待鉴别图像分类为非高分辨样本图像；当鉴别网络的输出为1或接近1时，表示其接收到的待鉴别图像为第二分辨率样本图像。

鉴别网络的打分功能可以利用预先确定分数的“真”样本和“假”样本进行训练。例如，“假”样本为生成网络生成的图像，“真”样本为第二分辨率样本图像。鉴别网络的训练过程即：通过调整鉴别网络的参数，使得鉴别网络接收到“真”样本时输出接近1的分数；接收到“假”样本时输出接近0的分数。

S4、通过调整生成网络的参数以减小生成网络的损失函数。所谓“减小生成网络的损失函数”是指，损失函数的值相对于上一次生成网络训练步骤中是减小的，或者，多次生成网络训练步骤中，损失函数的值整体上呈减小的趋势。这里，生成网络的损失函数包括第一损失、第二损失和第三损失；具体的，损失函数是第一损失、第二损失和第三损失的叠加，其中，第一损失为基于第二输出图像和第二分辨率样本图像之间的重构误差；第二损失为基于第一输出图像与第二分辨率样本图像之间的感知误差；第三损失基于第一鉴别结果和第二鉴别结果。

在进行超分辨率重构时，重构的第二分辨率图像中细节特征(例如，毛发、线条等)往往会和噪声有关。当生成网络的训练中不加入噪声时，生成网络所生成的第二分辨率图像的重构失真较小，感知失真较大，肉眼看起来不够真实；当生成网络的训练中加入噪声时，重构的第二分辨率图像中的细节特征会比较明显，但是重构失真较大。而本公开中在生成网络的训练中，分别将包括幅度为0的噪声图像的第二输入图像和包括幅度为1的噪声图像的第一输入图像提供给了生成网络进行训练，且损失函数的第一损失反映了生成网络生成结果的重构失真，第二损失反映了生成网络生成结果的感知失真，即，损失函数结合了两种失真评价标准，在利用训练好的生成网络来对图像进行分辨率提升时，可以根据实际需要(即，是否需要获得突出图像的细节以及突出程度)，来调节输入噪声的幅度，从而使重构的图像满足实际需求。例如，在给定重构失真范围的情况下，通过调节输入噪声的幅度，以达到最小的感知失真；或者在给定感知失真范围的情况下，通过调节输入噪声的幅度，以达到最小的重构失真。

需要说明的是，本实施例中所说的第一输入图像的噪声图像的幅度为1，是指对噪声图像的幅度进行归一化之后得到的幅度值。在本申请的其他实施例中，也可不对噪声图像的幅度进行归一化，则第一输入图像的噪声图像的幅度值也可以为其他不为1的值。

可选地，噪声样本为随机噪声；第一噪声图像的均值为1。可选地，第一噪声图像的均值为：第一噪声图像的归一化图像的均值。例如，第一噪声图像为灰度图像，则对第一噪声图像进行归一化得到的图像中，各像素值的平均值即为第一噪声图像的均值；又例如，第一噪声图像为彩色图像，则对第一噪声图像各通道进行归一化后得到的图像中，各像素值的平均值即为第一噪声图像的均值。需要说明的是本公开实施例的图像的通道是对一副图像划分为一个或多个通道进行处理，例如一副RGB模式彩色图像，可以分为红、绿、蓝三个通道；如果是灰度图，就是一个通道的图像；如果是以HSV色系划分彩色图像指的是色调H，饱和度S，亮度V三个通道。

可选地，生成网络的损失函数如以下公式所示：

Loss＝λ ₁L _rec(X，Y _n＝0)+λ ₂L _per(X，Y _n＝1)+λ ₃L _GAN(Y _n＝1)

其中，损失函数Loss的第一损失λ ₁L _rec(X，Y _n＝0)中，L _rec(X，Y _n＝0)为第二输出图像和第二分辨率样本图像之间的重构误差。损失函数Loss的第二损失λ ₂L _per(X，Y _n＝1)中，L _per(X，Y _n＝1)为第二输出图像与第二分辨率样本图像之间的感知误差。损失函数Loss的第三损失λ ₂L _per(X，Y _n＝1)中，λ ₃L _GAN(Y _n＝1)为第一鉴别结果和第二鉴别结果之和。λ ₁、λ ₂、λ ₃均为预设的权值。例如，λ ₁：λ ₂：λ ₃＝10：0.1：0.001，或者，λ ₁：λ ₂：λ ₃＝1：1：0.5等，可根据实际需求进行调整。在一些实施例中，可以根据局部图像的连续性设置λ ₁：λ ₂：λ ₃。在一些实施例中，可以根据图像中的目标像素设置λ ₁：λ ₂：λ ₃。

具体地，第二输出图像Y _n＝0与第二分辨率样本图像X之间的重构误差L _rec(X，Y _n＝0)根据以下公式计算：

其中，第一输出图像和第二输出图像均由生成网络通过分辨率提升步骤的迭代处理生成；迭代处理中的分辨率提升步骤的总次数为L，L≥1。

为生成网络基于第二输入图像进行的迭代处理中第l次分辨率提升步骤结束时生成的图像；l≤L。可以理解的是，当l＝L时，生成网络即生成第二输出图像Y _n＝0。

LR为第一分辨率样本图像；

为对

进行下采样后得到的与第一分辨率样本图像分辨率相同的图像。下采样方式可以与步骤S1中从第二分辨率样本图像中获取第一分辨率样本图像的方式相同。

HR ^l为第二分辨率样本图像进行下采样后得到的与

分辨率相同的图像。在此需要注意的是，当l＝L时，

即为第二输出图像Y _n＝0，此时，HR ^l即为第二分辨率样本图像本身，也可以看作对第二分辨率样本图像进行倍率为1的下采样后得到的图像。

E[]为对矩阵能量的计算。例如，E[]可以为计算“[]”中的矩阵中元素的最大值或平均值。

对于生成网络迭代多次分辨率提升步骤的情况，在计算重构误差时，不仅仅计算第二输出图像本身与第二分辨率样本图像之间的差值图像矩阵的L1泛数，而且还累加了生成网络生成的第三分辨率图像(即，

)与相同分辨率的第三分辨率样本图像(即，HR ¹、HR ²、…HR ^L-1)之间的差值图像矩阵的L1泛数。同时，还累加了第三分辨率图像、第二输出图像下采样的图像与第一分辨率样本图像之间的差值图像的L1泛数，从而在利用生成网络进行分辨率提升时，当输入幅度为零的噪声时，生成网络最终输出的图像能够达到尽量小的重构失真。需要说明的是第三分辨率图像的分辨率大于第一分辨率样本图像的分辨率，第三分辨率图像的分辨率和第三分辨率样本图像的分辨率相同。

上述实施例中，第二输出图像和第二分辨率样本图像之间的重构误差L _rec(X，Y _n＝0)是基于第二输出图像与第二分辨率样本图像的差值图像矩阵的L1泛数得到的，当然，也可以基于第二输出图像与第二分辨率样本图像之间的均方误差(MSE)得到重构误差，或者基于第二输出图像与第二分辨率样本图像之间的结构相似性(SSIM)得到重构误差。

可选地，第一输出图像Y _n＝1与第二分辨率样本图像X之间的感知误差L _per(X，Y _n＝1)根据以下公式计算：

为生成网络基于第一输入图像进行的迭代处理中第l次分辨率提升步骤结束时生成的图像；l≤L。可以理解的是，当l＝L时，生成网络即生成第一输出图像Y _n＝1。

为对

进行下采样后得到的与第一分辨率样本图像LR分辨率相同的图像。下采样方式可以与步骤S1中从第二分辨率样本图像中获取第一分辨率样本图像的方式相同。HR ^l、E[]的含义参见上文中描述，这里不再赘述。

L _CX()为感知损失(Contextual Loss)计算函数。

与计算重构误差类似地，感知误差的计算不仅利用感知损失函数计算了第一输出图像与第二分辨率样本图像的差异，还累加计算了：生成网络基于第一输入图像生成的第三分辨率图像(即，

)与相同分辨率的第三分辨率样本图像(即，HR ¹、HR ²、…HR ^L-1)之间的差异。同时，还累加了第三分辨率图像、第二输出图像下采样的图像与第一分辨率样本图像之间的差异，从而在利用生成网络进行分辨率提升时，当输入幅度为第一幅度的噪声时，生成网络最终输出的图像能够达到尽量小的感知失真。

可选地，生成网络的损失函数的第三损失中的L _GAN(Y _n＝1)根据以下公式计算：

其中，

为生成网络基于第一输入图像进行迭代处理时生成图像组，该图像组中包括各次分辨率提升步骤结束时生成的图像。当L＝1时，该图像组中仅包括上述第一输出图像；当L＞1时，该图像组中包括上述

至

以及第一输出图像Y _n＝1。

HR ^1，2，...L为对第二分辨率样本图像进行下采样后得到的与

中各个图像的分辨率一一对应的相同的图像。其中，HR ^L即为第二分辨率样本图像本身。

为鉴别网络基于

的鉴别结果，即，第一鉴别结果；D(HR ^1，2，...L)为鉴别网络基于HR ^1，2，...L的鉴别结果，即，第二鉴别结果。

在本公开的训练方法中，除了上述生成网络的训练步骤外，还包括鉴别网络训练步骤，鉴别网络训练步骤包括：将第一输出图像和第二分辨率样本图像分别提供给鉴别网络，使鉴别网络分别输出基于第一输出图像的鉴别结果和基于第二分辨率样本图像的鉴别结果；并通过调整鉴别网络的参数，以减小鉴别网络的损失函数。

鉴别网络训练步骤与生成网络训练步骤交替进行，直至达到预设训练条件。该预设训练条件例如可以为交替次数达到预定值。

其中，在初始化时，生成网络和鉴别网络的参数是设定的或随机的。

如上文中所述，第一输出图像和第二输出图像均由生成网络通过分辨率提升步骤的迭代处理生成，迭代总次数为L次。当L＝1时，每次向鉴别网络提供图像时，可以只将第一输出图像或第二分辨率样本图像提供给鉴别网络。当L＞1时，生成网络基于第一输入图像进行的前L-1次分辨率提升步骤中，每进行一次分辨率提升，生成网络均生成一个中间图像；迭代第L次时，生成网络生成的图像即为第一输出图像。此时，鉴别网络配置为具有多个输入端，以同时接收多个图像，并根据接收到的多个图像确定其中分辨率最高的一者与第二分辨率样本图像之间的匹配度。而在鉴别网络训练步骤中，将第一输出图像提供给鉴别网络的同时，还将生成网络基于第一输入图像生成的各个中间图像提供给鉴别网络；将第二分辨率样本图像提供给鉴别网络的同时，还将对第二分辨率样本图像进行下采样后得到的与各个中间图像一一对应的且分辨率相同的第三分辨率样本图像提供给鉴别网络。

在生成网络的训练过程中，通过调整生成网络的参数，以使生成网络的输出结果输入鉴别网络后，鉴别网络输出尽量接近1的匹配度，以作为鉴别结果，即，使鉴别网络认为生成网络的输出结果为第二分辨率样本图像。在鉴别网络的训练过程中，通过调整鉴别网络的参数，以使得第二分辨率样本图像输入鉴别网络后，鉴别网络输出尽量接近1的匹配度，且在生成网络的输出结果输入鉴别网络后，鉴别网络输出尽量接近0的匹配度；即，鉴别网络通过训练能够判断出其接收到的图像是否是第二分辨率样本图像。通过生成网络和鉴别网络的交替训练，使得鉴别网络不断优化，以提高鉴别能力；而生成网络不断优化，以使输出结果尽可能接近第二分辨率样本图像。这种方法使得两个相互“对抗”的模型在每次训练中基于另一模型越来越好的结果而进行竞争和不断改进，以得到越来越优的生成对抗网络模型。

本公开还提供一种利用如上述训练方法得到的生成对抗网络的图像处理方法，该图像处理方法用于利用生成对抗网络中的生成网络提升图像的分辨率，图像处理方法包括：将输入图像和参考噪声所对应的噪声图像提供给生成网络，以使生成网络生成比输入图像的分辨率更高的图像。其中，参考噪声的幅度在0到第一幅度之间。具体地，参考噪声为随机噪声。

本公开在训练生成对抗网络中的生成网络时，分别给生成网络提供了幅度为零的噪声样本和第一幅度的噪声样本，并且，生成网络的损失函数结合了重构失真和感知失真两种失真评价标准，那么，在利用生成网络对图像进行分辨率提升时，则可以根据实际需要来调节参考噪声的幅度，从而满足实际需求。例如，在给定重构失真范围的情况下，通过调节参考噪声的幅度，以达到最小的感知失真；或者在给定感知失真范围的情况下，通过调节参考噪声的幅度，以达到最小的重构失真。

图3为本公开实施例中的生成网络的结构示意图。下面结合图3对生成网络进行介绍。生成网络用于进行分辨率提升的迭代处理，每次分辨率提升过程将待处理图像I _l-1的分辨率进行提升，以得到分辨率提升后的图像I _l。当分辨率提升的总迭代次数为1时，待处理图像I _l-1即为初始的输入图像；当分辨率提升的总迭代次数为L次，且L>1 时，则待处理图像I _l-1为对初始的输入图像进行l-1次分辨率提升后的输出图像。下面以初始的输入图像的分辨率为128*128、每次分辨率提升倍数为2、l＝2为例对生成网络进行介绍。此时，图中的待处理图像I _l-1则为经过一次分辨率提升后得到的256*256的图像。

如图3所示，生成网络包括第一分析模块11、第二分析模块12、第一联接模块21、第二联接模块22、插值模块31、第一上采样模块41、第一下采样模块51、叠加模块70和迭代的残差校正系统。

第一分析模块11被构造成生成待处理图像I _l-1的特征图像R ^μ _l-1，该特征图像R ^μ _l-1的通道数大于待处理图像I _l-1的通道数。

第一联接模块21被构造成将待处理图像的特征图像R ^μ _l-1与噪声图像noise联接(concatenate)，得到第一合并图像RC ^μ _l-1；该第一合并图像RC ^μ _l-1的通道数为特征图像R ^μ _l-1的通道数与噪声图像noise的通道数之和。

在此需要注意的是，噪声图像noise的分辨率与待处理图像I _l-1的分辨率相同。因此，当生成网络执行分辨率提升的迭代总次数为多次时，在生成网络的训练步骤中，向生成网络提供的第一输入图像和第二输入图像均可以包括第一分辨率样本图像和多个不同分辨率的噪声样本图像；或者，第一输入图像和第二输入图像均包括第一分辨率样本图像和一个噪声样本图像，当迭代至第l次时，生成网络根据噪声样本的幅度生成所需倍数的噪声样本图像。

插值模块31被构造成对待处理图像I _l-1进行插值，得到基于待处理图像I _l-1的第四分辨率图像，该第四分辨率图像的分辨率为512*512。插值模块可以采样双三次插值(bicubic)等传统插值方法进行插值。所述第四分辨率图像的分辨率大于所述待处理图像I _l-1的分辨率。

第二分析模块12被构造成生成第四分辨率图像的特征图像，该特征图像的通道数大于第四分辨率图像的通道数。

第一下采样模块51被构造成对第四分辨率图像的特征图像进行下采样，以获得第一下采样特征图像。该下采样特征图像的分辨率为256*256。

第二联接模块22被构造成将第一合并图像RC ^μ _l-1与第一下采样特征图像联接，得到第二合并图像。

第一上采样模块41被构造成对第二合并图像进行上采样，得到第一上采样特征图像R _l ⁰。

迭代的残差校正系统用于通过反向投影(back-projection)对第一上采样特征图像进行至少一次残差校正，得到经过残差修正的特征图像。

其中，迭代残差校正系统包括第二下采样模块52、第二上采样模块42和残差确定模块60。第二下采样模块52被构造成对其接收到的图像进行2倍的下采样，第二上采样模块42被构造成对其接收到的图像进行2倍的上采样；残差确定模块60被构造成对确定其接收到的两个图像之间的差值图像。

在第一次残差校正时，第一上采样特征图像R _l ⁰经过第一个第二下采样模块52的2倍下采样后，得到特征图像R _l ⁰¹；该特征图像R _l ⁰¹经过第二个第二下采样模块的2倍下采样后，得到与初始输入图像分辨率相同的特征图像R _l ⁰²；之后，利用一个残差确定模块获取特征图像R _l ⁰²与第一次分辨率提升步骤中的第一合并图像RC ^μ ₀(即，原始输入图像的特征图像与噪声图像合并后的第一合并图像RC ^μ ₀)之间的差值图像；然后利用第二上采样模块对该差值图像进行上采样，并利用叠加模块70将上采样后得到的特征图像与特征图像R ⁰¹ _l叠加，得到与第一合并图像R ¹ _l-1分辨率相同的特征图像R ⁰³ _l；之后，利用另一个残差确定模块得到特征图像R ⁰³ _l与第一合并图像RC ^μ _l-1之间的差值图像；并利用第二上采样模块42对该差值图像进行2倍的上采样，上采样后的图像与第一上采样特征图像R _l ⁰叠加，得到经过第一次残像校正后的特征图像R _l ¹。

之后可以通过同样的过程对特征图像R _l ¹进行第2次残差校正，得到经过第二次残差校正后的特征图像R _l ²；还可以再通过同样的过程对特征图像R _l ²进行第3次残像校正，以此类推。图中μ表示残差校正的次数。

生成网络还包括合成模块80，该合成模块80被构造成对经过多次残差校正后得到的特征图像R _l ^μ进行合成，以得到与第四分辨率图像通道数相同的第五分辨率图像；该第五分辨率图像和第四分辨率图像叠加，得到第l次分辨率提升后的输出图像I _l。第五分辨率图像的分辨率与第四分辨率图像的分辨率相同。

在生成网络中，第一分析模块11、第二分析模块12、第一上采样模块41、第二上采样模块42、第一下采样模块51、第二下采样模块52和合成模块80均可以通过各模块均可以卷积层来实现相应的功能。

上述是以l＝2为例，对迭代处理中的第二次分辨率提升过程进行了介绍，其他次分辨率提升过程与上述过程类似，这里不再详细说明。

本公开还提供一种计算机设备，包括存储器和处理器，所述存储器上存储有计算机程序，所述计算机程序被所述处理器执行时实现上述生成对抗网络的训练方法。

本公开还提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述生成对抗网络的训练方法。

上述存储器和所述计算机可读存储介质包括但不限于以下可读介质：诸如随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除PROM(EEPROM)、闪存、磁或光数据存储、寄存器、磁盘或磁带、诸如光盘(CD)或DVD(数字通用盘)的光存储介质以及其它非暂时性介质。处理器的示例包括但不限于通用处理器、中央处理单元(CPU)、微处理器、数字信号处理器(DSP)、控制器、微控制器、状态机等。

可以理解的是，以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式，然而本公开并不局限于此。对于本领域内的普通技术人员而言，在不脱离本公开的精神和实质的情况下，可以做出各种变型和改进，这些变型和改进也视为本公开的保护范围。

Claims

一种生成对抗网络的训练方法，所述生成对抗网络包括生成网络和鉴别网络，所述生成网络用于将第一分辨率图像转化为第二分辨率图像，第二分辨率图像的分辨率大于第一分辨率图像的分辨率，所述训练方法包括生成网络训练步骤，其中，所述生成网络训练步骤包括：

从第二分辨率样本图像中提取第一分辨率样本图像，所述第二分辨率样本图像的分辨率高于所述第一分辨率样本图像的分辨率；

分别将第一输入图像和第二输入图像提供给所述生成网络，以分别生成基于第一输入图像的第一输出图像和基于第二输入图像的第二输出图像；其中，第一输入图像包括所述第一分辨率样本图像和第一幅度的噪声样本所对应的第一噪声图像；所述第二输入图像包括所述第一分辨率样本图像和第二幅度的噪声样本所对应的第二噪声图像；所述第一幅度大于0，所述第二幅度等于0；

分别将所述第一输出图像和所述第二分辨率样本图像提供给鉴别网络，所述鉴别网络输出基于所述第一输出图像的第一鉴别结果和基于所述第二分辨率样本图像的第二鉴别结果；

调整所述生成网络的参数以减小生成网络的损失函数，其中，所述生成网络的损失函数包括第一损失、第二损失和第三损失，所述第一损失基于所述第二输出图像和所述第二分辨率样本图像之间的重构误差；所述第二损失基于所述第一输出图像与所述第二分辨率样本图像之间的感知误差；所述第三损失基于所述第一鉴别结果和第二鉴别结果。
根据权利要求1所述的训练方法，其中，根据所述第二输出图像与所述第二分辨率样本图像的差值图像矩阵的L1泛数、所述第二输出图像与所述第二分辨率样本图像之间的均方误差、所述第二输出图像与所述第二分辨率样本图像之间的结构相似性中的任意一者确定所述第二输出图像和所述第二分辨率样本图像之间的重构误差。
根据权利要求1所述的训练方法，其中，所述第一输出图像和所述第二输出图像均由所述生成网络通过分辨率提升步骤的迭代处理生成，所述生成网络的损失函数的第一损失为λ ₁L _rec(X，Y _n＝0)，其中：

其中，X为所述第二分辨率样本图像；

Y _n＝0为所述第二输出图像；

L _rec(X，Y _n＝0)为所述第二输出图像与所述第二分辨率样本图像之间的重构误差；

L为所述迭代处理中分辨率提升步骤的总次数，L≥1；

为所述生成网络基于所述第二输入图像进行的迭代处理中第l次分辨率提升步骤结束时生成的图像，l≤L；

LR为所述第一分辨率样本图像；

为对
进行下采样后得到的与第一分辨率样本图像分辨率相同的图像；

HR ^l为所述第二分辨率样本图像进行下采样后得到的与
分辨率相同的图像；

E[]为对矩阵能量的计算；以及

λ ₁为预设的权值。
根据权利要求3所述的训练方法，其中，所述生成网络的损失函数的第二损失为λ ₂L _per(X，Y _n＝1)，其中：

其中，Y _n＝1为所述第一输出图像；

L _per(X，Y _n＝1)为所述第一输出图像与所述第二分辨率样本图像之间的感知误差；

为所述生成网络基于所述第一输入图像进行的迭代处理中第 l次分辨率提升步骤结束时生成的图像；

为对
进行下采样后得到的与第一分辨率样本图像分辨率相同的图像；

L _CX()为感知损失计算函数；以及

λ ₂为预设的权值。
根据权利要求4所述的训练方法，其中，所述生成网络的损失函数的第三损失为λ ₃L _GAN(Y _n＝1)，其中，

其中，
为所述生成网络基于所述第一输入图像进行迭代处理时生成图像组，该图像组包括各次分辨率提升步骤结束时生成的图像；

HR ^1，2，...L为对第二分辨率样本图像进行下采样后得到的与
中各个图像一一对应的分辨率相同的图像；

为所述第一鉴别结果；D(HR ^1，2，...L)为所述第二鉴别结果；以及

λ ₃为预设的权值。
根据权利要求5所述的训练方法，其中，λ ₁：λ ₂：λ ₃＝10：0.1：0.001。
根据权利要求1所述的训练方法，其中，所述噪声样本为随机噪声。
根据权利要求1所述的训练方法，其中，

所述训练方法还包括鉴别网络训练步骤，该鉴别网络训练步骤包括：将所述第一输出图像和所述第二分辨率样本图像分别提供给所述鉴别网络，使所述鉴别网络分别输出基于所述第一输出图像的鉴别结果和基于所述第二分辨率样本图像的鉴别结果；并通过调整所述鉴别网络的参数，以减小所述鉴别网络的损失函数；

所述鉴别网络训练步骤与所述生成网络训练步骤交替进行，直至达到预设训练条件。
根据权利要求8所述的训练方法，其中，

所述第一输出图像和所述第二输出图像均由所述生成网络通过分辨率提升步骤的迭代处理生成，所述迭代处理中的分辨率提升步骤的总次数为L；当L大于1时，所述生成网络基于第一输入图像进行迭代处理中的前L-1次分辨率提升步骤中，每进行一次分辨率提升，生成网络均生成一个中间图像；

在所述鉴别网络训练步骤中，将所述第一输出图像提供给所述鉴别网络的同时，还将生成网络基于所述第一输入图像生成的各个中间图像提供给生成网络；将所述第二分辨率样本图像提供给所述鉴别网络的同时，还将对所述第二分辨率样本图像进行下采样后得到的与各个中间图像一一对应的分辨率相同的第三分辨率样本图像提供给所述鉴别网络。
一种利用如权利要求1至9中任意一项的训练方法得到的生成对抗网络中的生成网络的图像处理方法，其中，所述图像处理方法用于提升图像的分辨率，所述图像处理方法包括：

将输入图像和参考噪声所对应的噪声图像提供给所述生成网络，以使所述生成网络生成基于所述输入图像的第二分辨率图像。
根据权利要求10所述的图像处理方法，其中，所述参考噪声的幅度在0到所述第一幅度之间。
根据权利要求10所述的图像处理方法，其中，所述参考噪声为随机噪声。
一种计算机设备，包括存储器和处理器，所述存储器上存储有计算机程序，其中，所述计算机程序被所述处理器执行时实现权利要求1至9中任意一项所述的训练方法。
一种计算机可读存储介质，其上存储有计算机程序，其中，该计算机程序被处理器执行时实现权利要求1至9中任意一项所述的训练方法。