CN109255769A

CN109255769A - 图像增强网络的训练方法和训练模型、及图像增强方法

Info

Publication number: CN109255769A
Application number: CN201811252613.9A
Authority: CN
Inventors: 周铭柯; 李志阳; 张伟; 李启东; 许清泉
Original assignee: Xiamen Meitu Technology Co Ltd
Current assignee: Xiamen Meitu Technology Co Ltd
Priority date: 2018-10-25
Filing date: 2018-10-25
Publication date: 2019-01-22

Abstract

本发明公开了图像增强网络的训练方法和训练模型、及图像增强方法。其中，图像增强网络的训练方法包括步骤：获取多个训练图像对；将训练图像对中的第一图像输入到预训练的图像生成网络，经多次卷积处理后输出图像，并按照第一损失函数计算输出图像相对于训练图像对中对应第二图像的第一损失值；将输出图像输入到预训练的图像判别网络，经多次卷积处理后输出判别值，并按照第二损失函数计算该判别值相对于预设标签值的第二损失值；结合第一、第二损失值来更新图像生成网络和图像判别网络的网络参数，直到第一损失值和第二损失值的总和满足预定条件时，训练结束，得到训练后的图像生成网络，作为训练好的图像增强网络。

Description

图像增强网络的训练方法和训练模型、及图像增强方法

技术领域

本发明涉及图像处理技术领域，尤其涉及图像增强网络的训练方法和训练模型、及图像增强方法。

背景技术

随着互联网技术的发展，人们越来越依赖于通过网络快速地获取信息，诸如图片、视频等。然而，通过互联网传播的大量图片，其视觉效果一般，互联网用户经常很难找到内容好且图像色彩也好的图片。另一方面，移动终端(例如手机、平板电脑等)也成了人们常用的拍照设备，但移动终端拍出来的照片很难满足更高的视觉需求。基于这两点的考虑，通过图像增强方法提升图像的视觉效果具有广泛的应用场景。

传统的图像增强算法通常通过固定的参数值来调整图像各通道的像素值，以改善图像的清晰度、饱和度和对比度。但这类方法效果单一，容易出现调整效果不自然、色块等问题。卷积神经网络(CNN，Convolutional Neural Network)的发展为图像处理带来了新思路，其增强效果在某些方面优于传统算法，但是，基于CNN的算法容易出现过渡不自然、色偏等问题。

因此，需要一种能克服上述缺点的图像增强方案。

发明内容

为此，本发明提供了图像增强网络的训练方法和训练模型、及图像增强方法，以力图解决或至少缓解上面存在的至少一个问题。

根据本发明的一个方面，提供了一种图像增强网络的训练方法，训练方法适于在计算设备中执行，包括步骤：获取多个训练图像对，每一个训练图像对中包括作为训练样本的第一图像和作为目标样本的第二图像；将训练图像对中的第一图像输入到预训练的图像生成网络，经多次卷积处理后输出图像，并按照第一损失函数计算输出图像相对于训练图像对中对应第二图像的第一损失值；将输出图像输入到预训练的图像判别网络，经多次卷积处理后输出判别值，并按照第二损失函数计算该判别值相对于预设标签值的第二损失值；以及结合第一损失值和第二损失值来更新图像生成网络和图像判别网络的网络参数，直到所述第一损失值和第二损失值的总和满足预定条件时，训练结束，得到训练后的图像生成网络，作为训练好的图像增强网络。

可选地，在根据本发明的训练方法中，获取多个训练图像对的步骤还包括：采集训练样本，并对采集到的每个训练样本进行调整处理后生成对应的目标样本；分别从训练样本和其对应的目标样本的相同位置处截取出预定尺寸的子图像，并形成一个训练图像对，其中，从训练样本中截取出的子图像作为训练图像对中的第一图像，从其对应的目标样本中截取出的子图像作为训练图像对中的第二图像。

可选地，在根据本发明的训练方法中，按照第一损失函数计算输出图像相对于训练图像对中对应第二图像的第一损失值的步骤包括：对输出图像和对应的第二图像分别进行模糊处理，得到模糊后的输出图像和模糊后的第二图像；计算模糊后的输出图像和模糊后的第二图像中对应像素点的像素距离值，作为颜色损失；将输出图像与对应的第二图像分别输入预设卷积网络来生成各自的特征图；计算输出图像的特征图与第二图像的特征图中对应像素点的像素距离值，作为纹理损失；以及根据颜色损失和纹理损失计算出第一损失值。

可选地，在根据本发明的训练方法中，按照第二损失函数计算该判别值相对于预设标签值的第二损失值的步骤包括：根据判别值生成两个对数运算值；利用预设标签值生成两个系数；根据两个系数和两个对数运算值计算出第二损失值。

可选地，在根据本发明的训练方法中，图像生成网络包括依次相连的多个第一处理块和一个结果处理块，其中，每个第一处理块包括依次相连的至少两个卷积激活层和一个跳跃连接层，跳跃连接层适于将其所属的第一处理块的第一个卷积激活层的输入与最后一个卷积激活层的输出相加；结果处理块包括多个卷积激活层；以及在第一个第一处理块之前，还包括一个卷积激活层。

可选地，在根据本发明的训练方法中，第一处理块的个数为4，且各第一处理块中的卷积激活层的激活函数为ReLU函数；结果处理块包括三个卷积激活层，其中，前两个卷积激活层的激活函数为ReLU函数，第三个卷积激活层的激活函数为Tanh函数。

可选地，在根据本发明的训练方法中，图像判别网络包括依次相连的一个缩放层、一个卷积激活层、多个第二处理块和两个全连接处理块，其中，第二处理块包括依次相连的卷积层、批标准化层和激活层。

根据本发明的一个方面，提供了一种图像增强网络的训练模型，训练模型适于训练生成图像增强网络来对待处理的图像进行增强处理，训练模型包括：图像生成网络，适于对输入的训练样本进行多层卷积处理，以生成与输入的训练样本具有相同尺寸的输出图像，训练样本具有对应的目标样本；图像判别网络，与图像生成网络相耦接，适于对输出图像进行多层卷积处理，以生成判断所述输出图像达到增强目标的判别值；其中，图像生成网络和图像判别网络的网络参数根据总损失值来调整，若计算出的总损失值不满足预定条件则调整网络参数，直到总损失值满足预定条件时训练结束，此时的图像生成网络就是训练好的图像增强网络，其中总损失值通过计算输出图像相对于目标样本的第一损失值和计算判别值相对于预设标签值的第二损失值得到。

可选地，在根据本发明的训练模型中，图像生成网络包括依次相连的多个第一处理块和一个结果处理块，其中每个第一处理块包括依次相连的至少两个卷积激活层和一个跳跃连接层，跳跃连接层适于将其所属的第一处理块的第一个卷积激活层的输入与最后一个卷积激活层的输出相加；结果处理块包括多个卷积激活层；以及在第一个第一处理块之前，还包括一个卷积激活层。

可选地，在根据本发明的训练模型中，在图像生成网络中，第一处理块的个数为4，且各第一处理块中的卷积激活层的激活函数为ReLU函数；结果处理块包括三个卷积激活层，其中，前两个卷积激活层的激活函数为ReLU函数，第三个卷积激活层的激活函数为Tanh函数。

可选地，在根据本发明的训练模型中，图像判别网络包括依次相连的一个缩放层、一个卷积激活层、多个第二处理块和两个全连接处理块，其中，第二处理块包括依次相连的卷积层、批标准化层和激活层。

可选地，在根据本发明的训练模型中，在图像判别网络中，第一个全连接处理块包括依次相连的全连接层和激活层；以及第二个全连接处理块包括依次相连的全连接层和分类层。

根据本发明的一个方面，提供了一种图像增强方法，适于通过预设的图像增强网络来对待处理图像进行增强处理，该方法在计算设备中执行，包括步骤：将待处理图像输入预设的图像增强网络中，经多次卷积处理后生成增强后的图像，其中预设的图像增强网络利用如上所述的训练方法来生成。

根据本发明的再一个方面，提供了一种计算设备，包括：至少一个处理器；和存储器；一个或多个程序，其中一个或多个程序存储在存储器中并被配置为由处理器执行，一个或多个程序包括用于执行如上所述的训练方法的指令和用于执行如上所述的图像增强方法的指令。

根据本发明的再一个方面，提供了一种存储一个或多个程序的计算机可读存储介质，一个或多个程序包括指令，指令当计算设备执行时，使得计算设备执行如上所述的训练方法中的任一方法和用于执行如上所述的图像增强方法。

根据本发明的图像增强方案基于生成对抗网络的思想，通过构建图像增强网络的训练模型，利用图像生成网络生成的结果来“欺骗”图像判别网络，由图像判别网络鉴别图像生成网络生成的输出图像是否满足理想效果，这样，图像生成网络与图像判别网络相互对抗学习，使得经图像增强网络增强后的图像能较好地逼近目标样本，以达到预期的增强效果。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了实现上述以及相关目的，本文结合下面的描述和附图来描述某些说明性方面，这些方面指示了可以实践本文所公开的原理的各种方式，并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述，本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开，相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的计算设备100的示意图；

图2示出了根据本发明一个实施例的图像增强网络的训练方法200的流程图；

图3A和图3B示出了根据本发明一个实施例的训练图像对，其中图3A为第一图像，图3B为第二图像；

图4示出了根据本发明一个实施例的图像增强网络的训练模型400的结构示意图；

图5示出了根据本发明一个实施例的图像生成网络410的结构图；

图6示出了根据本发明一个实施例的第一处理块的结构图；

图7示出了根据本发明一个实施例的结果处理块的结构图；

图8示出了根据本发明一个实施例的图像判别网络420的结构图；

图9示出了根据本发明一个实施例的图像增强方法900的流程示意图；以及

图10A和图10B示出了根据本发明一个实施例的增强效果对比图，其中图10A为待处理图像，图10B为增强后的图像。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明的图像增强方案适于在一个或一组计算设备中执行，即，在一个或一组计算设备中完成利用图像增强网络的训练模型训练生成图像增强网络的过程、以及利用训练好的图像增强网络对输入的待处理图像进行增强处理的过程。计算设备例如可以是服务器(例如Web服务器、应用服务器等)，桌面计算机和笔记本计算机等个人计算机，手机、平板电脑、智能可穿戴设备等便携式移动设备等，但不限于此。根据一种优选的实施例，本发明的图像增强方案在计算设备中执行，例如，计算设备可以实现为Parameter Server架构的分布式系统。

图1示出了根据本发明一个实施例的计算设备100的示意图。如图1所示，在基本的配置102中，计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置，处理器104可以是任何类型的处理，包括但不限于：微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用，或者在一些实现中，存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置，系统存储器106可以是任意类型的存储器，包括但不限于：易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序124。在一些实施方式中，应用122可以布置为在操作系统上由一个或多个处理器104利用程序124执行指令。

计算设备100还可以包括有助于从各种接口设备(例如，输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156，它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如，键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160，其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块，并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号，它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例，通信介质可以包括诸如有线网络或者专线网络之类的有线介质，以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

在根据本发明的计算设备100中，应用122包括执行图像增强网络的训练方法200和图像增强方法900的多条程序指令，程序124还可以包括训练图像对、图像增强网络的训练模型的参数等数据。

图2示出了根据本发明一个实施例的图像增强网络的训练方法200的流程图，训练方法200适于在计算设备(例如前述计算设备100)中执行。如图2所示，训练方法200始于步骤S210。

在步骤S210中，获取多个训练图像对，每一个训练图像对中包括作为训练样本的第一图像和作为目标样本的第二图像。

根据本发明的实施例，考虑到由单反相机拍摄的图像噪点少、细节丰富，故选用通过单反相机采集得到的图像作为训练样本(即训练用的图像)，例如用单反相机采集1000张图像生成一个训练样本的集合，训练样本可以包含在不同场景、不同时段等采集的图像，本发明的实施例对此不做限制。接着，利用专业人士对训练样本分别进行调整处理(得到至少1000张调整后的图片)，使其具有更好的对比度和饱和度，将调整后的图像作为与调整前图像(即训练样本)相对应的目标样本，目标样本表征了期望的图像增强效果。

根据本发明的一种优选实施方式，为了兼顾训练效果和训练速度，分别从训练样本和其对应的目标样本的相同坐标位置处截取出预定尺寸的子图像(在根据本发明的一个优选实施例中，预定尺寸取100*100)，并形成一个训练图像对，其中，从训练样本中截取出的子图像作为训练图像对中的第一图像，从其对应的目标样本中截取出的子图像作为训练图像对中的第二图像。需要说明的是，本发明的实施例对截取子图像的方式不作限制，可以以任意角度、任意位置从原始图像中截取出预定尺寸的子图像，可以从一个原始图像中截取出多个子图像。图3A和图3B示出了根据本发明一个实施例的训练图像对，其中图3A为第一图像，图3B为第二图像。

随后在步骤S220中，将训练图像对中的第一图像输入到预训练的图像生成网络，经多次卷积处理后输出图像，并按照第一损失函数计算输出图像相对于训练图像对中对应第二图像的第一损失值。

应当指出，预设的图像生成网络的结构可以由本领域技术人员根据实际需要自行设置，本发明对此不做限制。根据一种实施例，图像生成网络采用全卷积网络，其结构包括依次相连的多个第一处理块(B)和一个结果处理块(C)。需要说明的是，本发明的实施例对图像生成网络中所包括的第一处理块的数目不做限制(在一个实施例中，第一处理块的个数为4，依次记作B1、B2、B3和B4)。每个第一处理块(B)包括依次相连的至少两个卷积激活层(A)和一个跳跃连接层(SKIP)，其中每个卷积激活层又包括卷积层(CONV)和激活层(ACTI)，激活层的激活函数可以由本领域技术人员自行设置，本发明对此不做限制，例如，可以将激活函数设置为ReLU函数、Tanh函数、Sigmoid函数等。跳跃连接层将其所属的第一处理块的第一个卷积激活层的输入与最后一个卷积激活层的输出相加后输出。第一处理块(B)采用残差网络的结构，简化了卷积网络结构的深度，有利于降低计算的复杂度，同时保持训练效率和准确率。结果处理块(C)包括一个或多个卷积激活层，应当指出，本发明对结果处理块中所包括的卷积激活层的数量不做限制，另外，本发明对结果处理块中各卷积激活层所采用的激活函数亦不做限制。特别地，根据一种实施例，在第一个第一处理块B1之前，还包括一个卷积激活层A0，卷积激活层A0中仍然包括卷积层CONV0和激活层ACTI0。此外，在每个卷积层中，除了卷积处理外，还可能包含池化处理，例如最大值池化、均值池化等，对于本领域技术人员来说，卷积网络中所包含的卷积、池化、激活等处理均属于已知内容，此处不再一一赘述。

需要说明的是，对图像的激活处理可以通过设置单独的激活层实现(如上文所述)，也可以在构造层对象时通过传递activation参数实现，本发明的实施例对激活函数的实现方式并不做限制。

关于图像生成网络进一步的结构说明可参见下文中关于图像增强网络的训练模型的描述，此处主要描述利用图像增强网络的训练模型进行训练的过程，对网络结构不再展开赘述。

将第一图像输入到预训练的图像生成网络，得到输出图像，接着，按照第一损失函数计算输出图像相对于训练图像对中对应第二图像的第一损失值。第一损失函数的设置会影响图像生成网络的训练效果。根据本发明的实现方式，采用计算混合损失的方式设置第一损失函数，根据一个实施例，第一损失函数可以用公式(1)表示：

loss₁＝λ₁*color_loss+λ₂*vgg_loss (1)

式(1)中，loss₁表示第一损失值，color_loss为颜色损失，vgg_loss为纹理损失，λ₁和λ₂为对应的加权系数。应当指出，λ₁和λ₂的值可以由本领域技术人员根据训练过程自行设置，本发明对此不做限制。根据一种优选的实施例，λ₁和λ₂的取值分别为：λ₁＝10.0，λ₂＝1.0。

以下分别给出计算颜色损失和纹理损失的一种方法。

(a)计算颜色损失的步骤包括：先对输出图像和对应的第二图像(即，该输出图像对应输入的第一图像所属的训练图像对中的第二图像)分别进行模糊处理，得到模糊后的输出图像和模糊后的第二图像，在根据本发明的实施例中，可以采用均值模糊算法或高斯模糊算法或其他任何图像模糊处理算法对图像进行模糊处理，以消除图像中高频信息的干扰，便于学习更多的颜色信息；而后，计算模糊后的输出图像和模糊后的第二图像中对应像素点的像素距离值，作为颜色损失。

对于一帧输出图像和第二图像而言，颜色损失的计算公式可以简单描述如公式(2)：

式(2)中，W和H分别为输出图像和第二图像的水平尺寸和垂直尺寸(在根据本发明的实施例中，W＝H＝100(像素数))，(i,j)表示图像中的坐标位置，r_ij、g_ij、b_ij分别表示输出图像中坐标为(i,j)的像素的R、G、B值，r′_ij、g′_ij、b′_ij分别表示第二图像中坐标为(i,j)的像素的R、G、B值。相当于遍历图像中的所有像素点来计算对应的像素距离值，再将所有像素距离值相加作为颜色损失。

(b)计算纹理损失的步骤包括：首先，将输出图像与对应的第二图像分别输入预设卷积网络来生成各自的特征图(可以生成预设卷积网络中每一层的特征图，也可以从中抽取出部分层的特征图，本发明对此不做限制)；然后，计算输出图像的特征图与第二图像的对应特征图中对应像素点的像素距离值，作为纹理损失。在一种实施例中，预设卷积网络采用在ImageNet数据集上训练好的参数初始化的VGG-19网络并生成每一层的特征图，以便于更好地生成语义和纹理信息，计算各层特征图对应的像素距离值，来作为该层的纹理损失，最后求取所有层的纹理损失的均值作为一次训练过程的纹理损失。

对于一帧输出图像的特征图与第二图像的对应特征图而言，纹理损失的计算公式可以简单描述如公式(3)：

式(3)中，W'和H'分别为输出图像的特征图和第二图像的特征图的水平尺寸和垂直尺寸(每一层特征图的尺寸可能都不相同)，(i,j)表示图像中的坐标位置，vr_ij、vg_ij、vb_ij分别表示输出图像的特征图中坐标为(i,j)的像素的R、G、B值，vr′_ij、vg′_ij、vb′_ij分别表示第二图像的对应特征图中坐标为(i,j)的像素的R、G、B值。相当于遍历特征图中的所有像素点来计算对应的像素距离值，再将所有像素距离值相加作为纹理损失。在一些实施例中，一帧输出图像可能会对应多个特征图，此时对所有特征图计算出纹理损失后，再计算文理损失的均值，作为该输出图像相对于第二图像的文理损失。

对于一帧输出图像与第二图像，根据上面的公式(2)和(3)分别计算出颜色损失和纹理损失后，再代入公式(1)就可以计算出该帧输出图像相对于第二图像的第一损失值。假设一共有N个训练图像对，就循环执行N次上述计算过程，最后求取N个第一损失值的均值作为本次训练过程的第一损失值。

随后在步骤S230中，将步骤S220中的输出图像输入到预训练的图像判别网络，经多次卷积处理后输出判别值，并按照第二损失函数计算该判别值相对于预设标签值的第二损失值。

应当指出，预设的图像判别网络的结构可以由本领域技术人员根据实际需要自行设置，本发明对此不做限制。根据一种实施例，图像判别网络的结构包括依次相连的一个缩放层(R)、一个卷积激活层(A)、多个第二处理块(D)和两个全连接处理块(F)。需要说明的是，本发明的实施例对图像判别网络中所包括的第二处理块(D)的数目不做限制(在一个实施例中，第二处理块的个数为4)。每个第二处理块(D)又包括依次相连的卷积层(CONV)、批标准化层(BN)和激活层(ACTI)。其中，卷积激活层(A)又包括卷积层(CONV)和激活层(ACTI)，激活层的激活函数可以由本领域技术人员自行设置，本发明对此不做限制，例如，可以将激活函数设置为ReLU函数、Tanh函数、Sigmoid函数等。第一个全连接处理块(F1)包括依次相连的全连接层(FC)和激活层(ACTI)，第二个全连接处理块(F2)包括依次相连的全连接层(FC)和分类层(S)，在根据本发明的实施例中，分类层采用Softmax网络。

此外，在每个卷积层中，除了卷积处理外，还可能包含池化处理，例如最大值池化、均值池化等，对于本领域技术人员来说，卷积网络中所包含的卷积、池化、激活等处理均属于已知内容，此处不再一一赘述。

关于图像判别网络进一步的结构说明可参见下文中关于图像增强网络的训练模型的描述，此处主要描述利用图像增强网络的训练模型进行训练的过程，对网络结构不做展开赘述。

将输出图像输入到预训练的图像判别网络，得到一个指示该输出图像(经图像生成网络生成)是否达到增强要求的判别值，接着，按照第二损失函数计算该判别值相对于预设标签值的第二损失值。第二损失函数的设置会影响图像判别网络的训练效果，进而还会影响图像生成网络的学习能力。根据本发明的一个实施例，第二损失函数可以用公式(4)表示：

loss₂＝t*log(s)+(1-t)*log(1-s) (4)

式(4)中，loss₂表示第二损失值，t表示预设标签值，s表示判别值。

根据一种实施方式，参照公式(4)，计算第二损失值的步骤概括如下：先根据判别值生成两个对数运算值，即log(s)和log(1-s)，再利用预设标签值生成两个系数，即t和(1-t)，最后结合这两个系数和两个对数运算值计算出第二损失值。在根据本发明的实施例中，预设标签值选取正例标签值，一般为1，为增强图像判别网络的泛化能力，在根据本发明的一个实施例中，预设标签值设为0.9。

对于一帧输出图像的判别值，根据上面的公式(4)计算出第二损失值。假设一共有N个训练图像对，就循环执行N次上述计算过程，最后求取N个第二损失值的均值作为本次训练过程的第二损失值。

随后在步骤S240中，结合第一损失值和第二损失值来更新图像生成网络和图像判别网络的网络参数，直到第一损失值和第二损失值的总和满足预定条件时，训练结束，得到训练后的图像生成网络，作为训练好的图像增强网络。

根据一种实施方式，在每次计算出第一损失值和第二损失值后，一方面根据第二损失值来更新图像判别网络的网络参数，另一方面计算第一损失值和第二损失值的总损失值，并根据总损失值来更新图像生成网络的网络参数，在每次更新完网络参数后，利用新的图像生成网络和图像判别网络对上述训练图像对再进行训练来生成新的第一损失值、第二损失值，再更新网络参数，…，重复迭代多次“计算总损失值→更新网络参数”的步骤，直到计算出的总损失值满足预定条件(在模型的训练过程中，随着训练次数的增加，通常总损失值会越来越小，预定条件可以设为相邻两个总损失值的差值小于阈值或相邻的几个总损失值基本保持不变，此时说明损失趋于稳定)，训练结束。此时对应的图像生成网络就是训练好的图像增强网络。

根据一种实施例，总损失值通过对第一损失值和第二损失值的加权计算得到，结合公式(1)，总损失值loss可以表示为：

loss＝λ₁*color_loss+λ₂*vgg_loss+λ₃*loss₂ (5)

式(5)中，λ₁*color_loss+λ₂*vgg_loss就代表了第一损失值loss₁，loss₂为第二损失值，λ₁＝10.0，λ₂＝1.0，λ₃＝0.5。

对应于训练方法200，本发明还提供了通过训练方法200来训练图像增强网络的训练模型400，如图4，示出了根据本发明一个实施例的图像增强网络的训练模型400的结构示意图。

结合上文所述及图4所示，基于生成对抗网络的思想，图像增强网络的训练模型400包括图像生成网络410和图像判别网络420。根据本发明的实施例，训练样本首先输入图像生成网络410，图像生成网络410采用全卷积网络结构，对训练样本进行多层卷积处理，以生成与输入的训练样本具有相同尺寸的输出图像。在根据本发明的实施例中，每一个训练样本均具有对应的目标样本，前文已经说明了训练样本与目标样本的采集过程，此处不再展开。图像判别网络420与图像生成网络410相耦接，图像生成网络410的输出图像接着输入图像判别网络420，再次经卷积处理后生成判断该输出图像达到增强目标的判别值并输出。

根据一种实施方式，图像生成网络410和图像判别网络420的网络参数根据总损失值来调整，若计算出的总损失值不满足预定条件则调整网络参数，直到总损失值满足预定条件时训练结束，此时的图像生成网络就是训练好的图像增强网络。总损失值通过计算输出图像相对于目标样本的第一损失值和计算判别值相对于预设标签值的第二损失值得到，关于总损失值的计算在前文中有详细的描述，此处不再赘述。

图5示出了根据本发明一个实施例的图像生成网络410的结构示意图。如上所述，图像生成网络410包括依次相连的1个卷积激活层A0、4个第一处理块B1～B4以及1个结果处理块C。其中第一处理块B1～B4的结构类似，图6以第一处理块B1为例来说明图5中各第一处理块的结构。如图6所示，第一处理块B1包括依次相连的卷积激活层A1、卷积激活层A2和跳跃连接层SKIP1，卷积激活层A1进一步包括卷积层CONV1和一个采用ReLU函数的激活层ACTI1，卷积激活层A2进一步包括卷积层CONV2和一个采用ReLU函数的激活层ACTI2，跳跃连接层SKIP1将卷积激活层A1的输入(也即卷积层CONV1的输入)与卷积激活层A2的输出(也即激活层ACTI2的输出)相加而后输出。

图7示出了图5中结果处理块C的一种结构。如图7所示，结果处理块C包括三个卷积激活层A9～A11，卷积激活层A9进一步包括卷积层CONV9和采用ReLU函数的激活层ACTI9，卷积激活层A10进一步包括卷积层CONV10和采用ReLU函数的激活层ACTI10，卷积激活层A11进一步包括卷积层CONV11和采用Tanh函数的激活层ACTI11。

应当指出，在构建了图像生成网络410的结构后，还有一些参数需要预先设置，例如，每一个卷积层(CONV)所采用的卷积核(kernel)的数量和尺寸、卷积核的移动步长、四周填充边的数量等。表1示出了图5～图7所示的图像生成网络410的参数示例，鉴于跳跃连接层中并不需要额外设置参数，故仅示出了各卷积激活层所需参数(应当指出，在每一个卷积激活层中，激活层仅需确定选用哪种激活函数，故在每个卷积激活层中标注出了其中的激活层所采用的的激活函数)。

表1图像生成网络410的参数示例

上述图像生成网络410的结构及各卷积激活层的基本参数均由本领域技术人员预先设置，作为预训练的图像生成网络410，与预训练的图像判别网络420一起构建出训练模型400。利用训练模型400训练图像增强网络，即确定训练模型400中的各网络参数，其中，网络参数包括每一个卷积核的各个位置处的权重，以及偏置参数等。

图8示出了根据本发明一个实施例的图像判别网络420的结构示意图。如上所述，图像判别网络420包括依次相连的1个缩放层R00、1个卷积激活层A00、4个第二处理块D1～D4和2个全连接处理块F1～F2。其中，缩放层R00将输入图像判别网络420的图像尺寸同一缩放到一个固定尺寸，例如，缩放层R00将图像缩放到100*100大小。卷积激活层A00包括卷积层CONV00和一个采用ReLU激活函数的激活层ACTI00。第二处理块D1～D4的结构类似，如图8，以第二处理块D1为例，包括依次相连的1个卷积层CONV01、批标准化层BN01和激活层ACTI01，本发明的实施例对第二处理块中所采用的激活函数不做限制，在一个实施例中，各第二处理块中均采用ReLU激活函数。第二处理块D1～D4均是在卷积处理后先进行批标准化处理、再进行激活处理，加入批标准化层能够控制过拟合。第一个全连接处理块F1包括一个全连接层FC01和一个采用ReLU激活函数的激活层ACTI05，当然，也可以根据需要选择其他激活函数，此处仅作为示例。经第一全连接处理块F1处理后，生成一个向量输入到第二个全连接处理块F2，第二个全连接处理块F2包括一个全连接层FC02和一个分类层S01，在根据本发明的实施例中，分类层采用Softmax网络，计算输入图像判别网络420中的图像为符合增强目标的图像的概率，作为判别值输出。

应当指出，在构建了图像判别网络420的结构后，还有一些参数需要预先设置，例如，每一个卷积层(CONV)所采用的卷积核(kernel)的数量和尺寸、卷积核的移动步长、四周填充边的数量等。表2示出了图8所示的图像判别网络420的参数示例。需要说明的是，表2中重点示出了各卷积层中所需的卷积参数，由于在每一个卷积激活层中，激活层仅需确定选用哪种激活函数，故在每个卷积激活层中标注出了其中的激活层所采用的的激活函数，同时，对于缩放层R00和全连接处理块F1～F2，在表2中另外标注出了除卷积参数之外的其他参数。

表2图像判别网络420的参数示例

上述图像判别网络420的结构及各卷积激活层的基本参数均由本领域技术人员预先设置，作为预训练的图像判别网络420，与预训练的图像生成网络410一起构建出训练模型400。利用训练模型400训练图像增强网络，即确定训练模型400中的各网络参数，其中，网络参数包括每一个卷积核的各个位置处的权重，以及偏置参数等。

以上示出了根据本发明一些实施例的训练模型400的网络结构、以及在训练模型400上所执行的训练方法200的步骤流程。本领域技术人员应当了解，在执行完训练方法200后，即可得到训练好的训练模型400，包括训练好的图像生成网络410和训练好的图像判别网络420，此时，训练好的图像生成网络410就是需要的图像增强网络，即预设的图像增强网络。

图9示出了根据本发明的一个实施例的图像增强方法900的流程示意图。方法900通过预设的图像增强网络来对待处理图像进行增强处理，具体地，方法900始于步骤S910，将待处理图像输入预设的图像增强网络中，经多次卷积处理后生成增强后的图像。如上所述，预设的图像增强网络利用训练方法200在训练模型400上生成。

根据本发明的实施方式，待处理图像可以是通过移动终端拍摄所得的图像，也可以是通过网络下载的图像，预设的图像增强网络是一个全卷积神经网络，故输入增强网络的待处理图像可以是任意尺寸，且通过预设的图像增强网络处理后，增强后的图像的尺寸与待处理图像的尺寸相同。

图10A和图10B示出了根据本发明一个实施例的增强效果对比图，其中图10A为待处理图像，图10B为增强后的图像。对比图10A和图10B，根据本发明的图像增强方案生成的增强图像，其质量明显优于原始的待处理图像，并且能够很好地修复过曝和颜色溢出的问题。

根据本发明的图像增强方法900基于生成对抗网络的思想，通过构建图像增强网络的训练模型，利用图像生成网络生成的结果来“欺骗”图像判别网络，由图像判别网络鉴别图像生成网络生成的输出图像是否满足理想效果，这样，图像生成网络与图像判别网络相互对抗学习，使得经图像增强网络增强后的图像能较好地逼近目标样本，以达到预期的增强效果。并且，可以通过对训练图像对(也就是训练样本和目标样本)的选择，来达到对不同类别的图像的适应性增强的效果。例如，选取代表某种风格的图像作为目标样本，则增强后的图像也会具有某种风格。又如，选取包含某一类内容(如人像、如风景、等等)的图像作为训练图像对，那么学习到的图像增强网络就会擅于处理这类图像。

这里描述的各种技术可结合硬件或软件，或者它们的组合一起实现。从而，本发明的方法和设备，或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介，例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式，其中当程序被载入诸如计算机之类的机器，并被所述机器执行时，所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下，计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)，至少一个输入装置，和至少一个输出装置。其中，存储器被配置用于存储程序代码；处理器被配置用于根据该存储器中存储的所述程序代码中的指令，执行本发明的方法。

以示例而非限制的方式，可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据，并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。

在此处所提供的说明书中，算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

本发明一并公开了：

A7、如A5或6所述的训练方法，其中，各第一处理块中的卷积激活层的激活函数为ReLU函数；所述结果处理块包括三个卷积激活层，其中，前两个卷积激活层的激活函数为ReLU函数，第三个卷积激活层的激活函数为Tanh函数。A8、如A1-7中任一项所述的训练方法，其中，所述图像判别网络包括依次相连的一个缩放层、一个卷积激活层、多个第二处理块和两个全连接处理块，其中，所述第二处理块包括：依次相连的卷积层、批标准化层和激活层。

B10、如B9所述的训练模型，其中，所述图像生成网络包括依次相连的多个第一处理块和一个结果处理块，其中，每个所述第一处理块包括依次相连的至少两个卷积激活层和一个跳跃连接层，所述跳跃连接层适于将其所属的第一处理块的第一个卷积激活层的输入与最后一个卷积激活层的输出相加；所述结果处理块包括多个卷积激活层；以及在第一个第一处理块之前，还包括一个卷积激活层。B11、如B10所述的训练模型，在所述图像生成网络中，所述第一处理块的个数为4。B12、如B10或11所述的训练模型，在所述图像生成网络中，各第一处理块中的卷积激活层的激活函数为ReLU函数；所述结果处理块包括三个卷积激活层，其中，前两个卷积激活层的激活函数为ReLU函数，第三个卷积激活层的激活函数为Tanh函数。B13、如B9-12中任一项所述的训练模型，其中，所述图像判别网络包括依次相连的一个缩放层、一个卷积激活层、多个第二处理块和两个全连接处理块，其中，所述第二处理块包括：依次相连的卷积层、批标准化层和激活层。B14、如B13所述的训练模型，在所述图像判别网络中，第一个全连接处理块包括依次相连的全连接层和激活层；以及第二个全连接处理块包括依次相连的全连接层和分类层。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种图像增强网络的训练方法，所述训练方法适于在计算设备中执行，所述训练方法包括步骤：

获取多个训练图像对，每一个训练图像对中包括作为训练样本的第一图像和作为目标样本的第二图像；

将所述训练图像对中的第一图像输入到预训练的图像生成网络，经多次卷积处理后输出图像，并按照第一损失函数计算输出图像相对于训练图像对中对应第二图像的第一损失值；

将所述输出图像输入到预训练的图像判别网络，经多次卷积处理后输出判别值，并按照第二损失函数计算该判别值相对于预设标签值的第二损失值；以及

结合第一损失值和第二损失值来更新图像生成网络和图像判别网络的网络参数，直到所述第一损失值和第二损失值的总和满足预定条件时，训练结束，得到训练后的图像生成网络，作为训练好的图像增强网络。

2.如权利要求1所述的训练方法，其中，所述获取多个训练图像对的步骤还包括：

采集训练样本，并对采集到的每个训练样本进行调整处理后生成对应的目标样本；

分别从所述训练样本和其对应的目标样本的相同位置处截取出预定尺寸的子图像，并形成一个训练图像对，其中，从训练样本中截取出的子图像作为训练图像对中的第一图像，从其对应的目标样本中截取出的子图像作为训练图像对中的第二图像。

3.如权利要求1或2所述的训练方法，其中，按照第一损失函数计算输出图像相对于训练图像对中对应第二图像的第一损失值的步骤包括：

对输出图像和对应的第二图像分别进行模糊处理，得到模糊后的输出图像和模糊后的第二图像；

计算模糊后的输出图像和模糊后的第二图像中对应像素点的像素距离值，作为颜色损失；

将输出图像与对应的第二图像分别输入预设卷积网络来生成各自的特征图；

计算输出图像的特征图与第二图像的特征图中对应像素点的像素距离值，作为纹理损失；以及

根据所述颜色损失和纹理损失计算出第一损失值。

4.如权利要求1-3中任一项所述的训练方法，其中，按照第二损失函数计算该判别值相对于预设标签值的第二损失值的步骤包括：

根据判别值生成两个对数运算值；

利用预设标签值生成两个系数；

根据两个系数和两个对数运算值计算出第二损失值。

5.如权利要求1-4中任一项所述的训练方法，其中，所述图像生成网络包括依次相连的多个第一处理块和一个结果处理块，其中，

每个所述第一处理块包括依次相连的至少两个卷积激活层和一个跳跃连接层，所述跳跃连接层适于将其所属的第一处理块的第一个卷积激活层的输入与最后一个卷积激活层的输出相加；

所述结果处理块包括多个卷积激活层；以及

在第一个第一处理块之前，还包括一个卷积激活层。

6.如权利要求5所述的训练方法，其中，所述第一处理块的个数为4。

7.一种图像增强网络的训练模型，所述训练模型适于训练生成图像增强网络来对待处理的图像进行增强处理，所述训练模型包括：

图像生成网络，适于对输入的训练样本进行多层卷积处理，以生成与输入的训练样本具有相同尺寸的输出图像，所述训练样本具有对应的目标样本；

图像判别网络，与所述图像生成网络相耦接，适于对所述输出图像进行多层卷积处理，以生成判断所述输出图像达到增强目标的判别值；

其中，所述图像生成网络和所述图像判别网络的网络参数根据总损失值来调整，若计算出的总损失值不满足预定条件则调整网络参数，直到总损失值满足预定条件时训练结束，此时的图像生成网络就是训练好的图像增强网络，其中所述总损失值通过计算输出图像相对于目标样本的第一损失值和计算判别值相对于预设标签值的第二损失值得到。

8.一种图像增强方法，所述方法适于通过预设的图像增强网络来对待处理图像进行增强处理，所述方法在计算设备中执行，所述方法包括步骤：

将待处理图像输入预设的图像增强网络中，经多次卷积处理后生成增强后的图像，

其中所述预设的图像增强网络利用如权利要求1-6中任一项所述的训练方法来生成。

9.一种计算设备，包括：

至少一个处理器；和

存储器；

一个或多个程序，其中所述一个或多个程序存储在所述存储器中并被配置为由所述处理器执行，所述一个或多个程序包括用于执行如权利要求1-6中任一项所述的训练方法的指令和用于执行如权利要求8所述的方法的指令。

10.一种存储一个或多个程序的计算机可读存储介质，所述一个或多个程序包括指令，所述指令当计算设备执行时，使得所述计算设备执行根据权利要求1-6所述的训练方法中的任一方法和用于执行根据权利要求8所述方法。