CN111145116A

CN111145116A - 一种基于生成对抗网络的海面雨天图像样本增广方法

Info

Publication number: CN111145116A
Application number: CN201911336661.0A
Authority: CN
Inventors: 苏丽; 崔浩浩; 王立鹏; 孙雨鑫
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2019-12-23
Filing date: 2019-12-23
Publication date: 2020-05-12
Anticipated expiration: 2039-12-23
Also published as: CN111145116B

Abstract

本发明属于神经网络深度学习技术领域，具体涉及一种基于生成对抗网络的海面雨天图像样本增广方法。本发明基于生成对抗网络，采用传统的L1损失和GAN损失相结合的方法来训练网络，在训练生成器的过程中除了传统的GAN损失外还加上了生成的假的雨天图片与真实雨天图片之间的L1损失；生成器采用残差网络，判别器采用Patch‑D，通过对图像分成N*N个小块分别进行判别来计算损失，提高图像的清晰度以及细节保持能力，生成样本时仍采用深度学习框架中的训练模式，即不对批归一化层的参数进行固定，继续启用dropout层。本发明中通过利用成对的图片来训练生成器，从而由多数类样本生成其对应的少数类样本，达到增广样本的目的。

Description

一种基于生成对抗网络的海面雨天图像样本增广方法

技术领域

本发明属于神经网络深度学习技术领域，具体涉及一种基于生成对抗网络的海面雨天图像样本增广方法。

背景技术

随着深度学习技术的发展，其在图像、语音、文本等领域均取得了巨大的成功，多年来各种深度神经网络层出不穷，随着计算机硬件技术的提高，神经网络的规模也越来越大，参数也越来越多。同时，对训练网络所用的样本数据的要求也越来越高，对于深度学习来说，样本数据往往是其至关重要的一环。使用深度学习训练模型实际上就是通过让神经网络对大量的已有样本进行学习，并对学习到的样本数据进行统计分析，根据分析结果来优化神经网络的参数，从而使得神经网络能够输出我们想要的结果。同人类的学习一样，要想让神经网络的学习效果足够好就需要对其提供足够数量和良好质量的样本数据。现如今，一些较大的神经网络拥有的参数量甚至达到了上亿级别，这就需要一个庞大的样本数据集来对其进行训练。

对于图像领域来说，虽然随着互联网的发展我们可以很容易的获得大量的目标图片，但是并不是只要数量足够就可以组成一个满足深度学习要求的数据集。一个合格的数据集不仅要保证数量，还要保证质量，不仅要满足样本数据的多样性要求，还要保证各个类别的样本数量均衡。而我们容易获得的照片更多的是摄影爱好者进行的拍照或者一些专业人员出于某种目的进行的拍摄，这就导致不同种类样本数量的不均衡，直接用这样的数据集进行训练很容易造成网络的过拟合，从而导致训练结果出错。

发明内容

本发明的目的在于提供通过利用成对的图片来训练生成器，从而由多数类样本生成其对应的少数类样本，实现增广样本的一种基于生成对抗网络的海面雨天图像样本增广方法。

本发明的目的通过如下技术方案来实现：包括以下步骤：

步骤1：输入待增广的图像样本，设定期望增广的纹理；

步骤2：根据期望增广的纹理，获取成对的原始图片-带纹理图片数据集；原始图片-带纹理图片数据集中包括同一场景下的原始图片A和带纹理图片B；

步骤3：构建神经网络；神经网络包含生成器和判别器，损失函数采用L1损失与GAN损失相结合的方法；

步骤4：训练神经网络；

步骤4.1：设定循环次数；

步骤4.2：将原始图片-带纹理图片数据集中的原始图片A输入到神经网络的生成器，输出假的带纹理图片fake-B；将假的带纹理图片fake-B作为判别器的输入，用判别器对其分布进行判别；若假的带纹理图片fake-B与真实的带纹理图片B分布相同则输出1，否则输出0；将判别器的输出结果与期望结果利用均方差进行损失计算，得到生成器的GAN损失函数；将假的带纹理图片fake-B与真实的带纹理图片B进行L1损失计算，得到生成器的L1损失；将生成器的GAN损失与L1损失结合，作为生成器的损失值，并通过对该损失值进行反向传播来训练生成器，提升生成器的生成能力；

步骤4.3：将假的带纹理图片fake-B与真实的带纹理图片B分别作为判别器的输入；当判别器的输入为假的带纹理图片fake-B时，期望输出为N*N大小的全0特征图；当判别器的输入为真实的带纹理图片B时，期望输出为N*N大小的全1特征图；计算判别器的实际输出与期望输出之间的均方差，得到判别器的损失值；通过将判别器的损失值反向传播来训练判别器，提升判别器的判别能力；

步骤4.4：重复进行步骤4.2与步骤4.3，将生成器与判别器交替训练，直至达到设定的循环次数，完成神经网络的训练；

步骤5：将待待增广的图像样本输入训练好的神经网络的生成器中，得到增广后带有期望增广的纹理的图像；在生成过程中不采用深度学习框架中的测试模式，仍然选择训练模式，即不对批归一化层的参数进行固定，继续启用dropout层。

本发明还可以包括：

所述的步骤3中神经网络的生成器具体为：

生成器采用残差网络，第一层采用9*9的卷积核进行步长为1的卷积，使得网络具有较大的感受野，之后两层用步长为2的卷积层进行下采样，对图像编码，接下来跟5层残差块，增加网络的深度，并在每个残差块加入dropout层引入噪声，两层步长为2的反卷积上采样解码过程，最后为一层卷积核为9*9步长为1的卷积层，除最后一层不使用批归一化与激活函数外，其余层均启用批归一化，并选用ReLu激活函数；

所述的步骤3中神经网络的判别器具体为：

判别器采用Patch-D，网络结构为四层步长为2的卷积下采样和一层步长为1的卷积层，最后一层不再进行全连接，而是保持为卷积层，使得输出为一个N*N大小的特征图。

所述的步骤3中L1损失与GAN损失相结合的方法具体为：由GAN损失重建图片的高频部分，由L1损失重建图像的低频部分，最终的损失函数为：

L_GAN(G，D)＝E_y[||D(y)||²]+E_x，z[||(1-D(G(x，z)))||²]

LL₁(G)＝E_x，y，z[||y-G(x,z)||₁]

其中，G^*为目标生成器；G为生成器；D为判别器；x为原始图片A；y为带纹理图片B；z为通过dropout引入的噪声；E表示求均值。

本发明的有益效果在于：

在深度学习技术中，样本集往往占据着相当重要的地位，能够直接影响到最终网络训练的好坏，但是在许多情况下我们往往很难得到理想的样本集，样本数量的绝对稀缺或相对稀缺都会对网络的训练造成很大的影响。本发明提供了一种基于生成对抗网络的样本增广方法，通过该方法可以在一些场景下实现由容易获得的多数类样本生成逼真的对应的少数类样本，从而解决样本图像绝对稀缺的问题。本发明基于生成对抗网络，采用传统的L1损失和GAN损失相结合的方法来训练网络，在训练生成器的过程中除了传统的GAN损失外还加上了生成的假的雨天图片与真实雨天图片之间的L1损失；生成器采用残差网络，判别器采用Patch-D，通过对图像分成N*N个小块分别进行判别来计算损失，提高图像的清晰度以及细节保持能力，测试阶段Batch_size选择为1，生成样本时仍采用深度学习框架中的训练模式，即不对批归一化层的参数进行固定，继续启用dropout层。本发明中通过利用成对的图片来训练生成器，从而由多数类样本生成其对应的少数类样本，达到增广样本的目的。

附图说明

图1是本发明的神经网络中生成器的结构示意图。

图2为本发明实施例中训练所用的部分样本示意图。

图3是本发明实施例中增广的雨天样本示意图。

具体实施方式

下面结合附图对本发明做进一步描述。

本发明涉及样本图像增广、深度学习和神经网络领域，尤指一种基于生成对抗网络的海面雨天图像样本增广方法。本发明基于生成对抗网络，采用传统的L1损失和GAN损失相结合的方法来训练网络，在训练生成器的过程中除了传统的GAN损失外还加上了生成的假的雨天图片与真实雨天图片之间的L1损失；生成器采用残差网络，判别器采用Patch-D，通过对图像分成N*N个小块分别进行判别来计算损失，提高图像的清晰度以及细节保持能力，测试阶段Batch_size选择为1，生成样本时仍采用深度学习框架中的训练模式，即不对批归一化层的参数进行固定，继续启用dropout层。本发明中通过利用成对的图片来训练生成器，从而由多数类样本生成其对应的少数类样本，达到增广样本的目的。

一种基于生成对抗网络的海面雨天图像样本增广方法，包括以下步骤：

步骤1：输入待增广的图像样本，设定期望增广的纹理；

L1损失与GAN损失相结合的方法具体为：由GAN损失重建图片的高频部分，由L1损失重建图像的低频部分，最终的损失函数为：

L_GAN(G，D)＝E_y[||D(y)||²]+E_x，z[||(1-D(G(x，z)))||²]

L_L1(G)＝E_x，y，z[||y-G(x，z)||₁]

步骤4：训练神经网络；

步骤4.1：设定循环次数；

实施例1：

对于深度学习来说，样本数据的好坏会直接影响到神经网络的训练成果，当某类样本的数量相对其他类差距较大时，就会造成神经网络对多数类样本的“过度学习”，从而导致网络出现过拟合，进而造成网络的识别分类等任务出现较大的偏差，无法对少数类样本进行准确的识别分类。而当某类样本数量绝对稀少时更是无法对其进行训练。本发明提供了一种基于生成对抗网络的方法，通过对成对样本图像进行训练，从而实现由多数类样本生成对应的少数类样本的方法，以下以晴天-雨天成对数据集为例进行详细介绍。

步骤1、从网络上下载人工制作的成对的晴天(A)-雨天(B)数据集。

步骤2、根据发明内容所述构建神经网络。其中生成器采用残差网络，判别器采用Patch-D，损失函数采用传统的L1损失与GAN损失相结合的方法。

步骤3、将数据集中的晴天图片(A)输入到神经网络的生成器，输出生成的假的雨天图片(fake-B)。

步骤4、将生成器生成的假的雨天图片(fake-B)作为判别器的输入，用判别器对其分布进行判别，若与真实的雨天图片分布相同则输出1，否则输出0，同时对假的雨天图片(fake-B)与真实的雨天图片(B)之间计算L1损失，从而对生成器进行训练。

步骤5、将生成器生成的假的雨天图片(fake-B)与数据集中真实的雨天图片(B)作为判别器的输入进行训练，当输入为假的雨天图片(fake-B)时网络输出1，当输入为数据集中真实的雨天图片时网络输出为0。

步骤6、生成器与判别器交替训练，共同进步，不断提升生成效果，直至最终能够由晴天图片生成足够逼真的雨天照片。

1、获取数据集

通过从网络下载或者人工制作得到数据集，数据集要求位于同一场景下的成对图片，例如同一场景下的晴天-雨天图片，白天-夜晚图片等；也可以是一些仿真图片中难以建模的纹理图片等，如仿真得到不带纹理的海面、大理石、木材等与真实的带有纹理的对应图片。以下以晴天(A)-雨天(B)成对图片为例继续进行说明。

2、构建神经网络

该算法基于生成对抗网络，网络主要包含两部分：生成器和判别器。其中生成器采用残差网络，第一层采用9*9的卷积核进行步长为1的卷积，使得网络具有较大的感受野，之后两层用步长为2的卷积层进行下采样，对图像编码，接下来跟5层残差块，增加网络的深度，并在每个残差块加入dropout层引入噪声，两层步长为2的反卷积上采样解码过程，最后为一层卷积核为9*9步长为1的卷积层。除最后一层不使用批归一化与激活函数外，其余层均启用批归一化，并选用ReLu激活函数；判别器采用Patch-D,网络结构为四层步长为2的卷积下采样和一层步长为1的卷积层，最后一层不再进行全连接，而是保持为卷积层，使得输出为一个N*N大小的特征图。

3、训练神经网络

将第一步中获取的成对数据集中的晴天图片(A)作为生成器的输入，输出假的雨天的图片(fake-B)，将该图片(fake-B)作为判别器的输入进行判别，判断其是否与雨天照片分布相同，分布相同返回1，否则返回0，将返回结果与我们期望返回的标签1利用均方差进行损失计算，得到生成器的GAN损失函数。本发明采用传统的L1-Loss与GAN相结合的方法，由GAN损失重建图片的高频部分，由L1损失来重建图像的低频部分，因此在训练生成器的时候，除了传统的GAN损失外，还要加上假的雨天图片(fake-B)与真的雨天图片(B)之间的L1损失，即将生成的假的雨天图片(fake-B)与真实的雨天图片(B)进行L1损失计算，得到两者之间的L1损失，将GAN损失与L1损失结合，作为生成器的损失值，并通过对该损失值进行反向传播来训练生成器，进而提升生成器的生成能力。

之后将生成的假的雨天图片(fake-B)与数据集中的真实的雨天图片(B)分别作为判别器的输入，这里由于判别器采用Patch-D结构，所以当在判别器中输入图片时，输出会得到一个N*N大小的特征图，我们希望输入为假的雨天图片(fake-B)时输出返回N*N大小的全0特征图，当输入为真的雨天图片(B)时，输出返回N*N大小的全1特征图，通过将返回值与期望的输出之间计算均方差得到判别器的损失值，通过将判别器的损失值反向传播来训练判别器，从而提升判别器的判别能力。通过该方法可以使得输出的图像具有更高的清晰度与更好的细节保持。

总的损失函数如下所示

目标函数为：G^*＝arg min_Gmax_DL_GAN(G,D)+λL_L1(G)

其中：L_GAN(G，D)＝E_y[||D(y)||²]+E_x，z[||(1-D(G(x，z)))||²]

L_L1(G)＝E_x，y，z[||y-G(x，z)||₁]

G代表生成器，D代表判别器，x代表晴天图片，y代表雨天图片，z为通过dropout引入的噪声，E表示求均值，G^*为目标生成器。最后经过多次循环，将生成器与判别器交替训练，两者共同进步，从而不断提生成效果，最终能够生成逼真的雨天图片。

4、增广样本

从网络上下载所需的晴天下的海面目标图片，将其传入到训练好的生成器中即可得到对应的雨天场景下的海面目标图片，这里在生成过程中不采用深度学习框架中的测试模式，仍然选择训练模式，即不对批归一化层的参数进行固定。Batch_size选择1。

本发明的有益效果在于：

在深度学习技术中，样本集往往占据着相当重要的地位，能够直接影响到最终网络训练的好坏，但是在许多情况下我们往往很难得到理想的样本集，样本数量的绝对稀缺或相对稀缺都会对网络的训练造成很大的影响。本发明提供了一种基于生成对抗网络的样本增广方法，通过该方法可以在一些场景下实现由容易获得的多数类样本生成逼真的对应的少数类样本，从而解决样本图像绝对稀缺的问题。

实施例2：

1、从网络上下载人工制作的成对晴天-雨天数据集，数据集部分内容如附图中的图2所示，每组成对的图片中左边的图片为晴天图片，右边图片为人工制作的对应场景下的雨天图片。在这里由于要进行的是海面场景下的雨天样本图像增广，只关心雨丝的纹理，所以样本集中的背景选择对本发明没有影响。

2、构建生成对抗网络。

其中生成器采用残差网络，其结构图如附图中的图1所示，第一层采用9*9的卷积核进行步长为1的卷积，使得网络具有较大的感受野，之后两层用步长为2的卷积层进行下采样，对图像编码，接下来跟5层残差块儿，增加网络的深度，两层步长为2的反卷积上采样解码过程，最后为一层卷积核为9*9步长为1的卷积层。除最后一层不使用批归一化与激活函数外，其余层均启用批归一化，并选用ReLu激活函数。

判别器采用Patch-D,网络结构为四层步长为2的卷积下采样和一层步长为1的卷积层，最后一层不再进行全连接，而是保持为卷积层，输出一个N*N大小的特征图，并将其与同样大小的标签矩阵进行损失计算。相当于将原图分为N*N个小块儿，每个小块儿代表一个感受野，分别对每个感受野进行损失计算。

该算法采用传统的L1-Loss与GAN相结合的方法，由GAN重建图片的高频部分，由L1-Loss来重建图像的低频部分，因此在训练生成器的时候，除了传统的GAN损失外，还要加上假的雨天图片(fake-B)与真的雨天图片(B)之间的L1损失，最终算法的损失函数如下

目标函数为：G^*＝arg min_Gmax_DL_GAN(G，D)+λL_L1(G)

其中：L_GAN(G，D)＝E_y[||D(y)||²]+E_x，z[||(1-D(G(x，z)))||²]

L_L1(G)＝E_x，y，z[||y-G(x，z)||₁]

λ取值选择100。

G代表生成器，D代表判别器，x代表晴天图片，y代表雨天图片，z为通过dropout引入的噪声，E表示求均值，G^*为目标生成器。

3、训练神经网络

将第一步中获取的成对数据集中的晴天图片(A)作为生成器的输入，输出假的雨天的图片(fake-B)，将该图片(fake-B)作为判别器的输入进行判别，判断其是否与雨天照片分布相同，分布相同返回1，否则返回0，将返回结果与我们期望返回的标签1利用均方差进行损失计算，得到生成器的GAN损失函数。本发明采用传统的L1-Loss与GAN相结合的方法，由GAN损失重建图片的高频部分，由L1损失来重建图像的低频部分，因此在训练生成器的时候，除了传统的GAN损失外，还要加上假的雨天图片(fake-B)与真的雨天图片(B)之间的L1损失，即将生成的假的雨天图片(fake-B)与真实的雨天图片(B)进行L1损失计算，得到两者之间的L1损失，将GAN损失与100倍的L1损失相加，作为生成器的损失值，并通过对该损失值进行反向传播来训练生成器，进而提升生成器的生成能力；

最后经过90次循环，将生成器与判别器交替训练，两者共同进步，从而不断提升生成效果，最终能够生成逼真的雨天图片。

4、增广样本

从网络上下载所需的晴天下的海面目标图片，将其传入到训练好的生成器中即可得到对应的雨天场景下的海面目标图片，这里在生成过程中不采用深度学习框架中的测试模式，仍然选择训练模式，即不对批归一化层的参数进行固定，继续启用dropout层。Batch_size选择1，得到的生成结果如附图中的图3所示，每组图片中左边代表网络上下载的晴天图片，右边部分为生成器生成的雨天下的海面目标图片。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于生成对抗网络的海面雨天图像样本增广方法，其特征在于，包括以下步骤：

步骤1：输入待增广的图像样本，设定期望增广的纹理；

步骤4：训练神经网络；

步骤4.1：设定循环次数；

2.根据权利要求1所述的一种基于生成对抗网络的海面雨天图像样本增广方法，其特征在于：所述的步骤3中神经网络的生成器具体为：

所述的步骤3中神经网络的判别器具体为：

3.根据权利要求1或2所述的一种基于生成对抗网络的海面雨天图像样本增广方法，其特征在于：所述的步骤3中L1损失与GAN损失相结合的方法具体为：由GAN损失重建图片的高频部分，由L1损失重建图像的低频部分，最终的损失函数为：

L_GAN(G,D)＝E_y[‖D(y)‖²]+E_x,z[||(1-D(G(x,z)))||²]

L_L1(G)＝E_x,y,z[‖y-G(x,z)‖₁]