WO2021248938A1

WO2021248938A1 - 一种融合特征金字塔的生成对抗网络图像去雾方法

Info

Publication number: WO2021248938A1
Application number: PCT/CN2021/077354
Authority: WO
Inventors: 张登银; 曹雪杰; 董江伟; 周诗琪; 赵莎莎
Original assignee: 南京邮电大学
Priority date: 2020-06-10
Filing date: 2021-02-23
Publication date: 2021-12-16
Also published as: CN111738942A; JP7379787B2; JP2022548712A

Abstract

本发明公开了图像处理技术领域的一种基于融合特征金字塔的生成对抗网络图像去雾方法，旨在解决现有技术中采用图像增强的去雾方法处理的图像存在信息丢失、采用图像复原的去雾方法处理的图像如果选取参数不当会影响复原后图像的效果、采用基于深度学习的去雾算法影响图像去雾的速度的技术问题。所述方法包括如下步骤：将有雾图像输入预先训练好的生成对抗网络，获取与有雾图像相对应的无雾图像；所述生成对抗网络的生成器网络融合有特征金字塔。

Description

一种融合特征金字塔的生成对抗网络图像去雾方法

本申请要求于2020年6月10日提交中国专利局、申请号为202010522038.0、发明名称为“一种融合特征金字塔的生成对抗网络图像去雾方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及图像处理技术领域，特别是涉及一种融合特征金字塔的生成对抗网络图像去雾方法。

背景技术

在雾霾天气条件下，空气中存在着许多悬浮的微粒和水滴，这些微粒子会对光进行吸收和散射，导致图像采集系统获得的图片参数色彩失真、对比度下降，造成细节丢失，降低图片在目标识别、安全监控、智能交通等计算机视觉应用等方面的使用价值。因此，研究改进图像去雾技术对于计算机视觉系统在雾霾环境下的正常工作具有十分重要的现实意义。

目前，主流的图像去雾技术大致可分为三类：一类是基于图像增强的去雾方法，该类方法不考虑图像退化的原因，通过图像增强的手段来提高图像的对比度、饱和度、清晰度等特征，以提升图像的主观视觉效果，经过增强后的图像具有更高的对比度，但同时也存在信息丢失、图像失真等问题；一类是基于复原的去雾方法，这方法是以大气光散射模型等物理模型为基础，利用各种方法估计模型中的参数，然后反演求解出退化前的原始图像，该方法使处理后的图像更加清晰、自然，细节损失较少，但去雾效果与模型参数的选取有关，不精确的参数将直接影响复原后图像的效果，同时该方法需要人工总结图像的先验知识、设计图像特征，对复杂场景缺乏普适性；一类是基于深度学习的去雾方法，该类方法不需要人工设计特征提取器，而是通过神经网络的特征提取能力学习雾霾的特征，从而达到较好的图像去雾效果，但存在网络模型训练参数过多，对计算平台的内存和计算能力要求较高，图像去雾效率较慢的问题。

发明内容

针对现有技术的不足，本发明的目的在于提供一种融合特征金字塔的生成对抗网络图像去雾方法，以解决现有技术中采用图像增强的去雾方法处理的图像存在信息丢失、采用图像复原的去雾方法处理的图像如果选取参数不当会影响复原后图像的效果、采用基于深度学习的去雾算法影响图像去雾的速度的技术问题。

为实现上述目的，本发明提供了如下方案：

一种融合特征金字塔的生成对抗网络图像去雾方法，包括如下步骤：

将有雾图像输入预先训练好的生成对抗网络，获取与有雾图像相对应的无雾图像；所述生成对抗网络包括：生成器网络和判别器网络；

生成对抗网络的生成器网络融合有特征金字塔。

优选地，生成对抗网络的判别器网络包括：顺序连接的卷积激活层、编码单元提取特征层、全连接层和sigmoid激活层，所述编码单元提取特征层不少于两个且彼此串联。

优选地，所述生成器网络包括：顺序连接的骨干网络、特征金字塔和图像重建网络；

所述无雾图像的获取方法，包括：

所述骨干网络对所输入的有雾图像进行特征提取；

所述特征金字塔对所提取的特征进行特征融合；

所述图像重建网络对所融合的特征进行还原，输出与有雾图像相对应的无雾图像。

优选地，所述骨干网络采用预先训练好的MobileNet-V2网络；

所述骨干网络对所输入的有雾图像进行特征提取，包括：MobileNet-V2网络响应于所输入的有雾图像，输出不少于两个不同尺度的特征图。

优选地，在所述特征金字塔对所提取的特征进行特征融合之前，还包括：对MobileNet-V2网络所输出的特征图进行1*1卷积运算。

优选地，生成对抗网络的训练方法，包括：

基于预获取的不少于两张有雾图像以及与之相对应的无雾图像，构建训练样本集；

以判别器网络的损失函数趋向于0.5、生成器网络的损失函数趋向于0为目标，将所述训练样本集中的图像输入生成对抗网络对其进行训练，直至获取训练好的生成对抗网络。

优选地，判别器网络的损失函数，其表达式如下：

式中，L _D为判别器网络的损失函数，

为判别器对于生成器生成的第i个生成图像的判别结果，

为判别器对于训练样本集中第i个标签图像的判别结果，N为训练样本集中图像的对数。

优选地，生成器网络的损失函数，其表达式如下：

式中，L _G为生成器网络的损失函数，

为生成器生成的第i个生成图像，

为训练样本集中第i个标签图像，C为图像的通道，W×H为图像的尺寸，

为判别器对于生成器生成的第i个生成图像的判别结果，

为判别器对于训练样本集中第i个标签图像的判别结果，N为训练样本集中图像的对数，λ为加权系数权重。

优选地，在将所述训练样本集中的图像输入生成对抗网络对其进行训练之前，还包括：使用平均值为0和标准偏差为0.001的高斯分布随机初始化权重W _ji中的各项分量，令偏置B _ji为0。

优选地，将所述训练样本集中的图像输入生成对抗网络对其进行训练，包括：

根据训练结果更新权重W _ji和偏置B _ji；

将更新后的权重W _ji和偏置B _ji代入损失函数；

重复权重W _ji和偏置B _ji的更新和代入过程，直至判别器网络的损失函数为0.5，获取训练好的生成对抗网络。

根据本发明提供的具体实施例，本发明公开了以下技术效果：本发明方法采用特征金字塔结构代替普通的图像放缩来进行多尺度的特征提取，并增加判别器网络，将原本网络框架拓展成基于生成对抗网络的框架，提高生成器生成图像的质量和效率。其中，生成对抗网络的生成器的输入为有雾图像，输出为去雾后的清晰图像，因此在训练完毕后只需要将有雾图像输入到生成对抗网络的生成器中即可获得去雾后的清晰图像。由于生成器采用MobileNet-V2作为骨干网络，能够减少网络模型训练参数，提高特征提取的速度；同时网络模型中融合的特征金字塔结构能够减少内存占用和计算量，并且能够更高效地融合不同尺度的雾的特征信息，使去雾后的图像更加清晰自然；此外，模型基于生成对抗网络模型并采用交替迭代训练，可以在提高生成器生成图像的质量的同时，提高稳定性和收敛速度。

说明书附图

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明方法实施例的流程示意图；

图2是本发明方法实施例中判别器网络的结构示意图；

图3是本发明方法实施例中生成器网络的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

特征金字塔是一种高效的特征提取方式，利用卷积神经网络(Convolutional Neural Networks，CNN)模型内部从低至上的多个纬度的特征表达，在单一图片视图下生成对图像的多维度特征表达。相对于图像金字塔，极大降低了模型对于计算和内存的要求，同时能够有效地赋能常规CNN模型，并生成出表达能力更强的特征图。因此可以提高网络模型的特征提取能力，同时降低内存和计算量的要求，使图像去雾任务更加高质高效。

生成式对抗网络(Generative Adversarial Networks，GAN)模型是一个通过对抗过程估计生成模型的框架，在该框架中包含生成器G和判别器D两个模型。其中，生成器G从真实样本数据分布映射到新的数据空间，并尽量使其与目标函数的误差减小以欺骗判别器。判别器D的输入包括真实数据和生成器G的生成数据，并努力判别真假，两者互相博弈，最终达到纳什均衡。GAN的模型设计简单，不需要预先设计复杂函数模型，并且可以通过反向传播训练函数，在有效的损失函数的约束下可以更高效地训练网络模型，明显提高网络的收敛性和稳定性。

鉴于上述分析，本发明具体实施方式提供了一种融合特征金字塔的生成对抗网络图像去雾方法，如图1所示，是本发明方法实施例的流程示意图，本发明方法基于融合特征金字塔的生成对抗网络加以实现，包括如下步骤：

步骤1，获取RESIDE-Bate中的OTS和ITS数据集作为训练样本中的无雾图像集。

步骤2，利用大气散射模型为步骤1中的无雾图像集添加不同浓度的雾，得到有雾图像集。将有雾图像集和无雾图像集中的图像裁剪成224*224的图像块，再转换成HDF5的数据格式存储。将有雾图像的图像块和无雾图像的图像块各自按比例分成两部分，一部分作为训练样本，另一部分作为测试样本，以用于训练。该过程中，为适应不同天气条件下的雾浓度、学习不同雾浓度下的图像特征，对无雾图像集合成浓度百分比分别为10、20、30、40、50、60、70、80、90、100的雾，得到有雾图像集。挑选有雾图像和无雾图像共计2000对作为训练样本，剩余400对图像作为测试样本。

步骤3，将步骤2中HDF5格式的训练样本作为输入，设计融合特征金字塔的生成对抗网络，该融合特征金字塔的生成对抗网络包括：由卷积神经网络构成的判别器网络和融合特征金字塔的生成器网络。

如图2所示，是本发明方法实施例中判别器网络的结构示意图，判别器网络包括自左至右顺序连接的一个卷积激活层、5个彼此串联的编码单元提取特征层、一个全连接层和一个sigmoid激活层。

卷积激活层包括一个Conv卷积层和一个Relu激活层，卷积层的通道数为32，步长为2，卷积核大小为3×3，激活层采用修正线性单元ReLU激活函数对卷积的输出结果F ₁进行非线性回归，从而获得

其表达式如下：

每个编码单元提取特征层包括依次串联的一个Conv卷积层、一个批归一化层(BatchNorm)和一个激活层(Relu)，五个编码单元提取特征层依次串联，其对应的卷积层参数如表1所示：

表1：编码单元提取特征层中对应的卷积层参数

层序号

1

2

3

4

5

通道数n	32	64	128	256	512
步长s	2	2	2	2	1
卷积核k	3×3	3×3	3×3	3×3	3×3

在编码单元提取特征层进行特征提取后，还需要进行一个1*1的卷积(Conv)，以减少通道数进而降低计算量，全连接层(FC)位于该卷积层之后，可以将其提取到的特征进行分类，然后使用sigmoid函数对其分类结果进行归一化，其计算式如下所示：

该函数可以将其全连接层结果约束到[0,1]，其输出结果即判别器判定输入图像为真实无雾图像的概率。

如图3所示，是本发明方法实施例中生成器网络的结构示意图，生成器网络包括顺序连接的一个特征提取的骨干网络、一个特征融合的特征金字塔和一个特征还原的图像重建网络。

骨干网络为预训练好的MobileNet-V2网络，其输出为4个不同尺度的特征图，分别为MobileNet-V2网络的“block_2_project”、“block_4_project”、“block_7_project”和“block_11_project”层的输出图像，对应尺寸分别为112×112、56×56、28×28和17×17。特征图输入特征金字塔进行特征融合前，先进行一个1×1的卷积，以减小网络的计算量。

特征金字塔第一层的操作为一个卷积核为256×3×3，步长为1的卷积层，一个Relu的激活层，输出激活后的特征图。之后的每一层操作依次为一个2×2的反卷积层，一个与输入特征图的元素相加层，一个卷积核为256×3×3，步长为1的卷积层和一个Relu的激活层，激活后的特征图即为输出特征图。

图像重建网络将特征金字塔的输出特征图通过反卷积调整为大小一致，然后再将其连接为一个特征图，通过卷积、激活、反卷积和元素相加融合进行图像的重建，在最后一个重建层选择输入原始有雾图像进行相加操作以增强图像的低频细节。

步骤4，构建损失函数。

对于判别器网络，其损失函数为：

式中，L _D为判别器网络的损失函数，

为判别器对于生成器生成的第i个生成图像的判别结果，

对于生成器网络的损失函数，其损失函数为：

式中，L _G为生成器网络的损失函数，

为生成器生成的第i个生成图像，

为判别器对于生成器生成的第i个生成图像的判别结果，

为判别器对于训练样本集中第i个标签图像的判别结果，N为训练样本集中图像的对数，λ为加权系数权重，其取值为0.01。

在该等式中，右侧第一项

是内容损失项，用于计算图像的像素损失。右侧第二项

是对抗损失项，用于计算对抗网络中的损失。

可以看出，判别器的损失为对样本图像和标签图像的判定概率之差，当生成器的效果达到最好时，判定器无法判断一张图像是去雾的图像还是无雾的图像，即判定器的损失函数结果为0.5。在该状态下生成器能够产生最接近真实无雾图像的结果。

训练时，首先对W _ji和B _ji进行初始化。网络模型每层的权重均使用平均值为0和标准偏差为0.001的高斯分布随机初始化滤波器权重，即W _ji中的各项分量。初始化B _ji为0。

初始化完成后，使用随机梯度下降算法来更新权重W _ji和偏置B _ji，更新规则服从如下公式：

式中，α为学习速率。上述两个公式中的偏导数可以由反向传播算法求出，即对损失函数公式分别求W _ji的偏导

和B _ji的偏导

其表达式如下：

其中，反向传播算法主要步骤是：首先，将给定样本进行前向传递，得到全部网络神经节点的输出值。然后，计算出总误差，并用总误差对某个节点进行求偏导，可得到该节点对最终输出的影响。

因此，完整的网络模型训练步骤如下：

对网络各层参数进行初始化。

对每个样本i，

a:利用反向传播求出

和

b:求出参数W _ji和B _ji的变化量，其中初始化

和

均为0：

c：完成参数更新：

d：将更新后W _ji和B _ji代入损失函数，重复执行步骤a至步骤d，直至判定器损失函数为0.5，更新结束，进入步骤5。

步骤5，将新的有雾图像输入训练好的融合特征金字塔的生成对抗网络的生成器中，得到的输出结果作为该新的有雾图像去雾后的无雾图像。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种融合特征金字塔的生成对抗网络图像去雾方法，其特征是，包括如下步骤：

将有雾图像输入预先训练好的生成对抗网络，获取与有雾图像相对应的无雾图像；所述生成对抗网络包括：生成器网络和判别器网络；

生成对抗网络的生成器网络融合有特征金字塔。
根据权利要求1所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，生成对抗网络的判别器网络包括：顺序连接的卷积激活层、编码单元提取特征层、全连接层和sigmoid激活层，所述编码单元提取特征层不少于两个且彼此串联。
根据权利要求1所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，所述生成器网络包括：顺序连接的骨干网络、特征金字塔和图像重建网络；

所述无雾图像的获取方法，包括：

所述骨干网络对所输入的有雾图像进行特征提取；

所述特征金字塔对所提取的特征进行特征融合；

所述图像重建网络对所融合的特征进行还原，输出与有雾图像相对应的无雾图像。
根据权利要求3所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，所述骨干网络采用预先训练好的MobileNet-V2网络；

所述骨干网络对所输入的有雾图像进行特征提取，包括：MobileNet-V2网络响应于所输入的有雾图像，输出不少于两个不同尺度的特征图。
根据权利要求4所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，在所述特征金字塔对所提取的特征进行特征融合之前，还包括：对MobileNet-V2网络所输出的特征图进行1*1卷积运算。
根据权利要求1所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，生成对抗网络的训练方法，包括：

基于预获取的不少于两张有雾图像以及与之相对应的无雾图像，构建训练样本集；

以判别器网络的损失函数趋向于0.5、生成器网络的损失函数趋向于0为目标，将所述训练样本集中的图像输入生成对抗网络对其进行训练，直至获取训练好的生成对抗网络。
根据权利要求6所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，判别器网络的损失函数，其表达式如下：

式中，L _D为判别器网络的损失函数，
为判别器对于生成器生成的第i个生成图像的判别结果，
为判别器对于训练样本集中第i个标签图像的判别结果，N为训练样本集中图像的对数。
根据权利要求6所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，生成器网络的损失函数，其表达式如下：

式中，L _G为生成器网络的损失函数，
为生成器生成的第i个生成图像，
为训练样本集中第i个标签图像，C为图像的通道，W×H为图像的尺寸，
为判别器对于生成器生成的第i个生成图像的判别结果，
为判别器对于训练样本集中第i个标签图像的判别结果，N为训练样本集中图像的对数，λ为加权系数权重。
根据权利要求6所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，在将所述训练样本集中的图像输入生成对抗网络对其进行训练之前，还包括：使用平均值为0和标准偏差为0.001的高斯分布随机初始化权重W _ji中的各项分量，令偏置B _ji为0。
根据权利要求9所述的融合特征金字塔的生成对抗网络图像去雾方法，其特征是，将所述训练样本集中的图像输入生成对抗网络对其进行训练，包括：

根据训练结果更新权重W _ji和偏置B _ji；

将更新后的权重W _ji和偏置B _ji代入损失函数；

重复权重W _ji和偏置B _ji的更新和代入过程，直至判别器网络的损失函数为0.5，获取训练好的生成对抗网络。