CN112614070A

CN112614070A - 一种基于DefogNet的单幅图像去雾方法

Info

Publication number: CN112614070A
Application number: CN202011576883.2A
Authority: CN
Inventors: 陈苏婷; 范文昊
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-04-06
Anticipated expiration: 2040-12-28
Also published as: CN112614070B

Abstract

本发明公开了一种基于DefogNet的单幅图像去雾方法，该方法以CycleGAN为基础进行适当优化，在生成器中采用跨层连接的结构，增加了模型的多尺度特征提取能力，有效避免过拟合的发生，从而优化图像的质量；设计了独特的损失函数，添加细节感知损失和色彩感知损失，避免去雾操作导致图像的颜色差异、重建缺失等情况，有效提高了去雾后图像的还原度；提出了Defog‑SN算法改进了判别器的结构，使得整个判别网络满足1‑Lipschitz连续，增强了模型的稳定性，有效避免了GANs网络易崩溃的问题。该方法仅仅需要大量的图像便能够顺利达到训练网络的目的，完全省略了人为提取特征的操作，并且不需要场景先验信息，具备了更强的实用性以及精确度，属于一种适应范围较广的方法。

Description

一种基于DefogNet的单幅图像去雾方法

技术领域

本发明涉及图像处理领域，尤其涉及一种基于DefogNet的单幅图像去雾方法。

背景技术

雾、霾等天气环境下采集的图像往往存在对比度低、场景不清晰、颜色误差较大等问题，易对目标检测和语义分割等计算机视觉算法的应用产生负面影响。因此，无须使用任何先验信息直接对单幅图像完成去雾处理的方法，在计算机视觉及人工智能领域具有重要的研究价值。目前常见的去雾方法根据原理的不同可以划分为三种：1.图像增强技术，此方法关注的重点主要集中在图像本身的对比度等信息；雾霾图像对比度等信息一定程度上反映了雾霾的严重程度，但针对这类直观信息的方法缺少对雾霾图像形成机理的探究，往往在去雾过程中丢失细节信息，难以达到良好的去雾效果。2.以物理模型为基础的图像复原法，此方法从成像机制上对有雾图片展开研究，主要通过先验知识和物理模型相结合的方式完成去雾操作，但须估算先验信息。3.以神经网络为基础的去雾方法，此方法主要使用神经网络来完成雾霾特征提取，由此完成去雾处理。这些方法训练时往往对带雾图像和其相对应的无雾图像具有真实性的要求，数据要求高，获取难度大，且去雾结果存在边缘细节信息丢失、模型稳定性不足等问题。

发明内容

发明目的：针对以上问题，本发明提出一种基于DefogNet的单幅图像去雾方法。

技术方案：为实现本发明的目的，本发明所采用的技术方案是：一种基于DefogNet的单幅图像去雾方法，具体方法如下：

在训练阶段，首先构建有雾图像样本数据集X和无雾图像样本数据集Y，同时构造DefogNet网络训练模型，利用有雾图像样本数据集X和无雾图像样本数据集Y训练所述DefogNet网络训练模型，得到最终DefogNet网络模型；

在测试阶段，首先将有雾图像归一化至特定尺寸，然后将归一化后的有雾图像输入至DefogNet网络模型，输出得到生成的去雾图像；

其中，所述DefogNet网络模型具体包括：

第一生成器和第二生成器，所述第一生成器用于接收输入带雾图像和合成的带雾图像，生成对应的去雾图像；所述第二生成器用于接收输入无雾图像和合成的无雾图像，生成对应的带雾图像；

第一生成器对应第一判别器，第二生成器对应第二判别器，第一判别器和第二判别器用于判别输入图像来源于真实数据集或合成数据集；

所述DefogNet网络训练模型通过在图像背景保持不变的情况下学习雾霾特征，通过两个生成器和两个判别器的循环对抗中对模型参数进行更新，直至DefogNet网络训练模型目标函数小于设定的阈值，表示训练完成，得到所述DefogNet网络模型。

进一步的，为正确训练样本分布，有效优化最终生成图片的质量，所述DefogNet的网络模型在CycleGAN网络模型的基础上进行改进，具体包括：

在所述第一生成器和第二生成器中加入跨层连接结构增强网络多尺度特征提取的能力，突破编解码过程中信息丢失的瓶颈，摒弃了简单地连接对称层所有通道的方法。

所述第一生成器和第二生成器的网络结构均为编码器-转换器-解码器；所述编码器及解码器采用卷积层、激活层、BN层；转换器采用Dense block的稠密连接结构，包括卷积层和激活层；

其中，编解码器和解码器中的激活层使用Leaky ReLU激活函数：

其中x为上层卷积的输入；

转换器中的激活层使用SeLU激活函数，能够将样本分布自动归一化至均值为0以及标准差为1，所述SeLU激活函数：

其中x为上层卷积的输入；α、λ为系数；

进一步的，所述第一判别器和第二判别器均采用CNN网络模型，共6个层级结构，每个层级包括卷积层、激活层、BN层和谱归一化层。

本发明对已被提出的CycleGAN损失函数进行改进，以原始CycleGAN损失函数为基础，添加色彩感知损失函数以及细节感知损失函数，用于估计图像在经过去雾处理之后产生的差异性。

所述DefogNet的损失函数由原始CycleGAN损失函数、色彩感知损失函数以及细节感知损失函数构成：

L_defog＝L_CYC+L_dpl+L_cpl(I)

式中，L_defog为DefogNet网络模型的损失函数；L_CYC为CycleGAN网络模型的损失函数；L_dpl为细节感知损失函数；L_cpl(I)为色彩感知损失函数。

进一步的CycleGAN网络模型的损失函数由生成器与判别器的对抗损失函数和循环一致性损失函数构成：

L_CYC＝L_GAN(G，D_Y，X，Y)+L_GAN(F，D_X，X，Y)+γL_CCL

式中，L_CYC为CycleGAN损失函数；L_GAN(G，D_Y，X，Y)表示判别器对真实样本的概率估计；L_GAN(F，D_X，X，Y)表示判别器对生成样本的概率估计；γ为循环一致损失的权重；L_CCL为循环一致性损失函数。

进一步的，所述生成对抗损失函数由判别器对真实样本的概率估计以及判别器对生成样本的概率估计构成，相关公式：

式中，L_GAN(G，D_Y，X，Y)表示判别器对真实样本的概率估计；

表示数据域X内的样本数据x的期望分布；

表示数据域Y内的样本数据y的期望分布；L_GAN(F，D_X，X，Y)表示判别器对生成样本的概率估计；X、Y分别表示两个数据域；x表示数据域X内的样本数据；y表示数据域Y内的样本数据；G表示X到Y的映射函数；F表示Y到X的映射函数；D_X、D_Y分别表示第一判别器和第二判别器；

进一步的，所述循环一致性损失函数：

式中，L_CCL为循环一致性损失函数；φ(x)为数据域X内的样本数据的正态分布；φ(y)为数据域Y内的样本数据的正态分布；φ(F(G(x)))为；φ(G(F(y)))为；

进一步的，为降低生成图片与原图的差异，加入了细节感知损失函数，所述细节感知损失函数由第一生成器和第二生成器的细节感知损失函数构成；其中，DefogNet的细节感知损失函数：

L_dpl＝L_dpl(F_X→Y)+L_dpl(G_Y→X)

式中，L_dpl为DefogNet的细节感知损失函数；L_dpl(G_X→Y)为第一生成器的细节感知损失函数；L_dpl(F_Y→X)为第二生成器的细节感知损失函数。

其中，所述第一生成器的细节感知损失函数：

式中，L_dpl(G_X→Y)为第一生成器的细节感知损失函数；

为数据域X内的样本数据的期望概率分布；

为数据域Y内的样本数据的期望概率分布。

所述第二生成器的细节感知损失函数：

式中，L_dpl(F_Y→X)为第二生成器的细节感知损失函数；

进一步的，去雾处理过程需要对rgb三种类型的通道完成相同的操作，同时还需要保持去雾完成后的图像细节不产生较大的差异，因此在生成图像时加入色彩感知损失函数；所述色彩感知损失函数：

式中，L_cpl(I)为DefogNet的色彩感知损失函数；W为图片的宽；H为图片的高；rgb表示色光的彩色模式，r表示红色，g表示绿色，b表示蓝色。

本发明还提出一种Defog-SN算法，能够解决生成样本多样性不足的问题，提高去雾图像的质量，进一步提升网络整体的稳定性以及收敛速度，具体在所述第一判别器和第二判别器的卷积层中均添加谱归一化层，令判别网络满足1-Lipschitz连续，同时利用梯度惩罚增强了Lipschitz约束条件，得到DefogNet网络模型的目标函数。

进一步的，在所述第一判别器和第二判别器的卷积层中均添加谱归一化层，令判别网络满足1-Lipschitz连续，具体包括：

卷积层参数矩阵W满足1-Lipschitz连续，需满足如下关系式：

式中，W_SN为归一化后的卷积层参数矩阵；W为卷积层参数矩阵；σ(W)为卷积层参数矩阵W的谱范数，且该谱范数等于卷积层参数矩阵W的最大奇异值；

其中，谱范数σ(W)的计算公式如下：

式中，h表示任意一卷积层；

进一步的，卷积层参数矩阵W的最大奇异值利用其左右奇异值向量得到，具体包括：

首先，随机初始化向量u，并将向量u作为参数矩阵W的右奇异值向量；

然后，根据右奇异值向量u通过以下公式计算左奇异值向量v：

式中，v为参数矩阵W的左奇异值向量；W为卷积层参数矩阵；u为参数矩阵W的右奇异值向量；

接着，将计算得到的左奇异值向量v计算得到新的右奇异值向量u：

最后，通过重复迭代，直到卷积层参数矩阵的奇异值达到最大；其中卷积层的奇异值计算公式：

式中，

为W^TW最大特征值的开方，即卷积层参数矩阵W的最大奇异值。

进一步的，本发明提出了计算具有任意步长和填充方案的判别器的卷积层的最大奇异值，同时通过反卷积运算简化和加快卷积谱范数的计算，具体包括：

神经网络中判别器第i层的输出特征图ψ_i(X)可表示为输入数据域X的线性运算：

式中，M是输入的特征图的全部像素点；F_i，j为滤波器；j为坐标点；

对数据域X进行矢量化处理，使得T_i，j表示为与F_i，j相关的整体线性运算：

ψ_i(X)＝[T_1，1 … T_1，M]X

卷积运算表示为：

通过转置卷积参数矩阵W得到W^T，无需显式构造W就可以实现矩阵乘法，从而得到谱范数σ(W)；

这样，通过幂迭代方法获得谱范数σ(W)，并在卷积和卷积转置运算中添加适当的步长和填充参数。在每一层卷积运算中使用相同的u，每个步骤仅更新一次W，并使用更大的范围来限制σ(W)≤β，这样可以加快训练速度：

其中，β为常数；

进一步的，本发明使用Wasserstein距离衡量生成的分布p_g和实际分布Pdata是否符合要求。由于引入了1-lipschitz连续性，网络参数的变化范围需要限制在一定范围内，即每次更新时参数的变化范围都不应超过某个常数β。因此，实际数据分布p_data与生成的数据分布p_g之间的Wasserstein距离可以表示为：

式中，D_w为实际数据分布p_data与生成的数据分布p_g之间的Wasserstein距离；

为实际数据的期望分布；

为生成数据的期望分布；

其中D_w越小，生成分布p_g越接近于真实分布P_data。

由于引入了频谱归一化，该函数在任何情况下都是可微的，可以解决Gan模型训练过程中梯度消失的问题。此时判别器的目标函数如下：

式中，obj^D为判别器的目标函数；

本发明还通过梯度惩罚增强了Lipschitz约束条件，具体包括：

首先，使用随机采样方法获得真实样本X_data，错误样本X_g和[0，1]范围内的随机数θ：

X_data～P_data，X_g～p_g，θ～uniform[0，1]

式中，X_data～P_data表示真实样本服从真实分布；X_g～p_g表示错误样本服从生成分布；θ～uniform[0，1]表示随机数服从随机函数分布；

然后，在真实样本X_data和错误样本X_g之间随机插入样本

其中，

满足的分布表示为

最后，得到DefogNet网络模型的目标函数为：

式中，obj^(G，D)表示DefogNet网络模型的目标函数值。

有益效果：与现有技术相比，本发明的技术方案具有以下有益技术效果：

针对当前大多采用先验知识方法中设计先验物理模型复杂，特征提取不完备，并且去雾处理效率低的问题。本发明在生成器中添加了跨层连接的设计，通过训练DefogNet得到最优生成网络G，直接生成无雾图，省略了人工设计先验模型的环节，既不需要模糊和真实图像的样本，也不需要在训练和测试阶段的任何大气散射模型参数。

针对去雾操作中产生的颜色偏移、对比度过高，导致颜色失真等情况，本发明设计了独特的损失函数：细节感知损失和色彩感知损失，用以优化对单幅图像进行去雾处理的DefogNet。

本发明在判别网络中引入谱归一化，提出Defog-SN算法，该算法的泛化能力强，有效地解决了生成样本多样性不足的问题，提高了去雾图像的质量，进一步提升网络整体的稳定性以及收敛速度。

附图说明

图1是本发明去雾方法的总体流程图；

图2是本发明DefogNet的网络结构示意图；

图3是本发明DefogNet的生成器结构示意图；

图4是本发明DefogNet的判别器结构示意图。

具体实施方式

下面结合附图和实施例对本发明的技术方案作进一步的说明。

本发明所述的一种基于DefogNet的单幅图像去雾方法，通过DefogNet的去雾方法在保证图像背景和结构不变的条件下实现图像去雾，生成清晰图像。

本发明的训练集和验证集中的有雾和无雾图像采用开源数据集RESIDE、I-HAZE、O-HAZE中的图像。RESIDE的室外数据集包含8970幅清晰无雾图像和根据清晰图像合成的313950幅有雾图像。O-HAZE是一个室外场景数据库，包含45对室外场景的真实有雾图像和相应的无雾图像。I-HAZE包含了35对室内真实场景的有雾图像及相应的无雾图像。本发明从I-HAZE、O-HAZE以及RESIDE中随机抽取4900张用于训练以及验证。随机抽取的有雾图像为域X；随机抽取的无雾图像为域Y。

一种基于DefogNet的单幅图像去雾方法，具体方法如下：

其中，所述DefogNet网络模型具体包括：

其中，编解码器和解码器中的激活层使用Leaky ReLU激活函数：

其中x为上层卷积的输入；

其中x为上层卷积的输入；α、λ为系数；

L_defog＝L_CYC+L_dpl+L_cpl(I)

L_CYC＝L_GAN(G，D_Y，X，Y)+L_GAN(F，D_X，X，Y)+γL_CCL

式中，L_GAN(G，D_Y，X，Y)表示判别器对真实样本的概率估计；

表示数据域X内的样本数据x的期望分布；

进一步的，所述循环一致性损失函数：

L_dpl＝L_dpl(F_X→Y)+L_dpl(G_Y→X)

其中，所述第一生成器的细节感知损失函数：

式中，L_dpl(G_X→Y)为第一生成器的细节感知损失函数；

为数据域X内的样本数据的期望概率分布；

为数据域Y内的样本数据的期望概率分布。

所述第二生成器的细节感知损失函数：

式中，L_dpl(F_Y→X)为第二生成器的细节感知损失函数；

卷积层参数矩阵W满足1-Lipschitz连续，需满足如下关系式：

其中，谱范数σ(W)的计算公式如下：

式中，h表示任意一卷积层；

式中，

ψ_i(X)＝[T_1，1 … T_1，M]X

卷积运算表示为：

其中，β为常数；

进一步的，本发明使用Wasserstein距离衡量生成的分布p_g和实际分布p_data是否符合要求。由于引入了1-lipschitz连续性，网络参数的变化范围需要限制在一定范围内，即每次更新时参数的变化范围都不应超过某个常数β。因此，实际数据分布p_data与生成的数据分布p_g之间的Wasserstein距离可以表示为：

为实际数据的期望分布；

为生成数据的期望分布；

其中D_w越小，生成分布p_g越接近于真实分布p_data。

式中，obj^D为判别器的目标函数；

本发明还通过梯度惩罚增强了Lipschitz约束条件，具体包括：

X_data～p_data，X_g～p_g，θ～uniform[0，1]

然后，在真实样本X_data和错误样本X_g之间随机插入样本

：

其中，

满足的分布表示为

最后，得到DefogNet网络模型的目标函数为：

式中，obj^(G，D)表示DefogNet网络模型的目标函数值。

Claims

1.一种基于DefogNet的单幅图像去雾方法，其特征在于，该方法包括如下步骤：

其中，所述DefogNet网络模型具体包括：

2.根据权利要求1所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，所述第一生成器和第二生成器的网络结构均为编码器-转换器-解码器；所述编码器及解码器采用卷积层、激活层、BN层；转换器采用Dense block的稠密连接结构，包括卷积层和激活层；

所述第一判别器和第二判别器均采用CNN网络模型，共6个层级结构，每个层级包括卷积层、激活层、BN层和谱归一化层。

3.根据权利要求2所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，所述编解码器和解码器中的激活层使用Leaky ReLU激活函数：

式中，x为上层卷积的输入；

所述转换器中的激活层使用SeLU激活函数：

式中，x为上层卷积的输入；α、λ为系数。

4.根据权利要求3所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，添加细节感知损失与色彩感知损失，构成了DefogNet的损失函数：

L_defog＝L_CYC+L_dpl+L_cpl(I)

式中，L_defog为DefogNet的损失函数；L_CYC为CycleGAN损失函数；L_dpl为细节感知损失函数；L_cpl(I)为色彩感知损失函数；

所述CycleGAN损失函数由生成器与判别器的对抗损失函数和循环一致性损失函数构成：

L_CYC＝L_GAN(G，D_Y，X，Y)+L_GAN(F，D_X，X，Y)+γL_CCL

5.根据权利要求4所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，所述细节感知损失包括：

(1)第一生成器的细节感知损失函数：

式中，L_dpl(G_X→Y)为第一生成器的细节感知损失函数；X、Y表示两个数据域；x表示数据域X内的样本数据；y表示数据域Y内的样本数据；G表示X到Y的映射函数，F表示Y到X的映射函数；D_X、D_Y分别表示第一判别器和第二判别器；

为数据域X内的样本数据的期望分布；

为数据域Y内的样本数据的期望分布；

(2)第二生成器的细节感知损失函数：

式中，L_dpl(F_Y→X)为第二生成器的细节感知损失函数；

(3)所述第一生成器和第二生成器的细节感知损失函数构成DefogNet的细节感知损失函数：

L_dpl＝L_dpl(F_X→Y)+L_dpl(G_Y→X)

式中，L_dpl为DefogNet的细节感知损失函数。

6.根据权利要求4所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，所述色彩感知损失：

式中，L_cpl(I)为DefogNet的色彩感知损失函数；W为图片的宽；H为图片的高；r g b表示色光的彩色模式，r表示红色，g表示绿色，b表示蓝色。

7.根据权利要求3所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，在所述第一判别器和第二判别器的卷积层中均添加谱归一化层，令判别网络满足1-LipsChitz连续，具体包括：

卷积层参数矩阵W满足1-Lipschitz连续，需满足如下关系式：

其中，卷积层参数矩阵W的最大奇异值利用其左右奇异值向量得到，具体通过随机初始化向量u，并将向量u作为参数矩阵W的右奇异值向量；然后通过下列计算式反复迭代，直到卷积层参数矩阵的奇异值达到最大；其中计算式：

为W^TW最大特征值的开方，即卷积层参数矩阵W的最大奇异值；

其中，所述谱范数σ(W)的计算公式如下：

式中，h表示任意一卷积层。

8.根据权利要求7所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，计算卷积层的最大奇异值过程中通过反卷积运算简化和加快卷积谱范数的计算，具体包括：

对数据域X通过卷积运算进行矢量化处理，使得T_i，j表示为与F_i，j相关的整体线性运算：

ψ_i(X)＝[T_1，1 … T_1，M]X

其中，卷积运算表示为：

通过转置卷积参数矩阵得到W^T，进而得到谱范数σ(W)；

通过幂迭代方法获得谱范数σ(W)，并在卷积和卷积转置运算中添加一定的步长和填充参数，同时在每一层卷积运算中均使用相同的右奇异值向量u，每个步骤仅更新一次W，并使用更大的范围来限制σ(W)≤β，得到加快训练速度的作用；其中，归一化后的卷积层参数矩阵的计算公式为：

式中，β为常数。

9.根据权利要求8所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，令判别网络满足1-Lipschitz连续过程中利用梯度惩罚增强了Lipschitz约束条件，得到DefogNet网络模型的目标函数，具体包括：

X_data～p_data，X_g～p_g，θ～uniform[0，1]

然后，在真实样本X_data和错误样本X_g之间随机插入样本

其中，

满足的分布表示为

最后，得到DefogNet网络模型的目标函数为：

式中，obj^(G，D)表示DefogNet网络模型的目标函数值。

10.根据权利要求9所述的一种基于DefogNet的单幅图像去雾方法，其特征在于，生成的分布p_g和实际分布p_data通过Wasserstein距离判断是否符合要求，具体包括：

设置阈值，若计算得到的Wasserstein距离小于阈值，则表示生成的分布p_g符合要求；否则，不符合要求；其中，Wasserstein距离计算式为：

为实际数据的期望分布；

为生成数据的期望分布。