CN111861939A

CN111861939A - 一种基于无监督学习的单张图像去雾方法

Info

Publication number: CN111861939A
Application number: CN202010750386.3A
Authority: CN
Inventors: 彭玺; 李伯运; 缑元彪
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2020-07-30
Filing date: 2020-07-30
Publication date: 2020-10-30
Anticipated expiration: 2040-07-30
Also published as: CN111861939B

Abstract

本发明公开了一种基于无监督学习的单张图像去雾方法，包括S1、构建图像去雾模型；S2、将有雾图像输入到图像去雾模型中，获得对应折射率图像f_T(x)和大气光照图像f_A(x)；S3、利用有雾图像及其f_T(x)和f_A(x)，通过大气散射模型的确定干净图像，实现单张图像去雾。本发明只需要一张有雾的图片即可进行模型训练，并输出对应的干净图片，节省了大量人力，避免了由于生成数据集质量差而导致的去雾图片失真的情况；将图像先验信息与网络相结合，相对于基于先验的单张图片去雾方法效果更佳；除可实现单张图像去雾，同时还可以利用模型输出结果对单张图像进行增雾，以生成大规模的有雾图像数据集，避免了传统的图像增雾方法因图像深度信息估计错误而导致的图像失真现象。

Description

一种基于无监督学习的单张图像去雾方法

技术领域

本发明属于图像处理技术领域，具体涉及一种基于无监督学习的单张图像去雾方法。

背景技术

雾是一种由烟尘、蒸汽等颗粒引起的常见自然现象。在摄像机成像过程中，这些漂浮的颗粒折射了场景的反射光，同时引入了空气中的环境光，使得摄像机拍出来的雾天图像相对于晴天图像模糊、偏色且可视距离短。含雾图片的这些特点不仅影响了图片的视觉效果，而且对于高层的计算机视觉算法同样有抑制作用。以有雾图片作为输入时，物体检测、目标识别、分类等算法的效果都会有所下降，这极大的影响了自动驾驶、智能安防等应用的落地。

现有的图像去雾方法主要分为两类，即基于先验的图像去雾算法和数据驱动的图像去雾算法。具体的，基于先验的图像去雾算法主要是通过使用人工设定的图像先验来进行去雾，例如，通过假设干净图像比有雾图像对比度更高，增强有雾图像的局部对比度来实现去雾效果；另外也可通过彩色衰减先验，利用图片饱和度和亮度的差值估计图像深度，进而实现去雾效果。基于图像先验的去雾算法不依赖大规模数据集且可解释性强，所以取得了巨大的成功，但是由于基于先验的去雾算法严重依赖先验信息且先验信息往往存在诸多局限性，去雾结果有时难以令人满意，鲁棒性较差。近年来，随着深度学习技术的发展，数据驱动的图像去雾算法应运而生，构建基于神经网络的去雾网络，通过大量感觉-有雾图像对其进行训练，获得去雾网络，另外一种是多尺度去雾网络，通过同时优化粗尺度和细尺度网络来实现去雾效果，这些方法去雾效果好，鲁棒性腔，但往往需要人工生成大量数据集，这使得数据驱动的图像去雾算法需要消耗大量人工，而且去雾效果也极大的依赖数据集的内容。

发明内容

针对现有技术中的上述不足，本发明提供的基于无监督学习的单张图像去雾方法解决了现有的图像去雾方法依赖先验和大规模数据集的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于无监督学习的单张图像去雾方法，包括以下步骤：

S1、构建图像去雾模型；

S2、将原始有雾图像x输入到图像去雾模型中，获得原始有雾图像对应折射率图像f_T(x)和大气光照图像f_A(x)；

S3、利用原始有雾图像x及其对应的f_T(x)和f_A(x)，通过大气散射模型的确定原始有雾图像对应的干净图像，实现单张图像去雾。

进一步地，所述步骤S1中的图像去雾模型包括三个并列的J-Net网络、T-Net网络和A-Net网络；

所述J-Net网络输出初步干净图像进而确定图像去雾模型的重构损失，用于辅助图像去雾模型的训练；

所述T-Net网络用于输出原始有雾图像对应的折射率图像；

所述A-Net网络用于输出原始有雾图像对应的大气光照图像。

进一步地，所述图像去雾模型的训练方法为：

A1、为图像去雾模型中的J-Net网络、T-Net网络和A-Net网络添加不同的损失函数；

A2、将一张有雾图像输入到图像去雾模型的三个网络中；

A3、在图像去雾模型对输入图像处理过程中，将每个网络的损失函数值通过梯度反向传播回对应的网络中，优化对应的网络参数，获得对应网络输出，完成图像去雾模型的训练。

进一步地，所述步骤S1中的图像去雾模型的损失函数L为：

L＝L_Rec+L_J+L_H+L_KL+λL_Reg

式中，L_Rec为重构损失，L_J为J-Net网络的先验损失，L_H为加在A-Net网络的线索先验，L_KL为相对熵损失，L_Reg为平滑损失，λ为参数项。

进一步地，所述重构损失L_Rec为：

L_Rec＝|I(x)-x|_p

式中，x是输入的有雾图像，I(x)为通过J-Net、T-Net和A-Net网络的输出结果重构出的有雾图像，下标p为范数标号，I(x)＝f_J(x)f_T(x)+f_A(1-f_T(x))，f_J(x)为J-Net网络输出的初步干净图像，f_T(x)为T-Net网络输出的有雾图像对应的折射率图像，f_A(x)为A-Net网络输出的有雾图像对应的大气光照图像；

在所述J-Net网络中，将输入有雾图像的颜色衰减作为J-Net网络的输出引导，得到先验损失L_J为：

L_J＝|V(f_J(x))-S(f_J(x))|_p

式中，V和S分别为初步干净图像f_J(x)在HSV空间中的明亮度值和饱和度值；

在所述A-Net网络中，通过无监督的方法获取输入有雾图像的全局光照作为A-Net网络的约束，得到线索先验L_H为：

L_H＝|f_A(x)-A(x)|_p

式中，A(x)通过无监督方法获得的输入有雾图像的全局光照；

在所述A-Net网络中，将A-Net网络的隐层空间约束至标准高斯分布，得到相对熵损失L_KL为：

式中，

为隐变量z的第i维均值，

为隐变量z的第i维方差；

在所述A-Net网络中，对A-Net网络输出的大气光照图像进行平滑约束，得到平滑损失L_Reg为：

式中，x_j为大气光照图像中第j个像素点位置，N(x_i)为x_i的二阶近邻，m为大气光照图中的像素点总数。

进一步地，所述步骤S3中，原始有雾图像对应的干净图像J为：

进一步地，所述J-Net网络和T-Net网络的网络结构相同，均包括依次连接的四个第一特征提取模块和第一输出模块；

每个所述第一特征提取模块均包括依次连接的第一卷积层、第一归一化层和第一非线性激活层；所述第一输出模块包括依次连接的第二卷积层和第二非线性激活层。

进一步地，在所述J-Net网络中：

每个所述第一特征提取模块中的第一卷积层的输入通道为3，输出通道为3，卷积核大小为5×5，步长为1，填充为2，所述第一非线性激活层中的激活函数LeakReLU函数；所述第一输出模块中的第二卷积层的输入通道为3，输出通道为3、卷积核大小为5×5，步长为1，填充为2，所述第二非线性激活层中的激活函数为Sigmoid函数；

在所述T-Net网络中：

第一个所述第一特征提取模块中第一卷积层的输入通道为3，输出通道为1，卷积核大小为5×5，步长为1，填充为2；第二个所述第一特征提取模块、第三个所述第一特征提取模块和第四个所述第一特征提取模块中第一卷积层的输入通道均为1、输出通道均为1、卷积核大小均为5×5，步长均为1，填充均为2，所述第一非线性激活层中的激活函数LeakReLU函数；所述第一输出模块中的第二卷积层的输入通道为1，输出通道为1，卷积核大小为5×5，步长为1，填充为2，所述第二非线性激活层中的激活函数为Sigmoid函数。

进一步地，所述A-Net网络包括依次连接的编码器、两个并列的第一全连接层、第二全连接层和解码器；

所述编码器包括依次连接的四个第二特征提取模块，每个所述第二特征模块包括依次连接的第三卷积层、第三非线性激活层和最大池化层；

所述解码器包括依次连接的三个第三特征提取模块和一个第二输出模块，每个所述第三特征提取模块包括依次连接的上采样层、第四卷积层、第二归一化层和第四非线性激活层，所述第二输出模块包括依次连接的第五卷积层和第五非线性激活层。

进一步地，在所述A-Net网络的编码器中：

第一个所述第二特征提取模块中的第三卷积层的输入通道为3，输出通道为16，卷积核大小为5×5，步长为1，填充为2；第二个所述第二特征提取模块中的第三卷积层的输入通道为16，输出通道为32，卷积核大小为5×5，步长为1，填充为2；第三个所述第二特征提取模块中的第三卷积层的输入通道为32，输出通道为64，卷积核大小为5×5，步长为1，填充为2；第四个所述第二特征提取模块中的第三卷积层的输入通道为64，输出通道为128，卷积核大小为5×5，步长为1，填充为2；每个所述第二特征提取模块中的第三非线性激活层中的激活函数为ReLU函数，最大池化层的步长为2；

在所述A-Net网络的解码器中：

第一个所述第三特征提取模块中的第四卷积层的输入通道为128，输出通道为64，卷积核大小为5×5，步长为1，填充为2；第二个所述第三特征提取模块中的第四卷积层的输入通道为64，输出通道为32，卷积核大小为5×5，步长为1，填充为2；第三个所述第三特征提取模块中的第四卷积层的输入通道为32，输出通道为16，卷积核大小为5×5，步长为1，填充为2，所述第三特征提取模块中的第四非线性激活层中激活函数为ReLU激活函数；所述第二输出模块中的第五卷积层的输入通道为16，输出通道为3，卷积核大小为5×5，步长为1，填充为2，所述第二输出模块中的第五非线性激活层中激活函数为Sigmoid函数。

本发明的有益效果为：

1)本发明首次提出无需在大规模数据集上训练的单张图像去雾模型，不需要大量人工生成的数据集，只需要一张有雾的图片即可进行模型训练，并输出对应的干净图片，节省了大量人力，并且避免了由于生成数据集质量差而导致的去雾图片失真的情况；

2)本发明将图像先验信息与网络相结合，相对于基于先验的单张图片去雾方法效果更佳；

3)本发明除了可以实现单张图像去雾，同时还可以利用模型输出结果对单张图像进行增雾，以生成大规模的有雾图像数据集，避免了传统的图像增雾方法因图像深度信息估计错误而导致的图像失真现象。

附图说明

图1为本发明提供的基于无监督学习的单张图像去雾方法流程图。

图2为本发明提供的图像去雾模型结构图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

实施例1：

如图1所示，一种基于无监督学习的单张图像去雾方法，包括以下步骤：

S1、构建图像去雾模型；

本实施例的步骤S1中的图像去雾模型包括三个并列的J-Net网络、T-Net网络和A-Net网络；

J-Net网络输出初步干净图像进而确定图像去雾模型的重构损失，用于辅助图像去雾模型的训练；

T-Net网络用于输出原始有雾图像对应的折射率图像；

A-Net网络用于输出原始有雾图像对应的大气光照图像。

具体地，在流程上对于一张输入的有雾图像，我们将其分别输入进J-Net网络、T-Net网络和A-Net网络中，分别获得f_J(x)、f_T(x)和f_A(x)，之后通过大气散射模型利用输入的有雾图像x及其f_T(x)和f_A(x)，求出最终的干净图像J，而J-Net网络及其输出的f_J(x)只在训练过程中起到幅值训练的作用，不参与计算输出，对于J-Net网络的输出f_J(x)我们认为其物理意义是干净图像，但是并不会将其作为最终的干净图像结果输出，因为直接通过J-Net网络学习到的效果较好的干净图像是非常困难的，但是我们需要一个物理含义为干净的图像的输出来使得图像去雾模型的重构损失成立，因此设置J-Net网络起到辅助模型训练的作用。

基于上述过程，对图像去雾模型进行训练的方法具体为：

A2、将一张有雾图像输入到图像去雾模型的三个网络中；

在上述模型训练过程中，之所以只使用一张有雾图像就能对模型进行训练主要有两个原因：在过程上，通过一张有雾图像输入到三个不同的网络，然后获得对应的输出，然后利用干净图像的获得公式计算出最终的干净图像，不需要其他图像辅助；在原理上，主要是通过对三个网络添加不同的损失函数，即使网络具有相同的输入，但其的输出也有不同含义。

本实施例中，图像去雾模型的损失函数L为：

L＝L_Rec+L_J+L_H+L_KL+λL_Reg

具体为：

(1)对于重构损失，其是通过让最后的重构图像和输入图像尽可能相似，在整体上让各网络的输出结果相互影响，将网络整合成一个整体；重构损失主要用以重构输入图像，以间接获得大气散射模型的三个参数，基于此得到重构损失L_Rec为：

L_Rec＝|I(x)-x|_p

(2)对于先验损失L_J：

先验损失L_J是让J-Net输出的符合干净图像的统计特性，保证J-Net输出的是我们想要的干净图像，而不是其他的东西；在J-Net网络中，将输入有雾图像的颜色衰减作为J-Net网络的输出引导，得到先验损失L_J为：

L_J＝|V(f_J(x))-S(f_J(x))|_p

通过最小化先验损失，可以让J-Net网络的输出f_J(x)满足更多的先验信息。

(3)对于线索先验L_H：

线索先验L_H主要是让A-Net的结果是全局光照，而不是其他的东西；在A-Net网络中，通过无监督的方法获取输入有雾图像的全局光照作为A-Net网络的约束，得到线索先验L_H为：

L_H＝|f_A(x)-A(x)|_p

式中，A(x)通过无监督方法获得的输入有雾图像的全局光照；

(4)对于相对熵损失L_KL：

相对熵损失L_KL是为了让全局光照的隐变量能约束到指定分布；在A-Net网络中，将A-Net网络的隐层空间约束至标准高斯分布，便于A-Net网络的后续采样，得到相对熵损失L_KL为：

式中，

为隐变量z的第i维均值，

为隐变量z的第i维方差；

在确定相对熵损失L_KL时，除约束到标准高斯分布外，还可还多逆伽马分布，混合高斯分布等，本实施例采用标准高斯分布主要是是因为我们把雾当成一种与图像内容无关的噪声，并假设其符合高斯分布，所以我们才使用文中所示的网络和损失函数来让其隐变量符合高斯分布；在效果上，经过试验证明，约束到标准高斯分布让网络的效果在PSNR的指标上有了2个点左右的提高。

(5)对于平滑损失L_Reg：

在A-Net网络中，对A-Net网络输出的大气光照图像进行平滑约束，使得A-Net网络生成我们所期望的结果，得到平滑损失L_Reg为：

在上述步骤S3中，利用参数完整的图像去雾模型对有雾图像处理后，得到原始有雾图像对应的干净图像J为：

实施例2：

本实施例中提供了图像去雾模型的具体网络结构，如图2所示：

J-Net网络和T-Net网络的网络结构相同，均包括依次连接的四个第一特征提取模块和第一输出模块；每个第一特征提取模块均包括依次连接的第一卷积层、第一归一化层和第一非线性激活层；第一输出模块包括依次连接的第二卷积层和第二非线性激活层。

具体地，在J-Net网络中：

每个第一特征提取模块中的第一卷积层的输入通道为3，输出通道为3，卷积核大小为5×5，步长为1，填充为2，第一非线性激活层中的激活函数LeakReLU函数；第一输出模块中的第二卷积层的输入通道为3，输出通道为3、卷积核大小为5×5，步长为1，填充为2，第二非线性激活层中的激活函数为Sigmoid函数；

在T-Net网络中：

第一个第一特征提取模块中第一卷积层的输入通道为3，输出通道为1，卷积核大小为5×5，步长为1，填充为2；第二个第一特征提取模块、第三个第一特征提取模块和第四个第一特征提取模块中第一卷积层的输入通道均为1、输出通道均为1、卷积核大小均为5×5，步长均为1，填充均为2，第一非线性激活层中的激活函数LeakReLU函数；第一输出模块中的第二卷积层的输入通道为1，输出通道为1，卷积核大小为5×5，步长为1，填充为2，第二非线性激活层中的激活函数为Sigmoid函数。

图像去雾模型中的A-Net网络包括依次连接的编码器、两个并列的第一全连接层、第二全连接层和解码器；

编码器包括依次连接的四个第二特征提取模块，每个第二特征模块包括依次连接的第三卷积层、第三非线性激活层和最大池化层；解码器包括依次连接的三个第三特征提取模块和一个第二输出模块，每个第三特征提取模块包括依次连接的上采样层、第四卷积层、第二归一化层和第四非线性激活层，第二输出模块包括依次连接的第五卷积层和第五非线性激活层；

具体地，在A-Net网络的编码器中：

第一个第二特征提取模块中的第三卷积层的输入通道为3，输出通道为16，卷积核大小为5×5，步长为1，填充为2；第二个第二特征提取模块中的第三卷积层的输入通道为16，输出通道为32，卷积核大小为5×5，步长为1，填充为2；第三个第二特征提取模块中的第三卷积层的输入通道为32，输出通道为64，卷积核大小为5×5，步长为1，填充为2；第四个第二特征提取模块中的第三卷积层的输入通道为64，输出通道为128，卷积核大小为5×5，步长为1，填充为2；每个第二特征提取模块中的第三非线性激活层中的激活函数为ReLU函数，最大池化层的步长为2；

两个并列的第一全连接层的输出为100维；

在A-Net网络的解码器中：

第一个第三特征提取模块中的第四卷积层的输入通道为128，输出通道为64，卷积核大小为5×5，步长为1，填充为2；第二个第三特征提取模块中的第四卷积层的输入通道为64，输出通道为32，卷积核大小为5×5，步长为1，填充为2；第三个第三特征提取模块中的第四卷积层的输入通道为32，输出通道为16，卷积核大小为5×5，步长为1，填充为2，第三特征提取模块中的第四非线性激活层中激活函数为ReLU激活函数；第二输出模块中的第五卷积层的输入通道为16，输出通道为3，卷积核大小为5×5，步长为1，填充为2，第二输出模块中的第五非线性激活层中激活函数为Sigmoid函数。

实施例3：

本实施例中，提供了利用本发明方法与传统图像去雾方法的效果对比：

图3为本实施例中利用本发明方法在合成数据集上进行图像去雾的实验结果(合成数据集中的有雾图片均是从干净图片合成得到的)；其中从左到右分别是输入的有雾图片、DehazeNet,MSCNN,AOD-Net.DCP,GRM,N2V,DIP,DD,DDIP，本发明方法和真实值(对应的干净图片)。其中右下角的框里是放大的细节，可以看出本发明方法比其他的算法去雾效果更加好。

图4是另一个实例，其中(1)是真实的有雾图片，(2)是DehazeNet的去雾结果，(3)是本发明方法得到的结果，(4)是我们的折射率的图片，可以在左下的框里看出来我们的结果去雾去的更加干净。