CN116542872A

CN116542872A - 一种基于半监督知识蒸馏的单幅图像去雾方法

Info

Publication number: CN116542872A
Application number: CN202310370749.4A
Authority: CN
Inventors: 兰云伟; 崔智高; 李爱华; 苏延召; 蔡艳平; 李庆辉; 钟啸
Original assignee: Rocket Force University of Engineering of PLA
Current assignee: Rocket Force University of Engineering of PLA
Priority date: 2023-04-10
Filing date: 2023-04-10
Publication date: 2023-08-04
Anticipated expiration: 2043-04-10
Also published as: CN116542872B

Abstract

本发明公开了一种基于半监督知识蒸馏的单幅图像去雾方法，包括步骤：一、训练集图像的获取；二、图像去雾半监督网络模型的建立；三、合成有雾图像和真实有雾图像的特征提取；四、监督损失函数和无监督损失函数的建立；五、合成有雾图像和真实有雾图像对图像去雾半监督网络模型的训练；六、利用训练好的图像去雾半监督网络模型对单幅图像去雾。本发明方法步骤简单，设计合理，通过无监督训练和有监督训练，提高图像去雾效果，且半监督学习通过结合监督学习的拟合优势和无监督学习防止过拟合的优势，能够有效提高模型输出特征的分布并提高鲁棒性。

Description

一种基于半监督知识蒸馏的单幅图像去雾方法

技术领域

本发明属于图像去雾处理技术领域，具体涉及一种基于半监督知识蒸馏的单幅图像去雾方法。

背景技术

随着数字化时代的到来，图像已成为人类生产活动中的重要信息载体。为满足雾霾天气条件下智能视频监控系统图像质量以及目标检测、语义分割等高层计算机视觉任务的需要，开展图像去雾方法研究逐渐成为计算机视觉领域的重要方向。

目前，图像去雾方法大致可分为基于图像增强的去雾方法、基于先验信息的去雾方法和基于深度学习的去雾方法三类。基于图像增强的去雾方法不考虑雾天图像的退化机理，将雾霾作为噪声，利用常规的图像处理来调节图像的灰度等级，从而增加图像的对比度并生成去雾图像。基于先验信息的去雾方法以图像本身为研究对象，通过对无雾图像的颜色、饱和度等信息进行观察和分析，人为制定先验信息来对大气散射模型进行约束，进而求得大气散射模型的未知参数并恢复无雾图像。近年来，随着深度学习的迅速发展和显卡在矩阵计算方面的优异表现，深度学习被广泛应用于计算机视觉任务当中。在图像去雾领域，研究者们深入研究相关工作并提出大量方法，通过深度神经网络的强大特征提取能力来生成去雾图像。相比于上述两类方法，基于深度学习的去雾方法采用知识驱动的方式直接或间接地生成去雾图像，能够有效缓解利用人为先验信息去雾而造成的的伪影、颜色失真等问题。此类方法需要大量匹配的真实有雾图像及其相应的无雾图像作为训练数据集来对网络进行训练。然而在现实世界中，真实有雾训练数据集的收集极其困难且需消耗大量的人力物力，因而基于深度学习的去雾方法大多在合成有雾数据集上进行有监督训练。此外，由于真实有雾图像和合成有雾图像上的雾霾分布存在一定差异，因此此类方法的鲁棒性较差，在真实有雾图像上的去雾效果不够理想。

因此，现如今缺少一种设计合理的基于半监督知识蒸馏的单幅图像去雾方法，通过无监督训练和有监督训练，提高图像去雾效果，且半监督学习通过结合监督学习的拟合优势和无监督学习防止过拟合的优势，能够有效提高模型输出特征的分布并提高鲁棒性。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于半监督知识蒸馏的单幅图像去雾方法，其方法步骤简单，设计合理，通过无监督训练和有监督训练，提高图像去雾效果，且半监督学习通过结合监督学习的拟合优势和无监督学习防止过拟合的优势，能够有效提高模型输出特征的分布并提高鲁棒性。

为解决上述技术问题，本发明采用的技术方案是：一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于，该方法包括以下步骤：

步骤一、训练集图像的获取：

步骤101、从雾天图像数据库RESIDE中的室内训练集中选择训练集；其中，训练集包括合成有雾图像I_S和与所述合成有雾图像对应的无雾训练图像J_S；

步骤102、从雾天图像数据库URHI中选择真实有雾数据训练集；其中，所述真实有雾数据训练集包括真实有雾图像I_R，且真实有雾图像I_R、合成有雾图像I_S、无雾训练图像J_S的数量均相同且均为N；

步骤二、图像去雾半监督网络模型的建立：

采用计算机建立图像去雾半监督网络模型；其中，所述图像去雾半监督网络模型包括第一卷积Conv+ReLU激活函数层，4个基于PA和CA的特征提取块，第一卷积+Tanh激活函数层；

步骤三、合成有雾图像和真实有雾图像的特征提取：

步骤301、采用计算机将合成有雾图像I_S经过图像去雾半监督网络模型进行特征提取，具体过程如下：

步骤3011、采用计算机将合成有雾图像I_S输入图像去雾半监督网络模型中，并经过第一卷积Conv+ReLU激活函数层进行特征提取，得到特征图F_in；

步骤3012、采用计算机将特征图F_in依次经过4个基于PA和CA的特征提取块进行特征提取，得到第一特征图；

步骤3013、采用计算机将第一特征图经过进行第一卷积+Tanh激活函数层进行特征提取，得到有监督的去雾图像

步骤302、采用计算机将真实有雾图像I_R经过图像去雾半监督网络模型进行特征提取，具体过程如下：

步骤3021、采用计算机将真实有雾图像I_R输入图像去雾半监督网络模型中，并经过第一卷积Conv+ReLU激活函数层进行特征提取，得到无监督特征图F_in′；

步骤3022、采用计算机将无监督特征图F_in′依次经过4个基于PA和CA的特征提取块进行特征提取，得到第二特征图；

步骤3023、采用计算机将第二特征图经过进行第一卷积+Tanh激活函数层进行特征提取，得到无监督的真实去雾图像

步骤303、采用计算机利用暗通道先验去雾算法对真实有雾图像I_R处理，得到第一去雾图像J_DCP；采用计算机利用RefineDNet网络模型对真实有雾图像I_R处理，得到第二去雾图像J_dist；

步骤四、监督损失函数和无监督损失函数的建立：

步骤401、采用计算机根据L_S＝L₁-0.5L_SSIM，得到监督损失函数L_S；其中，代表有监督的去雾图像/>和其相对应的无雾图像J_S之间的曼哈顿距离，代表有监督的去雾图像/>和其相对应的无雾图像J_S之间的SSIM损失；

步骤402、采用计算机根据L_U＝L_DCP+L_dist，得到无监督损失函数L_U；其中，代表无监督的真实去雾图像/>和第一去雾图像J_DCP之间的曼哈顿距离，代表无监督的真实去雾图像/>和第二去雾图像J_dist之间的曼哈顿距离；

步骤五、合成有雾图像和真实有雾图像对图像去雾半监督网络模型的训练：

步骤501、计算机采用Adam优化算法，利用监督损失函数L_S和无监督损失函数L_U分别对图像去雾半监督网络模型进行迭代优化，直至训练集全部训练，完成一次迭代训练；

步骤502、重复步骤501迭代训练直至满足迭代训练预设次数，得到训练好的图像去雾半监督网络模型；

步骤六、利用训练好的图像去雾半监督网络模型对单幅图像去雾：

采用计算机将任一张有雾图像输入训练好的图像去雾半监督网络模型中进行去雾处理，得到无雾图像。

上述的一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于：步骤二中所述第一卷积Conv+ReLU激活函数层包括Conv1卷积层和ReLU激活函数层，所述第一卷积+Tanh激活函数层包括Conv2卷积层和Tanh激活函数层，Conv1卷积层和Conv2卷积层中卷积核的数量为32，卷积核的大小为3×3，滑动步长为1，padding为1；

4个基于PA和CA的特征提取块的结构且均包括第一卷积池化层、第二卷积池化层、第三卷积池化层、Conv3卷积层以及PA和CA模块，所述PA和CA模块包括自适应池化层、Conv4卷积层、Conv5卷积层和Conv6卷积层；

第一卷积池化层中卷积核的数量为32，卷积核的大小为1×1，滑动步长为1，padding为0，第一卷积池化层中池化核的大小为3×3，滑动步长为1，padding为1；

第二卷积池化层中卷积核的数量为32，卷积核的大小为1×1，滑动步长为1，padding为0，第二卷积池化层中池化核的大小为5×5，滑动步长为1，padding为2；

第三卷积池化层中卷积核的数量为32，卷积核的大小为1×1，滑动步长为1，padding为0，第三卷积池化层中池化核的大小为7×7，滑动步长为1，padding为3；

Conv3卷积层中卷积核的数量为32，卷积核的大小为1×1，滑动步长为1，padding为0；

Conv4卷积层中卷积核的数量为32，Conv4卷积层中卷积核的大小为1×1，滑动步长为1，padding为0；

Conv5卷积层中卷积核的数量为1，Conv5卷积层中卷积核的大小为3×3，滑动步长为1，padding为1；

Conv6卷积层中卷积核的数量为32，Conv6卷积层中卷积核的大小为1×1，滑动步长为1，padding为0。

上述的一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于：步骤3012中采用计算机将特征图F_in依次经过4个基于PA和CA的特征提取块进行特征提取得到第一特征图，具体过程如下：

步骤A、采用计算机将特征图F_in经过第一个基于PA和CA的特征提取块中第一卷积池化层进行特征提取，得到第一中间特征图F₁；

步骤B、采用计算机调用拼接cat函数模块将特征图F_in和第一中间特征图F₁拼接，得到第二中间特征图F₂；

步骤C、采用计算机将第二中间特征图F₂经过第一个基于PA和CA的特征提取块中第二卷积池化层进行特征提取，得到第三中间特征图F₃；

步骤D、采用计算机调用拼接cat函数模块将第二中间特征图F₂和第三中间特征图F₃拼接，得到第四中间特征图F₄；

步骤E、采用计算机将第四中间特征图F₄经过第一个基于PA和CA的特征提取块中第三卷积池化层进行特征提取，得到第五中间特征图F₅；

步骤F、采用计算机调用拼接cat函数模块将第四中间特征图F₄和第五中间特征图F₅拼接，得到第六中间特征图F₆；

步骤G、采用计算机将第六中间特征图F₆经过第一个基于PA和CA的特征提取块中Conv3卷积层进行特征提取，得到第七中间特征图F₇；

步骤H、采用计算机将第七中间特征图F₇经过第一个基于PA和CA的特征提取块中PA和CA模块进行特征提取，得到第一输出特征图；

步骤I、按照步骤A至步骤H所述的方法，采用计算机将第一输出特征图经过第二个基于PA和CA的特征提取块进行特征提取，得到第二输出特征图；

步骤J、按照步骤A至步骤H所述的方法，采用计算机将第二输出特征图经过第三个基于PA和CA的特征提取块进行特征提取，得到第三输出特征图；

步骤K、按照步骤A至步骤H所述的方法，采用计算机将第三输出特征图经过第四个基于PA和CA的特征提取块进行特征提取，得到第一特征图；

步骤3022中采用计算机将无监督特征图F′_in依次经过4个基于PA和CA的特征提取块进行特征提取，得到第二特征图，具体如下：

按照步骤A至步骤K所述的方法，对无监督特征图F′_in进行特征提取，得到第二特征图。

上述的一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于：步骤H中采用计算机将第七中间特征图F₇经过第一个基于PA和CA的特征提取块中PA和CA模块进行特征提取，得到第一输出特征图，具体过程如下：

步骤H01、采用计算机将第七中间特征图F₇输入PA和CA模块中自适应池化层和Conv4卷积层经过特征提取，得到第八中间特征图F₈；其中，自适应池化层output_size为1；

步骤H02、采用计算机根据得到第九中间特征图F₉；其中，/>表示特征图矩阵之间的哈达玛积运算；

步骤H03、采用计算机将第九中间特征图F₉输入Conv5卷积层经过特征提取，得到第十中间特征图F₁₀；

步骤H04、采用计算机根据得到第十一中间特征图F₁₁；其中，/>表示特征图矩阵之间的哈达玛积运算；

步骤H05、采用计算机将第十一中间特征图F₁₁输入Conv6卷积层经过特征提取，得到第一输出特征图F_out。

本发明与现有技术相比具有以下优点：

1、本发明方法步骤简单，设计合理，首先是训练集图像的获取；其次是图像去雾半监督网络模型的建立，接着是合成有雾图像和真实有雾图像的特征提取，之后是监督损失函数和无监督损失函数的建立，然后是合成有雾图像和真实有雾图像对图像去雾半监督网络模型的训练，最后利用训练好的图像去雾半监督网络模型对单幅图像去雾，提高图像去雾效果，且鲁棒性好。

2、本发明图像去雾半监督网络模型中包括第一卷积Conv+ReLU激活函数层，4个基于PA和CA的特征提取块，第一卷积+Tanh激活函数层，不仅能融合所有特征，而且能自适应地学习不同层次特征信息，又具有较强的泛化能力。

3、本发明减少了对训练数据集的依赖，并且在训练过程中利用了真实有雾图像包含的信息来增强方法对真实有雾图像的去雾能力。

4、本发明在真实有雾数据集中，通过知识蒸馏的方式将RefineDNet模型中所蕴含的知识进行迁移，同时引入暗通道先验去雾算法对真实有雾图像信息的利用，从而改善其去雾效果。

5、本发明结合了监督学习和无监督学习的优势，在防止网络过拟合的同时能够有效地增强训练后网络的鲁棒性及泛化能力。

综上所述，本发明方法步骤简单，设计合理，通过无监督训练和有监督训练，提高图像去雾效果，且半监督学习通过结合监督学习的拟合优势和无监督学习防止过拟合的优势，能够有效提高模型输出特征的分布并提高鲁棒性。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明的方法流程框图。

图2-1为本发明有监督训练的结构示意图。

图2-2为本发明无监督训练的结构示意图。

图3为本发明一个基于PA和CA的特征提取块的结构示意图。

具体实施方式

如图1至图3所示，本发明的一种基于半监督知识蒸馏的单幅图像去雾方法，包括以下步骤：

步骤一、训练集图像的获取：

步骤二、图像去雾半监督网络模型的建立：

步骤三、合成有雾图像和真实有雾图像的特征提取：

步骤四、监督损失函数和无监督损失函数的建立：

本实施例中，步骤二中所述第一卷积Conv+ReLU激活函数层包括Conv1卷积层和ReLU激活函数层，所述第一卷积+Tanh激活函数层包括Conv2卷积层和Tanh激活函数层，Conv1卷积层和Conv2卷积层中卷积核的数量为32，卷积核的大小为3×3，滑动步长为1，padding为1；

本实施例中，步骤3012中采用计算机将特征图F_in依次经过4个基于PA和CA的特征提取块进行特征提取得到第一特征图，具体过程如下：

步骤3022中采用计算机将无监督特征图F_in′依次经过4个基于PA和CA的特征提取块进行特征提取，得到第二特征图，具体如下：

按照步骤A至步骤K所述的方法，对无监督特征图F_in′进行特征提取，得到第二特征图。

本实施例中，步骤H中采用计算机将第七中间特征图F₇经过第一个基于PA和CA的特征提取块中PA和CA模块进行特征提取，得到第一输出特征图，具体过程如下：

本实施例中，所述合成有雾图像I_S、无雾训练图像J_S、真实有雾图像I_R的数量均相同且均为N，且N为2093。

本实施例中，需要说明的是，PA模块即空间注意力机制模块，CA模块即通道注意力机制模块。

本实施例中，需要说明的是，Adam优化算法即Adaptive momentum优化算法。

本实施例中，需要说明的是，实际使用时，是指图像矩阵之间的哈达玛积，例如设定矩阵A中的第i行第j列元素为aij，矩阵B中第i行第j列元素为bij，则/>则C中第i行第j列元素为cij＝aij×bij，且A、B和C是同阶矩阵。

本实施例中，需要说明的是，步骤502中迭代训练预设次数为30。

本实施例中，特征图的大小用通道数×长×宽表示。

本实施例中，真实有雾图像I_R、合成有雾图像I_S、无雾训练图像J_S的均为三通道的RGB彩色图像，即3×256×256。

本实施例中，特征图F_in的大小为256×256，特征图F_in的通道数为32；无监督特征图F_in′的大小为256×256，无监督特征图F_in′的通道数为32。

本实施例中，第一中间特征图F₁的大小为32×256×256；第二中间特征图F₂的大小为64×256×256；第三中间特征图F₃的大小为32×256×256；第四中间特征图F₄的大小为96×256×256；第五中间特征图F₅的大小为32×256×256；第六中间特征图F₆的大小为128×256×256；第七中间特征图F₇的大小为32×256×256；第八中间特征图F₈的大小为32×1×1，第九中间特征图F₉的大小为32×256×256；第十中间特征图F₁₀的大小为1×256×256；第十一中间特征图F₁₁的大小为32×256×256；第一输出特征图F_out的大小为32×256×256。

以上所述，仅是本发明的较佳实施例，并非对本发明作任何限制，凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化，均仍属于本发明技术方案的保护范围内。

Claims

1.一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于，该方法包括以下步骤：

步骤一、训练集图像的获取：

步骤二、图像去雾半监督网络模型的建立：

步骤三、合成有雾图像和真实有雾图像的特征提取：

步骤四、监督损失函数和无监督损失函数的建立：

2.按照权利要求1所述的一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于：步骤二中所述第一卷积Conv+ReLU激活函数层包括Conv1卷积层和ReLU激活函数层，所述第一卷积+Tanh激活函数层包括Conv2卷积层和Tanh激活函数层，Conv1卷积层和Conv2卷积层中卷积核的数量为32，卷积核的大小为3×3，滑动步长为1，padding为1；

3.按照权利要求2所述的一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于：步骤3012中采用计算机将特征图F_in依次经过4个基于PA和CA的特征提取块进行特征提取得到第一特征图，具体过程如下：

4.按照权利要求3所述的一种基于半监督知识蒸馏的单幅图像去雾方法，其特征在于：步骤H中采用计算机将第七中间特征图F₇经过第一个基于PA和CA的特征提取块中PA和CA模块进行特征提取，得到第一输出特征图，具体过程如下：