WO2023040462A1

WO2023040462A1 - 图像去雾方法、装置及设备

Info

Publication number: WO2023040462A1
Application number: PCT/CN2022/107282
Authority: WO
Inventors: 张登银; 朱虹; 韩文生; 严伟丹; 寇英杰
Original assignee: 南京邮电大学
Priority date: 2021-09-17
Filing date: 2022-07-22
Publication date: 2023-03-23
Also published as: CN113947537A

Abstract

本发明公开了一种图像去雾方法、装置及设备，所述方法包括：获取待处理有雾图像，将有雾图像输入预先训练的去雾模型，获得有雾图像对应的无雾图像；所述去雾模型包括多个残差群组，所述残差群组包括若干串联的残差双重注意力融合模块，残差双重注意力融合模块包括残差块、第一卷积层、通道注意力模块、像素注意力模块和第二卷积层，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述通道注意力模块和像素注意力模块的输出融合再进行输出处理，用于实现残差双重注意力融合模块的输出在每个通道图增强全局依赖的同时获得像素特征。本发明将残差双重注意力融合模块作为神经网络的基本模块，提高了去雾效果。

Description

图像去雾方法、装置及设备

技术领域

本申请主要涉及图像处理技术领域，更具体地说是涉及一种图像去雾方法、装置及设备。

背景技术

近年来，随着社会的发展，雾霾已经成为当前的一种大气现象，在计算机视觉中普遍存在。由于众多悬浮颗粒的存在，光线在传播过程中被反射，导致户外图像模糊、色彩失真、对比度降低。高级图像处理任务，如目标检测、目标识别和工业物联网，都需要清晰的图像作为输入，有雾的图像将影响后续高级任务的质量和鲁棒性；因此，作为一个预处理的图像任务，图像去雾是一个经典的图像处理问题，一直是研究者们研究的热点。

目前，图像去雾算法主要基于深度学习的方法，基于深度学习的去雾网络同等对待通道和像素特征，但是雾霾是非均质的，如薄雾和浓雾，近景和远景的像素权重应明显不同，因此，去雾网络同等对待通道和像素特征导致去雾效果不佳，去雾化后的图像仍然不可避免地保持着图像的深层雾霾，失去了图像的细节。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种图像去雾方法、装置及设备。

第一方面，本发明提供了一种图像去雾方法，所述方法包括：

获取待处理有雾图像；

将所述待处理有雾图像输入预先训练的去雾模型，获得所述待处理有雾图像对应的无雾图像；

其特征在于，所述预先训练的去雾模型包括多个残差群组，所述残差群组包括若干串联的残差双重注意力融合模块，所述残差双重注意力融合模块包括残差块、第一卷积层、通道注意力模块、像素注意力模块和第二卷积层，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述通道注意力模块和像素注意力模块的输出融合再进行输出处理，用于实现残差双重注意力融合模块的输出在每个通道图增强全局依赖的同时获得像素特征。

进一步的，所述去雾模型包括3个残差群组，所述3个残差群组按照由后到前的输出进行通道内连接。

进一步的，所述残差群组包括3个残差双重注意力融合模块。

进一步的，所述通道注意力模块和像素注意力模块的输出与所述残差块的输入经逐元素相加后输入第二卷积层进行融合，获得残差双重注意力融合模块的输出。

进一步的，所述去雾模型还包括特征提取卷积层、通道注意力模块、像素注意力模块和输出卷积层，所述待处理有雾图像经特征提取卷积层提取特征后进入残差群组，经残差群组处理后依次进入通道注意力模块、像素注意力模块和输出卷积层进行处理后得到输出特征，输出特征与所述待处理有雾图像进行逐元素相加，获得无雾图像。

进一步的，所述去雾模型的训练，包括：

获取RESIDE数据集，从RESIDE数据集中随机选取6000对有雾图像和无雾图像构建训练样本集；

利用训练样本集对预先设立的神经网络进行训练。

进一步的，所述神经网络的损失函数L表示为：

式中，N为训练样本的个数，

为第i个训练样本的真实的清晰图像,

为第i个训练样本由所述神经网络估计得到的无雾图像。

第二方面，本发明还提供了一种图像去雾装置，所述装置包括：

待处理有雾图像获取模块，用于获取待处理有雾图像；

去雾处理模块，用于将所述待去雾图像输入去雾模型进行处理，输出所述待处理有雾图像对应的无雾图像；

所述去雾模型包括多个残差群组，所述残差群组包括若干串联的残差双重注意力融合模块，所述残差双重注意力融合模块包括残差块、第一卷积层、通道注意力模块、像素注意力模块和第二卷积层，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述通道注意力模块和像素注意力模块的输出融合，用于实现残差双重注意力融合模块的输出在每个通道图增强全局依赖的同时获得像素特征。

第三方面，本发明还提供了一种设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现第一方面任一项所述的图像去雾方法。

与现有技术相比，本发明的有益效果为：

第一，本发明改进了具有固定感受野的卷积神经网络，将残差双重注意力融合模块作为基本模块，残差双重注意力融合模块由残差块、通道注意力模块和像素注意力模块融合组成，结合不同通道图的相关特征，每个通道图增强全局依赖性，同时获得像素特征，在减少参数数量的同时保留了较好的细节，提高了去雾效果；

第二，本发明采用端到端的去雾网络，残差群组内部仅设置了3个残差双重注意力融合模块，减少了模型复杂程度，提高了模型训练的效率。

附图说明

图1是本发明实施例提供的图像去雾方法流程图；

图2是本发明实施例提供的去雾模型结构示意图；

图3是本发明实施例提供的通道注意力模块的示意图；

图4是本发明实施例提供的像素注意力模块的示意图；

图5是本发明实施例提供的残差群组的示意图；

图6是本发明实施例提供的残差双重注意力融合模块的示意图；

图7是本发明实施例提供的图像去雾方法与其他方法的去雾效果对比图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

实施例1：

如图1所示，本发明提供了一种图像去雾方法，本方法基于神经网络建立图像去雾模型，但是改进了具有固定感受野的卷积神经网络，将残差双重注意力融合模块作为基本模块，残差双重注意力融合模块由残差块和通道与像素的注意力模块融合组成。

具体的，如图2所示，去雾模型包括1个特征提取卷积层、3个残差群组、通道注意力模块、像素注意力模块和2个输出卷积层，3个残差群组按照由后到前的输出进行通道内连接；待处理有雾图像经特征提取卷积层提取特征后进入残差群组，经残差群组处理后依次进入通道注意力模块、像素注意力模块和2个输出卷积层处理后得到输出特征，输出特征与所述待处理有雾图像进行逐元素相加，获得无雾图像。

如图3所示，通道注意力模块由输入特征输入全局平均池化、卷积层、ReLU激活函数、卷积层、Sigmoid激活函数，得到的输出权重和输入特征进行逐元素相乘得到通道注意力模块的输出，其表达式如下：

式中，Z ^c(x,y)代表在(x,y)位置的c通道的输入Z ^c的像素值，c∈{R,G,B}；在全局平均池化后，特征图的维度由C×H×W变为C×1×1；δ是ReLU激活函数，σ是Sigmoid激活函数，

是逐元素相乘；通道注意力模块输入F ^c到通道注意力模块输出

之间的映射函数是H _CAB。

通道注意力模块的第一个卷积层使用8个大小为1*1的卷积核，第二个卷积层使用64个大小为1*1的卷积核。

如图4所示，像素注意力模块由输入特征输入卷积层、ReLU激活函数、卷积层、Sigmoid激活函数，得到的输出权重和输入的特征进行逐元素相乘得到像素注意力模块的输出其表达式如下：

F _PA＝σ(Conv(δ(Conv(F)))) (4)

F _PAB＝H _PAB(F) (6)

式中F _PA为输出的特征权重，维度由C×H×W变为1×H×W，像素注意力模块输入F到通道注意力模块输出F _PAB之间的映射函数是H _PAB。

像素注意力模块的第一个卷积层使用8个大小为1*1的卷积核，第二个卷积层使用1个大小为1*1的卷积核。其他卷积层使用64个大小为3*3的卷积核。

如图5所示，残差群组包括3个串联的残差双重注意力融合模块和1个卷积层，输入特征输入残差双重注意力融合模块和卷积层，输出的结果和输入特征进行逐元素相加得到残差群组的输出，残差群组的输出表达式如下：

F _g,m＝H _RDAFM(F _g,m-1) (7)

F _g＝H _RG(F _g,0) (9)

式中，F _g,m-1和F _g,m分布是第g个残差群组中的第m个残差双重注意力融合模块的输入、输出，g＝1,2,3，m＝1,2,3；由残差双重注意力融合模块的输入F _g,m-1到残差双重注意力融合模块的输出F _g,m之间的映射函数是H _RDAFM；由残差群组的输入F _g,0到残差群组的输出F _g之间的映射函数是H _RG。

如图6所示，残差双重注意力融合模块包括残差块、第一卷积层、通道注意力模块、像素注意力模块和第二卷积层，残差块包括一个卷积层和ReLU激活函数，残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述通道注意力模块和像素注意力模块的输出融合，用于实现残差双重注意力融合模块的输出与所述残差块的输入经逐元素相加后输入第二卷积层进行融合，获得残差双重注意力融合模块的输出，使得残差双重注意力融合模块的输出在每个通道图增强全局依赖的同时获得像素特征，残差双重注意力融合模块的输出，其表达式如下：

F ^*＝Conv(F _RB) (11)

F _RDAFM＝H _RDAFM(F) (13)

其中，

是逐元素相加，F _RB是残差块的输出，F ^*是注意力模块的输入，由残差双重注意力融合模块的输入F到残差双重注意力融合模块的输出F _RDAFM之间的映射函数是H _RDAFM。

去雾模型的训练包括以下步骤：获取RESIDE数据集，从RESIDE数据集中随机选取6000对有雾图像和无雾图像构建训练样本集，利用训练样本集对神经网络进行训练得到去雾模型，使用时，获取待处理有雾图像输入去雾模型，获得无雾图像。

神经网络的损失函数L表示为：

其中，N为训练样本的个数，

为第i个训练样本的真实的清晰图像,

为第i个训练样本由所述神经网络估计得到的无雾图像。

在所述神经网络中，使用Adam优化器对网络的权重参数进行初始化，其中β ₁和β ₂的默认值分别为0.9和0.999；初始学习率α设置为1×10 ^-4，使用余弦退火策略来更新学习率，将学习率从初始值调整为0：

式中，T为批次总数，α为初始学习率，t为当前的批次，α _t为自适应更新的学习率。

对每个输入去雾网络模型的训练集中的样本图像，先利用前向传播求出真实的清晰图像与网络恢复的去雾的差异的总损失，再根据Adam优化器对权重参数进行更新；总共训练1×10 ⁵步，每200步为一个批次，总共500个批次，重复上述步骤直至达到设定的最大步长，得到训练好的去雾网络模型，其表达式为：

F ₀＝Conv(I) (16)

F _g＝H _RG(F _g-1) (17)

其中，I是有雾的输入图像，F _g-1和F _g分别是第g个残差群组的输入、输出，g＝1,2,3；

表示通道内的连接操作，

是恢复的输出图像。

实施例2：

本实施例中，还提供一种图像去雾装置，所述装置包括：

图像获取模块，用于获取待处理有雾图像；

图像去雾模块，用于将所述待去雾图像输入去雾模型进行处理，输出所述待处理有雾图像对应的无雾图像；

所述去雾模型包括多个残差群组，所述残差群组包括若干串联的残差双重注意力融合模块，所述残差双重注意力融合模块包括残差块、第一卷积层、通道注意力模块、像素注意力模块和第二卷积层，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述通道注意力模块和像素注意力模块的输出与所述残差块的输入经逐元素相加后输入第二卷积层进行融合，获得残差双重注意力融合模块的输出，用于实现残差双重注意力融合模块的输出在每个通道图增强全局依赖的同时获得像素特征。

实施例3：

本实施例还提供一种设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现实施例1所述的图像去雾方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

一种图像去雾方法，所述方法包括：

获取待处理有雾图像；

将所述待处理有雾图像输入预先训练的去雾模型，获得所述待处理有雾图像对应的无雾图像；

其特征在于，所述预先训练的去雾模型包括多个残差群组，所述残差群组包括若干串联的残差双重注意力融合模块，所述残差双重注意力融合模块包括残差块、第一卷积层、通道注意力模块、像素注意力模块和第二卷积层，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述通道注意力模块和像素注意力模块的输出融合后再进行输出处理，用于实现残差双重注意力融合模块的输出在每个通道图增强全局依赖的同时获得像素特征。
根据权利要求1所述的图像去雾方法，其特征在于，所述去雾模型包括3个残差群组，所述3个残差群组按照由后到前的输出进行通道内连接。
根据权利要求1所述的图像去雾方法，其特征在于，所述残差群组包括3个残差双重注意力融合模块。
根据权利要求1所述的图像去雾方法，其特征在于，所述通道注意力模块和像素注意力模块的输出与所述残差块的输入经逐元素相加后输入第二卷积层进行融合，获得残差双重注意力融合模块的输出。
根据权利1所述的图像去雾方法，其特征在于，所述去雾模型还包括特征提取卷积层、通道注意力模块、像素注意力模块和输出卷积层，所述待处理有雾图像经特征提取卷积层提取特征后进入残差群组，经残差群组处理后依次进入通道注意力模块、像素注意力模块和输出卷积层进行处理后得到输出特征，输出特征与所述待处理有雾图像进行逐元素相加，获得无雾图像。
根据权利要求1所述的图像去雾方法，其特征在于，所述去雾模型的训练，包括：

获取RESIDE数据集，从RESIDE数据集中随机选取6000对有雾图像和无雾图像构建训练样本集；

利用训练样本集对预先设立的神经网络进行训练。
根据权利要求6所述的图像去雾方法，其特征在于，所述神经网络的损失函数L表示为：

式中，N为训练样本的个数，
为第i个训练样本的真实的清晰图像,
为第i个训练样本由所述神经网络估计得到的无雾图像。
一种图像去雾装置，所述装置包括：

图像获取模块，用于获取待处理有雾图像；

图像去雾模块，用于将所述待去雾图像输入去雾模型进行处理，输出所述待处理有雾图像对应的无雾图像；

其特征在于，所述去雾模型包括多个残差群组，所述残差群组包括若干串联的残差双重注意力融合模块，所述残差双重注意力融合模块包括残差块、第一卷积层、通道注意力模块、像素注意力模块和第二卷积层，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述残差块的输出经第一卷积层分别与所述通道注意力模块和像素注意力模块的输入连接，所述通道注意力模块和像素注意力模块的输出融合，用于实现残差双重注意力融合模块的输出在每个通道图增强全局依赖的同时获得像素特征。
根据权利要求8所述的图像去雾装置，其特征在于，所述通道注意力模块和像素注意力模块的输出与所述残差块的输入经逐元素相加后输入第二卷积层进行融合，获得残差双重注意力融合模块的输出。
一种设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-7任一项所述的图像去雾方法。