CN113269685A

CN113269685A - 一种融合多注意力机制的图像去雾方法

Info

Publication number: CN113269685A
Application number: CN202110516155.0A
Authority: CN
Inventors: 胡彬; 顾铭岑; 岳壮壮; 李金航
Original assignee: Nantong University
Current assignee: Nantong University
Priority date: 2021-05-12
Filing date: 2021-05-12
Publication date: 2021-08-17

Abstract

本发明提供一种融合多注意力机制的图像去雾方法，首先构建端到端的图像去雾网络模型，网络模型由一个浅层特征提取卷积层、由多注意力融合模块叠加构成的子网络、特征重构部分和全局残差学习结构构成。然后利用有雾与清晰图像对构成的样本库训练该模型得到参数。应用时，网络模型加载训练好的参数后，输入待去雾图像，即可输出清晰的图像。本发明设计了一种融合了空间注意力、通道注意力和像素注意力机制的多注意力融合模块，通过叠加该模块和残差连接构建了基于端到端的图像去雾网络，取得了较好的去雾效果。

Description

一种融合多注意力机制的图像去雾方法

技术领域

本发明属于图像处理技术领域，具体涉及一种融合多注意力机制的图像去雾方法。

背景技术

雾霾是由空气中的灰尘和烟雾等小的漂浮颗粒产生的常见大气现象，这些漂浮的颗粒极大地吸收和散射光，导致图像产生退化，在雾霾影响上，基于视频图像的目标检测和识别等高级计算机视觉任务容易被干扰，因此，图像去雾具有重大的实际应用价值。

发明内容

本发明要解决的技术问题是提供一种融合多注意力机制的图像去雾方法，通过叠加多注意力融合网络模块和残差连接构建了基于端到端的图像去雾网络，取得了较好的去雾效果。

为解决上述技术问题，本发明的实施例提供一种融合多注意力机制的图像去雾方法，包括如下步骤：

S1、构建端到端的图像去雾网络模型；

S2、利用样本库训练样本参数，样本库由若干对有雾-清晰图像对组成，利用样本库训练图像去雾网络模型得到样本参数

S3、将待去雾图像输进图像去雾网络模型，图像去雾网络模型加载训练好的样本参数后，输出清晰的图像。

其中，所述图像去雾网络模型由一个浅层特征提取卷积层、由多注意力融合模块叠加构成的子网络、特征重构部分和全局残差学习结构构成。

其中，所述图像去雾网络模型的concatenate模块中的Multi-Attention Group由若干个多注意力融合模块组成，前一个Group的输出特征作为后一个 Group的输入，定义每个Group的输出为G_i，i表示Group的编号，最后将多个Group级联得到concatenate模块的输出：

C＝[G₁，G₂，...，G_n]，

其中，n为Group的数量。

其中，所述多注意力融合模块由两个卷积层和注意力单元构成，通过添加局部短连接提高训练收敛速度。

进一步，所述多注意力融合模块中的注意力单元融合了空间注意力、通道注意力和像素注意力，工作步骤如下：

5.1、在注意力单元中，首先对输入特征采用全局平均池化：

其中，H_p表示全局平均池化函数，X_c(i，j)表示输入值的c通道位于(i，j)处的值，Fc表示输入特征；

5.2、在通道注意力和像素注意力中，将池化后的特征通过卷积层、ReLU、卷积层和sigmoid激活函数处理之后得到CA，

CA＝σ(Conv(δ(Conv(g_c)))) 式(II)，

其中，σ表示sigmoid函数，δ表示ReLU函数；

将输入特征与CA相乘得到通道注意力特征CA^*：

CA^*然后通过卷积层、ReLU、卷积层和sigmoid激活函数得到像素注意力特征：

PA＝σ(Conv(δ(Conv(CA^*)))) 式(IV)；

最终融合通道注意力和像素注意力输出：

5.3、空间注意力分支中，将池化后的特征通过卷积层和sigmoid激活函数，得到：

5.4、融合三种注意力机制：

F＝[F₁，SA] 式(VII)；

经过卷积后输出特征：

F_out＝Conv(F) 式(VIII)。

其中，所述图像去雾网络模型采用L₁损失函数在数据集RESIDE进行训练， L₁损失函数如下式：

其中，N指图像像素总数，

和J_i(x)指第i个通道上x出的像素值，

指经过网络计算得到的值，J_i(x)表示真实值，

本发明的上述技术方案的有益效果如下：本发明设计了一种融合了空间注意力、通道注意力和像素注意力机制的多注意力融合模块，通过叠加该模块和残差连接构建了基于端到端的图像去雾网络，取得了较好的去雾效果。

附图说明

图1为本发明中图像去雾网格模型的示意图；

图2为本发明中多注意力融合模块的示意图；

图3为本发明中注意力单元的示意图；

图4为本发明实施例一中图像去雾前后的对比图；

图5为本发明实施例二中图像去雾前后的对比图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

本发明提供了一种融合多注意力机制的图像去雾方法，包括如下步骤：

S1、构建端到端的图像去雾网络模型，如图1所示，由一个浅层特征提取卷积层、由多注意力融合模块叠加构成的子网络、特征重构部分和全局残差学习结构构成。

图1中，Hazy image为输入样本图像；Conv layer为卷积层；Multi-attentionmodule为多注意力融合模块；Clear image为输出清晰图像。

所述图像去雾网络模型的concatenate模块中的Multi-Attention Group由若干个多注意力融合模块(Multi-Attention Module,MAM)组成，前一个Group 的输出特征作为后一个Group的输入，定义每个Group的输出为G_i，i表示Group 的编号，最后将多个Group级联得到concatenate模块的输出：

C＝[G₁，G₂，...，G_n]，

其中，n为Group的数量。

所述多注意力融合模块(Multi-Attention Module，MAM)由两个卷积层和注意力单元(Attention Module，AM)构成，通过添加局部短连接提高训练收敛速度，如图2所示。

所述多注意力融合模块中的注意力单元(Attention Module，AM)如图3 所示，融合了空间注意力、通道注意力和像素注意力，工作步骤如下：

5.1、在注意力单元中，首先对输入特征采用全局平均池化：

CA＝σ(Conv(δ(Conv(g_c)))) 式(II)，

其中，σ表示sigmoid函数，δ表示ReLU函数；

将输入特征与CA相乘得到通道注意力特征CA^*：

PA＝σ(Conv(δ(Conv(CA^*)))) 式(IV)；

最终融合通道注意力和像素注意力输出：

5.4、融合三种注意力机制：

F＝[F₁，SA] 式(VII)；

经过卷积后输出特征：

F_out＝Conv(F) 式(VIII)。

本发明的图像去雾网络模型采用L₁损失函数在数据集RESIDE进行训练， L₁损失函数如下式：

其中，N指图像像素总数，

和J_i(x)指第i个通道上x出的像素值，

指经过网络计算得到的值，J_i(x)表示真实值，

本发明采用峰值信噪比(PSNR)和结构相似性(SSIM)进行度量，在 RESIDE的室内测试集上PSNR＝36.76，SSIM＝0.9950，室外测试上 PSNR＝33.96，SSIM＝0.9895，结果好于现有方法。部分可视化结果如图4和图 5所示，其中，图4中左图和图5中左图为去雾前图像，图4中右图和图5中右图为去雾后图像。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种融合多注意力机制的图像去雾方法，其特征在于，包括如下步骤：

S1、构建端到端的图像去雾网络模型；

2.根据权利要求1所述的融合多注意力机制的图像去雾方法，其特征在于，所述图像去雾网络模型由一个浅层特征提取卷积层、由多注意力融合模块叠加构成的子网络、特征重构部分和全局残差学习结构构成。

3.根据权利要求1或2所述的融合多注意力机制的图像去雾方法，其特征在于，所述图像去雾网络模型的concatenate模块中的Multi-Attention Group由若干个多注意力融合模块组成，前一个Group的输出特征作为后一个Group的输入，定义每个Group的输出为G_i，i表示Group的编号，最后将多个Group级联得到concatenate模块的输出：

C＝[G₁，G₂，...，G_n]，

其中，n为Group的数量。

4.根据权利要求3所述的融合多注意力机制的图像去雾方法，其特征在于，所述多注意力融合模块由两个卷积层和注意力单元构成，通过添加局部短连接提高训练收敛速度。

5.根据权利要求3所述的融合多注意力机制的图像去雾方法，其特征在于，所述多注意力融合模块中的注意力单元融合了空间注意力、通道注意力和像素注意力，工作步骤如下：

5.1、在注意力单元中，首先对输入特征采用全局平均池化：