CN113313644A

CN113313644A - 一种基于残差双注意力网络的水下图像增强方法

Info

Publication number: CN113313644A
Application number: CN202110578932.4A
Authority: CN
Inventors: 石争浩; 尚荣荣; 尤珍臻; 赵明华; 冯亚宁; 葛飞航
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2021-05-26
Filing date: 2021-05-26
Publication date: 2021-08-27
Anticipated expiration: 2041-05-26
Also published as: CN113313644B

Abstract

本发明公开了一种基于残差双注意力网络的水下图像增强方法，具体按照以下步骤实施：步骤1、对输入的图像进行预处理；步骤2、将预处理的图像映射到R通道、G通道、B通道，分别对每个颜色通道进行单独的卷积操作；步骤3、使用基于残差双注意力的编解码器的深度网络架构对图像进行处理，编码器用于提取图像特征，减少空间维度，增大感受野；解码器用于逐步恢复恢复图像的细节信息和空间维度；利用预处理的图像对残差双注意力网络模型进行训练，得到训练好的残差双注意力网络模型；步骤4、将模糊的低质量的水下图像输入所述训练好的残差双注意力网络模型中，得到清晰的水下图像。解决了现有技术中存在的水下图像存在的颜色偏差的问题。

Description

一种基于残差双注意力网络的水下图像增强方法

技术领域

本发明属于图像处理技术领域，涉及一种基于残差双注意力网络的水下图像增强方法。

背景技术

海洋和人类的生活紧密相连，地球上71％的面积是海洋。其中蕴藏着丰富的矿产资源、生物资源和能源资源，被视为人类可以利用的“第六大洲”，在资源日益短缺的今天，海洋信息的获取、传输和处理对合理开发及利用海洋资源至关重要。因此，水下图像受到越来越多的关注，人们期望通过对水下图像的研究来获取有价值的信息。

水下图像作为人们获取水下信息的重要媒介，在海洋生物研究、水下目标检测、海洋能源勘测、海洋军事和水下考古学等领域均有重要应用。然而，水下图像通常受光的吸收作用导致其存在一定程度的颜色偏差，受光的散射作用导致其存在一定程度的细节模糊和对比度低等现象，为后续人们对水下信息的获取带来了困难。例如：由于水体的特殊特性，使其无法满足水下捕捞机器人的捕捞需求，同时对于精准识别目标物也具有一定的困难。

近年来，随着图像处理技术和计算机视觉的快速发展，越来越多的人利用计算机视觉技术和图像处理技术对水下图像进行一定程度的增强处理和颜色校正处理，用于得到清晰的水下图像，从中获取更多有价值的信息。因此，水下图像增强技术的关注度极高，主要用于增强退化图像的对比度与能见度，校正颜色偏差，提高图像质量。总的来说水下图像增强的任务可以分为以下几类：1.基于水下成像模型的方法。2.基于传统图像处理知识的增强方法和颜色校正方法。3.基于深度卷积神经网络的水下图像增强方法。4.基于生成对抗网络的水下图像增强方法

发明内容

本发明的目的是提供一种基于残差双注意力网络的水下图像增强方法，解决了现有技术中存在的水下图像存在的颜色偏差的问题。

本发明所采用的技术方案是，一种基于残差双注意力网络的水下图像增强方法，具体按照以下步骤实施：

步骤1、对输入的图像进行预处理；

步骤2、将预处理的图像映射到R通道、G通道、B通道，分别对每个颜色通道进行单独的卷积操作；

步骤3、使用基于残差双注意力的编解码器的深度网络架构对步骤2得到的图像进行处理，编码器用于提取图像特征，减少空间维度，增大感受野；解码器用于逐步恢复图像的细节信息和空间维度；利用预处理的图像对残差双注意力网络模型进行训练，得到训练好的残差双注意力网络模型；

步骤4、将模糊的低质量的水下图像输入所述训练好的残差双注意力网络模型中，得到清晰的水下图像。

本发明的特点还在于：

步骤1具体按照以下实施：对低质量的模糊的水下图像进行预处理，将图像的像素值归一化为[0,1]，并裁剪为256×256×3。

步骤2具体按照以下实施：将模糊的低质量的水下图像作为输入，将其分为R通道、G通道和B通道，分别对每个颜色通道进行单独的卷积操作，使深度网络了解应该为每个颜色通道分配的权重，并对其进行特征映射连接，对其进行输出，将其作为整个网络的中间输出，并采用MAE损失函数和SSIM损失函数进行约束，用于提高颜色恢复的质量和细节信息。

步骤3中使用基于残差双注意力的编解码器的深度网络架构对步骤2得到的图像进行处理具体按照以下实施：

将步骤2得到的图像作为图像去雾网络的输入，在编解码部分采用了卷积、深度可分离金字塔模块和残差双注意力模块，使用卷积用于提取图像的特征，使用深度可分离金字塔模块用于提高图像的亮度信息和对比度信息，使用残差双注意力模块用于对图像的细节和高频增厚的一些重要信息进行提取和细节增强，其中，残差双注意力模块采用残差块和通道注意力，像素注意力相结合的方式，通道注意力将更多的注意力集中在更重要的通道信息上，像素注意力将更多的注意力集中在高频和增厚的像素区域，在该模块的中间采用平滑扩张残差块，使用不同的扩张率，扩大感受野，并对平滑扩张残差块进行融合操作，使不同层次的信息充分融合，提取更多有用的信息。最后，将编码部分和解码部分进行跳跃连接，将浅层信息与深层信息进行充分融合，通过该网络模型来得到清晰的水下图像。

步骤3中残差块的公式为：

x_l+1＝x_l+F(x_l+W_l) (1)

其中，x_l+1为第l+1层卷积层的卷积结果，xl为第l层卷积层的卷积结果，W_l为第l层卷积层的权重，F(x_l+W_l)为残差部分。

本发明的有益效果是：本发明的目的是提供一种基于残差双注意力网络的水下图像增强方法，解决了现有技术中存在的水下图像存在的颜色偏差、背景模糊、对比度和能见度低等问题。

附图说明

图1为本发明一种基于残差双注意力网络的水下图像增强方法的流程示意图；

图2为本发明一种基于残差双注意力网络的水下图像增强方法中深度可分离的金字塔模块结构图；

图3为本发明一种基于残差双注意力网络的水下图像增强方法中残差双注意力基本块模块结构图；

图4为本发明一种基于残差双注意力网络的水下图像增强方法中通道注意力和像素注意力相结合的模块结构图；

图5为本发明一种基于残差双注意力网络的水下图像增强方法中平滑扩张残差块模块；

图6为本发明一种基于残差双注意力网络的水下图像增强方法中平滑扩张残差块的融合模块；

图7为本发明一种基于残差双注意力网络的水下图像增强方法中残差双注意力网络水下图像增强的整体结构示意图；

图8为本发明一种基于残差双注意力网络的水下图像增强方法中水下图像增强结果对比图；

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明一种基于残差双注意力网络的水下图像增强方法，具体按照以下步骤实施：

步骤1、对输入的图像进行预处理；

步骤3、使用基于残差双注意力的编解码器的深度网络架构对步骤2得到的图像进行处理，编码器用于提取图像特征，减少空间维度，增大感受野；解码器用于逐步恢复图像的细节信息和空间维度；利用预处理的图像对残差双注意力网络模型进行训练，得到训练好的残差双注意力网络模型。

步骤3中残差块的公式为：

x_l+1＝x_l+F(x_l+W_l) (2)

其中，x_l+1为第l+1层卷积层的卷积结果，x_l为第l层卷积层的卷积结果，W_l为第l层卷积层的权重，F(x_l+W_l)为残差部分。

本发明一种基于残差双注意力网络的水下图像增强方法中残差双注意力网络模型的损失函数公式为：

MAE损失：利用L₁损失优化颜色恢复网络模块结果的纹理信息和细节结构，绝对值误差用于测量图像经过颜色恢复网络模块的结果与对应清晰图像之差的绝对值。具体的公式如下所示：

公式中Y_i代表输入的清晰的水下图像，x_i代表输入的第i张模糊的水下图像，f(x_i)代表通过颜色恢复模块预测出来的清晰的水下图像。

SSIM损失函数：因为颜色恢复模块是对每一个颜色通道进行单独的卷积操作并为其分配不同的权重信息，使其产生视觉上令人愉悦的结果。因此，我们使用SSIM损失优化颜色恢复网络模块的输出结果，提高颜色恢复的图像质量。SSIM损失函数考虑了亮度、对比度和结构指标，设x和y分别表示模糊的低质量的水下图像和清晰的水下图像。

表示输入图像x经过颜色恢复网络后输出的图像。因此，

和y之间的SSIM计算公式如下所示：

其中g、c和s分别表示亮度、对比度和结构，α、β和γ是系数。SSIM损失可以定义为：

MSE损失函数：为了使图像去雾后输出的清晰的水下图像与真实的清晰水下图像越接近越好，在图像去雾网络使用L₂损失函数。均方误差损失函数是基于逐像素比较图像去雾后的水下图像与清晰的水下图像之间的差异，然后取平方，具体的公式如下所示：

因此本发明一种基于残差双注意力网络的水下图像增强方法的总损失函数为：

Loss＝λ₁Loss_MAE+λ₂Loss_SSIM+λ₃Loss_MSE (7)

其中，λ₁、λ₂、λ₃代表设置的参数。

本发明一种基于残差双注意力网络的水下图像增强方法，分为两个阶段，将其分为颜色恢复网络和图像去雾网络，具体的细节介绍如下所述：

在颜色恢复网络中，将模糊的低质量的水下图像作为输入，将其分为R通道、G通道和B通道，分别对每个颜色通道进行单独的卷积操作，使深度网络了解应该为每个颜色通道分配的权重，并对其进行特征映射连接，使其产生视觉上令人愉悦的颜色。在颜色恢复网络中，对其进行输出，将其作为整个网络的中间输出，并采用MAE损失函数和SSIM损失函数进行约束，用于提高颜色恢复的质量和细节信息。

在图像去雾网络中，将颜色恢复网络的输出作为图像去雾网络的输入，在该网络中，采用编解码的网络架构，在编解码部分采用了卷积、深度可分离金字塔模块和残差双注意力模块，使用卷积用于提取图像的特征，使用深度可分离金字塔模块用于提高图像的亮度信息和对比度信息，使用残差双注意力模块用于对图像的细节和高频增厚的一些重要信息进行提取和细节增强。在该模块的中间采用平滑扩张残差块，使用不同的扩张率，扩大感受野，并对平滑扩张残差块进行融合操作，使不同层次的信息充分融合，提取更加丰富的信息。最后，将编码部分和解码部分进行跳跃连接，将浅层信息与深层信息进行充分融合，通过该网络模型来得到清晰的水下图像。在图像去雾网络中，使用MSE损失函数，用于优化图像去雾后输出的清晰的水下图像与真实的清晰水下图像之间的差异。

采用数据集对所述残差双注意力网络模型进行训练，得到训练好的残差双注意力网络模型。

将模糊的低质量的水下图像输入所述训练好的残差双注意力网络模型中，得到清晰的水下图像。

在图像去雾网络中的深度可分离的金字塔模块采用深度可分离卷积相对于其他卷积而言，所用的参数更少，对输入特征采用不同大小的卷积核进行卷积操作，然后对其做concat操作，最后使用1×1的卷积。

在图像去雾网络中残差双注意力模块采用了残差块、通道注意力和像素注意力相结合的方式，用于对图像的细节和高频增厚的一些重要信息进行提取和细节增强。

在图像去雾网络中平滑扩张残差块采用不同的扩张率，用于扩大图像的感受野，并在平滑扩张残差块的最后对其进行融合操作，使不同层次的信息充分融合，提取更加丰富的信息。

实施例

步骤1、对输入的图像进行预处理，将图像的像素值归一化为[0,1]，并裁剪为256×256×3。

步骤2、将卷积操作、实例归一化和激活函数ReLU组合为一个卷积层。

F＝ReLU(Instance_norm(Conv(x))) (8)

步骤3、构建需要的深度可分离金字塔模块DS_Block，在实验代码的编写中把DS_Block模块封装到函数里，这样在网络编写的时候需要这个模块就直接调用这个函数。如图2所示，在DS_Block模块中，采用深度可分离卷积，深度可分离卷积包括逐深度卷积和逐点卷积，对输入特征分别做1×1，3×3，5×5和7×7的逐深度卷积，然后对它们做1×1的逐点卷积，经过SeLU激活函数，对其进行concat操作后经过Conv1x1、IN、ReLU，最后对特征进行输出。

步骤4、构建需要的残差双注意力基本块CP_Resblock，在实验代码的编写中把CP_Resblock模块封装到函数里，在需要该模块的时候可以直接调用这个函数。图3给出了总的残差双注意力模块的结构，在CP_Resblock模块中，采用残差模块和通道注意力以及像素注意力相结合的方式，图4给出了具体的通道注意力和像素注意力的结构。在残差双注意力模块使用卷积核大小为3×3的残差块提取特征，将其连接到通道注意力模块中，将特征图的大小从C×H×W变成C×1×1，依次经过一个3×3卷积层，ReLU激活函数，3×3卷积层，Sigmoid激活函数，提取通道上的权重信息，用于关注不同通道的权重信息，使网络更加关注通道与通道之间的关系。再将其经过像素注意力模块，将输出特征依次经过1×1卷积层，ReLU激活函数，1×1卷积层和Sigmoid激活函数，使其形状由C×H×W变成1×H×W，使网络更加关注雾度的像素信息，最后将残差块的输入与像素注意力的输出进行相加输出。

步骤5、构建需要的平滑扩张残差块模块SD_Resblock，在实验代码的编写中把SD_Resblock模块封装到函数里，在需要该模块的时候可以直接调用这个函数。如图5所示的是一个平滑扩张残差块的结构，在SD_Resblock模块中，采用可分离和可共享的卷积作为额外的卷积层用SSConv3×3表示，在如图6所示的是本发明的基于融合的六个平滑扩张残差块，标有rate的值代表的是扩张率，Fusion模块是对它们的输出特征与其所对应的权值进行相乘相加的线性组合。

步骤6、将处理后的输入图像分为R通道、G通道和B通道，即用x_R,x_G,x_B表示，分别对每一个颜色通道进行卷积操作，每一个颜色通道经过卷积核大小为7×7和步长为1通道大小为64的卷积层：

O_R1＝F₁(x_R) (9)

O_G1＝F₂(x_G) (10)

O_B1＝F₃(x_B) (11)

步骤7、将输出特征O_R1，O_G1，O_B1分别经过卷积核大小为5×5和步长为1通道大小为64的卷积层：

O_R2＝F₄(O_R1) (12)

O_G2＝F₅(O_G1) (13)

O_B2＝F₆(O_B1) (14)

步骤8、将输出特征O_R2，O_G2，O_B2分别经过卷积核大小为3×3和步长为1通道大小为64的卷积层：

O_R3＝F₇(O_R2) (15)

O_G3＝F₈(O_G2) (16)

O_B3＝F₉(O_B2) (17)

步骤9、将输出特征O_R3，O_G3，O_B3分别经过卷积核大小为7×7和步长为1通道大小为32的卷积层：

O_R4＝F₁₀(O_R3) (18)

O_G4＝F₁₁(O_G3) (19)

O_B4＝F₁₂(O_B3) (20)

步骤10、将输出特征O_R4，O_G4，O_B4分别经过卷积核大小为5×5和步长为1通道大小为32的卷积层：

O_R5＝F₁₃(O_R4) (21)

O_G5＝F₁₄(O_G4) (22)

O_B5＝F₁₅(O_B4) (23)

步骤11、将输出特征O_R5，O_G5，O_B5分别经过卷积核大小为3×3和步长为1通道大小为32的卷积层：

O_R6＝F₁₆(O_R5) (24)

O_G6＝F₁₇(O_G5) (25)

O_B6＝F₁₈(O_B5) (26)

步骤12、将输出特征O_R6，O_G6，O_B6做Concat₁连接：

O₇＝Concat₁(O_R6,O_G6,O_B6) (27)

步骤13、将输出特征O₇经过一个卷积核大小3×3和步长为1通道为32的卷积层：

O₈＝F₁₉(O₇) (28)

步骤14、将输出特征O₈经过一个卷积核大小1×1和步长为1通道为3的卷积层，将其作为颜色恢复网络的输出Output1(O₉)：

O₉＝F₂₀(O₈) (29)

步骤6-14为颜色恢复网络，主要是将输入的水下图像映射到R通道、G通道、B通道，分别对每个颜色通道进行单独的卷积操作，使深度网络了解应该为每个颜色通道应该分配的权重，使其产生感知上令人愉悦的颜色。

步骤15、在图像去雾网络中，将Output1作为Input2的输入，即Input2的大小为256×256×3，将输出特征O₉经过一个卷积核大小为3×3和步长为1通道为64的卷积层：

O₁₀＝F₂₁(O₉) (30)

步骤16、将输出特征O₁₀经过卷积组成的深度可分离金字塔DS_Block₁模块中：

O₁₁＝DS_Block₁(O₁₀) (31)

步骤17、将输出特征O₁₁经过卷积组成的残差双注意力CP_Resblock₁模块中：

O₁₂＝CP_Resblock₁(O₁₁) (32)

步骤18、将输出特征O₁₂使用卷积核大小为3×3和步长为2通道为64的卷积层进行下采样处理：

O₁₃＝DownSample₁(O₁₂) (33)

步骤19、将输出特征O₁₃经过一个卷积核大小为3×3和步长为1通道为64的卷积层：

O₁₄＝F₂₂(O₁₃) (34)

步骤20、将输出特征O₁₄经过卷积组成的深度可分离金字塔DS_Block₂模块中：

O₁₅＝DS_Block₂(O₁₄) (35)

步骤21、将输出特征O₁₅经过卷积组成的残差双注意力CP_Resblock₂模块中：

步骤22、将输出特征O₁₆使用卷积核大小为3×3和步长为2通道为64的卷积层进行下采样处理：

O₁₇＝DownSample₂(O₁₆) (37)

步骤16-22为图像去雾网络的编码器部分，在该部分主要采用了卷积、深度可分离金字塔模块、残差双注意力模块和下采样，主要用于提取图像特征，减少空间维度，增大感受野，对图像的亮度、对比度和细节信息进行提取。

步骤23、将输出特征O₁₇经过通道数为64，扩张率为1的平滑扩张残差块SD_Resblock₁模块中：

O₁₈＝SD_Resblock₁(O₁₇) (38)

步骤24、将输出特征O₁₈经过通道数为64，扩张率为1的平滑扩张残差块SD_Resblock₂模块中：

O₁₉＝SD_Resblock₂(O₁₈) (39)

步骤25、将输出特征O₁₉经过通道数为64，扩张率为2的平滑扩张残差块SD_Rseblock₃模块中：

O₂₀＝SD_Resblock₃(O₁₉) (40)

步骤26、将输出特征O₂₀经过通道数为64，扩张率为2的平滑扩张残差块SD_Resblock₄模块中：

O₂₁＝SD_Resblock₄(O₂₀) (41)

步骤27、将输出特征O₂₁经过通道数为64，扩张率为4的平滑扩张残差块SD_Resblock₅模块中：

O₂₂＝SD_Resblock₅(O₂₁) (42)

步骤28、将输出特征O₂₂经过通道数为64，扩张率为4的平滑扩张残差块SD_Resblock₆模块中：

O₂₃＝SD_Resblock₆(O₂₂) (43)

步骤29、输出特征O₁₉，O₂₁，O₂₃对应的权重为M₁,M₂,M₃，对它们的输出特征与权重进行线性组合：

O₂₄＝O₁₉×M₁+O₂₁×M₂+O₂₃×M₃ (44)

步骤23-29是编解码的中间部分，在该部分采用了扩张率分别为1、1、2、2、4、4的平滑扩张残差块，对其做特征融合操作，使不同层次的信息充分融合，提取更多有用的信息。

步骤30、将输出特征O₂₄使用卷积核大小3×3和步长为2通道为64的转置卷积层进行上采样处理：

O₂₅＝Upsampling₁(O₂₄) (45)

步骤31、将输出特征O₁₆与O₂₅进行Concat₂跳跃连接：

O₂₆＝Concat₂(O₁₆,O₂₅) (46)

步骤32、将输出特征O₂₆经过一个卷积核大小为3×3和步长为1通道为64的卷积层：

O₂₇＝F₂₃(O₂₆) (47)

步骤33、将输出特征O₂₇经过卷积组成的深度可分离金字塔DS_Block₃模块中：

O₂₈＝DS_Block₃(O₂₇) (48)

步骤34、将输出特征O₂₈经过卷积组成的残差双注意力CP_Resblock₃模块中：

O₂₉＝CP_Resblock₃(O₂₈) (49)

步骤35、将输出特征O₂₉使用卷积核大小3×3和步长为2通道为64的转置卷积层进行上采样处理：

O₃₀＝UpSampling₂(O₂₉) (50)

步骤36、将输出特征O₁₂与O₃₀进行Concat₃跳跃连接：

O₃₁＝Concat₃(O₁₂,O₃₀) (51)

步骤37、将输出特征O₃₁经过一个卷积核大小为3×3和步长为1通道为64的卷积层：

O₃₂＝F₂₄(O₃₁) (52)

步骤38、将输出特征O₃₂经过卷积组成的深度可分离金字塔DS_Block₄模块中：

O₃₃＝DS_Block₄(O₃₂) (53)

步骤39、将输出特征O₃₃经过卷积组成的残差双注意力CP_Resblock₄模块中：

O₃₄＝CP_Resblock₄(O₃₃) (54)

步骤30-39为图像去雾网络的解码器部分，在该部分采用了上采样、卷积、深度可分离金字塔模块和残差双注意力模块，用于恢复图像的细节信息和空间信息，并且对其做了跳跃连接使得编解码器能够更好的恢复图像的细节信息，还原图像的精度。

步骤40、将输出特征O₃₄经过一个卷积核大小为1×1和步长为1通道为3的卷积层，即可得到最后的输出图像结果，此步骤后就构成了卷积神经网络模型(结构如图7)：

O₃₅＝F₂₅(O₃₄) (55)

步骤41、采用预处理好的数据集对残差双注意力网络模型进行训练，得到水下图像增强的网络模型。利用上文提到的损失函数对训练网络得到的结果进行约束，然后反向传播更新参数，通过150次的训练，这里的1次指的是把预处理好的所有图片训练一遍，最后得到训练好的水下图像增强的网络模型。

步骤42、将待处理的低质量的模糊的水下图像放入训练好的模型中进行测试，最终输出增强后的结果，对比结果如图8所示。第一行是低质量的模糊的水下图像，第二行是使用本发明的模型增强后的水下图像，第三行是清晰的水下图像。

Claims

1.一种基于残差双注意力网络的水下图像增强方法，其特征在于，具体按照以下步骤实施：

步骤1、对输入的图像进行预处理；

2.根据权利要求1所述的一种基于残差双注意力网络的水下图像增强方法，其特征在于，所述步骤1具体按照以下实施：对低质量的模糊的水下图像进行预处理，将图像的像素值归一化为[0,1]，并裁剪为256×256×3。

3.根据权利要求1所述的一种基于残差双注意力网络的水下图像增强方法，其特征在于，所述步骤2具体按照以下实施：将模糊的低质量的水下图像作为输入，将其分为R通道、G通道和B通道，分别对每个颜色通道进行单独的卷积操作，使深度网络了解应该为每个颜色通道分配的权重，并对其进行特征映射连接，对其进行输出，将其作为整个网络的中间输出，并采用MAE损失函数和SSIM损失函数进行约束，用于提高颜色恢复的质量和细节信息。

4.根据权利要求1所述的一种基于残差双注意力网络的水下图像增强方法，其特征在于，所述步骤3中使用基于残差双注意力的编解码器的深度网络架构对步骤2得到的图像进行处理具体按照以下实施：

5.根据权利要求1所述的一种基于残差双注意力网络的水下图像增强方法，其特征在于，所述步骤3中残差块的公式为：

x_l+1＝x_l+F(x_l+W_l) (1)