CN117974509B

CN117974509B - 基于目标检测感知特征融合的两阶段水下图像增强方法

Info

Publication number: CN117974509B
Application number: CN202410390972.XA
Authority: CN
Inventors: 李坤乾; 徐旷惟; 刘帅鑫; 宋大雷
Original assignee: Ocean University of China
Current assignee: Ocean University of China
Priority date: 2024-04-02
Filing date: 2024-04-02
Publication date: 2024-06-18
Anticipated expiration: 2044-04-02
Also published as: CN117974509A

Abstract

本发明公开基于目标检测感知特征融合的两阶段水下图像增强方法，属于图像增强技术领域，用于水下图像增强，包括：获得待处理的图像数据集，构建两阶段深度学习增强网络在训练与学习过程中所需的训练样本，搭建两阶段深度学习增强网络训练两阶段深度学习增强网络；将一幅视觉质量退化的水下图像作为两阶段深度学习增强网络的输入，经过两阶段的增强处理后，输出增强图像。本发明基于颜色迁移参数预测策略和统计学先验知识的频域分离增强策略结合神经网络策略，在不同水体环境下的增强视觉效果更好，同时在跨水域目标检测任务中，融合目标检测潜在感知特征后的增强图像有效缓解了域偏移导致的检测性能衰退问题。

Description

基于目标检测感知特征融合的两阶段水下图像增强方法

技术领域

本发明公开基于目标检测感知特征融合的两阶段水下图像增强方法，属于图像增强技术领域。

背景技术

随着海洋技术装备的持续发展，越来越多先进的工具被用来探索和开发海洋资源。深海潜水器和自主水下无人机等高端设备的发展，极大地扩展了人类对海洋的观测能力和作业范围。这些技术的进步不仅能够到达过去无法到达的深海区域，还能够更加精确地采集数据和图像，为科研和资源开发提供支持。然而，海洋环境的固有复杂性——特别是水下环境的低光照、高浊度以及水体对光的吸收和散射——仍然给高质量水下图像获取带来了挑战。

因此，水下图像增强技术的重要性愈加凸显。随着人工智能技术的融入，水下图像增强已经成为智能化海洋观测的重要组成部分，研究人员期望通过水下图像增强技术处理回传的图像数据，提高信息提取的准确性和效率。近年来，随着深度学习的发展，水下图像增强技术由原有的传统图像增强算法过渡到以深度学习策略为主的图像增强算法，以卷积神经网络、对抗生成网络、Transformer为代表的深度学习技术在图像增强领域得到了广泛应用且取得优秀的视觉增强效果。水下图像增强技术的既是为了获得视觉效果更优秀的图像，也希望能够帮助水下场景的科研工作提高准确率和效率，然而在某些场景下水下图像增强技术增强后的图像在进行后续检测任务时没有获得预期的积极效果，这也背离了水下图像增强技术的初衷。

一方面，由于现有大多水下图像评价指标设计的出发点是人眼视觉感知习惯，导致增强后的图像虽然满足人眼偏好，但没有满足机器视觉偏好，在校正退化图像颜色或结构的同时丢失了下游检测任务的关键特征。另一方面，与陆空环境中的数据集相比，例如去雨去雾任务和暗光增强任务数据集同时包含无噪声真值图像和检测任务标注，水下缺少既包含增强参考真值图像，又包含水下目标检测真值标注的数据集，这导致在有限的水下增强数据集训练的网络算法，面对形形色色的目标检测数据集时呈现风格迥异的增强结果，这种不稳定、不统一的增强对下游任务性能产生不利影响。

发明内容

本发明的目的在于提供基于目标检测感知特征融合的两阶段水下图像增强方法，以解决现有技术中，水下图像质量低的问题。

基于目标检测感知特征融合的两阶段水下图像增强方法，包括：

S1获得待处理的图像数据集，构建两阶段深度学习增强网络在训练与学习过程中所需的训练样本，一个训练样本包含水下增强数据集退化图像，与/>对应的参考增强图像，/>的颜色迁移参数参考真值，水下目标检测数据集图像/>；

S2搭建两阶段深度学习增强网络，两阶段深度学习增强网络包括颜色迁移参数预测模块、内置的颜色迁移模块、频域增强模块、检测特征融合模块；

在一阶段网路中，利用颜色迁移损失对颜色迁移参数预测模块进行约束优化，利用高频特征损失、低频特征损失和像素值对比损失约束一阶段增强网络的输出；

在二阶段网络中，利用感知特征对比损失约束网络融合目标检测感知特征，利用像素值对比损失约束二阶段网络的总体输出；

S3训练两阶段深度学习增强网络；

S4将一幅视觉质量退化的水下图像作为两阶段深度学习增强网络的输入，经过两阶段的增强处理后，输出增强图像。

S1包括，将从RGB颜色空间转换到Lab颜色空间，分别计算源图像和目标图像的每个颜色通道的平均值/>和标准差/>：

；/>；

式中，𝑁是图像中通道的像素总数，是第𝑖个像素在颜色通道上的值；

、/>、/>、/>和/>共同组成一个用于训练两阶段深度学习增强网络的样本。

S2包括，S2.2根据深度回归网络VGG-Net的结构，搭建用于获取颜色迁移参数的颜色迁移参数预测模块，预测输出用于颜色迁移的六个基础参数，基础参数包括目标迁移图像的L*、a*、b*三个通道的均值和标准差/>；颜色迁移参数预测模块包括深度编码模块和深度回归模块，深度编码模块采用卷积层-激活层-池化层，以深度特征提取结构堆叠而成，提取输入图像的各层次深度特征表达；深度回归模块采用解码器结构，深度回归模块的输出为颜色迁移所需要的六个均值和标准差参数。

S2包括，S2.3设计内置的颜色迁移模块，获得颜色迁移后的颜色迁移图像：

；

式中，为增强图像的通道c矩阵，/>表示输入退化图像的通道c矩阵，/>表示输入退化图像的通道c矩阵元素均值，/>表示输入退化图像的通道c矩阵元素标准差；

内置的颜色迁移模块以退化图像、颜色迁移参数预测模块输出均值/>和标准差为输入，输出颜色迁移后视觉质量得到初步增强的颜色迁移图像/>。

S2包括，S2.4.搭建用于增强图像纹理和校正图像颜色的频域增强模块，以颜色迁移模块输出的颜色迁移图像为输入，将颜色迁移图像转化到频域，对高频信息使用自注意力机制引导的边缘补偿进行增强处理，对低频信息使用多颜色空间直方图拉伸进行增强处理，再将增强后的高频信息和低频信息进行融合优化；

频域增强模块包括注意力机制引导的边缘补偿模块、基于统计学的多颜色空间关联校正模块和频域特征融合优化模块，注意力机制引导的边缘补偿模块采用像素注意力和通道注意力机制结合的方式提高增强网络对边缘细节的敏感性，基于统计学的多颜色空间关联校正模块使用卷积层动态学习直方图拉伸参数，在RGB、Lab、HIS、HSV颜色空间进行直方图拉伸，校正颜色迁移后对颜色增强的不足，频域特征融合优化模块采用解码器结构，使用堆叠的卷积层-激活层-池化层得到一阶段增强图像。

S2包括，S2.5.搭建用于融合目标检测感知特征的检测特征融合模块，以和其一阶段增强图像/>为输入，/>经过二阶段特征融合网络增强得到二阶段增强图像/>，将/>和/>送入预训练的目标检测器提取并对比潜在检测感知特征，约束二阶段特征融合增强网络。

S3包括，S3.1将作为一阶段深度学习增强网络的输入；

S3.2将颜色迁移参数预测模块的六个参数输出，计算与/>、/>与/>之间的颜色迁移损失，颜色迁移损失为/>：

；

S3.3输入经过一阶段增强网络模型后生成与输入对应的增强水下图像记为/>，计算/>和/>之间的像素对比损失/>：

；

式中，w和h表示的宽和高。

S3包括，S3.4在频域增强模块中，计算注意力机制引导的边缘补偿模块的高频特征损失和基于统计学的多颜色空间关联校正模块的低频特征损失/>：

；

式中，和/>分别表示高频特征中的像素级信息值和真值参考图像高频特征的像素级信息值，/>和/>分别表示高频特征中的像素级信息值和真值参考图像高频特征的像素级信息值，/>和/>分别表示增强图像和真值参考图像的均值，/>和/>分别表示增强图像和真值参考图像的标准差，/>表示增强图像和真值参考图像的协方差，/>、/>和/>为微小常量。

S3包括，S3.5通过最小化损失项之和，迭代更新优化一阶段增强网络的模型参数：

；

其中，=0.3，/>=0.1；

S3.6将和/>，作为二阶段增强网络的输入；

S3.7将二阶段增强的图像记作，计算/>和/>之间的像素对比损失/>：

。

S3包括，S3.8预训练的目标检测器从和/>中提取潜在感知特征/>和/>，计算/>和/>的空间距离作为感知特征对比损失/>：

；

式中，和/>分别是/>和/>中的像素点信息，/>为微小常数；

S3.9通过最小化损失项之和，迭代更新优化一阶段增强网络的模型参数：

；

式中，。

相对比现有技术，本发明具有以下有益效果：有效缓解了大多数一般图像增强技术增强过程中中对目标检测特征的破坏，使增强后的图像应用于后续目标检测任务上的性能表现更好，给出了一种水下图像增强任务和水下目标检测任务的级联使用的方法；基于颜色迁移参数预测策略和统计学先验知识的频域分离增强策略结合神经网络策略，在不同水体环境下的增强视觉效果更好，同时在跨水域目标检测任务中，融合目标检测潜在感知特征后的增强图像有效缓解了域偏移导致的检测性能衰退问题。

附图说明

图1是本发明一种实施例的两阶段水下图像增强方法的流程示意图；

图2是本发明一种实施例的两阶段水下图像增强方法的详细流程示意图；

图3是本发明一种实施例的两阶段水下图像增强系统的框架示意图；

图4是本发明一种实施例的两阶段水下图像增强深度网络的训练数据准备流程示意图；

图5是本发明一种实施例的两阶段水下图像增强深度网络的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

S3训练两阶段深度学习增强网络；

；/>；

；

S3包括，S3.1将作为一阶段深度学习增强网络的输入；

；

式中，w和h表示的宽和高。

；

其中，=0.3，/>=0.1；

S3.6将和/>，作为二阶段增强网络的输入；

。

；

式中，和/>分别是/>和/>中的像素点信息，/>为微小常数；

；

式中，。

本发明实施例中，两阶段水下图像增强方法的流程示意图如图1，首先获得一幅需要检测的水下退化图像，作为输入图像，然后利用训练好的两阶段水下图像增强网络，先后进行一阶段和二阶段的图像增强，获得与输入退化水下图像相对应的水下清晰图像。两阶段水下图像增强方法详细流程如图2所示，首先获得数据增强扩展数据集，执行训练数据准备、增强模型训练和模型部署。两阶段水下图像增强系统的框架如图3所示，包括水下图像获取模块、可选择的图像预处理模块、一阶段颜色迁移模块、一阶段频域增强模块和二阶段检测特征增强模块。两阶段水下图像增强网络的训练数据准备流程如图4，将图像增强数据集分为水下退化图像和水下清晰图像，分别输入三个通道中，并将图像增强数据集拓展为图像增强扩展数据集；目标检测数据集中含有待检测目标的水下图像作为二阶段训练的数据图像。两阶段水下图像增强深度网络的结构示意图如图5所示，将水下退化图像依次导入颜色迁移参数预测模块、频域增强模块，得到一阶段增强图像，然后将一阶段增强图像和水下退化图像导入检测特征融合模块进行感知特征融合，最终得到有利于目标检测任务的水下清晰增强图像。

本申请的深度回归网络结构使用例如VGG-Net等回归预测网络结构，编码-解码结构使用例如U-Net等深度编码-解码结构，水下退化-增强图像的水下图像数据集使用例如UIEB数据集、DUO数据集，卷积层-激活层-池化层使用例如Conv-ReLu-MaxPool，本段举例都是本领域的现有技术，因此未解释详细内容。

本发明的具体实施中，表1列出了使用绿色域训练增强网络在其余域检测定量评价的结果，表2列出了使用蓝绿色域训练增强网络在其余域检测定量评价的结果。

表1 使用绿色域训练增强网络在其余域检测定量评价的结果

。

表2 使用蓝绿色域训练增强网络在其余域检测定量评价的结果

。

表1和表2中展示了所提出的一种基于目标检测感知特征融合的两阶段水下图像增强方法在跨水域场景中的目标检测任务的性能表现，其中XX域表示跨水域原始图像的检测结果，En-XX域表示经过该方法增强后图像的检测结果，选取的评价指标均为公共数据集VOC和COCO中的评价方法，mAP表示全部类别的平均精确度，AP表示单类别的平均精确度，AR表示平均召回率，AP直观的反映了测试数据集中检测的准确率，AR直观的反映了测试数据集中检测的漏检率。

以上实施例仅用于说明本发明的技术方案，而非对其限制，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换，而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.基于目标检测感知特征融合的两阶段水下图像增强方法，其特征在于，包括：

S1获得待处理的图像数据集，构建两阶段深度学习增强网络在训练与学习过程中所需的训练样本，一个训练样本包含水下增强数据集退化图像，与/>对应的参考增强图像/>，/>的颜色迁移参数参考真值，水下目标检测数据集图像/>；

在一阶段网络中，利用颜色迁移损失对颜色迁移参数预测模块进行约束优化，利用高频特征损失、低频特征损失和像素值对比损失约束一阶段增强网络的输出；

S3训练两阶段深度学习增强网络；

S4将一幅视觉质量退化的水下图像作为两阶段深度学习增强网络的输入，经过两阶段的增强处理后，输出增强图像；S1包括，将从RGB颜色空间转换到Lab颜色空间，分别计算源图像和目标图像的每个颜色通道的平均值/>和标准差/>：

；/>；

、/>、/>、/>和/>共同组成一个用于训练两阶段深度学习增强网络的样本；

S2包括，S2.2根据深度回归网络VGG-Net的结构，搭建用于获取颜色迁移参数的颜色迁移参数预测模块，预测输出用于颜色迁移的六个基础参数，基础参数包括目标迁移图像的L*、a*、b*三个通道的均值和标准差/>；颜色迁移参数预测模块包括深度编码模块和深度回归模块，深度编码模块采用卷积层-激活层-池化层，以深度特征提取结构堆叠而成，提取输入图像的各层次深度特征表达；深度回归模块采用解码器结构，深度回归模块的输出为颜色迁移所需要的六个均值和标准差参数；

；

内置的颜色迁移模块以退化图像、颜色迁移参数预测模块输出均值/>和标准差/>为输入，输出颜色迁移后视觉质量得到初步增强的颜色迁移图像/>；

频域增强模块包括注意力机制引导的边缘补偿模块、基于统计学的多颜色空间关联校正模块和频域特征融合优化模块，注意力机制引导的边缘补偿模块采用像素注意力和通道注意力机制结合的方式提高增强网络对边缘细节的敏感性，基于统计学的多颜色空间关联校正模块使用卷积层动态学习直方图拉伸参数，在RGB、Lab、HIS、HSV颜色空间进行直方图拉伸，校正颜色迁移后对颜色增强的不足，频域特征融合优化模块采用解码器结构，使用堆叠的卷积层-激活层-池化层得到一阶段增强图像；

S2包括，S2.5.搭建用于融合目标检测感知特征的检测特征融合模块，以和其一阶段增强图像/>为输入，/>经过二阶段特征融合网络增强得到二阶段增强图像/>，将/>和/>送入预训练的目标检测器提取并对比潜在检测感知特征，约束二阶段特征融合增强网络；

S3.1将作为一阶段深度学习增强网络的输入；

；

式中，w和h表示的宽和高；

；

式中，和/>分别表示高频特征中的像素级信息值和真值参考图像高频特征的像素级信息值，/>和/>分别表示高频特征中的像素级信息值和真值参考图像高频特征的像素级信息值，/>和/>分别表示增强图像和真值参考图像的均值，/>和/>分别表示增强图像和真值参考图像的标准差，/>表示增强图像和真值参考图像的协方差，/>、/>和/>为微小常量；

；

其中，=0.3，/>=0.1；

S3.6将和/>，作为二阶段增强网络的输入；

；

式中，和/>分别是/>和/>中的像素点信息，/>为微小常数；

；

式中，。