CN114511480A

CN114511480A - 一种基于分数阶卷积神经网络的水下图像增强方法

Info

Publication number: CN114511480A
Application number: CN202210088955.1A
Authority: CN
Inventors: 李建祯; 朱钰裕; 杜昭平; 蔡悦
Original assignee: Jiangsu University of Science and Technology
Current assignee: Jiangsu University of Science and Technology
Priority date: 2022-01-25
Filing date: 2022-01-25
Publication date: 2022-05-17

Abstract

本发明公开了一种基于分数阶卷积神经网络的水下图像增强方法，步骤包括：输入水下图像，通过白平衡及直方图均衡化对水下图像进行初步预处理，设计水下图像的环境光估计网络和透射率估计网络，分别对两个估计网络进行参数训练，对于环境光估计网络输出得到环境光值B，对于透射率估计网络，输出得到透射率参数t,根据水下物理模型复原得到清晰的图像。本发明的方法在不需要大量高质量清晰水下图像的前提下，通过计算一组IQM来评估结果的方法，使得增强后的水下图像视觉质量明显提升，增强效果显著。

Description

一种基于分数阶卷积神经网络的水下图像增强方法

技术领域

本发明属于计算机视觉技术领域，具体涉及一种基于分数阶卷积神经网络的水下图像增强方法。

背景技术

海洋中蕴藏着丰富的资源，水下图像作为海洋信息的重要载体，对海洋的探测和开发具有无法代替的作用。由于受到水下复杂环境的影响，水下拍摄的图像往往存在质量退化现象，为了改善原始水下图像的对比度低、颜色失真、细节模糊等问题，需要对水下图像进行增强处理，以获得清晰的水下图像。

现有的水下图像增强技术已经取得了很大进步，水下图像增强效果比较明显，然而，恢复水下图像的视觉质量仍然面临巨大挑战。

现有的水下图像增强方法主要有两大类，一类是传统的水下图像增强方法，包括基于直方图的增强方法、基于Retinex的增强方法、基于滤波和信号处理的增强方法、基于图像融合的增强方法，另一类是基于神经网络的增强方法。这些方法都能不同程度的使水下图像得到增强，改善原始水下图像的对比度低、颜色失真、细节模糊等问题。然而，这些方法在参数训练过程中都需要水下原始图像对应的真实图像。尽管目前的水下图像数据集可以采用多种方式得到，但要得到大量高质量的真实水下图像还是比较困难的，能否在不需要真实图像的情况下采用模拟数据指导的方法来恢复水下图像的视觉质量，得到高质量的清晰图像，是一个值得研究的课题。另外，现有的方案在神经网络的参数训练过程中，比如随机梯度下降法、动量梯度下降法等，其学习收敛速度较慢，训练时间较长。由于分数阶具有记忆性和遗传性的特点，在参数训练算法中引入分数阶，可使网络权值的更新更稳定，进一步提高训练速度和准确率。此外由于分数阶模型包含整数阶模型，因此分数阶模型中参数的调节也更灵活，可为神经网络参数训练优化算法提供更多的可能。

发明内容

本发明的目的是针对现实中缺乏大量的真实水下图像的困难和问题，为了增强原始水下图像的视觉质量，并且提升网络参数训练过程中的学习速率，而提供一种基于分数阶卷积神经网络的水下图像增强方法。

为达到上述目的，本发明是通过以下技术方案予以实现的：

一种基于分数阶卷积神经网络的水下图像增强方法，具体步骤如下：

步骤A1：输入原始的水下图像。

步骤A2：水下图像初步预处理，即通过白平衡及直方图均衡化纠正图像的色彩偏差，并增强图像的亮度和对比度。

步骤A3：设计水下图像的环境光估计网络和透射率估计网络。

所述环境光估计网络的结构为：输入的图像大小为49*49，第一层的卷积核大小为7*7，步长为1，输出得到43*43的图像。第二层的卷积核大小为5*5，步长为1，输出得到39*39的图像。第三层为池化层，大小为3*3，步长为3，输出得到13*13的图像。第四层的卷积核大小为5*5，步长为1，输出得到9*9的图像。第五层为池化层，大小为3*3，步长为3，输出得到3*3的图像。最后一层采用卷积层作为非线性回归层。每个卷积层后都加上ReLU激活函数，以加快训练的收敛速度，避免陷入局部最小值。

所述透射率估计网络的设计包括以下三个步骤，分别为：(1)搭建预处理模块，提取图像的浅层特征；(2)采用多尺度卷积层实现特征提取与融合；(3)应用反卷积模块恢复图像原始尺寸，输出透射率图。

步骤A4：对环境光估计网络和透射率估计网络进行参数训练。

所述环境光估计网络的参数训练，即通过网络前向传播计算出目标值和实际输出之间的误差，当误差在允许范围内，则结束训练；当误差超出允许范围，则计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

所述透射率估计网络的参数训练，即将初步预处理后的水下图像I送入到透射率估计网络中，输出得到透射率参数t。根据水下物理模型，环境光值B和透射率参数t得到清晰图像J。对比水下图像I和清晰图像J，采用IQM作为损失函数，通过网络前向传播计算出目标值和实际输出之间的误差，当误差在允许范围内，则结束训练；当误差超出允许范围，则计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

进一步的，所述环境光估计网络的参数训练采用环境光的估计值与其对应的理想值之间的欧氏距离作为损失函数，所述损失函数记作L_h，为：

其中||·||为对矩阵求二范数操作，B_i(I)为环境光的估计值，B_i(J)为其对应的理想值，i代表颜色通道，I为初步预处理后的水下图像，J为清晰图像。

进一步的，所述透射率估计网络参数训练中的损失函数记作L_IQM，为：

L_IQM＝1-IQM(I,J)

其中，IQM(I,J)为多目标函数的IQM集，选择与人的视觉感知紧密相关的五个指标构成IQM集：对比度、敏锐度、边界完整性、先验灰色世界和清晰度。

步骤A5：将预处理的水下图像I送入训练好的网络中，对于环境光估计网络，输出得到环境光值B；对于透射率估计网络，输出得到透射率参数t。

步骤A6：根据水下物理模型，结合步骤A5中环境光估计网络输出得到的环境光值B和透射率估计网络输出得到的透射率参数t，得到复原后清晰的图像。

具体的，水下物理模型为：

其中，J表示清晰图像，I表示初步预处理后的水下图像，B表示环境光值，t表示透射率参数。

本发明的优点和有益效果：

1、现有的环境光估计方法，大多通过选取图像中深度无穷远处的像素值作为环境光的估计结果，然而当有特殊物体的干扰或图像本身并没有深度很大的区域时，估计结果将会存在较大误差，而采用环境光估计网络这种深度学习的方法，学习水下图像和其对应环境光值之间的映射关系，能适应多种不同的水下环境，估计的环境光值B更为准确。

2、本发明采用的两种卷积神经网络，包括环境光估计网络和透射率估计网络，可以先后独立训练，设计灵活，训练方便。

3、本发明不需要大量高质量的真实清晰水下图像，而是通过计算一组IQM来评估结果的方法，以基于IQM的损失函数最小化，使得增强后的图像在视觉质量上得到明显提升，图像增强效果显著，视觉感官良好。

4、本发明使用分数阶动量的分数阶梯度下降算法对卷积神经网络的参数进行优化训练，可以大大加快学习收敛速度，工作效率得到明显提升。

附图说明

图1为本发明的水下图像增强方法流程图，

图2为本发明的环境光估计网络参数训练流程图，

图3为本发明的透射率估计网络参数训练流程图。

具体实施方式

下面将结合附图和实施例对本发明的技术方案做进一步的详细描述，该实施例仅用于解释本发明，并不对本发明的保护范围构成限定。

图1所示，为本发明的一种基于分数阶卷积神经网络的水下图像增强方法，具体步骤如下：

步骤A1：输入原始的水下图像。

所述环境光估计网络的输出仅为三通道的像素值，因此网络的设计较为简单。采用尺寸大小为49*49的图像，具体的网络结构为：第一层的卷积核大小为7*7，步长为1，输出得到43*43的图像。第二层的卷积核大小为5*5，步长为1，输出得到39*39的图像。第三层为池化层，大小为3*3，步长为3，输出得到13*13的图像。第四层的卷积核大小为5*5，步长为1，输出得到9*9的图像。第五层为池化层，大小为3*3，步长为3，输出得到3*3的图像。最后一层采用卷积层作为非线性回归层。每个卷积层后都加上ReLU激活函数，以加快训练的收敛速度，避免陷入局部最小值。

对于步骤(1)，连续采用3个卷积层对水下图像进行浅层特征的提取，3个卷积层的大小和个数都为3*3*16，激活函数采用带参数修正线性单元(PRelu),并使用BN归一化处理。

对于步骤(2)，对浅层特征提取的图像进行多尺度卷积运算，卷积核大小和个数分别为3*3*16、5*5*16、7*7*16，采用最大池化采样，激活函数采用带参数修正线性单元(PRelu),并使用BN归一化处理，再对其进行特征融合(Concat)。为了获得深层次的图像信息，再次使用多尺度3*3*16、5*5*16、7*7*16卷积核进行卷积操作，激活函数为PRelu，并使用BN归一化处理，再对其进行特征融合(Concat)。

对于步骤(3)，反卷积模块用来增加图像的空间维度，反卷积核的尺寸定为2*2，步长为1，将池化操作后的特征图还原成输入图像大小。网络模型最后一层采用3通道，卷积核大小为1*1，输出透射率图。

所述环境光估计网络的参数训练，即通过网络前向传播计算出目标值和实际输出之间的误差，如果误差在允许范围内，那么结束训练；如果误差超出允许范围，那么计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

所述透射率估计网络的参数训练，即将初步预处理后的水下图像I送入到透射率估计网络中，输出得到透射率参数t。根据水下物理模型，环境光值B和透射率参数t得到清晰图像J。对比I和J两幅图像，采用IQM作为损失函数，通过网络前向传播计算出目标值和实际输出之间的误差，如果误差在允许范围内，那么结束训练；如果误差超出允许范围，那么计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

所述环境光估计网络的参数训练采用环境光的估计值与其对应的理想值之间的欧氏距离作为损失函数，所述损失函数记作L_h，为：

所述透射率估计网络参数训练中的损失函数记作L_IQM，为：

L_IQM＝1-IQM(I,J)

其中，IQM(I,J)为多目标函数的IQM集，选择与人的视觉感知紧密相关的五个指标来构成IQM集：对比度、敏锐度、边界完整性、先验灰色世界和清晰度。

步骤A5：将初步预处理后的水下图像送入训练好的网络中，对于环境光估计网络，输出得到环境光值B；对于透射率估计网络，输出得到透射率参数t。

所述水下物理模型为：

图2所示的为环境光估计网络参数训练流程图，具体步骤如下：

步骤B1：输入原始的水下图像。

步骤B2：通过白平衡及直方图均衡化方法对水下图像进行初步预处理。

步骤B3：将初步预处理后的水下图像I送入到步骤A3中设计的环境光估计网络中进行参数训练。采用环境光的估计值与其对应的理想值之间的欧氏距离作为损失函数，所述损失函数记作L_h，为：

步骤B4：通过网络前向传播计算出目标值和实际输出之间的误差，如果误差在允许范围内，那么结束训练；如果误差超出允许范围，那么计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

所述分数阶动量的分数阶梯度下降算法，推导过程如下：动量随机梯度下降法对应的权重更新公式为：

w^[l+1] _(c+1)＝w^[l+1] _(c)+v^[l+1] _(c+1)

动量随机梯度下降法对应的偏置更新公式为：

b^[l+1] _(c+1)＝b^[l+1] _(c)+a^[l+1] _(c+1)

其中

为学习率，λ为动量项系数且0＜λ＜1，L为优化目标函数，V和a分别为权重动量项和偏置动量项，w^[l+1] _(c+1)、b^[l+1] _(c+1)分别为c+1次迭代的权重和偏置，w^[l+1] _(c)、b^[l+1] _(c)分别为c次迭代的权重和偏置。

对于给定的函数y(c)，G-L定义为：

其中α为分数阶阶次且0＜α＜1，T为周期，

为广义二项式系数。

为了将分数阶与动量结合，令动量项系数λ＝1，并考虑分数阶导数的长记忆特性，需对历史信息截断，设置截断为γ，得到如下分数阶动量随机梯度下降法的权重和偏置更新公式：

对于给定的函数f(x)，Caputo的定义为：

其中c是迭代次数，x₀是初始点，β是分数阶阶次且0＜β＜1。

由于分数阶导数求导对历史信息具有累加作用这一长记忆特性，通过定记忆长度的方法来保障算法收敛的准确性。为了简化运算过程，可对算法进行高阶截断且仅保留第一项，为了使算法可在(1,2)阶次中选择，需引入绝对值。当1＜β＜2时出现x_c＝x_c-1，则算法不收敛，需加一个很小的正常数δ，得到如下分数阶梯度下降算法公式：

对于卷积神经网络反向传播，为了保持链式法则的正常使用，层与层之间仍然使用整数阶梯度进行传播，而层内部间的参数梯度更新则使用分数阶代替整数阶。经过推导后，分数阶层内梯度参数变化率为

其中p表示神经元的输入值，q是神经元的输出值，l、l+1表示第l、l+1层，

分别表示w^[l+1]、b^[l+1]分数阶梯度，

和

分别是p^[l+1]和

在第(c-1)次的迭代，

是q^[l]在第(c-1)次迭代中的输出，

和

是参数w^[l+1]和b^[l+1]的第c次迭代。

结合分数阶动量随机梯度下降算法，得到分数阶动量的分数阶梯度下降算法：

图3所示的为透射率估计网络参数训练流程图，具体步骤如下：

步骤C1：输入原始的水下图像。

步骤C2：通过白平衡及直方图均衡化方法对水下图像进行初步预处理。

步骤C3：将初步预处理后的水下图像I送入到训练好的环境光估计网络中，输出得到环境光值B。

步骤C4:将初步预处理后的水下图像I送入到透射率估计网络中，输出得到透射率参数t。

步骤C5：根据水下物理模型，环境光值B和透射率参数t得到清晰图像J。

步骤C6：对比I和J两幅图像，采用IQM作为损失函数，通过网络前向传播计算出目标值和实际输出之间的误差，如果误差在允许范围内，那么结束训练；如果误差超出允许范围，那么计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

所述损失函数记作L_IQM，为：

L_IQM＝1-IQM(I,J)

其中，IQM(I,J)为多目标函数的IQM集，表示为：

IQM(I,J)＝∑φ_Xg_X(I,J)

其中，I为初步预处理后的水下图像，J为清晰图像，φ_X是特征增益g_X的权重，g_X包括对比度g_C(I,J)、敏锐度g_A(I,J)、边界完整性g_E(I,J)、先验灰色世界g_G(J)和清晰度g_S(I,J)五个指标。将复原后清晰图像标准化为[0,1]之间的值，限制∑φ_X＝1，使得IQM介于[0,1]之间，其中1代表最佳恢复，0代表最差恢复，初始化权重：φ_C＝0.25,φ_A＝0.4,φ_E＝0.05,φ_G＝0.25,φ_S＝0.05。

所述对比度记作g_C(I,J)，为：

其中，C(I,x)，C(J,x)是像素x在初步预处理后的水下图像I和清晰图像J中的对比度。

所述敏锐度记作g_A(I,J)，为：

g_A(I,J)＝A(J)-A(I)

其中，A(I)，A(J)是初步预处理后的水下图像I和清晰图像J的敏锐度。

所述边界完整性记作g_E(I,J)，为：

其中，E是边缘检测器，E_d是边界图像扩大了5个像素。

所述先验灰色世界记作g_G(J)，为：

其中，I_max和I_min是像素可以具有的最大强度和最小强度，并且

g_G的第一项随着距离灰色世界的距离变小而使度量更高。

所述清晰度记作g_S(I,J)，为：

其中log中的分式是两个图像像素中亮度最大与最小值的比值。S(I,x)、S(J,x)是像素x在初步预处理后的水下图像I和清晰图像J的清晰度。

Claims

1.一种基于分数阶卷积神经网络的水下图像增强方法，其特征在于，包括以下步骤：

A1：输入原始的水下图像；

A2：水下图像初步预处理，即通过白平衡及直方图均衡化纠正图像的色彩偏差，并增强图像的亮度和对比度；

A3：设计水下图像的环境光估计网络和透射率估计网络；

A4：对环境光估计网络和透射率估计网络进行参数训练；

A5：将预处理的水下图像送入训练好的环境光估计网络和透射率估计网络中，所述环境光估计网络，输出得到环境光值B；所述透射率估计网络，输出得到透射率参数t；

A6：根据水下物理模型，结合A5中环境光估计网络输出得到的环境光值B和透射率估计网络输出得到的透射率参数t，得到复原后清晰的图像。

2.根据权利要求1所述的水下图像增强方法，其特征在于，所述环境光估计网络和透射率估计网络均采用分数阶卷积神经网络。

3.根据权利要求1所述的水下图像增强方法，其特征在于，步骤A3所述环境光估计网络的结构为：输入的图像大小为49*49，第一层的卷积核大小为7*7，步长为1，输出得到43*43的图像；第二层的卷积核大小为5*5，步长为1，输出得到39*39的图像；第三层为池化层，大小为3*3，步长为3，输出得到13*13的图像；第四层的卷积核大小为5*5，步长为1，输出得到9*9的图像；第五层为池化层，大小为3*3，步长为3，输出得到3*3的图像；最后一层采用卷积层作为非线性回归层；每个卷积层后都加上ReLU激活函数，以加快训练的收敛速度，避免陷入局部最小值。

4.根据权利要求1所述的水下图像增强方法，其特征在于，步骤A3所述透射率估计网络的设计方法，包括三个步骤，(1)搭建预处理模块，提取图像的浅层特征；(2)采用多尺度卷积层实现特征提取与融合；(3)应用反卷积模块恢复图像原始尺寸，输出透射率图。

5.根据权利要求1所述的水下图像增强方法，其特征在于，步骤A4所述环境光估计网络的参数训练的方法是，通过网络前向传播计算出目标值和实际输出之间的误差，当误差在允许范围内，则结束训练；当误差超出允许范围，则计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

6.根据权利要求5所述的水下图像增强方法，其特征在于，所述环境光估计网络的参数训练的方法是，采用环境光的估计值与其对应的理想值之间的欧氏距离作为损失函数，所述损失函数记作L_h，为：

7.根据权利要求1所述的水下图像增强方法，其特征在于，步骤A4所述透射率估计网络的参数训练的方法是，将初步预处理后的水下图像I送入到透射率估计网络中，输出得到透射率参数t；根据水下物理模型，环境光值B和透射率参数t得到清晰图像J；对比水下图像I和清晰图像J，采用IQM作为损失函数，通过网络前向传播计算出目标值和实际输出之间的误差，当误差在允许范围内，则结束训练；当误差超出允许范围，则计算误差，通过网络反向传播求出误差梯度，利用分数阶动量的分数阶梯度下降算法更新参数，使权重从初始状态逐步更新到最终的学习到的状态。

8.根据权利要求7所述的水下图像增强方法，其特征在于，所述透射率估计网络的参数训练中的损失函数记作L_IQM，为：

L_IQM＝1-IQM(I,J)

9.根据权利要求1所述的水下图像增强方法，其特征在于，步骤A6所述水下物理模型为：