CN114511480A - 一种基于分数阶卷积神经网络的水下图像增强方法 - Google Patents
一种基于分数阶卷积神经网络的水下图像增强方法 Download PDFInfo
- Publication number
- CN114511480A CN114511480A CN202210088955.1A CN202210088955A CN114511480A CN 114511480 A CN114511480 A CN 114511480A CN 202210088955 A CN202210088955 A CN 202210088955A CN 114511480 A CN114511480 A CN 114511480A
- Authority
- CN
- China
- Prior art keywords
- image
- underwater
- ambient light
- estimation network
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 11
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 31
- 238000002834 transmittance Methods 0.000 claims description 24
- 238000011176 pooling Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 230000002708 enhancing effect Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000016776 visual perception Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 5
- 230000004438 eyesight Effects 0.000 abstract description 2
- 238000011478 gradient descent method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/40—Image enhancement or restoration using histogram techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于分数阶卷积神经网络的水下图像增强方法,步骤包括:输入水下图像,通过白平衡及直方图均衡化对水下图像进行初步预处理,设计水下图像的环境光估计网络和透射率估计网络,分别对两个估计网络进行参数训练,对于环境光估计网络输出得到环境光值B,对于透射率估计网络,输出得到透射率参数t,根据水下物理模型复原得到清晰的图像。本发明的方法在不需要大量高质量清晰水下图像的前提下,通过计算一组IQM来评估结果的方法,使得增强后的水下图像视觉质量明显提升,增强效果显著。
Description
技术领域
本发明属于计算机视觉技术领域,具体涉及一种基于分数阶卷积神经网络的水下图像增强方法。
背景技术
海洋中蕴藏着丰富的资源,水下图像作为海洋信息的重要载体,对海洋的探测和开发具有无法代替的作用。由于受到水下复杂环境的影响,水下拍摄的图像往往存在质量退化现象,为了改善原始水下图像的对比度低、颜色失真、细节模糊等问题,需要对水下图像进行增强处理,以获得清晰的水下图像。
现有的水下图像增强技术已经取得了很大进步,水下图像增强效果比较明显,然而,恢复水下图像的视觉质量仍然面临巨大挑战。
现有的水下图像增强方法主要有两大类,一类是传统的水下图像增强方法,包括基于直方图的增强方法、基于Retinex的增强方法、基于滤波和信号处理的增强方法、基于图像融合的增强方法,另一类是基于神经网络的增强方法。这些方法都能不同程度的使水下图像得到增强,改善原始水下图像的对比度低、颜色失真、细节模糊等问题。然而,这些方法在参数训练过程中都需要水下原始图像对应的真实图像。尽管目前的水下图像数据集可以采用多种方式得到,但要得到大量高质量的真实水下图像还是比较困难的,能否在不需要真实图像的情况下采用模拟数据指导的方法来恢复水下图像的视觉质量,得到高质量的清晰图像,是一个值得研究的课题。另外,现有的方案在神经网络的参数训练过程中,比如随机梯度下降法、动量梯度下降法等,其学习收敛速度较慢,训练时间较长。由于分数阶具有记忆性和遗传性的特点,在参数训练算法中引入分数阶,可使网络权值的更新更稳定,进一步提高训练速度和准确率。此外由于分数阶模型包含整数阶模型,因此分数阶模型中参数的调节也更灵活,可为神经网络参数训练优化算法提供更多的可能。
发明内容
本发明的目的是针对现实中缺乏大量的真实水下图像的困难和问题,为了增强原始水下图像的视觉质量,并且提升网络参数训练过程中的学习速率,而提供一种基于分数阶卷积神经网络的水下图像增强方法。
为达到上述目的,本发明是通过以下技术方案予以实现的:
一种基于分数阶卷积神经网络的水下图像增强方法,具体步骤如下:
步骤A1:输入原始的水下图像。
步骤A2:水下图像初步预处理,即通过白平衡及直方图均衡化纠正图像的色彩偏差,并增强图像的亮度和对比度。
步骤A3:设计水下图像的环境光估计网络和透射率估计网络。
所述环境光估计网络的结构为:输入的图像大小为49*49,第一层的卷积核大小为7*7,步长为1,输出得到43*43的图像。第二层的卷积核大小为5*5,步长为1,输出得到39*39的图像。第三层为池化层,大小为3*3,步长为3,输出得到13*13的图像。第四层的卷积核大小为5*5,步长为1,输出得到9*9的图像。第五层为池化层,大小为3*3,步长为3,输出得到3*3的图像。最后一层采用卷积层作为非线性回归层。每个卷积层后都加上ReLU激活函数,以加快训练的收敛速度,避免陷入局部最小值。
所述透射率估计网络的设计包括以下三个步骤,分别为:(1)搭建预处理模块,提取图像的浅层特征;(2)采用多尺度卷积层实现特征提取与融合;(3)应用反卷积模块恢复图像原始尺寸,输出透射率图。
步骤A4:对环境光估计网络和透射率估计网络进行参数训练。
所述环境光估计网络的参数训练,即通过网络前向传播计算出目标值和实际输出之间的误差,当误差在允许范围内,则结束训练;当误差超出允许范围,则计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
所述透射率估计网络的参数训练,即将初步预处理后的水下图像I送入到透射率估计网络中,输出得到透射率参数t。根据水下物理模型,环境光值B和透射率参数t得到清晰图像J。对比水下图像I和清晰图像J,采用IQM作为损失函数,通过网络前向传播计算出目标值和实际输出之间的误差,当误差在允许范围内,则结束训练;当误差超出允许范围,则计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
进一步的,所述环境光估计网络的参数训练采用环境光的估计值与其对应的理想值之间的欧氏距离作为损失函数,所述损失函数记作Lh,为:
其中||·||为对矩阵求二范数操作,Bi(I)为环境光的估计值,Bi(J)为其对应的理想值,i代表颜色通道,I为初步预处理后的水下图像,J为清晰图像。
进一步的,所述透射率估计网络参数训练中的损失函数记作LIQM,为:
LIQM=1-IQM(I,J)
其中,IQM(I,J)为多目标函数的IQM集,选择与人的视觉感知紧密相关的五个指标构成IQM集:对比度、敏锐度、边界完整性、先验灰色世界和清晰度。
步骤A5:将预处理的水下图像I送入训练好的网络中,对于环境光估计网络,输出得到环境光值B;对于透射率估计网络,输出得到透射率参数t。
步骤A6:根据水下物理模型,结合步骤A5中环境光估计网络输出得到的环境光值B和透射率估计网络输出得到的透射率参数t,得到复原后清晰的图像。
具体的,水下物理模型为:
其中,J表示清晰图像,I表示初步预处理后的水下图像,B表示环境光值,t表示透射率参数。
本发明的优点和有益效果:
1、现有的环境光估计方法,大多通过选取图像中深度无穷远处的像素值作为环境光的估计结果,然而当有特殊物体的干扰或图像本身并没有深度很大的区域时,估计结果将会存在较大误差,而采用环境光估计网络这种深度学习的方法,学习水下图像和其对应环境光值之间的映射关系,能适应多种不同的水下环境,估计的环境光值B更为准确。
2、本发明采用的两种卷积神经网络,包括环境光估计网络和透射率估计网络,可以先后独立训练,设计灵活,训练方便。
3、本发明不需要大量高质量的真实清晰水下图像,而是通过计算一组IQM来评估结果的方法,以基于IQM的损失函数最小化,使得增强后的图像在视觉质量上得到明显提升,图像增强效果显著,视觉感官良好。
4、本发明使用分数阶动量的分数阶梯度下降算法对卷积神经网络的参数进行优化训练,可以大大加快学习收敛速度,工作效率得到明显提升。
附图说明
图1为本发明的水下图像增强方法流程图,
图2为本发明的环境光估计网络参数训练流程图,
图3为本发明的透射率估计网络参数训练流程图。
具体实施方式
下面将结合附图和实施例对本发明的技术方案做进一步的详细描述,该实施例仅用于解释本发明,并不对本发明的保护范围构成限定。
图1所示,为本发明的一种基于分数阶卷积神经网络的水下图像增强方法,具体步骤如下:
步骤A1:输入原始的水下图像。
步骤A2:水下图像初步预处理,即通过白平衡及直方图均衡化纠正图像的色彩偏差,并增强图像的亮度和对比度。
步骤A3:设计水下图像的环境光估计网络和透射率估计网络。
所述环境光估计网络的输出仅为三通道的像素值,因此网络的设计较为简单。采用尺寸大小为49*49的图像,具体的网络结构为:第一层的卷积核大小为7*7,步长为1,输出得到43*43的图像。第二层的卷积核大小为5*5,步长为1,输出得到39*39的图像。第三层为池化层,大小为3*3,步长为3,输出得到13*13的图像。第四层的卷积核大小为5*5,步长为1,输出得到9*9的图像。第五层为池化层,大小为3*3,步长为3,输出得到3*3的图像。最后一层采用卷积层作为非线性回归层。每个卷积层后都加上ReLU激活函数,以加快训练的收敛速度,避免陷入局部最小值。
所述透射率估计网络的设计包括以下三个步骤,分别为:(1)搭建预处理模块,提取图像的浅层特征;(2)采用多尺度卷积层实现特征提取与融合;(3)应用反卷积模块恢复图像原始尺寸,输出透射率图。
对于步骤(1),连续采用3个卷积层对水下图像进行浅层特征的提取,3个卷积层的大小和个数都为3*3*16,激活函数采用带参数修正线性单元(PRelu),并使用BN归一化处理。
对于步骤(2),对浅层特征提取的图像进行多尺度卷积运算,卷积核大小和个数分别为3*3*16、5*5*16、7*7*16,采用最大池化采样,激活函数采用带参数修正线性单元(PRelu),并使用BN归一化处理,再对其进行特征融合(Concat)。为了获得深层次的图像信息,再次使用多尺度3*3*16、5*5*16、7*7*16卷积核进行卷积操作,激活函数为PRelu,并使用BN归一化处理,再对其进行特征融合(Concat)。
对于步骤(3),反卷积模块用来增加图像的空间维度,反卷积核的尺寸定为2*2,步长为1,将池化操作后的特征图还原成输入图像大小。网络模型最后一层采用3通道,卷积核大小为1*1,输出透射率图。
步骤A4:对环境光估计网络和透射率估计网络进行参数训练。
所述环境光估计网络的参数训练,即通过网络前向传播计算出目标值和实际输出之间的误差,如果误差在允许范围内,那么结束训练;如果误差超出允许范围,那么计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
所述透射率估计网络的参数训练,即将初步预处理后的水下图像I送入到透射率估计网络中,输出得到透射率参数t。根据水下物理模型,环境光值B和透射率参数t得到清晰图像J。对比I和J两幅图像,采用IQM作为损失函数,通过网络前向传播计算出目标值和实际输出之间的误差,如果误差在允许范围内,那么结束训练;如果误差超出允许范围,那么计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
所述环境光估计网络的参数训练采用环境光的估计值与其对应的理想值之间的欧氏距离作为损失函数,所述损失函数记作Lh,为:
其中||·||为对矩阵求二范数操作,Bi(I)为环境光的估计值,Bi(J)为其对应的理想值,i代表颜色通道,I为初步预处理后的水下图像,J为清晰图像。
所述透射率估计网络参数训练中的损失函数记作LIQM,为:
LIQM=1-IQM(I,J)
其中,IQM(I,J)为多目标函数的IQM集,选择与人的视觉感知紧密相关的五个指标来构成IQM集:对比度、敏锐度、边界完整性、先验灰色世界和清晰度。
步骤A5:将初步预处理后的水下图像送入训练好的网络中,对于环境光估计网络,输出得到环境光值B;对于透射率估计网络,输出得到透射率参数t。
步骤A6:根据水下物理模型,结合步骤A5中环境光估计网络输出得到的环境光值B和透射率估计网络输出得到的透射率参数t,得到复原后清晰的图像。
所述水下物理模型为:
其中,J表示清晰图像,I表示初步预处理后的水下图像,B表示环境光值,t表示透射率参数。
图2所示的为环境光估计网络参数训练流程图,具体步骤如下:
步骤B1:输入原始的水下图像。
步骤B2:通过白平衡及直方图均衡化方法对水下图像进行初步预处理。
步骤B3:将初步预处理后的水下图像I送入到步骤A3中设计的环境光估计网络中进行参数训练。采用环境光的估计值与其对应的理想值之间的欧氏距离作为损失函数,所述损失函数记作Lh,为:
其中||·||为对矩阵求二范数操作,Bi(I)为环境光的估计值,Bi(J)为其对应的理想值,i代表颜色通道,I为初步预处理后的水下图像,J为清晰图像。
步骤B4:通过网络前向传播计算出目标值和实际输出之间的误差,如果误差在允许范围内,那么结束训练;如果误差超出允许范围,那么计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
所述分数阶动量的分数阶梯度下降算法,推导过程如下:动量随机梯度下降法对应的权重更新公式为:
w[l+1] (c+1)=w[l+1] (c)+v[l+1] (c+1)
动量随机梯度下降法对应的偏置更新公式为:
b[l+1] (c+1)=b[l+1] (c)+a[l+1] (c+1)
其中为学习率,λ为动量项系数且0<λ<1,L为优化目标函数,V和a分别为权重动量项和偏置动量项,w[l+1] (c+1)、b[l+1] (c+1)分别为c+1次迭代的权重和偏置,w[l+1] (c)、b[l+1] (c)分别为c次迭代的权重和偏置。
对于给定的函数y(c),G-L定义为:
为了将分数阶与动量结合,令动量项系数λ=1,并考虑分数阶导数的长记忆特性,需对历史信息截断,设置截断为γ,得到如下分数阶动量随机梯度下降法的权重和偏置更新公式:
对于给定的函数f(x),Caputo的定义为:
其中c是迭代次数,x0是初始点,β是分数阶阶次且0<β<1。
由于分数阶导数求导对历史信息具有累加作用这一长记忆特性,通过定记忆长度的方法来保障算法收敛的准确性。为了简化运算过程,可对算法进行高阶截断且仅保留第一项,为了使算法可在(1,2)阶次中选择,需引入绝对值。当1<β<2时出现xc=xc-1,则算法不收敛,需加一个很小的正常数δ,得到如下分数阶梯度下降算法公式:
对于卷积神经网络反向传播,为了保持链式法则的正常使用,层与层之间仍然使用整数阶梯度进行传播,而层内部间的参数梯度更新则使用分数阶代替整数阶。经过推导后,分数阶层内梯度参数变化率为
其中p表示神经元的输入值,q是神经元的输出值,l、l+1表示第l、l+1层,分别表示w[l+1]、b[l+1]分数阶梯度,和分别是p[l+1]和在第(c-1)次的迭代,是q[l]在第(c-1)次迭代中的输出,和是参数w[l+1]和b[l+1]的第c次迭代。
结合分数阶动量随机梯度下降算法,得到分数阶动量的分数阶梯度下降算法:
图3所示的为透射率估计网络参数训练流程图,具体步骤如下:
步骤C1:输入原始的水下图像。
步骤C2:通过白平衡及直方图均衡化方法对水下图像进行初步预处理。
步骤C3:将初步预处理后的水下图像I送入到训练好的环境光估计网络中,输出得到环境光值B。
步骤C4:将初步预处理后的水下图像I送入到透射率估计网络中,输出得到透射率参数t。
步骤C5:根据水下物理模型,环境光值B和透射率参数t得到清晰图像J。
步骤C6:对比I和J两幅图像,采用IQM作为损失函数,通过网络前向传播计算出目标值和实际输出之间的误差,如果误差在允许范围内,那么结束训练;如果误差超出允许范围,那么计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
所述损失函数记作LIQM,为:
LIQM=1-IQM(I,J)
其中,IQM(I,J)为多目标函数的IQM集,表示为:
IQM(I,J)=∑φXgX(I,J)
其中,I为初步预处理后的水下图像,J为清晰图像,φX是特征增益gX的权重,gX包括对比度gC(I,J)、敏锐度gA(I,J)、边界完整性gE(I,J)、先验灰色世界gG(J)和清晰度gS(I,J)五个指标。将复原后清晰图像标准化为[0,1]之间的值,限制∑φX=1,使得IQM介于[0,1]之间,其中1代表最佳恢复,0代表最差恢复,初始化权重:φC=0.25,φA=0.4,φE=0.05,φG=0.25,φS=0.05。
所述对比度记作gC(I,J),为:
其中,C(I,x),C(J,x)是像素x在初步预处理后的水下图像I和清晰图像J中的对比度。
所述敏锐度记作gA(I,J),为:
gA(I,J)=A(J)-A(I)
其中,A(I),A(J)是初步预处理后的水下图像I和清晰图像J的敏锐度。
所述边界完整性记作gE(I,J),为:
其中,E是边缘检测器,Ed是边界图像扩大了5个像素。
所述先验灰色世界记作gG(J),为:
所述清晰度记作gS(I,J),为:
其中log中的分式是两个图像像素中亮度最大与最小值的比值。S(I,x)、S(J,x)是像素x在初步预处理后的水下图像I和清晰图像J的清晰度。
Claims (9)
1.一种基于分数阶卷积神经网络的水下图像增强方法,其特征在于,包括以下步骤:
A1:输入原始的水下图像;
A2:水下图像初步预处理,即通过白平衡及直方图均衡化纠正图像的色彩偏差,并增强图像的亮度和对比度;
A3:设计水下图像的环境光估计网络和透射率估计网络;
A4:对环境光估计网络和透射率估计网络进行参数训练;
A5:将预处理的水下图像送入训练好的环境光估计网络和透射率估计网络中,所述环境光估计网络,输出得到环境光值B;所述透射率估计网络,输出得到透射率参数t;
A6:根据水下物理模型,结合A5中环境光估计网络输出得到的环境光值B和透射率估计网络输出得到的透射率参数t,得到复原后清晰的图像。
2.根据权利要求1所述的水下图像增强方法,其特征在于,所述环境光估计网络和透射率估计网络均采用分数阶卷积神经网络。
3.根据权利要求1所述的水下图像增强方法,其特征在于,步骤A3所述环境光估计网络的结构为:输入的图像大小为49*49,第一层的卷积核大小为7*7,步长为1,输出得到43*43的图像;第二层的卷积核大小为5*5,步长为1,输出得到39*39的图像;第三层为池化层,大小为3*3,步长为3,输出得到13*13的图像;第四层的卷积核大小为5*5,步长为1,输出得到9*9的图像;第五层为池化层,大小为3*3,步长为3,输出得到3*3的图像;最后一层采用卷积层作为非线性回归层;每个卷积层后都加上ReLU激活函数,以加快训练的收敛速度,避免陷入局部最小值。
4.根据权利要求1所述的水下图像增强方法,其特征在于,步骤A3所述透射率估计网络的设计方法,包括三个步骤,(1)搭建预处理模块,提取图像的浅层特征;(2)采用多尺度卷积层实现特征提取与融合;(3)应用反卷积模块恢复图像原始尺寸,输出透射率图。
5.根据权利要求1所述的水下图像增强方法,其特征在于,步骤A4所述环境光估计网络的参数训练的方法是,通过网络前向传播计算出目标值和实际输出之间的误差,当误差在允许范围内,则结束训练;当误差超出允许范围,则计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
7.根据权利要求1所述的水下图像增强方法,其特征在于,步骤A4所述透射率估计网络的参数训练的方法是,将初步预处理后的水下图像I送入到透射率估计网络中,输出得到透射率参数t;根据水下物理模型,环境光值B和透射率参数t得到清晰图像J;对比水下图像I和清晰图像J,采用IQM作为损失函数,通过网络前向传播计算出目标值和实际输出之间的误差,当误差在允许范围内,则结束训练;当误差超出允许范围,则计算误差,通过网络反向传播求出误差梯度,利用分数阶动量的分数阶梯度下降算法更新参数,使权重从初始状态逐步更新到最终的学习到的状态。
8.根据权利要求7所述的水下图像增强方法,其特征在于,所述透射率估计网络的参数训练中的损失函数记作LIQM,为:
LIQM=1-IQM(I,J)
其中,IQM(I,J)为多目标函数的IQM集,选择与人的视觉感知紧密相关的五个指标构成IQM集:对比度、敏锐度、边界完整性、先验灰色世界和清晰度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210088955.1A CN114511480A (zh) | 2022-01-25 | 2022-01-25 | 一种基于分数阶卷积神经网络的水下图像增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210088955.1A CN114511480A (zh) | 2022-01-25 | 2022-01-25 | 一种基于分数阶卷积神经网络的水下图像增强方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114511480A true CN114511480A (zh) | 2022-05-17 |
Family
ID=81550449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210088955.1A Pending CN114511480A (zh) | 2022-01-25 | 2022-01-25 | 一种基于分数阶卷积神经网络的水下图像增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114511480A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309232A (zh) * | 2023-05-15 | 2023-06-23 | 中国海洋大学 | 一种结合物理先验与深度学习的水下图像增强方法 |
CN116757966A (zh) * | 2023-08-17 | 2023-09-15 | 中科方寸知微(南京)科技有限公司 | 基于多层级曲率监督的图像增强方法及系统 |
CN117218033A (zh) * | 2023-09-27 | 2023-12-12 | 仲恺农业工程学院 | 一种水下图像复原方法、装置、设备及介质 |
CN117939098A (zh) * | 2024-03-22 | 2024-04-26 | 徐州稻源龙芯电子科技有限公司 | 一种基于卷积神经网络的图像自动白平衡处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
CN109584170A (zh) * | 2018-10-29 | 2019-04-05 | 西安电子科技大学 | 基于卷积神经网络的水下图像复原方法 |
CN111882489A (zh) * | 2020-05-15 | 2020-11-03 | 东北石油大学 | 用于水下图像同时增强的超分辨率图形恢复方法 |
CN113920018A (zh) * | 2021-09-13 | 2022-01-11 | 中国人民解放军战略支援部队航天工程大学 | 一种改进的mscnn水下图像去雾方法 |
-
2022
- 2022-01-25 CN CN202210088955.1A patent/CN114511480A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
CN109584170A (zh) * | 2018-10-29 | 2019-04-05 | 西安电子科技大学 | 基于卷积神经网络的水下图像复原方法 |
CN111882489A (zh) * | 2020-05-15 | 2020-11-03 | 东北石油大学 | 用于水下图像同时增强的超分辨率图形恢复方法 |
CN113920018A (zh) * | 2021-09-13 | 2022-01-11 | 中国人民解放军战略支援部队航天工程大学 | 一种改进的mscnn水下图像去雾方法 |
Non-Patent Citations (1)
Title |
---|
林森;刘世本;唐延东;: "多输入融合对抗网络的水下图像增强", 红外与激光工程, no. 05, 25 May 2020 (2020-05-25) * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309232A (zh) * | 2023-05-15 | 2023-06-23 | 中国海洋大学 | 一种结合物理先验与深度学习的水下图像增强方法 |
CN116309232B (zh) * | 2023-05-15 | 2023-08-18 | 中国海洋大学 | 一种结合物理先验与深度学习的水下图像增强方法 |
CN116757966A (zh) * | 2023-08-17 | 2023-09-15 | 中科方寸知微(南京)科技有限公司 | 基于多层级曲率监督的图像增强方法及系统 |
CN117218033A (zh) * | 2023-09-27 | 2023-12-12 | 仲恺农业工程学院 | 一种水下图像复原方法、装置、设备及介质 |
CN117218033B (zh) * | 2023-09-27 | 2024-03-12 | 仲恺农业工程学院 | 一种水下图像复原方法、装置、设备及介质 |
CN117939098A (zh) * | 2024-03-22 | 2024-04-26 | 徐州稻源龙芯电子科技有限公司 | 一种基于卷积神经网络的图像自动白平衡处理方法 |
CN117939098B (zh) * | 2024-03-22 | 2024-05-28 | 徐州稻源龙芯电子科技有限公司 | 一种基于卷积神经网络的图像自动白平衡处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112288658B (zh) | 一种基于多残差联合学习的水下图像增强方法 | |
CN112233038B (zh) | 基于多尺度融合及边缘增强的真实图像去噪方法 | |
CN110599409B (zh) | 基于多尺度卷积组与并行的卷积神经网络图像去噪方法 | |
CN114511480A (zh) | 一种基于分数阶卷积神经网络的水下图像增强方法 | |
CN108986050B (zh) | 一种基于多分支卷积神经网络的图像和视频增强方法 | |
CN111275637B (zh) | 一种基于注意力模型的非均匀运动模糊图像自适应复原方法 | |
CN111275643B (zh) | 基于通道和空间注意力的真实噪声盲去噪网络系统及方法 | |
CN113313657A (zh) | 一种用于低光照图像增强的非监督学习方法和系统 | |
CN111028177A (zh) | 一种基于边缘的深度学习图像去运动模糊方法 | |
CN111861906B (zh) | 一种路面裂缝图像虚拟增广模型建立及图像虚拟增广方法 | |
CN111915522A (zh) | 一种基于注意力机制的图像修复方法 | |
CN110136075B (zh) | 一种基于边缘锐化循环生成对抗网络的遥感影像去雾方法 | |
CN112651917A (zh) | 一种基于生成对抗网络的空间卫星低照度图像增强方法 | |
CN110570381B (zh) | 一种基于高斯总变差的半解耦图像分解暗光图像增强方法 | |
CN116468938A (zh) | 一种在标签带噪数据上鲁棒的图像分类方法 | |
CN113392711A (zh) | 一种基于高层语义与噪声抑制的烟雾语义分割方法及系统 | |
CN113284070A (zh) | 基于传递注意力机制的非均匀雾图去雾算法 | |
CN117422653A (zh) | 一种基于权重共享和迭代数据优化的低光照图像增强方法 | |
CN115797205A (zh) | 基于Retinex分数阶变分网络的无监督单张图像增强方法及系统 | |
CN115272072A (zh) | 一种基于多特征图像融合的水下图像超分辨率方法 | |
CN118229569A (zh) | 基于模糊扩散模型的文档图像透射去除方法及装置 | |
CN117611484A (zh) | 一种基于去噪自解码网络的图像去噪方法及系统 | |
Guan et al. | DiffWater: Underwater image enhancement based on conditional denoising diffusion probabilistic model | |
CN116862809A (zh) | 一种低曝光条件下的图像增强方法 | |
CN110136164B (zh) | 基于在线透射变换、低秩稀疏矩阵分解去除动态背景的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |