CN114820395B - 一种基于多领域信息融合的水下图像增强方法 - Google Patents
一种基于多领域信息融合的水下图像增强方法 Download PDFInfo
- Publication number
- CN114820395B CN114820395B CN202210757566.3A CN202210757566A CN114820395B CN 114820395 B CN114820395 B CN 114820395B CN 202210757566 A CN202210757566 A CN 202210757566A CN 114820395 B CN114820395 B CN 114820395B
- Authority
- CN
- China
- Prior art keywords
- domain
- module
- gradient
- semantic
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000004927 fusion Effects 0.000 title claims abstract description 20
- 238000000605 extraction Methods 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims description 21
- 238000011176 pooling Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 4
- 238000013441 quality evaluation Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000238366 Cephalopoda Species 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 101150027068 DEGS1 gene Proteins 0.000 description 1
- 241000196171 Hydrodictyon reticulatum Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于多领域信息融合的水下图像增强方法,采用包括语义分支、梯度分支和像素分支的分层增强网络模型来进行图像增强,所述语义分支包括多尺度注意力特征提取模块和语义域特征解码模块,所述梯度分支包括梯度域特征提取模块和梯度域特征解码模块,所述像素分支包括多通道注意力特征编码模块和像素域特征解码模块,将所述语义分支输出图像、像素分支输出图像和梯度分支输出图像进行融合,然后经过一个卷积层,得到增强后的水下清晰图像。本发明实现了水下图像增强,能够捕捉图像中目标的结构特征,并且在真实水下数据集上具有良好的泛化效果。
Description
技术领域
本申请属于基于新一代信息技术的水下场景处理技术领域,尤其涉及一种基于多领域信息融合的水下图像增强方法。
背景技术
水下作业,特别是水下机器人作业等场景,水下图像增强具有广阔的应用前景,水下图像增强在海洋资源勘探、海洋生态研究、深海设施监测和海军军事应用等方面发挥着重要作用。
由于复杂的水下环境以及广在水中传播的影响,会导致水下成像系统捕获的水下图像常出现色偏、雾化和模糊等质量问题。
目前水下图像增强的主要方法有:概率模型方法、数据驱动方法。在概率模型方法中,常用的水下图像增强方法有对数(或幂律)变换、对比度拉伸、直方图均衡化、锐化等,这些方法能有效地拓宽图像的显示范围,但是这些方法忽略了亮度的统计分布与位置信息,导致性能不理想。此外,这些方法局限于具有放大噪声的物理模型,不足以指示图像退化的过程。数据驱动方法利用神经网络直接学习降质图像与清晰图像之间的非线性函数。但是这些方法忽略了水下目标的结构与颜色信息。此外,由于海洋环境的复杂性,这些基于数据驱动的方法所依赖的数据信息在增强真实水下图像时往往有局限性。
发明内容
本申请的目的是提供一种基于多领域信息融合的水下图像增强方法,克服了进行水下图像增强时忽略了水下目标结构和颜色的问题,在真实水下场景应用中快且有效。
为了实现上述目的,本申请技术方案如下:
一种基于多领域信息融合的水下图像增强方法,采用包括语义分支、梯度分支和像素分支的分层增强网络模型来进行图像增强,所述语义分支包括多尺度注意力特征提取模块和语义域特征解码模块,所述梯度分支包括梯度域特征提取模块和梯度域特征解码模块,所述像素分支包括多通道注意力特征编码模块和像素域特征解码模块,所述基于多领域信息融合的水下图像增强方法,包括:
将水下的降质图像输入到预训练好的掩码计算器,得到语义掩码;
将水下的降质图像输入到像素分支的多通道注意力特征提取模块,所述多通道注意力特征编码模块包含六个残差模块和一个多尺寸注意力模块,通过所述六个残差模块获取三种尺度的通道注意力特征,并通过多尺寸注意力模块获取像素域中间特征;
将三种尺度的通道注意力特征输入到语义分支的多尺度注意力特征提取模块,提取语义域中间特征;
将三种尺度的通道注意力特征以及水下的降质图像的梯度特征,输入到梯度域特征提取模块,提取梯度域中间特征;
采用语义分支的语义域特征解码模块对输入的语义域中间特征进行解码操作,所述语义域特征解码模块包括四个残差模块和一个卷积层,并将所述语义域特征解码模块输出的特征与语义掩码相乘,得到语义分支输出图像;
采用梯度域特征解码模块对输入的梯度域中间特征进行解码操作,所述梯度域特征解码模块包括两个u形卷积块和一个卷积层,所述梯度域特征解码模块输出梯度分支输出图像;
所述像素域特征解码模块包括六个残差模块,将所述语义域中间特征与像素域中间特征拼接后输入到像素域特征解码模块,经过两个残差模块后,与所述语义域特征解码模块第二个残差模块输出的特征进行拼接,再经过两个残差模块后,与所述梯度域特征解码模块第二个u形卷积块输出的特征进行拼接,最后再经过两个残差模块,得到像素分支输出图像;
将所述语义分支输出图像、像素分支输出图像和梯度分支输出图像进行融合,然后经过一个卷积层,得到增强后的水下清晰图像。
进一步的,所述掩码计算器包括四个残差模块。
进一步的,所述多尺寸注意力模块包括三个单尺寸特征注意力模块,每个单尺寸特征注意力模块对输入特征做一次全局平均值池化和全局最大值池化操作,并将池化操作得到的结果相加,得到一组一维的通道权重向量,通道权重向量再通过三层的全连接神经网络进一步挖掘特征信息,得到通道注意力,通道注意力再与输入特征进行通道维度上的乘法,得到单尺寸特征注意力模块的输出;
最下层单尺寸注意力模块的输出经过上采样与中层单尺寸注意力模块输出进行特征拼接操作,再次经过上采样与卷积操作与最上层单尺寸注意力模块的输出进行特征拼接操作,最后经过卷积得到多尺寸注意力模块的输出。
进一步的,所述多尺度注意力特征提取模块,包括一个多尺寸注意力模块和六个残差模块。
进一步的,所述梯度域特征提取模块,首先对输入的梯度特征进行一次3 × 3卷积运算扩充维度,再构造三个u形卷积块,将多通道注意力编码模块中的不同尺度的通道注意力特征分别输入到每个u形卷积块中进行特征拼接操作,最后再通过一次3 × 3卷积运算,得到梯度域特征提取模块的编码结果,输出梯度域中间特征。
进一步的,所述采用梯度域特征解码模块对输入的梯度域中间特征进行解码操作,包括:
输入特征经过两个u形卷积块之后与原输入特征相加,然后再输入到卷积层,最后得到梯度分支输出图像。
进一步的,所述u形卷积块,包括五个小块,每小块包含两次连续的“3 × 3卷积、Relu激活函数”,其中,第二个小块的输出特征与多通道注意力编码模块中的不同尺度的通道注意力特征拼接后,再经过三个小块的运算后输出。
进一步的,所述分层增强网络模型为每个分支的输出以及模型最后的输出设置损失函数,通过最小化所述损失函数来训练网络模型。
本申请提出的一种基于多领域信息融合的水下图像增强方法,提出了一种水下图像分层增强网络模型(SIB-Net),该网络能够仅仅在输入真实的水下图像下,输出增强后的清晰的图像。克服了现有的图像增强方法不能够体现水下目标的结构与颜色信息的局限性,在真实水下图像增强上有良好的效果。
附图说明
图1为本申请基于多领域信息融合的水下图像增强方法流程图;
图2为本申请实施例分层增强网络模型结构示意图;
图3为本申请实施例多通道注意力特征编码模块结构示意图;
图4为本申请实施例多尺寸注意力模块结构示意图;
图5为本申请实施例多尺度注意力特征提取模块结构示意图;
图6为本申请实施例梯度域特征提取模块结构示意图;
图7为本申请实施例u形卷积块示意图;
图8为本申请实施例特征解码模块结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。
在水下场景中,受水中介质对光反射和对不同波长光的吸收的影响,水下图像出
现颜色衰退、对比度低以及细节模糊等现象。水下图像与透射率、大气光存在一定的非线性
关系。本申请将水下场景中采集的图像称为水下的降质图像,记为,其中 表示
三个颜色通道,增强后的水下清晰图像记为。
在一个实施例中,如图1所示,提出了一种基于多领域信息融合的水下图像增强方法,采用包括语义分支(Semantic-based Foreground Branch,SFB)、梯度分支(Gradient-based High-frequency Branch,GHB)和像素分支(Underwater Pixel Branch,UPB)的分层增强网络模型(Structure-Inferred Bi-level model with hierarchical enhancingNetwork,SIB-Net)来进行图像增强,所述语义分支包括多尺度注意力特征提取模块和语义域特征解码模块,所述梯度分支包括梯度域特征提取模块和梯度域特征解码模块,所述像素分支包括多通道注意力特征编码模块和像素域特征解码模块。包括:
步骤S1、将水下的降质图像输入到预训练好的掩码计算器,得到语义掩码。
语义掩码 是通过一个预训练好的掩码计算器计算得到的,其输入是水下的降
质图像 ,掩码计算器包括四个残差模块(附图中标记为Residual Block),每一个残差
模块包含连续的两次“卷积运算、Relu激活函数”和一次最终的卷积运算。
掩码计算器可以表示为如下公式:
通过掩码与图像的点乘操作,可以得到前景图像。
步骤S2、将水下的降质图像输入到像素分支的多通道注意力特征提取模块,所述多通道注意力特征编码模块包含六个残差模块和一个多尺寸注意力模块,通过所述六个残差模块获取三种尺度的通道注意力特征,并通过多尺寸注意力模块获取像素域中间特征。
如图2所示,本实施例像素分支包括多通道注意力特征编码模块和像素域特征解码模块。为了利用语义域与梯度域信息,将由语义域和梯度域产生的特征映射提供给所述像素分支。并且像素分支多通道注意力特征编码模块提取的多尺度通道注意力特征,分别发送给语义分支和梯度分支进行进一步的处理。
如图3所示,多通道注意力特征编码模块包含六个残差模块(附图中标记为
Residual Block)和一个多尺寸注意力模块。为了挖掘不同尺度下深层纹理特征的分层特
征,采用基于金字塔状的多尺寸注意块来估计初步像素特征。像素域特征解码模块包含6
个残差模块。
三个尺度的通道注意力特征A、B和C输入到多尺寸注意力模块,输出像素域中间特征。
如图4所示,多尺寸注意力模块包括三个单尺寸特征注意力模块,每个单尺寸特征注意力模块对输入特征做一次全局平均值池化和全局最大值池化操作,并将池化操作得到的结果相加,得到一组一维的通道权重向量,通道权重向量再通过三层的全连接神经网络进一步挖掘特征信息,得到通道注意力,通道注意力再与输入特征进行通道维度上的乘法,得到单尺寸特征注意力模块的输出。
最下层单尺寸注意力模块的输出经过上采样(Upsample)与中层单尺寸注意力模块输出进行特征拼接操作,再次经过上采样与卷积操作与最上层单尺寸注意力模块的输出进行特征拼接操作,最后经过卷积得到多尺寸注意力模块的输出。
多尺寸注意力模块的输出最后通过六个残差模块,获得最终特定的前景特征,即
像素域中间特征。每一个残差模块包含连续的两次“卷积运算、Relu激活函数”和一次
最终的卷积运算,本申请残差模块结构相同,以下不再赘述。
步骤S3、将三种尺度的通道注意力特征输入到语义分支的多尺度注意力特征提取模块,提取语义域中间特征。
其中,多尺寸注意力模块结构同样如图4所示,这里不再赘述。多尺寸注意力模块输出的特征经过六个残差模块输出语义域中间特征。此外,附图中,Residual Block表示残差模块,Upsample表示上采样操作,Conv表示卷积操作,Relu表示激活函数,以下不再赘述。
步骤S4、将三种尺度的通道注意力特征以及水下的降质图像的梯度特征,输入到梯度域特征提取模块,提取梯度域中间特征。
本实施例梯度分支包括梯度域特征提取模块和梯度域特征解码模块。梯度域特征
提取模块如图6所示,首先对输入的梯度特征进行一次3 × 3卷积运算扩充维度,再构造三
个u形卷积块(记为),将多通道注意力编码模块中的不同尺度的通道注意力特征,即大尺
寸特征(记为A)、中尺寸特征(记为B)、 小尺寸特征(记为C)分别输入到每个u形卷积块(记
为)中进行特征拼接操作,最后再通过一次3 × 3卷积运算,得到梯度域特征提取模块的
编码结果,输出梯度域中间特征。
其中,u形卷积块如图7所示,每个u形卷积块中共五小块,每小块包含两次连续的“3 × 3卷积、Relu激活函数”。其中,第二个小块的输出特征与多通道注意力编码模块中的不同尺度的通道注意力特征(图中所示为像素域特征)拼接后,再经过三个小块的运算后输出。
为改善水下图像的纹理结构,本实施例引入梯度分支,梯度分支以水下降质图像的梯度作为输入。
步骤S5、采用语义分支的语义域特征解码模块对输入的语义域中间特征进行解码操作,所述语义域特征解码模块包括四个残差模块和一个卷积层,并将所述语义域特征解码模块输出的特征与语义掩码相乘,得到语义分支输出图像。
本实施例语义域特征解码模块、梯度域特征解码模块和像素域特征解码模块,如图8所示。
步骤S6、采用梯度域特征解码模块对输入的梯度域中间特征进行解码操作,所述梯度域特征解码模块包括两个u形卷积块和一个卷积层,所述梯度域特征解码模块输出梯度分支输出图像。
步骤S7、所述像素域特征解码模块包括六个残差模块,将所述语义域中间特征与像素域中间特征拼接后输入到像素域特征解码模块,经过两个残差模块后,与所述语义域特征解码模块第二个残差模块输出的特征进行拼接,再经过两个残差模块后,与所述梯度域特征解码模块第二个u形卷积块输出的特征进行拼接,最后再经过两个残差模块,得到像素分支输出图像。
本实施例像素域特征解码模块包括六个残差模块,将语义域中间特征与像素域中
间特征拼接后输入到像素域特征解码模块的第一个残差模块,经过第一个和第二个残差模
块后,与所述语义域特征解码模块第二个残差模块输出的特征进行拼接,输入到第三个残
差模块,再经过第三个和第四个残差模块后,与所述梯度域特征解码模块第二个u形卷积块
输出的特征进行拼接,输入到第五个残差模块,最后再经过第五个残差模块和第六个残差
模块,最后得到像素分支输出图像,本实施例用表示。
需要说明的是,本步骤在进行特征拼接前,还分别对语义域中间特征、所述语义域特征解码模块第二个残差模块输出的特征、所述梯度域特征解码模块第二个u形卷积块输出的特征进行两倍上采样操作,以使得拼接时的特征尺度相同。
步骤S8、将所述语义分支输出图像、像素分支输出图像和梯度分支输出图像进行融合,然后经过一个卷积层,得到增强后的水下清晰图像。
本申请分层增强网络模型的语义分支通过引入语义掩码,单独优化检测出的前景目标,有目的地增强水下图像的目标区域,隐式地反映图像中的区域是否需要增强,以避免背景区域的不必要干扰。梯度分支通过梯度空间的引导来保留纹理结构,来增强水下降质图像的细节信息,并通过计算相邻像素之间的差值得到水下图像的梯度映射。像素分支是由残差块组成的常规水下图像增强网络,是水下图像增强结构的基本组成部分。
此外,为利用所述分支提取出的特征和利用语义信息与梯度信息进行水下图像增强,本申请引入基于双层优化的超参数优化方案,来学习一个合适的超参数将所述分支信息融合。最后将需要进行增强的水下图像输入到训练好的水下图像分层增强模型,输出增强后的水下图片。
在一个具体的实施例中,本申请还为每个分支的输出以及模型最后的输出设置损失函数,通过最小化所述损失函数来训练网络。
对于整体输出的损失函数,使用整体损失来更好的保持融合后图像的强度分布,所述整体损失表示为以下公式:
需要说明的是,本实施例水下图像分层增强网络模型在训练时,将数据集划分为
训练集、验证集和测试集三部分。本实施例采用了合成的水下图像数据集EUVP和真实的水
下图像数据集UIEB、LUSI、Test-C60、SQUID和RUIE,训练模型时,设定批处理的大小为16,设
定模型的学习率为2 ,各层滤波器的权重按照高斯分布进行初始化,偏差初始设置为常
数。所有的网络都被训练为200个批处理大小,图像大小为。用Adam算法最小化损
失函数,保存最优的模型作为训练好的模型。关于网络模型的训练,在本技术领域已经是比
较成熟的技术,这里不再赘述。
本申请还提供了实验数据,对不同的模型预测结果进行了比较,采用两种不同的评测指标以测算模型整体综合性能。分别是PSNR和SSIM。PSNR(Peak Signal-to-NoiseRatio)是指峰值信噪比,PSNR得分高说明图像质量高。SSIM(Structure SimilarityIndex)是结构相似指标,可以衡量图像的失真程度和两张照片的相似程度。为进一步衡量模型在增强真实水下图像时的性能,采用四种不同的评测指标。分别是UIQM、UCIQE、NIQE和PS。UIQM(Underwater Image Quality Measure)是一种基于人眼视觉系统激励的无参考水下图像质量评价指标,针对水下图像的退化机理与成像特点,采用色彩测量指标(UICM),清晰度测量指标(UISM),对比度测量指标(UIConM)作为评价依据,将三者线性组合。其值越大,表示图像的颜色平衡、清晰度、对比度越佳。UCIQE(Underwater Color Image QualityEvalution)、PS(Perceptual Scores)是无参考图像的图像质量评价指标,值越大,图像质量越高。NIQE(Natural Image Quality Evaluat)是客观的评价指标,提取图像特征,并将特征用于拟合多元的高斯模型,值越小,图像质量越高。本申请模型与其他优秀方法的对比数据如下:
表1
表2
在表1和表2中,Datasets表示所采用的数据集,metrics表示衡量指标,Methods表示相比较的模型,与本申请技术方案(Ours)相比较的不同模型包括UDCP、Fusion、Water-Net、UGAN、Fuine-GAN、Ucolor和USUIR等。
最优结果均使用黑体加粗标注。在EUVP、UIEB、LUSI这三个数据集中,与其他方法相比,本申请模型(SIB-Net)获得了最高的PSNR和SSIM值和最低的均方误差MSE值。在Test-C60、RUIE、SQUID这三个数据集中,与其他方法相比,本申请模型(SIB-Net)获得了最高的PS、UIQM和UCIQE值。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种基于多领域信息融合的水下图像增强方法,其特征在于,采用包括语义分支、梯度分支和像素分支的分层增强网络模型来进行图像增强,所述语义分支包括多尺度注意力特征提取模块和语义域特征解码模块,所述梯度分支包括梯度域特征提取模块和梯度域特征解码模块,所述像素分支包括多通道注意力特征编码模块和像素域特征解码模块,所述基于多领域信息融合的水下图像增强方法,包括:
将水下的降质图像输入到预训练好的掩码计算器,得到语义掩码;
将水下的降质图像输入到像素分支的多通道注意力特征提取模块,所述多通道注意力特征编码模块包含六个残差模块和一个多尺寸注意力模块,通过所述六个残差模块获取三种尺度的通道注意力特征,并通过多尺寸注意力模块获取像素域中间特征;
将三种尺度的通道注意力特征输入到语义分支的多尺度注意力特征提取模块,提取语义域中间特征;
将三种尺度的通道注意力特征以及水下的降质图像的梯度特征,输入到梯度域特征提取模块,提取梯度域中间特征;
采用语义分支的语义域特征解码模块对输入的语义域中间特征进行解码操作,所述语义域特征解码模块包括四个残差模块和一个卷积层,并将所述语义域特征解码模块输出的特征与语义掩码相乘,得到语义分支输出图像;
采用梯度域特征解码模块对输入的梯度域中间特征进行解码操作,所述梯度域特征解码模块包括两个u形卷积块和一个卷积层,所述梯度域特征解码模块输出梯度分支输出图像;
所述像素域特征解码模块包括六个残差模块,将所述语义域中间特征与像素域中间特征拼接后输入到像素域特征解码模块,经过两个残差模块后,与所述语义域特征解码模块第二个残差模块输出的特征进行拼接,再经过两个残差模块后,与所述梯度域特征解码模块第二个u形卷积块输出的特征进行拼接,最后再经过两个残差模块,得到像素分支输出图像;
将所述语义分支输出图像、像素分支输出图像和梯度分支输出图像进行融合,然后经过一个卷积层,得到增强后的水下清晰图像。
2.根据权利要求1所述的基于多领域信息融合的水下图像增强方法,其特征在于,所述掩码计算器包括四个残差模块。
3.根据权利要求1所述的基于多领域信息融合的水下图像增强方法,其特征在于,所述多尺寸注意力模块包括三个单尺寸特征注意力模块,每个单尺寸特征注意力模块对输入特征做一次全局平均值池化和全局最大值池化操作,并将池化操作得到的结果相加,得到一组一维的通道权重向量,通道权重向量再通过三层的全连接神经网络进一步挖掘特征信息,得到通道注意力,通道注意力再与输入特征进行通道维度上的乘法,得到单尺寸特征注意力模块的输出;
最下层单尺寸注意力模块的输出经过上采样与中层单尺寸注意力模块输出进行特征拼接操作,再次经过上采样与卷积操作与最上层单尺寸注意力模块的输出进行特征拼接操作,最后经过卷积得到多尺寸注意力模块的输出。
4.根据权利要求1所述的基于多领域信息融合的水下图像增强方法,其特征在于,所述多尺度注意力特征提取模块,包括一个多尺寸注意力模块和六个残差模块。
5.根据权利要求1所述的基于多领域信息融合的水下图像增强方法,其特征在于,所述梯度域特征提取模块,首先对输入的梯度特征进行一次3 × 3卷积运算扩充维度,再构造三个u形卷积块,将多通道注意力编码模块中的不同尺度的通道注意力特征分别输入到每个u形卷积块中进行特征拼接操作,最后再通过一次3 × 3卷积运算,得到梯度域特征提取模块的编码结果,输出梯度域中间特征。
6.根据权利要求1所述的基于多领域信息融合的水下图像增强方法,其特征在于,所述采用梯度域特征解码模块对输入的梯度域中间特征进行解码操作,包括:
输入特征经过两个u形卷积块之后与原输入特征相加,然后再输入到卷积层,最后得到梯度分支输出图像。
7.根据权利要求5或6所述的基于多领域信息融合的水下图像增强方法,其特征在于,所述u形卷积块,包括五个小块,每小块包含两次连续的“3 × 3卷积、Relu激活函数”,其中,第二个小块的输出特征与多通道注意力编码模块中的不同尺度的通道注意力特征拼接后,再经过三个小块的运算后输出。
8.根据权利要求1所述的基于多领域信息融合的水下图像增强方法,其特征在于,所述分层增强网络模型为每个分支的输出以及模型最后的输出设置损失函数,通过最小化所述损失函数来训练网络模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210757566.3A CN114820395B (zh) | 2022-06-30 | 2022-06-30 | 一种基于多领域信息融合的水下图像增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210757566.3A CN114820395B (zh) | 2022-06-30 | 2022-06-30 | 一种基于多领域信息融合的水下图像增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114820395A CN114820395A (zh) | 2022-07-29 |
CN114820395B true CN114820395B (zh) | 2022-09-13 |
Family
ID=82523393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210757566.3A Active CN114820395B (zh) | 2022-06-30 | 2022-06-30 | 一种基于多领域信息融合的水下图像增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114820395B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116579918B (zh) * | 2023-05-19 | 2023-12-26 | 哈尔滨工程大学 | 基于风格无关判别器的注意力机制多尺度图像转换方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10482603B1 (en) * | 2019-06-25 | 2019-11-19 | Artificial Intelligence, Ltd. | Medical image segmentation using an integrated edge guidance module and object segmentation network |
CN111127493A (zh) * | 2019-11-12 | 2020-05-08 | 中国矿业大学 | 基于注意力多尺度特征融合的遥感图像语义分割方法 |
CN112233038B (zh) * | 2020-10-23 | 2021-06-01 | 广东启迪图卫科技股份有限公司 | 基于多尺度融合及边缘增强的真实图像去噪方法 |
CN113807355B (zh) * | 2021-07-29 | 2023-08-25 | 北京工商大学 | 一种基于编解码结构的图像语义分割方法 |
CN113850824B (zh) * | 2021-09-27 | 2024-03-29 | 太原理工大学 | 一种基于多尺度特征融合的遥感图像路网提取方法 |
-
2022
- 2022-06-30 CN CN202210757566.3A patent/CN114820395B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114820395A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108986050B (zh) | 一种基于多分支卷积神经网络的图像和视频增强方法 | |
Jiang et al. | Underwater image enhancement with lightweight cascaded network | |
CN111275637A (zh) | 一种基于注意力模型的非均匀运动模糊图像自适应复原方法 | |
CN112767279B (zh) | 一种基于离散小波集成生成对抗网络的水下图像增强方法 | |
CN116797488A (zh) | 一种基于特征融合与注意力嵌入的低照度图像增强方法 | |
CN111275643A (zh) | 基于通道和空间注意力的真实噪声盲去噪网络模型及方法 | |
CN113284061B (zh) | 一种基于梯度网络的水下图像增强方法 | |
Han et al. | UIEGAN: Adversarial learning-based photorealistic image enhancement for intelligent underwater environment perception | |
Chen et al. | Image denoising via deep network based on edge enhancement | |
CN114820395B (zh) | 一种基于多领域信息融合的水下图像增强方法 | |
CN115861094A (zh) | 一种融合注意力机制的轻量级gan水下图像增强模型 | |
CN117994167B (zh) | 融合并行多卷积注意力的扩散模型去雾方法 | |
CN118172283A (zh) | 基于改进gUNet模型的海上目标图像去雾方法 | |
CN113191962B (zh) | 基于环境背景光的水下图像颜色恢复方法、装置及存储介质 | |
Krishnan et al. | A novel underwater image enhancement technique using ResNet | |
CN113810683A (zh) | 一种客观评估水下视频质量的无参考评价方法 | |
Niu et al. | Underwater Waste Recognition and Localization Based on Improved YOLOv5. | |
Zhang et al. | Multi-scale attentive feature fusion network for single image dehazing | |
CN117011160A (zh) | 一种基于密集循环网络融合注意力机制的单图像去雨方法 | |
Liu et al. | Attention-guided lightweight generative adversarial network for low-light image enhancement in maritime video surveillance | |
Liu et al. | A Novel Lightweight Model for Underwater Image Enhancement | |
Huang et al. | Unsupervised image dehazing based on improved generative adversarial networks | |
Guodong et al. | Underwater image enhancement and detection based on convolutional DCP and YOLOv5 | |
Zhao et al. | Nonuniform illumination correction for underwater images through a pseudo-siamese network | |
Sivaanpu et al. | Underwater Image Enhancement Using Dual Convolutional Neural Network with Skip Connections |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |