CN112435174B - 基于双重注意机制的水下图像处理方法 - Google Patents

基于双重注意机制的水下图像处理方法 Download PDF

Info

Publication number
CN112435174B
CN112435174B CN202011140666.9A CN202011140666A CN112435174B CN 112435174 B CN112435174 B CN 112435174B CN 202011140666 A CN202011140666 A CN 202011140666A CN 112435174 B CN112435174 B CN 112435174B
Authority
CN
China
Prior art keywords
noise
underwater image
training
network
underwater
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011140666.9A
Other languages
English (en)
Other versions
CN112435174A (zh
Inventor
傅博
王丽妍
吴越楚
杜飞飞
王瑞子
王奕
张天壮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Zhongying Education Technology Co.,Ltd.
Original Assignee
Liaoning Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Normal University filed Critical Liaoning Normal University
Publication of CN112435174A publication Critical patent/CN112435174A/zh
Application granted granted Critical
Publication of CN112435174B publication Critical patent/CN112435174B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种于双重注意机制的水下图像处理方法,利用双重注意机制(非局部注意机制和通道注意机制)对水下图像进行处理。在浅层网络,采用非局部抑制噪声和提取浅层颜色特征;在深层网络,利用通道注意来增强水下图像的细节特征和校正颜色;只需一套端到端的网络模型参数即可对水下图象进行去噪、增强和校正颜色等处理,不仅效率高,而且效果好。

Description

基于双重注意机制的水下图像处理方法
技术领域
本发明涉及一种水下图像处理方法,尤其是一种基于双重注意机制的水下图像处理方法。
背景技术
由于水下复杂的成像环境及光在水中传播等影响,导致水下成像系统捕获的水下图像常出现模糊、噪声和偏色等质量问题。随着人工智能技术的不断发展,深度学习在图像处理领域内发挥着至关重要的作用,卷积神经网路也逐渐成为了图像处理问题的主流方式,已有学者将一些基于卷积神经网络和生成对抗网络的方法用于水下图像处理。然而,现有大多数方法是解决水下图像的模糊、偏色等问题,很少考虑噪声影响,不能彻底保证水下图象的质量。此外,亦有方法是先去除噪声,再进行颜色校正、增强等处理,效率较低。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种基于双重注意机制的水下图像处理方法。
本发明的技术解决方案是:一种基于双重注意机制的水下图像处理方法,按照如下步骤进行:
01部分,使用数据集中的配对水下图像,在进入网络之前进行预处理操作:
步骤 C011:将数据集中多对自然图像作为训练集,其中待处理水下图像集记为Pre_UnderImages,真实的水下图像集记为Real_UnderImages;
步骤 C012:将Pre_UnderImages和Real_UnderImages数据集中的图像切块,块的大小为48*48像素,Pre_UnderImage数据集切块后的图像块分别加入高斯噪声,并将所得到的噪声图像块集合记为Noise_ Patches, Real_UnderImages数据集切块后的图像块集合记为Real_ Patches;
02部分,训练网络,得到水下图像处理的网络模型:
步骤C021:将噪声图像块Noise_ Patches输入网络;
步骤C022:开始训练
Figure DEST_PATH_IMAGE001
对应的线性关系模型,约定变量epoch为网络循环训练的次数,初始为0;
步骤C0221:噪声图像块Noise_ Patches进入第一部分,即浅层特征去噪,记为Shallow_denoise,其中包括一个带有64个3*3大小的滤波器的卷积层conv1和一个非局部去噪层NL_DN,噪声块Noise_ Patches经过conv1后得到的浅层特征空间集合记作S,在经过NL_DN时,采用了三个1*1的卷积和softmax函数,分别学习到三个参数
Figure 641333DEST_PATH_IMAGE002
,再经过一个1*1核卷积,得到降噪特征空间集,记作D;
步骤C0222:进入第二部分,即深层特征增强,记为Deep_enhance,包含分别记为RCAB1,RCAB2,RCAB3,RCAB4的4个残差注意块和三个分别记为conv2,conv3,conv4的卷积层,每一个卷积层带有64个3*3大小的滤波器以及一个长跳跃连接、两个短跳连接;每一个残差注意块是由一个带有两个Conv层和一个Relu激活函数及短跳连接的残差块和通道注意机制组成,通道注意机制包括一层平均池化层Pooling、两个Conv层和一个Relu激活函数以及sigmoid函数;
步骤C0223:进入第三部分,即特征重构,记为Recon,由一个带有3个3*3大小的滤波器的反卷积层Deconv组成;得到清晰的水下图像集,记为Output_Images;
步骤C023:通过L1 Loss计算方法求取Output_Images和Real_UnderImages数据集相应的损失函数值,记为loss,置epoch =epoch +1;当epoch 达到300次后,网络停止训练,保存训练模型model.pt文件;否则将loss值反向传播,通过ADAM优化算法重新更新参数,再一次进入步骤C022,循环重复训练;
03部分,将待处理的水下图像输入训练模型model.pt文件中,得到清晰图像。
本发明利用双重注意机制(非局部注意机制和通道注意机制)对水下图像进行处理。在浅层网络,采用非局部抑制噪声和提取浅层颜色特征;在深层网络,利用通道注意来增强水下图像的细节特征和校正颜色;只需一套端到端的网络模型参数即可对水下图象进行去噪、增强和校正颜色等处理,不仅效率高,而且效果好。
附图说明
图1 是本发明实施例水下图像增强网络架构图。
图2 是本发明实施例非局部注意机制的非局部去噪层(NL_DN)示意图。
图3 是本发明实施例通道注意机制的残差注意块(RCAB)示意图。
图4是本发明实施例与现有技术处理水下图象的效果对比图。
具体实施方式
本发明的一种基于双重注意机制的水下图像处理方法如图1所示,按照如下步骤进行:
01部分,使用EUVP数据集,即5550对配对的水下图像,在进入网络之前进行预处理操作,具体步骤如下:
步骤 C011:划分数据集,将EUVP数据集中的5022对自然图像作为训练集,528对自然图像作为验证集;其中输入的待处理水下图像集记为Pre_UnderImages;真实的水下图像集记为Real_UnderImages;
步骤 C012:将Pre_UnderImages和Real_UnderImages数据集中的5520对图像切块,块的大小为48*48像素,Pre_UnderImage数据集切块后的图像块分别加入值为10的高斯噪声,并将所得到的噪声图像块集合记为Noise_ Patches, Real_UnderImages数据集切块后的图像块集合记为Real_ Patches;
02部分,训练网络,得到水下图像处理的网络模型:
步骤C021:将噪声图像块Noise_ Patches输入网络;
步骤C022:开始训练
Figure 759331DEST_PATH_IMAGE001
对应的线性关系模型,约定变量epoch为网络循环训练的次数,初始为0;
步骤C0221:噪声图像块Noise_ Patches进入第一部分,即浅层特征去噪,记为Shallow_denoise,其中包括一个带有64个3*3大小的滤波器的卷积层conv1和一个如图2所示的非局部去噪层NL_DN,噪声块Noise_ Patches经过conv1后得到的浅层特征空间集合记作S,在经过NL_DN时,采用了三个1*1的卷积和softmax函数,分别学习到三个参数
Figure 435032DEST_PATH_IMAGE002
,再经过一个1*1核卷积,得到降噪特征空间集,记作D;
步骤C0222:进入第二部分,即深层特征增强,记为Deep_enhance,包含分别记为RCAB1,RCAB2,RCAB3,RCAB4的4个如图3所示的残差注意块和三个分别记为conv2,conv3,conv4的卷积层,每一个卷积层带有64个3*3大小的滤波器以及一个长跳跃连接、两个短跳连接;每一个残差注意块是由一个带有两个Conv层和一个Relu激活函数及短跳连接的残差块和通道注意机制组成,通道注意机制包括一层平均池化层Pooling、两个Conv层和一个Relu激活函数以及sigmoid函数;
步骤C0223:进入第三部分,即特征重构,记为Recon,由一个带有3个3*3大小的滤波器的反卷积层Deconv组成;得到清晰的水下图像集,记为Output_Images;
步骤C023:通过L1 Loss计算方法求取Output_Images和Real_UnderImages数据集相应的损失函数值,记为loss,置epoch =epoch +1;当epoch 达到300次后,网络停止训练,保存训练模型model.pt文件;否则将loss值反向传播,通过ADAM优化算法重新更新参数,再一次进入步骤C022,循环重复训练;
03部分,输入训练模型model.pt文件中,得到清晰图像,具体步骤如下:
步骤C031:将020部分中得到的水下图像处理模型model.pt文件导入到测试代码中;
步骤C032:将EUVP数据集中选用的528张测试图像输入到训练好的网络模型中,得到去噪和增强后的水下图像。
将本发明实施例模拟添加噪声强度为5、10、15的高斯噪声情况下建立模型并对EUVP数据集中选用的528张测试图像进行处理结果—峰值信噪比(PSNR),与使用相同的EUVP数据集且在模拟添加噪声强度为5、10、15的高斯噪声情况下,分别训练了cycleGan,funieGAN两种网络并以同样的528张测试图像进行测试的结果进行比较,见表1。
表1
Figure DEST_PATH_IMAGE003
将本发明及cycleGan,funieGAN加入噪声强度为10的高斯噪声的水下图像处理算法对比效果如图4所示。
从表1、图4中可以看出,本发明实施例与现有技术相比,处理水下图象的峰值信噪比(PSNR)较高,图像更加清晰且颜色与真实图像更为接近。

Claims (1)

1.一种基于双重注意机制的水下图像处理方法,其特征在于按照如下步骤进行:
01部分,使用数据集中的配对水下图像,在进入网络之前进行预处理操作:
步骤 C011:将数据集中多对自然图像作为训练集,其中待处理水下图像集记为Pre_UnderImages,真实的水下图像集记为Real_UnderImages;
步骤 C012:将Pre_UnderImages和Real_UnderImages数据集中的图像切块,块的大小为48*48像素,Pre_UnderImage数据集切块后的图像块分别加入高斯噪声,并将所得到的噪声图像块集合记为Noise_ Patches, Real_UnderImages数据集切块后的图像块集合记为Real_ Patches;
02部分,训练网络,得到水下图像处理的网络模型:
步骤C021:将噪声图像块Noise_ Patches输入网络;
步骤C022:开始训练
Figure 278341DEST_PATH_IMAGE001
对应的线性关系模型,约定变量epoch为网络循环训练的次数,初始为0;
步骤C0221:噪声图像块Noise_ Patches进入第一部分,即浅层特征去噪,记为Shallow_denoise,其中包括一个带有64个3*3大小的滤波器的卷积层conv1和一个非局部去噪层NL_DN,噪声块Noise_ Patches经过conv1后得到的浅层特征空间集合记作S,在经过NL_DN时,采用了三个1*1的卷积和softmax函数,分别学习到三个参数
Figure 798184DEST_PATH_IMAGE002
,再经过一个1*1核卷积,得到降噪特征空间集,记作D;
步骤C0222:进入第二部分,即深层特征增强,记为Deep_enhance,包含分别记为RCAB1,RCAB2,RCAB3,RCAB4的4个残差注意块和三个分别记为conv2,conv3,conv4的卷积层,每一个卷积层带有64个3*3大小的滤波器以及一个长跳跃连接、两个短跳连接;每一个残差注意块是由一个带有两个Conv层和一个Relu激活函数及短跳连接的残差块和通道注意机制组成,通道注意机制包括一层平均池化层Pooling、两个Conv层和一个Relu激活函数以及sigmoid函数;
步骤C0223:进入第三部分,即特征重构,记为Recon,由一个带有3个3*3大小的滤波器的反卷积层Deconv组成;得到清晰的水下图像集,记为Output_Images;
步骤C023:通过L1 Loss计算方法求取Output_Images和Real_UnderImages数据集相应的损失函数值,记为loss,置epoch =epoch +1;当epoch 达到300次后,网络停止训练,保存训练模型model.pt文件;否则将loss值反向传播,通过ADAM优化算法重新更新参数,再一次进入步骤C022,循环重复训练;
03部分,将待处理的水下图像输入训练模型model.pt文件中,得到清晰图像。
CN202011140666.9A 2020-08-20 2020-10-22 基于双重注意机制的水下图像处理方法 Active CN112435174B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010841540 2020-08-20
CN2020108415408 2020-08-20

Publications (2)

Publication Number Publication Date
CN112435174A CN112435174A (zh) 2021-03-02
CN112435174B true CN112435174B (zh) 2023-07-11

Family

ID=74695897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011140666.9A Active CN112435174B (zh) 2020-08-20 2020-10-22 基于双重注意机制的水下图像处理方法

Country Status (1)

Country Link
CN (1) CN112435174B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379715A (zh) * 2021-06-24 2021-09-10 南京信息工程大学 一种水下图像增强和数据集真值图像获得方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298413A (zh) * 2019-07-08 2019-10-01 北京字节跳动网络技术有限公司 图像特征提取方法、装置、存储介质及电子设备
CN111046967A (zh) * 2019-12-18 2020-04-21 江苏科技大学 一种基于卷积神经网络和注意力机制的水下图像分类方法
CN111047515A (zh) * 2019-12-29 2020-04-21 兰州理工大学 一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法
CN111311506A (zh) * 2020-01-21 2020-06-19 辽宁师范大学 基于双残差网络的低剂量ct牙齿图像去噪方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10685429B2 (en) * 2017-02-22 2020-06-16 Siemens Healthcare Gmbh Denoising medical images by learning sparse image representations with a deep unfolding approach

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298413A (zh) * 2019-07-08 2019-10-01 北京字节跳动网络技术有限公司 图像特征提取方法、装置、存储介质及电子设备
CN111046967A (zh) * 2019-12-18 2020-04-21 江苏科技大学 一种基于卷积神经网络和注意力机制的水下图像分类方法
CN111047515A (zh) * 2019-12-29 2020-04-21 兰州理工大学 一种基于注意力机制的空洞卷积神经网络图像超分辨率重建方法
CN111311506A (zh) * 2020-01-21 2020-06-19 辽宁师范大学 基于双残差网络的低剂量ct牙齿图像去噪方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
多输入融合对抗网络的水下图像增强;林森;刘世本;唐延东;;红外与激光工程(第05期);全文 *

Also Published As

Publication number Publication date
CN112435174A (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN114140353B (zh) 一种基于通道注意力的Swin-Transformer图像去噪方法及系统
CN110599409B (zh) 基于多尺度卷积组与并行的卷积神经网络图像去噪方法
CN109003240B (zh) 一种基于多尺度并行cnn的图像去噪方法
Yim et al. Enhancing the performance of convolutional neural networks on quality degraded datasets
CN111062880B (zh) 一种基于条件生成对抗网络的水下图像实时增强方法
CN113450290B (zh) 基于图像修补技术的低照度图像增强方法及系统
CN112257766B (zh) 一种基于频域滤波处理的自然场景下阴影识别检测方法
CN108830809B (zh) 一种基于膨胀卷积图像去噪方法
CN113052814B (zh) 基于Retinex和注意力机制的暗光图像增强方法
CN111260591A (zh) 一种基于注意力机制的图像自适应去噪方法
CN114972107A (zh) 基于多尺度堆叠式注意力网络的低照度图像增强方法
CN111210395A (zh) 基于灰度值映射的Retinex水下图像增强方法
CN114723630A (zh) 基于空洞双残差多尺度深度网络的图像去模糊方法及系统
CN112435174B (zh) 基于双重注意机制的水下图像处理方法
CN114742911A (zh) 图像压缩感知重建方法、系统、设备及介质
CN109993701B (zh) 一种基于金字塔结构的深度图超分辨率重建的方法
CN110728643A (zh) 一种基于卷积神经网络的低照度带噪声图像优化方法
Li et al. Low-light hyperspectral image enhancement
Wu et al. Multiple-operation image anti-forensics with WGAN-GP framework
CN112200752B (zh) 一种基于er网络多帧图像去模糊系统及其方法
CN116977651B (zh) 一种基于双分支和多尺度特征提取的图像去噪方法
Patil et al. Bilateral filter for image denoising
CN117422653A (zh) 一种基于权重共享和迭代数据优化的低光照图像增强方法
CN115272131B (zh) 基于自适应多光谱编码的图像去摩尔纹系统及方法
Piriyatharawet et al. Image denoising with deep convolutional and multi-directional LSTM networks under Poisson noise environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240117

Address after: No. 067, D-3 Chuntianyuan, Ganjingzi District, Dalian City, Liaoning Province, 116000

Patentee after: Dalian Zhongying Education Technology Co.,Ltd.

Address before: No. 116500, Shahekou Road, Dalian City, Liaoning Province

Patentee before: LIAONING NORMAL University

TR01 Transfer of patent right