CN114663309A - 一种基于多尺度信息选择注意机制的图像去雾方法及系统 - Google Patents
一种基于多尺度信息选择注意机制的图像去雾方法及系统 Download PDFInfo
- Publication number
- CN114663309A CN114663309A CN202210289695.4A CN202210289695A CN114663309A CN 114663309 A CN114663309 A CN 114663309A CN 202210289695 A CN202210289695 A CN 202210289695A CN 114663309 A CN114663309 A CN 114663309A
- Authority
- CN
- China
- Prior art keywords
- attention
- scale
- image
- features
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000007246 mechanism Effects 0.000 title claims abstract description 21
- 230000004927 fusion Effects 0.000 claims abstract description 41
- 239000010410 layer Substances 0.000 claims abstract description 38
- 239000011229 interlayer Substances 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 238000000605 extraction Methods 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 14
- 239000002356 single layer Substances 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 230000004931 aggregating effect Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 5
- 238000003860 storage Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 8
- 238000013528 artificial neural network Methods 0.000 description 4
- CVKBYFCJQSPBOI-UHFFFAOYSA-N methyl 3-[(4-methylphenyl)sulfonylamino]benzoate Chemical compound COC(=O)C1=CC=CC(NS(=O)(=O)C=2C=CC(C)=CC=2)=C1 CVKBYFCJQSPBOI-UHFFFAOYSA-N 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 239000011800 void material Substances 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 206010047571 Visual impairment Diseases 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 208000029257 vision disease Diseases 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000004393 visual impairment Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种基于多尺度信息选择注意机制的图像去雾方法及系统,包括:对有雾图像经预处理后得到添加高低频先验信息的图像样本;对图像样本采用多个卷积分支进行并行的多尺度多层卷积操作,并通过层间交叉方式提取多尺度特征,对多尺度特征融合后得到样本融合特征;采用包括多个级联的多尺度特征选择注意模块的注意力群组,对样本融合特征进行结合空间注意和通道注意的多尺度选择注意特征图的提取与拼接,拼接后得到融合注意力特征;根据融合注意力特征对去雾网络进行训练,对待处理有雾图像采用训练后的去雾网络得到无雾图像。实现更高效、更有针对性的去雾效果。
Description
技术领域
本发明涉及图像去雾技术领域,特别是涉及一种基于多尺度信息选择注意机制的图像去雾方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
造成视力障碍的恶劣天气会对当前的视觉系统造成很大的干扰,其中大雾天气因其发生频率高、影响范围广而备受关注。恶劣大雾天气会使成像设备产生劣质图像,如严重失真、模糊不清、细节丢失等。雾气导致成像质量低下,这会对目标检测、跟踪和分割等计算机视觉任务造成一定的障碍,同时给交通监控、智能导航、场景勘测等实际应用带来一定挑战。因此,对有雾图像进行去雾处理、恢复图像清晰化对后续一系列的计算机视觉任务能够正常开展以及人类正常生产生活有着重大意义。
当前的图像去雾算法主要可以分为三类:基于图像处理的增强方法、基于物理模型的去雾算法以及基于深度学习的去雾方法。其中,基于图像处理的增强方法运用已有的、成熟的数字图像处理技术改善图像质量实现图像去雾。这类方法不探究引起图像降质的原因,直接对图像进行增强处理,可能会让图像丢失一些信息,甚至引入噪声使图像失真。
基于物理模型的去雾算法是通过构建大气散射模型预测大气光值等参数,利用先验知识实现去雾。这类方法的去雾效果普遍强于基于图像处理的增强方法,但过于依赖物理模型及先验知识,对参数的估计偏差会直接导致不理想的去雾效果。
基于深度学习的去雾方法主要是通过构建端到端的卷积神经网络直接恢复出无雾图像,是目前最常用的去雾方法,尽管在一定程度上提升了去雾的性能,但是对图像有雾像素区域和重要特征通道信息关注不足,仍会存在去雾效果不理想的问题。
发明内容
为了解决上述问题,本发明提出了一种基于多尺度信息选择注意机制的图像去雾方法及系统,将图像的高低频信息作为去雾的附加先验,通过并行的多尺度卷积神经网络提取到图像不同尺度的特征信息,并对其进行特征融合,最后基于空间注意力和通道注意力机制设计注意力群组,以实现更高效、更有针对性的去雾效果。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种基于多尺度信息选择注意机制的图像去雾方法,包括:
对有雾图像经预处理后得到添加高低频先验信息的图像样本;
对图像样本采用多个卷积分支进行并行的多尺度多层卷积操作,并通过层间交叉方式提取多尺度特征,对多尺度特征融合后得到样本融合特征;
采用包括多个级联的多尺度特征选择注意模块的注意力群组,对样本融合特征进行结合空间注意和通道注意的多尺度选择注意特征图的提取与拼接,拼接后得到融合注意力特征;
根据融合注意力特征对去雾网络进行训练,对待处理有雾图像采用训练后的去雾网络得到无雾图像。
作为可选择的实施方式,对有雾图像的预处理包括:采用拉普拉斯算子提取有雾图像的高频分量,采用高斯滤波提取有雾图像的低频分量,将有雾图像与对应的高频分量和低频分量级联后,得到图像样本。
作为可选择的实施方式,并行的多尺度多层卷积操作包括:所述多个卷积分支中,每个卷积分支包括多层卷积层,多个卷积分支对图像样本并行进行特征提取,且每个分支的下一层输入为该分支前一层的输出和其他分支前一层的输出,以此提取多尺度特征。
作为可选择的实施方式,多尺度选择注意特征图的提取过程包括:对样本融合特征采用多层卷积分支进行并行的多尺度单层卷积操作,以提取不同尺度信息并进行拼接,对拼接特征进行注意特征提取,得到结合空间注意和通道注意的注意力特征图;将注意力特征图与样本融合特征逐元素相加后,将得到的特征重复多尺度单层卷积操作和注意特征提取,得到多尺度选择注意特征图。
作为可选择的实施方式,注意特征提取的过程包括:对拼接特征进行全局最大池化和全局平均池化,得到两个通道描述符,采用一维卷积聚合两个通道描述符邻域内k个通道信息,将一维卷积后的特征按元素相加,并通过sigmoid函数运算后,得到通道注意特征值,将通道注意特征值与拼接特征逐元素相乘后,得到空间注意的输入特征;
对空间注意的输入特征沿通道轴方向进行全局最大池化和全局均值池化,得到两个空间上下文描述符,对两个空间上下文描述符进行通道拼接,得到有效空间特征描述符,对有效空间特征描述符采用空洞卷积聚合空间上下文信息,根据空间上下文信息得到空间注意特征值,将空间注意特征值与空间注意的输入特征逐元素相乘后,得到注意力特征图。
作为可选择的实施方式,多尺度选择注意特征图的拼接过程包括:对每个多尺度特征选择注意模块得到的多尺度选择注意特征图进行拼接,得到融合注意力特征;其中,前一个多尺度特征选择注意模块得到的多尺度选择注意特征图,为后一个多尺度特征选择注意模块的输入。
作为可选择的实施方式,根据融合注意力特征对去雾网络进行训练的过程包括,将融合注意力特征与有雾图像进行逐元素相加后,采用L1损失对去雾网络进行训练。
第二方面,本发明提供一种基于多尺度信息选择注意机制的图像去雾系统,包括:
高低频信息提取模块,被配置为对有雾图像经预处理后得到添加高低频先验信息的图像样本;
多尺度特征提取模块,被配置为对图像样本采用多个卷积分支进行并行的多尺度多层卷积操作,并通过层间交叉方式提取多尺度特征,对多尺度特征融合后得到样本融合特征;
注意力群组模块,被配置为采用包括多个级联的多尺度特征选择注意模块的注意力群组,对样本融合特征进行结合空间注意和通道注意的多尺度选择注意特征图的提取与拼接,拼接后得到融合注意力特征;
去雾处理模块,被配置为根据融合注意力特征对去雾网络进行训练,对待处理有雾图像采用训练后的去雾网络得到无雾图像。
第三方面,本发明提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述的方法。
第四方面,本发明提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
与现有技术相比,本发明的有益效果为:
为了实现有雾图像清晰化的目标,同时最大限度的保持图像原有的结构和细节信息,本发明提出一种基于多尺度信息选择注意机制的图像去雾方法及系统,将图像的高低频信息作为去雾的附加先验,通过并行的多尺度多层卷积神经网络提取到图像不同尺度的特征信息,并将图像不同尺度的特征信息进行有效结合,最后基于空间注意力机制和通道注意力机制设计MSAB注意力群组,引入注意力机制来加强信息提取能力,提高图像重点区域的关注度,进而更有针对性的去雾,提升图像去雾的效果;解决现有模型对有雾图像进行特征提取时,忽略对图像不同尺度空间特征信息的提取和聚合,可能导致图像细节信息丢失的问题;且现有模型平等地对待有雾图像中的通道特征和像素特征,导致对图像有雾像素区域和重要特征通道信息关注不足,从而导致去雾效果不佳的问题。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的基于多尺度信息选择注意机制的图像去雾方法框架图;
图2为本发明实施例1提供的多尺度特征选择注意模块结构图;
图3为本发明实施例1提供的特征注意模块结构图;
图4为本发明实施例1提供的通道注意模块结构图;
图5为本发明实施例1提供的空间注意模块结构图。
具体实施方式
下面结合附图与实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1
如图1所示,本实施例提供一种基于多尺度信息选择注意机制的图像去雾方法,包括:
S1:对有雾图像经预处理后得到添加高低频先验信息的图像样本;
S2:对图像样本采用多个卷积分支进行并行的多尺度多层卷积操作,并通过层间交叉方式提取多尺度特征,对多尺度特征融合后得到样本融合特征;
S3:采用包括多个级联的多尺度特征选择注意模块的注意力群组,对样本融合特征进行结合空间注意和通道注意的多尺度选择注意特征图的提取与拼接,拼接后得到融合注意力特征;
S4:根据融合注意力特征对去雾网络进行训练,对待处理有雾图像采用训练后的去雾网络得到无雾图像。
在所述步骤S1中,对有雾图像的预处理包括:提取有雾图像的高频分量和低频分量,并将有雾图像与对应的高频分量和低频分量级联后,得到图像样本;具体包括:
S1-1:利用拉普拉斯算子提取有雾图像的高频分量;
采用拉普拉斯算子使有雾图像的边缘和纹理被增强,拉普拉斯算子本质是使用二阶微分进行图像锐化,增大邻域间像素的差值,使图像的突变部分变的更加明显。本实施例采用如表1所示的拉普拉斯算子核;
表1拉普拉斯算子核
S1-2:利用高斯滤波提取有雾图像的低频分量;
为了提取低频信息,本实施例对有雾图像进行高斯滤波,以去除高频细节。首先设定一个掩模,然后对模板内的图像灰度值进行加权平均,再将加权平均值赋给模板中心像素点,直至扫描整个有雾图像的所有像素点。
二维高斯函数的公式如下:
其中,x、y表示模板内的坐标点;σ为标准偏差;为了达到较好的模糊效果,本实施例使用窗口大小为15的高斯模板,标准偏差σ设为3。
S1-3:将有雾图像与其对应的高频分量和低频分量进行级联,得到添加高低频先验信息的图像样本;
设给定的有雾图像为I,经过高斯滤波后得到的低频分量为ILF,经过拉普拉斯运算后得到的高频分量为IHF;将有雾图像I与其对应的低频分量和高频分量进行级联,得到图像样本Iconcat如下:
Iconcat=I∞ILF∞IHF
其中,∞表示级联,即通道方向上的连接。
本实施例利用高低频信息作为附加先验信息,进而能够提取到更丰富且能有效区分有雾与无雾图像的特征信息。
在所述步骤S2中,将添加了高低频先验信息的图像样本Iconcat通过并行多尺度多层卷积神经网络,提取多尺度特征,并对多尺度特征融合后得到样本融合特征,具体包括:
S2-1:将图像样本Iconcat采用并行多尺度多层卷积神经网络,通过层间交叉方式提取图像样本的多尺度特征;其中,并行多尺度多层卷积神经网络包括多个卷积分支,每个卷积分支包括多层卷积层,多个卷积分支并行进行特征提取,且每个分支下一层的输入为该分支前一层的输出和其他分支前一层的输出;
本实施例采用两个卷积分支,每个卷积分支都包括两个卷积层;同时,设各个卷积分支的卷积核大小分别为3×3和5×5,令并行多尺度多层卷积神经网络的输入为F0,F0分别通过两个卷积分支的第一层卷积层,第一层卷积层的输出表示如下:
F1 3×3=f3×3(F0;η0 3×3);
F1 5×5=f5×5(F0;η0 5×5);
其中,F1 n×n表示第一层尺度为n×n的卷积输出,fn×n(.)表示尺度为n×n的卷积操作,η0 n×n表示尺度为n×n的卷积超参数。
为了进一步提高网络的表示能力,本实施例引入层间多尺度信息融合技术,将不同尺度的特征进行交叉融合,公式表示如下:
F2 3×3=f3×3((F1 3×3+F1 5×5);η1 3×3);
F2 5×5=f5×5((F1 5×5+F1 3×3);η1 5×5);
其中,F2 n×n表示第二层尺度为n×n的卷积输出,η1 n×n表示第二层尺度为n×n的卷积超参数。
在本实施例中,以上卷积层的激活函数都使用α为0.5的LeaklyReLu激活函数。
S2-2:将多尺度特征进行特征融合,得到信息更丰富的样本融合特征Fn-1:
Fn_1=F2 3×3∞F2 5×5;
其中,∞表示通道方向上的连接。
在所述步骤S3中,所述注意力群组基于空间注意力机制和通道注意力机制而设计,注意力群组包括3个级联的多尺度特征选择注意模块MSAB;如图2所示,每个多尺度特征选择注意模块MSAB包括并行多尺度单层卷积模块和特征注意模块FAM;如图3所示,特征注意模块FAM包括通道注意模块CAM和空间注意模块SAM,通道注意模块CAM和空间注意模块SAM以残差连接的方式组合为特征注意模块FAM。
在本实施例中,多尺度选择注意特征图的提取包括如下步骤:
S3-1:通过并行多尺度单层卷积模块,将样本融合特征Fn-1采用多层卷积分支进行并行的多尺度单层卷积操作,以提取不同尺度特征信息并进行拼接;
本实施例的并行多尺度单层卷积模块采用两个卷积分支,每个卷积分支包括一层卷积层,两个卷积分支的卷积核大小分别为1×1和3×3,在两个卷积分支后连接一个3×3的卷积层,将不同尺度特征信息经3×3的卷积层后得到拼接特征F,公式表示如下:
F=f3×3(f3×3(Fn-1)∞f1×1(Fn-1))
其中,fn×n(.)表示尺度为n×n的卷积操作。
S3-2:对拼接特征F采用特征注意模块进行注意特征提取,得到结合空间注意和通道注意的注意力特征图;具体包括:
S3-2-1:对拼接特征F采用通道注意模块,对不同通道特征赋予不同的加权信息,得到通道注意特征值;
如图4所示,在通道注意模块中,对于大小为C×H×W的拼接特征F,首先,采用全局最大池化和全局平均池化从空间信息中得到两个1×1×C的通道描述符,用以分别表示最大池化特征和平均池化特征;
然后,采用卷积核长度为k的一维卷积来聚合通道描述符邻域内k个通道的信息;
最后,将一维卷积后的两个特征按元素相加,并通过sigmoid函数运算,得到通道注意特征值Mc(F);公式表示如下:
其中,C表示拼接特征F的通道数,odd表示取与值最接近的奇数。
S3-2-2:将通道注意特征值Mc(F)在空间的两个维度上分别进行广播扩充,并与拼接特征F逐元素相乘,得到空间注意模块的输入特征F′;公式表示如下:
S3-2-3:如图5所示,在空间注意模块中,对于输入大小为C×H×W的特征图F′,首先,沿通道轴方向分别进行全局最大池化和全局均值池化,生成两个不同的1×H×W的空间上下文描述符;
然后,对两个空间上下文描述符进行通道拼接,生成有效空间特征描述符,对有效空间特征描述符采用空洞卷积高效聚合空间上下文信息;
最后,对空间上下文信息经过sigmoid函数生成空间注意特征值Ms(F);公式表示如下:
S3-2-4:将空间注意特征值Ms(F)在空间的两个维度上分别进行广播扩充,并与特征图F′逐元素相乘,得到注意力特征图F″,公式如下:
S3-3:将样本融合特征Fn-1与注意力特征图F″逐元素相加:
对相加得到的特征Fn-1′重复上述的多尺度单层卷积操作和注意特征提取操作,最终得到多尺度选择注意特征图;其中,多尺度单层卷积模块选择不同大小的卷积核,第二次两个卷积分支的卷积核大小分别为3×3和5×5。
在本实施例中,将多个级联的多尺度特征选择注意模块的多尺度选择注意特征图进行拼接;具体地,通过残差连接的方式进行通道方向上的拼接,继而将拼接特征FMSAB经过两个卷积层,得到最终的融合注意力特征FAttention;其中,两个卷积层的卷积核大小分别为1×1和公式3×3;公式如下:
FMSAB=FMSAB 1∞FMSAB 2∞FMSAB 3
其中,FMSAB n表示在网络架构中第n个MSAB的输出。
在所述步骤S4中,将融合注意力特征FAttention与原始的有雾图像I进行逐元素相加,采用L1损失对去雾网络进行训练,最后输出清晰无雾图像J;L1损失函数的公式如下所示:
其中,J表示无雾图像,I表示有雾图像,MISA表示去雾网络。
实施例2
本实施例提供一种基于多尺度信息选择注意机制的图像去雾系统,包括:
高低频信息提取模块,被配置为对有雾图像经预处理后得到添加高低频先验信息的图像样本;
多尺度特征提取模块,被配置为对图像样本采用多个卷积分支进行并行的多尺度多层卷积操作,并通过层间交叉方式提取多尺度特征,对多尺度特征融合后得到样本融合特征;
注意力群组模块,被配置为采用包括多个级联的多尺度特征选择注意模块的注意力群组,对样本融合特征进行结合空间注意和通道注意的多尺度选择注意特征图的提取与拼接,拼接后得到融合注意力特征;
去雾处理模块,被配置为根据融合注意力特征对去雾网络进行训练,对待处理有雾图像采用训练后的去雾网络得到无雾图像。
此处需要说明的是,上述模块对应于实施例1中所述的步骤,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1中所述的方法。
实施例1中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于多尺度信息选择注意机制的图像去雾方法,其特征在于,包括:
对有雾图像经预处理后得到添加高低频先验信息的图像样本;
对图像样本采用多个卷积分支进行并行的多尺度多层卷积操作,并通过层间交叉方式提取多尺度特征,对多尺度特征融合后得到样本融合特征;
采用包括多个级联的多尺度特征选择注意模块的注意力群组,对样本融合特征进行结合空间注意和通道注意的多尺度选择注意特征图的提取与拼接,拼接后得到融合注意力特征;
根据融合注意力特征对去雾网络进行训练,对待处理有雾图像采用训练后的去雾网络得到无雾图像。
2.如权利要求1所述的一种基于多尺度信息选择注意机制的图像去雾方法,其特征在于,对有雾图像的预处理包括:采用拉普拉斯算子提取有雾图像的高频分量,采用高斯滤波提取有雾图像的低频分量,将有雾图像与对应的高频分量和低频分量级联后,得到图像样本。
3.如权利要求1所述的一种基于多尺度信息选择注意机制的图像去雾方法,其特征在于,并行的多尺度多层卷积操作包括:所述多个卷积分支中,每个卷积分支包括多层卷积层,多个卷积分支对图像样本并行进行特征提取,且每个分支的下一层输入为该分支前一层的输出和其他分支前一层的输出,以此提取多尺度特征。
4.如权利要求1所述的一种基于多尺度信息选择注意机制的图像去雾方法,其特征在于,多尺度选择注意特征图的提取过程包括:对样本融合特征采用多层卷积分支进行并行的多尺度单层卷积操作,以提取不同尺度信息并进行拼接,对拼接特征进行注意特征提取,得到结合空间注意和通道注意的注意力特征图;将注意力特征图与样本融合特征逐元素相加后,将得到的特征重复多尺度单层卷积操作和注意特征提取,得到多尺度选择注意特征图。
5.如权利要求4所述的一种基于多尺度信息选择注意机制的图像去雾方法,其特征在于,注意特征提取的过程包括:对拼接特征进行全局最大池化和全局平均池化,得到两个通道描述符,采用一维卷积聚合两个通道描述符邻域内k个通道信息,将一维卷积后的特征按元素相加,并通过sigmoid函数运算后,得到通道注意特征值,将通道注意特征值与拼接特征逐元素相乘后,得到空间注意的输入特征;
对空间注意的输入特征沿通道轴方向进行全局最大池化和全局均值池化,得到两个空间上下文描述符,对两个空间上下文描述符进行通道拼接,得到有效空间特征描述符,对有效空间特征描述符采用空洞卷积聚合空间上下文信息,根据空间上下文信息得到空间注意特征值,将空间注意特征值与空间注意的输入特征逐元素相乘后,得到注意力特征图。
6.如权利要求1所述的一种基于多尺度信息选择注意机制的图像去雾方法,其特征在于,多尺度选择注意特征图的拼接过程包括:对每个多尺度特征选择注意模块得到的多尺度选择注意特征图进行拼接,得到融合注意力特征;其中,前一个多尺度特征选择注意模块得到的多尺度选择注意特征图,为后一个多尺度特征选择注意模块的输入。
7.如权利要求1所述的一种基于多尺度信息选择注意机制的图像去雾方法,其特征在于,根据融合注意力特征对去雾网络进行训练的过程包括,将融合注意力特征与有雾图像进行逐元素相加后,采用L1损失对去雾网络进行训练。
8.一种基于多尺度信息选择注意机制的图像去雾系统,其特征在于,包括:
高低频信息提取模块,被配置为对有雾图像经预处理后得到添加高低频先验信息的图像样本;
多尺度特征提取模块,被配置为对图像样本采用多个卷积分支进行并行的多尺度多层卷积操作,并通过层间交叉方式提取多尺度特征,对多尺度特征融合后得到样本融合特征;
注意力群组模块,被配置为采用包括多个级联的多尺度特征选择注意模块的注意力群组,对样本融合特征进行结合空间注意和通道注意的多尺度选择注意特征图的提取与拼接,拼接后得到融合注意力特征;
去雾处理模块,被配置为根据融合注意力特征对去雾网络进行训练,对待处理有雾图像采用训练后的去雾网络得到无雾图像。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210289695.4A CN114663309A (zh) | 2022-03-23 | 2022-03-23 | 一种基于多尺度信息选择注意机制的图像去雾方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210289695.4A CN114663309A (zh) | 2022-03-23 | 2022-03-23 | 一种基于多尺度信息选择注意机制的图像去雾方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114663309A true CN114663309A (zh) | 2022-06-24 |
Family
ID=82031761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210289695.4A Pending CN114663309A (zh) | 2022-03-23 | 2022-03-23 | 一种基于多尺度信息选择注意机制的图像去雾方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114663309A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115272776A (zh) * | 2022-09-26 | 2022-11-01 | 山东锋士信息技术有限公司 | 基于双路卷积与双注意的高光谱图像分类方法及存储介质 |
CN115359360A (zh) * | 2022-10-19 | 2022-11-18 | 福建亿榕信息技术有限公司 | 一种电力现场作业场景检测方法、系统、设备和存储介质 |
CN116824542A (zh) * | 2023-06-13 | 2023-09-29 | 重庆市荣冠科技有限公司 | 一种基于深度学习的轻量级雾天车辆检测方法 |
CN117253184A (zh) * | 2023-08-25 | 2023-12-19 | 燕山大学 | 一种雾先验频域注意表征引导的雾天图像人群计数方法 |
CN118038025A (zh) * | 2024-03-22 | 2024-05-14 | 重庆大学 | 基于频率域和空间域的雾天目标检测方法、装置以及设备 |
CN118298004A (zh) * | 2024-06-05 | 2024-07-05 | 纽智医疗科技(宁波)有限公司 | 一种基于三维超声心动图的心脏功能评估方法及系统 |
-
2022
- 2022-03-23 CN CN202210289695.4A patent/CN114663309A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115272776A (zh) * | 2022-09-26 | 2022-11-01 | 山东锋士信息技术有限公司 | 基于双路卷积与双注意的高光谱图像分类方法及存储介质 |
CN115272776B (zh) * | 2022-09-26 | 2023-01-20 | 山东锋士信息技术有限公司 | 基于双路卷积与双注意的高光谱图像分类方法及存储介质 |
CN115359360A (zh) * | 2022-10-19 | 2022-11-18 | 福建亿榕信息技术有限公司 | 一种电力现场作业场景检测方法、系统、设备和存储介质 |
CN116824542A (zh) * | 2023-06-13 | 2023-09-29 | 重庆市荣冠科技有限公司 | 一种基于深度学习的轻量级雾天车辆检测方法 |
CN116824542B (zh) * | 2023-06-13 | 2024-07-12 | 万基泰科工集团数字城市科技有限公司 | 一种基于深度学习的轻量级雾天车辆检测方法 |
CN117253184A (zh) * | 2023-08-25 | 2023-12-19 | 燕山大学 | 一种雾先验频域注意表征引导的雾天图像人群计数方法 |
CN117253184B (zh) * | 2023-08-25 | 2024-05-17 | 燕山大学 | 一种雾先验频域注意表征引导的雾天图像人群计数方法 |
CN118038025A (zh) * | 2024-03-22 | 2024-05-14 | 重庆大学 | 基于频率域和空间域的雾天目标检测方法、装置以及设备 |
CN118038025B (zh) * | 2024-03-22 | 2024-07-05 | 重庆大学 | 基于频率域和空间域的雾天目标检测方法、装置以及设备 |
CN118298004A (zh) * | 2024-06-05 | 2024-07-05 | 纽智医疗科技(宁波)有限公司 | 一种基于三维超声心动图的心脏功能评估方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114663309A (zh) | 一种基于多尺度信息选择注意机制的图像去雾方法及系统 | |
CN112507997B (zh) | 一种基于多尺度卷积和感受野特征融合的人脸超分辨系统 | |
CN111915530B (zh) | 一种基于端到端的雾霾浓度自适应神经网络图像去雾方法 | |
CN116071243B (zh) | 一种基于边缘增强的红外图像超分辨率重建方法 | |
Yin et al. | Highly accurate image reconstruction for multimodal noise suppression using semisupervised learning on big data | |
CN112257766B (zh) | 一种基于频域滤波处理的自然场景下阴影识别检测方法 | |
WO2021238420A1 (zh) | 图像去雾方法、终端及计算机存储介质 | |
CN111091503A (zh) | 基于深度学习的图像去失焦模糊方法 | |
Shen et al. | Convolutional neural pyramid for image processing | |
CN114223019A (zh) | 用于参数有效的语义图像分割的反馈解码器 | |
CN111179196B (zh) | 一种基于分而治之的多分辨率深度网络图像去高光方法 | |
Fan et al. | Multiscale cross-connected dehazing network with scene depth fusion | |
CN111951195A (zh) | 图像增强方法及装置 | |
Sanghvi et al. | Photon limited non-blind deblurring using algorithm unrolling | |
CN114627034A (zh) | 一种图像增强方法、图像增强模型的训练方法及相关设备 | |
Cui et al. | Exploring the potential of channel interactions for image restoration | |
CN113450261A (zh) | 一种基于条件生成对抗网络的单幅图像去雾方法 | |
CN114219722A (zh) | 一种利用时频域层级处理的低光照图像增强方法 | |
CN116863194A (zh) | 一种足溃疡图像分类方法、系统、设备及介质 | |
CN113962905B (zh) | 基于多阶段特征互补网络的单幅图像去雨方法 | |
He et al. | Low-light image enhancement with multi-scale attention and frequency-domain optimization | |
CN113627481A (zh) | 一种面向智慧园林的多模型组合的无人机垃圾分类方法 | |
KR20220059881A (ko) | 순환 신경망 네트워크를 이용한 점진적 비 제거 방법 및 장치 | |
Ooi et al. | Enhanced dense space attention network for super-resolution construction from single input image | |
Haris et al. | An efficient super resolution based on image dimensionality reduction using accumulative intensity gradient |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |