CN112102176A - 基于多尺度密集混合注意力神经网络的图像去雨方法 - Google Patents

基于多尺度密集混合注意力神经网络的图像去雨方法 Download PDF

Info

Publication number
CN112102176A
CN112102176A CN202010729947.1A CN202010729947A CN112102176A CN 112102176 A CN112102176 A CN 112102176A CN 202010729947 A CN202010729947 A CN 202010729947A CN 112102176 A CN112102176 A CN 112102176A
Authority
CN
China
Prior art keywords
attention
module
features
intensive
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010729947.1A
Other languages
English (en)
Inventor
李洽
彭振桓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
National Sun Yat Sen University
Original Assignee
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Sun Yat Sen University filed Critical National Sun Yat Sen University
Priority to CN202010729947.1A priority Critical patent/CN112102176A/zh
Publication of CN112102176A publication Critical patent/CN112102176A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度密集混合注意力神经网络的图像去雨方法,包括以下步骤:构建多尺度密集混合注意力神经网络,包括顺序连接的进入模块、多个密集注意力模块、退出模块、全连接操作单元以及负残差还原操作单元,两两相邻的密集注意力模块之间设置一转接层;将含雨图像输入多尺度密集混合注意力神经网络,进行初始特征提取;密集注意力模块对初始特征处理;对密集注意力模块输出的特征经转接层变为和初始特征相同维度大小的特征;全连接操作与负残差还原操作,最后输出无雨清晰图像。基于本发明,可以充分地去除含雨图像中的雨纹,并且较好的保留图像中的背景信息。

Description

基于多尺度密集混合注意力神经网络的图像去雨方法
技术领域
本发明属于计算机视觉任务中的低级处理技术或图像处理中的图像复原技术领域,具体涉及一种基于多尺度密集混合注意力神经网络的图像去雨方法。
背景技术
诸如监控系统等成像设备在室外拍摄遇到雨天时,拍摄所得的图像上会依附有雨滴,这种现象导致图像的可视化质量下降,从而使得计算机系统对该图像的处理无法正常操作。例如无人车需要时刻拍摄当前环境的图像估计行进路线,若图像的可视化质量下降,则无人车无法正常行驶。
近年来关于单图像去雨算法的研究大致可分为非深度学习的图像去雨算法和深度学习的图像去雨算法。
基于卷积神经网络的深度学习图像去雨方案目前有:Fu等人提出了基于残差神经网络框架的深度细节网络(DDN),他们利用低频滤波器将含雨图像分解为细节层和基础层,然后将细节层图像作为深度细节网络的输入,并提出了含雨图像和无雨图像之间的负残差层有利于神经网络拟合学习的观点;Zhang等人认为含雨图像上存在不均匀密度的雨纹,他们依据此设计了一个通过由残差感知分类器获得估计的雨纹密度标签指导雨纹去除的多流密集连接神经网络(DID-MDN),并创建了包含雨纹密度标签的数据集用于训练所提出的密度感知网络;Li等人介绍了一个结合了深度卷积和循环结构的神经网络(RSECAN),该网络采用了膨胀卷积操作来获取更大的感受野进而提取更多上下文信息,利用压缩激发模块指定不同方向和形状的雨纹层的权重值,同时将去雨操作分解为多个阶段,通过循环神经网络结构以保留使用上一去雨阶段的信息。
徐奕等人提出的一种基于多尺度特征融合的单帧图像去雨方法;柳长源等人提出的一种多通道多尺度卷积神经网络的单幅图像去雨方法。
上述图像去雨技术存在的缺点主要是去雨不足和过度去雨,前者导致雨纹痕迹残留在图像上,后者导致图像背景细节信息被破坏。去雨不足的原因在于现有去雨技术对含雨图像上雨纹特征信息提取的不充分,没有全面地考虑含雨图像上不同规模和方向的雨纹;过度去雨的原因主要是现有去雨技术对含雨图像上雨纹特征信息提取的不准确,即混淆了雨纹信息和背景细节信息,没有准确地判别出雨纹。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提出一种基于多尺度密集混合注意力神经网络的图像去雨方法,该方法基于卷积神经网络进行构建,能较为充分地去除含雨图像上的雨纹,并较好地保留背景细节信息。
为了达到上述目的,本发明采用以下技术方案:
基于多尺度密集混合注意力神经网络的图像去雨方法,包括以下步骤:
构建多尺度密集混合注意力神经网络,所述多尺度密集混合注意力神经网络包括顺序连接的进入模块、多个密集注意力模块、退出模块,全连接操作单元以及负残差还原操作单元,两两相邻的密集注意力模块之间设置一转接层;所述密集注意力模块包括多个组合模块,每个组合模块包括密集层、选择核单元以及空间注意力块,并按照密集层、选择核单元和空间注意力块的顺序对输入特征依次进行处理,处理结果输入到下一个组合模块;
将含雨图像输入多尺度密集混合注意力神经网络,进行初始特征提取;
密集注意力模块对初始特征进行处理,所述初始特征经过密集层进行卷积、批标准化和ReLU操作之后,由选择核单元进行划分、融合和选择运算处理,划分运算生成通过不同卷积核大小的卷积操作获得的多分支特征,而不同卷积核大小对应不同的感受野大小,融合运算对多分支特征进行组合聚集,为动态的权重选择获得不同感受野组合的全局表示,选择运算根据权重选择动态自适应地组合聚集不同卷积核大小对应的多分支特征;经过选择核单元处理后特征再由空间注意力块获得的两个空间维度上像素值被权重校正的特征进行通道维度上的组合特征,再利用一个卷积核大小为1的卷积层对组合特征进行降维,获得与输入特征具有相同维度大小的输出特征;
对密集注意力模块输出的特征经转接层变为和初始特征相同维度大小的特征,然后输入到下一个密集注意力模块,并重复执行密集注意力模块处理与改变特征维度大小步骤的操作,直至最后一个密集注意力模块完成处理,输出结果;
将多个密集注意力模块的输入特征在通道维度上进行级联的全连接操作并输入到退出模块,退出模块输出结果与含雨图像进行相加的负残差还原操作,最后得到无雨清晰图像。
进一步的,所述多尺度密集混合注意力神经网络包括4个密集注意力模块、3个转接层、1个进入模块、1个退出模块、1个全连接操作单元以及1个负残差还原操作单元;所述进入模块包括1个卷积层、1个批标准化层以及1个ReLU单元。
进一步的,所述初始特征提取具体为利用进入模块提取初始特征:
I=E(X)
其中I为初始特征,X为含雨图像。
进一步的,所述组合模块中的密集层和转接层具有相同的组成结构,包括1个卷积层、1个批标准化层以及1个ReLU单元,输入特征经过组合模块,组合模块的处理具体为:
Dl=f(S)=fSA(fSK(fDL(S)))
其中,S表示第l个组合模块的输入特征,Dl表示第l个组合模块的输出特征,fDL(·),fSK(·)和fSA(·)分别表示密集层,选择核单元和空间注意力块。
进一步的,所述选择核单元包括若干个卷积核大小为1的卷积层、若干个批标准化层、1个选择核卷积模块以及1个用于残差映射的跳远连接。
进一步的,所述选择核卷积模块由以下步骤实现:
划分运算,对于空间维度大小为H×W,带有C个通道的特征F,使用卷积核大小分别为3和5的两个卷积模块对特征F进行转换,所述两个卷积模块均由1个卷积层、1个批标准化层以及1个ReLU单元顺序地组成;
融合运算,采用门机制控制来自多个尺度的信息流,同时,设置阀门整合来自所有尺度的信息;
首先对来自多个尺度的特征信息通过逐个像素求和的方式进行融合:
U=U1+U2,
其中,U1和U2分别表示特征F经过所述划分运算步骤中两个卷积模块转换的结果;
使用自适应全局平均池化,使融合特征U在空间维度上收缩,变为大小为C的一维向量z:
Figure BDA0002602770860000041
用于降维的全连接操作单元生成紧凑特征g,g用于准确并自适应地指导选择来自多个尺度的信息,具体如下:
g=ffc(z)=δ(BN(Vz)),
其中δ(·)为ReLU函数,BN(·)表示批标准化层,ffc表示全连接层,V为全连接层ffc使用的尺寸大小为d×C的权重矩阵;
选择运算,为了自适应地选择来自不同空间尺度的信息,使用被紧凑特征g引导的软注意力,softmax操作定义如下:
Figure BDA0002602770860000051
其中A和B尺寸大小都是d×C,a、b分别表示U1和U2在通道维度上大小为C的软注意权重向量,同时,a和b的对应像素相加和为一;输出特征O通过不同尺度信息和注意权重的校正获得,具体如下:
O=a·U1+b·U2,ac+bc=1。
进一步的,所述空间注意力块对于给定的输入特征Fs,在通道维度上分别进行全局最大池化操作和全局平均池化操作获得特征在通道维度上的两种不同的聚合信息:
Figure BDA0002602770860000052
Figure BDA0002602770860000053
与输入特征Fs在空间维度上具有相同的大小,但仅带有一个通道;
将两种聚合信息进行通道维度上的拼接,生成输入特征Fs的全局池化描述子;
分别使用卷积核大小为3和7的两个卷积层对全局池化描述子进行操作并利用Sigmoid激活函数将所有像素值归一化,获得输入特征Fs的两个不同尺度的二维空间注意力图M1(Fs)和M2(Fs),具体如下:
Figure BDA0002602770860000054
Figure BDA0002602770860000055
进一步的,所述空间注意力块还包括以下步骤:
将M1(Fs)和M2(Fs)分别和输入特征Fs进行乘积操作,完成输入特征Fs在空间维度上多尺度的空间注意力机制;
将获得的两个空间维度上像素值被权重校正的特征进行通道维度上的组合;
利用一个卷积核大小为1的卷积层对组合特征进行降维,获得与输入特征Fs具有相同维度大小的输出特征
Figure BDA0002602770860000061
Figure BDA0002602770860000062
进一步的,所述组合模块的输入特征经过密集层、选择核单元以及空间注意力块处理后输出结果;组合模块的输入特征为前一个组合模块的输出特征与初始特征在通道维度上的级联结果;密集注意力模块的输出结果为所有组合模块的输出特征与初始特征在通道维度上的级联结果,具体如下表示:
Dl=f(S)=f([SI,D0,....,Dl-1]),
其中[SI,D0,....,Dl-1]表示密集注意力模块的原始输入特征和第0,.....,l-1个组合模块的输出特征在通道维度上的拼接结果。
进一步的,所述退出模块包括1个卷积层和1个批标准化层。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明结合采用了选择核单元和空间注意力块,构建了多尺度的通道注意力机制和多尺度的空间注意力机制的混合,实现对含雨图像上雨纹特征信息在不同维度上的准确提取。基于对含雨图像上雨纹特征信息在不同维度上的准确提取的基础,本发明采用密集连接神经网络结构,实现多层级特征的重复利用,确保有用的特征信息持续地传播,最终实现较为充分地去除含雨图像上的雨纹,并较好地保留背景细节信息。
2、本发明为了改正雨纹去除不充分的缺点,采用了密集连接神经网络结构,实现多层级特征重复利用,可以充分地挖掘含雨图像上多样的雨纹特性信息。
3、本发明为了改正过度去雨的缺点,结合利用了多尺度的通道注意力机制和多尺度的空间注意力机制,实现雨纹特征信息的校正,从而能有效准确地提取雨纹特征信息。
附图说明
图1是本发明神经网络的构造示意图;
图2是本发明密集注意力模块的构造示意图;
图3是本发明构造选择核卷积模块步骤的示意图;
图4是本发明得到二维空间注意力图步骤的示意图;
图5是本发明实施例的去雨效果图;
图6是本发明实施例的去雨效果图;
图7是本发明实施例的去雨效果图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明结合采用了选择核单元和空间注意力块,构建了多尺度的通道注意力机制和多尺度的空间注意力机制的混合,实现对含雨图像上雨纹特征信息在不同维度上的准确提取。基于对含雨图像上雨纹特征信息在不同维度上的准确提取的基础,本发明采用密集连接神经网络结构,实现多层级特征的重复利用,确保有用的特征信息持续地传播,最终实现较为充分地去除含雨图像上的雨纹,并较好地保留背景细节信息。
实施例
本发明提出的基于多尺度密集混合注意力神经网络的图像去雨方法包括以下步骤:
S1、构建多尺度密集混合注意力神经网络,基于卷积神经网络进行构建,包括顺序连接的进入模块、多个密集注意力模块、退出模块、全连接操作单元以及负残差还原操作单元,两两相邻的密集注意力模块之间设置一转接层;
在本实施例中,如图1所示,多尺度密集混合注意力神经网络包括4个密集注意力模块、3个转接层、1个进入模块、1个退出模块、1个全连接操作单元以及1个负残差还原操作单元;
S11、构建进入模块,在本实施例中,所述进入模块包括1个卷积层、1个批标准化层以及1个ReLU单元。
S12、构建密集注意力模块,所述密集注意力模块基于密集连接神经网络结构,包括多个组合模块,每个组合模块包括密集层、选择核单元以及空间注意力块;
如图2所示,在本实施例中,所述密集注意力模块包含3个组合模块,所述组合模块包括1个密集层、1个选择核单元以及1个空间注意力块。
S121、构建密集层,在本实施例中,所述密集层由1个卷积层、1个批标准化层以及1个ReLU单元组成。
S122、构建选择核单元,在本实施例中,选择核单元包括若干个卷积核大小为1的卷积层、若干个批标准化层、1个选择核卷积模块以及1个用于残差映射的跳远连接,选择核卷积模块为选择核单元的核心模块,如图3所示,其通过以下步骤实现:
划分运算,划分生成通过不同卷积核大小的卷积操作获得的多分支特征,而不同卷积核大小对应不同的感受野大小,具体为:
对于空间维度大小为H×W,带有C个通道的特征F,两个卷积核大小分别为3和5的卷积模块被用来对特征F进行转换,所述两个卷积模块均由1个卷积层、1个批标准化层和1个ReLU单元顺序地组成。
融合运算,融合对多分支特征进行组合聚集,为动态的权重选择获得不同感受野组合的全局表示,具体为:
在本实施例中,为了使神经元能根据刺激内容自适应地调整其感受野,采用门机制控制来自多个尺度的信息流,同时设置阀门整合来自所有尺度的信息。因此,首先对来自多个尺度的特征信息通过逐个像素求和的方式进行融合:
U=U1+U2,
其中,U1和U2分别表示特征F经过上述划分运算步骤两个卷积模块转换的结果。
随后,使用自适应全局平均池化,使融合特征U在空间维度上收缩为大小为C的一维向量z:
Figure BDA0002602770860000091
然后,用于降维的全连接操作单元将生成紧凑特征g,g用于准确并自适应地指导选择来自多个尺度的信息,具体如下:
g=ffc(z)=δ(BN(Vz)),
其中δ(·)为ReLU函数,BN(·)表示批标准化层,ffc表示全连接层,V为全连接层ffc使用的尺寸大小为d×C的权重矩阵。
选择运算,根据权重选择动态自适应地组合聚集不同卷积核大小对应的多分支特征,具体为:
为了自适应地选择来自不同空间尺度的信息,使用被紧凑特征g引导的软注意力,softmax操作定义如下:
Figure BDA0002602770860000092
其中A和B尺寸大小都是d×C,a,b分别表示U1和U2在通道维度上的大小为C的软注意权重向量,a和b的对应像素相加和为一。因此,输出特征O可以通过不同尺度信息和注意权重的校正获得,定义如下:
O=a·U1+b·U2,ac+bc=1
S123、构建空间注意力块,空间注意力块对于给定的输入特征Fs,通过在通道维度上分别进行全局最大池化操作和全局平均池化操作,获得特征在通道维度上的两种不同的聚合信息:
Figure BDA0002602770860000101
Figure BDA0002602770860000102
它们和输入特征Fs在空间维度上具有相同的大小,但仅带有一个通道。
将两种聚合信息进行通道维度上的拼接,生成输入特征Fs的全局池化描述子。
接着分别使用卷积核大小为3和7的两个卷积层对全局池化描述子进行操作并利用Sigmoid激活函数将所有像素值归一化,获得输入特征Fs的两个不同尺度的二维空间注意力图,M1(Fs)和M2(Fs),如图4所示,操作定义如下:
Figure BDA0002602770860000103
Figure BDA0002602770860000104
通过将M1(Fs)和M2(Fs)分别和输入特征Fs进行乘积操作完成输入特征Fs在空间维度上多尺度的空间注意力机制,并将获得的两个空间维度上像素值被权重校正的特征进行通道维度上的组合。
最后利用一个卷积核大小为1的卷积层对组合特征进行降维,获得与输入特征Fs具有相同维度大小的输入特征
Figure BDA0002602770860000105
具体为:
Figure BDA0002602770860000106
S13、构建转接层,在本实施例中,所述转接层与上述密集层构造一致,包括1个卷积层、1个批标准化层以及1个ReLU单元。
S14、构建退出模块,在本实施例中,所述退出模块包括1个卷积层和1个批标准化层。
S2、从数据库中获得依附有雨纹或雨滴的含雨图像X并输入多尺度密集混合注意力神经网络模型;如图5、图6、图7的左半部分所示,本实施例采用这3张含雨图像作为输入。
S3、提取初始特征,利用进入模块提取初始特征I:
I=E(X)。
S4、密集注意力模块对初始特征处理,按照组合模块中密集层、选择核单元和空间注意力块的顺序对初始特征依次进行处理,处理结果输入到下一个组合模块,具体为:
Dl=f(S)=fSA(fSK(fDL(S)))
其中,S表示第l个组合模块的输入特征,Dl表示第l个组合模块的输出特征,fDL(·),fSK(·)和fSA(·)分别表示密集层,选择核单元和空间注意力块。
组合模块的输入特征为前一个组合模块的输出特征与初始特征在通道维度上的级联结果;密集注意力模块的输出结果为所有组合模块的输出特征与初始特征在通道维度上的级联结果,具体如下表示:
Dl=f(S)=f([SI,D0,....,Dl-1]),
其中[SI,D0,....,Dl-1]表示密集注意力模块的原始输入特征和第0,.....,l-1个组合模块的输出特征在通道维度上的拼接结果。
在本实施例中,具体为:
初始特征经过密集层进行卷积、批标准化和ReLU操作之后,由选择核单元进行划分、融合和选择运算处理,详见步骤S122;
经过选择核单元处理后特征再由空间注意力块获得的两个空间维度上像素值被权重校正的特征进行通道维度上的组合特征,再利用一个卷积核大小为1的卷积层对组合特征进行降维,获得与输入特征具有相同维度大小的输出特征,详见步骤S123。
S5、密集注意力模块输出的特征经过转接层变为和初始特征I相同维度大小的特征,然后再输入到下一个密集注意力模块,重复步骤S4和S5,直至最后一个密集注意力模块完成处理,输出结果为止。
S6、对4个密集注意力模块的输入特征在通道维度上进行级联的全连接操作,然后输入退出模块,再经过和含雨图像X相加的负残差还原操作,最后输出无雨清晰图像N。
如图5、图6、图7右半部分所示,经过本发明方法的处理,图像中雨纹明显减少且背景信息得到了较好的保留。
还需要说明的是,在本说明书中,诸如术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,包括以下步骤:
构建多尺度密集混合注意力神经网络,所述多尺度密集混合注意力神经网络包括顺序连接的进入模块、多个密集注意力模块、退出模块,全连接操作单元以及负残差还原操作单元,两两相邻的密集注意力模块之间设置一转接层;所述密集注意力模块包括多个组合模块,每个组合模块包括密集层、选择核单元以及空间注意力块,并按照密集层、选择核单元和空间注意力块的顺序对输入特征依次进行处理,处理结果输入到下一个组合模块;
将含雨图像输入多尺度密集混合注意力神经网络,进行初始特征提取;
密集注意力模块对初始特征进行处理,所述初始特征经过密集层进行卷积、批标准化和ReLU操作之后,由选择核单元进行划分、融合和选择运算处理,划分运算生成通过不同卷积核大小的卷积操作获得的多分支特征,而不同卷积核大小对应不同的感受野大小,融合运算对多分支特征进行组合聚集,为动态的权重选择获得不同感受野组合的全局表示,选择运算根据权重选择动态自适应地组合聚集不同卷积核大小对应的多分支特征;经过选择核单元处理后特征再由空间注意力块获得的两个空间维度上像素值被权重校正的特征进行通道维度上的组合特征,再利用一个卷积核大小为1的卷积层对组合特征进行降维,获得与输入特征具有相同维度大小的输出特征;
对密集注意力模块输出的特征经转接层变为和初始特征相同维度大小的特征,然后输入到下一个密集注意力模块,并重复执行密集注意力模块处理与改变特征维度大小步骤的操作,直至最后一个密集注意力模块完成处理,输出结果;
将多个密集注意力模块的输入特征在通道维度上进行级联的全连接操作并输入到退出模块,退出模块输出结果与含雨图像进行相加的负残差还原操作,最后得到无雨清晰图像。
2.根据权利要求1所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述多尺度密集混合注意力神经网络包括4个密集注意力模块、3个转接层、1个进入模块、1个退出模块、1个全连接操作单元以及1个负残差还原操作单元;所述进入模块包括1个卷积层、1个批标准化层以及1个ReLU单元。
3.根据权利要求2所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述初始特征提取具体为利用进入模块提取初始特征:
I=E(X)
其中I为初始特征,X为含雨图像。
4.根据权利要求1所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述组合模块中的密集层和转接层具有相同的组成结构,包括1个卷积层、1个批标准化层以及1个ReLU单元,输入特征经过组合模块,组合模块的处理具体为:
Dl=f(S)=fSA(fSK(fDL(S)))
其中,S表示第l个组合模块的输入特征,Dl表示第l个组合模块的输出特征,fDL(·),fSK(·)和fSA(·)分别表示密集层,选择核单元和空间注意力块。
5.根据权利要求1所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述选择核单元包括若干个卷积核大小为1的卷积层、若干个批标准化层、1个选择核卷积模块以及1个用于残差映射的跳远连接。
6.根据权利要求5所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述选择核卷积模块由以下步骤实现:
划分运算,对于空间维度大小为H×W,带有C个通道的特征F,使用卷积核大小分别为3和5的两个卷积模块对特征F进行转换,所述两个卷积模块均由1个卷积层、1个批标准化层以及1个ReLU单元顺序地组成;
融合运算,采用门机制控制来自多个尺度的信息流,同时,设置阀门整合来自所有尺度的信息;
首先对来自多个尺度的特征信息通过逐个像素求和的方式进行融合:
U=U1+U2,
其中,U1和U2分别表示特征F经过所述划分运算步骤中两个卷积模块转换的结果;
使用自适应全局平均池化,使融合特征U在空间维度上收缩,变为大小为C的一维向量z:
Figure FDA0002602770850000031
用于降维的全连接操作单元生成紧凑特征g,g用于准确并自适应地指导选择来自多个尺度的信息,具体如下:
g=ffc(z)=δ(BN(Vz)),
其中δ(·)为ReLU函数,BN(·)表示批标准化层,ffc表示全连接层,V为全连接层ffc使用的尺寸大小为d×C的权重矩阵;
选择运算,为了自适应地选择来自不同空间尺度的信息,使用被紧凑特征g引导的软注意力,softmax操作定义如下:
Figure FDA0002602770850000032
其中A和B尺寸大小都是d×C,a、b分别表示U1和U2在通道维度上大小为C的软注意权重向量,同时,a和b的对应像素相加和为一;输出特征O通过不同尺度信息和注意权重的校正获得,具体如下:
O=a·U1+b·U2,ac+bc=1。
7.根据权利要求1所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述空间注意力块对于给定的输入特征Fs,在通道维度上分别进行全局最大池化操作和全局平均池化操作获得特征在通道维度上的两种不同的聚合信息:
Figure FDA0002602770850000033
Figure FDA0002602770850000034
与输入特征Fs在空间维度上具有相同的大小,但仅带有一个通道;
将两种聚合信息进行通道维度上的拼接,生成输入特征Fs的全局池化描述子;
分别使用卷积核大小为3和7的两个卷积层对全局池化描述子进行操作并利用Sigmoid激活函数将所有像素值归一化,获得输入特征Fs的两个不同尺度的二维空间注意力图M1(Fs)和M2(Fs),具体如下:
Figure FDA0002602770850000041
Figure FDA0002602770850000042
8.根据权利要求7所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述空间注意力块还包括以下步骤:
将M1(Fs)和M2(Fs)分别和输入特征Fs进行乘积操作,完成输入特征Fs在空间维度上多尺度的空间注意力机制;
将获得的两个空间维度上像素值被权重校正的特征进行通道维度上的组合;
利用一个卷积核大小为1的卷积层对组合特征进行降维,获得与输入特征Fs具有相同维度大小的输出特征
Figure FDA0002602770850000043
Figure FDA0002602770850000044
9.根据权利要求4-8中任一项所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述组合模块的输入特征经过密集层、选择核单元以及空间注意力块处理后输出结果;组合模块的输入特征为前一个组合模块的输出特征与初始特征在通道维度上的级联结果;密集注意力模块的输出结果为所有组合模块的输出特征与初始特征在通道维度上的级联结果,具体如下表示:
Dl=f(S)=f([SI,D0,....,Dl-1]),
其中[SI,D0,....,Dl-1]表示密集注意力模块的原始输入特征和第0,.....,l-1个组合模块的输出特征在通道维度上的拼接结果。
10.根据权利要求1所述的基于多尺度密集混合注意力神经网络的图像去雨方法,其特征在于,所述退出模块包括1个卷积层和1个批标准化层。
CN202010729947.1A 2020-07-27 2020-07-27 基于多尺度密集混合注意力神经网络的图像去雨方法 Pending CN112102176A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010729947.1A CN112102176A (zh) 2020-07-27 2020-07-27 基于多尺度密集混合注意力神经网络的图像去雨方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010729947.1A CN112102176A (zh) 2020-07-27 2020-07-27 基于多尺度密集混合注意力神经网络的图像去雨方法

Publications (1)

Publication Number Publication Date
CN112102176A true CN112102176A (zh) 2020-12-18

Family

ID=73750555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010729947.1A Pending CN112102176A (zh) 2020-07-27 2020-07-27 基于多尺度密集混合注意力神经网络的图像去雨方法

Country Status (1)

Country Link
CN (1) CN112102176A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686815A (zh) * 2020-12-24 2021-04-20 湖南大学 一种基于卷积神经网络的无人机单幅图像去雨方法
CN113312989A (zh) * 2021-05-11 2021-08-27 华南理工大学 一种基于聚合描述子与注意力的指静脉特征提取网络
CN113379674A (zh) * 2021-04-28 2021-09-10 北京医准智能科技有限公司 一种医学图像的检测方法及装置
CN113542780A (zh) * 2021-06-10 2021-10-22 北京工业大学 一种网络直播视频的压缩伪影去除方法及装置
CN114972105A (zh) * 2022-06-10 2022-08-30 江苏海洋大学 一种基于多尺度融合残差网络的单幅图像去雨方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415170A (zh) * 2019-06-24 2019-11-05 武汉大学 一种基于多尺度注意力卷积神经网络的图像超分辨率方法
CN110807749A (zh) * 2019-11-06 2020-02-18 广西师范大学 基于密集多尺度生成对抗网络的单幅图像去雨滴方法
US20200074186A1 (en) * 2018-08-28 2020-03-05 Beihang University Dense crowd counting method and apparatus
CN111275643A (zh) * 2020-01-20 2020-06-12 西南科技大学 基于通道和空间注意力的真实噪声盲去噪网络模型及方法
CN111311518A (zh) * 2020-03-04 2020-06-19 清华大学深圳国际研究生院 基于多尺度混合注意力残差网络的图像去噪方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200074186A1 (en) * 2018-08-28 2020-03-05 Beihang University Dense crowd counting method and apparatus
CN110415170A (zh) * 2019-06-24 2019-11-05 武汉大学 一种基于多尺度注意力卷积神经网络的图像超分辨率方法
CN110807749A (zh) * 2019-11-06 2020-02-18 广西师范大学 基于密集多尺度生成对抗网络的单幅图像去雨滴方法
CN111275643A (zh) * 2020-01-20 2020-06-12 西南科技大学 基于通道和空间注意力的真实噪声盲去噪网络模型及方法
CN111311518A (zh) * 2020-03-04 2020-06-19 清华大学深圳国际研究生院 基于多尺度混合注意力残差网络的图像去噪方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QIA LI 等: "Multi-Scale Dense Selective Kernel Spatial Attention Network for Single Image De-raining", 《2020 IEEE 5TH INTERNATIONAL CONFERENCE ON CLOUD COMPUTING AND BIG DATA ANALYTICS》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686815A (zh) * 2020-12-24 2021-04-20 湖南大学 一种基于卷积神经网络的无人机单幅图像去雨方法
CN113379674A (zh) * 2021-04-28 2021-09-10 北京医准智能科技有限公司 一种医学图像的检测方法及装置
CN113379674B (zh) * 2021-04-28 2022-05-13 北京医准智能科技有限公司 一种医学图像的检测方法及装置
CN113312989A (zh) * 2021-05-11 2021-08-27 华南理工大学 一种基于聚合描述子与注意力的指静脉特征提取网络
CN113542780A (zh) * 2021-06-10 2021-10-22 北京工业大学 一种网络直播视频的压缩伪影去除方法及装置
CN113542780B (zh) * 2021-06-10 2023-01-20 北京工业大学 一种网络直播视频的压缩伪影去除方法及装置
CN114972105A (zh) * 2022-06-10 2022-08-30 江苏海洋大学 一种基于多尺度融合残差网络的单幅图像去雨方法
CN114972105B (zh) * 2022-06-10 2024-03-29 江苏海洋大学 一种基于多尺度融合残差网络的单幅图像去雨方法

Similar Documents

Publication Publication Date Title
CN112102176A (zh) 基于多尺度密集混合注意力神经网络的图像去雨方法
CN110992275B (zh) 一种基于生成对抗网络的细化单幅图像去雨方法
CN109191382B (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
CN110135580B (zh) 一种卷积网络全整型量化方法及其应用方法
CN113052211B9 (zh) 一种基于特征的秩和通道重要性的剪枝方法
CN111046962A (zh) 基于稀疏注意力的卷积神经网络模型的特征可视化方法及系统
CN112102177B (zh) 基于压缩与激励机制神经网络的图像去模糊方法
CN109740451B (zh) 基于重要性加权的道路场景图像语义分割方法
CN111612024B (zh) 特征提取方法、装置、电子设备及计算机可读存储介质
CN107506792B (zh) 一种半监督的显著对象检测方法
CN109949200B (zh) 基于滤波器子集选择和cnn的隐写分析框架构建方法
CN111597920A (zh) 一种自然场景下的全卷积单阶段的人体实例分割方法
CN112801104B (zh) 基于语义分割的图像像素级伪标签确定方法及系统
CN110956201B (zh) 一种基于卷积神经网络的图像失真类型分类方法
CN113205026A (zh) 一种基于Faster RCNN深度学习网络改进的车型识别方法
CN110807369B (zh) 基于深度学习和注意力机制的短视频内容智能分类方法
CN111325167A (zh) 一种基于深度学习技术的巡检作业评价方法
CN115439849B (zh) 基于动态多策略gan网络的仪表数字识别方法及系统
CN110796716A (zh) 一种基于多重残差网络和正则化迁移学习的图像着色方法
CN110930314A (zh) 图像条带噪声抑制方法及其装置、电子设备、存储介质
CN110489584B (zh) 基于密集连接的MobileNets模型的图像分类方法及系统
CN114627005A (zh) 一种雨密度分类引导的双阶段单幅图像去雨方法
CN113240589A (zh) 一种多尺度特征融合的图像去雾方法及系统
CN112749731A (zh) 一种基于深度神经网络的票据数量识别方法及系统
CN110688986A (zh) 注意力分支引导的3d卷积行为识别网络方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201218