CN115115549A

CN115115549A - 多支路融合注意力机制的图像增强模型、方法、设备及存储介质

Info

Publication number: CN115115549A
Application number: CN202210773177.XA
Authority: CN
Inventors: 贾晓芬; 郭永存; 汪星; 赵佰亭; 黄友锐; 马天兵
Original assignee: Anhui University of Science and Technology
Current assignee: Anhui University of Science and Technology
Priority date: 2022-07-01
Filing date: 2022-07-01
Publication date: 2022-09-27

Abstract

本发明公开了一种多支路融合注意力机制的图像增强模型、方法、设备及存储介质，图像增强模型由特征提取阶段，增强阶段和融合阶段构成。特征提取阶段负责识别低光图像的不同区域，并提取出边缘、纹理等有效信息；增强阶段将提取出来的特征通过结合注意力机制自适应设置不同权重，来增强图像并实现去噪；融合阶段利用多分支融合网络将输出的结果进一步融合增强，最终输出增强图像。本发明能够自适应的提升图像亮度的同时降低图像的噪声和去除伪影，能解决低光照图像对比度低、细节信息丢失、颜色失真以及噪声伪影等引起的过度曝光问题。

Description

多支路融合注意力机制的图像增强模型、方法、设备及存储介质

技术领域

本发明属于图像处理技术领域，涉及多支路融合注意力机制的低光照图像增强模型、方法、设备及存储介质。

背景技术

计算机视觉领域高速发展的今天，高质量图像不仅记录日常生活而且还为科研提供了便利。在日常生活中由于受到天气晴雨、光照强度或拍摄方式等影响，使得得到的图像对比度低、噪声严重以及出现伪影和信息丢失等问题。从而影响后续的操作如目标识别、图像分类以及检测等。因此，低光照图像增强技术应运而生。

对于低照度图像增强，人们近年来提出了各种不同的算法，主要分为三类：基于传统算法、基于物理模型先验算法、基于深度学习算法。

针对传统算法如直方图均衡化、伽马校正等灰度增强方法，其通过对亮区域进行灰度拉伸，以达到对暗区域增强的目的。LIME[详见“Guo X,Li Y,Ling H.LIME:Low-lightimage enhancement via illumination map estimation[J].IEEE Transactions onimage processing,2016,26(2):982-993.”]通过优化低光图像的亮通道图得到光照图像，然后再经过伽马变换得到增强后图像；这些方法能够有效的提升全局和局部对比度，但对数据处理不够敏感，易使局部仍存在一些不好的视觉效果。

针对物理模型先验算法，如Retinex模型是模仿人类视觉系统构建出的算法。MSR[详见“Jobson D J,Rahman Z,Woodell G A.A multiscale retinex for bridging thegap between color images and the human observation of scenes[J].IEEETransactions on Image processing,1997,6(7):965-976.”]和SRIE[详见“Fu X,Zeng D,Huang Y,et al.A weighted variational model for simultaneous reflectance andillumination estimation[C]//Proceedings of the IEEE conference on computervision andpattern recognition.2016:2782-2790.”]等，能够在一定程度上对低光图像质量有所提高，但在求解构建出的复杂先验正则项，往往需要进行多次的迭代，耗时长。

最近深度学习成为热门的研究方向，如Retinex-Net[详见“Wei C,WangW,Yang W,et al.Deep retinex decomposition for low-light enhancement[J].arXiv preprintarXiv:1808.04560,2018.”]将输入图像分别经过分解模块和低光增强模块，然后再通过约束条件来实现增强；Kind[详见“Zhang Y,Zhang J,Guo X.Kindling the darkness:Apractical low-light image enhancer[C]//Proceedings of the 27th ACMinternational conference on multimedia.2019:1632-1640.”]网络包括分解模块、恢复模块以及重建模块，通过使用在不同曝光程度的图像块来进行训练，使得到的增强图像具有很好的效果；Zero-DCE[详见“Li C,Guo C,Chen C L.Learning to Enhance Low-LightImage via Zero-Reference Deep Curve Estimation[J].IEEE Transactions onSoftware Engineering,2021”]则构建一个无监督的训练网络，不依赖训练数据，通过采用迭代递进的方式来估测输入图像的亮度曲线来对低光照图像增强。GLADNet[详见“Wang W,Wei C,Yang W,et al.Gladnet:Low-light enhancement network with globalawareness[C]//201813th IEEE international conference on automatic face&gesture recognition,2018:751-755.”]提出了一种全局感知和细节保持网络，将低光图像通过全局光照估计来估计照明图像，然后再通过细节重建模块，从而对低光图像增强。

上述低照度图像增强方法虽取得了不错的效果，但存在以下问题：

(1)无法同时对低光图像进行去噪、伪影的抑制以及对不同区域增强；

(2)没有去噪模块，没有考虑噪声对图像的影响。

因此，本发明提出一种多支路低光增强网络(MANet)，首先对输入图像特征进行有效的提取，然后结合注意力机制的对提取出的不同区域图像设置不同权重进行增强，最后对增强后的输出融合来进一步提高图像。

发明内容

为了解决上述问题，本发明提供一种多支路融合注意力机制的图像增强模型，它能提升低光图像的亮度，同时降低图像的噪声和去除伪影，能解决低光照图像对比度低、细节信息丢失、颜色失真以及噪声伪影等引起的过度曝光问题。

本发明的第二目的是，提供一种多支路融合注意力机制的图像增强方法。

本发明的第三目的是，提供一种电子设备。

本发明的第四目的是，提供一种计算机存储介质。

本发明所采用的技术方案是，一种多支路融合注意力机制的图像增强模型，包括：特征提取阶段，增强阶段和融合阶段；

所述特征提取阶段负责识别低光图像的不同区域，并提取出边缘、纹理等有效信息；

所述增强阶段将提取出来的特征通过结合注意力机制自适应设置不同权重，来增强图像并实现去噪；

所述融合阶段利用多分支融合网络将输出的结果进一步融合增强，最终输出增强图像。

进一步地，所述特征提取阶段由3组深度可分离卷积层组成；

所述每组深度可分离卷积层的结构为Depthwise+BN+ReLu，其卷积核大小为3×3，通道数为32；

所述每组深度可分离卷积层负责提取不同区域的亮度并送到后续的操作；

所述深度可分离卷积层在降低运算量的同时，有助于提取低光照图像的边缘、纹理等有效的特征信息。

进一步地，所述增强阶段由3个EM增强模块构成；

所述EM增强模块首先使用1个3×3的卷积层提取输入图像的有效特征，然后再经过CBAM模块来对不同区域识别和增强；

所述EM增强模块根据下采样输出的特征图的宽和高来设计下采样块的数量，共用到3个下采样块，在一系列对称的上采样块之后，输出增强特征图；

所述下采样块由步长为2的卷积层和ReLU组成；

所述下采样块将最大池化层替换为CBAM注意力模块；首先将输入特征分别进行通道池化，再分别经过卷积网络并将输出的结果进行元素拼接，得到权重系数Mc，最后与输入的特征相乘得到通道注意力模块的输出；再将通道注意力模块的输出作为空间注意力模块的输入，再经过3×3卷积层，得到权重系数Ms，最后再与最开始的输入特征相乘得到最后的结果；该模块的所有层采用3×3卷积层，通道数分别为16，32，64，128；

所述EM增强模块利用跳跃连接将从下采样的特征引入到其相对应的上采样模块中，来补偿丢失的细节信息，增强清晰度；

所述增强阶段分别对3个EM增强模块的输出EM₁o、EM₂o、EM₃o进行1×1卷积后，进行融合，即可得到对低光照图像增强的结果。

进一步地，所述融合阶段负责融合增强阶段的输出结果；

所述融合阶段采用四尺度融合结构，用四条平行支路的多尺度卷积结构对增强模块的输出EMo进一步合并增强；

所述融合阶段输出的增强图像在颜色通道维度中连接来自EM₁o、EM₂o、EM₃o三个模块的所有输出；

所述融合阶段可以完全保留增强模块的信息并对其进行增强。

一种多支路融合注意力机制的图像增强方法，按以下步骤进行图像增强：

步骤S1、将低光图像输入到多支路融合注意力机制的图像增强模型中；

步骤S2、多支路融合注意力机制的图像增强模型，利用特征提取模块识别低光图像的不同区域，并提取出边缘、纹理等有效信息；

步骤S3、多支路融合注意力机制的图像增强模型，利用增强模块通过设置不同权重，增强步骤S2中提取的边缘、纹理等特征，并完成去噪，得到增强特征图；

步骤S4、多支路融合注意力机制的图像增强模型，利用融合模块对步骤S3输出的增强特征图进一步合并增强，得到最终的增强图像。

进一步地，所述图像增强方法必须借助在损失函数约束下训练好的图像增强模型实现；

所述损失函数能够在训练过程中使得图像增强模型估计出的增强图像与输入低光图像对应的真实增强图像之间的距离缩小；

所述损失函数包括结构损失、感知损失和区域损失，其计算公式为，

Loss＝αL_SSIM+βL_VGG+γL_Region (1)

其中L_SSIM、L_VGG和L_Region分别表示结构损失、感知损失和区域损失。

进一步地，所述结构损失函数用来衡量真实图像和增强后图像之间的差异，提高输出图像的视觉质量效果，其计算式为，

其中，μ_x和μ_y分别为x和y的图像像素的平均值，σ_x ²、σ_y ²与σ_xy分别表示x和y的方差和协方差，C₁、C₂为任意非零常数，其值是防止分母为零；

所述结构损失只注重图像的低层信息，但对于增强图像质量还需要高层信息；

所述感知损失，利用图像风格转换算法将低光图像经过卷积得到的特征与增强后图像得到的特征比较，其计算式为，

其中，E和G分别表示增强后的图像和真实图像，W_i,jH_i,jC_i,j分别表示特征图的宽度、高度以及通道数，

为第i块第j卷积层得到的特征图，取i＝3，j＝4；

所述区域损失是为了约束图像中的低光区域和其它区域之间的增强程度，避免整幅图像的不同区域整体增强导致的过度曝光问题，其计算式为，

其中E_l和G_l是增强图像和真实图像的低光区域，E_h和G_h是图像的其余部分；

所述权重取值为ω_l＝5,ω_h＝1，该取值的依据是：为了在训练时更多地关注图像中低光区域，对低光区域设置更大的权重值。

一种电子设备，其特征在于，采用如权利要求5-7任一项所述的方法实现对低光图像的增强。

一种计算机存储介质，其特征在于，所述存储介质中存储有至少一条程序指令，所述至少一条程序指令被处理器加载并执行以实现如权利要求5-7任一项所述的低光图像的增强方法。

本发明实施例的有益效果是，通过将普通卷积替换为可分离卷积，在提取出边缘、纹理等有效特征的同时降低计算量。能够根据不同的特性信息设置不同的权重，实现不同区域的特征信息局部增强，能减少语义特征丢失，提高图像清晰度。本发明能够自适应的提升图像亮度的同时降低图像的噪声和去除伪影，能解决低光照图像对比度低、细节信息丢失、颜色失真以及噪声伪影等引起的过度曝光问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种多支路融合注意力机制的图像增强模型的结构示意图。

图2是本发明实施例的一种多支路融合注意力机制的图像增强模型的增强阶段的增强模块结构示意图。

图3是本发明实施例的一种多支路融合注意力机制的图像增强模型的融合阶段的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1，

一种多支路融合注意力机制的图像增强模型，其结构如图1所示，包括：特征提取阶段，增强阶段和融合阶段；

其中特征提取阶段负责识别低光图像的不同区域，并提取出边缘、纹理等有效信息；特征提取阶段由3组深度可分离卷积层组成；每组深度可分离卷积层的结构为Depthwise+BN+ReLu，其卷积核大小为3×3，通道数为32；每组深度可分离卷积层负责提取不同区域的亮度并送到后续的操作；深度可分离卷积层在降低运算量的同时，有助于提取低光照图像的边缘、纹理等有效的特征信息。

如图2所示，

增强阶段将提取出来的特征通过结合注意力机制自适应设置不同权重，来增强图像并实现去噪；

增强阶段由3个EM增强模块构成；EM增强模块首先使用1个3×3的卷积层提取输入图像的有效特征，然后再经过CBAM模块来对不同区域识别和增强；EM增强模块根据下采样输出的特征图的宽和高来设计下采样块的数量，共用到3个下采样块，在一系列对称的上采样块之后，输出增强特征图；

下采样块由步长为2的卷积层和ReLU组成；下采样块将最大池化层替换为CBAM注意力模块；首先将输入特征分别进行通道池化，再分别经过卷积网络并将输出的结果进行元素拼接，得到权重系数Mc，最后与输入的特征相乘得到通道注意力模块的输出；再将通道注意力模块的输出作为空间注意力模块的输入，再经过3×3卷积层，得到权重系数Ms，最后再与最开始的输入特征相乘得到最后的结果；该模块的所有层采用3×3卷积层，通道数分别为16，32，64，128；

EM增强模块利用跳跃连接将从下采样的特征引入到其相对应的上采样模块中，来补偿丢失的细节信息，增强清晰度；

增强阶段分别对3个EM增强模块的输出EM₁o、EM₂o、EM₃o进行1×1卷积后，进行融合，即可得到对低光照图像增强的结果。

如图3所示，

融合阶段利用多分支融合网络将输出的结果进一步融合增强，最终输出增强图像。

融合阶段采用四尺度融合结构，用四条平行支路的多尺度卷积结构对增强模块的输出EMo进一步合并增强；

实施例2，

一种多支路融合注意力机制的图像增强方法，按图1所示的以下步骤进行图像增强：

图像增强方法必须借助在损失函数约束下训练好的图像增强模型实现；损失函数能够在训练过程中使得图像增强模型估计出的增强图像与输入低光图像对应的真实增强图像之间的距离缩小；

损失函数包括结构损失、感知损失和区域损失，其计算公式为，

Loss＝αL_SSIM+βL_VGG+γL_Region

结构损失函数用来衡量真实图像和增强后图像之间的差异，提高输出图像的视觉质量效果，其计算式为，

结构损失只注重图像的低层信息，但对于增强图像质量还需要高层信息；

感知损失，利用图像风格转换算法将低光图像经过卷积得到的特征与增强后图像得到的特征比较，其计算式为，

为第i块第j卷积层得到的特征图，取i＝3，j＝4；

区域损失是为了约束图像中的低光区域和其它区域之间的增强程度，避免整幅图像的不同区域整体增强导致的过度曝光问题，其计算式为，

权重取值为ω_l＝5,ω_h＝1，该取值的依据是：为了在训练时更多地关注图像中低光区域，对低光区域设置更大的权重值。

为了验证本发明实施例的多支路融合注意力机制的图像增强方法MANet的有效性，在144张合成低光图像数据集和不同曝光组成的配对数据集SCIE上开展实验。144张合成低光图像数据集使用基于MBLLE的PASCALVOC图像数据集合成的大量低光图像。其中训练集有16925张，验证集56张和测试集144张，图像的大小为256×256×3。数据集SCIE是在不同场景下的选取了由不同曝光组成的配对效果，每个序列有3到18张不同曝光度的低对比度图像，总共包含4413张多重曝光图像。

将MANet在上述两个数据集上开展图像增强实验，并分别与9个低光增强网络：LIME、MSR、BIMEF[详见，“YingZ,Ge L,Wen G.A Bio-InspiredMulti-Exposure FusionFrameworkfor Low-light Image Enhancement[J].2017.DOI:10.48550/arXiv.1711.00591”]、SRIE、Zero-DCE、KinD、GLADNet、RetinexNet、R2RNet[详见，“Hai J,Xuan Z,YangR,et al.R2RNet:Low-light Image Enhancement via Real-low to Real-normal Network[J].2021.DOI:10.48550/arXiv.2106.14501”]进行比较。

表1、2是在合成低光144张图像上测试，表3是在SCIE上4413张图像测试。其中“↑”表示值越高图像质量越好，“↓”表示值越低图像质量越好。

表1是不含噪声看出本算法在PSNR、SSIM和NIQE上都取得较好的优势，且与R2RNet相比PSNR提高了17％。表2是含噪声的图像，从表中可以看出MANet模型在PSNR、SSIM和NIQE与其他方法相比对噪声抑制有一定的效果，且与R2RNet相比PSNR提高了大约20％。

表1合成低光图像(不含噪声)增强的定量评价

注：粗体表示最优，斜体表示次之。

表2合成低光图像(含噪声)增强的定量评价

注：粗体表示最优，斜体表示次之。

表3是在SCIE数据集上测试结果，从表中可以看出MANet模型在PSNR、SSIM以及NIQE与其他方法相比有取得较好的结果，且与R2RNet相比在PSNR和SSIM分别提高了7％与12％

表3 SCIE数据集上定量评价

注：粗体表示最优，斜体表示次之。

综上所述，本发明MANet模型在所有指标上取得最优结果，且对低光图像也有一定的增强效果。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。