CN117132752A - 基于多维度加权的沙尘图像增强方法、装置、设备及介质 - Google Patents

基于多维度加权的沙尘图像增强方法、装置、设备及介质 Download PDF

Info

Publication number
CN117132752A
CN117132752A CN202311379112.8A CN202311379112A CN117132752A CN 117132752 A CN117132752 A CN 117132752A CN 202311379112 A CN202311379112 A CN 202311379112A CN 117132752 A CN117132752 A CN 117132752A
Authority
CN
China
Prior art keywords
image
sand
dust
data set
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311379112.8A
Other languages
English (en)
Other versions
CN117132752B (zh
Inventor
瞿千上
庄焰
赵彩丹
陈凌俊
高晨星
胡文欣
谭熠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shuocheng Xiamen Technology Co ltd
Original Assignee
Shuocheng Xiamen Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shuocheng Xiamen Technology Co ltd filed Critical Shuocheng Xiamen Technology Co ltd
Priority to CN202311379112.8A priority Critical patent/CN117132752B/zh
Publication of CN117132752A publication Critical patent/CN117132752A/zh
Application granted granted Critical
Publication of CN117132752B publication Critical patent/CN117132752B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了基于多维度加权的沙尘图像增强方法、装置、设备及介质,可以在还原图像颜色信息的同时,有效增强图像边缘信息。在沙尘环境中,图像整体存在严重偏向红黄色以及细节不清的问题,影响着城市户外计算机视觉系统对图像物体的定位和监控。然而,现有的图像增强算法性能容易受到沙尘浓度的影响,且无法较好地解决沙尘图像中偏色严重问题,故本发明提出了一种基于多维度加权的沙尘图像增强网络MDE‑cycGAN(Multi‑Dimension Enhancement based on cycleGAN)。该网络增加了自适应的多维度通道注意力加权机制,能够增强生成器对图像中多个维度色彩偏移的恢复能力,并对生成对抗模型训练机制进行优化,保证图像质量,并优化合成图像算法。最后利用数据集进行试验,验证了方法的可行性。

Description

基于多维度加权的沙尘图像增强方法、装置、设备及介质
技术领域
本发明涉及深度学习技术领域,具体涉及基于多维度加权的沙尘图像增强方法、装置、设备及介质。
背景技术
沙尘环境中悬浮着大量的沙尘颗粒,吸收并散射蓝光和绿光,导致图像整体存在严重偏向于红黄色调以及细节不清的问题,不仅对基于道路视觉的自动驾驶系统有较大的影响,而且严重影响着整个城市中大型的户外计算机视觉系统对图像物体的定位与监控。因此,需要进行沙尘图像增强的研究。
当前,对于沙尘天气条件下的图像增强引起了广泛的研究,具体可以分为基于视觉感知、图像退化物理模型和深度学习的方法。首先,基于视觉感知的沙尘图像增强处理方法针对沙尘图像整体颜色偏黄、对比度低等特点进行处理,其中主要有基于白平衡方法、直方图均衡方法;这些方法有着较好的性能,但在处理沙尘浓度较大的图像时,存在失真、块效应、偏色加重等问题。其次,基于图像退化物理模型的沙尘图像增强算法可以根据改进的大气散射模型或者运用暗通道先验理论等,获取先验知识并拟合图像退化的物理原理,最后通过逆推得到原始图像;该方法需要一定的假设基础,利用先验知识完成沙尘图像的增强,但会受到沙尘浓度、光照条件变化的影响,具有一定的局限性,且处理后的图像仍然有颜色失真、细节模糊的问题。最后,近年来,CNN、GAN等深度学习算法在不同天气下的低质图像增强领域也得到了普遍应用,在雾天、雨天图像处理上已经取得了较多显著的成果,将深度学习算法运用到沙尘图像增强领域也是研究的趋势;但相对于雾天图像而言,沙尘天气中悬浮的沙尘颗粒直径更大,不仅会出现严重的图像偏色问题,同时会对传输光线造成更强的衰减或遮挡,最终拍摄图像清晰程度更低。同时,将其它场景中表现较好的模型运用在沙尘场景中,还有较多需要改进的地方。
有鉴于此,提出本申请。
发明内容
有鉴于此,本发明的目的在于提供基于多维度加权的沙尘图像增强方法、装置、设备及介质,能够有效解决现有技术中的图像增强方法存在失真、块效应、偏色加重、具有一定的局限性、且处理后的图像仍然有颜色失真、细节模糊、拍摄图像清晰程度低的问题。
本发明公开了基于多维度加权的沙尘图像增强方法, 包括:
获取自然沙尘图像,对所述自然沙尘图像的色彩特征进行统计分析处理,并基于RGB三个通道的不同偏移特征,对沙尘图像合成算法进行优化;
获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集;
调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,其中,所述多维度加权的沙尘图像增强网络模型MDE-cycGAN包括生成器网络和判别器网络。
优选地,获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集,具体为:
获取RESIDE-OTS数据集中的图像,构成原始清晰图像;
在RESIDE-OTS数据集的基础上合成了4194张配对的沙图,生成合成数据集;
使用预先收集到的多张真实沙尘图像,构成真实沙尘图像数据集;
通过所述合成数据集、所述原始清晰图像和所述真实沙尘图像数据集构成沙尘图像数据集。
优选地,调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,具体为:
调用所述生成器网络对所述沙尘图像数据集进行预处理,生成增强图像,其中,所述生成器网络由特征降维、特征识别与转换网络和图像重构网络三个部分组成,具体的:
获取沙尘图像特征,并通过所述特征识别与转换网络将所述沙尘图像特征转换为清晰图像特征,其中,所述特征识别与转换网络由残差块以及多维度通道关注模块组成;
将清晰图像、合成的沙尘图像和自然沙尘图像作为生成器的输入,并将通过三级卷积后的清晰图像、合成的沙尘图像和自然沙尘图像进行特征识别和转换处理,图像重构之后,得到增强的图像,生成增强图像。
优选地,调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,还包括:
所述多维度通道关注模块通过神经网络的卷积和全连接操作,实现对通道系数的自适应模拟;
设置输入特征热图的维度为H×W×M,得到两个全连接层的权重维度,其中,H为图像的长度,W为图像的宽度,M为通道数;
将上下两个支路的信息进行融合,输出维度为1×1×M,获得了M个通道的空间注意力系数;
根据空间注意力系数对对应通道的像素进行加权相乘处理,以实现图像的特征校正;
对图像的H维度和W维度上都加入通道注意力,实现对每个像素点的自适应拉伸系数的估计;
在所述多维度通道关注模块的输出前加入一个核为1的卷积进行维度恢复,所述核为1的卷积对图像进行维度归一化,变换为三个维度相等的特征图,以使得各个维度的通道注意力权重均衡。
优选地,在调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理之前,还包括:
获取训练图像数据集,构建一个基础沙尘图像增强网络模型;
调用所述基础沙尘图像增强网络模型的生成器网络对所述训练图像数据集进行多轮迭代预处理,生成训练图像;
调用所述基础沙尘图像增强网络模型的判别器网络对所述训练图像进行判别,生成判别结果;
当所述判别结果为真时,结束训练,并通过设置的判别器和生成器的损失函数计算所述基础沙尘图像增强网络模型的误差,以进一步提高训练效果,生成多维度加权的沙尘图像增强网络模型MDE-cycGAN。
本发明还公开了基于多维度加权的沙尘图像增强装置,包括:
优化单元,用于获取自然沙尘图像,对所述自然沙尘图像的色彩特征进行统计分析处理,并基于RGB三个通道的不同偏移特征,对沙尘图像合成算法进行优化;
数据集生成单元,用于获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集;
图像增强单元,用于调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,其中,所述多维度加权的沙尘图像增强网络模型MDE-cycGAN包括生成器网络和判别器网络。
优选地,所述数据集生成单元具体用于:
获取RESIDE-OTS数据集中的图像,构成原始清晰图像;
在RESIDE-OTS数据集的基础上合成了4194张配对的沙图,生成合成数据集;
使用预先收集到的多张真实沙尘图像,构成真实沙尘图像数据集;
通过所述合成数据集、所述原始清晰图像和所述真实沙尘图像数据集构成沙尘图像数据集。
优选地,所述图像增强单元具体用于:
调用所述生成器网络对所述沙尘图像数据集进行预处理,生成增强图像,其中,所述生成器网络由特征降维、特征识别与转换网络和图像重构网络三个部分组成,具体的:
获取沙尘图像特征,并通过所述特征识别与转换网络将所述沙尘图像特征转换为清晰图像特征,其中,所述特征识别与转换网络由残差块以及多维度通道关注模块组成;
将清晰图像、合成的沙尘图像和自然沙尘图像作为生成器的输入,并将通过三级卷积后的清晰图像、合成的沙尘图像和自然沙尘图像进行特征识别和转换处理,图像重构之后,得到增强的图像,生成增强图像。
本发明还公开了基于多维度加权的沙尘图像增强设备,包括处理器、存储器以及存储在存储器中且被配置由处理器执行的计算机程序,处理器执行计算机程序时实现如上任意一项的基于多维度加权的沙尘图像增强方法。
本发明还公开了可读存储介质,存储有计算机程序,计算机程序能够被该存储介质所在设备的处理器执行,以实现如上任意一项的基于多维度加权的沙尘图像增强方法。
综上所述,本实施例提供的基于多维度加权的沙尘图像增强方法、装置、设备及介质,可以在还原图像颜色信息的同时,有效增强图像边缘信息;增加了自适应的多维度通道注意力加权机制,能够增强生成器对图像中多个维度色彩偏移的恢复能力,并对生成对抗模型训练机制进行优化,保证图像质量,并优化合成图像算法。从而解决现有技术中的图像增强方法存在失真、块效应、偏色加重、具有一定的局限性、且处理后的图像仍然有颜色失真、细节模糊、拍摄图像清晰程度低的问题。
附图说明
图1是本发明实施例提供的基于多维度加权的沙尘图像增强方法的流程示意图。
图2是本发明实施例提供的基于循环生成对抗网络的沙尘图像增强网络结构示意图。
图3是本发明实施例提供的各算法在自然沙尘图像上的对比示意图。
图4是本发明实施例提供的基于多维度加权的沙尘图像增强装置的模块示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
以下结合附图对本发明的具体实施例做详细说明。
请参阅图1至图2,本发明的第一实施例提供了基于多维度加权的沙尘图像增强方法,其可由沙尘图像增强设备(以下简称增强设备)来执行,特别的,由增强设备内的一个或者多个处理器来执行,以实现如下步骤:
在本实施例中,所述增强设备可为存储设备(如智能手机、智能电脑或者其他智能设备),该用户终端设备可与云端的服务器建立通讯连接,以实现数据的交互。
S101,获取自然沙尘图像,对所述自然沙尘图像的色彩特征进行统计分析处理,并基于RGB三个通道的不同偏移特征,对沙尘图像合成算法进行优化;
S102,获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集;
具体地,步骤S102包括:获取RESIDE-OTS数据集中的图像,构成原始清晰图像;
在RESIDE-OTS数据集的基础上合成了4194张配对的沙图,生成合成数据集;
使用预先收集到的多张真实沙尘图像,构成真实沙尘图像数据集;
通过所述合成数据集、所述原始清晰图像和所述真实沙尘图像数据集构成沙尘图像数据集。
具体地,在本实施例中,对自然沙尘图像的色彩特征进行统计分析,基于RGB三个通道的不同偏移特征,优化了沙尘图像合成算法。构建配对数据集。对合成数据集、原始清晰图像和真实沙尘图像数据集进行预处理;即在RESIDE-OTS数据集的基础上合成了4194张配对的沙图,加以网络爬虫获得的1180张真实沙尘图像,共同构成了由清晰图像、合成沙尘图像以及自然沙尘图像组成的沙尘图像数据集。
在本实施例中,在基于多维度加权的沙尘图像增强算法的性能试验中,使用的数据集包含合成沙尘图像、自然沙尘图像和清晰图像。采用室外图像数据集 RESIDE-OTS中699张原始清晰图像合成沙图,利用优化的沙尘图像合成方法将每张清晰图像合成不同的6张沙尘图像,共计4194张,作为合成沙尘图像数据集。另外,经人工筛选出符合室外沙尘天气条件下拍摄的真实图像共1180张,作为自然沙尘图像数据。合成沙尘图像能够构建监督学习需要的成对数据集、自然沙尘图像能够更全面的反映沙尘天气的实际情况,利用两种数据集各自的优势,通过构建混合数据集对模型进行训练,提高模型的综合性能。其中,所述基于多维度加权的沙尘图像增强方法所采用的显卡配置为NVIDIA GeForce RTX 306012 GB,编程环境为python3.7、torch 1.7.0 + cu11。模型训练的batchsize为8,epoch迭代次数设置为300,采用Adam Optimizer,学习率为0.0002,其一阶矩和二阶矩分别为0.9和0.999。
简单来说,所述基于多维度加权的沙尘图像增强方法首先要构建数据集,基于优化的沙尘图像合成方法获取合成沙尘图像,将数据集用于基于多维度加权的沙尘图像增强网络,实现沙尘图像增强,分析结果。收集图像,对图像进行预处理,构建实验数据集。用室外图像数据集RESIDE-OTS的基础上合成沙尘图像。沙尘图像质量降低的原因包括颜色偏移和边缘模糊。在沙尘天气场景中,空气中存在大量半径较大的沙尘颗粒,导致目标物体反射的光线在到达图像接收设备之前经过了沙尘介质的吸收、散射和辐射。图像拍摄设备接收的图像对比度、清晰度降低,且色彩发生偏移。沙尘天气下成像设备最终接收到的总光强可由目标反射光经过沙尘等介质衰减和光源经过沙尘等粒子散射形成的大气光两个部分线性叠加组成。沙尘天气对于图像采集设备成像的影响与有雾天气存在一定相似性,因此可以通过改进雾天图像形成的物理模型,来描述沙尘图像成像原理。基于RGB三个通道的不同偏移特征,优化了沙尘图像合成算法。算法合成后的图像与真实沙尘图像相比,合成的沙尘图像在三原色通道分布上,B通道的主要峰值分布在中间,R通道和G通道明显向右偏移,分布在125~250之间,峰值以外区域的值相对峰值大幅减少,与自然沙尘图像的特征一致。通过图像轮廓的对比,其层次和边缘细节弱化的表现与预期吻合。
S103,调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,其中,所述多维度加权的沙尘图像增强网络模型MDE-cycGAN包括生成器网络和判别器网络。
具体地,步骤S103包括:调用所述生成器网络对所述沙尘图像数据集进行预处理,生成增强图像,其中,所述生成器网络由特征降维、特征识别与转换网络和图像重构网络三个部分组成,具体的:
获取沙尘图像特征,并通过所述特征识别与转换网络将所述沙尘图像特征转换为清晰图像特征,其中,所述特征识别与转换网络由残差块以及多维度通道关注模块组成;
将清晰图像、合成的沙尘图像和自然沙尘图像作为生成器的输入,并将通过三级卷积后的清晰图像、合成的沙尘图像和自然沙尘图像进行特征识别和转换处理,图像重构之后,得到增强的图像,生成增强图像。
所述多维度通道关注模块通过神经网络的卷积和全连接操作,实现对通道系数的自适应模拟;
设置输入特征热图的维度为H×W×M,得到两个全连接层的权重维度,其中,H为图像的长度,W为图像的宽度,M为通道数;
将上下两个支路的信息进行融合,输出维度为1×1×M,获得了M个通道的空间注意力系数;
根据空间注意力系数对对应通道的像素进行加权相乘处理,以实现图像的特征校正;
对图像的H维度和W维度上都加入通道注意力,实现对每个像素点的自适应拉伸系数的估计;
在所述多维度通道关注模块的输出前加入一个核为1的卷积进行维度恢复,所述核为1的卷积对图像进行维度归一化,变换为三个维度相等的特征图,以使得各个维度的通道注意力权重均衡。
具体地,在本实施例中,需要设计多维度加权的沙尘图像增强网络MDE-cycGAN(Multi-Dimension Enhancement based on cycleGAN),该模型一共分为两大部分,包括生成器网络和判别器网络。在模型设计上,为实现更好的色彩自适应能力和更高图像能见度,基于通道注意力的思想,通过多维度通道注意力加权机制对图像各特征通道、空间像素点进行自适应的加权值估计,克服单颜色通道加权校正的不足。最后,所述基于多维度加权的沙尘图像增强方法改进了cycleGAN模型训练机制,以获得更好的增强效果。
生成器网络由特征降维、特征识别与转换网络和图像重构网络三个部分组成,最终获得增强图像。基于循环对抗网络结构,设计了“沙尘图域→清晰图域”以及“清晰图域→沙尘图域”的两种生成器。在单向循环网络的基础上,设计双向循环对抗网络加强训练。判别器网络包含两种,分别是清晰图像域判别器和沙尘图像域判别器,用于判别生成图像的真假,判别器结构均为卷积网络。
特征识别与转换网络的主要目的是在获取沙尘图像特征之后,将沙尘图像特征转换为清晰图像特征。该网络主要由残差块以及多维度通道关注模块。为了提取图像的特征信息并减少转换信息损失,采用两端对称的残差块设计。为了提取图像的特征信息并减少转换信息损失,采用两端对称的残差块设计。将清晰图像、合成的沙尘图像和自然沙尘图像作为生成器的输入,然后通过三级卷积后进行特征识别和转换,图像重构之后得到增强的图像。
多维度通道关注模块通过神经网络的卷积和全连接操作,即多维度通道关注模块核心是神经网络的卷积和全连接操作,实现对通道系数的自适应模拟,有效改善传统的通道系数在实际处理中缺乏对图像的自适应调整能力。设置输入特征热图的维度为H×W×M,得到两个全连接层的权重维度,其中,H为图像的长度,W为图像的宽度,M为通道数。然后将上下两个支路的信息融合之后,输出维度为1×1×M,即获得了M个通道的空间注意力系数,再用该系数对对应通道的像素进行加权相乘,实现图像的特征校正。然后对图像的H和W维度上都加入通道注意力,实现对每个像素点的自适应拉伸系数的估计。为使各个维度的通道注意力权重均衡,多维度通道注意力模型中首先用一个核为1的卷积对图像进行维度归一化,变换为三个维度相等的特征图,在模块的输出前加入一个核为1的卷积进行维度恢复。
具体地,在本实施例中,在调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理之前,还包括:
获取训练图像数据集,构建一个基础沙尘图像增强网络模型;
调用所述基础沙尘图像增强网络模型的生成器网络对所述训练图像数据集进行多轮迭代预处理,生成训练图像;
调用所述基础沙尘图像增强网络模型的判别器网络对所述训练图像进行判别,生成判别结果;
当所述判别结果为真时,结束训练,并通过设置的判别器和生成器的损失函数计算所述基础沙尘图像增强网络模型的误差,以进一步提高训练效果,生成多维度加权的沙尘图像增强网络模型MDE-cycGAN。
在本实施例中,经过多轮迭代,完成训练。获得PSNR(Peak signal-to-noiseRatio)、SSIM(Structural Similarity)和NRSS(No-reference Structural Sharpness)三个客观指标。同时,通过设置的判别器和生成器的损失函数计算模型的误差,进一步提高训练效果。简单来说,在理想情况下,如果判别器的输入为干净的图像,那么判别器的网络输出的就是一个概率接近1的值,判别器的loss就会比较低,此时,若输入是生成器生成的图像,那么判别器便判别为假,判别器的网络输出的就是一个概率接近0的值,判别器的loss比较高,此时,该判别器就是一个训练好的判别器了。当这个判别器已经无法分辨真假时,说明生成器的效果达到预设值,生成的图像接近于真实图像,说明整个GAN网络loss很小,训练停止。即,判别器判别为真的时候,代表已经训练好了;为假的时候就是没有训练好。
所述基于多维度加权的沙尘图像增强方法基于cycleGAN网络,提出了MDE-cycGAN(Multi-Dimension Enhancement based on cycleGAN)网络。根据沙尘图像的统计特性,提出了一种基于大气散射模型的合成图像算法,并在RESIDE-OTS数据集上合成了配对的沙图。为了能够验证模型的泛化能力,收集自然沙尘图像,共同构建沙尘数据集。在白平衡理论的思想下,所述基于多维度加权的沙尘图像增强方法设计了自适应的多维度通道注意力加权机制,增强生成器对图像中多个维度色彩偏移的恢复能力。此外,对生成对抗模型训练机制进行优化,使用双循环以更好地保证增强后的图像质量。
请参阅图3,在本实施例中,用当前图像增强效果较好的RetinexNet、 DehazeNet、HDRNet、AODnet以及MSRCR、DCP算法作为对比,以验证所述基于多维度加权的沙尘图像增强方法的优点。在所述基于多维度加权的沙尘图像增强方法提出的沙尘数据集上,从视觉主观感受以及图像质量评分进行实验对比。辅以消融实验,证明所提模型的有效性和泛化性。即,在同意沙尘数据集的基础上,从视觉主观感受以及图像质量评分进行实验对比。辅以消融实验,证明了本发明提出网络的有效性和泛化性。经过实验可得,本发明所提算法在合成沙尘图像数据中获得了31.7974的PSNR均值以及0.9683的SSIM均值评分;在自然沙尘图像数据中获得了0.9513的NRSS评分。与其他模型相比,分数最高,并且在主观评价上能够较好地还原图像颜色信息,有效去除边缘伪影并增强图像边缘信息,具有较好的模型泛化能力。
其中,为了验证多通道注意力的有效性,所述基于多维度加权的沙尘图像增强方法构建了基于残差的单通道注意力模型SDSSIE(Single Dimension Stretch Sand ImageEnhancement)以及多维度通道注意力模型——MDSSIE-I(Multi-Dimension Stretch SandImage Enhancement-I)模型;即消融实验中提出的模型。在此基础上,进一步研究了特征的识别及转换模块中对称性设计的影响,在多维度通道注意力模型两边放置残差模块的模型MDSSIE-II,最后依据改进的损失函数设计,合成MDSSIE-III(Multi-Dimension StretchSand Image Enhancement-III)模型。
对比分析可得,MSRCR以及DCP算法在沙尘浓度较低的情况下,可以一定程度提升图像对比度以及轮廓细节特征,而当图像的颜色过于偏黄的情况下,图像颜色偏离以及细节模糊反而更加严重。四种深度学习方法,均出现了不同程度的图像颜色失真情况,无法恢复图像颜色信息, 并且在边缘细节上提升不大。所述基于多维度加权的沙尘图像增强方法所提算法对于自然沙尘图像可较好实现偏黄图像的颜色校正,图像与正常天气下拍摄的图像颜色相近。对于图像细节信息上的恢复也较好,如图3中各算法处理后的图像路灯都已不可观测,而所述基于多维度加权的沙尘图像增强方法所提算法具有最佳的观测效果。
从视觉角度和参数评价两个方面综合分析可知,所述基于多维度加权的沙尘图像增强方法的算法相比于其他对比算法在图像的偏色、清晰度上有更佳的处理效果,在有效性以及泛化能力上都更胜一筹。所述基于多维度加权的沙尘图像增强方法所提网络在图像256 × 256的分辨率下,处理图像速度达到31FPS(Frames Per Second),可以达到30FPS的最低实时处理要求。
综上,所述基于多维度加权的沙尘图像增强方法在主观评价上能够较好地还原图像颜色信息,有效去除边缘伪影并增强图像边缘信息,具有较好的模型泛化能力。所述基于多维度加权的沙尘图像增强方法所提算法从视觉角度和参数评价两个方面与RetinexNet、DehazeNet、HDRNet、AODnet以及MSRCR、DCP算法相比,本发明算法相比于其他对比算法在图像的偏色、清晰度上有更佳的处理效果,在有效性以及泛化能力上都更胜一筹。所述基于多维度加权的沙尘图像增强方法所提网络在图像256×256的分辨率下,处理图像速度达到31FPS(Frames Per Second),可以达到30FPS的最低实时处理要求。所述基于多维度加权的沙尘图像增强方法所提的多维度通道注意力及改进损失对于图像的去沙尘都具有一定效果,图像的视觉效果也有所提升,预测的图像物体颜色更加真实,图像整体画面具有良好的视觉效果。
请参阅图4,本发明的第二实施例提供了基于多维度加权的沙尘图像增强装置,包括:
优化单元201,用于获取自然沙尘图像,对所述自然沙尘图像的色彩特征进行统计分析处理,并基于RGB三个通道的不同偏移特征,对沙尘图像合成算法进行优化;
数据集生成单元202,用于获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集;
图像增强单元203,用于调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,其中,所述多维度加权的沙尘图像增强网络模型MDE-cycGAN包括生成器网络和判别器网络。
优选地,所述数据集生成单元202具体用于:
获取RESIDE-OTS数据集中的图像,构成原始清晰图像;
在RESIDE-OTS数据集的基础上合成了4194张配对的沙图,生成合成数据集;
使用预先收集到的多张真实沙尘图像,构成真实沙尘图像数据集;
通过所述合成数据集、所述原始清晰图像和所述真实沙尘图像数据集构成沙尘图像数据集。
优选地,所述图像增强单元203具体用于:
调用所述生成器网络对所述沙尘图像数据集进行预处理,生成增强图像,其中,所述生成器网络由特征降维、特征识别与转换网络和图像重构网络三个部分组成,具体的:
获取沙尘图像特征,并通过所述特征识别与转换网络将所述沙尘图像特征转换为清晰图像特征,其中,所述特征识别与转换网络由残差块以及多维度通道关注模块组成;
将清晰图像、合成的沙尘图像和自然沙尘图像作为生成器的输入,并将通过三级卷积后的清晰图像、合成的沙尘图像和自然沙尘图像进行特征识别和转换处理,图像重构之后,得到增强的图像,生成增强图像。
本发明的第三实施例提供了基于多维度加权的沙尘图像增强设备,包括处理器、存储器以及存储在存储器中且被配置由处理器执行的计算机程序,处理器执行计算机程序时实现如上任意一项的基于多维度加权的沙尘图像增强方法。
本发明的第四实施例提供了可读存储介质,存储有计算机程序,计算机程序能够被该存储介质所在设备的处理器执行,以实现如上任意一项的基于多维度加权的沙尘图像增强方法。
示例性地,本发明第三实施例和第四实施例中所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述基于多维度加权的沙尘图像增强设备中的执行过程。例如,本发明第二实施例中所述的装置。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于多维度加权的沙尘图像增强方法的控制中心,利用各种接口和线路连接整个所述基于多维度加权的沙尘图像增强方法的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现基于多维度加权的沙尘图像增强方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(Secure Digital, SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述实现的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。

Claims (10)

1.基于多维度加权的沙尘图像增强方法, 其特征在于,包括:
获取自然沙尘图像,对所述自然沙尘图像的色彩特征进行统计分析处理,并基于RGB三个通道的不同偏移特征,对沙尘图像合成算法进行优化;
获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集;
调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,其中,所述多维度加权的沙尘图像增强网络模型MDE-cycGAN包括生成器网络和判别器网络。
2.根据权利要求1所述的基于多维度加权的沙尘图像增强方法,其特征在于,获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集,具体为:
获取RESIDE-OTS数据集中的图像,构成原始清晰图像;
在RESIDE-OTS数据集的基础上合成了4194张配对的沙图,生成合成数据集;
使用预先收集到的多张真实沙尘图像,构成真实沙尘图像数据集;
通过所述合成数据集、所述原始清晰图像和所述真实沙尘图像数据集构成沙尘图像数据集。
3.根据权利要求1所述的基于多维度加权的沙尘图像增强方法,其特征在于,调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,具体为:
调用所述生成器网络对所述沙尘图像数据集进行预处理,生成增强图像,其中,所述生成器网络由特征降维、特征识别与转换网络和图像重构网络三个部分组成,具体的:
获取沙尘图像特征,并通过所述特征识别与转换网络将所述沙尘图像特征转换为清晰图像特征,其中,所述特征识别与转换网络由残差块以及多维度通道关注模块组成;
将清晰图像、合成的沙尘图像和自然沙尘图像作为生成器的输入,并将通过三级卷积后的清晰图像、合成的沙尘图像和自然沙尘图像进行特征识别和转换处理,图像重构之后,得到增强的图像,生成增强图像。
4.根据权利要求3所述的基于多维度加权的沙尘图像增强方法,其特征在于,调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,还包括:
所述多维度通道关注模块通过神经网络的卷积和全连接操作,实现对通道系数的自适应模拟;
设置输入特征热图的维度为H×W×M,得到两个全连接层的权重维度,其中,H为图像的长度,W为图像的宽度,M为通道数;
将上下两个支路的信息进行融合,输出维度为1×1×M,获得了M个通道的空间注意力系数;
根据空间注意力系数对对应通道的像素进行加权相乘处理,以实现图像的特征校正;
对图像的H维度和W维度上都加入通道注意力,实现对每个像素点的自适应拉伸系数的估计;
在所述多维度通道关注模块的输出前加入一个核为1的卷积进行维度恢复,所述核为1的卷积对图像进行维度归一化,变换为三个维度相等的特征图,以使得各个维度的通道注意力权重均衡。
5.根据权利要求4所述的基于多维度加权的沙尘图像增强方法,其特征在于,在调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理之前,还包括:
获取训练图像数据集,构建一个基础沙尘图像增强网络模型;
调用所述基础沙尘图像增强网络模型的生成器网络对所述训练图像数据集进行多轮迭代预处理,生成训练图像;
调用所述基础沙尘图像增强网络模型的判别器网络对所述训练图像进行判别,生成判别结果;
当所述判别结果为真时,结束训练,并通过设置的判别器和生成器的损失函数计算所述基础沙尘图像增强网络模型的误差,以进一步提高训练效果,生成多维度加权的沙尘图像增强网络模型MDE-cycGAN。
6.基于多维度加权的沙尘图像增强装置,其特征在于,包括:
优化单元,用于获取自然沙尘图像,对所述自然沙尘图像的色彩特征进行统计分析处理,并基于RGB三个通道的不同偏移特征,对沙尘图像合成算法进行优化;
数据集生成单元,用于获取合成数据集、原始清晰图像和真实沙尘图像数据集,构建生成沙尘图像数据集;
图像增强单元,用于调用训练好的多维度加权的沙尘图像增强网络模型MDE-cycGAN对所述沙尘图像数据集进行处理,生成增强图像,其中,所述多维度加权的沙尘图像增强网络模型MDE-cycGAN包括生成器网络和判别器网络。
7.根据权利要求6所述的基于多维度加权的沙尘图像增强装置,其特征在于,所述数据集生成单元具体用于:
获取RESIDE-OTS数据集中的图像,构成原始清晰图像;
在RESIDE-OTS数据集的基础上合成了4194张配对的沙图,生成合成数据集;
使用预先收集到的多张真实沙尘图像,构成真实沙尘图像数据集;
通过所述合成数据集、所述原始清晰图像和所述真实沙尘图像数据集构成沙尘图像数据集。
8.根据权利要求6所述的基于多维度加权的沙尘图像增强装置,其特征在于,所述图像增强单元具体用于:
调用所述生成器网络对所述沙尘图像数据集进行预处理,生成增强图像,其中,所述生成器网络由特征降维、特征识别与转换网络和图像重构网络三个部分组成,具体的:
获取沙尘图像特征,并通过所述特征识别与转换网络将所述沙尘图像特征转换为清晰图像特征,其中,所述特征识别与转换网络由残差块以及多维度通道关注模块组成;
将清晰图像、合成的沙尘图像和自然沙尘图像作为生成器的输入,并将通过三级卷积后的清晰图像、合成的沙尘图像和自然沙尘图像进行特征识别和转换处理,图像重构之后,得到增强的图像,生成增强图像。
9.基于多维度加权的沙尘图像增强设备,其特征在于,包括处理器、存储器以及存储在存储器中且被配置由处理器执行的计算机程序,处理器执行计算机程序时实现如权利要求1至5任意一项的基于多维度加权的沙尘图像增强方法。
10.可读存储介质,其特征在于,存储有计算机程序,计算机程序能够被该存储介质所在设备的处理器执行,以实现如权利要求1至5任意一项的基于多维度加权的沙尘图像增强方法。
CN202311379112.8A 2023-10-24 2023-10-24 基于多维度加权的沙尘图像增强方法、装置、设备及介质 Active CN117132752B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311379112.8A CN117132752B (zh) 2023-10-24 2023-10-24 基于多维度加权的沙尘图像增强方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311379112.8A CN117132752B (zh) 2023-10-24 2023-10-24 基于多维度加权的沙尘图像增强方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN117132752A true CN117132752A (zh) 2023-11-28
CN117132752B CN117132752B (zh) 2024-02-02

Family

ID=88858494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311379112.8A Active CN117132752B (zh) 2023-10-24 2023-10-24 基于多维度加权的沙尘图像增强方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117132752B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570426A (zh) * 2018-06-06 2019-12-13 国际商业机器公司 使用深度学习的图像联合配准和分割
CN111738946A (zh) * 2020-06-16 2020-10-02 新疆大学 一种沙尘降质图像的增强方法及装置
CN112070693A (zh) * 2020-08-27 2020-12-11 西安理工大学 一种基于灰度世界自适应网络的单幅沙尘图像恢复方法
CN114220024A (zh) * 2021-12-22 2022-03-22 内蒙古自治区气象信息中心(内蒙古自治区农牧业经济信息中心)(内蒙古自治区气象档案馆) 基于深度学习的静止卫星沙尘暴识别方法
WO2022067668A1 (zh) * 2020-09-30 2022-04-07 中国科学院深圳先进技术研究院 基于视频图像目标检测的火灾检测方法、系统、终端以及存储介质
CN114882373A (zh) * 2022-03-29 2022-08-09 内蒙古工业大学 基于深度神经网络的多特征融合沙尘暴预测方法
CN115205141A (zh) * 2022-06-16 2022-10-18 北京航空航天大学 一种火星遥感图像增强方法与装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570426A (zh) * 2018-06-06 2019-12-13 国际商业机器公司 使用深度学习的图像联合配准和分割
CN111738946A (zh) * 2020-06-16 2020-10-02 新疆大学 一种沙尘降质图像的增强方法及装置
CN112070693A (zh) * 2020-08-27 2020-12-11 西安理工大学 一种基于灰度世界自适应网络的单幅沙尘图像恢复方法
WO2022067668A1 (zh) * 2020-09-30 2022-04-07 中国科学院深圳先进技术研究院 基于视频图像目标检测的火灾检测方法、系统、终端以及存储介质
CN114220024A (zh) * 2021-12-22 2022-03-22 内蒙古自治区气象信息中心(内蒙古自治区农牧业经济信息中心)(内蒙古自治区气象档案馆) 基于深度学习的静止卫星沙尘暴识别方法
CN114882373A (zh) * 2022-03-29 2022-08-09 内蒙古工业大学 基于深度神经网络的多特征融合沙尘暴预测方法
CN115205141A (zh) * 2022-06-16 2022-10-18 北京航空航天大学 一种火星遥感图像增强方法与装置

Also Published As

Publication number Publication date
CN117132752B (zh) 2024-02-02

Similar Documents

Publication Publication Date Title
Liu et al. Trident dehazing network
CN111507909A (zh) 一种有雾图像清晰化的方法、装置及存储介质
CN111861901A (zh) 一种基于gan网络的边缘生成图像修复方法
CN113450290B (zh) 基于图像修补技术的低照度图像增强方法及系统
CN112465727A (zh) 基于HSV色彩空间和Retinex理论的无正常光照参考的低照度图像增强方法
CN111179196B (zh) 一种基于分而治之的多分辨率深度网络图像去高光方法
Das et al. A comparative study of single image fog removal methods
CN115880177A (zh) 聚合上下文和增强细节的全分辨率低照度图像增强方法
Yeh et al. Single image dehazing via deep learning-based image restoration
CN115131229A (zh) 图像降噪、滤波数据处理方法、装置和计算机设备
Pandey et al. A fast and effective vision enhancement method for single foggy image
Yang et al. Joint image dehazing and super-resolution: Closed shared source residual attention fusion network
Babu et al. An efficient image dahazing using Googlenet based convolution neural networks
Tan et al. Low-light image enhancement with geometrical sparse representation
CN112489103B (zh) 一种高分辨率深度图获取方法及系统
CN113628143A (zh) 一种基于多尺度卷积的加权融合图像去雾方法及装置
Holla et al. EFID: edge-focused image denoising using a convolutional neural network
CN117611467A (zh) 一种能同时平衡不同区域细节和亮度的低光图像增强方法
CN117132752B (zh) 基于多维度加权的沙尘图像增强方法、装置、设备及介质
CN117196940A (zh) 一种基于卷积神经网络的适用于真实场景图像的超分辨率重构方法
Jin et al. Color correction and local contrast enhancement for underwater image enhancement
Banerjee et al. Bacterial foraging-fuzzy synergism based image Dehazing
Tao et al. LEGAN: A low-light image enhancement generative adversarial network for industrial internet of smart-cameras
CN115272131B (zh) 基于自适应多光谱编码的图像去摩尔纹系统及方法
CN116703750A (zh) 基于边缘注意力和多阶微分损失的图像去雾方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant