CN112381723A - 一种轻量高效的单幅图像去烟雾方法 - Google Patents

一种轻量高效的单幅图像去烟雾方法 Download PDF

Info

Publication number
CN112381723A
CN112381723A CN202010997199.5A CN202010997199A CN112381723A CN 112381723 A CN112381723 A CN 112381723A CN 202010997199 A CN202010997199 A CN 202010997199A CN 112381723 A CN112381723 A CN 112381723A
Authority
CN
China
Prior art keywords
smoke
network
formula
image
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010997199.5A
Other languages
English (en)
Other versions
CN112381723B (zh
Inventor
陆文凯
吴静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202010997199.5A priority Critical patent/CN112381723B/zh
Publication of CN112381723A publication Critical patent/CN112381723A/zh
Application granted granted Critical
Publication of CN112381723B publication Critical patent/CN112381723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10068Endoscopic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20016Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种单幅图像去烟雾的方法,该方法基于烟雾形成的物理模型,利用轻量高效的神经网络设计了基本的编码器(Encoder)网络,再将编码网络输出的隐空间特征应用解码器(Decoder)网络解码,得到物理模型中传输介质参数,同时还将隐空间特征输入到了估计大气光照的回归器中,得到大气光照参数。将上一步得到的传输介质参数再输入到设计的金字塔网络中,进而估计出更加准确的传输介质参数。最后将所估计出的传输介质参数和大气光照参数代入到烟雾退化的物理公式中,得到去烟/雾的图像。

Description

一种轻量高效的单幅图像去烟雾方法
技术领域
本发明涉及一种基于轻量化高效率深度卷积神经网络的单幅图像去烟雾方法,属于计算 机视觉领域。
背景技术
烟雾的产生,会极大地吸收光线,从而降低成像系统的成像质量,影响后续计算机视觉 任务的性能,如语义分割、目标追踪、目标检测等等。图像去烟/雾技术被广泛地认为是一种 病态图像恢复和图像增强的问题,有诸多挑战需要克服,其应用领域也非常广泛。现有许多 的应用场景,不仅要求去烟/雾算法模型有良好的去烟/雾效果,更要求其轻量化,高效率,如 视频监控、自动驾驶、外科手术等等。轻量化去烟/雾模型,提高模型的运行效率,扩宽了模 型的应用场合,降低了模型对终端设备的要求。设计轻量化去烟/雾模型的难点在于,在不损 失或者轻微损失模型性能的情况下,通过有限的模型复杂度和计算量,达到良好的去烟/雾效 果,从而为后续的计算机视觉任务提供高质量的数据,节省宝贵的计算资源。
现有的去烟雾模型主要分为两类:1)基于先验知识的方法;2)基于学习的方法。基于 先验知识的方法主要利用统计学工具,观察统计出烟雾图像或清晰图像的某些规律,从而估 计恢复出原始的清晰图像,如颜色线法(参见Fattal R.Dehazing using color-lines[J].ACM transactions on graphics(TOG),2014,34(1):1-14)、暗通道法(参见HeK,Sun J,Tang X.Single image haze removal using dark channel prior[J].IEEEtransactions on pattern analysis and machine intelligence,2010,33(12):2341-2353)、块对比度(参见Tang K,Yang J,Wang J.Investigating haze-relevant featuresin a learning framework for image dehazing[C]//Proceedings of the IEEEconference on computer vision and pattern recognition.2014:2995-3000)最大等等。暗通道是简 单,效果较好的经典去雾方法,它观察统计发现,清晰RGB图像三个通道最小的像素值接近 0,利用此规律,估计出大气模型中的传输介质(Transmission)参数,最后恢复出清晰的图 像。深度卷积神经网络(CNN)在诸多计算机视频任务中表现出了优越的性能,同样,CNN 逐渐成为图像去烟/雾领域的主要研究算法。有一部分模型基于大气物理模型,估计其传输介 质参数(参见Cai B,Xu X,Jia K,et al.Dehazenet:An end-to-endsystem for single image haze removal[J].IEEE Transactions on ImageProcessing,2016,25(11):5187-5198)或者同时估计传输 介质参数和大气光照参数(参见Zhang H,Patel V M.Densely connected pyramid dehazing network[C]//Proceedingsof the IEEE conference on computer vision and pattern recognition.2018: 3194-3203),再利用大气模型公式恢复出原始的清晰图像数据。有的模型将这两个参数合并 为一个参数,然后设计一个端到端的轻量化CNN(AODNet,参见Li B,Peng X,Wang Z,et al.Aod-net:All-in-one dehazing network[C]//Proceedings of the IEEE internationalconference on computer vision.2017:4770-4778)估计这个参数。另外还有一些模型完全基于数据驱动的方 法,直接从烟雾图像中估计清晰图像(参见Qu Y,Chen Y,Huang J,etal.Enhanced pix2pix dehazing network[C]//Proceedings of the IEEE Conferenceon Computer Vision and Pattern Recognition.2019:8160-8168、Shao Y,Li L,Ren W,et al.Domain Adaptation for Image Dehazing[C]//Proceedings of the IEEE/CVFConference on Computer Vision and Pattern Recognition.2020:2808-2817)。
上述基于学习方法的去烟雾模型在某些数据集上都取得了不错的去雾效果,但是它们却 需要进行大量计算,无法满足实时去烟/雾的需求。虽然AODNet是一个轻量化网络,但是它 在高清图像上的仍然难以实时运行,此外,它性能的还有待提高。设计轻量化高效率的神经 网络目前有2类主流的方法:1)压缩模型,其中模型量化技术(Jacob B,KligysS,Chen B,et al.Quantization and training of neural networks for efficientinteger-arithmetic-only inference[C]//Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition. 2018:2704-2713.)最为常见;2)设计更加高效的卷积神经网络结构,如SqueezeNet(参见Forrest N I,Song H,Matthew V M,etal.SqueezeNet:AlexNet-level accuracy with 50x fewer parameters and<0.5 MBmodel size[C]//ICLR′17 conference proceedings.2017:207-212)、 MobileNet(参见Howard A,Sandler M,Chu G,et al.Searching for mobilenetv3[C]//Proceedings ofthe IEEE International Conference on Computer Vision.2019:1314-1324)等。现有的去烟/雾模 型,鲜有利用这2类技术来提高模型的效率和性能,在高清图像数据上,无法同时达到实时 运行和良好的去烟雾效果。本发明基于大气物理模型和,利用设计高效的卷积神经网络结构 的技术,设计了一种轻量高效的去烟雾卷积神经网络模型,它的参数量小,运算量低,泛化 性能好,去烟/去雾效果良好。本发明模型可以方便地嵌入到其它计算机视觉任务中,仅占用 极少的计算资源,却可以为后续任务提供高质量的数据。
发明目的
本发明的目的是实现一种高效的去烟雾算法模型,该方法可以在高清图像上实时去烟/雾, 并且达到较为先进的去烟雾的效果。
发明内容
本发明提供了一种单幅图像去烟雾的方法,包括以下步骤:
步骤S1:构建烟雾形成的大气物理模型,推导出烟雾退化公式;
步骤S2:基于神经网络设计编码器网络,再将编码网络输出的隐空间特征应用解码器网 络解码,得到物理模型中传输介质参数,同时还将隐空间特征输入到了估计大气光照的回归 器中,得到大气光照参数,具体为选取包含传输介质参数、大气光照参数、有烟雾-清晰图像 对的数据集,将烟雾图像输入出编码器,得到隐空间特征,再分别输入解码器和回归器,分 别得到传输介质参数和大气光照参数;
步骤S3:将步骤S2中得到的传输介质参数再输入到金字塔网络,估计出更加准确的传 输介质参数,再将该传输介质参数和步骤S2中所得到的大气光照参数代入步骤S1中所述的 烟雾退化的物理公式,得到清晰的图像;
步骤S4:将步骤S2、S3中所得到的2个传输介质参数、大气光照参数和清晰图像分别 与步骤S2中所述的数据集中的真实值计算合适的损失函数,训练神经网络,直到在验证集中 效果可以接受;
步骤S5:将实际的烟雾数据输入到步骤S4中已训练好的网络中,并利用烟雾退化的物 理公式,得到去烟/雾图像。
进一步地,所述烟雾形成的大气物理模型的数学公式如式(1)所示:
I(x)=J(x)t(x)+A(1-t(x)) (1)
其中,I(x)表示有烟雾的图像,其中J(x)表清晰的无烟雾图像,t(x)表示传输介质参数,A 表示全局大气光照;所述烟雾退化公式如式(2)所示:
Figure BDA0002692948490000041
附图说明
图1是实现本发明的方法流程图。
图2是初步估计的传输介质参数和大气光照参数网络结构示意图。
图3是利用金字塔结构进一步估计传输介质参数网络结构示意图。
图4是合成数据集中的自然图像上的有雾图像和去雾图像的对比图:(1)有雾图像;(2)去 雾图像;(3)真实图像;(4)网络估计的传输介质参数(RGB的图像分别用RGB三个通道显示)。
图5是实际的外科手术内窥镜图像去烟对比图:(1)有雾图像;(2)去雾图像;(3)真实图像; (4)网络估计的传输介质参数。(RGB的图像分别用RGB三个通道显示)
图6是SOTS数据集实际数据去雾前后对比图:其中(1)实际有雾图像;(2)去雾图像。(RGB 的图像分别用RGB三个通道显示)
图7外科手术内窥镜视频数据去烟对比图。(RGB的图像分别用RGB三个通道显示)
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。
本发明所述去除烟雾的方法的整体流程如图1所示,由3部分组成:传输介质参数初步 估计网络(Coarse Block)、传输介质参数进一步估计网络(Fine Block)和大气光照参数回归 网络(Regressor)。
烟雾形成的大气物理模型数学公式如式(1)所示:
I(x)=J(x)t(x)+A(1-t(x)) (1)
I(x)表示有烟雾的图像,其中J(x)表清晰的无烟雾图像,t(x)表示传输介质参数,A表示全 局大气光照。利用式(1)推导出烟雾退化公式如式(2)所示:
Figure BDA0002692948490000051
去除烟雾的过程主要包括以下步骤:
步骤一、构建初步的卷积神经网络(Coarse Block),估计式(2)中的t(x)和A。
具体如图2所示。为了减少网络的计算,采用编码器-解码器(Encoder-Decoder)卷积 神经网络结构,在编码器部分,采用步长大于1的空洞卷积运算实现特征图的下采样。由于 此网络结构中步长设置较大,为保证下采样的特征图的信息量损失最小,同时不增加网络模 型的参数,采用空洞卷积(Dilated Convolution)作为解码器的卷积模块。记卷积运算为
Figure BDA0002692948490000052
其中xi表示第i层的特征图,c表示卷积输出通道数,e表示输入通道数,k表 示卷积核的大小为k2,s为卷积运算的步长,p为像素填充,d为空洞卷积的膨胀系数。编码 器的每一层都采用ReLU激活函数,解码器的中间层也采用ReLU激活函数,最后一层使用Tanh激活函数,估计A的回归网络也解码器的激活函数配置相同,ReLU和Tanh数学公式如式(3)、式(4)所示:
ReLU(x)=max(0,x) (3)
Figure BDA0002692948490000053
输入编码器网络的RGB烟雾图像记为x0,编码器网络的运算过程如下式(5)所示:
Figure BDA0002692948490000054
编码器输出的特征图x3即为隐空间特征z,再输入解码器网络估计
Figure BDA0002692948490000055
其运算过 程如式(6)所示:
Figure BDA0002692948490000056
上式中Hi(x)表示对特征图x最近邻上采样i倍,[xi;xj]表示特征图xi和xj在通道维度上拼 接。
将式(5)得到的隐空间特征z输入到估计A的回归网络中,其运算过程如式(7)所示:
Figure BDA0002692948490000061
上式中
Figure BDA0002692948490000062
表示回归网络的第i个特征图;Pooli(x)表示步长为i,核大小为i的平均池化运算;
Figure BDA0002692948490000063
表示将特征图平均池化到i×i的大小。
步骤二、构建精炼传输介质参数
Figure BDA0002692948490000064
的金字塔网络(Fine Block),估计出更为准确的 传输介质参数
Figure BDA0002692948490000065
如图3所示,在基于物理模型的去雾网络模型中,t(x)对图像去烟/雾的质量有着决定性 的作用,估计出准确的t(x),可以更加准确地还原清晰图像。步骤一中获得的
Figure BDA0002692948490000066
还包 含了许多原始图像的信息,因此可以设计一个金字塔的网络结构,在不同尺度 (1/2,1/4,1/8)上提取
Figure BDA0002692948490000067
的信息,过滤掉原始图像的干扰信息,从而估计出更为准确的
Figure BDA0002692948490000068
其运算过程如式(8)所示:
Figure BDA0002692948490000069
式中H-i(x)表示对特征图x平均池化i倍,Pi表示1/i尺度下的特征图,当i=0时,表示原尺 度。由式(8)得到不同尺度的特征图像后,以通道顺序进行拼接,然后分成3组,进行分组卷 积运算,最后再通过普通的卷积,得到最终的
Figure BDA00026929484900000610
其计算过程如式(9)所示:
Figure BDA00026929484900000611
上式C[Pi;Pj]表示将Pi,Pj按通道顺序拼接,记
Figure BDA00026929484900000612
那么
Figure BDA00026929484900000613
Figure BDA00026929484900000614
表示分组卷积,其中xi表示第i层的 特征图,c表示卷积输出通道数,e表示输入通道数,k表示卷积核的大小为k2,s为卷积运 算的步长,p为像素填充,g为分组卷积的分组数,其中e和c都必须为g的整数倍。
最后将
Figure BDA0002692948490000071
和步骤一中所得到的估计A,即
Figure BDA0002692948490000072
代入到式(2),计算出清晰的图像
Figure BDA0002692948490000073
如式(10)所示:
Figure BDA0002692948490000074
步骤三、以均方根误差损失(MSE Loss)作为训练网络的目标函数,采用反向传播算法 更新网络参数,其优化目标如式(11)所示:
Figure BDA0002692948490000075
式中θc,θr,θf分别为Coarse Block,Regressor、Fine Block的网络权重。λi为手动设定的系数, λ1=0.3,λ2=0.3,λ3=0.3,λ4=0.1。训练过程中,在验证集上加以验证,直到在验证 集中效果可以接受。
步骤四、神经网络训练完成后,将烟雾图像数据输入到神经网络中,在网络的输出端得 到
Figure BDA0002692948490000076
Figure BDA0002692948490000077
再将这两个参数代入式(10),得到最终的去烟/雾图像
Figure BDA0002692948490000078
实施例1
为了验证本发明的去烟雾的高效性与先进性,将本发明所提出的网络模型在自然图像的 室内数据集上训练,然后分别应用于自然图像的室内数据、室外数据以及外科手术内窥镜高 清视频数据,以展示本发明中轻量化高效率深度卷积神经网络模型高效实时去烟/雾的效果。
本实施例以Python语言实现(版本号:3.7.6),其中的深度卷积神经网络利用Pytorch(版 本号:1.5.1)框架搭建。训练和测试所使用的操作系统为Linux系统(Ubuntu18.04 LTS,内 核版本号:4.15.0)。机器配置为:CPU型号:Intel(R)Core(TM)i9-10920XCPU@3.50GHz; 内存大小:96G;GPU型号:GeForce GTX 2080Ti。
首先,采用RESIDE数据集(参见Li B,Ren W,Fu D,et al.Benchmarking single-image dehazing and beyond[J].IEEE Transactions on Image Processing,2018,28(1):492-505)的室内数 据ITS_v2子集作为本发明网络的训练集和验证集,网络模型在训练集完成后,如图4、5所 示,在SOTS子集(合成数据集,包含了室内数据集和室外数据集)上进行测试,并计算了 常见的图像质量评价指标PSNR和SSIM(参见 https://scikit- image.org/docs/stable/api/skimage.metrics.html#skimage.metrics.structural_ similarity )。此外,如图5所示,在HSTS的实际数据集进行了测试。从表1和表2可以看出,本发明 方法在ITS_v2数据集上,取得了先进的去雾效果,并且运算量(GFLOPs,以图像大小为 1920x1080x3作为输入计算),仅有当前先进的轻量化网络的1/6,验证了本发明先进高效的 去雾性能。
表1SOTS数据集室内(Indoor)和室外(Outdoor)的PSNR/SSIM评价指标对比
Figure RE-GDA0002848694200000081
表2 SOTS数据集综合PSNR/SSIM/Params/GFLOPs评价指标对比
Figure RE-GDA0002848694200000082
表3内窥镜视频FPS和盲图像质量评价指标对比
Figure RE-GDA0002848694200000083
为了验证本发明良好的泛化性能,以及高清图像上达到了实时去雾的效果,在外科手 术内窥镜视频数据上测试本发明网络,该视频数据帧为RGB图像,分辨率为1920x1080, 去烟对比结果如图7所示。由于内窥镜视频数据没有标签,不能用PSNR/SSIM来评价去雾 结果,而是使用2种常见的盲图像质量评价指标,NIQE(参见Mittal A,Soundararajan R, Bovik A C.Making a“completely blind”image quality analyzer[J].IEEE Signal processing letters,2012,20(3):209-212)是自然图像上一个评价指标,它指示图像是否自然,其值越低, 图像质量越高;FADE(参见Choi L K,You J,Bovik AC.Referenceless prediction of perceptual fog density and perceptual imagedefogging[J].IEEE Transactions on Image Processing,2015, 24(11):3888-3901)是评价图像是否存在烟雾,它指示图像的烟雾程度,其值越低,图像的 烟雾越少。如表3所示,本发明网络在这两个指标上都取得了不错的结果,其中去烟雾效 果比其它两种方法更好,但是在图像的自然程度上略逊于DCPDN。此外,还对比了每秒处 理的帧数(FPS)指标,表3中的FPS1计算过程包括数据从CPU到GPU去雾,再传输到 CPU,比较符合实际应用情况,FPS2计算过程仅包括数据在GPU上去雾,再传输到CPU, 它更能比较出各个模型的际运算速度。
本发明的优点是,网络的参数量极少,泛化性能好,计算效率高,对运行设备要求低。 在高清图像上也可以实时运行,并且能够达到先进的去烟/雾效果。同时本发明也可以方便地 嵌入到其它计算机视觉任务中,为这些任务提供高质量的数据,同时仅占用极少的计算资源。

Claims (7)

1.一种单幅图像去烟雾的方法,其特征在于,包括以下步骤:
步骤S1:构建烟雾形成的大气物理模型,推导出烟雾退化公式;
步骤S2:基于神经网络设计编码器网络,再将编码网络输出的隐空间特征应用解码器网络解码,得到物理模型中传输介质参数,同时还将隐空间特征输入到了估计大气光照的回归器中,得到大气光照参数,具体为选取包含传输介质参数、大气光照参数、有烟雾-清晰图像对的数据集,将烟雾图像输入出编码器,得到隐空间特征,再分别输入解码器和回归器,分别得到传输介质参数和大气光照参数;
步骤S3:将步骤S2中得到的传输介质参数再输入到金字塔网络,估计出更加准确的传输介质参数,再将该传输介质参数和步骤S2中所得到的大气光照参数代入步骤S1中所述的烟雾退化的物理公式,得到清晰的图像;
步骤S4:将步骤S2、S3中所得到的2个传输介质参数、大气光照参数和清晰图像分别与步骤S2中所述的数据集中的真实值计算合适的损失函数,训练神经网络,直到在验证集中效果可以接受;
步骤S5:将实际的烟雾数据输入到步骤S4中已训练好的网络中,并利用烟雾退化的物理公式,得到去烟/雾图像。
2.根据权利要求1所述单幅图像去烟雾的方法,其特征在于,所述烟雾形成的大气物理模型的数学公式如式(1)所示:
I(x)=J(x)t(x)+A(-t(x)) (1)
其中,I(x)表示有烟雾的图像,其中J(x)表清晰的无烟雾图像,t(x)表示传输介质参数,A表示全局大气光照;所述烟雾退化公式如式(2)所示:
Figure FDA0002692948480000021
3.根据权利要求2所述单幅图像去烟雾的方法,其特征在于,所述步骤S2进一步包括构建初步的卷积神经网络,估计式中的t(x)和A,所述卷积神经网络为编码器一解码器卷积神经网络结构,在编码器部分,采用步长大于1的空洞卷积运算实现特征图的下采样。
4.根据权利要求3所述单幅图像去烟雾的方法,其特征在于,记所述空洞卷积运算为
Figure FDA0002692948480000022
其中xi表示第i层的特征图,c表示卷积输出通道数,e表示输入通道数,k表示卷积核的大小为k2,s为卷积运算的步长,p为像素填充,d为空洞卷积的膨胀系数;所述编码器的每一层都采用ReLU激活函数,所述解码器的中间层也采用ReLU激活函数,最后一层使用Tanh激活函数,估计A的回归网络与解码器的激活函数配置相同,ReLU和Tanh数学公式如式(3)、式(4)所示:
ReLU(x)=max(0,x) (1),
Figure FDA0002692948480000023
将输入编码器网络的RGB烟雾图像记为x0,则编码器网络的运算过程如下式(5)所示:
Figure FDA0002692948480000031
编码器输出的特征图x3即为隐空间特征z,再输入解码器网络估计
Figure FDA0002692948480000032
其运算过程如式(6)所示:
Figure FDA0002692948480000033
其中,Hi(x)表示对特征图x最近邻上采样i倍,[xi;xj]表示特征图xi和xj在通道维度上拼接;
将式(3)得到的隐空间特征z输入到估计A的回归网络中,其运算过程如式(7)所示:
Figure FDA0002692948480000034
其中
Figure FDA0002692948480000035
表示回归网络的第i个特征图,Pooli(x)表示步长为i、核大小为i的平均池化运算,
Figure FDA0002692948480000036
表示将特征图平均池化到i×i的大小,所得到的估计A记作
Figure FDA0002692948480000037
5.根据权利要求4所述单幅图像去烟雾的方法,其特征在于,所述步骤S3进一步包括:
构建传输介质参数
Figure RE-FDA0002898457970000037
的金字塔网络,估计出更准确的传输介质参数
Figure RE-FDA0002898457970000038
具体运算过程如式(8)所示:
Figure RE-FDA0002898457970000039
式中H-i(x)表示对特征图x平均池化i倍,Pi表示1/i尺度下的特征图,当i=0 时,表示原尺度;
由式(6)得到不同尺度的特征图像后,以通道顺序进行拼接,然后分成3组,进行分组卷积运算,再通过普通的卷积,得到最终的
Figure RE-FDA0002898457970000041
其计算过程如式(9)所示:
Figure RE-FDA0002898457970000042
式中,C[Pi;Pj]表示将Pi,Pj按通道顺序拼接,记
Figure RE-FDA0002898457970000043
Figure RE-FDA0002898457970000044
Figure RE-FDA0002898457970000045
Figure RE-FDA0002898457970000046
表示分组卷积,其中xi表示第i层的特征图,c表示卷积输出通道数,e表示输入通道数,k表示卷积核的大小为k2,s为卷积运算的步长,p为像素填充,g为分组卷积的分组数,其中e和c都必须为g的整数倍;
Figure RE-FDA0002898457970000047
和第(1)步得到的
Figure RE-FDA0002898457970000048
代入到式,计算出清晰的图像
Figure RE-FDA0002898457970000049
如式(10)所示:
Figure RE-FDA00028984579700000410
6.根据权利要求5所述单幅图像去烟雾的方法,其特征在于,所述步骤S4进一步包括:以均方根误差损失作为训练网络的目标函数,采用反向传播算法更新网络参数,其优化目标如式(11)所示:
Figure FDA00026929484800000412
式中θc,θr,θf分别为传输介质参数初步估计网络、大气光照参数回归网络和传输介质参数进一步估计网络和的网络权重;λi为手动设定的系数,λ1=0.3,λ2=0.3,λ3=0.3,λ4=0.1;训练过程中,在验证集上加以验证,直到在验证集中效果可以接受。
7.根据权利要求6所述单幅图像去烟雾的方法,其特征在于,所述步骤S5进一步包括:
神经网络训练完成后,将烟雾图像数据输入到神经网络中,在神经网络的输出端得到
Figure FDA0002692948480000051
Figure FDA0002692948480000052
再将这两个参数代入式(8),得到最终的去烟雾图像
Figure FDA0002692948480000053
CN202010997199.5A 2020-09-21 2020-09-21 一种轻量高效的单幅图像去烟雾方法 Active CN112381723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010997199.5A CN112381723B (zh) 2020-09-21 2020-09-21 一种轻量高效的单幅图像去烟雾方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010997199.5A CN112381723B (zh) 2020-09-21 2020-09-21 一种轻量高效的单幅图像去烟雾方法

Publications (2)

Publication Number Publication Date
CN112381723A true CN112381723A (zh) 2021-02-19
CN112381723B CN112381723B (zh) 2023-06-30

Family

ID=74586139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010997199.5A Active CN112381723B (zh) 2020-09-21 2020-09-21 一种轻量高效的单幅图像去烟雾方法

Country Status (1)

Country Link
CN (1) CN112381723B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113887473A (zh) * 2021-10-15 2022-01-04 中国海洋大学 一种基于改进的规范化可变形卷积人群计数方法
CN115063304A (zh) * 2022-05-19 2022-09-16 湖南师范大学 一种基于端到端的多尺寸融合的金字塔神经网络图像去雾方法及系统
CN116129379A (zh) * 2022-12-28 2023-05-16 国网安徽省电力有限公司芜湖供电公司 一种雾天环境下的车道线检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648160A (zh) * 2018-05-14 2018-10-12 中国农业大学 一种水下海参图像去雾增强方法及系统
AU2020100274A4 (en) * 2020-02-25 2020-03-26 Huang, Shuying DR A Multi-Scale Feature Fusion Network based on GANs for Haze Removal
CN110930320A (zh) * 2019-11-06 2020-03-27 南京邮电大学 一种基于轻量化卷积神经网络的图像去雾方法
CN111192219A (zh) * 2020-01-02 2020-05-22 南京邮电大学 一种基于改进的逆大气散射模型卷积网络的图像去雾方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648160A (zh) * 2018-05-14 2018-10-12 中国农业大学 一种水下海参图像去雾增强方法及系统
CN110930320A (zh) * 2019-11-06 2020-03-27 南京邮电大学 一种基于轻量化卷积神经网络的图像去雾方法
CN111192219A (zh) * 2020-01-02 2020-05-22 南京邮电大学 一种基于改进的逆大气散射模型卷积网络的图像去雾方法
AU2020100274A4 (en) * 2020-02-25 2020-03-26 Huang, Shuying DR A Multi-Scale Feature Fusion Network based on GANs for Haze Removal

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HE ZHANG等: "Densely Connected Pyramid Dehazing Network", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
SHIBAI YIN等: "A Novel Residual Dense Pyramid Network for Image Dehazing", 《ENTROPY》 *
任敏敏: "图像融合的循环神经网络去雾算法", 《小型微型计算机系统》 *
宋佳怡等: "融合暗通道滤波和空间金字塔的图像去雾算法", 《信号处理》 *
陈清江等: "基于全卷积神经网络的图像去雾算法", 《应用光学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113887473A (zh) * 2021-10-15 2022-01-04 中国海洋大学 一种基于改进的规范化可变形卷积人群计数方法
CN113887473B (zh) * 2021-10-15 2024-04-26 中国海洋大学 一种基于改进的规范化可变形卷积人群计数方法
CN115063304A (zh) * 2022-05-19 2022-09-16 湖南师范大学 一种基于端到端的多尺寸融合的金字塔神经网络图像去雾方法及系统
CN115063304B (zh) * 2022-05-19 2023-08-25 湖南师范大学 一种多尺寸融合的金字塔神经网络图像去雾方法及系统
CN116129379A (zh) * 2022-12-28 2023-05-16 国网安徽省电力有限公司芜湖供电公司 一种雾天环境下的车道线检测方法
CN116129379B (zh) * 2022-12-28 2023-11-07 国网安徽省电力有限公司芜湖供电公司 一种雾天环境下的车道线检测方法

Also Published As

Publication number Publication date
CN112381723B (zh) 2023-06-30

Similar Documents

Publication Publication Date Title
CN112381723A (zh) 一种轻量高效的单幅图像去烟雾方法
CN111784602B (zh) 一种生成对抗网络用于图像修复的方法
WO2020015330A1 (zh) 基于增强的神经网络的图像复原方法、存储介质及系统
CN111739082B (zh) 一种基于卷积神经网络的立体视觉无监督深度估计方法
CN108734661B (zh) 基于图像纹理信息构建损失函数的高分辨率图像预测方法
CN108805839A (zh) 基于卷积神经网络的联合估计图像去雾方法
CN107123091A (zh) 一种基于深度学习的近红外人脸图像超分辨率重建方法
CN109859166B (zh) 一种基于多列卷积神经网络的无参3d图像质量评估方法
CN111901532B (zh) 基于循环神经网络迭代策略的视频稳定方法
CN111986108A (zh) 一种基于生成对抗网络的复杂海空场景图像去雾方法
CN114897742B (zh) 一种纹理和结构特征两次融合的图像修复方法
CN111553856B (zh) 基于深度估计辅助的图像去雾方法
Fan et al. Multiscale cross-connected dehazing network with scene depth fusion
Li et al. Single image dehazing via region adaptive two-shot network
CN113992920A (zh) 一种基于深度展开网络的视频压缩感知重建方法
CN117252782A (zh) 基于条件去噪扩散和掩膜优化的图像修复方法
CN114821368B (zh) 一种基于强化学习和Transformer的电力缺陷检测方法
CN115587967B (zh) 一种基于HA-UNet网络的眼底图像视盘检测方法
CN116524402A (zh) 基于多头自注意力的多时间跨度上下文建模动作识别方法
CN116309170A (zh) 一种输电线路巡检图像去雾方法和装置
CN116468625A (zh) 基于金字塔高效通道注意力机制的单幅图像去雾方法和系统
CN116310871A (zh) 融合空洞空间金字塔池化的内陆水体提取方法
Wang et al. How Powerful Potential of Attention on Image Restoration?
CN114140334A (zh) 一种基于改进生成对抗网络的复杂煤矿图像去雾方法
CN110222716B (zh) 基于全分辨率深度卷积神经网络的图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant