CN112381723A - 一种轻量高效的单幅图像去烟雾方法 - Google Patents
一种轻量高效的单幅图像去烟雾方法 Download PDFInfo
- Publication number
- CN112381723A CN112381723A CN202010997199.5A CN202010997199A CN112381723A CN 112381723 A CN112381723 A CN 112381723A CN 202010997199 A CN202010997199 A CN 202010997199A CN 112381723 A CN112381723 A CN 112381723A
- Authority
- CN
- China
- Prior art keywords
- smoke
- network
- formula
- image
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000000779 smoke Substances 0.000 claims abstract description 69
- 230000005540 biological transmission Effects 0.000 claims abstract description 37
- 238000005286 illumination Methods 0.000 claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 230000015556 catabolic process Effects 0.000 claims abstract description 10
- 238000006731 degradation reaction Methods 0.000 claims abstract description 10
- 108091006146 Channels Proteins 0.000 claims description 22
- 230000000694 effects Effects 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 16
- 238000013527 convolutional neural network Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 10
- 238000012795 verification Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000011176 pooling Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 2
- 238000013461 design Methods 0.000 abstract description 5
- 238000012545 processing Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000013441 quality evaluation Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005057 refrigeration Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10068—Endoscopic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种单幅图像去烟雾的方法,该方法基于烟雾形成的物理模型,利用轻量高效的神经网络设计了基本的编码器(Encoder)网络,再将编码网络输出的隐空间特征应用解码器(Decoder)网络解码,得到物理模型中传输介质参数,同时还将隐空间特征输入到了估计大气光照的回归器中,得到大气光照参数。将上一步得到的传输介质参数再输入到设计的金字塔网络中,进而估计出更加准确的传输介质参数。最后将所估计出的传输介质参数和大气光照参数代入到烟雾退化的物理公式中,得到去烟/雾的图像。
Description
技术领域
本发明涉及一种基于轻量化高效率深度卷积神经网络的单幅图像去烟雾方法,属于计算 机视觉领域。
背景技术
烟雾的产生,会极大地吸收光线,从而降低成像系统的成像质量,影响后续计算机视觉 任务的性能,如语义分割、目标追踪、目标检测等等。图像去烟/雾技术被广泛地认为是一种 病态图像恢复和图像增强的问题,有诸多挑战需要克服,其应用领域也非常广泛。现有许多 的应用场景,不仅要求去烟/雾算法模型有良好的去烟/雾效果,更要求其轻量化,高效率,如 视频监控、自动驾驶、外科手术等等。轻量化去烟/雾模型,提高模型的运行效率,扩宽了模 型的应用场合,降低了模型对终端设备的要求。设计轻量化去烟/雾模型的难点在于,在不损 失或者轻微损失模型性能的情况下,通过有限的模型复杂度和计算量,达到良好的去烟/雾效 果,从而为后续的计算机视觉任务提供高质量的数据,节省宝贵的计算资源。
现有的去烟雾模型主要分为两类:1)基于先验知识的方法;2)基于学习的方法。基于 先验知识的方法主要利用统计学工具,观察统计出烟雾图像或清晰图像的某些规律,从而估 计恢复出原始的清晰图像,如颜色线法(参见Fattal R.Dehazing using color-lines[J].ACM transactions on graphics(TOG),2014,34(1):1-14)、暗通道法(参见HeK,Sun J,Tang X.Single image haze removal using dark channel prior[J].IEEEtransactions on pattern analysis and machine intelligence,2010,33(12):2341-2353)、块对比度(参见Tang K,Yang J,Wang J.Investigating haze-relevant featuresin a learning framework for image dehazing[C]//Proceedings of the IEEEconference on computer vision and pattern recognition.2014:2995-3000)最大等等。暗通道是简 单,效果较好的经典去雾方法,它观察统计发现,清晰RGB图像三个通道最小的像素值接近 0,利用此规律,估计出大气模型中的传输介质(Transmission)参数,最后恢复出清晰的图 像。深度卷积神经网络(CNN)在诸多计算机视频任务中表现出了优越的性能,同样,CNN 逐渐成为图像去烟/雾领域的主要研究算法。有一部分模型基于大气物理模型,估计其传输介 质参数(参见Cai B,Xu X,Jia K,et al.Dehazenet:An end-to-endsystem for single image haze removal[J].IEEE Transactions on ImageProcessing,2016,25(11):5187-5198)或者同时估计传输 介质参数和大气光照参数(参见Zhang H,Patel V M.Densely connected pyramid dehazing network[C]//Proceedingsof the IEEE conference on computer vision and pattern recognition.2018: 3194-3203),再利用大气模型公式恢复出原始的清晰图像数据。有的模型将这两个参数合并 为一个参数,然后设计一个端到端的轻量化CNN(AODNet,参见Li B,Peng X,Wang Z,et al.Aod-net:All-in-one dehazing network[C]//Proceedings of the IEEE internationalconference on computer vision.2017:4770-4778)估计这个参数。另外还有一些模型完全基于数据驱动的方 法,直接从烟雾图像中估计清晰图像(参见Qu Y,Chen Y,Huang J,etal.Enhanced pix2pix dehazing network[C]//Proceedings of the IEEE Conferenceon Computer Vision and Pattern Recognition.2019:8160-8168、Shao Y,Li L,Ren W,et al.Domain Adaptation for Image Dehazing[C]//Proceedings of the IEEE/CVFConference on Computer Vision and Pattern Recognition.2020:2808-2817)。
上述基于学习方法的去烟雾模型在某些数据集上都取得了不错的去雾效果,但是它们却 需要进行大量计算,无法满足实时去烟/雾的需求。虽然AODNet是一个轻量化网络,但是它 在高清图像上的仍然难以实时运行,此外,它性能的还有待提高。设计轻量化高效率的神经 网络目前有2类主流的方法:1)压缩模型,其中模型量化技术(Jacob B,KligysS,Chen B,et al.Quantization and training of neural networks for efficientinteger-arithmetic-only inference[C]//Proceedings of the IEEE Conference onComputer Vision and Pattern Recognition. 2018:2704-2713.)最为常见;2)设计更加高效的卷积神经网络结构,如SqueezeNet(参见Forrest N I,Song H,Matthew V M,etal.SqueezeNet:AlexNet-level accuracy with 50x fewer parameters and<0.5 MBmodel size[C]//ICLR′17 conference proceedings.2017:207-212)、 MobileNet(参见Howard A,Sandler M,Chu G,et al.Searching for mobilenetv3[C]//Proceedings ofthe IEEE International Conference on Computer Vision.2019:1314-1324)等。现有的去烟/雾模 型,鲜有利用这2类技术来提高模型的效率和性能,在高清图像数据上,无法同时达到实时 运行和良好的去烟雾效果。本发明基于大气物理模型和,利用设计高效的卷积神经网络结构 的技术,设计了一种轻量高效的去烟雾卷积神经网络模型,它的参数量小,运算量低,泛化 性能好,去烟/去雾效果良好。本发明模型可以方便地嵌入到其它计算机视觉任务中,仅占用 极少的计算资源,却可以为后续任务提供高质量的数据。
发明目的
本发明的目的是实现一种高效的去烟雾算法模型,该方法可以在高清图像上实时去烟/雾, 并且达到较为先进的去烟雾的效果。
发明内容
本发明提供了一种单幅图像去烟雾的方法,包括以下步骤:
步骤S1:构建烟雾形成的大气物理模型,推导出烟雾退化公式;
步骤S2:基于神经网络设计编码器网络,再将编码网络输出的隐空间特征应用解码器网 络解码,得到物理模型中传输介质参数,同时还将隐空间特征输入到了估计大气光照的回归 器中,得到大气光照参数,具体为选取包含传输介质参数、大气光照参数、有烟雾-清晰图像 对的数据集,将烟雾图像输入出编码器,得到隐空间特征,再分别输入解码器和回归器,分 别得到传输介质参数和大气光照参数;
步骤S3:将步骤S2中得到的传输介质参数再输入到金字塔网络,估计出更加准确的传 输介质参数,再将该传输介质参数和步骤S2中所得到的大气光照参数代入步骤S1中所述的 烟雾退化的物理公式,得到清晰的图像;
步骤S4:将步骤S2、S3中所得到的2个传输介质参数、大气光照参数和清晰图像分别 与步骤S2中所述的数据集中的真实值计算合适的损失函数,训练神经网络,直到在验证集中 效果可以接受;
步骤S5:将实际的烟雾数据输入到步骤S4中已训练好的网络中,并利用烟雾退化的物 理公式,得到去烟/雾图像。
进一步地,所述烟雾形成的大气物理模型的数学公式如式(1)所示:
I(x)=J(x)t(x)+A(1-t(x)) (1)
其中,I(x)表示有烟雾的图像,其中J(x)表清晰的无烟雾图像,t(x)表示传输介质参数,A 表示全局大气光照;所述烟雾退化公式如式(2)所示:
附图说明
图1是实现本发明的方法流程图。
图2是初步估计的传输介质参数和大气光照参数网络结构示意图。
图3是利用金字塔结构进一步估计传输介质参数网络结构示意图。
图4是合成数据集中的自然图像上的有雾图像和去雾图像的对比图:(1)有雾图像;(2)去 雾图像;(3)真实图像;(4)网络估计的传输介质参数(RGB的图像分别用RGB三个通道显示)。
图5是实际的外科手术内窥镜图像去烟对比图:(1)有雾图像;(2)去雾图像;(3)真实图像; (4)网络估计的传输介质参数。(RGB的图像分别用RGB三个通道显示)
图6是SOTS数据集实际数据去雾前后对比图:其中(1)实际有雾图像;(2)去雾图像。(RGB 的图像分别用RGB三个通道显示)
图7外科手术内窥镜视频数据去烟对比图。(RGB的图像分别用RGB三个通道显示)
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。
本发明所述去除烟雾的方法的整体流程如图1所示,由3部分组成:传输介质参数初步 估计网络(Coarse Block)、传输介质参数进一步估计网络(Fine Block)和大气光照参数回归 网络(Regressor)。
烟雾形成的大气物理模型数学公式如式(1)所示:
I(x)=J(x)t(x)+A(1-t(x)) (1)
I(x)表示有烟雾的图像,其中J(x)表清晰的无烟雾图像,t(x)表示传输介质参数,A表示全 局大气光照。利用式(1)推导出烟雾退化公式如式(2)所示:
去除烟雾的过程主要包括以下步骤:
步骤一、构建初步的卷积神经网络(Coarse Block),估计式(2)中的t(x)和A。
具体如图2所示。为了减少网络的计算,采用编码器-解码器(Encoder-Decoder)卷积 神经网络结构,在编码器部分,采用步长大于1的空洞卷积运算实现特征图的下采样。由于 此网络结构中步长设置较大,为保证下采样的特征图的信息量损失最小,同时不增加网络模 型的参数,采用空洞卷积(Dilated Convolution)作为解码器的卷积模块。记卷积运算为 其中xi表示第i层的特征图,c表示卷积输出通道数,e表示输入通道数,k表 示卷积核的大小为k2,s为卷积运算的步长,p为像素填充,d为空洞卷积的膨胀系数。编码 器的每一层都采用ReLU激活函数,解码器的中间层也采用ReLU激活函数,最后一层使用Tanh激活函数,估计A的回归网络也解码器的激活函数配置相同,ReLU和Tanh数学公式如式(3)、式(4)所示:
ReLU(x)=max(0,x) (3)
输入编码器网络的RGB烟雾图像记为x0,编码器网络的运算过程如下式(5)所示:
上式中Hi(x)表示对特征图x最近邻上采样i倍,[xi;xj]表示特征图xi和xj在通道维度上拼 接。
将式(5)得到的隐空间特征z输入到估计A的回归网络中,其运算过程如式(7)所示:
如图3所示,在基于物理模型的去雾网络模型中,t(x)对图像去烟/雾的质量有着决定性 的作用,估计出准确的t(x),可以更加准确地还原清晰图像。步骤一中获得的还包 含了许多原始图像的信息,因此可以设计一个金字塔的网络结构,在不同尺度 (1/2,1/4,1/8)上提取的信息,过滤掉原始图像的干扰信息,从而估计出更为准确的其运算过程如式(8)所示:
式中H-i(x)表示对特征图x平均池化i倍,Pi表示1/i尺度下的特征图,当i=0时,表示原尺 度。由式(8)得到不同尺度的特征图像后,以通道顺序进行拼接,然后分成3组,进行分组卷 积运算,最后再通过普通的卷积,得到最终的其计算过程如式(9)所示:
上式C[Pi;Pj]表示将Pi,Pj按通道顺序拼接,记那么 表示分组卷积,其中xi表示第i层的 特征图,c表示卷积输出通道数,e表示输入通道数,k表示卷积核的大小为k2,s为卷积运 算的步长,p为像素填充,g为分组卷积的分组数,其中e和c都必须为g的整数倍。
步骤三、以均方根误差损失(MSE Loss)作为训练网络的目标函数,采用反向传播算法 更新网络参数,其优化目标如式(11)所示:
式中θc,θr,θf分别为Coarse Block,Regressor、Fine Block的网络权重。λi为手动设定的系数, λ1=0.3,λ2=0.3,λ3=0.3,λ4=0.1。训练过程中,在验证集上加以验证,直到在验证 集中效果可以接受。
实施例1
为了验证本发明的去烟雾的高效性与先进性,将本发明所提出的网络模型在自然图像的 室内数据集上训练,然后分别应用于自然图像的室内数据、室外数据以及外科手术内窥镜高 清视频数据,以展示本发明中轻量化高效率深度卷积神经网络模型高效实时去烟/雾的效果。
本实施例以Python语言实现(版本号:3.7.6),其中的深度卷积神经网络利用Pytorch(版 本号:1.5.1)框架搭建。训练和测试所使用的操作系统为Linux系统(Ubuntu18.04 LTS,内 核版本号:4.15.0)。机器配置为:CPU型号:Intel(R)Core(TM)i9-10920XCPU@3.50GHz; 内存大小:96G;GPU型号:GeForce GTX 2080Ti。
首先,采用RESIDE数据集(参见Li B,Ren W,Fu D,et al.Benchmarking single-image dehazing and beyond[J].IEEE Transactions on Image Processing,2018,28(1):492-505)的室内数 据ITS_v2子集作为本发明网络的训练集和验证集,网络模型在训练集完成后,如图4、5所 示,在SOTS子集(合成数据集,包含了室内数据集和室外数据集)上进行测试,并计算了 常见的图像质量评价指标PSNR和SSIM(参见 https://scikit- image.org/docs/stable/api/skimage.metrics.html#skimage.metrics.structural_ similarity )。此外,如图5所示,在HSTS的实际数据集进行了测试。从表1和表2可以看出,本发明 方法在ITS_v2数据集上,取得了先进的去雾效果,并且运算量(GFLOPs,以图像大小为 1920x1080x3作为输入计算),仅有当前先进的轻量化网络的1/6,验证了本发明先进高效的 去雾性能。
表1SOTS数据集室内(Indoor)和室外(Outdoor)的PSNR/SSIM评价指标对比
表2 SOTS数据集综合PSNR/SSIM/Params/GFLOPs评价指标对比
表3内窥镜视频FPS和盲图像质量评价指标对比
为了验证本发明良好的泛化性能,以及高清图像上达到了实时去雾的效果,在外科手 术内窥镜视频数据上测试本发明网络,该视频数据帧为RGB图像,分辨率为1920x1080, 去烟对比结果如图7所示。由于内窥镜视频数据没有标签,不能用PSNR/SSIM来评价去雾 结果,而是使用2种常见的盲图像质量评价指标,NIQE(参见Mittal A,Soundararajan R, Bovik A C.Making a“completely blind”image quality analyzer[J].IEEE Signal processing letters,2012,20(3):209-212)是自然图像上一个评价指标,它指示图像是否自然,其值越低, 图像质量越高;FADE(参见Choi L K,You J,Bovik AC.Referenceless prediction of perceptual fog density and perceptual imagedefogging[J].IEEE Transactions on Image Processing,2015, 24(11):3888-3901)是评价图像是否存在烟雾,它指示图像的烟雾程度,其值越低,图像的 烟雾越少。如表3所示,本发明网络在这两个指标上都取得了不错的结果,其中去烟雾效 果比其它两种方法更好,但是在图像的自然程度上略逊于DCPDN。此外,还对比了每秒处 理的帧数(FPS)指标,表3中的FPS1计算过程包括数据从CPU到GPU去雾,再传输到 CPU,比较符合实际应用情况,FPS2计算过程仅包括数据在GPU上去雾,再传输到CPU, 它更能比较出各个模型的际运算速度。
本发明的优点是,网络的参数量极少,泛化性能好,计算效率高,对运行设备要求低。 在高清图像上也可以实时运行,并且能够达到先进的去烟/雾效果。同时本发明也可以方便地 嵌入到其它计算机视觉任务中,为这些任务提供高质量的数据,同时仅占用极少的计算资源。
Claims (7)
1.一种单幅图像去烟雾的方法,其特征在于,包括以下步骤:
步骤S1:构建烟雾形成的大气物理模型,推导出烟雾退化公式;
步骤S2:基于神经网络设计编码器网络,再将编码网络输出的隐空间特征应用解码器网络解码,得到物理模型中传输介质参数,同时还将隐空间特征输入到了估计大气光照的回归器中,得到大气光照参数,具体为选取包含传输介质参数、大气光照参数、有烟雾-清晰图像对的数据集,将烟雾图像输入出编码器,得到隐空间特征,再分别输入解码器和回归器,分别得到传输介质参数和大气光照参数;
步骤S3:将步骤S2中得到的传输介质参数再输入到金字塔网络,估计出更加准确的传输介质参数,再将该传输介质参数和步骤S2中所得到的大气光照参数代入步骤S1中所述的烟雾退化的物理公式,得到清晰的图像;
步骤S4:将步骤S2、S3中所得到的2个传输介质参数、大气光照参数和清晰图像分别与步骤S2中所述的数据集中的真实值计算合适的损失函数,训练神经网络,直到在验证集中效果可以接受;
步骤S5:将实际的烟雾数据输入到步骤S4中已训练好的网络中,并利用烟雾退化的物理公式,得到去烟/雾图像。
3.根据权利要求2所述单幅图像去烟雾的方法,其特征在于,所述步骤S2进一步包括构建初步的卷积神经网络,估计式中的t(x)和A,所述卷积神经网络为编码器一解码器卷积神经网络结构,在编码器部分,采用步长大于1的空洞卷积运算实现特征图的下采样。
4.根据权利要求3所述单幅图像去烟雾的方法,其特征在于,记所述空洞卷积运算为其中xi表示第i层的特征图,c表示卷积输出通道数,e表示输入通道数,k表示卷积核的大小为k2,s为卷积运算的步长,p为像素填充,d为空洞卷积的膨胀系数;所述编码器的每一层都采用ReLU激活函数,所述解码器的中间层也采用ReLU激活函数,最后一层使用Tanh激活函数,估计A的回归网络与解码器的激活函数配置相同,ReLU和Tanh数学公式如式(3)、式(4)所示:
ReLU(x)=max(0,x) (1),
将输入编码器网络的RGB烟雾图像记为x0,则编码器网络的运算过程如下式(5)所示:
其中,Hi(x)表示对特征图x最近邻上采样i倍,[xi;xj]表示特征图xi和xj在通道维度上拼接;
将式(3)得到的隐空间特征z输入到估计A的回归网络中,其运算过程如式(7)所示:
5.根据权利要求4所述单幅图像去烟雾的方法,其特征在于,所述步骤S3进一步包括:
式中H-i(x)表示对特征图x平均池化i倍,Pi表示1/i尺度下的特征图,当i=0 时,表示原尺度;
式中,C[Pi;Pj]表示将Pi,Pj按通道顺序拼接,记 则 表示分组卷积,其中xi表示第i层的特征图,c表示卷积输出通道数,e表示输入通道数,k表示卷积核的大小为k2,s为卷积运算的步长,p为像素填充,g为分组卷积的分组数,其中e和c都必须为g的整数倍;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010997199.5A CN112381723B (zh) | 2020-09-21 | 2020-09-21 | 一种轻量高效的单幅图像去烟雾方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010997199.5A CN112381723B (zh) | 2020-09-21 | 2020-09-21 | 一种轻量高效的单幅图像去烟雾方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112381723A true CN112381723A (zh) | 2021-02-19 |
CN112381723B CN112381723B (zh) | 2023-06-30 |
Family
ID=74586139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010997199.5A Active CN112381723B (zh) | 2020-09-21 | 2020-09-21 | 一种轻量高效的单幅图像去烟雾方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112381723B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887473A (zh) * | 2021-10-15 | 2022-01-04 | 中国海洋大学 | 一种基于改进的规范化可变形卷积人群计数方法 |
CN115063304A (zh) * | 2022-05-19 | 2022-09-16 | 湖南师范大学 | 一种基于端到端的多尺寸融合的金字塔神经网络图像去雾方法及系统 |
CN116129379A (zh) * | 2022-12-28 | 2023-05-16 | 国网安徽省电力有限公司芜湖供电公司 | 一种雾天环境下的车道线检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108648160A (zh) * | 2018-05-14 | 2018-10-12 | 中国农业大学 | 一种水下海参图像去雾增强方法及系统 |
AU2020100274A4 (en) * | 2020-02-25 | 2020-03-26 | Huang, Shuying DR | A Multi-Scale Feature Fusion Network based on GANs for Haze Removal |
CN110930320A (zh) * | 2019-11-06 | 2020-03-27 | 南京邮电大学 | 一种基于轻量化卷积神经网络的图像去雾方法 |
CN111192219A (zh) * | 2020-01-02 | 2020-05-22 | 南京邮电大学 | 一种基于改进的逆大气散射模型卷积网络的图像去雾方法 |
-
2020
- 2020-09-21 CN CN202010997199.5A patent/CN112381723B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108648160A (zh) * | 2018-05-14 | 2018-10-12 | 中国农业大学 | 一种水下海参图像去雾增强方法及系统 |
CN110930320A (zh) * | 2019-11-06 | 2020-03-27 | 南京邮电大学 | 一种基于轻量化卷积神经网络的图像去雾方法 |
CN111192219A (zh) * | 2020-01-02 | 2020-05-22 | 南京邮电大学 | 一种基于改进的逆大气散射模型卷积网络的图像去雾方法 |
AU2020100274A4 (en) * | 2020-02-25 | 2020-03-26 | Huang, Shuying DR | A Multi-Scale Feature Fusion Network based on GANs for Haze Removal |
Non-Patent Citations (5)
Title |
---|
HE ZHANG等: "Densely Connected Pyramid Dehazing Network", 《2018 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
SHIBAI YIN等: "A Novel Residual Dense Pyramid Network for Image Dehazing", 《ENTROPY》 * |
任敏敏: "图像融合的循环神经网络去雾算法", 《小型微型计算机系统》 * |
宋佳怡等: "融合暗通道滤波和空间金字塔的图像去雾算法", 《信号处理》 * |
陈清江等: "基于全卷积神经网络的图像去雾算法", 《应用光学》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113887473A (zh) * | 2021-10-15 | 2022-01-04 | 中国海洋大学 | 一种基于改进的规范化可变形卷积人群计数方法 |
CN113887473B (zh) * | 2021-10-15 | 2024-04-26 | 中国海洋大学 | 一种基于改进的规范化可变形卷积人群计数方法 |
CN115063304A (zh) * | 2022-05-19 | 2022-09-16 | 湖南师范大学 | 一种基于端到端的多尺寸融合的金字塔神经网络图像去雾方法及系统 |
CN115063304B (zh) * | 2022-05-19 | 2023-08-25 | 湖南师范大学 | 一种多尺寸融合的金字塔神经网络图像去雾方法及系统 |
CN116129379A (zh) * | 2022-12-28 | 2023-05-16 | 国网安徽省电力有限公司芜湖供电公司 | 一种雾天环境下的车道线检测方法 |
CN116129379B (zh) * | 2022-12-28 | 2023-11-07 | 国网安徽省电力有限公司芜湖供电公司 | 一种雾天环境下的车道线检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112381723B (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112381723A (zh) | 一种轻量高效的单幅图像去烟雾方法 | |
CN111784602B (zh) | 一种生成对抗网络用于图像修复的方法 | |
WO2020015330A1 (zh) | 基于增强的神经网络的图像复原方法、存储介质及系统 | |
CN111739082B (zh) | 一种基于卷积神经网络的立体视觉无监督深度估计方法 | |
CN108734661B (zh) | 基于图像纹理信息构建损失函数的高分辨率图像预测方法 | |
CN108805839A (zh) | 基于卷积神经网络的联合估计图像去雾方法 | |
CN107123091A (zh) | 一种基于深度学习的近红外人脸图像超分辨率重建方法 | |
CN109859166B (zh) | 一种基于多列卷积神经网络的无参3d图像质量评估方法 | |
CN111901532B (zh) | 基于循环神经网络迭代策略的视频稳定方法 | |
CN111986108A (zh) | 一种基于生成对抗网络的复杂海空场景图像去雾方法 | |
CN114897742B (zh) | 一种纹理和结构特征两次融合的图像修复方法 | |
CN111553856B (zh) | 基于深度估计辅助的图像去雾方法 | |
Fan et al. | Multiscale cross-connected dehazing network with scene depth fusion | |
Li et al. | Single image dehazing via region adaptive two-shot network | |
CN113992920A (zh) | 一种基于深度展开网络的视频压缩感知重建方法 | |
CN117252782A (zh) | 基于条件去噪扩散和掩膜优化的图像修复方法 | |
CN114821368B (zh) | 一种基于强化学习和Transformer的电力缺陷检测方法 | |
CN115587967B (zh) | 一种基于HA-UNet网络的眼底图像视盘检测方法 | |
CN116524402A (zh) | 基于多头自注意力的多时间跨度上下文建模动作识别方法 | |
CN116309170A (zh) | 一种输电线路巡检图像去雾方法和装置 | |
CN116468625A (zh) | 基于金字塔高效通道注意力机制的单幅图像去雾方法和系统 | |
CN116310871A (zh) | 融合空洞空间金字塔池化的内陆水体提取方法 | |
Wang et al. | How Powerful Potential of Attention on Image Restoration? | |
CN114140334A (zh) | 一种基于改进生成对抗网络的复杂煤矿图像去雾方法 | |
CN110222716B (zh) | 基于全分辨率深度卷积神经网络的图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |