CN110189262A

CN110189262A - 基于神经网络以及直方图匹配的图像去雾算法

Info

Publication number: CN110189262A
Application number: CN201910357531.9A
Authority: CN
Inventors: 范益波; 池俊; 李敏江; 孟子皓; 曾晓洋
Original assignee: Fudan University
Current assignee: Fudan University
Priority date: 2019-04-29
Filing date: 2019-04-29
Publication date: 2019-08-30
Anticipated expiration: 2039-04-29
Also published as: CN110189262B

Abstract

本发明属于图像增强技术领域，具体为一种基于神经网络以及直方图匹配的图像去雾算法。本发明方法包括：先对输入有雾图像进行分割，然后对分割后的每一小块图像采用神经网络预测有雾图像到无雾图像的直方图变化，并以模型输出的预测直方图指导该小块有雾图像进行像素的重新排布；每小块图像去雾完成后，通过导向滤波器去除区块之间的不自然过渡。本发明在拥有良好的去雾结果的同时，计算速度也更快，并且计算量不随着图像大小增加而增加，非常适合高分辨率图像去雾。

Description

基于神经网络以及直方图匹配的图像去雾算法

技术领域

本发明属于图像增强技术领域，具体涉及基于神经网络进行直方图匹配的图像去雾算法。

背景技术

大雾是一种普遍的天气，尤其在中国以及其他正在进行工业化的国家中，由于空气污染的影响，很多城市更是经常受到雾霾天气的困扰。在雾霾天中，由于空气中的雾气、灰尘、小水滴等细小悬浮物对光线传播的散射，会极大地影响人视线。在这样的天气下拍摄的照片也往往会变得朦胧。

在过去的十余年里，去雾领域的研究者提出了很多的算法来实现单幅图像的去雾，可以大致分为以下几类。一类算法基于图像增强，基于图像增强的算法更关注图像的对比度和细节，去雾后的结果更加清晰，然而由于未考虑图像质量变差的根本原因，恢复后的图像相比原图会产生色彩的畸变。第二类算法为基于物理模型的算法，基于物理模型的算法从有雾图像的退化机制入手，恢复原始图像，由于考虑了有雾图像的形成机制，能更真实地还原出原始图像，然而这种类型的算法往往只能应用于特定场景。还有一类算法基于深度学习，其中又分端到端(模型输入有雾图像，输出清晰图像)的方法，以及利用模型估算传输率等物理量，再用传统方法去雾的算法。这两类算法都需要对输入图像进行二维的卷积，需要大量的运算，尤其是对高清图像时，计算的复杂度急剧上升。

发明内容

本发明的目的在于提出一种高效的，并且能适应多种场景的图像去雾算法。

由于传统的尝试通过物理模型的算法很难以一种线性变换来表示各种情况中雾气的影响，在本发明中加入了深度学习的方法，通过大量数据，来学习有雾图像以及无雾图像的直方图之间潜在的变换。

本发明提出的图像去雾算法，是基于神经网络以及直方图匹配技术的，具体步骤为：

(1)将图像分割成一系列的小块，使得每一小块内，雾的浓度相差不大；通常情况下可将图像分割成8x8个区块。若图像中不同区域雾浓度变化较大，可以分成更多块；

(2)统计每一小块内的像素值的分布，分R、G、B(红、绿、蓝)三通道统计灰度直方图。灰度直方图的横坐标以4像素为间隔，故总共有256/4＝64个间隔，又因为有三个通道，故统计得到的数据可以表示成64x1x3的矩阵。统计得到的矩阵需要除以矩阵中的最大值，保证所有输入数据的取值范围为0-1，便于模型学习；

(3)将之前得到的每一小块图像的直方图统计结果输入到经过训练的神经网络中，通过一系列一维的卷积，最终输出预测的去雾结果中对应块的直方图；

(4)将输出的直方图以及输入的直方图都除以它们所有数据的和，使它们中数据的累加和为1(归一化处理)，并通过积分转换为累计分布直方图，以进行直方图匹配。假设输入的直方图进行积分得到的累计分布直方图为c_i(x)，输出的直方图积分得到的累计分布直方图为c_o(x)，它们的横坐标x为像素值，纵坐标为小于等于x的像素在所有像素中所占的比例。取c_i＝c_o时他们的横坐标就是对应的像素重排列的查找表。例如c_i(100)＝c_o(90)，则表示有雾图像中像素值为100的像素在去雾结果中的像素值应该为90；

(5)进行直方图匹配后，对应的，分别获得每一块的去雾结果，并拼成大图；

(6)由于分块预测，此时区块之间会有不自然的过渡，本发明通过导向滤波器来去除不自然的过渡。其中，原始有雾图像作为引导图。

实验表明，本发明方法去雾效果非常好，明显增强了图像的对比度，且十分自然；算法的速度也远远优于现有方法。

附图说明

图1为本发明算法框图。

图2为本发明中的神经网络的结构。

图3为本发明方法流程图。

图4为本发明与其他几种算法相比的效果对比。

具体实施方式

下面结合附图，对本发明做进一步描述。

图1展示了本发明中算法的整体框图，图2展示了本发明中的神经网络的结构。

图1中最左侧的图像为待去雾的有雾图象，上面的红框表示第一个待处理的窗口。第一步先获取该窗口的灰度直方图(这里为了方便将三通道的信息合并展示)。R、G、B三通道都分别进行直方图统计，每个通道的直方图横坐标分成64个区间(图1有雾图像直方图横坐标)，分别代表像素值的取值范围[0,3]，[4,7]……直方图的纵坐标代表落在对应像素值区间的像素点的数目，所以纵坐标取值范围不固定，需要在输入模型进行预测前将其取值范围归一化到[0,1]，具体做法为三个颜色通道直方图中的所有数据都除以其最大值。

之后将获取到的归一化直方图输入到我们训练好的网络，即HistogramsTransformation Network。网络给出了预测去雾结果的直方图。为了保证积分得到的累计分布函数收敛到1，需要将输入直方图和输出直方图中的所有数据除以它们的和。之后将输入和输出的直方图分别进行积分，得到两者的累计分布函数，并进行直方图匹配，就获得了清晰图像上用红框表示出来的去雾结果。假设输入的直方图进行积分得到的累计分布直方图为c_i(x)，输出的直方图积分得到的累计分布直方图为c_o(x)，直方图匹配的具体步骤为：

(a)将64点的累计分布函数通过线性插值插到256点；

(b)依次取x＝0，1，……255，取c_i(x)的值，并求使得c_i(x)＝c_o(x′)时的x′的值；由于通常来无法正好找到整数x′，使得c_i(x)＝c_o(x′)，故取值时取满足c_o(x′)<c_i(x)<c_o(x′+1)的整数x′并进行插值得到x′；x′就是对应的去雾后，该区块内取值为x的像素值应映射到的新像素值；

(c)在步骤(b)中算出255个像素对应的查找表后，对该区块内所有像素依据查找表进行重排列，此时输入图像的直方图近似为模型输出结果。

完成所有图像窗口的直方图匹配工作后，需要用到导向滤波器去除区块效应。这里，选择原始的有雾图像作为引导图，分块直方图匹配结果为待滤波图像。

图2展示了直方图变换网络的结构。网络的输入以及中间的特征图都为一维的数据，并且中间的运算采取一维的卷积。由于在进行判决时，是将统计好的直方图送入网络，这一步相当于把数据压缩成了一维，这样在网络进行卷积时，只需沿着第二维(纬度为1)进行卷积，大大减少了运算的次数以及产生的中间特征所占用的内存。网络由三部分组成，特征提取层(Feature Extracting Layers)，映射层(Mapping Layers)以及压缩层(Shrinking Layers)。

特征提取层由三层网络组成。第一层由64个3x1x3的卷积核组成，第二层由64个3x1x64的卷积核组成，第三层由32个3x1x64的卷积核组成。所有的卷积核都做一维的卷积。每一层做卷积的时候都对输入特征进行“零填充”，保证所有输出特征在第一个维度上保持64的大小，以免因为网络太深造成边缘信息损失。

映射层由16层包含了32个3x1x32的卷积核的层构成。映射层采用了一个一维“残差网络”的结构，如图2最右侧所示。映射层中每一层的输出都为输入以及卷积结果的和。由于在较深的网络中，每一层的输入和输出变化比较小，但是卷积核比较难以学习非常小的变化，所以提供一个旁路让输入直接到输出，这样只需要令卷积核中的权重都接近0就可以实现比较小的变化，使网络更深。

最后的压缩层将映射层的输出压缩为64x1x3的大小，用于之后进行三个通道的直方图匹配。

模型训练使用的数据库为Google的RESIDE-β数据集。训练时将训练集分为四份，使用其中三份为训练集，第四份为测试集，第四份中最后留350张图作为验证集。

训练时，初始的学习率为3x10^-4，每当模型连续两轮训练在测试集上的表现不再提升时，减半学习率。

图4展示了几张本发明与其他算法的去雾结果对比图，可以发现本发明的去雾结果增强了图像的对比度，且十分自然。

表1展示了本发明与其他几种算法的量化结果对比。可以发现，本发明的结果，在结构相似度以及色差上都表现最佳，且在运行时间上，本发明也远远快于ECCV2016与CVPR2018中提出的另外两种基于深度学习的算法。

表1本发明与其他几种算法的效果及耗时对比

Claims

1.一种基于神经网络以及直方图匹配的图像去雾算法，其特征在于，具体步骤为：

（1）将图像分割成一系列的小块，使得每一小块内，雾的浓度相差不大；

（2）统计每一小块内的像素值的分布，分R、G、B三通道统计灰度直方图；设灰度直方图的横坐标以4像素为间隔，总共有256 / 4 = 64个间隔；有三个通道，统计得到的数据表示成64×1×3的矩阵；将统计得到的矩阵除以矩阵中的最大值，保证所有输入数据的取值范围为0-1，便于模型学习；

（3）将之前得到的每一小块图像的直方图统计结果输入到经过训练的神经网络中，通过一系列一维的卷积，最终输出预测的去雾结果中对应块的直方图；

（4）将输出的直方图以及输入的直方图都除以它们所有数据的和，使它们中数据的累加和为1，并通过积分转换为累计分布直方图，以进行直方图匹配；

（5）进行直方图匹配后，对应的，分别获得每一块的去雾结果，并拼成大图；

（6）由于分块预测，此时区块之间会有不自然的过渡，通过导向滤波器来去除不自然的过渡；其中，原始有雾图像作为引导图。

2.根据权利要求1所述的基于神经网络以及直方图匹配的图像去雾算法，其特征在于，步骤（1）中所述图像小块大小分8×8像素。

3.根据权利要求1所述的基于神经网络以及直方图匹配的图像去雾算法，其特征在于，步骤（3）中所述神经网络结构分为三部分：特征提取层，映射层以及压缩层；其中：

特征提取层由三层网络组成：第一层由64个3×1×3的卷积核组成，第二层由64个3×1×64的卷积核组成，第三层由32个3×1×64的卷积核组成；所有的卷积核都做一维的卷积；每一层做卷积的时候都对输入特征进行“零填充”，保证所有输出特征在第一个维度上保持64的大小；

映射层有16层，每层包含32个3×1×32的卷积核；映射层采用一个一维“残差网络”的结构，映射层中每一层的输出都为输入以及卷积结果的和；

压缩层将映射层的输出压缩为64×1×3的大小，用于之后进行三个通道的直方图匹配。

4.根据权利要求1所述的基于神经网络以及直方图匹配的图像去雾算法，其特征在于，步骤（3）中，模型训练使用的数据库为Google的RESIDE-β数据集；训练时将训练集分为四份，使用其中三份为训练集，第四份为测试集，第四份中最后留350张图作为验证集。

5.根据权利要求1-4之一所述的基于神经网络以及直方图匹配的图像去雾算法，其特征在于，步骤（4）中所述直方图匹配时，假设输入的直方图进行积分得到的累计分布直方图为c_i(x)，输出的直方图积分得到的累计分布直方图为c_o(x)，匹配的具体步骤为：

（a）将64点的累计分布函数通过线性插值插到256点；

（b）依次取x=0，1，……255，取c_i(x)的值，并求使得时的的值；由于通常来无法正好找到整数，使得，故取值时取满足的整数并进行插值得到；就是对应的去雾后，该区块内取值为x的像素值应映射到的新像素值；

（c）在步骤（b）中算出255个像素对应的查找表后，对该区块内所有像素依据查找表进行重排列，此时输入图像的直方图近似为模型输出结果。