CN109447907A

CN109447907A - 一种基于全卷积神经网络的单图像增强方法

Info

Publication number: CN109447907A
Application number: CN201811097909.8A
Authority: CN
Inventors: 郁梅; 陈晔曜; 邵华; 姜浩; 蒋刚毅
Original assignee: Ningbo University
Current assignee: Ningbo University
Priority date: 2018-09-20
Filing date: 2018-09-20
Publication date: 2019-03-08
Anticipated expiration: 2038-09-20
Also published as: CN109447907B

Abstract

本发明公开了一种基于全卷积神经网络的单图像增强方法，首先，考虑到单曝光图像丢失的信息可由多曝光序列来描述，利用构建的预测曝光网络来产生与输入的图像曝光不同的低曝光图像和高曝光图像，以此构建出一个多曝光序列；接着，为避免手动提取融合特征导致增强方法鲁棒性低的问题，利用构建的曝光融合网络来完成特征提取、特征融合以及图像重建任务；最后，考虑到预测曝光网络中的反卷积层会造成输出的图像出现棋盘伪像，采用与人眼感知相关的结构相异性损失来训练预测曝光网络以减轻这种伪像；优点是其既能提高图像整体对比度，又能恢复一定的图像曝光不足和曝光过度区域的信息。

Description

一种基于全卷积神经网络的单图像增强方法

技术领域

本发明涉及一种单图像增强技术，尤其是涉及一种基于全卷积神经网络的单图像增强方法。

背景技术

由于相机传感器的动态范围限制，因此单次曝光的图像存在细节丢失现象，为提高图像质量，常采用多图像融合技术。但是，多图像的拍摄过程是对同一场景多次曝光，存在一定的时间间隔，对于动态场景会引入鬼影现象，因此多图像融合技术需要额外考虑鬼影的检测和去除。而单图像增强技术只需要调整单曝光图像的色调曲线，不会引入鬼影现象，所以实用性更强，但是单曝光图像无法表征整个场景的内容，其增强图像的质量会明显低于多图像融合技术得到的融合图像的质量。因此使单图像增强技术的性能接近多图像融合技术，已成为该技术走向应用的关键环节。

现有的单图像增强方法可以分为两大类：基于像素域和基于辐照域的增强方法。

基于像素域的增强方法是从原始图像域角度出发，通过调整图像的像素点的分布来增强图像整体的对比度。目前使用最广泛的方法是基于直方图和基于Retinex理论，例如Celik等人采用像素点间上下文信息来增强图像的对比度；Lee等人利用二维直方图分层差分表示来增强图像；Fu等人根据Retinex理论，通过加权变分模型估计图像的亮度分量和反射分量。但是这类方法能够利用的图像信息很有限，所以只能恢复图像隐藏的细节信息，无法恢复图像已丢失的细节信息。

单曝光图像丢失的细节信息存在对应的高动态范围(High dynamic range，HDR)数据中，因此基于辐照域的增强方法是通过色调曲线，将原始图像映射到HDR域，即辐照域以恢复图像的信息。Banterle等人提出的逆色调映射方法，其通过计算对数色调映射的逆函数，将原始图像映射到辐照域，但是对数色调映射是信息的有损压缩过程，其逆函数只能提高图像的整体亮度，无法恢复压缩过程中丢失的细节信息；Huo等人从人眼对图像的感知角度出发，提出了基于视网膜响应的逆色调映射方法，但是该方法的性能取决于多个自定义的参数，因此鲁棒性不强。随着深度神经网络在计算机视觉领域的成功应用，有研究者提出了利用深度卷积神经网络(Convolutional neural network，CNN)来学习单曝光图像的HDR重建。Eilertsen等人通过编码器提取原始低动态范围(Low dynamic range，LDR)图像的特征信息，再通过解码器重建HDR图像。由于LDR图像和HDR图像的动态范围不一致，所以采用对数映射来构造LDR图像和HDR图像之间的跳转连接。该方法能较好地提高图像的整体亮度，并恢复饱和区域的细节信息，但是考虑到图像低暗区域存在噪声，该方法无法恢复图像低暗区域的细节信息。

虽然相关研究已经取得了较好的单图像增强效果，但是在恢复图像曝光不足和曝光过度区域的信息上仍存在一定的不足。

发明内容

本发明所要解决的技术问题是提供一种基于全卷积神经网络的单图像增强方法，其能够有效地增强图像对比度，并且能够恢复出图像曝光不足和曝光过度区域的信息。

本发明解决上述技术问题所采用的技术方案为：一种基于全卷积神经网络的单图像增强方法，其特征在于包括以下步骤：

步骤一：构建两个级联网络，第一个网络为预测曝光网络、第二个网络为曝光融合网络；

预测曝光网络包括十二层，依次分别为第一卷积层、第二卷积层、第三卷积层、第四卷积层、第一反卷积层、第一跳转连接层、第二反卷积层、第二跳转连接层、第三反卷积层、第三跳转连接层、第四反卷积层、第五卷积层；

预测曝光网络中的第一卷积层至第四卷积层各自通过卷积核对输入的图像进行卷积提取出特征图，将第一卷积层的输入记为I_normal，将第一卷积层的输出记为F_1e，F_1e＝A(W_1e*I_normal+b_1e)，其中，第一卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，第一卷积层的卷积步长为2，第一卷积层输入的通道数为m_1e，第一卷积层输出的通道数为n_1e，W_1e表示第一卷积层的卷积核，W_1e的维数为k_1e×k_1e，符号“*”为卷积操作符号，b_1e表示维数为1×n_1e的偏置项；令i表示卷积层的索引号，i＝2,3,4，i＝2时代表第二卷积层，i＝3时代表第三卷积层，i＝4时代表第四卷积层，索引号为i的卷积层的输入为F_(i-1)e，将索引号为i的卷积层的输出记为F_ie，F_ie＝A(W_ie*F_(i-1)e+b_ie)，其中，索引号为i的卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，索引号为i的卷积层的卷积步长为2，索引号为i的卷积层输入的通道数为m_ie，索引号为i的卷积层输出的通道数为n_ie，W_ie表示索引号为i的卷积层的卷积核，W_ie的维数为k_ie×k_ie，b_ie表示维数为1×n_ie的偏置项；

预测曝光网络中的第一反卷积层至第四反卷积层各自通过卷积核对输入的特征图进行上采样以恢复到第一卷积层输入的图像的尺寸，第一反卷积层的输入为F_4e，将第一反卷积层的输出记为R_1d，R_1d＝A(W_1d⊙F_4e+b_1d)，其中，第一反卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，第一反卷积层的反卷积步长为2，第一反卷积层输入的通道数为m_1d，第一反卷积层输出的通道数为n_1d，W_1d表示第一反卷积层的卷积核，W_1d的维数为k_1d×k_1d，符号“⊙”为反卷积操作符号，b_1d表示维数为1×n_1d的偏置项；令j表示反卷积层的索引号，j＝2,3,4，j＝2时代表第二反卷积层，j＝3时代表第三反卷积层，j＝4时代表第四反卷积层，索引号为j的反卷积层的输入为R_(j-1)d，将索引号为j的反卷积层的输出记为R_jd，R_jd＝A(W_jd⊙R_(j-1)d+b_jd)，其中，索引号为j的反卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，索引号为j的反卷积层的反卷积步长为2，索引号为j的反卷积层输入的通道数为m_jd，索引号为j的反卷积层输出的通道数为n_jd，W_jd表示索引号为j的反卷积层的卷积核，W_jd的维数为k_jd×k_jd，b_jd表示维数为1×n_jd的偏置项；

预测曝光网络中的第一跳转连接层至第三跳转连接层各自通过连接算子和卷积核使输出的图像具有更多来自第一卷积层输入的图像的细节信息，令h表示跳转连接层的索引号，h＝1,2,3，h＝1时代表第一跳转连接层，h＝2时代表第二跳转连接层，h＝3时代表第三跳转连接层，索引号为h的跳转连接层的输入为F_(4-h)e和R_hd，将索引号为h的跳转连接层的输出记为R'_hd，R'_hd＝A(W_hs*concat[F_(4-h)e,R_hd]+b_hs)，再令R_hd＝R'_hd，其中，索引号为h的跳转连接层的激活函数为指数线性单元函数，A()表示指数线性单元函数，索引号为h的跳转连接层的卷积步长为1，索引号为h的跳转连接层输入的通道数为m_hs，索引号为h的跳转连接层输出的通道数为n_hs，W_hs表示索引号为h的跳转连接层的卷积核，W_hs的维数为k_hs×k_hs，b_hs表示维数为1×n_hs的偏置项，concat[]表示连接算子，concat[F_(4-h)e,R_hd]表示将索引号为4-h的卷积层的输出F_(4-h)e与索引号为h的反卷积层的输出R_hd在通道数维度进行连接，R_hd＝R'_hd中的“＝”为赋值符号；

预测曝光网络中的第五卷积层通过卷积核将输入的特征图重建为预测曝光后的图像，第五卷积层的输入为R_4d，将第五卷积层的输出记为I_out，I_out＝A(W_p*R_4d+b_p)，其中，第五卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，第五卷积层的卷积步长为1，第五卷积层输入的通道数为m_p，第五卷积层输出的通道数为n_p，W_p表示第五卷积层的卷积核，W_p的维数为k_p×k_p，b_p表示维数为1×n_p的偏置项；

曝光融合网络包括七层，依次分别为第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层；

曝光融合网络中的第一卷积层至第三卷积层各自通过卷积核对输入的图像进行卷积提取出特征图，第一卷积层的输入有三幅图像，分别为I_normal、I_low和I_high，将针对I_normal的第一卷积层的输出记为F_normal,1，F_normal,1＝A(W_1E*I_normal+b_1E)，将针对I_low的第一卷积层的输出记为F_low,1，F_low,1＝A(W_1E*I_low+b_1E)，将针对I_high的第一卷积层的输出记为F_high,1,F_high,1＝A(W_1E*I_high+b_1E)，其中，第一卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，第一卷积层的卷积步长为1，第一卷积层输入的通道数为m_1E，第一卷积层输出的通道数为n_1E，W_1E表示第一卷积层的卷积核，W_1E的维数为k_1E×k_1E，b_1E表示维数为1×n_1E的偏置项；令p表示卷积层的索引号，p＝2,3，p＝2时代表第二卷积层，p＝3时代表第三卷积层，针对I_normal的索引号为p的卷积层的输入为F_normal,p-1，将针对I_normal的索引号为p的卷积层的输出记为F_normal,p，F_normal,p＝A(W_pE*F_normal,p-1+b_pE)，针对I_low的索引号为p的卷积层的输入为F_low,p-1，将针对I_low的索引号为p的卷积层的输出记为F_low,p，F_low,p＝A(W_pE*F_low,p-1+b_pE)，针对I_high的索引号为p的卷积层的输入为F_high,p-1，将针对I_high的索引号为p的卷积层的输出记为F_high,p，F_high,p＝A(W_pE*F_high,p-1+b_pE)，其中，索引号为p的卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，索引号为p的卷积层的卷积步长为1，索引号为p的卷积层输入的通道数为m_pE，索引号为p的卷积层输出的通道数为n_pE，W_pE表示索引号为p的卷积层的卷积核，W_pE的维数为k_pE×k_pE，b_pE表示维数为1×n_pE的偏置项；

曝光融合网络中的第四卷积层通过连接算子对输入的特征图在通道数维度进行连接，并通过卷积核进行特征融合，第四卷积层的输入有三类特征图，分别为F_low,3,F_normal,3,F_high,3，将第四卷积层的输出记为F_fusion，F_fusion＝A(W_fusion*concat[F_low,3,F_normal,3,F_high,3]+b_fusion)，其中，第四卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，第四卷积层的卷积步长为1，第四卷积层输入的通道数为m_fusion，第四卷积层输出的通道数为n_fusion，W_fusion表示第四卷积层的卷积核，W_fusion的维数为k_fusion×k_fusion，b_fusion表示维数为1×n_fusion的偏置项，concat[]表示连接算子，concat[F_low,3,F_normal,3,F_high,3]表示将F_low,3,F_normal,3,F_high,3在通道数维度进行连接；

曝光融合网络中的第五卷积层至第七卷积层各自通过卷积核对输入的特征图进行重建，第五卷积层的输入为F_fusion，将第五卷积层的输出记为I_enhanced,5，I_enhanced,5＝A(W_5D*F_fusion+b_5D)，其中，第五卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，第五卷积层的卷积步长为1，第五卷积层输入的通道数为m_5D，第五卷积层输出的通道数为n_5D，W_5D表示第五卷积层的卷积核，W_5D的维数为k_5D×k_5D，b_5D表示维数为1×n_5D的偏置项；令g表示卷积层的索引号，g＝6,7，g＝6时代表第六卷积层，g＝7时代表第七卷积层，索引号为g的卷积层的输入为I_enhanced,g-1，将索引号为g的卷积层的输出记为I_enhanced,g，I_enhanced,g＝A(W_gD*I_enhanced,g-1+b_gD)，其中，索引号为g的卷积层的激活函数为指数线性单元函数，A()表示指数线性单元函数，索引号为g的卷积层的卷积步长为1，索引号为g的卷积层输入的通道数为m_gD，索引号为g的卷积层输出的通道数为n_gD，W_gD表示索引号为g的卷积层的卷积核，W_gD的维数为k_gD×k_gD，b_gD表示维数为1×n_gD的偏置项；

步骤二：选取个多曝光序列，且设定每个多曝光序列对应有一幅已知的高质量的融合图像，其中，然后将所有多曝光序列中的正常曝光图像和低曝光图像构成第一预测训练集，并将所有多曝光序列中的正常曝光图像和高曝光图像构成第二预测训练集；接着将第一预测训练集中的低曝光图像作为标签图像，将第一预测训练集中的正常曝光图像记为I_normal并作为输入，输入到构建好的预测曝光网络中进行训练，训练得到对应的预测低曝光图像，记为I_low，即I_out为I_low；并将第二预测训练集中的高曝光图像作为标签图像，将第二预测训练集中的正常曝光图像记为I_normal并作为输入，输入到构建好的预测曝光网络中进行训练，训练得到对应的预测高曝光图像，记为I_high，即I_out为I_high；之后将所有多曝光序列中的正常曝光图像I_normal、对应的预测低曝光图像I_low、对应的预测高曝光图像I_high、对应的高质量的融合图像构成融合训练集；再将融合训练集中的高质量的融合图像作为标签图像，将融合训练集中的正常曝光图像I_normal、对应的预测低曝光图像I_low、对应的预测高曝光图像I_high作为输入，输入到构建好的曝光融合网络中进行训练，训练得到对应的增强图像，记为I_enhanced，即I_enhanced,7为I_enhanced；训练结束后得到了预测曝光网络和曝光融合网络中的各卷积核的最佳参数及对应的最佳偏置项，得到了级联训练网络；

步骤三：选取一个多曝光序列作为测试序列；然后将测试序列中的正常曝光图像记为I_test,normal；接着将I_test,normal作为输入，输入到级联训练网络中，级联训练网络输出I_test,normal对应的增强图像，记为I_{test,enhanced}。

所述的步骤一中，取k_1e＝7，m_1e＝3，n_1e＝32；k_2e＝5，m_2e＝32，n_2e＝64；k_3e＝3，m_3e＝64，n_3e＝128；k_4e＝3，m_4e＝128，n_4e＝256；k_1d＝3，m_1d＝256，n_1d＝128；k_2d＝3，m_2d＝128，n_2d＝64；k_3d＝5，m_3d＝64，n_3d＝32；k_4d＝7，m_4d＝32，n_4d＝32；k_1s＝1，m_1s＝256，n_1s＝128；k_2s＝1，m_2s＝128，n_2s＝64；k_3s＝1，m_3s＝64，n_3s＝32；k_p＝1，m_p＝32，n_p＝3；

取k_1E＝3，m_1E＝3，n_1E＝16；k_2E＝3，m_2E＝16，n_2E＝32；k_3E＝3，m_3E＝32，n_3E＝32；k_fusion＝1，m_fusion＝96，n_fusion＝32；k_5D＝3，m_5D＝32，n_5D＝32；k_6D＝3，m_6D＝32，n_6D＝16；k_7D＝3，m_7D＝16，n_7D＝3。

与现有技术相比，本发明的优点在于：

1)本发明方法考虑到图像丢失的细节信息存在于对应的多曝光序列中，采用构建的预测曝光网络学习单图像与低曝光图像以及单图像与高曝光图像的映射关系，以此产生能表征场景高亮区域信息的低曝光图像和能表征场景低暗区域信息的高曝光图像，进而恢复图像丢失的细节信息，即能够恢复出图像曝光不足和曝光过度区域的信息。

2)本发明方法为避免手动提取融合特征造成增强方法鲁棒性低的问题，采用数据驱动方式，利用构建的曝光融合网络完成特征提取、特征融合以及图像重建任务，其中特征融合层采用1×1的卷积核能够学习多曝光图像之间的相对重要性，进而使重建图像包含更多来自每幅不同曝光图像在其良好曝光区域的信息，因此能够有效地增强图像对比度。

附图说明

图1为本发明方法的总体实现流程框图；

图2为本发明方法中构建的预测曝光网络的结构示意图；

图3为本发明方法中构建的曝光融合网络的结构示意图；

图4a为Balloons多曝光图像序列中的第7幅图像；

图4b为采用Huo提出的PITM模型对图4a所示的图像进行处理得到的增强图像；

图4c为采用Eilertsen提出的HDRCNN模型对图4a所示的图像进行处理得到的增强图像；

图4d为采用Fu提出的WVM模型对图4a所示的图像进行处理得到的增强图像；

图4e为采用Celik提出的CVC模型对图4a所示的图像进行处理得到的增强图像；

图4f为采用Lee提出的CE模型对图4a所示的图像进行处理得到的增强图像；

图4g为采用本发明方法对图4a所示的图像进行处理得到的增强图像；

图4h为图4a所示的图像对应的高质量的融合图像；

图5a为Lamp多曝光图像序列中的第3幅图像；

图5b为采用Huo提出的PITM模型对图5a所示的图像进行处理得到的增强图像；

图5c为采用Eilertsen提出的HDRCNN模型对图5a所示的图像进行处理得到的增强图像；

图5d为采用Fu提出的WVM模型对图5a所示的图像进行处理得到的增强图像；

图5e为采用Celik提出的CVC模型对图5a所示的图像进行处理得到的增强图像；

图5f为采用Lee提出的CE模型对图5a所示的图像进行处理得到的增强图像；

图5g为采用本发明方法对图5a所示的图像进行处理得到的增强图像；

图5h为图5a所示的图像对应的高质量的融合图像。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

由于相机传感器的动态范围限制，因此单次曝光图像存在信息丢失现象，针对此，本发明提出了一种基于全卷积神经网络的单图像增强方法，其首先考虑到自然场景的信息可由多曝光序列来描述，因此利用单曝光图像产生与其曝光不同的低/高曝光图像，以此恢复丢失的信息；再利用神经网络提取多曝光序列的融合特征，以此重建最终的增强图像。

本发明方法的总体实现流程框图如图1所示，本发明方法包括以下步骤：

如图2所示，预测曝光网络包括十二层，依次分别为第一卷积层、第二卷积层、第三卷积层、第四卷积层、第一反卷积层、第一跳转连接层、第二反卷积层、第二跳转连接层、第三反卷积层、第三跳转连接层、第四反卷积层、第五卷积层；

预测曝光网络中的第一卷积层至第四卷积层各自通过卷积核对输入的图像进行卷积提取出特征图，将第一卷积层的输入记为I_normal，将第一卷积层的输出记为F_1e，F_1e＝A(W_1e*I_normal+b_1e)，其中，第一卷积层的激活函数为指数线性单元(Exponential LinearUnit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，第一卷积层的卷积步长为2，第一卷积层输入的通道数为m_1e，第一卷积层输出的通道数为n_1e，W_1e表示第一卷积层的卷积核，W_1e的维数为k_1e×k_1e，符号“*”为卷积操作符号，b_1e表示维数为1×n_1e的偏置项；令i表示卷积层的索引号，i＝2,3,4，i＝2时代表第二卷积层，i＝3时代表第三卷积层，i＝4时代表第四卷积层，索引号为i的卷积层的输入为F_(i-1)e，将索引号为i的卷积层的输出记为F_ie，F_ie＝A(W_ie*F_(i-1)e+b_ie)，其中，索引号为i的卷积层的激活函数为指数线性单元(Exponential Linear Unit，ELU)函数，A()表示指数线性单元(Exponential LinearUnit，ELU)函数，索引号为i的卷积层的卷积步长为2，索引号为i的卷积层输入的通道数为m_ie，索引号为i的卷积层输出的通道数为n_ie，W_ie表示索引号为i的卷积层的卷积核，W_ie的维数为k_ie×k_ie，b_ie表示维数为1×n_ie的偏置项；由于不同曝光图像的细节信息与图像亮度有关，即低曝光图像保留的信息主要存在其高亮区域，而高曝光图像保留的信息主要存在其低暗区域，这说明不同曝光图像的相关性不强，因此为恢复图像良好的细节信息，预测曝光网络中的前四层卷积层采用步长为2的卷积进行下采样以增大图像的感受野。

预测曝光网络中的第一反卷积层至第四反卷积层各自通过卷积核对输入的特征图进行上采样以恢复到第一卷积层输入的图像的尺寸，第一反卷积层的输入为F_4e，将第一反卷积层的输出记为R_1d，R_1d＝A(W_1d⊙F_4e+b_1d)，其中，第一反卷积层的激活函数为指数线性单元(Exponential Linear Unit，ELU)函数，A()表示指数线性单元(Exponential LinearUnit，ELU)函数，第一反卷积层的反卷积步长为2，第一反卷积层输入的通道数为m_1d，第一反卷积层输出的通道数为n_1d，W_1d表示第一反卷积层的卷积核，W_1d的维数为k_1d×k_1d，符号“⊙”为反卷积操作符号，b_1d表示维数为1×n_1d的偏置项；令j表示反卷积层的索引号，j＝2,3,4，j＝2时代表第二反卷积层，j＝3时代表第三反卷积层，j＝4时代表第四反卷积层，索引号为j的反卷积层的输入为R_(j-1)d，将索引号为j的反卷积层的输出记为R_jd，R_jd＝A(W_jd⊙R_(j-1)d+b_jd)，其中，索引号为j的反卷积层的激活函数为指数线性单元(Exponential Linear Unit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，索引号为j的反卷积层的反卷积步长为2，索引号为j的反卷积层输入的通道数为m_jd，索引号为j的反卷积层输出的通道数为n_jd，W_jd表示索引号为j的反卷积层的卷积核，W_jd的维数为k_jd×k_jd，b_jd表示维数为1×n_jd的偏置项；

预测曝光网络中的第一跳转连接层至第三跳转连接层各自通过连接算子和卷积核使输出的图像具有更多来自第一卷积层输入的图像的细节信息，令h表示跳转连接层的索引号，h＝1,2,3，h＝1时代表第一跳转连接层，h＝2时代表第二跳转连接层，h＝3时代表第三跳转连接层，索引号为h的跳转连接层的输入为F_(4-h)e和R_hd，将索引号为h的跳转连接层的输出记为R'_hd，R'_hd＝A(W_hs*concat[F_(4-h)e,R_hd]+b_hs)，再令R_hd＝R'_hd，其中，索引号为h的跳转连接层的激活函数为指数线性单元(Exponential Linear Unit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，索引号为h的跳转连接层的卷积步长为1，索引号为h的跳转连接层输入的通道数为m_hs，索引号为h的跳转连接层输出的通道数为n_hs，W_hs表示索引号为h的跳转连接层的卷积核，W_hs的维数为k_hs×k_hs，b_hs表示维数为1×n_hs的偏置项，concat[]表示连接算子，concat[F_(4-h)e,R_hd]表示将索引号为4-h的卷积层的输出F_(4-h)e与索引号为h的反卷积层的输出R_hd在通道数维度进行连接，R_hd＝R'_hd中的“＝”为赋值符号；在此，跳转连接层通过卷积操作可以降低通道维度，并且增加预测曝光网络的非线性表达能力。

预测曝光网络中的第五卷积层通过卷积核将输入的特征图重建为预测曝光后的图像，第五卷积层的输入为R_4d，将第五卷积层的输出记为I_out，I_out＝A(W_p*R_4d+b_p)，其中，第五卷积层的激活函数为指数线性单元(Exponential Linear Unit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，第五卷积层的卷积步长为1，第五卷积层输入的通道数为m_p，第五卷积层输出的通道数为n_p，W_p表示第五卷积层的卷积核，W_p的维数为k_p×k_p，b_p表示维数为1×n_p的偏置项；

如图3所示，曝光融合网络包括七层，依次分别为第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第六卷积层、第七卷积层；

曝光融合网络中的第一卷积层至第三卷积层各自通过卷积核对输入的图像进行卷积提取出特征图，第一卷积层的输入有三幅图像，分别为I_normal、I_low和I_high，将针对I_normal的第一卷积层的输出记为F_normal,1，F_normal,1＝A(W_1E*I_normal+b_1E)，将针对I_low的第一卷积层的输出记为F_low,1，F_low,1＝A(W_1E*I_low+b_1E)，将针对I_high的第一卷积层的输出记为F_high,1,F_high,1＝A(W_1E*I_high+b_1E)，其中，第一卷积层的激活函数为指数线性单元(Exponential LinearUnit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，第一卷积层的卷积步长为1，第一卷积层输入的通道数为m_1E，第一卷积层输出的通道数为n_1E，W_1E表示第一卷积层的卷积核，W_1E的维数为k_1E×k_1E，b_1E表示维数为1×n_1E的偏置项；令p表示卷积层的索引号，p＝2,3，p＝2时代表第二卷积层，p＝3时代表第三卷积层，针对I_normal的索引号为p的卷积层的输入为F_normal,p-1，将针对I_normal的索引号为p的卷积层的输出记为F_normal,p，F_normal,p＝A(W_pE*F_normal,p-1+b_pE)，针对I_low的索引号为p的卷积层的输入为F_low,p-1，将针对I_low的索引号为p的卷积层的输出记为F_low,p，F_low,p＝A(W_pE*F_low,p-1+b_pE)，针对I_high的索引号为p的卷积层的输入为F_high,p-1，将针对I_high的索引号为p的卷积层的输出记为F_high,p，F_high,p＝A(W_pE*F_high,p-1+b_pE)，其中，索引号为p的卷积层的激活函数为指数线性单元(ExponentialLinear Unit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，索引号为p的卷积层的卷积步长为1，索引号为p的卷积层输入的通道数为m_pE，索引号为p的卷积层输出的通道数为n_pE，W_pE表示索引号为p的卷积层的卷积核，W_pE的维数为k_pE×k_pE，b_pE表示维数为1×n_pE的偏置项；

曝光融合网络中的第四卷积层通过连接算子对输入的特征图在通道数维度进行连接，并通过卷积核进行特征融合，第四卷积层的输入有三类特征图，分别为F_low,3,F_normal,3,F_high,3，将第四卷积层的输出记为F_fusion，F_fusion＝A(W_fusion*concat[F_low,3,F_normal,3,F_high,3]+b_fusion)，其中，第四卷积层的激活函数为指数线性单元(Exponential LinearUnit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，第四卷积层的卷积步长为1，第四卷积层输入的通道数为m_fusion，第四卷积层输出的通道数为n_fusion，W_fusion表示第四卷积层的卷积核，W_fusion的维数为k_fusion×k_fusion，b_fusion表示维数为1×n_fusion的偏置项，concat[]表示连接算子，concat[F_low,3,F_normal,3,F_high,3]表示将F_low,3,F_normal,3,F_high,3在通道数维度进行连接；

曝光融合网络中的第五卷积层至第七卷积层各自通过卷积核对输入的特征图进行重建，第五卷积层的输入为F_fusion，将第五卷积层的输出记为I_enhanced,5，I_enhanced,5＝A(W_5D*F_fusion+b_5D)，其中，第五卷积层的激活函数为指数线性单元(Exponential Linear Unit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，第五卷积层的卷积步长为1，第五卷积层输入的通道数为m_5D，第五卷积层输出的通道数为n_5D，W_5D表示第五卷积层的卷积核，W_5D的维数为k_5D×k_5D，b_5D表示维数为1×n_5D的偏置项；令g表示卷积层的索引号，g＝6,7，g＝6时代表第六卷积层，g＝7时代表第七卷积层，索引号为g的卷积层的输入为I_enhanced,g-1，将索引号为g的卷积层的输出记为I_enhanced,g，I_enhanced,g＝A(W_gD*I_enhanced,g-1+b_gD)，其中，索引号为g的卷积层的激活函数为指数线性单元(Exponential Linear Unit，ELU)函数，A()表示指数线性单元(Exponential Linear Unit，ELU)函数，索引号为g的卷积层的卷积步长为1，索引号为g的卷积层输入的通道数为m_gD，索引号为g的卷积层输出的通道数为n_gD，W_gD表示索引号为g的卷积层的卷积核，W_gD的维数为k_gD×k_gD，b_gD表示维数为1×n_gD的偏置项；在此，由于曝光融合网络是完成图像信息的合理融合，所以不需要进行下采样，设置卷积步长为1，并通过零填充保证卷积后的图像尺寸保持不变。

在本实施例中，步骤一中，取k_1e＝7，m_1e＝3，n_1e＝32；k_2e＝5，m_2e＝32，n_2e＝64；k_3e＝3，m_3e＝64，n_3e＝128；k_4e＝3，m_4e＝128，n_4e＝256；k_1d＝3，m_1d＝256，n_1d＝128；k_2d＝3，m_2d＝128，n_2d＝64；k_3d＝5，m_3d＝64，n_3d＝32；k_4d＝7，m_4d＝32，n_4d＝32；k_1s＝1，m_1s＝256，n_1s＝128；k_2s＝1，m_2s＝128，n_2s＝64；k_3s＝1，m_3s＝64，n_3s＝32；k_p＝1，m_p＝32，n_p＝3。取k_1E＝3，m_1E＝3，n_1E＝16；k_2E＝3，m_2E＝16，n_2E＝32；k_3E＝3，m_3E＝32，n_3E＝32；k_fusion＝1，m_fusion＝96，n_fusion＝32；k_5D＝3，m_5D＝32，n_5D＝32；k_6D＝3，m_6D＝32，n_6D＝16；k_7D＝3，m_7D＝16，n_7D＝3。

步骤二：选取个多曝光序列，且设定每个多曝光序列对应有一幅已知的高质量的融合图像，其中，在本实施例中取多曝光序列可以采用现有的多曝光序列数据库中的多曝光序列，也可以自行构建，若多曝光序列直接采用现有的多曝光序列，则高质量的融合图像在相应的数据库中已提供，若多曝光序列是自行构建的，则可以采用现有的多种融合方法对多曝光序列进行处理得到高质量的融合图像；然后将所有多曝光序列中的正常曝光图像和低曝光图像构成第一预测训练集，并将所有多曝光序列中的正常曝光图像和高曝光图像构成第二预测训练集；接着将第一预测训练集中的低曝光图像作为标签图像，将第一预测训练集中的正常曝光图像记为I_normal并作为输入，输入到构建好的预测曝光网络中进行训练，训练得到对应的预测低曝光图像，记为I_low，即I_out为I_low；并将第二预测训练集中的高曝光图像作为标签图像，将第二预测训练集中的正常曝光图像记为I_normal并作为输入，输入到构建好的预测曝光网络中进行训练，训练得到对应的预测高曝光图像，记为I_high，即I_out为I_high；之后将所有多曝光序列中的正常曝光图像I_normal、对应的预测低曝光图像I_low、对应的预测高曝光图像I_high、对应的高质量的融合图像构成融合训练集；再将融合训练集中的高质量的融合图像作为标签图像，将融合训练集中的正常曝光图像I_normal、对应的预测低曝光图像I_low、对应的预测高曝光图像I_high作为输入，输入到构建好的曝光融合网络中进行训练，训练得到对应的增强图像，记为I_enhanced，即I_enhanced,7为I_enhanced；训练结束后得到了预测曝光网络和曝光融合网络中的各卷积核的最佳参数及对应的最佳偏置项，得到了级联训练网络。

为了进一步说明本发明方法的可行性和有效性，进行如下实验。

本发明方法采用TensorFlow框架实现。训练用的多曝光序列来自Cai等人提供的数据库，由于该数据库中的每个多曝光序列中的图像的数目超过3幅，所以定义正常曝光图像为多曝光序列中的中间曝光图像，即将多曝光序列中的图像按曝光时间进行排序，设图像的总幅数为M(M≥3)，挑选第幅图像作为正常曝光图像，并分别挑选曝光时间小于正常曝光图像的低曝光图像，以及曝光时间大于正常曝光图像的高曝光图像。为增加训练样本，并且避免大量训练样本的内容出现重复现象，对每幅正常曝光图像及其对应的低曝光图像和对应的高曝光图像进行下采样，使其分辨率降低为原来的1/4，并根据步长64，将每幅正常曝光图像及其对应的低曝光图像和对应的高曝光图像裁剪为128×128的图像块，同样，高质量的融合图像也进行相同处理，裁剪为128×128的图像块。

为测试本发明方法的普适性，采用不同于训练样本的图像进行测试。使用的测试图像包含室内、外场景，其基本信息如表1所示。

表1测试图像信息

多曝光序列名称	分辨率	图像数量	测试图像序号
				Balloons	512×352	9	7
CadikLamp	512×384	15	6
				Candle	512×352	10	5
Chinese_garden	512×352	3	2
				Farmhouse	512×352	3	2
Lamp	512×352	6	3
				MadisonCapitol	512×384	30	15
Office	512×352	6	4
				Tower	352×512	3	2

设预测曝光网络和曝光融合网络的初始学习率均为10^-3，并在完成一次训练后，以0.98的衰减系数衰减学习率。预测曝光网络和曝光融合网络中的所有卷积核的参数和偏置项的初始值均采用均值为0、标准差为0.1的高斯分布随机值。

为了说明本发明方法的性能，将本发明方法与现有的五种单图像增强方法进行对比，用于对比的五种单图像增强方法分别为三种基于像素域的方法：Celik提出的CVC模型、Lee提出的CE模型、Fu提出的WVM模型，以及两种基于辐照域的方法：Huo提出的PITM模型和Eilertsen提出的HDRCNN模型。实验中采用PSNR、SSIM和FSIM三种图像质量客观评价方式来评价各种单图像增强方法得到的增强图像的质量，其中，PSNR衡量增强图像与参考图像的像素差异，SSIM和FSIM从视觉感知角度出发，衡量增强图像与参考图像的结构差异。表2给出了分别采用本发明方法与现有的五种单图像增强方法对表1所列的多曝光序列进行处理得到的增强图像在PSNR指标上的对比结果，表3给出了分别采用本发明方法与现有的五种单图像增强方法对表1所列的多曝光序列进行处理得到的增强图像在SSIM指标上的对比结果，表4给出了分别采用本发明方法与现有的五种单图像增强方法对表1所列的多曝光序列进行处理得到的增强图像在FSIM指标上的对比结果。从表2至表4所列的数据可以看出，采用本发明方法在PSNR、SSIM和FSIM指标上均高于采用现有的五种单图像增强方法，其中，本发明方法相比于性能较好的Fu提出的WVM模型和Eilertsen提出的HDRCNN模型，在PSNR值上分别提升了2.4474dB和3.0259dB，在SSIM指标上分别提升了0.0356和0.1073，在FSIM指标上提升了0.0082和0.0505。

表2采用本发明方法与现有的五种单图像增强方法在PSNR(dB)指标上的对比

表3采用本发明方法与现有的五种单图像增强方法在SSIM指标上的对比

表4采用本发明方法与现有的五种单图像增强方法在FSIM指标上的对比

图4a给出了Balloons多曝光图像序列中的第7幅图像，图4b给出了采用Huo提出的PITM模型对图4a所示的图像进行处理得到的增强图像，图4c给出了采用Eilertsen提出的HDRCNN模型对图4a所示的图像进行处理得到的增强图像，图4d给出了采用Fu提出的WVM模型对图4a所示的图像进行处理得到的增强图像，图4e给出了采用Celik提出的CVC模型对图4a所示的图像进行处理得到的增强图像，图4f给出了采用Lee提出的CE模型对图4a所示的图像进行处理得到的增强图像，图4g给出了采用本发明方法对图4a所示的图像进行处理得到的增强图像，图4h给出了图4a所示的图像对应的高质量的融合图像；图5a给出了Lamp多曝光图像序列中的第3幅图像，图5b给出了采用Huo提出的PITM模型对图5a所示的图像进行处理得到的增强图像，图5c给出了采用Eilertsen提出的HDRCNN模型对图5a所示的图像进行处理得到的增强图像，图5d给出了采用Fu提出的WVM模型对图5a所示的图像进行处理得到的增强图像，图5e给出了采用Celik提出的CVC模型对图5a所示的图像进行处理得到的增强图像，图5f给出了采用Lee提出的CE模型对图5a所示的图像进行处理得到的增强图像，图5g给出了采用本发明方法对图5a所示的图像进行处理得到的增强图像，图5h给出了图5a所示的图像对应的高质量的融合图像。从图4a至图5h中可以看出，Huo提出的PITM模型、Celik提出的CVC模型和Lee提出的CE模型只能提高图像整体的对比度，无法恢复图像的细节，比如图4b、图4e、图4f的天空区域和图5b、图5e、图5f两侧的墙壁区域；Eilertsen提出的HDRCNN模型会造成图像颜色失真，比如图4c的太阳区域和图5c的整体色彩；Fu提出的WVM模型能恢复一定细节，但本发明方法增强的图像细节更丰富，并且颜色更自然，比如图4g的天空和气球区域。

本发明方法的创新性主要体现如下：传统的单图像增强方法只考虑恢复原图像中隐藏的细节信息，不包括由于相机传感器的动态范围限制而导致丢失的信息，本发明方法通过网络分别学习单图像与低曝光图像以及单图像与高曝光图像的映射关系，以此产生一个能较好表征整个场景信息的多曝光序列；同时针对自然场景内容的丰富性，采用数据驱动的方式，利用卷积神经网络来提取融合特征，使特征的鲁棒性和多样性更强。

Claims

1.一种基于全卷积神经网络的单图像增强方法，其特征在于包括以下步骤：

2.根据权利要求1所述的一种基于全卷积神经网络的单图像增强方法，其特征在于所述的步骤一中，取k_1e＝7，m_1e＝3，n_1e＝32；k_2e＝5，m_2e＝32，n_2e＝64；k_3e＝3，m_3e＝64，n_3e＝128；k_4e＝3，m_4e＝128，n_4e＝256；k_1d＝3，m_1d＝256，n_1d＝128；k_2d＝3，m_2d＝128，n_2d＝64；k_3d＝5，m_3d＝64，n_3d＝32；k_4d＝7，m_4d＝32，n_4d＝32；k_1s＝1，m_1s＝256，n_1s＝128；k_2s＝1，m_2s＝128，n_2s＝64；k_3s＝1，m_3s＝64，n_3s＝32；k_p＝1，m_p＝32，n_p＝3；