CN111798400A

CN111798400A - 基于生成对抗网络的无参考低光照图像增强方法及系统

Info

Publication number: CN111798400A
Application number: CN202010700648.5A
Authority: CN
Inventors: 牛玉贞; 宋冰蕊; 吴建斌; 刘文犀
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2020-07-20
Filing date: 2020-07-20
Publication date: 2020-10-20
Anticipated expiration: 2040-07-20
Also published as: CN111798400B

Abstract

本发明涉及一种基于生成对抗网络的无参考低光照图像增强方法及系统，该方法包括以下步骤：分别对原始分辨率的低光照图像和正常光照图像进行预处理，得到用于训练的不成对的低光照图像块和正常光照图像块；构建用于低光照增强的生成器网络和用于进行对抗训练的判别器网络；使用低光照图像块和正常光照图像块交替训练生成器网络和判别器网络收敛到纳什平衡；将用于测试的原始低光照图像输入训练好的生成器网络预测其增强后的图像。该方法及系统有利于提高低光照图像增强的质量。

Description

基于生成对抗网络的无参考低光照图像增强方法及系统

技术领域

本发明属于图像和视频处理技术领域，特别涉及一种基于生成对抗网络的无参考低光照图像增强方法及系统。

背景技术

随着拍摄设备越来越普及且便携，人们可以拍摄到视觉效果好的图像。但是在光线不足的场景下，如夜景或昏暗的室内，要得到视觉效果良好的摄影图像仍然是十分困难的。由于场景光线不足或背光拍摄，捕获到的图像会呈现曝光不足，这类图像被称作低光照图像。低光照图像中的某些区域几乎看不到图像细节。低光照图像不仅呈现较低视觉效果，而且会影响许多基本的计算机视觉和图像处理方法的性能，如图像分类、图像显著性检测、对象检测和识别等。

目前，基于深度学习的图像增强方法通常能获得比其它方法更好的结果。但是基于深度学习的图像增强方法，普遍需要使用成对的图像对进行训练。然而，在低光照图像增强问题上，获得可用于深度学习模型训练的成对数据集是很困难的。现有的低光照图像增强方法大多使用合成的成对低光照图像数据集，由于合成数据集于真实图像存在差异，导致使用合成数据集训练的方法在真实场景下图像增强能力无法得到保证。

发明内容

本发明的目的在于提供一种基于生成对抗网络的无参考低光照图像增强方法及系统，该方法及系统有利于提高低光照图像增强的质量。

为实现上述目的，本发明采用的技术方案是：一种基于生成对抗网络的无参考低光照图像增强方法，包括以下步骤：

分别对原始分辨率的低光照图像和正常光照图像进行预处理，得到用于训练的不成对的低光照图像块和正常光照图像块；

构建用于低光照增强的生成器网络和用于进行对抗训练的判别器网络；

使用低光照图像块和正常光照图像块交替训练生成器网络和判别器网络收敛到纳什平衡；

将用于测试的原始低光照图像输入训练好的生成器网络预测其增强后的图像。

进一步地，对原始分辨率的低光照图像和正常光照图像进行预处理的具体方法为：

分别将原始分辨率的低光照图像、正常光照图像在随机位置上进行切块，其中切块大小随机选取128×128到320×320之间的正方形尺寸，然后将得到的切块统一缩小到128×128大小，作为训练用的低光照图像块和正常光照图像块；

分别将得到的低光照图像块和正常光照图像块进行随机的旋转和翻转，并且使用如下公式缩放图像的像素范围，得到用于训练的不成对的低光照图像块和正常光照图像块数据集；

其中，I^ori为像素值范围处于[0，255]的原始图像，I是经过缩放后像素范围处于[-1，1]的图像。

进一步地，构建用于低光照增强的生成器网络的具体方法为：

生成器网络采用U-Net结构，包含编码器和解码器两部分，分别包含3次下采样提取图像特征和3次上采样还原输出图像，并将各尺度的编码器输出特征跳连到解码器部分对应层的输入中；其中编码器的下采样由步长为2、卷积核大小为3×3的卷积操作完成，解码器的上采样由最近邻插值的方式进行；在编码器部分，使用卷积、批归一化和带泄漏修正线性单元Leaky ReLU激活进行图像特征提取；在解码器部分，使用卷积、层归一化、LeakyReLU激活和上采样操作来还原增强图像；

通过卷积子网络将输入的低光照图像编码成具有全局语义信息的潜在编码，使用潜在编码对编码器部分最后的输出特征进行自适应实例归一化，以实现适应不同亮度的输入低光照图像的特征调整；

分别将多尺度权重图与解码器的每层输出特征进行自注意力融合，通过将权重图融合到解码器特征中，以强化低光照区域的特征表达。

进一步地，通过卷积子网络将输入的低光照图像编码成具有全局语义信息的潜在编码，使用潜在编码对编码器部分最后的输出特征进行自适应实例归一化，其具体方法为：

用一个由五个串联的步长为2、卷积核大小为4×4的卷积层、Leaky ReLU激活函数和一个全连接层组成子网络f(.)，将输入的低光照图像I转换为一维的潜在编码，使用通过潜在编码学习到的特征变换系数对归一化后的特征进行变换，如以下公式：

其中，I为输入的低光照图像，x为图像I经过编码器部分输出的最后一个特征图，x′表示特征图x经过自适应实例归一化后的结果，σ(x)和μ(x)分别是特征图x在宽、高维度上的均值和标准差，f(I)是利用子网络从图像I计算得到一维的潜在编码，σ_f(f(I))和μ_f(f(I))分别是由一个全连接层从潜在编码学习出的特征变化系数，用于对归一化后的特征图x进行变换。

进一步地，分别将多尺度权重图与解码器的每层输出特征进行自注意力融合，具体包括以下步骤：

分别对解码器的每一层计算对应的权重图，然后使用权重图对每一层解码器特征进行自注意力融合；在解码器的每一层，首先使用双线性插值将输入图像I的宽、高缩小到对应解码器层中特征图的大小，再将每个RGB像素视为三维向量并计算其欧几里德范数，得到一张权重图M；

然后对权重图M使用卷积操作，为原始的解码器输出特征f_c的每个通道学习空间权重图，得到M_c，将解码器特征f_c和空间权重图M_c进行点乘得到f′_c，完成空间注意力计算，再将f′_c进行全局平均池化得到一维向量，对池化后的一维向量使用全连接层进行压缩和扩张，得到通道注意力向量V_c，将通道注意力向量V_c点乘f′_c完成通道注意力计算，得到的输出特征作为该层最终的解码器输出特征。

进一步地，构建的判别器网络包括全局判别器网络和局部判别器网络，所述全局判别器含有1层步长为1、卷积核大小为1×1的卷积层和五层串联的步长为2、卷积核大小为4×4的卷积层，卷积层后使用LeakyReLU函数激活，将输入图像的空间大小从128×128降到4×4，再经过展平后使用串联的全连接层和LeakyReLU层合并全局图像信息，最后使用一个全连接层预测判别结果；判别结果分为两类，即真实的正常光照图像和生成的正常光照图像；

所述局部判别器含有1层步长为1、卷积核大小为1×1的卷积层和五层串联的步长为2，卷积核大小为4×4的卷积层，卷积层后使用LeakyReLU函数激活，将输入图像转变成特征矩阵，最后使用全连接层将该特征矩阵变换为输出的预测矩阵；局部判别器的预测矩阵中每个位置的值对应于原始输入中94×94大小的像素块，故预测矩阵中的每个值表示对输入图中对应位置块的判别结果。

进一步地，使用低光照图像块和正常光照图像块交替训练生成器网络和判别器网络收敛到纳什平衡，具体包括以下步骤：

将低光照图像块随机划分为多个批次，每个批次包含N个图像块；

将正常光照图像块随机划分为多个批次，每个批次包含N个图像块；

将低光照图像块按批次输入生成器网络得到增强图像块，将增强图像块和正常光照图像块按批次分别输入全局判别器网络和局部判别器网络得到判别结果；

根据生成器网络的总目标损失函数，使用反向传播方法计算生成器网络中各参数的梯度，并利用随机梯度下降方法更新生成器网络的参数；

根据判别器网络的总目标损失函数，使用反向传播方法计算全局判别器网络和局部判别器网络中各参数的梯度，并利用随机梯度下降方法更新全局判别器网络和局部判别器网络的参数；

以批次为单位重复进行上述步骤，直至生成器网络的目标损失函数数值和判别器网络的目标损失函数数值收敛到纳什平衡，保存网络参数，完成生成器和判别器网络训练过程。

进一步地，所述生成器网络的总目标损失函数计算如下：

其中，

和

分别是全局判别器对生成器的损失、局部判别器对生成器的损失、自颜色损失和总变分损失，λ₁、λ₂、λ₃和λ₄是各项损失平衡系数，·为实数的点乘操作；其中各项损失具体的计算公式如下：

其中，z表示低光照图像，Q为低光照图像分布，

为计算每个批次内图像对应的均值，D^global和D^local分别是全局判别器和局部判别器，G表示生成器网络；

为了计算自颜色损失

首先对输入的低光照图像I进行处理得到颜色图I^c，该处理公式如下：

其中，I为像素范围处于[-1，1]的输入图像，μ_l(I)和σ_l(I)分别是在输入图像I的宽、高和通道数三个维度上的均值和标准差，I^c是图像I对应的颜色图；然后使用如下公式计算

其中，I_i′为该批次内第i张低光照图像I_i经生成器输出的增强结果，

是该批次内第i张低光照图像I_i对应的颜色图，M是每一张图像内的像素数量，

和I′_i(j)分别是图像

和I_i′对应于j位置的RGB像素组成的一维向量，||.||₂表示欧几里得范数，||.||₁表示绝对值范数，·和×分别代表实数点乘和向量点积运算符，

表示计算图像空间维度的梯度，

和

分别表示梯度图

和

中位置j上的值，λ_sc是权重系数；

其中，I_i″为该批次内第i张低光照图像I_i经生成器输出的增强结果，N为该批次内低光照图像的数量，H、W分别表示每一张图像的高和宽，I′_i(w，h，c)表示生成器输出的增强结果图像I′_i中(w，h，c)位置的像素值，|·|为取绝对值操作，·为实数的点乘操作。

进一步地，所述判别器网络的总目标损失函数计算如下：

其中，

和

分别为全局判别器和局部判别器的损失函数，λ₅和λ₆分别为两个损失函数的系数，·为实数的点乘操作，其中各项损失具体的计算公式如下：

其中，x和z分别表示正常光照图像和低光照图像，P和Q分别表示正常光照图像分布和低光照图像分布，max表示取最大值操作，

为计算每个批次内图像对应的均值，D^global和D^local分别是全局判别器和局部判别器，G表示生成器网络。

本发明还提供了一种基于生成对抗网络的无参考低光照图像增强系统，包括存储器、处理器以及存储于存储器上并能够在处理器上运行的计算机程序，当处理器运行该计算机程序时，实现如权利要求1-9任一项所述的方法步骤。

与现有技术相比，本发明具有以下有益效果：本发明使用生成对抗网络的训练方式，能够不依赖于成对的低光照图像和正常光照图像，结合低光照图像全局信息的自适应实例归一化能够对不同程度的低光照图像进行合适的增强，并且通过基于空间和通道的自注意力融合提高恢复图像的结构和细节信息，再使用自颜色损失还原低光照图像的颜色，进一步提升了低光照图像增强的性能，具有很强的实用性和广阔的应用前景。

附图说明

图1为本发明实施例的方法实现流程图。

图2为本发明实施例中生成器网络结构示意图。

图3为本发明实施例中自注意力融合操作示意图。

图4为本发明实施例中判别器网络结构示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出，以下详细说明都是示例性的，旨在对本申请提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示，本发明提供了一种基于生成对抗网络的无参考低光照图像增强方法，包括以下步骤：

S1、分别对原始分辨率的低光照图像和正常光照图像进行预处理，得到用于训练的不成对的低光照图像块和正常光照图像块。

S2、构建用于低光照增强的生成器网络和用于进行对抗训练的判别器网络。

S3、使用低光照图像块和正常光照图像块交替训练生成器网络和判别器网络收敛到纳什平衡。

S4、将用于测试的原始低光照图像输入训练好的生成器网络预测其增强后的图像。

在步骤S1中，对原始分辨率的低光照图像和正常光照图像进行预处理的具体方法为：

在步骤S2中，构建用于低光照增强的生成器网络的具体方法为：

生成器网络采用U-Net结构(U-Net:Convolutional Networks for BiomedicalImage Segmentaion,arXiv:1505.04597)，如图2所示，包含编码器和解码器两部分，分别包含3次下采样提取图像特征和3次上采样还原输出图像，并将各尺度的编码器输出特征跳连到解码器部分对应层的输入中；其中编码器的下采样由步长为2、卷积核大小为3×3的卷积操作完成，解码器的上采样由最近邻插值的方式进行；在编码器部分，使用卷积、批归一化和带泄漏修正线性单元Leaky ReLU(Leaky Rectified Linear Unit，Leaky ReLU)激活进行图像特征提取；在解码器部分，使用卷积、层归一化、Leaky ReLU激活和上采样操作来还原增强图像。

通过卷积子网络将输入的低光照图像编码成具有全局语义信息的潜在编码，使用潜在编码对编码器部分最后的输出特征进行自适应实例归一化，其具体方法为：

如图2所示，用一个由五个串联的步长为2、卷积核大小为4×4的卷积层、LeakyReLU激活函数和一个全连接层组成子网络f(.)，将输入的低光照图像I转换为一维的潜在编码，使用通过潜在编码学习到的特征变换系数对归一化后的特征进行变换，如以下公式：

分别将多尺度权重图与解码器的每层输出特征进行自注意力融合，其具体包括以下步骤：

如图3所示，分别对解码器的每一层计算对应的权重图，然后使用权重图对每一层解码器特征进行自注意力融合；在解码器的每一层，首先使用双线性插值将输入图像I的宽、高缩小到对应解码器层中特征图的大小，再将每个RGB像素视为三维向量并计算其欧几里德范数(Euclidean norm)，得到一张权重图M；

然后对权重图M使用卷积操作，为原始的解码器输入特征f_c的每个通道学习空间权重图，得到M_c，将解码器特征f_c和空间权重图M_c进行点乘得到f′_c，完成空间注意力计算，再将f′_c进行全局平均池化得到一维向量，对池化后的一维向量使用全连接层进行压缩和扩张，得到通道注意力向量V_c，将通道注意力向量V_c点乘f′_c完成通道注意力计算，得到的输出特征作为该层最终的解码器输出特征。

如图4所示，在步骤S2中，构建的判别器网络包括全局判别器网络和局部判别器网络，所述全局判别器含有1层步长为1、卷积核大小为1×1的卷积层和五层串联的步长为2、卷积核大小为4×4的卷积层，卷积层后使用Leaky ReLU函数激活，将输入图像的空间大小从128×128降到4×4，再经过展平后使用串联的全连接层和Leaky ReLU层合并全局图像信息，最后使用一个全连接层预测判别结果；判别结果分为两类，即真实的正常光照图像和生成的正常光照图像。

所述局部判别器含有1层步长为1、卷积核大小为1×1的卷积层和五层串联的步长为2、卷积核大小为4×4的卷积层，卷积层后使用Leaky ReLU函数激活，将输入图像转变成特征矩阵，最后使用全连接层将该特征矩阵变换为输出的预测矩阵；局部判别器的预测矩阵中每个位置的值对应于原始输入中94×94大小的像素块，故预测矩阵中的每个值表示对输入图中对应位置块的判别结果。

在步骤S3中，使用低光照图像块和正常光照图像块交替训练生成器网络和判别器网络收敛到纳什平衡，具体包括以下步骤：

其中，所述生成器网络的总目标损失函数计算如下：

其中，

和

其中，z表示低光照图像，Q为低光照图像分布，

为了计算自颜色损失

和I′_i(j)分别是图像

表示计算图像空间维度的梯度，

和

分别表示梯度图

和

中位置j上的值，λ_sc是权重系数；

其中，I_i′为该批次内第i张低光照图像I_i经生成器输出的增强结果，N为该批次内低光照图像的数量，H、W分别表示每一张图像的高和宽，I′_i(w，h，c)表示生成器输出的增强结果图像I′_i中(w，h，c)位置的像素值，|．|为取绝对值操作，·为实数的点乘操作。

所述判别器网络的总目标损失函数计算如下：

其中，

和

本发明还提供了一种基于生成对抗网络的无参考低光照图像增强系统，包括存储器、处理器以及存储于存储器上并能够在处理器上运行的计算机程序，当处理器运行该计算机程序时，实现上述的方法步骤。

本发明使用不成对的低光照图像和正常光照图像，将低光照图像的编码器特征使用基于空间和通道的自注意力融合操作和结合低光照图像全局信息的自适应实例归一化操作来恢复图像的结构和细节信息，再使用生成对抗思想和自颜色损失还原低光照图像的颜色，进一步提升了低光照图像增强的性能，对比现有的无参考低光照图像增强方法，该方法能显著提高低光照图像的增强效果。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅是本发明的较佳实施例而已，并非是对本发明作其它形式的限制，任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型，仍属于本发明技术方案的保护范围。

Claims

1.一种基于生成对抗网络的无参考低光照图像增强方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于生成对抗网络的无参考低光照图像增强方法，其特征在于，对原始分辨率的低光照图像和正常光照图像进行预处理的具体方法为：

3.根据权利要求2所述的基于生成对抗网络的无参考低光照图像增强方法，其特征在于，构建用于低光照增强的生成器网络的具体方法为：

生成器网络采用U-Net结构，包含编码器和解码器两部分，分别包含3次下采样提取图像特征和3次上采样还原输出图像，并将各尺度的编码器输出特征跳连到解码器部分对应层的输入中；其中编码器的下采样由步长为2、卷积核大小为3×3的卷积操作完成，解码器的上采样由最近邻插值的方式进行；在编码器部分，使用卷积、批归一化和带泄漏修正线性单元Leaky ReLU激活进行图像特征提取；在解码器部分，使用卷积、层归一化、Leaky ReLU激活和上采样操作来还原增强图像；

分别将多尺度权重图与解码器的每层输出特征进行自注意力融合，通过将权重图融合到解码器特征中，以实现强化低光照区域的特征表达。

4.根据权利要求3所述的基于生成对抗网络的无参考低光照图像增强方法，其特征在于，通过卷积子网络将输入的低光照图像编码成具有全局语义信息的潜在编码，使用潜在编码对编码器部分最后的输出特征进行自适应实例归一化，其具体方法为：

5.根据权利要求3所述的基于生成对抗网络的无参考低光照图像增强方法，其特征在于，分别将多尺度权重图与解码器的每层输出特征进行自注意力融合，具体包括以下步骤：

6.根据权利要求3所述的基于生成对抗网络的无参考低光照图像增强方法，其特征在于，构建的判别器网络包括全局判别器网络和局部判别器网络，所述全局判别器含有1层步长为1、卷积核大小为1×1的卷积层和五层串联的步长为2、卷积核大小为4×4的卷积层，卷积层后使用Leaky ReLU函数激活，将输入图像的空间大小从128×128降到4×4，再经过展平后使用串联的全连接层和Leaky ReLU层合并全局图像信息，最后使用一个全连接层预测判别结果；判别结果分为两类，即真实的正常光照图像和生成的正常光照图像；

7.根据权利要求6所述的基于生成对抗网络的无参考低光照图像增强方法，其特征在于，使用低光照图像块和正常光照图像块交替训练生成器网络和判别器网络收敛到纳什平衡，具体包括以下步骤：

8.根据权利要求7所述的基于生成对抗网络的无参考低光照图像增强方法，其特征在于，所述生成器网络的总目标损失函数计算如下：