CN116596809A

CN116596809A - 一种基于Residual-Unet网络的低照度图像增强方法

Info

Publication number: CN116596809A
Application number: CN202310623249.7A
Authority: CN
Inventors: 胡长晖; 王思雨
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2023-05-30
Filing date: 2023-05-30
Publication date: 2023-08-15

Abstract

本发明公开了一种基于Residual‑Unet网络的低照度图像增强方法，属于低照度图像增强技术领域；包括以下步骤：数据预处理；获取待增强图像，并对其进行直方图均衡化预处理；构建基于Residual‑Unet的低照度图像增强网络，并完成网络训练；将待增强图像与经过直方图均衡化预处理后的图像进行合并，输入基于Residual‑Unet的低照度图像增强网络，由基于Residual‑Unet的低照度图像增强网络输出增强后的图像。本发明在传统的残差网络结构之上，取消了residual网络中的所有批量归一化操作，将第二权重层由简单的卷积层和激活层替换为整个Unet卷积神经网络，减少光照变化的影响，丰富待增强图像的可视化信息；避免了不相关的信息对增强结果造成影响，加快模型的收敛，同时实现增强视觉效果，显著提升峰值信噪比。

Description

一种基于Residual-Unet网络的低照度图像增强方法

技术领域

本发明属于低照度图像增强技术领域，具体是一种基于Residual-Unet网络的低照度图像增强方法。

背景技术

在照明条件不佳的情况下拍摄的图像被认为是低照度图像，而在良好照明条件下拍摄得到的图像被认为是正常曝光图像。与正常曝光图像相比，低照度图像主要表现出对比度低、可读性差、颜色失真、纹理特征不清晰以及含有大量噪声等问题。由于缺乏光照，该类图像的灰度值总体偏小，像素值分布集中且图像整体偏暗，轮廓等边缘像素的灰度值与非边缘的邻域像素的灰度值差距较小导致了细节信息被弱化。这些问题不仅深刻影响着人们在日常生产生活中对高质量图像的需求，更不利于夜间监控、目标检测、人脸识别等对图像质量要求更高的计算机视觉领域的实际应用。

在传统的弱光照图像增强方法中研究最多的是直方图均衡化方法以及基于Retinex的方法，前者由于只是从数学角度出发，不考虑弱光照图像成像过程的物理模型和去噪问题，导致处理效果往往不能尽如人意，后者由于需要精心设计光照估计模型，对于不同场景下的弱光照图像泛化能力较弱，因此应用十分有限。基于深度学习的方法则主要分为有监督的成对训练和无监督的单图像训练，前者所能使用的数据集有限，但利用简单的损失函数就可以取得较好的效果，后者数据集相对易得，但是对于网络结构以及损失函数的设计要求更高。同时，基于深度学习的方法普遍共存的一个问题是，随着的网络的加深，为了节省计算资源，不得不对图像的尺寸进行缩小，这意味着神经网络在层数加深的同时感受野将越来越小。基于Residual-Unet网络的低照度图像增强方法属于有监督的成对训练方法，但平衡了图像光照增强网络的处理深度和感受野的关系，在此基础上取得良好的增强效果。

发明内容

本发明的目的在于提供一种基于Residual-Unet网络的低照度图像增强方法，以解决深度神经网络在不断加深的过程中缺乏对全局信息的捕获能力。

本发明目的是这样实现的：一种基于Residual-Unet网络的低照度图像增强方法，包括以下步骤：

步骤S1：数据预处理；

获取待增强图像，并对其进行直方图均衡化预处理；

步骤S2：构建基于Residual-Unet的低照度图像增强网络，并完成网络训练；

所述基于Residual-Unet的低照度图像增强网络包括：浅层特征编码块、Residual-Unet深层特征处理块、双通道注意力机制块与上采样块；

步骤S3：将步骤S1中待增强图像与经过直方图均衡化预处理后的图像进行合并，输入步骤S2中基于Residual-Unet的低照度图像增强网络，由基于Residual-Unet的低照度图像增强网络输出增强后的图像。

优选的，所述浅层特征编码块包括卷积层C₁、激活层R₁、卷积层C₂与最大池化层P₁，卷积层C₁、激活层R₁、卷积层C₂与最大池化层P₁依次连接；所述Residual-Unet深层特征处理块由4个Rs-Unet子块依次连接构成，且在每两个Rs-Unet子块间嵌入结构相同的卷积层C₃；

所述双通道注意力机制块由空间注意力机制子块和通道注意力机制子块并联构成，上采样块由依次连接的插值采样层I、卷积层C₁₀与激活层R₄构成。

优选的，所述Rs-Unet子块包括第一权重层、Unet卷积神经网络与卷积层C₄，第一权重层、Unet卷积神经网络与卷积层C₄依次连接，引入残差结构并将第一权重层的输入与Unet卷积神经网络的输出进行合并作为卷积层C₄的输入；

所述第一权重层由依次连接的卷积层C₅与激活层R₂构成，Unet卷积神经网络包括下采样特征提取子块、通道扩展子块E与上采样特征提取子块构成。

优选的，所述下采样特征提取子块包括下采样特征提取子块D₁、下采样特征提取子块D₂、下采样特征提取子块D₃以及下采样特征提取子块D₄；

所述上采样特征提取子块包括上采样特征提取子块U₁、上采样特征提取子块U₂、上采样特征提取子块U₃以及上采样特征提取子块U₄；

所述Unet卷积神经网络由依次连接的4个下采样特征提取子块、1个通道扩展子块E与4个上采样特征提取子块构成。

优选的，所述下采样特征提取子块D₁由依次连接的卷积层C_D1-1、激活层R_Unet、卷积层C_D1-2、激活层R_Unet与池化层P_Unet构成，下采样特征提取子块D₂由依次连接的卷积层C_D2-1、激活层R_Unet、卷积层C_D2-2、激活层R_Unet与池化层P_Unet构成，下采样特征提取子块D₃由依次连接的卷积层C_D3-1、激活层R_Unet、卷积层C_D3-2、激活层R_Unet与池化层P_Unet构成，下采样特征提取子块D₄由依次连接的卷积层C_D4-1、激活层R_Unet、卷积层C_D4-2、激活层R_Unet与池化层P_Unet构成；

所述通道扩展子块E由依次连接的卷积层C_E1-1、激活层R_Unet、卷积层C_E1-2与激活层R_Unet构成；

所述上采样特征提取子块U₁由依次连接的转置卷积层T₁、卷积层C_U1-1、激活层R_Unet、卷积层C_U1-2与激活层R_Unet构成，上采样特征提取子块U₂由依次连接的转置卷积层T₂、卷积层C_U2-1、激活层R_Unet、卷积层C_U2-2与激活层R_Unet构成，上采样特征提取子块U₃由依次连接的转置卷积层T₃、卷积层C_U3-1、激活层R_Unet、卷积层C_U3-2与激活层R_Unet构成，上采样特征提取子块U₄由依次连接的转置卷积层T₄、卷积层C_U4-1、激活层R_Unet、卷积层C_U4-2与激活层R_Unet构成，且转置卷积层T₁、T₂、T₃、T₄的输出分别与卷积层C_D4-2、C_D3-2、C_D2-2、C_D1-2的输出进行合并分别作为卷积层C_U1-1、C_U2-1、C_U3-1和C_U4-1的输入。

优选的，所述空间注意力机制子块由依次连接的双通道池化模块和基础卷积模块构成，双通道池化模块由全局平均池化层P₃和全局最大池化层P₄并联构成，且P₃和P₄的输出将被合并后作为双通道池化模块的输出；所述基础卷积模块由卷积层C₆和激活层R_M构成，通道注意力机制子块由依次连接的自适应平均池化层P₂和特征维度变换模块构成；所述特征维度变换模块由卷积层C₇、激活层R₃、卷积层C₈与激活层R_M构成；

所述空间注意力机制与通道注意力机制将分别生成空间注意力图和通道注意力图并分别作用于原始输入特征后进行合并，再经过卷积层C₉处理与原始特征进行像素和处理，像素和结果作为所述双通道注意力机制块的输出。

优选的，所述卷积层C₁的卷积核尺寸为3×3、输入通道为6、输出通道为16、padding为1；激活层R₁为LeakyReLU且negative_slope为0.2；卷积层C₂的卷积核尺寸为3×3、输入通道为16、输出通道为32、padding为1；最大池化层P₁的卷积核大小为2×2，stride为2；卷积层C₃的卷积核尺寸为3×3、输入通道为64、输出通道为32、padding为1；卷积层C₄与卷积层C₃参数相同；卷积层C₅的卷积核尺寸为3×3、输入通道为32、输出通道为32、padding为1；激活层R₂为ReLU函数。

优选的，所述卷积层C_D1-1与卷积层C_D1-2的参数相同，均为：卷积核尺寸为3×3、输入通道为32、输出通道为32、padding为1；卷积层C_D2-1的输入通道为32、输出通道为64；卷积层C_D2-2的输入通道为64、输出通道为64；卷积层C_D3-1的输入通道为64、输出通道为128；卷积层C_D3-2的输入通道为128、输出通道为128；卷积层C_D4-1的输入通道为128、输出通道为256；卷积层C_D4-2的输入通道为256、输出通道为256；卷积层C_E1-1的输入通道为256、输出通道为512；卷积层C_E1-2的输入通道为512、输出通道为512；卷积层C_U1-1、C_U2-1、C_U3-1、C_U4-1的输入通道与输出通道分别与卷积层C_E1-1、C_D4-1、C_D3-1和C_D2-1相反；卷积层C_U1-2、C_U2-2、C_U3-2与C_U4-2的输入通道与输出通道分别与卷积层C_D4-2、C_D3-2、C_D2-2和C_D1-2相同；除输入通道与输出通道外，卷积层C_D1-1、_1-2～C_D4-1、_4-2，卷积层C_E1-1、_1-2与卷积层C_U1-1、_1-2～C_U4-1、_4-2参数相同，均为：卷积核尺寸为3×3、padding为1；激活层R_Unet采用LeakyReLU块；池化层P_Unet采用最大池化，卷积核大小为2×2，stride为2；转置卷积层T采用ConvTranspose2d块，卷积核尺寸均为2×2、stride均为2，其中T₁的输入通道为512、输出通道为256，T₂的输入通道为256、输出通道为128，T₃的输入通道为128、输出通道为64，T₄的输入通道为64、输出通道为32；全局平均池化层P₃和全局最大池化层P₄均为通道池化操作，分别沿着特征图的通道维度计算平局值和最大值；卷积层C₆的卷积核尺寸为5×5、输入通道为2、输出通道为1、padding为2；激活层R_M采用Sigmoid块；自适应平均池化层P₂采用AdaptiveAvgPool2d块，且output_size为1；卷积层C₇的卷积核尺寸为1×1、输入通道为32、输出通道为4、padding为0；激活层R₃采用ReLU块；卷积层C₈的卷积核尺寸为1×1、输入通道为4、输出通道为32、padding为0；卷积层C₉的卷积核尺寸为1×1、输入通道为64、输出通道为32、padding为0；插值采样层I采用Interpolate块，且scale_factor为2；卷积层C₁₀的卷积核尺寸为1×1、输入通道为32、输出通道为3、padding为0；激活层R₄采用Sigmoid块。

优选的，所述Residual-Unet低照度图像增强网络的训练过程为：

采用现有图像数据集作为训练集，在数据加载阶段，对训练集中的低照度待增强图像与作为标签的正常曝光图像进行相同位置的随机剪裁、翻转和旋转，获得尺寸为N×N的用于网络训练的图片，再将原始低照度图像进行直方图均衡化预处理，将低照度图像与直方图均衡化预处理得到的图像作为输入，构成训练样本；设置损失函数与训练参数，采用监督批学习的方法对基于Residual-Unet的低照度图像增强网络进行训练。

优选的，所述损失函数为：

其中，L(x,y)表示损失函数，Ref(x,y)表示标签，G(x,y)表示基于Residual-Unet的低照度图像增强网络生成的输出图像，(x,y)表示像素坐标，N为剪裁的图片大小。

与现有技术相比，本发明具有如下改进及优点：1、通过在传统的Residual结构之上，取消Residual网络中的所有批量归一化操作，将第二权重层由简单的卷积、激活层整体替换为Unet深度神经网络，避免了网络加深的过程中对于全局信息处理不足的问题；并且对低照度图像进行直方图均衡化预处理，减少光照变化的影响，丰富待增强图像的可视化信息，可以帮助网络更好地进行学习。

2、通过引入双通道注意力机制模块对融合的特征进行处理，避免了不相关的信息对增强结果造成影响，加快模型的收敛；同时实现增强视觉效果，显著提升峰值信噪比(PSNR)，使之能够广泛适用于不同场景下的低照度图像增强任务。

附图说明

图1为本发明中基于Residual-Unet网络的低照度图像增强方法的流程示意图。

图2为本发明中Residual-Unet图像增强网络的结构示意图。

图3为图2所示Residual-Unet图像增强网络中浅层特征编码块结构示意图。

图4为图2所示Residual-Unet图像增强网络中Residual-Unet深层特征处理块结构示意图。

图5为图4所示Residual-Unet深层特征处理块中Rs-Unet结构示意图。

图6为图5所示Rs-Unet结构中的Unet卷积神经网络结构示意图。

图7为图2所示Residual-Unet图像增强网络中双通道注意力机制块结构示意图。

图8为图2所示Residual-Unet图像增强网络中上采样块结构示意图。

具体实施方式

以下结合附图对本发明做进一步概述。

如图1所示，一种基于Residual-Unet网络的低照度图像增强方法，具体包括以下步骤：

步骤S1：数据预处理；

获取待增强图像，并对其进行直方图均衡化预处理。本实施例中将获取的RGB待增强图像进行通道分离，分别对R、G、B三个单通道灰度图进行直方图均衡化处理，然后重新合并处理后的通道。该步骤可以显著提升曝光不足图像的细节信息；

基于Residual-Unet的低照度图像增强网络如图2所示，包括：浅层特征编码块、Residual-Unet深层特征处理块、双通道注意力机制块与上采样块；

浅层特征编码块如图3所示，由依次连接的卷积层C₁、激活层R₁、卷积层C₂与最大池化层P₁构成。其中卷积层C₁的卷积核尺寸为3×3，输入通道为6、输出通道为16、padding为1；激活层R₁为LeakyReLU且negative_slope为0.2；卷积层C₂的卷积核尺寸为3×3、输入通道为16、输出通道为32、padding为1；最大池化层P₁的卷积核大小为2×2，stride为2。

Residual-Unet深层特征处理块如图4所示，由4个Rs-Unet子块依次连接构成，且在每两个Rs-Unet子块间嵌入结构相同的卷积层C₃。其中，卷积层C₃的卷积核尺寸为3×3、输入通道为64、输出通道为32、padding为1。上述第二浅层特征Layer_S2经过Rs-Unet子块处理后再经过3×3的卷积核卷积，可转化为第一深层特征层Layer_d1，为了增强网络对不同尺度和不同层次特征的感知能力，将Rs-Unet的输出与输入进行通道合并，即Layer_d1可记作：Layer_d1＝Conv_3×3(cat(RSU₁(Layer_S1)，Layer_S1))。其中RSU₁即图4所示Rs-Unet1子块，cat操作用于将两个尺寸为C×H×W的特征图合并为2C×H×W大小；同样的方法，可以继续得到第二深层特征层Layer_d2、第三深层特征层Layer_d3以及第四深层特征层Layer_d4：

Layer_d2＝Conv_3×3(cat(RSU₂(Layer_d1)，Layer_d1))+Layer_S1；

Layer_d3＝Conv_3×3(cat(RSU₃(Layer_d2)，Layer_d2))+Layer_d1；

Layer_d4＝Conv_3×3(cat(RSU₄(Layer_d3)，Layer_d3))+Layer_d2；

使用跳线连接进行隔层相加目的是为了更好地保留原始图像的细节信息。本实施例中，Layer_d1、Layer_d2、Layer_d3以及Layer_d4大小一致，均为32×128×128。

Rs-Unet子块如图5所示，由依次连接的第一权重层、Unet卷积神经网络与卷积层C₄构成，引入残差跳线作用于Unet卷积神经网络，且将第一权重层的输入与Unet卷积神经网络的输出进行合并作为卷积层C₄的输入。其中，卷积层C₄采用与C₃相同的参数设置；所述第一权重层由依次连接的卷积层C₅与激活层R₂构成，卷积层C₅的卷积核尺寸为3×3、输入通道为32、输出通道为32、padding为1；激活层R₂使用ReLU函数。因此，所述Rs-Unet子块的输出可以记作：RSU＝Conv_3×3(cat(Res(Unet(ReLU(Conv_3×3(F_in))))，F_in))。其中，Unet(·)表示Unet卷积神经网络运算机制，Res表示残差连接，F_in为输入特征。本实施例中，Rs-Unet子块不改变输入特征的尺寸。

Unet卷积神经网络如图6所示，由依次连接的4个下采样特征提取子块(D₁～D₄)、1个通道扩展子块E与4个上采样特征提取子块(U₁～U₄)构成；所述下采样特征提取子块D₁由依次连接的卷积层C_D1-1、激活层R_Unet、卷积层C_D1-2、激活层R_Unet与池化层P_Unet构成。其中，卷积层C_D1-1与卷积层C_D1-2的参数相同，均为：卷积核尺寸为3×3、输入通道为32、输出通道为32、padding为1；激活层R_Unet使用LeakyReLU函数；池化层P_Unet采用最大池化，卷积核大小为2×2，stride为2。由此可得第一下采样特征提取层Layer_D1为：

Layer_D1＝Maxpool(LeReL U(Conv_3×3(LeReL U(Conv_3×3(F_in)))))。其中，LeReL U(·)函数为：LeReLU(x)＝max(0.2×x，x)。如图6所示，下采样特征提取层子块D₂、D₃以及D₄的结构均与D₁相同，不同之处仅在于卷积层C_D2-1、C_D2-2、C_D3-1、C_D3-2、C_D4-1以及C_D4-2的输入输出通道。具体而言，卷积层C_D2-1的输入通道为32、输出通道为64；卷积层C_D2-2的输入通道为64、输出通道为64；卷积层C_D3-1的输入通道为64、输出通道为128；卷积层C_D3-2的输入通道为128、输出通道为128；卷积层C_D4-1的输入通道为128、输出通道为256；卷积层C_D4-2的输入通道为256、输出通道为256。因此，可以使用同样的方法得到第二下采样特征提取层Layer_D2、第三下采样特征提取层Layer_D3以及第四下采样特征提取层Layer_D4为：

Layer_D2＝Maxpool(LeReLU(Conv_3×3(LeReLU(Conv_3×3(Layer_D1)))))

Layer_D3＝Maxpool(LeReLU(Conv_3×3(LeReLU(Conv_3×3(Layer_D2)))))

Layer_D4＝Maxpool(LeReLU(Conv_3×3(LeReLU(Conv_3×3(Layer_D3)))))

经过Maxpool池化处理后的特征图尺寸减半。因此在本实施例中Layer_D1、Layer_D2、Layer_D3与Layer_D4的大小分别为32×64×64、64×32×32、128×16×16、256×8×8。如图6所示，所述通道扩展子块E由依次连接的卷积层C_E1-1、激活层R_Unet、卷积层C_E1-2与激活层R_Unet构成。其中，卷积层C_E1-1的卷积核尺寸为3×3、输入通道为256、输出通道为512、padding为1；卷积层C_E1-2的卷积核尺寸为3×3、输入通道为512、输出通道为512、padding为1。从工作原理上讲，通道扩展子块E不再对输入做下采样操作，而只扩展其通道数，以此来增强网络对不同模式和特征的表达能力。本实施例中，通道扩展层Layer_E可记作：

Layer_E＝LeReLU(Conv_3×3(LeReLU(Conv_3×3(Layer_D4))))，

其大小为512×8×8。

如图6所示，上采样特征提取子块U₁由依次连接的转置卷积层T₁、卷积层C_U1-1、激活层R_Unet、卷积层C_U1-2与激活层R_Unet构成。其中，转置卷积层T₁的卷积核尺寸为2×2、输入通道为512、输出通道为256、stride为2；卷积层C_U1-1的卷积核尺寸为3×3、输入通道为512、输出通道为256、padding为1；卷积层C_U1-2的卷积核尺寸为3×3、输入通道为256、输出通道为256、padding为1。从工作原理上讲，上采样特征提取子块U₁用于完成与下采样特征提取子块D₄相反的功能，即增大特征图尺寸的同时降低维度，在该过程中，为了获得更好的语义信息并提高网络的特征表达能力，Unet网络还通过跳线的方式将Layer_D4与U₁进行合并，即第一上采样特征提取层Layer_U1可记作：

Layer_U1＝LeReLU(Conv_3×3(LeReLU(Conv_3×3(cat(Conv_2×2(Layer_E)，Layer_D4)))))

其中Conv_2×2(·)即为转置卷积函数。

同样，上采样特征提取子块U₂、U₃以及U₄的结构与U₁相同，不同之处仅在于转置卷积层T₂、T₃、T₄以及卷积层C_U2-1、C_U2-2、C_U3-1、C_U3-2、C_U4-1、C_U4-2的输入输出通道。具体而言，转置卷积层T₂的输入通道为256、输出通道为128；卷积层C_U2-1的输入通道为256、输出通道为128；卷积层C_U2-2的输入通道为128、输出通道为128；转置卷积层T₃的输入通道为128、输出通道为64；卷积层C_U3-1的输入通道为128、输出通道为64；卷积层C_U3-2的输入通道为64、输出通道为64；转置卷积层T₄的输入通道为64、输出通道为32；卷积层C_U4-1的输入通道为64、输出通道为32；卷积层C_U4-2的输入通道为32、输出通道为32。因此，可以使用同样的方法得到第二上采样特征提取层Layer_U2、第三上采样特征提取层Layer_U3以及第四上采样特征提取层Layer_U4为：

Layer_U2＝LeReLU(Conv_3×3(LeReLU(Conv_3×3(cat(Conv_2×2(Layer_U1)，Layer_D3)))))

Layer_U3＝LeReLU(Conv_3×3(LeReLU(Conv_3×3(cat(Conv_2×2(Layer_U2)，Layer_D2)))))

Layer_U4＝LeReLU(Conv_3x3(LeReLU(Conv_3×3(cat(Conv_2×2(Layer_U3)，Layer_D1)))))

本实施例中，Layer_U1、Layer_U2、Layer_U3以及Layer_U4的大小分别为256×16×16、128×32×32、64×64×64、32×128×128。

双通道注意力机制块如图7所示，由空间注意力机制子块和通道注意力机制子块并联构成；空间注意力机制子块由依次连接的双通道池化模块和基础卷积模块构成；双通道池化模块由全局平均池化层P₃和全局最大池化层P₄并联构成，且P₃和P₄的输出将被合并后作为双通道池化模块的输出，基础卷积模块由卷积层C₆和激活层R_M构成。其中，全局平均池化层P₃和全局最大池化层P₄均为通道池化操作，对于大小为[B，32,128,128]的特征张量输入(其中B为网络训练过程中的Batch Size大小)，P₃、P₄将分别沿通道维度进行平均池化和最大池化操作，将上述张量转化为[B，1，128,128]大小；卷积层C₆的卷积核尺寸为5×5、输入通道为2、输出通道为1、padding为2，使用大的卷积核可以在一定程度上减少参数量，降低过拟合的风险；激活层R_M采用Sigmoid函数，其函数表达式为：

经过Sigmoid激活层的特征将被映射至[O,1]区间，进而作为空间注意力图作用于输入特征，即空间注意力机制层Layer_spa可记作：

如图7所示，通道注意力机制子块由依次连接的自适应平均池化层P₂和特征维度变换模块构成；特征维度变换模块由卷积层C₇、激活层R₃、卷积层C₈与激活层R_M构成。具体而言，自适应平均池化层P₂采用AdaptiveAvgPool2d块，且output_size为1，与P₃、P₄不同，P₂将大小为[B，32,128,128]的输入张量转换为[B，32,1,1]大小，即计算出每个通道的权重；卷积层C₇的卷积核尺寸为1×1、输入通道为32、输出通道为4、padding为0；激活层R₃采用ReLU函数；卷积层C₈的卷积核尺寸为1×1、输入通道为4、输出通道为32、padding为0。同样地，经过Sigmoid激活后的值作为通道注意力图作用于输入特征，即通道注意力机制层Layer_cha可记作：

Layer_cha＝Sig(Conv_3×3(ReL U(Conv_3×3(AdpPool(F_in)))))。

综上，双通道注意力机制的输出Layer_M由Layer_spa与Layer_cha合并后经3×3的卷积核卷积所得：

本实施例中，双通道注意力机制模块不改变输入特征的大小，即输入与输出大小均为32×128×128。

上采样块如图8所示，由依次连接的插值采样层I、卷积层C₁₀与激活层R₄构成。其中插值采样层I采用Interpolate块，且scale_factor为2，即将输入特征图大小由32×128×128转换为最初的图像大小：32×256×256；卷积层C₁₀的卷积核尺寸为1×1、输入通道为32、输出通道为3、padding为0；激活层R₄采用Sigmoid块。从工作原理上讲，上采样块用于将特征图恢复至三通道的RGB图像，且大小和输入的待增强图像一致。本实施例中，上采样的最终输出大小为3×256×256。

进一步，Residual-Unet低照度图像增强网络的训练过程为：

采用现有图像数据集作为训练集，在数据加载阶段，对训练集中的低照度待增强图像与作为标签的正常曝光图像进行相同位置的随机剪裁、翻转和旋转，获得尺寸为N×N的用于网络训练的图片，再将原始低照度图像进行直方图均衡化预处理，将低照度图像与直方图均衡化预处理得到的图像作为输入，构成训练样本；本实施例中，剪裁的图片尺寸N为256。

设置损失函数与训练参数，采用监督批学习的方法对基于Residual-Unet的低照度图像增强网络进行训练，所述损失函数为：

其中，L(x,y)表示损失函数，Ref(x,y)表示标签，G(x,y)表示基于Residual-Unet的低照度图像增强网络生成的输出图像，(x,y)表示像素坐标，N为剪裁的图片尺寸。该损失函数表示了本发明基于Residual-Unet的低照度图像增强网络输出的光照增强图像与正常曝光的参考图像之间的“差距”。

本实施例中，采用LOL-v2-real数据集中的689对图像作为训练集，剩下的100对图像作为测试集；如图1所示流程图中的示例图像来自LOL-v2-real中的测试集；原始低照度图像尺寸为400×600，为降低计算开销，便于网络训练，将图像剪裁至256×256大小，训练中Batch Size设置为24；通过本发明得到的光照增强模型，在LOL-v2-real数据集上测试的PSNR指标为25.942，已显著超过现有的大部分光照增强方法。

仿真实验:

本发明使用的实验数据集为LOL-v2-real，数据集分为训练集和测试集，训练集和测试集的图片数量分别为689、100；通过对比实验使用的评价指标为峰值信噪比(PSNR)。

表1为各个对比方法的对比实验结果表

方法	LIME	GRI	GRIR	CRM	RUAS
						PSNR	17.78	16.39	18.34	19.66	15.33

表2为各个对比方法的对比实验结果表

表3为各个对比方法的对比实验结果表

如表1至表3所示，使用本发明的方法得到的峰值信噪比(PSNR)值最高，实现增强视觉效果；本发明方法平衡了图像光照增强网络的处理深度和感受野的关系，在此基础上取得良好的增强效果，显著提升峰值信噪比(PSNR)，使之能够广泛适用于不同场景下的低照度图像增强任务。

以上所述仅为本发明的实施方式而已，并不用于限制本发明。对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原理内所作的任何修改、等同替换、改进等，均应包括在本发明的权利要求范围之内。

Claims

1.一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：该方法包括以下步骤：

步骤S1：数据预处理；

获取待增强图像，并对其进行直方图均衡化预处理；

2.根据权利要求1所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述浅层特征编码块包括卷积层C₁、激活层R₁、卷积层C₂与最大池化层P₁，卷积层C₁、激活层R₁、卷积层C₂与最大池化层P₁依次连接；所述Residual-Unet深层特征处理块由4个Rs-Unet子块依次连接构成，且在每两个Rs-Unet子块间嵌入结构相同的卷积层C₃；

3.根据权利要求2所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述Rs-Unet子块包括第一权重层、Unet卷积神经网络与卷积层C₄，第一权重层、Unet卷积神经网络与卷积层C₄依次连接，引入残差结构并将第一权重层的输入与Unet卷积神经网络的输出进行合并作为卷积层C₄的输入；

4.根据权利要求3所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述下采样特征提取子块包括下采样特征提取子块D₁、下采样特征提取子块D₂、下采样特征提取子块D₃以及下采样特征提取子块D₄；

5.根据权利要求4所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述下采样特征提取子块D₁由依次连接的卷积层C_D1-1、激活层R_Unet、卷积层C_D1-2、激活层R_Unet与池化层P_Uner构成，下采样特征提取子块D₂由依次连接的卷积层C_D2-1、激活层R_Unet、卷积层C_D2-2、激活层R_Unet与池化层P_Unet构成，下采样特征提取子块D₃由依次连接的卷积层C_D3-1、激活层R_Unet、卷积层C_D3-2、激活层R_Unet与池化层P_Unet构成，下采样特征提取子块D₄由依次连接的卷积层C_D4-1、激活层R_Unet、卷积层C_D4-2、激活层R_Unet与池化层P_Unet构成；

6.根据权利要求2所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述空间注意力机制子块由依次连接的双通道池化模块和基础卷积模块构成，双通道池化模块由全局平均池化层P₃和全局最大池化层P₄并联构成，且P₃和P₄的输出将被合并后作为双通道池化模块的输出；所述基础卷积模块由卷积层C₆和激活层R_M构成，通道注意力机制子块由依次连接的自适应平均池化层P₂和特征维度变换模块构成；所述特征维度变换模块由卷积层C₇、激活层R₃、卷积层C₈与激活层R_M构成；

7.根据权利要求3所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述卷积层C₁的卷积核尺寸为3×3、输入通道为6、输出通道为16、padding为1；激活层R₁为LeakyReLU且negative_slope为0.2；卷积层C₂的卷积核尺寸为3×3、输入通道为16、输出通道为32、padding为1；最大池化层P₁的卷积核大小为2×2，stride为2；卷积层C₃的卷积核尺寸为3×3、输入通道为64、输出通道为32、padding为1；卷积层C₄与卷积层C₃参数相同；卷积层C₅的卷积核尺寸为3×3、输入通道为32、输出通道为32、padding为1；激活层R₂为ReLU函数。

8.根据权利要求5所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述卷积层C_D1-1与卷积层C_D1-2的参数相同，均为：卷积核尺寸为3×3、输入通道为32、输出通道为32、padding为1；卷积层C_D2-1的输入通道为32、输出通道为64；卷积层C_D2-2的输入通道为64、输出通道为64；卷积层C_D3-1的输入通道为64、输出通道为128；卷积层C_D3-2的输入通道为128、输出通道为128；卷积层C_D4-1的输入通道为128、输出通道为256；卷积层C_D4-2的输入通道为256、输出通道为256；卷积层C_E1-1的输入通道为256、输出通道为512；卷积层C_E1-2的输入通道为512、输出通道为512；卷积层C_U1-1、C_U2-1、C_U3-1、C_U4-1的输入通道与输出通道分别与卷积层C_E1-1、C_D4-1、C_D3-1和C_D2-1相反；卷积层C_U1-2、C_U2-2、C_U3-2与C_U4-2的输入通道与输出通道分别与卷积层C_D4-2、C_D3-2、C_D2-2和C_D1-2相同；除输入通道与输出通道外，卷积层C_D1-1、1-2～C_D4-1、4-2，卷积层C_E1-1、1-2与卷积层C_U1-1、1-2～C_U4-1、4-2参数相同，均为：卷积核尺寸为3×3、padding为1；激活层R_Unet采用LeakyReLU块；池化层P_Unet采用最大池化，卷积核大小为2×2，stride为2；转置卷积层T采用ConvTranspose2d块，卷积核尺寸均为2×2、stride均为2，其中T₁的输入通道为512、输出通道为256，T₂的输入通道为256、输出通道为128，T₃的输入通道为128、输出通道为64，T₄的输入通道为64、输出通道为32；全局平均池化层P₃和全局最大池化层P₄均为通道池化操作，分别沿着特征图的通道维度计算平局值和最大值；卷积层C₆的卷积核尺寸为5×5、输入通道为2、输出通道为1、padding为2；激活层R_M采用Sigmoid块；自适应平均池化层P₂采用AdaptiveAvgPool2d块，且output_size为1；卷积层C₇的卷积核尺寸为1×1、输入通道为32、输出通道为4、padding为0；激活层R₃采用ReLU块；卷积层C₈的卷积核尺寸为1×1、输入通道为4、输出通道为32、padding为0；卷积层C₉的卷积核尺寸为1×1、输入通道为64、输出通道为32、padding为0；插值采样层I采用Interpolate块，且scale_factor为2；卷积层C₁₀的卷积核尺寸为1×1、输入通道为32、输出通道为3、padding为0；激活层R₄采用Sigmoid块。

9.根据权利要求1所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述Residual-Unet低照度图像增强网络的训练过程为：

10.根据权利要求9所述的一种基于Residual-Unet网络的低照度图像增强方法，其特征在于：所述损失函数为：