CN111695633A

CN111695633A - 基于rpf-cam的低照度目标检测方法

Info

Publication number: CN111695633A
Application number: CN202010534721.6A
Authority: CN
Inventors: 江泽涛; 翟丰硕
Original assignee: Guilin University of Electronic Technology
Current assignee: Guilin University of Electronic Technology
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2020-09-22
Anticipated expiration: 2040-06-12
Also published as: CN111695633B

Abstract

本发明公开了一种基于RPF‑CAM的低照度目标检测方法，其特征在于，包括如下步骤：1）制作合成数据源，建立来源图像；2）特征提取网络模块的训练；3）通道注意力机制网络模块的训练；4）目标检测网络的训练；5）对整个卷积神经网络进行构造与训练。这种方法使得目标检测的特征图的特征表达能力更好、目标检测的精度高。

Description

基于RPF-CAM的低照度目标检测方法

技术领域

本发明涉及图像增强和目标检测技术领域，具体是一种基于残差金字塔融合和通道注意力机制RPF-CAM(residual pyramid fusion and channel attention mechanism，简称RPF-CAM)的低照度目标检测方法。

背景技术

现有的目标检测方法主要针对于正常照度的环境下的目标检测，但是对于照度较低，所需检测目标成像偏暗、模糊不清、干扰较多的情况下，普遍存在检测效果和检测精度较为不佳的情况。

Lab颜色模型是国际照明委员会(CIE)于1976年公布的一种色彩模式，是CIE组织确定的一个理论上包括了人眼可见的所有色彩的色彩模式，Lab模式弥补了RGB与CMYK两种彩色模式的不足。

现在的目标检测网络，例如Faster R-CNN网络，在特征提取的过程中，逐步进行下采样，最后将得到的特征图送进区域建议网络生成先验框，这样得到的特征图存在较多的低层信息的丢失，造成小物体检测效果不佳，且对于低照度图像，没有针对性将光照信息和颜色信息进行分离，导致低照度目标检测效果不佳。

发明内容

本发明的目的是针对现有技术的不足，而提供一种基于RPF-CAM的低照度目标检测方法。这种方法使得目标检测的特征图的特征表达能力更好、目标检测的精度高。

实现本发明目的的技术方案是：

一种基于RPF-CAM的低照度目标检测方法，包括如下步骤：

1)制作合成数据源，建立来源图像：将正常日光照度下获取的正常照度图像Nor-images、模拟低照度环境下的成像特点获取的低照度图像Dark-images和图像标注数据Images_Annotation进行整合构造成一个Dark-Nor-Data数据集，数据集的分组情况如下表1所示：

表1：

2)特征提取网络模块的训练：过程包括：

2-1)将所有低照度图像Dark-images和正常照度图像Nor-images进行预处理，缩放到统一的宽度和高度；

2-2)采用Lab颜色模型将低照度图像Dark-images和正常照度图像Nor-images分解成光照分量和颜色分量两个部分，分别对两个部分进行降采样，参考ResNet50进行设计，Lab颜色是由RGB三基色转换而来的，它与RGB色彩模式转化公式如下：

a＝500*(f(X)-f(Y))，

其中，

2-3)将原RGB图像经过Lab颜色模型转换后的图像进行卷积下采样，得到各个阶段各种尺寸大小的特征图，然后将最后一个阶段的特征图经过1×1卷积，改变成与上一阶段的特征图同样的通道数，再经过双线性插值，变成与上一阶段的特征图同等尺寸大小的特征图，最后通过逐像素相加，融合两个阶段的特征图，同理，将各个阶段的特征经过逐级融合，得到多尺度、多层级的能代表图像细节的特征图；

2-4)将低照度图像进行卷积下采样得到的特征图跟正常光照图像经过卷积下采样得到的特征图进行逐像素的内容损失函数的计算，损失函数采用MSE损失函数，MSE损失函数是预测值与目标值之间差值取平方和的均值，具体为公式(1)：

其中n为统计的数据量总数，y_iy_i'表示真实值和输出的预测值，依据所用数据进行公式的更改，更改后的均方误差MSE损失函数为公式(2)：

其中W、H分别表示预处理过后的图像的宽度和高度，

表示真实正常光照的可见光图像特征图的像素值，G(I^Dark-images)_x,y表示低照度图像I^Dark-images进行卷积下采样后得到的特征图的像素值；

3)通道注意力机制网络模块的训练，包括：

3-1)将光照分量和颜色分量得到的特征图进行通道间的连接操作，得到具有光照和颜色分量两个部分的高级特征图，然后经过全局平局池化将庞大的特征图压缩成1×1×C的特征向量，C为通道数，再经过挤压全连接操作，对每个通道的特征值进行激励学习，再通过全连接操作把特征向量放大成与特征图相同的通道数，其中，

挤压函数为公式(3)：

激励函数为公式(4)：s＝F_ex(z,W)＝σ(g(z,W))＝σ(W₂δ(W₁z)) (4)，

δ函数是ReLu，而σ是一个sigmoid激活函数，W₁和W₂的维度分别是第一层全连接的维度和第二层全连接的维度，通过训练学习这两个权重，得到一个一维的激励权重来激活每一层通道，其中，尺度函数为公式(5)：

3-2)将特征图和最后得到的特征向量进行通道间的相乘操作；

4)目标检测网络的训练，包括：

4-1)将特征提取网络模块中的下采样的各个阶段对应的光照分量和颜色分量得到的特征图进行连接操作，其中光照分量和颜色分量在下采样过程中，对每一阶段的特征图进行横向连接操作，组成特征金字塔；

4-2)将经过注意力机制引导过后的总体特征图送进区域建议网络，用于生成建议框anchors，通过softmax即归一化指数函数判断建议框anchors属于正样本还是属于负样本，再利用边框回归修正建议框anchors获得精确的建议框，建议框的窗口采用四维向量(x,y,w,h)表示，分别表示窗口的中心点坐标和宽高，框A代表原始的前景Anchors，框G代表目标的GT，目标是寻找一种关系，使得输入原始的anchor A经过映射得到一个跟真实窗口G更接近的回归窗口G’，即：

4-2-1)给定：anchor A＝(A_x,A_y,A_w,A_h)和GT＝[G_x,G_y,G_w,G_h]；

4-2-2)寻找一种F,使得：F(A_x,A_y,A_w,A_h)＝(G'_x,G'_y,G'_w,G'_h)，其中(G'_x,G'_y,G'_w,G'_h)≈(G_x',G'_y,G'_w,G'_h)，

经过变换F从anchor A变为G’的就是如下过程：

依据公式(6)、公式(7)先做平移：

G′_x＝A_w·d_x(A)+A_x (6)，

G′_y＝A_h·d_y(A)+A_y (7)，

依据公式(8)、公式(9)再做缩放：

G′_w＝A_w·exp(d_w(A)) (8)，

G′_h＝A_h·exp(d_h(A)) (9)，

依据公式(6)、公式(7)、公式(8)、公式(9)，需要学习的是d_x(A)，d_y(A)，d_w(A)，d_h(A)这四个变换，当输入的anchor A与GT相差较小时，把这种变换当作一种线性变换，那么就可以用线性回归来建模对窗口进行微调，线性回归就是给定输入的特征向量X，学习一组参数W，使得经过线性回归后的值跟真实值Y非常接近，即Y＝WX，输入X是卷积特征图，定义为

同时还有训练传入A与GT之间的变换量，即(t_x,t_y,t_w,t_h)，输出是d_x(A)，d_y(A)，d_w(A)，d_h(A)四个变换，目标函数可以表示为公式(10)：

其中

是对用anchor的特征图组成的特征向量，w是需要学习的参数，d(A)是得到的预测值，让预测值(t_x,t_y,t_w,t_h)与真实之差距最小，设计损失函数为公式(12)：

函数优化目标为：

对于训练边框回归函数网络回归分支，输入是卷积特征

监督信号是Anchor与GT的差距(t_x,t_y,t_w,t_h)，即训练目标是：输入

使网络输出与监督信号尽可能相近，当边框回归工作时，再输入

时，回归网络分支的输出就是每个Anchor的平移量和变换尺度(t_x,t_y,t_w,t_h)，即可用来修正Anchor位置；

4-3)建议框层负责综合所有[d_x(A),d_y(A),d_w(A),d_h(A)]变换量和前景anchors，计算出精确的目标框Proposal，送入后续的ROI池化层；

4-4)将步骤4-1)得到的特征图和步骤4-3)生成的建议框送入到ROI池化层，综合这些信息后提取建议框特征图，送入后续的卷积层判定目标分类；

4-5)采用建议框特征图计算建议框的类别，同时再次边框回归获得检测框最终的精确位置；

5)对整个卷积神经网络进行构造与训练，包括：

5-1)对特征提取部分网络进行构造，特征提取网络的输入、输出数据如下：输入为模拟的低照度图像和正常光照图像，输出为融合过的高级特征图，对目标检测网络进行构造，检测网络的输入、输出数据如下：融合的光照分量和颜色分量的特征图，检测的目标的正确边框位置和类别数值；

5-2)对检测部分网络进行训练。

步骤1)中所述的低照度图像Dark-images、正常照度图像Nor-images,属于同源不同光照条件的图像对，每一类场景每种类型图像对数不少于50对，图像中包含所需检测目标，检测目标的边框和类别信息要包含图像中每个待检测物体的边框的坐标数值、边框长度和高度和所属类别，而且还要包含检测难度评估即较小并且跟其它物体有重叠的物体检测难度设置为1，除此之外检测难度设置为0，正常照度图像要比模拟的低照度图像照度要高，而且是再正常光照照度下采集的，图像需要更加清晰，锐度更高。

步骤2-1)中所述的预处理为：

1)将宽度和高度都缩放为512像素；

2)将图像序列打散，使得连续的图像中所存在的目标和位置不完全相同。

步骤2-3)中所述的卷积为：

1)对低照度图像进行Lab颜色模型分解，分成两个部分，一个部分为L光照分量，一个分量为ab颜色分量，分别送进低照度增强网络；

2)将转化后的光照分量和颜色分量的像素值进行归一化处理；

3)网络前面部分采用四阶段下采样方法进行深度特征提取，过程为：首先采用填充模式为“same”模式的全零填充，采用5*5的二维卷积，步长为2，光照分量的卷积核个数为32，颜色分量的卷积核个数为64，然后分别进行批标准化和使用relu激活函数进行激活后传入下一阶段的下采样特征提取；

4)光照分量的特征图接一个改变特征图大小的残差模块，其中的四次卷积的分别为：卷积核大小为1*1，卷积核个数为64，步长为1的一次卷积；卷积核大小为3*3，卷积核个数为64，步长为2，填充模式为“same”的一次卷积；卷积核大小为1*1，卷积核个数为64，步长为1的一次卷积；卷积核大小为1*1，卷积核个数为64，步长为2的一次卷积，其中第一次卷积的和第四次卷积的输入均为该残差模块之前的原始的特征图，第二次卷积的输入为第一次卷积完成后经过批标准化和relu激活函数的输出，第三次卷积的输入为第二次卷积完成后经过批标准化和relu激活函数的输出，第四次卷积经过批标准化后与同样经过批标准化的第三层卷积得到的特征图进行像素之间的相加操作，最后再使用relu激活函数进行激活传入下一层；颜色分量的特征图接一个改变特征图大小的残差模块，其中的四次卷积的分别为：卷积核大小为1*1，卷积核个数为64，步长为1的一次卷积；卷积核大小为3*3，卷积核个数为128，步长为2，填充模式为“same”的一次卷积；卷积核大小为1*1，卷积核个数为128，步长为1的一次卷积；卷积核大小为1*1，卷积核个数为128，步长为2的一次卷积，其中第一次卷积的和第四次卷积的输入均为该残差模块之前的原始的特征图，第二次卷积的输入为第一次卷积完成后经过批标准化和relu激活函数的输出，第三次卷积的输入为第二次卷积完成后经过批标准化和relu激活函数的输出，第四次卷积经过批标准化后与同样经过批标准化的第三层卷积得到的特征图进行像素之间的相加操作，最后再使用relu激活函数进行激活传入下一层；

5)光照分量的特征图经过一个改变特征图大小的残差模块之后再接一个用来加深网络深度的残差模块，其中的三次卷积的分别为：卷积核大小为1*1，卷积核个数为64，步长为1的一次卷积；卷积核大小为3*3，卷积核个数为32，步长为1的一次卷积；卷积核大小为1*1，卷积核个数为64，步长为1的一次卷积，其中第一次卷积的输入为该残差模块之前的特征图，第两次卷积的输入为第一次卷积经过批标准化和relu激活函数的输出，第三次卷积的输入为第二次卷积经过批标准化和relu激活函数的输出，第三次卷积完成后经过批标准后原始输入特征图进行像素之间的相加操作，最后再使用relu激活函数激活传入下一阶段的下采样特征提取；颜色分量的特征图经过一个改变特征图大小的残差模块之后再接一个用来加深网络深度的残差模块，其中的三次卷积的分别为：卷积核大小为1*1，卷积核个数为128，步长为1的一次卷积；卷积核大小为3*3，卷积核个数为64，步长为1的一次卷积；卷积核大小为1*1，卷积核个数为128，步长为1的一次卷积，其中第一次卷积的输入为该残差模块之前的特征图，第两次卷积的输入为第一次卷积经过批标准化和relu激活函数的输出，第三次卷积的输入为第二次卷积经过批标准化和relu激活函数的输出，第三次卷积完成后经过批标准后原始输入特征图进行像素之间的相加操作，最后再激活函数激活传入下一阶段的下采样特征提取；

6)后再接两个阶段的下采样特征提取操作，类似于3)和4)中的残差模块，只是将后一阶段得到的特征图的层数变为前一阶段的两倍；

7)将四个阶段的特征图进行特征金字塔操作，使用双线性插值的方法将深层的特征图进行扩充，通过1*1卷积，把通道数转换成与前一层的特征图一样的通道数，然后进行相加融合。使用相同的操作将四个阶段的特征图全部融合，将光照分量最终得到的特征图和颜色分量最终得到的特征图进行叠加操作，然后输入到注意力机制网络进行各通道权重的学习，最后送进目标检测网络。

步骤3-1)中所述的高级特征图生成过程为：

1)光照分量和颜色分量在下采样过程中，从最底层特征图自底向上即从最后一阶段卷积得到的特征图到第一阶段卷积得到的特征图进行双线性插值，得到与上一层相同尺寸的特征图；

2)将经过双线性插值得到的放大的特征图通过1*1卷积得到与上一层特征相同的通道数，然后进行各个像素之间的相加，得到融合过后的特征图。

步骤4-2)中所述区域建议网络为：

1)区域建议网络分为两条支路，一路通过softmax分类anchors获得前景和背景；

2)另外一条支路用于计算对于anchors的边界框回归的偏移量，以获得精确的目标候选区；

3)anchors包括9个矩形，共有3种形状，长宽比大约为(1：1，1：2，2：1)三种，矩形大小分别为400*200，200*400，350*350，200*100，100*200，200*200，50*100，100*50，50*50。

本技术方案解决的是目标检测中，由于低照度环境下，目标成像过暗，模糊不清，丢失细节导致的检测精度不佳的问题，本技术方案先使用Lab颜色模型将低照度图像分成光照分量和颜色分量两个部分，再利用特征提取网络对低照度图像进行图像细节提取，然后将照度优化过程中的各个阶段组成光照分量金字塔特征图和颜色分量金字塔特征图进行融合，然后输入到注意力机制网络，再送进区域建议网络获得ROI，最后通过边框回归和分类预测，得到精确得低照度图像中的目标检测结果。

这种方法使得目标检测的特征图的特征表达能力更好、目标检测的精度高。

附图说明

图1为实施例中特征提取网络模块示意图；

图2为实施例中通道注意力网络图示意图；

图3为实施例中目标检测网络模块示意图；

图4为实施例中检测框回归示意图。

具体实施方式

下面结合附图和实施例对本发明的内容作进一步的阐述，但不是对本发明的限定。

实施例：

一种基于RPF-CAM的低照度目标检测方法，包括如下步骤：

表1：

2)特征提取网络的训练：过包括：

a＝500*(f(X)-f(Y))，

其中，

2-3)将原RGB图像经过Lab颜色模型转换后的图像进行卷积下采样，如图1，得到各个阶段各种尺寸大小的特征图，然后将最后一个阶段的特征图经过1×1卷积，改变成与上一阶段的特征图同样的通道数，再经过双线性插值，变成与上一阶段的特征图同等尺寸大小的特征图，最后通过逐像素相加，融合两个阶段的特征图，同理，将各个阶段的特征经过逐级融合，得到多尺度、多层级的能代表图像细节的特征图；

2-4)将低照度图像进行卷积下采样得到的特征图跟正常光照图像经过卷积下采样得到的特征图进行逐像素的内容损失函数的计算，损失函数采用MSE损失函数，MSE损失函数是应用最为广泛的损失函数，MSE损失函数是预测值与目标值之间差值取平方和的均值，具体为公式(1)：

其中W、H分别表示预处理过后的图像的宽度和高度，

表示真实正常光照的可见光图像特征图的像素值，G(I^Dark-images)_x,y表示低照度图像I^Dark-images进行卷积下采样后得到的特征图的像素值，公式(2)反映正常光照图像Nor-images和低照度图像Dark-images卷积下采样得到的特征图之间的均方误差，均方误差越小，则低照度图像提取到的特征与真实正常照度可见光图像提取到的特征的相似度越接近，反之低照度可见光图像提取到的特征与真实正常照度的可见光图像提取到的特征的相似度越低，相似度越高则表示网络对低照度图像特征提取能力越强，反之，则越弱；

3)通道注意力机制网络的训练，包括：

3-1)将光照分量和颜色分量得到的特征图进行通道间的连接操作，得到具有光照和颜色分量两个部分的高级特征图，然后经过全局平局池化将庞大的特征图压缩成1×1×C的特征向量，C为通道数，再经过挤压全连接操作，目的是减少参数，对每个通道的特征值进行激励学习，再通过全连接操作把特征向量放大成与特征图相同的通道数，其中，

挤压函数为公式(3)：

激励函数为公式(4)：：s＝F_ex(z,W)＝σ(g(z,W))＝σ(W₂δ(W₁z)) (4)，

这一步其实就是一个放缩的过程，不同通道的值乘上不同的权重，从而可以增强对关键通道域的注意力；

3-2)如图2，将特征图和最后得到的特征向量进行通道间的相乘操作,相当于给每个通道增加了一个权重参数，让网络自动学习光照和颜色分量的细节比例，参加模型的可泛化性和解释性；

4)目标检测网络的训练，包括：

4-1)如图1，将特征提取网络模块中的下采样的各个阶段对应的光照分量和颜色分量得到的特征图进行连接操作，其中光照分量和颜色分量在下采样过程中，对每一阶段的特征图进行横向连接操作，组成特征金字塔；

4-2)如图2和图3，将经过注意力机制引导过后的总体特征图送进区域建议网络，用于生成建议框anchors，通过softmax即归一化指数函数判断建议框anchors属于正样本还是属于负样本，再利用边框回归修正建议框anchors获得精确的建议框，如图4所示，框G代表目标的真实目标框GT，框A代表原始的前景建议框Anchors，回归窗口为G'，即便框A被分类器识别为正确的物体，但是由于框A定位不准，检测器相当于没有正确地检测出物体，所以对框A的坐标值和框的长宽值进行微调，使得前景建议框anchors和真实目标框GT更加接近，建议框的窗口采用四维向量(x,y,w,h)表示，分别表示窗口的中心点坐标和宽高，对于图4框A代表原始的前景建议框Anchors，框G代表目标的真实目标框GT，目标是寻找一种关系，使得输入原始的建议框Anchor A经过映射得到一个跟真实窗口G更接近的回归窗口G'，即：

4-2-1)给定：anchor A＝(A_x,A_y,A_w,A_h)和GT＝[G_x,G_y,G_w,G_h]；

经过变换F从图4中的Anchor A变为G’的就是如下过程：

依据公式(6)、公式(7)先做平移：

G′_x＝A_w·d_x(A)+A_x (6)，

G′_y＝A_h·d_y(A)+A_y (7)，

依据公式(8)、公式(9)再做缩放：

G′_w＝A_w·exp(d_w(A)) (8)，

G′_h＝A_h·exp(d_h(A)) (9)，

其中

函数优化目标为：

对于训练边框回归函数网络回归分支，输入是卷积特征

的情况西使网络输出与监督信号尽肯能相近，当边框回归工作时，再输入

时，回归网络分支的输出就是每个Anchor的平移量和变换尺度(t_x,t_y,t_w,t_h)，显然即可用来修正Anchor位置；

4-3)建议框层负责综合所有[d_x(A),d_y(A),d_w(A),d_h(A)]变换量和前景anchors，计算出精确的目标狂proposal，送入后续的ROI池化层；

5)对整个卷积神经网络进行构造与训练，包括：

5-2)对检测部分网络进行训练。

步骤2-1)中所述的预处理为：

1)将宽度和高度都缩放为512像素；

步骤2-3)中所述的卷积为：

3)网络前面部分采用四阶段下采样方法进行深度特征提取，过程为：首先采用填充模式为“same”模式的全零填充，采用5*5的二维卷积，步长为2，光照分量的卷积核个数为32，颜色分量的卷积核个数为64，然后分别进行批标准化和使用relu激活函数进行激活后传入下一阶段的下采样特征提取，same使得卷积之后的特征图大小等于原尺寸除以步长；

步骤3-1)中所述的高级特征图生成过程为：

步骤4-2)中所述区域建议网络为：

Claims

1.一种基于RPF-CAM的低照度目标检测方法，其特征在于，包括如下步骤：

表1：

2)特征提取网络模块的训练：过程包括：

a1500*(f(X)-f(Y))，

其中，

其中n为统计的数据量总数，y_i y'_i表示真实值和输出的预测值，依据所用数据进行公式的更改，更改后的均方误差MSE损失函数为公式(2)：

其中W、H分别表示预处理过后的图像的宽度和高度，

3)通道注意力机制网络模块的训练，包括：

挤压函数为公式(3)：

3-2)将经过2-3)融合后的特征图和3-1)最后得到的特征向量进行通道间的相乘操作；

4)目标检测网络的训练，包括：

4-2)将经过注意力机制引导过后的总体特征图送进区域建议网络，用于生成建议框anchors，通过softmax即归一化指数函数判断建议框anchors属于正样本还是属于负样本，再利用边框回归修正建议框anchors获得精确的建议框，建议框的窗口采用四维向量(x,y,w,h)表示，分别表示窗口的中心点坐标和宽高，框A代表原始的前景建议框Anchors，框G代表目标的真实框GT，目标是寻找一种关系，使得输入原始的anchor A经过映射得到一个跟真实窗口G更接近的回归窗口G’，即：

4-2-1)给定：anchor A＝(A_x,A_y,A_w,A_h)和GT＝[G_x,G_y,G_w,G_h]；

4-2-2)寻找一种F,使得：F(A_x,A_y,A_w,A_h)＝(G'_x,G'_y,G'_w,G’_h)，其中(G’_x,G'_y,G'_w,G'_h)≈(G’_x,G'_y,G'_w,G'_h)，

经过变换F从anchor A变为G’的就是如下过程：

依据公式(6)、公式(7)先做平移：

G′_x＝A_w·d_x(A)+A_x (6)，

G′_y＝A_h·d_y(A)+A_y (7)，

依据公式(8)、公式(9)再做缩放：

G′_w＝A_w·exp(d_w(A)) (8)，

G′_h＝A_h·exp(d_h(A)) (9)，

其中

函数优化目标为：

对于训练边框回归函数网络回归分支，输入是卷积特征

5)对整个卷积神经网络进行构造与训练，包括：

5-2)对检测部分网络进行训练。

2.根据权利要求1所述的基于RPF-CAM的低照度目标检测方法，其特征在于，步骤1)中所述的低照度图像Dark-images、正常照度图像Nor-images,属于同源不同光照条件的图像对，每一类场景每种类型图像对数不少于50对，图像中包含所需检测目标，检测目标的边框和类别信息包含图像中每个待检测物体的边框的坐标数值、边框长度和高度和所属类别，而且还要包含检测难度评估即较小并且跟其它物体有重叠的物体检测难度设置为1，除此之外检测难度设置为0。

3.根据权利要求1所述的基于RPF-CAM的低照度目标检测方法，其特征在于，步骤2-1)中所述的预处理为：

1)将宽度和高度都缩放为512像素；

4.根据权利要求1所述的基于RPF-CAM的低照度目标检测方法，其特征在于，步骤2-3)中所述的卷积为：

5.根据权利要求1所述的基于RPF-CAM的低照度目标检测方法，其特征在于，步骤3-1)中所述的高级特征图生成过程为：

6.根据权利要求1所述的基于RPF-CAM的低照度目标检测方法，其特征在于，步骤4-2)中所述区域建议网络为：