CN111967524A

CN111967524A - 基于高斯滤波反馈和空洞卷积的多尺度融合特征增强算法

Info

Publication number: CN111967524A
Application number: CN202010840295.9A
Authority: CN
Inventors: 郑秋梅; 王璐璐; 王风华
Original assignee: China University of Petroleum East China
Current assignee: China University of Petroleum East China
Priority date: 2020-08-20
Filing date: 2020-08-20
Publication date: 2020-11-20

Abstract

本发明提出基于高斯高通滤波反馈传播和空洞卷积的特征增强算法，对神经网络的特征提取结构改进，充分发挥深层和浅层特征互补性，解决浅层特征背景噪声过多以及下采样导致深层特征信息丢失问题。首先，通过高斯高通滤波对神经网络中提取的图像浅层特征增强，反馈传播融合上一层特征，此过程递归实现，最终获得前景增强的浅层特征；接着，利用三种不同空洞率的卷积放大深层特征感受野，捕捉更多上下文信息，将这其融合构成一个堆叠模块，丰富深层语义特征；最后，将增强后的浅层特征和语义丰富的深层特征融合，获得具有更强表征能力的输出特征，以提高目标检测的准确率。实验显示，本发明方法性能均优于原始网络，并且不会过多降低速度。

Description

基于高斯滤波反馈和空洞卷积的多尺度融合特征增强算法

技术领域

本发明提出一种基于高斯高通滤波的多级反馈和空洞卷积的多尺度融合特征增强算法，改进神经网络特征提取器，获得表征能力更强的特征，用于后续的目标检测和分类任务。提高神经网络对目标检测的准确率，属于人工智能领域。

背景技术

深度卷积神经网络在目标检测中具有很广泛的应用，并取得了一系列成功，因为它可以更强的表达图像中的特征。许多深度学习模型都采用下采样方式，通过不断降低卷积层提取的特征图的分辨率来获得语义更丰富的大感受野。但是，下采样过程会丢失大量信息，造成较小目标或者细节信息损失，并且损失的信息无法通过后续上采样操作恢复，影响提取的特征的表征能力，进而制约目标检测方法的性能。因此，如何提高有效特征的表征能力对目标检测效果至关重要。为改善这个问题，研究者致力于研究特征提取这一问题。

在特征提取过程中，浅层特征中包含大量的位置、纹理以及轮廓等信息，有利于小目标的特征表达，而随着特征层的加深，被提取的特征越具有局部代表性，更有利于大目标物体的特征表达。于是，采用将浅层特征和深层特征融合的策略，在目标检测的准确率方面均有较明显的提升。但是，浅层的特征中具有较小感受野和较高空间分辨率，除了可以提供大量位置等细节信息外，还具有较多背景噪声且语义混乱；同时，通过层层卷积和下采样操作后的得到的深层特征必然会丢失大量目标信息，尤其是像素和信息量较少的小目标信息，这些信息无法通过后续上采样操作恢复(不可逆)。这种直接将这种原始的浅层和深层特征融合的方式无法充分发挥浅层和深层特征互补的优势，影响其特征表达能力，进而制约模型检测性能，这尤其体现在小目标检测方面。

发明内容

本发明在研究了浅层特征和深层特征层的特点后，提出一种基于高斯高通滤波的多级反馈以及空洞卷积的多尺度融合特征增强算法，改进神经网络特征提取器，获得表征能力更强的特征输出，用于后续的目标检测和分类任务。首先，利用高斯高通滤波对图像浅层特征f_l(i)进行增强，再反馈传播，融合上一层特征层f_l(i-1)，获得表征能力更强的浅特征层f_l(i+1)，即利用增强后的第f_l(i)层特征结合第f_l(i-1)层特征恢复其中的模糊性内容，使用更深更有辨别力的特征来增强噪声较多、辨别能力较差但定位准确的浅层传递的信息，并且不会激活更多的背景噪声；接着，利用三种不同空洞率的空洞卷积放大深层特征f_h(i)感受野，如此可以捕捉像素更多的上下文信息，丰富深层语义特征，然后将三种不同空洞率卷积融合，构成一个堆叠式结构，覆盖全特征图；最后，将增强后的浅层特征和语义丰富的深层特征级联融合，构成一个表征能力更强的输出特征图并输出，用于后续的目标检测任务。本发明算法伪代码如图1所示。

本发明的技术方案为：一种基于高斯高通滤波的多级反馈和空洞卷积的多尺度融合特征增强算法，包括下述步骤：

1)、将图像输入到神经网络中，进行前向传播，提取特征f_l(x^[k])；

2)、将提取的浅层特征f_l(x^[k])进行一次高斯高通滤波增强，得到特征层G₁[f_l(x^[k])]，将G₁[f_l(x^[k])]反向传播，融合上层特征f_l(x^[k-1])，获得一次增强后的特征f_l(x^[k+1])，按上述过程迭代n次，直到获得最佳性能特征层f_l(x^[k+n])；

3)、将不经过下采样处理的深层特征f_h(i)经过1×1卷积处理后用三个不同空洞率的空洞卷积提取特征，叠加不同感受野的三个特征层构成一个“齿轮状”堆叠式结构f_h(i+1)，覆盖全特征图；

4)、将经过步骤四处理后的浅层特征f_l(x^[k+n])与步骤五处理的深层特征f_h(i+1)经过L2自正则化后级联融合，再通过1×1卷积层减少通道后输出表征能力更强的特征层Y，用于后续的目标检测分类任务。

本发明采取以上方法后，具有以下优点：

1、本发明提出的浅层特征增强算法不会激活过多背景噪声，通过融合上一级特征来恢复其中的模糊性信息，在增强前景特征的同时达到抑制背景噪声效果；

2、相比通过下采样扩大感受野得到的深层特征，本发明设计的堆叠式空洞卷积结构可以不进行下采样的条件下扩大感受野，并达到密集覆盖全特征图的效果，减少有效信息的丢失，促进模型对上下文信息的理解能力，且不引入过多参数；

3、将增强后的浅层特征和深层特征融合，可以获得表征能力更强的输出特征，有利于提高目标检测的准确率，经过大量实验验证，本发明在多个基准网络(baseline)上使用都可以获得比基准网络更高的准确率，且不过多降低速度。

附图说明

图1是本发明算法的整体伪代码；

图2是在VGG-16架构中的实施实例；

图3是高斯高通滤波特征增强与多级反馈融合算法伪代码；

图4是高斯高通滤波特征增强与多级反馈融合模块结构图；

图5是深层特征处理模块结构图；

图6是多尺度融合模块；

图7是实验结果。

具体实施方式

下面结合说明书附图1通过图2中具体实例对本发明做进一步说明，图2实例仅为本发明中的一个，实施步骤如下：

步骤1)前向传播到第k层卷积，计算第k层特征，对图像进行特征提取。其计算过程如下：

其中，X^K为来自浅层的特征参数，*为卷积操作,W为权重参数，B_n为偏移量参数.

是backbone结构的激活函数。

步骤2)浅层特征处理模块：高斯高通滤波特征增强与多级反馈融合，如图3和图4所示，其具体步骤如下：

S21)令f_l(x^[k])表示第k层的特征，得到：

已知频率域特征增强卷积为：

G(U,V)＝H(U,V)*F(U,V) (3)

其中，F(U,V)表示傅里叶变换，H(U,V)表示我们选用的滤波器，在我们设计的模型中，选用高斯高通滤波器作为传递函数来增强浅层中目标特征，滤波器传递函数为：

其中，D₀为截止频率，D(U,V)为频谱点到频谱中心的欧氏距离，σ为频带宽度。联合公式(2)(3)(4)，得到：

G₁[f_l(x^[k])]＝w₁*μ(f_l(x^[k])) (5)

其中，G₁[f_l(x^[k])]为f_l(x^[k])经一次高斯增强后的特征层，μ为Relu激活函数。

S22)将高斯增强后获得的G₁[f_l(x^[k])]特征层反向传播并融合特征层f_l(x^[k-1])，获得：

将f_l(x^[k])经上述过程n次递归反馈后得到：

其中n为反馈次数，通过设置实验，以mAP作为评估指标确定最佳滤波与反馈传播次数为2次。

步骤3)深层特征处理模块：令f_h(i)表示要处理的深层特征，本算法以VGG-16为例，将Conv4_3输出特征不通过下采样操作，只通过1×1的卷积平滑后得到Conv5_1层特征，用f_h(i)表示。利用空洞率分别为1，2，3的三种空洞卷积提取f_h(i)层特征，获得三种感受野不同的特征层，叠加后构成一个堆叠式空洞卷积模块f_h(i+1)，覆盖全特征图，如图5所示。

步骤4)将步骤2和步骤3中增强后的浅层特征和深层特征分别进行1×1卷积处理后，采用L2自正则化将特征值调整成相同范围，利用concatenation方式融合，再通过1×1卷积层减少通道后输出表征能力更强的特征Y，如图6所示，用于后续的目标检测和分类任务。

通过以上步骤，充分发挥并利用了深层特征和浅层特征的互补性，可以解决浅层特征背景噪声过多、干扰有效特征表达以及下采样过程导致深层特征层中的信息丢失问题，通过融合不同层特征得到表征能力更强的特征图。

本发明采用动态学习率的训练方法，利用PASCAL VOC 2007和2012数据训练时，在前25K和37.5K迭代中将学习率设置为0.001，在后10K和7.5K迭代中将学习率降低10倍。动量参数为0.9，权重衰减为0.0005，其余超参数均为Pytorch以及中的默认参数值，输入图像设置为300×300。

本发明设计的算法并不局限在某一种backbone架构中使用，通过在VGG-16和ResNet-50架构中设计模型和实现，之后在Darkent-19中成功实现模型迁移，并分别与原始Faster R CNN、Cascade R CNN、SSD以及YOLOv2网络进行对比，验证本发明算法的稳定性、有效性以及泛化能力。

在本发明的实验中，整个算法分别基于PASCAL VOC和MS-COCO数据集进行训练和测试；实验结果如图7所示，本发明算法在参数增量在可控范围内的基础上提高了2％左右的mAP，在小目标中的检测精度提升可达2.5～3％，并且不会过多影响检测速度，对于实时性检测方法仍然具有实时性检测性能。

本发明的保护范围也并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求书的保护范围为准。

Claims

1.基于高斯高通滤波多级反馈传播和空洞卷积的多尺度融合特征增强算法，其特征在于对卷积神经网络的特征提取结构进行改进，获得表征能力更强的输出特征，提高目标检测和分类任务的准确率。包含如下步骤：

1)输入一张图片，前向传播提取特征；

2)通过高斯高通滤波对神经网络中提取的浅层特征进行增强处理，将处理后的特征层反馈传播融合上一层特征，得到增强后的特征层，此过程递归实现，最终获得表征能力更强的浅层特征；

3)设计堆叠式空洞卷积模块，利用三种不同空洞率的空洞卷积放大深层特征感受野，在不通过pooling下采样减小深层特征分辨率的前提下捕捉更多上下文信息，丰富深层语义特征，将这三种不同空洞率卷积融合构成堆叠式空洞卷积模块；

4)将增强后的浅层特征和语义丰富的深层特征进行多尺度融合，获得具有更强表征能力的特征并输出，用于后续的目标检测和分类任务，以提高目标检测的准确率，且不过多降低速度。

2.如权利要求1所述的算法，其特征在于：所述步骤1)，对输入图像进行特征提取，前向传播到第k层卷积，计算第k层特征，令f_l(x^[k])表示浅层和深层特征。

3.如权利要求1所述的算法，其特征在于：所述步骤2)，设计高斯高通滤波特征增强与反馈融合算法对提取的浅层特征进行处理。具体步骤为：将步骤1中前向传播的特征f_l(x^[k])进行一次高斯高通滤波增强，获得增强后的特征层G₁[f_l(x^[k])]，将其反馈融合上一层特征，恢复其中的模糊性信息，得到一次增强后的特征f_l(x^[k+1])，此过程多次反馈执行n次，直到获得特征表征性能最佳的特征f_l(x^[k+n])。

其中n为反馈次数，通过设置实验，以广泛用于目标检测性能评估的mAP作为评估指标来确定最佳滤波与反馈传播次数为2次。

4.如权利要求1所述的算法，其特征在于：所述步骤3)，设计堆叠式空洞卷积模块进行深层特征处理。令f_h(i)表示要处理的深层特征，以VGG-16为例，将Conv4_3输出特征不通过下采样操作，只通过1×1的卷积平滑后得到Conv5_1层特征，用f_h(i)表示。利用空洞率分别为1，2，3的三种空洞卷积提取f_h(i)层特征，获得三种感受野不同的特征层，叠加后构成一个堆叠式空洞卷积模块f_h(i+1)，覆盖全特征图。

5.如权利要求1所述的算法，其特征在于：所述步骤4)，将步骤2和步骤3中处理后的浅层特征f_l(x^[k+n])和深层特征f_h(i+1)分别进行1×1卷积处理后，采用L2自正则化将特征值调整成相同范围，利用concatenation级联方式融合，最后通过1×1卷积减少通道后输出表征能力更强的特征Y，用于后续的目标检测和分类任务。