CN108875906B

CN108875906B - 一种多尺度逐步累加的卷积神经网络学习方法

Info

Publication number: CN108875906B
Application number: CN201810359791.5A
Authority: CN
Inventors: 朱建清; 曾焕强; 陈婧; 蔡灿辉; 杜永兆; 吴含笑
Original assignee: Huaqiao University
Current assignee: Huaqiao University
Priority date: 2018-04-20
Filing date: 2018-04-20
Publication date: 2019-06-04
Anticipated expiration: 2038-04-20
Also published as: CN108875906A

Abstract

本发明涉及一种多尺度逐步累加的卷积神经网络学习方法，可广泛应用于机器视觉和人工智能领域，例如目标检测、目标分类、目标识别等。首先，本发明采用均值池化操作对输入图像构建多尺度图像金字塔；然后，将各个不同尺度的图像逐步送入卷积神经网络，让卷积神经网络随着网络深度的逐步深入，能够在多种不同尺度的图像上进行学习并进行特征逐步累加，从提高了而卷积神经网络的特征学习能力。

Description

一种多尺度逐步累加的卷积神经网络学习方法

技术领域

本发明涉及机器视觉和人工智能领域，特别涉及一种多尺度逐步累加的卷积神经网络学习方法，可应用于目标检测、目标分类和目标识别系统。

背景技术

卷积神经网络是目前最流行的一种深度学习算法。近年来涌现出大量基于卷积神经网络的目标检测、目标分类和目标识别算法，这些算法的准确性很大程度上依赖于卷积神经网络特征学习能力。

对卷积神经网络的研究，目前多数聚焦于通过加深网络深度来提升特征学习能力，出现了很多极深的卷积神经网络，例如GoogleNet，ResNet，DenseNet等。这些极深的卷积神经网络确实提升了卷积神经网络的特征学习能力，但是其相应的计算量也急剧增长。此外，不管网络的深度如何，这些极深的卷积神经网络都是将最后的特征映射(FeatureMap)作为最终的图像特征表达，意味着只有单一尺度的特征被学习得到，因此卷积神经网络的特征学习能力依然具有一定的提升空间。

除了上述极深的卷积神经网络之外，亦有少数多尺度卷积神经网络被提出来。文献[1](P.Sermanet and Y.LeCun.Traffic sign recognition with multi-scaleconvolutional networks[C].The 2011International Joint Conference on NeuralNetworks,San Jose,CA,2011,pp.2809-2813)将不同深度的下采样池化(Pooling)层输出的特征映射进行线性组合获得最终的多尺度融合特征。可见，文献[1]的这种做法并不是在一个多尺度的图像金字塔中学习多尺度特征。文献[2](J.Liu,Z.J.Zha,and Q.I.Tian,etal.Multi-scale triplet CNN for person re-identification[C].ACM on MultimediaConference,Theater Tuschinski,Amsterdam,2016,pp.192-196)首先使用不同的下采样率，获得一系列分辨率不同的输入图像；其次，在高分辨率的图像上训练深的卷积神经网络，而在低分辨率图像上训练浅的卷积神经网络；最后，把多个深浅不一的卷积神经网络的最后一层输出的特征映射全部串联起来，获得最终的多尺度融合特征。可见，文献[2]的算法未能把图像下采样操作整合到卷积神经网络的学习中，且它实际上需要训练同时多个卷积神经网络，计算量偏大。

发明内容

本发明的目的在于提供一种多尺度逐步累加的卷积神经网络学习方法，该方法具有能够融合多种不同尺度的特征的能力，可提升卷积神经网络的特征学习能力。

为实现上述目的，本发明采用的技术方案是：

一种多尺度逐步累加的卷积神经网络学习方法，其具体包括以下步骤：

步骤1、构建多尺度图像金字塔；

输入图像作为第一个尺度图像，将输入图像通过低通滤波器滤除噪声，并利用下采样操作得到分辨率更低的第二个尺度图像；然后在第二个尺度图像上继续进行低通滤波和下采样操作，得到第三个尺度图像；如此重复，最终构建出具有N个尺度图像的多尺度图像金字塔，其中，N≥2；

步骤2、逐步累加的多尺度特征学习；

把步骤1中的构建多尺度图像金字塔中各个不同尺度的图像逐步送入卷积神经网络，使得在不同尺度的图像上学习的特征随着网络深度的深入逐步累加，最终获得图像的多尺度特征表达，具体如下：

首先，融合第一个尺度图像和第二个尺度图像上的特征，即将第一个尺度图像经过卷积神经网络单元和下采样的最大池化层后得到特征F₁，第二个尺度图像经过卷积神经网络单元后得到特征F₂，将特征F₁和特征F₂进行融合得到融合特征G₂；

当N＝2时，将融合特征G₂依次经过卷积神经网络单元、下采样的最大池化层、全连接单元、Softmax损失函数后，得到图像的多尺度特征表达；

当N≥3时，将融合特征G₂与第三个尺度图像上的特征进行融合，即将融合特征G₂经过卷积神经网络单元和下采样的最大池化层后得到特征H₂，第三个尺度图像经过卷积神经网络单元后得到特征F₃，将特征H₂和特征F₃进行融合得到融合特征G₃；以此类推，直至得到融合特征G_N，最后将融合特征G_N依次经过卷积神经网络单元、下采样的最大池化层、全连接单元、Softmax损失函数后，得到图像的多尺度特征表达。

所述步骤1中，所述低通滤波为均值滤波，所述下采样操作为等间隔下采样。所述均值滤波和等间隔下采样采用均值池化操作实现。

所述步骤2中，不同尺度图像上的特征在进行融合时采用逐步累加的方式实现。

采用上述方案后，本发明首先采用均值池化操作对输入图像构建多尺度图像金字塔；然后将各个不同尺度的图像逐步送入卷积神经网络，让卷积神经网络随着网络深度的逐步深入，能够在多种不同尺度的图像上进行学习并进行特征的逐步累加，从提高了而卷积神经网络的特征学习能力。

此外，由于从不同尺度图像上所学的特征采用逐步累加的方式进行融合，在多尺度特征学习过程中，不会显著增加特征维数，进而保证卷积神经网络的复杂度不会显著增加，从而节省了计算量。

附图说明

图1为本发明卷积神经网络学习方法流程图；

图2为本发明卷积神经网络单元框图。

具体实施方式

本发明揭示了一种多尺度逐步累加的卷积神经网络学习方法，其采用均值池化操作对输入图像构建多尺度图像金字塔；然后，将各个不同尺度的图像逐步送入卷积神经网络，让卷积神经网络随着网络深度的逐步深入，能够在多种不同尺度的图像上进行学习并进行特征逐步累加，从提高了而卷积神经网络的特征学习能力。

如图1所示，本发明的一种多尺度逐步累加的卷积神经网络学习方法，具体步骤如下：

步骤1、采用一种基于均值池化(Average Pooling,AP)操作的快速算法实现多尺度图像金字塔的构建。

对输入图像，通过均值低通滤波器滤除噪声，再通过等间隔下采样操作得到分辨率更低的下一个尺度的图像；然后在新得到的图像上，继续进行均值低通滤波和等间隔下采样操作，又得到下一个尺度的图像；如此重复这种低通滤波和下采样操作，最终构建出多尺度图像金字塔。在本实施例中，均值低通滤波和等间隔下采样操作被整合在一起，用均值池化(Average Pooling,AP)操作加以快速实现。

如图1所示，本具体实施例采用三个均值池化层(AP1、AP2、AP3)构建了多尺度图像金字塔，该多尺度图像金字塔具有四个尺度的图像。其中，第一个尺度图像的分辨率为128×128，其经过均值池化层AP1后得到第二个尺度图像，第二尺度图像的分辨率为64×64；第二个尺度图像经过均值池化层AP2得到第三个尺度图像，第三尺度图像的分辨率为32×32；第三个尺度图像经过均值池化层AP3得到第四个尺度图像，第四尺度图像的分辨率为16×16。

步骤2、逐步累加的多尺度特征学习：把步骤1中的构建多尺度图像金字塔中各个不同尺度的图像逐步送入卷积神经网络，使得在不同尺度的图像上学习的特征随着网络深度的深入逐步累加，最终获得图像的多尺度特征表达。

如图2所示，为了便于描述，本发明将卷积层(Conv)、批归一化层(Batch Norm)和ReLU激活函数整合为卷积神经网络单元，即CBR单元，本具体实施例中所有CBR单元中统一采用3×3大小的滤波器，并采用1像素补零操作。

随着网络深度的深入CBR单元的输出特征通道数倍增，例如，图1中的卷积神经网络单元CBR1和CBR2输出的特征映射为64通道；卷积神经网络单元CBR3和CBR4输出的特征映射为128通道；卷积神经网络单元CBR5和CBR6输出的特征映射为256通道；CBR7单元输出的特征映射为512通道；全连接(Full Connection,FC)单元输出的特征映射为1024通道。

多尺度图像金字塔中各个不同尺度的图像在进行学习时，先融合第一个尺度图像和第二个尺度图像上的特征，即第一尺度的图像经过卷积神经网络单元CBR1和下采样的最大池化层(Max Pooling,MP)MP1后得到对应的特征F₁，再把第二尺度的图像经过卷积神经网络CBR2后得到对应的特征F₂，然后把两个不同尺度的输入图像上所学得的特征F₁和F₂经过求和层(Summation，SUM)SUM1进行融合，得到融合特征G₂。

再进一步将融合特征G₂和第三个尺度图像上的特征F₃进行融合，即融合特征G₂经过卷积神经网络单元CBR3和下采样的最大池化层MP2后得到对应的特征H₂，再把第三尺度的图像经过卷积神经网络单元CBR4后得到对应的特征F₃，最后把特征H₂和F₃经过求和层SUM2进行融合，得到融合特征G₃。

接着，将融合特征G₃和第四个尺度图像上的特征F₄进行融合，即融合特征G₃经过卷积神经网络单元CBR5和下采样的最大池化层MP3后得到对应的特征H₃，再把第三尺度的图像经过卷积神经网络单元CBR6后得到对应的特征F₄，最后把特征H₃和F₄经过求和层SUM3进行融合，得到融合特征G₄。

将得到的融合特征G₄依次经过卷积神经网络单元CBR7、下采样的最大池化层MP4、全连接(Full Connection,FC)单元和softmax损失函数后得到图像的多尺度特征表达，最终实现不同尺度图像上所学特征的逐步融合。

本实施例中的所有的池化层，包括四个最大池化层(MP1、MP2、MP3和MP4)和三个均值池化层(AP1、AP2和AP3)采用池化窗口皆为3×3，采用步长为2像素，并采用1像素补零操作。

以上所述，仅是本发明实施例而已，并非对本发明的技术范围作任何限制，故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰，均仍属于本发明技术方案的范围内。

Claims

1.一种多尺度逐步累加的卷积神经网络学习方法，其特征在于：所述学习方法具体包括以下步骤：

步骤1、构建多尺度图像金字塔；

步骤2、逐步累加的多尺度特征学习；

2.根据权利要求1所述的一种多尺度逐步累加的卷积神经网络学习方法，其特征在于：所述步骤1中，所述低通滤波为均值滤波，所述下采样操作为等间隔下采样。

3.根据权利要求2所述的一种多尺度逐步累加的卷积神经网络学习方法，其特征在于：所述均值滤波和等间隔下采样采用均值池化操作实现。

4.根据权利要求1所述的一种多尺度逐步累加的卷积神经网络学习方法，其特征在于：所述步骤2中，不同尺度图像上的特征在进行融合时采用逐步累加的方式实现。