CN111144460A

CN111144460A - 一种提高卷积神经网络分类性能的算法

Info

Publication number: CN111144460A
Application number: CN201911291641.6A
Authority: CN
Inventors: 文颖; 沈庾涛
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2019-12-16
Filing date: 2019-12-16
Publication date: 2020-05-12

Abstract

本发明公开了一种提高卷积神经网络分类性能的算法，其特点是采用全局深度空洞卷积进行CNN优化的算法，实现高效的图像分类，其具体优化包括：特征映射多尺度化、提取特征映射重要性得分、约束重要性得分和特征映射加权。本发明与现有技术相比具有高率的图像分类，有效提高卷积神经网络分类性能，极大的降低了提取特征映射的重要性得分所需要庞大计算量的要求，多种不同架构的CNN在图像分类领域的性能均有显著提升，进一步推动了相关问题的研究与应用，具有广泛的实用意义。

Description

一种提高卷积神经网络分类性能的算法

技术领域

本发明涉及深度学习技术领域，尤其是一种基于多尺度特征映射和全局深度空洞卷积的提高卷积神经网络分类性能的算法。

背景技术

深度学习技术在图像分类、语义分割等领域表现优异，卷积神经网络(CNN)的提出使得网络在计算机视觉领域上进入新的高度，CNN能够在极短的时间内理解一幅自然图像所包含的信息。一般CNN在达到性能的瓶颈后，很难再对其精度进行提高。现今的工作大部分聚焦于寻找更好的CNN架构，而我们无法预知新的CNN架构是否会有较好的表现，所以需要大量的实验来验证新的架构的性能。基于此，本发明提出了一种基于多尺度特征映射和全局深度空洞卷积的提高卷积神经网络分类性能的算法，作为分支模块嵌入到多种不同架构的CNN中进行优化，而无需探索新的网络架构，以达到提高CNN性能的目的。

发明内容

本发明的目的是针对现有技术的不足而设计的一种提高卷积神经网络分类性能的算法，采用多尺度特征映射和全局深度空洞卷积算法，作为分支模块嵌入到多种不同架构的CNN中进行优化，以提高卷积神经网络分类性能，通过GDDConv提取每一个通道内的多尺度特征映射的重要性得分充分考虑了特征映射的多尺度信息，对多尺度特征映射中每一个关键位置都产生响应，引入的GDDConv参数少，计算代价较小，分类性能好，极大的降低了提取特征映射的重要性得分所需庞大计算量，图像分类效率高，多种不同架构的CNN在图像分类领域的性能均有显著提升，具有广泛的实用意义。

本发明的目的是这样实现的：一种提高卷积神经网络分类性能的算法，其特点是采用全局深度空洞卷积进行CNN优化的算法，有效提高卷积神经网络分类性能，实现高效的图像分类，其优化流程具体包括以下步骤：

a步骤：对卷积神经网络输入图像，生成不同层级的特征映射；

b步骤：通过不同的卷积操作的组合得到特征映射在不同感受野下的输出，并将这些不同感受野下的输出与原特征映射相加得到新的多尺度特征映射；

c步骤：利用全局深度空洞卷积提取多尺度特征映射的每一个通道的重要性得分；

d步骤：通过Sigmoid函数约束步骤c中得到的重要性得分；

e步骤：根据步骤d中的得分对原特征映射加权；

f步骤：对原卷积神经网络的不同层级的特征映射执行b～e步骤；

g步骤：在训练集上进行训练，得到优化的卷积神经网络。

所述优化流程作为分支模块嵌入卷积神经网络的不同层。

所述提取特征映射的重要性得分基于全局深度空洞卷积操作。

所述优化流程分为特征映射多尺度化、提取特征映射重要性得分、约束重要性得分和特征映射加权四部分。

本发明与现有技术相比具有高率的图像分类，极大的降低了提取特征映射的重要性得分所需要庞大计算量的要求，在提高CNN的分类精度的同时保持了CNN的处理速度，有效提升了多种不同架构的CNN在图像分类领域的性能，进一步推动了相关问题的研究与应用，具有广泛的实用意义。

附图说明

图1为本发明流程图；

图2为全局深度空洞卷积结构示意图；

图3为CNN架构的两种嵌入方式示意图；

图4为实施例1的图像分类结果。

具体实施方式

通过以下具体实施例对本发明作进一步的详细说明。

实施例1

参阅附图1，本发明按下述步骤进行卷积神经网络分类性能优化的：

a步骤：对卷积神经网络输入图像，生成不同层级的特征映射

将输入图像记为I，并将图像I输入至CNN后得到不同层级的特征映射记为Y_i，其中i代表第i个层级。

b步骤：通过不同卷积操作的组合得到特征映射在不同感受野下的输出，并将这些不同感受野下的输出与原特征映射相加得到新的多尺度特征映射，所述感受野(receptivefiled)是指在CNN中，决定某一层输出结果中一个元素所对应的输入层的区域大小，感受野越大，得到的输出特征映射所包含的大尺度信息越多。由于原特征映射的空间尺寸比较大且尺度单一，直接在原特征映射上进行操作效果较差，所以对原特征映射进行下述不同感受野下的卷积操作：

分别取感受野为3×3，5×5和7×7，其中，5×5的感受野由两个3×3的标准卷积组合获得，7×7的感受野由一个3×3的标准卷积和一个空洞尺寸为2的3×3的空洞卷积组合获得。将不同感受野下的输出结果与原特征映射按下述a式计算，得到新的多尺度特征映射：

U_i＝Y_i+Conv_3×3(Y_i)+Conv_3×3(Conv_3×3(Y_i))+DConv_3×3(Conv_3×3(Y_i))Y_i，U_i∈H_i×W_i×C_i (a)，

其中：Cony_3×3(·)为3×3的标准卷积，可以获得3×3的感受野；而两个3×3的标准卷积，即第三项组合构成了5×5的感受野；DConv_3×3(·)代表一个空洞尺寸为2的3×3的空洞卷积，因此，上式最后一项的卷积组合获得了7×7的感受野；U_i为新的多尺度特征映射，即不同感受野下的输出与原特征映射相加的结果；H_i×W_i×C_i为原特征映射Y_i与新的多尺度特征映射U_i的空间尺寸。

c步骤：利用全局深度空洞卷积提取新的多尺度特征映射的每一个通道的重要性得分

参阅附图2，在CNN中，不同通道内的特征映射在前向传播的过程中影响是不一样的，根据每一个通道内的特征映射的重要性来重新加权这些特征映射可以优化CNN对图像的分类性能，按下述b式计算通过GDDConv提取每一个通道内的特征映射的重要性得分：

V_i＝GDDConv(U_i)

V_i∈1×C_i (b)，

其中：GDDConv(·)是全局深度空洞卷积；V_i为对应于U_i的每一个通道内特征映射的重要性得分；GDDConv为多尺度特征映射U_i的每个关键位置进行响应，对每个关键位置赋予了可学习的权重。对应GDDConv的卷积核尺寸大小固定为7×7，由于CNN的不同层级的特征映射共拥有4种尺寸，分别是56×56、28×28、14×14和7×7，所以GDDConv分别对应采用空洞尺寸为4、3、2和1的卷积核以令输出是1×C_i的一维向量V_i。

d步骤：通过Sigmoid函数约束步骤c中得到的重要性得分

直接由步骤c得到的重要性得分数值相差较大，存在有的得分过高有的得分过低的情况，引入Sigmoid函数进行约束后可以将重要性得分约束在0-1间，按下述c式进行重要性得分约束计算：

其中：

为约束后的重要性得分。

e步骤：根据步骤d中的约束后的重要性得分按下述d式对原特征映射加权计算：

其中：Mul(·)为逐通道的乘法，利用约束后的重要性得分

对原特征映射Y_i进行加权得到

将

馈入原卷积神经网络的第i层进行优化。

f步骤：对原卷积神经网络的不同层级的特征映射执行b～e步骤参阅附图3，该模块在常见的两种CNN架构上的嵌入方法(其代表网络分别为vgg和ResNet)，将b～e步骤构建的优化模块嵌入至CNN的不同层级的特征映射上，使得不同层级的原始特征映射根据其自身的重要性得分重新加权，得到整个优化后的CNN。

步骤g：在训练集上进行训练，得到优化的卷积神经网络

取数据集为ImageNet-2012，总共训练90轮，batch_size设为256，学习率初始时设为0.1，并在30轮和60轮时各缩小十倍。

参阅附图4，原始的CNN为ResNet-50，参数量为24M，经90轮训练后在ImageNet-2012测试集上取得了75.27％的分类精度，其参数量为25M，使用相同的训练过程后最终精度达到了77.22％，比原网络提高了约2％的分类精度。本发明引入的GDDConv参数较少、计算代价较小，通过GDDConv提取每一个通道内的多尺度特征映射的重要性得分充分考虑了特征映射的多尺度信息，对多尺度特征映射中每一个关键位置都产生响应。

以上只是对本发明作进一步的说明，并非用以限制本专利，在不背离本发明构思的精神和范围下的等效实施，均应包含于本专利的权利要求范围之内。

Claims

1.一种提高卷积神经网络分类性能的算法，其特征在于采用全局深度空洞卷积进行CNN优化的算法，提高卷积神经网络分类性能，实现高效的图像分类，其优化流程具体包括以下步骤：

d步骤：通过Sigmoid函数约束步骤c中得到的重要性得分；

e步骤：根据步骤d中的得分对原特征映射加权；

f步骤：对原卷积神经网络的不同层级的特征映射执行b~e步骤；

g步骤：在训练集上进行训练，得到优化的卷积神经网络。

2.根据权利要求1所述提高卷积神经网络分类性能的算法，其特征在于所述优化流程作为分支模块嵌入卷积神经网络的不同层。

3.根据权利要求1所述提高卷积神经网络分类性能的算法，其特征在于所述提取特征映射的重要性得分基于全局深度空洞卷积操作。

4.根据权利要求1或权利要求2所述提高卷积神经网络分类性能的算法，其特征在于所述优化流程分为特征映射多尺度化、提取特征映射重要性得分、约束重要性得分和特征映射加权四部分。