CN110942106B

CN110942106B - 一种基于平方平均的池化卷积神经网络图像分类方法

Info

Publication number: CN110942106B
Application number: CN201911279242.8A
Authority: CN
Inventors: 卢婷; 杨贺群; 胡念妍; 刘国华; 郭文静
Original assignee: Donghua University
Current assignee: Donghua University
Priority date: 2019-12-13
Filing date: 2019-12-13
Publication date: 2023-11-07
Anticipated expiration: 2039-12-13
Also published as: CN110942106A

Abstract

本发明涉及一种基于平方平均的池化卷积神经网络图像分类方法。本发明采用梯度下降法对网络中的权值和阈值参数进行逐层的反向调节，以获取网络参数的最优解。其中池化层通过设定池化窗口的大小和步长的大小进行池化运算，目的是减小特征图维度，池化规模一般为2x2。虽然最大值池化能够更多地保留图像的纹理特征，却忽略了背景特征信息。因此在池化层中使用平方平均池化运算方法，对特征矩阵进行平方平均运算，通过平方平均运算更好的保留图像的纹理和背景特征。图像经过一系列卷积层池化层后，最后得到的是一系列的特征图，然后将这些特征图中的像素依次取出，融合成一个向量传给分类器。

Description

一种基于平方平均的池化卷积神经网络图像分类方法

技术领域

本发明涉及一种神经网络图像分类的改进方法，尤其涉及一种在池化层的改进从而提高图像分类精度的方法。

背景技术

现阶段，图像分类广泛应用于各个领域，比如目标识别、图像理解、基于内容的图像检索等。近年来，随着深度学习在图像处理领域获得突破性进展，利用深度学习进行图像分类已成为一项研究热点。

第一个卷积神经网络是1987年由Alexander Waibel等提出的时间延迟网络，它被用于语音识别问题。随着技术的发展，卷积神经网络被逐步改进，并应用于计算机视觉领域。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络，是一种多层的监督学习神经网络，通过权值共享和卷积运算直接处理二维图像。其基本结构是一系列交替连接的卷积层和池化层以及一个全连接的输出层，卷积神经网络中的三个关键操作为：局部感受野、权值共享和池化。

在计算机视觉领域，卷积神经网络(CNN)已经成为最主流的方法，最常见的卷积神经网络模型有GoogLenet，VGG-19，Incepetion等。CNN史上的一个里程碑事件是ResNet模型的出现，ResNet可以训练出更深的CNN模型，从而实现更高的准确度。ResNet模型的核心是通过建立前面层与后面层之间的“短路连接”，这有助于训练过程中梯度的反向传播，从而能训练出更深的CNN网络。而本发明采用的是DenseNet模型，它的基本思路与ResNet一致，但是它建立的是前面所有层与后面层的密集连接，它的名称也是由此而来。DenseNet的另一大特色是通过特征在通道上的连接来实现特征重用。

发明内容

本发明的目的是：使得池化过程中能够很好地保留图像的纹理特征和背景特征，从而提升分类精度。

为了达到上述目的，本发明的技术方案是提供了一种基于平方平均的池化卷积神经网络图像分类方法，其特征在于，包括以下步骤：

步骤1、将训练集输入到卷积层进行卷积运算，在卷积运算过程中对训练集中的图像进行特征提取，增强原图像信息并降低图像噪声；

步骤2、将卷积层输出的训练集输入到3x3的最大池化层进行处理；

步骤3、将最大池化层输出的训练集输入到密集连接块Dense Block中，在密集连接块Dense Block中采用密集连接的方式处理训练集中的特征图；

步骤4、把密集连接块Dense Block处理后的特征图输入过渡层中进行卷积和平方平均池化运算，通过平方平均池化运算进一步增强特征信号；

步骤5、在通过一系列密集连接块Dense Block和过渡层处理后，在最后的池化层进行7x7的全局平均池化，最终得到多个具有统一输出维度的特征矩阵；

步骤6、把特征矩阵融合为输出特征向量，对输出特征向量进行分类；

步骤7、对网络进行多次训练，调整中间参数，使输入输出的关系更加明显。

优选地，步骤1中，所述卷积层采用的卷积公式如式(1)所示：

式(1)中，为第n层的输出特征，x和y分别为输出特征的长度和高度，为第n层的长度为x、高度为y的感受野；/>为第n-1层的输出特征，其为第n层的输入特征；w_n为权重；b_n为置偏；f为激活函数，如式(2)所示：

优选地，步骤3中，所述密集连接块Dense Block使用非线性组合函数H_l(·)，非线性组合函数H_l(·)包含BN、ReLU、3x3卷积，在每个密集连接块Dense Block中在经过各个层的卷积之后均输出k个特征图，即采用k个卷积核，k为增长率。

优选地，步骤3中，所述密集连接块Dense Block中的密集连接具体实现为：将第一层收到的前边所有的特征图,作为其输入，然后用式(3)完成密集连接操作：

X_l＝H_l([x₀,x₁,…,x_l-1]) (3)

式(3)中，[x₀,x₁,…,x_l-1]代表对第0层到(l-1)层的特征图进行拼接操作，X_l表示第l层的输入。

本发明采用梯度下降法对网络中的权值和阈值参数进行逐层的反向调节，以获取网络参数的最优解。其中池化层通过设定池化窗口的大小和步长的大小进行池化运算，目的是减小特征图维度，池化规模一般为2x2。在所有的卷积神经网络模型中应用最广泛的是基于最大值池化的池化算法，它是一种有效的提取特征算法。虽然最大值池化能够更多地保留图像的纹理特征，却忽略了背景特征信息。因此我们在池化层中使用平方平均池化运算方法，对特征矩阵进行平方平均运算，通过平方平均运算更好的保留图像的纹理和背景特征。图像经过一系列卷积层池化层后，最后得到的是一系列的特征图，然后将这些特征图中的像素依次取出，融合成一个向量传给分类器。

综上所述，平方平均池化卷积神经网络能更多的保留图像的纹理和背景特征，提高分类精度。因此，我们设计了基于平方平均池化卷积神经网络的图像分类方法。

为解决现有分类算法存在的问题，如丢失重要特征信息，本发明提出了一种基于平方平均池化卷积神经网络的图像分类方法，简述本发明的实现步骤：首先将所有图像输入网络提取出图像的全局或者局部特征；然后，对这些特征进行编码得到张量；接下来，进行向量的池化；最后，用分类器进行分类。

相对于现有技术，本发明的优点在于：

1、本发明提供一种基于平方平均的池化卷积神经网络图像分类方法，利用最大池化能更多地保留图像纹理特征的优点，以及平均池化能更多地保留图像背景特征的优点，将最大池化和平均池化相结合，并利用平方平均的思想更多地保留图像纹理特征和背景特征，使得图像的分类精度提高。

2、基于平方平均的池化卷积神经网络图像分类方法不仅可以提高图像分类精度，还可以降低图像分类损失，如图1所示这个方法在Cifar-10数据集上精度由原来的89.87％提升到90.38％，分类精度提升了约百分之一。并且从图2可以看出本方法下的图像分类损失很低。

附图说明

图1是采用平方平均方法的图像分类精度图；

图2是采用平方平均方法的图像分类损失图；

图3是DenseNet网络结构图；

图4是Dense Block中各层特征图的连接示意图；

图5是本发明平方平均池化的运算示意图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的DenseNet网络结构如图3所示，在该结构上实现的图像分类方法包括如下步骤：

步骤一、将Cifar-10训练集输入到图1所示网络的卷积层进行卷积运算，在卷积运算过程中对图像进行特征提取，增强原图像信息并降低图像噪声。

卷积公式如式(1)所示：

步骤二、训练集通过卷积后输入到3x3的最大池化层进行处理。

步骤三、再把经池化处理后的训练集输入到图1的Dense Block中。Dense Block采用密集连接方式处理特征图，其具体连接方式如图2所示，然后将处理后的特征图输出到过渡层。

在Dense Block中，各个层的特征图大小必须一致，保证能够在通道维度上连接。Dense Block中使用非线性组合函数H_l(·)，该函数包含BN、ReLU、3x3卷积这些操作，在每个Dense Block中在经过各个层的卷积之后均输出k(k＝12)个特征图，即采用k个卷积核。k在DenseNet中是一个超参数，被称为增长率。DenseBlock中的密集连接具体实现为：将第一层收到的前边所有的特征图,作为其输入，然后用式(3)完成密集连接操作，其中[x₀,x₁,…,x_l-1]代表对第0层到(l-1)层的特征图进行拼接操作。本实施方案中l＝5。

X_l＝H_l([x₀,x₁,…,x_l-1]) (3)

步骤四、把Dense Block处理后的特征图输入到过渡层中。该过渡层由批量归一化层、1x1卷积层和平方平均池化层组成。通过平方平均池化运算进一步增强特征信号。在池化层中，对训练集进行平方平均池化，本实施方案中池化规模为2x2，具体计算示意图如图5，公式为：

式(4)中，Max表示局部接受域中值最大的点，Avg表示局部接受域中所有值的平均值。

步骤五、通过一系列Dense Block和过渡层处理后，在最后的池化层进行7x7的全局平均池化，最终得到多个具有统一输出维度的特征矩阵。

步骤六、把特征矩阵融合为输出特征向量；对输出特征向量进行分类。

步骤七、对网络进行多次训练，调整中间参数，使输入输出的关系更加明显。

Claims

1.一种基于平方平均的池化卷积神经网络图像分类方法，其特征在于，包括以下步骤：

步骤4、把密集连接块Dense Block处理后的特征图输入过渡层中进行卷积和平方平均池化运算，通过平方平均池化运算进一步增强特征信号，在平方平均池化运算中对特征矩阵进行平方平均运算；

2.如权利要求1所述的一种基于平方平均的池化卷积神经网络图像分类方法，其特征在于，步骤1中，所述卷积层采用的卷积公式如式(1)所示：

。

3.如权利要求1所述的一种基于平方平均的池化卷积神经网络图像分类方法，其特征在于，步骤3中，所述密集连接块Dense Block使用非线性组合函数H_l(·)，非线性组合函数H_l(·)包含BN、ReLU、3x3卷积，在每个密集连接块Dense Block中在经过各个层的卷积之后均输出k个特征图，即采用k个卷积核，k为增长率。

4.如权利要求3所述的一种基于平方平均的池化卷积神经网络图像分类方法，其特征在于，步骤3中，所述密集连接块Dense Block中的密集连接具体实现为：

将第一层收到的前边所有的特征图,作为其输入，然后用式(3)完成密集连接操作：

X_l＝H_l([x₀,x₁,…,x_l-1]) (3)