CN110942105B

CN110942105B - 一种基于最大池化和平均池化的混合池化方法

Info

Publication number: CN110942105B
Application number: CN201911279148.2A
Authority: CN
Inventors: 卢婷; 宋佳霏; 黄若琳; 张磊; 常姗
Original assignee: Donghua University
Current assignee: Donghua University
Priority date: 2019-12-13
Filing date: 2019-12-13
Publication date: 2022-09-16
Anticipated expiration: 2039-12-13
Also published as: CN110942105A

Abstract

本发明涉及一种基于最大池化和平均池化的混合池化方法。本发明结合了最大池化和平均池化的优点，利用平方平均的数学意义和实际意义，形成了一种基于最大池化和平均池化的混合池化方法，该池化方法能够更好的保留图像的纹理特征和背景特征，从而提高图像分类精度，并降低分类损失。本发明是基于DenseNet所做的实验，但本发明可应用于其他使用池化层的卷积神经网络，比如ResNet，FastRCNN等等。

Description

一种基于最大池化和平均池化的混合池化方法

技术领域

本发明涉及一种神经网络池化层改进方法，涉及人工智能领域，具体地说，是一种基于最大池化和平均池化的混合池化方法。

背景技术

图像分类，是根据各自在图像信息中所反映的不同特征，把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析，把图像或图像中的每个像素或区域划归为若干个类别中的某一种，以代替人的视觉判读。近年来，随着深度学习在图像处理领域获得突破性进展，利用深度学习进行图像分类已成为一项研究热点。

密集连接卷积网络(Densely Connected Convolutional Networks，DenseNet)是一种基于卷积神经网络(Convolutional Neural Network，CNN)改进的前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。它包括卷积层(alternating convolutional layer)和池化层(pooling layer)。

密集连接卷积网络中卷积层主要利用局部感受野以及共享权重技术输出数据，池化层将卷积层输出数据作为输入数据进行特征提取并输出特征图(feature map)，大幅减少卷积网络中参数的个数，防止卷积网络过拟合，并且使卷积网络更容易被训练，同时能够大大提高模式识别的准确率。

密集连接网络中使用的方法有最大池化(max-pooling)，即取池化区域内的最大值作为特征值输出；以及平均池化(mean-pooling)，即取池化区域内的平均值作为特征值输出。最大池化能够减小卷积层参数误差造成估计均值的偏移，更多的保留纹理信息；平均池化能够减小邻域大小受限造成的估计值方差增大的误差，更多的保留背景信息。但最大池化方法忽略了部分有效特征的表现，平均池化方法弱化了最鲜明特征的表现。

发明内容

本发明的目的是：使卷积网络能够更好的保留图像的纹理特征和背景特征，从而提高图像分类精度，并降低分类损失。

为了达到上述目的，本发明的技术方案是提供了一种基于最大池化和平均池化的混合池化方法，其特征在于，包括以下步骤：

步骤1、将图像X输入卷积层，卷积层采用的公式如式(1)所示：

式(1)中，X*W表示图像X与卷积区域W做卷积；x(i+m,j+n)表示图像X中第i行第j列像素x(i,j)每次沿横坐标移动m步长、每次沿纵坐标移动n步长；w(m,n)代表卷积区域W中第m行第n列的大小；

步骤2、卷积层计算输出的数据作为第一个池化层的输入；

步骤3、上一个池化层计算后输出的数据送入第一个密集连接块Dense Block1；

步骤4、将0到i层的输出特征图x₀,……,x_l-1作为i+1层的输入，则有：

x_l＝H_l([x₀,x₁,...,x_l-1]) (2)

式(2)中，[x₀,x₁,...,x_l-1]表示第0层到第l-1层产生的特征图的合并，H_l(.)由三部分组成：批标准化BatchNorm，激活函数ReLU和一个3x3的卷积；

步骤5、上一个密集连接块Dense Block输出的数据送入过渡层TransitionLayer，过渡层Transition Layer包括一个1×1的卷积层和2×2的池化层，在2×2的池化区域中，式(3)进行计算：

式(3)中，max²表示放大最鲜明特征的占比，avg是考虑了四个特征值的综合结果，(max-avg)²即放大最大值损失的占比，式(3)所得作为池化层的输出特征；

步骤6、重复步骤3到步骤5两次；

步骤7、重复步骤3到步骤4一次；

步骤8、第四个密集连接块Dense BlockDense Block 4输出的数据送入分类层Classification Layer，分类层Classification Layer包括池化区域为7×7的平均池化和全连接层。

与现有技术相比，本发明的有益之处是：

本发明结合了最大池化和平均池化的优点，利用平方平均的数学意义和实际意义，形成了一种基于最大池化和平均池化的混合池化方法，该池化方法能够更好的保留图像的纹理特征和背景特征，从而提高图像分类精度，并降低分类损失。本发明是基于DenseNet所做的实验，但本发明可应用于其他使用池化层的卷积神经网络，比如ResNet，FastRCNN等等。

附图说明

图1为DenseNet网络结构示意图；

图2为Dense Block结构示意图；

图3为本发明在卷积网络池化层运算示意图；

图4为使用本发明的Cifar-10数据集在DenseNet中的实验结果损失图；

图5为使用本发明的Cifar-10数据集在DenseNet中的实验结果精度图。

具体实施方式

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明提供的一种基于最大池化和平均池化的混合池化方法，包括以下步骤：

步骤2、卷积层计算输出的数据作为第一个池化层(采用池化区域为3×3的最大池化，每次移动步长为2，见下表1)的输入；

表1

x_l＝H_l([x₀,x₁,...,x_l-1]) (2)

式(2)中，[x₀,x₁,...,x_l-1]表示第0层到第l-1层产生的特征图的合并，H_l(.)由三部分组成：批标准化BatchNorm，激活函数ReLU和一个3x3的卷积，见图2；

步骤5、上一个密集连接块Dense Block输出的数据送入过渡层TransitionLayer，过渡层Transition Layer包括一个1×1的卷积层和2×2的池化层，见上表1，在2×2的池化区域中，式(3)进行计算(具体计算方法见图3)：

步骤6、重复步骤3到步骤5两次；

步骤7、重复步骤3到步骤4一次；

步骤8、第四个密集连接块Dense BlockDense Block 4输出的数据送入分类层Classification Layer，分类层Classification Layer包括池化区域为7×7的平均池化和全连接层，见上表1。

本发明中使用的公式的意义是：

max²的意义是：放大最鲜明特征的占比；

(max-avg)²的意义是：avg是考虑了四个特征值的综合结果，max-avg是最鲜明特征相对于平均特征的损失，(max-avg)²即放大最大值损失的占比；

的意义是：求平均。

开根号的意义是：求平方平均。

实验结果经整理后如下：

数据集：Cifar-10。

相同轮数(epoch)下精度对比如下表所示。

	Epoch 030	Epoch 040	Epoch 060	Epoch 090
					Max-pooling	83.45	89.28	89.91	89.66
本发明	88.44	90.15	90.05	90.06

相同精度(acc)下轮数对比如下表所示。

	89.86	89.93
			Max-pooling	Epoch 062	Epoch 092
本发明	Epoch 050	Epoch 070

本发明是基于DenseNet所做的实验，但本发明可应用于其他使用池化层的卷积神经网络，比如ResNet，FastRCNN等等。

Claims

1.一种基于最大池化和平均池化的混合池化方法，其特征在于，包括以下步骤：

步骤2、卷积层计算输出的数据作为第一个池化层的输入，第一个池化层采用池化区域为3×3的最大池化，每次移动步长为2；

步骤3、上一个池化层计算后输出的数据送入第一个密集连接块Dense Block 1；

步骤4、将0到l-1层的输出特征图x₀,……,x_l-1作为l层的输入，则有：

x_l＝H_l([x₀,x₁,...,x_l-1]) (2)

步骤5、上一个密集连接块Dense Block输出的数据送入过渡层Transition Layer，过渡层Transition Layer包括一个1×1的卷积层和2×2的池化层，在2×2的池化区域中，式(3)进行计算：

步骤6、重复步骤3到步骤5两次；

步骤7、重复步骤3到步骤4一次；

步骤8、第四个密集连接块Dense Block 4输出的数据送入分类层ClassificationLayer，分类层Classification Layer包括池化区域为7×7的平均池化和全连接层。