CN110942105B - 一种基于最大池化和平均池化的混合池化方法 - Google Patents

一种基于最大池化和平均池化的混合池化方法 Download PDF

Info

Publication number
CN110942105B
CN110942105B CN201911279148.2A CN201911279148A CN110942105B CN 110942105 B CN110942105 B CN 110942105B CN 201911279148 A CN201911279148 A CN 201911279148A CN 110942105 B CN110942105 B CN 110942105B
Authority
CN
China
Prior art keywords
pooling
layer
formula
convolution
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911279148.2A
Other languages
English (en)
Other versions
CN110942105A (zh
Inventor
卢婷
宋佳霏
黄若琳
张磊
常姗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201911279148.2A priority Critical patent/CN110942105B/zh
Publication of CN110942105A publication Critical patent/CN110942105A/zh
Application granted granted Critical
Publication of CN110942105B publication Critical patent/CN110942105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于最大池化和平均池化的混合池化方法。本发明结合了最大池化和平均池化的优点,利用平方平均的数学意义和实际意义,形成了一种基于最大池化和平均池化的混合池化方法,该池化方法能够更好的保留图像的纹理特征和背景特征,从而提高图像分类精度,并降低分类损失。本发明是基于DenseNet所做的实验,但本发明可应用于其他使用池化层的卷积神经网络,比如ResNet,FastRCNN等等。

Description

一种基于最大池化和平均池化的混合池化方法
技术领域
本发明涉及一种神经网络池化层改进方法,涉及人工智能领域,具体地说,是一种基于最大池化和平均池化的混合池化方法。
背景技术
图像分类,是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像素或区域划归为若干个类别中的某一种,以代替人的视觉判读。近年来,随着深度学习在图像处理领域获得突破性进展,利用深度学习进行图像分类已成为一项研究热点。
密集连接卷积网络(Densely Connected Convolutional Networks,DenseNet)是一种基于卷积神经网络(Convolutional Neural Network,CNN)改进的前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。它包括卷积层(alternating convolutional layer)和池化层(pooling layer)。
密集连接卷积网络中卷积层主要利用局部感受野以及共享权重技术输出数据,池化层将卷积层输出数据作为输入数据进行特征提取并输出特征图(feature map),大幅减少卷积网络中参数的个数,防止卷积网络过拟合,并且使卷积网络更容易被训练,同时能够大大提高模式识别的准确率。
密集连接网络中使用的方法有最大池化(max-pooling),即取池化区域内的最大值作为特征值输出;以及平均池化(mean-pooling),即取池化区域内的平均值作为特征值输出。最大池化能够减小卷积层参数误差造成估计均值的偏移,更多的保留纹理信息;平均池化能够减小邻域大小受限造成的估计值方差增大的误差,更多的保留背景信息。但最大池化方法忽略了部分有效特征的表现,平均池化方法弱化了最鲜明特征的表现。
发明内容
本发明的目的是:使卷积网络能够更好的保留图像的纹理特征和背景特征,从而提高图像分类精度,并降低分类损失。
为了达到上述目的,本发明的技术方案是提供了一种基于最大池化和平均池化的混合池化方法,其特征在于,包括以下步骤:
步骤1、将图像X输入卷积层,卷积层采用的公式如式(1)所示:
Figure BDA0002316213950000021
式(1)中,X*W表示图像X与卷积区域W做卷积;x(i+m,j+n)表示图像X中第i行第j列像素x(i,j)每次沿横坐标移动m步长、每次沿纵坐标移动n步长;w(m,n)代表卷积区域W中第m行第n列的大小;
步骤2、卷积层计算输出的数据作为第一个池化层的输入;
步骤3、上一个池化层计算后输出的数据送入第一个密集连接块Dense Block1;
步骤4、将0到i层的输出特征图x0,……,xl-1作为i+1层的输入,则有:
xl=Hl([x0,x1,...,xl-1]) (2)
式(2)中,[x0,x1,...,xl-1]表示第0层到第l-1层产生的特征图的合并,Hl(.)由三部分组成:批标准化BatchNorm,激活函数ReLU和一个3x3的卷积;
步骤5、上一个密集连接块Dense Block输出的数据送入过渡层TransitionLayer,过渡层Transition Layer包括一个1×1的卷积层和2×2的池化层,在2×2的池化区域中,式(3)进行计算:
Figure BDA0002316213950000022
式(3)中,max2表示放大最鲜明特征的占比,avg是考虑了四个特征值的综合结果,(max-avg)2即放大最大值损失的占比,式(3)所得作为池化层的输出特征;
步骤6、重复步骤3到步骤5两次;
步骤7、重复步骤3到步骤4一次;
步骤8、第四个密集连接块Dense BlockDense Block 4输出的数据送入分类层Classification Layer,分类层Classification Layer包括池化区域为7×7的平均池化和全连接层。
与现有技术相比,本发明的有益之处是:
本发明结合了最大池化和平均池化的优点,利用平方平均的数学意义和实际意义,形成了一种基于最大池化和平均池化的混合池化方法,该池化方法能够更好的保留图像的纹理特征和背景特征,从而提高图像分类精度,并降低分类损失。本发明是基于DenseNet所做的实验,但本发明可应用于其他使用池化层的卷积神经网络,比如ResNet,FastRCNN等等。
附图说明
图1为DenseNet网络结构示意图;
图2为Dense Block结构示意图;
图3为本发明在卷积网络池化层运算示意图;
图4为使用本发明的Cifar-10数据集在DenseNet中的实验结果损失图;
图5为使用本发明的Cifar-10数据集在DenseNet中的实验结果精度图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明提供的一种基于最大池化和平均池化的混合池化方法,包括以下步骤:
步骤1、将图像X输入卷积层,卷积层采用的公式如式(1)所示:
Figure BDA0002316213950000031
式(1)中,X*W表示图像X与卷积区域W做卷积;x(i+m,j+n)表示图像X中第i行第j列像素x(i,j)每次沿横坐标移动m步长、每次沿纵坐标移动n步长;w(m,n)代表卷积区域W中第m行第n列的大小;
步骤2、卷积层计算输出的数据作为第一个池化层(采用池化区域为3×3的最大池化,每次移动步长为2,见下表1)的输入;
Figure BDA0002316213950000032
Figure BDA0002316213950000041
表1
步骤3、上一个池化层计算后输出的数据送入第一个密集连接块Dense Block1;
步骤4、将0到i层的输出特征图x0,……,xl-1作为i+1层的输入,则有:
xl=Hl([x0,x1,...,xl-1]) (2)
式(2)中,[x0,x1,...,xl-1]表示第0层到第l-1层产生的特征图的合并,Hl(.)由三部分组成:批标准化BatchNorm,激活函数ReLU和一个3x3的卷积,见图2;
步骤5、上一个密集连接块Dense Block输出的数据送入过渡层TransitionLayer,过渡层Transition Layer包括一个1×1的卷积层和2×2的池化层,见上表1,在2×2的池化区域中,式(3)进行计算(具体计算方法见图3):
Figure BDA0002316213950000042
式(3)中,max2表示放大最鲜明特征的占比,avg是考虑了四个特征值的综合结果,(max-avg)2即放大最大值损失的占比,式(3)所得作为池化层的输出特征;
步骤6、重复步骤3到步骤5两次;
步骤7、重复步骤3到步骤4一次;
步骤8、第四个密集连接块Dense BlockDense Block 4输出的数据送入分类层Classification Layer,分类层Classification Layer包括池化区域为7×7的平均池化和全连接层,见上表1。
本发明中使用的公式的意义是:
max2的意义是:放大最鲜明特征的占比;
(max-avg)2的意义是:avg是考虑了四个特征值的综合结果,max-avg是最鲜明特征相对于平均特征的损失,(max-avg)2即放大最大值损失的占比;
Figure BDA0002316213950000051
的意义是:求平均。
开根号的意义是:求平方平均。
实验结果经整理后如下:
数据集:Cifar-10。
相同轮数(epoch)下精度对比如下表所示。
Epoch 030 Epoch 040 Epoch 060 Epoch 090
Max-pooling 83.45 89.28 89.91 89.66
本发明 88.44 90.15 90.05 90.06
相同精度(acc)下轮数对比如下表所示。
89.86 89.93
Max-pooling Epoch 062 Epoch 092
本发明 Epoch 050 Epoch 070
本发明是基于DenseNet所做的实验,但本发明可应用于其他使用池化层的卷积神经网络,比如ResNet,FastRCNN等等。

Claims (1)

1.一种基于最大池化和平均池化的混合池化方法,其特征在于,包括以下步骤:
步骤1、将图像X输入卷积层,卷积层采用的公式如式(1)所示:
Figure FDA0003641910630000011
式(1)中,X*W表示图像X与卷积区域W做卷积;x(i+m,j+n)表示图像X中第i行第j列像素x(i,j)每次沿横坐标移动m步长、每次沿纵坐标移动n步长;w(m,n)代表卷积区域W中第m行第n列的大小;
步骤2、卷积层计算输出的数据作为第一个池化层的输入,第一个池化层采用池化区域为3×3的最大池化,每次移动步长为2;
步骤3、上一个池化层计算后输出的数据送入第一个密集连接块Dense Block 1;
步骤4、将0到l-1层的输出特征图x0,……,xl-1作为l层的输入,则有:
xl=Hl([x0,x1,...,xl-1]) (2)
式(2)中,[x0,x1,...,xl-1]表示第0层到第l-1层产生的特征图的合并,Hl(.)由三部分组成:批标准化BatchNorm,激活函数ReLU和一个3x3的卷积;
步骤5、上一个密集连接块Dense Block输出的数据送入过渡层Transition Layer,过渡层Transition Layer包括一个1×1的卷积层和2×2的池化层,在2×2的池化区域中,式(3)进行计算:
Figure FDA0003641910630000012
式(3)中,max2表示放大最鲜明特征的占比,avg是考虑了四个特征值的综合结果,(max-avg)2即放大最大值损失的占比,式(3)所得作为池化层的输出特征;
步骤6、重复步骤3到步骤5两次;
步骤7、重复步骤3到步骤4一次;
步骤8、第四个密集连接块Dense Block 4输出的数据送入分类层ClassificationLayer,分类层Classification Layer包括池化区域为7×7的平均池化和全连接层。
CN201911279148.2A 2019-12-13 2019-12-13 一种基于最大池化和平均池化的混合池化方法 Active CN110942105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911279148.2A CN110942105B (zh) 2019-12-13 2019-12-13 一种基于最大池化和平均池化的混合池化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911279148.2A CN110942105B (zh) 2019-12-13 2019-12-13 一种基于最大池化和平均池化的混合池化方法

Publications (2)

Publication Number Publication Date
CN110942105A CN110942105A (zh) 2020-03-31
CN110942105B true CN110942105B (zh) 2022-09-16

Family

ID=69910832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911279148.2A Active CN110942105B (zh) 2019-12-13 2019-12-13 一种基于最大池化和平均池化的混合池化方法

Country Status (1)

Country Link
CN (1) CN110942105B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111523483B (zh) * 2020-04-24 2023-10-03 北京邮电大学 中餐菜品图像识别方法及装置
CN116882473A (zh) * 2023-06-29 2023-10-13 无锡芯光互连技术研究院有限公司 神经网络的训练方法、图像分类方法、电子设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182456A (zh) * 2018-01-23 2018-06-19 哈工大机器人(合肥)国际创新研究院 一种基于深度学习的目标检测模型及其训练方法
CN108846334A (zh) * 2018-05-30 2018-11-20 安徽大学 一种云类别自动识别方法及系统
CN109376589A (zh) * 2018-09-07 2019-02-22 中国海洋大学 基于卷积核筛选ssd网络的rov形变目标与小目标识别方法
WO2019118639A1 (en) * 2017-12-12 2019-06-20 The Regents Of The University Of California Residual binary neural network
CN110460840A (zh) * 2019-09-23 2019-11-15 上海工程技术大学 基于三维密集网络的镜头边界检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180089586A1 (en) * 2016-09-29 2018-03-29 Stmicroelectronics S.R.L. Artificial neural networks for human activity recognition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019118639A1 (en) * 2017-12-12 2019-06-20 The Regents Of The University Of California Residual binary neural network
CN108182456A (zh) * 2018-01-23 2018-06-19 哈工大机器人(合肥)国际创新研究院 一种基于深度学习的目标检测模型及其训练方法
CN108846334A (zh) * 2018-05-30 2018-11-20 安徽大学 一种云类别自动识别方法及系统
CN109376589A (zh) * 2018-09-07 2019-02-22 中国海洋大学 基于卷积核筛选ssd网络的rov形变目标与小目标识别方法
CN110460840A (zh) * 2019-09-23 2019-11-15 上海工程技术大学 基于三维密集网络的镜头边界检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《Robust Face Recognition via Multimodal Deep Face Representation》;Ding CX et al;《IEEE》;20150904;全文 *
《卷积神经网络的二值化研究及其FPGA实验》;白一帆;《中国优秀硕士学位论文全文数据库 信息科技辑》;20190915(第2019年第09期);全文 *

Also Published As

Publication number Publication date
CN110942105A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN111489358B (zh) 一种基于深度学习的三维点云语义分割方法
CN110163258B (zh) 一种基于语义属性注意力重分配机制的零样本学习方法及系统
Ghaseminezhad et al. A novel self-organizing map (SOM) neural network for discrete groups of data clustering
CN109118473B (zh) 基于神经网络的角点检测方法、存储介质与图像处理系统
CN110942105B (zh) 一种基于最大池化和平均池化的混合池化方法
CN113203566B (zh) 一种基于一维数据增强和cnn的电机轴承故障诊断方法
CN111401156B (zh) 基于Gabor卷积神经网络的图像识别方法
CN113011386B (zh) 一种基于等分特征图的表情识别方法及系统
CN107578405A (zh) 一种基于深度卷积神经网络的肺部结节自动检测方法
Yue et al. Face recognition based on histogram equalization and convolution neural network
CN113989340A (zh) 一种基于分布的点云配准方法
CN116152554A (zh) 基于知识引导的小样本图像识别系统
CN109685823B (zh) 一种基于深度森林的目标跟踪方法
CN110751183A (zh) 影像数据分类模型的生成方法、影像数据分类方法及装置
CN110728352A (zh) 一种基于深度卷积神经网络的大规模图像分类方法
CN113807497B (zh) 一种增强纹理细节的非配对图像翻译方法
CN112990336B (zh) 基于竞争注意力融合的深度三维点云分类网络构建方法
CN114358050A (zh) 一种基于双三次插值和wvd特征方阵的雷达辐射源智能识别方法
CN113139577A (zh) 一种基于可变形卷积网络的深度学习图像分类方法及系统
CN110110769B (zh) 一种基于宽度径向基函数网络的图像分类方法
CN114170465A (zh) 基于注意力机制的3d点云分类方法、终端设备及存储介质
CN111428640A (zh) 一种基于图像的地点识别方法
CN112001431A (zh) 一种基于梳状卷积的高效图像分类方法
CN117574136B (zh) 一种基于多元高斯函数空间变换的卷积神经网络计算方法
CN114913512B (zh) 基于计算机视觉的汽车座椅皮革分类方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant