CN110942106B - 一种基于平方平均的池化卷积神经网络图像分类方法 - Google Patents

一种基于平方平均的池化卷积神经网络图像分类方法 Download PDF

Info

Publication number
CN110942106B
CN110942106B CN201911279242.8A CN201911279242A CN110942106B CN 110942106 B CN110942106 B CN 110942106B CN 201911279242 A CN201911279242 A CN 201911279242A CN 110942106 B CN110942106 B CN 110942106B
Authority
CN
China
Prior art keywords
layer
feature
pooling
square average
dense
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911279242.8A
Other languages
English (en)
Other versions
CN110942106A (zh
Inventor
卢婷
杨贺群
胡念妍
刘国华
郭文静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201911279242.8A priority Critical patent/CN110942106B/zh
Publication of CN110942106A publication Critical patent/CN110942106A/zh
Application granted granted Critical
Publication of CN110942106B publication Critical patent/CN110942106B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于平方平均的池化卷积神经网络图像分类方法。本发明采用梯度下降法对网络中的权值和阈值参数进行逐层的反向调节,以获取网络参数的最优解。其中池化层通过设定池化窗口的大小和步长的大小进行池化运算,目的是减小特征图维度,池化规模一般为2x2。虽然最大值池化能够更多地保留图像的纹理特征,却忽略了背景特征信息。因此在池化层中使用平方平均池化运算方法,对特征矩阵进行平方平均运算,通过平方平均运算更好的保留图像的纹理和背景特征。图像经过一系列卷积层池化层后,最后得到的是一系列的特征图,然后将这些特征图中的像素依次取出,融合成一个向量传给分类器。

Description

一种基于平方平均的池化卷积神经网络图像分类方法
技术领域
本发明涉及一种神经网络图像分类的改进方法,尤其涉及一种在池化层的改进从而提高图像分类精度的方法。
背景技术
现阶段,图像分类广泛应用于各个领域,比如目标识别、图像理解、基于内容的图像检索等。近年来,随着深度学习在图像处理领域获得突破性进展,利用深度学习进行图像分类已成为一项研究热点。
第一个卷积神经网络是1987年由Alexander Waibel等提出的时间延迟网络,它被用于语音识别问题。随着技术的发展,卷积神经网络被逐步改进,并应用于计算机视觉领域。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是一种多层的监督学习神经网络,通过权值共享和卷积运算直接处理二维图像。其基本结构是一系列交替连接的卷积层和池化层以及一个全连接的输出层,卷积神经网络中的三个关键操作为:局部感受野、权值共享和池化。
在计算机视觉领域,卷积神经网络(CNN)已经成为最主流的方法,最常见的卷积神经网络模型有GoogLenet,VGG-19,Incepetion等。CNN史上的一个里程碑事件是ResNet模型的出现,ResNet可以训练出更深的CNN模型,从而实现更高的准确度。ResNet模型的核心是通过建立前面层与后面层之间的“短路连接”,这有助于训练过程中梯度的反向传播,从而能训练出更深的CNN网络。而本发明采用的是DenseNet模型,它的基本思路与ResNet一致,但是它建立的是前面所有层与后面层的密集连接,它的名称也是由此而来。DenseNet的另一大特色是通过特征在通道上的连接来实现特征重用。
发明内容
本发明的目的是:使得池化过程中能够很好地保留图像的纹理特征和背景特征,从而提升分类精度。
为了达到上述目的,本发明的技术方案是提供了一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,包括以下步骤:
步骤1、将训练集输入到卷积层进行卷积运算,在卷积运算过程中对训练集中的图像进行特征提取,增强原图像信息并降低图像噪声;
步骤2、将卷积层输出的训练集输入到3x3的最大池化层进行处理;
步骤3、将最大池化层输出的训练集输入到密集连接块Dense Block中,在密集连接块Dense Block中采用密集连接的方式处理训练集中的特征图;
步骤4、把密集连接块Dense Block处理后的特征图输入过渡层中进行卷积和平方平均池化运算,通过平方平均池化运算进一步增强特征信号;
步骤5、在通过一系列密集连接块Dense Block和过渡层处理后,在最后的池化层进行7x7的全局平均池化,最终得到多个具有统一输出维度的特征矩阵;
步骤6、把特征矩阵融合为输出特征向量,对输出特征向量进行分类;
步骤7、对网络进行多次训练,调整中间参数,使输入输出的关系更加明显。
优选地,步骤1中,所述卷积层采用的卷积公式如式(1)所示:
式(1)中,为第n层的输出特征,x和y分别为输出特征的长度和高度, 为第n层的长度为x、高度为y的感受野;/>为第n-1层的输出特征,其为第n层的输入特征;wn为权重;bn为置偏;f为激活函数,如式(2)所示:
优选地,步骤3中,所述密集连接块Dense Block使用非线性组合函数Hl(·),非线性组合函数Hl(·)包含BN、ReLU、3x3卷积,在每个密集连接块Dense Block中在经过各个层的卷积之后均输出k个特征图,即采用k个卷积核,k为增长率。
优选地,步骤3中,所述密集连接块Dense Block中的密集连接具体实现为:将第一层收到的前边所有的特征图,作为其输入,然后用式(3)完成密集连接操作:
Xl=Hl([x0,x1,…,xl-1]) (3)
式(3)中,[x0,x1,…,xl-1]代表对第0层到(l-1)层的特征图进行拼接操作,Xl表示第l层的输入。
本发明采用梯度下降法对网络中的权值和阈值参数进行逐层的反向调节,以获取网络参数的最优解。其中池化层通过设定池化窗口的大小和步长的大小进行池化运算,目的是减小特征图维度,池化规模一般为2x2。在所有的卷积神经网络模型中应用最广泛的是基于最大值池化的池化算法,它是一种有效的提取特征算法。虽然最大值池化能够更多地保留图像的纹理特征,却忽略了背景特征信息。因此我们在池化层中使用平方平均池化运算方法,对特征矩阵进行平方平均运算,通过平方平均运算更好的保留图像的纹理和背景特征。图像经过一系列卷积层池化层后,最后得到的是一系列的特征图,然后将这些特征图中的像素依次取出,融合成一个向量传给分类器。
综上所述,平方平均池化卷积神经网络能更多的保留图像的纹理和背景特征,提高分类精度。因此,我们设计了基于平方平均池化卷积神经网络的图像分类方法。
为解决现有分类算法存在的问题,如丢失重要特征信息,本发明提出了一种基于平方平均池化卷积神经网络的图像分类方法,简述本发明的实现步骤:首先将所有图像输入网络提取出图像的全局或者局部特征;然后,对这些特征进行编码得到张量;接下来,进行向量的池化;最后,用分类器进行分类。
相对于现有技术,本发明的优点在于:
1、本发明提供一种基于平方平均的池化卷积神经网络图像分类方法,利用最大池化能更多地保留图像纹理特征的优点,以及平均池化能更多地保留图像背景特征的优点,将最大池化和平均池化相结合,并利用平方平均的思想更多地保留图像纹理特征和背景特征,使得图像的分类精度提高。
2、基于平方平均的池化卷积神经网络图像分类方法不仅可以提高图像分类精度,还可以降低图像分类损失,如图1所示这个方法在Cifar-10数据集上精度由原来的89.87%提升到90.38%,分类精度提升了约百分之一。并且从图2可以看出本方法下的图像分类损失很低。
附图说明
图1是采用平方平均方法的图像分类精度图;
图2是采用平方平均方法的图像分类损失图;
图3是DenseNet网络结构图;
图4是Dense Block中各层特征图的连接示意图;
图5是本发明平方平均池化的运算示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的DenseNet网络结构如图3所示,在该结构上实现的图像分类方法包括如下步骤:
步骤一、将Cifar-10训练集输入到图1所示网络的卷积层进行卷积运算,在卷积运算过程中对图像进行特征提取,增强原图像信息并降低图像噪声。
卷积公式如式(1)所示:
式(1)中,为第n层的输出特征,x和y分别为输出特征的长度和高度, 为第n层的长度为x、高度为y的感受野;/>为第n-1层的输出特征,其为第n层的输入特征;wn为权重;bn为置偏;f为激活函数,如式(2)所示:
步骤二、训练集通过卷积后输入到3x3的最大池化层进行处理。
步骤三、再把经池化处理后的训练集输入到图1的Dense Block中。Dense Block采用密集连接方式处理特征图,其具体连接方式如图2所示,然后将处理后的特征图输出到过渡层。
在Dense Block中,各个层的特征图大小必须一致,保证能够在通道维度上连接。Dense Block中使用非线性组合函数Hl(·),该函数包含BN、ReLU、3x3卷积这些操作,在每个Dense Block中在经过各个层的卷积之后均输出k(k=12)个特征图,即采用k个卷积核。k在DenseNet中是一个超参数,被称为增长率。DenseBlock中的密集连接具体实现为:将第一层收到的前边所有的特征图,作为其输入,然后用式(3)完成密集连接操作,其中[x0,x1,…,xl-1]代表对第0层到(l-1)层的特征图进行拼接操作。本实施方案中l=5。
Xl=Hl([x0,x1,…,xl-1]) (3)
步骤四、把Dense Block处理后的特征图输入到过渡层中。该过渡层由批量归一化层、1x1卷积层和平方平均池化层组成。通过平方平均池化运算进一步增强特征信号。在池化层中,对训练集进行平方平均池化,本实施方案中池化规模为2x2,具体计算示意图如图5,公式为:
式(4)中,Max表示局部接受域中值最大的点,Avg表示局部接受域中所有值的平均值。
步骤五、通过一系列Dense Block和过渡层处理后,在最后的池化层进行7x7的全局平均池化,最终得到多个具有统一输出维度的特征矩阵。
步骤六、把特征矩阵融合为输出特征向量;对输出特征向量进行分类。
步骤七、对网络进行多次训练,调整中间参数,使输入输出的关系更加明显。

Claims (4)

1.一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,包括以下步骤:
步骤1、将训练集输入到卷积层进行卷积运算,在卷积运算过程中对训练集中的图像进行特征提取,增强原图像信息并降低图像噪声;
步骤2、将卷积层输出的训练集输入到3x3的最大池化层进行处理;
步骤3、将最大池化层输出的训练集输入到密集连接块Dense Block中,在密集连接块Dense Block中采用密集连接的方式处理训练集中的特征图;
步骤4、把密集连接块Dense Block处理后的特征图输入过渡层中进行卷积和平方平均池化运算,通过平方平均池化运算进一步增强特征信号,在平方平均池化运算中对特征矩阵进行平方平均运算;
步骤5、在通过一系列密集连接块Dense Block和过渡层处理后,在最后的池化层进行7x7的全局平均池化,最终得到多个具有统一输出维度的特征矩阵;
步骤6、把特征矩阵融合为输出特征向量,对输出特征向量进行分类;
步骤7、对网络进行多次训练,调整中间参数,使输入输出的关系更加明显。
2.如权利要求1所述的一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,步骤1中,所述卷积层采用的卷积公式如式(1)所示:
式(1)中,为第n层的输出特征,x和y分别为输出特征的长度和高度, 为第n层的长度为x、高度为y的感受野;/>为第n-1层的输出特征,其为第n层的输入特征;wn为权重;bn为置偏;f为激活函数,如式(2)所示:
3.如权利要求1所述的一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,步骤3中,所述密集连接块Dense Block使用非线性组合函数Hl(·),非线性组合函数Hl(·)包含BN、ReLU、3x3卷积,在每个密集连接块Dense Block中在经过各个层的卷积之后均输出k个特征图,即采用k个卷积核,k为增长率。
4.如权利要求3所述的一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,步骤3中,所述密集连接块Dense Block中的密集连接具体实现为:
将第一层收到的前边所有的特征图,作为其输入,然后用式(3)完成密集连接操作:
Xl=Hl([x0,x1,…,xl-1]) (3)
式(3)中,[x0,x1,…,xl-1]代表对第0层到(l-1)层的特征图进行拼接操作,Xl表示第l层的输入。
CN201911279242.8A 2019-12-13 2019-12-13 一种基于平方平均的池化卷积神经网络图像分类方法 Active CN110942106B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911279242.8A CN110942106B (zh) 2019-12-13 2019-12-13 一种基于平方平均的池化卷积神经网络图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911279242.8A CN110942106B (zh) 2019-12-13 2019-12-13 一种基于平方平均的池化卷积神经网络图像分类方法

Publications (2)

Publication Number Publication Date
CN110942106A CN110942106A (zh) 2020-03-31
CN110942106B true CN110942106B (zh) 2023-11-07

Family

ID=69910828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911279242.8A Active CN110942106B (zh) 2019-12-13 2019-12-13 一种基于平方平均的池化卷积神经网络图像分类方法

Country Status (1)

Country Link
CN (1) CN110942106B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688702B (zh) * 2021-08-12 2024-04-26 武汉工程大学 基于融合多特征的街景图像处理方法及系统
CN116882473A (zh) * 2023-06-29 2023-10-13 无锡芯光互连技术研究院有限公司 神经网络的训练方法、图像分类方法、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092960A (zh) * 2017-04-17 2017-08-25 中国民航大学 一种改进的并行通道卷积神经网络训练方法
WO2019001209A1 (zh) * 2017-06-28 2019-01-03 苏州比格威医疗科技有限公司 基于三维卷积神经网络的视网膜oct图像的分类算法
CN109376589A (zh) * 2018-09-07 2019-02-22 中国海洋大学 基于卷积核筛选ssd网络的rov形变目标与小目标识别方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107092960A (zh) * 2017-04-17 2017-08-25 中国民航大学 一种改进的并行通道卷积神经网络训练方法
WO2019001209A1 (zh) * 2017-06-28 2019-01-03 苏州比格威医疗科技有限公司 基于三维卷积神经网络的视网膜oct图像的分类算法
CN109376589A (zh) * 2018-09-07 2019-02-22 中国海洋大学 基于卷积核筛选ssd网络的rov形变目标与小目标识别方法

Also Published As

Publication number Publication date
CN110942106A (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
CN110599409B (zh) 基于多尺度卷积组与并行的卷积神经网络图像去噪方法
CN106991646B (zh) 一种基于密集连接网络的图像超分辨率方法
CN108510485B (zh) 一种基于卷积神经网络的无参照图像质量评估方法
CN109711426B (zh) 一种基于gan和迁移学习的病理图片分类装置及方法
KR101970488B1 (ko) 실내 의미론적 분할을 위한 컬러-깊이 영상의 단계적 레지듀얼 특성 결합 네트워크 장치
CN108764317B (zh) 一种基于多路特征加权的残差卷积神经网络图像分类方法
CN108847223B (zh) 一种基于深度残差神经网络的语音识别方法
CN111626355A (zh) 一种基于Unet++卷积神经网络的地震数据初至拾取方法
CN109146944B (zh) 一种基于深度可分卷积神经网络的视觉深度估计方法
Zhang et al. Self-supervised image denoising for real-world images with context-aware transformer
CN113326930B (zh) 数据处理方法、神经网络的训练方法及相关装置、设备
CN110135460B (zh) 基于vlad卷积模块的图像信息强化方法
CN113344188A (zh) 基于通道注意力模块的轻量级神经网络模型
CN111489364B (zh) 基于轻量级全卷积神经网络的医学图像分割方法
CN110942106B (zh) 一种基于平方平均的池化卷积神经网络图像分类方法
CN113743269B (zh) 一种轻量化识别视频人体姿态的方法
CN114998958B (zh) 一种基于轻量化卷积神经网络的人脸识别方法
CN111339862B (zh) 一种基于通道注意力机制的遥感场景分类方法及装置
CN112819096B (zh) 一种基于复合卷积神经网络的化石图像分类模型的构建方法
CN105787867A (zh) 基于神经网络算法的处理视频图像的方法和装置
CN114186672A (zh) 一种用于脉冲神经网络的高效高精度训练算法
Liu et al. RB-Net: Training highly accurate and efficient binary neural networks with reshaped point-wise convolution and balanced activation
CN110570443A (zh) 一种基于结构约束条件生成模型的图像线状目标提取方法
CN111986085A (zh) 一种基于深度反馈注意力网络系统的图像超分辨率方法
CN110991554B (zh) 一种基于改进pca的深度网络图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant