CN111144460A - 一种提高卷积神经网络分类性能的算法 - Google Patents
一种提高卷积神经网络分类性能的算法 Download PDFInfo
- Publication number
- CN111144460A CN111144460A CN201911291641.6A CN201911291641A CN111144460A CN 111144460 A CN111144460 A CN 111144460A CN 201911291641 A CN201911291641 A CN 201911291641A CN 111144460 A CN111144460 A CN 111144460A
- Authority
- CN
- China
- Prior art keywords
- neural network
- convolutional neural
- feature mapping
- algorithm
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 54
- 238000013507 mapping Methods 0.000 claims abstract description 50
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 7
- 238000011160 research Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种提高卷积神经网络分类性能的算法,其特点是采用全局深度空洞卷积进行CNN优化的算法,实现高效的图像分类,其具体优化包括:特征映射多尺度化、提取特征映射重要性得分、约束重要性得分和特征映射加权。本发明与现有技术相比具有高率的图像分类,有效提高卷积神经网络分类性能,极大的降低了提取特征映射的重要性得分所需要庞大计算量的要求,多种不同架构的CNN在图像分类领域的性能均有显著提升,进一步推动了相关问题的研究与应用,具有广泛的实用意义。
Description
技术领域
本发明涉及深度学习技术领域,尤其是一种基于多尺度特征映射和全局深度空洞卷积的提高卷积神经网络分类性能的算法。
背景技术
深度学习技术在图像分类、语义分割等领域表现优异,卷积神经网络(CNN)的提出使得网络在计算机视觉领域上进入新的高度,CNN能够在极短的时间内理解一幅自然图像所包含的信息。一般CNN在达到性能的瓶颈后,很难再对其精度进行提高。现今的工作大部分聚焦于寻找更好的CNN架构,而我们无法预知新的CNN架构是否会有较好的表现,所以需要大量的实验来验证新的架构的性能。基于此,本发明提出了一种基于多尺度特征映射和全局深度空洞卷积的提高卷积神经网络分类性能的算法,作为分支模块嵌入到多种不同架构的CNN中进行优化,而无需探索新的网络架构,以达到提高CNN性能的目的。
发明内容
本发明的目的是针对现有技术的不足而设计的一种提高卷积神经网络分类性能的算法,采用多尺度特征映射和全局深度空洞卷积算法,作为分支模块嵌入到多种不同架构的CNN中进行优化,以提高卷积神经网络分类性能,通过GDDConv提取每一个通道内的多尺度特征映射的重要性得分充分考虑了特征映射的多尺度信息,对多尺度特征映射中每一个关键位置都产生响应,引入的GDDConv参数少,计算代价较小,分类性能好,极大的降低了提取特征映射的重要性得分所需庞大计算量,图像分类效率高,多种不同架构的CNN在图像分类领域的性能均有显著提升,具有广泛的实用意义。
本发明的目的是这样实现的:一种提高卷积神经网络分类性能的算法,其特点是采用全局深度空洞卷积进行CNN优化的算法,有效提高卷积神经网络分类性能,实现高效的图像分类,其优化流程具体包括以下步骤:
a步骤:对卷积神经网络输入图像,生成不同层级的特征映射;
b步骤:通过不同的卷积操作的组合得到特征映射在不同感受野下的输出,并将这些不同感受野下的输出与原特征映射相加得到新的多尺度特征映射;
c步骤:利用全局深度空洞卷积提取多尺度特征映射的每一个通道的重要性得分;
d步骤:通过Sigmoid函数约束步骤c中得到的重要性得分;
e步骤:根据步骤d中的得分对原特征映射加权;
f步骤:对原卷积神经网络的不同层级的特征映射执行b~e步骤;
g步骤:在训练集上进行训练,得到优化的卷积神经网络。
所述优化流程作为分支模块嵌入卷积神经网络的不同层。
所述提取特征映射的重要性得分基于全局深度空洞卷积操作。
所述优化流程分为特征映射多尺度化、提取特征映射重要性得分、约束重要性得分和特征映射加权四部分。
本发明与现有技术相比具有高率的图像分类,极大的降低了提取特征映射的重要性得分所需要庞大计算量的要求,在提高CNN的分类精度的同时保持了CNN的处理速度,有效提升了多种不同架构的CNN在图像分类领域的性能,进一步推动了相关问题的研究与应用,具有广泛的实用意义。
附图说明
图1为本发明流程图;
图2为全局深度空洞卷积结构示意图;
图3为CNN架构的两种嵌入方式示意图;
图4为实施例1的图像分类结果。
具体实施方式
通过以下具体实施例对本发明作进一步的详细说明。
实施例1
参阅附图1,本发明按下述步骤进行卷积神经网络分类性能优化的:
a步骤:对卷积神经网络输入图像,生成不同层级的特征映射
将输入图像记为I,并将图像I输入至CNN后得到不同层级的特征映射记为Yi,其中i代表第i个层级。
b步骤:通过不同卷积操作的组合得到特征映射在不同感受野下的输出,并将这些不同感受野下的输出与原特征映射相加得到新的多尺度特征映射,所述感受野(receptivefiled)是指在CNN中,决定某一层输出结果中一个元素所对应的输入层的区域大小,感受野越大,得到的输出特征映射所包含的大尺度信息越多。由于原特征映射的空间尺寸比较大且尺度单一,直接在原特征映射上进行操作效果较差,所以对原特征映射进行下述不同感受野下的卷积操作:
分别取感受野为3×3,5×5和7×7,其中,5×5的感受野由两个3×3的标准卷积组合获得,7×7的感受野由一个3×3的标准卷积和一个空洞尺寸为2的3×3的空洞卷积组合获得。将不同感受野下的输出结果与原特征映射按下述a式计算,得到新的多尺度特征映射:
Ui=Yi+Conv3×3(Yi)+Conv3×3(Conv3×3(Yi))+DConv3×3(Conv3×3(Yi))Yi,Ui∈Hi×Wi×Ci (a),
其中:Cony3×3(·)为3×3的标准卷积,可以获得3×3的感受野;而两个3×3的标准卷积,即第三项组合构成了5×5的感受野;DConv3×3(·)代表一个空洞尺寸为2的3×3的空洞卷积,因此,上式最后一项的卷积组合获得了7×7的感受野;Ui为新的多尺度特征映射,即不同感受野下的输出与原特征映射相加的结果;Hi×Wi×Ci为原特征映射Yi与新的多尺度特征映射Ui的空间尺寸。
c步骤:利用全局深度空洞卷积提取新的多尺度特征映射的每一个通道的重要性得分
参阅附图2,在CNN中,不同通道内的特征映射在前向传播的过程中影响是不一样的,根据每一个通道内的特征映射的重要性来重新加权这些特征映射可以优化CNN对图像的分类性能,按下述b式计算通过GDDConv提取每一个通道内的特征映射的重要性得分:
Vi=GDDConv(Ui)
Vi∈1×Ci (b),
其中:GDDConv(·)是全局深度空洞卷积;Vi为对应于Ui的每一个通道内特征映射的重要性得分;GDDConv为多尺度特征映射Ui的每个关键位置进行响应,对每个关键位置赋予了可学习的权重。对应GDDConv的卷积核尺寸大小固定为7×7,由于CNN的不同层级的特征映射共拥有4种尺寸,分别是56×56、28×28、14×14和7×7,所以GDDConv分别对应采用空洞尺寸为4、3、2和1的卷积核以令输出是1×Ci的一维向量Vi。
d步骤:通过Sigmoid函数约束步骤c中得到的重要性得分
直接由步骤c得到的重要性得分数值相差较大,存在有的得分过高有的得分过低的情况,引入Sigmoid函数进行约束后可以将重要性得分约束在0-1间,按下述c式进行重要性得分约束计算:
e步骤:根据步骤d中的约束后的重要性得分按下述d式对原特征映射加权计算:
f步骤:对原卷积神经网络的不同层级的特征映射执行b~e步骤参阅附图3,该模块在常见的两种CNN架构上的嵌入方法(其代表网络分别为vgg和ResNet),将b~e步骤构建的优化模块嵌入至CNN的不同层级的特征映射上,使得不同层级的原始特征映射根据其自身的重要性得分重新加权,得到整个优化后的CNN。
步骤g:在训练集上进行训练,得到优化的卷积神经网络
取数据集为ImageNet-2012,总共训练90轮,batch_size设为256,学习率初始时设为0.1,并在30轮和60轮时各缩小十倍。
参阅附图4,原始的CNN为ResNet-50,参数量为24M,经90轮训练后在ImageNet-2012测试集上取得了75.27%的分类精度,其参数量为25M,使用相同的训练过程后最终精度达到了77.22%,比原网络提高了约2%的分类精度。本发明引入的GDDConv参数较少、计算代价较小,通过GDDConv提取每一个通道内的多尺度特征映射的重要性得分充分考虑了特征映射的多尺度信息,对多尺度特征映射中每一个关键位置都产生响应。
以上只是对本发明作进一步的说明,并非用以限制本专利,在不背离本发明构思的精神和范围下的等效实施,均应包含于本专利的权利要求范围之内。
Claims (4)
1.一种提高卷积神经网络分类性能的算法,其特征在于采用全局深度空洞卷积进行CNN优化的算法,提高卷积神经网络分类性能,实现高效的图像分类,其优化流程具体包括以下步骤:
a步骤:对卷积神经网络输入图像,生成不同层级的特征映射;
b步骤:通过不同的卷积操作的组合得到特征映射在不同感受野下的输出,并将这些不同感受野下的输出与原特征映射相加得到新的多尺度特征映射;
c步骤:利用全局深度空洞卷积提取多尺度特征映射的每一个通道的重要性得分;
d步骤:通过Sigmoid函数约束步骤c中得到的重要性得分;
e步骤:根据步骤d中的得分对原特征映射加权;
f步骤:对原卷积神经网络的不同层级的特征映射执行b~e步骤;
g步骤:在训练集上进行训练,得到优化的卷积神经网络。
2.根据权利要求1所述提高卷积神经网络分类性能的算法,其特征在于所述优化流程作为分支模块嵌入卷积神经网络的不同层。
3.根据权利要求1所述提高卷积神经网络分类性能的算法,其特征在于所述提取特征映射的重要性得分基于全局深度空洞卷积操作。
4.根据权利要求1或权利要求2所述提高卷积神经网络分类性能的算法,其特征在于所述优化流程分为特征映射多尺度化、提取特征映射重要性得分、约束重要性得分和特征映射加权四部分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911291641.6A CN111144460A (zh) | 2019-12-16 | 2019-12-16 | 一种提高卷积神经网络分类性能的算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911291641.6A CN111144460A (zh) | 2019-12-16 | 2019-12-16 | 一种提高卷积神经网络分类性能的算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111144460A true CN111144460A (zh) | 2020-05-12 |
Family
ID=70518382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911291641.6A Pending CN111144460A (zh) | 2019-12-16 | 2019-12-16 | 一种提高卷积神经网络分类性能的算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111144460A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109389556A (zh) * | 2018-09-21 | 2019-02-26 | 五邑大学 | 一种多尺度空洞卷积神经网络超分辨率重构方法及装置 |
CN109636802A (zh) * | 2019-01-18 | 2019-04-16 | 天津工业大学 | 基于深度卷积神经网络的肺实质经ct图像分割方法 |
CN110020606A (zh) * | 2019-03-13 | 2019-07-16 | 北京工业大学 | 一种基于多尺度卷积神经网络的人群密度估计方法 |
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
EP3543916A1 (fr) * | 2018-03-20 | 2019-09-25 | Idemia Identity & Security France | Procédés d'apprentissage de paramètres d'un réseau de neurones à convolution, et de classification d'une donnée d'entrée |
CN110309880A (zh) * | 2019-07-01 | 2019-10-08 | 天津工业大学 | 一种基于注意力机制cnn的5天和9天孵化鸡蛋胚胎图像分类方法 |
-
2019
- 2019-12-16 CN CN201911291641.6A patent/CN111144460A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110232394A (zh) * | 2018-03-06 | 2019-09-13 | 华南理工大学 | 一种多尺度图像语义分割方法 |
EP3543916A1 (fr) * | 2018-03-20 | 2019-09-25 | Idemia Identity & Security France | Procédés d'apprentissage de paramètres d'un réseau de neurones à convolution, et de classification d'une donnée d'entrée |
CN109389556A (zh) * | 2018-09-21 | 2019-02-26 | 五邑大学 | 一种多尺度空洞卷积神经网络超分辨率重构方法及装置 |
CN109636802A (zh) * | 2019-01-18 | 2019-04-16 | 天津工业大学 | 基于深度卷积神经网络的肺实质经ct图像分割方法 |
CN110020606A (zh) * | 2019-03-13 | 2019-07-16 | 北京工业大学 | 一种基于多尺度卷积神经网络的人群密度估计方法 |
CN110309880A (zh) * | 2019-07-01 | 2019-10-08 | 天津工业大学 | 一种基于注意力机制cnn的5天和9天孵化鸡蛋胚胎图像分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111583263B (zh) | 一种基于联合动态图卷积的点云分割方法 | |
CN106228185B (zh) | 一种基于神经网络的通用图像分类识别系统及方法 | |
CN110210551A (zh) | 一种基于自适应主体敏感的视觉目标跟踪方法 | |
CN112364699B (zh) | 基于加权损失融合网络的遥感图像分割方法、装置及介质 | |
CN110929080B (zh) | 基于注意力和生成对抗网络的光学遥感图像检索方法 | |
CN113326930B (zh) | 数据处理方法、神经网络的训练方法及相关装置、设备 | |
CN109214353B (zh) | 一种基于剪枝模型的人脸图像快速检测训练方法和装置 | |
CN111259940A (zh) | 一种基于空间注意力地图的目标检测方法 | |
CN110175248B (zh) | 一种基于深度学习和哈希编码的人脸图像检索方法和装置 | |
CN112329760A (zh) | 基于空间变换网络端到端印刷体蒙古文识别翻译的方法 | |
WO2021042857A1 (zh) | 图像分割模型的处理方法和处理装置 | |
CN111143567B (zh) | 一种基于改进神经网络的评论情感分析方法 | |
CN110704665A (zh) | 一种基于视觉注意力机制的图像特征表达方法及系统 | |
CN116091946A (zh) | 一种基于YOLOv5的无人机航拍图像目标检测方法 | |
CN114299305A (zh) | 聚合密集和注意力多尺度特征的显著性目标检测算法 | |
CN111310820A (zh) | 基于交叉验证深度cnn特征集成的地基气象云图分类方法 | |
CN113205102B (zh) | 一种基于忆阻神经网络的车辆标志识别方法 | |
CN117152823A (zh) | 一种基于动态空洞卷积金字塔注意力的多任务年龄估计方法 | |
Sheng et al. | Lightweight Food Image Recognition With Global Shuffle Convolution | |
CN115376195B (zh) | 训练多尺度网络模型的方法及人脸关键点检测方法 | |
CN111144460A (zh) | 一种提高卷积神经网络分类性能的算法 | |
CN114168782B (zh) | 一种基于三元组网络的深度哈希图像检索方法 | |
CN115329821A (zh) | 一种基于配对编码网络和对比学习的舰船噪声识别方法 | |
CN117635986B (zh) | 一种适用大尺度场景下基于特征匹配网络的特征识别方法 | |
CN117152810A (zh) | 一种基于头部输出特征自适应匹配的知识蒸馏方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200512 |