CN108647723B - 一种基于深度学习网络的图像分类方法 - Google Patents

一种基于深度学习网络的图像分类方法 Download PDF

Info

Publication number
CN108647723B
CN108647723B CN201810448134.8A CN201810448134A CN108647723B CN 108647723 B CN108647723 B CN 108647723B CN 201810448134 A CN201810448134 A CN 201810448134A CN 108647723 B CN108647723 B CN 108647723B
Authority
CN
China
Prior art keywords
network
column vector
size
pooling
feature map
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810448134.8A
Other languages
English (en)
Other versions
CN108647723A (zh
Inventor
王改华
吕朦
袁国亮
刘文洲
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201810448134.8A priority Critical patent/CN108647723B/zh
Publication of CN108647723A publication Critical patent/CN108647723A/zh
Application granted granted Critical
Publication of CN108647723B publication Critical patent/CN108647723B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习网络的图像分类方法,首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现。根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;然后在建立好网络的三节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;接着将最后的特征列向量与softmax分类器连接,完整整个网络;整个网络用已知数据库进行调节,保存调节好后的权值;最后将网络运用到新数据库时,用保存好的权值迁移学习,然后进行微调。本发明提出了一种新的卷积神经网络算法结构,并降低了参数储存量,缩短了网络训练时间,同时提高了识别效率。

Description

一种基于深度学习网络的图像分类方法
技术领域
本发明属于图形处理与模式识别技术领域,涉及一种图像分类方法,具体涉及一种在ResNext网络基础上进行多空间多尺度特征提取融合,并结合迁移学习训练网络的深度学习的图像分类方法。
背景技术
ResNext是原作者之一何凯明对网络ResNet的改进,一共有152层的深度残差网络ResNet在2015年的ImageNet和COCO 2015竞赛中的图像分类、目标检测和语义分割各个分项都取得最好成绩。
多尺度提取特征能有效改善图像检索、图像分类和目标检测的正确率。卷积神经网络中的多尺度提取特征可从卷积层,全连接层不同空间中提取特征。
迁移学习是指一种学习对另一种学习的影响。在深度学习中,就是把已经训练好的的模型参数迁移到新的模型来帮助新的模型训练。
发明内容
本发明的目的是提出一种在ResNext网络基础上进行多空间多尺度特征提取融合,并结合迁移学习训练网络的图像分类方法,减少了训练参数量,缩短训练时间,提高图像的模式识别的能力。
本发明所采用的技术方案是:一种基于深度学习网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现;根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
步骤2:在建立好网络的三节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整;
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到达一定程度后(正确率在80%以上),保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习,即将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络,即微调步骤。
本发明的有益效果是:提出了一种新的卷积神经网络算法结构,并降低了参数储存量,缩短了网络训练时间,同时提高了识别效率。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例网络结构图;
图3为本发明实施例的原始block示意图;
图4为本发明实施例的修改后的block示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于深度学习网络的图像分类方法,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现。根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
请见图2,为本实施例的网络结构图;具体网络结构请见表1
表1
Figure BDA0001657739060000021
Figure BDA0001657739060000031
表1中,输出列的数据表示的经过网络经过各阶段操作后得到的输出,如果操作无参数,表明此网络无此操作,输出为上一阶段的输出;
表1中,卷积操作中的n*n,m,表示为卷积核大小为n*n,卷积核个数为 m;C表示通道数,表示有C个n*n,m卷积操作。我们的方法中,一类采用1*3 和3*1两层卷积层,另一类采用两个重复的1*3和3*1两层卷积层,同时调整步长,使输出特征图大小相同。每类的通道个数均为对比网络的一半,组合后相同;每阶段操作最右的大括号表示卷积块的堆叠的个数;
表1中,池化操作中的n*n,表示为池化大小为n*n。
步骤2:在建立好网络的每节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤2的具体实现包括以下子步骤:
步骤2.1:将每一部分获得的特征图进行均匀池化,一共有N节部分时,第一部分池化后特征图大小为2(N-1)*2(N-1),第二部分池化后特征图大小为2(N-2) *2(N-2),以此类推,最后一部分池化后特征图大小为2(N-N)*2(N-N)
本实施例的N取3。
步骤2.2:将每一部分的每一张特征图转化为列向量排列,然后整个部分顺序连接为列向量,最后将每个列向量顺利连接为最后的特征列向量。
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整。
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到达一定程度后(正确率在80%以上),保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习,即将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络,即微调步骤。
本发明在ResNext网络基础上进行了改进,减少了block的个数,在不改变Cardinality个数的基础上减小了网络的深度,减少了参数调整量的同时,提高了网络精度。
首先,减少block的个数,将block的个数由2改为3.
请见图3,本发明针对单个block,根据ResNext模型,选取了原始block结构进行了改进,改进后的block结构请见图4;
Cardinality个数不变,但是将Cardinality分成均等两类,一类采用1*3和3*1 两层卷积层替代原始3*3卷积核,另一类采用两个重复的1*3和3*1两层卷积层来替代5*5卷积核,同时调整步长,使输出特征图大小相同。其他结构保持不变。
然后,在整体结构中选取每个重复block的最后输出进行不同尺度的均匀池化,最后一层的block输出均匀池化为1*1大小的特征图,即与原网络的全局均匀池化相同,倒数第二个重复block的输出则均匀池化为2^(2_1)*2^(2_1)大小的特征图,以此类推,以空间金字塔结构来获取深层网络中不同深度下特征图,最后将这些特征图进行顺序连接,送入softmax分类器中,完整网络。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (1)

1.一种基于深度学习网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
步骤2:在建立好网络的每节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤2的具体实现包括以下子步骤:
步骤2.1:将每一部分获得的特征图进行均匀池化,一共有N节部分时,第一部分池化后特征图大小为2(N-1)*2(N-1),第二部分池化后特征图大小为2(N-2)*2(N-2),以此类推,最后一部分池化后特征图大小为2(N-N)*2(N-N)
步骤2.2:将每一部分的每一张特征图转化为列向量排列,然后整个部分顺序连接为列向量,最后将每个列向量顺利连接为最后的特征列向量;
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整;
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到预设程度后,保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习;
其中,将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络。
CN201810448134.8A 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法 Expired - Fee Related CN108647723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810448134.8A CN108647723B (zh) 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810448134.8A CN108647723B (zh) 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法

Publications (2)

Publication Number Publication Date
CN108647723A CN108647723A (zh) 2018-10-12
CN108647723B true CN108647723B (zh) 2020-10-13

Family

ID=63754530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810448134.8A Expired - Fee Related CN108647723B (zh) 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法

Country Status (1)

Country Link
CN (1) CN108647723B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109509187B (zh) * 2018-11-05 2022-12-13 中山大学 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法
CN109918752B (zh) * 2019-02-26 2022-12-16 华南理工大学 基于迁移卷积神经网络的机械故障诊断方法、设备及介质
CN110414536B (zh) * 2019-07-17 2022-03-25 北京得意音通技术有限责任公司 录音重放检测方法、存储介质和电子设备
CN110503185B (zh) * 2019-07-18 2023-04-07 电子科技大学 一种改进的深度调制识别网络模型
CN111898479B (zh) * 2020-07-14 2023-09-26 中国矿业大学 一种基于全卷积单步目标检测算法的口罩佩戴识别方法和装置
CN112561880B (zh) * 2020-12-16 2022-07-08 华东师范大学 一种将先验知识融入深度学习引导磁共振图像分类的方法
CN113343002A (zh) * 2021-06-07 2021-09-03 湖南大学 一种基于深度cnn特征的图像检索和分类方法
CN113807362B (zh) * 2021-09-03 2024-02-27 西安电子科技大学 基于层间语义信息融合深度卷积网络的图像分类方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069472A (zh) * 2015-08-03 2015-11-18 电子科技大学 一种基于卷积神经网络自适应的车辆检测方法
CN105224942A (zh) * 2015-07-09 2016-01-06 华南农业大学 一种rgb-d图像分类方法及系统
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107506740A (zh) * 2017-09-04 2017-12-22 北京航空航天大学 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9501724B1 (en) * 2015-06-09 2016-11-22 Adobe Systems Incorporated Font recognition and font similarity learning using a deep neural network
CN106127173B (zh) * 2016-06-30 2019-05-07 北京小白世纪网络科技有限公司 一种基于深度学习的人体属性识别方法
US20180124437A1 (en) * 2016-10-31 2018-05-03 Twenty Billion Neurons GmbH System and method for video data collection
CN107341506A (zh) * 2017-06-12 2017-11-10 华南理工大学 一种基于多方面深度学习表达的图像情感分类方法
CN107239802B (zh) * 2017-06-28 2021-06-01 广东工业大学 一种图像分类方法及装置
CN107480599B (zh) * 2017-07-19 2021-01-22 董伟 一种基于深度学习算法的共享单车还车管理方法
CN107958272B (zh) * 2017-12-12 2020-11-24 北京旷视科技有限公司 图片数据集更新方法、装置、系统及计算机存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224942A (zh) * 2015-07-09 2016-01-06 华南农业大学 一种rgb-d图像分类方法及系统
CN105069472A (zh) * 2015-08-03 2015-11-18 电子科技大学 一种基于卷积神经网络自适应的车辆检测方法
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107506740A (zh) * 2017-09-04 2017-12-22 北京航空航天大学 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SINGING STYLE INVESTIGATION BY RESIDUAL SIAMESE CONVOLUTIONAL NEURAL NETWORKS;Cheng-i Wang.et;《ICASSP 2018》;20180420;第116-120页 *
采用无监督学习算法与卷积的图像分类模型;王改华等;《华侨大学学报(自然科学版)》;20180131;第39卷(第1期);第146-151页 *

Also Published As

Publication number Publication date
CN108647723A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108647723B (zh) 一种基于深度学习网络的图像分类方法
CN108764471B (zh) 基于特征冗余分析的神经网络跨层剪枝方法
CN107705242B (zh) 一种结合深度学习与深度感知的图像风格化迁移方法
CN112257794B (zh) 一种基于yolo的轻量级的目标检测方法
CN106991440B (zh) 一种基于空间金字塔的卷积神经网络的图像分类方法
CN108875076B (zh) 一种基于Attention机制和卷积神经网络的快速商标图像检索方法
CN106845529A (zh) 基于多视野卷积神经网络的影像特征识别方法
CN111723915B (zh) 一种基于深度卷积神经网络的目标检测方法
CN103942571B (zh) 一种基于遗传规划算法的图形图像分类方法
CN110309835B (zh) 一种图像局部特征提取方法及装置
CN111046917B (zh) 基于深度神经网络的对象性增强目标检测方法
CN113515656B (zh) 一种基于增量学习的多视角目标识别与检索方法、及装置
CN111242180A (zh) 一种基于轻量化卷积神经网络的图像识别方法及系统
CN111709516A (zh) 神经网络模型的压缩方法及压缩装置、存储介质、设备
Yue et al. Face recognition based on histogram equalization and convolution neural network
US20220245510A1 (en) Multi-dimensional model shape transfer
CN109190666B (zh) 基于改进的深度神经网络的花卉图像分类方法
CN111860679B (zh) 一种基于YOLO v3改进算法的车辆检测方法
KR102305575B1 (ko) 이미지 간 유사도를 이용한 유사 영역 강조 방법 및 시스템
CN112257727A (zh) 一种基于深度学习自适应可变形卷积的特征图像提取方法
CN112150497A (zh) 基于二值神经网络的局部激活方法与系统
CN113807366B (zh) 一种基于深度学习的点云关键点提取方法
CN113313140B (zh) 基于深度注意力的三维模型分类和检索方法及装置
CN116433980A (zh) 脉冲神经网络结构的图像分类方法、装置、设备及介质
Hoang et al. FPGA oriented compression of DNN using layer-targeted weights and activations quantization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201013

CF01 Termination of patent right due to non-payment of annual fee