CN108647723A - 一种基于深度学习网络的图像分类方法 - Google Patents

一种基于深度学习网络的图像分类方法 Download PDF

Info

Publication number
CN108647723A
CN108647723A CN201810448134.8A CN201810448134A CN108647723A CN 108647723 A CN108647723 A CN 108647723A CN 201810448134 A CN201810448134 A CN 201810448134A CN 108647723 A CN108647723 A CN 108647723A
Authority
CN
China
Prior art keywords
network
section
characteristic pattern
column vector
image classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810448134.8A
Other languages
English (en)
Other versions
CN108647723B (zh
Inventor
王改华
吕朦
袁国亮
刘文洲
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201810448134.8A priority Critical patent/CN108647723B/zh
Publication of CN108647723A publication Critical patent/CN108647723A/zh
Application granted granted Critical
Publication of CN108647723B publication Critical patent/CN108647723B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种基于深度学习网络的图像分类方法,首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现。根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;然后在建立好网络的三节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;接着将最后的特征列向量与softmax分类器连接,完整整个网络;整个网络用已知数据库进行调节,保存调节好后的权值;最后将网络运用到新数据库时,用保存好的权值迁移学习,然后进行微调。本发明提出了一种新的卷积神经网络算法结构,并降低了参数储存量,缩短了网络训练时间,同时提高了识别效率。

Description

一种基于深度学习网络的图像分类方法
技术领域
本发明属于图形处理与模式识别技术领域,涉及一种图像分类方法,具体涉及一种在ResNext网络基础上进行多空间多尺度特征提取融合,并结合迁移学习训练网络的深度学习的图像分类方法。
背景技术
ResNext是原作者之一何凯明对网络ResNet的改进,一共有152层的深度残差网络ResNet在2015年的ImageNet和COCO 2015竞赛中的图像分类、目标检测和语义分割各个分项都取得最好成绩。
多尺度提取特征能有效改善图像检索、图像分类和目标检测的正确率。卷积神经网络中的多尺度提取特征可从卷积层,全连接层不同空间中提取特征。
迁移学习是指一种学习对另一种学习的影响。在深度学习中,就是把已经训练好的的模型参数迁移到新的模型来帮助新的模型训练。
发明内容
本发明的目的是提出一种在ResNext网络基础上进行多空间多尺度特征提取融合,并结合迁移学习训练网络的图像分类方法,减少了训练参数量,缩短训练时间,提高图像的模式识别的能力。
本发明所采用的技术方案是:一种基于深度学习网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现;根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
步骤2:在建立好网络的三节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整;
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到达一定程度后(正确率在80%以上),保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习,即将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络,即微调步骤。。
本发明的有益效果是:提出了一种新的卷积神经网络算法结构,并降低了参数储存量,缩短了网络训练时间,同时提高了识别效率。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例网络结构图;
图3为本发明实施例的原始block示意图;
图4为本发明实施例的修改后的block示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于深度学习网络的图像分类方法,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,这部分通过堆叠卷积快来实现。根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
请见图2,为本实施例的网络结构图;具体网络结构请见表1
表1
表1中,输出列的数据表示的经过网络经过各阶段操作后得到的输出,如果操作无参数,表明此网络无此操作,输出为上一阶段的输出;
表1中,卷积操作中的n*n,m,表示为卷积核大小为n*n,卷积核个数为m;C表示通道数,表示有C个n*n,m卷积操作。我们的方法中,一类采用1*3和3*1两层卷积层,另一类采用两个重复的1*3和3*1两层卷积层,同时调整步长,使输出特征图大小相同。每类的通道个数均为对比网络的一半,组合后相同;每阶段操作最右的大括号表示卷积块的堆叠的个数;
表1中,池化操作中的n*n,表示为池化大小为n*n。
步骤2:在建立好网络的每节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤2的具体实现包括以下子步骤:
步骤2.1:将每一部分获得的特征图进行均匀池化,一共有N节部分时,第一部分池化后特征图大小为2(N-1)*2(N-1),第二部分池化后特征图大小为2(N-2)*2(N-2),以此类推,最后一部分池化后特征图大小为2(N-N)*2(N-N)
本实施例的N取3。
步骤2.2:将每一部分的每一张特征图转化为列向量排列,然后整个部分顺序连接为列向量,最后将每个列向量顺利连接为最后的特征列向量。
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整。
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到达一定程度后(正确率在80%以上),保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习,即将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络,即微调步骤。
本发明在ResNext网络基础上进行了改进,减少了block的个数,在不改变Cardinality个数的基础上减小了网络的深度,减少了参数调整量的同时,提高了网络精度。
首先,减少block的个数,将block的个数由2改为3.
请见图3,本发明针对单个block,根据ResNext模型,选取了原始block结构进行了改进,改进后的block结构请见图4;
Cardinality个数不变,但是将Cardinality分成均等两类,一类采用1*3和3*1两层卷积层替代原始3*3卷积核,另一类采用两个重复的1*3和3*1两层卷积层来替代5*5卷积核,同时调整步长,使输出特征图大小相同。其他结构保持不变。
然后,在整体结构中选取每个重复block的最后输出进行不同尺度的均匀池化,最后一层的block输出均匀池化为1*1大小的特征图,即与原网络的全局均匀池化相同,倒数第二个重复block的输出则均匀池化为2^(2_1)*2^(2_1)大小的特征图,以此类推,以空间金字塔结构来获取深层网络中不同深度下特征图,最后将这些特征图进行顺序连接,送入softmax分类器中,完整网络。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (3)

1.一种基于深度学习网络的图像分类方法,其特征在于,包括以下步骤:
步骤1:首先建立与ResNext网络相同的提取特征部分,根据参数设置,将每个参数相同的卷积块分为一节,并对每节部分进行同样大小卷积块的删减;
步骤2:在建立好网络的每节部分中提取每一部分网络得到的特征图,处理后获得最后的特征列向量;
步骤3:将最后的特征列向量与softmax分类器进行全连接,使整个网络完整;
步骤4:将已知数据库输入到整个网络中,运用梯度下降法进行调节,当训练精度和验证精度到预设程度后,保存调节好后的权值;
步骤5:将网络运用到新数据库时,用保存好的权值进行迁移学习。
2.根据权利要求1所述的基于深度学习网络的图像分类方法,其特征在于,步骤2的具体实现包括以下子步骤:
步骤2.1:将每一部分获得的特征图进行均匀池化,一共有N节部分时,第一部分池化后特征图大小为2(N-1)*2(N-1),第二部分池化后特征图大小为2(N-2)*2(N-2),以此类推,最后一部分池化后特征图大小为2(N-N)*2(N-N)
步骤2.2:将每一部分的每一张特征图转化为列向量排列,然后整个部分顺序连接为列向量,最后将每个列向量顺利连接为最后的特征列向量。
3.根据权利要求1所述的基于深度学习网络的图像分类方法,其特征在于,步骤5的具体实现过程是:将保持好的权值对网络进行权值初始化,然后运用梯度下降法调节网络。
CN201810448134.8A 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法 Active CN108647723B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810448134.8A CN108647723B (zh) 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810448134.8A CN108647723B (zh) 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法

Publications (2)

Publication Number Publication Date
CN108647723A true CN108647723A (zh) 2018-10-12
CN108647723B CN108647723B (zh) 2020-10-13

Family

ID=63754530

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810448134.8A Active CN108647723B (zh) 2018-05-11 2018-05-11 一种基于深度学习网络的图像分类方法

Country Status (1)

Country Link
CN (1) CN108647723B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109509187A (zh) * 2018-11-05 2019-03-22 中山大学 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法
CN109918752A (zh) * 2019-02-26 2019-06-21 华南理工大学 基于迁移卷积神经网络的机械故障诊断方法、设备及介质
CN110414536A (zh) * 2019-07-17 2019-11-05 北京得意音通技术有限责任公司 数据特征提取方法、录音重放检测方法、存储介质和电子设备
CN110503185A (zh) * 2019-07-18 2019-11-26 电子科技大学 一种改进的深度调制识别网络模型
CN111898479A (zh) * 2020-07-14 2020-11-06 中国矿业大学 一种基于全卷积单步目标检测算法的口罩佩戴识别方法和装置
CN112561880A (zh) * 2020-12-16 2021-03-26 华东师范大学 一种将先验知识融入深度学习引导磁共振图像分类的方法
CN113343002A (zh) * 2021-06-07 2021-09-03 湖南大学 一种基于深度cnn特征的图像检索和分类方法
CN113807362A (zh) * 2021-09-03 2021-12-17 西安电子科技大学 基于层间语义信息融合深度卷积网络的图像分类方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069472A (zh) * 2015-08-03 2015-11-18 电子科技大学 一种基于卷积神经网络自适应的车辆检测方法
CN105224942A (zh) * 2015-07-09 2016-01-06 华南农业大学 一种rgb-d图像分类方法及系统
CN106127173A (zh) * 2016-06-30 2016-11-16 北京小白世纪网络科技有限公司 一种基于深度学习的人体属性识别方法
US9501724B1 (en) * 2015-06-09 2016-11-22 Adobe Systems Incorporated Font recognition and font similarity learning using a deep neural network
CN107239802A (zh) * 2017-06-28 2017-10-10 广东工业大学 一种图像分类方法及装置
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107341506A (zh) * 2017-06-12 2017-11-10 华南理工大学 一种基于多方面深度学习表达的图像情感分类方法
CN107480599A (zh) * 2017-07-19 2017-12-15 董伟 一种基于深度学习算法的共享单车还车管理方法
CN107506740A (zh) * 2017-09-04 2017-12-22 北京航空航天大学 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法
CN107958272A (zh) * 2017-12-12 2018-04-24 北京旷视科技有限公司 图片数据集更新方法、装置、系统及计算机存储介质
US20180124437A1 (en) * 2016-10-31 2018-05-03 Twenty Billion Neurons GmbH System and method for video data collection

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9501724B1 (en) * 2015-06-09 2016-11-22 Adobe Systems Incorporated Font recognition and font similarity learning using a deep neural network
CN105224942A (zh) * 2015-07-09 2016-01-06 华南农业大学 一种rgb-d图像分类方法及系统
CN105069472A (zh) * 2015-08-03 2015-11-18 电子科技大学 一种基于卷积神经网络自适应的车辆检测方法
CN106127173A (zh) * 2016-06-30 2016-11-16 北京小白世纪网络科技有限公司 一种基于深度学习的人体属性识别方法
US20180124437A1 (en) * 2016-10-31 2018-05-03 Twenty Billion Neurons GmbH System and method for video data collection
CN107341506A (zh) * 2017-06-12 2017-11-10 华南理工大学 一种基于多方面深度学习表达的图像情感分类方法
CN107239802A (zh) * 2017-06-28 2017-10-10 广东工业大学 一种图像分类方法及装置
CN107480599A (zh) * 2017-07-19 2017-12-15 董伟 一种基于深度学习算法的共享单车还车管理方法
CN107316066A (zh) * 2017-07-28 2017-11-03 北京工商大学 基于多通路卷积神经网络的图像分类方法及系统
CN107506740A (zh) * 2017-09-04 2017-12-22 北京航空航天大学 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法
CN107958272A (zh) * 2017-12-12 2018-04-24 北京旷视科技有限公司 图片数据集更新方法、装置、系统及计算机存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHENG-I WANG.ET: "SINGING STYLE INVESTIGATION BY RESIDUAL SIAMESE CONVOLUTIONAL NEURAL NETWORKS", 《ICASSP 2018》 *
王改华等: "采用无监督学习算法与卷积的图像分类模型", 《华侨大学学报(自然科学版)》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109509187A (zh) * 2018-11-05 2019-03-22 中山大学 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法
CN109509187B (zh) * 2018-11-05 2022-12-13 中山大学 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法
CN109918752A (zh) * 2019-02-26 2019-06-21 华南理工大学 基于迁移卷积神经网络的机械故障诊断方法、设备及介质
CN110414536A (zh) * 2019-07-17 2019-11-05 北京得意音通技术有限责任公司 数据特征提取方法、录音重放检测方法、存储介质和电子设备
CN110414536B (zh) * 2019-07-17 2022-03-25 北京得意音通技术有限责任公司 录音重放检测方法、存储介质和电子设备
CN110503185A (zh) * 2019-07-18 2019-11-26 电子科技大学 一种改进的深度调制识别网络模型
CN110503185B (zh) * 2019-07-18 2023-04-07 电子科技大学 一种改进的深度调制识别网络模型
CN111898479A (zh) * 2020-07-14 2020-11-06 中国矿业大学 一种基于全卷积单步目标检测算法的口罩佩戴识别方法和装置
CN111898479B (zh) * 2020-07-14 2023-09-26 中国矿业大学 一种基于全卷积单步目标检测算法的口罩佩戴识别方法和装置
CN112561880B (zh) * 2020-12-16 2022-07-08 华东师范大学 一种将先验知识融入深度学习引导磁共振图像分类的方法
CN112561880A (zh) * 2020-12-16 2021-03-26 华东师范大学 一种将先验知识融入深度学习引导磁共振图像分类的方法
CN113343002A (zh) * 2021-06-07 2021-09-03 湖南大学 一种基于深度cnn特征的图像检索和分类方法
CN113807362A (zh) * 2021-09-03 2021-12-17 西安电子科技大学 基于层间语义信息融合深度卷积网络的图像分类方法
CN113807362B (zh) * 2021-09-03 2024-02-27 西安电子科技大学 基于层间语义信息融合深度卷积网络的图像分类方法

Also Published As

Publication number Publication date
CN108647723B (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN108647723A (zh) 一种基于深度学习网络的图像分类方法
CN110020682B (zh) 一种基于小样本学习的注意力机制关系对比网络模型方法
CN110929603B (zh) 一种基于轻量级卷积神经网络的天气图像识别方法
WO2020168844A1 (en) Image processing method, apparatus, equipment, and storage medium
CN111079795B (zh) 基于cnn的分片多尺度特征融合的图像分类方法
AU2017101165A4 (en) Method of Structural Improvement of Game Training Deep Q-Network
CN106779068A (zh) 调整人工神经网络的方法和装置
CN110533024B (zh) 基于多尺度roi特征的双二次池化细粒度图像分类方法
CN109948029A (zh) 基于神经网络自适应的深度哈希图像搜索方法
CN107679617A (zh) 多次迭代的深度神经网络压缩方法
CN108170736A (zh) 一种基于循环注意力机制的文档快速扫描定性方法
CN108960301B (zh) 一种基于卷积神经网络的古彝文识别方法
Yang et al. Recomputation of the dense layers for performance improvement of dcnn
CN109543029A (zh) 基于卷积神经网络的文本分类方法、装置、介质和设备
CN111723915A (zh) 深度卷积神经网络的剪枝方法、计算机设备及应用方法
CN109145107B (zh) 基于卷积神经网络的主题提取方法、装置、介质和设备
CN107480788A (zh) 一种深度卷积对抗生成网络的训练方法及训练系统
Du et al. Efficient network construction through structural plasticity
Jasitha et al. Venation based plant leaves classification using GoogLeNet and VGG
CN107392155A (zh) 基于多目标优化的稀疏受限玻尔兹曼机的手写体识别方法
CN108920623A (zh) 一种数据挖掘方法及装置
CN107292322A (zh) 一种图像分类方法、深度学习模型及计算机系统
CN107563496A (zh) 一种向量核卷积神经网络的深度学习模式识别方法
CN110188978B (zh) 一种基于深度学习的大学生专业推荐方法
CN104965818B (zh) 一种基于自学习规则的项目名实体识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant