CN113807363B - 基于轻量化残差网络的图像分类方法 - Google Patents
基于轻量化残差网络的图像分类方法 Download PDFInfo
- Publication number
- CN113807363B CN113807363B CN202111048042.9A CN202111048042A CN113807363B CN 113807363 B CN113807363 B CN 113807363B CN 202111048042 A CN202111048042 A CN 202111048042A CN 113807363 B CN113807363 B CN 113807363B
- Authority
- CN
- China
- Prior art keywords
- convolution
- image classification
- unit block
- network
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012549 training Methods 0.000 claims abstract description 38
- 238000012360 testing method Methods 0.000 claims abstract description 29
- 238000013145 classification model Methods 0.000 claims abstract description 27
- 238000011176 pooling Methods 0.000 claims description 23
- 238000010276 construction Methods 0.000 claims description 14
- 230000004913 activation Effects 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 7
- 230000005284 excitation Effects 0.000 claims description 6
- 230000003213 activating effect Effects 0.000 claims description 5
- 238000001125 extrusion Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 2
- 238000011423 initialization method Methods 0.000 claims description 2
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 238000004088 simulation Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 6
- 230000003993 interaction Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于轻量化残差网络的图像分类方法,主要解决现有图像分类方法的网络模型参数数量过多,图像特征信息利用不充分的问题,其实现方案是:获取训练样本集和测试样本集;对传统的残差单元进行更改,建立五个不同的轻量化单元块,并将其与全连接层、分类器依次级联,构成的轻量化残差网络图像分类模型;利用训练样本集采用反向传播算法对构建的图像分类模型进行训练;将测试样本集输入到训练好的轻量化残差网络图像分类模型中,得到分类结果。本发明不仅在图像分类任务中能够得到较高的图像分类准确率,而且减少了网络模型参数量,提高了网络的运行速度,可用于人脸、交通场景、医学图像的识别,图像检索和相册自动归类。
Description
技术领域
本发明属于图像处理技术领域,更进一步涉及一种图像分类方法,可用于人脸、交通场景、医学图像的识别,图像检索和相册自动归类。
背景技术
图像分类是从图像中获取能够代表该图像内容的特征,然后利用计算机对该特征进行分析,从而得到该图像所属类别的一项技术。在实际的图像分类任务中,往往会预先给定几个图像类别信息,计算机会给出该图像属于各类别的概率值,并最终判定概率值最大的类别即为该图像所属类别。因此,在图像分类任务中,从图像中所学习和提取到的特征是决定图像类别判定的关键性因素,如何提取到更加具有代表性更丰富的特征也成为学者们研究和关注的重点。
传统的图像分类方法首先通过人工提取特征的方式从图像中获取特征信息,然后再使用分类器判断图像种类,例如Dalal N,和Triggs B在Histograms of orientedgradients forhuman detection中使用方向梯度直方图进行手工特征的提取。该方法的主要步骤是,将图像分成小的连通区域,然后采集连通区域中各像素点的梯度的或边缘的方向直方图,最后把这些直方图组合起来,就可以构成特征描述符,然后用于后续的检测、分类等任务。此方法优势是通过位置和方向空间的量化抑制了平移和旋转带来的影响;采取在局部区域归一化直方图,可以抵消光照变化带来的影响;使用分块单元的处理方法使得图像局部像素点之间的关系得到了更有效的表征。但此方法描述子生成过程过于冗长,导致速度慢,实时性差,而且很难处理遮挡问题,并且该描述子对噪点相当敏感。
自1998年LeNet5出现后,研究者们开始注意到卷积神经网络在特征提取上的强大能力,由于网络具有一定深度,能够学习到图像的层级结构性特征,进而可提升后续的图像识别效果。Alex在ImageNet LSVRC-2010大赛中使用一种新的网络模型进行特征的提取,并取得了当年的冠军,随后在Imagenet classification with deep convolutionalneuralnetworks一文中对模型进行了详细的阐述并命名为AlexNet。该方法使用非线性激活函数ReLU进行激活操作,并采取分组卷积即双GPU并行的运行方式提高运行速度,采用局部响应归一化进行正则化,利用重叠池化减少过拟合操作,该方法在分类问题上的效果进一步证明了深度卷积神经网络的优越性,取得了不错的效果,但却存在着网络模型参数数量过多,分组卷积之后不同组通道间缺乏信息交流的问题。
针对上述方法网络模型参数数量过多的问题,研究者提出了通过改变卷积方式来降低计算复杂度的轻量化网络,使得在保证图像分类精度的前提下达到参数少速度快的效果,现有的轻量化网络大多依托单一的卷积方式,仍然存在参数数量过大的问题,而且也没有明显的提升网络特征表达能力。
针对上述方法分组卷积不同组通道间缺乏信息交流的问题,研究者利用通道混洗操作来加强特征信息的交互,此操作可以促进通道间信息的融合,改变通道维度,增强网络特征的表达能力,然而单纯的通道混洗操作并没有减少网络的参数数量,网络的速度也并没有得到提升。
发明内容
本发明根据现有技术的不足,提出一种基于轻量化残差网络的图像分类方法,以在增强网络特征表达能力的同时减少网络参数规模和参数数量,充分利用各通道特征信息,提高图像分类任务的精度和速度。
实现本发明目的的技术方案是:基于传统的轻量化残差网络,将其中的残差单元与卷积方式为分组卷积的ShuffleNet单元相结合以减少网络参数数量,并利用通道混洗操作加强各分组间图像特征交互,再通过引入挤压激励结构调节不同图像特征通道的权值得到多层次特征,最后融合多层次特征完成图像分类任务,其具体实现包括如下:
(1)获取训练样本集R1和测试样本集E1:
(1a)从网上下载已经划分为训练样本和测试样本的K幅RGB图像数据集,每种样本包含T个目标类别幅RGB图像,其中t为类别标签,t∈{1,2...,T},r为样本类型,取值为0表示训练样本,取值为1表示测试样本,样本数/>随着样本类别的不同而不同,T≥10,K≥10000,/>
(1b)将数据集中的训练样本设置为训练样本集R1,测试样本设置为测试样本集E1;
(2)构建轻量化残差网络图像分类模型:
(2a)搭建由一层卷积层和一层最大池化层顺次叠加构成的第一单元块Stage1;
(2b)将传统残差单元构建模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该构建模块的快捷连接上增加一个卷积核为3,步长为2的平均池化层,得到第二单元块Stage2;
(2c)将传统残差单元构建模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该构建模块的快捷连接上增加一个卷积核为3*3,步长为2的平均池化层;最后在该构建模块的末尾添加一个大小为3*3、步长为2的卷积层,得到第三单元块Stage3;
(2d)将传统残差单元瓶颈模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该瓶颈模块的快捷连接上增加一个卷积核为3*3,步长为2的平均池化层,得到第四单元块Stage4;
(2e)将传统残差单元瓶颈模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该瓶颈模块的快捷连接上增加一个卷积核为3*3,步长为2的平均池化层;最后在该瓶颈模块的末尾添加一个大小为3*3、步长为2的卷积层,得到第五单元块Stage5;
(2f)将上述得到的这五个单元块Stage1、Stage2、Stage3、Stage4、Stage5依次连接使之成为一个单元块序列,再在该单元块序列后级联一个全连接层和一个分类器,得到轻量化残差网络图像分类模型;
(3)将训练样本集R1输入到轻量化残差网络图像分类模型,利用反向传播算法进行训练,得到训练好的轻量化残差网络图像分类模型;
(4)将测试样本集E1输入到训练好的轻量化残差网络图像分类模型中,得到E1中每一张RGB测试图像的类别标签。
本发明与现有的技术相比具有以下优点:
第一,由于本发明在传统残差单元的构建模块和瓶颈模块中利用分组卷积进行特征提取,使得本发明在图像分类任务中减少了模型参数量,降低了网络参数规模。
第二,由于本发明通过通道混洗操作加强了各通道间图像特征交互,再通过压缩、激励操作调节了不同通道图像特征的权值,使得本发明提高了图像分类的准确性。
附图说明
图1为本发明的实现总流程图;
图2是本发明构建的轻量化残差网络图像分类模型的子流程图;
图3是本发明中构建的轻量化残差网络图像分类模型结构图。
具体实施方式
下面结合附图对本发明的实施例和效果做进一步详细描述。
参照图1,对本发明的实现步骤包括如下:
步骤1,获取训练样本集R1和测试样本集E1:
从网上下载已经划分为训练样本和测试样本的K幅RGB图像数据集,每种样本包含T个目标类别幅RGB图像,其中t为类别标签,t∈{1,2...,T},r为样本类型,取值为0表示训练样本,取值为1表示测试样本,样本数/>随着样本类别的不同而不同,T≥10,K≥10000,将数据集中的训练样本设置为训练样本集R1,测试样本设置为测试样本集E1。
步骤2,构建轻量化残差网络图像分类模型。
参照图2,本步骤的实现如下:
2.1)构建第一单元块Stage1:将一个卷积核大小为7*7,步长为2的卷积层与一个卷积核大小为3*3,步长为2的最大池化层顺次叠加,得到第一单元块Stage1;
2.2)对传统残差单元中的构建模块进行更改,构建第二单元块Stage2:将构建模块中卷积核为1*1的常规卷积替换为1*1的分组卷积,并将卷积核大小为3*3的深度可分离卷积操作的步长由1改为2,再在该构建模块的快捷连接上增加一个卷积核大小为3*3,步长为2的平均池化层,得到第二单元块Stage2;
2.3)对传统残差单元中的构建模块进行更改,构建第三单元块Stage3:将构建模块中卷积核为1*1的常规卷积替换为1*1的分组卷积,并将卷积核为3*3的深度可分离卷积操作的步长由1改为2,再在该构建模块的快捷连接上增加一个卷积核大小为3*3,步长为2的平均池化层;最后在该构建模块的末尾添加一个卷积核大小为3*3、步长为2的卷积层,得到第三单元块Stage3;
2.4)对传统残差单元中的瓶颈模块进行更改,构建第四单元块Stage4:将瓶颈模块进行中卷积核为1*1的常规卷积替换为1*1的分组卷积,并将卷积核为3*3的深度可分离卷积操作的步长由1改为2,再在该瓶颈模块进行的快捷连接上增加一个卷积核大小为3*3,步长为2的平均池化层,得到第四单元块Stage4;
2.5)对传统残差单元中的瓶颈模块进行更改,构建第五单元块Stage5:将瓶颈模块进行中卷积核为1*1的常规卷积替换为1*1的分组卷积,并将卷积核为3*3的深度可分离卷积操作的步长由1改为2,再在该瓶颈模块进行的快捷连接上增加一个卷积核为3*3,步长为2的平均池化层;最后在该瓶颈模块进行的末尾添加一个卷积核大小为3*3、步长为2的卷积层,得到第五单元块Stage5;
2.6)将上述得到的这五个单元块Stage1、Stage2、Stage3、Stage4、Stage5依次连接使之成为一个单元块序列,并在该单元块序列之后增加一个挤压和激励操作调节第五单元块Stage5的输出结果;
2.7)在2.6)的输出结果级联一个全连接层和一个分类器,得到的轻量化残差网络图像分类模型结构,如图3所示。
参照图3,本步骤构建的轻量化残差网络图像分类模型结构,包括依次级联第一单元块Stage1、第二单元块Stage2、第三单元块Stage3、第四单元块Stage4、第五单元块Stage5、全连接层和分类器,且在第二单元块Stage2、第三单元块Stage3、第四单元块Stage4、第五单元块Stage5中的输入与输出之间均快捷连接有平均池化层,在第三单元块Stage3和第五单元块Stage5的输出端之前连接有一个卷积核大小为3*3、步长为2的卷积层。
步骤3,对轻量化残差网络图像分类模型进行训练。
3.1)利用正交初始化方法对轻量化残差网络图像分类模型参数进行随机初始化,设最大迭代次数为E=500;
3.2)将训练样本集R1输入到第一单元块Stage1中,依次经过卷积、最大池化操作得到每一张RGB输入图像初始特征
3.3)将初始特征依次输入到第二单元块Stage2、第三单元块Stage3、第四单元块Stage4、第五单元块Stage5中,再利用挤压和激励操作调节第五单元块Stage5的输出结果,得到新的特征响应/>
3.3.1)将输入特征映射为新的特征图U∈RH×W×C,其中/>表示目标类别为t的训练样本的初始特征,RH'×W'×C表示初始特征矩阵的高度为H',宽度为W',通道数为C,RH×W×C表示新的特征图矩阵的高度为H,宽度为W,通道数为C,映射公式如下:
U=[u1,u2,…,uj,…,uC]
其中,表示第j个通道的输出矩阵,vj表示第j个卷积核对/>的第j个通道进行操作,*表示卷积运算;
3.3.2)利用全局平均池化将新的特征图U压缩为一维通道描述向量z:
z=[z1,z2,···,zj,···,zc]
其中,表示特征图U第j个通道经过全局平均池化得到的描述值,H×W表示特征图U的大小,Uj(m,n)表示特征图U的第j个通道坐标为(m,n)的特征点的值;
3.3.3)利用激活函数对通道描述向量z进行激活,得到激活向量s:
s=[s1,s2,···,sj,···,sc]
其中,sj表示描述向量z中第j个描述值经过激活得到的值,sj=σ(zj),σ(·)表示ReLU激活函数;
3.3.4)利用激活值s重新调整特征图U,得到新的特征响应
其中表示目标类别为t的训练样本中第j个通道激活值经过重新调整得到的特征响应值,/>sj为激活值,Uj表示特征图U中第j个通道的值;
3.4)将新的特征响应输入到全连接层,再送入分类器进行分类,计算分类损失并利用反向传播算法对网络参数进行更新;
3.5)重复上述步骤3.2)~3.4),直至网络达到最大的迭代次数E,停止训练,得到训练好的轻量化残差网络图像分类模型。
步骤4,将测试样本集E1输入到训练好的轻量化残差网络图像分类模型中,得到E1中每一张RGB测试图像的分类结果。
下面结合仿真实验对本发明的效果做进一步说明。
1.仿真实验条件:
本发明仿真实验的硬件测试平台是:处理器为Intel(R)Core i5-3470,主频为3.2GHz,内存16GB;
本发明仿真实验的软件平台为:Windows 7旗舰版,64位操作系统,Python3.6,PyTorch1.7。
仿真实验所用数据集是CIFAR10数据集。CIFAR10数据集共包含60000张维度大小为32*32*3的RGB图像,有10种各自独立的类别,每个类别都包含5000张训练图像和1000张测试图像,所以训练集共50000张图像,测试集共10000张图像。
2.仿真内容仿真结果分析:
仿真1,在上述仿真条件下,分别利用现有的VGG16图像分类方法、ResNet50图像分类方法、ResNet101图像分类方法、SCF图像分类方法作和本发明对CIFAR10数据集测试样本集测试,得到分类结果,再利用分类结果分别计算每类方法的分类准确率,结果如表格1。
表格1不同方法的分类准确率
分类方法 | 准确率 |
VGG16 | 92.64% |
ResNet50 | 93.62% |
ResNet101 | 93.75% |
SCF | 93.71% |
本发明 | 95.38% |
由表1可以看出,本发明在图像分类CIFAR10测试数据集上的分类精度达到95.38%,比之前分类最好的方法ResNet50高1.76%,与其他分类方法相比也有明显提升。实验结果表明本发明利用通道混洗加强了各通道间图像特征交互,再通过压缩、激励操作调节了不同通道图像特征的权值,提升了模型的特征表达能力,使得本发明能够在实际分类任务中提升图像的分类准确度。
仿真2,在上述仿真条件下,用CIFAR10数据集的训练样本集对现有的VGG16图像分类方法所构建的网络模型、ResNet50图像分类方法所构建的网络分类模型、ResNet101图像分类方法所构建的模型和本发明所构建的轻量化残差网络分类模型进行训练,并利用反向传播算法对分类模型参数进行更新,得到训练好的上述四种模型,分别统计每个模型在训练中所需要的参数量,结果如表格2。
表格2不同方法在训练各自分类网络所需要的参数量
分类方法 | 参数量 |
VGG16 | 138M |
ResNet50 | 26M |
ResNet101 | 45M |
本发明 | 23M |
由表格2可以看出,本发明相比ResNet50分类方法在参数量上减少了3M左右,与其他常用的分类方法相比也取得了明显的提升,表明本发明通过分组卷积进行特征提取,确实达到了减少网络参数的目的。
以上仿真结果表明:本发明不仅在图像分类任务中能够得到较高的图像分类准确率,而且减少了网络模型参数量,提高了网络的运行速度。
Claims (4)
1.一种基于轻量化残差网络的图像分类方法,其特征在于,包括如下:
(1)获取训练样本集R1和测试样本集E1:
(1a)从网上下载已经划分为训练样本和测试样本的K幅RGB图像数据集,每种样本包含T个目标类别幅RGB图像,其中t为类别标签,t∈{1,2...,T},r为样本类型,取值为0表示训练样本,取值为1表示测试样本,样本数/>随着样本类别的不同而不同,T≥10,K≥10000,
(1b)将数据集中的训练样本设置为训练样本集R1,测试样本设置为测试样本集E1;
(2)构建轻量化残差网络图像分类模型:
(2a)搭建由一层卷积层和一层最大池化层顺次叠加构成的第一单元块Stage1;
(2b)将传统残差单元构建模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该构建模块的快捷连接上增加一个卷积核为3,步长为2的平均池化层,得到第二单元块Stage2;
(2c)将传统残差单元构建模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该构建模块的快捷连接上增加一个卷积核为3*3,步长为2的平均池化层;最后在该构建模块的末尾添加一个大小为3*3、步长为2的卷积层,得到第三单元块Stage3;
(2d)将传统残差单元瓶颈模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该瓶颈模块的快捷连接上增加一个卷积核为3*3,步长为2的平均池化层,得到第四单元块Stage4;
(2e)将传统残差单元瓶颈模块中的常规卷积替换为分组卷积,并将其卷积核为3*3的深度可分离卷积操作的步长由1改为2;再在该瓶颈模块的快捷连接上增加一个卷积核为3*3,步长为2的平均池化层;最后在该瓶颈模块的末尾添加一个大小为3*3、步长为2的卷积层,得到第五单元块Stage5;
(2f)将上述得到的这五个单元块Stage1、Stage2、Stage3、Stage4、Stage5依次连接使之成为一个单元块序列,再在该单元块序列后级联一个全连接层和一个分类器,得到轻量化残差网络图像分类模型;
(3)将训练样本集R1输入到轻量化残差网络图像分类模型,利用反向传播算法进行训练,得到训练好的轻量化残差网络图像分类模型;
(4)将测试样本集E1输入到训练好的轻量化残差网络图像分类模型中,得到E1中每一张RGB测试图像的类别标签。
2.根据权利要求1所述的方法,其中(3)中所述的将训练样本集R1输入到轻量化残差网络图像分类模型,利用反向传播算法进行训练,实现如下:
(3a)利用正交初始化方法对网络参数进行随机初始化,设最大迭代次数为E=500;
(3b)将训练样本集R1输入到第一单元块Stage1中,依次经过卷积、池化操作得到每一张RGB输入图像初始特征
(3c)将初始特征依次输入到第二单元块Stage2、第三单元块Stage3、第四单元块Stage4、第五单元块Stage5中,再利用挤压和激励操作调节第五单元块Stage5的输出结果,得到新的特征响应/>
(3d)将新的特征响应输入全连接层,然后送入分类器进行分类,采取交叉熵函数计算分类损失并利用反向传播算法对网络参数进行更新;
(3e)重复上述步骤(3b)~(3d),直至网络达到最大的迭代次数E,停止训练,得到训练好的轻量化残差网络图像分类模型。
3.根据权利要求2所述的方法,其中(3c)中所述的利用挤压和激励操作调节第五单元块Stage5的输出,实现如下:
(3c1)将输入特征映射为新的特征图U∈RH×W×C,其中/>表示目标类别为t的训练样本的初始特征,RH′×W′×C表示初始特征矩阵的高度为H',宽度为W',通道数为C,RH ×W×C表示新的特征图矩阵的高度为H,宽度为W,通道数为C;
(3c2)利用全局平均池化将新的特征图U压缩为一维通道描述向量z:
z=[z1,z2,…,zj,…,zc]
其中,表示特征图U第j个通道经过全局平均池化得到的描述值,H×W表示特征图U的大小,Uj(m,n)表示特征图U的第j个通道坐标为(m,n)的特征点的值;
(3c3)利用激活函数对通道描述向量z进行激活,得到激活向量s:
s=[s1,s2,…,sj,…,sc]
其中,sj表示描述向量z中第j个描述值经过激活得到的值,sj=σ(zj),σ(·)表示ReLU激活函数;
(3c4)利用激活值s重新调整输出,得到新的特征响应
其中表示目标类别为t的训练样本中第j个通道激活值经过重新调整得到的特征响应值,/>sj为激活值,Uj表示特征图U中第j个通道的值。
4.根据权利要求3所述的方法,其中(3c1)所述的将输入特征映射为新的特征图U∈RH×W×C,公式如下:
U=[u1,u2,…,uj,…,uC]
其中,表示第j个通道的输出矩阵,vj表示第j个卷积核对/>的第j个通道进行操作,*表示卷积运算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111048042.9A CN113807363B (zh) | 2021-09-08 | 2021-09-08 | 基于轻量化残差网络的图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111048042.9A CN113807363B (zh) | 2021-09-08 | 2021-09-08 | 基于轻量化残差网络的图像分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113807363A CN113807363A (zh) | 2021-12-17 |
CN113807363B true CN113807363B (zh) | 2024-04-19 |
Family
ID=78894825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111048042.9A Active CN113807363B (zh) | 2021-09-08 | 2021-09-08 | 基于轻量化残差网络的图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807363B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107437096A (zh) * | 2017-07-28 | 2017-12-05 | 北京大学 | 基于参数高效的深度残差网络模型的图像分类方法 |
KR101847874B1 (ko) * | 2017-06-28 | 2018-05-25 | 서경대학교 산학협력단 | 합성곱 신경망을 이용한 이미지 인식 방법 및 그 기록 매체 |
WO2018120740A1 (zh) * | 2016-12-29 | 2018-07-05 | 深圳光启合众科技有限公司 | 图片分类方法和装置、机器人 |
CN110197205A (zh) * | 2019-05-09 | 2019-09-03 | 三峡大学 | 一种多特征来源残差网络的图像识别方法 |
CN110427970A (zh) * | 2019-07-05 | 2019-11-08 | 平安科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
JP2019197445A (ja) * | 2018-05-11 | 2019-11-14 | 日本電信電話株式会社 | 画像認識装置、画像認識方法、およびプログラム |
AU2020102569A4 (en) * | 2020-10-02 | 2020-11-19 | Alankrita Aggarwal | A system and method for classifying reptilian images using convolutional neural network |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
DE102019123756A1 (de) * | 2019-09-05 | 2021-03-11 | Connaught Electronics Ltd. | Neuronales Netzwerk zur Durchführung einer semantischen Segmentierung eines Eingabebildes |
CN113033650A (zh) * | 2021-03-22 | 2021-06-25 | Oppo广东移动通信有限公司 | 图像分类方法、分类模型的训练方法、装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017142629A1 (en) * | 2016-02-18 | 2017-08-24 | Google Inc. | Image classification neural networks |
US10303979B2 (en) * | 2016-11-16 | 2019-05-28 | Phenomic Ai Inc. | System and method for classifying and segmenting microscopy images with deep multiple instance learning |
US10083374B2 (en) * | 2016-12-12 | 2018-09-25 | Texas Instruments Incorporated | Methods and systems for analyzing images in convolutional neural networks |
CN108776807A (zh) * | 2018-05-18 | 2018-11-09 | 复旦大学 | 一种基于可跳层双支神经网络的图像粗细粒度分类方法 |
CN109389078B (zh) * | 2018-09-30 | 2022-06-21 | 京东方科技集团股份有限公司 | 图像分割方法、相应的装置及电子设备 |
-
2021
- 2021-09-08 CN CN202111048042.9A patent/CN113807363B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018120740A1 (zh) * | 2016-12-29 | 2018-07-05 | 深圳光启合众科技有限公司 | 图片分类方法和装置、机器人 |
KR101847874B1 (ko) * | 2017-06-28 | 2018-05-25 | 서경대학교 산학협력단 | 합성곱 신경망을 이용한 이미지 인식 방법 및 그 기록 매체 |
CN107437096A (zh) * | 2017-07-28 | 2017-12-05 | 北京大学 | 基于参数高效的深度残差网络模型的图像分类方法 |
JP2019197445A (ja) * | 2018-05-11 | 2019-11-14 | 日本電信電話株式会社 | 画像認識装置、画像認識方法、およびプログラム |
CN110197205A (zh) * | 2019-05-09 | 2019-09-03 | 三峡大学 | 一种多特征来源残差网络的图像识别方法 |
CN110427970A (zh) * | 2019-07-05 | 2019-11-08 | 平安科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
WO2021003938A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
DE102019123756A1 (de) * | 2019-09-05 | 2021-03-11 | Connaught Electronics Ltd. | Neuronales Netzwerk zur Durchführung einer semantischen Segmentierung eines Eingabebildes |
AU2020102569A4 (en) * | 2020-10-02 | 2020-11-19 | Alankrita Aggarwal | A system and method for classifying reptilian images using convolutional neural network |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
CN113033650A (zh) * | 2021-03-22 | 2021-06-25 | Oppo广东移动通信有限公司 | 图像分类方法、分类模型的训练方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
基于多样化结构的轻量型卷积神经网络设计;魏书伟;曾上游;潘兵;王新娇;;现代电子技术(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113807363A (zh) | 2021-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830855B (zh) | 一种基于多尺度低层特征融合的全卷积网络语义分割方法 | |
CN111460968B (zh) | 基于视频的无人机识别与跟踪方法及装置 | |
CN106780639B (zh) | 基于显著性特征稀疏嵌入和极限学习机的哈希编码方法 | |
Karim et al. | Impact of compressed and down-scaled training images on vehicle detection in remote sensing imagery | |
CN109840560A (zh) | 基于胶囊网络中融入聚类的图像分类方法 | |
CN114913379B (zh) | 基于多任务动态对比学习的遥感图像小样本场景分类方法 | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
CN109034370A (zh) | 一种基于特征映射剪枝的卷积神经网络精简方法 | |
CN115131760B (zh) | 一种基于改进特征匹配策略的轻量级车辆追踪方法 | |
CN114972753B (zh) | 基于上下文信息聚合和辅助学习的轻量级语义分割方法及系统 | |
CN113920472A (zh) | 一种基于注意力机制的无监督目标重识别方法及系统 | |
CN110991554B (zh) | 一种基于改进pca的深度网络图像分类方法 | |
Liu et al. | A new and effective image retrieval method based on combined features | |
CN116452863A (zh) | 面向遥感影像场景分类的类中心知识蒸馏方法 | |
CN115393666A (zh) | 图像分类中基于原型补全的小样本扩充方法及系统 | |
Wang et al. | Pedestrian detection in infrared image based on depth transfer learning | |
CN113327227B (zh) | 一种基于MobilenetV3的小麦头快速检测方法 | |
CN113743251B (zh) | 一种基于弱监督场景的目标搜索方法及装置 | |
CN118247645A (zh) | 一种新型DDCE-YOLOv8s模型的水下图像目标检测方法 | |
CN114358279A (zh) | 图像识别网络模型剪枝方法、装置、设备及存储介质 | |
CN109241315A (zh) | 一种基于深度学习的快速人脸检索方法 | |
CN105844299B (zh) | 一种基于词袋模型的图像分类方法 | |
CN113807363B (zh) | 基于轻量化残差网络的图像分类方法 | |
Zhang et al. | Channel compression optimization oriented bus passenger object detection | |
CN116129327A (zh) | 一种基于改进YOLOv7算法的红外车辆检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |