CN113436200A - 基于轻量分割卷积网络的rgb图像分类方法 - Google Patents

基于轻量分割卷积网络的rgb图像分类方法 Download PDF

Info

Publication number
CN113436200A
CN113436200A CN202110849717.3A CN202110849717A CN113436200A CN 113436200 A CN113436200 A CN 113436200A CN 202110849717 A CN202110849717 A CN 202110849717A CN 113436200 A CN113436200 A CN 113436200A
Authority
CN
China
Prior art keywords
layer
convolution
lightweight
convolutional
image classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110849717.3A
Other languages
English (en)
Other versions
CN113436200B (zh
Inventor
田小林
黄小萃
王凯
杨婷
焦李成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202110849717.3A priority Critical patent/CN113436200B/zh
Publication of CN113436200A publication Critical patent/CN113436200A/zh
Application granted granted Critical
Publication of CN113436200B publication Critical patent/CN113436200B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种基于轻量分割卷积网络的RGB图像分类方法,实现步骤为:(1)获取训练样本集R1和测试样本集E1;(2)构建轻量分割卷积网络;(3)构建基于轻量分割卷积网络的图像分类模型H;(4)对基于轻量分割卷积网络的图像分类模型H进行迭代训练;(5)获取RGB图像的分类结果。本发明多个轻量分割卷积网络可以将最大池化得到的高维特征分割成两个不重叠的子特征,然后用不同的卷积层分别对两个子特征进行特征提取,避免了现有技术在整体特征的基础上进行特征提取导致的未充分抑制深度学习网络对于冗余特征的自适应提取的缺陷,有效提高了RGB图像的分类精度。

Description

基于轻量分割卷积网络的RGB图像分类方法
技术领域
本发明属于图像处理技术领域,涉及一种RGB图像分类方法,具体涉及一种基于轻量分割卷积网络的RGB图像分类方法,可用于目标识别、行为识别和基于图像内容的图像检索。
背景技术
图像分类是一种根据不同类别的目标各自在图像信息中所反映的不同特征,把不同类别的图像区分开来的图像处理方法。图像分类可分为基于传统特征的分类方法和基于机器学习的分类方法,基于传统特征的分类方法是基于色彩、纹理、形状、空间关系等图像特征对图像目标进行分类。
随着机器学习在各个领域的广泛应用,RGB图像分类也出现了多种基于深度学习的分类方法,如自编码器AE(Autoencoder)、生成对抗网络GAN(Generative AdversarialNets)、深度残差网络ResNet(Residual Neural Network)、深度信念网络DBN(Deep BeliefNetwork)等。基于机器学习的RGB图像分类方法并不需要人工提取特征以及过多专业知识,能够通过神经网络模型的训练自动稳健地提取图像特征,从而取得很好的分类结果,得到了研究人员的广泛应用。
由于机器学习网络提取特征的方式是自适应的,导致其所提取的特征冗余度高,进而影响深度学习网络对RGB图像进行准确分类,为了抑制特征冗余度高对RGB图像分类准确率的影响,例如,申请公布号为CN113111970A,名称为“通过构建全局嵌入式注意力残差网络对图像分类的方法”的专利申请,公开了一种通过构建全局嵌入式注意力残差网络对RGB图像进行分类的方法,该方法首先将待分类的RGB图像数据进行预处理,构建包括基于全局上下文的空间注意力子模块和基于坐标的通道注意力子模块的全局嵌入式注意力模块,构建包括1个输入层、1个卷积核大小为7×7的卷积层、1个最大池化层、全局嵌入式注意力模块、2个全连接层和1个输出层的全局嵌入式注意力残差网络,然后将预处理后的待分类RGB图像数据输入全局嵌入式注意力残差网络进行训练及测试,得到RGB图像目标的分类结果。该方法在深度学习网络中加入了基于全局上下文的空间注意力子模块和基于坐标的通道注意力子模块,因而可以提高有效特征的权重,降低冗余特征的权重,解决了RGB图像分类方法中特征冗余度过高影响RGB图像准确分类所造成的分类精度低的问题,但是由于该方法是在整体特征的基础上采用注意力模块来降低特征的冗余度,仍未充分抑制深度学习网络对于冗余特征的自适应提取,导致对RGB图像分类的精度依然较低。
发明内容
本发明的目的在于针对上述现有技术存在的不足,提出一种基于轻量分割卷积网络的RGB图像分类方法,用于解决现有技术中存在的分类精度较低的技术问题。
为实现上述目的,本发明采取的技术方案包括如下步骤:
(1)获取训练样本集R1和测试样本集E1
(1a)获取包含T个目标类别的K幅RGB图像,每个目标类别对应I幅RGB图像,其中,T≥2,K≥20,I≥10;
(1b)随机选取每个目标类别对应RGB图像中的半数以上组成数据集R0,并对R0中每幅RGB图像的目标进行标记后,对经过标记的每幅RGB图像进行预处理,再将所有经过预处理的RGB图像组成训练样本集R1,同时将除R0以外的其他RGB图像组成测试样本集E1
(2)构建轻量分割卷积网络:
构建包括顺次连接的第一卷积层、特征切片层、堆叠层、第三卷积层的轻量分割卷积网络,特征切片层与堆叠层之间加载有并行排布的TFP层和第二卷积层,TFP层和第二卷积层的输出端各连接有一个第一全局平均池化层;TFP层包括两个并行连接的第四卷积层;
(3)构建基于轻量分割卷积网络的图像分类模型H:
构建包括依次层叠的第五卷积层、最大池化层、Q个轻量分割卷积网络、第二全局平均池化层和全连接层的图像分类模型H,Q≥2;
(4)对基于轻量分割卷积网络的图像分类模型H进行迭代训练:
(4a)初始化迭代次数为s,最大迭代次数为S,S≥200,第s次迭代的图像分类模型为Hs,Hs的权值参数为ωs,并令s=1,Hs=H;
(4b)将从训练样本集R1中有放回且随机选取的M个训练样本作为基于轻量分割卷积网络的图像分类模型Hs的输入,第五卷积层对每个训练样本进行卷积,最大池化层对每个训练样本卷积得到的高维特征f进行最大池化,Q个轻量分割卷积网络对最大池化得到的高维特征F进行特征提取,第二全局平均池化层对Q个轻量分割卷积网络所提取的高维特征F*进行平均池化,全连接层对平均池化后的高维特征F1 *进行分类,得到预测标签集合y={y1,y2,...,ym,...,yM},其中,M≥2,ym表示第m个训练样本对应的预测标签;
(4c)采用交叉熵损失函数,并通过每个预测标签ym和其对应的真实标签
Figure BDA0003181980950000031
计算Hs的损失值Ls,然后求取Ls对权值参数ωs的偏导
Figure BDA0003181980950000032
再采用梯度下降法,通过将
Figure BDA0003181980950000033
在Hs中进行反向传播的方式对权值参数ωs进行更新;
(4d)判断s≥S是否成立,若是,得到训练好的图像分类模型H*,否则,令s=s+1,并执行步骤(4b);
(5)获取RGB图像的分类结果:
将测试样本集E1作为训练好的图像分类模型H*的输入进行前向传播,得到所有测试样本的预测标签。
本发明与现有技术相比,具有如下优点:
本发明所构建的图像分类模型包含有多个轻量分割卷积网络,在对图像分类模型进行迭代训练,以及获取RGB图像的分类结果的过程中,多个轻量分割卷积网络可以将最大池化得到的高维特征分割成两个不重叠的子特征,然后用不同的卷积层分别对两个子特征进行特征提取,避免了现有技术在整体特征的基础上进行特征提取导致的未充分抑制深度学习网络对于冗余特征的自适应提取的缺陷,有效提高了RGB图像的分类精度。
附图说明
图1为本发明的实现流程图;
图2为本发明构建的轻量分割卷积网络的结构示意图。
具体实施方式
以下结合附图和具体实施例,对本发明作进一步详细描述:
参照图1,本发明包括如下步骤:
步骤1)获取训练样本集R1和测试样本集E1
步骤1a)从ImageNet图像分类数据集中获取包含T个目标类别的K幅RGB图像,每个目标类别对应I幅RGB图像,其中,T≥2,K≥20,I≥10;在本实施例中,T=1000,K=500000。
步骤1b)随机选取每个目标类别对应RGB图像中的80%以上组成数据集R0,并对R0中每幅RGB图像的目标进行标记后,对经过标记的每幅RGB图像进行预处理,再将所有经过预处理的RGB图像组成训练样本集R1,同时将除R0以外的其他RGB图像组成测试样本集E1
对经过标记的每幅RGB图像进行预处理,实现步骤为:对经过标记的每幅RGB图像围绕其竖直方向的中心轴进行水平翻转,并对经过水平翻转的RGB图像的亮度、对比度和饱和度随机进行调整,实现对每幅RGB图像的预处理。
步骤2)构建轻量分割卷积网络,其结构如图2所示:
轻量分割卷积网络包括顺次连接的第一卷积层、特征切片层、堆叠层、第三卷积层的轻量分割卷积网络,特征切片层与堆叠层之间夹杂有并行排布的TFP层和第二卷积层,TFP层和第二卷积层的输出端各连接有一个第一全局平均池化层;TFP层包括两个并行连接的第四卷积层。
轻量分割卷积网络所包含的各卷积层的参数设置为:第一、第二、第三卷积层的卷积核大小均为1,卷积步长均为1,第一和第二卷积层卷积核的个数为64,第三卷积层卷积核的个数为256;TFP层所包含的两个第四卷积层卷积核的大小分别为3和1,卷积核的个数均为64,卷积步长均为1。
步骤3)构建基于轻量分割卷积网络的图像分类模型H:
构建包括依次层叠的第五卷积层、最大池化层、Q个轻量分割卷积网络、第二全局平均池化层和全连接层的图像分类模型H,Q≥2;在本实施例中,Q=33。
基于轻量分割卷积网络的图像分类模型H所包含的第五卷积层和最大池化层的参数设置为:第五卷积层、最大池化层卷积核的大小分别为7、3,第五卷积层和最大池化层卷积核的个数均为64,卷积步长均为2。
步骤4)对基于轻量分割卷积网络的图像分类模型H进行迭代训练:
步骤4a)初始化迭代次数为s,最大迭代次数为S,S≥200,第s次迭代的图像分类模型为Hs,Hs的权值参数为ωs,并令s=1,Hs=H;在本实施例中,S=300。
步骤4b)将从训练样本集R1中有放回且随机选取的M个训练样本作为基于轻量分割卷积网络的图像分类模型Hs的输入,第五卷积层对每个训练样本进行卷积,最大池化层对每个训练样本卷积得到的高维特征f进行最大池化,Q个轻量分割卷积网络对最大池化得到的高维特征F进行特征提取,第二全局平均池化层对Q个轻量分割卷积网络所提取的高维特征F*进行平均池化,全连接层对平均池化后的高维特征F1 *进行分类,得到预测标签集合y={y1,y2,...,ym,...,yM},其中,M≥2,ym表示第m个训练样本对应的预测标签;在本实施例中,M=64。
Q个轻量分割卷积网络对最大池化得到的高维特征F进行特征提取,实现步骤为:
步骤4b1)初始化Q个轻量分割卷积网络为D={D1,D2,...,Dq,...,DQ},并令q=1;
步骤4b2)第一卷积层对最大池化得到的高维特征F进行卷积,特征切片层按照比例α将第一卷积层卷积后的特征Fq'分割成不重叠的特征F1q和特征F2q,其中,α≥0.1;在本实施例中,α=0.5;
步骤4b3)令F2q=0,TFP层中的一个第四卷积层对F1q进行逐点卷积,另一个第四卷积层对F1q进行组卷积,得到由逐点卷积结果Y1q和组卷积结果Y2q组成的TFP层的输出结果Ytq=Y1q+Y2q,令F1q=0,第二卷积层对F2q进行逐点卷积,得到输出结果Ycq,其中:
Figure BDA0003181980950000051
Figure BDA0003181980950000052
Figure BDA0003181980950000053
其中
Figure BDA0003181980950000054
表示逐点卷积的参数值,N表示Y1q的通道数,a表示F1q的通道数,x1q~xaq表示F1q中的各个特征;
Figure BDA0003181980950000055
表示组卷积的参数值,G表示组卷积的分组数量,z1q~zGq表示将F1q分组后各组的特征;
Figure BDA0003181980950000056
表示逐点卷积的参数值,xa+1,q~xC,q表示F2q中的各个特征;
步骤4b4)与TFP层连接的第一全局平均池化层对Ytq进行全局平均池化,得到Ytq的特征向量βtq,并通过βtq和Ytq计算增强后的特征
Figure BDA0003181980950000057
同时与第二卷积层连接的第一全局平均池化层对Ycq进行全局平均池化,得到Ycq的特征向量βcq,并通过βcq和Ycq计算增强后的特征
Figure BDA0003181980950000058
其中:
Figure BDA0003181980950000061
Figure BDA0003181980950000062
步骤4b5)堆叠层将
Figure BDA0003181980950000063
Figure BDA0003181980950000064
堆叠成增强特征Yq,第三卷积层对Yq进行卷积,得到Dq的输出特征
Figure BDA0003181980950000065
步骤4b6)判断q=Q是否成立,若是,得到高维特征F对应的高维特征F*
Figure BDA0003181980950000066
否则,令q=q+1,
Figure BDA0003181980950000067
并执行步骤(4b2)。
步骤4c)采用交叉熵损失函数,并通过每个预测标签ym和其对应的真实标签
Figure BDA0003181980950000068
计算Hs的损失值Ls,然后求取Ls对权值参数ωs的偏导
Figure BDA0003181980950000069
再采用梯度下降法,通过将
Figure BDA00031819809500000610
在Hs中进行反向传播的方式对权值参数ωs进行更新;
计算Hs的损失值Ls、对权值参数ωs进行更新,计算、更新分别为:
Figure BDA00031819809500000611
Figure BDA00031819809500000612
其中,ln表示以自然常数e为底的对数,
Figure BDA00031819809500000613
表示ωs的更新结果,η表示Ls的学习率,
Figure BDA00031819809500000614
表示求导操作;
步骤4d)判断s≥S是否成立,若是,得到训练好的图像分类模型H*,否则,令s=s+1,并执行步骤(4b)。
步骤5)获取RGB图像的分类结果:
将测试样本集E1作为训练好的图像分类模型H*的输入进行前向传播,得到所有测试样本的预测标签。
本发明所构建的RGB图像分类网络模型,其中包含的轻量分割卷积网络可以将输入特征分割成两个不重叠的子特征,然后用不同的卷积层分别对两个子特征进行特征提取,有效抑制了深度学习网络对于冗余特征的自适应提取,进一步提升了深度学习网络对RGB图像分类的能力,所以本发明的分类精度要明显优于现有技术。
下面结合仿真实验,对本发明的技术效果作进一步的描述。
1.仿真条件和内容:
仿真实验使用的硬件平台为CPU
Figure BDA0003181980950000071
Xeon(R)E5-2609,主频2.4GHz,8G RAM。软件平台为Python3.7和PyCharm 2019.3.3x64。操作系统为Ubuntu 16.04LTS x64。
仿真实验中用到的RGB图像数据集为ImageNet数据集。该数据集中的RGB图像采集自互联网,图像大小不一。ImageNet数据集包含21841个类别的14197122幅RGB图像,仿真实验中选取其中的1000个类别的500000幅RGB图像组成一个子数据集,且在子数据集中选取每个目标类别对应RGB图像中的80%以上组成数据集R0,将进行预处理后的R0组成训练样本集R1,同时将除R0以外的其他RGB图像组成测试样本集E1
对本发明与现有的基于全局嵌入式注意力残差网络的RGB图像分类方法的分类精度进行对比仿真,其结果如表1所示。
2.仿真结果分析:
参照表1,本发明在测试样本集E1上的分类精度为79.65%,现有技术在测试样本集E1上的分类精度为76.8%。本发明相对于现有技术,分类精度提高了2.85%。
表1
评价指标 本发明 GEARN
分类准确率(%) 79.65 76.8
综合上述仿真实验中的结果分析,本发明提出的方法能有效地解决传统深度卷积神经网络中无法充分抑制深度学习网络对于冗余特征的自适应提取的问题,进一步解决深度卷积神经网络对RGB图像分类精度低的问题。

Claims (6)

1.一种基于轻量分割卷积网络的RGB图像分类方法,其特征在于,包括如下步骤:
(1)获取训练样本集R1和测试样本集E1
(1a)获取包含T个目标类别的K幅RGB图像,每个目标类别对应I幅RGB图像,其中,T≥2,K≥20,I≥10;
(1b)随机选取每个目标类别对应RGB图像中的半数以上组成数据集R0,并对R0中每幅RGB图像的目标进行标记后,对经过标记的每幅RGB图像进行预处理,再将所有经过预处理的RGB图像组成训练样本集R1,同时将除R0以外的其他RGB图像组成测试样本集E1
(2)构建轻量分割卷积网络:
构建包括顺次连接的第一卷积层、特征切片层、堆叠层、第三卷积层的轻量分割卷积网络,特征切片层与堆叠层之间加载有并行排布的TFP层和第二卷积层,TFP层和第二卷积层的输出端各连接有一个第一全局平均池化层;TFP层包括两个并行连接的第四卷积层;
(3)构建基于轻量分割卷积网络的图像分类模型H:
构建包括依次层叠的第五卷积层、最大池化层、Q个轻量分割卷积网络、第二全局平均池化层和全连接层的图像分类模型H,Q≥2;
(4)对基于轻量分割卷积网络的图像分类模型H进行迭代训练:
(4a)初始化迭代次数为s,最大迭代次数为S,S≥200,第s次迭代的图像分类模型为Hs,Hs的权值参数为ωs,并令s=1,Hs=H;
(4b)将从训练样本集R1中有放回且随机选取的M个训练样本作为基于轻量分割卷积网络的图像分类模型Hs的输入,第五卷积层对每个训练样本进行卷积,最大池化层对每个训练样本卷积得到的高维特征f进行最大池化,Q个轻量分割卷积网络对最大池化得到的高维特征F进行特征提取,第二全局平均池化层对Q个轻量分割卷积网络所提取的高维特征F*进行平均池化,全连接层对平均池化后的高维特征F1 *进行分类,得到预测标签集合y={y1,y2,...,ym,...,yM},其中,M≥2,ym表示第m个训练样本对应的预测标签;
(4c)采用交叉熵损失函数,并通过每个预测标签ym和其对应的真实标签
Figure FDA0003181980940000021
计算Hs的损失值Ls,然后求取Ls对权值参数ωs的偏导
Figure FDA0003181980940000022
再采用梯度下降法,通过将
Figure FDA0003181980940000023
在Hs中进行反向传播的方式对权值参数ωs进行更新;
(4d)判断s≥S是否成立,若是,得到训练好的图像分类模型H*,否则,令s=s+1,并执行步骤(4b);
(5)获取RGB图像的分类结果:
将测试样本集E1作为训练好的图像分类模型H*的输入进行前向传播,得到所有测试样本的预测标签。
2.根据权利要求1所述的基于轻量分割卷积网络的RGB图像分类方法,其中特征在于,步骤(1b)中所述的对经过标记的每幅RGB图像进行预处理,实现步骤为:
对经过标记的每幅RGB图像围绕其竖直方向的中心轴进行水平翻转,并对经过水平翻转的RGB图像的亮度、对比度和饱和度随机进行调整,实现对每幅RGB图像的预处理。
3.根据权利要求1所述的基于轻量分割卷积网络的RGB图像分类方法,其特征在于,步骤(2)中所述的轻量分割卷积网络,其所包含的各卷积层的参数设置为:
第一、第二、第三卷积层的卷积核大小均为1,卷积步长均为1,第一和第二卷积层卷积核的个数为64,第三卷积层卷积核的个数为256;
TFP层所包含的两个第四卷积层卷积核的大小分别为3和1,卷积核的个数均为64,卷积步长均为1。
4.根据权利要求1所述的基于轻量分割卷积网络的RGB图像分类方法,其中特征在于,步骤(3)中所述的基于轻量分割卷积网络的图像分类模型H,其所包含的第五卷积层和最大池化层的参数设置为:
第五卷积层、最大池化层卷积核的大小分别为7、3,第五卷积层和最大池化层卷积核的个数均为64,卷积步长均为2。
5.根据权利要求1所述的基于轻量分割卷积网络的RGB图像分类方法,其特征在于,步骤(4b)中所述的Q个轻量分割卷积网络对最大池化得到的高维特征F进行特征提取,实现步骤为:
(4b1)初始化Q个轻量分割卷积网络为D={D1,D2,...,Dq,...,DQ},并令q=1;
(4b2)第一卷积层对最大池化得到的高维特征F进行卷积,特征切片层按照比例α将第一卷积层卷积后的特征Fq'分割成不重叠的特征F1q和特征F2q,其中,α≥0.1;
(4b3)令F2q=0,TFP层中的一个第四卷积层对F1q进行逐点卷积,另一个第四卷积层对F1q进行组卷积,得到由逐点卷积结果Y1q和组卷积结果Y2q组成的TFP层的输出结果Ytq=Y1q+Y2q,令F1q=0,第二卷积层对F2q进行逐点卷积,得到输出结果Ycq,其中:
Figure FDA0003181980940000031
Figure FDA0003181980940000032
Figure FDA0003181980940000041
其中
Figure FDA0003181980940000042
表示逐点卷积的参数值,N表示Y1q的通道数,a表示F1q的通道数,x1q~xaq表示F1q中的各个特征;
Figure FDA0003181980940000043
表示组卷积的参数值,G表示组卷积的分组数量,z1q~zGq表示将F1q分组后各组的特征;
Figure FDA0003181980940000044
表示逐点卷积的参数值,xa+1,q~xC,q表示F2q中的各个特征;
(4b4)与TFP层连接的第一全局平均池化层对Ytq进行全局平均池化,得到Ytq的特征向量βtq,并通过βtq和Ytq计算增强后的特征
Figure FDA0003181980940000045
同时与第二卷积层连接的第一全局平均池化层对Ycq进行全局平均池化,得到Ycq的特征向量βcq,并通过βcq和Ycq计算增强后的特征
Figure FDA0003181980940000046
其中:
Figure FDA0003181980940000047
Figure FDA0003181980940000048
(4b5)堆叠层将
Figure FDA0003181980940000049
Figure FDA00031819809400000410
堆叠成增强特征Yq,第三卷积层对Yq进行卷积,得到Dq的输出特征
Figure FDA00031819809400000411
(4b6)判断q=Q是否成立,若是,得到高维特征F对应的高维特征F*
Figure FDA00031819809400000412
否则,令q=q+1,
Figure FDA00031819809400000413
并执行步骤(4b2)。
6.根据权利要求1所述的基于轻量分割卷积网络的RGB图像分类方法,其特征在于,步骤(4c)中所述的计算Hs的损失值Ls、对权值参数ωs进行更新,计算、更新分别为:
Figure FDA00031819809400000414
Figure FDA00031819809400000415
其中,ln表示以自然常数e为底的对数,
Figure FDA0003181980940000051
表示ωs的更新结果,η表示Ls的学习率,
Figure FDA0003181980940000052
表示求导操作。
CN202110849717.3A 2021-07-27 2021-07-27 基于轻量分割卷积网络的rgb图像分类方法 Active CN113436200B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110849717.3A CN113436200B (zh) 2021-07-27 2021-07-27 基于轻量分割卷积网络的rgb图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110849717.3A CN113436200B (zh) 2021-07-27 2021-07-27 基于轻量分割卷积网络的rgb图像分类方法

Publications (2)

Publication Number Publication Date
CN113436200A true CN113436200A (zh) 2021-09-24
CN113436200B CN113436200B (zh) 2023-05-30

Family

ID=77761976

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110849717.3A Active CN113436200B (zh) 2021-07-27 2021-07-27 基于轻量分割卷积网络的rgb图像分类方法

Country Status (1)

Country Link
CN (1) CN113436200B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170243085A1 (en) * 2016-02-18 2017-08-24 Google Inc. Image classification neural networks
US20190065817A1 (en) * 2017-08-29 2019-02-28 Konica Minolta Laboratory U.S.A., Inc. Method and system for detection and classification of cells using convolutional neural networks
CN110163275A (zh) * 2019-05-16 2019-08-23 西安电子科技大学 基于深度卷积神经网络的sar图像目标分类方法
CN111079649A (zh) * 2019-12-17 2020-04-28 西安电子科技大学 基于轻量化语义分割网络的遥感图像地物分类方法
CN111145181A (zh) * 2019-12-25 2020-05-12 华侨大学 一种基于多视角分离卷积神经网络的骨骼ct图像三维分割方法
US20210133508A1 (en) * 2019-10-30 2021-05-06 Google Llc Efficient Convolutional Neural Networks and Techniques to Reduce Associated Computational Costs

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170243085A1 (en) * 2016-02-18 2017-08-24 Google Inc. Image classification neural networks
US20190065817A1 (en) * 2017-08-29 2019-02-28 Konica Minolta Laboratory U.S.A., Inc. Method and system for detection and classification of cells using convolutional neural networks
CN110163275A (zh) * 2019-05-16 2019-08-23 西安电子科技大学 基于深度卷积神经网络的sar图像目标分类方法
US20210133508A1 (en) * 2019-10-30 2021-05-06 Google Llc Efficient Convolutional Neural Networks and Techniques to Reduce Associated Computational Costs
CN111079649A (zh) * 2019-12-17 2020-04-28 西安电子科技大学 基于轻量化语义分割网络的遥感图像地物分类方法
CN111145181A (zh) * 2019-12-25 2020-05-12 华侨大学 一种基于多视角分离卷积神经网络的骨骼ct图像三维分割方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIN ZHOU等: ""FAFEnet: A fast and accurate model for automatic license plate detection and recognition"", 《IET IMAGE PROCESSING》 *
谢宝剑: ""基于卷积神经网络的图像分类方法研究"", 《中国优秀硕士学位论文全文数据库·信息科技辑》 *

Also Published As

Publication number Publication date
CN113436200B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN110334765B (zh) 基于注意力机制多尺度深度学习的遥感影像分类方法
CN108615010B (zh) 基于平行卷积神经网络特征图融合的人脸表情识别方法
CN107609638B (zh) 一种基于线性编码器和插值采样优化卷积神经网络的方法
CN113486981B (zh) 基于多尺度特征注意力融合网络的rgb图像分类方法
CN109840560B (zh) 基于胶囊网络中融入聚类的图像分类方法
CN110321830B (zh) 一种基于神经网络的中文字符串图片ocr识别方法
CN109086799A (zh) 一种基于改进卷积神经网络模型AlexNet的作物叶片病害识别方法
CN109740679B (zh) 一种基于卷积神经网络和朴素贝叶斯的目标识别方法
CN110197205A (zh) 一种多特征来源残差网络的图像识别方法
CN107944483B (zh) 基于双通道dcgan和特征融合的多光谱图像分类方法
CN108491864B (zh) 基于自动确定卷积核大小卷积神经网络的高光谱图像分类
CN112308825B (zh) 一种基于SqueezeNet的农作物叶片病害识别方法
CN111652273B (zh) 一种基于深度学习的rgb-d图像分类方法
CN112101364B (zh) 基于参数重要性增量学习的语义分割方法
CN115049952B (zh) 一种基于多尺度级联感知深度学习网络的幼鱼肢体识别方法
CN112819748A (zh) 一种带钢表面缺陷识别模型的训练方法及装置
CN114972759A (zh) 基于分级轮廓代价函数的遥感图像语义分割方法
CN113283524A (zh) 一种基于对抗攻击的深度神经网络近似模型分析方法
CN112364974A (zh) 一种基于激活函数改进的YOLOv3算法
CN111310820A (zh) 基于交叉验证深度cnn特征集成的地基气象云图分类方法
CN111222545A (zh) 基于线性规划增量学习的图像分类方法
CN114170657A (zh) 融合注意力机制与高阶特征表示的面部情感识别方法
CN112132137A (zh) 一种基于FCN-SPP-Focal Net的抽象画图像正确方向的识别方法
CN115937693A (zh) 一种基于遥感图像的道路识别方法及系统
CN113436200B (zh) 基于轻量分割卷积网络的rgb图像分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant