CN113159159A - 一种基于改进cnn的小样本图像分类方法 - Google Patents

一种基于改进cnn的小样本图像分类方法 Download PDF

Info

Publication number
CN113159159A
CN113159159A CN202110410717.3A CN202110410717A CN113159159A CN 113159159 A CN113159159 A CN 113159159A CN 202110410717 A CN202110410717 A CN 202110410717A CN 113159159 A CN113159159 A CN 113159159A
Authority
CN
China
Prior art keywords
image
sample image
cnn
neural network
processed sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110410717.3A
Other languages
English (en)
Other versions
CN113159159B (zh
Inventor
王海旭
栗伟
王乙晴
王珊珊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN202110410717.3A priority Critical patent/CN113159159B/zh
Publication of CN113159159A publication Critical patent/CN113159159A/zh
Application granted granted Critical
Publication of CN113159159B publication Critical patent/CN113159159B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于改进CNN的小样本图像分类方法,涉及图像分类技术领域。本发明通过对浅层卷积神经网络进行分析,构建了一个针对小样本图像分类任务的模型。在数据预处理过程中,较大程度保留图像原始信息的情况下,又增加了图像的变化,有效地减轻了网络的过拟合,分类模型的效果得到了显著的提升,十分适用于小样本数据分类。与原始分类模型相比,本发明的分类效果有了明显的提升。

Description

一种基于改进CNN的小样本图像分类方法
技术领域
本发明涉及图像分类技术领域,尤其涉及一种基于改进CNN的小样本图像分类方法。
背景技术
图像分类是根据目标在图像信息中反映出的不同特征,把不同类别的目标区分开的一种图像处理方法。数字化图像可以通过计算机算法,自动分析出各个区域的特征,将其分成若干类别。
传统的图像分类算法有多种类别。基于颜色的图像分类,将差别小的相邻像素归为一类。由于每一类物体都有其独特的颜色特征,利用颜色对比度差异,可以将一幅图像分成几个类别。基于纹理的图像分类,通过像素的邻域灰度空间分布规律来进行分类,灰度共生矩阵是对图像做纹理特征提取的一种常用统计分析方法。传统的图像分类方法,通常提取图像的底层特征进行分类,例如颜色,纹理,形状,位置等。然而,底层的信息有多种提取方法,易受人的主观程度影响。并且,图像分类很大程度上是由高级的语义特征来决定的,仅凭底层的图像信息,无法有效的对图像建模。
卷积神经网络(Convolutional Neural Networks,CNN)是一种包含卷积操作的前馈神经网络,能较好地提取图像的特征,基于深度卷积神经网络的图像分类方法,通过大量的数据来建模物体的分布,无需手动设计特征,就能够自动地学习图像的特征来进行分类。卷积层相当于传统的滤波器,非常适合于图像数据。近年来深度学习取得了巨大的成功,在Imagenet等大型图像数据集上,不断地刷新记录,首次突破了人工分类的结果。深度学习方法是一种数据驱动的方法,往往需要大量的数据集来进行特征学习。然而,在一些领域收集这样巨大的数据量往往十分困难。医学影像中,由于不同的影像设备和隐私保护的需要,难以收集大量的同种影像数据。故障诊断中,自然发生的情况少,难以通过实验获取大量的数据。这些情况限制了深度神经网络的应用。
针对小样本数据集,深度学习分类效果差的问题,通常使用迁移学习和数据增强方法来解决。研究发现,深度网络的浅层特征属于图像共有的底层特征,不随任务的改变而发生巨大的变化。迁移学习方法,首先在大型数据集上进行分类任务的预训练,然后保留卷积层的参数,在小样本数据集上进行微调。然而,医学影像和自然图像的差别十分巨大,医学影像通常为灰度图,自然图像为三通道彩色图。对小样本医学影像数据集进行迁移时,自然图像学习到的特征很难迁移到医学影像。同时网络的参数量也远大于小样本数据集的数量,使得卷积神经网络参数冗余,浪费大量的硬件空间,容易造成过拟合。此外进行迁移学习时,很难找到适合的网络结构、微调的参数和固定卷积的层数,有很多的不确定性,需要依次实验,耗费大量的时间。
数据增强方法,广泛应用于深度学习中。通过对原始图像做一些变换,如剪切,旋转,平移,翻转等,使得网络能够针这些微小的变化,做出稳定的预测。由于卷积神经网络需要输入相同大小的数据,数据增强中需要对数据做出归一化操作。现有的图像大小归一化方法主要有尺度改变(resize)和剪裁(crop),这些方法简单且便于实现,但有时无法对原始图像做出多样化的改变。
发明内容
针对现有技术的不足,本发明提供一种基于改进CNN的小样本图像分类方法。
本发明的技术方案为,一种基于改进CNN的小样本图像分类方法,包括以下步骤:
步骤1:对样本图像进行预处理,将样本图像转换成统一的PNG格式;
步骤2:分析处理后的样本图像的像素值分布,计算数据的均值和标准差;
设x表示样本图像,xi表示样本图像的每个像素点值,像素点总数为n,计算像素的均值
Figure BDA0003021265700000023
以及像素的标准差S公式如下:
Figure BDA0003021265700000021
Figure BDA0003021265700000022
步骤3:使用基于RCR(RCR为Resize调整尺寸-Crop剪裁-Resize调整尺寸)的数据增强策略,对处理后的样本图像进行尺寸调整、垂直翻转、水平翻转和旋转,根据均值和标准差进行图像的像素值归一化;
步骤3.1:将处理后的样本图像最短边调整尺寸至256大小,使用双三次插值算法,将另一边调整成保持原始图像纵横比的对应大小;
步骤3.2:在处理后的样本图像中心处进行随机剪裁图像;
步骤3.3:将处理后的样本图像Resize调整尺寸至224*224大小;
步骤3.4:以50%的概率对处理后的样本图像进行垂直翻转;
步骤3.5:以50%的概率对处理后的样本图像进行水平翻转;
步骤3.6:将处理后的样本图像进行随机旋转0-30°;
步骤3.7:使用均值和标准差对处理后的样本图像进行像素值归一化,归一化的计算如下:
输出[通道]=(输入[通道]–均值[通道])/标准差[通道]
输入处理后的样本图像,减去求得的图像均值,再除以标准差;
步骤4:将步骤3中输出的样本图像输入至卷积神经网络,训练CNN-1CL卷积神经网络,直到网络趋于收敛;
所述CNN-1CL卷积神经网络共有三层,第一层由3个1*1的卷积层和Relu激活函数组成,后接四个由7*7的卷积层、Relu激活函数、批归一化(BN)和最大池化层(Max-Pool)组成的模块,其中四个7*7的卷积层步长为1,通道数分别是32,64,128,256,每一个卷积层后都添加一个Relu激活函数,批归一化的参数默认是eps=0.00001,momentum=0.1,最大池化层的卷积核的大小是2*2,CNN-1CL卷积神经网络的最后两层分别为全局平均池化层和全连接层,其中全连接层的输入通道数为256,输出通道数为2,CNN-1CL卷积神经网络的所有权重都是从kaiming(凯明)均匀分布中采样来进行随机初始化;
其中所述Relu为非线性激活函数,函数的输入为x,输出为y,使得输入负值变为0,其余值保持不变,来增加网络的非线性的表达:
y=max(0,x)
CNN-1CL卷积神经网络的输出为二维向量zj,j=1,2分别表示图像属于正例和负例的权重大小,数值越大代表可能性越高,所述softmax函数,将网络输出的二维向量zj,压缩到(0,1)之间,并且向量z的两个分量和为1,softmax输出P(y=j|x)表示图像x属于正例和负例的概率;
Figure BDA0003021265700000031
步骤5:使用CNN-1CL卷积神经网络对测试集进行训练与测试,输出预测结果,实现小样本数据集的准确自动分类;所述测试集包括正例和负例的待测图片;
CNN-1CL卷积神经网络的输入大小为3*224*224,batch size为32,使用交叉熵作为损失函数H,如下式所示:
H(x,q)=-∑xp(x)logq(x)
其中x为输入数据,p为图像的真实标签分布,q为模型预测的标签分布;优化器为Adam,学习率为0.001,betas=(0.9,0.999)。模型训练使用动态学习率调整策略,学习率每100轮下降一半,共训练1000轮。
测试集图片通过resize和crop调整到3*224*224。将网络输出概率最大的值的类别作为预测标签,使用真实标签进行评价指标的计算。
采用上述技术方法所产生的有益效果在于:
本发明提供一种基于改进CNN的小样本图像分类方法,通过对浅层卷积神经网络进行分析,构建了一个针对小样本图像分类任务的模型。在数据预处理过程中,提出了一种新型的基于Resize-Crop-Resize(简称为RCR)的数据增强方法,在较大程度保留图像原始信息的情况下,又增加了图像的变化,有效地减轻了网络的过拟合。此外,本发明提出了一种改进卷积神经网络(CNN-1CL,1CL表示1*1卷积层)的分类模型,通过首端设计的3个1*1的卷积,和一个Relu激活函数,增加了原图像的非线性变化。本发明创新性的在模型的首端使用1*1卷积,对原始图片的各个通道进行线性加权,并增加一个Relu函数,来增加图像的非线性表示。使得网络可以端到端的对图像进行自适应的再一次增强,相当于加强了适用于网络分类任务的图像各项特征,通过在网络第一层使用1*1卷积,在不明显增加网络参数量的前提下,分类模型的效果得到了显著的提升,十分适用于小样本数据分类。与原始分类模型相比,本发明的分类效果有了明显的提升。
附图说明
图1为本发明分类方法流程图;
图2为本发明RCR数据增强方法
图3为本发明图像预处理整体流程图
图4为本发明CNN-1CL整体网络结构图
图5为本发明实施例中1*1卷积层示意图
图6为本发明1*1卷积层效果示意图;
图7为本发明7*7卷积层示意图
图8为本发明Relu激活函数示意图
图9为本发明最大池化示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
本发明的技术方案为,一种基于改进CNN的小样本图像分类方法,如图1所示,包括以下步骤:
步骤1:对样本图像进行预处理,将样本图像转换成统一的PNG格式;
步骤2:分析处理后的样本图像的像素值分布,计算数据的均值和标准差;
设x表示样本图像,xi表示样本图像的每个像素点值,像素点总数为n,计算像素的均值
Figure BDA0003021265700000041
以及像素的标准差S公式如下:
Figure BDA0003021265700000051
Figure BDA0003021265700000052
步骤3:使用基于RCR(RCR为Resize调整尺寸-Crop剪裁-Resize调整尺寸)的数据增强策略,对处理后的样本图像进行尺寸调整、垂直翻转、水平翻转和旋转,根据均值和标准差进行图像的像素值归一化;
先将图像短边Resize成256,然后使用随机Crop,对图像中心处进行随机剪裁,最后再对图像进行第二次Resize操作,图像尺寸变为224*224。如图2所示,RCR在保留大量图像信息的前提下,增加了图像的变化,有效的缓解了小样本的过拟合问题,取得了不错的增强效果。它独立于其他数据增强方法,可以与其他方法进行随意的组合,简单有效,容易实现。
本发明中的图像预处理整体流程如图3所示。收集的数据格式统一成相同PNG格式,计算出像素的均值和标准差。
步骤3.1:将处理后的样本图像最短边调整尺寸至256大小,使用双三次插值算法,将另一边调整成保持原始图像纵横比的对应大小;
步骤3.2:在处理后的样本图像中心处进行随机剪裁图像;
步骤3.3:将处理后的样本图像Resize调整尺寸至224*224大小;
步骤3.4:以50%的概率对处理后的样本图像进行垂直翻转;
步骤3.5:以50%的概率对处理后的样本图像进行水平翻转;
步骤3.6:将处理后的样本图像进行随机旋转0-30°;
步骤3.7:使用均值和标准差对处理后的样本图像进行像素值归一化,归一化的计算如下:
输出[通道]=(输入[通道]–均值[通道])/标准差[通道]
输入处理后的样本图像,减去求得的图像均值,再除以标准差;像素值归一化可以使网络训练更稳定,鲁棒性更强。基于RCR的数据增强方法,在保留了大量图像信息的前提下,增加了图像的多样性。
步骤4:将步骤3中输出的样本图像输入至卷积神经网络,训练CNN-1CL卷积神经网络,直到网络趋于收敛;
CNN-1CL整体网络结构图如图4所示,输入图片大小为3*224*224,所述CNN-1CL卷积神经网络共有三层,第一层由3个1*1的卷积层和Relu激活函数组成,后接四个由7*7的卷积层、Relu激活函数、批归一化(BN)和最大池化层(Max-Pool)组成的模块,其中四个7*7的卷积层步长为1,通道数分别是32,64,128,256,每一个卷积层后都添加一个Relu激活函数,批归一化的参数默认是eps=1e-05,momentum=0.1,最大池化层的卷积核的大小是2*2,CNN-1CL卷积神经网络的最后两层分别为全局平均池化层和全连接层,全连接层的输入通道数为256,输出通道数为2,CNN-1CL卷积神经网络的输出为二维向量zj,j=1,2分别表图像属于正例和负例的权重大小,数值越大代表可能性越高,所占的大小经过softmax函数,将网络输出的二维向量zj,压缩到(0,1)之间,并且向量z的两个分量和为1。softmax输出P(y=j|x)表示图像属于正例和负例的概率;CNN-1CL卷积神经网络的所有权重都是从kaiming(凯明)均匀分布中采样来进行随机初始化;
其中所述Relu为非线性激活函数,函数的输入为x,输出为y,使得输入负值变为0,其余值保持不变,来增加网络的非线性的表达,如图8所示。
y=max(0,x)
CNN-1CL卷积神经网络的输出为二维向量zj,j=1,2分别表示图像属于正例和负例的权重大小,数值越大代表可能性越高。softmax函数,将网络输出的二维向量zj,压缩到(0,1)之间,并且向量z的两个分量和为1。softmax输出P(y=j|x)表示图像x属于正例和负例的概率。
Figure BDA0003021265700000061
1*1的卷积层如图5所示,应用于卷积神经网络中,在所用参数量较少的情况下,对图像中间特征进行升维,降维。本发明创新性的在模型的首端使用1*1卷积,对原始图片的各个通道进行线性加权,并增加一个Relu函数,来增加图像的非线性表示。使得网络可以端到端的对图像进行自适应的再一次增强,相当于加强了适用于网络分类任务的图像各项特征。1*1卷积的效果如图6所示,通过在网络第一层使用1*1卷积,在不明显增加网络参数量的前提下,分类模型的效果得到了显著的提升,十分适用于小样本数据分类。
为了解决小样本分类任务,本发明使用了浅层的卷积神经网络架构,避免深层网络参数量过大,容易过拟合。模型组件的介绍如下。卷积核大小为7*7的卷积,如图7所示,用于提取图像特征。Relu激活函数如图8所示,可以过滤响应为负数的参数,增加模型的非线性。批标准化通过统计每一个batch的均值和方差进行归一化,来加快网络的训练和收敛的速度,控制梯度爆炸,防止梯度消失,减少过拟合,十分适用于小样本分类任务。卷积核为2*2的最大池化层,如图9所示,丢弃网络中的较小参数,减轻网络的过拟合效应。在小样本数据分类任务中,相比于其他模型,CNN-1CL模型的参数量小,分类效果更好。
步骤5:使用CNN-1CL卷积神经网络对测试集进行训练与测试,输出预测结果,实现小样本数据集的准确自动分类;所述测试集包括正例和负例的待测图片;
CNN-1CL卷积神经网络的输入大小为3*224*224,batch size为32,使用交叉熵作为损失函数H,如下式所示:
H(x,q)=-∑xp(x)logq(x)
其中x为输入数据,p为图像的真实标签分布,q为模型预测的标签分布;优化器为Adam,学习率为0.001,betas=(0.9,0.999)。模型训练使用动态学习率调整策略,学习率每100轮下降一半,共训练1000轮。
测试集图片通过resize和crop调整到3*224*224。将网络输出概率最大的值的类别作为预测标签,使用真实标签进行评价指标的计算。
本发明通过设计基于RCR的数据增强方法,很大程度上保留了原始图像信息,增加了图像的多样性,减少了网络的过拟合。提出的基于卷积神经网络的CNN-1CL分类模型,通过网络第一层的3组1*1卷积和Relu激活函数,提升了图像特征的学习效果,提高了网络的分类效果。本发明使用一组小样本影像数据进行二分类实验,样本数分别为正例592张和负例625张,使用五折交叉验证。评价指标分别为准确率(ACC)、召回率(Recall)、加权调和平均数(F1)、ROC曲线下的面积(AUC),测试结果如下:
表1测试结果
模型 ACC Recall F1 AUC
CNN 0.844 0.842 0.846 0.921
CNN-1CL 0.861 0.900 0.868 0.929
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (3)

1.一种基于改进CNN的小样本图像分类方法,其特征在于,包括以下步骤:
步骤1:对样本图像进行预处理,将样本图像转换成统一的PNG格式;
步骤2:分析处理后的样本图像的像素值分布,计算数据的均值和标准差;
设x表示样本图像,xi表示样本图像的每个像素点值,像素点总数为n,计算像素的均值
Figure FDA0003021265690000013
以及像素的标准差S公式如下:
Figure FDA0003021265690000011
Figure FDA0003021265690000012
步骤3:使用基于RCR(RCR为Resize调整尺寸-Crop剪裁-Resize调整尺寸)的数据增强策略,对处理后的样本图像进行尺寸调整、垂直翻转、水平翻转和旋转,根据均值和标准差进行图像的像素值归一化;
步骤4:将步骤3中输出的样本图像输入至卷积神经网络,训练CNN-1CL卷积神经网络,直到网络趋于收敛;
步骤5:使用CNN-1CL卷积神经网络对测试集进行训练与测试,输出预测结果,实现小样本数据集的准确自动分类;所述测试集包括正例和负例的待测图片;
所述CNN-1CL卷积神经网络的输入大小为3*224*224,batch size为32,使用交叉熵作为损失函数H,如下式所示:
H(x,q)=-Σxp(x)log q(x)
其中x为输入数据,p为图像的真实标签分布,q为模型预测的标签分布;优化器为Adam,学习率为0.001,betas=(0.9,0.999),模型训练使用动态学习率调整策略,学习率每100轮下降一半;
测试集图片通过resize和crop调整到3*224*224;将网络输出概率最大的值的类别作为预测标签,使用真实标签进行评价指标的计算。
2.根据权利要求1所述的一种基于改进CNN的小样本图像分类方法,其特征在于,所述CNN-1CL卷积神经网络共有三层,第一层由3个1*1的卷积层和Relu激活函数组成,后接四个由7*7的卷积层、Relu激活函数、批归一化(BN)和最大池化层(Max-Pool)组成的模块,其中四个7*7的卷积层步长为1,通道数分别是32,64,128,256,每一个卷积层后都添加一个Relu激活函数,批归一化的参数默认是eps=0.00001,momentum=0.1,最大池化层的卷积核的大小是2*2,CNN-1CL卷积神经网络的最后两层分别为全局平均池化层和全连接层,其中全连接层的输入通道数为256,输出通道数为2,CNN-1CL卷积神经网络的所有权重都是从kaiming(凯明)均匀分布中采样来进行随机初始化;
其中所述Relu为非线性激活函数,函数的输入为x,输出为y,使得输入负值变为0,其余值保持不变,来增加网络的非线性的表达:
y=max(0,x)
CNN-1CL卷积神经网络的输出为二维向量zj,j=1,2分别表示图像属于正例和负例的权重大小,数值越大代表可能性越高,所述softmax函数,将网络输出的二维向量zj,压缩到(0,1)之间,并且向量z的两个分量和为1,softmax输出P(y=j|x)表示图像x属于正例和负例的概率;
Figure FDA0003021265690000021
3.根据权利要求1所述的一种基于改进CNN的小样本图像分类方法,其特征在于,所述步骤3具体包括以下步骤:
步骤3.1:将处理后的样本图像最短边调整尺寸至256大小,使用双三次插值算法,将另一边调整成保持原始图像纵横比的对应大小;
步骤3.2:在处理后的样本图像中心处进行随机剪裁图像;
步骤3.3:将处理后的样本图像Resize调整尺寸至224*224大小;
步骤3.4:以50%的概率对处理后的样本图像进行垂直翻转;
步骤3.5:以50%的概率对处理后的样本图像进行水平翻转;
步骤3.6:将处理后的样本图像进行随机旋转0-30°;
步骤3.7:使用均值和标准差对处理后的样本图像进行像素值归一化,归一化的计算如下:
输出[通道]=(输入[通道]–均值[通道])/标准差[通道]
输入处理后的样本图像,减去求得的图像均值,再除以标准差。
CN202110410717.3A 2021-04-15 2021-04-15 一种基于改进cnn的小样本图像分类方法 Active CN113159159B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110410717.3A CN113159159B (zh) 2021-04-15 2021-04-15 一种基于改进cnn的小样本图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110410717.3A CN113159159B (zh) 2021-04-15 2021-04-15 一种基于改进cnn的小样本图像分类方法

Publications (2)

Publication Number Publication Date
CN113159159A true CN113159159A (zh) 2021-07-23
CN113159159B CN113159159B (zh) 2023-09-29

Family

ID=76868597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110410717.3A Active CN113159159B (zh) 2021-04-15 2021-04-15 一种基于改进cnn的小样本图像分类方法

Country Status (1)

Country Link
CN (1) CN113159159B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113902749A (zh) * 2021-09-30 2022-01-07 上海商汤临港智能科技有限公司 一种图像处理方法、装置、计算机设备和存储介质
CN115017945A (zh) * 2022-05-24 2022-09-06 南京林业大学 基于增强型卷积神经网络的机械故障诊断方法和诊断系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017220032A1 (zh) * 2016-06-24 2017-12-28 平安科技(深圳)有限公司 基于深度学习的车牌分类方法、系统、电子装置及存储介质
CN110188824A (zh) * 2019-05-31 2019-08-30 重庆大学 一种小样本植物病害识别方法及系统
CN110573066A (zh) * 2017-03-02 2019-12-13 光谱Md公司 用于多光谱截肢部位分析的机器学习系统和技术
CN110570377A (zh) * 2019-09-11 2019-12-13 辽宁工程技术大学 一种基于组归一化的快速图像风格迁移方法
CN110853009A (zh) * 2019-11-11 2020-02-28 北京端点医药研究开发有限公司 基于机器学习的视网膜病理图像分析系统
CN111062952A (zh) * 2018-10-16 2020-04-24 腾讯科技(深圳)有限公司 肺部图像分割设备、方法及存储介质
WO2020177651A1 (zh) * 2019-03-01 2020-09-10 华为技术有限公司 图像分割方法和图像处理装置
WO2020181685A1 (zh) * 2019-03-12 2020-09-17 南京邮电大学 一种基于深度学习的车载视频目标检测方法
CN111723654A (zh) * 2020-05-12 2020-09-29 中国电子系统技术有限公司 基于背景建模、YOLOv3与自优化的高空抛物检测方法及装置
WO2020238293A1 (zh) * 2019-05-30 2020-12-03 华为技术有限公司 图像分类方法、神经网络的训练方法及装置
US10885099B1 (en) * 2019-08-07 2021-01-05 Capital One Services, Llc Systems and methods for presenting image classification results

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017220032A1 (zh) * 2016-06-24 2017-12-28 平安科技(深圳)有限公司 基于深度学习的车牌分类方法、系统、电子装置及存储介质
CN110573066A (zh) * 2017-03-02 2019-12-13 光谱Md公司 用于多光谱截肢部位分析的机器学习系统和技术
CN111062952A (zh) * 2018-10-16 2020-04-24 腾讯科技(深圳)有限公司 肺部图像分割设备、方法及存储介质
WO2020177651A1 (zh) * 2019-03-01 2020-09-10 华为技术有限公司 图像分割方法和图像处理装置
WO2020181685A1 (zh) * 2019-03-12 2020-09-17 南京邮电大学 一种基于深度学习的车载视频目标检测方法
WO2020238293A1 (zh) * 2019-05-30 2020-12-03 华为技术有限公司 图像分类方法、神经网络的训练方法及装置
CN110188824A (zh) * 2019-05-31 2019-08-30 重庆大学 一种小样本植物病害识别方法及系统
US10885099B1 (en) * 2019-08-07 2021-01-05 Capital One Services, Llc Systems and methods for presenting image classification results
CN110570377A (zh) * 2019-09-11 2019-12-13 辽宁工程技术大学 一种基于组归一化的快速图像风格迁移方法
CN110853009A (zh) * 2019-11-11 2020-02-28 北京端点医药研究开发有限公司 基于机器学习的视网膜病理图像分析系统
CN111723654A (zh) * 2020-05-12 2020-09-29 中国电子系统技术有限公司 基于背景建模、YOLOv3与自优化的高空抛物检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩晓臻: "一种基于ResNet与迁移学习的小样本图像识别方法", 《浙江万里学院学报》, vol. 33, no. 6 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113902749A (zh) * 2021-09-30 2022-01-07 上海商汤临港智能科技有限公司 一种图像处理方法、装置、计算机设备和存储介质
CN115017945A (zh) * 2022-05-24 2022-09-06 南京林业大学 基于增强型卷积神经网络的机械故障诊断方法和诊断系统

Also Published As

Publication number Publication date
CN113159159B (zh) 2023-09-29

Similar Documents

Publication Publication Date Title
CN111369563B (zh) 一种基于金字塔空洞卷积网络的语义分割方法
CN107316307B (zh) 一种基于深度卷积神经网络的中医舌图像自动分割方法
WO2021139258A1 (zh) 基于图像识别的细胞识别计数方法、装置和计算机设备
CN106778687B (zh) 基于局部评估和全局优化的注视点检测方法
CN112949704B (zh) 一种基于图像分析的烟叶成熟度状态识别方法及装置
CN111222457B (zh) 一种基于深度可分离卷积的鉴别视频真伪性的检测方法
CN109190511B (zh) 基于局部与结构约束低秩表示的高光谱分类方法
CN113159159B (zh) 一种基于改进cnn的小样本图像分类方法
WO2023179099A1 (zh) 一种图像检测方法、装置、设备及可读存储介质
CN110503140B (zh) 基于深度迁移学习与邻域降噪的分类方法
CN111798440A (zh) 医学图像伪影自动识别方法、系统及存储介质
CN111553438A (zh) 一种基于卷积神经网络的图像识别方法
CN112819063B (zh) 一种基于改进的Focal损失函数的图像识别方法
CN113361623A (zh) 一种轻量级cnn结合迁移学习的医学图像分类方法
CN112819821A (zh) 一种细胞核图像检测方法
CN110110724A (zh) 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法
CN113011243A (zh) 基于胶囊网络的面部表情分析方法
CN111860601B (zh) 预测大型真菌种类的方法及装置
CN113065430A (zh) 基于深度学习特征与人工提取特征融合的白细胞分类方法
CN113409290B (zh) 一种液晶屏外观缺陷检测方法、装置及存储介质
CN114120406B (zh) 基于卷积神经网络的人脸特征提取分类方法
CN115511838A (zh) 一种基于群智能优化的植物病害高精度识别方法
CN111178174B (zh) 基于深度卷积神经网络的尿液有形成分图像识别方法
Monteiro et al. Deep learning recognition of a large number of pollen grain types
Yu Research progress of crop disease image recognition based on wireless network communication and deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant