CN113139576A - 一种结合图像复杂度的深度学习图像分类方法及系统 - Google Patents

一种结合图像复杂度的深度学习图像分类方法及系统 Download PDF

Info

Publication number
CN113139576A
CN113139576A CN202110302261.9A CN202110302261A CN113139576A CN 113139576 A CN113139576 A CN 113139576A CN 202110302261 A CN202110302261 A CN 202110302261A CN 113139576 A CN113139576 A CN 113139576A
Authority
CN
China
Prior art keywords
layer
size
convolution kernels
convolution
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110302261.9A
Other languages
English (en)
Other versions
CN113139576B (zh
Inventor
刘伟鑫
徐晨
周松斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Original Assignee
Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Intelligent Manufacturing of Guangdong Academy of Sciences filed Critical Institute of Intelligent Manufacturing of Guangdong Academy of Sciences
Priority to CN202110302261.9A priority Critical patent/CN113139576B/zh
Publication of CN113139576A publication Critical patent/CN113139576A/zh
Application granted granted Critical
Publication of CN113139576B publication Critical patent/CN113139576B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种结合图像复杂度的深度学习图像分类方法及系统,涉及计算机视觉图像识别领域,该方法包括以下步骤:步骤S1:将所有图像缩放至200*200大小,并分为训练集和测试集;步骤S2:计算所有训练集图像的平均复杂度,根据平均复杂度选择网络结构1、网络结构2和网络结构3中的其中一种网络结构;步骤S3:选择好网络结构后,网络模型对训练集数据进行训练;步骤S4:根据训练好的模型对测试集数据进行分类识别。本发明与目前主流的深度学习算法相比,能通过分析图像的复杂度自动选择合适网络结构,在保证网络性能下,减少企业应用深度学习算法的人力成本、时间成本。

Description

一种结合图像复杂度的深度学习图像分类方法及系统
技术领域
本发明涉及计算机视觉图像识别领域,尤其是涉及一种结合图像复杂度的深度学习图像分类方法及系统。
背景技术
近年来深度学习在学术界、科技界应用广泛,尤其在图像领域,目前已经在图像分类领域取得较大进展,取得不错成效。但目前深度学习在工业领域的推广并不顺利,主要原因是工业领域的应用大多是细分领域、定制化的,但目前主流的深度学习网络如AlexNet、VGG16、GoogleNet都难以直接应用到项目中,企业需要不断测试、改进网络结构参数才可以应用到项目中,十分耗费时间、人力成本。
发明内容
有鉴于此,有必要针对上述的问题,提出一种结合图像复杂度的深度学习图像分类方法及系统,通过分析图像的复杂度自动选择合适网络结构,在保证网络性能下,减少企业应用深度学习算法的人力成本、时间成本。
为实现上述目的,本发明提供以下技术方案:
一方面,本发明提供一种结合图像复杂度的深度学习图像分类方法,包括以下步骤:
步骤S1:将所有图像缩放至200*200大小,并分为训练集和测试集;
步骤S2:计算所有训练集图像的平均复杂度,根据平均复杂度选择网络结构1、网络结构2和网络结构3中的其中一种网络结构;
步骤S3:选择好网络结构后,网络模型对训练集数据进行训练;
步骤S4:根据训练好的模型对测试集数据进行分类识别。
进一步地,在步骤S2中,训练集图像的平均复杂度K计算过程如下:
①采用opencv的meanStdDev函数求每张图像的标准差stddvi,求取所有训练集图像的标准差的平均值stddvavrage
②按照下面公式计算训练集每张图像的二维熵H,再求所有训练集图像的二维熵的平均值Haverage
Figure BDA0002986722930000021
其中H为图像二维熵,(i,j)为图像的邻域灰度均值与图像的像素灰度组成特征二元组,i表示像素的灰度值(0<=i<=255),j表示邻域灰度均值(0<=j<=255),pij为联合概率,其中联合概率按如下公式计算:
pij=f(i,j)/N*M
其中f(i,j)为特征二元组(i,j)出现的频数,N*M为图像的尺度;
③然后按照如下公式求出训练集图像复杂度K:
K=stddvavrage*0.05+0.95*Haverage
如果0≤K<3,选择网络结构1;如果3≤K<6,选择网络结构2;如果6≤K,选择网络结构3。
进一步地,在步骤S2中,网络结构1、网络结构2和网络结构3如下:
①网络结构1:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为6,卷积核大小为11*11;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为6,卷积核大小为11*11;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N;
②网络结构2:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为7*7;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为7*7;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为5*5;第7层为最大值池化层,核大小为2*2;第8、9层为全连接层,分别为120个和84个神经节点;第10层为输出层,输出节点为N;
③网络结构3:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为3*3;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为3*3;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为3*3;第7层为最大值池化层,核大小为2*2;第8层为卷积层,卷积核个数为16,卷积核大小为3*3;第9层为最大值池化层,核大小为2*2;第10、11层为全连接层,分别为120个和84个神经节点;第12层为输出层,输出节点为N。
另一方面,本发明还提供一种结合图像复杂度的深度学习图像分类系统,包括:
图像缩放模块,用于将所有图像缩放至200*200大小,并分为训练集和测试集;
网络结构选择模块,用于计算所有训练集图像的平均复杂度,根据平均复杂度选择网络结构1、网络结构2和网络结构3中的其中一种网络结构;
模型训练模块,用于选择好网络结构后,根据网络模型对训练集数据进行训练;
分类识别模块,用于根据训练好的模型对测试集数据进行分类识别。
进一步地,训练集图像的平均复杂度K计算过程如下:
①采用opencv的meanStdDev函数求每张图像的标准差stddvi,求取所有训练集图像的标准差的平均值stddvavrage
②按照下面公式计算训练集每张图像的二维熵H,再求所有训练集图像的二维熵的平均值Haverage
Figure BDA0002986722930000041
其中H为图像二维熵,(i,j)为图像的邻域灰度均值与图像的像素灰度组成特征二元组,i表示像素的灰度值(0<=i<=255),j表示邻域灰度均值(0<=j<=255),pij为联合概率,其中联合概率按如下公式计算:
pij=f(i,j)/N*M
其中f(i,j)为特征二元组(i,j)出现的频数,N*M为图像的尺度;
③然后按照如下公式求出训练集图像复杂度K:
K=stddvavrage*0.05+0.95*Haverage
如果0≤K<3,选择网络结构1;如果3≤K<6,选择网络结构2;如果6≤K,选择网络结构3。
进一步地,网络结构1、网络结构2和网络结构3如下:
①网络结构1:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为6,卷积核大小为11*11;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为6,卷积核大小为11*11;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N;
②网络结构2:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为7*7;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为7*7;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为5*5;第7层为最大值池化层,核大小为2*2;第8、9层为全连接层,分别为120个和84个神经节点;第10层为输出层,输出节点为N;
③网络结构3:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为3*3;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为3*3;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为3*3;第7层为最大值池化层,核大小为2*2;第8层为卷积层,卷积核个数为16,卷积核大小为3*3;第9层为最大值池化层,核大小为2*2;第10、11层为全连接层,分别为120个和84个神经节点;第12层为输出层,输出节点为N。
与现有技术相比,本发明的优点和积极效果至少包括:
(1)相比目前的深度学习技术,本发明通过分析图像的复杂度自动选择合适网络结构,在保证网络性能下,减少企业应用深度学习算法的人力成本、时间成本;
(2)本发明适用于其他图像分类任务,具有一定的通用性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明结合图像复杂度的深度学习图像分类方法的流程示意图;
图2是本发明结合图像复杂度的深度学习图像分类方法采用的网络结构1的网络结构示意图;
图3是本发明结合图像复杂度的深度学习图像分类方法采用的网络结构2的网络结构示意图;
图4是本发明结合图像复杂度的深度学习图像分类方法采用的网络结构3的网络结构示意图;
图5是本发明结合图像复杂度的深度学习图像分类系统的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
为对本发明内容进行具体说明,本实施例以CIFAR-10数据集作一个10分类的问题作实例。
需要说明的是,本实施例中所使用的具体数字,仅仅是本实施例中所使用的一组可能的或较优的搭配,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
如图1所示,本实施例提供一种结合图像复杂度的深度学习图像分类方法,包括以下步骤:
步骤S1:CIFAR-10数据集一共有10种图片,包括(飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船和卡车),将所有图像缩放至200*200大小,并分为训练集和测试集;
步骤S2:计算所有训练集图像的平均复杂度K,根据图像平均复杂度选择网络结构1、网络结构2、网络结构3中的其中一种网络结构;
训练集图像的平均复杂度K计算过程如下:
①采用opencv的meanStdDev函数求每张图像的标准差stddvi,求取所有训练集图像的标准差的平均值stddvavrage
②按照下面公式计算训练集每张图像的二维熵H,再求所有训练集图像的二维熵的平均值Haverage
Figure BDA0002986722930000071
其中H为图像二维熵,(i,j)为图像的邻域灰度均值与图像的像素灰度组成特征二元组,i表示像素的灰度值(0<=i<=255),j表示邻域灰度均值(0<=j<=255),pij为联合概率,其中联合概率按如下公式计算:
pij=f(i,j)/N*M
其中f(i,j)为特征二元组(i,j)出现的频数,N*M为图像的尺度。
③然后按照如下公式求出训练集图像复杂度K:
K=stddvavrage*0.05+0.95*Haverage
如果0≤K<3,选择网络结构1;如果3≤K<6,选择网络结构2;如果6≤K,选择网络结构3;(网络结构1、网络结构2、网络结构3具体结构如图2、图3、图4所示)。
①网络结构1:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为6,卷积核大小为11*11;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为6,卷积核大小为11*11;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N;
②网络结构2:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为7*7;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为7*7;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为5*5;第7层为最大值池化层,核大小为2*2;第8、9层为全连接层,分别为120个和84个神经节点;第10层为输出层,输出节点为N;
③网络结构3:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为3*3;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为3*3;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为3*3;第7层为最大值池化层,核大小为2*2;第8层为卷积层,卷积核个数为16,卷积核大小为3*3;第9层为最大值池化层,核大小为2*2;第10、11层为全连接层,分别为120个和84个神经节点;第12层为输出层,输出节点为N。
最终求得复杂度为7.81,选择网络结构3。
步骤S3:选择好网络结构后,网络模型对训练集数据进行训练;
步骤S4:根据训练好的模型对测试集数据进行分类识别。
本发明方法基于CIFAR-10数据集与AlexNet、VGG16、GoogleNet三种主流的深度学习算法进行对比测试。
表1四种方法测试结果对比
方法 准确率
本发明方法 98.37%
AlexNet 93.21%
VGG16 96.78%
GoogleNet 97.11%
由上表1可以看出,本发明方法准确率高于目前主流的深度学习网络AlexNet、VGG16。
实施例2
如图5所示,本实施例以CIFAR-10数据集作一个10分类的问题作实例。本实施例提供一种结合图像复杂度的深度学习图像分类系统,包括图像缩放模块、网络结构选择模块、模型训练模块和分类识别模块;
图像缩放模块:CIFAR-10数据集一共有10种图片,包括(飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船和卡车),图像缩放模块将所有图像缩放至200*200大小,并分为训练集和测试集;
网络结构选择模块:计算所有训练集图像的平均复杂度K,根据图像平均复杂度选择网络结构1、网络结构2、网络结构3中的其中一种网络结构;
训练集图像的平均复杂度K计算过程如下:
①采用opencv的meanStdDev函数求每张图像的标准差stddvi,求取所有训练集图像的标准差的平均值stddvavrage
②按照下面公式计算训练集每张图像的二维熵H,再求所有训练集图像的二维熵的平均值Haverage
Figure BDA0002986722930000091
其中H为图像二维熵,(i,j)为图像的邻域灰度均值与图像的像素灰度组成特征二元组,i表示像素的灰度值(0<=i<=255),j表示邻域灰度均值(0<=j<=255),pij为联合概率,其中联合概率按如下公式计算:
pij=f(i,j)/N*M
其中f(i,j)为特征二元组(i,j)出现的频数,N*M为图像的尺度。
③然后按照如下公式求出训练集图像复杂度K:
K=stddvavrage*0.05+0.95*Haverage
如果0≤K<3,选择网络结构1;如果3≤K<6,选择网络结构2;如果6≤K,选择网络结构3;(网络结构1、网络结构2、网络结构3具体结构如图2、图3、图4所示)。
①网络结构1:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为6,卷积核大小为11*11;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为6,卷积核大小为11*11;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N;
②网络结构2:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为7*7;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为7*7;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为5*5;第7层为最大值池化层,核大小为2*2;第8、9层为全连接层,分别为120个和84个神经节点;第10层为输出层,输出节点为N;
③网络结构3:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为3*3;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为3*3;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为3*3;第7层为最大值池化层,核大小为2*2;第8层为卷积层,卷积核个数为16,卷积核大小为3*3;第9层为最大值池化层,核大小为2*2;第10、11层为全连接层,分别为120个和84个神经节点;第12层为输出层,输出节点为N。
最终求得复杂度为7.81,选择网络结构3。
模型训练模块:选择好网络结构后,网络模型对训练集数据进行训练;
分类识别模块:根据训练好的模型对测试集数据进行分类识别。
本发明的优点和积极效果至少包括:
(1)相比目前的深度学习技术,本发明通过分析图像的复杂度自动选择合适网络结构,在保证网络性能下,减少企业应用深度学习算法的人力成本、时间成本;
(2)本发明适用于其他图像分类任务,具有一定的通用性。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (6)

1.一种结合图像复杂度的深度学习图像分类方法,其特征在于,包括以下步骤:
步骤S1:将所有图像缩放至200*200大小,并分为训练集和测试集;
步骤S2:计算所有训练集图像的平均复杂度,根据平均复杂度选择网络结构1、网络结构2和网络结构3中的其中一种网络结构;
步骤S3:选择好网络结构后,网络模型对训练集数据进行训练;
步骤S4:根据训练好的模型对测试集数据进行分类识别。
2.根据权利要求1所述的结合图像复杂度的深度学习图像分类方法,其特征在于,在步骤S2中,训练集图像的平均复杂度K计算过程如下:
①采用opencv的meanStdDev函数求每张图像的标准差stddvi,求取所有训练集图像的标准差的平均值stddvavrage
②按照下面公式计算训练集每张图像的二维熵H,再求所有训练集图像的二维熵的平均值Haverage
Figure FDA0002986722920000011
其中H为图像二维熵,(i,j)为图像的邻域灰度均值与图像的像素灰度组成特征二元组,i表示像素的灰度值(0<=i<=255),j表示邻域灰度均值(0<=j<=255),pij为联合概率,其中联合概率按如下公式计算:
pij=f(i,j)/N*M
其中f(i,j)为特征二元组(i,j)出现的频数,N*M为图像的尺度;
③然后按照如下公式求出训练集图像复杂度K:
K=stddvavrage*0.05+0.95*Haverage
如果0≤K<3,选择网络结构1;如果3≤K<6,选择网络结构2;如果6≤K,选择网络结构3。
3.根据权利要求1所述的结合图像复杂度的深度学习图像分类方法,其特征在于,在步骤S2中,网络结构1、网络结构2和网络结构3如下:
①网络结构1:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为6,卷积核大小为11*11;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为6,卷积核大小为11*11;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N;
②网络结构2:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为7*7;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为7*7;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为5*5;第7层为最大值池化层,核大小为2*2;第8、9层为全连接层,分别为120个和84个神经节点;第10层为输出层,输出节点为N;
③网络结构3:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为3*3;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为3*3;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为3*3;第7层为最大值池化层,核大小为2*2;第8层为卷积层,卷积核个数为16,卷积核大小为3*3;第9层为最大值池化层,核大小为2*2;第10、11层为全连接层,分别为120个和84个神经节点;第12层为输出层,输出节点为N。
4.一种结合图像复杂度的深度学习图像分类系统,其特征在于,包括:
图像缩放模块,用于将所有图像缩放至200*200大小,并分为训练集和测试集;
网络结构选择模块,用于计算所有训练集图像的平均复杂度,根据平均复杂度选择网络结构1、网络结构2和网络结构3中的其中一种网络结构;
模型训练模块,用于选择好网络结构后,根据网络模型对训练集数据进行训练;
分类识别模块,用于根据训练好的模型对测试集数据进行分类识别。
5.根据权利要求4所述的结合图像复杂度的深度学习图像分类系统,其特征在于,训练集图像的平均复杂度K计算过程如下:
①采用opencv的meanStdDev函数求每张图像的标准差stddvi,求取所有训练集图像的标准差的平均值stddvavrage
②按照下面公式计算训练集每张图像的二维熵H,再求所有训练集图像的二维熵的平均值Haverage
Figure FDA0002986722920000031
其中H为图像二维熵,(i,j)为图像的邻域灰度均值与图像的像素灰度组成特征二元组,i表示像素的灰度值(0<=i<=255),j表示邻域灰度均值(0<=j<=255),pij为联合概率,其中联合概率按如下公式计算:
pij=f(i,j)/N*M
其中f(i,j)为特征二元组(i,j)出现的频数,N*M为图像的尺度;
③然后按照如下公式求出训练集图像复杂度K:
K=stddvavrage*0.05+0.95*Haverage
如果0≤K<3,选择网络结构1;如果3≤K<6,选择网络结构2;如果6≤K,选择网络结构3。
6.根据权利要求4所述的结合图像复杂度的深度学习图像分类系统,其特征在于,网络结构1、网络结构2和网络结构3如下:
①网络结构1:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为6,卷积核大小为11*11;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为6,卷积核大小为11*11;第5层为最大值池化层,核大小为2*2;第6、7层为全连接层,分别为120个和84个神经节点;第8层为输出层,输出节点为N;
②网络结构2:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为7*7;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为7*7;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为5*5;第7层为最大值池化层,核大小为2*2;第8、9层为全连接层,分别为120个和84个神经节点;第10层为输出层,输出节点为N;
③网络结构3:第1层为输入层,输入100*100的图片;第2层为卷积层,卷积核个数为16,卷积核大小为3*3;第3层为最大值池化层,核大小为2*2;第4层为卷积层,卷积核个数为16,卷积核大小为3*3;第5层为最大值池化层,核大小为2*2;第6层为卷积层,卷积核个数为16,卷积核大小为3*3;第7层为最大值池化层,核大小为2*2;第8层为卷积层,卷积核个数为16,卷积核大小为3*3;第9层为最大值池化层,核大小为2*2;第10、11层为全连接层,分别为120个和84个神经节点;第12层为输出层,输出节点为N。
CN202110302261.9A 2021-03-22 2021-03-22 一种结合图像复杂度的深度学习图像分类方法及系统 Active CN113139576B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110302261.9A CN113139576B (zh) 2021-03-22 2021-03-22 一种结合图像复杂度的深度学习图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110302261.9A CN113139576B (zh) 2021-03-22 2021-03-22 一种结合图像复杂度的深度学习图像分类方法及系统

Publications (2)

Publication Number Publication Date
CN113139576A true CN113139576A (zh) 2021-07-20
CN113139576B CN113139576B (zh) 2024-03-12

Family

ID=76809978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110302261.9A Active CN113139576B (zh) 2021-03-22 2021-03-22 一种结合图像复杂度的深度学习图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN113139576B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657945A (zh) * 2015-01-29 2015-05-27 南昌航空大学 复杂背景下多尺度时空联合滤波的红外小目标检测方法
CN107194872A (zh) * 2017-05-02 2017-09-22 武汉大学 基于内容感知深度学习网络的遥感图像超分辨率重建方法
CN110213584A (zh) * 2019-07-03 2019-09-06 北京电子工程总体研究所 基于纹理复杂度的编码单元分类方法和编码单元分类设备
CN110415225A (zh) * 2019-07-22 2019-11-05 南充折衍智能光电科技有限公司 一种基于多信息融合的手指静脉图像质量评价方法
CN110569860A (zh) * 2019-08-30 2019-12-13 西安理工大学 结合判别分析和多核学习的图像有趣性二分类预测方法
CN110660065A (zh) * 2019-09-29 2020-01-07 云南电网有限责任公司电力科学研究院 一种红外故障检测识别算法
CN112489497A (zh) * 2020-11-18 2021-03-12 南京航空航天大学 基于深度卷积神经网络的空域运行复杂度评估方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657945A (zh) * 2015-01-29 2015-05-27 南昌航空大学 复杂背景下多尺度时空联合滤波的红外小目标检测方法
CN107194872A (zh) * 2017-05-02 2017-09-22 武汉大学 基于内容感知深度学习网络的遥感图像超分辨率重建方法
CN110213584A (zh) * 2019-07-03 2019-09-06 北京电子工程总体研究所 基于纹理复杂度的编码单元分类方法和编码单元分类设备
CN110415225A (zh) * 2019-07-22 2019-11-05 南充折衍智能光电科技有限公司 一种基于多信息融合的手指静脉图像质量评价方法
CN110569860A (zh) * 2019-08-30 2019-12-13 西安理工大学 结合判别分析和多核学习的图像有趣性二分类预测方法
CN110660065A (zh) * 2019-09-29 2020-01-07 云南电网有限责任公司电力科学研究院 一种红外故障检测识别算法
CN112489497A (zh) * 2020-11-18 2021-03-12 南京航空航天大学 基于深度卷积神经网络的空域运行复杂度评估方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张晓男,钟兴等: "基于集成卷积神经网络的遥感影像场景分类", 光学学报, vol. 38, no. 11, pages 350 - 360 *
李欣;赵亦工;郭伟;: "基于复杂度的自适应门限弱小目标检测方法", 光子学报, no. 08, pages 2144 - 2149 *

Also Published As

Publication number Publication date
CN113139576B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CN109685115B (zh) 一种双线性特征融合的细粒度概念模型及学习方法
WO2021042828A1 (zh) 神经网络模型压缩的方法、装置、存储介质和芯片
EP3065085B1 (en) Digital image processing using convolutional neural networks
CN108764292B (zh) 基于弱监督信息的深度学习图像目标映射及定位方法
Bodapati et al. Feature extraction and classification using deep convolutional neural networks
EP4163831A1 (en) Neural network distillation method and device
DE112016004535T5 (de) Universelles Übereinstimmungsnetz
Namba et al. Cellular neural network for associative memory and its application to Braille image recognition
CN112132145B (zh) 一种基于模型扩展卷积神经网络的图像分类方法及系统
CN112418261B (zh) 一种基于先验原型注意力机制的人体图像多属性分类方法
CN112580662A (zh) 一种基于图像特征识别鱼体方向的方法及系统
JP2010157118A (ja) パターン識別装置及びパターン識別装置の学習方法ならびにコンピュータプログラム
CN111223128A (zh) 目标跟踪方法、装置、设备及存储介质
CN112861659A (zh) 一种图像模型训练方法、装置及电子设备、存储介质
CN112036454A (zh) 一种基于多核密集连接网络的图像分类方法
CN112101364A (zh) 基于参数重要性增量学习的语义分割方法
CN114882278A (zh) 一种基于注意力机制和迁移学习的轮胎花纹分类方法和装置
CN114492634A (zh) 一种细粒度装备图片分类识别方法及系统
CN113139576A (zh) 一种结合图像复杂度的深度学习图像分类方法及系统
CN116543250A (zh) 一种基于类注意力传输的模型压缩方法
CN113139577A (zh) 一种基于可变形卷积网络的深度学习图像分类方法及系统
CN115713769A (zh) 文本检测模型的训练方法、装置、计算机设备和存储介质
CN115410042A (zh) 工件的分类方法、装置、计算机可读介质及电子设备
CN114913339A (zh) 特征图提取模型的训练方法和装置
Chung et al. Filter pruning by image channel reduction in pre-trained convolutional neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant