CN114092819A - 一种图像分类方法及装置 - Google Patents

一种图像分类方法及装置 Download PDF

Info

Publication number
CN114092819A
CN114092819A CN202210057396.8A CN202210057396A CN114092819A CN 114092819 A CN114092819 A CN 114092819A CN 202210057396 A CN202210057396 A CN 202210057396A CN 114092819 A CN114092819 A CN 114092819A
Authority
CN
China
Prior art keywords
model
classification
vgg16 model
vgg16
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210057396.8A
Other languages
English (en)
Other versions
CN114092819B (zh
Inventor
蓝科
吕宗明
张国兵
张登辉
胥果
曾丸畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Sefon Software Co Ltd
Original Assignee
Chengdu Sefon Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Sefon Software Co Ltd filed Critical Chengdu Sefon Software Co Ltd
Priority to CN202210057396.8A priority Critical patent/CN114092819B/zh
Publication of CN114092819A publication Critical patent/CN114092819A/zh
Application granted granted Critical
Publication of CN114092819B publication Critical patent/CN114092819B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像分类方法及装置,主要解决现有技术中存在的现有图像分类模型存在的模型性能提升困难及模型分类性能不佳的问题。该发明对原始图像数据进行处理增加图像数据的多变性以及缓解过拟合线性,将训练集输入VGG16模型计算出其总交叉熵Loss,至loss曲线收敛;提升了VGG16模型提取特征的多粒度性,使模型的提升更易;最后结合投票决策得出最终的VGG16模型,有效地对多个分类结果进行了综合评估,提升了模型分类的可信度。

Description

一种图像分类方法及装置
技术领域
本发明涉及深度学习图像分类技术领域,具体地说,是涉及一种图像分类方法及装置。
背景技术
图像分类作为图像分析的基础应用,在视觉感知领域如人机交互、智能化监控、内容智能剖析等方面具有重要应用;在图像分类技术中,分类精度作为不可或缺的指标,决定着分类方法的性能,如何有效提升分类模型的分类精度一直是图像分类技术的难点。
就图像本身而言,图像数据不同于一般结构化数据,图像数据内容更为内涵且复杂,除了图像数据展现的固有内容外,事物的形状、纹理、颜色、亮度等细节信息都对图像数据的分析有着巨大影响。
目前在图像分类技术中常使用的深度模型均是通过设计模型结构以适应不同的分类任务,通过提取最后一次特征层向量作为图像特征的全局表征,训练分类器得到类别标签;但这种方式存在两个问题:
①模型性能提升困难,一个高性能模型的设计工程量巨大涉及各领域的学科知识,缺乏快速有效提升模型分类性能的简便方法;
②现有方法仅使用深度模型的高层抽象特征作为图像的最终表征,缺乏局部特征的融入,表征缺乏多粒度性,会影响模型分类性能。
发明内容
本发明的目的在于提供一种图像分类方法及装置,以解决现有图像分类模型存在的模型性能提升困难及模型分类性能不佳的问题。
为了解决上述问题,本发明提供如下技术方案:
一种图像分类方法包括以下步骤:
S1、对原始图像数据进行处理,然后进行批处理形成训练集;
S2、将步骤S1的训练集数据输入VGG16模型丰富其局部表征和全局表征特性,并据此计算出VGG16模型总交叉熵Loss;
S3、判断步骤S2得到的VGG16模型的Loss曲线是否收敛,是则执行步骤S4,否则调整步骤S2的VGG16模型超参数重复步骤S2和步骤S3,直至loss曲线收敛;
S4、VGG16模型收敛后,通过Softmax分类器得到分类结果,然后对分类结果进行投票统计得到最终预测类别;
S5、根据步骤S4的最终预测类别,计算VGG16模型分类精度;
S6、通过步骤S5的VGG16模型对图像进行分类。
目前在图像分类技术中常使用的深度模型诸如ResNet、VGGNet、GoogleNet、AlexNet,通过设计模型结构以适应不同的分类任务,在图像识别领域获得了巨大的成功,但存在模型性能提升困难及模型分类性能不佳的问题;上述方案对原始图像数据进行处理增加图像数据的多变性以及缓解过拟合线性,将训练集输入VGG16模型计算出其总交叉熵Loss,至loss曲线收敛;提升了VGG16模型提取特征的多粒度性,使模型的提升更易;最后结合投票决策得出最终的VGG16模型,有效地对多个分类结果进行了综合评估,提升了模型分类的可信度。
进一步的,步骤S1中对原始图像的处理包括随机裁剪、旋转、镜像、缩放中任一种或多种;也可采用其他方式对原始图像分类数据进行镜像数据增强。
进一步的,步骤S1中批处理形成训练集的具体过程为:将处理后的数据按设定训 练批次大小进行分类,表示为:
Figure 959719DEST_PATH_IMAGE001
,其中,
Figure 553380DEST_PATH_IMAGE002
为批处理后多张图片的集合,
Figure 723462DEST_PATH_IMAGE003
代表训练集中的第n张图片,batchsize为每个批次集合 中的图片数量。
进一步的,步骤S2的具体过程如下:
S201、搭建VGG16模型,其包含conv1、conv2、conv3、conv4、conv5以及Fc6六个特征层组合模块;
S202、分别提取步骤S201的VGG16模型中conv1、conv2、conv3、conv4、conv5、Fc6六 个特征层组合模块的特征输出,分别记为
Figure 698371DEST_PATH_IMAGE004
S203、根据步骤S202的六个特征输出,得出特征集合和维度;具体过程为:
Figure 711326DEST_PATH_IMAGE005
,其中
Figure 982381DEST_PATH_IMAGE004
分别对应conv1、 conv2、conv3、conv4、conv5、Fc6各模块的特征输出,F为此些特征的集合,
Figure 6969DEST_PATH_IMAGE006
维度为
Figure 152780DEST_PATH_IMAGE007
,分别表示高度,宽度和通道数,此处的
Figure 902299DEST_PATH_IMAGE008
,由于
Figure 995020DEST_PATH_IMAGE009
为全连接特征 模块的输出,维度为D;
S204、完成步骤S203后接入1×1的卷积核将卷积层特征通道进行合并,使卷积层 特征通道数缩减为1,即
Figure 670852DEST_PATH_IMAGE006
维度变更为
Figure 161132DEST_PATH_IMAGE010
S205、完成步骤S204后将从通道数缩减后的卷积层特征按照
Figure 148680DEST_PATH_IMAGE011
的组合维度铺 展开,并分别接入多层感知机MLP将维度降为与分类数相同得到分类特征向量集合:
Figure 45092DEST_PATH_IMAGE012
,其中
Figure 309851DEST_PATH_IMAGE013
分别为对应
Figure 905786DEST_PATH_IMAGE004
经过维度整合后分类特征,包含着多个粒度表征特性;
S206、计算VGG16模型总交叉熵Loss。
进一步的,步骤S4的具体过程为:提取softmax分类器输出并引入硬投票决策机 制,取输出类别数占比最大的类作为预测类;过程可表示如下:其中
Figure 990417DEST_PATH_IMAGE014
Figure 221678DEST_PATH_IMAGE015
各个分类器的输出标签值,count为对不 同类别标签出现次数的统计操作,index为导出最大值对应的类别标签操作。
一种图像分类装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现一种图像分类方法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明中VGG16模型在特征表征上粒度层次丰富,兼顾了对全局合局部细节信息的描述,判别能力强;本发明通过在VGG16图像识别模型中引入多粒度特征融合策略,使得不同空间层次的视觉感知特征能获得充分的利用,实现了图像深度特征由浅到深的互补,有效增强了不同特征层之间交互作用,快速提升模型分类性能。
(2)本发明中使用多个层级特征对模型进行训练,一定程度上缓解了模型过拟合;模型训练过程,增加了多个层级的特征,特征的多样性以及训练资源的数量都获得提升,并通过综合计算了各自的训练loss指导模型收敛过程,充分调动模型学习能力,避免模型训练过程陷入过拟合。
(3)本发明中硬投票机制的使用,有效地对多个分类结果进行了综合评估,提升了模型分类的可信度;本发明在对使用了多粒度特征的分类模型的分类决策过程中使用了硬投票法,通过在统计后的分类标签中遵循少数服从多少的原则,对结果进行了综合决策,统一管理了多个识别任务。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,其中:
图1为本发明的流程架构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合图1对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
实施例1
如图1所示,一种图像分类方法是通过一种结合深度模型多粒度特征融合策略和投票决策方法的图像分类模型来实现图像分类的,其针对实际场景中图片识别任务;本发明具有过程包括以下步骤:
S1,为了增加图像数据的多变性以及缓解过拟合线性,通过随机裁剪、旋转、镜像、缩放等方法对原始图像分类数据镜像数据增强:
S2,对扩增后的数据进行批处理,设定各个训练批次大小,批处理后的训练集表示如下:
Figure 465578DEST_PATH_IMAGE001
其中,
Figure 969765DEST_PATH_IMAGE002
为批处理后多张图片的集合,
Figure 931904DEST_PATH_IMAGE003
代表训练集中的第
Figure 373381DEST_PATH_IMAGE016
张图片,batchsize为每个批次集合中的图片数量。
S3,搭建VGG16模型,模型包含conv1、conv2、conv3、conv4、conv5以及Fc6六个特征层组合模块,靠前的卷积层的特征平面,主要提取的是局部特征,保留着输入视频帧较好的空间分辨率,中层卷积层特征包含的细节特征是作为区别类内差别的重要依据,但是特征抽象化程度不高,泛化性以及表征能力不强。相比之下,全连接层整合了卷积层多个通道的特征平面,向量化后得到数据全局特征,具有很强的判别能力。
S4,于是为了提升模型提取特征的多粒度性,在此,分别提取VGG16模型中conv1、conv2、conv3、conv4、conv5、Fc6各模块的特征输出作为后续模型的决策依据,使得能在表征层面实现全局和局部的互补:
Figure 986634DEST_PATH_IMAGE005
其中
Figure 19312DEST_PATH_IMAGE004
分别对应conv1、conv2、conv3、conv4、conv5、Fc6各模块的特征输出,F为此些特征的集合,
Figure 609693DEST_PATH_IMAGE006
维度为
Figure 41812DEST_PATH_IMAGE007
,分别表示高度,宽度和通道数,此处的
Figure 246921DEST_PATH_IMAGE008
,由于
Figure 106293DEST_PATH_IMAGE009
为全连接特征模块的输出,维度为D。
S5,通过接入1×1的卷积核将卷积层特征通道进行合并,使卷积层特征通道数缩减为1,即
Figure 387233DEST_PATH_IMAGE006
维度变更为
Figure 75572DEST_PATH_IMAGE010
S6,再将从通道数缩减后的卷积层特征
Figure 758357DEST_PATH_IMAGE011
的组合维度铺展开,并分别接入多层感知机MLP将维度降为与分类数相同。得到分类特征向量集合:
Figure 929576DEST_PATH_IMAGE012
其中
Figure 88024DEST_PATH_IMAGE013
为对应
Figure 102424DEST_PATH_IMAGE004
经过维度整合后分类特征,包含着多个粒度表征特性。
S7,由于以上整个模型计算过程复杂,将上述模型计算过程记录为:
Figure 702033DEST_PATH_IMAGE017
其中
Figure 44152DEST_PATH_IMAGE018
表示VGG16神经网络的内部计算操作,
Figure 939165DEST_PATH_IMAGE019
为输出的预测结果,表示分类向量
Figure 64247DEST_PATH_IMAGE020
softmax分类器后的各个预测类别的概率分布。
同时,这里采取交叉熵结合训练参数正则化的方式计算多个分类结果Loos的总和值,来指导模型优化过程,具体如下:
Figure 426351DEST_PATH_IMAGE021
其中,
Figure 798427DEST_PATH_IMAGE022
表示数据真实标签的one-hot值,C为分类数目,W为模型参数,
Figure 744517DEST_PATH_IMAGE023
为正则化参数,i为用到的分类向量的索引值。
S8,搭建训练框架,调整模型超参数,对模型进行端到端的训练,直至loss曲线收敛。
S9,模型收敛后,分别取出各个粒度特征的分类结果,即通过提取softmax分类器输出并引入硬投票决策机制,取输出类别数占比最大的类作为预测类。过程可表示如下:
Figure 109508DEST_PATH_IMAGE014
其中,
Figure 824655DEST_PATH_IMAGE015
各个分类器的输出标签值,count为对不同类别标签出现次数的统计操作,index为导出最大值对应的类别标签操作。
S10,计算模型分类精度,然后通过最终的模型对图像进行分类。
本发明基于VGG16模型在图像特征表征上制定了多粒度特征融合策略,充分且有效地利用VGG16模型的多个特征表示层数据,在丰富模型局部表征和全局表征特性上起到了重要作用;同时,在分类决策层面加入了投票法去作决策,综合了多个粒度特征的表征结果使得分类结果更具可信度。
综上,本发明中涉及一种结合深度模型多粒度特征融合策略和投票决策方法的图像分类模型,该模型方法可以广泛应用于RGB图像分类识别的任务中,在对图像内容理解以及分析的过程中尤为重要。
实施例2
一种图像分类装置包括存储器:用于存储可执行指令;处理器:用于执行所述存储器中存储的可执行指令,实现一种图像分类方法。
本发明是一种基于多粒度特征融合策略+投票决策的图像分类方法,其采取了多粒度特征融合的策略,将不同层级特征作为决策资源,有效提升了表征特征的质量,使得模型方法支持了浅层与高层特征的输入与交互,粒度更为丰富,训练特征的增加在调动模型拟合能力上起到一定作用;同时,针对多个分类结果,模型通过引入投票机制,实现了对多结果的综合决策;因此,该模型方法具有较好的分类性能和可信度。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (6)

1.一种图像分类方法,其特征在于,包括以下步骤:
S1、对原始图像数据进行处理,然后进行批处理形成训练集;
S2、将步骤S1的训练集数据输入VGG16模型丰富其局部表征和全局表征特性,并据此计算出VGG16模型总交叉熵Loss;
S3、判断步骤S2得到的VGG16模型的Loss曲线是否收敛,是则执行步骤S4,否则调整步骤S2的VGG16模型超参数重复步骤S2和步骤S3,直至loss曲线收敛;
S4、VGG16模型收敛后,通过Softmax分类器得到分类结果,然后对分类结果进行投票统计得到最终预测类别;
S5、根据步骤S4的最终预测类别,计算VGG16模型分类精度;
S6、通过步骤S5的VGG16模型对图像进行分类。
2.根据权利要求1所述的一种图像分类方法,其特征在于,步骤S1中对原始图像的处理包括随机裁剪、旋转、镜像、缩放中任一种或多种。
3.根据权利要求1所述的一种图像分类方法,其特征在于,步骤S1中批处理形成训练集的具体过程为:将处理后的数据按设定训练批次大小进行分类,表示为:
Figure 366253DEST_PATH_IMAGE001
,其中,
Figure 597908DEST_PATH_IMAGE002
为批处理后多张图片的集合,
Figure 253011DEST_PATH_IMAGE003
代表训练集中的第n张图片,batchsize为每个批次集合中的图片数量。
4.根据权利要求1所述的一种图像分类方法,其特征在于,步骤S2的具体过程如下:
S201、搭建VGG16模型,其包含conv1、conv2、conv3、conv4、conv5以及Fc6六个特征层组合模块;
S202、分别提取步骤S201的VGG16模型中conv1、conv2、conv3、conv4、conv5、Fc6六个特征层组合模块的特征输出,分别记为
Figure 710537DEST_PATH_IMAGE004
S203、根据步骤S202的六个特征输出,得出特征集合和维度;具体过程为:
Figure 836494DEST_PATH_IMAGE005
,其中
Figure 721273DEST_PATH_IMAGE004
分别对应conv1、conv2、conv3、conv4、conv5、Fc6各模块的特征输出,F为此些特征的集合,
Figure 863673DEST_PATH_IMAGE006
维度为
Figure 377087DEST_PATH_IMAGE007
,分别表示高度,宽度和通道数,此处的
Figure 108283DEST_PATH_IMAGE008
,由于
Figure 914696DEST_PATH_IMAGE009
为全连接特征模块的输出,维度为D;
S204、完成步骤S203后接入1×1的卷积核将卷积层特征通道进行合并,使卷积层特征通道数缩减为1,即
Figure 731342DEST_PATH_IMAGE006
维度变更为
Figure 779938DEST_PATH_IMAGE010
S205、完成步骤S204后将从通道数缩减后的卷积层特征按照
Figure 365641DEST_PATH_IMAGE011
的组合维度铺展开,并分别接入多层感知机MLP将维度降为与分类数相同得到分类特征向量集合:
Figure 670851DEST_PATH_IMAGE012
,其中
Figure 226991DEST_PATH_IMAGE013
分别为对应
Figure 564431DEST_PATH_IMAGE004
经过维度整合后分类特征,包含着多个粒度表征特性;
S206、计算VGG16模型总交叉熵Loss。
5.根据权利要求1所述的一种图像分类方法,其特征在于,步骤S4的具体过程为:提取softmax分类器输出并引入硬投票决策机制,取输出类别数占比最大的类作为预测类;过程可表示如下:其中
Figure 20951DEST_PATH_IMAGE014
Figure 418435DEST_PATH_IMAGE015
各个分类器的输出标签值,count为对不同类别标签出现次数的统计操作,index为导出最大值对应的类别标签操作。
6.一种图像分类装置,其特征在于,包括
存储器:用于存储可执行指令;
处理器:用于执行所述存储器中存储的可执行指令,实现如权利要求1-5任一项所述的一种图像分类方法。
CN202210057396.8A 2022-01-19 2022-01-19 一种图像分类方法及装置 Active CN114092819B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210057396.8A CN114092819B (zh) 2022-01-19 2022-01-19 一种图像分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210057396.8A CN114092819B (zh) 2022-01-19 2022-01-19 一种图像分类方法及装置

Publications (2)

Publication Number Publication Date
CN114092819A true CN114092819A (zh) 2022-02-25
CN114092819B CN114092819B (zh) 2022-04-19

Family

ID=80308525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210057396.8A Active CN114092819B (zh) 2022-01-19 2022-01-19 一种图像分类方法及装置

Country Status (1)

Country Link
CN (1) CN114092819B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116051506A (zh) * 2023-01-28 2023-05-02 东莞市言科新能源有限公司 聚合物锂离子电池的智能化生产系统及其方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902736A (zh) * 2019-02-25 2019-06-18 东北大学 一种基于自动编码器构建特征表示的肺结节图像分类方法
CN110766660A (zh) * 2019-09-25 2020-02-07 上海众壹云计算科技有限公司 基于融合深度学习模型的集成电路缺陷图像识别分类系统
CN111291807A (zh) * 2020-02-03 2020-06-16 Oppo广东移动通信有限公司 一种细粒度图像分类方法、装置及存储介质
CN111598157A (zh) * 2020-05-14 2020-08-28 北京工业大学 一种基于vgg16网络层级优化的身份证图像分类方法
CN112101190A (zh) * 2020-09-11 2020-12-18 西安电子科技大学 一种遥感图像分类方法、存储介质及计算设备
CN112270347A (zh) * 2020-10-20 2021-01-26 西安工程大学 一种基于改进ssd的医疗废弃物分类检测方法
CN112597904A (zh) * 2020-12-25 2021-04-02 天津职业技术师范大学(中国职业培训指导教师进修中心) 一种用于高炉料面图像的识别与分类方法
CN112800927A (zh) * 2021-01-25 2021-05-14 北京工业大学 一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法
AU2021101851A4 (en) * 2021-04-12 2021-06-03 Vishwakarma Institute Of Information Technology A deep learning based system for automatic segmentation and quantification of covid-19 in CT images
CN112906829A (zh) * 2021-04-13 2021-06-04 成都四方伟业软件股份有限公司 一种基于Mnist数据集的数字识别模型构建方法及装置
CN113469198A (zh) * 2021-06-30 2021-10-01 南京航空航天大学 一种基于改进的vgg卷积神经网络模型的图像分类方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902736A (zh) * 2019-02-25 2019-06-18 东北大学 一种基于自动编码器构建特征表示的肺结节图像分类方法
CN110766660A (zh) * 2019-09-25 2020-02-07 上海众壹云计算科技有限公司 基于融合深度学习模型的集成电路缺陷图像识别分类系统
CN111291807A (zh) * 2020-02-03 2020-06-16 Oppo广东移动通信有限公司 一种细粒度图像分类方法、装置及存储介质
CN111598157A (zh) * 2020-05-14 2020-08-28 北京工业大学 一种基于vgg16网络层级优化的身份证图像分类方法
CN112101190A (zh) * 2020-09-11 2020-12-18 西安电子科技大学 一种遥感图像分类方法、存储介质及计算设备
CN112270347A (zh) * 2020-10-20 2021-01-26 西安工程大学 一种基于改进ssd的医疗废弃物分类检测方法
CN112597904A (zh) * 2020-12-25 2021-04-02 天津职业技术师范大学(中国职业培训指导教师进修中心) 一种用于高炉料面图像的识别与分类方法
CN112800927A (zh) * 2021-01-25 2021-05-14 北京工业大学 一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法
AU2021101851A4 (en) * 2021-04-12 2021-06-03 Vishwakarma Institute Of Information Technology A deep learning based system for automatic segmentation and quantification of covid-19 in CT images
CN112906829A (zh) * 2021-04-13 2021-06-04 成都四方伟业软件股份有限公司 一种基于Mnist数据集的数字识别模型构建方法及装置
CN113469198A (zh) * 2021-06-30 2021-10-01 南京航空航天大学 一种基于改进的vgg卷积神经网络模型的图像分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DEWI ROSMALA等: "TRANSFER LEARNING WITH VGG16 AND INCEPTIONV3 MODEL FOR CLASSIFICATION OF POTATO LEAF DISEASE", 《JOURNAL OF THEORETICAL AND APPLIED INFORMATION TECHNOLOGY》 *
李彦冬: "基于卷积神经网络的计算机视觉关键技术研究", 《中国博士学位论文全文数据库_信息科技辑》 *
梁苗苗: "基于多尺度空谱融合网络的高光谱图像分", 《中国博士学位论文全文数据库_工程科技Ⅱ辑》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116051506A (zh) * 2023-01-28 2023-05-02 东莞市言科新能源有限公司 聚合物锂离子电池的智能化生产系统及其方法

Also Published As

Publication number Publication date
CN114092819B (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
CN112396002B (zh) 一种基于SE-YOLOv3的轻量级遥感目标检测方法
WO2020114378A1 (zh) 视频水印的识别方法、装置、设备及存储介质
Squalli-Houssaini et al. Deep learning for predicting image memorability
CN111582397B (zh) 一种基于注意力机制的cnn-rnn图像情感分析方法
CN113762138B (zh) 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN109710804B (zh) 一种教学视频图像知识点降维分析方法
CN110321805B (zh) 一种基于时序关系推理的动态表情识别方法
CN110569814A (zh) 视频类别识别方法、装置、计算机设备及计算机存储介质
CN108491430A (zh) 一种基于对特征方向进行聚类的无监督哈希检索方法
WO2023206944A1 (zh) 一种语义分割方法、装置、计算机设备和存储介质
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN116610778A (zh) 基于跨模态全局与局部注意力机制的双向图文匹配方法
CN110929099A (zh) 一种基于多任务学习的短视频帧语义提取方法及系统
CN109711442A (zh) 无监督逐层生成对抗特征表示学习方法
CN115240024A (zh) 一种联合自监督学习和半监督学习的地外图片分割方法和系统
CN114092819B (zh) 一种图像分类方法及装置
CN114741519A (zh) 一种基于图卷积神经网络和知识库的论文相关性分析方法
Gayathri et al. Improved fuzzy-based SVM classification system using feature extraction for video indexing and retrieval
Jayanthiladevi et al. Text, images, and video analytics for fog computing
CN117437577A (zh) 基于多特征融合的视频分类方法及系统
CN117315752A (zh) 人脸情绪识别网络模型的训练方法、装置、设备和介质
CN115082840B (zh) 基于数据组合和通道相关性的动作视频分类方法和装置
Doshi et al. Image aesthetics assessment using multi channel convolutional neural networks
CN113255570B (zh) 一种感知视频片段关系的时序动作检测方法
CN111768214A (zh) 产品属性的预测方法、系统、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant