CN111310852B - 一种图像分类方法及系统 - Google Patents
一种图像分类方法及系统 Download PDFInfo
- Publication number
- CN111310852B CN111310852B CN202010154538.3A CN202010154538A CN111310852B CN 111310852 B CN111310852 B CN 111310852B CN 202010154538 A CN202010154538 A CN 202010154538A CN 111310852 B CN111310852 B CN 111310852B
- Authority
- CN
- China
- Prior art keywords
- image
- sample image
- images
- pseudo sample
- pseudo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000000605 extraction Methods 0.000 claims abstract description 98
- 238000013145 classification model Methods 0.000 claims abstract description 60
- 238000003062 neural network model Methods 0.000 claims abstract description 14
- 230000004913 activation Effects 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 abstract description 70
- 238000009826 distribution Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 3
- TVYLLZQTGLZFBW-ZBFHGGJFSA-N (R,R)-tramadol Chemical compound COC1=CC=CC([C@]2(O)[C@H](CCCC2)CN(C)C)=C1 TVYLLZQTGLZFBW-ZBFHGGJFSA-N 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007786 learning performance Effects 0.000 description 1
- 206010027175 memory impairment Diseases 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000009304 pastoral farming Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种图像分类方法及系统,涉及数字图像处理技术领域。该方法包括:利用第一图像训练集训练得到特征提取网络模型;利用变分自编码网络、第一图像训练集、特征提取网络模型,以及三种损失函数的加权和,得到与最小的加权和对应的变分自编码网络的解码网络;利用解码网络随机生成伪样本图像集;利用伪样本图像集和第二图像训练集训练全连接神经网络模型,得到分类模型;利用分类模型对待分类图像进行分类。本发明的图像分类方法利用变分自编码网络对第一图像进行分解重构,计算并最小化三种损失函数的加权和,利用与最小的加权和对应的变分自编码网络的解码网络生成伪样本图像集,能完全舍弃旧类样本图像数据,降低内存的占用率。
Description
技术领域
本发明涉及数字图像处理技术领域,特别是涉及一种图像分类方法及系统。
背景技术
作为人工智能领域的一个重要分支,机器学习算法学习训练数据以优化学习性能。很多机器学习算法将训练数据集合作为整体进行一次性训练,这种学习方式通常被称作批量学习(Batch Learning)。与批量学习不同,增量学习(Incremental Learning)首先使用部分数据建立一个初始模型,然后依次使用更多的数据对机器学习模型进行更新,通过这种增量的方式来对这些数据进行训练和学习。同批量学习相比,这种增量学习知识的方式有其特有的优势。首先,从计算智慧的角度来看,生物智慧体就是通过增量的方式学习信息、积累经验、拓展时空关联以完成知识的学习与储备。因此,增量学习的学习模式同生物智能更为相似。其次,从实际应用来看.增量学习可以应用在批量学习难以使用的学习场景中去,如学习海量数据和挖掘流式数据中的知识。一般来说,批量学习算法需要将训练数据一次性加载内存,以便进行统计和分析从而得到最终的模型。但是,对于海量的训练数据而言,批量学习算法无法将数据一次性加载内存。在数据流中,数据连续不断地产生,这同样无法被传统的批量学习算法所学习。随着大数据时代的到来,增量学习在学术领域和工业应用中表现着越来越重要的角色。
与批量学习相比,增量学习有着其特有的优势,但同时也带来了更多新的挑战,其中最重要的一个挑战就是灾难性遗忘(catastrophic forgetting)。在20世纪80年代末,McCloskey等人描述了灾难性遗忘的问题,即用新数据训练神经网络时训练的新数据会覆盖神经网络从以前的数据中学到的知识;Castro F M等人提出了一种端到端的增量学习方法,通过保留少量的旧类样本图像与新类样本图像一起训练实现增量学习,因为新旧类样本图像数量不平衡问题,端到端的增量学习方法使用一个平衡的样本图像子集,基于放牧的样本图像选择算法,通过减少来自新类的样本图像数量来构建该子集,仅保留每个类中最具代表性的样本图像,即让新训练子集每个类包含相同数量的样本图像,无论样本图像是属于新类还是旧类,通过对分类器和特征的联合学习,都能够以端到端的方式克服以往工作的局限性;Amanda Rios通过结合GAN(生成式对抗网络,Generative AdversarialNetworks)生成模型与少量样本图像保留,提出一个累积死循环记忆重放GAN(CloGAN),累积死循环记忆重放GAN由一个为最大采样多样性选择的小型存储单元提供外部正则化。上述方法虽然在一定程度上减轻了在类增量学习过程中的灾难性遗忘,但都需要保留旧类的样本图像数据,占用大量的内存。因此,现有类增量学习方法存在占用大量的内存的问题。
发明内容
本发明的目的是提供一种图像分类方法及系统,解决了现有类增量学习方法占用大量的内存的问题。
为实现上述目的,本发明提供了如下方案:
一种图像分类方法,包括:
获取第一图像训练集;所述第一图像训练集包括:多张第一图像和每张所述第一图像的类别;
利用所述第一图像训练集训练特征提取网络,得到特征提取网络模型;所述特征提取网络模型用于提取输入所述特征提取网络模型的图像的图像特征;
利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像;
利用所述特征提取网络模型分别提取所述第一图像的第一图像特征和所述重构样本图像的重构图像特征;
利用所述第一图像、所述重构样本图像、所述第一图像特征和所述重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和;
多次调整所述变分自编码网络的权重,更新所述变分自编码网络后返回“利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像”,并更新所述加权和,确定更新后的加权和;
比较所述加权和以及多次所述更新后的加权和,确定最小的加权和;
获取与所述最小的加权和对应的所述变分自编码网络的解码网络,以及第二图像训练集;所述第二图像训练集包括:多张第二图像和每张所述第二图像的类别;所述第二图像的类别与所述第一图像的类别不同;
利用所述解码网络随机生成伪样本图像集;
利用所述伪样本图像集和所述第二图像训练集训练全连接神经网络模型,得到分类模型;所述分类模型用于确定输入所述分类模型的图像的所属类别;
获取待分类图像;
将所述待分类图像输入所述分类模型,对所述待分类图像进行分类,得到所述待分类图像的类别。
可选的,所述特征提取网络模型包括2层全连接层;所述全连接层的激活函数为线性整流函数。
可选的,所述利用所述第一图像、所述重构样本图像、所述第一图像特征和所述重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和,具体包括:
根据公式LR=(x-x')2计算所述重构损失函数LR;
根据公式LF=(Fx-Fx')2计算所述特征损失函数LF;
根据公式LALL=LR+LKL+LF计算所述加权和LALL;
上式中,x表示所述第一图像,x’表示所述重构样本图像,Fx表示所述第一图像特征,Fx'表示所述第二图像特征,LKL表示所述KL散度损失函数。
可选的,所述利用所述解码网络随机生成伪样本图像集,具体包括:
利用所述解码网络生成伪样本图像组;
利用所述特征提取网络模型提取所述伪样本图像组的伪样本图像特征组;伪样本图像特征组包括所述伪样本图像组中每张伪样本图像的伪样本图像特征;
根据公式将属于y类的伪样本图像归类到数据组Dy中,式中Dy表示第y类的数据组,xi表示第i张所述伪样本图像,Fi’表示第i张所述伪样本图像的伪样本图像特征,uk表示第k类图像的类平均特征向量,t表示所述第一图像的类别的总数;
返回“利用所述解码网络生成伪样本图像组”,更新所述数据组Dy,直至所述数据组Dy中的伪样本图像数量为所述第一图像训练集中属于第y类的第一图像的数量的n倍,得到所有类的初始数据组;
获取每张所述伪样本图像的特征距离;所述特征距离为所述伪样本图像的伪样本图像特征与所述伪样本图像所属类别的类平均特征向量之差;
将所述初始数据组中的伪样本图像按照所述特征距离进行排序,得到伪样本图像序列;
获取预设特征距离,将所述伪样本图像序列中特征距离小于所述预设特征距离的所有伪样本图像确定为伪样本图像组,所述伪样本图像集为所有类的伪样本图像组。
可选的,所述分类模型包括:输入层、隐藏层和输出层;
所述输入层用于输入待分类的图像;
所述隐藏层为所述特征提取网络模型;
所述输出层用于根据所述特征提取网络模型提取的图像特征对所述待分类图像进行分类。
一种图像分类系统,包括:
图像训练集模块,用于获取第一图像训练集;所述第一图像训练集包括:多张第一图像和每张所述第一图像的类别;
特征提取网络模型模块,用于利用所述第一图像训练集训练特征提取网络,得到特征提取网络模型;所述特征提取网络模型用于提取输入所述特征提取网络模型的图像的图像特征;
重构样本图像模块,用于利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像;
分类特征模块,用于利用所述特征提取网络模型分别提取所述第一图像的第一图像特征和所述重构样本图像的重构图像特征;
加权和模块,用于利用所述第一图像、所述重构样本图像、所述第一图像特征和所述重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和;
更新加权和模块,用于多次调整所述变分自编码网络的权重,更新所述变分自编码网络后返回“利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像”,并更新所述加权和,确定更新后的加权和;
最小加权和模块,用于比较所述加权和以及多次所述更新后的加权和,确定最小的加权和;
解码网络模块,用于获取与所述最小的加权和对应的所述变分自编码网络的解码网络,以及第二图像训练集;所述第二图像训练集包括:多张第二图像和每张所述第二图像的类别;所述第二图像的类别与所述第一图像的类别不同;
伪样本图像集模块,用于利用所述解码网络随机生成伪样本图像集;
分类模型模块,用于利用所述伪样本图像集和所述第二图像训练集训练全连接神经网络模型,得到分类模型;所述分类模型用于确定输入所述分类模型的图像的所属类别;
待分类图像模块,用于获取待分类图像;
分类模块,用于将所述待分类图像输入所述分类模型,对所述待分类图像进行分类,得到所述待分类图像的类别。
可选的,所述特征提取网络模型包括2层全连接层;所述全连接层的激活函数为线性整流函数。
可选的,所述加权和模块,具体包括:
重构损失函数单元,用于根据公式LR=(x-x')2计算所述重构损失函数LR;
特征损失函数单元,用于根据公式LF=(Fx-Fx')2计算所述特征损失函数LF;
加权和单元,用于根据公式LALL=LR+LKL+LF计算所述加权和LALL;
上式中,x表示所述第一图像,x’表示所述重构样本图像,Fx表示所述第一图像特征,Fx'表示所述第二图像特征,LKL表示所述KL散度损失函数。
可选的,所述伪样本图像集模块,具体包括:
伪样本图像组单元,用于利用所述解码网络生成伪样本图像组;
伪样本图像特征组单元,用于利用所述特征提取网络模型提取所述伪样本图像组的伪样本图像特征组;伪样本图像特征组包括所述伪样本图像组中每张伪样本图像的伪样本图像特征;
归类单元,用于根据公式将属于y类的伪样本图像归类到数据组Dy中,式中Dy表示第y类的数据组,xi表示第i张所述伪样本图像,Fi’表示第i张所述伪样本图像的伪样本图像特征,uk表示第k类图像的类平均特征向量,t表示所述第一图像的类别的总数;
初始数据组单元,用于返回“利用所述解码网络生成伪样本图像组”,更新所述数据组Dy,直至所述数据组Dy中的伪样本图像数量为所述第一图像训练集中属于第y类的第一图像的数量的n倍,得到所有类的初始数据组;
特征距离单元,用于获取每张所述伪样本图像的特征距离;所述特征距离为所述伪样本图像的伪样本图像特征与所述伪样本图像所属类别的类平均特征向量之差;
伪样本图像序列单元,用于将所述初始数据组中的伪样本图像按照所述特征距离进行排序,得到伪样本图像序列;
伪样本图像集单元,用于获取预设特征距离,将所述伪样本图像序列中特征距离小于所述预设特征距离的所有伪样本图像确定为伪样本图像组,所述伪样本图像集为所有类的伪样本图像组。
可选的,所述分类模型包括:输入层、隐藏层和输出层;
所述输入层用于输入待分类的图像;
所述隐藏层为所述特征提取网络模型;
所述输出层用于根据所述特征提取网络模型提取的图像特征对所述待分类图像进行分类。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供了一种图像分类方法及系统。该方法包括:获取第一图像训练集;第一图像训练集包括:多张第一图像和每张第一图像的类别;利用第一图像训练集训练特征提取网络,得到特征提取网络模型;特征提取网络模型用于提取输入特征提取网络模型的图像的图像特征;利用变分自编码网络对第一图像进行分解重构,得到重构样本图像;利用特征提取网络模型分别提取第一图像的第一图像特征和重构样本图像的重构图像特征;利用第一图像、重构样本图像、第一图像特征和重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和;多次调整变分自编码网络的权重,更新变分自编码网络后返回“利用变分自编码网络对第一图像进行分解重构,得到重构样本图像”,并更新加权和,确定更新后的加权和;比较加权和以及多次更新后的加权和,确定最小的加权和;获取与最小的加权和对应的变分自编码网络的解码网络,以及第二图像训练集;第二图像训练集包括:多张第二图像和每张第二图像的类别;第二图像的类别与第一图像的类别不同;利用解码网络随机生成伪样本图像集;利用伪样本图像集和第二图像训练集训练全连接神经网络模型,得到分类模型;分类模型用于确定输入分类模型的图像的所属类别;获取待分类图像;将待分类图像输入分类模型,对待分类图像进行分类,得到待分类图像的类别。本发明的图像分类方法利用变分自编码网络对样本图像进行分解重构,计算并最小化三种损失函数的加权和,利用与最小的加权和对应的变分自编码网络的解码网络生成伪样本图像集,能完全舍弃旧类样本图像数据,降低内存的占用率,还能提高分类准确率和降低时间复杂度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的图像分类方法的流程图;
图2为本发明实施例所提供的图像分类系统的结构图;
图3为本发明实施例所提供的训练特征提取网络的流程图及特征提取网络模型示意图;
图4为本发明实施例所提供的分类模型的结构示意图;
图5为本发明实施例所提供的训练CF-VAE的流程图及伪样本图像生成器示意图;
图6为本发明实施例所提供的计算精馏标签的流程图。
其中,1、输入层;2、特征提取网络;3、softmax层;4、特征提取网络模型;5、编码网络;6、初始解码网络;7、伪样本图像生成器;8、最近邻样本图像均值特征分类器。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种图像分类方法及系统,解决了现有类增量学习方法占用大量的内存的问题。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
本实施例提供一种图像分类方法,图1为本发明实施例所提供的图像分类方法的流程图。参见图1,图像分类方法包括:
步骤101,获取第一图像训练集;第一图像训练集包括:多张第一图像、每张第一图像的类别和类别数量。
步骤102,利用第一图像训练集训练特征提取网络,得到特征提取网络模型;特征提取网络模型用于提取输入特征提取网络模型的图像的图像特征。特征提取网络模型包括2层全连接层;全连接层的激活函数为线性整流函数。
步骤103,利用变分自编码网络对第一图像进行分解重构,得到重构样本图像。
步骤104,利用特征提取网络模型分别提取第一图像的第一图像特征和重构样本图像的重构图像特征。
步骤105,利用第一图像、重构样本图像、第一图像特征和重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和。
步骤105具体包括:
根据公式LR=(x-x')2计算重构损失函数LR。
根据公式LF=(Fx-Fx')2计算特征损失函数LF。
根据公式LALL=LR+LKL+LF计算加权和LALL。
上式中,x表示第一图像,x’表示重构样本图像,Fx表示第一图像特征,Fx'表示第二图像特征,LKL表示KL散度损失函数。
步骤106,多次调整变分自编码网络的权重,更新变分自编码网络后返回步骤103“利用变分自编码网络对第一图像进行分解重构,得到重构样本图像”,并更新加权和,确定更新后的加权和。
步骤107,比较加权和以及多次更新后的加权和,确定最小的加权和。
步骤108,获取与最小的加权和对应的变分自编码网络的解码网络,以及第二图像训练集;第二图像训练集包括:多张第二图像和每张第二图像的类别;第二图像的类别与第一图像的类别不同。
步骤109,利用解码网络随机生成伪样本图像集。
步骤109具体包括:
利用解码网络生成伪样本图像组。
利用特征提取网络模型提取伪样本图像组的伪样本图像特征组;伪样本图像特征组包括伪样本图像组中每张伪样本图像的伪样本图像特征。
根据公式将属于y类的伪样本图像归类到数据组Dy中,式中Dy表示第y类的数据组,xi表示第i张伪样本图像,Fi’表示第i张伪样本图像的伪样本图像特征,uk表示第k类图像的类平均特征向量,t表示第一图像的类别的总数。
返回“利用解码网络生成伪样本图像组”,更新数据组Dy,直至数据组Dy中的伪样本图像数量为第一图像训练集中属于第y类的第一图像的数量的n倍,得到所有类的初始数据组。
获取每张伪样本图像的特征距离;特征距离为伪样本图像的伪样本图像特征与伪样本图像所属类别的类平均特征向量之差;具体为根据公式Li=||Fi'-uk||计算每张伪样本图像的伪样本图像特征与该伪样本图像所属类别的类平均特征向量的特征距离Li,此时uk表示该伪样本图像所属类别的类平均特征向量,即若该伪样本图像属于第1类图像,则k=1,uk表示第1类图像的类平均特征向量。
将初始数据组中的伪样本图像按照特征距离进行排序,得到伪样本图像序列。排列顺序为特征距离由小到大。
获取预设特征距离,将伪样本图像序列中特征距离小于预设特征距离的所有伪样本图像确定为伪样本图像组,伪样本图像集为所有类的伪样本图像组。
步骤110,利用伪样本图像集和第二图像训练集训练全连接神经网络模型,得到分类模型;分类模型用于确定输入分类模型的图像的所属类别。分类模型包括:输入层、隐藏层和输出层;输入层用于输入待分类的图像,输入层为全连接层;隐藏层为特征提取网络模型;输出层为最近邻样本图像均值特征分类器(Nearest-Mean-of-ExemplarsClassification),输出层用于根据特征提取网络模型提取的图像特征对待分类的图像进行分类。
步骤111,获取待分类图像。
步骤112,将待分类图像输入分类模型,对待分类图像进行分类,得到待分类图像的类别。
本实施例提供一种图像分类系统,图2为本发明实施例所提供的图像分类系统的结构图。参见图2,图像分类系统包括:
图像训练集模块201,用于获取第一图像训练集;第一图像训练集包括:多张第一图像、每张第一图像的类别和类别数量。
特征提取网络模型模块202,用于利用第一图像训练集训练特征提取网络,得到特征提取网络模型;特征提取网络模型用于提取输入特征提取网络模型的图像的图像特征。特征提取网络模型包括2层全连接层;全连接层的激活函数为线性整流函数。
重构样本图像模块203,用于利用变分自编码网络对第一图像进行分解重构,得到重构样本图像。
分类特征模块204,用于利用特征提取网络模型分别提取第一图像的第一图像特征和重构样本图像的重构图像特征。
加权和模块205,用于利用第一图像、重构样本图像、第一图像特征和重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和。
加权和模块205具体包括:
重构损失函数单元,用于根据公式LR=(x-x')2计算重构损失函数LR。
特征损失函数单元,用于根据公式LF=(Fx-Fx')2计算特征损失函数LF。
加权和单元,用于根据公式LALL=LR+LKL+LF计算加权和LALL。
上式中,x表示第一图像,x’表示重构样本图像,Fx表示第一图像特征,Fx'表示第二图像特征,LKL表示KL散度损失函数。
更新加权和模块206,用于多次调整变分自编码网络的权重,更新变分自编码网络后执行重构样本图像模块203,并更新加权和,确定更新后的加权和。
最小加权和模块207,用于比较加权和以及多次更新后的加权和,确定最小的加权和。
解码网络模块208,用于获取与最小的加权和对应的变分自编码网络的解码网络,以及第二图像训练集;第二图像训练集包括:多张第二图像和每张第二图像的类别;第二图像的类别与第一图像的类别不同。
伪样本图像集模块209,用于利用解码网络随机生成伪样本图像集。
伪样本图像集模块209具体包括:
伪样本图像组单元,用于利用解码网络生成伪样本图像组。
伪样本图像特征组单元,用于利用特征提取网络模型提取伪样本图像组的伪样本图像特征组;伪样本图像特征组包括伪样本图像组中每张伪样本图像的伪样本图像特征。
归类单元,用于根据公式将属于y类的伪样本图像归类到数据组Dy中,式中Dy表示第y类的数据组,xi表示第i张伪样本图像,Fi’表示第i张伪样本图像的伪样本图像特征,uk表示第k类图像的类平均特征向量,t表示第一图像的类别的总数。
初始数据组单元,用于执行伪样本图像组单元,更新数据组Dy,直至数据组Dy中的伪样本图像数量为第一图像训练集中属于第y类的第一图像的数量的n倍,得到所有类的初始数据组。
特征距离单元,用于获取每张伪样本图像的特征距离;特征距离为伪样本图像的伪样本图像特征与伪样本图像所属类别的类平均特征向量之差。
伪样本图像序列单元,用于将初始数据组中的伪样本图像按照特征距离进行排序,得到伪样本图像序列。
伪样本图像集单元,用于获取预设特征距离,将伪样本图像序列中特征距离小于预设特征距离的所有伪样本图像确定为伪样本图像组,伪样本图像集为所有类的伪样本图像组。
分类模型模块210,用于利用伪样本图像集和第二图像训练集训练全连接神经网络模型,得到分类模型;分类模型用于确定输入分类模型的图像的所属类别。分类模型包括:输入层、隐藏层和输出层;输入层用于输入待分类的图像,输入层为全连接层;隐藏层为特征提取网络模型;输出层为最近邻样本图像均值特征分类器(Nearest-Mean-of-Exemplars Classification),输出层用于根据特征提取网络模型提取的图像特征对待分类的图像进行分类。
待分类图像模块211,用于获取待分类图像。
分类模块212,用于将待分类图像输入分类模型,对待分类图像进行分类,得到待分类图像的类别。
本实施例提供一种基于类增量学习的图像分类方法,包括:
(1)训练全连接神经网络模型,得到分类模型;分类模型用于确定图像所属类别。全连接神经网络模型包括:输入层、隐藏层和输出层;输入层用于输入训练特征提取网络的图像,输入层为全连接层;隐藏层为特征提取网络;输出层为softmax层,全连接神经网络模型用于训练特征提取网络,得到特征提取网络模型。在实际应用中输入层用于输入图像,当输入层位于全连接神经网络模型中用于输入训练特征提取网络的图像,当输入层位于分类模型中用于待分类的图像。
首先,训练全连接神经网络模型,包括:
获取第一图像训练集。第一图像训练集包括:多张第一图像、每张第一图像的类别和图像类别数量,第一图像为真实图像。特征提取网络包括2层全连接层,特征提取网络用于提取图像的图像特征,即将输入真实图像x映像为一组具有D维的图像特征,表示为φ:x→RD,其中φ表示特征提取网络,x表示真实图像,RD表示一组具有D维的图像特征。特征提取网络每层的激活函数均选用更容易学习优化的线性整流函数(Rectified Linear Unit,ReLU),线性整流函数ReLU(x)参见公式(1):
利用第一图像训练集训练特征提取网络,得到特征提取网络模型。图3为本发明实施例所提供的训练特征提取网络的流程图及特征提取网络模型示意图,参见图3,将第一图像训练集中的所有真实图像通过输入层1输入特征提取网络2,得到特征提取网络2提取的第一图像训练集的图像特征。
将特征提取网络2提取的第一图像训练集的图像特征输入softmax层3,得到第一图像训练集中每张真实图像的softmax层3的输出值:
其中,gk(x)表示每张真实图像的softmax层输出值,即每张真实图像被分到第k类的概率;k表示图像类别的序号,k∈{1,...,t};t表示第一图像训练集中图像类别的总数,每个类别对应的权值为w1,...,wt,w1,...,wt∈RD;j表示图像类别序号,j∈{1,…,t};表示第k类图像对应的权值的转置,表示第j类图像对应的权值的转置;φ(x)表示真实图像x通过特征提取网络模型得到的一组具有D维的图像特征;bk表示第k类图像对应的softmax层的偏置项,bj表示第j类图像对应的softmax层的偏置项。softmax层为一层全连接层,具有与图像类别数量一致的输出节点,softmax层将多个输出节点的输出值映射到(0,1)区间内,可以将softmax层的输出值看成真实图像被预测为各个类别的概率,从而根据输出值来对真实图像进行分类,确定真实图像所属类别。
利用softmax层确定的真实图像的所属类别和第一图像训练集对特征提取网络进行训练,获取训练好的特征提取网络的网络参数,并固定训练好的特征提取网络的网络参数得到特征提取网络模型4;具体为:根据softmax层的输出值与真实图像的类别构建交叉熵损失函数,最小化交叉熵损失函数,交叉熵损失函数最小时对应的特征提取网络为训练好的特征提取网络。交叉熵损失函数LC为:
其中,N为每个图像类别中包含的真实图像数量,n表示每个图像类别中真实图像的序号,n∈N;t图像类别的总数,即为softmax层的节点数;k表示图像类别的序号,k∈{1,...,t};pn,k为真实图像的图像类别;gk(n)表示第n张真实图像的softmax层输出值。
其次,根据公式(3)计算第一图像训练集包括的每个类别的类平均特征向量u1,...,ut:
其中,uk表示第k类图像的类平均特征向量;Pk表示属于第k类的真实图像的集合;|Pk|表示属于第k类的真实图像的数量;p表示属于第k类的任一真实图像;φ(p)表示属于第k类的任一真实图像通过特征提取网络模型得到的图像特征。
最后,确定分类模型。图4为本发明实施例所提供的分类模型的结构示意图,参见图4,分类模型包括:输入层1、隐藏层和输出层。输入层用于输入待分类的图像,输入层为全连接层;隐藏层为特征提取网络模型4;输出层为最近邻样本图像均值特征分类器8(Nearest-Mean-of-Exemplars Classification),输出层用于根据特征提取网络模型提取的图像特征对待分类的图像进行分类。最近邻样本图像均值特征分类器根据公式(4)为待分类图像分配与待分类图像最相近的类标签:
其中,y*表示待分类图像的类标签,x1表示待分类图像,φ(x1)表示待分类图像的图像特征。根据待分类图像的类标签确定待分类图像的类别。
本实施例采用的最近邻样本图像均值特征分类器因为没有权重向量,当图像特征改变时,每个类的类平均特征向量都会自动改变,使得最近邻样本图像均值特征分类器对图像特征的改变具有鲁棒性,可以维护一个具有与图像类别数量一致的每个类的类平均特征向量。
步骤(1)训练得到的分类模型可以对第一图像训练集包括的图像类别进行分类:将待分类图像输入分类模型,特征提取网络模型提取待分类图像的图像特征,最近邻样本图像均值特征分类器根据待分类图像的图像特征确定待分类图像的类别。
当图像的类别增加时,传统的基于类增量学习的图像分类方法需要利用旧的第一图像训练集和包括新类别的新图像训练集一起训练分类模型,对分类模型进行更新,使分类模型可以对旧类别和新类别的图像进行的分类。然而旧的第一图像训练集会占用大量的内存,本实施例通过训练伪样本图像生成器,利用伪样本图像生成器生成的伪样本图像集代替旧的第一图像训练集,完全舍弃旧的第一图像训练集,降低内存的占用率。
(2)训练伪样本图像生成器。图5为本发明实施例所提供的训练CF-VAE的流程图及伪样本图像生成器示意图,参见图5,利用变分自编码网络对第一图像训练集的第一图像,即真实图像进行分解重构,得到重构样本图像。变分自编码网络包括编码网络5和解码网络,编码网络5用于将真实图像编码分解为均值μ和方差的对数logσ2;解码网络用于将从均值μ和方差的对数logσ2采样后的正态分布还原为真实图像。编码网络5和解码网络均为包括2层全连接层的全连接神经网络,解码网络和编码网络的激活函数均为sigmoid函数。
利用变分自编码网络对真实图像进行分解重构,得到重构样本图像具体包括:
首先,将真实图像x输入编码网络Φ(x)后能得到x对应的均值μ和方差的对数logσ2,即公式(5):
μ,logσ2=Φ(x) (5)
然后,根据x对应的均值μ和方差的对数logσ2,以及公式(6)从标准正太分布中采样得到的正太分布Z:
Z=μ+ε·σ (6)
上式中ε表示服从均值为0、方差为1的标准正态分布的一组数据(b,d),b表示输入到编码网络的真实图像的数量,d表示与μ维数一致的2维;σ表示真实图像x对应的标准偏差。
最后,将正太分布Z输入初始解码网络ω(Z),对初始解码网络6进行训练得到x的重构样本图像x’,即公式(7):
x'=ω(Z) (7)
利用步骤(1)的特征提取网络模型4分别提取真实图像的第一图像特征Fx和重构样本图像的重构图像特征Fx'。
计算变分自编码器(Variational Auto-Encoder,VAE)的损失函数,VAE本身只有两个损失函数,一个为重构损失函数LR,一个为Kullback-Leibler散度(KL散度)损失函数LKL。
其中重构损失函数LR是为了使解码出来的重构样本图像与真实图像尽可能的一致,根据公式(8)计算重构损失函数:
LR=(x-x')2 (8)
KL散度损失函数描述的是两个概率分布间的差异,因为是要从标准正态分布N(0,1)中采样的Z来解码生成重构样本图像,所以VAE利用KL散度损失函数来让所有真实图像的正态分布p(Z|x)都向标准正态分布N(0,1)看齐,p(Z|x)表示专属于真实图像x的一个独立且多元的正态分布,根据公式(9)计算KL散度损失函数LKL:
上式中,KL(N(μ,σ2)|N(0,1))表示计算N(μ,σ2)与N(0,1)之间的KL散度。
本实施例为传统VAE构建一个新的损失函数:特征损失函数LF,也就是说本实施例的变分自编码网络为基于分类特征的变分自编码器(Variational auto-encoder basedon classification features,简称CF-VAE),分类特征即图像特征。根据公式(10)计算特征损失函数LF:
LF=(Fx-Fx')2 (10)
根据公式(11)计算三种损失函数的加权和LALL:
LALL=LR+LKL+LF (11)
多次调整变分自编码网络的权重,更新变分自编码网络后返回步骤“利用变分自编码网络对真实图像进行分解重构,得到重构样本图像”,更新加权和,比较加权和以及多次更新的加权和,得到最小的加权和。
获取与最小的加权和对应的变分自编码网络的初始解码网络6,以及与最小的加权和对应的初始解码网络6的网络参数,并固定与最小的加权和对应的初始解码网络6的网络参数得到解码网络。解码网络即为训练好的伪样本图像生成器7。
(3)计算精馏标签。本实施例为了尽可能的保留分类模型在旧的图像类别上的性能,为无监督的伪样本图像生成器生成的伪样本图像打上精馏标签。知识精馏一开始提出的目的是为了实现知识迁移,其主要思想是将复杂网络得到的软目标作为总损失的一部分,诱导简单网络的训练,使得简单网络能达到复杂网络的性能。图6为本发明实施例所提供的计算精馏标签的流程图,参见图6,首先,利用伪样本图像生成器7生成伪样本图像:
从标准正态分布N(0,1)中随机生成一组随机数A,A通过伪样本图像生成器Ω得到伪样本图像xi,即xi=Ω(A)。
将伪样本图像xi输入步骤(1)的特征提取网络模型4中得到用于分类的伪样本图像xi的图像特征,将图像特征输入softmax层得到伪样本图像的分类分数,即伪样本图像的精馏标签,计算公式参见公式(12):
y'=g{φ(xi)} (12)
其中,y’表示伪样本图像的精馏标签,g{φ(xi)}表示伪样本图像xi的softmax层输出值,φ(xi)表示伪样本图像xi通过特征提取网络模型4得到的图像特征。
伪样本图像及其精馏标签为接下来训练增加图像类别的分类模型较好的保留了来自旧图像类别的知识及分类的性能。
(4)生成伪样本图像集
因为采用的CF-VAE是无监督模型,且伪样本图像的生成是随机的,随着旧类图像数目的增加,仅靠着CF-VAE模型的随机生成很难准确的把控每个类的伪样本图像数量及其质量。因此,本实施例基于类平均特征向量,为每个类选择与类别最近邻的伪样本图像,伪样本图像与类平均特征向量越接近,越具有代表性,越能更好的保留旧类图像在分类模型上的性能。
设存储的伪样本图像的数据集为Dgen={D1,...,Dt},D1,...,Dt分别表示存储t个类别伪样本图像的数据组,数据集Dgen一开始为空集。
参见步骤(3)利用伪样本图像生成器生成一组伪样本图像,即伪样本图像组:{x1,x2,…,xm}=Ω(A),{x1,x2,...,xm}表示生成的伪样本图像组,x1,x2,...,xm表示伪样本图像组中的伪样本图像,m为伪样本图像的数量。
利用特征提取网络模型提取伪样本图像组的伪样本图像特征组;伪样本图像特征组包括伪样本图像组中每张伪样本图像的伪样本图像特征Fi’:
Fi'=φ(xi),i∈1~m
利用最近邻样本图像均值特征分类器,根据公式(13)将属于y类的伪样本图像归类到数据组Dy中:
式中Dy表示第y类的数据组,y表示类别序号,y∈1~t;xi表示第i张伪样本图像,Fi’表示第i张伪样本图像的伪样本图像特征,uk表示第k类图像的平均图像特征,即第k类图像的类平均特征向量。
返回“利用伪样本图像生成器生成一组伪样本图像”,更新数据集,直至数据集中每组数据组Dy中的伪样本图像数量为对应旧类别的图像数目的n倍,或数据组Dy中的伪样本图像数量大于预设伪样本图像数量,得到初始数据集。本实施例中第一图像训练集中的图像为旧类别的图像,即每组数据组Dy中存储的伪样本图像数量为第一图像训练集第y类图像数量的n倍。
获取每张伪样本图像的特征距离;特征距离为伪样本图像的伪样本图像特征与伪样本图像所属类别的类平均特征向量之差;具体为根据公式Li=||Fi'-uk||计算每张伪样本图像的伪样本图像特征与该伪样本图像所属类别的类平均特征向量的特征距离Li,此时uk表示该伪样本图像所属类别的类平均特征向量,即若该伪样本图像属于第1类图像,则k=1,uk表示第1类图像的类平均特征向量。
将每组数据组Dy中的伪样本图像按照特征距离由小到大的顺序进行排序,得到伪样本图像序列。
获取预设特征距离,将伪样本图像序列中特征距离小于预设特征距离的所有伪样本图像确定为伪样本图像组;本实施例中预设特征距离为伪样本图像序列第1/n张的伪样本图像的特征距离,即保留伪样本图像序列前1/n的伪样本图像,得到伪样本图像组,保证了最终伪样本图像集中每个类别的伪样本图像的数量与旧类别图像的数量一致。
通过公式(12)计算伪样本图像组中每张伪样本图像的精馏标签,为所有类的伪样本图像组中的伪样本图像标记精馏标签,伪样本图像集为标记精馏标签的所有类的伪样本图像组。
(5)更新分类模型
获取第二图像训练集;第二图像训练集包括的图像类别与第一图像训练集包括的图像类别不同。
根据步骤(1),用步骤(4)生成的伪样本图像集和第二图像训练集替换第一图像训练集,训练全连接神经网络模型,更新分类模型,更新后的分类模型可以分类的类别包括第一图像训练集的图像类别和第二图像训练集的图像类别。
当不需要更新图像类别时,获取待分类图像。
将待分类图像输入分类模型,对待分类图像进行分类,得到待分类图像的类别。
当需要更新图像类别时,先根据步骤(5)更新分类模型后,将待分类图像输入更新后的分类模型,得到待分类图像的类别。
本实施例中的网络参数包括每层全连接层的权重,图3-图6中的数字表示每层的节点数量,例如图3中输入层的节点数量为784;图5中提取的第一图像特征的节点数量为256,即每张第一图像的图像特征为256维;图6中输入的A的节点数量为2,即标准正态分布N(0,1)中随机生成的一组随机数A的维数为2维。图3-图6中的FC表示全连接神经网络,本实施例中特征提取网络模型包括2层全连接神经网络层FC,第一层全连接神经网络层FC的节点数量为512,第二层全连接神经网络层FC的节点数量为256。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种图像分类方法,其特征在于,包括:
获取第一图像训练集;所述第一图像训练集包括:多张第一图像和每张所述第一图像的类别;
利用所述第一图像训练集训练特征提取网络,得到特征提取网络模型;所述特征提取网络模型用于提取输入所述特征提取网络模型的图像的图像特征;
利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像;
利用所述特征提取网络模型分别提取所述第一图像的第一图像特征和所述重构样本图像的重构图像特征;
利用所述第一图像、所述重构样本图像、所述第一图像特征和所述重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和;
多次调整所述变分自编码网络的权重,更新所述变分自编码网络后返回“利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像”,并更新所述加权和,确定更新后的加权和;
比较所述加权和以及多次所述更新后的加权和,确定最小的加权和;
获取与所述最小的加权和对应的所述变分自编码网络的解码网络,以及第二图像训练集;所述第二图像训练集包括:多张第二图像和每张所述第二图像的类别;所述第二图像的类别与所述第一图像的类别不同;
利用所述解码网络随机生成伪样本图像集,具体包括:
利用所述解码网络生成伪样本图像组;
利用所述特征提取网络模型提取所述伪样本图像组的伪样本图像特征组;伪样本图像特征组包括所述伪样本图像组中每张伪样本图像的伪样本图像特征;
根据公式将属于y类的伪样本图像归类到数据组Dy中,式中Dy表示第y类的数据组,xi表示第i张所述伪样本图像,Fi’表示第i张所述伪样本图像的伪样本图像特征,uk表示第k类图像的类平均特征向量,t表示所述第一图像的类别的总数;
返回“利用所述解码网络生成伪样本图像组”,更新所述数据组Dy,直至所述数据组Dy中的伪样本图像数量为所述第一图像训练集中属于第y类的第一图像的数量的n倍,得到所有类的初始数据组;
获取每张所述伪样本图像的特征距离;所述特征距离为所述伪样本图像的伪样本图像特征与所述伪样本图像所属类别的类平均特征向量之差;
将所述初始数据组中的伪样本图像按照所述特征距离进行排序,得到伪样本图像序列;
获取预设特征距离,将所述伪样本图像序列中特征距离小于所述预设特征距离的所有伪样本图像确定为伪样本图像组,所述伪样本图像集为所有类的伪样本图像组;
利用所述伪样本图像集和所述第二图像训练集训练全连接神经网络模型,得到分类模型;所述分类模型用于确定输入所述分类模型的图像的所属类别;
获取待分类图像;
将所述待分类图像输入所述分类模型,对所述待分类图像进行分类,得到所述待分类图像的类别。
2.根据权利要求1所述的图像分类方法,其特征在于,所述特征提取网络模型包括2层全连接层;所述全连接层的激活函数为线性整流函数。
3.根据权利要求2所述的图像分类方法,其特征在于,所述利用所述第一图像、所述重构样本图像、所述第一图像特征和所述重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和,具体包括:
根据公式LR=(x-x')2计算所述重构损失函数LR;
根据公式LF=(Fx-Fx')2计算所述特征损失函数LF;
根据公式LALL=LR+LKL+LF计算所述加权和LALL;
上式中,x表示所述第一图像,x’表示所述重构样本图像,Fx表示所述第一图像特征,Fx'表示所述第二图像特征,LKL表示所述KL散度损失函数。
4.根据权利要求1所述的图像分类方法,其特征在于,所述分类模型包括:输入层、隐藏层和输出层;
所述输入层用于输入待分类的图像;
所述隐藏层为所述特征提取网络模型;
所述输出层用于根据所述特征提取网络模型提取的图像特征对所述待分类图像进行分类。
5.一种图像分类系统,其特征在于,包括:
图像训练集模块,用于获取第一图像训练集;所述第一图像训练集包括:多张第一图像和每张所述第一图像的类别;
特征提取网络模型模块,用于利用所述第一图像训练集训练特征提取网络,得到特征提取网络模型;所述特征提取网络模型用于提取输入所述特征提取网络模型的图像的图像特征;
重构样本图像模块,用于利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像;
分类特征模块,用于利用所述特征提取网络模型分别提取所述第一图像的第一图像特征和所述重构样本图像的重构图像特征;
加权和模块,用于利用所述第一图像、所述重构样本图像、所述第一图像特征和所述重构图像特征,计算重构损失函数、KL散度损失函数和特征损失函数的加权和;
更新加权和模块,用于多次调整所述变分自编码网络的权重,更新所述变分自编码网络后返回“利用变分自编码网络对所述第一图像进行分解重构,得到重构样本图像”,并更新所述加权和,确定更新后的加权和;
最小加权和模块,用于比较所述加权和以及多次所述更新后的加权和,确定最小的加权和;
解码网络模块,用于获取与所述最小的加权和对应的所述变分自编码网络的解码网络,以及第二图像训练集;所述第二图像训练集包括:多张第二图像和每张所述第二图像的类别;所述第二图像的类别与所述第一图像的类别不同;
伪样本图像集模块,用于利用所述解码网络随机生成伪样本图像集,具体包括:
伪样本图像组单元,用于利用所述解码网络生成伪样本图像组;
伪样本图像特征组单元,用于利用所述特征提取网络模型提取所述伪样本图像组的伪样本图像特征组;伪样本图像特征组包括所述伪样本图像组中每张伪样本图像的伪样本图像特征;
归类单元,用于根据公式将属于y类的伪样本图像归类到数据组Dy中,式中Dy表示第y类的数据组,xi表示第i张所述伪样本图像,Fi’表示第i张所述伪样本图像的伪样本图像特征,uk表示第k类图像的类平均特征向量,t表示所述第一图像的类别的总数;
初始数据组单元,用于返回“利用所述解码网络生成伪样本图像组”,更新所述数据组Dy,直至所述数据组Dy中的伪样本图像数量为所述第一图像训练集中属于第y类的第一图像的数量的n倍,得到所有类的初始数据组;
特征距离单元,用于获取每张所述伪样本图像的特征距离;所述特征距离为所述伪样本图像的伪样本图像特征与所述伪样本图像所属类别的类平均特征向量之差;
伪样本图像序列单元,用于将所述初始数据组中的伪样本图像按照所述特征距离进行排序,得到伪样本图像序列;
伪样本图像集单元,用于获取预设特征距离,将所述伪样本图像序列中特征距离小于所述预设特征距离的所有伪样本图像确定为伪样本图像组,所述伪样本图像集为所有类的伪样本图像组;
分类模型模块,用于利用所述伪样本图像集和所述第二图像训练集训练全连接神经网络模型,得到分类模型;所述分类模型用于确定输入所述分类模型的图像的所属类别;
待分类图像模块,用于获取待分类图像;
分类模块,用于将所述待分类图像输入所述分类模型,对所述待分类图像进行分类,得到所述待分类图像的类别。
6.根据权利要求5所述的图像分类系统,其特征在于,所述特征提取网络模型包括2层全连接层;所述全连接层的激活函数为线性整流函数。
7.根据权利要求6所述的图像分类系统,其特征在于,所述加权和模块,具体包括:
重构损失函数单元,用于根据公式LR=(x-x')2计算所述重构损失函数LR;
特征损失函数单元,用于根据公式LF=(Fx-Fx')2计算所述特征损失函数LF;
加权和单元,用于根据公式LALL=LR+LKL+LF计算所述加权和LALL;
上式中,x表示所述第一图像,x’表示所述重构样本图像,Fx表示所述第一图像特征,Fx'表示所述第二图像特征,LKL表示所述KL散度损失函数。
8.根据权利要求5所述的图像分类系统,其特征在于,所述分类模型包括:输入层、隐藏层和输出层;
所述输入层用于输入待分类的图像;
所述隐藏层为所述特征提取网络模型;
所述输出层用于根据所述特征提取网络模型提取的图像特征对所述待分类图像进行分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010154538.3A CN111310852B (zh) | 2020-03-08 | 2020-03-08 | 一种图像分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010154538.3A CN111310852B (zh) | 2020-03-08 | 2020-03-08 | 一种图像分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111310852A CN111310852A (zh) | 2020-06-19 |
CN111310852B true CN111310852B (zh) | 2022-08-12 |
Family
ID=71162028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010154538.3A Active CN111310852B (zh) | 2020-03-08 | 2020-03-08 | 一种图像分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310852B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113139612A (zh) * | 2021-05-07 | 2021-07-20 | 上海商汤临港智能科技有限公司 | 图像分类方法、分类网络的训练方法和相关产品 |
CN113313152B (zh) * | 2021-05-19 | 2023-09-22 | 北京大学 | 基于优化诱导的平衡神经网络模型的图像分类方法 |
CN113449781B (zh) * | 2021-06-17 | 2023-04-07 | 上海深至信息科技有限公司 | 一种甲状腺结节分类模型的生成方法及系统 |
CN113435488B (zh) * | 2021-06-17 | 2023-11-07 | 深圳大学 | 一种图像采样概率提升方法及其应用 |
CN113537400B (zh) * | 2021-09-14 | 2024-03-19 | 浙江捷瑞电力科技有限公司 | 一种基于分支神经网络的边缘计算节点的分配与退出方法 |
CN116910752B (zh) * | 2023-07-17 | 2024-03-08 | 重庆邮电大学 | 一种基于大数据的恶意代码检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8983941B1 (en) * | 2011-03-28 | 2015-03-17 | Google Inc. | Visual content retrieval |
CN108256561A (zh) * | 2017-12-29 | 2018-07-06 | 中山大学 | 一种基于对抗学习的多源域适应迁移方法及系统 |
CN110163041A (zh) * | 2018-04-04 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 视频行人再识别方法、装置及存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016037844A1 (en) * | 2014-09-09 | 2016-03-17 | Thomson Licensing | Method and apparatus for image retrieval with feature learning |
CN106126581B (zh) * | 2016-06-20 | 2019-07-05 | 复旦大学 | 基于深度学习的手绘草图图像检索方法 |
CN107180248A (zh) * | 2017-06-12 | 2017-09-19 | 桂林电子科技大学 | 基于联合损失增强网络的高光谱图像分类方法 |
CN108776806A (zh) * | 2018-05-08 | 2018-11-09 | 河海大学 | 基于变分自编码器和密度峰值的混合属性数据聚类方法 |
CN108875818B (zh) * | 2018-06-06 | 2020-08-18 | 西安交通大学 | 基于变分自编码机与对抗网络结合的零样本图像分类方法 |
CN110084156B (zh) * | 2019-04-12 | 2021-01-29 | 中南大学 | 一种步态特征提取方法及基于步态特征的行人身份识别方法 |
CN110472089B (zh) * | 2019-08-16 | 2022-03-11 | 重庆邮电大学 | 一种基于对抗生成网络的红外和可见光图像检索方法 |
CN110580501B (zh) * | 2019-08-20 | 2023-04-25 | 天津大学 | 一种基于变分自编码对抗网络的零样本图像分类方法 |
-
2020
- 2020-03-08 CN CN202010154538.3A patent/CN111310852B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8983941B1 (en) * | 2011-03-28 | 2015-03-17 | Google Inc. | Visual content retrieval |
CN108256561A (zh) * | 2017-12-29 | 2018-07-06 | 中山大学 | 一种基于对抗学习的多源域适应迁移方法及系统 |
CN110163041A (zh) * | 2018-04-04 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 视频行人再识别方法、装置及存储介质 |
Non-Patent Citations (1)
Title |
---|
冯敏等.基于生成对抗网络的跨模态行人重识别研究.《现代信息科技》.2020,(第04期), * |
Also Published As
Publication number | Publication date |
---|---|
CN111310852A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111310852B (zh) | 一种图像分类方法及系统 | |
Creswell et al. | Inverting the generator of a generative adversarial network | |
Wang et al. | Instance credibility inference for few-shot learning | |
CN110689086B (zh) | 基于生成式对抗网络的半监督高分遥感图像场景分类方法 | |
CN111291836B (zh) | 一种生成学生网络模型的方法 | |
CN113469356A (zh) | 一种基于迁移学习的改进vgg16网络猪的身份识别方法 | |
CN111078911B (zh) | 一种基于自编码器的无监督哈希方法 | |
CN111538761A (zh) | 基于注意力机制的点击率预测方法 | |
CN113065649B (zh) | 一种复杂网络拓扑图表示学习方法、预测方法及服务器 | |
CN109272332B (zh) | 一种基于递归神经网络的客户流失预测方法 | |
CN112784929B (zh) | 一种基于双元组扩充的小样本图像分类方法及装置 | |
CN112417289B (zh) | 一种基于深度聚类的资讯信息智能推荐方法 | |
CN113705811B (zh) | 模型训练方法、装置、计算机程序产品及设备 | |
CN114612721A (zh) | 基于多层次自适应特征融合类增量学习的图像分类方法 | |
CN111898461A (zh) | 一种时序行为片段生成方法 | |
CN114186568A (zh) | 一种基于关系编码和层次注意力机制的图像段落描述方法 | |
CN114780767A (zh) | 一种基于深度卷积神经网络的大规模图像检索方法及系统 | |
CN114780866A (zh) | 一种基于时空上下文兴趣学习模型的个性化智能推荐方法 | |
CN112528077A (zh) | 基于视频嵌入的视频人脸检索方法及系统 | |
Jenny Li et al. | Evaluating deep learning biases based on grey-box testing results | |
CN112541530A (zh) | 针对聚类模型的数据预处理方法及装置 | |
CN117154256A (zh) | 锂电池的电化学修复方法 | |
CN110288002B (zh) | 一种基于稀疏正交神经网络的图像分类方法 | |
CN113344060B (zh) | 文本分类模型训练方法、诉讼状分类方法及装置 | |
CN113344069B (zh) | 一种基于多维关系对齐的无监督视觉表征学习的图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20200619 Assignee: Guangxi Yiyoumi Information Technology Co.,Ltd. Assignor: GUILIN University OF ELECTRONIC TECHNOLOGY Contract record no.: X2023980045641 Denomination of invention: A Method and System for Image Classification Granted publication date: 20220812 License type: Common License Record date: 20231103 |