CN111539448B - 一种基于元学习的少样本图像分类方法 - Google Patents

一种基于元学习的少样本图像分类方法 Download PDF

Info

Publication number
CN111539448B
CN111539448B CN202010188012.7A CN202010188012A CN111539448B CN 111539448 B CN111539448 B CN 111539448B CN 202010188012 A CN202010188012 A CN 202010188012A CN 111539448 B CN111539448 B CN 111539448B
Authority
CN
China
Prior art keywords
images
training
training set
image
surf
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010188012.7A
Other languages
English (en)
Other versions
CN111539448A (zh
Inventor
刘伟鑫
周松斌
刘忆森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Institute of Intelligent Manufacturing
Original Assignee
Guangdong Institute of Intelligent Manufacturing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Institute of Intelligent Manufacturing filed Critical Guangdong Institute of Intelligent Manufacturing
Priority to CN202010188012.7A priority Critical patent/CN111539448B/zh
Publication of CN111539448A publication Critical patent/CN111539448A/zh
Application granted granted Critical
Publication of CN111539448B publication Critical patent/CN111539448B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种基于元学习的少样本图像分类方法,涉及计算机视觉图像识别领域,包括以下步骤:S1:将图像集分为训练集、测试集;S2:提取训练集所有图像的surf特征,采用聚类方法对surf特征做聚类,得到训练集视觉词典;S3:计算训练集每一幅图像的视觉词袋,形成训练集视觉词袋检索库;S4:将训练集、测试集分别划分为多个子任务,每个子任务包括支撑集、查询集;S5:训练过程:采用MAML算法,对训练集多个子任务进行元训练,学习一个最优的初始参数;S6:测试过程:每次测试一个测试集子任务的查询集图像。本发明与传统的方案相比具备少样本快速学习、泛化能力。

Description

一种基于元学习的少样本图像分类方法
技术领域
本发明涉及计算机视觉图像识别领域,尤其是涉及一种基于元学习的少样本图像分类方法。
背景技术
近年来深度学习在学术界、科技界应用广泛,尤其在图像领域,目前已经在图像分类领域取得较大进展,取得不错成效。深度学习能取得了巨大成功,最为关键的因素就是利用大量的数据去驱动模型训练,使其获得良好的测试效果。但是在实际应用中深度学习算法难以实施,因为深度学习训练需要大量的标记样本,但拥有大量数据样本的企业毕竟是少数,大部分企业并没有那么多标记样本;其次模型训练耗时,对于有些检测分类要求频繁变化的应用,每次更改一次检测要求,就需要重新训练大量样本,这大大增加了时间成本。
元学习是近年来深度学习领域最热门的研究方向之一,其最主要应用于少样本学习,其主要通过元训练过程学会学习能力,使网络模型对新的少样本具备快速学习泛化的能力。
从少量数据中快速学习和适应的能力对于人工智能至关重要。深度学习方法可以通过元学习“利用之前的经验学习如何学习”的思想来解决少样本学习问题,从而弥补其在样本量少的情况下无法快速泛化和继续学习的缺点。
发明内容
有鉴于此,有必要针对上述的问题,提供一种基于元学习的少样本图像分类方法,采用MAML框架算法进行元训练,实现在少样本训练下完成图像分类的方法。
为实现上述目的,本发明是根据以下技术方案实现的:
一种基于元学习的少样本图像分类方法,包括以下步骤:
步骤S1:将图像集分为训练集、测试集;
步骤S2:提取训练集所有图像的surf特征,采用kmeans聚类方法对训练集所有图像的surf特征做聚类,形成k个簇,得到训练集视觉词典,同时得到聚类分类器k-classify;
步骤S3:计算训练集每一幅图像的视觉词袋,形成训练集视觉词袋检索库;
步骤S4:将训练集、测试集分别划分为多个子任务,每个子任务包括支撑集、查询集;
步骤S5:训练过程:采用MAML算法,对训练集多个子任务进行元训练,学习一个最优的初始参数;
步骤S6:测试过程:通过视觉词袋技术从训练集视觉词袋检索库中找出与测试集子任务支撑集图像相似的图像,用相似图像对网络模型进行预训练更新参数,再用子任务的支撑集图像进行训练更新模型参数,最后用更新完参数的网络模型对测试集子任务查询集图像进行测试,每次测试一个测试集子任务的查询集图像。
进一步地,在步骤S1中,所述训练集、测试集包括不同种类的图像,所述训练集的图像种类、数量多于所述测试集的图像种类、数量。
进一步地,步骤S2具体包括以下步骤:
步骤S21:计算训练集所有图像的surf特征,统计训练集每一幅图像surf特征数量,统计训练集所有图像surf特征数量的众数k1
步骤S22:计算训练集所有图像的surf特征数量的平均数k2,计算公式如下:
k2=Sumsurf/C  (1)
其中Sumsurf是训练集所有图像surf特征数量,C为训练集图像数量;
步骤S23:确定聚类方法kmeans的参数k,计算公式如下:
Figure BDA0002414871650000021
步骤S24:采用kmeans聚类方法对训练集所有图像的surf特征向量进行聚类,最终形成k个簇,每个簇就是一个视觉单词,同时得到聚类分类器k-classify。
进一步地,步骤S3具体包括以下步骤:
步骤S31:计算训练集每一幅图像的surf特征,采用步骤S2中的聚类分类器k-classify判断每一幅图像的每一个surf特征对应步骤S2中训练集视觉词典中的视觉单词,即计算surf特征向量距离k-classify聚类最近的簇;
步骤S32:统计每幅图像的视觉词袋,将训练集所有图像的视觉词袋集合成一个数据库,形成训练集的视觉词袋检索库。
进一步地,在步骤S4中,所述将训练集划分为多个子任务的具体步骤为:从训练集中随机选取N种图像,每种图像随机抽取K+Q张图像;支撑集在N种图像中每种抽取K张图像,故支撑集包含N*K张图像,包含N种图像,每种图像K张;查询集在N种图像中每种抽取剩余的Q张图像,故查询集包含N*Q张图像,包含N种图像,每种图像Q张;支撑集和查询集的图像种类一样,支撑集和查询集图像不重复;
所述将测试集划分为多个子任务的具体步骤与所述将训练集划分为多个子任务的具体步骤相同。
进一步地,步骤S5具体包括以下步骤:
步骤S51:随机初始化模型参数;
步骤S52:从训练集采样子任务;
步骤S53:对每一个子任务求梯度,并对模型的参数进行第一次梯度更新;
步骤S54:根据步骤S53更新的参数,对模型进行第二次梯度更新;
步骤S55:不断重复步骤S52至步骤S54,直至完成迭代循环,学习到一个最优的初始参数。
进一步地,步骤S6具体包括以下步骤:
步骤S61:网络模型采用步骤S5训练过程得到的最优初始参数,对测试集一个子任务的支撑集图像提取surf特征;
步骤S62:采用步骤S2得到的聚类分类器k-classify判断支撑集图像的每一个surf特征对应步骤S2训练集视觉词典中的视觉单词,统计得到支撑集图像的视觉词袋;
步骤S63:将支撑集图像的视觉词袋与训练集视觉词袋检索库的所有图像的视觉词袋进行余弦相似度比较,每一个图像的视觉词袋是一个k维特征向量,最终得到与每一张支撑集图像最相似的10张图像,相似图像的训练学习率按如下公式计算得出:
Figure BDA0002414871650000041
其中,l为学习率,S余弦相似度,i为图像序号;
步骤S64:将得到的所有相似图像打乱顺序输入到网络模型更新参数,再用测试集子任务的支撑集图像更新网络模型参数,学习率为0.02;
步骤S65:用更新参数后的网络模型对测试集子任务的查询集图像进行分类测试。
进一步地,在上述步骤S61至步骤S64中,所述支撑集图像为M张,所述相似图像为M*10张,其中,M为大于或者等于1的正整数。
与现有技术相比,本发明的优点和积极效果至少包括:
(1)相比目前的深度学习技术,具备快速学习、泛化能力;
(2)相比目前的深度学习技术,本方法只需要少量样本就能取得较高的准确率;
(3)适用于其他图像分类任务,具有一定的通用性。
本发明采用MAML框架算法进行元训练,得到最优初始参数,然后通过视觉词袋技术从训练集视觉词袋库中找出与测试集子任务支撑图像相似的图像,用相似图像对网络模型进行预训练更新参数,再用子任务的支撑集图像进行训练更新模型参数,最后用更新完参数的网络模型对子任务查询集图像进行测试,具备少样本快速学习、泛化能力。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种基于元学习的少样本图像分类方法的流程示意图;
图2是本发明一种基于元学习的少样本图像分类方法所使用的MAML算法采用的网络结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本发明提供了一种基于元学习的少样本图像分类方法,包括以下步骤:
步骤S1:将图像集分为训练集、测试集;
步骤S2:提取训练集所有图像的surf特征,采用kmeans聚类方法对训练集所有图像的surf特征做聚类,形成k个簇,得到训练集视觉词典(视觉词典是训练集所有图像的surf特征聚类成k个视觉单词的词典,所有视觉单词组成视觉词典),同时得到聚类分类器k-classify;
步骤S3:计算训练集每一幅图像的视觉词袋(视觉词袋是一种图像的特征表示方式,这里是指图像由视觉词典中的若干个视觉单词表示,一般是统计视觉词典中的视觉单词在图像中出现的频率,用视觉词汇直方图表示),形成训练集视觉词袋检索库;
步骤S4:将训练集、测试集分别划分为多个子任务,每个子任务包括支撑集、查询集;
步骤S5:训练过程:采用MAML算法,对训练集多个子任务进行元训练,学习一个最优的初始参数;
步骤S6:测试过程:通过视觉词袋技术从训练集视觉词袋检索库中找出与测试集子任务支撑集图像相似的图像,用相似图像对网络模型进行预训练更新参数,再用子任务的支撑集图像进行训练更新模型参数,最后用更新完参数的网络模型对测试集子任务查询集图像进行测试,每次测试一个测试集子任务的查询集图像。
进一步地,在步骤S1中,所述训练集、测试集包括不同种类的图像,所述训练集的图像种类、数量多于所述测试集的图像种类、数量。
进一步地,步骤S2具体包括以下步骤:
步骤S21:计算训练集所有图像的surf特征,统计训练集每一幅图像surf特征数量,统计训练集所有图像surf特征数量的众数k1
步骤S22:计算训练集所有图像的surf特征数量的平均数k2,计算公式如下:
k2=Sumsurf/C  (1)
其中Sumsurf是训练集所有图像surf特征数量,C为训练集图像数量;
步骤S23:确定聚类方法kmeans的参数k,计算公式如下:
Figure BDA0002414871650000061
步骤S24:采用kmeans聚类方法对训练集所有图像的surf特征向量进行聚类,最终形成k个簇,每个簇就是一个视觉单词,同时得到聚类分类器k-classify。
进一步地,步骤S3具体包括以下步骤:
步骤S31:计算训练集每一幅图像的surf特征,采用步骤S2中的聚类分类器k-classify判断每一幅图像的每一个surf特征对应步骤S2中训练集视觉词典中的视觉单词,即计算surf特征向量距离k-classify聚类最近的簇;
步骤S32:统计每幅图像的视觉词袋,将训练集所有图像的视觉词袋集合成一个数据库,形成训练集的视觉词袋检索库。
进一步地,在步骤S4中,所述将训练集划分为多个子任务的具体步骤为:从训练集中随机选取N种图像,每种图像随机抽取K+Q张图像;支撑集在N种图像中每种抽取K张图像,故支撑集包含N*K张图像,包含N种图像,每种图像K张;查询集在N种图像中每种抽取剩余的Q张图像,故查询集包含N*Q张图像,包含N种图像,每种图像Q张;支撑集和查询集的图像种类一样,支撑集和查询集图像不重复;
所述将测试集划分为多个子任务的具体步骤与所述将训练集划分为多个子任务的具体步骤相同。
进一步地,步骤S5具体包括以下步骤:
步骤S51:随机初始化模型参数;
步骤S52:从训练集采样子任务;
步骤S53:对每一个子任务求梯度,并对模型的参数进行第一次梯度更新;
步骤S54:根据步骤S53更新的参数,对模型进行第二次梯度更新;
步骤S55:不断重复步骤S52至步骤S54,直至完成迭代循环,学习到一个最优的初始参数;
如图2所示,具体地,在步骤S5中,所采用的MAML算法采用的网络模型为:包括5个模块,第一个到第四个模块均包含1个卷积层,卷积核为3*3,32个,1个最大池化层,池化核大小为2*2,激活函数采用ReLU;第五个模块是一个全连接层、一个输出层,全连接层800个节点,输出层是5个输出节点(输出节点个数可根据分类种数调整,如10分类,就10个输出节点)。
进一步地,步骤S6具体包括以下步骤:
步骤S61:网络模型采用步骤S5训练过程得到的最优初始参数,对测试集一个子任务的支撑集图像提取surf特征;
步骤S62:采用步骤S2得到的聚类分类器k-classify判断支撑集图像的每一个surf特征对应步骤S2训练集视觉词典中的视觉单词,统计得到支撑集图像的视觉词袋;
步骤S63:将支撑集图像的视觉词袋与训练集视觉词袋检索库的所有图像的视觉词袋进行余弦相似度比较,每一个图像的视觉词袋是一个k维特征向量,最终得到与每一张支撑集图像最相似的10张图像,相似图像的训练学习率按如下公式计算得出:
Figure BDA0002414871650000081
其中,l为学习率,S余弦相似度,i为图像序号;
步骤S64:将得到的所有相似图像打乱顺序(防止过拟合或者不收敛,提高模型泛化能力))输入到网络模型更新参数,再用测试集子任务的支撑集图像更新网络模型参数,学习率为0.02;
步骤S65:用更新参数后的网络模型对测试集子任务的查询集图像进行分类测试。
进一步地,在上述步骤S61至步骤S64中,所述支撑集图像为M张,所述相似图像为M*10张,其中,M为大于或者等于1的正整数。
实施例2
为对本发明内容进行具体说明,本实施例以ChestX-ray14数据集作一个3分类的问题作实例。
需要说明的是,本实施例中所使用的具体数字,仅仅是本实施例中所使用的一组可能的或较优的搭配,但并不能因此而理解为对本发明专利范围的限制;应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
本实施例提供一种基于元学习的少样本图像分类方法,包括以下步骤:
步骤S1:ChestX-ray14数据集一共有14类肺部疾病图片,包括(肺不张、变实、浸润、气胸、水肿、肺气肿、纤维变性、积液、肺炎、胸膜增厚、心脏肥大、结节、肿块和疝气),将ChestX-ray14图像集划分为训练集、测试集,其中训练集11类图像,测试集3类图像,将所有图像尺寸归一化到84*84。
步骤S2:提取训练集所有图像的surf特征,采用kmeans聚类方法对训练集所有图像的surf特征做聚类,形成k个簇(一个簇即是一个视觉单词),得到训练集视觉词典,同时得到聚类分类器k-classify;具体步骤如下:
步骤S21:计算训练集所有图像的surf特征,统计训练集每一幅图像surf特征数量,统计训练集所有图像surf特征数量的众数k1
步骤S22:计算训练集所有图像的surf特征数量的平均数k2,计算公式如下:
k2=Sumsurf/C  (1)
其中Sumsurf是训练集所有图像surf特征数量,C为训练集图像数量;
步骤S23:确定聚类方法kmeans的参数k,计算公式如下:
Figure BDA0002414871650000091
步骤S24:采用kmeans聚类方法对训练集所有图像的surf特征向量进行聚类,最终形成k个簇,每个簇就是一个视觉单词,同时得到聚类分类器k-classify。
步骤S3:计算训练集每一幅图像的视觉词袋,形成训练集视觉词袋检索库;具体包括以下步骤:
步骤S31:计算训练集每一幅图像的surf特征,采用步骤S2中的聚类分类器k-classify判断每一幅图像的每一个surf特征对应步骤S2中训练集视觉词典中的视觉单词,即计算surf特征向量距离k-classify聚类最近的簇;
步骤S32:统计每幅图像的视觉词袋,将训练集所有图像的视觉词袋集合成一个数据库,形成训练集的视觉词袋检索库。
步骤S4:将训练集、测试集分别划分为多个子任务,每个子任务包括支撑集、查询集;具体步骤如下:
利用训练集制作200000子任务,每个子任务包括支撑集、查询集,每个子任务制作规则如下:从训练集中随机选取3种图像,每种图像随机抽取16张图像,其中支撑集每种图像抽取1张图像,故支撑集包含3张图像,包含3种图像,每种图像1张;查询集取出每种图像剩余的15张图像,故查询集包含45张图像,包含3种图像,每种图像15张,支撑集和查询集的图像种类一样,支撑集和查询集图像不重复;
同理,测试集划分为200子任务,每个子任务包括支撑集、查询集,每个子任务制作规则如下:从测试集中随机选取3种图像,每种图像随机抽取16张图像,其中支撑集每种图像抽取1张图像,故支撑集包含3张图像,包含3种图像,每种图像1张;查询集取出每种图像剩余的15张图像,故查询集包含45张图像,包含3种图像,每种图像15张,支撑集和查询集的图像种类一样,支撑集和查询集图像不重复。
步骤S5:训练过程:采用MAML算法,对训练集多个子任务进行元训练,学习一个最优的初始参数;具体包括以下步骤:
步骤S51:随机初始化模型参数;
步骤S52:从训练集采样子任务;
步骤S53:对每一个子任务求梯度,并对模型的参数进行第一次梯度更新;
步骤S54:根据步骤S53更新的参数,对模型进行第二次梯度更新;
步骤S55:不断重复步骤S52至步骤S54,直至完成迭代循环,学习到一个最优的初始参数。
具体地,在步骤S5中,所采用的MAML算法采用的网络模型为:包括5个模块,第一个到第四个模块均包含1个卷积层,卷积核为3*3,32个,1个最大池化层,池化核大小为2*2,激活函数采用ReLU;第五个模块是一个全连接层、一个输出层,全连接层800个节点,输出层是3个输出节点。
步骤S6:测试过程,对每一个子任务采用如下测试方法:网络模型使用步骤S5训练过程得到的最优初始参数,对测试集一个子任务的支撑集图像提取surf特征,采用步骤S2的聚类分类器k-classify判断支撑集图像(这里有3张)的每一个surf特征对应步骤S2中训练集视觉词典的视觉单词,统计得到支撑集图像的视觉词袋,这里有3张图像的视觉词袋,然后将测试集一个子任务的支撑集图像的视觉词袋与训练集视觉词袋检索库中的每张图像的视觉词袋(每一个图像的视觉词词袋是一个k维特征向量)进行余弦相似度比较,最终得到与支撑集图像最相似的10张图像,这里我们有3张支撑集图像,每张图像有10张相似图像,故有30张相似图像,然后将30张图像打乱顺序,每张图像的训练学习率按如下公式(3)计算得出,然后将30张图像依次输入到网络,更新网络参数,然后再用子任务的支撑集图像(3张)输入到网络更新网络参数,学习率为0.02,最后将更新参数后的网络模型对子任务的查询集图像进行测试。
Figure BDA0002414871650000111
其中,l为学习率,S余弦相似度,i为图像序号。
以下表格1是本发明方法和SVM、AlexNet方法进行200次子任务测试的结果,每次测试要求如下:从ChestX-ray14中的三种肺炎疾病图片(固定的三种)每种随机抽取16张,其中每种图片的训练图片为1张,剩下的15张为测试图片,故3种图像测试图片总共45张。
表1三种方法测试结果对比
Figure BDA0002414871650000112
由上表1可以看出,本发明方法在少样本训练的情况下,准确率远远高于传统SVM以及深度学习方法AlexNet。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

Claims (7)

1.一种基于元学习的少样本图像分类方法,其特征在于,包括以下步骤:
步骤S1:将图像集分为训练集、测试集;
步骤S2:提取训练集所有图像的surf特征,采用kmeans聚类方法对训练集所有图像的surf特征做聚类,形成k个簇,得到训练集视觉词典,同时得到聚类分类器k-classify;
步骤S3:计算训练集每一幅图像的视觉词袋,形成训练集视觉词袋检索库;
步骤S4:将训练集、测试集分别划分为多个子任务,每个子任务包括支撑集、查询集;
步骤S5:训练过程:采用MAML算法,对训练集多个子任务进行元训练,学习一个最优的初始参数;
步骤S6:测试过程:通过视觉词袋技术从训练集视觉词袋检索库中找出与测试集子任务支撑集图像相似的图像,用相似图像对网络模型进行预训练更新参数,再用子任务的支撑集图像进行训练更新模型参数,最后用更新完参数的网络模型对测试集子任务查询集图像进行测试,每次测试一个测试集子任务的查询集图像;
步骤S6具体包括以下步骤:
步骤S61:网络模型采用步骤S5训练过程得到的最优初始参数,对测试集一个子任务的支撑集图像提取surf特征;
步骤S62:采用步骤S2得到的聚类分类器k-classify判断支撑集图像的每一个surf特征对应步骤S2训练集视觉词典中的视觉单词,统计得到支撑集图像的视觉词袋;
步骤S63:将支撑集图像的视觉词袋与训练集视觉词袋检索库的所有图像的视觉词袋进行余弦相似度比较,每一个图像的视觉词袋是一个k维特征向量,最终得到与每一张支撑集图像最相似的10张图像,相似图像的训练学习率按如下公式计算得出:
Figure FDA0004043895400000021
其中,l为学习率,S余弦相似度,i为图像序号;
步骤S64:将得到的所有相似图像打乱顺序输入到网络模型更新参数,再用测试集子任务的支撑集图像更新网络模型参数,学习率为0.02;
步骤S65:用更新参数后的网络模型对测试集子任务的查询集图像进行分类测试。
2.根据权利要求1所述的基于元学习的少样本图像分类方法,其特征在于,在步骤S1中,所述训练集、测试集包括不同种类的图像,所述训练集的图像种类、数量多于所述测试集的图像种类、数量。
3.根据权利要求2所述的基于元学习的少样本图像分类方法,其特征在于,步骤S2具体包括以下步骤:
步骤S21:计算训练集所有图像的surf特征,统计训练集每一幅图像surf特征数量,统计训练集所有图像surf特征数量的众数k1
步骤S22:计算训练集所有图像的surf特征数量的平均数k2,计算公式如下:
k2=Sumsurf/C(1)其中Sumsurf是训练集所有图像surf特征数量,C为训练集图像数量;
步骤S23:确定聚类方法kmeans的参数k,计算公式如下:
Figure FDA0004043895400000022
步骤S24:采用kmeans聚类方法对训练集所有图像的surf特征向量进行聚类,最终形成k个簇,每个簇就是一个视觉单词,同时得到聚类分类器k-classify。
4.根据权利要求2所述的基于元学习的少样本图像分类方法,其特征在于,步骤S3具体包括以下步骤:
步骤S31:计算训练集每一幅图像的surf特征,采用步骤S2中的聚类分类器k-classify判断每一幅图像的每一个surf特征对应步骤S2中训练集视觉词典中的视觉单词,即计算surf特征向量距离k-classify聚类最近的簇;
步骤S32:统计每幅图像的视觉词袋,将训练集所有图像的视觉词袋集合成一个数据库,形成训练集的视觉词袋检索库。
5.根据权利要求2所述的基于元学习的少样本图像分类方法,其特征在于,在步骤S4中,所述将训练集划分为多个子任务的具体步骤为:从训练集中随机选取N种图像,每种图像随机抽取K+Q张图像;支撑集在N种图像中每种抽取K张图像,故支撑集包含N*K张图像,包含N种图像,每种图像K张;查询集在N种图像中每种抽取剩余的Q张图像,故查询集包含N*Q张图像,包含N种图像,每种图像Q张;支撑集和查询集的图像种类一样,支撑集和查询集图像不重复;
将测试集划分为多个子任务的具体步骤与所述将训练集划分为多个子任务的具体步骤相同。
6.根据权利要求2所述的基于元学习的少样本图像分类方法,其特征在于,步骤S5具体包括以下步骤:
步骤S51:随机初始化模型参数;
步骤S52:从训练集采样子任务;
步骤S53:对每一个子任务求梯度,并对模型的参数进行第一次梯度更新;
步骤S54:根据步骤S53更新的参数,对模型进行第二次梯度更新;
步骤S55:不断重复步骤S52至步骤S54,直至完成迭代循环,学习到一个最优的初始参数。
7.根据权利要求2所述的基于元学习的少样本图像分类方法,其特征在于,
在步骤S61至步骤S64中,所述支撑集图像为M张,所述相似图像为M*10张,
其中,M为大于或者等于1的正整数。
CN202010188012.7A 2020-03-17 2020-03-17 一种基于元学习的少样本图像分类方法 Active CN111539448B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010188012.7A CN111539448B (zh) 2020-03-17 2020-03-17 一种基于元学习的少样本图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010188012.7A CN111539448B (zh) 2020-03-17 2020-03-17 一种基于元学习的少样本图像分类方法

Publications (2)

Publication Number Publication Date
CN111539448A CN111539448A (zh) 2020-08-14
CN111539448B true CN111539448B (zh) 2023-04-07

Family

ID=71976680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010188012.7A Active CN111539448B (zh) 2020-03-17 2020-03-17 一种基于元学习的少样本图像分类方法

Country Status (1)

Country Link
CN (1) CN111539448B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036472A (zh) * 2020-08-28 2020-12-04 长安大学 一种电力系统视觉图像分类方法及系统
CN112613556B (zh) * 2020-09-01 2022-04-19 电子科技大学 基于元学习的少样本图像情感分类方法
CN113160108B (zh) * 2020-12-01 2024-03-19 江苏大学 一种少样本多类饵料的顺序查询计数方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110490249A (zh) * 2019-08-16 2019-11-22 哈尔滨工业大学 基于属性类别关系和少样本元学习的结构损伤识别方法
CN110580500A (zh) * 2019-08-20 2019-12-17 天津大学 一种面向人物交互的网络权重生成少样本图像分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109961089A (zh) * 2019-02-26 2019-07-02 中山大学 基于度量学习和元学习的小样本和零样本图像分类方法
CN110490249A (zh) * 2019-08-16 2019-11-22 哈尔滨工业大学 基于属性类别关系和少样本元学习的结构损伤识别方法
CN110580500A (zh) * 2019-08-20 2019-12-17 天津大学 一种面向人物交互的网络权重生成少样本图像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于度量方式不可知的少量样本的一次性面部识别;李新叶 等;《电脑编程技巧与维护》(第1期);第1-2页 *

Also Published As

Publication number Publication date
CN111539448A (zh) 2020-08-14

Similar Documents

Publication Publication Date Title
CN111539448B (zh) 一种基于元学习的少样本图像分类方法
CN112613581B (zh) 一种图像识别方法、系统、计算机设备和存储介质
CN109993100B (zh) 基于深层特征聚类的人脸表情识别的实现方法
KR20190050698A (ko) 신경망의 최적화 방법
CN111882040A (zh) 基于通道数量搜索的卷积神经网络压缩方法
WO2022105108A1 (zh) 一种网络数据分类方法、装置、设备及可读存储介质
Yu et al. A re-balancing strategy for class-imbalanced classification based on instance difficulty
Rasyidi et al. Batik pattern recognition using convolutional neural network
CN111008224B (zh) 一种基于深度多任务表示学习的时间序列分类和检索方法
CN111832580B (zh) 结合少样本学习与目标属性特征的sar目标识别方法
WO2023124342A1 (zh) 一种针对图像分类的神经网络结构低成本自动搜索方法
CN114299362A (zh) 一种基于k-means聚类的小样本图像分类方法
CN116052218B (zh) 一种行人重识别方法
CN111860656A (zh) 分类器训练方法、装置、设备以及存储介质
CN116089883A (zh) 用于提高已有类别增量学习新旧类别区分度的训练方法
CN112800927B (zh) 一种基于AM-Softmax损失的蝴蝶图像细粒度识别方法
Tao et al. Efficient incremental training for deep convolutional neural networks
Yang et al. Evolutionary channel pruning for real-time object detection
CN111488923A (zh) 增强的锚点图半监督分类方法
Hao et al. Architecture self-attention mechanism: Nonlinear optimization for neural architecture search
CN113128614B (zh) 基于图像梯度的卷积方法、基于方向卷积的神经网络及分类方法
Lei et al. Automated wafer defect classification using a convolutional neural network augmented with distributed computing
Jadhav et al. An effective content based image retrieval (CBIR) system based on evolutionary programming (EP)
Chen et al. End-to-end trained sparse coding network with spatial pyramid pooling for image classification
JP2023013293A (ja) 教師データ生成装置、学習モデル生成装置、および教師データの生成方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant