CN111539448A

CN111539448A - 一种基于元学习的少样本图像分类方法

Info

Publication number: CN111539448A
Application number: CN202010188012.7A
Authority: CN
Inventors: 刘伟鑫; 周松斌; 刘忆森
Original assignee: Guangdong Institute of Intelligent Manufacturing
Current assignee: Guangdong Institute of Intelligent Manufacturing
Priority date: 2020-03-17
Filing date: 2020-03-17
Publication date: 2020-08-14
Anticipated expiration: 2040-03-17
Also published as: CN111539448B

Abstract

本发明公开了一种基于元学习的少样本图像分类方法，涉及计算机视觉图像识别领域，包括以下步骤：S1：将图像集分为训练集、测试集；S2：提取训练集所有图像的surf特征，采用聚类方法对surf特征做聚类，得到训练集视觉词典；S3：计算训练集每一幅图像的视觉词袋，形成训练集视觉词袋检索库；S4：将训练集、测试集分别划分为多个子任务，每个子任务包括支撑集、查询集；S5：训练过程：采用MAML算法，对训练集多个子任务进行元训练，学习一个最优的初始参数；S6：测试过程：每次测试一个测试集子任务的查询集图像。本发明与传统的方案相比具备少样本快速学习、泛化能力。

Description

一种基于元学习的少样本图像分类方法

技术领域

本发明涉及计算机视觉图像识别领域，尤其是涉及一种基于元学习的少样本图像分类方法。

背景技术

近年来深度学习在学术界、科技界应用广泛，尤其在图像领域，目前已经在图像分类领域取得较大进展，取得不错成效。深度学习能取得了巨大成功，最为关键的因素就是利用大量的数据去驱动模型训练，使其获得良好的测试效果。但是在实际应用中深度学习算法难以实施，因为深度学习训练需要大量的标记样本，但拥有大量数据样本的企业毕竟是少数，大部分企业并没有那么多标记样本；其次模型训练耗时，对于有些检测分类要求频繁变化的应用，每次更改一次检测要求，就需要重新训练大量样本，这大大增加了时间成本。

元学习是近年来深度学习领域最热门的研究方向之一，其最主要应用于少样本学习，其主要通过元训练过程学会学习能力，使网络模型对新的少样本具备快速学习泛化的能力。

从少量数据中快速学习和适应的能力对于人工智能至关重要。深度学习方法可以通过元学习“利用之前的经验学习如何学习”的思想来解决少样本学习问题，从而弥补其在样本量少的情况下无法快速泛化和继续学习的缺点。

发明内容

有鉴于此，有必要针对上述的问题，提供一种基于元学习的少样本图像分类方法，采用MAML框架算法进行元训练，实现在少样本训练下完成图像分类的方法。

为实现上述目的，本发明是根据以下技术方案实现的：

一种基于元学习的少样本图像分类方法，包括以下步骤：

步骤S1：将图像集分为训练集、测试集；

步骤S2：提取训练集所有图像的surf特征，采用kmeans聚类方法对训练集所有图像的surf特征做聚类，形成k个簇，得到训练集视觉词典，同时得到聚类分类器k-classify；

步骤S3：计算训练集每一幅图像的视觉词袋，形成训练集视觉词袋检索库；

步骤S4：将训练集、测试集分别划分为多个子任务，每个子任务包括支撑集、查询集；

步骤S5：训练过程：采用MAML算法，对训练集多个子任务进行元训练，学习一个最优的初始参数；

步骤S6：测试过程：通过视觉词袋技术从训练集视觉词袋检索库中找出与测试集子任务支撑集图像相似的图像，用相似图像对网络模型进行预训练更新参数，再用子任务的支撑集图像进行训练更新模型参数，最后用更新完参数的网络模型对测试集子任务查询集图像进行测试，每次测试一个测试集子任务的查询集图像。

进一步地，在步骤S1中，所述训练集、测试集包括不同种类的图像，所述训练集的图像种类、数量多于所述测试集的图像种类、数量。

进一步地，步骤S2具体包括以下步骤：

步骤S21：计算训练集所有图像的surf特征，统计训练集每一幅图像surf特征数量，统计训练集所有图像surf特征数量的众数k₁；

步骤S22：计算训练集所有图像的surf特征数量的平均数k₂，计算公式如下：

k₂＝Sum_surf/C (1)

其中Sum_surf是训练集所有图像surf特征数量，C为训练集图像数量；

步骤S23：确定聚类方法kmeans的参数k，计算公式如下：

步骤S24：采用kmeans聚类方法对训练集所有图像的surf特征向量进行聚类，最终形成k个簇，每个簇就是一个视觉单词，同时得到聚类分类器k-classify。

进一步地，步骤S3具体包括以下步骤：

步骤S31：计算训练集每一幅图像的surf特征，采用步骤S2中的聚类分类器k-classify判断每一幅图像的每一个surf特征对应步骤S2中训练集视觉词典中的视觉单词，即计算surf特征向量距离k-classify聚类最近的簇；

步骤S32：统计每幅图像的视觉词袋，将训练集所有图像的视觉词袋集合成一个数据库，形成训练集的视觉词袋检索库。

进一步地，在步骤S4中，所述将训练集划分为多个子任务的具体步骤为：从训练集中随机选取N种图像，每种图像随机抽取K+Q张图像；支撑集在N种图像中每种抽取K张图像，故支撑集包含N*K张图像，包含N种图像，每种图像K张；查询集在N种图像中每种抽取剩余的Q张图像，故查询集包含N*Q张图像，包含N种图像，每种图像Q张；支撑集和查询集的图像种类一样，支撑集和查询集图像不重复；

所述将测试集划分为多个子任务的具体步骤与所述将训练集划分为多个子任务的具体步骤相同。

进一步地，步骤S5具体包括以下步骤:

步骤S51：随机初始化模型参数；

步骤S52：从训练集采样子任务；

步骤S53：对每一个子任务求梯度，并对模型的参数进行第一次梯度更新；

步骤S54：根据步骤S53更新的参数，对模型进行第二次梯度更新；

步骤S55：不断重复步骤S52至步骤S54，直至完成迭代循环，学习到一个最优的初始参数。

进一步地，步骤S6具体包括以下步骤：

步骤S61：网络模型采用步骤S5训练过程得到的最优初始参数，对测试集一个子任务的支撑集图像提取surf特征；

步骤S62：采用步骤S2得到的聚类分类器k-classify判断支撑集图像的每一个surf特征对应步骤S2训练集视觉词典中的视觉单词，统计得到支撑集图像的视觉词袋；

步骤S63：将支撑集图像的视觉词袋与训练集视觉词袋检索库的所有图像的视觉词袋进行余弦相似度比较，每一个图像的视觉词袋是一个k维特征向量，最终得到与每一张支撑集图像最相似的10张图像，相似图像的训练学习率按如下公式计算得出：

其中，l为学习率，S余弦相似度，i为图像序号；

步骤S64：将得到的所有相似图像打乱顺序输入到网络模型更新参数，再用测试集子任务的支撑集图像更新网络模型参数，学习率为0.02；

步骤S65：用更新参数后的网络模型对测试集子任务的查询集图像进行分类测试。

进一步地，在上述步骤S61至步骤S64中，所述支撑集图像为M张，所述相似图像为M*10张，其中，M为大于或者等于1的正整数。

与现有技术相比，本发明的优点和积极效果至少包括：

(1)相比目前的深度学习技术，具备快速学习、泛化能力；

(2)相比目前的深度学习技术，本方法只需要少量样本就能取得较高的准确率；

(3)适用于其他图像分类任务，具有一定的通用性。

本发明采用MAML框架算法进行元训练，得到最优初始参数，然后通过视觉词袋技术从训练集视觉词袋库中找出与测试集子任务支撑图像相似的图像，用相似图像对网络模型进行预训练更新参数，再用子任务的支撑集图像进行训练更新模型参数，最后用更新完参数的网络模型对子任务查询集图像进行测试，具备少样本快速学习、泛化能力。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一种基于元学习的少样本图像分类方法的流程示意图；

图2是本发明一种基于元学习的少样本图像分类方法所使用的MAML算法采用的网络结构示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

如图1所示，本发明提供了一种基于元学习的少样本图像分类方法，包括以下步骤：

步骤S1：将图像集分为训练集、测试集；

步骤S2：提取训练集所有图像的surf特征，采用kmeans聚类方法对训练集所有图像的surf特征做聚类，形成k个簇，得到训练集视觉词典(视觉词典是训练集所有图像的surf特征聚类成k个视觉单词的词典，所有视觉单词组成视觉词典)，同时得到聚类分类器k-classify；

步骤S3：计算训练集每一幅图像的视觉词袋(视觉词袋是一种图像的特征表示方式，这里是指图像由视觉词典中的若干个视觉单词表示，一般是统计视觉词典中的视觉单词在图像中出现的频率，用视觉词汇直方图表示)，形成训练集视觉词袋检索库；

进一步地，步骤S2具体包括以下步骤：

k₂＝Sum_surf/C (1)

步骤S23：确定聚类方法kmeans的参数k，计算公式如下：

进一步地，步骤S3具体包括以下步骤：

进一步地，步骤S5具体包括以下步骤：

步骤S51：随机初始化模型参数；

步骤S52：从训练集采样子任务；

步骤S55：不断重复步骤S52至步骤S54，直至完成迭代循环，学习到一个最优的初始参数；

如图2所示，具体地，在步骤S5中，所采用的MAML算法采用的网络模型为：包括5个模块，第一个到第四个模块均包含1个卷积层，卷积核为3*3，32个，1个最大池化层，池化核大小为2*2，激活函数采用ReLU；第五个模块是一个全连接层、一个输出层，全连接层800个节点，输出层是5个输出节点(输出节点个数可根据分类种数调整，如10分类，就10个输出节点)。

进一步地，步骤S6具体包括以下步骤：

其中，l为学习率，S余弦相似度，i为图像序号；

步骤S64：将得到的所有相似图像打乱顺序(防止过拟合或者不收敛，提高模型泛化能力))输入到网络模型更新参数，再用测试集子任务的支撑集图像更新网络模型参数，学习率为0.02；

实施例2

为对本发明内容进行具体说明，本实施例以ChestX-ray14数据集作一个3分类的问题作实例。

需要说明的是，本实施例中所使用的具体数字，仅仅是本实施例中所使用的一组可能的或较优的搭配，但并不能因此而理解为对本发明专利范围的限制；应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明的保护范围应以所附权利要求为准。

本实施例提供一种基于元学习的少样本图像分类方法，包括以下步骤：

步骤S1：ChestX-ray14数据集一共有14类肺部疾病图片，包括(肺不张、变实、浸润、气胸、水肿、肺气肿、纤维变性、积液、肺炎、胸膜增厚、心脏肥大、结节、肿块和疝气)，将ChestX-ray14图像集划分为训练集、测试集，其中训练集11类图像，测试集3类图像，将所有图像尺寸归一化到84*84。

步骤S2：提取训练集所有图像的surf特征，采用kmeans聚类方法对训练集所有图像的surf特征做聚类，形成k个簇(一个簇即是一个视觉单词)，得到训练集视觉词典，同时得到聚类分类器k-classify；具体步骤如下：

k₂＝Sum_surf/C (1)

步骤S23：确定聚类方法kmeans的参数k，计算公式如下：

步骤S3：计算训练集每一幅图像的视觉词袋，形成训练集视觉词袋检索库；具体包括以下步骤：

步骤S4：将训练集、测试集分别划分为多个子任务，每个子任务包括支撑集、查询集；具体步骤如下：

利用训练集制作200000子任务，每个子任务包括支撑集、查询集，每个子任务制作规则如下：从训练集中随机选取3种图像，每种图像随机抽取16张图像，其中支撑集每种图像抽取1张图像，故支撑集包含3张图像，包含3种图像，每种图像1张；查询集取出每种图像剩余的15张图像，故查询集包含45张图像，包含3种图像，每种图像15张，支撑集和查询集的图像种类一样，支撑集和查询集图像不重复；

同理，测试集划分为200子任务，每个子任务包括支撑集、查询集，每个子任务制作规则如下：从测试集中随机选取3种图像，每种图像随机抽取16张图像，其中支撑集每种图像抽取1张图像，故支撑集包含3张图像，包含3种图像，每种图像1张；查询集取出每种图像剩余的15张图像，故查询集包含45张图像，包含3种图像，每种图像15张，支撑集和查询集的图像种类一样，支撑集和查询集图像不重复。

步骤S5：训练过程：采用MAML算法，对训练集多个子任务进行元训练，学习一个最优的初始参数；具体包括以下步骤：

步骤S51：随机初始化模型参数；

步骤S52：从训练集采样子任务；

具体地，在步骤S5中，所采用的MAML算法采用的网络模型为：包括5个模块，第一个到第四个模块均包含1个卷积层，卷积核为3*3，32个，1个最大池化层，池化核大小为2*2，激活函数采用ReLU；第五个模块是一个全连接层、一个输出层，全连接层800个节点，输出层是3个输出节点。

步骤S6：测试过程，对每一个子任务采用如下测试方法：网络模型使用步骤S5训练过程得到的最优初始参数，对测试集一个子任务的支撑集图像提取surf特征，采用步骤S2的聚类分类器k-classify判断支撑集图像(这里有3张)的每一个surf特征对应步骤S2中训练集视觉词典的视觉单词，统计得到支撑集图像的视觉词袋，这里有3张图像的视觉词袋，然后将测试集一个子任务的支撑集图像的视觉词袋与训练集视觉词袋检索库中的每张图像的视觉词袋(每一个图像的视觉词词袋是一个k维特征向量)进行余弦相似度比较，最终得到与支撑集图像最相似的10张图像，这里我们有3张支撑集图像，每张图像有10张相似图像，故有30张相似图像，然后将30张图像打乱顺序，每张图像的训练学习率按如下公式(3)计算得出，然后将30张图像依次输入到网络，更新网络参数，然后再用子任务的支撑集图像(3张)输入到网络更新网络参数，学习率为0.02，最后将更新参数后的网络模型对子任务的查询集图像进行测试。

其中，l为学习率，S余弦相似度，i为图像序号。

以下表格1是本发明方法和SVM、AlexNet方法进行200次子任务测试的结果，每次测试要求如下：从ChestX-ray14中的三种肺炎疾病图片(固定的三种)每种随机抽取16张，其中每种图片的训练图片为1张，剩下的15张为测试图片，故3种图像测试图片总共45张。

表1三种方法测试结果对比

由上表1可以看出，本发明方法在少样本训练的情况下，准确率远远高于传统SVM以及深度学习方法AlexNet。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明的保护范围应以所附权利要求为准。

Claims

1.一种基于元学习的少样本图像分类方法，其特征在于，包括以下步骤：

步骤S1：将图像集分为训练集、测试集；

2.根据权利要求1所述的基于元学习的少样本图像分类方法，其特征在于，在步骤S1中，所述训练集、测试集包括不同种类的图像，所述训练集的图像种类、数量多于所述测试集的图像种类、数量。

3.根据权利要求2所述的基于元学习的少样本图像分类方法，其特征在于，步骤S2具体包括以下步骤：

k₂＝Sum_surf/C (1)

步骤S23：确定聚类方法kmeans的参数k，计算公式如下：

4.根据权利要求2所述的基于元学习的少样本图像分类方法，其特征在于，步骤S3具体包括以下步骤：

5.根据权利要求2所述的基于元学习的少样本图像分类方法，其特征在于，在步骤S4中，所述将训练集划分为多个子任务的具体步骤为：从训练集中随机选取N种图像，每种图像随机抽取K+Q张图像；支撑集在N种图像中每种抽取K张图像，故支撑集包含N*K张图像，包含N种图像，每种图像K张；查询集在N种图像中每种抽取剩余的Q张图像，故查询集包含N*Q张图像，包含N种图像，每种图像Q张；支撑集和查询集的图像种类一样，支撑集和查询集图像不重复；

6.根据权利要求2所述的基于元学习的少样本图像分类方法，其特征在于，步骤S5具体包括以下步骤:

步骤S51：随机初始化模型参数；

步骤S52：从训练集采样子任务；

7.根据权利要求2所述的基于元学习的少样本图像分类方法，其特征在于，步骤S6具体包括以下步骤：

其中，l为学习率，S余弦相似度，i为图像序号；

8.根据权利要求7所述的基于元学习的少样本图像分类方法，其特征在于，在步骤S61至步骤S64中，所述支撑集图像为M张，所述相似图像为M*10张，其中，M为大于或者等于1的正整数。