CN112861995B

CN112861995B - 基于模型无关元学习的无监督少样本图像分类方法、系统及存储介质

Info

Publication number: CN112861995B
Application number: CN202110273807.2A
Authority: CN
Inventors: 洪楷铎; 郑伟诗
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2021-03-15
Filing date: 2021-03-15
Publication date: 2023-03-31
Anticipated expiration: 2041-03-15
Also published as: CN112861995A

Abstract

本发明公开了一种基于模型无关元学习的无监督少样本图像分类方法、系统及存储介质，包括下述步骤：生成训练数据，得到元训练集和元测试集；构造卷积神经网络模型，在卷积神经网络模型中引入快权重和慢权重，所述快权重在内部循环中进行迭代，所述慢权重在外部循环进行优化求解；利用元训练集和元测试集对优化后的卷积神经网络模型进行训练，得到优化后的神经网络模型；引入无监督相关损失，提高卷积神经网络模型分类效果；将待分类的图像输入到训练好的卷积神经网络，得到分类结果。本发明结合数据采样、数据增强、和无监督图像分类中的方法，提升模型无关原学习方法的训练速度，解决少样本学习无监督样本生成和计算效率的问题。

Description

基于模型无关元学习的无监督少样本图像分类方法、系统及存储介质

技术领域

本发明属于人工智能领域和计算机视觉领域分支少样本图像分类，具体涉及一种基于模型无关元学习的无监督少样本图像分类方法、系统及存储介质。

背景技术

随着计算机硬件的发展，计算能力得到大幅度的提高，使得卷积神经网络在计算视觉领域大显神通。图像分类作为计算视觉领域中一个基本的任务，在上世纪就受到了关注。

尽管由于卷积神经网络和深度学习的崛起，基于卷积神经网络和深度学习的相关方法在业界取得重大成果，但这些方法在解决一个特定任务时，需要大量的训练样本。为了解决此问题，LiFeiFei等人在论文《Learning generative visual models from fewtraining examples:An incremental Bayesian approach tested on 101objectcategories》，《One-shot learning of object categories》中提出利用少量样本甚至每个类别单样本的学习任务，旨在让模型从众多相似的任务上学习得到先验领域知识，迁移到当前任务中来，而不是从随机开始训练新的任务。在众多的少样本分类模型中，Finn,Chelsea；Abbeel,Pieter；Levine,Sergey在《Model-agnostic meta-learning for fastadaptation of deep networks》提出的模型无关元学习方法具有一定的代表性。

然而，该任务为了从相似任务中提取可迁移部分的知识，依旧需要大量相似任务的标注数据。特别是利用深度学习模型，更是如此。在图像分类领域存在一些无监督方法，这些方法多用于无监督图像表征的学习上，无法应用于当前的任务。Khodadadeh,Siavash；Boloni,Ladislau；Shah,Mubarak在《Unsupervised Meta-Learning for Few-Shot ImageClassification》指出，可以利用采样方法来生成用于少样本分类训练样本，而无需大量标注样本，可以进行无监督少样本学习。

但是上述方法仍然存在一些不足，面对复杂的分类任务，由于单一的图像生成策略，容易导致模型过拟合，模型健壮性不足。并且，模型无关元学习方法需要多次内部迭代，训练效率较低，且由于占用空间较大，不能适用于大规模网络。

发明内容

本发明的主要目的在于克服现有技术的缺点与不足，提供一种基于模型无关元学习的无监督少样本图像分类方法、系统及存储介质，提升模型无关原学习方法的训练速度，解决少样本学习无监督样本生成和计算效率的问题。

为了达到上述目的，本发明采用以下技术方案：

本发明一方面提供了一种基于模型无关元学习的无监督少样本图像分类方法，包括下述步骤：

生成训练数据，得到元训练集和元测试集；

构造卷积神经网络模型，在卷积神经网络模型中引入快权重和慢权重，所述快权重在内部循环中进行迭代，所述慢权重在外部循环进行优化求解，所述卷积神经网络包括三部分，具体为：

第一部分为神经网络的前面几层卷积层，用来提升较为通用的特征，称为卷积层前部，网络参数记为w_f，将w_f作为慢权重；

第二部分为网络除卷积层前部外的卷积层，称为卷积层后部，参数记为w_b，w_b作为快权重和慢权重；

第三部分为最后的全连接层参数记为w，w＝w_bias+w_linear，其中w_bias是快权重，w_linear是慢权重；

利用元训练集和元测试集对优化后的卷积神经网络模型进行训练，得到优化后的神经网络模型；

引入无监督相关损失，提高卷积神经网络模型分类效果；

将待分类的图像输入到训练好的卷积神经网络，得到分类结果。

作为优选的技术方案，所述生成训练数据具体为：

随机采样得到原始输入数据D，赋予D中每张图片一个类别，构成初始的单次任务数据；

将单次任务数据进行多次复制，并使用图像增强技术对图像进行变换，变换后的图像数据及其类别，构成元训练数据；

将单次任务数据进行多次复制，并使用不同与元训练数据的图像增强技术对图像进行变换，变换后的图像数据及其类别构成元测试数据；

增强复制得到的数据，获得每个任务的训练数据集，这样得到的训练数据为单个任务的数据，重复多次，即得到多个任务训练数据。

作为优选的技术方案，所述利用元训练集和元测试集对优化后的卷积神经网络模型进行训练，具体为：

设x_spt为元训练数据，x_qry为元测试数据，卷积神经网络及损失函数为f，其参数为w，初始参数为w₀，内部学习率为α_inner，w_k为第k次内部迭代得到的参数，则卷积神经网络模型的第一个训练目标就是：

min_wf(w_k，x_qry)；

其中的一些概念解释如下：

任务：在少样本图像分类中，定义任务为给定少量几张图像X，再给定另外同类别的几张图像Y，判断Y中的每一张图像，分别和X中哪张图像属于同一类别；

x_spt：元训练集，少样本图像分类任务中，每一个任务的少量训练样本；

x_qry：元测试集，少样本图像分类任务中，每一个任务的少量测试样本；

模型参数w，w_0等：指的是卷积神经网络中可训练的网络权重；

α_inner：在模型无关元学习中，内层迭代使用的学习率。

作为优选的技术方案，在训练过程中，内部循环固定卷积神经网络的前几层参数，将w分为w_f和w_b，w＝[w_f，w_b]，w_f和w_b分别表示卷积神经网络的前几层参数和后面基层的参数，则优化目标变成：

min_wf(w_f，w_b，k，x_qry)

w_b，0＝w_b，w＝[w_f，w_b]。

作为优选的技术方案，还包括对全连接层参数进行分解的步骤，具体为：

卷积神经网络最后一层全连接层参数为w和b，其中w是线性操作参数，b是平移参数，w大小为fea_num×n，b大小为n，其中fea_num是卷积层的特征维度，n是少样本分类类别数，将w分为w＝w_bias+w_linear，其中w_bias大小为fea_num×1，w_linear大小为fea_num×n，内部循环时，w_bias保持不变，w_linear初始化为0开始迭代，外部循环只对w_bias做优化，故优化目标为：

w_linear，0＝w_linear，w_b，0＝w_b，w＝[w_f，w_b，w_bias]。

作为优选的技术方案，在内部循环中，元训练集数据输入后，经过softmax层输出logits，logits一方面用于分类损失的计算，另一方面计算logits的熵，损失中加入一个logits的熵的项：

Loss＝cross_entropy(logits，y)+λ∑logits_iloglogits_i

其中λ是一个超参数。

作为优选的技术方案，支撑集损失，在内层迭代中，加入熵约束，减少拟合风险

∑e_iloge_i

z_i＝f(x_spt，i)。

作为优选的技术方案，卷积特征后连接一个投影模块，用于旋转的预测。投影块由两层线性层组成，再加上一个softmax分类器，在内部循环中，将查询集每个图像x经过多次旋转，得到x₁，x₂，...，x_r，输入同一张图像的两张不同角度的图片x_i，x_j，经过投影模块经过softmax层，输出一个12维的向量，表示预测的两张图片的旋转角度差。

本发明另一方面还提供了一种基于模型无关元学习的无监督少样本图像分类系统，应用于所述的基于模型无关元学习的无监督少样本图像分类方法，包括数据获取模块、模型构造模块、训练模块、损失模块以及分类模块；

所述数据获取模块，用于生成训练数据，得到元训练集和元测试集；

所述模型构造模块，用于构造卷积神经网络模型，在卷积神经网络模型中引入快权重和慢权重，所述快权重在内部循环中进行迭代，所述慢权重在外部循环进行优化求解，所述卷积神经网络包括三部分，具体为：

所述训练模块，用于利用元训练集和元测试集对优化后的卷积神经网络模型进行训练，得到优化后的神经网络模型；

所述损失模块，用于引入无监督相关损失，提高卷积神经网络模型分类效果；

分类模块，用于将待分类的图像输入到训练好的卷积神经网络，得到分类结果。

本发明的又一方面还提供了一种存储介质，存储有程序，所述程序被处理器执行时，实现所述的基于模型无关元学习的无监督少样本图像分类方法。

本发明与现有技术相比，具有如下优点和有益效果：

(1)本发明构建的模型能适用于无监督和半监督情形的少样本学习。不仅如此依据其能够从大量无标注图像数据中自动生成训练数据集，在某些任务上还能得益于网络中存在的大量无标注图像。

(2)由于模型的改造，对内部循环固定一部分参数，能够避免对它们求二阶导数，能够有效避免在反向传播中计算梯度造成的大量的时间损耗。以及采用混合精度的训练方式，使得模型无关元学习方法单次迭代更快，且能适用于更大规模的网络结构。

(3)对内部循环引入熵的约束，同时加入查询集的旋转预测损失，能够加强模型的健壮性，避免模型过拟合，同时提高模型的预测能力。

附图说明

图1为本发明方法的整体流程图；

图2为网络结构整体框架图；

图3为实施例中训练集生成示意图；

图4为实施例中卷积神经网络结构图；

图5为实施例中线性层分类；

图6为本发明另一个实施例中系统的结构示意图；

图7为本发明另一个实施例中存储介质的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

实施例

如图1-图3所示，本实施例基于模型无关元学习的无监督少样本图像分类方法，包括下述步骤：

S1、生成训练数据，得到元训练集和元测试集；

步骤S1具体为：

选择和目标任务相似性比较大的数据集，或者从网络中获取相关的图片数据集，随机采样N张图得到原始输入数据D，N指的是少样本学习中每个任务的类别数。并赋予原始输入数据D中每张图片一个类别，分别从1到N，每张图片一个类别，所属类别随机确定。将数据和类别整体记为(D，Y)对，为当前任务原训练数据。

将数据(D，Y)进行复制4份，记为(D1，Y)，(D2，Y)，(D3，Y)，(D4，Y)。采用不同的自动图像增强方法对图像进行增强。针对物体识别，对D1，D2，D3使用图像增强技术1，对D4采用图像增强技术2，增强复制得到的数据，以此获得每个任务的训练数据集。

每个任务的的数据集用两种图像增强技术得到的分别用作元训练集(也叫支撑集)和元测试集(也叫查询集)。其中Di增强得到Di’。支撑集构成为D1’，D2’，D3’，而查询集构成为D4’。

S2、构造卷积神经网络模型，在卷积神经网络模型中引入快权重和慢权重，所述快权重在内部循环中进行迭代，所述慢权重在外部循环进行优化求解，所述卷积神经网络包括三部分，具体为：

进一步的，所述快权重、慢权重并不是分割的，即它们的交集不是空，有的权重仅是单一的快权重或者慢权重，有点两者都是。

在本申请的另一个实施例中，网络结构采用四成卷积神经网络，结构如图4所示，包括4个卷积层conv1、conv2、conv3、conv4和一个全连接层linear。将conv1，conv2设为慢权重，conv3，conv4设为快权重，全连接层权重拆分如图5所示。

所述利用元训练集和元测试集对优化后的卷积神经网络模型进行训练，具体为：

设x_spt为元训练数据，x_qry为元测试数据，卷积神经网络及损失函数为f，其参数为w，初始参数为w₀，内部学习率为α_inner，w_k为第k次内部迭代得到的参数，则模型的第一个训练目标就是：

min_wf(w_k，x_qry)；

其中的一些概念解释如下：

α_inner：在模型无关元学习中，内层迭代使用的学习率。

针对模型无关元学习方法，对卷积神经网络模型进行改造，同时在训练时期使用混合精度，加快模型训练，模型无关元学习方法分为内部迭代和外部迭代，在训练过程中，内部迭代固定卷积神经网络的前几层参数，将w分为w_f和w_b，w＝[w_f，w_b]，w_f和w_b分别表示卷积神经网络的前几层参数和后面基层的参数，则优化目标变成：

min_wf(w_f，w_b，k，x_qry)；

w_b，0＝w_b，w＝[w_f，w_b]。

进一步的，将网络最后一层的全连接层参数进行分解，卷积神经网络最后一层全连接层参数为w和b，其中w是线性操作参数，b是平移参数。将w大小为fea_num×n，b大小为n，其中fea_num是卷积层的特征维度，n是少样本分类类别数，将w分为w＝w_bias+w_linear，其中w_bias大小为fea_num×1，w_linear大小为fea_num×n，内部循环时，w_bias保持不变，w_linear初始化为0开始迭代，外部循环只对w_bias做优化，故优化目标为：

w_linear，0＝w_linear，w_b，0＝w_b，w＝[w_f，w_b，w_bias]。

S4、引入无监督相关损失，提高模型分类效果，避免模型过拟合。不同于上面的符号f，这里记f为卷积神经网络到最后一层线性层为止除softmax及损失的模型，忽略参数和迭代过程，记单次输入输出关系为y＝f(x)，在内部循环中加入如下两个损失：

a)支撑集损失，在内层迭代中，加入熵约束，减少拟合风险，

∑e_iloge_i

z_i＝f(x_spt，i)

b)增加一个模块g，用于旋转的预测，在卷积神经网络特征层后面，加上一个投影层，作为旋转预测模块；旋转预测模块，预测同一张图片不同的旋转角度。将查询集的每一张图片进行多次旋转，得到若干图片，该模块用于预测图片间的相对转角。为了简化任务复杂度，避免任务过于复杂难以拟合。将角度进行划分，360度分为12个区间，每30度为一个类别，模块g就是将卷积特征进行投影，然后映射到一个12维的归一化向量上。

S4、将待分类的图像输入到训练好的卷积神经网络，得到分类结果。

如图6所示，在另一个实施例中，提供了一种基于模型无关元学习的无监督少样本图像分类系统，该系统包括数据获取模块、模型构造模块、训练模块、损失模块以及分类模块；

分类模块，用于将待分类的图像输入到训练好的卷积神经网络，得到分类图像。

在此需要说明的是，上述实施例提供的系统仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能，该系统是应用于上述实施例的基于同源性分析的APT攻击识别及归属方法。

如图7所示，在本申请的另一个实施例中，还提供了一种存储介质，存储有程序，所述程序被处理器执行时，实现基于模型无关元学习的无监督少样本图像分类方法，具体为：

生成训练数据，得到元训练集和元测试集；

引入无监督相关损失，提高卷积神经网络模型分类效果；

将待分类的图像输入到训练好的卷积神经网络，得到分类图像。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.基于模型无关元学习的无监督少样本图像分类方法，其特征在于，包括下述步骤：

生成训练数据，得到元训练集和元测试集；

第一部分为神经网络的前面几层卷积层，用来提升较为通用的特征，称为卷积层前部；

第二部分为网络除卷积层前部外的卷积层，称为卷积层后部；

第三部分为最后的全连接层线性操作参数记为w，w＝w_bias+w_linear；

在所有卷积层后连接一个投影模块，用于旋转的预测，投影模块由两层线性层组成，再加上一个softmax分类器，在内部循环中，将元测试集每个图像x经过多次旋转，得到x₁,x₂,…,x_r，输入同一张图像的两张不同角度的图片x_i,x_j，经过投影模块经过softmax层，输出一个12维的向量，表示预测的两张图片的旋转角度差；

设x_spt为元训练集，x_qry为元测试集，卷积神经网络的损失函数为f,其参数为

初始参数为w₀,内部学习率为α_inner,w_k为第k次内部迭代得到的参数，则卷积神经网络模型的第一个训练目标就是：

其中的一些概念解释如下：

指的是卷积神经网络中可训练的网络权重；

α_inner：在模型无关元学习中，内层迭代使用的学习率；

在训练过程中，内部循环固定卷积神经网络的前几层参数，将

分为w_f和w_b，

w_f和w_b分别表示卷积神经网络的前几层参数和后面几层的参数，则训练目标变成：

w_b,0＝w_b,

还包括对全连接层参数进行分解的步骤，具体为：

卷积神经网络最后一层全连接层参数包括w和b，其中w是线性操作参数，b是平移参数，w在小为fea_num×n，b大小为n，其中fea_num是卷积层的特征维度，n是少样本分类类别数，将w分为w＝w_bias+w_linear，其中w_bias大小为fea_num×1，w_linear大小为fea_num×n，内部循环时，w_bias保持不变，w_linear初始化为0开始迭代，外部循环只对w_bias做优化，故训练目标为：

w_linear,0＝w_linear,w_b,0＝w_b,w＝[w_f,w_b,w_bias]；

引入无监督相关损失，提高卷积神经网络模型分类效果；

2.根据权利要求1所述基于模型无关元学习的无监督少样本图像分类方法，其特征在于，所述生成训练数据具体为：

将单次任务数据进行多次复制，并使用不同于元训练数据的图像增强技术对图像进行变换，变换后的图像数据及其类别构成元测试数据；

3.根据权利要求1所述基于模型无关元学习的无监督少样本图像分类方法，其特征在于，在内部循环中，元训练集数据输入后，经过softmax层输出logits，logits一方面用于分类损失的计算，另一方面计算logits的熵，损失中加入一个logits的熵的项：

Loss＝cross_entropy(logits,y)+λ∑logits_Iloglogits_I

其中λ是一个超参数。

4.根据权利要求1所述基于模型无关元学习的无监督少样本图像分类方法，其特征在于，支撑集损失，在内层迭代中，加入熵约束，减少拟合风险。

5.基于模型无关元学习的无监督少样本图像分类系统，其特征在于，应用于权利要求1-4中任一项所述的基于模型无关元学习的无监督少样本图像分类方法，包括数据获取模块、模型构造模块、训练模块、损失模块以及分类模块；

在所有卷积层后连接一个投影模块，用于旋转的预测，投影模块由两层线性层组成，再加上一个softmax分类器，在内部循环中，将元测试集每个图像x经过多次旋转，得到x₁,x₂,…,x_r，输入同一张图像的两张不同角度的图片x_i,x_j，经过投影模块经过softmax层，输出一个12维的向量，表示预测的两张图片的旋转角度差；所述训练模块，用于利用元训练集和元测试集对优化后的卷积神经网络模型进行训练，得到优化后的神经网络模型；

6.一种计算机可读存储介质，存储有程序，其特征在于：所述程序被处理器执行时，实现权利要求1-4任一项所述的基于模型无关元学习的无监督少样本图像分类方法。