CN110443277A

CN110443277A - 基于注意力模型的少量样本分类方法

Info

Publication number: CN110443277A
Application number: CN201910582214.7A
Authority: CN
Inventors: 冀中; 柴星亮
Original assignee: Tianjin University
Current assignee: Tianjin University
Priority date: 2019-06-30
Filing date: 2019-06-30
Publication date: 2019-11-12

Abstract

一种基于注意力模型的少量样本分类方法，训练一个卷积神经网络图像分类模型，训练好卷积神经网络图像分类模型后，去掉卷积神经网络图像分类模型的全连接层，保留卷积神经网络图像分类模型的卷积神经网络部分；根据所有样本图像的特征向量对待测图像进行基础分类，得到n×m个标量，n为所有样本图像的类数，m为每个类中的样本图像数；将每一类的m个样本图像连接为m×M维的向量，输入一个非线性映射函数得到n×m个相对权重；将得到的n×m个标量与对应的n×m个相对权重分别相乘，得到新的n×m个标量，将每个类中新的m个标量相加得到最终的分类结果。本发明通过挖掘类内图像重要性的得分，使得模型能更加关注比较重要的样本，对类内图像进行均衡。

Description

基于注意力模型的少量样本分类方法

技术领域

本发明涉及一种样本分类方法。特别是涉及一种面向计算机视觉的基于注意力模型的少量样本分类方法。

背景技术

图像目标的识别是计算机视觉领域最基本也是最有价值的方向之一，是其他图像处理方法的基础。目前大多数的图像识别基于深度学习网络，虽然在很多的场景中都能取得非常高的分类准确度，但这些方法需要动辄百万量级的数据集来支持网络的训练，样本的获取成本极高，同时网络的训练和使用需要非常长的时间以及大量的计算资源，通常在当前先进的GPU设备上耗费数天的时间，训练好之后识别一幅图像可能会到数秒，这对算力较小特别是一些嵌入式的设备来说是不可接受的，虽然可以将其部署在云端，但对于一些实时性要求高的领域这种解决方法并不适合，对于一些网速欠发达的地区来说也限制其应用。

针对深度网络的这些问题，近年来通过少量训练样本进行高速度、高准确度的网络训练逐渐成为学术界以及工业界主要关注的问题之一。

虽然随着研究人员的增多，少量样本的图像识别近年来取得了一些进展，大多数工作集中在学习一种度量或者设计一种度量方法，导致很多方法创新性极小，这些工作很少注意样本图片本身含有的信息量不同，没有去发掘同一类图片本身蕴含的重要性的信息，所以虽然取得了一些进展，但效果不是太好。

发明内容

本发明所要解决的技术问题是，提供一种能够使得模型更加关注比较重要的样本，对类内图像进行均衡的基于注意力模型的少量样本分类方法。

本发明所采用的技术方案是：一种基于注意力模型的少量样本分类方法，包括如下步骤：

1)训练一个卷积神经网络图像分类模型，训练好卷积神经网络图像分类模型后，去掉该卷积神经网络图像分类模型的全连接层，保留该卷积神经网络图像分类模型的卷积神经网络部分；

2)根据所有样本图像的特征向量对待测图像进行基础分类，得到n×m个标量，其中，n为所有样本图像的类数，m为每个类中的样本图像数；

3)将每一类的m个样本图像连接为m×M维的向量，输入一个非线性映射函数得到n×m个相对权重；

4)将得到的n×m个标量与对应的n×m个相对权重分别相乘，得到新的n×m个标量，将每个类中的新的m个标量相加得到最终的分类结果。

步骤1)所述的卷积神经网络图像分类模型是VGGNet模型或GoogLeNet模型或ResNet模型。

步骤2)包括：设所有样本图像有n个类，每个类有m个样本图像，利用所述的卷积神经网络部分对n×m个样本图像进行特征提取，得到对应的n×m个样本图像特征向量，每个样本图像特征向量是M维，利用所述的卷积神经网络部分对待测图像x进行特征提取，得到待测图像x的特征向量，并将所述的待测图像x的特征向量分别连接到n×m个样本图像特征向量的后面，得到n×m个连接向量，将n×m个连接向量经过一个非线性映射得到n×m个标量，所述的n×m个标量表示待测图像x与n×m个样本图像的相似程度，从而完成待测图像进行基础分类。

所述的非线性映射为一个三层的全连接层。

步骤3)用公式表示如下：

M＝g(Y) (1)

W＝activate(M) (2)

其中，Y表示将每个类中所有样本图像串联后的矩阵，g是一个非线性映射，W表示最终的权重矩阵。

本发明的基于注意力模型的少量样本分类方法，通过挖掘类内图像重要性的得分，使得模型能更加关注比较重要的样本，对类内图像进行均衡。其优势主要体现在：

1、有效性：通过对比无注意力模型的分类效果和加注意力模型的分类效果，可以发现加注意力后分类准确率明显提升，说明本发明能很好地达到预期效果。

2、快速性：本发明注意力得分的计算模型较为简单，基本不会引入其他计算量，计算快速且占用算力资源少。

3、实用性：少量样本下图像的识别对深度学习成本的缩减具有极大的意义，可以加速深度学习算法向着实用发展。

具体实施方式

下面结合实施例对本发明的基于注意力模型的少量样本分类方法做出详细说明。

本发明的基于注意力模型的少量样本分类方法，旨在提出一种关注更重要样本的注意力模型，给更重要的样本图像分配大的权重而不重要的样本分配较低的权重，从而使重要样本主导模型的分类。具体包括如下步骤：

1)训练一个卷积神经网络图像分类模型，训练好卷积神经网络图像分类模型后，去掉该卷积神经网络图像分类模型的全连接层，保留该卷积神经网络图像分类模型的卷积神经网络部分；所述的卷积神经网络图像分类模型是VGGNet模型或GoogLeNet模型或ResNet模型。

2)根据所有样本图像的特征向量对待测图像进行基础分类，得到n×m个标量，其中，n为所有样本图像的类数，m为每个类中的样本图像数；包括：

设所有样本图像有n个类，每个类有m个样本图像，利用所述的卷积神经网络部分对n×m个样本图像进行特征提取，得到对应的n×m个样本图像特征向量，每个样本图像特征向量是M维，利用所述的卷积神经网络部分对待测图像x进行特征提取，得到待测图像x的特征向量，并将所述的待测图像x的特征向量分别连接到n×m个样本图像特征向量的后面，得到n×m个连接向量，将n×m个连接向量经过一个非线性映射得到n×m个标量，所述的非线性映射为一个三层的全连接层。所述的n×m个标量表示待测图像x与n×m个样本图像的相似程度，从而完成待测图像进行基础分类。

3)以上的方法中我们并没有考虑到每个样本对分类判别的重要程度的不同，这种方法的分类效果达不到比较理想的效果。在每一类的图像中，噪声图像不仅不会促进分类，反而会造成相反的效果。例如在一张标注为狗的图片中，人却占了大部分区域，那么应该给该图像一个较小的权重，以均衡每个样本的对分类的贡献。将每一类的m个样本图像连接为m×M维的向量，输入一个非线性映射函数得到n×m个相对权重，用公式表示如下：

M＝g(Y) (1)

W＝activate(M) (2)

其中，Y表示将每个类中所有样本图像串联后的矩阵，g是一个非线性映射，W表示最终的权重矩阵，例如对于有5个类，其中每个类别有5张样本图像，每个样本图像的特征向量为M维的情况而言，Y为5×(5×M)的矩阵，W为5×5的矩阵，W对应位置的值为对应样本图像的权重。

Claims

1.一种基于注意力模型的少量样本分类方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于注意力模型的少量样本分类方法，其特征在于，步骤1)所述的卷积神经网络图像分类模型是VGGNet模型或GoogLeNet模型或ResNet模型。

3.根据权利要求1所述的基于注意力模型的少量样本分类方法，其特征在于，步骤2)包括：设所有样本图像有n个类，每个类有m个样本图像，利用所述的卷积神经网络部分对n×m个样本图像进行特征提取，得到对应的n×m个样本图像特征向量，每个样本图像特征向量是M维，利用所述的卷积神经网络部分对待测图像x进行特征提取，得到待测图像x的特征向量，并将所述的待测图像x的特征向量分别连接到n×m个样本图像特征向量的后面，得到n×m个连接向量，将n×m个连接向量经过一个非线性映射得到n×m个标量，所述的n×m个标量表示待测图像x与n×m个样本图像的相似程度，从而完成待测图像进行基础分类。

4.根据权利要求3所述的基于注意力模型的少量样本分类方法，其特征在于，所述的非线性映射为一个三层的全连接层。

5.根据权利要求1所述的基于注意力模型的少量样本分类方法，其特征在于，步骤3)用公式表示如下：

M＝g(Y) (1)

W＝activate(M) (2)