CN108805196B

CN108805196B - 用于图像识别的自动增量学习方法

Info

Publication number: CN108805196B
Application number: CN201810574578.6A
Authority: CN
Inventors: 庞善民; 吴伟; 钟越星
Original assignee: Xian Jiaotong University
Current assignee: Xian Jiaotong University
Priority date: 2018-06-05
Filing date: 2018-06-05
Publication date: 2022-02-18
Anticipated expiration: 2038-06-05
Also published as: CN108805196A

Abstract

本发明公开一种用于图像识别的自动增量学习方法，包括：1)读取已标注的若干图像数据并进行处理，使用设计的卷积神经网络，输入处理后的数据进行训练得到预训练模型；2)计算当前预训练模型得到评价标准α，将一部分无标注数据输入到当前预训练模型中，对输出结果应用熵损失函数β进行分类；3)每次得到的新训练数据重新输入到当前的模型中进行训练；优化模型参数，直到无标注数据全部标注或不可再划分则停止迭代。本发明为如何使用少量标注数据和相对较多无标注数据(或者含有干扰的数据)进行图像识别提供了解决方案，既避免大量人工劳动和在某些领域标注数据需要专业知识的困难，又提高了图像的识别精度。

Description

用于图像识别的自动增量学习方法

技术领域

本发明属于计算机视觉图像识别领域，特别涉及一种用于图像识别的自动增量学习方法。

背景技术

在图像识别领域中，良好的训练过的神经网络模型已经可以达到很高的识别率，能够区分出图片中的不同物体。目前，对于图像的识别存在以下问题：

1)训练好的模型只能识别已训练过的物体，对于未训练的物体会错误的归到已知类中，并不能将其归到未知类，图像识别的精度不高。

2)每一类物体需要大量人工标注的数据，这些标注工作需要大量的人工劳动，既费时又费事。标注数据还需要较高的专业性。标注数据的缺失导致神经网络缺乏训练，影响后续的工作。

发明内容

本发明的目的在于提供一种用于图像识别的自动增量学习方法，以解决上述技术问题。

为达到上述目的，本发明采用了以下技术方案：

一种用于图像识别的自动增量学习方法，包括以下步骤：

1)预训练卷积神经网络

读取已标注的若干图像数据并进行处理，使用设计的卷积神经网络，输入处理后的数据进行训练得到预训练模型；

2)自动对无标注数据进行标注

计算当前预训练模型得到评价标准α，将一部分无标注数据输入到当前预训练模型中，对输出结果应用熵损失函数β进行分类；

3)迭代全量训练

每次得到的新训练数据重新输入到当前的模型中进行训练；优化模型参数，直到无标注数据全部标注或不可再划分则停止迭代。

进一步的，步骤1)具体包括：首先，读取若干已标注的图像数据进行处理；其次，输入到未经训练的卷积神经网络中；然后，在GPU上进行训练得到预训练模型；并在测试数据集上验证预训练模型识别准确精度。

进一步的，所述读取若干已标注的图像数据进行处理的步骤为：首先，对已经标注图像数据做L2归一化处理；然后，将已标注数据划分为训练集和验证集。

进一步的，所述的卷积神经网络输入维度与训练数据维度大小相同；该卷积神经网络有三个卷积层，一个max-pooling层和一个soft-max层。

进一步的，步骤2)具体包括：首先，计算当前预训练模型，将结果按类别进行累加取平均值并放入数组中得到评价标准α；其次，将一部分无标注数据输入到当前预训练模型中，对输出结果与α中对应类别的值应用熵损失函数β进行分类，若输出值满足结果则对此图像标注对应的类别，并将标注的图像数据加入到当前的训练数据集中。

进一步的，所述评价标准α，

α是当前网络对训练集各个类别正确输出的结果取平均值，在网络中α值的个数与要分类的个数是相同的，id表示一个类别，n表示类别的总数，m表示训练集输出中y是id的样本总数，

表示在指定id下m个总数中第i个y。

进一步的，所述熵损失函数β，

i表示每个类别概率值，y_i表示网络输出的sotfmax数组，α_(id)i表示α中类别是id的softmax数组的第i位，n表示类别的总数。

进一步的，应用熵损失函数β进行分类，若计算值β小于1，则满足结果并对此图像标注对应的类别。

进一步的，所述迭代全量训练的步骤为：将新的训练集输入到当前网络中进行训练；训练完成后重新进行α的计算；取另一部分无标注数据进行标注加入到原有训练集；判断无标注数据集是否标注完，若没有标注完则训练过程一直反复，否则停止迭代。

进一步的，所述卷积神经网络的输入维度与训练数据维度大小相同；该卷积神经网络结构不为固定样式，可参考主流方法自行设计，本发明所采用的是根据inception-v4网络结构改进的。

相对于现有技术，本发明具有以下有益效果：

首先，使用少量标注数据和相对较多无标注数据(或者含有干扰的数据)进行图像识别，能避免大量的人工工作。其次，可以自动对无标注数据进行标注，提高了图像识别的精度。

附图说明

图1为图像识别的自动增量学习方法的总体流程图。

图2为计算集合α流程图。

图3为计算β并标注图像流程图。

具体实施方式

下面结合附图对发明作进一步说明。

对于本发明，要求是卷积神经网络预训练模型在验证集的准确率指标达到85％以上，并划分无标注数据，进行多次迭代的全量训练。图1是本发明的总体步骤，显示了用少量标注数据通过本发明的方法提高图像识别精度的三大步骤，卷积神经网络预训练、自动标注没有标注过的图像和重新训练卷积神经网络。

本发明提供一种用于图像识别的自动增量学习方法，包括以下步骤：

步骤一、首先是预训练卷积神经网络，预训练网络主要是将少量已标注的图像数据，输入到未经训练的卷积神经网络中进行训练，然后在测试数据集上验证准确率指标，如指标可以达到85％以上，则继续进行下面的过程，否则需要通过增加标注数据或者修改神经网络结构来提高预训练模型的准确率。预训练模型的具体步骤为：

步骤1，对已经标注图像数据做L2归一化处理；

步骤2，将已标注数据划分为训练集和验证集；训练集占4/5，验证集占1/5；每类已标注图片数量应大于1000，已标注数据总数应大于n*1000，n表示类别总数；

步骤3，设计输入维度与训练数据维度大小相同的卷积神经网络，网络参考DenseNet，ResNext，也可以使用迁移学习的方法；

步骤4，输入步骤2经过归一化处理后的训练数据，在GPU上训练卷积神经网络；

步骤5，训练完成后，获得预训练模型，步骤一完成。

步骤二、用预训练模型自动对无标注图像数据进行标注，在无标注图像数据中既包含了网络可识别的图像类别，也包含了其他干扰图像。自动标注数据主要分为两个步：第一，用训练集数据重新输入目前网络中，然后对输出计算得到评价标准α；第二，将无标注数据集划分，然后将一部分输入到目前网络中，对输出结果应用熵损失函数辨别是否标注，如果标注则将此图像数据集加入到当前的训练集中。具体方式为：

1)评价标准α是当前网络对训练集各个类别正确输出的结果取平均值，在网络中α值的个数与要分类的个数是相同的。这一过程的具体步骤为：

步骤1，将训练数据集重新输入到当前网络中，记录识别正确的输出结果；

步骤2，将步骤1的识别结果按类别进行累加取平均值；

步骤3，将结果都放入到一个数组中得到集合α。

评价标准α，

表示在指定id下m个总数中第i个y。

2)在自动标注时应用到判别函数，它是把前输出与α集合中的正确输出作为输入，输入到本发明所设计的熵损失判断函数中，依据其结果决定是否标注图像，这一过程的具体步骤为：

步骤1，划分无标注数据集，取其中的一部分，将里面的无标注数据逐个输入到预训练模型中得到输出结果；

步骤2，将步骤1的输出结果与集合α中对应类别的值输入到熵损失判断函数中；熵损失函数β，

步骤3，熵损失判断函数的输出值，如果满足结果则对此图像标注对应的类别；

步骤4，将标注的新图像数据加入到原有的训练数据集中。

步骤三、最后为迭代全量训练，将每次产生的新训练数据重新输入到当前的模型中进行训练，新的训练数据是原有的加上后来标注的。这个训练过程一直反复，直到把划分的无标注数据集全部训练完后停止。这一过程的具体步骤为：

步骤1，将新的训练集输入到当前网络中进行训练；

步骤2，训练完成后重新进行α的计算；

步骤3，取另一部分无标注数据进行标注加入到原有训练集；

步骤4，判断无标注数据集是否标注完，如果没有则回到步骤1继续迭代。