CN107563406B

CN107563406B - 一种自主学习的图像精细分类方法

Info

Publication number: CN107563406B
Application number: CN201710598711.7A
Authority: CN
Inventors: 宣琦; 肖浩泉; 傅晨波; 方宾伟; 王金宝
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2017-07-21
Filing date: 2017-07-21
Publication date: 2021-01-01
Anticipated expiration: 2037-07-21
Also published as: CN107563406A

Abstract

一种自主学习的图像精细分类方法，包括以下步骤：1)人工采集对应需求标签的图像数据集，保存至强标签数据集，使用ImageNet数据集初始化卷积神经网络CNN参数；2)使用强标签数据集微调修正CNN；3)判断分类网络的优化趋势；4)判断网络分类精度是否达到了要求；5)利用网络爬虫从互联网爬取、人工采集与标签相关的图像数据和噪声数据保存至弱标签数据集；6)使用弱标签数据集调整滤波器的阈值；7)使用调整后的滤波器筛选数据保存至强标签数据集和噪声数据集；8)保存网络权重和滤波器参数。本发明训练得到的分类器的分类精度和鲁棒性都较高。

Description

一种自主学习的图像精细分类方法

技术领域

本发明涉及卷积神经网络(CNN)，网络爬虫技术及图像分类技术，特别针对噪声数据的分类器训练技术，尤其是一种自主学习的图像精细分类方法。

背景技术

随着机器学习技术的应用越来越广泛尤其是深度学习技术的发展，依赖于深度学习的机器学习方法的设计变得越来越简单，而训练数据集的获取成为了限制机器学习最大的门槛。传统的机器学习所用的数据集都为人工采集，即便是用互联网爬取的数据，也需要人为的进行标注和筛选。

传统的机器学习方法难以有效应对随机选择图像的子类分类，而卷积神经网络则可以在大数据的基础上较好的解决此问题。卷积神经网络(Convolutional NeuralNetworks，CNN)是深度学习算法的一种，近年来成为图像识别领域重要的处理分析工具。卷积神经网络算法的优点在于训练模型时不需要使用任何人工标注的特征，算法可以自动探索输入变量所隐含的特征，同时网络的权值共享特性，降低了模型的复杂度，减少了权值的数量。这些优点使原始图像可以直接作为网络的输入，避免了传统识别算法中复杂的特征提取和数据重建过程。此外，卷积神经网络的池化层对平移、倾斜具有不变性，提高了算法处理图像的鲁棒性。

图像识别是深度学习的一大受益者，如果有足够的准确标注的图像数据集，就能用深度学习的方法得到分类效果较好的图像分类器。而互联网上存在大量的弱标签的图像数据，已经存在可行的方法爬取这些图像数据。如果通过网络爬虫的手段爬取公开的图像数据，再通过计算机程序自动筛选标签正确的图像，就可以用较小的成本获取较大量所需的图像数据集，从而通过卷积神经网络训练出较高正确率的图像子类分类器。目前常见的网络图像数据源主要包含两种类型：

1、主流图像搜索引擎，如Baidu、Google、Bing、Yahoo等；

2、图像分享网站，如Picasa、Flickr、Instagram等。

当使用网络爬虫技术获取图像数据时，使用图像搜索引擎爬取的图像质量随显示的顺序大体呈现下降的趋势，使用图像分享网站爬取的图像质量尽管与图像搜索引擎相比与显示的顺序相关性较小，但随爬取的数量增加，质量也会有所下降。如果直接使用爬取的数据训练网络，就会出现网络分类器正确率先增后减的情况，最终得到的分类器难以满足需求。

发明内容

为了克服现有技术中传统的网络爬虫得到的图像数据存在数据噪声过大造成的训练分类器正确率低的情况，本发明提出了一种针对噪声数据集的自主学习的图像精细分类方法，本发明具体用到的深度学习方法为卷积神经网络(CNN)，卷积神经网络算法直接使用图像作为输入，避免了传统识别算法中复杂的特征提取和数据重建过程，训练得到的分类器的分类精度和鲁棒性都较高。

本发明为解决上述技术问题所采用的技术方案如下：

一种自主学习的图像精细分类方法，包括以下步骤：

S1：人工采集对应需求标签的图像数据集，保存至强标签数据集，使用ImageNet数据集初始化卷积神经网络CNN参数；

S2：使用强标签数据集微调修正CNN；

S3：判断分类网络的优化趋势；

S4：判断网络分类精度是否达到了要求；

S5：利用网络爬虫从互联网爬取、人工采集与标签相关的图像数据和噪声数据保存至弱标签数据集；

S6：使用弱标签数据集调整滤波器的阈值。

S7：使用调整后的滤波器筛选数据保存至强标签数据集和噪声数据集。

S8：保存网络权重和滤波器参数。

进一步，所述步骤S1包含以下步骤：

S1.1：根据需求列出分类名单作为标签列表，按照标签列表从互联网抓取或使用相机人工采集相关的图片，每一类保留设定数量张准确的图片。

S1.2：使用ImageNet数据集训练卷积神经网络，主要为训练网络的卷积层参数。

优选的，所述步骤S2的处理过程为：使用强标签数据微调训练卷积神经网络，主要为调整网络的分类参数。

再进一步，所述步骤S3包括以下步骤：

S3.1：若迭代不足三次，则进入步骤S4；

S3.2：比较最近三次迭代中，末次是否是最优分类精度，是则认为网络还在优化阶段，否则认为网络参数已经停止收敛；

S3.2：若网络仍在优化阶段，则进入步骤S4；

S3.3：若网络参数停止收敛，则进入步骤S8。

所述步骤S4包括以下步骤：

S4.1：判断网络精度是否达到了预设的精度要求；

S4.2：若是，则进入步骤S8；

S4.3：若否，则进入步骤S5。

所述步骤S5包含以下步骤：

S5.1：使用爬虫技术从互联网爬取与标签相关的图像数据，包含但不局限于Baidu、Bing、Google、Yahoo、Instagram或Flickr；

S5.2：采用数码设备人工采集与标签对应的图像数据。

所述步骤S6包含以下步骤：

S6.1：统计分类网络对弱标签数据的分类结果，计算类间相似度；

S6.2：根据类间相似度，计算使分类误差最小的分类阈值.

所述步骤S7包含以下步骤：

S7.1：使用当前的分类网络和调节后的滤波器筛选弱标签数据集；

S7.2：分类可信的数据归至强标签数据集，不可信的数据归至噪声数据集；

S7.3：随机挑选每类50张图片至弱标签数据集。

所述步骤S8包含以下步骤：

S8.1：将最新的网络参数初始化最终分类网络；

S8.2：停止学习。

本发明所述的方法具有如下的有益效果：

(1)本发明所述的方法通过卷积神经网络对噪声数据进行判断，适时终止学习，提高了机器学习的效率，降低了在数据筛选上消耗的时间。

(2)本发明所述的方法利用爬虫等方法获取到的数据训练卷积神经网络，能够不断增强卷积神经网络的鲁棒性，使最终的分类器有一个较优的性能。

(3)本发明所述的方法将卷积神经网络与图像分类结合，实现双向互惠，形成一个不断优化的可持续系统，减少了整个项目投入的人力成本。

附图说明

图1为一种自主学习的图像精细分类方法的流程图；

图2为完整的分类器学习流程图；

图3为分类器分类损失值随迭代次数减小的变化曲线。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1～图3，一种自主学习的图像精细分类方法，包括以下步骤：

步骤1：随机获取初始图像数据和分类网络

根据需求列出分类名单作为标签列表，按照标签列表从互联网抓取或使用相机人工采集相关的图片，每一类保留设定数量张准确的图片，使用ImageNet数据集训练卷积神经网络，主要为训练网络的卷积层参数；

步骤2：强标签数据微调分类网络

使用强标签数据微调训练卷积神经网络，主要为调整网络的分类参数；

步骤3：判断分类网络的优化趋势

若迭代不足三次，则进入步骤4；比较最近三次迭代中，末次是否是最优分类精度，是则认为网络还在优化阶段，否则认为网络参数已经停止收敛；若网络仍在优化阶段，则进入步骤4；若网络参数停止收敛，则进入步骤8；

步骤4：判断网络分类精度是否达到了要求

判断网络精度是否达到了预设的精度要求，是则进入步骤8，若否，则进入步骤5；

步骤5：扩充弱标签数据集

使用爬虫技术从互联网爬取与标签相关的图像数据，包含但不局限于Baidu、Bing、Google、Yahoo、Instagram或Flickr；

采用相机、手机等数码设备人工采集与标签对应的图像数据；

步骤6：计算滤波器的参数

统计分类网络对弱标签数据的分类结果，计算类间相似度；

根据类间相似度，计算使分类误差最小的分类阈值；

步骤7：筛选数据

使用当前的分类网络和调节后的滤波器筛选弱标签数据集；

分类可信的数据归至强标签数据集，不可信的数据归至噪声数据集；

随机挑选每类50张图片至弱标签数据集；

步骤8：结束学习过程

将最新的网络参数初始化最终分类网络；停止学习。

本实施例对互联网公开的图像数据进行数据爬取。以本实例研究对宠物图像精细分类器训练为例，介绍本发明，所述图像精细分类方法包括以下步骤：

步骤1：随机获取初始图像数据和分类网络：

参照图2，使用Oxford Pets数据集，每类使用100张图像作为初始训练数据保存至强标签数据集。使用ImageNet数据集训练AlexNet网络参数；

步骤2：强标签数据微调分类网络：

使用强标签数据集微调训练AlexNet网络，得到一个能够粗略识别宠物种类的图像分类器，对输入的图像输出该图像属于每一种类的概率，按概率从大到小排列子类名单；

步骤3：判断分类网络的优化趋势：

步骤4：判断网络分类精度是否达到了要求：

判断网络精度是否达到了预设的精度要求,若是则进入步骤8,若否，则进入步骤5；

步骤5：扩充弱标签数据集：

使用爬虫技术从Baidu、Bing、Google、Yahoo、Sogou爬取相关图像；

步骤6：计算滤波器的参数：

统计分类网络对弱标签数据的分类结果，计算类间相似度；根据类间相似度，计算使分类误差最小的分类阈值；

步骤7：筛选数据：

使用当前的分类网络和调节后的滤波器筛选弱标签数据集，分类可信的数据归至强标签数据集，不可信的数据归至噪声数据集，从噪声数据集随机挑选每类50张图片至弱标签数据集；

步骤8：结束学习过程：

将最新的网络参数初始化最终分类网络并停止学习过程。

迭代过程中网络分类的损失值变化如图3。

如上所述为本发明在宠物图像分类的实施例介绍，本发明通过对图像分类器的迭代更新和网络爬取数据的自动筛选，由初始的少量数据量扩展成大量数据量，明显提高了图像分类器的分类精度，减少了大量人力和财力。对发明而言仅仅是说明性的，而非限制性的。本专业技术人员理解，在发明权利要求所限定的精神和范围内可对其进行许多改变，修改，甚至等效，但都将落入本发明的保护范围内。

Claims

1.一种自主学习的图像精细分类方法，其特征在于：包括以下步骤：

S2：使用强标签数据集微调修正CNN；

S3：判断分类网络的优化趋势，包括以下步骤：

S3.1：若迭代不足三次，则进入步骤S4；

S3.2：若网络仍在优化阶段，则进入步骤S4；

S3.3：若网络参数停止收敛，则进入步骤S8；

S4：判断网络分类精度是否达到了要求；

S6：使用弱标签数据集调整滤波器的阈值；

S7：使用调整后的滤波器筛选数据保存至强标签数据集和噪声数据集；

S8：保存网络权重和滤波器参数，包含以下步骤：

S8.1：将最新的网络参数初始化最终分类网络；

S8.2：停止学习。

2.根据权利要求1所述的自主学习的图像精细分类方法，其特征在于：所述步骤S1包含以下步骤：

S1.1：根据需求列出分类名单作为标签列表，按照标签列表从互联网抓取或使用相机人工采集相关的图片，每一类保留设定数量张准确的图片；

3.根据权利要求1或2所述的自主学习的图像精细分类方法，其特征在于：所述步骤S2的处理过程为：使用强标签数据微调训练卷积神经网络，主要为调整网络的分类参数。

4.根据权利要求1或2所述的自主学习的图像精细分类方法，其特征在于：所述步骤S4包括以下步骤：

S4.1：判断网络精度是否达到了预设的精度要求；

S4.2：若是，则进入步骤S8；

S4.3：若否，则进入步骤S5。

5.根据权利要求1或2所述的自主学习的图像精细分类方法，其特征在于：所述步骤S5包含以下步骤：

S5.2：采用数码设备人工采集与标签对应的图像数据。

6.根据权利要求1或2所述的自主学习的图像精细分类方法，其特征在于：所述步骤S6包含以下步骤：

S6.2：根据类间相似度，计算使分类误差最小的分类阈值。

7.根据权利要求1所述的自主学习的图像精细分类方法，其特征在于：所述步骤S7包含以下步骤：

S7.3：随机挑选每类50张图片至弱标签数据集。