CN111950630B

CN111950630B - 基于两阶段迁移学习的小样本工业产品缺陷分类方法

Info

Publication number: CN111950630B
Application number: CN202010803896.2A
Authority: CN
Inventors: 刘家欢; 刁思勉; 张云; 李娜; 刘文锋; 陈艳平; 李锡康
Original assignee: Shenzhen Yejiawei Technology Co ltd
Current assignee: Shenzhen Yejiawei Technology Co ltd
Priority date: 2020-08-12
Filing date: 2020-08-12
Publication date: 2022-08-02
Anticipated expiration: 2040-08-12
Also published as: CN111950630A

Abstract

一种基于两阶段迁移学习的小样本工业产品缺陷分类方法，包括如下步骤，S1、采集正、负样本构成数据集；S21、用图像数据增强手段将数据集中负样本的数量扩充2‑3倍，随机挑选数量与扩充后的负样本的数量相当的正样本，组成数量平衡的数据子集；S22、将剩余的正样本组成另一个数据集子集；S31、选取CNN检测模型，进行第一阶段的训练；S32、第二阶段的训练是在包含剩余正样本和扩充后的负样本的数据集子集上进行；S4、将S32步模型训练收敛后，在测试集上测试模型的分类性能，若满足要求，即可上线测试，否则重复划分数据子集和模型训练过程，重复S21至S32，直至满足要求。本发明具有以下有益效果：一是具有性能更好的缺陷图像高维特征；二是提高了模型对工业产品图像的表征能力；三是所述的模型训练策略具有良好的通用性。

Description

基于两阶段迁移学习的小样本工业产品缺陷分类方法

技术领域

本发明属于视觉检测技术领域，具体的涉及一种基于两阶段迁移学习的小样本工业产品缺陷分类方法。

背景技术

随着智能制造的发展，工业产品的生产自动化需求越来越迫切，产品质量要求也越来越高，目前的工业生产实际中，大多数的生产技术环节过程都已经实现了自动化。但是产品的外观质量检测检测环节仍然很难实现自动化，需要大量的人工检测，影响了生产效率和产品质量。因此，工业产品的外观缺陷检测技术和系统的研究非常重要。

产品外观检测的基本流程是首先获取产品缺陷图像，然后通过算法模型提取图像中的缺陷特征，然后根据特征计算缺陷的类型和位置，最后将检测结果反馈给执行机构，执行产品的分拣任务。传统的图像处理算法采用特征工程的方法，通过计算人为设计的图像特征来实现分类，但是这种方式对人的依赖很大，调试困难，适应性差。随着深度学习技术的发展，基于深度学习模型的缺陷检测技术应用越来越广，但是，工业产品生产过程中缺陷样本数量较少，收集困难，标注过程耗时耗力，导致可以用于模型训练的缺陷样本很少，而正常样本数量庞大，因此，这样就形成了缺陷样本和正常样本的数量不平衡，在这种数量不平衡的数据集上训练得到的深度学习模型会导致模型偏向于数量多的正常样本，导致对缺陷样本的检测准确率下降，难以保证最终产品的合格率。

发明内容

针对上述所描述的难题，本发明提供了一种基于两阶段迁移学习的小样本工业产品缺陷分类方法。

本发明中，缺陷样本定义为负样本，正常样本定义为正样本。两阶段训练策略首先将原来的不平衡数据集划分为两部分，具体来说，依据数据集中数量较少的负样本的数量将数据集划分为两组，一组全部由正样本组成，一组是由所有的负样本和与负样本数量相当的正样本组成，这样一来，这两部分数据子集均是平衡的数据集，然后模型先在所有正样本组成的数据集上训练，然后在正负样本组成的完全数据集上训练，这样就能得到无偏模型。

为了提高模型的表征能力，减少训练时间，模型使用两阶段迁移学习策略。第一阶段的迁移过程是将在开源数据集上训练的模型迁移到所有正样本组成的数据集的训练中，第二阶段的迁移过程是从在正样本组成的数据集上训练的模型迁移到所有样本组成的数据集的训练中。本发明提出的基于深度学习的缺陷检测算法是利用卷积神经网络(ConvolutionalNeuralNetworkCNN)处理输入图像，提取图像特征，对缺陷图像进行分类。

为了实现上述的目的，本发明还提出了图像数据增强方式用于提高负样本的数量，为模型训练提供更多的训练信息，具体来说，对数量较少的负样本实施旋转、翻转、注入高斯噪声等方式进行图像变换，增加负样本的数量，同时提高模型的鲁棒性。

本发明的技术方案是提供一种基于两阶段迁移学习的小样本工业产品缺陷分类方法，其中，基于两阶段迁移学习的模型训练策略是在模型实际使用之前进行离线训练，具体训练步骤为：

S1、采集包含预定数量的正、负样本构成缺陷图像数据集，其中正样本的数量是负样本数量的5倍～25倍；

S21、使用图像数据增强手段将数据集中所有缺陷类别的负样本的数量扩充2-3倍，然后从每个类别中随机挑选数量与扩充后的负样本的数量相当的正样本，将这些正负样本一起组成数量平衡的数据子集；

S22、将剩余的正样本组成另一个只包含正样本的数据集子集；

S31、选取合适的CNN模型结构，第一阶段的训练是在只包含正样本的数据集子集上进行，将该结构的模型在公开图像数据集上预训练得到的模型卷积层部分迁移到第一阶段的模型卷积层中，然后随机初始化模型的分类层，在数据子集训练整个模型；

S32、第二阶段的训练是在包含剩余正样本和扩充后的负样本的数据集子集上进行，将S31步中得到的模型去除最后一层分类层，并且将输出节点数扩充一倍(一个正样本类别增加一个负样本类别)，后迁移到第二个模型中，重新随机初始化第二个模型的分类层，然后在包含剩余正样本和扩充后的负样本的数据子集上训练模型；

S4、将S32步模型训练收敛后，在测试集上测试模型的分类性能，若满足要求，即可上线测试，否则重复划分数据子集和模型训练过程，重复S2和S3，直至满足要求。

优选地，所述的CNN检测模型由VGG16模型组成，VGG16网络模型包含5个连续的由卷积层、池化层和激活函数组成的构建模块，这5个构建块共有13个层，用于从图像中提取特征，后面有3个全连接层，用于从提取到的高维特征中计算分类结果。

总体而言，通过本发明所构思的以上技术方案与现有技术相比，本发明提供的基于两阶段迁移学习模型训练策略和数据增强方法主要具有以下有益效果：

(1)数据增强方法扩充了负样本的数量，为深度学习模型训练提供了更多的特征信息，使模型学习到性能更好的缺陷图像高维特征；

(2)所述的两阶段迁移学习策略加快了模型的训练速度，提高的模型对工业产品图像的表征能力。其次，该迁移学习方法提高了训练样本使用效率，改善了模型在不平衡数据集上训练的偏移特性，提高了模型对数量较少的负样本的分类准确率；

(3)所述的模型训练策略具有通用性，即方法中所用的深度学习模型可以使用任何常见的模型，不依赖与某种具体的模型结构。

附图说明

图1是本发明所述模型训练思路流程示意图。

图2是本发明所述的数据集划分策略示意图。

图3是本发明所述的两阶段迁移学习模型训练策略示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

结合图1所示，本发明的两阶段迁移学习模型训练策略为，首先将原始由于负样本较少导致的正负样本平衡的数据集中的负样本通过图像数据增强方式扩充2-3倍，然后在数量众多的正样本中随机挑选数量与扩充后的负样本数量相当的正样本，一起组成数据集子集，然后剩余的正样本组成另一个只包含正样本的数据集子集。选定的深度学习模型首先从公开图像数据集上迁移到第一个新模型中，在只包含正样本的数据集子集上训练至收敛，然后将第一个模型迁移至第二个新模型中，在包含剩余正样本和扩充负样本的数据集子集上训练至收敛，最后将模型用于性能测试和线上缺陷检测。

一种基于两阶段迁移学习的小样本工业产品缺陷分类方法，包括如下步骤：

S21、使用图像数据增强方法将原始不平衡数据集中的负样本扩充2-3倍，然后、从原始数据集中随机挑选数量与扩充后的负样本数量相当的正样本，将这些正样本和扩充后的负样本一起组成数量平衡的数据集子集，标记为DataSet_正负；

S22、将剩余的正样本组成另一个只包含正样本的平衡的数据集子集，标记为DataSet_正；

S31、挑选并设计合适的深度学习模型架构，记为Model；然后将模型Model在公开自然图像数据集上训练得到的模型的卷积层部分迁移至第一个缺陷检测模型Model₁，然后随机初始化Model₁的分类层参数，然后模型Model₁在只包含正样本的数据集子集DataSet_正上进行训练，在这一阶段的训练中，Model₁学会将参数适应缺陷检测任务；

S32、将S31得到的模型Model₁去掉最后一层分类层之后迁移至第二个缺陷检测模型Model₂中，然后将原来的分类层节点数量增加一倍(每个正样本类别对应一个负样本类别)，随机初始化分类层参数后，在包含剩余正样本和扩充负样本的数据集子集DataSet_正负上训练第二个模型Model₂的分类层参数，其它层参数保持不变；

S4、在测试集上对S32得到的第二个模型Model₂进行性能测试，若满足要求则将模型用于线上缺陷检测，否则重复S2和S3步骤，直至模型性能达到要求。

通过本发明提出的训练策略，在经典缺陷检测数据集，如DAGM数据集上，当正负样本比例为25:1时，在测试数据集上对缺陷负样本的测试准确率可以比直接在不平衡数据集上训练得到的模型提升9％以上，极大地提升了缺陷检测准确率。

优选地，所述的深度学习模型Model的架构为修改后的VGG16模型，模型各层的卷积核参数如下表所示，其中，Num为缺陷类别个数。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于两阶段迁移学习的小样本工业产品缺陷分类方法，其特征在于：包括如下步骤，

S21、使用图像数据增强手段将缺陷图像数据集中所有缺陷类别的负样本的数量扩充2-3倍，然后，从每个类别中随机挑选数量与扩充后的负样本的数量相当的正样本，将这些正负样本一起组成数量平衡的数据子集，标记为DataSet_正负；

S22、将剩余的正样本组成另一个只包含正样本的数据集子集，标记为DataSet_正；

S32、将S31得到的模型Model₁去掉最后一层分类层之后迁移至第二个缺陷检测模型Model₂中，然后将原来的分类层节点数量增加一倍，其中，每个正样本类别对应一个负样本类别，随机初始化分类层参数后，在包含剩余正样本和扩充负样本的数据集子集DataSet_正负上训练第二个模型Model₂的分类层参数，其它层参数保持不变；

S4、将S32步模型训练收敛后，在测试集上测试模型的分类性能，若满足要求，即可上线测试，否则重复划分数据子集和模型训练过程，重复S21至S32，直至满足要求。

2.根据权利要求1所述的基于两阶段迁移学习的小样本工业产品缺陷分类方法，其特征在于： CNN检测模型由VGG16模型组成，VGG16网络模型包含5个连续的由卷积层、池化层和激活函数组成的构建模块，这5个构建块共有13个层，用于从图像中提取特征，后面有3个全连接层，用于从提取到的高维特征中计算分类结果。