CN111833313B

CN111833313B - 基于深度主动学习的工业产品表面缺陷检测方法及系统

Info

Publication number: CN111833313B
Application number: CN202010574964.2A
Authority: CN
Inventors: 伍旭东; 王勇
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2024-02-02
Anticipated expiration: 2040-06-22
Also published as: CN111833313A

Abstract

本发明提出了一种基于深度主动学习的工业产品表面缺陷检测方法，解决现有运用卷积神经网络检测缺陷时，浪费人力时间大量标注数据的问题，方法包括：利用图像采集器采集工业产品表面图像样本；通过迁移学习获取卷积神经网络模型作为工业产品表面缺陷检测的训练模型，保留卷积神经网络模型的各层参数作为训练模型的初始参数；初始化训练模型，得到神经网络参数W后，将已标注训练样本集L中的样本清空；通过主动学习选择未标注数据集U中的样本进行标注，对训练模型进行训练调节；对工业产品表面进行缺陷检测。本发明提出了一种基于深度主动学习的工业产品表面缺陷检测系统，提高工业产品表面缺陷检测效率。

Description

基于深度主动学习的工业产品表面缺陷检测方法及系统

技术领域

本发明涉及工业产品表面缺陷检测的技术领域，更具体地，涉及一种基于深度主动学习的工业产品表面缺陷检测方法及系统。

背景技术

在工业生产中，工业产品的质量问题主要表现在生产材料缺陷、安装配置缺陷、各种表面缺陷等问题上，其中表面缺陷是最主要的表现形式。现有的表面缺陷检测方法是人工目视检测，这样的方式具有效率低，成本高等缺点，另外在对人体有害的生产环境中，人工目视检测失效。

得益于深度学习的兴起和卷积神经网络在特征提取、表达方面表现出的优良适应能力，一批运用卷积神经网络检测缺陷的方法应运而生，通过构建一个深度卷积神经网络模型，然后用大量的标注数据去训练模型，使深度卷积神经网络学习到这些数据中的特征，拥有识别图像特征的能力，通常来说要让深度神经网络具有较好的特征识别能力，需要大量的标注数据去训练，王立中等在2018年5月25日公开了“基于深度学习的带钢表面缺陷检测”的文章，带钢表面缺陷检测的准确率达到92.2％，并且具有较快的检测速度，完全满足了工业生产中对带钢自动化检测的要求，但训练深度学习模型时需要大量的已标注数据，而获取已标注数据需要投入大量的人力和时间。其次，在工业生产中，存在缺陷的产品数量远少于正常产品的数量，且工业产品检测场景单一，样本可供训练的有效信息不多，因此，在训练模型时，大部分是无用的重复信息，不利于模型精度的提高。

综上所述，以上存在的不足使深度学习卷积神经网络模型的训练花费较多时间和成本，工业产品表面缺陷的检测方法需要进一步改进。

发明内容

为克服现有运用卷积神经网络检测缺陷的方法在训练深度学习模型时须大量标注数据，具有花费大量人力和时间的弊端，而且训练深度学习模型时的数据大部分是无用的重复信息，不利于模型精度的提高，本发明提出一种基于深度主动学习的工业产品表面缺陷检测方法及系统，减少训练数据的标注量，提高训练效率及工业产品表面缺陷检测效率。

为实现以上发明目的，本发明的技术方案如下：

一种基于深度主动学习的工业产品表面缺陷检测方法，至少包括以下步骤：

S1.采集工业产品表面图像样本，组成训练样本集；

S2.通过迁移学习获取卷积神经网络模型作为工业产品表面缺陷检测的训练模型，保留卷积神经网络模型的各层参数作为训练模型的初始参数；

S3.将训练样本集中n个未标记的样本放入未标注训练样本集U中，从未标注数据集U中随机选取j个样本进行人工标注后，放入已标注训练样本集L中；

S4.将已标注训练样本集L中的样本输入到训练模型，对训练模型进行初步训练，得到神经网络参数W后，将已标注训练样本集L中的样本清空；

S5.通过主动学习选择未标注数据集U中的样本进行标注，对训练模型进行训练调节；

S6.利用训练调节完毕的训练模型，对工业产品表面进行缺陷检测。

在此，迁移学习为深度学习领域的一个手段，是将一个在其它训练样本集上训练好参数的神经网络模型迁移到一个全新的网络里应用，训练另一个数据样本集，在训练深度学习网络的过程中，初始化参数有着重要的作用，优秀的初始化参数能够避免在训练的开始模型陷入最优解，为此步骤S2中利用迁移学习获取一个在其它训练集上已经训练好的卷积神经网络模型，保留卷积神经网络模型的各层参数作为训练模型的初始参数，而且已经训练好的卷积神经网络模型具有一定的特征表达能力，能加快神经网络训练的速度；步骤S3及步骤S4为卷积神经网络模型初始化的过程，另外对模型进行训练的手段为本领域的基本操作，模型调节即模型微调，属于深度学习领域的常规操作，步骤S4中将已标注训练样本集L中的样本清空是为了下一批样本数据的进入留出空间。

优选地，步骤S2所述通过迁移学习获取的卷积神经网络模型为VGGNet16卷积神经网络模型，VGGNet16卷积神经网络模型作为工业产品表面缺陷检测的训练模型。

在此，由于VGGNet16卷积神经网络模型在图像分类及定位时均具有良好的性能，工业产品表面缺陷检测也是通过图像分类进行的，所以通过迁移学习获取VGGNet16卷积神经网络模型作为工业产品表面缺陷检测的训练模型。

优选地，在步骤S2之后，步骤S3之前还包括：对训练模型的输入层和输出层分别进行修改，将输入层大小修改为输入工业产品表面图像样本的大小，将输出层大小修改为缺陷分类的类数，保证输入数据大小、缺陷分类分别与输入输出层大小适应。

优选地，步骤S5所述的通过主动学习选择未标注数据集U中的样本进行标注，对训练模型进行训练调节的过程包括：

S51.从未标注数据集U中随机选取m个样本加入到候选样本集C中；

S52.将候选样本集C中的样本输入到训练模型中，在训练模型的softmax层得到样本的输出p(y_j|x_i；W)，其中，x_i表示第i个输入样本数据；y_j表示训练模型的第j个输出样本数据，即第j类缺陷，p表示第i个输入样本数据被训练模型判断为第j类缺陷的概率；

S53.根据训练模型的softmax层的样本输出p(y_j|x_i；W)，利用主动学习法求得m个样本的信息不确定性BvSB；

S54.对m个样本的BvSB值进行排序，选取BvSB值最小的K个样本作为信息最丰富样本，将BvSB值最小的K个样本数据进行数据增广处理，K≤m；

S55.将未标注数据集U中所有原数据及数据增广处理后的K个样本数据进行人工标注，放入已标注数据集L中，从候选样本集C里未被选中的样本中随机选取2K个样本数据进行标注并放入标注数据集L中；

S56.利用已标注数据集L对训练模型进行训练调节，将候选样本集C和已标注数据集L中的样本清空；

S57.令K_t+1＝K_t-r*t，其中，K_t+1表示第t+1次模型训练调节时K的值，t表示第t次模型调节，K_t表示第t次模型训练调节时K的值，r表示模型调节控制比例；

S58.判断未标注数据集U中所有数据是否均已被挑选训练，若是，执行步骤S6，否则，返回执行步骤S51。

在此，信息不确定性代表了样本的信息丰富程度，信息不确定性越低表示其信息丰富程度越高，利用BvSB值来代表信息不确定性时的计算量小，另外，在训练中，随着VGGNet16卷积神经网络模型的特征识别性能的提高，训练模型需要的数据信息丰富程度应该更高，因此K值应该减少，令K_t+1＝K_t-r*t，从候选样本集C里未被选中的样本中随机选取2K个样本数据进行标注并放入标注数据集L中是为了克服主动学习挑选的样本可能存在缺陷，造成训练的网络在识别合格工业品的能力可能不足的弊端。

优选地，m个样本中每一个输入样本数据x_i的信息不确定性BvSB的计算公式为：

BvSB_i＝argmin(p(y_best|x_i；W)-p(y_second-best|x_i；W))

其中，BvSB_i表示第i个输入样本数据x_i的信息不确定性BvSB值，BvSB值越小，信息丰富程度越高；argmin表示取得最小值的函数，y_best和Y_second-best分别表示第i个输入样本数据x_i输入至训练模型时，最优及第二优的缺陷分类，p(y_best|x_i；W)表示第i个输入样本数据被训练模型判断为最优属于的缺陷的概率；p(y_second-best|x_i；W)表示第i个输入样本数据被训练模型判断为第二优属于的缺陷的概率。

优选地，在步骤S53之后，步骤S54之前还包括：根据m个样本最优属于的缺陷分类概率及第二优属于的缺陷分类概率，计算每一个样本的BvSB值。

优选地，步骤S54所述数据增广处理的方式包括：水平垂直翻转、左右旋转、以及加入高斯噪声；步骤S55所述将未标注数据集U中所有原数据及数据增广处理后的K个样本数据进行人工标注时，仅标注原数据，数据增广处理后的K个样本数据与人工标注对应原数据具有相同的标签。

优选地，步骤S6所述的训练调节完毕的标志为：未标注数据集U中所有数据均已被挑选训练。

本发明还提出一种基于深度主动学习的工业产品表面缺陷检测系统，所述系统用于实现基于深度主动学习的工业产品表面缺陷检测方法，包括：

图像样本采集器，用于采集工业产品表面图像样本；

训练模型获取器，通过迁移学习获取卷积神经网络模型作为工业产品表面缺陷检测的训练模型；

训练模型初始化模块，将训练样本集中n个未标记的样本放入未标注训练样本集U中，从未标注数据集U中随机选取j个样本进行人工标注后，放入已标注训练样本集L中，将已标注训练样本集L中的样本输入到训练模型，对训练模型进行初步训练，得到神经网络参数W后，将已标注训练样本集L中的样本清空；

模型标注调节器，通过主动学习选择未标注数据集U中的样本进行标注，对训练模型进行训练调节；

缺陷检测模块，利用训练调节完毕的训练模型，对工业产品表面进行缺陷检测。

与现有技术相比，本发明技术方案的有益效果是：

本发明提出一种基于深度主动学习的工业产品表面缺陷检测方法及系统，通过迁移学习获取卷积神经网络模型作为工业产品表面缺陷检测的训练模型，用卷积神经网络模型去学习工业产品表面缺陷特征，用主动学习方法去选择未标注数据进行标注，从未标注数据集U中标注其中一部分数据放入已标注数据集L中初步训练模型，对训练模型进行训练调节，减少了人工标注样本的成本，不会应用大量重复的数据，提高了模型训练的效率和工业产品表面缺陷检测精度。

附图说明

图1为本发明提出的基于深度主动学习的工业产品表面缺陷检测方法的流程图；

图2为本发明实施例中提出的VGGNet16卷积神经网络模型的结构图；

图3为本发明实施例中提出的VGGNet16卷积神经网络模型初始化的过程示意图；

图4为本发明提出的深度主动学习方法与传统深度学习方法分类器性能比较示意图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

为了更好说明本实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对于本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本发明的技术方案做进一步的说明。

实施例1

如图1所示，一种基于深度主动学习的工业产品表面缺陷检测方法，包括以下步骤：

S1.采集工业产品表面图像样本，组成训练样本集；

在本实施例中，通过迁移学习获取的卷积神经网络模型为VGGNet16卷积神经网络模型，VGGNet16卷积神经网络模型作为工业产品表面缺陷检测的训练模型，示意图如图2所示，参见图2，训练模型的结构主要包括convolution+ReLU层、max pooling层、fullynected+ReLU层及softmax层，图2中224×224×3等这些表示VGGNet16卷积神经网络模型的输入数据大小，模型的输入是一个三通道的彩色图像，输出是softmax值；

S4.将已标注训练样本集L中的样本输入到训练模型，对训练模型进行初步训练，得到神经网络参数W后，将已标注训练样本集L中的样本清空，为了下一批样本数据的进入留出空间；步骤S3及步骤S4为卷积神经网络模型初始化的过程，示意图如图3所示；

S5.通过主动学习选择未标注数据集U中的样本进行标注，对训练模型进行训练调节；过程包括：

S54.对m个样本的BvSB值进行排序，选取BvSB值最小的K个样本作为信息最丰富样本，将BvSB值最小的K个样本数据进行数据增广处理，K≤m；m个样本中每一个输入样本数据x_i的信息不确定性BvSB的计算公式为：

BvSB_i＝argmin(p(y_best|x_i；W)-p(y_second-best|x_i；W))

其中，BvSB_i表示第i个输入样本数据x_i的信息不确定性BvSB值，BvSB值越小，信息丰富程度越高；argmin表示取得最小值的函数，y_best和y_second-best分别表示第i个输入样本数据x_i输入至训练模型时，最优及第二优的缺陷分类，p(y_best|x_i；W)表示第i个输入样本数据被训练模型判断为最优属于的缺陷的概率；p(y_second-best|x_i；W)表示第i个输入样本数据被训练模型判断为第二优属于的缺陷的概率；数据增广处理的方式包括：水平垂直翻转、左右旋转、以及加入高斯噪声；步骤S55所述将未标注数据集U中所有原数据及数据增广处理后的K个样本数据进行人工标注时，仅标注原数据，数据增广处理后的K个样本数据与人工标注对应原数据具有相同的标签；

S6.利用训练调节完毕的训练模型，对工业产品表面进行缺陷检测，未标注数据集U中所有数据均已被挑选训练时，训练模型训练调节完毕。

在本实施例中，在步骤S2之后，步骤S3之前还包括：对训练模型的输入层和输出层分别进行修改，将输入层大小修改为输入工业产品表面图像样本的大小，将输出层大小修改为缺陷分类的类数，如图2所示，输入是224×224×3，输出是1000，将输入的大小改成输入图像大小，输出改成缺陷的分类类数，保证输入数据大小和缺陷分类与输入输出层大小适应。

在本实施例中，在步骤S53之后，步骤S54之前还包括：根据m个样本最优属于的缺陷分类概率及第二优属于的缺陷分类概率，计算每一个样本的BvSB值。

图像样本采集器，用于采集工业产品表面图像样本；

训练模型初始化模块，将训练样本集中n个未标记的样本放入未标注训练样本集U中，从未标注数据集U中随机选取i个样本进行人工标注后，放入已标注训练样本集L中，将已标注训练样本集L中的样本输入到训练模型，对训练模型进行初步训练，得到神经网络参数W后，将已标注训练样本集L中的样本清空；

如图4所示的运用本发明提出的深度主动学习方法与传统深度学习方法后，分类器性能比较示意图，其中，虚线表示深度主动学习方法下分类器随训练集样本数性能提高曲线，实线是深度神经网络方法下分类器随训练集样本数性能提高曲线。由图4可知，深度主动学习收敛速度比深度学习方法快，本发明提出的基于深度主动学习的工业产品表面缺陷检测方法及系统提高了模型训练的效率。

附图中描述位置关系的用于仅用于示例性说明，不能理解为对本专利的限制；

显然，本发明的上述实施例仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

Claims

1.一种基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，至少包括以下步骤：

S1.利用图像采集器采集工业产品表面图像样本，组成训练样本集；

步骤S5所述的通过主动学习选择未标注数据集U中的样本进行标注，对训练模型进行训练调节的过程包括：

S58.判断未标注数据集U中所有数据是否均已被挑选训练，若是，执行步骤S6，否则，返回执行步骤S51；

m个样本中每一个输入样本数据x_i的信息不确定性BvSB的计算公式为：

BvSB_i＝argmin((p(y_best|x_i；W)-p(y_second-best|x_i；W))

其中，BvSB_i表示第i个输入样本数据x_i的信息不确定性BvSB值，BvSB值越小，信息丰富程度越高；argmin表示取得最小值的函数，y_best和y_second-best分别表示第i个输入样本数据x_i输入至训练模型时，最优及第二优的缺陷分类，p(y_best|x_i；W)表示第i个输入样本数据被训练模型判断为最优属于的缺陷的概率；p(y_second-best|x_i；W)表示第i个输入样本数据被训练模型判断为第二优属于的缺陷的概率；

2.根据权利要求1所述的基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，步骤S2所述通过迁移学习获取的卷积神经网络模型为VGGNet16卷积神经网络模型，VGGNet16卷积神经网络模型作为工业产品表面缺陷检测的训练模型。

3.根据权利要求2所述的基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，在步骤S2之后，步骤S3之前还包括：对训练模型的输入层和输出层分别进行修改，将输入层大小修改为输入工业产品表面图像样本的大小，将输出层大小修改为缺陷分类的类数。

4.根据权利要求1所述的基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，在步骤S53之后，步骤S54之前还包括：根据m个样本最优属于的缺陷分类概率及第二优属于的缺陷分类概率，计算每一个样本的BvSB值。

5.根据权利要求4所述的基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，步骤S54所述数据增广处理的方式包括：水平垂直翻转、左右旋转、以及加入高斯噪声。

6.根据权利要求5所述的基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，步骤S55所述将未标注数据集U中所有原数据及数据增广处理后的K个样本数据进行人工标注时，仅标注原数据，数据增广处理后的K个样本数据与人工标注对应原数据具有相同的标签。

7.根据权利要求6所述的基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，步骤S6所述的训练调节完毕的标志为：未标注数据集U中所有数据均已被挑选训练。

8.一种基于深度主动学习的工业产品表面缺陷检测系统，所述系统用于实现权利要求1所述的基于深度主动学习的工业产品表面缺陷检测方法，其特征在于，包括：

图像样本采集器，用于采集工业产品表面图像样本；