CN114037653B

CN114037653B - 基于二阶段知识蒸馏的工业机器视觉缺陷检测方法和系统

Info

Publication number: CN114037653B
Application number: CN202111114994.6A
Authority: CN
Inventors: 刘建志
Original assignee: Shanghai Yidian Artificial Intelligence Innovation Institute Co ltd
Current assignee: Shanghai Yidian Artificial Intelligence Innovation Institute Co ltd
Priority date: 2021-09-23
Filing date: 2021-09-23
Publication date: 2024-08-06
Anticipated expiration: 2041-09-23
Also published as: CN114037653A

Abstract

本发明涉及一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法和系统，方法包括：收集真实场景数据和实验室模拟数据，构建原始数据集，然后拆分并重新构建为K个数据集组合，每个数据集组合均包括验证集和训练集；对每个数据集组合，依次采用训练集训练预测模型，采用验证集进行模型微调，然后对训练集进行预测，获取软标签，重新训练预测模型，得到K个知识蒸馏模型；对K个知识蒸馏模型的预测结构进行融合，得到新的数据集，用于模型训练。与现有技术相比，本发明不仅可以充分利用有限的真实标记样本数据，构造满足工业检测准确性和实时性要求的人工智能算法，而且适用于图像分类、目标检测、实体分割等不同的工业机器视觉缺陷检测场景。

Description

基于二阶段知识蒸馏的工业机器视觉缺陷检测方法和系统

技术领域

本发明涉及工业机器视觉缺陷检测技术领域，尤其是涉及基于二阶段知识蒸馏的工业机器视觉缺陷检测方法和系统。

背景技术

随着人工智能技术的发展和成熟，以机器学习和深度学习为基础的人工智能算法已经在越来越多的领域得到广泛的应用和探索。特别的，在工业领域，利用机器视觉技术来实现自动化的缺陷检测已经成为一个非常迫切的需求。然而，因为工业领域的特殊性，机器视觉检测方案的落地实施存在着一些困难。其中一个突出的问题表现在工业视觉缺陷检测领域中难以获得大量的实际生产环境中的标记样本。生产环境中的，缺陷样品本身数量就很少，要获取大量的缺陷样本需要付出极大的人力和时间成本。如何在缺乏大量标记样本的条件下，训练和学习基于深度学习的检测模型是一个不可避免的问题。

在实际应用中，有几种不同的解决思路：

一种是基于无监督学习或者少样本学习的方法，然而由于深度神经网络必须要大量的数据进行训练，这种方法的检测准确率并不能满足工业领域对于可靠性和准确性的要求。

一种是在实验室中大量构造和模拟生产环境中的缺陷样本，并且通过各种数据增强的手段来扩充数据集，然而，这些扩充的数据分布经常与生产环境中的真实数据分布不一致，需要将收集到的真实标记样本拆分出验证集和测试集，导致参与训练的真实标记样本数量更少，降低了算法的准确性。

另一种方法是在第二种方法的基础上采用K折交叉验证的方法训练K个模型，采用模型组合的方式来解决这个问题。虽然可以充分利用真实标记样本的信息，但是模型组合的方法无法满足工业领域的检测实时性的要求。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种充分利用有限的真实标记样本数据，构造满足工业检测准确性和实时性要求的基于二阶段知识蒸馏的工业机器视觉缺陷检测方法和系统。

本发明的目的可以通过以下技术方案来实现：

一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法，包括以下步骤：

数据收集和标注步骤：收集真实场景数据和实验室模拟数据及其标记，构建原始数据集；

数据集分割步骤：将所述原始数据集拆分并重新构建为K个数据集组合，每个数据集组合均包括验证集和训练集；

一阶段知识蒸馏步骤：采用所述K个数据集组合分别进行模型训练和知识蒸馏，得到K个知识蒸馏模型，所述模型训练和知识蒸馏的过程具体为：

采用一个数据集组合中的训练集训练预先建立的预测模型，得到预训练模型；

固定该预训练模型中前面N层的参数，采用该数据集组合中的验证集进行模型微调，得到微调后的模型；

采用微调后的模型对该训练集进行预测，得到对应的软标签；

将所述软标签与该训练集组合构建包含特征、标记和软标签的带软标签的训练集；采用该带软标签的训练集重新训练所述预测模型，得到一个知识蒸馏模型；

二阶段知识蒸馏步骤：采用得到的K个知识蒸馏模型分别对所述原始数据集进行训练，得到K个预测结果，对该K个预测结果进行融合，得到原始数据预测值，并与原始数据集中的特征拼接，得到新的数据集；在该新的数据集中进行模型训练，得到最终的模型，用于工业视觉缺陷检测。

进一步地，一阶段知识蒸馏步骤中，采用带软标签的训练集重新训练预测模型时，训练过程的损失函数为：

L1(y,Φ1(X))+L2(y_soft,Φ1(X))

式中，L1和L2均为损失函数计算式，y为标记，y_soft为软标签，X为特征，Φ1(X)为预测模型根据带软标签的训练集的特征的预测结果。

进一步地，数据集分割步骤中，将所述原始数据集分为K个子集合，并根据该K个子集合采用无重复抽样方法，构建所述K个数据集组合。

进一步地，所述数据集组合的构建过程具体为：

将原始数据集中的真实场景数据均分为K份，采用无重复抽样方法选取其中一份作为验证集，将剩余的K-1份真实场景数据和实验室模拟数据作为训练集。

进一步地，对K个预测结果进行融合采用的融合函数为：

式中，y1为对K个预测结果融合后的原始数据预测值，p_k为第K个预测结果。

本发明还提供一种基于二阶段知识蒸馏的工业机器视觉缺陷检测系统，包括：

数据收集和标注模块，被配置为收集真实场景数据和实验室模拟数据及其标记，构建原始数据集；

数据集分割模块，被配置为将所述原始数据集拆分并重新构建为K个数据集组合，每个数据集组合均包括验证集和训练集；

一阶段知识蒸馏模块，被配置为采用所述K个数据集组合分别进行模型训练和知识蒸馏，得到K个知识蒸馏模型，所述模型训练和知识蒸馏的过程具体为：

二阶段知识蒸馏模块，被配置为采用得到的K个知识蒸馏模型分别对所述原始数据集进行训练，得到K个预测结果，对该K个预测结果进行融合，得到原始数据预测值，并与原始数据集中的特征拼接，得到新的数据集；在该新的数据集中进行模型训练，得到最终的模型，用于工业视觉缺陷检测。

进一步地，一阶段知识蒸馏模块中，采用带软标签的训练集重新训练预测模型时，训练过程的损失函数为：

L1(y,Φ1(X))+L2(y_soft,Φ1(X))

进一步地，数据集分割模块中，将所述原始数据集分为K个子集合，并根据该K个子集合采用无重复抽样方法，构建所述K个数据集组合。

进一步地，所述数据集组合的构建过程具体为：

进一步地，对K个预测结果进行融合采用的融合函数为：

与现有技术相比，本发明具有以下优点：

(1)本发明提供一种有效的二阶段知识蒸馏学习框架，不仅可以充分利用有限的真实标记样本数据，构造满足工业检测准确性和实时性要求的人工智能算法；而且该框架作为一个统一的学习框架，可以适用于图像分类、目标检测、实体分割等不同的工业机器视觉缺陷检测场景。

(2)本发明一阶段知识蒸馏步骤的目的在于处理训练数据和验证数据的分布不一致的问题，防止训练集和验证集的效果难以对齐；采用知识蒸馏的方法来桥接训练集和测试集的分布，充分利用有限的真实样本数据提供的有效数据分布信息，提高模型的准确性。

(3)本发明二阶段知识蒸馏步骤目的在于通过一个模型综合前述步骤生成的K个模型的知识，减少模型规模，提升模型实际使用过程中的运行效率，满足工业场景中的实时性要求。

附图说明

图1为本发明实施例中提供的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法的整体流程框架图；

图2为本发明实施例中提供的一种一阶段知识蒸馏流程图；

图3为本发明实施例中提供的一种二阶段知识蒸馏流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

实施例1

本实施例提供一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法，包括以下步骤：

数据收集和标注步骤S1：收集真实场景数据和实验室模拟数据及其标记，构建原始数据集；此过程是包含收集真实场景的数据和标记过程，同时也需要在实验室中构造、模拟大量样本数据；

数据集分割步骤S2：将原始数据集拆分并重新构建为K个数据集组合，每个数据集组合均包括验证集和训练集，为后续一阶段知识蒸馏做准备；

具体为，将原始数据集分为K个子集合，并根据该K个子集合采用无重复抽样方法，构建K个数据集组合；

数据集组合的构建过程具体为：

将原始数据集中的真实场景数据均分为K份，采用无重复抽样方法选取其中一份作为验证集，将剩余的K-1份真实场景数据和实验室模拟数据作为训练集；

一阶段知识蒸馏步骤S3：此过程主要是为了解决训练集和验证集数据分布不一致的问题，实现方法是在数据集分割步骤中生成的K个子集上分别进行模型训练和知识蒸馏的过程，得到K个知识蒸馏模型。此过程中，主要包括4个步骤，首先在子集的训练集上预训练得到预训练模型，然后在此子集的验证集上利用迁移学习进行模型微调。得到微调的模型后，利用此模型对子集的训练集数据进行预测，得到软标签。最后利用得到的软标签及原始子数据集重新进行联合训练；

具体为：采用K个数据集组合分别进行模型训练和知识蒸馏，得到K个知识蒸馏模型，模型训练和知识蒸馏的过程具体为：

将软标签与该训练集组合构建包含特征、标记和软标签的带软标签的训练集；采用该带软标签的训练集重新训练预测模型，得到一个知识蒸馏模型；采用带软标签的训练集重新训练预测模型时，训练过程的损失函数为：

L1(y,Φ1(X))+L2(y_soft,Φ1(X))

式中，L1和L2均为损失函数计算式，y为标记，y_soft为软标签，X为特征，Φ1(X)为预测模型根据带软标签的训练集的特征的预测结果；

二阶段知识蒸馏步骤S4：此过程主要是为了在保证准确率的前提下提高模型的检测效率。实现方法是通过对步骤3中生成的K个知识蒸馏模型进行二次蒸馏。此过程主要4个步骤，首先用K个知识蒸馏模型对训练集进行预测，得到K预测结果。然后利用将K个预测结果进行融合，得到伪标签。接着将生成的为标签和原始训练数据进行整合，构造新的训练数据集。最后是在新的数据集上进行模型训练，得到最终的模型；

相当于，采用得到的K个知识蒸馏模型分别对原始数据集进行训练，得到K个预测结果，对该K个预测结果进行融合，得到原始数据预测值，并与原始数据集中的特征拼接，得到新的数据集；在该新的数据集中进行模型训练，得到最终的模型，用于工业视觉缺陷检测。

如图1所示，下面对本实施例基于二阶段知识蒸馏的工业机器视觉缺陷检测方法的具体实施过程进行描述，其包括以下四个步骤：

1、数据收集和标记

数据收集和标记既包含生产环境中收集、标记的少量的真实样本数据用D_real＝{X_real,y_real}表示，也包含在实验室环境中模拟、构造的大量的样本数据D_lab＝{X_lab,y_lab}，这些数据统一作为后续模型学习的原始数据用D＝Union(D_real，D_lab)。其中实验室数据的量远远大于真实数据即card(D_real)<<card(D_lab)，且二者数据分布往往不一致。

2、数据集切分

数据集切分是指将原始数据分为训练数据D_train和验证数据D_valid。切分过程采用k折交叉验证所使用的无重复抽样方法。将真实数据均分为K份，其中1份为验证集，剩余的k-1份和实验室构造的样本数据作为训练数据。架构图中示例为k＝5，其中D₀为D_lab，{D_i，i＝1,2,3,4,5}表示D_real的均匀K等分。

3、验证集知识蒸馏

验证集知识蒸馏也就是第一阶段的知识蒸馏，其目的在于处理训练数据和验证数据的分布不一致的问题，防止训练集和验证集的效果难以对齐。采用知识蒸馏的方法来桥接训练集和测试集的分布，充分利用有限的真实样本数据提供的有效数据分布信息，提高模型的准确性。具体步骤如附图2：

a)首先在训练集D_train1＝{D_i，i＝0，1，2，3，4},上训练模型，得到预训练模型Φ1。其中D_i＝{X,y}表示训练数据的标记结果，X表示特征，y表示X对应的标签。训练过程的损失函数为L1(y,Φ1(X))。根据工业视觉领域的不同任务，选择具体适合的模型网络结构和损失函数。

b)然后采用迁移学习的方法，固定预训练模型Φ1的前面N层参数，只训练模型后M层的参数。在验证集D₅上进行模型微调，使得模型能够学习到验证集的数据分布信息。

c)利用微调后的模型Φ1对训练集数据D_train1进行预测，得到其对应的软标签y_soft＝Φ1(X),其中X表示D_train1＝{X,y}中的特征数据。

d)构造带软标签的训练数据D_{train1_s}＝{X,y,y_soft},此时训练数据中已经包含了验证集的数据分布信息。

e)在带软标签的训练集D_{train1_s}＝{X,y,y_soft}上重新训练模型，得到一阶段知识蒸馏模型Ψ1。

其中训练过程中的损失函数为L1(y,Φ1(X))+L2(y_soft,Φ1(X))。将软标签引入损失函数，与原始的标签联合学习，进一步促使模型接近验证集分布。

f)对K折切分数据分别执行上述步骤，得到K个知识蒸馏模型{Ψi,i＝1,2,3..K},实例中K＝5。

4、知识蒸馏模型的再蒸馏

知识蒸馏模型的再蒸馏，也就是第二阶段的知识蒸馏，目的在于通过一个模型综合前述步骤生成的K个模型的知识，减少模型规模，提升模型实际使用过程中的运行效率，满足工业场景中的实时性要求。其基本结构是典型的教师学生结构。将K个教师模型的输出结果融合后作为新的学生模型的标签数据，最终使得唯一的学生模型融合K个教师模型的信息。具体操作步骤如附图3：

a)针对原始训练集D＝{X,y}，首先利用前述步骤获得的K个知识蒸馏模型来进行预测的到预测值p＝[p1,p2,…,pk]。

b)然后融合这k个预测结果得到y1＝Γ(p),Γ为融合函数，比较简单且常用的融合方法为

c)构造新的训练集ND＝{X,y1}。

d)在新的数据集上训练二阶段蒸馏模型，得到最终的输出模型Θ，其中损失函数使用loss(Θ(X),y1)的形式。

实施例2

本实施例提供一种基于二阶段知识蒸馏的工业机器视觉缺陷检测系统，包括：

数据收集和标注模块，被配置为收集真实场景数据和实验室模拟数据及其标记，构建原始数据集；相当于执行实施例1中的数据收集和标注步骤；

数据集分割模块，被配置为将原始数据集拆分并重新构建为K个数据集组合，每个数据集组合均包括验证集和训练集；相当于执行实施例1中的数据集分割步骤；

K个数据集组合的构建过程具体为：将原始数据集分为K个子集合，并根据该K个子集合采用无重复抽样方法，构建K个数据集组合。

数据集组合的构建过程具体为：

一阶段知识蒸馏模块，被配置为采用K个数据集组合分别进行模型训练和知识蒸馏，得到K个知识蒸馏模型，模型训练和知识蒸馏的过程具体为：

将软标签与该训练集组合构建包含特征、标记和软标签的带软标签的训练集；采用该带软标签的训练集重新训练预测模型，得到一个知识蒸馏模型；

采用带软标签的训练集重新训练预测模型时，训练过程的损失函数为：

L1(y,Φ1(X))+L2(y_soft,Φ1(X))

相当于执行实施例1中的一阶段知识蒸馏步骤；

二阶段知识蒸馏模块，被配置为采用得到的K个知识蒸馏模型分别对原始数据集进行训练，得到K个预测结果，对该K个预测结果进行融合，得到原始数据预测值，并与原始数据集中的特征拼接，得到新的数据集；在该新的数据集中进行模型训练，得到最终的模型，用于工业视觉缺陷检测；

相当于执行实施例1中的二阶段知识蒸馏模块。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法，其特征在于，一阶段知识蒸馏步骤中，采用带软标签的训练集重新训练预测模型时，训练过程的损失函数为：

L1(y,Φ1X)+L2(y_soft,Φ1X)

式中，L1和L2均为损失函数计算式，y为标记，y_soft为软标签，X为特征，Φ1X为预测模型根据带软标签的训练集的特征的预测结果。

3.根据权利要求1所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法，其特征在于，数据集分割步骤中，将所述原始数据集分为K个子集合，并根据该K个子集合采用无重复抽样方法，构建所述K个数据集组合。

4.根据权利要求3所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法，其特征在于，所述数据集组合的构建过程具体为：

5.根据权利要求1所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测方法，其特征在于，对K个预测结果进行融合采用的融合函数为：

6.一种基于二阶段知识蒸馏的工业机器视觉缺陷检测系统，其特征在于，包括：

7.根据权利要求6所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测系统，其特征在于，一阶段知识蒸馏模块中，采用带软标签的训练集重新训练预测模型时，训练过程的损失函数为：

L1(y,Φ1X)+L2(y_soft,Φ1X)

8.根据权利要求6所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测系统，其特征在于，数据集分割模块中，将所述原始数据集分为K个子集合，并根据该K个子集合采用无重复抽样方法，构建所述K个数据集组合。

9.根据权利要求8所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测系统，其特征在于，所述数据集组合的构建过程具体为：

10.根据权利要求6所述的一种基于二阶段知识蒸馏的工业机器视觉缺陷检测系统，其特征在于，对K个预测结果进行融合采用的融合函数为：