CN115631186B

CN115631186B - 一种基于双分支神经网络的工业元件表面缺陷检测方法

Info

Publication number: CN115631186B
Application number: CN202211393023.4A
Authority: CN
Inventors: 杨宪强; 田中华; 高会军
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2022-11-08
Filing date: 2022-11-08
Publication date: 2023-10-03
Anticipated expiration: 2042-11-08
Also published as: CN115631186A

Abstract

一种基于双分支神经网络的工业元件表面缺陷检测方法，涉及缺陷检测技术领域。本发明是为了解决工业元件表面缺陷检测任务所面临的图像分辨率高、缺陷面积小、缺陷样本数量少、现有算法适应能力弱的问题。本发明包括：获取待预测的工业元件图像，将待预测的工业元件图像输入到表面缺陷检测网络中获得缺陷检测结果；表面缺陷检测网络，通过以下方式获得：构建工业元件表面缺陷分类数据集；对缺陷分类数据集增广，增广结果作为训练集；构建双分支深度卷积神经网络，利用训练集训练双分支深度卷积神经网络获得表面缺陷检测网络。本发明用于检测工业元件的表面缺陷。

Description

一种基于双分支神经网络的工业元件表面缺陷检测方法

技术领域

本发明涉及缺陷检测技术领域，特别涉及一种基于双分支神经网络的工业元件表面缺陷检测方法。

背景技术

在工业制造领域中，产品表面是否有缺陷是衡量产品是否满足工业质量要求的重要依据，因此工业元件表面缺陷检测成为工业元件生产流程的重要环节之一，对提高工业元件的良品率，改良生产工艺具有重要意义。

当前的表面缺陷自动检测方法主要依靠专家根据领域知识设计特征，无法直接从数据中学习提取特征进行缺陷检测，因此目前的表面缺陷检测算法还存在开发周期长、适应性差的缺点。同时，工业元件图像还存在由于分辨率高、缺陷面积小的特点带来的样本类别不均衡的问题，因此在应用现有的表面缺陷检测方法进行工业元件缺陷检测时还存在缺陷分割精度低、速度慢的问题，进而导致缺陷检测准确率低、效率低。

发明内容

本发明目的是为了解决现有的工业元件缺陷检测方法还存在缺陷分割精度低、速度慢的进而导致的缺陷检测准确率低、效率低的问题，而提出一种基于双分支神经网络的工业元件表面缺陷检测方法。

一种基于双分支神经网络的工业元件表面缺陷检测方法具体过程为：获取待预测的工业元件图像，将待预测的工业元件图像输入到表面缺陷检测网络中获得缺陷检测结果；

所述表面缺陷检测网络，通过以下方式获得：

步骤一、构建工业元件表面缺陷分类数据集；

步骤二、对步骤一构建的缺陷分类数据集进行增广，将增广后的缺陷分类数据集即为训练集；

步骤三、构建双分支深度卷积神经网络，并利用训练集训练双分支深度卷积神经网络，当训练迭代n次损失收敛后，获得训练好的双分支深度卷积神经网络即表面缺陷检测网络；

所述双分支深度卷积神经网络包括：主干网络、分类分支网络、分割分支网络；

所述主干网络用于提取图像特征，包括：两个卷积模块、一个最大池化层、一个特征融合模块；

所述卷积模块由三个卷积核尺寸为3x3的卷积层、BatchNorm层和Relu激活层依次堆叠而成；

所述特征融合模块包括三个特征融合分支和一个卷积核尺寸为1x1的卷积层；

所述特征融合模块中的每个特征融合分支包括：卷积核尺寸分为别1x1，3x3，5x5的卷积模块；

其中，卷积核尺寸分别为1x1，3x3，5x5的卷积模块即为卷积模块中的卷积层的卷积核尺寸分别为1x1，3x3，5x5；

所述分类分支网络用于将图像特征分为缺陷特征和正常特征，包括：一个全局平均池化层、两个全连接层；

所述分割分支网络用于根据缺陷特征将缺陷从图像中分割出来，包括：一个卷积核尺寸为3x3的卷积模块和一个卷积核尺寸为1x1的卷积层。

进一步地，所述步骤一中的构建工业元件表面缺陷分类数据集，包括以下步骤：

步骤一一、构建缺陷分割数据集：

获得有缺陷的工业元件图像，并对图像中的缺陷区域进行标注，获得缺陷图像及标签，所有的缺陷图像及标签构成缺陷分割数据集；

步骤一二、基于步骤一一获得的缺陷分割数据集构建缺陷分类数据集：

以w为窗口尺寸、s为步长在缺陷分割数据集中的缺陷图像及标签上同步滑动，将窗口区域内不包含缺陷像素的区域标记为正常图像，将窗口区域内包含缺陷像素的区域标记为缺陷区域图像，所有正常图像和缺陷区域图像构成缺陷分类数据集。

进一步地，所述步骤二中的对步骤一构建的缺陷分类数据集进行增广,包括以下步骤：

将分类数据集中的图像进行图像仿射变换、图像亮度变换、图像对比度变换、图像饱和度变换、图像色度变换、局部仿射变换；

所述图像仿射变换包括：旋转、平移、缩放。

进一步地，所述局部仿射变换具体为：

对缺陷分类数据集中的缺陷区域图像中缺陷外接矩形区域进行仿射变换，然后将仿射变换的区域放回缺陷区域图像原图中，获得局部仿射变换后的图像；

其中，将仿射变换的区域放回缺陷区域图像原图中拼接处产生的空白像素通过双线性插值算法进行像素值的填充。

进一步地，所述步骤三中的主干网络用于提取图像特征，如下式：

F_i×i(·)＝Repeat(Relu(BN(Conv_i×i(·))),3) (1)

F_fuse(·)＝Conv_1×1(Cat([F_1×1(·),F_3×3(·),F_5×5(·)],dim＝1)) (2)

Backbone(x)＝F_fuse(F_3×3(MaxPool(F_3×3(x)))) (3)

其中，F_i×i(·)代表卷积核尺寸为i×i的卷积模块，Conv_i×i(·)是i×i卷积，BN(·)是批归一化层，Relu(·)是ReLu激活层，Repeat(·,3)代表过程重复3次，F_fuse(·)是特征融合模块，Cat(·,dim＝1)代表在第一个维度进行特征拼接，MaxPool(·)是最大池化层，Backbone(x)是特征提取网络；其中i取1、3、5。

进一步地，所述步骤三中的分类分支网络前向传播过程，如下式：

Cls(x’)＝FC(Dropout(ReLU(FC(AdapativeAvgPool(x’))))) (4)

其中，Cls(x’)代表分类分支，FC(·)是全连接层，Droupout(·)是随机失活，AdapativeAvgPool(·)是全局平均池化，x’是主干网络提取的特征图。

进一步地，所述步骤三中的分割分支网络的前向传播过程，如下式：

Seg(x”)＝Conv_1×1(F_1×1(x”)) (5)

其中，Seg(x”)代表分割分支，F_1×1(·)代表卷积核尺寸为1×1的卷积模块，Conv_1×1(·)是1×1卷积。

进一步地，所述利用训练集训练双分支深度卷积神经网络，获得训练好的双分支深度卷积神经网络即表面缺陷检测网络；采用以下损失函数进行训练：

Loss＝Loss_cls+λLoss_seg (6)

其中，Loss是双分支深度卷积神经网络的损失函数，Loss_cls是分类损失，Loss_seg是分割损失，λ是调和系数，N是训练集中样本个数，C是缺陷类别数，与/>是图像的标签与预测值，/>与/>是像素的标签与预测值，w_c是类别权重。

进一步地，

其中，f_c是当前样本缺陷类别像素的频率，median()为取中值。

进一步地，训练双分支深度卷积神经网络时采用随机梯度下降算法优化网络权重。

本发明的有益效果为：

本发明通过双分支端对端的网络结构设计提高了工业元件表面缺陷分割网络的检测速度，通过引入频率加权交叉熵损失函数解决了缺陷区域面积小带来的样本类别不均衡问题，提高了缺陷分割的精度，通过引入提出的局部仿射变换的图像增广方法，扩增了数据集的容量，缓解了工业元件表面缺陷检测所面临的小样本问题。本发明方法有效地提高工业元件表面缺陷分割的速度与精度，进而提高了缺陷检测准确率和效率。

附图说明

图1是数据扩增方法流程图；

图2是本发明的双分支模型的训练流程图；

图3是本发明的双分支模型的推理流程图；

图4是本发明的模型的推理效果图。

具体实施方式

具体实施方式一：本实施方式一种基于双分支神经网络的工业元件表面缺陷检测方法具体过程为：获取待预测的工业元件图像，将待预测的工业元件图像输入到表面缺陷检测网络中获得缺陷检测结果；

所述表面缺陷检测网络，通过以下方式获得：

步骤一、构建工业元件表面缺陷分类数据集，具体为：

步骤一一、构建工业元件表面缺陷分割数据集：

收集有缺陷的工业元件，并用500万像素的彩色CMOS相机拍摄其表面缺陷图像，用语义分割任务的标注工具对缺陷区域进行像素级标注，得到的缺陷图像及其标签构成了工业元件表面缺陷分割数据集；

步骤一二、基于步骤一一获得的缺陷分割数据集构建工业元件表面缺陷分类数据集：

在表面缺陷分割数据集的基础上，以w为窗口尺寸，s为步长，在工业元件缺陷图像及其标签上同步滑动窗口，当窗口区域标签不含缺陷像素时，将窗口图像标记为正常图像，当窗口区域标签包含缺陷像素时，将窗口图像记为缺陷区域图像，由此构建工业元件的表面缺陷分类数据集；

其中，设置w为(256，306)，s为(128，153)。

步骤二、对步骤一构建的缺陷分类数据集进行增广，并将增广后的缺陷分类数据集划分为训练集和测试集：

步骤二一、除了常规的图像仿射变换(旋转、平移、缩放)、图像亮度、对比度、饱和度、色度变换等数据增广方法外，本发明还提出了局部仿射增广方法；

所述局部仿射增广方法具体为：仅对缺陷的外接矩形图像区域进行小尺度的仿射变换，然后将变换后的区域图像放回原图，拼接处的空白像素通过双线性插值算法进行像素值的填充。

步骤二二、将增广后的缺陷分类数据集划分为训练集和测试集；

其中，划分数据集的比例根据经验确定；

步骤三、构建双分支深度卷积神经网络，并利用训练集训练双分支深度卷积神经网络，当训练迭代n次损失收敛后，获得训练好的双分支深度卷积神经网络，具体为：

步骤三一、构建双分支深度卷积神经网络：

所述卷积模块由三个卷积核大小为3x3的卷积层、BatchNorm层和Relu激活层依次堆叠而成；

所述特征融合模块包含三个特征融合分支和一个卷积核尺寸为1x1的卷积层；

特征融合模块三个特征融合分支中的每个分支都包含一个卷积核尺寸分别为1x1，3x3，5x5的卷积模块，最后将这三个分支提取的特征在通道维度上拼接起来，通过一个1x1卷积进行融合；

所述主干网络，如下式：

F_i×i(·)＝Repeat(Relu(BN(Conv_i×i(·))),3) (1)

F_fuse(·)＝Conv_1×1(Cat([F_1×1(·),F_3×3(·),F_5×5(·)],dim＝1)) (2)

Backbone(x)＝F_fuse(F_3×3(MaxPool(F_3×3(x)))) (3)

其中，F_i×i(·)代表卷积核尺寸为i×i的卷积模块，Conv_i×i(·)是i×i卷积，BN(·)是批归一化层，Relu(·)是ReLu激活层，Repeat(·,3)代表过程重复3次。F_fuse(·)是特征融合模块，Cat(·,dim＝1)代表在第一个维度进行特征拼接。MaxPool(·)是最大池化层。整个特征提取网络用Backbone(x)表示，其前向传播过程如式(3)所示。

所述分类分支网络用于将图像特征分为缺陷特征和正常特征，包括：一个全局平均池化层和两个全连接层，最后一个全连接层的输出神经元的个数为分类的类别数2；

所述分割分支用于根据缺陷特征将缺陷从图像中分割出来获得缺陷掩码，包括：一个卷积核尺寸为3x3的卷积模块和一个1x1卷积层，其最后一层卷积的输出通道数为缺陷的类别数+1(背景类)。

所述分类分支的前向传播过程，如下式：

Cls(x’)＝FC(Dropout(ReLU(FC(AdapativeAvgPool(x’))))) (4)

所述分割分支的前向传播过程，如下式：

Seg(x”)＝Conv_1×1(F_1×1(x”)) (5)

其中，Cls(x”)代表分类分支，FC(·)是全连接层，Droupout(·)是随机失活，AdapativeAvgPool(·)是全局平均池化，Seg(x”)代表分割分支。

步骤三二、利用训练集训练双分支深度卷积神经网络，采用以下损失函数：

双分支模型的损失函数由两部分构成，分别是分类损失和分割损失，如式(6)-(8)所示。

Loss＝Loss_cls+λLoss_seg (6)

其中，Loss是双分支深度卷积神经网络的损失函数，Loss_cls是分类损失，Loss_seg是分割损失，λ是调和系数，N是训练集中样本个数，C是缺陷类别数，是第n个样本缺陷类别c的标签，/>是第n个样本缺陷类别c的预测值。/>对于分类任务来说是图像的标签与预测值，对于分割任务来说是像素的标签与预测值。w_c是类别权重，定义如式(9)所示，为所有类别像素频率的中值比上当前类别像素的频率，f_c是当前样本缺陷类别像素的频率；

首先我们将优化器的动量设置为0.9，权重衰减系数设置为0.0001，初始学习率设置为0.001，并在40k次迭代后衰减到0.0005。我们使用随机梯度下降算法优化模型权重。我们将调和系数λ设为3.0，训练时同时喂给网络正常和缺陷样本图像提取特征，分类损失的计算包含正常和缺陷两部分，但是分割损失的计算只包含缺陷样本，因此主干网络提取的特征在传入分割分支之前需要先根据分类标签将正常样本的特征去掉后再传入分割分支。

当迭代40k次后损失收敛，停止训练，得到训练好的双分支表面缺陷检测模型。

步骤四、利用测试集测试训练好的双分支深度卷积神经网络：

在用训练好的模型进行推理时，首先将拍摄的工业元件表面图像平分成64个图像块，然后将这些图像块打包成一个批次输入双分支网络，主干网络提取的特征先送入分类分支进行预测，对图像块是否含有缺陷进行分类，根据分类结果筛选出包含缺陷的图像块对应的特征送入分割分支进行预测，得到对应图像块的缺陷掩码。综合考虑分类分支与分割分支的预测结果就可得到原始工业元件表面图像的缺陷分割预测结果。

实施例：

采用如图1所示的数据增广方法扩充工业元件表面缺陷分割数据集，其中本发明提出的局部小尺度仿射变换和双线性插值方法用于改变图像中缺陷的形状，有利于提高数据集中缺陷形态的多样性，从而提高模型的泛化性能。采用图2所示的训练流程训练双分支网络模型，其中分类分支与分割分支同时进行训练，注意分割损失的计算只针对含有缺陷的图像块样本。训练好的模型采用图3所示的流程进行推理，训练中我们采用真值标签对缺陷样本的特征进行筛选，推理时没有真值标签，我们采用分类分支的预测结果筛选出异常样本对应的特征送入分割分支进行缺陷的分割，最后综合考虑分类分支和分割分支的结果就可得到原图的缺陷分割预测结果。图4从左到右依次为工业元件原图、分类定位示意图和分割结果图。表1所示为本发明方法在工业元件表面缺陷分割测试集上的评估指标，通过与U-Net整图分割的对比实验，可以发现本发明提出的双分支网络模型通过先分类再分割的渐进式缺陷分割方法可以快速而准确地对工业元件的表面缺陷进行分割预测。

表1双分支模型在缺陷分割测试集上的评估指标

根据以上试验进一步验证了本发明方法适用于工业元件的表面缺陷分割。

虽然在本发明中参照了特定的实施方式来描述本发明，但是应该理解的是，这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是，可以对示例性的实施例进行许多修改，并且可以设计出其他的布置，只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是，可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是，结合单独实施例所描述的特征可以使用在其它所述实施例中。

Claims

1.一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于所述方法的具体过程为：获取待预测的工业元件图像，将待预测的工业元件图像输入到表面缺陷检测网络中获得缺陷检测结果；

所述表面缺陷检测网络，通过以下方式获得：

步骤一、构建工业元件表面缺陷分类数据集；

步骤二、对步骤一构建的缺陷分类数据集进行增广，增广后的缺陷分类数据集即为训练集；

对步骤一构建的缺陷分类数据集进行增广,包括以下步骤：

所述图像仿射变换包括：旋转、平移、缩放；

所述局部仿射变换具体为：

对缺陷分类数据集中的缺陷区域图像中缺陷外接矩形区域进行仿射变换，然后将仿射变换后的外接矩形区域放回缺陷区域图像中，获得局部仿射变换后的图像；

其中，将仿射变换后的外接矩形区域放回缺陷区域图像中，拼接处产生的空白像素通过双线性插值算法进行像素值的填充；

步骤三、构建双分支深度卷积神经网络，并利用训练集训练双分支深度卷积神经网络，当训练迭代40k次损失收敛后，获得训练好的双分支深度卷积神经网络即表面缺陷检测网络；

其中，卷积核尺寸分别为1x1，3x3，5x5的含义为卷积模块中的卷积层的卷积核尺寸分别为1x1，3x3，5x5；

所述分割分支网络用于根据缺陷特征将缺陷从图像中分割出来，包括：一个卷积核尺寸为3x3的卷积模块和一个卷积核尺寸为1x1的卷积层；

其中，卷积核尺寸为1x1的卷积层输出通道数为缺陷类别数+1。

2.根据权利要求1所述的一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于：所述步骤一中的构建工业元件表面缺陷分类数据集，包括以下步骤：

步骤一一、构建缺陷分割数据集：

3.根据权利要求2所述的一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于：所述步骤三中的主干网络用于提取图像特征，如下式：

F_i×i(·)＝Repeat(Relu(BN(Conv_i×i(·)))，3) (1)

F_fuse(·)＝Conv_1×1(Cat([F_1×1(·)，F_3×3(·)，F_5×5(·)]，dim＝1)) (2)

Backbone(x)＝F_fuse(F_3×3(MaxPool(F_3×3(x)))) (3)

其中，F_i×i(·)代表卷积核尺寸为i×i的卷积模块，Conv_i×i(·)是i×i卷积，BN(·)是批归一化层，Relu(·)是ReLu激活层，Repeat(·，3)代表过程重复3次，F_fuse(·)是特征融合模块，Cat(·，dim＝1)代表在第一个维度进行特征拼接，MaxPool(·)是最大池化层，Backbone(x)是特征提取网络；其中i取1、3、5。

4.根据权利要求3所述的一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于：所述步骤三中的分类分支网络前向传播过程，如下式：

Cls(x’)＝FC(Dropout(ReLU(FC(AdapativeAvgPool(x’))))) (4)

其中，Cls(x’)代表分类分支，FC(·)是全连接层，Droupout(·)是随机失活，AdapativeAvgPool(·)是全局平均池化，x′是主干网络提取的特征图。

5.根据权利要求4所述的一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于：所述步骤三中的分割分支网络的前向传播过程，如下式：

Seg(x”)＝Conv_1×1(F_1×1(x”)) (5)

6.根据权利要求5所述的一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于：所述利用训练集训练双分支深度卷积神经网络，获得训练好的双分支深度卷积神经网络即表面缺陷检测网络；采用以下损失函数进行训练：

Loss＝Loss_cls+λLoss_seg (6)

7.根据权利要求6所述的一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于：

8.根据权利要求7所述的一种基于双分支神经网络的工业元件表面缺陷检测方法，其特征在于：训练双分支深度卷积神经网络时采用随机梯度下降算法优化网络权重。