CN117726628B

CN117726628B - 一种基于半监督目标检测算法的钢材表面缺陷检测方法

Info

Publication number: CN117726628B
Application number: CN202410179240.6A
Authority: CN
Inventors: 王晓宾; 陈成军; 张强
Original assignee: Qingdao University of Technology
Current assignee: Qingdao University of Technology
Priority date: 2024-02-18
Filing date: 2024-02-18
Publication date: 2024-04-19
Anticipated expiration: 2044-02-18
Also published as: CN117726628A

Abstract

本发明涉及一种基于半监督目标检测算法的钢材表面缺陷检测方法，包括以下步骤：数据采集阶段；数据处理阶段，对部分钢材表面缺陷图像A的进行缺陷标注；模型构建阶段，构建教师模型和学生模型；模型训练阶段，将钢材表面缺陷图像A输入教师模型进行预测，生成带有伪标注的钢材表面缺陷图像C；将钢材表面缺陷图像B和钢材表面缺陷图像A输入学生模型进行预测，计算钢材表面缺陷图像C的伪标注的损失，并更新学生模型；通过学生模型的网络参数更新教师模型的网络参数；检测阶段，将教师模型作为检测模型，用于钢材表面缺陷检测。本发明通过对复杂缺陷具有精确提取能力的特征提取网络，改善了模型对复杂缺陷的提取能力。

Description

一种基于半监督目标检测算法的钢材表面缺陷检测方法

技术领域

本发明涉及一种基于半监督目标检测算法的钢材表面缺陷检测方法，属于钢材表面缺陷检测技术领域。

背景技术

钢材在机械加工制造、汽车和半导体等行业有着广泛的应用。由于生产工艺和外部环境的限制，钢材表面在生产过程中难以避免的会产生缺陷，严重影响了产品的外观和质量。鉴于钢材表面缺陷具有纹理复杂，易与正常钢材产品混淆等特点，如何精确检测这类缺陷成为目前工业界亟待解决的问题。

依托于计算机视觉与人工智能领域的发展，基于深度学习的缺陷检测方法在工业界得到了广泛关注和应用。相比较于人工筛选和基于传统视觉的检测方法，基于深度学习的方法能够降低人工成本的同时对多种复杂缺陷进行实时检测，相比较于其他方法效率更高，检测更准确。目前，大多数基于深度学习的缺陷检测方法使用全监督目标检测网络进行缺陷的检测和识别，例如使用大量带标注信息的缺陷图像对YOLO,RetinaNet等一阶段目标检测网络或Faster-RCNN等一系列二阶段目标检测网络进行固定迭代轮数的训练，训练后的网络可以基于某一类任务实现缺陷的实时准确检测。但是，基于全监督网络实现的缺陷检测方法需要大量带标注缺陷图像用于网络训练，人工标注的所需的成本以及后期标注的操作在实际工业场景下难以实现，脱离了工业环境下的实际应用。上述问题严重影响着这一方法在工业领域的实现和部署。

随着半监督方法在计算机视觉领域的不断完善和优化，基于深度学习的半监督目标检测方法得到了深入研究与发展。该方法能够仅使用少量带标注图像和大量无标注图像作为训练数据，并对无标注图像生成伪标注来指导网络训练，该方法训练后的网络能够达到全监督网络相似甚至更高的精测精度；缺点在于难以准确识别纹理复杂、尺寸小和背景噪声多的目标（如钢材表面缺陷），且基于缺陷生成的伪标注质量较差，因此在缺陷检测任务中表现不佳。

发明内容

为了克服上述问题，本发明提供一种基于半监督目标检测算法的钢材表面缺陷检测方法，该方法通过对复杂缺陷具有精确提取能力的特征提取网络，改善了模型对复杂缺陷的提取能力，通过参与全局训练过程、指导和优化缺陷图像伪标注生成的自适应损失策略对模型进行训练，从而生成质量更好的伪标注。

本发明的技术方案如下：

一种基于半监督目标检测算法的钢材表面缺陷检测方法，包括以下步骤：

数据采集阶段，采集若干钢材表面缺陷图像A；

数据处理阶段，对部分所述钢材表面缺陷图像A的进行缺陷标注，得到钢材表面缺陷图像B；

模型构建阶段，构建教师模型和学生模型；

模型训练阶段，包括：

将所述钢材表面缺陷图像A输入所述教师模型，所述教师模型对所述钢材表面缺陷图像A中的钢材表面缺陷进行预测，并根据预测结果进行标注，生成带有伪标注的钢材表面缺陷图像C；

将所述钢材表面缺陷图像B和所述钢材表面缺陷图像C输入所述学生模型，所述学生模型对所述钢材表面缺陷图像B和所述钢材表面缺陷图像C进行预测，计算所述钢材表面缺陷图像C的伪标注的损失，并更新所述学生模型；

通过所述学生模型的网络参数更新所述教师模型的网络参数；

检测阶段，将所述教师模型作为检测模型，用于钢材表面缺陷检测。

进一步的，所述教师模型与所述学生模型结构相同。

进一步的，所述教师模型与所述学生模型包括特征提取模块和特征融合模块；

所述特征提取模块对所述钢材表面缺陷图像进行特征提取；

所述特征融合模块对所述钢材表面缺陷图像的特征进行特征融合。

进一步的，所述特征提取模块包括依次连接的Stem层、第一Resnet50层、第二Resnet50层、第三Resnet50层和第四Resnet50层；

所述Stem层对输入的钢材表面缺陷图像进行处理得到通道数为64的原始特征图；

所述第二Resnet50层对所述原始特征图进行下采样，得到特征图C3，采样比例为1/2；

所述第三Resnet50层对所述特征图C3进行下采样，得到特征图C4，采样比例为1/2；

所述第四Resnet50层对所述特征图C4进行下采样，得到特征图C5，采样比例为1/2；

将所述特征图C4输入双层注意力模块，得到特征图C4'；

将所述特征图C5输入双层注意力模块并构成残差连接，得到特征图C5'；

输出所述特征图C3、所述特征图C4'和所述特征图C5'。

进一步的，所述双层注意力模块包括：

将输入的特征图F ₁通过第一层注意力模块获得通道域的权重，将所述通道域的权重与特征图F ₁相乘，获得加权后的特征图特征图F ₂；所述第一层注意力模块包括依次连接的平均池化层、全连接层和全连接层；

所述特征图特征图F ₂，如下：

；

其中，W ₁和W ₂分别为两次全连接操作中可学习的参数；σ和δ分别为Sigmoid函数和ReLU函数；Avgpool(F ₁)表示对特征图F ₁应用平均池化；

表示按元素进行相乘；

将输入的特征图F ₁通过第二层注意力模块获得空间域的权重，将所述空间域的权重与特征图F ₂相乘，获得加权后的特征图F _out；所述第二次注意力模块包括对特征图F ₁各通道同时进行平均池化和最大池化，将平均池化和最大池化的结果在通道维度上拼接后，输入卷积层，以Sigmoid函数作为激活函数；

所述特征图F _out，如下：

；

其中，Conv _n×n为卷积核大小为n的卷积，n为3或7；Concat表示将两个特征图在通道维度上进行拼接；Maxpool(F ₁)表示对特征图F ₁应用最大池化。

进一步的，所述特征融合模块包括：

将所述特征图像C3、所述特征图C4'和所述特征图C5'分别通过卷积核大小为1的卷积；其中，所述特征图C5'经过卷积核大小为1，通道数为256卷积处理后，得到中间特征M5；

将所述中间特征M5与经过卷积核大小为1，通道数为256卷积处理后的所述特征图C4'进行邻近差值的上采样，得到中间特征M4；

将所述中间特征M4与经过卷积核大小为1，通道数为256卷积处理后的所述特征图C3进行邻近差值的上采样，得到中间特征M3；

将所述中间特征M3、所述中间特征M4和所述中间特征M4分别通过卷积核大小为3，通道数为256的卷积，得到特征图P3、特征图P4和特征图P5；

将所述特征图C5'依次通过ReLU激活函数和卷积核大小为3的卷积，得到特征图P6；

将所述特征图P6依次通过ReLU激活函数和卷积核大小为3的卷积，得到特征图P7。

进一步的，还包括预测模块，所述预测模块根据所述特征图P3-P7对钢材表面缺陷进行预测并计算损失；

所述预测模块包括分类分支和回归分支；

所述分类分支用于预测缺陷类型并得到置信度分数；

所述回归分支用于计算特征图像中各点与生成锚框各端点的距离，从而定位钢材表面缺陷位置。

进一步的，还包括重复所述模型训练阶段若干次。

进一步的，训练阶段采用全局自适应损失策略，具体为：

损失函数L，如下：

；

其中，和/>分别为第i张所述钢材表面缺陷图像B和所述钢材表面缺陷图像C，N _l和N _u分别为所述钢材表面缺陷图像B和所述钢材表面缺陷图像C的数量；L _cls和L _reg分别为分类分支损失函数和回归分支损失函数；λ _u为所述钢材表面缺陷图像C上伪标注损失的权重系数；

训练阶段，λ _u跟随迭代次数的变化自适应变化，公式如下：

；

其中，iters为训练阶段模型已迭代次数，iters _max为预设的最大训练迭代次数；σ为Sigmoid函数，T为迭代次数阈值；

F _iters为用于动态调整伪标注的权重系数，计算方式如下：

；

所述学生模型根据损失函数L和梯度下降法对内部网络的参数进行更新；

所述学生模型通过指数滑动平均来指导所述教师模型的内部网络参数更新，所述教师模型在迭代次数为t时的权重如下：

；

其中，α为超参数，θ _t为所述学生模型在迭代次数为t时的权重。

进一步的，所述模型训练阶段中通过所述教师模型进行预测时冻结所述教师模型内部网络的参数。

本发明具有如下有益效果：

1、该方法在同等标注条件下相比于其他半监督目标检测算法和全监督目标检测算法具有更精确的检测精度，能够仅通过少量带标注图像进行训练并达到更优越的精度，大幅度降低了人工标注的成本，更适合于工业生产要求。

2、该方法的特征提取模块能够对不同维度的特征信息进行了关注和学习、减少缺陷图像的背景噪声影响，进一步提升对钢材表面复杂缺陷的特征提取能力，提升半监督目标检测算法的检测精确度。

3、该方法的全局自适应损失策略能够根据训练的迭代次数自适应调整伪标注损失的权重比例，在训练初期仅考虑监督损失，使模型充分学习带标注图像的特征信息，保证伪标注的准确生成；训练中期权重系数λ _u随着迭代次数非线性增加，通过教师模型生成的伪标注图像对学生模型的训练进行指导；训练末期调整λ _u恒等于2，令教师模型与学生模型进行互补学习。该策略能够改善教师模型生成的伪标注质量，进一步提升半监督目标检测模型的检测性能和稳定性。

附图说明

图1为本发明实施例的流程示意图。

图2为本发明实施例的教师模型和学生模型结构示意图。

图3为本发明实施例的特征提取模块结构示意图。

图4为本发明实施例的全局自适应损失策略流程图。

具体实施方式

下面结合附图和具体实施例来对本发明进行详细的说明。

参考图1-2，一种基于半监督目标检测算法的钢材表面缺陷检测方法，包括以下步骤：

数据采集阶段，采集若干钢材表面缺陷图像A；

模型构建阶段，构建教师模型和学生模型；

模型训练阶段，包括：

将所述钢材表面缺陷图像B和所述钢材表面缺陷图像C输入所述学生模型，所述学生模型对所述钢材表面缺陷图像B和所述钢材表面缺陷图像C进行预测，计算所述钢材表面缺陷图像C的伪标注的损失，并更新所述学生模型；学生模型进行预测时并不使用所述钢材表面缺陷图像B和所述钢材表面缺陷图像C上的标注，所述钢材表面缺陷图像B和所述钢材表面缺陷图像C上的标注用于计算预测结果的损失。

参考图2，在本发明的一种实施方式中，所述教师模型与所述学生模型结构相同。

参考图2，在本发明的一种实施方式中，所述教师模型与所述学生模型包括特征提取模块和特征融合模块；

所述特征提取模块对所述钢材表面缺陷图像进行特征提取；

参考图2和3，在本发明的一种实施方式中，所述特征提取模块包括依次连接的Stem层、第一Resnet50层、第二Resnet50层、第三Resnet50层和第四Resnet50层；

所述Stem层第一Resnet50层、第二Resnet50层、第三Resnet50层和第四Resnet50层即图3中的Stem layer、Resnet50 layer1、Resnet50 layer2、Resnet50 layer3和Resnet50 layer4。

将所述特征图C4输入双层注意力模块，得到特征图C4'；

所述双层注意力模块用于进一步关注缺陷特征信息。

将所述特征图C5输入双层注意力模块并构成残差连接，得到特征图C5'；残差连接能够保证反向传输的稳定性。

输出所述特征图C3、所述特征图C4'和所述特征图C5'。

该实施方式中采用的Stem层、第一Resnet50层、第二Resnet50层、第三Resnet50层和第四Resnet50层均为现有技术，已在论文《Deep residual learning for imagerecognition》中公开。Stem层、第一Resnet50层、第二Resnet50层、第三Resnet50层和第四Resnet50层分别与该论文中的conv1、cov2_x、cov3_x，cov4_x和cov5_结构相同。

在本发明的一种实施方式中，所述双层注意力模块包括：

所述特征图特征图F ₂，如下：

；

表示按元素进行相乘；

所述特征图F _out，如下：

；

其中，Conv _n×n为卷积核大小为n的卷积，n为3或7，申请人在研发过程中发现，卷积核大小为3和7时，检测效果提升最大；Concat表示将两个特征图在通道维度上进行拼接；Maxpool(F ₁)表示对特征图F ₁应用最大池化。

双层注意力模块的两条支路分别作用于特征图像的通道域和空间域，通过池化、全连接、卷积等一系列处理获得不同维度上的权重信息，加权后输出语义信息更精确的特征图像。图3中的H、W和C分别为特征图的长、宽和通道数。第二层注意力模块对特征图进行不同的池化处理，通过拼接、卷积处理等一系列操作获得特征图像的权重信息，并与特征图F ₂相乘。

所述双层注意力模块对不同维度（空间域和通道域）的重要信息进行了关注和学习，并保留了高权重系数的局部缺陷特征信息。

在本发明的一种实施方式中，所述特征融合模块包括：

将所述特征图像C3、所述特征图C4'和所述特征图C5'分别通过卷积核大小为1的卷积；其中，所述特征图C5'经过卷积核大小为1，通道数为256的卷积处理后，得到中间特征M5；

在本发明的一种实施方式中，还包括预测模块，所述预测模块根据所述特征图P3-P7对钢材表面缺陷进行预测并计算损失；

所述预测模块包括分类分支和回归分支；

所述分类分支用于预测缺陷类型并得到置信度分数；

所述特征融合模块与预测模块用于组合高维特征和低维特征，通过回归预测和分类预测实现缺陷的定位和检测任务。

在本发明的一种实施方式中，还包括重复所述模型训练阶段若干次。

参考图4，在本发明的一种实施方式中，训练阶段采用全局自适应损失策略，具体为：

损失函数L，如下：

；

学生模型进行预测时并不使用所述钢材表面缺陷图像B和所述钢材表面缺陷图像C上的标注，所述钢材表面缺陷图像B和所述钢材表面缺陷图像C上的标注用于计算预测结果的损失。只有在计算损失和测试检测精度的过程中，模型才会读取输入图像的标注信息，用于优化网络和计算检测精确度。图2中计算损失的式子进行加权累加后就可以得到本式。

；

其中，iters为训练阶段模型已迭代次数，iters _max为预设的最大训练迭代次数；σ为Sigmoid函数；T为迭代次数阈值，用于划分训练阶段的前期和中期，可设置在12.5%-25%iters _max；

Sigmoid函数用于确保伪标注损失的权重在指定范围内进行非线性递增

F _iters为用于动态调整伪标注的权重系数，计算方式如下：

；

全局动态损失策略在训练初期仅考虑监督损失进行训练，使模型充分学习带标注图像的特征信息，保证伪标注的准确生成；随后，权重系数λ _u随着迭代次数非线性增加，通过教师模型生成的伪标注图像对学生模型的训练进行指导；在训练末期，调整λ _u恒等于2，教师模型与学生模型进行互补学习，进一步提升模型性能。

；

在本发明的一种实施方式中，所述模型训练阶段中通过所述教师模型进行预测时冻结所述教师模型内部网络的参数。

图2，在本发明的一种实施方式中，还包括对钢材表面缺陷图像进行图像增强（即图2中的数据增强），具体为对输入所述教师模型的钢材表面缺陷图像A进行弱图像增强，对输入所述学生模型的钢材表面缺陷图像A进行强图像增强，对输入所述学生模型的钢材表面缺陷图像B，进行弱图像增强。

强数据增强包括的内容有：随机变形、随机图像翻转、自动对比度、随机均衡、随机太阳化、随机颜色、随机对比度、随机亮度、随机锐化、随机海报化、随机平移（水平或垂直）、随机旋转（-30到30度）、随机剪切（水平或垂直剪切，角度在-30到30度之间）、随机擦除。

弱数据增强包括的内容有：随机变形、随机图像翻转。

在一具体的实施例中，基于半监督目标检测算法的钢材表面缺陷检测方法的具体流程有：采集与划分数据集阶段、训练阶段和测试阶段。采集与划分数据集阶段将收集一定数量的钢材表面缺陷图像，10%的缺陷图像带标注，其余为无标注缺陷图像；训练阶段中，教师模型用于给无标注缺陷图像生成伪标注并根据学生模型的指导更新网络参数，学生模型通过带标注和带伪标注的训练样本训练内部网络并指导教师模型的更新；测试阶段由教师模型对测试样本进行检测，检测该半监督缺陷检测算法的准确度和适用性。

三个阶段的具体流程如下：

数据集准备阶段：

使用的数据集为公开的钢材缺陷数据集NEU-DET，包括六种不同的钢材表面缺陷，每种缺陷各含有240张图像，总共1440张缺陷图像。按照7:1比例划分为训练样本和测试样本。训练样本按照10%标注的比例进行划分，其中带标注缺陷图像126张，无标注缺陷图像1134张。

训练阶段：

如图1所示，本发明设计的改进半监督缺陷检测算法训练过程如下：

S1：将缺陷图像输入到半监督检测模型中，按照带标注缺陷图像：无标注缺陷图像=1:3的采样比例进行划分。

S2：教师模型冻结内部网络的参数，使网络在训练过程中不通过反向传播进行参数更新，随后对无标注缺陷图像通过本发明提出的Resnet50-B（即前述教师模型和学生模型）进行特征提取、融合和预测，得到带有伪标注的缺陷图像并按采样比例送入学生模型。

S3：将带有伪标注的缺陷图像和带标注的缺陷图像按比例送入学生模型，内部网络通过特征提取、融合以及预测环节对缺陷进行预测，并根据当前迭代次数应用本发明提出的全局自适应损失策略来计算伪标注的损失权重和损失函数，随后通过梯度下降法对学生模型进行参数更新。

S4：将学生模型的网络参数按照指数滑动平均进行计算，指导更新教师模型的网络参数。

S5：利用缺陷图像数据集不断迭代执行步骤S1至S4，直至达到设定的训练迭代后停止训练，使用训练完成后的教师模型作为检测模型。

测试阶段：

使用划分后的测试样本中的缺陷图像，利用训练后的教师模型对缺陷图像进行特征提取、融合和预测，输出对输入测试图像的检测结果。

将现有的半监督目标检测模型Consistent-Teacher（X. Wang et al.,Consistent-Teacher: Towards Reducing Inconsistent Pseudo-Targets in Semi-Supervised Object Detection, in 2023 IEEE/CVF Conference on Computer Visionand Pattern Recognition, CVPR 2023.）与本实施例进行对比。数据集均使用10%标注条件下NEU-DET钢表面缺陷检测数据集，评价指标采用总体平均准确率（mAP）、各缺陷平均识别准确率结果如表1所示：

表1

网络模型	Cr	In	Pa	Ps	Rs	Sc	mAP
								Faster-RCNN	20.1	65.4	65.5	44.0	42.7	76.0	52.3
RetinaNet	35.3	58.6	72.6	52.0	41.2	36.2	49.3
								YOLOv3	39.7	63.8	78.3	63.8	46.3	54.5	57.7
Consistent Teacher	17.4	67.9	82.5	79.0	48.3	71.3	61.1
								Mean Teacher	<b>43.7</b>	<b>79.8</b>	81.8	70.0	40.6	<b>79.5</b>	65.9
本发明	42.2	78.4	<b>83.5</b>	<b>72.9</b>	<b>48.0</b>	77.7	<b>67.1</b>

裂纹（Cr）、夹杂（In）、斑块（Pa）、麻点（Ps）、氧化皮（Rs）以及划痕（Sc）分别为金属表面的六种不同缺陷类型。从表1中可以看出,与全监督目标检测算法相比较，例如Faster-RCNN ，YOLOv3，RerinaNet，本发明在各缺陷的平均识别准确率和总体平均准确率均高于上述网络；相比于其他半监督目标检测算法，例如Consistent Teacher，Mean Teacher，本发明具有更好的检测性能和准确度。在10%标注比例下，裂纹、夹杂、斑块和划痕缺陷的平均识别率分别比Consistent Teacher网络提升了24.8%、10.5%、1.0%和6.4%，总体平均准确率（mAP）相比于现有SOTA半监督目标检测方法Consistent Teacher提升了6.0%。

以上所述仅为本发明的实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于半监督目标检测算法的钢材表面缺陷检测方法，其特征在于，包括以下步骤：

数据采集阶段，采集若干钢材表面缺陷图像A；

模型构建阶段，构建教师模型和学生模型；

模型训练阶段，包括：

检测阶段，将所述教师模型作为检测模型，用于钢材表面缺陷检测；

所述教师模型与所述学生模型结构相同；

所述教师模型与所述学生模型包括特征提取模块和特征融合模块；

所述特征提取模块对所述钢材表面缺陷图像进行特征提取；

所述特征融合模块对所述钢材表面缺陷图像的特征进行特征融合；

所述特征提取模块包括依次连接的Stem层、第一Resnet50层、第二Resnet50层、第三Resnet50层和第四Resnet50层；

将所述特征图C4输入双层注意力模块，得到特征图C4'；

输出所述特征图C3、所述特征图C4'和所述特征图C5'；

所述双层注意力模块包括：

所述特征图特征图F ₂，如下：

；

表示按元素进行相乘；

将输入的特征图F ₁通过第二层注意力模块获得空间域的权重，将所述空间域的权重与特征图F ₂相乘，获得加权后的特征图F _out；所述第二层注意力模块包括对特征图F ₁各通道同时进行平均池化和最大池化，将平均池化和最大池化的结果在通道维度上拼接后，输入卷积层，以Sigmoid函数作为激活函数；

所述特征图F _out，如下：

；

2.根据权利要求1所述基于半监督目标检测算法的钢材表面缺陷检测方法，其特征在于，所述特征融合模块包括：

将所述中间特征M5与经过卷积核大小为1，通道数为256的卷积处理后的所述特征图C4'进行邻近差值的上采样，得到中间特征M4；

将所述中间特征M4与经过卷积核大小为1，通道数为256的卷积处理后的所述特征图C3进行邻近差值的上采样，得到中间特征M3；

3.根据权利要求2所述基于半监督目标检测算法的钢材表面缺陷检测方法，其特征在于，还包括预测模块，所述预测模块根据所述特征图P3-P7对钢材表面缺陷进行预测并计算损失：

所述预测模块包括分类分支和回归分支；

所述分类分支用于预测缺陷类型并得到置信度分数；

4.根据权利要求3所述基于半监督目标检测算法的钢材表面缺陷检测方法，其特征在于，还包括重复所述模型训练阶段若干次。

5.根据权利要求4所述基于半监督目标检测算法的钢材表面缺陷检测方法，其特征在于，训练阶段采用全局自适应损失策略，具体为：

损失函数L，如下：

；

F _iters为用于动态调整伪标注的权重系数，计算方式如下：

；

6.根据权利要求1所述基于半监督目标检测算法的钢材表面缺陷检测方法，其特征在于，所述模型训练阶段中通过所述教师模型进行预测时冻结所述教师模型内部网络的参数。