CN117094999B

CN117094999B - 一种跨尺度缺陷检测方法

Info

Publication number: CN117094999B
Application number: CN202311355310.0A
Authority: CN
Inventors: 汪俊; 濮宬涵; 高长才; 单忠徳
Original assignee: Nanjing University of Aeronautics and Astronautics
Current assignee: Nanjing University of Aeronautics and Astronautics
Priority date: 2023-10-19
Filing date: 2023-10-19
Publication date: 2023-12-22
Anticipated expiration: 2043-10-19
Also published as: CN117094999A

Abstract

本发明涉及一种跨尺度缺陷检测方法，包括:S1、采集待检测物体表面缺陷数据，并对缺陷进行分类定义；S2、对原图像中包含缺陷的数据进行特征提取，得到跨尺度缺陷边缘特征；S3、将待检测物体的原图像数据和跨尺度缺陷边缘特征输入SwinIDE‑merge网络模型，提取高维缺陷信息；S4、构建缺陷检测模型，将高维缺陷信息输出缺陷检测模型，检测出缺陷的bounding box预测结果和分类结果；S5、针对跨尺度缺陷的缺陷检测模型，采用Wasserstein距离作为损失函数，对该模型进行训练和权重更新，并得到最终的缺陷检测模型。本发明的特征提取方式采用了更少的下采样层，减少了提取过程中小缺陷的特征损失，对于待检测物体图像数据上较小的缺陷，具有更好的检测效果。

Description

一种跨尺度缺陷检测方法

技术领域

本发明涉及机械加工与工业视觉检测技术领域，尤其涉及一种跨尺度缺陷检测方法。

背景技术

在当代机械制造过程领域中，机械金属发挥着至关重要的作用，其在汽车工程、航空航天工程、海洋工程等各个领域有着广泛的应用。它们极大地提高了各种工业流程的效率、可靠性和可持续性，并能够促进流体运输、发电和空气循环，在冷却系统、推进系统和流体控制机制中发挥着重要作用。但是，在待检测物体的自动化生成加工制造过程中，不可避免地会出现由于加工工艺以及人为因素造成的待检测物体表面缺陷损伤，这些表面缺陷不仅会降低待检测物体的性能，在机械制造中，使用有缺陷的待检测物体，也可能会对整个生产制造过程造成巨大影响。综上，探索一条自动化、智慧化、流程化的待检测物体表面缺陷自动检测方案是一项非常重要的工作。

21世纪初，人工智能技术逐渐兴起，依托于现代硬件系统的强大算力，基于数字驱动的采用计算机视觉进行目标检测的技术被工业所认可。因为具有精度高、实时性强等特性，世界制造强国纷纷提出将计算机视觉技术运用于本国的制造业未来发展战略，以孕育出一个高度灵活的个性化、智能化生产管理模式。基于此背景，本发明旨在运用机器视觉技术，实现数据驱动的待检测物体表面缺陷检测，保证待检测物体生产加工制造过程中产品质量的可靠性。

发明内容

针对现有技术的不足，本发明提供了一种跨尺度缺陷检测方法，解决了现有技术对待检测物体表面缺陷检测特征提取方式较为复杂和检测效率较低，以及对于待检测物体较小缺陷数据鲁棒性低的问题，针对上述背景技术中存在的问题，本发明可以通过缺陷检测模型，实现对待检测物体表面跨尺度缺陷的实时监测；同时，相较于其他目标检测框架，本发明的特征提取方式采用了更少的下采样层，减少了特征提取过程中，小缺陷的特征损失，对于待检测物体图像数据上较小的缺陷，具有更好的检测效果；最后，由于采用了较少的特征提取结构，本发明提出的目标检测框架推理效率更高，适用于大部分工业场景下的待检测物体表面跨尺度缺陷检测。

为解决上述技术问题，本发明提供了如下技术方案：一种跨尺度缺陷检测方法，包括以下步骤：

S1、采集待检测物体表面缺陷数据，并对缺陷进行分类定义；

S2、对待检测物体的原图像中包含缺陷的数据进行特征提取，得到跨尺度缺陷边缘特征；

S3、构建SwinIDE-merge网络模型，将待检测物体的原图像数据和跨尺度缺陷边缘特征输入SwinIDE-merge网络模型中，提取高维缺陷信息；

S4、构建缺陷检测模型，将高维缺陷信息输入缺陷检测模型，检测出缺陷的bounding box预测结果和分类结果；

S5、针对跨尺度缺陷的缺陷检测模型，采用Wasserstein距离作为损失函数，对该模型进行训练和权重更新，并得到最终的缺陷检测模型。

进一步地，所述S1中采集待检测物体表面缺陷数据，并对缺陷进行分类定义，包括如下步骤：

S101：采用二维工业相机对有缺陷的待检测物体表面进行图像采集；

S102：对采集得到的待检测物体表面缺陷的图像种类进行定义，待检测物体表面缺陷种类分为凹坑、磕碰伤、边缘破损、锈蚀、破损、划痕、褶皱七类，定义完缺陷种类后，对待检测物体表面缺陷进行数据标注。

进一步地，S2中的对待检测物体的图像中包含缺陷的数据进行特征提取，得到缺陷边缘特征，包括如下步骤：

S201、对原图像数据进行高斯平滑滤波，去除缺陷图像上的噪声点；

S202、计算原图像各像素间的梯度大小和方向，分别采用Canny算子和Sobel算子对原图像中包含的缺陷边缘信息进行提取，得到跨尺度缺陷边缘特征。

进一步地，S202中的跨尺度缺陷边缘特征采用非极大抑制、双阈值和滞后边界跟踪算法进行精细化处理。

进一步地，S3中的构建SwinIDE-merge网络模型，将待检测物体的原图像数据和跨尺度缺陷边缘特征输入SwinIDE-merge网络模型中，提取高维缺陷信息，包括如下步骤：

S301、构建原图像特征提取模块，该模块将提取出的原图像特征与S2步骤中提取出的跨尺度缺陷边缘特征进行叠加，通过Patch Partial结构展平，并通过Swin-transformer结构提取出图像深层次特征，所述Swin-Transformer结构第一个阶段由Linear Embedding和Swin-Transformer Block组成，其余3个阶段均由Patch Merging和Swin-Transformer Block构成；

S302、构建多尺度缺陷轮廓特征提取模块，该模块针对S2步骤中提取出的跨尺度缺陷边缘特征，采用4层2倍下采样的Resnet卷积神经网络，单独提取跨尺度缺陷边缘特征，并与所述图像深层次特征进行特征融合，获得缺陷融合边缘特征的特征图；

S303、构建多尺度缺陷特征融合模块，将四个阶段所述Swin-transformerBlock结构分别通过1*1卷积层以及上采样处理并拼接融合得到多尺度缺陷特征；

S304、构建尺度感知注意力模块，该模块将所述缺陷融合边缘特征的特征图以及所述多尺度缺陷特征作为输入，并融合平均池化层、1*1卷积层、relu激活函数和HardSigmoid激活函数结构，最后通过1*1卷积以及批量归一化提取出精细化的多尺度缺陷特征；

S305、构建结果输出模块，将所述精细化的多尺度缺陷特征与所述缺陷融合边缘特征的特征图以及所述多尺度缺陷特征进行拼接得到高维缺陷信息。

进一步地，S5中采用Wasserstein距离作为损失函数，对该模型进行训练和权重更新，包括如下步骤：

S501、将水平边界框R＝(cx,cy,w,h)建模为二维高斯分布N(μ,∑)，其中(cx,cy)，w和h分别表示目标框的x，y轴的中心坐标、宽度和高度，μ,∑分别表示为均值向量和协方差矩阵；

S502、对待检测物体缺陷的真实缺陷边界框和预测边界框进行高斯建模，将真实缺陷边界框和预测边界框的相似度转换为两个高斯分布之间的分布距离，对于高斯分布为μ₁＝N(m₁,∑₁)的真实目标框和高斯分布为μ₂＝N(m₂,∑₂)的预测目标框，并计算两者之间的二阶Wasserstein距离为

S503、对于真实目标框和预测目标框/>建模的高斯分布N_A和N_B，其中，/>w_A,h_A分别代表真实目标框A的x，y轴中心坐标以及长宽，/>w_B,h_B分别代表预测目标框B的x，y轴中心坐标以及长宽，其两者之间的Wasserstein距离可以进一步简化为/>

S504、使用其指数归一化形式作为缺陷检测模型的定位损失函数，并基于梯度下降的方式，对缺陷检测模型进行训练，缺陷检测模型的定位损失函数公式表示如下：

其中，C为待检测物体图像中缺陷的平均尺寸，Loss表示模型的定位损失函数，e表示幂函数。

借由上述技术方案，本发明提供了一种跨尺度缺陷检测方法，至少具备以下有益效果：

本发明提供了一种面跨尺度缺陷检测方法，可以基于融合的待检测物体表面缺陷边缘特征与SwinIDE-merge网络，对待检测物体表面缺陷进行精准定位；相较于一般的目标检测框架，本发明提出的待检测物体缺陷检测框架模型提取出的特征图包含了图像本身的信息和多尺度缺陷的信息，对于不同尺度缺陷，具有更强的特征提取效果；同时，本发明的特征提取方式采用了更少的下采样层，减少了特征提取过程中，小缺陷的特征损失，对于待检测物体图像数据上较小的缺陷，具有更好的检测效果；最后，由于采用了较少的特征提取结构，本发明提出的目标检测框架推理效率更高，适用于大部分工业场景下的待检测物体表面跨尺度缺陷检测。本发明能够有效解决了现有技术对待检测物体表面缺陷检测特征提取方式较为复杂和检测效率较低，以及对于待检测物体较小缺陷数据鲁棒性低的问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本发明待检测物体表面跨尺度缺陷检测方法流程图；

图2是本发明实施例中定义的叶轮表面缺陷类型图；

图3是本发明SwinIDE-merge网络模型框架图；

图4是本发明建立的待检测物体表面跨尺度缺陷检测框架图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。借此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

请参照图1-图4，示出了本实施例的一种具体实施方式，本实施例通过待检测物体缺陷检测模型提取出的特征图包含了图像本身的信息和多尺度缺陷的信息，对于不同尺度缺陷，具有更强的特征提取效果；同时，本发明的特征提取方式采用了更少的下采样层，减少了特征提取过程中，小缺陷的特征损失，对于待检测物体图像数据上较小的缺陷，具有更好的检测效果；最后，由于采用了较少的特征提取结构，本发明提出的目标检测框架推理效率更高，适用于大部分工业场景下的待检测物体表面跨尺度缺陷检测。

请参照图1，本实施例提出了一种跨尺度缺陷检测方法，本实施例中的待检测物体以叶轮为例，该方法包括以下步骤：

S1、采集叶轮表面缺陷数据，并对缺陷进行分类定义；

具体的，所述S1中采集叶轮表面缺陷数据，并对缺陷进行分类定义，包括如下步骤：

S101：采用二维工业相机对有缺陷的叶轮表面进行图像采集；

S102：对采集得到的叶轮表面缺陷的图像种类进行定义，叶轮表面缺陷种类分为凹坑、磕碰伤、边缘破损、锈蚀、破损、划痕、褶皱七类，定义完缺陷种类后，对叶轮表面缺陷进行数据标注。

S2、对叶轮的原图像中包含缺陷的数据进行特征提取，得到跨尺度缺陷边缘特征；

具体的，所述S2中的对叶轮的图像中包含缺陷的数据进行特征提取，得到缺陷边缘特征，包括如下步骤：

S201、对原图像数据进行高斯平滑滤波，去除缺陷图像上的噪声点；其中，高斯平滑滤波的公式如下

其中，(i,j)表示高斯卷积核中的每一个点的坐标位置，k代表高斯卷积核的大小，σ表示高斯分布的标准差，σ越大，去噪能力越好，但图像越模糊，本专利中，σ按照经验取值为1.4，卷积核大小为3*3；

S202、计算原图像各像素间的梯度大小和方向，分别采用Canny算子和Sobel算子对原图像中包含的缺陷边缘信息进行提取，得到跨尺度缺陷边缘特征；考虑到图像缺陷通常为水平或竖直方向，本专利采用的Canny算子表示为：

其中，C_K_x表示用于提取x轴上边缘特征的Canny算子，C_K_y表示用于提取y轴上边缘特征的Canny算子。

本专利采用的Sobel算子表示为：

其中，S_K_x表示用于提取x轴上边缘特征的Sobel算子，S_K_y表示用于提取y轴上边缘特征的Sobel算子。

具体的，S202中的跨尺度缺陷边缘特征采用非极大抑制、双阈值和滞后边界跟踪算法进行精细化处理。

S3、构建SwinIDE-merge网络模型，将叶轮的原图像数据和跨尺度缺陷边缘特征输入SwinIDE-merge网络模型中，提取高维缺陷信息；

所述S3中的构建SwinIDE-merge网络模型，将叶轮的原图像数据和跨尺度缺陷边缘特征输入SwinIDE-merge网络模型中，提取高维缺陷信息，SwinIDE-merge网络模型框架如图3所示，包括如下步骤：

S301、构建原图像特征提取模块，该模块将提取出的原图像特征与S2步骤中提取出的跨尺度缺陷边缘特征进行叠加，并通过Patch Partial结构展平，通过Swin-transformer结构提取出图像深层次特征；其中，Swin-Transformer结构是一个已经成熟且固定的结构，其主要由4个阶段构成，第一个阶段由Linear Embedding和Swin-TransformerBlock组成，其余2、3、4阶段均由Patch Merging和Swin-Transformer Block构成；

进一步地，此处的Patch Partial结构表示为补丁分区模块，该模块的功能主要为对输入长、宽、通道数分别为H、W、C的特征图进行空间结构上的调整，经过补丁分区模块后，长、宽、信道数为H、W、C的特征图变为长、宽、信道数为16*C的特征图；

进一步地，此处的Linear Embedding结构表示线性嵌入模块，该模块主要功能将特征图的信道数转换为指定大小；

进一步地，此处的Patch Merging结构表示补丁合并模块，其主要功能主要是将特征图的长和宽减半，通道数变为原来的两倍；

进一步地，Swin-Transformer表示带有滑动窗口的注意力机制计算模块，其主要功能为，将特征图通过滑动窗口的方式，分为4个矩阵，每个矩阵分别进行注意力机制计算，注意力机制计算公式如下所示：

其中，Attention表示注意力机制计算得到的结果，Softmax为函数表达式，其输入输出关系可以表示为：

其中，S_input表示Softmax函数的输入向量，sum(S_input)表示对该输入向量求和，S_output表示Softmax函数的输出向量，e表示幂函数；

d表示滑动窗口分出的矩阵的维度，T表示矩阵的转置，Q表示Q矩阵，其计算公式为：

Q＝P_m*W_q；

其中，P_m表示特征图分出的第m个矩阵，W_q表示用于计算Q矩阵的权重矩阵，该矩阵通过模型训练得到；

K表示K矩阵，其计算公式为：

K＝P_m*W_k；

W_k表示用于计算K矩阵的权重矩阵，该矩阵通过模型训练得到；

V表示V矩阵，其计算公式为：

V＝P_m*W_v；

W_v表示用于计算V矩阵的权重矩阵，该矩阵通过模型训练得到；

S302、构建多尺度缺陷轮廓特征提取模块，该模块针对S2步骤中提取出的跨尺度缺陷边缘特征，采用4层2倍下采样的Resnet卷积神经网络，单独提取跨尺度缺陷边缘特征，并与所述图像深层次特征进行特征融合，获得缺陷融合边缘特征的特征图；其中，卷积神经网络采用卷积核大小均为3*3，填充为1，步长为1；

S303、构建多尺度缺陷特征融合模块，将四个阶段所述Swin-transformerBlock结构分别通过1*1卷积层以及上采样处理并拼接融合得到多尺度缺陷特征；其中，上采样卷积神经网络的卷积核为3*3，上采样倍率均为2。

S304、构建尺度感知注意力模块，该模块将所述缺陷融合边缘特征的特征图以及所述多尺度缺陷特征作为输入，并融合平均池化层、1*1卷积层、relu激活函数和HardSigmoid激活函数结构，最后通过1*1卷积以及批量归一化提取出精细化的多尺度缺陷特征；其中，平均池化层的核大小为2*2，填充为0，步长为2；

S4、构建缺陷检测模型，将高维缺陷信息输入缺陷检测模型，检测出缺陷的bounding box预测结果和分类结果，得到缺陷类别预测，缺陷中心点的预测和缺陷预测框预测。

具体的，S5中采用Wasserstein距离作为损失函数，对该模型进行训练和权重更新，包括如下步骤：

S501、将水平边界框R＝(cx,cy,w,h)建模为二维高斯分布N(μ,∑)，其中(cx,cy)，w和h分别表示目标框的x，y轴的中心坐标、宽度和高度，μ,∑分别表示为均值向量和协方差矩阵，对于水平边界框R＝(cx,cy,w,h)而言，其内接椭圆方程可以表示为：

其中(μ_x,μ_y)是椭圆的中心坐标，σ_x和σ_y是沿x和y轴的半轴长度，因此，μ_x＝cx，μ_y＝cy，二维高斯分布的概率密度函数如下式所示：

其中e表示幂函数，T表示矩阵的转置，X、μ和∑分别表示高斯分布的坐标、均值向量和协方差矩阵，当满足：

(X-μ)^TΣ^-1(X-μ)＝1；

则椭圆方程可以表示为二维高斯分布的密度等值线，因此，水平边界框R＝(cx,cy,w,h)可以建模为二维高斯分布N(μ,Σ)，此时，μ和Σ可以表示为：

S502、对叶轮缺陷的真实缺陷边界框和预测边界框进行高斯建模，将真实缺陷边界框和预测边界框的相似度转换为两个高斯分布之间的分布距离，定义归一化的高斯Wasserstein距离损失函数，在S501中，本专利已经对两个不同的目标框进行了高斯建模，则对于高斯分布为μ₁＝N(m₁,Σ₁)的真实目标框和高斯分布为μ₂＝N(m₂,∑₂)的预测目标框，两者之间的二阶Wasserstein距离可以简化为：

其中，||*||₂表示二范数，||*||_F表示Frobenius范数，m₁表示真实目标框高斯分布的均值，∑₁表示真实目标框高斯分布的方差，m₂表示预测目标框高斯分布的均值，∑₂表示预测目标框高斯分布的方差。

S503、对于真实目标框和预测目标框/>建模的高斯分布N_A和N_B，其两者之间的Wasserstein距离可以进一步简化为:

其中，w_A,h_A分别代表真实目标框A的x，y轴中心坐标以及长宽，/>w_B,h_B分别代表预测目标框B的x，y轴中心坐标以及长宽。

S504、由于是距离度量，不能用于衡量相似度，即值域不在0到1之间，因此，使用其指数归一化形式作为缺陷检测模型的定位损失函数，并基于梯度下降的方式，对缺陷检测模型进行训练，缺陷检测模型的定位损失函数公式表示如下：

其中，C为叶轮图像中缺陷的平均尺寸，Loss表示模型的定位损失函数，e表示幂函数。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。

以上实施方式对本发明进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种跨尺度缺陷检测方法，其特征在于，包括以下步骤：

S2、对待检测物体的原图像中包含缺陷的数据进行特征提取，得到跨尺度缺陷边缘特征；所述S2包括：S201、对原图像数据进行高斯平滑滤波，去除缺陷图像上的噪声点；S202、计算原图像各像素间的梯度大小和方向，分别采用Canny算子和Sobel算子对原图像中包含的缺陷边缘信息进行提取，得到跨尺度缺陷边缘特征，其采用非极大抑制、双阈值和滞后边界跟踪算法进行精细化处理;

S3、构建SwinIDE-merge网络模型，将待检测物体的原图像数据和跨尺度缺陷边缘特征输入SwinIDE-merge网络模型中，提取高维缺陷信息；所述S3包括：S301、构建原图像特征提取模块，该模块将提取出的原图像特征与S2步骤中提取出的跨尺度缺陷边缘特征进行叠加，通过Patch Partial结构展平，并通过Swin-transformer结构提取出图像深层次特征，所述Swin-Transformer结构第一个阶段由Linear Embedding和Swin-Transformer Block组成，其余3个阶段均由Patch Merging和Swin-Transformer Block构成；S302、构建多尺度缺陷轮廓特征提取模块，该模块针对S2步骤中提取出的跨尺度缺陷边缘特征，采用4层2倍下采样的Resnet卷积神经网络，单独提取跨尺度缺陷边缘特征，并与所述图像深层次特征进行特征融合，获得缺陷融合边缘特征的特征图；S303、构建多尺度缺陷特征融合模块，将四个阶段所述Swin-transformerBlock结构分别通过1*1卷积层以及上采样处理并拼接融合得到多尺度缺陷特征；S304、构建尺度感知注意力模块，该模块将所述缺陷融合边缘特征的特征图以及所述多尺度缺陷特征作为输入，并融合平均池化层、1*1卷积层、relu激活函数和Hard Sigmoid激活函数结构，最后通过1*1卷积以及批量归一化提取出精细化的多尺度缺陷特征；S305、构建结果输出模块，将所述精细化的多尺度缺陷特征与所述缺陷融合边缘特征的特征图以及所述多尺度缺陷特征进行拼接得到高维缺陷信息；

S4、构建缺陷检测模型，将高维缺陷信息输入缺陷检测模型，检测出缺陷的boundingbox预测结果和分类结果；

2.根据权利要求1所述的一种跨尺度缺陷检测方法，其特征在于，所述S1中采集待检测物体表面缺陷数据，并对缺陷进行分类定义，包括如下步骤：

3.根据权利要求1所述的一种跨尺度缺陷检测方法，其特征在于，所述S5中采用Wasserstein距离作为损失函数，对该模型进行训练和权重更新，包括如下步骤：

S503、对于真实目标框和预测目标框/>建模的高斯分布N_A和N_B，其中，/>w_A,h_A分别代表真实目标框A的x，y轴中心坐标以及长宽，w_B,h_B分别代表预测目标框B的x，y轴中心坐标以及长宽，其两者之间的Wasserstein距离可以进一步简化为/>