CN117408996B

CN117408996B - 基于缺陷专注和边缘权重损失的表面缺陷检测方法

Info

Publication number: CN117408996B
Application number: CN202311703447.0A
Authority: CN
Inventors: 刘玉峰; 孙启玉; 孙平; 杨公平
Original assignee: Shandong Fengshi Information Technology Co ltd
Current assignee: Shandong Fengshi Information Technology Co ltd
Priority date: 2023-12-13
Filing date: 2023-12-13
Publication date: 2024-04-19
Anticipated expiration: 2043-12-13
Also published as: CN117408996A

Abstract

本发明涉及一种基于缺陷专注和边缘权重损失的表面缺陷检测方法，属于图像处理和表面缺陷检测技术领域。通过构建记忆库核心子集，将训练样本输入到特征提取网络提取多层特征，将提取的中间层特征采用最近邻算法与对应记忆库核心子集对比得到缺陷先验图，特征增强；将增强后的特征输入到可变形注意力中生成校正后的增强特征，对校正后的增强特征与提取的非中间层特征采用邻近特征融合，获得融合后特征图；通过计算校正后的增强特征图与融合后特征图的边缘权重损失，加和计算总损失，根据总损失训练网络。本发明利用边缘权重损失来增强对缺陷区域的影响，同时使用可变形注意力进行缺陷专注，从而实现高精度定位的表面缺陷检测方法。

Description

基于缺陷专注和边缘权重损失的表面缺陷检测方法

技术领域

本发明涉及一种表面缺陷检测方法，特别涉及一种基于缺陷专注和边缘权重损失的表面缺陷检测方法，属于图像处理和表面缺陷检测技术领域。

背景技术

目前，基于深度学习的表面缺陷检测方法主要以卷积神经网络（CNN）为基础。这些方法使用CNN来提取特征，然后对这些特征进行各种操作以实现缺陷检测。其中，一种常见的检测方法是使用特征记忆库。

特征记忆库方法的基本思路如下：首先，从一些正常样本中提取特征并将其保存到记忆库中。在训练或测试时，给定一个样本，计算该样本的特征与记忆库中所有特征的欧氏距离，从而生成一个距离分数图，图中每个分数代表当前空间位置特征的缺陷程度，可以将该分数图直接用于缺陷检测，或者作为先验图来增强原始特征。然而，这种方法存在一些不足之处。由于表面缺陷的种类多样，很多缺陷都伴随着强烈的背景干扰。背景干扰与正常部分之间的差异很大，因此代表背景干扰部分的特征所对应的欧氏距离往往很大。如果直接进行检测，可能会误将背景干扰部分误判为缺陷；如果作为缺陷先验用于增强特征，可能会同时增强缺陷和背景，从而减弱对缺陷的关注，导致误判。不管哪种方式都会降低最终的检测精度，不利于准确地缺陷检测。

发明内容

本发明的目的是克服上述不足而提供一种基于缺陷专注和边缘权重损失的表面缺陷检测方法，利用边缘权重损失来增强对缺陷区域的影响，同时使用可变形注意力进行缺陷专注，从而实现高精度定位的表面缺陷检测方法。

本发明采取的技术方案为：

基于缺陷专注和边缘权重损失的表面缺陷检测方法，包括步骤如下：

S1. 划分数据集：将缺陷检测数据划分为对照集、训练集和测试集；

S2. 构建记忆库核心子集：将对照集的所有样本输入特征提取网络获取多层特征，使用中间层的特征构建特征记忆库，使用聚类算法将记忆库分成多个簇，并保存所有簇中心作为核心子集用来代替整个记忆库，得到记忆库核心子集；

S3.将训练样本输入到特征提取网络提取多层特征，将提取的中间层特征采用最近邻算法与对应记忆库核心子集对比得到缺陷先验图，将缺陷先验图与和其对应的提取特征像素级相乘得到增强后的特征；将增强后的特征输入到可变形注意力中生成校正后的增强特征，对校正后的增强特征与提取的非中间层特征采用邻近特征融合，获得融合后特征图；

S4.分别计算校正后的增强特征图与融合后特征图的边缘权重损失，加和计算总损失，根据总损失训练网络（不包括特征提取网络）；

S5.将测试集样本输入到训练好的模型中，通过特征提取网络提取多层特征，利用步骤S2生成的记忆库核心子集按照步骤S3所述的方法计算中间层的特征对应的缺陷先验图，再获得增强后的特征，将增强后的特征输入到可变形注意力中生成校正后的增强特征，对校正后的增强特征与测试集样本提取的非中间层特征采用邻近特征融合，将获得的融合后特征图上采样、降低通道、归一化得到最终的预测图。

上述方法中，步骤S1中将原始数据集中所有正常样本的1/5设置为对照集，剩余正常样本与缺陷样本按照3：1的比例分成训练集与测试集。

步骤S2、S3、S5中所述的特征提取网络采用ResNet18。

上述方法中，步骤S2优选将每个核心子集中的特征数量设置为对应记忆库中总特征数量的5%。

步骤S3中优选将训练样本输入到特征提取网络提取四层特征F ₁-F ₄，用中间两层的特征F ₂、 F ₃采用最近邻算法分别在两个记忆库核心子集中搜索与其每个空间位置上的特征距离最近的特征，计算并保存对应的距离，将两个距离向量值Sigmoid函数归一化和reshape操作得到两个缺陷先验图DPI ₂、DPI ₃。

步骤S3中可变形注意力首先将增强后的特征F’ 输入到一个1×1卷积中得到查询Q，然后将查询输入到偏移量生成网络中得到参考点偏移量/>，根据增强后的特征的高度H与宽度W来生成网格参考点ref，ref与/>分别表示参考点坐标以及对应的偏移量坐标，二者相加得到要采样的位置向量pos，利用grid_sample函数根据位置向量pos对输入增强后的特征图进行双线性插值映射，映射得到一个新的特征图F’_sampled，将其输入到两个1×1卷积中，分别得到键K，值V两个向量，将Q、K、V维度reshape，经过可变形注意力得到的结果为F’_output，计算F’_output涉及的公式定义如下：

，

其中Conv1×1表示1×1卷积，σ表示Softmax函数，c表示特征通道数，将F’_output维度reshape并输入到一个1×1卷积中，从而特征F ₂增强后的特征F ₂ ’ 输入到可变形注意力中最终生成校正后的增强特征F ₂ ’_output，特征F ₃增强后的特征F ₃ ’ 输入到可变形注意力中最终生成校正后的增强特征F ₃ ’_output。

步骤S3中所述的邻近特征融合是先按特征层次由低到高排列，再相邻特征两两融合，相邻特征间的融合按照高层特征上采样二倍与底层特征融合，同时将融合后的特征输入到一个3×3卷积块中，一轮融合得到的特征再进行排列、两两融合、输入卷积块直到得到一个融合特征图F _final。

步骤S4根据训练集中每个样本对应的标签图片GT生成该样本各像素对应的边缘权重，计算特征图F ₂ ’output、 F ₃ ’_output、F _final的交叉熵损失，根据交叉熵损失与边缘权重分别计算各图边缘权重损失，加和计算总损失，计算过程为：

使用一个函数ψ将归一化的距离转化为对应的边缘权重，转化后的结果是边缘部分像素的权重较大，中心部分权重较小，最终缺陷像素的边缘权重的数学公式定义如下：

，

其中EW _i表示第i个缺陷像素的边缘权重，d _i表示当前缺陷像素到其最近正常像素之间的距离，d _max表示缺陷像素到正常像素距离的最大值，表示将距离值x转换为边缘权重的函数，/>是控制权重范围的超参数，在这里设置为2，exp(·)是以底数为e的幂函数；

边缘权重损失EWL是根据交叉熵损失与计算的边缘权重定义的，每个像素的交叉熵公式定义如下：

，

其中，y表示像素的标签，取值为0或1，1表示缺陷像素，0表示正常像素；p表示像素的预测值，表示该位置的像素预测为缺陷的概率，训练使用的边缘权重损失定义如下：

，

其中W表示样本的宽，H表示样本的高，L ⁱ _pixel表示样本第i个像素的交叉熵损失，EW _i表示样本第i个像素的边缘权重，最终，一个样本计算的总损失定义如下：

，

其中M表示在深度监督中计算损失时所用的特征图的数量，在这里M为3；EWL _m表示第m个特征图与GT、样本边缘权重计算出来的边缘权重损失。

基于缺陷专注和边缘权重损失的表面缺陷检测系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法。

一种存储介质，其为计算机可读存储介质，所述的计算机可读存储介质上存储有计算机程序用于实现如上所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法中的步骤。

本发明的有益效果是：

本发明方法利用可变形注意力，对由记忆库先验增强的特征进行缺陷专注，从而有效地突出模型要关注的缺陷部分，减弱可能被先验增强的背景干扰的影响，提高检测的准确性；同时，还引入了边缘权重损失，通过增加缺陷像素损失的权重，确保可变形注意力能够正确突出缺陷，使得模型更加注重缺陷部分。这一方法解决了使用记忆库生成的先验图进行特征增强导致的模型误判问题，在实际应用中，可解决由于强烈的背景干扰，导致模型过度聚焦于背景干扰部分而忽略了真实的缺陷的问题。

附图说明

图1为本发明方法的模型结构示意图；

图2为本发明方法训练阶段的流程图；

图3为本发明方法测试阶段的流程图；

图4为本发明特征提取网络结构示意图；

图5为本发明可变形注意力处理过程示意图；

图6为本发明邻近特征融合过程图。

具体实施方式

下面结合具体实施例进一步说明本发明。

实施例1：基于缺陷专注和边缘权重损失的表面缺陷检测方法，包括步骤如下：

S1. 划分数据集：

通常情况下，缺陷检测数据集被划分为训练集和测试集，每个样本都附带相应的标签图片（GT）。为了满足特定需求，本发明将缺陷检测数据集分为三个独立的样本集：对照集、训练集和测试集。对于对照集而言，其内正常样本越多，提取的对照特征就越多，最后预测越准确，但是也要考虑到计算资源问题，因此本发明设置对照集为原始数据集中所有正常样本的1/5，剩余正常样本与缺陷样本按照3：1的比例分成训练集与测试集。所有样本都被调整为固定尺寸的224×224，并以RGB形式读取。同时，对应的GT以灰度图形式读取，从而形成样本尺寸为3×224×224，GT尺寸为1×224×224。

S2. 构建记忆库核心子集：

使用预训练特征提取网络ResNet18结构中的conv1、bn1、relu、maxpooling、layer1、layer2、layer3，layer4来提取特征（如图4），如表1所示。本发明中对照集样本不参与训练，只用于记忆库核心子集的构建。注意，特征提取网络不参与训练，在训练之前对其进行参数冻结。

表1

。

将对照集的所有样本输入特征提取网络，以获取4层特征F ₁-F ₄。使用中间两层（第2和第3层）的特征构建特征记忆库，共生成2个特征记忆库。这样做的原因如下：第一层特征包含过多细节信息，而第四层特征则是深层特征，偏向于自然语言分类任务，不适用于特定的缺陷检测任务，所以不使用这两层特征进行记忆库构建。

由于构建的记忆库内存庞大，如果直接进行后续缺陷先验图的计算，会耗费大量时间。因此，为了节省时间，需要从每个记忆库中寻找一个核心子集，并且使得在核心子集上得到的计算结果与在对应记忆库上得到的计算结果最接近。因此，我们使用K-means++算法进行聚类，将记忆库分成多个簇，并保存所有簇中心作为核心子集用来代替整个记忆库。核心子集中的特征数量设置的越大越好，这样计算出来的结果会更精确，但是考虑到构建过程的计算复杂度，我们将每个核心子集中的特征数量设置为对应记忆库中总特征数量的5%，记为C _i（取整，i取2，3）。

假设对照集中有N个样本，所有样本经过上述网络提取特征，得到4个特征图，尺寸分别为[N, 64, 56, 56]、[N, 128, 28, 28]、[N, 256, 14, 14]、[N, 512, 7, 7]，每个特征图有4个维度，从左到右每个维度表示的含义依次为样本数、通道数、特征宽、特征高。用中间两层特征生成的两个记忆库M _i（i=2,3），大小分别为[N×28×28, 128]、[N×14×14,256]。对每个记忆库使用K-means++算法来寻找其内的核心子集，K-means++算法流程如下：

对于任一记忆库M _i，取其内任意一条特征E _i ⁰，将其作为一个簇中心并添加到核心子集M _ci中，然后计算记忆库中所有特征与E _i ⁰的欧式距离，记为D _i ⁰，找到与E _i ⁰距离最远的特征E _i ¹，因为E _i ¹与E _i ⁰距离非常远，说明二者不相似，因此将其作为第二个簇中心，并添加到核心子集M _ci中，同时计算记忆库中所有特征与E _i ¹的欧式距离，记为D _i ¹，比较D _i ⁰与D _i ¹，取相同索引值下的距离最小值，新生成的距离向量记为D _i ^min。举一例，记忆库中的某特征E（索引值为k）到E _i ⁰的距离小于其到E _i ¹的距离（即：特征E与E _i ⁰更相似），则E应属于E _i ⁰所在的簇内（即：E可以用E _i ⁰粗略近似），因此在D _i ^min中索引值为k的位置存储特征E到E _i ⁰的距离，记忆库中其他特征以此类推。此时，记忆库M _i被分了两簇，簇中心分别为E _i ⁰与E _i ¹。取D _i ^min中的距离最大值所在的索引，并取出该索引所属的特征向量E _i ²，E _i ²与E _i ⁰、E _i ¹均不相似，需要作为一个新的簇中心，因此，将E _i ²加入到核心子集M _ci中，计算记忆库中所有特征与E _i ²的距离，记为D _i ²，比较D _i ²与D _i ^min中相同索引值下的值并取最小值更新D _i ^min，以此类推，直到核心子集中特征数量达到C _i结束。核心子集M _ci构建完成，也就是说M _i被分成C _i个簇，记忆库M _i中的其他特征总能在C _i个特征找到一个特征近似。生成的两个核心子集记为M _c2，M _c3。构建完毕的核心子集用于训练与测试阶段，由于对照集中只包含正常样本，因此每个核心子集中只包含正常特征。

S3.将训练样本输入到特征提取网络提取多层特征，将提取的中间层特征采用最近邻算法与对应记忆库核心子集对比得到缺陷先验图，将缺陷先验图与和其对应的提取特征像素级相乘得到增强后的特征；将增强后的特征输入到可变形注意力中生成校正后的增强特征，对校正后的增强特征与提取的非中间层特征采用邻近特征融合，获得融合后特征图（如图1）：

将训练集的每张图片输入到特征提取网络中提取4层特征F ₁-F ₄，然后采用K最近邻（KNN）搜索算法在核心子集M _c2中找到与特征F ₂中每个空间位置所在的特征最相似的特征，并计算对应的欧氏距离，同理特征F ₃也是相同的操作，最终输出2个距离向量。使用Sigmoid函数将两个距离向量中的值归一化为[0,1]之间，然后进行reshape操作得到缺陷先验图DPI ₂，DPI ₃。在缺陷先验图中值表示对应空间位置特征的缺陷程度，值越大，表明特征为缺陷的概率越大；值越小，表示该条特征为缺陷的概率越小。DPI ₂，DPI ₃的尺寸分别为[1, 1, 28,28]，[1, 1, 14, 14]。

将缺陷先验图DPI ₂，DPI ₃分别与对应的特征F ₂，F ₃做像素级乘法，得到增强后的特征F ₂ ^’，F ₃ ^’，特征F ₂ ^’，F ₃ ^’中已经对缺陷特征（如果有）进行了增强，对背景特征进行了抑制，但是背景干扰所在部分的特征也有可能会被增强，导致最终模型的误判。因此，我们将其输入到可变形注意力模块中，在之前缺陷先验图增强的基础上，利用可变形注意力来进行校正（缺陷专注），来进一步凸显缺陷部分，抑制先前缺陷先验图增强的背景干扰部分，使模型更加专注于缺陷，从而实现更精准的定位。

例如，给定一个缺陷样本，通过网络提取4层特征，经过上述操作得到F ₂ ^’，F ₃ ^’，维度分别为[1,128,28,28]，[1, 256, 14, 14]，对于特征F ₂ ^’来说，将其输入到可变形注意力模块中，做如下操作：首先将特征F ₂ ^’输入到一个1×1卷积中得到查询Q ₂，维度为[1,128,28,28]，然后将Q ₂输入到偏移量生成网络中，得到参考点偏移量/>，表示模型想要关注位置的偏移，维度为[1,28,28,2]，生成网络/>应该有对局部特征的感知，来合理地学习偏移量，因此其结构为一个5×5的深度卷积（步长为2），一个非线性激活函数GELU以及一个1×1卷积。其次根据F ₂ ^’的高度H与宽度W来生成网格参考点ref，ref内的值为线性间隔的二维坐标{(0,0)，…， (27,27)}，将坐标归一化到[-1，+1]范围内，其中(-1，-1)表示左上角，(+1，+1)表示右下角。ref的维度为[1,28,28,2]，ref与/>分别表示参考点坐标以及对应的偏移量坐标，二者相加得到要采样的位置向量pos，我们利用grid_sample函数，根据位置向量pos对输入特征图F ₂ ^’进行双线性插值映射，得到一个新的特征图F ₂ ^’ _- sampled，其可以看作是对原始特征图F ₂ ^’进行了一定程度的“变形”，维度为[1,128,28,28]，并将其输入到两个1×1卷积中，分别得到键K ₂，值V ₂两个向量，整个过程如图5所示。注意，这里的K ₂，V ₂不是由特征F ₂ ^’得到，而是由F ₂ ^’ _- sampled变换得到，这样可以确保注意力分布是根据输入特征的变形而自适应调整的。将Q ₂，K ₂，V ₂维度都reshape为[28*28，128]，得到可变形注意力的结果F ₂ ^’ _- output，计算F ₂ ^’ _- output涉及的公式定义如下：

，

其中Conv1×1表示1×1卷积，σ表示Softmax函数，c表示特征通道数。将F ₂ ^’ _- output维度reshape为[1，128，28，28]并输入到一个1×1卷积中。特征F ₃’也是同样操作。最终生成两个特征向量F ₂ ^’ _- output，F ₃ ^’ _- output，两个特征都经过可变形注意力进行了缺陷专注，能够使得模型更加关注到缺陷部分，减弱对背景以及背景干扰的关注。

在提取的四层特征中，第一层特征包含大部分细节信息，第四层特征是深层特征，包含抽象语义信息，比较偏向于自然语言分类任务。根据这两层特征构建出来记忆库计算出来的缺陷先验图中误差比较大，因此，在构建记忆库时，我们不使用第一层与第四层特征。但是，底层特征（第一层）包含细节信息的特征，是有利于缺陷的定位；高层特征（第四层）包含更抽象的特征，是有利于模型区分缺陷与正常。融合这些信息可以提供更全面、多样化的特征表示，提高模型泛化能力，有利于缺陷的检测与定位。因此，我们对F ₁，F ₂ ^’ _- output，F ₃ ^’ _- output，F ₄采用邻近特征融合。

在邻近融合时，先按特征层次由低到高排列，再相邻特征两两融合，相邻特征间的融合按照高层特征上采样二倍与底层特征融合，同时将融合后的特征输入到一个3×3卷积块中，来减少融合后的冗余信息。过程如下：共有三轮融合。第一轮是F ₁与F ₂ ^’ _- output融合、F ₂ ^’ _- output与F ₃ ^’ _- output融合，F ₃ ^’ _- output与F ₄融合，融合后得到F _1,2，F _2,3，F _3,4。第二轮是F _1,2与F _2,3融合，F _2,3与F _3,4融合，得到F _1,2,3，F _2,3,4，第三轮是F _1,2,3与F _2,3,4融合，得到产生更具代表性和丰富信息的特征F _final，各个融合特征的尺寸表2所示。

表2

。

S4.分别计算校正后的增强特征图与融合后特征图的边缘权重损失，加和计算总损失，根据总损失训练网络：

训练集中每个样本都有对应的标签图片（GT），我们根据每个样本的GT来生成其内每个像素对应的边缘权重。对于缺陷样本，其中既含有正常像素也含有缺陷像素。对于正常像素，我们将其边缘权重设置为1。对于缺陷像素，我们采用距离变换算法计算出其与最近的正常像素的距离，计算出来的距离值根据缺陷像素的位置而变化，其中，缺陷边缘的距离值最小，缺陷中心的距离值最大。如果直接使用距离值当作损失权重，模型可能会过度关注缺陷中心而忽略缺陷边缘，不利于缺陷的整体性检测。因此，我们使用一个函数ψ将归一化的距离转化为对应的边缘权重，转化后的结果是边缘部分像素的权重较大，中心部分权重较小。最终缺陷像素的边缘权重的数学公式定义如下：

，

其中EW _i表示第i个缺陷像素的边缘权重，d _i表示当前缺陷像素到其最近正常像素之间的距离，d _max表示缺陷像素到正常像素距离的最大值，表示将距离值x转换为边缘权重的函数，/>是控制权重范围的超参数，在这里设置为2，exp(·)是以底数为e的幂函数。注意，虽然最终得出的边缘的权重高于中心的权重，但它们之间的数值差异并不大，这可以避免模型过于关注边缘而忽略整个缺陷区域。另外，缺陷像素的权重是大于正常像素的权重（为1），这样做的目的是增加缺陷区域的影响，减弱正常区域（包含背景以及背景干扰）的影响，提高模型对各种缺陷区域检测的鲁棒性，这体现在模型参数更新过程中。对于正常样本而言，没有缺陷像素，都是正常像素，其内每个像素边缘权重是1，也就是说计算出来的损失保持不变。

为了使网络能学习更加有效的特征表示，同时也能够更快、更稳定的收敛。我们使用深度监督方式，通过在不同层次上提供监督信号，网络可以逐层学习复杂特征，从而促进更好的泛化和更高的性能。使用双线性插值将F ₂ ^’ _- output，F ₃ ^’ _- output，F _final上采样到原图片尺寸，然后使用1×1卷积降低通道，得到3个通道数为1，尺寸为224×224的特征图，逐像素计算每个特征图与GT、计算的边缘权重之间的边缘权重损失。

边缘权重损失（EWL）是根据交叉熵损失与计算的边缘权重定义的，每个像素的交叉熵公式定义如下：

，

其中，y表示像素的标签，取值为0或1，1表示缺陷像素，0表示正常像素；p表示像素的预测值，表示该位置的像素预测为缺陷的概率。训练使用的边缘权重损失定义如下：

，

其中W表示样本的宽，H表示样本的高，这里均定义为224，L ⁱ _pixel表示样本第i个像素的交叉熵损失，EW _i表示样本第i个像素的边缘权重。最终，一个样本计算的总损失定义如下：

，

本发明在模型训练过程（如图2）中使用Adam优化器，权重衰减系数设置为0.005，初始学习率设置为0.001，采用阶段性衰减策略改变学习率，每600次迭代将学习率降为原来的0.1，以进一步加速模型的收敛。批次大小设置为8，即每次读取10张训练集图片作为一次迭代，每次迭代分别计算总损失并进行梯度回传、模型参数更新。共迭代6000次，取迭代完后的模型作为最终的模型并保存参数。

S5.将测试集样本输入到训练好的模型中，通过特征提取网络提取多层特征，利用步骤S2生成的记忆库核心子集按照步骤S3所述的方法计算中间层的特征对应的缺陷先验图，再获得增强后的特征，将增强后的特征输入到可变形注意力中生成校正后的增强特征，对校正后的增强特征与测试集样本提取的非中间层特征采用邻近特征融合，将获得的融合后特征图上采样、降低通道、归一化得到最终的预测图：

在测试阶段，读取最终的模型参数，同时使用生成的两个记忆库核心子集M _c2，M _c3，将测试集样本数据输入到模型中，通过特征提取网络提取4层特征F ₁-F ₄，按照步骤S3的方法得到的两个缺陷先验图分别与特征F ₂与F ₃做像素级乘法，将结果特征输入到可变形注意力中，生成两个不同层次的聚焦于缺陷的特征F ₂ ^’ _- output，F ₃ ^’ _- output，，最后对F ₁，F ₂ ^’ _- output，F ₃ ^’ _- output，F ₄进行邻近特征融合，生成最终的融合特征F _final，将其上采样到原图像尺寸，并通过1×1卷积降低通道得到模型输出。对输出取Sigmoid得到最终的预测图，预测图中每个位置上的分数表示为对应像素为缺陷的概率，分数越大，说明该像素是缺陷的概率越大。测试阶段流程如图3所示。

实施例2：本实施例提供实现基于缺陷专注和边缘权重损失的表面缺陷检测方法的硬件设备。

基于缺陷专注和边缘权重损失的表面缺陷检测系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上实施例1所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法。

一种存储介质，其为计算机可读存储介质，所述的计算机可读存储介质上存储有计算机程序用于实现如上实施例1所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法中的步骤。

以上所述仅为本发明的较佳实施例而已，并不用于限制本发明，凡在本发明的精神和原则范围之内所作的任何修改、等同替换以及改进等，均应包含在本发明的保护范围之内。

Claims

1.基于缺陷专注和边缘权重损失的表面缺陷检测方法，其特征是，包括步骤如下：

所述的缺陷先验图的获得过程为：将训练样本输入到特征提取网络提取四层特征F ₁-F ₄，用中间两层的特征F ₂、F ₃采用最近邻算法分别在两个记忆库核心子集中搜索与其每个空间位置上的特征距离最近的特征，计算并保存对应的距离，将两个距离向量值Sigmoid函数归一化和reshape操作得到两个缺陷先验图DPI ₂、DPI ₃；

所述的邻近特征融合是先按特征层次由低到高排列，再相邻特征两两融合，相邻特征间的融合按照高层特征上采样二倍与底层特征融合，同时将融合后的特征输入到一个3×3卷积块中，一轮融合得到的特征再进行排列、两两融合、输入卷积块直到得到一个融合特征图F _final；

所述的可变形注意力首先将增强后的特征F’ 输入到一个1×1卷积中得到查询Q，然后将查询输入到偏移量生成网络中得到参考点偏移量/>根据增强后的特征的高度H与宽度W来生成网格参考点ref，ref与/>分别表示参考点坐标以及对应的偏移量坐标，二者相加得到要采样的位置向量pos，利用grid_sample函数根据位置向量pos对输入增强后的特征图进行双线性插值映射，映射得到一个新的特征图F’_sampled，将其输入到两个1×1卷积中，分别得到键K，值V两个向量，将Q、K、V维度reshape，经过可变形注意力得到的结果为F’_output，计算F’_output涉及的公式定义如下：

，

其中Conv1×1表示1×1卷积，σ表示Softmax函数，c表示特征通道数，将F’_output维度reshape并输入到一个1×1卷积中最终生成校正后的增强特征；

S4.分别计算校正后的增强特征图与融合后特征图的边缘权重损失，加和计算总损失，根据总损失训练除特征提取网络外的网络；

计算过程为：根据训练集中每个样本对应的标签图片GT生成该样本各像素对应的边缘权重，计算特征图的交叉熵损失，使用一个函数ψ将归一化的距离转化为对应的边缘权重，转化后的结果是边缘部分像素的权重较大，中心部分权重较小，最终缺陷像素的边缘权重的数学公式定义如下：

，

其中M表示在深度监督中计算损失时所用的特征图的数量；EWL _m表示第m个特征图与GT、样本边缘权重计算出来的边缘权重损失；

2.根据权利要求1所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法，其特征是，步骤S1中将原始数据集中所有正常样本的1/5设置为对照集，剩余正常样本与缺陷样本按照3：1的比例分成训练集与测试集。

3.根据权利要求1所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法，其特征是，步骤S2、S3、S5中所述的特征提取网络采用ResNet18。

4.根据权利要求1所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法，其特征是，步骤S2将每个核心子集中的特征数量设置为对应记忆库中总特征数量的5%。

5.基于缺陷专注和边缘权重损失的表面缺陷检测系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征是，所述处理器执行所述程序时实现如权利要求1-4任一项所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法。

6.一种存储介质，其为计算机可读存储介质，其特征是，所述的计算机可读存储介质上存储有计算机程序用于实现如权利要求1-4任一项所述的基于缺陷专注和边缘权重损失的表面缺陷检测方法中的步骤。