CN114841992A

CN114841992A - 基于循环生成对抗网络和结构相似性的缺陷检测方法

Info

Publication number: CN114841992A
Application number: CN202210608742.7A
Authority: CN
Inventors: 郭一晶; 钟林威; 邱义; 詹俦军; 温宗恒
Original assignee: Xiamen University Tan Kah Kee College
Current assignee: Xiamen University Tan Kah Kee College
Priority date: 2022-05-31
Filing date: 2022-05-31
Publication date: 2022-08-02

Abstract

本发明涉及一种基于循环生成对抗网络和结构相似性的缺陷检测方法，包括以下步骤：步骤S1:获取缺陷图片并预处理，作为训练数据集；步骤S2:构建CycleGAN模型，并基于训练数据集训练，得到一个将缺陷图片映射为无缺陷图片的模型；步骤S3:将待检测图片输入训练后的CycleGAN模型，使用结构相似性算法对比原图和修复图的差异，获取差异二值图；步骤S4:对差异二值图进行连通域降噪和形态学处理，原始图像存在缺陷，则该二值图中白色区域即为提取出的缺陷形状。本发明检测精度高、对复杂纹理表面鲁棒性高、能够准确检测细小缺陷等优势。

Description

基于循环生成对抗网络和结构相似性的缺陷检测方法

技术领域

本发明涉及涉及机器视觉领域和工业生产领域，具体涉及一种基于循环生成对抗网络和结构相似性的缺陷检测方法。

背景技术

“目标检测”是计算机视觉(CV)领域的核心问题之一，它的任务是从给定图像或视频中定位所需寻找目标(物体)，并识别不同的目标，输出目标的类别。目标检测的应用场景非常广泛，其中被广为研究的是人脸检测、行人检测、车辆检测等。而缺陷检测是目标检测的一种具体应用，其待检测的目标为产品表面可能存在的缺陷。长期以来，工业缺陷检测依靠人工完成。但依靠人工来检测表面缺陷是费时、费力且带有强烈主观偏见的，其效率和准确率均得不到很好的保障。因而利用计算机来自动化缺陷检测一直是计算机视觉领域的一大研究热点。基于计算机视觉的缺陷检测的方法可以分为传统方法和深度学习方法方法。缺陷检测传统方法包括支持向量机、朴素贝叶斯、马尔可夫随机场等，而深度学习方法大多基于卷积神经网络(CNN)，如SSD、YOLO、FCN、U-Net等。相较于传统方法，基于卷积神经网络的缺陷检测算法在大多数场景下能够提取到更深层次的缺陷特征，因而往往优于传统方法。所以基于卷积神经网络的缺陷检测检测成为目前主流的目标检测算法，发挥了出色的性能。然而目前缺陷检测的深度学习方法仍具有一些不足：1.大部分需要带标注(图像级或像素级)的训练数据，而标注大量数据无疑也是费时费力且主观的；2.检测准确度不高或检测错误率过高，难以满足实际应用的要求。

由于工业表面缺陷检测仍主要靠人工完成，存在劳动强度大、效率低、受主观性影响大等问题，不能很好地满足工业生产的高效率和高精度需求，而大多数基于机器视觉的缺陷检测方法也存在需要人工标注大量训练数据、训练耗时长、对纹理杂乱的表面检测效果差的不足。

发明内容

有鉴于此，本发明的目的在于提供一种基于循环生成对抗网络和结构相似性的缺陷检测方法，检测精度高、对复杂纹理表面鲁棒性高、能够准确检测细小缺陷等优势。

为实现上述目的，本发明采用如下技术方案：

一种基于循环生成对抗网络和结构相似性的缺陷检测方法，包括以下步骤：

步骤S1：获取缺陷图片并预处理，作为训练数据集；

步骤S2：构建CycleGAN模型，并基于训练数据集训练，得到一个将缺陷图片映射为无缺陷图片的模型；

步骤S3：将待检测图片输入训练后的CycleGAN模型，使用结构相似性算法对比原图和修复图的差异，获取差异二值图；

步骤S4：对差异二值图进行连通域降噪和形态学处理，原始图像存在缺陷，则该二值图中白色区域即为提取出的缺陷形状。

进一步的，所述CycleGAN模型包括正-＞负生成器、负-＞正的生成器、正样本判别器和负样本判别器。

进一步的，所述生成器采用下采样+残差块+上采样的结构，并在输入图像下采样至256通道后加入两个Involution块，分别位于残差块的两端。

进一步的，所述判别器首先采用四个卷积块对输入图像下采样，4个卷积块的核尺寸均为4×4，输入图像经过四次卷积之后通道数增加至512，然后再经过一次卷积将通道数减少至1，最后使用全局平均池化压缩为1×1的标量，该标量取值范围为[0，1]，表示判别器对该输入图像为真实样本的置信度。

进一步的，所述CycleGAN模型损失函数包括对抗性L_GAN、损失循环一致性损失L_cycle和同一性损失L_identity。

进一步的，所述L_GAN包括L_{GAN_G}和L_{GAN_D}，分别表示生成器G和判别器D的优化目标，均使用L2损失度量，如式(1)、(2)所示，

L_{GAN_G}＝∑_p∈P(D_n(G_p2n(p))-1)²+∑_n∈N(D_p(G_n2p(n))-1)² (1)

L_{GAN_D}＝∑_p∈P[(p-1)²+(D_n(G_p2n(p))-0)²]+∑_n∈N[(n-1)²+(D_p(G_n2p(n))-0)²] (2)

其中0和1分别代表全0张量和全1张量。

进一步的，使用了一种损失函数替换策略，即在前k个epoch时使用SSIM损失实现L_cycle，而在之后的epoch种将损失函数替换为L1损失，以获得与原图相近光照和颜色细节：

进一步的，所述L_identity采用与L_cycle同样的度量策略，即先用SSIM损失后用L1损失，于是同一性损失描述为：

于是生成器G和判别器D的损失函数分别为：

L_G＝L_{GAN_G}+αL_cycle+βL_identity (5)

L_D＝L_{GAN_D} (6)

其中α和β为超参数。

进一步的，所述结构相似性算法，具体为：

定义三个对比函数：亮度对比函数l(x，y)、对比度对比函数c(x，y)、结构对比函数s(x，y)：

其中μ_x、σ_x、σ_xy分别表示x的均值、x的方差、x和y的协方差；

设C₃＝C₂/2，则SSIM指数函数表示为：

上述公式中，均值、方差和协方差的计算都在滑窗内的局部区域完成，并且逐像素的遍历整幅图片最后全局的SSIM得分为所有滑窗内局部区域得分的平均值。

本发明与现有技术相比具有以下有益效果：

本发明无需人工标注、模型收敛速度快、检测准确率高、在不同背景下鲁棒性强等特点，可以较大程度上提升缺陷检测的效率

附图说明

图1是本发明一实施例中训练阶段示意图；

图2是本发明一实施例中生成器G的示意图；

图3是本发明一实施例中判别器D的示意图；

图4是本发明一实施例中Involution的原理图；

图5是本发明一实施例中数据集；

图6是本发明一实施例中存放训练和测试数据集的文件夹结构；

图7是本发明一实施例中测试准确率和错误率随训练epoch变化趋势；

图8是本发明一实施例中模型训练50epoch时检测效果。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

本发明提供一种基于循环生成对抗网络和结构相似性的缺陷检测方法，包括以下步骤：

步骤S1：获取缺陷图片并预处理，作为训练数据集；

参考图1，为训练阶段示意图，在本实施例中，其中P和N分别为训练集中的正样本和负样本，P和N分别是原始样本P和N经过一次映射获得的假样本，

和

分别是

和

经过一次反向映射获得的假样本。G_p2n和分别为正-＞负和负-＞正的生成器，D_p和D_n分别为正样本判别器和负样本判别器。L_GAN为对抗性损失，用以衡量生成的假样本与真实样本的差异。L_cycle为循环一致性损失，用以衡量真实样本依次经过两个生成器映射后获得的图像与原始图像的差异。L_identity为同一性损失，用以降低将无缺陷样本错误检测为有缺陷样本的概率。

在本实施例中，生成器G采用经典的U-net结构，即下采样+残差块+上采样的结构，如图2所示。其中Involution算子(详见5)是CVPR2021中新提出的一种网络算子，其具有通道无关性、空间特异性两大特性(与卷积相反)，可以更好地适应不同空间位置提取不同的特征，且其在输入通道较大时可以有效减少网络参数量。由于在表面缺陷检测这一实际应用中图像的缺陷区域和非缺陷区域一般具有不一样的局部特征，因此本方法中生成器网络在输入图像下采样至256通道后加入两个Involution块，分别位于残差块的两端，Involution算子独特的空间特异性有助于更好地提取出缺陷特征，以提升生成器模型的性能。

在本实施例中，判别器D首先采用四个卷积块对输入图像下采样，4个卷积块的核尺寸均为4×4，如图3所示。输入图像经过四次卷积之后通道数增加至512，然后再经过一次卷积将通道数减少至1，最后使用全局平均池化压缩为1×1的标量，该标量取值范围为[0，1]，表示判别器对该输入图像为真实样本的置信度。

在本实施例中，CycleGAN模型损失函数包括对抗性L_GAN、损失循环一致性损失L_cycle和同一性损失L_identity。

L_GAN在代码实现上分为L_{GAN_G}和L_{GAN_D}，分别表示生成器G和判别器D的优化目标，均使用L2损失度量，如式(1)、(2)所示，其中0和1分别代表全0张量和全1张量。生成器希望生成的假样本能够欺骗判别器，即输入假样本让判别器输出尽可能接近1，而判别器希望尽可能区分真实样本和生成器生成的假样本，因此对于真实样本判别器希望自己输出尽可能接近1，而对于假样本输出尽可能接近0。

L_{GAN_G}＝∑_p∈P(D_n(G_p2n(p))-1)²+∑_n∈N(D_p(G_n2p(n))-1)² (1)

L_cycle为循环一致性损失，我们希望真实样本在依次经过一次正向映射和一次反向映射之后获得的样本与原样本尽可能一致，即G_n2p(G_p2n(p))≈p、G_p2n(G_n2p(n))≈n。

SSIM损失具有收敛速度快的优势，但单纯使用SSIM作为损失度量容易导致生成图片亮度的改变和颜色的偏差，这种偏差会引入不必要的噪声，对后续缺陷的检测和提取造成负面影响。本实施例中，使用了一种损失函数替换策略，即在前k个epoch时使用SSIM损失实现Lcycle，以获取较快的网络收敛速度。而在之后的epoch种将损失函数替换为L1损失，以获得与原图相近光照和颜色细节。其中k被经验性地设置为10。

除此之外，为了降低检测的错误率(将无缺陷样本检测为缺陷样本的概率)，本方法还使用了一项重要的损失函数L_identity，即同一性损失。当无缺陷的正样本P被输入生成器G_n2p时，P无需进行任何改动，因此我们希望重建获得的样本P与P尽可能接近，以避免引入不必要的干扰噪声，造成错误检测。L_identity采用与L_cycle同样的度量策略，即先用SSIM损失后用L1损失，于是同一性损失描述为：

于是生成器G和判别器D的损失函数分别为：

L_G＝L_{GAN_G}+αL_cycle+βL_identity (5)

L_D＝L_{GAN_D} (6)

其中α和β为超参数。优选的，设置α＝10，β＝5。

在本实施例中，把与物体结构相关的亮度和对比度作为图像中结构信息的定义。为此，定义三个对比函数：亮度对比函数l(x，y)、对比度对比函数c(x，y)、结构对比函数s(x，y)。

其中μ_x、σ_x、σ_xy分别表示x的均值、x的方差、x和y的协方差。为简化形式，设C₃＝C₂/2，则SSIM指数函数表示为：

在图像质量评估之中，局部求SSIM指数的效果要好于全局。第一，图像的统计特征通常在空间中分布不均；第二，图像的失真情况在空间中也是变化的；第三，在正常视距内，人们只能将视线聚焦在图像的一个区域内，所以局部处理更符合人类视觉系统的特点；第四，局部质量检测能得到图片空间质量变化的映射矩阵，结果可服务到其他应用中。因而在上述公式中，均值、方差和协方差的计算都在滑窗内的局部区域完成，并且逐像素的遍历整幅图片。最后全局的SSIM得分为所有滑窗内局部区域得分的平均值。

对于SSIM在本缺陷检测方法中的应用来说，SSIM滑窗大小也是超参数之一，优选的，滑窗大小设置为9。

在本实施例中，在CVPR2021上，基于空间特异性和通道无关性的全新算子Involution被提出了。相比于传统的卷积，involution巧妙地将网络计算量分为kemelgeneration和Multiply-Add两部分进行计算，明显改善了传统CNN的参数量和计算量。

图4为Involution的原理图，与卷积核不同，Involution核H是基于单个像素的而不是其与相邻像素的关系，其形状取决于输入特征图X的尺寸，核生成函数根据特定像素生成内卷核，即→K×K×。于是核H定义为：

其中W₁和W₀代表线性变换，W₀将1×1×C的特定像素的表示降维到1×1×C/r(r代表减少比率)，σ代表的是BN和非线性激活。W₁将1×1×C/r变化为K×K×G，最后使用生成的内卷核对特定像素区域进行卷积操作。

对于表面缺陷检测，使用Involution算子可以满足在图像不同区域(缺陷区域和非缺陷区域)不同视觉能力的需求，使模型提取的缺陷轮廓更接近于真实缺陷轮廓，且有助于降低将与缺陷特征相似的非缺陷区域误检为缺陷的概率。

实施例1：

在本实施例中，计算机环境如下，CPU：Intel(R)Xeon(R)CPU E5-2620 v4@2.10GHz，GPU：GeForce GTX 1080Ti，Memory：128G，Python：3.6.13，Pytorch：1.7.1。

1、数据集制作

数据集来源于公用数据集DAGM2007中的Class6(图5中a、图5中b)和Class7(图5中c、图5中d)，DAGM2007是工业表面缺陷检测常用数据集，共有10个不同类别，每个类别分训练集和测试集，所有图片均为png格式的灰度图像，512×512像素。

在本实施例中，所有训练图片和测试图片在被输入模型前均被resize为256×256大小，并以0.5为均值和标准差进行数据标准化，以此加快模型的收敛速度。此外，训练图片还会进行随机裁剪和随机翻转，以提升模型的鲁棒性。

本方法所用数据集的大小如表1所示：

表1

存放训练和测试数据集的文件夹结构如图6所示：

定义训练超参数

在本方法中，需要使用一些调整一些超参数以获取较好的检测效果。经过大量对比实验，本方法中使用的一些主要超参数如下。学习率：0.0002，学习率衰减率：0.98，BatchSize：1，epoch：100，图像尺寸：256，ssim窗口大小：9。

本方法使用argparse模块来定义训练所需的超参数，argparse是python内置的标准命令行解析模块，它可以让用户直接从命令行中传入代码运行所需的参数，方便代码的调试。

3、模型训练

定义好各类超参数之后开始训练模型，训练命令如下：

python train.py--class_name Class6--ssimL1--involution--identity_loss--min_area 250

在训练最后部分的输出如下：

……

Epoch：95 finish.Dn loss：0.16，Dp loss：0.24，G loss：1.48，lr：0.000029

Epoch：96 finish.Dn loss：0.15，Dp loss：0.24，G loss：1.65，lr：0.000028

Epoch：97 finish.Dn loss：0.16，Dp loss：0.25，G loss：1.55，lr：0.000028

Epoch：98 finish.Dn loss：0.17，Dp loss：0.24，G loss：1.43，lr：0.000027

Epoch：99 finish.Dn loss：0.16，Dp loss：0.24，G loss：1.47，lr：0.000027

Epoch：100 finish.Dn loss：0.17，Dp loss：0.25，G loss：1.43，lr：0.000026

其中，Dn loss表示判别器Dn的损失，Dp loss表示判别器Dp的损失，G loss表示G_n2p和G_p2n的损失之和。G loss可以衡量真实图像和生成图像的相似程度，但并不是越低越好，因为过低的G loss可能导致模型对训练集的过拟合，反而降低模型在测试集上的表现。由输出可见，随着训练epoch的增加，生成器损失和判别器损失均没有发生较大的波动，这表明此时生成器和判别器已经达到平衡状态。

本方法的模型共训练迭代100次，用时约3小时。

4、模型测试

加载保存的模型进行测试，测试准确率和错误率随训练epoch变化趋势如图7所示；模型训练50epoch时检测效果如图8所示，其中(a)为测试图像、(b)为修复图像、(c)为提取的缺陷、(d)为标签。可以看到，本方法只需训练50-60个epoch(约1.5小时)就可以达到较好的图像修复和缺陷检测效果，较快的训练速度有利于快速地部署于实际应用场景。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，包括以下步骤：

步骤S1:获取缺陷图片并预处理，作为训练数据集；

步骤S2:构建CycleGAN模型，并基于训练数据集训练，得到一个将缺陷图片映射为无缺陷图片的模型；

步骤S3:将待检测图片输入训练后的CycleGAN模型，使用结构相似性算法对比原图和修复图的差异，获取差异二值图；

步骤S4:对差异二值图进行连通域降噪和形态学处理，原始图像存在缺陷，则该二值图中白色区域即为提取出的缺陷形状。

2.根据权利要求1所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，所述CycleGAN模型包括正->负生成器、负->正的生成器、正样本判别器和负样本判别器。

3.根据权利要求2所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，所述生成器采用下采样+残差块+上采样的结构，并在输入图像下采样至256通道后加入两个Involution块，分别位于残差块的两端。

4.根据权利要求2所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，所述判别器首先采用四个卷积块对输入图像下采样，4个卷积块的核尺寸均为4×4，输入图像经过四次卷积之后通道数增加至512，然后再经过一次卷积将通道数减少至1，最后使用全局平均池化压缩为1×1的标量，该标量取值范围为[0,1]，表示判别器对该输入图像为真实样本的置信度。

5.根据权利要求2所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，所述CycleGAN模型损失函数包括对抗性L_GAN、损失循环一致性损失L_cycle和同一性损失L_identity。

6.根据权利要求5所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，所述L_GAN包括L_{GAN_G}和L_{GAN_D}，分别表示生成器G和判别器D的优化目标，均使用L2损失度量，如式(1)、(2)所示，

L_{GAN_G}＝∑_p∈P(D_n(G_p2n(p))-1)²+∑_n∈N(D_p(G_n2p(n))-1)² (1)

其中0和1分别代表全0张量和全1张量。

7.根据权利要求5所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，使用了一种损失函数替换策略，即在前k个epoch时使用SSIM损失实现L_cycle，而在之后的epoch种将损失函数替换为L1损失，以获得与原图相近光照和颜色细节：

8.根据权利要求7所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，所述L_identity采用与L_cycle同样的度量策略，即先用SSIM损失后用L1损失，于是同一性损失描述为：

于是生成器G和判别器D的损失函数分别为：

L_G＝L_{GAN_G}+αL_cycle+βL_identity (5)

L_D＝L_{GAN_D} (6)

其中α和β为超参数。

9.根据权利要求1所述的基于循环生成对抗网络和结构相似性的缺陷检测方法，其特征在于，所述结构相似性算法，具体为：

定义三个对比函数：亮度对比函数l(x,y)、对比度对比函数c(x,y)、结构对比函数s(x,y)：

设C₃＝C₂/2，则SSIM指数函数表示为：