CN114742799B

CN114742799B - 基于自监督异构网络的工业场景未知类型缺陷分割方法

Info

Publication number: CN114742799B
Application number: CN202210401019.1A
Authority: CN
Inventors: 周瑜; 蔡雨萱; 罗东亮; 周欢; 白翔; 郑增强; 刘荣华
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2022-04-18
Filing date: 2022-04-18
Publication date: 2024-04-26
Anticipated expiration: 2042-04-18
Also published as: CN114742799A

Abstract

本发明公开一种基于自监督异构网络的工业场景未知类型缺陷分割方法：准备大型预训练网络并固定参数，作为教师网络；构建异构学生网络，由异构特征编码模块、特征融合模块和分割模块组成；训练异构学生网络，将合成异常图像输入至教师和异构学生网络中，一方面，约束学生网络在合成图像的正常区域提取的多尺度特征与教师网络相应尺度特征相似，另一方面，约束分割模块产生的分割概率图准确回归合成的异常区域；测试阶段通过教师和异构学生网络提取的相应尺度的特征图的差异和分割概率图得到异常得分图，设置合适的阈值二值化得到异常分割图。本发明通过对特征编码模块的相关设计和自监督的引入，实现了对图像异常区域的精确分割。

Description

基于自监督异构网络的工业场景未知类型缺陷分割方法

技术领域

本发明属于计算机视觉技术领域，更具体地，涉及一种基于自监督异构网络的工业场景未知类型缺陷分割方法。

背景技术

异常检测，旨在构建模型使其能够根据预先定义的正常模式检测待检样本中的视觉异常。这一技术已在许多实际的应用领域引起了广泛关注，例如工业制造、医学影像、视频监控等。然而，异常检测任务还存在着巨大挑战，如异常样本难以获取，异常区域可视性低，异常模式具有未知性等，因此该任务通常要求模型能在基于正常样本学习的情况下，对待检样本中的潜在异常进行识别和分割。

现有的主流方法包括基于图像重建的方法、基于特征比较的方法和自监督方法。基于图像重建的方法假设在正常样本上训练的模型仅能重建出正常样本，推理阶段根据重建样本和待检样本的重建误差进行异常分割。基于特征比较的方法根据教师网络和学生网络提取的特征的差异分割异常，两者在正常区域编码的特征趋于一致，而在异常区域将有明显区别。虽然近年来无监督方法已取得了长足进步，但其会对异常区域边缘周围像素产生漏检和误检，导致模型分割性能不佳。自监督方法基于正常样本生成异常数据，并自动产生监督标签，然后通过对比学习或有监督的思想训练得到分割模型，自监督方法不仅省去了人工标注的成本，还展现出了优异的分割潜力。

通过对现有方法的分割结果的深入观察，提出影响分割精度的关键因素是异常边缘周围像素的不确定度(Uncertainty AroundBoundary,UAB)。UAB表示模型对于异常边缘周围像素的预测会展现出较大的不确定度，导致异常边缘周围像素经常会被误检或漏检，这种现象严重影响了分割精度，但是在现有方法中很少被讨论。

发明内容

针对现有技术的以上缺陷或改进需求，本发明提供了一种基于自监督异构网络的工业场景未知类型缺陷分割方法，其目的在于对异常区域进行精细化分割，提升现有方法的分割精度。为实现上述目的，本发明提供如下技术方案：

一种基于自监督异构网络的工业场景未知类型缺陷分割方法，包括以下步骤：

步骤S1，准备一个在ImageNet预训练完成的大型预训练网络作为教师网络(1)，在后续步骤中教师网络(1)的参数都被固定；

步骤S2，构建异构学生网络(2)。异构学生网络(2)由异构特征编码模块、特征融合模块和分割模块组成。其中异构特征编码模块由三个独立的特征提取器组成，用于提取图像的三种不同尺度的特征，三个特征提取器分别命名为底层特征提取学生网络，中层特征提取学生网络和高层特征提取学生网络。特征融合模块用于将异构特征编码模块产生的三种不同尺度特征进行融合，然后将融合后的特征输入分割模块中，分割模块输出分割概率图。

步骤S3，训练异构学生网络(2)。首先合成一些异常区域粘贴到训练集中的正常图像上，得到合成图像(3)。然后，将其同时输入到教师网络(1)和异构学生网络(2)中，一方面，约束异构学生网络(2)在合成图像(3)的正常区域提取的多尺度特征与教师网络(1)的相应尺度特征相似；另一方面，约束由分割模块产生的分割概率图可以准确回归合成的异常区域，使其对异常区域边缘敏感。

步骤S4，测试阶段。将含有异常区域的测试图像(6)同时输入教师网络(1)和异构学生网络(2)中。一方面，通过异常得分函数(7)计算两者提取的相应尺度的特征图在特征空间的距离，得到异常差异图；另一方面，通过分割模块预测得到分割概率图。通过融合异常差异图和分割概率图得到最终的异常得分图，最后通过设置合适的阈值对异常得分图进行二值化，得到异常分割图。

优选地，异构学生网络(2)的异构特征编码模块中的特征提取器可以采用任意现有的通用特征提取模型。本发明中的三个特征提取器都去除了现有通用特征提取模型中的池化等下采样操作，并对特征提取模型中卷积层的步长进行设计，以降低特征提取学生网络的感受野，保证底层、中层及高层特征提取学生网络输出特征图尺寸均为输入图像的1/2，通道数分别为C₁,C₂,C₃，其中C₁,C₂,C₃分别为预设值。去除通用特征提取模型中的下采样操作，降低特征提取学生网络的感受野，限制输出特征图分辨率的动机是抑制UAB现象，分析如下：

UAB代表着模型对异常区域边缘周围的像素的预测具有较大的不确定性，而造成UAB的关键原因在于卷积神经网络的感受野。卷积神经网络提取的特征图中的每一个特征向量都代表着对原始图像中某一块区域的感知，若特征向量编码的区域中同时包含了正常像素和异常像素，将会导致在通过特征图计算异常差异图进行异常分割时，模型对该区域产生较大的不确定度，因此区域内的像素容易被漏检或误检。网络的感受野越大，同时编码正常像素和异常像素的特征向量越多，UAB现象越明显。

优选地，异构学生网络(2)的特征融合模块用于平滑和融合异构特征编码模块提取的特征，具体包括：

步骤S2-1，使用1×1卷积对高层特征提取学生网络输出的1/2分辨率的特征图进行平滑其中C为预设值。

步骤S2-2，使用1×1卷积对中层特征提取学生网络输出的1/2分辨率的特征图进行平滑并将它与步骤S2-1得到的特征图逐像素相加。

步骤S2-3，使用1×1卷积对底层特征提取学生网络输出的1/2分辨率的特征图进行平滑并将它与步骤S2-2得到的特征图逐像素相加。

步骤S2-4，将步骤S2-1，步骤S2-2，步骤S2-3得到的特征图在通道维度上进行堆叠R^(C+C+C)→R^3C。

优选地，异构学生网络(2)的分割模块用于预测得到分割概率图，具体包括：

步骤S2-5，使用卷积核为3×3，步长为1的卷积层将步骤S2-4得到的融合特征进行降维并使用BatchNorm层进行归一化，ReLu进行激活，得到分辨率为原图大小1/2，通道数为C₄的特征。

步骤S2-6，使用卷积核为2×2，步长为2的反卷积层将步骤S2-5得到的特征图进行上采样，并使用BatchNorm层进行归一化，ReLu进行激活，得到分辨率为原图大小，通道数为C₄的特征。

步骤S2-7，使用1×1卷积对步骤S2-6得到的特征进行逐像素的预测并使用Sigmoid函数激活，得到预测的分割概率图。

优选地，在异构学生网络(2)的训练阶段，输入的训练图像是合成的异常图像(3)，合成数据的步骤可分为三步。首先，生成两种类型的基本异常模式，一种是随机生成的形状，如线条、矩形等，另一种是从正常图像中随机裁剪的补丁。然后，使用了两种操作来增加异常的多样性：1)使用弹性形变对基本异常进行形状变换，增加异常的形状多样性，2)通过颜色转换调整异常的亮度、对比度、饱和度和清晰度，增加异常的颜色多样性。最后，将这些异常粘贴到正常图像上，为了避免边界信息泄露，还采用了高斯模糊来平滑合成异常的边界。

优选地，在异构学生网络(2)的训练阶段，为了约束异构特征编码模块提取的不同尺度的特征与教师网络(1)相应尺度的特征在正常区域保持一致，优化的目标函数(4)为：

其中分别表示高层、中层和底层特征提取学生网络提取的合成的异常图像在正常区域的特征，/>表示教师网络(1)的相应尺度特征，up表示上采样操作，L₁表示所比较的两个特征图之间的平均绝对误差，SSIM表示所比较的两个特征图之间的结构相似性，SSIM取值越趋近于1表示两个特征图之间越相似。

优选地，在异构学生网络(2)的训练阶段，为了使分割模块网络可准确的分割出异常区域，本发明使用交叉熵损失约束分割概率图和像素级异常标签之间的距离，同时，由于正常像素远多于异常像素，为了克服两者数量的不均衡问题，本发明使用了难样本挖掘策略。因此，本发明中交叉熵损失(5)定义为：

其中S为从分割概率图中采样的子集，采样的正常像素数量与异常像素数量的比例为3:1，x_i为分割概率图在位置索引i处预测的异常概率值，y_i为对应的异常标签，本发明中将异常像素的标签设置为1。

优选地，在测试阶段，通过得分函数(7)计算教师网络(1)提取的不同尺度特征图与异构学生网络(2)特征编码模块提取的相应尺度的特征图之间的距离，得到异常差异图。得分函数(7)为：

其中M_l,M_m,M_h分别表示底层、中层及高层的师生网络的异常差异图，C表示特征图的通道数，分别表示教师网络(1)和异构学生网络(2)提取的底层、中层及高层特征图的绝对距离，SSIM表示结构相似性。对于正常像素，得分函数(7)将计算出较小的异常得分，反之对于异常像素，异常得分将较大。

优选地，在测试阶段，本发明将异常差异图和分割概率图相加得到最终的异常得分图。其中分割概率图与原始图像尺寸一致，异常差异图分辨率为原始图像尺寸的1/2，因此需要对各层级的异常差异图进行上采样操作。此外，为了得到二值分割结果，还需要对异常得分图设置合适的阈值进行二值化。

总体而言，通过本发明所构思的以上技术方案与现有技术相比，具有如下有益效果：

(1)本发明提出了一种新颖的异构学生网络，异构学生网络由异构特征编码模块、特征融合模块和分割模块组成。其中异构特征编码模块中包含了三个不同的特征提取学生网络，这三个特征提取学生网络均以现有的通用特征提取模型为基准，通过去除通用特征提取模型的池化等下采样操作，降低了特征提取学生网络的感受野，限制了输出特征图分辨率。这种设计可从三个角度提升模型的分割精度。第一，相比现有方法，对于单独的每个特征提取学生网络而言，降低其感受野有助于抑制UAB现象；第二，不同层级的特征提取学生网络对于不同模式的异常的检出各有优势，高层的网络对于分割结构性较强的图像中存在的异常十分有效，低层的网络则更加适用于分割纹理类图像中的潜在异常，多尺度的设计提升了模型的泛化性。第三，对于异构特征编码模块整体而言，由于感受野越大UAB现象将越明显，此时低层的网络可对高层网络形成抑制作用，增加高层网络编码区域中正常区域的置信度，从而抑制UAB问题。

(2)本发明还引入了自监督学习进一步缓解UAB。通过合成的异常数据显式的约束学生网络，使其对异常边缘敏感。同时，为了防止以往数据合成方法可能造成的边缘泄露问题，也为了保证合成异常数据的多样性，本发明还对异常数据合成方式进行了相关设计。

附图说明

图1是本发明提供的基于自监督异构学生网络进行异常分割的整体流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明提供了一种基于自监督异构网络的工业场景未知类型缺陷分割方法，如图1所示，包括以下步骤：

主要有三个实现部分：1)异构学生网络；2)合成数据；3)目标函数和打分函数。接下来对本发明中步骤进行详细说明。

1.异构学生网络

本发明实施例中异构学生网络(2)由异构特征编码模块、特征融合模块和分割模块组成。其中异构特征编码模块由三个不同的特征提取学生网络组成，其中底层特征提取学生网络以ResNet50的结构为基准，去除其中的池化操作，并只保留ResNet50中第一层(Stage1)的下采样操作，将ResNet50中其余步长为2的卷积层的步长都调整为1以避免下采样，然后截断到ResNet50的的第二层(Stage2)，输出特征图的尺寸为输入图像的1/2，通道数为256。

类似的，中层和高层特征提取学生网络同样以ResNet50的结构为基准，去除其中的池化操作，并只保留ResNet50中第一层(Stage1)的下采样操作，将ResNet50中其余步长为2的卷积层的步长都调整为1以避免下采样，然后分别截断到ResNet50的的第三层(Stage3)和第四层(Stage4)。中层和高层特征提取学生网络输出特征图的尺寸均为输入图像的1/2，通道数分别为512和1024。

异构学生网络(2)的特征融合模块用于平滑和融合学生网络提取的特征，做法如下，本发明实施例将C设置为256：

步骤S2-1，使用1×1卷积对高层特征提取学生网络输出的1/2分辨率的特征图进行平滑R¹⁰²⁴→R^C。

步骤S2-2，使用1×1卷积对中层特征提取学生网络输出的1/2分辨率的特征图进行平滑R⁵¹²→R^C，并将它与步骤S2-1得到的特征图逐像素相加。

步骤S2-3，使用1×1卷积对底层特征提取学生网络输出的1/2分辨率的特征图进行平滑R²⁵⁶→R^C，并将它与步骤S2-2得到的特征图逐像素相加。

异构学生网络(2)的分割模块用于预测得到分割概率图，具体包括，本发明实施例中将C₄设置为64：

2.合成数据

本发明实施例合成数据的步骤分为三步。首先，生成两种类型的基本异常模式，一种是随机生成的形状，如线条、矩形等，另一种是从正常图像中随机裁剪的补丁。然后，使用了两种操作来增加异常的多样性：1)使用弹性形变对基本异常进行形状变换，增加异常的形状多样性，2)通过颜色转换调整异常的亮度、对比度、饱和度和清晰度，增加异常的颜色多样性。最后，将这些异常粘贴到正常图像上，为了避免边界信息泄露，还采用了高斯模糊来平滑合成异常的边界。

3.目标函数和打分函数

本发明实施例在异构学生网络(2)的训练阶段，一方面，约束异构学生网络(2)在合成图像(3)的正常区域提取的多尺度特征与教师网络(1)的相应尺度特征相似；另一方面，约束由分割模块产生的分割概率图可以准确回归合成的异常区域，使其对异常区域边缘敏感。

为了约束异构特征编码模块提取的不同尺度的特征与教师网络(1)相应尺度的特征在正常区域保持一致，优化的目标函数(4)为：

为了使分割模块产生的分割概率图可以准确回归合成的异常区域，本发明使用交叉熵损失约束分割概率图和像素级异常标签之间的距离，同时，由于正常像素远多于异常像素，为了克服两者数量的不均衡问题，本发明使用了难样本挖掘策略。因此，本发明中交叉熵损失(5)定义为：

本发明实施例在异构学生网络(2)的测试阶段，通过异常差异图和分割概率图相加得到最终的异常得分图。其中通过得分函数(7)计算教师网络(1)提取的不同尺度特征图与异构学生网络(2)特征编码模块提取的相应尺度的特征图之间的距离，得到异常差异图。得分函数(7)为：

分割概率图由分割模块输出得到，其尺寸与原始图像尺寸一致，而异常差异图分辨率为原始图像尺寸的1/2，因此需要对各层级的异常差异图进行上采样操作。此外，为了得到二值分割结果，还需要对异常得分图设置合适的阈值进行二值化。

本发明提出了一种基于自监督异构网络的工业场景未知类型缺陷分割方法。通过教师网络和异构学生网络中的特征编码模块提取的特征计算得到异常差异图，通过分割模块产生分割概率图，然后融合这两个结果得到最终的异常得分图。为了抑制UAB现象和提升模型的泛化性，本发明对异构特征编码模块的结构进行了针对性设计，可大幅提升模型的分割性能。同时本发明还引入了自监督的思想，通过合成的异常数据显式的约束学生网络，使其产生的分割概率图对异常边缘敏感，从而进一步抑制了UAB现象。本发明通过对异构特征编码模块的相关设计和自监督的引入，实现了对图像中异常区域的精确分割。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于自监督异构网络的工业场景未知类型缺陷分割方法，其特征在于，包括以下步骤：

步骤S1，准备一个在ImageNet预训练完成的大型预训练网络作为教师网络，在后续步骤中教师网络的参数都被固定；

步骤S2，构建异构学生网络，异构学生网络由异构特征编码模块、特征融合模块和分割模块组成，其中异构特征编码模块由三个独立的特征提取器组成，用于提取图像的三种不同尺度的特征，三个特征提取器分别命名为底层特征提取学生网络，中层特征提取学生网络和高层特征提取学生网络，特征融合模块用于将异构特征编码模块产生的三种不同尺度特征进行融合，然后将融合后的特征输入分割模块中，分割模块输出分割概率图；异构学生网络的特征融合模块用于平滑和融合异构特征编码模块提取的特征，具体包括：步骤S2-1，使用1×1卷积对高层特征提取学生网络输出的1/2分辨率的特征图进行平滑其中C为预设值；步骤S2-2，使用1×1卷积对中层特征提取学生网络输出的1/2分辨率的特征图进行平滑/>并将它与步骤S2-1得到的特征图逐像素相加；步骤S2-3，使用1×1卷积对底层特征提取学生网络输出的1/2分辨率的特征图进行平滑/>并将它与步骤S2-2得到的特征图逐像素相加；步骤S2-4，将步骤S2-1，步骤S2-2，步骤S2-3得到的特征图在通道维度上进行堆叠R^(C+C+C)→R^3C；

步骤S3，训练异构学生网络，首先合成一些异常区域粘贴到训练集中的正常图像上，得到合成图像，然后将其同时输入到教师网络和异构学生网络中，一方面，约束异构学生网络在合成图像的正常区域提取的多尺度特征与教师网络的相应尺度特征相似；在异构学生网络的训练阶段，为了约束异构特征编码模块提取的不同尺度的特征与教师网络相应尺度的特征在正常区域保持一致，优化的目标函数为：

其中分别表示高层、中层和底层特征提取学生网络提取的合成的异常图像在正常区域的特征，/>表示教师网络的相应尺度特征，up表示上采样操作，L₁表示所比较的两个特征图之间的平均绝对误差，SSIM表示所比较的两个特征图之间的结构相似性，SSIM取值越趋近于1表示两个特征图之间越相似；另一方面，约束由分割模块产生的分割概率图可以准确回归合成的异常区域，使其对异常区域边缘敏感；

步骤S4，测试阶段，将含有异常区域的测试图像同时输入教师网络和异构学生网络中，一方面，通过异常得分函数计算两者提取的相应尺度的特征图在特征空间的距离，得到异常差异图；另一方面，通过分割模块预测得到分割概率图，通过融合异常差异图和分割概率图得到最终的异常得分图，最后通过设置合适的阈值对异常得分图进行二值化，得到异常分割图。

2.如权利要求1所述的基于自监督异构网络的工业场景未知类型缺陷分割方法，其特征在于，异构学生网络的异构特征编码模块中的特征提取器为：在现有通用特征提取模型中的池化下采样操作，并对特征提取模型中卷积层的步长进行设计，以降低特征提取学生网络的感受野，保证底层、中层及高层特征提取学生网络输出特征图尺寸均为输入图像的1/2。

3.如权利要求1或2所述的基于自监督异构网络的工业场景未知类型缺陷分割方法，其特征在于，异构学生网络的分割模块用于预测得到分割概率图，具体包括：

步骤S2-5，使用卷积核为3×3，步长为1的卷积层将步骤S2-4得到的融合特征进行降维并使用BatchNorm层进行归一化，ReLu进行激活，得到分辨率为原图大小1/2，通道数为C₄的特征；

步骤S2-6，使用卷积核为2×2，步长为2的反卷积层将步骤S2-5得到的特征图进行上采样，并使用BatchNorm层进行归一化，ReLu进行激活，得到分辨率为原图大小，通道数为C₄的特征；

4.如权利要求1或2所述的基于自监督异构网络的工业场景未知类型缺陷分割方法，其特征在于，在异构学生网络的训练阶段，输入的训练图像是合成的异常图像，合成数据的步骤可分为三步，首先生成两种类型的基本异常模式，一种是随机生成的形状，另一种是从正常图像中随机裁剪的补丁，并使用两种操作来增加异常的多样性：1)使用弹性形变对基本异常进行形状变换，增加异常的形状多样性，2)通过颜色转换调整异常的亮度、对比度、饱和度和清晰度，增加异常的颜色多样性，最后，将这些异常粘贴到正常图像上。

5.如权利要求1或2所述的基于自监督异构网络的工业场景未知类型缺陷分割方法，其特征在于，在异构学生网络的训练阶段，使用交叉熵损失约束分割概率图和像素级异常标签之间的距离，并使用难样本挖掘策略，交叉熵损失定义为：

其中S为从分割概率图中采样的子集，采样的正常像素数量与异常像素数量的比例为3:1，x_i为分割概率图在位置索引i处预测的异常概率值，y_i为对应的异常标签，异常像素的标签设置为1。

6.如权利要求1或2所述的基于自监督异构网络的工业场景未知类型缺陷分割方法，其特征在于，在测试阶段，通过得分函数计算教师网络提取的不同尺度特征图与异构学生网络特征编码模块提取的相应尺度的特征图之间的距离，得到异常差异图，得分函数为：

其中M_l,M_m,M_h分别表示底层、中层及高层的师生网络的异常差异图，C表示特征图的通道数，分别表示教师网络和异构学生网络提取的底层、中层及高层特征图的绝对距离，SSIM表示结构相似性，对于正常像素，得分函数将计算出较小的异常得分，反之对于异常像素，异常得分将较大。