CN114565594A

CN114565594A - 基于软掩膜对比损失的图像异常检测方法

Info

Publication number: CN114565594A
Application number: CN202210209818.9A
Authority: CN
Inventors: 路文; 李庚桓; 梁栋; 朱振杰; 朱志强
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2022-03-04
Filing date: 2022-03-04
Publication date: 2022-05-31

Abstract

本发明公开了一种基于软掩膜对比损失的图像异常检测方法，主要解决现有技术异常检测种类少，检测精度差的问题。其方案是：利用超像素分割算法与高斯噪声对MVTec数据集进行处理，得到合成图像训练数据集；搭建由重建自编码器和掩膜自编码器组成的异常检测模型，并使用L2误差损失作为掩膜自编码器的损失函数，使用L2误差损失与软掩膜对比损失作为重建自编码器的损失函数；利用合成图像训练数据集对其掩膜编码器和重建自编码器进行交替训练，直至各自的损失函数收敛；将测试图像输入到训练好的图像异常检测模型，得到图像异常检测与定位的结果。本发明异常识别种类多，检测精度高，可用于工业品瑕疵检测、医疗辅助诊断、视频违规行为检测。

Description

基于软掩膜对比损失的图像异常检测方法

技术领域

本发明属于图像处理技术领域，更进一步涉及一种图像异常检测方法，可应用工业品瑕疵检测、医疗辅助诊断、视频违规行为检测。

背景技术

图像异常检测是计算机视觉领域的一项用于检测和定位图像中异常或缺陷区域的任务。图像异常检测在生产生活中有着广泛的应用，比如针对电子元器件、纺织半成品等工业产品在生产过程中由于操作不当等原因而不慎出现的瑕疵品进行检测，辅助剔除残次品；帮助医务人员对病理图像进行病灶定位；也能够对监控视频当中的非法行为进行检测。由于在实际生活中，异常样本的出现概率极其微小，获取包含数量充足、类别丰富的异常样本数据集需要耗费大量的成本，因此当前图像异常检测数据集大多只包含正常样本。图像异常检测算法通常以无监督的方式在正常数据集上进行训练，尝试拟合正常样本分布，通过判断测试样本是否符合所学分布来判断图像是否存在异常。由于手工构造图像特征的方式对于图像采集环境以及图像质量极其敏感，因此，传统的图像异常检测算法始终无法达到与人工检测同等的水平。

近年来，随着深度学习技术的飞速发展，使用在数据集上训练得到的卷积神经网路提取到的特征对图像质量要求更低，因此基于深度学习的图像异常检测算法取得了长远的进步，并实现了令人满意的检测精度。

成都东方天呈智能科技有限公司在其专利申请号：202111288603.2的专利文献中公开了“一种基于生成对抗网络的异常检测系统、方法和存储介质”，该系统包含特征映射网络部分、生成器网络部分以及判别器网络部分，特征映射网络部分用于将图像样本映射成隐藏空间张量，生成器网络部分用于从隐藏空间张量中学习图像的真实分布，所述判别器网络部分用于在训练过程中区分真实图像与重构图像；该系统以重建正常样本为目标，尝试从正常样本中学习正常样本分布，使得在测试过程中，通过异常区域的高重建误差实现异常检测，但是这种仅以重建为目标函数的方法由于其生成器的重建能力过于强大，往往也能重建出异常区域，致使异常图像的重建误差同样很小，而导致异常检测效果变差。

湖南大学在其申请号：202111161614.4的专利文献中提出“一种基于混合监督学习的表面异常检测方法”。该方法首先获取表面正常的正常样本以及表面异常的异常样本进行预处理；并构建包括异常定位网络、自注意力网络和异常判别网络的神经网络模型，然后将预处理数据输入神经网络中进行训练以获取异常检测模型中进行训练以获取异常检测神经网络模型；最后将待测图像数据输入异常检测神经网络模型中，进而能够自动判别待测图像是否存在异常以及对异常区域进行定位。该方法由于以一种混合监督学习方式进行学习，将正常样本以及少量的带有粗略标注的样本作为训练集，因而对于从未在训练集中出现过的异常种类数据检测效果差。

发明内容

本发明的目的在于针对上述已有技术的不足，提出一种无监督学习的软掩膜对比损失图像异常检测方法，以提升图像异常检测效果，扩大对异常样本的识别种类。

为实现上述目的，本发明的技术方案包括如下：

(1)利用超像素分割算法和高斯噪声对MVTec工业异常检测训练数据集进行处理，得到合成图像训练数据集：

1a)将MVTec训练数据集中的所有正常图像数据利用超像素分割算法进行超像素分割，获取超像素图像与分割掩膜图；

1b)从分割后的超像素图像中随机选二十分之一数量的超像素，对其添加高斯噪声，得到合成图像，并将选取超像素对应的分割掩膜图作为合成图像的掩膜图标签；

1c)将合成图像及其对应的掩膜图标签作为训练数据集；

(2)搭建由重建自编码器和掩膜自编码器并联组成图像异常检测模型；

(3)利用合成图像训练集对图像异常检测模型进行训练：

3a)计算掩膜自编码器输出的预测掩膜图

与输入的合成异常图像对应的标签掩膜图M_{syn_ab}之间的L2误差损失L_MAE(I_{syn_ab})，并将该L2误差损失作为损失函数，利用Adam反向传播优化算法训练掩膜自编码器，完成其一次训练，其中的I_{syn_ab}表示输入的合成异常图像，

表示掩膜自编码器，ω_MAE表示掩膜自编码器的参数；

3b)对重建自编码器进行一次训练：

3b1)计算重建自编码器输出的重建图像

与原始正常图像I_nor之间的L2误差损失L_res(I_{syn_ab})，并利用一次训练得到的掩膜自编码器得到软掩膜图：

其中的

表示一次训练得到的掩膜自编码器，

表示一次训练得到的掩膜自编码器参数；

3b2)将3b1)计算得到的软掩膜图与合成异常图像逐像素相乘，获取软掩膜对比损失中的负例样本：N＝M_soft*I_{syn_ab}；

3b3)计算重建编码器的重建图像A、负例样本N、与合成图像对应的原始正常图像P三者之间的软掩膜对比损失L_CL(A,P,N)，并将L2误差损失L_res(I_{syn_ab})与软掩膜对比损失L_CL(A,P,N)的加权和作为重建自编码器的损失函数L_RAE(I_{syn_ab},P,N)，并利用Adam反向传播优化算法训练重建自编码器，完成其一次训练；

3d)交替执行3a)和3b)直至各自对应的损失函数收敛，停止迭代，得到训练好的图像异常检测模型；

(4)图像异常定位与检测：

4a)将MVTec测试数据集中的图像I作为输入，输入到训练好的图像异常检测模型中，其通过掩膜自编码器输出预测掩膜图S_mask(I)，通过重建自编码器输出重建图像，并通过L2误差S_L2(I)与对比误差S_CL(I)得到重建自编码器的异常得分图S_res(I)；

4b)通过掩膜自编码器的输出预测掩膜图S_mask(I)与重建自编码器的异常得分图S_res(I)，获取用于异常定位的像素级异常得分图S(I)：

S(I)＝S_res(I)+h_··S_mask(I)

其中的h_·为掩膜自编码器的置信度参数；

4c)在像素级异常得分图中选取其最大值，得到用于异常检测的图像级异常得分η：

其中w表示像素级异常得分图的宽，h表示像素级异常得分图的高，S(I)(i,j)表示在像素级异常得分图中第i行第j列处的异常得分；

4d)根据MVTec训练数据集原始正常图像设置阈值T，将测试图像I的图像级异常得分η与设定的阈值进行比较：

若η＞T，则图像I被判定为异常；

若η≤T，则图像I被判定为正常。

本发明与现有技术相比具有以下优点：

第一，本发明除以重建误差损失作为目标函数外，由于引入符合异常检测定义的对比损失函数，在学习正常分布的同时，远离异常分布，使得模型对于异常区域的重建效果差，增大异常区域的重建误差，提高异常检测结果。

第二，本发明由于利用具有高斯噪声超像素的合成图像训练数据集对图像异常检测模型进行训练，通过合成图像中随机生成的噪声超像素来模拟异常的多样性，扩大了对异常样本的识别种类。

附图说明

图1为本发明的实现总流程图；

图2是本发明中搭建的图像异常检测模型图；

图3是本发明中对图像异常检测模型进行训练的子流程图。

具体实施方式

下面结合附图对本发明的实施例和效果做进一步详细描述。

参照图1，本实例的实现步骤如下。

步骤1，构建合成图像训练数据集。

1.1)从公开网站获取MVTec工业异常检测数据集，并利用SEEDs超像素分割算法对MVTec训练数据集中的所有正常图像数据进行超像素分割，获取超像素图像与分割掩膜图；

1.2)从分割后的超像素图像中随机选二十分之一数量的超像素，对其添加高斯噪声，得到合成图像，并将选取超像素对应的分割掩膜图作为合成图像的掩膜图标签；

1.3)将合成图像及其对应的掩膜图标签作为训练数据集。

步骤2，搭建图像异常检测模型。

参照图2，图像异常检测模型包括重建自编码器和掩膜自编码器，其结构如下：

2.1)建立由编码器和重建解码器级联组成，且输出通道为3的重建自编码器：

所述编码器，依次由卷积层、第一最大池化层、四个残差模块和第二个最大池化层级联组成，其中，卷积层的卷积核大小为7×7，步长为2，填充像素为1；两个最大池化层的步长均为2；四个残差模块分别由3、4、6、3个残差卷积组组成，每个残差卷积组由第一卷积层、第二卷积层连接组成，这两个卷积层的卷积核大小均为3×3，步长均为1，填充像素均为1，该第二卷积层的输出特征与其输入特征逐通道相加即为残差卷积组的输出特征；

所述重建解码器，依次由六个解码模块和一个卷积模块级联组成，其中，每个解码模块由一个步长为2的双线性插值上采样层及第三卷积层、第四卷积层组成；卷积模块由两个卷积层组成，即第五卷积层和第六卷积层；该第三卷积层与第四卷积层的卷积核大小均为3×3，步长为1，填充像素为1；该第五卷积层和第六卷积层的卷积核大小均为3×3，步长为2，填充像素为1，其输出通道为3；

2.2)建立由编码器和重建解码器级联组成，且输出通道1的掩膜自编码器：

所述编码器与重建自编码器中的编码器结构相同；

所述掩膜解码器与重建自编码器中的重建自编码器结构相同，其输出通道为1；

2.3)重建自编码器与掩膜自编码器进行并联连接，组成图像异常检测模型，其中：

重建自编码器用于对输入图像进行重建，即通过编码器将输入图像编码成特征图，重建解码器将特征图解码为3通道的图像，以完成对输入图像的重建；

掩膜自编码器用于对输入图像进行异常预测，即通过编码器将输入图像编码成特征图，掩膜解码器将特征图解码为1通道的掩膜图，以完成对输入图像中异常的异常预测。

步骤3，对图像异常检测模型进行训练。

参照图3，本步骤的具体实现如下：

3.1)对掩膜编码器进行一次训练：

3.1.1)计算掩膜自编码器输出的预测掩膜图

与输入的合成异常图像对应的标签掩膜图M_{syn_ab}之间的L2误差损失L_MAE(I_{syn_ab})，并作为掩膜自编码器的损失函数：

其中，I_{syn_ab}表示输入的合成异常图像，n为合成图像数据集中的数据数量，

表示掩膜自编码器，ω_MAE表示掩膜自编码器的参数；

3.1.2)利用Adam反向传播优化算法最小化损失函数L_MAE(I_{syn_ab})的值，对掩膜自编码器参数进行更新，完成掩膜自编码器的一次训练；

3.2)对重建自编码器进行一次训练：

3.2.1)计算重建自编码器输出的重建图像

与原始正常图像I_nor之间的L2误差损失L_res(I_{syn_ab})：

其中，n为合成图像数据集中的数据数量，

为重建自编码器，ω_RAE为重建自编码器的权重参数；

3.2.2)利用一次训练得到的掩膜自编码器得到软掩膜图

将软掩膜图与合成异常图像逐像素相乘，获取软掩膜对比损失中的负例样本N：

N＝M_soft*I_{syn_ab}

其中，

表示一次训练得到的掩膜自编码器，

表示一次训练得到的掩膜自编码器参数；

3.2.3)计算重建编码器的重建图像A、负例样本N与合成图像对应的原始正常图像P三者之间的软掩膜对比损失L_CL(A,P,N)：

其中，

P＝I_nor，

为重建自编码器，ω_RAE为重建自编码器的权重参数，v_i(A)表示重建图像通过第i个VGG19特征层后得到的特征图，v_i(P)表示原始正常图像通过第i个VGG19特征层后得到的特征图，v_i(N)表示负例样本通过第i个VGG19特征层后得到的特征图，d(v_i(A),v_i(P))表示重建图像特征图与原始正常图像特征图之间的L1距离，d(v_i(A),v_i(N))表示重建图像特征图与负例样本特征图之间的L1距离，w_i表示第i个尺度特征提取层下的软掩膜对比损失项的权重参数，i取值范围为{1,2,...,k}，k表示选取在ImageNet公开数据集上训练好的VGG19不同尺度的特征提取层个数，k＝5，即权重参数分别为

h表示软掩膜对比损失中

因子所占的权重，公式如下：

其中，

表示一次训练得到的掩膜自编码器，

表示一次训练得到的掩膜自编码器参数；

3.2.4)将L2误差损失L_res(I_{syn_ab})与软掩膜对比损失L_CL(A,P,N)的加权和作为重建自编码器的损失函数L_RAE(I_{syn_ab},P,N)，表示如下：

L_RAE(I_{syn_ab},P,N)＝L_res(I_{syn_ab})+λ·L_CL(A,P,N)

其中，λ为平衡重建损失和软掩膜对比损失的权重超参数，I_{syn_ab}表示合成异常图像，P表示原始正常图像，N表示负例样本，

表示重建图像，

表示重建自编码器，ω_RAE表示重建自编码器的权重参数；

3.2.5)利用Adam反向传播优化算法最小化损失函数L_RAE(I_{syn_ab},P,N)的值，对重建自编码器参数进行更新，完成重建自编码器的一次训练；

3.3)重复执行3.1)和3.2)，对掩膜自编码器与和重建自编码器交替进行训练，直至各自对应的损失函数收敛，停止迭代，得到训练好的图像异常检测模型。

步骤4，图像异常定位与检测。

4.1)将MVTec测试数据集中的图像I作为输入，输入到训练好的图像异常检测模型中，其通过掩膜自编码器输出预测掩膜图S_mask(I)：

其中，

表示训练好的掩膜自编码器，

表示掩膜自编码器的权重参数；

4.2)图像I通过重建自编码器输出重建图像，并计算L2误差S_L2(I)与对比误差S_CL(I)：

其中，

表示训练好的重建自编码器，

表示得到的重建自编码器权重参数，w_i表示第i个尺度特征提取层下的软掩膜对比损失项的权重参数，i取值范围为{1,2,...,k}，k表示选取在ImageNet公开数据集上训练好的VGG19不同尺度的特征提取层个数，k＝5，即权重参数分别为

v_i(I)表示测试图像通过第i个VGG19特征层后得到的特征图，

表示重建图像通过第i个VGG19特征层后得到的特征图，

表示重建图像特征图与原始正常图像特征图之间的L1距离，

表示将重建图像特征图与原始正常图像特征图之间的L1距离上采样到测试图像尺寸。

4.3)通过L2误差S_L2(I)与对比误差S_CL(I)得到重建自编码器的异常得分图S_res(I)：

S_res(I)＝S_L2(I)+λ·S_CL(I)

其中，λ为平衡L2误差与对比误差的权重超参数；

4.4)通过掩膜自编码器的输出预测掩膜图S_mask(I)与重建自编码器的异常得分图S_res(I)，获取用于异常定位的像素级异常得分图S(I)：

S(I)＝S_res(I)+h_··S_mask(I)

其中的h_·为掩膜自编码器的置信度参数：

表示训练好的掩膜自编码器，

表示掩膜自编码器的权重参数；

4.5)在像素级异常得分图中选取其最大值，得到用于异常检测的图像级异常得分η：

其中，w表示像素级异常得分图的宽，h表示像素级异常得分图的高，S(I)(i,j)表示在像素级异常得分图中第i行第j列处的异常得分；

4.6)根据MVTec训练数据集中的所有原始正常图像设置阈值T：

4.6.1)计算训练数据集中的所有原始正常图像的像素级异常得分图，得到集合

其中

是训练数据集中的第k个原始正常图像，

表示图像

对应的像素级异常得分图，n表示训练数据集中的原始正常图像数量；

4.6.2)从像素级异常得分集合中计算每个原始正常图像的图像级异常得分μ_k：

其中w表示像素级异常得分图的宽，h表示像素级异常得分图的高，

表示在原始正常图像

对应的像素级异常得分图中第i行第j列处的异常得分；

4.6.3)根据每个原始正常图像的图像级异常得分得到所有原始正常图像对应的图像级异常分数集合：

Ω＝{μ₁,μ₂,...μ_k,...,μ_n}

4.6.4)从原始正常图像图像级异常分数集合集合Ω中选取最大值作为阈值T：

4.7)将测试图像I的图像级异常得分η与设定的阈值T进行比较：

若η＞T，则图像I被判定为异常；

若η≤T，则图像I被判定为正常，至此完成对测试图像I的异常检测。

下面结合仿真实验对本发明的效果做进一步的描述。

1、仿真实验条件：

本发明的仿真实验的硬件平台为：Intel Core i7-8700K@3.70GHZ、32GB RAM，显卡为NVIDIA GeForce GTX 1080Ti。

本发明仿真实验的软件平台为：Ubuntu18.04操作系统，Pytorch1.6.0，Python3.6；

仿真实验采用MVTec数据集，包含训练数据集与测试数据集，此数据集是一个用于评估图像异常检测与定位算法好坏的基准数据集，共包含15类不同的工业品，其中包含5类纹理类型数据：网格、瓷砖、地毯、木材及皮革；包含10类物品类型数据：瓶口、胶囊、药片、电缆、晶体管、拉链、榛果、螺母、螺丝及牙刷。

2、仿真内容及其结果分析：

仿真1，用本发明与现有的四种图像异常定位方法,即基于SSIM损失函数自编码器的图像异常定位方法AE_SSIM、基于能量迭代的正态数据流形投影图像异常定位方法VAE-grad、多尺度知识蒸馏图像异常定位方法MKD、基于判别性潜在向量的教师-学生网络的图像异常定位方法US，分别对MVTec测试数据集中的所有测试图像计算像素级异常得分图，计算各种方法的像素级受试者工作特征曲线与横坐标轴围成的面积AUC这个指标，结果如表1所示。

表1.五种方法的像素级AUC评价结果(％)对比表

所述像素级AUC，是像素级受试者工作特征曲线与横坐标轴围成的面积AUC，用于衡量异常定位方法的效果，其值介于0％-100％，值越大则定位效果越好。

从表1可见，本发明在测试集上的像素级AUC指标平均值高于其他四种方法，证明本发明具有更好的图像异常定位效果。

仿真2，用本发明与现有的三种图像异常检测方法,即基于SSIM损失函数自编码器的图像异常检测方法AE_SSIM、基于深度支持向量数据描述模型的异常检测方法DSVDD、基于能量迭代的正态数据流形投影图像异常检测方法VAE-grad，分别利用各方法对MVTec测试数据集中的所有测试图像计算图像级异常得分，并计算各种方法的图像级受试者工作特征曲线与横坐标轴围成的面积AUC这个指标，结果如表2所示。

表2.四种方法的图像AUC评价结果(％)对比表

所述图像级AUC，是图像级受试者工作特征曲线与横坐标轴围成的面积AUC，用于衡量异常检测方法的效果，其值介于0％-100％，值越大则检测效果越好。

从表2可见，本发明在测试集上的图像级AUC指标平均值高于其他三种方法，证明本发明具有更好的图像异常检测效果。

Claims

1.一种基于软掩膜对比损失的图像异常检测方法，其特征在于，包括如下步骤：

1c)将合成图像及其对应的掩膜图标签作为训练数据集；

(3)利用合成图像训练数据集对图像异常检测模型进行训练：

3a)计算掩膜自编码器输出的预测掩膜图

表示掩膜自编码器，ω_MAE表示掩膜自编码器的参数；

3b)对重建自编码器进行一次训练：

3b1)计算重建自编码器输出的重建图像

其中的

表示一次训练得到的掩膜自编码器，

表示一次训练得到的掩膜自编码器参数；

(4)图像异常定位与检测：

S(I)＝S_res(I)+h_··S_mask(I)

其中的h_·为掩膜自编码器的置信度参数；

若η＞T，则图像I被判定为异常；

若η≤T，则图像I被判定为正常。

2.根据权利要求1所述的方法，其特征在于，步骤2)图像异常检测模型中的重建自编码器和掩膜自编码器结构如下；

所述重建自编码器，由编码器和重建解码器级联组成；

该编码器，依次由卷积层、第一最大池化层、四个残差模块和第二个最大池化层级联组成，其中，卷积层的卷积核大小为7×7，步长为2，填充像素为1；两个最大池化层的步长均为2；四个残差模块分别由3、4、6、3个残差卷积组组成，每个残差卷积组由第一卷积层、第二卷积层连接组成，这两个卷积层的卷积核大小均为3×3，步长均为1，填充像素均为1，该第二卷积层的输出特征与其输入特征逐通道相加即为残差卷积组的输出特征；

该重建解码器，依次由六个解码模块和一个卷积模块级联组成，其中，每个解码模块由一个步长为2的双线性插值上采样层及第三卷积层、第四卷积层组成；卷积模块由两个卷积层组成，即第五卷积层和第六卷积层；该第三卷积层与第四卷积层的卷积核大小均为3×3，步长为1，填充像素为1；该第五卷积层和第六卷积层的卷积核大小均为3×3，步长为2，填充像素为1；其输出通道为3；

所述掩膜自编码器，包含编码器与掩膜编码器，其结构与重建自编码器相同，其输出通道为1。

3.根据权利要求1所述的方法，其特征在于，3a)中计算掩膜自编码器输出的预测掩膜图

与输入的合成异常图像对应的标签掩膜图M_{syn_ab}之间的L2误差损失L_MAE(I_{syn_ab})，公式如下：

其中，n为合成图像数据集中的数据数量。

4.根据权利要求1所述的方法，其特征在于，3b1)中计算重建自编码器输出的重建图像

与原始正常图像I_nor之间的L2误差损失L_res(I_{syn_ab})，公式如下：

其中，n为合成图像数据集中的数据数量。

5.根据权利要求1所述的方法，其特征在于，3b3)中计算重建编码器的重建图像A、负例样本N与合成图像对应的原始正常图像P三者之间的软掩膜对比损失L_CL(A,P,N)，公式如下：

其中，

P＝I_nor，

为重建自编码器，ω_RAE为重建自编码器的权重参数，v_i(A)表示重建图像通过第i个VGG19特征层后得到的特征图，v_i(P)表示原始正常图像通过第i个VGG19特征层后得到的特征图，v_i(N)表示负例样本通过第i个VGG19特征层后得到的特征图，d(v_i(A),v_i(P))表示重建图像特征图与原始正常图像特征图之间的L1距离，d(v_i(A),v_i(N))表示重建图像特征图与负例样本特征图之间的L1距离，w_i表示第i个尺度特征提取层下的软掩膜对比损失项的权重参数，i取值范围为{1,2,...,k}，k表示选取在ImageNet公开数据集上训练好的VGG19不同尺度的特征提取层个数，k＝5，h表示软掩膜对比损失中