CN113034516A

CN113034516A - 一种分割图像中异常区域的深度学习算法

Info

Publication number: CN113034516A
Application number: CN202110313181.3A
Authority: CN
Inventors: 姚健; 朱奕健; 余家伟; 胡超; 顾建峰; 陆海妹
Original assignee: China Unicom Shanghai Industrial Internet Co Ltd
Current assignee: China Unicom Shanghai Industrial Internet Co Ltd
Priority date: 2021-03-24
Filing date: 2021-03-24
Publication date: 2021-06-25

Abstract

本发明涉及无监督图像异常分割技术领域，尤其为一种分割图像中异常区域的深度学习算法，包括以下步骤：S1，首先作正样本图像特征提取，本发明通过设计分割图像中异常区域的深度学习算法达到算法准确度高；推理时间和内存占用为常数量级，与正样本参考图片数量无关；算法流程简单，只需选取最优的单个层级特征表示，无需多层级特征融合的效果，同时分割阈值可根据实际情况采取不同选取方式，算法的泛化能力好，易于复用，解决了现有的无监督异常分割算法准确度不高、推理时间长、内存占用大等问题,进而能够准确且高效地分割异常区域，且不需要多层级特征融合即可达到当前最优效果。

Description

一种分割图像中异常区域的深度学习算法

技术领域

本发明涉及无监督图像异常分割技术领域，尤其涉及一种分割图像中异常区域的深度学习算法。

背景技术

现存的无监督异常分割算法，主要有两种：1.基于重建的方法，通过自编码器(AutoEncoder)重建正样本图片，由于异常样本重建前后差异较大从而分割出异常区域，此类方法模型参数量大、训练时间长，对复杂图案重建效果不佳，分割准确度不高；2.基于预训练网络提取特征表示，并用knn等方法进行图像检索，将待测图片与特征空间上最临近的正样本参考图片作对比，分割出异常区域，该方法需要构建正样本特征字典，字典的内存占用、knn搜索时间都与正样本参考图片的数量成正比，当数据量非常大时，该算法非常耗时,另外，特征提取器通常是卷积神经网络，为获取不同感受野的特征表示，需要进行多层级特征融合。

综上所述，本发明通过设计一种分割图像中异常区域的深度学习算法来解决存在的问题。

发明内容

本发明的目的在于提供一种分割图像中异常区域的深度学习算法，为了克服现有的无监督异常分割算法准确度不高、推理时间长、内存占用大等问题,本发明创造提供一种新型解决方案，可以准确且高效地分割异常区域，且不需要多层级特征融合即可达到当前最优效果。

为实现上述目的，本发明提供如下技术方案：

一种分割图像中异常区域的深度学习算法，包括以下步骤：

S1，首先作正样本图像特征提取：使用基于大规模公开数据集(ImageNet)训练的分类网络ViT(视觉transformer)预训练模型，对正样本训练集提取特征，得到的数据体维度表示为(N,C,H,W)；

S2，然后对该数据体作统计量计算，对空间位置(i,j)(i的范围为[0,H]，j的范围为[0,W])的特征按通道求均值,C_mean(i,j)即对应位置的特征的均值,其是一个长度为C的向量；以及C_corr(i,j)，表示对应位置的特征的协方差矩阵，其是一个CxC大小的对称矩阵，需要将这两个统计量保存，为后面测试时计算马氏距离所用；

S3，接下来是测试阶段，同样用ViT提取被测图片的特征表示，然后使用马氏距离作为距离度量，其中，x_ij表示被测图片在(i，j)空间位置的特征向量，u_ij和Σ_ij就是在正样本训练数据上统计并保存的(i，j)位置上的特征均值和协方差矩阵，并且通过马氏距离公式计算马氏距离；

S4，最后，例如一张被测图片，其各个空间位置都可计算出与正样本训练集特征的马氏距离，得到一个(H,W)的马氏距离图，通过分割阈值筛选，做到图像块的正常/异常二分类，实现异常区域分割，并且将这个(H,W)的距离图的最大值记作异常值s,以及通过分类阈值筛选，做到全图的正常/异常二分类，即实现异常分类，对于分类和分割阈值的确定，提前人工标注一些真值，通过最大化AUCROC确定阈值或者在完全没有标注信息的情况下，通过正样本验证集，确定分类和分割的阈值。

优选的，所述S1中N表示训练用到的样本数量，C表示特征维度数，H和W分别的特征图的高和宽。

优选的，所述S2中的协方差矩阵计算公式为：

优选的，所述S3中马氏距离公式为：

优选的，所述S1中的特征表示采用非卷积神经网络结构，其感受野来自图片全局，内部采用多头自注意力机制，在大规模图像分类前置任务上训练得到网络权重，无需微调，直接用于当前图片特征提取。

与现有技术相比，本发明的有益效果是：

1、本发明中，通过设计分割图像中异常区域的深度学习算法达到算法准确度高；推理时间和内存占用为常数量级，与正样本参考图片数量无关；算法流程简单，只需选取最优的单个层级特征表示，无需多层级特征融合的效果，同时分割阈值可根据实际情况采取不同选取方式，算法的泛化能力好，易于复用，解决了现有的无监督异常分割算法准确度不高、推理时间长、内存占用大等问题,进而能够准确且高效地分割异常区域，且不需要多层级特征融合即可达到当前最优效果。

具体实施方式

下面将结合本发明实施例中，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例,基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种分割图像中异常区域的深度学习算法，包括以下步骤：

进一步的，所述S1中N表示训练用到的样本数量，C表示特征维度数，H和W分别的特征图的高和宽。

进一步的，所述S2中的协方差矩阵计算公式为：

进一步的，所述S3中马氏距离公式为：

进一步的，所述x_ij表示被测图片在(i，j)空间位置的的特征向量，u_ij和Σ_ij就是在正样本训练数据上统计并保存的(i，j)位置上的特征均值和协方差矩阵。

进一步的，所述S1中的特征表示采用非卷积神经网络结构，其感受野来自图片全局，内部采用多头自注意力机制，在大规模图像分类前置任务上训练得到网络权重，无需微调，直接用于当前图片特征提取。

实施例：

正样本：没有缺陷的正常样本；负样本：有缺陷的样本

算法的步骤具体如下:

首先作正样本图像特征提取：使用基于大规模公开数据集(ImageNet)训练的分类网络ViT(视觉transformer)预训练模型，对正样本训练集提取特征，得到的数据体维度表示为(N,C,H,W)，其中，N表示训练用到的样本数量，C表示特征维度数，H和W分别的特征图的高和宽；

然后对该数据体作统计量计算，对空间位置(i,j)(i的范围为[0,H]，j的范围为[0,W])的特征按通道求均值,C_mean(i,j)即对应位置的特征的均值,其是一个长度为C的向量；以及C_corr(i,j)，表示对应位置的特征的协方差矩阵，其是一个CxC大小的对称矩阵，需要将这两个统计量保存，为后面测试时计算马氏距离所用，其中协方差矩阵的计算为：

接下来是测试阶段，同样用ViT提取被测图片的特征表示，然后使用马氏距离作为距离度量，其中马氏距离度量的计算公式为：

其中，x_ij表示被测图片在(i，j)空间位置的的特征向量，u_ij和Σ_ij就是在正样本训练数据上统计并保存的(i，j)位置上的特征均值和协方差矩阵，通过上面公式计算马氏距离；

相较欧式距离，马氏距离不受各特征维度量纲的影响，还可以排除各特征维度之间的相关性的干扰；

例如，一张被测图片，其各个空间位置都可计算出与正样本训练集特征的马氏距离，得到一个(H,W)的马氏距离图，通过分割阈值筛选，做到图像块的正常/异常二分类，实现异常区域分割，并且将这个(H,W)的距离图的最大值记作异常值s,以及通过分类阈值筛选，做到全图的正常/异常二分类，即实现异常分类；

对于分类和分割阈值的确定，可以提前人工标注一些真值，通过最大化AUCROC确定阈值；也可以在完全没有标注信息的情况下，通过正样本验证集，确定分类和分割的阈值，具体方法是确定一个百分数，如98％，让98％的正样本位于分类阈值和分割阈值以下，此时的98％处的距离即作为阈值。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种分割图像中异常区域的深度学习算法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种分割图像中异常区域的深度学习算法，其特征在于，所述S1中N表示训练用到的样本数量，C表示特征维度数，H和W分别的特征图的高和宽。

3.根据权利要求1所述的一种分割图像中异常区域的深度学习算法，其特征在于，所述S2中的协方差矩阵计算公式为：

4.根据权利要求1所述的一种分割图像中异常区域的深度学习算法，其特征在于，所述S3中马氏距离公式为：

5.根据权利要求1所述的一种分割图像中异常区域的深度学习算法，其特征在于，所述S1中的特征表示采用非卷积神经网络结构，其感受野来自图片全局，内部采用多头自注意力机制，在大规模图像分类前置任务上训练得到网络权重，无需微调，直接用于当前图片特征提取。