WO2022095645A1

WO2022095645A1 - 基于内存增强潜在空间自回归的图像异常检测方法

Info

Publication number: WO2022095645A1
Application number: PCT/CN2021/122056
Authority: WO
Inventors: 徐行; 王甜; 沈复民; 贾可; 申恒涛
Original assignee: 成都考拉悠然科技有限公司
Priority date: 2020-11-04
Filing date: 2021-09-30
Publication date: 2022-05-12
Also published as: US20230154177A1; CN112036513B; CN112036513A

Abstract

一种基于内存增强潜在空间自回归的图像异常检测方法，属于计算机视觉中的异常检测领域。该方法包括：选择数据集，并将数据集划分为训练集和测试集（S1）；构建基于内存增强潜在空间自回归模型的网络结构（S2）；对训练数据集进行预处理（S3）；初始化基于内存增强潜在空间自回归模型（S4）；利用预处理后的训练集训练初始化后的基于内存增强潜在空间自回归模型（S5）；通过测试集验证训练好的基于内存增强潜在空间自回归模型，并使用训练好的基于内存增强潜在空间自回归模型判断输入图像是否为异常图像（S6）。该方法不需设置先验分布从而不会破坏数据本身的分布，并且能够阻止模型重建异常图片，最终能够更好地判断出异常图像。

Description

基于内存增强潜在空间自回归的图像异常检测方法

相关申请的交叉引用

本申请要求于2020年11月04日提交中国国家知识产权局的申请号为202011212882.X、名称为“基于内存增强潜在空间自回归的图像异常检测方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机视觉中的异常检测领域，尤其涉及一种基于内存增强潜在空间自回归的图像异常检测方法。

背景技术

异常检测，又称为离群点检测、新颖检测等，是找出与预期对象的行为差异较大的对象的检测过程。这些被检测出的对象又称为异常点或者离群点。异常检测在生产生活中有着广泛的应用，比如信用卡反欺诈、广告点击反作弊，网络入侵检测等。

随着最近几年深度学习的崛起，异常检测用于计算机视觉方面的研究开始火热。计算机视觉中的异常检测满足异常检测的相关定义，输入对象变为图像，视频等信息。比如，在一大堆图片中找出不符合这类图片的对象；在工业生产中检测错误生产的零件；将异常检测应用于监控视频，可以自动分析监控视频中出现的异常行为、对象等。正是由于计算机的火热发展和数据的急速膨胀，急迫需要一种技术能够对图像和视频等信息进行分析。

随着机器学习特别是深度学习技术的发展，基于机器学习的图像异常检测技术不断涌现。相较于传统异常检测，针对图像需要提取更加紧凑的信息表达。传统机器学习阶段，异常检测需要人工手动的分析数据分布，设计合适的特征，然后使用传统机器学习算法(支持向量机、孤立森林等)对数据进行建模分析。相较于传统机器学习，深度学习可以自动学习到数据的特征然后在针对特征进行建模分析，具有更高的鲁棒性。

目前，计算机视觉中的异常检测方法主要有：基于重建损失差异的方法、基于分类学习的方法和基于密度估计的方法。

1)基于重建损失差异的方法：这类方法往往是利用数据本身特征通过深度自编码器对输入数据进行重建，利用自编码器能够记住正常样本的特性，通过重建差异来评判数据是否是异常样本(异常样本通常不能很好的重建，设定一个阈值就可以检测出异常样本)。

2)基于分类学习的方法：这类方法主要针对用于离群点检测，正常样本往往是一组具有标签信息的数据，通过对这组数据应用分类算法，学习到数据是某一类的概率。在测试阶段，正常样本在某一类的概率值很大，而异常样本由于不属于这个分布，在所有类别概率值都很小，以此特性来区分数据是否是异常数据。

3)基于密度估计的方法：这类方法往往是针对一大堆数据中存在一小部分异常样本，通过传统机器学习或者深度学习提取特征的方法，通过应用密度估计方法对数据进行建模，异常数据往往就位于概率值较低的部分。

当然也有许多算法是上述算法的变种和组合来达到异常检测的效果，包括自编码器与生成对抗网络的结合、自编码器与密度估计方法的结合等。

但是，现有的异常检测方法由于缺乏明确的监督信息(异常数据难以收集，正常数据的收集费时费力难以获取完整的数据)，导致异常检测方法难以达到好的效果。尤其是基于深度自编码器的模型，针对数据分布较大，数据方差大等问题缺乏良好的解决方法。

发明内容

本申请提供了一种能够更好地判断出异常图像的基于内存增强潜在空间自回归的图像异常检测方法。

本申请解决其技术问题，采用的技术方案是：

基于内存增强潜在空间自回归的图像异常检测方法，可以包括如下步骤：

步骤1、选择数据集，并将数据集划分成训练集和测试集；

步骤2、构建基于内存增强潜在空间自回归模型的网络结构；

步骤3、对训练集进行预处理；

步骤4、初始化所述基于内存增强潜在空间自回归模型；

步骤5、利用预处理后的训练集训练初始化后的基于内存增强潜在空间自回归模型；

步骤6、通过测试集验证训练好的基于内存增强潜在空间自回归模型，并使用训练好的基于内存增强潜在空间自回归模型判断输入图像是否为异常图像。

可选地，步骤1中，所述数据集可以包括MNIST数据集和CIFAR10数据集。

可选地，步骤2中，所述基于内存增强潜在空间自回归模型可以包括：自编码器、自回归模块和内存模块；

所述自编码器，可以包括编码器和解码器，自编码器可以通过编码器将图像压缩到潜在空间，学习到特征表达，然后可以使用解码器将潜在空间的特征表达解码回图像空间；

所述自回归模块，可以被配置成用于利用潜在空间的特征对数据进行建模，拟合真实分布，其拟合过程通过如下公式表示：

其中，p(z)为潜在空间分布，p(z _i|z _＜i)为条件概率分布，d表示特征向量z的维度，z _i表示特征向量z的第i维,z _＜i表示特征向量z小于第i维的部分；

所述内存模块，可以被配置成用于保存潜在空间的特征表达，然后不属于该潜在空间的特征表达将被内存模块强行转换为内存中最相关的特征表达，其过程是：

其中，M为内存模块，

为内存模块对该特征的表达，w表示潜在空间与每一块内存的相似度，m _i表示内存模块的第i块内存，w _i表示特征向量z与m _i的相似性，N表示内存模块的大小，

其中,exp()表示以e为底的指数函数，||·||为取模运算,

为m _i的转置，m _j表示内存模块的第j块内存。

可选地，步骤2中，所述网络结构中：

自编码器的编码器网络结构可以包括下采样模块、下采样模块和全连接层，每个块使用残差网络的结构，且由三个连续的卷积层+批标准化+激活函数结构级联组成；

自编码器的解码器网络结构可以包括全连接层、上采样模块、上采样模块和卷积层，每个块使用残差网络的结构，且由三个子结构分别为转置卷积层+批标准化+激活函数、卷积层+批标准化+激活函数、转置卷积层+批标准化+激活函数结构级联组成；

自回归模块网络结构可以是由多个自回归层组成；

其中，自编码器中编码器表达为数学模式为：z＝en(X)，解码器表达为数学模式为：

自回归模块z _dist＝H(z)和

作用于z，此时

可选地，所述自编码器对图片的处理过程可以包括如下步骤：

a、输入一张大小为N*N的图片，经过自编码器的编码阶段，经过一次下采样模块后基于内存增强潜在空间自回归模型的尺寸变小2倍，通道维度由1到32再到64，最后经过整平操作输入编码器中的全连接层，最终得到潜在空间z∈R ⁶⁴，此时

b、将z送入内存模块，取得z与每一块内存的相似度w，将w经过一次

操作后得到

最后通过内存表示

c、将

经过解码器的全连接层得到大小为

的特征，最终经过两次上采样模块还原为原有尺寸，上采样模块的通道维度变化为64到32再到16；

d、经过最后一个卷积层将特征还原到原有图像空间。

可选地，步骤2具体可以包括以下步骤：

步骤201、选择训练集；

步骤202、分析训练集信息，所述训练集信息包括图像尺寸、图像强度和图像噪声；

步骤203、根据所得到的信息构建适用于当前数据的网络结构；

步骤204、将自编码器、自回归模块和内存模块组装在一起。

可选地，步骤3具体可以包括以下步骤：

步骤301、读取图像数据；

步骤302、将图像尺寸调整到特定大小；

步骤303、处理一定量与整体数据的图像空间不同的图片，具体为：灰度空间转RGB空间以及RGB空间转灰度空间；

步骤304、对图像数据进行正则化操作。

可选地，步骤4具体可以是指：使用不同的初始化方法对网络进行初始化，即：对自编码器和自回归模块使用随机初始化方式，对内存模块使用均匀分布初始化。

可选地，步骤5具体可以包括以下步骤：

步骤501、加载预处理之后的数据；

步骤502、为自编码器、自回归模块和内存模块分别设置学习率；

步骤503、固定内存模块训练自回归模块；

步骤504、固定自回归模块训练内存模块；

步骤505、迭代进行步骤503和步骤504直至基于内存增强潜在空间自回归模型收敛。

可选地，在步骤5中，所述模型的损失函数可以为：

L＝L _rec+αL _llk+βL _mem；

其中，L _rec表示原图片与重建图片的重建损失，

表示负对数似然损失，

表示特征与内存模块的权重系数的熵，α，β分别表示损失函数的权重系数，用以平衡不同损失的比例。对于不同的数据集，α，β有所不同。对于MNIST和CIFAR10，α分别等于1、0.1，β分别等于0.0002、0.0002。

可选地，步骤6可以具体是指：使用训练好的基于内存增强潜在空间自回归模型，将图片输入基于内存增强潜在空间自回归模型，获取自回归模块输出的概率和自编码器重建图片与原图片的重建差异，分别作为两个分数，将两个分数相加得到最终分数,通过先前设定的阈值判定是否是异常图像。

本申请的有益效果至少是：

通过上述基于内存增强潜在空间自回归的图像异常检测方法，通过构建并训练的基于内存增强潜在空间自回归模型，不需设置先验分布从而不会破坏数据本身的分布，并且能够阻止模型重建异常图片，最终能够更好地判断出异常图像。

附图说明

图1为本申请实施例中基于内存增强潜在空间自回归的图像异常检测方法的流程图；

图2为本申请实施例中基于内存增强潜在空间自回归模型的网络结构示意图；

图3为本申请实施例中自回归模块的示意图；

图4为本申请实施例中内存模块的示意图；

图5为本申请实施例中上、下采样模块的示意图；

图6为在MNIST数据集上模型性能(AUC)对比表；

图7为在CIFAR10数据集上模型性能(AUC)对比表。

具体实施方式

下面结合附图及实施例，详细描述本申请的技术方案。

本实施例提出了一种基于内存增强潜在空间自回归的图像异常检测方法，其流程图见如1，其中，该方法可以包括如下步骤：

S1：选择数据集，并将数据集划分成训练集和测试集

本实施例选取了两个主流的图像异常检测数据集进行实验，可以包括MNIST、CIFAR10。

MNIST数据集是很多任务都会选择的一个手写数据集，共包含60000个实例的训练集和10000个示例的测试集，该数据集可以包含数字0-9的手写字符，共10类，每张图片都是大小为28*28的灰度图像。

CIFAR10数据集是一个更接近普适物体的彩色图像数据集，共包含50000张训练数据和10000张测试数据，一共包含10个类别的彩色RGB图像：飞机、汽车、鸟类、猫、鹿、狗、蛙类、马、船、卡车，每张图片都是大小为32*32的彩色图像。

选择以上两个数据集是为了验证模型对于不同类型数据集的适应性和鲁棒性，MNIST和CIFAR10均包含10个分类，大多数实验都会选择这两个数据集，10个分类可以很好地适应异常检测的背景设置，并且满足数据多样的特点。

S2：构建基于内存增强潜在空间自回归模型的网络结构

如图2、3、4、5所示，本实施例中基于内存增强潜在空间自回归模型可以包含三个部分：自编码器、自回归模块和内存模块，其中：

自编码器，可以包括编码器和解码器，自编码器通过编码器将图像压缩到潜在空间，学习到特征表达，然后使用解码器将潜在空间的特征表达解码回图像空间；

自回归模块，可以被配置成用于利用潜在空间的特征对数据进行建模，拟合真实分布，其拟合过程通过如下公式表示：

其中，p(z)为潜在空间分布，p(z _i|z _＜i)为条件概率分布，d表示特征向量z的维度,z _i表示特征向量z的第i维,z _＜i表示特征向量z小于第i维的部分；这里，使用自回归模块学习数据的分布，不会像变分自编码器和对抗自编码器为数据设置一个先验分布，设置先验分布会损坏数据本身的分布，使用自回归模块可以有效避免这个问题。

内存模块，可以被配置成用于保存潜在空间的特征表达，然后不属于该潜在空间的特征表达将被内存模块强行转换为内存中最相关的特征表达，其过程可以是：

其中，M为内存模块，

其中，exp()表示以e为底的指数函数，||·||为取模运算,

为m _i的转置，m _j表示内存模块的第j块内存。

这里，使用内存模块去存储分布的稀疏特征表达，加强了自编码器的生成效果，并且限制权重，有效阻止了模型能够重建异常图片的问题。

参见图5，其为上、下采样模块的示意图，其中，Conv2d代表卷积层，Bn代表批标准化，ReLu代表激活函数，DeConv代表转置卷积层，这里，自编码器的编码器网络结构可以包括下采样模块、下采样模块和全连接层，每个块使用残差网络的结构，且由三个连续的卷积层+批标准化+激活函数结构级联组成。

本实施例中，自编码器的解码器网络结构可以包括全连接层、上采样模块、上采样模块和卷积层，每个块使用残差网络的结构，且由三个子结构可以分别为转置卷积层+批标准化+激活函数、卷积层+批标准化+激活函数、转置卷积层+批标准化+激活函数结构级联组成；

自回归模块网络结构使用如图3所示结构进行构建，图3代表一个自回归层的运行过程，输入与输出的特征数量保持不变，特征维度会发生改变，每一个自回归层都是由多个变异全连接层实现，使用特征向量之前的特征生成当前的特征，最后组装为一个特征向量，自回归网络是由多个这样的自回归层组成。

内存模块网络结构可以使用如图4所示结构进行构造，图4表明了内存模块的读取机制，首先，选取一块额外的内存空间作为内存，其每一块内存的大小与输入的大小一致，先用输入与每一块内存计算其相似度，然后相似度经过一次过滤操作(过滤掉值比较小的相似度)，使用相似度和每一块内存相乘之后再相加，得到输出。

需要指出的是，自编码器中编码器表达为数学模式为：z＝en(X)，解码器表达为数学模式为：

自回归模块z _dist＝H(z)和

作用于z，此时

具体应用过程中，自编码器对图片的处理过程可以包括如下步骤：

操作后得到

最后通过内存表示

c、将

经过解码器的全连接层得到大小为

d、经过最后一个卷积层将特征还原到原有图像空间。

S3：对训练集进行预处理

在模型训练的过程中，需要将所有图片尺寸调整为N*N，转换到对应的图像空间，根据数据的需要可以适当使用随机旋转，翻转，噪声等操作。

S4：初始化基于内存增强潜在空间自回归模型

由于模型初始化可以有效帮助网络进行训练和收敛，在这里采取的方案是针对自编码器模块和自回归模块使用随机初始化的方法，随机初始化的过程是尽可能保证网络权重很小，并且对偏差进行置0操作。

针对内存模块M∈R ^{N*feature_dim}，其中N表示内存模块的大小，feature_dim表示每一块内存保存的信息大小与潜在空间维度保持一致，对

使用均匀分布π～U(0，1)进行feature_dim对初始化操作，即：任意n属于N，就内存中的每一个小块进行初始化。

S5：利用预处理后的训练集训练初始化后的基于内存增强潜在空间自回归模型

在训练过程中，由于主要使用MNIST和CIFAR10两个数据集。

这里，输入网络的图片大小分别为28*28和32*32，feature_dim都设置为64，自回归模块的输出维度都是100，内存数量分别设置为100和500，并且对Batch_Size大小都是256，学习率分别设定为0.0001和0.001，使用Adam优化器进行学习，总的epoch设置为100，每隔20个epoch学习率乘以0.1。这里，内存模块提出了使用均匀分布进行初始化，设置单独学习率，有效解决了内存模块难以训练的问题。

另外，模型的损失函数如下：

L＝L _rec+αL _llk+βL _mem；

其中，L _rec表示原图片与重建图片的重建损失，

表示负对数似然损失，

S6：通过测试集验证训练好的基于内存增强潜在空间自回归模型，并使用训练好的基于内存增强潜在空间自回归模型判断输入图像是否为异常图像。

本实施例主要是采用ROC曲线下的面积AUC来评价方法的优劣。通常这个指标由分类问题的混淆矩阵中的真阳性(TruePositive，TP)、假阳性(FalsePositive，FP)、假阴性(FalsNegative，FN)和真阴性(TrueNegative，TN)四个元素计算而来，其中，混淆矩阵如下表1所示：

表1

	预测异常	预测正常
实际异常	真阳性(TP)	假阴性(FN)
实际正常	假阳性(FP)	真阴性(TN)

另外，计算如下公式：

ROC曲线由两个坐标组成，横坐标FPR，纵坐标TPR，通过调整不同的阈值可以画出一条曲线，AUC就是该曲线下面部分的面积大小。

另外，可以分别在MNIST和CIFAR10两个数据集测试了模型的性能，与当前流行的方法相比都达到了良好的性能。测试比较结果如图6、7所示，其中，图6为在MNIST数据集上模型性能(AUC)对比表，图7为在CIFAR10数据集上模型性能(AUC)对比表：

从图6可以看出，本实施例在MNIST数据集的各个类上均优于现有方法。本实施例的方法在最终的avg分数达到了0.981，该分数是目前最好的性能。从图7可以看出，本实施例在CIFAR10数据集的4、6、9上性能得到了巨大的提升，并且在最终的avg分数达到了0.673，该分数是目前最好的性能。这证明了本申请提出的基于内存增强潜在空间自回归模型能够有效应用于图像的异常检测，能极大地弥补当前方法所存在的缺点。

工业实用性

本申请提供了一种基于内存增强潜在空间自回归的图像异常检测方法，属于计算机视觉中的异常检测领域。本申请包括：选择训练数据集；构建基于内存增强潜在空间自回归模型的网络结构；对训练数据集进行预处理；初始化所述基于内存增强潜在空间自回归模型；训练所述基于内存增强潜在空间自回归模型；在选取数据集上验证模型，并使用训练好的模型判断输入图像是否为异常图像。本申请不需设置先验分布从而不会破坏数据本身的分布，并且能够阻止模型重建异常图片，最终能够更好地判断出异常图像。

此外，可以理解的是，本申请的基于内存增强潜在空间自回归的图像异常检测方法是可以重现的，并且可以用在多种工业应用中。例如，本申请的基于内存增强潜在空间自回归的图像异常检测方法可以用于需要进行图像异常检测的应用。

Claims

基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，包括如下步骤：

步骤1、选择数据集，并将数据集划分成训练集和测试集；

步骤2、构建基于内存增强潜在空间自回归模型的网络结构；

步骤3、对训练集进行预处理；

步骤4、初始化所述基于内存增强潜在空间自回归模型；

步骤5、利用预处理后的训练集训练初始化后的基于内存增强潜在空间自回归模型；

步骤6、通过测试集验证训练好的基于内存增强潜在空间自回归模型，并使用训练好的基于内存增强潜在空间自回归模型判断输入图像是否为异常图像。
根据权利要求1所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤1中，所述数据集包括MNIST数据集和CIFAR10数据集。
根据权利要求1或2所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤2中，所述基于内存增强潜在空间自回归模型包括：自编码器、自回归模块和内存模块；

所述自编码器，包括编码器和解码器，自编码器通过编码器将图像压缩到潜在空间，学习到特征表达，然后使用解码器将潜在空间的特征表达解码回图像空间；

所述自回归模块，用于利用潜在空间的特征对数据进行建模，拟合真实分布，其拟合过程通过如下公式表示：

其中，p(z)为潜在空间分布，p(z _i|z _＜i)为条件概率分布，d表示特征向量z的维度，z _i表示特征向量z的第i维,z _＜i表示特征向量z小于第i维的部分；所述内存模块，用于保存潜在空间的特征表达，然后不属于该潜在空间的特征表达将被内存模块强行转换为内存中最相关的特征表达，其过程是：

其中，M为内存模块，
为内存模块对该特征的表达，w表示潜在空间与每一块内存的相似度，m _i表示内存模块的第i块内存，w _i表示特征向量z与m _i的相似性，N表示内存模块的大小，

其中，exp()表示以e为底的指数函数，||·||为取模运算,
为m _i的转置，m _j表示内存模块的第j块内存。
根据权利要求1至3中任一项所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤2中，所述网络结构中：

自编码器的编码器网络结构包括下采样模块、下采样模块和全连接层，每个块使用残差网络的结构，且由三个连续的卷积层+批标准化+激活函数结构级联组成；

自编码器的解码器网络结构包括全连接层、上采样模块、上采样模块和卷积层，每个块使用残差网络的结构，且由三个子结构分别为转置卷积层+批标准化+激活函数、卷积层+批标准化+激活函数、转置卷积层+批标准化+激活函数结构级联组成；

自回归模块网络结构是由多个自回归层组成；

其中，自编码器中编码器表达为数学模式为：z＝en(X)，解码器表达为数学模式为：
自回归模块z _dist＝H(z)和
作用于z，此时
根据权利要求4所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，所述自编码器对图片的处理过程包括如下步骤：

a、输入一张大小为N*N的图片，经过自编码器的编码阶段，经过一次下采样模块后基于内存增强潜在空间自回归模型的尺寸变小2倍，通道维度由1到32再到64，最后经过整平操作输入编码器中的全连接层，最终得到潜在空间z∈R ⁶⁴，此时

b、将z送入内存模块，取得z与每一块内存的相似度w，将w经过一次
操作后得到
最后通过内存表示

c、将z∈R ⁶⁴经过解码器的全连接层得到大小为
的特征，最终经过两次上采样模块还原为原有尺寸，上采样模块的通道维度变化为64到32再到16；

d、经过最后一个卷积层将特征还原到原有图像空间。
根据权利要求1至5中任一项所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤2具体包括以下步骤：

步骤201、选择训练集；

步骤202、分析训练集信息，所述训练集信息包括图像尺寸、图像强度和图像噪声；

步骤203、根据所得到的信息构建适用于当前数据的网络结构；

步骤204、将自编码器、自回归模块和内存模块组装在一起。
根据权利要求1至6中任一项所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤3具体包括以下步骤：

步骤301、读取图像数据；

步骤302、将图像尺寸调整到特定大小；

步骤303、处理一定量与整体数据的图像空间不同的图片，具体为：灰度空间转RGB空间以及RGB空间转灰度空间；

步骤304、对图像数据进行正则化操作。
根据权利要求1至7中任一项所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤4具体是指：使用不同的初始化方法对网络进行初始化，即：对自编码器和自回归模块使用随机初始化方式，对内存模块使用均匀分布初始化。
根据权利要求1至8中任一项所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤5具体包括以下步骤：

步骤501、加载预处理之后的数据；

步骤502、为自编码器、自回归模块和内存模块分别设置学习率；

步骤503、固定内存模块训练自回归模块；

步骤504、固定自回归模块训练内存模块；

步骤505、迭代进行步骤503和步骤504直至基于内存增强潜在空间自回归模型收敛。
根据权利要求1至9中任一项所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，在步骤5中，所述模型的损失函数为：

L＝L _rec+αL _llk+βL _mem；

其中，L _rec表示原图片与重建图片的重建损失，
表示负对数似然损失，
表示特征与内存模块的权重系数的熵，α，β分别表示损失函数的权重系数，用以平衡不同损失的比例。对于不同的数据集，α，β有所不同。对于MNIST和CIFAR10，α分别等于1、0.1，β分别等于0.0002、0.0002。
根据权利要求1至10中任一项所述的基于内存增强潜在空间自回归的图像异常检测方法，其特征在于，步骤6具体是指：使用训练好的基于内存增强潜在空间自回归模型，将图片输入基于内存增强潜在空间自回归模型，获取自回归模块输出的概率和自编码器重建图片与原图片的重建差异，分别作为两个分数，将两个分数相加得到最终分数,通过先前设定的阈值判定是否是异常图像。