CN114049332A - 异常检测方法及装置、电子设备和存储介质 - Google Patents
异常检测方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114049332A CN114049332A CN202111359576.3A CN202111359576A CN114049332A CN 114049332 A CN114049332 A CN 114049332A CN 202111359576 A CN202111359576 A CN 202111359576A CN 114049332 A CN114049332 A CN 114049332A
- Authority
- CN
- China
- Prior art keywords
- feature map
- feature
- abnormal
- original image
- diagram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 79
- 230000005856 abnormality Effects 0.000 title claims abstract description 20
- 238000010586 diagram Methods 0.000 claims abstract description 201
- 230000002159 abnormal effect Effects 0.000 claims abstract description 153
- 238000000034 method Methods 0.000 claims abstract description 68
- 238000013507 mapping Methods 0.000 claims abstract description 60
- 238000012545 processing Methods 0.000 claims description 107
- 230000002441 reversible effect Effects 0.000 claims description 106
- 238000006243 chemical reaction Methods 0.000 claims description 103
- 230000008878 coupling Effects 0.000 claims description 92
- 238000010168 coupling process Methods 0.000 claims description 92
- 238000005859 coupling reaction Methods 0.000 claims description 92
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 89
- 238000000605 extraction Methods 0.000 claims description 34
- 230000008569 process Effects 0.000 claims description 33
- 238000013519 translation Methods 0.000 claims description 22
- 238000003062 neural network model Methods 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 20
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000009826 distribution Methods 0.000 claims description 12
- 230000002547 anomalous effect Effects 0.000 claims description 5
- 230000002349 favourable effect Effects 0.000 abstract description 2
- 238000004590 computer program Methods 0.000 description 15
- 230000009286 beneficial effect Effects 0.000 description 14
- 230000000007 visual effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 7
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 238000012805 post-processing Methods 0.000 description 6
- 238000005070 sampling Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G06T3/02—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
本申请实施例提供了一种异常检测方法及装置、电子设备和存储介质,其中,该方法包括:对原始图像进行特征提取,得到第一特征图;将第一特征图映射为第二特征图;根据第二特征图,得到原始图像的异常热力图;根据异常热力图,得到原始图像的异常检测结果。本申请实施例有利于提升图像异常检测的精度。
Description
技术领域
本申请涉及计算机视觉技术领域,具体涉及一种异常检测方法及装置、电子设备和存储介质。
背景技术
计算机视觉领域的异常检测和定位的目的是识别和定位出图像中的异常区域,被广泛应用于工业缺陷检测、医学图像检测和安全检测等领域。目前主流的异常检测方法是基于深度学习进行异常定位,然而,由于异常样本的缺失使得在实践中收集和标注大量的异常数据变得十分困难,不利于训练出检测精度较高的模型。为解决这一问题,业内提出了无监督异常检测定位技术,无监督异常检测定位技术通过对正常样本建模,不采用任何标注信息检测并定位出图像中的异常区域,但是现有的无监督方法存在图像的特征空间信息丢失或全局信息被忽略的情况,导致异常检测的精度较低。
发明内容
本申请实施例提供了一种异常检测方法及装置、电子设备和存储介质,有利于提升图像异常检测的精度。
第一方面,本申请实施例提供一种异常检测方法,包括:
对原始图像进行特征提取,得到第一特征图;
将第一特征图映射为第二特征图;
根据第二特征图,得到原始图像的异常热力图;
根据异常热力图,得到原始图像的异常检测结果。
结合第一方面,在一些可能的实施方式中,将第一特征图映射为第二特征图,包括:
通过至少2次可逆转换处理,将第一特征图映射为第二特征图;
其中,至少2次可逆转换处理中的第r次可逆转换处理所采用的二维卷积核的尺寸与第(r+1)次可逆转换处理所采用的二维卷积核的尺寸不同。
结合第一方面,在一些可能的实施方式中,在第一特征图包括多层级的特征图的情况下,将第一特征图映射为第二特征图,包括:
对多层级的特征图进行尺度归一化,得到多个第一待拼接特征图,多个第一待拼接特征图与多层级的特征图一一对应;
将多个第一待拼接特征图拼接为第三特征图;
对于第三特征图,通过至少2次可逆转换处理,得到第二特征图。
结合第一方面,在一些可能的实施方式中,在第一特征图包括多层级的特征图的情况下,将第一特征图映射为第二特征图,包括:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第四特征图,多个第四特征图与多层级的特征图一一对应;
对多个第四特征图进行尺度归一化,得到多个第二待拼接特征图,多个第二待拼接特征图与多个第四特征图一一对应;
将多个第二待拼接特征图拼接为第五特征图;
对于第五特征图,通过至少2次可逆转换处理,得到第二特征图。
结合第一方面,在一些可能的实施方式中,第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;
根据第二特征图,得到原始图像的异常热力图,包括:
在通道维度,对第二特征图中位置对应的概率密度估计求平方和;
计算平方和的均值,得到待缩放特征图;
对待缩放特征图进行缩放,得到异常热力图。
结合第一方面,在一些可能的实施方式中,在第一特征图包括多层级的特征图的情况下,将第一特征图映射为第二特征图,包括:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第二特征图,多个第二特征图与多层级的特征图一一对应,多个第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;
根据第二特征图,得到原始图像的异常热力图,包括:
对于多个第二特征图中的每个第二特征图,在通道维度,对每个第二特征图中位置对应的概率密度估计求平方和;
根据平方和,得到异常热力图。
结合第一方面,在一些可能的实施方式中,根据平方和,得到异常热力图,包括:
计算平方和的均值,得到每个第二特征图对应的待归一化特征图;
对待归一化特征图进行尺度归一化,以及对尺度归一化后的特征图进行融合,得到异常热力图。
结合第一方面,在一些可能的实施方式中,至少2次可逆转换处理中的任意一次可逆转换处理,包括:
对于待执行可逆转换处理的目标特征图,将目标特征图分裂为通道数相等的第一子目标特征图和第二子目标特征图;
对于第一子目标特征图和第二子目标特征图,通过n次仿射耦合操作,得到第一待连接特征图,n为大于或等于1的整数;
将第一待连接特征图与第二待连接特征图连接,得到可逆转换后的特征图;
其中,在n等于1的情况下,第二待连接特征图为第一子目标特征图或第二子目标特征图;在n大于1的情况下,第二待连接特征图为n次仿射耦合操作中的第(n-1)次仿射耦合操作得到的特征图。
结合第一方面,在一些可能的实施方式中,n次仿射耦合操作中的任意一次仿射耦合操作,包括:
在任意一次仿射耦合操作为第1次仿射耦合操作的情况下,对第一子目标特征图或第二子目标特征图进行二维卷积处理,得到第一缩放系数和第一平移系数;
采用第一缩放系数和第一平移系数,将未进行二维卷积处理的第二子目标特征图或第一子目标特征图,与第1次仿射耦合操作中的二维卷积处理的输入进行线性组合,得到第1次仿射耦合操作的输出;
在任意一次仿射耦合操作为第m次仿射耦合操作的情况下,对第(m-1)次仿射耦合操作的输出进行二维卷积处理,得到第二缩放系数和第二平移系数,m为大于1且小于或等于n的整数;
采用第二缩放系数和第二平移系数,将第(m-1)次仿射耦合操作的输出与第(m-1)次仿射耦合操作中二维卷积处理的输入进行线性组合,得到第m次仿射耦合操作的输出。
结合第一方面,在一些可能的实施方式中,在第一特征图为单层级的特征图的情况下,第二特征图为对单层级的特征图进行映射得到的特征图,第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;
根据第二特征图,得到原始图像的异常热力图,包括:
在通道维度,对第二特征图中位置对应的概率密度估计求平方和;
计算平方和的均值,得到待缩放特征图;
对待缩放特征图进行缩放,得到异常热力图。
结合第一方面,在一些可能的实施方式中,异常热力图中的特征用于表示原始图像中对应位置的异常评分,根据异常热力图,得到原始图像的异常检测结果,包括:
获取异常评分与预设值的差值,预设值基于正常图像的分布参数确定;
根据异常评分与预设值的差值确定原始图像中的异常区域,得到异常检测结果。
结合第一方面,在一些可能的实施方式中,将第一特征图映射为第二特征图是通过神经网络模型执行的,神经网络模型采用以下步骤训练得到:
对正样本图像进行特征提取,得到第六特征图;
通过神经网络将第六特征图映射为第七特征图,第七特征图中的特征表示正样本图像中对应位置的特征的概率密度估计;
根据第七特征图中的概率密度估计确定目标损失;
基于目标损失对神经网络的参数进行调整,得到神经网络模型。
结合第一方面,在一些可能的实施方式中,根据第七特征图中的概率密度估计确定目标损失,包括:
根据第七特征图中的概率密度估计确定第六特征图中的特征的对数似然估计;
将第六特征图中的特征的负对数似然估计作为目标损失。
第二方面,本申请实施例提供一种异常检测装置,包括特征提取单元和处理单元,其中,
特征提取单元,用于对原始图像进行特征提取,得到第一特征图;
特征提取单元,还用于将所述第一特征图映射为第二特征图;
处理单元,用于根据第二特征图,得到原始图像的异常热力图;
处理单元,还用于根据异常热力图,得到原始图像的异常检测结果。
第三方面,本申请实施例提供一种电子设备,包括输入设备和输出设备,其特征在于,还包括处理器和计算机存储介质;
处理器,适于实现一条或多条指令;以及,
计算机存储介质,存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如上述第一方面所述的方法。
第四方面,本申请实施例提供一种计算机存储介质,计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面所述的方法。
第五方面,本申请实施例提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
实施本申请实施例,具有如下有益效果:
可以看出,在本申请实施例中,通过对原始图像进行特征提取,得到第一特征图;将第一特征图映射为第二特征图;根据第二特征图,得到原始图像的异常热力图;根据异常热力图,得到原始图像的异常检测结果。由于第一特征图有利于更好地捕获原始图像局部与全局的关系,同时,对第一特征图进行映射得到的第二特征图保留了原始图像的特征空间信息,这样基于原始图像局部与全局的关系、特征空间信息及对第二特征图进行后处理,得到的异常热力图能够更准确地表示出原始图像中的异常分布(或异常区域),从而有利于提升图像异常检测的精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用环境的架构图;
图2为本申请实施例提供的一种深度学习架构的示意图;
图3为本申请实施例提供的一种异常检测方法的流程示意图;
图4为本申请实施例提供的一种获取异常热力图的示意图;
图5为本申请实施例提供的另一种获取异常热力图的示意图;
图6为本申请实施例提供的另一种获取异常热力图的示意图;
图7为本申请实施例提供的另一种获取异常热力图的示意图;
图8为本申请实施例提供的一种可逆转换的示意图;
图9为本申请实施例提供的另一种异常检测方法的流程示意图;
图10为本申请实施例提供的一种异常检测装置的结构示意图;
图11为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例提供了一种异常检测方法,可基于图1所示的应用环境实施,如图1所示,该应用环境中至少可以包括图像采集设备101、用户设备102和电子设备103。其中,图像采集设备101、用户设备102和电子设备103通过有线或无线的网络连接,图像采集设备101可以是工业、医疗、安防等各领域中的图像采集装置,比如辅助医疗设备、深度相机、高铁线路巡检中的摄像机,等等,图像采集设备101可用于在特定场景中进行图像采集,并向电子设备103发送采集的原始图像,由电子设备103对该原始图像进行异常检测,比如提取出原始图像的多层级特征,对多层级特征进行可逆转换处理以将特征映射为概率密度估计,对概率密度估计进行后处理,基于经过后处理的概率密度估计定位出原始图像中的异常区域。
在一些实施例中,电子设备103中部署有神经网络模型,异常检测方法中的部分或全部步骤可通过神经网络模型执行,其中,用户设备102可用于向电子设备103提供正样本图像集,以使电子设备103通过正样本图像集对神经网络进行训练,并将训练好的神经网络模型部署在本地或其他设备。需要说明的是,神经网络模型的训练设备和调用设备可以是同一设备,也可以是不同设备,比如电子设备103可以是服务器集群中的设备,一设备在训练好神经网络模型后,可将其部署在集群中的其他设备上,由该其他设备调用该神经网络模型对图像进行异常检测。由于电子设备103在进行异常检测时,更好地捕获了原始图像局部信息与全局信息的关系,且保留了特征空间信息,因此,有利于提升异常检测的精度。
示例性的,电子设备103可以是独立的物理服务器、嵌入式设备、人工智能设备,也可以是服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器,本申请对此不作限定。
以下结合相关附图对本申请实施例提供的深度学习架构进行简要描述。
请参见图2,图2为本申请实施例提供的一种深度学习架构的示意图,如图2所示,该深度学习架构至少可以包括特征提取器和神经网络,其中,该神经网络可以是二维归一化流(FastFlow),该二维归一化流也可以称为二维卷积流,包括至少2个可逆转换块f,并且相邻的可逆转换模块中的卷积核尺寸不同。其中,特征提取器,用于对输入的图像进行特征提取,得到宽度为W、高度为H和通道数为C的特征图;二维归一化流,用于采用至少2个可逆转换块f对特征提取器输出的特征图进行处理,得到输入图像的特征的概率密度估计,示例性的,至少2个可逆转换块f可以采用3*3卷积和1*1卷积交替处理的方式(简称为大小卷积交替处理的方式),以保留原始图像的特征空间信息。其中,每个可逆转换块f中使用仿射耦合层对输入的特征进行映射。基于二维归一化流输出的概率密度估计,可将该概率密度估计进行后处理以得到异常热力图,将异常热力图中的异常评分与预设值进行比较,将图像中该异常评分无限趋近于预设值的区域确定为正常区域,将该异常评分远离于预设值的区域确定为异常区域。
可以看出,在本申请实施例提供的深度学习架构中,特征提取器能更好地捕获输入图像的局部信息和全局信息的关系,而二维归一化流采用大小卷积交替处理的方式有利于保留输入图像的特征空间信息,从而能够得到更准确的概率密度估计,进而有利于提升图像异常检测的精度。
以下结合相关附图对本申请实施例提供的异常检测方法进行详细阐述。
请参见图3,图3为本申请实施例提供的一种异常检测方法的流程示意图,该方法可基于图1所示的应用环境实施,且应用于电子设备,如图3所示,包括步骤301-304:
步骤301:对原始图像进行特征提取,得到第一特征图。
其中,原始图像是指医疗、工业等实际场景中采集的图像,应理解,在异常检测的特征提取方面,相关技术中通常采用滑动窗口方法对特征图逐块(patch)建模并利用位置编码加以区分,逐块建模需要大量的图像块进行模型训练和测试,计算复杂度相对较高,且由于是针对局部进行建模,容易丢失图像的全局信息,在后续的推理中难以充分利用到全局信息与局部信息的相关性。
本申请实施例中,采用残差网络(ResNet)或带有蒸馏令牌(token)的视觉转换器(Vision Transformers)作为特征提取器,比如,残差网络可以是resnet18网络、wide_resnet50_2网络等,视觉转换器可以是DeiT(Data-efficient image Transformers,数据高效的图像转换器)、CaiT(Going deeper with Image Transformers,更深的图像转换器)等。可选的,特征提取器还可以采用其他预训练分类网络、目标检测网络、分割网络、重构网络、图像修复网络和超分辨网络等各类任务网络,可扩展性强,可选的,特征提取器还可以是多种视觉转换器的组合。
需要说明的是,特征提取器可以是预先训练好的,其所采用的数据集不限于常见视觉任务数据集和公开数据集,还可以是某些私有数据集。
示例性的,由于视觉转换器具有全局的感受野,因此其拥有更强的捕获局部与全局关系的能力,在采用视觉转换器作为特征提取器的情况下,第一特征图可以是视觉转换器中某一隐藏层输出的特征图,即单层级的特征图。
示例性的,残差网络在捕获局部与全局关系方面的能力相对低于视觉转换器,在采用视觉转换器作为特征提取器的情况下,为了能够更好地捕获原始图像局部与全局的关系,第一特征图可以是残差网络中多个残差块输出的特征图,即多层级的特征图,比如,可以选取残差网络第1个残差块输出的特征图、第2个残差块输出的特征图和第3个残差块输出的特征图作为后续神经网络模型的输入,即二维归一化流模型的输入。
步骤302:将第一特征图映射为第二特征图。
本申请实施例中,将第一特征图映射为第二特征图实际上是对第一特征图进行可逆转换处理,以得到原始图像的特征的概率密度估计,即第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计。具体的,可逆转换处理可以通过二维归一化流模型完成,第一特征图中的特征经过至少2次可逆转换处理,即可得到对应的隐变量,该隐变量可作为对应特征的概率密度估计。
示例性的,将第一特征图映射为第二特征图,包括:
通过至少2次可逆转换处理,将第一特征图映射为第二特征图。
具体的,请继续参见图2,将第一特征图输入二维归一化流模型的第1个可逆转换块f1进行第1次可逆转换处理,输出为第1次可逆转换处理得到的概率密度估计,将第1次可逆转换处理得到的概率密度估计输入二维归一化流模型的第2个可逆转换块f2进行第2次可逆转换处理,输出为第2次可逆转换处理得到的概率密度估计,……,将第r次可逆转换处理得到的概率密度估计输入二维归一化流模型的第(r+1)个可逆转换块fr+1进行第(r+1)次可逆转换处理,输出为第(r+1)次可逆转换处理得到的概率密度估计,经过至少2次可逆转换处理,得到第二特征图。比如,可将第2次可逆转换处理输出的特征图或第2次可逆转换处理之后的任意一次可逆转换处理输出的特征图作为该第二特征图,具体视二维归一化流模型中可逆转换块f的数量而定。应理解,归一化流(Normalizing Flows,NF)主要用于学习数据分布之间的转换,其特殊性质是它们的转换过程是双向的,流模型可以在两个方向上使用。基于此,本申请对第一特征图的映射也应该是双向可逆的,假设第一特征图为X1、概率密度估计为Z,则将X1映射为Z应满足:
和
其中,H表示可逆转换后的特征图,K表示可逆转换块f的数量。
示例性的,至少2次可逆转换处理中的第r次可逆转换处理所采用的二维卷积核的尺寸与第(r+1)次可逆转换处理所采用的二维卷积核的尺寸不同。如图2所示,至少2个可逆转换块f所采用的二维卷积核的尺寸可以是3*3卷积和1*1卷积交替出现的方式。需要说明的是,交替出现旨在强调大小卷积核的交替出现,并不局限于3*3卷积和1*1卷积交替出现。
该实施方式中,对于特征提取器提取出的第一特征图,通过二维归一化流模型对其进行映射,模型内采用大小卷积核交替处理的方式,有利于保留原始图像的特征空间信息,从而有利于后续得到准确度更高的第一概率密度估计。
示例性的,在第一特征图为单层级的特征图的情况下,第二特征图为对单层级的特征图进行映射得到的特征图。具体的,请参见图4,对于3*256*256的原始图像,假设在特征提取阶段产生256*64*64的第一特征图,第一特征图经过二维归一化流模型中至少2个可逆转换块f的映射得到256*64*64的第二特征图。该实施方式中,在第一特征图为单层级的特征图的情况下,由于视觉转换器本身就具有优异的全局捕获能力,将其输出作为二维归一化流模型的输入,能够充分利用到原始图像的特征的局部与全局关系,从而有利于提升第一概率密度估计的准确度。
示例性的,在第一特征图包括多层级的特征图的情况下,将第一特征图映射为第二特征图,包括:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第二特征图,多个第二特征图与多层级的特征图一一对应,多个第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计。
具体的,请参见图5,对于3*256*256的原始图像,假设在特征提取阶段产生三个层级的第一特征图,尺度分别为256*64*64、512*32*32和1024*16*16,三个层级的第一特征图分别经过二维归一化流模型中至少2个可逆转换块f的映射得到尺度对应的多个第二特征图。该实施方式中,在第一特征图为多层级的特征图的情况下,多个二维归一化流模型并行对每个层级的特征图进行可逆转换处理,有利于提升推理速度。
示例性的,在第一特征图包括多层级的特征图的情况下,将第一特征图映射为第二特征图,包括:
对多层级的特征图进行尺度归一化,得到多个第一待拼接特征图,多个第一待拼接特征图与多层级的特征图一一对应;
将多个第一待拼接特征图拼接为第三特征图;
对于第三特征图,通过至少2次可逆转换处理,得到第二特征图。
具体的,请参见图6,对于3*256*256的原始图像,经过四个残差块的处理,产生三个层级的第一特征图,尺度分别为512*32*32、1024*16*16和2048*8*8,从三个第一特征图的尺度中确定出参考尺度,比如可以将16*16作为参考尺度,即1024*16*16的第一特征图可以保持不动,对512*32*32的第一特征图进行下采样,得到2048*16*16的第一待拼接特征图,对2048*8*8的第一特征图进行上采样,得到512*16*16的第一待拼接特征图,以及,将1024*16*16的目标第二特征图也作为第一待拼接特征图,然后将三个第一待拼接特征图拼接为(2048+1024+512)*16*16的第三特征图。该第三特征图经过二维归一化流模型中至少2个可逆转换块f的映射得到尺度对应的第二特征图。该实施方式中,在二维归一化流模型处理之前,对多层级的特征图进行归一化和拼接,有利于减少二维归一化流模型的数量,降低部署多个二维归一化流模型进行推理所带来的开销。
示例性的,在第一特征图包括多层级的特征图的情况下,将第一特征图映射为第二特征图,包括:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第四特征图,多个第四特征图与多层级的特征图一一对应;
对多个第四特征图进行尺度归一化,得到多个第二待拼接特征图,多个第二待拼接特征图与多个第四特征图一一对应;
将多个第二待拼接特征图拼接为第五特征图;
对于第五特征图,通过至少2次可逆转换处理,得到第二特征图。
具体的,请参见图7,对于3*256*256的原始图像,经过四个残差块的处理,产生三个层级的第一特征图,尺度分别为512*32*32、1024*16*16和2048*8*8,三个层级的第一特征图分别经过二维归一化流模型中至少2个可逆转换块f的映射得到尺度对应的三个第四特征图。从三个第四特征图的尺度中确定出参考尺度,比如可以将16*16作为参考尺度,即1024*16*16的第四特征图可以保持不动,对512*32*32的第四特征图进行下采样,得到2048*16*16的第二待拼接特征图,对2048*8*8的第四特征图进行上采样,得到512*16*16的第二待拼接特征图,以及,将1024*16*16的第四特征图也作为第二待拼接特征图,然后将三个第二待拼接特征图拼接为(2048+1024+512)*16*16的第五特征图。第五特征图经过二维归一化流模型中至少2个可逆转换块f的映射得到尺度对应的第二特征图。
该实施方式中,在第一特征图为多层级的特征图的情况下,多个二维归一化流模型并行对每个层级的特征图进行可逆转换处理,有利于提升推理速度,另外,在二维归一化流模型内对多尺度特征图进行归一化、拼接,有利于充分利用多层级的特征进行概率密度的估计,在对多尺度特征图进行归一化、拼接后还可再利用二维归一化流模型对特征图进行处理,模型设置的灵活性高,不仅适用于多输入多输出,还适用于多输入单输出。
需要说明的是,由于二维归一化流模型从输入到输出的“流”具有可逆性,因此,对目标第二特征图进行下采样和上采样也应具有可逆性。
示例性的,至少2次可逆转换处理中的任意一次可逆转换处理,包括:
对于待执行可逆转换处理的目标特征图,将目标特征图分裂为通道数相等的第一子目标特征图和第二子目标特征图;
对于第一子目标特征图和第二子目标特征图,通过n次仿射耦合操作,得到第一待连接特征图,n为大于或等于1的整数;
将第一待连接特征图与第二待连接特征图连接,得到可逆转换后的特征图;
其中,在n等于1的情况下,第二待连接特征图为第一子目标特征图或第二子目标特征图;在n大于1的情况下,第二待连接特征图为n次仿射耦合操作中的第(n-1)次仿射耦合操作得到的特征图。
具体的,请参见图8,图8示出了每一个可逆转换块f中的处理流程,仿射耦合层中对于输入的目标特征图y,比如:目标特征图y可以是第一特征图、第三特征图或第五特征图,先通过具有数据依赖初始化的缩放和偏置层(Actnorm)进行零初始化,再进行通道变换(Channel Permute),然后将其分裂(Split)为通道数均为C/2的第一子目标特征图ya和第二子目标特征图yb,其公式表示为:
ya,yb=Split(y),
对于输入ya和yb,通过n次仿射耦合操作进行处理,将最后一次仿射耦合操作的输出作为第一待连接特征图,当仅采用1次仿射耦合操作时,将其输出的第一待连接特征图与ya或yb连接(concat),即完成一次可逆转换处理。比如:当仿射耦合操作中是对ya进行二维卷积处理,则将第一待连接特征图与ya连接,此时第二待连接特征图为ya;当仿射耦合操作中是对yb进行二维卷积处理,则将第一待连接特征图与yb连接,此时第二待连接特征图为yb。当采用n次仿射耦合操作时,将第n次仿射耦合操作输出的第一待连接特征图与第(n-1)次仿射耦合操作输出的特征图连接,即完成一次可逆转换处理,此时,第二待连接特征图为第(n-1)次仿射耦合操作得到的特征图。
示例性的,将第一待连接特征图与第二待连接特征图连接可以是基于通道进行特征图的拼接。
示例性的,n次仿射耦合操作中的任意一次仿射耦合操作,包括:
在任意一次仿射耦合操作为第1次仿射耦合操作的情况下,对第一子目标特征图或第二子目标特征图进行二维卷积处理,得到第一缩放系数和第一平移系数;
采用第一缩放系数和第一平移系数,将未进行二维卷积处理的第二子目标特征图或第一子目标特征图,与第1次仿射耦合操作中的二维卷积处理的输入进行线性组合,得到第1次仿射耦合操作的输出;
在任意一次仿射耦合操作为第m次仿射耦合操作的情况下,对第(m-1)次仿射耦合操作的输出进行二维卷积处理,得到第二缩放系数和第二平移系数,m为大于1且小于或等于n的整数;
采用第二缩放系数和第二平移系数,将第(m-1)次仿射耦合操作的输出与第(m-1)次仿射耦合操作中二维卷积处理的输入进行线性组合,得到第m次仿射耦合操作的输出。
具体的,假设通过两个子网s(·)和b(·)对ya进行二维卷积得到第一缩放系数s1,以及第一平移系数b(ya),即图中的b1,对s1进行以自然对数底数e为底数的指数运算exp得到s(ya),yb为未经过二维卷积处理的特征图,利用s(ya)和b(ya)求取ya和yb的线性组合,其公式表示为:
y′b=s(ya)⊙yb+b(ya),
其中,y′b表示第1次仿射耦合操作的输出,当仅采用1次仿射耦合操作时,该y′b即可作为第一待连接特征图,将其与ya连接,即可得到可逆转换后的特征图,其公式表示为:
y′=concat(y′b,y′a),
其中,y′表示可逆转换后的特征图,y′a表示ya的恒等映射,concat(·)表示连接。
示例性的,当任意一次仿射耦合操作为第m次仿射耦合操作时,比如第2次仿射耦合操作,通过两个子网s(·)和b(·)对第1次仿射耦合操作的输出y′b进行二维卷积得到第二缩放系数s2和第二平移系数b2,对s2进行以自然对数底数e为底数的指数运算exp得到s(y′b),利用s(y′b)和b2求取y′b和第1次仿射耦合操作中二维卷积处理的输入ya的线性组合,得到第2次仿射耦合操作的输出。类似的,若存在更多的仿射耦合操作,则可参照第2次仿射耦合操作中的描述,此处不再赘述。
该实施方式中,由于现有归一化流在可逆转换处理中通常采用的是全连接网络,需要将特征从二维压缩到一维,这一定程度上破坏了输入特征图的空间位置关系,本申请实施例在两个子网s(·)和b(·)中采用二维卷积层进行二维卷积,有利于保留原始图像的特征的空间位置信息。另外,本申请实施例在二维归一化流模型中采用二维卷积层,使得模型支持以张量为输入,能够端到端实现张量概率密度的估计。
步骤303:根据第二特征图,得到原始图像的异常热力图。
示例性的,在第一特征图为单层级的特征图的情况下,对应于图4所示的实施例,对所有64*64的第二特征图中位置对应的概率密度估计求平方和,计算每个位置上的平方和的均值得到1*64*64的异常热力图,对该异常热力图进行缩放得到目标尺度的异常热力图,比如1*256*256的异常热力图,其中,缩放可以是上采样,具体可以是线性插值。其中,1*256*256的异常热力图中的特征用于表示原始图像中对应位置的异常评分。
示例性的,在第一特征图包括多层级的特征图的情况下,对应于图5所示的实施例,根据第二特征图,得到原始图像的异常热力图,包括:
对于多个第二特征图中的每个第二特征图,在通道维度,对每个第二特征图中位置对应的概率密度估计求平方和;
根据平方和,得到异常热力图。
示例性的,根据平方和,得到异常热力图,包括:
计算平方和的均值,得到每个第二特征图对应的待归一化特征图;
对待归一化特征图进行尺度归一化,以及对尺度归一化后的特征图进行融合,得到异常热力图。
具体的,对所有64*64的第二特征图中位置对应的概率密度估计求平方和,计算每个位置上的平方和的均值得到1*64*64的异常热力图;对所有32*32的第二特征图中位置对应的概率密度估计求平方和,计算每个位置上的平方和的均值得到1*32*32的异常热力图;对所有16*16的第二特征图中位置对应的概率密度估计求平方和,计算每个位置上的平方和的均值得到1*16*16的异常热力图。
其中,1*64*64的异常热力图、1*32*32的异常热力图和1*16*16的异常热力图即待归一化特征图,将待归一化特征图缩放至目标尺度,得到尺度归一化后的特征图,将其进行融合即可得到最终的异常热力图。其中,缩放可以是上采样,具体可以是线性插值,其中,目标尺度可以是原始图像的尺度(256*256),或者还可以是待归一化特征图的尺度,此处不作限定。
该实施方式中,对每个二维归一化流模型输出的多尺度的第二特征图进行缩放、融合,有利于充分利用多层级的特征进行概率密度的估计。
示例性的,在第一特征图包括多层级的特征图的情况下,对应于图6或图7所示的实施例,根据第二特征图,得到原始图像的异常热力图,包括:
在通道维度,对所述第二特征图中位置对应的概率密度估计求平方和;
计算所述平方和的均值,得到待缩放特征图;
对所述待缩放特征图进行缩放,得到所述异常热力图。
如图6或图7所示,经过二维归一化流模型的至少2次可逆转换处理,得到(2048+1024+512)*16*16的第二特征图,对所有16*16的第二特征图中位置对应的概率密度估计求平方和,计算每个位置上的平方和的均值得到1*16*16的异常热力图(即待缩放特征图),对该待缩放特征图进行缩放得到目标尺度的异常评分图,比如1*256*256的异常热力图,该1*256*256的异常热力图中的特征用于表示原始图像中对应位置的异常评分。其中,缩放可以是上采样,具体可以是线性插值。
应理解,本申请实施例中求平方和的均值的操作有利于消除通道数对计算第一概率密度估计的影响。
步骤304:根据异常热力图,得到原始图像的异常检测结果。
本申请实施例中,将异常热力图中的异常评分与预设值进行比较,以获取二者的差值,根据异常评分与预设值的差值确定原始图像中的异常区域,得到异常检测结果。其中,预设值是基于正常图像的分布参数确定的,比如:预设值可以是正常图像的正态分布的中心0,通过求取异常评分与0的差值,可将原始图像中异常评分趋近于0的区域确定为正常区域,将异常评分远大于0或远小于0的区域确定为异常区域。
可以看出,本申请实施例通过对原始图像进行特征提取,得到第一特征图;将第一特征图映射为第二特征图;根据第二特征图,得到原始图像的异常热力图;根据异常热力图,得到原始图像的异常检测结果。由于第一特征图有利于更好地捕获原始图像局部与全局的关系,同时,对第一特征图进行映射得到的第二特征图保留了原始图像的特征空间信息,这样基于原始图像局部与全局的关系、特征空间信息及对第二特征图进行后处理,得到的异常热力图能够更准确地表示出原始图像中的异常区域,从而有利于提升图像异常检测的精度。
请参见图9,图9为本申请实施例提供的另一种异常检测方法的流程示意图,同样可基于图1所示的应用环境实施,如图9所示,包括步骤901-904:
步骤901:对原始图像进行特征提取,得到第一特征图;
步骤902:通过至少2次可逆转换处理,将第一特征图映射为第二特征图;
其中,至少2次可逆转换处理中的第r次可逆转换处理所采用的二维卷积核的尺寸与第(r+1)次可逆转换处理所采用的二维卷积核的尺寸不同。
步骤903:根据第二特征图,得到原始图像的异常热力图;
步骤904:根据异常热力图,得到原始图像的异常检测结果。
其中,步骤901-904的具体实施方式在图3所示的实施例中已有相关说明,此处不再赘述。
示例性的,在对原始图像进行特征提取,得到第一特征图之前,该方法还包括:
对正样本图像进行特征提取,得到第六特征图;
通过神经网络将第六特征图映射为第七特征图,第七特征图中的特征表示正样本图像中对应位置的特征的概率密度估计;
根据第七特征图中的概率密度估计确定目标损失;
基于目标损失对神经网络的参数进行调整,得到神经网络模型。
其中,正样本图像可以是异常检测或定位数据集MVTec AD、BTAD BeanTech或CIFAR-10中的图像,可通过图2所示的特征提取器对正样本图像进行特征提取,应理解,特征提取器可以是残差网络或视觉转换器,第六特征图可以是单层级的特征图,也可以是多层级的特征图。
其中,神经网络是指包括至少2个可逆转换块f的二维归一化流,将第六特征图输入二维归一化流进行至少2次可逆转换处理,得到第七特征图,即通过至少2个可逆转换块f将第六特征图X2中的特征x映射到均值为0、方差为1的正态分布Q,以得到正样本图像的特征的概率密度估计q,其目的在于让模型学习正样本图像(即正常图像)的分布。
示例性的,根据第七特征图中的概率密度估计确定目标损失,包括:
根据第七特征图中的概率密度估计确定第六特征图中的特征的对数似然估计;
将第六特征图中的特征的负对数似然估计作为目标损失。
应理解,若第六特征图X2中的特征x满足分布px,第七特征图中的概率密度估计q满足已知分布pz,将x映射为q表示为f(x)=q,根据变量替换法则有:
其中,x∈pX2(x),q∈pQ(q),表示将x映射为q的情况下,二维归一化流的雅可比行列式,log pX2(x)表示x的对数似然估计,log pQ(q)表示q的对数似然估计。最大化x的对数似然估计,即最小化其负数,将x的负对数似然估计作为目标损失L(x),其公式表示为:
其中,二维归一化流对第六特征图X2的映射,即对第六特征图X2进行可逆转换处理的过程,可参见图3所示的实施例中对第一特征图进行可逆转换处理的描述。
可以看出,本申请实施例通过对原始图像进行特征提取,得到第一特征图;将第一特征图映射为第二特征图;根据第二特征图,得到原始图像的异常热力图;根据异常热力图,得到原始图像的异常检测结果。由于第一特征图有利于更好地捕获原始图像局部与全局的关系,同时,对第一特征图进行映射得到的第二特征图保留了原始图像的特征空间信息,这样基于原始图像局部与全局的关系、特征空间信息及对第二特征图进行后处理,得到的异常热力图能够更准确地表示出原始图像中的异常区域,从而有利于提升图像异常检测的精度。
基于上述方法实施例的描述,本申请实施例还提供一种异常检测装置,请参见图10,图10为本申请实施例提供的一种异常检测装置的结构示意图,如图10所示,该装置包括特征提取单元1001和处理单元1002;其中,
特征提取单元1001,用于对原始图像进行特征提取,得到第一特征图;
特征提取单元1001,还用于将第一特征图映射为第二特征图;
处理单元1002,用于根据第二特征图,得到原始图像的异常热力图;
处理单元1002,还用于根据异常热力图,得到原始图像的异常检测结果。
可以看出,在图10所示的装置中,通过对原始图像进行特征提取,得到第一特征图;将第一特征图映射为第二特征图;根据第二特征图,得到原始图像的异常热力图;根据异常热力图,得到原始图像的异常检测结果。由于第一特征图有利于更好地捕获原始图像局部与全局的关系,同时,对第一特征图进行映射得到的第二特征图保留了原始图像的特征空间信息,这样基于原始图像局部与全局的关系、特征空间信息及对第二特征图进行后处理,得到的异常热力图能够更准确地表示出原始图像中的异常区域,从而有利于提升图像异常检测的精度。
在一种可能的实施方式中,在将第一特征图映射为第二特征图方面,特征提取单元1001具体用于:
通过至少2次可逆转换处理,将第一特征图映射为第二特征图;
其中,至少2次可逆转换处理中的第r次可逆转换处理所采用的二维卷积核的尺寸与第(r+1)次可逆转换处理所采用的二维卷积核的尺寸不同。
在一种可能的实施方式中,在第一特征图包括多层级的特征图的情况下,在将第一特征图映射为第二特征图方面,特征提取单元1001具体用于:
对多层级的特征图进行尺度归一化,得到多个第一待拼接特征图,多个第一待拼接特征图与多层级的特征图一一对应;
将多个第一待拼接特征图拼接为第三特征图;
对于第三特征图,通过至少2次可逆转换处理,得到第二特征图。
在一种可能的实施方式中,在第一特征图包括多层级的特征图的情况下,在将第一特征图映射为第二特征图方面,特征提取单元1001具体用于:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第四特征图,多个第四特征图与多层级的特征图一一对应;
对多个第四特征图进行尺度归一化,得到多个第二待拼接特征图,多个第二待拼接特征图与多个第四特征图一一对应;
将多个第二待拼接特征图拼接为第五特征图;
对于第五特征图,通过至少2次可逆转换处理,得到第二特征图。
在一种可能的实施方式中,第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;在根据第二特征图,得到原始图像的异常热力图方面,处理单元1002具体用于:
在通道维度,对第二特征图中位置对应的概率密度估计求平方和;
计算平方和的均值,得到待缩放特征图;
对待缩放特征图进行缩放,得到异常热力图。
在一种可能的实施方式中,在第一特征图包括多层级的特征图的情况下,在将第一特征图映射为第二特征图方面,特征提取单元1001具体用于:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第二特征图,多个第二特征图与多层级的特征图一一对应,多个第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;
在根据第二特征图,得到原始图像的异常热力图方面,处理单元1002具体用于:
对于多个第二特征图中的每个第二特征图,在通道维度,对每个第二特征图中位置对应的概率密度估计求平方和;
根据平方和,得到异常热力图。
在一种可能的实施方式中,在根据平方和,得到异常热力图方面,处理单元1002具体用于:
计算平方和的均值,得到每个第二特征图对应的待归一化特征图;
对待归一化特征图进行尺度归一化,以及对尺度归一化后的特征图进行融合,得到异常热力图。
在一种可能的实施方式中,在执行至少2次可逆转换处理中的任意一次可逆转换处理方面,特征提取单元1001具体用于:
对于待执行可逆转换处理的目标特征图,将目标特征图分裂为通道数相等的第一子目标特征图和第二子目标特征图;
对于第一子目标特征图和第二子目标特征图,通过n次仿射耦合操作,得到第一待连接特征图,n为大于或等于1的整数;
将第一待连接特征图与第二待连接特征图连接,得到可逆转换后的特征图;
其中,在n等于1的情况下,第二待连接特征图为第一子目标特征图或第二子目标特征图;在n大于1的情况下,第二待连接特征图为n次仿射耦合操作中的第(n-1)次仿射耦合操作得到的特征图。
在一种可能的实施方式中,在执行n次仿射耦合操作中的任意一次仿射耦合操作方面,特征提取单元1001具体用于:
在任意一次仿射耦合操作为第1次仿射耦合操作的情况下,对第一子目标特征图或第二子目标特征图进行二维卷积处理,得到第一缩放系数和第一平移系数;
采用第一缩放系数和第一平移系数,将未进行二维卷积处理的第二子目标特征图或第一子目标特征图,与第1次仿射耦合操作中的二维卷积处理的输入进行线性组合,得到第1次仿射耦合操作的输出;
在任意一次仿射耦合操作为第m次仿射耦合操作的情况下,对第(m-1)次仿射耦合操作的输出进行二维卷积处理,得到第二缩放系数和第二平移系数,m为大于1且小于或等于n的整数;
采用第二缩放系数和第二平移系数,将第(m-1)次仿射耦合操作的输出与第(m-1)次仿射耦合操作中二维卷积处理的输入进行线性组合,得到第m次仿射耦合操作的输出。
在一种可能的实施方式中,在第一特征图为单层级的特征图的情况下,第二特征图为对单层级的特征图进行映射得到的特征图,第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;在根据第二特征图,得到原始图像的异常热力图方面,处理单元1002具体用于:
在通道维度,对第二特征图中位置对应的概率密度估计求平方和;
计算平方和的均值,得到待缩放特征图;
对待缩放特征图进行缩放,得到异常热力图。
在一种可能的实施方式中,异常热力图中的特征用于表示原始图像中对应位置的异常评分,在根据异常热力图,得到原始图像的异常检测结果方面,处理单元1002具体用于:
获取异常评分与预设值的差值,预设值基于正常图像的分布参数确定;
根据异常评分与预设值的差值确定原始图像中的异常区域,得到异常检测结果。
在一种可能的实施方式中,对第一特征图进行特征提取,得到第二特征图是通过神经网络模型执行的,处理单元1002还用于:
对正样本图像进行特征提取,得到第六特征图;
通过神经网络将第六特征图映射为第七特征图,第七特征图中的特征表示正样本图像中对应位置的特征的概率密度估计;
根据第七特征图中的概率密度估计确定目标损失;
基于目标损失对神经网络的参数进行调整,得到神经网络模型。
在一种可能的实施方式中,在根据第七特征图中的概率密度估计确定目标损失方面,处理单元1002还用于:
根据第七特征图中的概率密度估计确定第六特征图中的特征的对数似然估计;
将第六特征图中的特征的负对数似然估计作为目标损失。
根据本申请的一个实施例,图10所示的异常检测装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,基于异常检测装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的另一个实施例,可以通过在包括中央处理单元(或称CPU(CentralProcessing Unit,中央处理器))、随机存取存储介质(RAM,Random Access Memory)、只读存储介质(ROM,Read-Only Memory)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图3或图9中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图10中所示的异常检测装置设备,以及来实现本申请实施例的异常检测方法。所述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
基于上述方法实施例和装置实施例的描述,本申请实施例还提供一种电子设备。请参见图11,该电子设备至少包括处理器1101、输入设备1102、输出设备1103以及计算机存储介质1104。其中,电子设备内的处理器1101、输入设备1102、输出设备1103以及计算机存储介质1104可通过总线或其他方式连接。
计算机存储介质1104可以存储在电子设备的存储器中,所述计算机存储介质1104用于存储计算机程序,所述计算机程序包括程序指令,所述处理器1101用于执行所述计算机存储介质1104存储的程序指令。处理器1101是电子设备的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能。
在一个实施例中,本申请实施例提供的电子设备的处理器1101可以用于进行一系列异常检测处理:
对原始图像进行特征提取,得到第一特征图;
将第一特征图映射为第二特征图;
根据第二特征图,得到原始图像的异常热力图;
根据异常热力图,得到原始图像的异常检测结果。
可以看出,在图11所示的电子设备中,通过对原始图像进行特征提取,得到第一特征图;将第一特征图映射为第二特征图;根据第二特征图,得到原始图像的异常热力图;根据异常热力图,得到原始图像的异常检测结果。由于第一特征图有利于更好地捕获原始图像局部与全局的关系,同时,对第一特征图进行映射得到的第二特征图保留了原始图像的特征空间信息,这样基于原始图像局部与全局的关系、特征空间信息及对第二特征图进行后处理,得到的异常热力图能够更准确地表示出原始图像中的异常区域,从而有利于提升图像异常检测的精度。
再一个实施例中,处理器1101执行将第一特征图映射为第二特征图,包括:
通过至少2次可逆转换处理,将第一特征图映射为第二特征图;
其中,至少2次可逆转换处理中的第r次可逆转换处理所采用的二维卷积核的尺寸与第(r+1)次可逆转换处理所采用的二维卷积核的尺寸不同。
再一个实施例中,在第一特征图包括多层级的特征图的情况下,处理器1101执行将第一特征图映射为第二特征图,包括:
对多层级的特征图进行尺度归一化,得到多个第一待拼接特征图,多个第一待拼接特征图与多层级的特征图一一对应;
将多个第一待拼接特征图拼接为第三特征图;
对于第三特征图,通过至少2次可逆转换处理,得到第二特征图。
再一个实施例中,在第一特征图包括多层级的特征图的情况下,处理器1101执行将第一特征图映射为第二特征图,包括:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第四特征图,多个第四特征图与多层级的特征图一一对应;
对多个第四特征图进行尺度归一化,得到多个第二待拼接特征图,多个第二待拼接特征图与多个第四特征图一一对应;
将多个第二待拼接特征图拼接为第五特征图;
对于第五特征图,通过至少2次可逆转换处理,得到第二特征图。
再一个实施例中,第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;处理器1101执行根据第二特征图,得到原始图像的异常热力图,包括:
在通道维度,对第二特征图中位置对应的概率密度估计求平方和;
计算平方和的均值,得到待缩放特征图;
对待缩放特征图进行缩放,得到异常热力图。
再一个实施例中,在第一特征图包括多层级的特征图的情况下,处理器1101执行将第一特征图映射为第二特征图,包括:
对于多层级的特征图,通过至少两次可逆转换处理,得到多个第二特征图,多个第二特征图与多层级的特征图一一对应,多个第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;
处理器1101执行根据第二特征图,得到原始图像的异常热力图,包括:
对于多个第二特征图中的每个第二特征图,在通道维度,对每个第二特征图中位置对应的概率密度估计求平方和;
根据平方和,得到异常热力图。
再一个实施例中,处理器1101执行根据平方和,得到异常热力图,包括:
计算平方和的均值,得到每个第二特征图对应的待归一化特征图;
对待归一化特征图进行尺度归一化,以及对尺度归一化后的特征图进行融合,得到异常热力图。
再一个实施例中,处理器1101执行至少2次可逆转换处理中的任意一次可逆转换处理,包括:
对于待执行可逆转换处理的目标特征图,将目标特征图分裂为通道数相等的第一子目标特征图和第二子目标特征图;
对于第一子目标特征图和第二子目标特征图,通过n次仿射耦合操作,得到第一待连接特征图,n为大于或等于1的整数;
将第一待连接特征图与第二待连接特征图连接,得到可逆转换后的特征图;
其中,在n等于1的情况下,第二待连接特征图为第一子目标特征图或第二子目标特征图;在n大于1的情况下,第二待连接特征图为n次仿射耦合操作中的第(n-1)次仿射耦合操作得到的特征图。
再一个实施例中,处理器1101执行n次仿射耦合操作中的任意一次仿射耦合操作,包括:
在任意一次仿射耦合操作为第1次仿射耦合操作的情况下,对第一子目标特征图或第二子目标特征图进行二维卷积处理,得到第一缩放系数和第一平移系数;
采用第一缩放系数和第一平移系数,将未进行二维卷积处理的第二子目标特征图或第一子目标特征图,与第1次仿射耦合操作中的二维卷积处理的输入进行线性组合,得到第1次仿射耦合操作的输出;
在任意一次仿射耦合操作为第m次仿射耦合操作的情况下,对第(m-1)次仿射耦合操作的输出进行二维卷积处理,得到第二缩放系数和第二平移系数,m为大于1且小于或等于n的整数;
采用第二缩放系数和第二平移系数,将第(m-1)次仿射耦合操作的输出与第(m-1)次仿射耦合操作中二维卷积处理的输入进行线性组合,得到第m次仿射耦合操作的输出。
再一个实施例中,在第一特征图为单层级的特征图的情况下,第二特征图为对单层级的特征图进行映射得到的特征图,第二特征图中的特征表示原始图像中对应位置的特征的概率密度估计;处理器1101执行根据第二特征图,得到原始图像的异常热力图,包括:
在通道维度,对第二特征图中位置对应的概率密度估计求平方和;
计算平方和的均值,得到待缩放特征图;
对待缩放特征图进行缩放,得到异常热力图。
再一个实施例中,异常热力图中的特征用于表示原始图像中对应位置的异常评分,处理器1101执行根据异常热力图,得到原始图像的异常检测结果,包括:
获取异常评分与预设值的差值,预设值基于正常图像的分布参数确定;
根据异常评分与预设值的差值确定原始图像中的异常区域,得到异常检测结果。
再一个实施例中,对第一特征图进行特征提取,得到第二特征图是通过神经网络模型执行的,处理器1101执行神经网络模型的训练,包括:
对正样本图像进行特征提取,得到第六特征图;
通过神经网络将第六特征图映射为第七特征图,第七特征图中的特征表示正样本图像中对应位置的特征的概率密度估计;
根据第七特征图中的概率密度估计确定目标损失;
基于目标损失对神经网络的参数进行调整,得到神经网络模型。
再一个实施例中,处理器1101执行根据第七特征图中的概率密度估计确定目标损失,包括:
根据第七特征图中的概率密度估计确定第六特征图中的特征的对数似然估计;
将第六特征图中的特征的负对数似然估计作为目标损失。
示例性的,电子设备可包括但不仅限于处理器1101、输入设备1102、输出设备1103以及计算机存储介质1104,输入设备1102可以是键盘、触摸屏等,输出设备1103可以是扬声器、显示器、射频发送器等。本领域技术人员可以理解,所述示意图仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
需要说明的是,由于电子设备的处理器1101执行计算机程序时实现上述的异常检测方法中的步骤,因此上述异常检测方法的实施例均适用于该电子设备,且均能达到相同或相似的有益效果。
本申请实施例还提供了一种计算机存储介质(Memory),所述计算机存储介质是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端中的内置存储介质,当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器1101加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的,还可以是至少一个位于远离前述处理器1101的计算机可读存储介质。在一个实施例中,可由处理器1101加载并执行计算机存储介质中存放的一条或多条指令,以实现上述有关异常检测方法的相应步骤。
示例性的,计算机存储介质的计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、ROM、RAM、电载波信号、电信信号以及软件分发介质等。
需要说明的是,由于计算机存储介质的计算机程序被处理器执行时实现上述的异常检测方法中的步骤,因此上述异常检测方法的所有实施例均适用于该计算机存储介质,且均能达到相同或相似的有益效果。
本申请实施例还提供了一种计算机程序产品,其中,上述计算机程序产品包括计算机程序,上述计算机程序可操作来使计算机执行如上述异常检测方法中的步骤。该计算机程序产品可以为一个软件安装包。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (16)
1.一种异常检测方法,其特征在于,所述方法包括:
对原始图像进行特征提取,得到第一特征图;
将所述第一特征图映射为第二特征图;
根据所述第二特征图,得到所述原始图像的异常热力图;
根据所述异常热力图,得到所述原始图像的异常检测结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一特征图映射为第二特征图,包括:
通过至少2次可逆转换处理,将所述第一特征图映射为所述第二特征图;
其中,所述至少2次可逆转换处理中的第r次可逆转换处理所采用的二维卷积核的尺寸与第(r+1)次可逆转换处理所采用的二维卷积核的尺寸不同。
3.根据权利要求1或2所述的方法,其特征在于,在所述第一特征图包括多层级的特征图的情况下,所述将所述第一特征图映射为第二特征图,包括:
对所述多层级的特征图进行尺度归一化,得到多个第一待拼接特征图,所述多个第一待拼接特征图与所述多层级的特征图一一对应;
将所述多个第一待拼接特征图拼接为第三特征图;
对于所述第三特征图,通过至少2次可逆转换处理,得到所述第二特征图。
4.根据权利要求1或2所述的方法,其特征在于,在所述第一特征图包括多层级的特征图的情况下,所述将所述第一特征图映射为第二特征图,包括:
对于所述多层级的特征图,通过至少两次可逆转换处理,得到多个第四特征图,所述多个第四特征图与所述多层级的特征图一一对应;
对所述多个第四特征图进行尺度归一化,得到多个第二待拼接特征图,所述多个第二待拼接特征图与所述多个第四特征图一一对应;
将所述多个第二待拼接特征图拼接为第五特征图;
对于所述第五特征图,通过至少2次可逆转换处理,得到所述第二特征图。
5.根据权利要求3或4所述的方法,其特征在于,所述第二特征图中的特征表示所述原始图像中对应位置的特征的概率密度估计;
所述根据所述第二特征图,得到所述原始图像的异常热力图,包括:
在通道维度,对所述第二特征图中位置对应的概率密度估计求平方和;
计算所述平方和的均值,得到待缩放特征图;
对所述待缩放特征图进行缩放,得到所述异常热力图。
6.根据权利要求1或2所述的方法,其特征在于,在所述第一特征图包括多层级的特征图的情况下,所述将所述第一特征图映射为第二特征图,包括:
对于所述多层级的特征图,通过至少两次可逆转换处理,得到多个第二特征图,所述多个第二特征图与所述多层级的特征图一一对应,所述多个第二特征图中的特征表示所述原始图像中对应位置的特征的概率密度估计;
所述根据所述第二特征图,得到所述原始图像的异常热力图,包括:
对于所述多个第二特征图中的每个第二特征图,在通道维度,对所述每个第二特征图中位置对应的概率密度估计求平方和;
根据所述平方和,得到所述异常热力图。
7.根据权利要求6所述的方法,其特征在于,所述根据所述平方和,得到所述异常热力图,包括:
计算所述平方和的均值,得到所述每个第二特征图对应的待归一化特征图;
对所述待归一化特征图进行尺度归一化,以及对尺度归一化后的特征图进行融合,得到所述异常热力图。
8.根据权利要求2-4或6中任一项所述的方法,其特征在于,所述至少2次可逆转换处理中的任意一次可逆转换处理,包括:
对于待执行可逆转换处理的目标特征图,将所述目标特征图分裂为通道数相等的第一子目标特征图和第二子目标特征图;
对于所述第一子目标特征图和所述第二子目标特征图,通过n次仿射耦合操作,得到第一待连接特征图,n为大于或等于1的整数;
将所述第一待连接特征图与第二待连接特征图连接,得到可逆转换后的特征图;
其中,在n等于1的情况下,所述第二待连接特征图为所述第一子目标特征图或所述第二子目标特征图;在n大于1的情况下,所述第二待连接特征图为所述n次仿射耦合操作中的第(n-1)次仿射耦合操作得到的特征图。
9.根据权利要求8所述的方法,其特征在于,所述n次仿射耦合操作中的任意一次仿射耦合操作,包括:
在所述任意一次仿射耦合操作为第1次仿射耦合操作的情况下,对所述第一子目标特征图或所述第二子目标特征图进行二维卷积处理,得到第一缩放系数和第一平移系数;
采用所述第一缩放系数和所述第一平移系数,将未进行二维卷积处理的所述第二子目标特征图或所述第一子目标特征图,与所述第1次仿射耦合操作中的二维卷积处理的输入进行线性组合,得到所述第1次仿射耦合操作的输出;
在所述任意一次仿射耦合操作为第m次仿射耦合操作的情况下,对第(m-1)次仿射耦合操作的输出进行二维卷积处理,得到第二缩放系数和第二平移系数,m为大于1且小于或等于n的整数;
采用所述第二缩放系数和所述第二平移系数,将所述第(m-1)次仿射耦合操作的输出与所述第(m-1)次仿射耦合操作中二维卷积处理的输入进行线性组合,得到所述第m次仿射耦合操作的输出。
10.根据权利要求1或2所述的方法,其特征在于,在所述第一特征图为单层级的特征图的情况下,所述第二特征图为对所述单层级的特征图进行映射得到的特征图,所述第二特征图中的特征表示所述原始图像中对应位置的特征的概率密度估计;
所述根据所述第二特征图,得到所述原始图像的异常热力图,包括:
在通道维度,对所述第二特征图中位置对应的概率密度估计求平方和;
计算所述平方和的均值,得到待缩放特征图;
对所述待缩放特征图进行缩放,得到所述异常热力图。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述异常热力图中的特征用于表示所述原始图像中对应位置的异常评分,所述根据所述异常热力图,得到所述原始图像的异常检测结果,包括:
获取所述异常评分与预设值的差值,所述预设值基于正常图像的分布参数确定;
根据所述异常评分与所述预设值的差值确定所述原始图像中的异常区域,得到所述异常检测结果。
12.根据权利要求1-11任一项所述的方法,其特征在于,所述将所述第一特征图映射为第二特征图是通过神经网络模型执行的,所述神经网络模型采用以下步骤训练得到:
对正样本图像进行特征提取,得到第六特征图;
通过神经网络将所述第六特征图映射为第七特征图,所述第七特征图中的特征表示所述正样本图像中对应位置的特征的概率密度估计;
根据所述第七特征图中的概率密度估计确定目标损失;
基于所述目标损失对所述神经网络的参数进行调整,得到所述神经网络模型。
13.根据权利要求12所述的方法,其特征在于,所述根据所述第七特征图中的概率密度估计确定目标损失,包括:
根据所述第七特征图中的概率密度估计确定所述第六特征图中的特征的对数似然估计;
将所述第六特征图中的特征的负对数似然估计作为所述目标损失。
14.一种异常检测装置,其特征在于,所述装置包括特征提取单元和处理单元,其中,
所述特征提取单元,用于对原始图像进行特征提取,得到第一特征图;
所述特征提取单元,还用于将所述第一特征图映射为第二特征图;
所述处理单元,用于根据所述第二特征图,得到所述原始图像的异常热力图;
所述处理单元,还用于根据所述异常热力图,得到所述原始图像的异常检测结果。
15.一种电子设备,其特征在于,包括输入设备和输出设备,其特征在于,还包括处理器和计算机存储介质;
所述处理器,适于实现一条或多条指令;以及,
所述计算机存储介质,存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如权利要求1-13任一项所述的方法。
16.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如权利要求1-13任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111359576.3A CN114049332A (zh) | 2021-11-16 | 2021-11-16 | 异常检测方法及装置、电子设备和存储介质 |
PCT/CN2022/092205 WO2023087636A1 (zh) | 2021-11-16 | 2022-05-11 | 异常检测方法及装置、电子设备、存储介质和计算机程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111359576.3A CN114049332A (zh) | 2021-11-16 | 2021-11-16 | 异常检测方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114049332A true CN114049332A (zh) | 2022-02-15 |
Family
ID=80209529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111359576.3A Pending CN114049332A (zh) | 2021-11-16 | 2021-11-16 | 异常检测方法及装置、电子设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114049332A (zh) |
WO (1) | WO2023087636A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114782694A (zh) * | 2022-06-21 | 2022-07-22 | 中国科学技术大学 | 无监督异常检测方法、系统、设备及存储介质 |
CN114820541A (zh) * | 2022-05-07 | 2022-07-29 | 武汉象点科技有限公司 | 基于重构网络的缺陷检测方法 |
CN115147669A (zh) * | 2022-06-24 | 2022-10-04 | 北京百度网讯科技有限公司 | 基于视觉转换器模型的图像处理方法、训练方法和设备 |
CN115147418A (zh) * | 2022-09-05 | 2022-10-04 | 东声(苏州)智能科技有限公司 | 缺陷检测模型的压缩训练方法和装置 |
WO2023087636A1 (zh) * | 2021-11-16 | 2023-05-25 | 上海商汤智能科技有限公司 | 异常检测方法及装置、电子设备、存储介质和计算机程序产品 |
CN117218457A (zh) * | 2023-11-07 | 2023-12-12 | 成都理工大学 | 一种基于双层二维归一化流的自监督工业异常检测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8131107B2 (en) * | 2008-05-12 | 2012-03-06 | General Electric Company | Method and system for identifying defects in NDT image data |
CN112907589A (zh) * | 2021-04-02 | 2021-06-04 | 联通(上海)产业互联网有限公司 | 一种检测异常并且分割图像中异常区域的深度学习算法 |
CN114049332A (zh) * | 2021-11-16 | 2022-02-15 | 上海商汤智能科技有限公司 | 异常检测方法及装置、电子设备和存储介质 |
-
2021
- 2021-11-16 CN CN202111359576.3A patent/CN114049332A/zh active Pending
-
2022
- 2022-05-11 WO PCT/CN2022/092205 patent/WO2023087636A1/zh unknown
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023087636A1 (zh) * | 2021-11-16 | 2023-05-25 | 上海商汤智能科技有限公司 | 异常检测方法及装置、电子设备、存储介质和计算机程序产品 |
CN114820541A (zh) * | 2022-05-07 | 2022-07-29 | 武汉象点科技有限公司 | 基于重构网络的缺陷检测方法 |
CN114782694A (zh) * | 2022-06-21 | 2022-07-22 | 中国科学技术大学 | 无监督异常检测方法、系统、设备及存储介质 |
CN114782694B (zh) * | 2022-06-21 | 2022-09-30 | 中国科学技术大学 | 无监督异常检测方法、系统、设备及存储介质 |
CN115147669A (zh) * | 2022-06-24 | 2022-10-04 | 北京百度网讯科技有限公司 | 基于视觉转换器模型的图像处理方法、训练方法和设备 |
CN115147418A (zh) * | 2022-09-05 | 2022-10-04 | 东声(苏州)智能科技有限公司 | 缺陷检测模型的压缩训练方法和装置 |
CN117218457A (zh) * | 2023-11-07 | 2023-12-12 | 成都理工大学 | 一种基于双层二维归一化流的自监督工业异常检测方法 |
CN117218457B (zh) * | 2023-11-07 | 2024-01-26 | 成都理工大学 | 一种基于双层二维归一化流的自监督工业异常检测方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2023087636A1 (zh) | 2023-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114049332A (zh) | 异常检测方法及装置、电子设备和存储介质 | |
US10902245B2 (en) | Method and apparatus for facial recognition | |
CN109977832B (zh) | 一种图像处理方法、装置及存储介质 | |
CN112465801B (zh) | 一种分尺度提取掩码特征的实例分割方法 | |
CN113269722A (zh) | 生成对抗网络的训练方法、及高分辨率图像重建方法 | |
CN115631112B (zh) | 一种基于深度学习的建筑轮廓矫正方法及装置 | |
CN114140346A (zh) | 一种图像处理方法及装置 | |
CN111275070B (zh) | 一种基于局部特征匹配的签名验证方法及设备 | |
CN114170438A (zh) | 神经网络训练的方法、电子设备及计算机存储介质 | |
CN114202473A (zh) | 一种基于多尺度特征和注意力机制的图像复原方法及装置 | |
CN110119736B (zh) | 车牌位置识别方法、装置及电子设备 | |
CN112132867B (zh) | 一种遥感影像变化检测方法及装置 | |
CN111353514A (zh) | 模型训练方法、图像识别方法、装置及终端设备 | |
Hua et al. | Dynamic scene deblurring with continuous cross-layer attention transmission | |
CN110414593B (zh) | 图像处理方法及装置、处理器、电子设备及存储介质 | |
CN111414823A (zh) | 人体特征点的检测方法、装置、电子设备以及存储介质 | |
CN114820755B (zh) | 一种深度图估计方法及系统 | |
CN111223046A (zh) | 一种图像超分辨率重建方法及装置 | |
Bricman et al. | CocoNet: A deep neural network for mapping pixel coordinates to color values | |
CN113378715B (zh) | 一种基于彩色人脸图像的活体检测方法及相关设备 | |
CN111368602A (zh) | 人脸图像模糊程度评价方法、装置、可读存储介质及设备 | |
CN116152542A (zh) | 图像分类模型的训练方法、装置、设备及存储介质 | |
CN113780305A (zh) | 一种基于两种线索交互的显著性目标检测方法 | |
CN110866431B (zh) | 人脸识别模型的训练方法、人脸识别的方法和装置 | |
CN115311542B (zh) | 一种目标检测方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40062793 Country of ref document: HK |