CN113888498A - 图像异常检测方法、装置、电子设备及存储介质 - Google Patents
图像异常检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113888498A CN113888498A CN202111147844.5A CN202111147844A CN113888498A CN 113888498 A CN113888498 A CN 113888498A CN 202111147844 A CN202111147844 A CN 202111147844A CN 113888498 A CN113888498 A CN 113888498A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- target
- detected
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 81
- 238000000605 extraction Methods 0.000 claims abstract description 132
- 238000012937 correction Methods 0.000 claims abstract description 89
- 238000010586 diagram Methods 0.000 claims abstract description 72
- 230000002159 abnormal effect Effects 0.000 claims abstract description 34
- 238000003702 image correction Methods 0.000 claims abstract description 30
- 239000013598 vector Substances 0.000 claims description 148
- 238000012545 processing Methods 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 36
- 230000009466 transformation Effects 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 33
- 230000005856 abnormality Effects 0.000 claims description 30
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 13
- 230000002349 favourable effect Effects 0.000 abstract description 6
- 238000004590 computer program Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 9
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 101100226898 Candida albicans (strain SC5314 / ATCC MYA-2876) FCA1 gene Proteins 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- UPRXAOPZPSAYHF-UHFFFAOYSA-N lithium;cyclohexyl(propan-2-yl)azanide Chemical compound CC(C)N([Li])C1CCCCC1 UPRXAOPZPSAYHF-UHFFFAOYSA-N 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种图像异常检测方法、装置、电子设备及存储介质,其中,该图像异常检测方法包括:对原始图像进行图像校正,得到第一待检测图像;对第一待检测图像进行特征提取与校正,得到第一目标特征图;根据第一目标特征图和正样本图像的特征图,得到异常检测结果。本申请实施例有利于提升图像异常检测的精度。
Description
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种图像异常检测方法、装置、电子设备及存储介质。
背景技术
计算机视觉技术作为近年来的研究热门,被广泛应用于社会各行业中,且在工业和医疗领域表现尤为突出。异常或缺陷检测是工业和医疗领域中难以避免的问题,比如工业质检的瑕疵品检测、辅助医疗影像检测等,异常检测的核心在于通过计算机视觉技术将正常图像和异常图像区分开,目前的主流做法是基于重建的方案学习正常样本的产生方式,以此在检测中确定出异常样本,或者,将异常检测作为一个单分类问题去进行异常分类和定位,然而这些方案在异常定位的精度上表现得并不理想,异常检测的精度相对较低。
发明内容
本申请实施例提供了一种图像异常检测方法、装置、电子设备及存储介质。
本申请实施例第一方面提供了一种图像异常检测方法,该方法包括:
对原始图像进行图像校正,得到第一待检测图像;
对第一待检测图像进行特征提取与校正,得到第一目标特征图;
根据第一目标特征图和正样本图像的特征图,得到异常检测结果。
结合第一方面,在一种可能的实施方式中,根据第一目标特征图和正样本图像的特征图,得到异常检测结果,包括:
获取正样本图像的特征图中,每个位置对应的目标高斯分布;
根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分;
将第一目标特征图中每个位置的异常得分组成的异常得分图,确定为异常检测结果。
结合第一方面,在一种可能的实施方式中,根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分,包括:
计算第一目标特征图中每个位置的特征与对应于该位置的目标高斯分布的第一距离;
将第一距离确定为第一目标特征图中每个位置的异常得分。
结合第一方面,在一种可能的实施方式中,对原始图像进行图像校正,得到第一待检测图像,包括:
获取第一变换矩阵;
采用第一变换矩阵对原始图像进行对准,得到第一待检测图像。
结合第一方面,在一种可能的实施方式中,对第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对第一待检测图像进行特征提取,得到待校正特征图;
获取第二变换矩阵;
采用第二变换矩阵对待校正特征图进行对准,得到第一特征图;
基于第一特征图得到第一目标特征图。
结合第一方面,在一种可能的实施方式中,对第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对第一待检测图像执行第1次特征提取与校正的操作,得到第1个第一特征图;
对第r个第一特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第一特征图,r为大于等于1的整数;
执行至少2次特征提取与校正的操作,得到M个第一特征图,M为大于等于2的整数,M个第一特征图包括第1个第一特征图和第(r+1)个第一特征图;
根据M个第一特征图得到第一目标特征图。
结合第一方面,在一种可能的实施方式中,第一待检测图像和第一目标特征图是通过第一子网络模型得到的,第一子网络模型是通过对神经网络的第一子网络进行训练得到的;
第一子网络模型采用以下步骤训练得到:
通过第一子网络对样本图像集中的N张正样本图像进行图像校正,得到N张第二待检测图像,其中,N张正样本图像与N张第二待检测图像一一对应,N为大于1的整数;
通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图,N张第二待检测图像与N个第二特征图一一对应;
根据N张第二待检测图像确定的第一损失、N个第二特征图确定的第二损失,确定目标损失;
对神经网络的参数进行调整,迭代正样本图像集,以使目标损失收敛,得到第一子网络模型。
结合第一方面,在一种可能的实施方式中,第一损失的确定步骤,包括:
从N张第二待检测图像中随机选取两张第二待检测图像;
计算两张第二待检测图像的第二距离,将第二距离确定为第一损失。
结合第一方面,在一种可能的实施方式中,神经网络还包括第二子网络和第三子网络,第二损失的确定步骤,包括:
通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集;
通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集;
根据第一特征向量集和第二特征向量集,确定第二损失。
结合第一方面,在一种可能的实施方式中,通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集,包括:
针对任意第二特征图a中的每个第一位置,通过第二子网络对第一位置的特征进行编码与投影,得到第一特征向量;
由每个第一位置对应的第一特征向量组成第一特征向量集;
通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集,包括:
针对任意第二特征图b中的每个第二位置,通过第三子网络对第二位置的特征进行编码,得到第二特征向量;
由每个第二位置对应的第二特征向量组成第二特征向量集。
结合第一方面,在一种可能的实施方式中,根据第一特征向量集和第二特征向量集,确定第二损失,包括:
从打乱顺序的N个第二特征图中确定出与任意第二特征图a的序列标识相同的目标第二特征图,任意第二特征图b包括目标第二特征图;
获取目标第二特征图对应的目标第二特征向量集,第二特征向量集包括目标第二特征向量集;
从目标第二特征向量集中确定出与第一特征向量集中的第一特征向量对应的目标第二特征向量;
根据第一特征向量和对应的目标第二特征向量确定第二损失。
结合第一方面,在一种可能的实施方式中,通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图,包括:
针对N张第二待检测图像中的任意一张第二待检测图像,通过第一子网络执行至少2次特征提取与校正的操作,得到任意一张第二待检测图像的第二特征图;
由N张第二待检测图像中每张第二待检测图像的第二特征图,组成N个第二特征图。
结合第一方面,在一种可能的实施方式中,在得到第一子网络模型之后,该方法还包括:
通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图,N张正样本图像与N个第二目标特征图一一对应;
对N个第二目标特征图中位置对应的特征进行高斯拟合,得到正样本图像的目标高斯分布。
结合第一方面,在一种可能的实施方式中,通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图,包括:
通过第一子网络模型对N张正样本图像进行图像校正,得到N张第三待检测图像,N张正样本图像与N张第三待检测图像一一对应;
通过第一子网络模型对N张第三待检测图像进行特征提取与校正,得到N个第二目标特征图,N个第二目标特征图与N张第三待检测图像一一对应;
其中,N张第三待检测图像中的任意一张第三待检测图像的特征提取与校正,包括:
通过第一子网络模型对任意一张第三待检测图像执行第1次特征提取与校正的操作,得到第1个第三特征图;
通过第一子网络模型对第r个第三特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第三特征图;
通过第一子网络模型执行至少2次特征提取与校正的操作,得到R个第三特征图,R为大于等于2的整数,R个第三特征图包括第1个第三特征图和第(r+1)个第三特征图;
通过第一子网络模型根据R个第三特征图,得到任意一张第三待检测图像对应的第二目标特征图。
本申请实施例第二方面提供了一种图像异常检测装置,该装置包括获取单元和处理单元;
获取单元,用于对原始图像进行图像校正,得到第一待检测图像;
处理单元,用于对第一待检测图像进行特征提取与校正,得到第一目标特征图;
处理单元,还用于根据所述第一目标特征图和正样本图像的特征图,得到异常检测结果。
本申请实施例第三方面提供了一种电子设备,该电子设备包括输入设备和输出设备,还包括处理器和计算机存储介质,处理器,适于实现一条或多条指令;以及,计算机存储介质,存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如上述第一方面所述图像异常检测方法中的步骤。
本申请实施例第四方面提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面所述图像异常检测方法中步骤。
本申请实施例第五方面提供了一种计算机程序产品,其中,上述计算机程序产品包括计算机程序,上述计算机程序可操作来使计算机执行如上述第一方面所述图像异常检测方法中的步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中通过对原始图像进行图像校正,得到第一待检测图像;对第一待检测图像进行特征提取与校正,得到第一目标特征图;根据第一目标特征图和正样本图像的特征图,得到异常检测结果。这样对原始图像进行图像校正,以便于将原始图像的每个位置上的特征向正常图像的特征分布对齐,有利于后续从每个位置去捕捉细粒度的异常,实现了像素级异常定位,另外,第一目标特征图是通过对不同层的特征图进行融合得到的,其能够将特征图中每个位置上的异常聚合,从而使像素级的异常更为明显,像素级的异常定位和更为明显的像素级异常意味着异常定位的精度更高,基于定位精度更高的第一目标特征图和正常样本图像的特征图有利于提升异常检测结果的精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用环境的架构图;
图2为本申请实施例提供的一种神经网络的结构示意图;
图3为本申请实施例提供的一种图像异常检测方法的流程示意图;
图4为本申请实施例提供的一种获取第一目标特征图的示意图;
图5为本申请实施例提供的一种未经过粗对准的图像和经过粗对准的图像的对比示意图;
图6为本申请实施例提供的另一种图像异常检测方法的流程示意图;
图7为本申请实施例提供的一种细对准阶段的处理流程示意图;
图8为本申请实施例提供的一种选取第二特征图的示意图;
图9为本申请实施例提供的一种图像异常检测装置的结构示意图;
图10为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请说明书、权利要求书和附图中出现的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
本申请实施例提出一种图像异常检测方法,可基于图1所示的应用环境实施,如图1所示,该应用环境包括图像采集设备101、终端设备102和电子设备103。其中,图像采集设备101、终端设备102和电子设备103通过网络连接,本申请实施例所涉及到的电子设备103可以包括各种具有程序代码运行能力和通信能力的设备,比如电子设备103可以是独立的物理服务器、嵌入式设备,也可以是服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
其中,图像采集设备101用于将工业、医疗等各领域中采集的原始图像发送到电子设备103,以使得电子设备103对该原始图像进行异常检测,并可通过终端设备102对异常检测结果进行展示,比如该异常检测可以是高铁接触网的缺陷检测、加工件的异常检测、医学影像中的病灶分割等。其中,终端设备102还用于向电子设备103提供正样本图像集,以使电子设备103通过正样本图像集对神经网络进行训练,并将训练好的神经网络模型部署在本地或其他设备上,则电子设备103或该其他设备可通过该神经网络模型进行图像的异常检测,即神经网络模型的训练设备和调用设备可以是同一设备,也可以是不同设备。由于电子设备103或该其他设备在进行异常检测时,能够实现像素级的异常定位,在异常定位精度更高的情况下,有利于提升图像异常检测的精度。
以下结合相关附图对本申请实施例的神经网络架构进行简要阐述。
请参见图2,图2为本申请实施例提供的一种神经网络的结构示意图,如图2所示,该神经网络包括第一子网络、第二子网络和第三子网络,整个框架可分为粗对准阶段和细对准阶段,其中,第一子网络用于粗对准阶段的处理,第二子网络和第三子网络用于细对准阶段的处理,提供整个框架的目的在于通过训练神经网络,得到可用于像素级异常定位的特征提取器,即第一子网络经过训练得到的第一子网络模型。
其中,第一子网络主要包括图像级粗对准模块(Image-level Coarse Alignment,ICA)和特征提取网络,图像级粗对准模块用于将输入的正样本图像集中的正样本图像定位到相似的方向和位置,得到每张正样本图像经过粗对准的待检测图像,以正则化正样本图像的像素分布;特征提取网络采用预训练的ResNet-18网络作为基础结构,应理解,ResNet-18网络通常包括4个特征提取层(layer1、layer2、layer3和layer4),本申请中的特征提取网络在每个特征提取层后加入特征级粗对准模块(Feature-Level Coarse Alignment,FCA),特征级粗对准模块对每个特征提取层提取出的特征做进一步对准,以使正样本图像的特征完成全局深度收缩,便于后续细对准阶段进行像素级密集特征的比较。示例性的,本申请可从ResNet-18网络中选取相应的层(layer)作为特征提取层,比如将预训练的layer1、layer2和layer3作为本申请的特征提取层,分别在layer1、layer2和layer3后加入特征级粗对准模块。
其中,第二子网络和第三子网络作为第一子网络后的两个分支,第二子网络直接输入的是第一子网络中最后一个特征级粗对准模块输出的特征图,第二子网络通过编码器f和预测器g将直接输入的特征图映射为特征向量。第三子网络的输入是对第一子网络中最后一个特征级粗对准模块输出的特征图打乱顺序后的特征图,第三子网络通过编码器f将打乱顺序的特征图映射为特征向量。细对准阶段最终会基于第二子网络和第三子网络提取出的特征向量,完成正样本图像之间像素级(或细粒度)的比较,以自监督的方式使特征级粗对准模块学习正常图像的特征分布。示例性的,为了避免仅采用正样本图像训练神经网络造成网络坍塌或崩溃的情况,本申请还在第三子网络中加入了停止梯度操作,即只允许第二子网络参与梯度反向传播。
可以看出,本申请提供的神经网络架构,通过由粗对准到细对准两阶段的训练,有利于监督第一子网络学习到正样本图像的像素级特征分布,从而在特征提取时能够实现像素级异常定位,进而有利于异常检测精度的提高。
以下结合相关附图对本申请实施例提供的图像异常检测方法进行详细阐述。
请参见图3,图3为本申请实施例提供的一种图像异常检测方法的流程示意图,该方法应用于电子设备,如图3所示,包括步骤301-304:
步骤301:对原始图像进行图像校正,得到第一待检测图像。
本申请实施例中,对于实际场景中采集的原始图像,如图4所示,采用经过训练得到的第一子网络模型对其进行处理,通过图像级粗对准模块对原始图像进行图像校正,得到第一待检测图像。具体的,图像级粗对准模块通过获取原始图像上的变换矩阵(即第一变换矩阵),采用类似于空间变换网络的方式对变换矩阵进行回归,即完成图像级粗对准,其公式表示如下:
其中,表示原始图像中的像素,表示仿射变换矩阵。表示像素粗对准后的像素,Zi表示原始图像,τθ表示图像级粗对准模块。其中,第一变换矩阵包括仿射变换矩阵。如图5所示,对于异常的螺钉图像,在粗对准之前其异常区域在热力图上表现得较为松散,这就会导致后续异常定位的精度不高,而粗对准之后,由于特征分布的收缩,其异常区域在热力图上表现得就较为紧凑了,这就会相对提高后续异常定位的精度。
步骤302:对第一待检测图像进行特征提取与校正,得到第一目标特征图。
本申请实施例中,请继续参见图4,对于步骤301得到的第一待检测图像,采用特征提取器进行特征提取。示例性的,对第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对第一待检测图像进行特征提取,得到待校正特征图;
获取变换矩阵;
采用变换矩阵对待校正特征图进行对准,得到第一特征图;
基于第一特征图得到第一目标特征图。
具体的,对于第一待检测图像,采用ResNet-18网络的layer对其进行特征提取,得到的特征图为待校正特征图,与图像校正相同,FCA通过获取待校正特征图上的变换矩阵(即第二变换矩阵),然后对第二变换矩阵进行回归即完成特征级粗对准,得到FCA输出的特征图(即第一特征图),基于第一特征图得到最终的第一目标特征图。比如:当仅采用一个layer+FCA,第一特征图即第一目标特征图,当采用多个layer+FCA,每个FCA输出的特征图的融合特征图即第一目标特征图。
示例性的,对第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对第一待检测图像执行第1次特征提取与校正的操作,得到第1个第一特征图;
对第r个第一特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第一特征图,r为大于等于1的整数;
执行至少2次特征提取与校正的操作,得到M个第一特征图,M为大于等于2的整数,M个第一特征图包括第1个第一特征图和第(r+1)个第一特征图;
根据M个第一特征图得到第一目标特征图。
以三个特征提取层(假设依次为layer1、layer2和layer3)为例,则每个特征提取层后会有一个特征级粗对准模块(假设依次为FCA1、FCA2和FCA3),总共执行3次特征提取与校正的操作。具体的,采用layer1对第一待检测图像进行特征提取,对于layer1输出的特征图,采用FCA1对其进行粗对准,得到第1个第一特征图;采用layer2对第1个第一特征图进行特征提取,对于layer2输出的特征图,采用FCA2对其进行粗对准,得到第2个第一特征图;采用layer3对第2个第一特征图进行特征提取,对于layer3输出的特征图,采用FCA3对其进行粗对准,得到第3个第一特征图。该第1个第一特征图、第2个第一特征图和第3个第一特征图即上述的M个第一特征图。该实施方式中,在对第一待检测图像进行特征提取的过程中融入特征级的粗对准处理,以将提取出的第一特征图的每个位置上的特征向正常图像的特征分布对齐,实现了特征分布的进一步收缩,有利于实现细粒度的异常定位。
示例性的,FCA1、FCA2和FCA3对对应的layer输出的特征图进行处理包括:获取该特征图上的变换矩阵,对该变换矩阵进行回归,即完成该特征图的粗对准。
对于得到的M个第一特征图,对M个第一特征图中除第1个第一特征图以外的第一特征图(比如第(r+1)个第一特征图)进行缩放,得到与第1个第一特征图尺寸相同的待融合特征图,将待融合特征图与第1个第一特征图融合,得到第一目标特征图。比如,将上述第3个第一特征图的尺寸缩放到与第1个第一特征图的尺寸一致,得到对应的待融合特征图,将上述第2个第一特征图的尺寸缩放到与第1个第一特征图的尺寸一致,得到对应的待融合特征图,将所有待融合特征图与第1个第一特征图融合,得到用于异常得分计算的第一目标特征图。
该实施方式中,由于第一目标特征图是通过对不同层的第一特征图进行融合得到的,其能够将第一特征图中每个位置上的异常聚合,从而使像素级的异常更为明显,进而使得根据计算出来的异常得分,能明显观测到异常的位置。
需要说明的是,特征级粗对准模块的处理方式与图像级粗对准模块的处理方式相同,均是对仿射变换矩阵进行回归。对于特征提取层和特征级粗对准模块的数量,可根据实际场景进行适应性调整,比如还可采用ResNet-18网络的4个layer进行特征提取,以上示例并不对本申请实施例造成限定。
该实施方式中,在每个特征提取层后加入特征级粗对准模块进行特征的粗对准,有利于使提取出的特征与各特征级粗对准模块学习到的仿射变换矩阵对齐,那么,正常像素上的特征就会趋向于正态分布,相对而言,异常像素上的特征分布与正态分布的差异就会愈加明显,从而更有利于实现像素级的异常定位。
步骤303:根据第一目标特征图和正样本图像的特征图,得到异常检测结果。
本申请实施例中,在训练好第一子网络模型后,通过第一子网络模型对正样本图像集进行推理得到N个第二目标特征图,电子设备对N个第二目标特征图中位置对应的特征进行高斯拟合,为N个第二目标特征图中位置对应的特征建立高斯分布模型N(μij,∑ij),得到正样本图像每个位置对应的目标高斯分布,其公式表示如下:
其中,μij表示N个第二目标特征图中第i行第j列位置上的特征的均值,k表示N个第二目标特征图中的第k个第二目标特征图,表示第k个第二目标特征图中第i行第j列位置上的特征,Σij表示N个第二目标特征图中第i行第j列位置上的特征的协方差,T表示转置。其中,位置对应是指N个第二目标特征图中每个第二目标特征图上第i行第j列的位置,N为大于1的整数。
应理解,N个第二目标特征图与第一目标特征图的尺寸相同,则第一目标特征图的每个位置均存在对应的高斯分布模型(即目标高斯分布),示例性的,根据第一目标特征图和正样本图像的特征图,得到异常检测结果,包括:
获取正样本图像的特征图中,每个位置对应的目标高斯分布;
根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分;
将第一目标特征图中每个位置的异常得分组成的异常得分图,确定为异常检测结果。
本申请实施例中,正样本图像是指上述正样本图像集中的图像,通过计算第一目标特征图中每个位置的特征与对应于该位置的目标高斯分布的第一距离,得到第一目标特征图中每个位置的异常得分。示例性的,可以采用马氏距离作为异常得分的度量,即第一距离包括马氏距离,通过计算第一目标特征图中每个位置的特征与该位置对应的目标高斯分布的马氏距离,得到第一目标特征图中每个位置的异常得分,其公式表示如下:
其中,d(eij)表示第一目标特征图中第i行第j列位置上的异常得分,eij表示第一目标特征图中第i行第j列位置上的特征。
最终,将第一目标特征图中每个位置上的异常得分组成像素级的异常得分图,该异常得分图为一个距离矩阵,将异常得分图作为异常检测结果进行输出,应理解,异常得分大于阈值的区域即检测出的异常区域,异常得分越高表示异常程度越高。
可以看出,本申请实施例中通过对原始图像进行图像校正,得到第一待检测图像;对第一待检测图像进行特征提取与校正,得到第一目标特征图;根据第一目标特征图和正样本图像的特征图,得到异常检测结果。这样对原始图像进行图像校正,以便于将原始图像的每个位置上的特征向正常图像的特征分布对齐,有利于后续从每个位置去捕捉细粒度的异常,实现了像素级异常定位,另外,第一目标特征图是通过对不同层的特征图进行融合得到的,其能够将特征图中每个位置上的异常聚合,从而使像素级的异常更为明显,像素级的异常定位和更为明显的像素级异常意味着异常定位的精度更高,基于定位精度更高的第一目标特征图和正常样本图像的特征图有利于提升异常检测结果的精度。
请参见图6,图6为本申请实施例提供的另一种图像异常检测方法的流程示意图,如图6所示,包括步骤601-605:
步骤601:对原始图像进行图像校正,得到第一待检测图像;
步骤602:对第一待检测图像进行特征提取与校正,得到第一目标特征图;
步骤603:获取正样本图像的特征图中,每个位置对应的目标高斯分布;
步骤604:根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分;
步骤605:将第一目标特征图中每个位置的异常得分组成的异常得分图,确定为异常检测结果。
其中,步骤601-605的具体实施方式在图3所示的实施例中已有相关说明,此处不再赘述。
示例性的,在对原始图像进行图像校正,得到第一待检测图像之前,该方法还包括:
通过第一子网络对样本图像集中的N张正样本图像进行图像校正,得到N张第二待检测图像,其中,N张正样本图像与N张第二待检测图像一一对应,N为大于1的整数;
通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图,N张第二待检测图像与N个第二特征图一一对应;
根据N张第二待检测图像确定的第一损失、N个第二特征图确定的第二损失,确定目标损失;
对神经网络的参数进行调整,迭代正样本图像集,以使目标损失收敛,得到第一子网络模型。
本申请实施例中,请继续参见图2,对于批处理正样本图像集中的N张正样本图像,将其输入第一子网络,首先由图像级粗对准模块对每张正样本图像进行粗对准,得到每张正样本图像经过粗对准后的第二待检测图像,则相应会产生N张第二待检测图像。其中,粗对准可以参见上述步骤301中的实施方式,即通过图像级粗对准模块τθ对每张正样本图像上的变换矩阵进行回归。该实施方式中,并没有为N张正样本图像分配标准方向或标准位置来实现粗对准,图像级粗对准模块在训练阶段通过自监督的方式学习正常图像的像素级特征分布,这样对于异常图像有利于实现细微异常的捕获,从而能够提升异常定位的精度和性能。
示例性的,通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图,包括:
针对N张第二待检测图像中的任意一张第二待检测图像,通过第一子网络执行至少2次特征提取与校正的操作,得到任意一张第二待检测图像的第二特征图;
由N张第二待检测图像中每张第二待检测图像的第二特征图,组成N个第二特征图。
其中,至少2次特征提取与校正的操作,包括:
对任意一张第二待检测图像进行第1次特征提取与校正,得到第四特征图;
对第四特征图进行第2次特征提取与校正,重复执行对上一次特征提取与校正得到的特征图进行当前特征提取与校正的操作,经过至少2次特征提取与校正的操作,得到任意一张第二待检测图像的第二特征图。
本申请实施例中,通过第一子网络中的特征提取网络对N张第二待检测图像进行处理,对于N张第二待检测图像中的任意一张第二待检测图像,在特征提取网络中将通过至少2次特征提取与校正的操作,得到对应的第二特征图。具体的,该至少2次特征提取与校正的操作对应于特征提取网络中特征提取层的数量,比如采用ResNet-18网络的layer1、layer2和layer3作为特征提取层,则相应有3次特征提取和粗对准的操作,采用layer1对该任意一张第二待检测图像进行特征提取,对于layer1输出的特征图,采用FCA1对其进行粗对准,得到第1次特征提取和粗对准输出的特征图;采用layer2对第1次特征提取和粗对准输出的特征图进行特征提取,对于layer2输出的特征图,采用FCA2对其进行粗对准,得到第2次特征提取和粗对准输出的特征图;采用layer3对第2次特征提取和粗对准输出的特征图进行特征提取,对于layer3输出的特征图,采用FCA3对其进行粗对准,得到第3次特征提取和粗对准输出的特征图,将该第3次特征提取和粗对准输出的特征图确定为第二特征图,由此通过N张第二待检测图像得到上述的N个第二特征图。该实施方式中,至少2次特征提取与校正的操作说明有至少2个特征提取层,相应的,至少2个特征提取层中每个特征提取层后均接有特征级粗对准模块,如此便能对至少2个特征提取层和至少2个特征级粗对准模块进行训练,以提升特征提取层和特征级粗对准模块的能力,便于应用阶段对每个特征级粗对准模块输出的特征图进行融合,以达到异常信号增强的目的。特征级粗对准模块在图像级粗对准的基础上,同样以自监督的方式进一步学习正常图像的特征分布,并通过层层粗对准处理将对正常图像的特征分布的学习过程依次增强,以提升特征提取网络对异常特征的捕获能力。
示例性的,第一损失的确定步骤,包括:
从N张第二待检测图像中随机选取两张第二待检测图像;
计算两张第二待检测图像的第二距离,将第二距离确定为第一损失。
本申请实施例中,为了训练图像级粗对准模块,从N张第二待检测图像中随机选取两张正样本图像P和Q对应的第二待检测图像,计算正样本图像P和Q对应的第二待检测图像的距离(即第二距离),示例性的,可将正样本图像P和Q对应的第二待检测图像的L2范数作为该第二距离,将该第二距离确定为第一损失,其公式表示如下:
其中,LICA表示第一损失,表示正样本图像P对应的第二待检测图像,表示正样本图像Q对应的第二待检测图像,D表示正样本图像集,θh表示仿射变换矩阵中的参数,H表示正样本图像P和Q的高度,W表示正样本图像P和Q的宽度。该实施方式中,第一损失用于监督正样本图像P和Q朝着减少熵的方向对齐,经过一定的迭代,熵会降低到某个值,图像级粗对准模块便能学习到如何对输入的图像进行对齐。
示例性的,第二损失的确定步骤,包括:
通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集;
通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集;
根据第一特征向量集和第二特征向量集,确定第二损失。
其中,通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集,包括:
针对任意第二特征图a中的每个第一位置,通过第二子网络对第一位置的特征进行编码与投影,得到第一特征向量;
由每个第一位置对应的第一特征向量组成第一特征向量集;
其中,通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集,包括:
针对任意第二特征图b中的每个第二位置,通过第三子网络对第二位置的特征进行编码,得到第二特征向量;
由每个第二位置对应的第二特征向量组成第二特征向量集。
本申请实施例中,请参见图7,将N个第二特征图按照原有顺序组成第二特征图序列A直接输入第二子网络进行处理,对于第二特征图序列A中的任意第二特征图a,通过编码器f对任意第二特征图a进行编码,得到第一特征向量集。将N个第二特征图打乱顺序(shufflfle),由打乱顺序后的N个第二特征图组成第二特征图序列B,将第二特征图序列B输入第三子网络进行处理,对于第二特征图序列B中的任意第二特征图b,通过编码器f对任意第二特征图b进行编码,得到第二特征向量集。
其中,针对任意第二特征图a中的每个第一位置,第二子网络中的编码器f将该第一位置上的特征wij编码为待投影特征向量mij,由每个第一位置对应的待投影特征向量mij组成待投影特征向量集,通过第二子网络中的预测器g将待投影特征向量集中的待投影特征向量mij投影到第二特征向量集中的第二特征向量nij的向量空间,投影后的待投影特征向量即第一特征向量,表示为g(mij)。换言之就是,第二特征图序列A中的每张第二特征图均对应一个第一特征向量集。其中,编码器f采用3个1*1的卷积层将wij编码为mij。其中,预测器g采用2个1*1的卷积层将mij映射为g(mij)。针对任意第二特征图b中的每个第二位置,第三子网络中的编码器f将该第二位置上的特征vij编码为第二特征向量nij,由每个第二位置对应的第二特征向量nij组成第二特征向量集,换言之就是,第二特征图序列B中的每张第二特征图均对应一个第二特征向量集。其中,编码器f采用3个1*1的卷积层将vij编码为nij。其中,第二子网络中的编码器f和第三子网络中的编码器f为共享编码器。该实施方式中,采用编码器f将任意第二特征图a中每个位置上的特征编码为特征向量,采用编码器f将任意第二特征图b中每个位置上的特征编码为特征向量,以便于细对准阶段对任意第二特征图a和任意第二特征图b的每个位置实现密集监督,通过打乱顺序的方式,最大化N个第二特征图之间的相似度。
示例性的,根据第一特征向量集和第二特征向量集,确定第二损失,包括:
从打乱顺序的N个第二特征图中确定出与任意第二特征图a的序列标识相同的目标第二特征图,任意第二特征图b包括目标第二特征图;
获取目标第二特征图对应的目标第二特征向量集,第二特征向量集包括目标第二特征向量集;
从目标第二特征向量集中确定出与第一特征向量集中的第一特征向量对应的目标第二特征向量;
根据第一特征向量和对应的目标第二特征向量确定第二损失。
其中,根据第一特征向量和对应的目标第二特征向量确定第二损失确定目标损失,包括:
计算第一特征向量与目标第二特征向量的负余弦相似度;
根据负余弦相似度和第三子网络中的停止梯度操作确定第二损失。
本申请实施例中,请参见图8,假设第二特征图序列A和第二特征图序列B中的第二特征图数量为3,任意第二特征图a为第二特征图序列A中的第2个第二特征图,则其序列标识为2,相应的,目标第二特征图同样为第二特征图序列B中的第2个第二特征图。应理解,经过编码器f的编码,目标第二特征图存在对应的目标第二特征向量集,对于每个待投影特征向量mij,目标第二特征向量集中存在对应的目标第二特征向量nij,通过第一特征向量g(mij)与目标第二特征向量nij的负余弦相似度来表示待投影特征向量mij与目标第二特征向量nij的相似度,其公式表示如下:
其中,Lij(mij,nij,θg,θf)表示第一特征向量g(mij)与目标第二特征向量nij的负余弦相似度,θg表示预测器g的参数,θf表示编码器f的参数。细对准阶段,通过在第i行第j列的位置将任意第二特征图a与对应的目标第二特征图的负余弦相似度最小化,以密集地监督任意第二特征图a与目标第二特征图进行特征对齐,从而有利于提升特征级粗对准模块在特征级粗对准上的性能。
从神经网络的结构可以看出,为了防止网络崩溃,本方案在第三子网络中加入了停止梯度操作(stop_grad),即每次迭代之后,第三子网络不会进行梯度反向传播操作,只允许第二子网络进行梯度反向传播,即上述的对神经网络的参数进行调整是基于第二子网络回传的梯度进行调整的,如此可增强模型的鲁棒性。基于最小化负余弦相似度的目的和停止梯度操作,可确定N个第二特征图每个位置上的总损失,即第二损失,其公式表示如下:
其中,LFAS表示第二损失,其表示神经网络不会从nij接收梯度信息,m表示第一特征向量集,n表示第二特征向量集。
LFAS为监督神经网络所有参数的主要损失函数,LICA为监督图像级特征提取模块收敛的辅助损失函数,使用系数λ1和λ2调整粗对准阶段和细对准阶段的权重,则整个神经网络框架的目标损失定义为:
Ltotal(·;θh,f,g,τθ)=λ1·LICA+λ2·LFAS;
基于目标损失Ltotal对粗对准阶段和细对准阶段进行整体优化,不断迭代正样本图像集,直至目标损失收敛,即得到第一子网络模型。
可以看出,本申请实施例在应用第一子网络模型之前,还采用了两阶段的训练方式训练神经网络框架,粗对准阶段主要监督图像级粗对准模块和特征级粗对准模块对正常图像的特征分布做图像级对齐和特征级对齐,细对准阶段主要监督整个神经网络通过像素级比较学习正常图像的特征分布,以提升第一子网络对异常的捕获能力,从而能够提升第一子网络模型对细微异常的定位效果。
示例性的,在得到第一子网络模型之后,该方法还包括:
通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图,N张正样本图像与N个第二目标特征图一一对应,N个第二目标特征图的尺寸相同,N个第二目标特征图与第一目标特征图的尺寸相同;
对N个第二目标特征图中位置对应的特征进行高斯拟合,得到正样本图像的目标高斯分布。
本申请实施例中,通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图,包括:
通过第一子网络模型对N张正样本图像进行图像校正,得到N张第三待检测图像,N张正样本图像与N张第三待检测图像一一对应;
通过第一子网络模型对N张第三待检测图像进行特征提取与校正,得到N个第二目标特征图,N个第二目标特征图与N张第三待检测图像一一对应;
其中,N张第三待检测图像中的任意一张第三待检测图像的特征提取与校正,包括:
通过第一子网络模型对任意一张第三待检测图像执行第1次特征提取与校正的操作,得到第1个第三特征图;
通过第一子网络模型对第r个第三特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第三特征图;
通过第一子网络模型执行至少2次特征提取与校正的操作,得到R个第三特征图,R为大于等于2的整数,R个第三特征图包括第1个第三特征图和第(r+1)个第三特征图;
通过第一子网络模型根据R个第三特征图,得到任意一张第三待检测图像对应的第二目标特征图。
具体的,在训练好第一子网络模型后,采用第一子网络模型对N张正样本图像再推理一遍,通过图像集粗对准模块对其进行粗对准,得到N张第三待检测图像,采用特征提取网络对N张第三待检测图像进行特征提取与校正,每个特征级粗对准模块输出的特征图即为第三特征图,对于任意一张第三待检测图像而言,均有对应的多个第三特征图,其中,特征提取网络的处理过程可参见步骤302中对第一待检测图像进行特征提取与校正的描述。对于任意一张第三待检测图像的R个第三特征图,按照步骤302中的方式进行尺度归一化和融合,得到第二目标特征图,如此便能得到N个第二目标特征图,对N个第二目标特征图中位置对应的特征进行高斯拟合,以构建出像素级的目标高斯分布,从而便于在应用阶段,能够基于第一目标特征图和目标高斯分布,计算出第一目标特征图中每个位置的异常得分,最终得到异常检测结果。
可以看出,本申请实施例中通过对原始图像进行图像校正,得到第一待检测图像;对第一待检测图像进行特征提取与校正,得到第一目标特征图;根据第一目标特征图和正样本图像的特征图,得到异常检测结果。这样对原始图像进行图像校正,以便于将原始图像的每个位置上的特征向正常图像的特征分布对齐,有利于后续从每个位置去捕捉细粒度的异常,实现了像素级异常定位,另外,第一目标特征图是通过对不同层的特征图进行融合得到的,其能够将特征图中每个位置上的异常聚合,从而使像素级的异常更为明显,像素级的异常定位和更为明显的像素级异常意味着异常定位的精度更高,基于定位精度更高的第一目标特征图和正常样本图像的特征图有利于提升异常检测结果的精度。
基于上述方法实施例的描述,本申请实施例还提供一种图像异常检测装置,请参见图9,图9为本申请实施例提供的一种图像异常检测装置的结构示意图,如图9所示,该装置包括获取单元901和处理单元902;
获取单元901,用于对原始图像进行图像校正,得到第一待检测图像;
处理单元902,用于对第一待检测图像进行特征提取与校正,得到第一目标特征图;
处理单元902,还用于根据所述第一目标特征图和正样本图像的特征图,得到异常检测结果。
可以看出,在图9所示的图像异常检测装置中,通过对原始图像进行图像校正,得到第一待检测图像;对第一待检测图像进行特征提取与校正,得到第一目标特征图;根据第一目标特征图和正样本图像的特征图,得到异常检测结果。这样对原始图像进行图像校正,以便于将原始图像的每个位置上的特征向正常图像的特征分布对齐,有利于后续从每个位置去捕捉细粒度的异常,实现了像素级异常定位,另外,第一目标特征图是通过对不同层的特征图进行融合得到的,其能够将特征图中每个位置上的异常聚合,从而使像素级的异常更为明显,像素级的异常定位和更为明显的像素级异常意味着异常定位的精度更高,基于定位精度更高的第一目标特征图和正常样本图像的特征图有利于提升异常检测结果的精度。
在一种可能的实施方式中,在根据第一目标特征图和正样本图像的特征图,得到异常检测结果方面,处理单元902具体用于:
获取正样本图像的特征图中,每个位置对应的目标高斯分布;
根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分;
将第一目标特征图中每个位置的异常得分组成的异常得分图,确定为异常检测结果。
在一种可能的实施方式中,在根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分方面,处理单元902具体用于:
计算第一目标特征图中每个位置的特征与对应于该位置的目标高斯分布的第一距离;
将第一距离确定为第一目标特征图中每个位置的异常得分。
在一种可能的实施方式中,在对原始图像进行图像校正,得到第一待检测图像方面,获取单元901具体用于:
获取第一变换矩阵;
采用第一变换矩阵对原始图像进行对准,得到第一待检测图像。
在一种可能的实施方式中,在对第一待检测图像进行特征提取与校正,得到第一目标特征图方面,处理单元902具体用于:
对第一待检测图像进行特征提取,得到待校正特征图;
获取第二变换矩阵;
采用第二变换矩阵对待校正特征图进行对准,得到第一特征图;
基于第一特征图得到第一目标特征图。
在一种可能的实施方式中,在对第一待检测图像进行特征提取与校正,得到第一目标特征图方面,处理单元902具体用于:
对第一待检测图像执行第1次特征提取与校正的操作,得到第1个第一特征图;
对第r个第一特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第一特征图,r为大于等于1的整数;
执行至少2次特征提取与校正的操作,得到M个第一特征图,M为大于等于2的整数,M个第一特征图包括第1个第一特征图和第(r+1)个第一特征图;
根据M个第一特征图得到第一目标特征图。
在一种可能的实施方式中,第一待检测图像和第一目标特征图是通过第一子网络模型得到的,第一子网络模型是通过对神经网络的第一子网络进行训练得到的;处理单元902还用于:
通过第一子网络对样本图像集中的N张正样本图像进行图像校正,得到N张第二待检测图像,其中,N张正样本图像与N张第二待检测图像一一对应,N为大于1的整数;
通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图,N张第二待检测图像与N个第二特征图一一对应;
根据N张第二待检测图像确定的第一损失、N个第二特征图确定的第二损失,确定目标损失;
对神经网络的参数进行调整,迭代正样本图像集,以使目标损失收敛,得到第一子网络模型。
在一种可能的实施方式中,在确定第一损失方面,处理单元902具体用于:
从N张第二待检测图像中随机选取两张第二待检测图像;
计算两张第二待检测图像的第二距离,将第二距离确定为第一损失。
在一种可能的实施方式中,神经网络还包括第二子网络和第三子网络,在确定第二损失方面,处理单元902具体用于:
通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集;
通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集;
根据第一特征向量集和第二特征向量集,确定第二损失。
在一种可能的实施方式中,在通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集方面,处理单元902具体用于:
针对任意第二特征图a中的每个第一位置,通过第二子网络对第一位置的特征进行编码与投影,得到第一特征向量;
由每个第一位置对应的第一特征向量组成第一特征向量集;
在通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集方面,处理单元902具体用于:
针对任意第二特征图b中的每个第二位置,通过第三子网络对第二位置的特征进行编码,得到第二特征向量;
由每个第二位置对应的第二特征向量组成第二特征向量集。
在一种可能的实施方式中,在根据第一特征向量集和第二特征向量集,确定第二损失方面,处理单元902具体用于:
从打乱顺序的N个第二特征图中确定出与任意第二特征图a的序列标识相同的目标第二特征图,任意第二特征图b包括目标第二特征图;
获取目标第二特征图对应的目标第二特征向量集,第二特征向量集包括目标第二特征向量集;
从目标第二特征向量集中确定出与第一特征向量集中的第一特征向量对应的目标第二特征向量;
根据第一特征向量和对应的目标第二特征向量确定第二损失。
在一种可能的实施方式中,在通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图方面,处理单元902具体用于:
针对N张第二待检测图像中的任意一张第二待检测图像,通过第一子网络执行至少2次特征提取与校正的操作,得到任意一张第二待检测图像的第二特征图;
由N张第二待检测图像中每张第二待检测图像的第二特征图,组成N个第二特征图。
在一种可能的实施方式中,处理单元902还用于:
通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图,N张正样本图像与N个第二目标特征图一一对应;
对N个第二目标特征图中位置对应的特征进行高斯拟合,得到正样本图像的目标高斯分布。
在一种可能的实施方式中,在通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图方面,处理单元902具体用于:
通过第一子网络模型对N张正样本图像进行图像校正,得到N张第三待检测图像,N张正样本图像与N张第三待检测图像一一对应;
通过第一子网络模型对N张第三待检测图像进行特征提取与校正,得到N个第二目标特征图,N个第二目标特征图与N张第三待检测图像一一对应;
其中,在N张第三待检测图像中的任意一张第三待检测图像的特征提取与校正方面,处理单元902具体用于:
通过第一子网络模型对任意一张第三待检测图像执行第1次特征提取与校正的操作,得到第1个第三特征图;
通过第一子网络模型对第r个第三特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第三特征图;
通过第一子网络模型执行至少2次特征提取与校正的操作,得到R个第三特征图,R为大于等于2的整数,R个第三特征图包括第1个第三特征图和第(r+1)个第三特征图;
通过第一子网络模型根据R个第三特征图,得到任意一张第三待检测图像对应的第二目标特征图。
根据本申请的一个实施例,图9所示的图像异常检测装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本申请的其它实施例中,基于图像异常检测装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的另一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图3或图6中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图9中所示的图像异常检测装置设备,以及来实现本申请实施例的图像异常检测方法。所述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
基于上述方法实施例和装置实施例的描述,本申请实施例还提供一种电子设备。请参见图10,该电子设备至少包括处理器1001、输入设备1002、输出设备1003以及计算机存储介质1004。其中,电子设备内的处理器1001、输入设备1002、输出设备1003以及计算机存储介质1004可通过总线或其他方式连接。
计算机存储介质1004可以存储在电子设备的存储器中,所述计算机存储介质1004用于存储计算机程序,所述计算机程序包括程序指令,所述处理器1001用于执行所述计算机存储介质1004存储的程序指令。处理器1001(或称CPU(Central Processing Unit,中央处理器))是电子设备的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能。
在一个实施例中,本申请实施例提供的电子设备的处理器1001可以用于进行一系列图像异常检测:
对原始图像进行图像校正,得到第一待检测图像;
对第一待检测图像进行特征提取与校正,得到第一目标特征图;
根据第一目标特征图和正样本图像的特征图,得到异常检测结果。
可以看出,在图10所示的电子设备中,通过对原始图像进行图像校正,得到第一待检测图像;对第一待检测图像进行特征提取与校正,得到第一目标特征图;根据第一目标特征图和正样本图像的特征图,得到异常检测结果。这样对原始图像进行图像校正,以便于将原始图像的每个位置上的特征向正常图像的特征分布对齐,有利于后续从每个位置去捕捉细粒度的异常,实现了像素级异常定位,另外,第一目标特征图是通过对不同层的特征图进行融合得到的,其能够将特征图中每个位置上的异常聚合,从而使像素级的异常更为明显,像素级的异常定位和更为明显的像素级异常意味着异常定位的精度更高,基于定位精度更高的第一目标特征图和正常样本图像的特征图有利于提升异常检测结果的精度。
再一个实施例中,处理器1001执行根据第一目标特征图和正样本图像的特征图,得到异常检测结果,包括:
获取正样本图像的特征图中,每个位置对应的目标高斯分布;
根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分;
将第一目标特征图中每个位置的异常得分组成的异常得分图,确定为异常检测结果。
再一个实施例中,处理器1001执行根据第一目标特征图中每个位置的特征和目标高斯分布,得到第一目标特征图中每个位置的异常得分,包括:
计算第一目标特征图中每个位置的特征与对应于该位置的目标高斯分布的第一距离;
将第一距离确定为第一目标特征图中每个位置的异常得分。
再一个实施例中,处理器1001执行对原始图像进行图像校正,得到第一待检测图像,包括:
获取第一变换矩阵;
采用第一变换矩阵对原始图像进行对准,得到第一待检测图像。
再一个实施例中,处理器1001执行对第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对第一待检测图像进行特征提取,得到待校正特征图;
获取第二变换矩阵;
采用第二变换矩阵对待校正特征图进行对准,得到第一特征图;
基于第一特征图得到第一目标特征图。
再一个实施例中,处理器1001执行对第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对第一待检测图像执行第1次特征提取与校正的操作,得到第1个第一特征图;
对第r个第一特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第一特征图,r为大于等于1的整数;
执行至少2次特征提取与校正的操作,得到M个第一特征图,M为大于等于2的整数,M个第一特征图包括第1个第一特征图和第(r+1)个第一特征图;
根据M个第一特征图得到第一目标特征图。
再一个实施例中,第一待检测图像和第一目标特征图是通过第一子网络模型得到的,第一子网络模型是通过对神经网络的第一子网络进行训练得到的;
处理器1001执行第一子网络模型的训练步骤,包括:
通过第一子网络对样本图像集中的N张正样本图像进行图像校正,得到N张第二待检测图像,其中,N张正样本图像与N张第二待检测图像一一对应,N为大于1的整数;
通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图,N张第二待检测图像与N个第二特征图一一对应;
根据N张第二待检测图像确定的第一损失、N个第二特征图确定的第二损失,确定目标损失;
对神经网络的参数进行调整,迭代正样本图像集,以使目标损失收敛,得到第一子网络模型。
再一个实施例中,处理器1001执行第一损失的确定步骤,包括:
从N张第二待检测图像中随机选取两张第二待检测图像;
计算两张第二待检测图像的第二距离,将第二距离确定为第一损失。
再一个实施例中,神经网络还包括第二子网络和第三子网络,处理器1001执行第二损失的确定步骤,包括:
通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集;
通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集;
根据第一特征向量集和第二特征向量集,确定第二损失。
再一个实施例中,处理器1001执行通过第二子网络对N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集,包括:
针对任意第二特征图a中的每个第一位置,通过第二子网络对第一位置的特征进行编码与投影,得到第一特征向量;
由每个第一位置对应的第一特征向量组成第一特征向量集;
处理器1001执行通过第三子网络对打乱顺序的N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集,包括:
针对任意第二特征图b中的每个第二位置,通过第三子网络对第二位置的特征进行编码,得到第二特征向量;
由每个第二位置对应的第二特征向量组成第二特征向量集。
再一个实施例中,处理器1001执行根据第一特征向量集和第二特征向量集,确定第二损失,包括:
从打乱顺序的N个第二特征图中确定出与任意第二特征图a的序列标识相同的目标第二特征图,任意第二特征图b包括目标第二特征图;
获取目标第二特征图对应的目标第二特征向量集,第二特征向量集包括目标第二特征向量集;
从目标第二特征向量集中确定出与第一特征向量集中的第一特征向量对应的目标第二特征向量;
根据第一特征向量和对应的目标第二特征向量确定第二损失。
再一个实施例中,处理器1001执行通过第一子网络对N张第二待检测图像进行特征提取与校正,得到N个第二特征图,包括:
针对N张第二待检测图像中的任意一张第二待检测图像,通过第一子网络执行至少2次特征提取与校正的操作,得到任意一张第二待检测图像的第二特征图;
由N张第二待检测图像中每张第二待检测图像的第二特征图,组成N个第二特征图。
再一个实施例中,在得到第一子网络模型之后,处理器1001还用于:
通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图,N张正样本图像与N个第二目标特征图一一对应;
对N个第二目标特征图中位置对应的特征进行高斯拟合,得到正样本图像的目标高斯分布。
再一个实施例中,处理器1001执行通过第一子网络模型对N张正样本图像进行处理,得到N个第二目标特征图,包括:
通过第一子网络模型对N张正样本图像进行图像校正,得到N张第三待检测图像,N张正样本图像与N张第三待检测图像一一对应;
通过第一子网络模型对N张第三待检测图像进行特征提取与校正,得到N个第二目标特征图,N个第二目标特征图与N张第三待检测图像一一对应;
其中,N张第三待检测图像中的任意一张第三待检测图像的特征提取与校正,包括:
通过第一子网络模型对任意一张第三待检测图像执行第1次特征提取与校正的操作,得到第1个第三特征图;
通过第一子网络模型对第r个第三特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第三特征图;
通过第一子网络模型执行至少2次特征提取与校正的操作,得到R个第三特征图,R为大于等于2的整数,R个第三特征图包括第1个第三特征图和第(r+1)个第三特征图;
通过第一子网络模型根据R个第三特征图,得到任意一张第三待检测图像对应的第二目标特征图。
示例性的,电子设备可包括但不仅限于处理器1001、输入设备1002、输出设备1003以及计算机存储介质1004,输入设备1002可以是键盘、触摸屏等,输出设备1003可以是扬声器、显示器、射频发送器等。本领域技术人员可以理解,所述示意图仅仅是电子设备的示例,并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件。
需要说明的是,由于电子设备的处理器1001执行计算机程序时实现上述的图像异常检测方法中的步骤,因此上述图像异常检测方法的实施例均适用于该电子设备,且均能达到相同或相似的有益效果。
本申请实施例还提供了一种计算机存储介质(Memory),所述计算机存储介质是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括终端中的内置存储介质,当然也可以包括终端所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器1001加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的,还可以是至少一个位于远离前述处理器1001的计算机存储介质。在一个实施例中,可由处理器1001加载并执行计算机存储介质中存放的一条或多条指令,以实现上述有关图像异常检测方法的相应步骤。
示例性的,计算机存储介质的计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
需要说明的是,由于计算机存储介质的计算机程序被处理器执行时实现上述的图像异常检测方法中的步骤,因此上述图像异常检测方法的所有实施例均适用于该计算机存储介质,且均能达到相同或相似的有益效果。
本申请实施例还提供了一种计算机程序产品,其中,上述计算机程序产品包括计算机程序,上述计算机程序可操作来使计算机执行如上述图像异常检测方法中的步骤。该计算机程序产品可以为一个软件安装包。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (17)
1.一种图像异常检测方法,其特征在于,所述方法包括:
对原始图像进行图像校正,得到第一待检测图像;
对所述第一待检测图像进行特征提取与校正,得到第一目标特征图;
根据所述第一目标特征图和正样本图像的特征图,得到异常检测结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一目标特征图和正样本图像的特征图,得到异常检测结果,包括:
获取正样本图像的特征图中,每个位置对应的目标高斯分布;
根据所述第一目标特征图中每个位置的特征和所述目标高斯分布,得到所述第一目标特征图中每个位置的异常得分;
将所述第一目标特征图中每个位置的异常得分组成的异常得分图,确定为所述异常检测结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一目标特征图中每个位置的特征和所述目标高斯分布,得到所述第一目标特征图中每个位置的异常得分,包括:
计算所述第一目标特征图中每个位置的特征与对应于所述位置的所述目标高斯分布的第一距离;
将所述第一距离确定为所述第一目标特征图中每个位置的异常得分。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述对原始图像进行图像校正,得到第一待检测图像,包括:
获取第一变换矩阵;
采用所述第一变换矩阵对所述原始图像进行对准,得到所述第一待检测图像。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述对所述第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对所述第一待检测图像进行特征提取,得到待校正特征图;
获取第二变换矩阵;
采用所述第二变换矩阵对所述待校正特征图进行对准,得到第一特征图;
基于所述第一特征图得到所述第一目标特征图。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述对所述第一待检测图像进行特征提取与校正,得到第一目标特征图,包括:
对所述第一待检测图像执行第1次特征提取与校正的操作,得到第1个第一特征图;
对第r个第一特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第一特征图,r为大于等于1的整数;
执行至少2次特征提取与校正的操作,得到M个第一特征图,M为大于等于2的整数,所述M个第一特征图包括所述第1个第一特征图和所述第(r+1)个第一特征图;
根据所述M个第一特征图得到所述第一目标特征图。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述第一待检测图像和所述第一目标特征图是通过第一子网络模型得到的,所述第一子网络模型是通过对神经网络的第一子网络进行训练得到的;
所述第一子网络模型采用以下步骤训练得到:
通过所述第一子网络对样本图像集中的N张正样本图像进行图像校正,得到N张第二待检测图像,其中,所述N张正样本图像与所述N张第二待检测图像一一对应,N为大于1的整数;
通过所述第一子网络对所述N张第二待检测图像进行特征提取与校正,得到N个第二特征图,所述N张第二待检测图像与所述N个第二特征图一一对应;
根据所述N张第二待检测图像确定的第一损失、所述N个第二特征图确定的第二损失,确定目标损失;
对所述神经网络的参数进行调整,迭代所述正样本图像集,以使所述目标损失收敛,得到所述第一子网络模型。
8.根据权利要求7所述的方法,其特征在于,所述第一损失的确定步骤,包括:
从所述N张第二待检测图像中随机选取两张第二待检测图像;
计算所述两张第二待检测图像的第二距离,将所述第二距离确定为所述第一损失。
9.根据权利要求7所述的方法,其特征在于,所述神经网络还包括第二子网络和第三子网络,所述第二损失的确定步骤,包括:
通过所述第二子网络对所述N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集;
通过所述第三子网络对打乱顺序的所述N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集;
根据所述第一特征向量集和所述第二特征向量集,确定所述第二损失。
10.根据权利要求9所述的方法,其特征在于,所述通过所述第二子网络对所述N个第二特征图中的任意第二特征图a进行编码,得到第一特征向量集,包括:
针对所述任意第二特征图a中的每个第一位置,通过所述第二子网络对所述第一位置的特征进行编码与投影,得到第一特征向量;
由每个所述第一位置对应的所述第一特征向量组成所述第一特征向量集;
所述通过所述第三子网络对打乱顺序的所述N个第二特征图中的任意第二特征图b进行编码,得到第二特征向量集,包括:
针对所述任意第二特征图b中的每个第二位置,通过所述第三子网络对所述第二位置的特征进行编码,得到第二特征向量;
由每个所述第二位置对应的所述第二特征向量组成所述第二特征向量集。
11.根据权利要求10所述的方法,其特征在于,所述根据所述第一特征向量集和所述第二特征向量集,确定所述第二损失,包括:
从打乱顺序的所述N个第二特征图中确定出与所述任意第二特征图a的序列标识相同的目标第二特征图,所述任意第二特征图b包括所述目标第二特征图;
获取所述目标第二特征图对应的目标第二特征向量集,所述第二特征向量集包括所述目标第二特征向量集;
从所述目标第二特征向量集中确定出与所述第一特征向量集中的所述第一特征向量对应的目标第二特征向量;
根据所述第一特征向量和对应的所述目标第二特征向量确定所述第二损失。
12.根据权利要求7-11任一项所述的方法,其特征在于,所述通过所述第一子网络对所述N张第二待检测图像进行特征提取与校正,得到N个第二特征图,包括:
针对所述N张第二待检测图像中的任意一张第二待检测图像,通过所述第一子网络执行至少2次特征提取与校正的操作,得到所述任意一张第二待检测图像的第二特征图;
由所述N张第二待检测图像中每张第二待检测图像的第二特征图,组成所述N个第二特征图。
13.根据权利要求7-12任一项所述的方法,其特征在于,在得到所述第一子网络模型之后,所述方法还包括:
通过所述第一子网络模型对所述N张正样本图像进行处理,得到N个第二目标特征图,所述N张正样本图像与所述N个第二目标特征图一一对应;
对所述N个第二目标特征图中位置对应的特征进行高斯拟合,得到所述正样本图像的目标高斯分布。
14.根据权利要求13所述的方法,其特征在于,所述通过所述第一子网络模型对所述N张正样本图像进行处理,得到N个第二目标特征图,包括:
通过所述第一子网络模型对所述N张正样本图像进行图像校正,得到N张第三待检测图像,所述N张正样本图像与所述N张第三待检测图像一一对应;
通过所述第一子网络模型对所述N张第三待检测图像进行特征提取与校正,得到所述N个第二目标特征图,所述N个第二目标特征图与所述N张第三待检测图像一一对应
其中,所述N张第三待检测图像中的任意一张第三待检测图像的特征提取与校正,包括:
通过所述第一子网络模型对所述任意一张第三待检测图像执行第1次特征提取与校正的操作,得到第1个第三特征图;
通过所述第一子网络模型对第r个第三特征图执行第(r+1)次特征提取与校正的操作,得到第(r+1)个第三特征图;
通过所述第一子网络模型执行至少2次特征提取与校正的操作,得到R个第三特征图,R为大于等于2的整数,所述R个第三特征图包括所述第1个第三特征图和所述第(r+1)个第三特征图;
通过所述第一子网络模型根据所述R个第三特征图,得到所述任意一张第三待检测图像对应的第二目标特征图。
15.一种图像异常检测装置,其特征在于,所述装置包括获取单元和处理单元;
所述获取单元,用于对原始图像进行图像校正,得到第一待检测图像;
所述处理单元,用于对所述第一待检测图像进行特征提取与校正,得到第一目标特征图;
所述处理单元,还用于根据所述第一目标特征图和正样本图像的特征图,得到异常检测结果。
16.一种电子设备,包括输入设备和输出设备,其特征在于,还包括处理器和计算机存储介质;
所述处理器,适于实现一条或多条指令;以及,
所述计算机存储介质,存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如权利要求1-14任一项所述的方法。
17.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如权利要求1-14任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111147844.5A CN113888498A (zh) | 2021-09-28 | 2021-09-28 | 图像异常检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111147844.5A CN113888498A (zh) | 2021-09-28 | 2021-09-28 | 图像异常检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113888498A true CN113888498A (zh) | 2022-01-04 |
Family
ID=79007750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111147844.5A Pending CN113888498A (zh) | 2021-09-28 | 2021-09-28 | 图像异常检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113888498A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024098813A1 (zh) * | 2022-11-09 | 2024-05-16 | 华为技术有限公司 | 图像的异常检测方法、装置、设备和存储介质 |
-
2021
- 2021-09-28 CN CN202111147844.5A patent/CN113888498A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024098813A1 (zh) * | 2022-11-09 | 2024-05-16 | 华为技术有限公司 | 图像的异常检测方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111950453B (zh) | 一种基于选择性注意力机制的任意形状文本识别方法 | |
CN110532897B (zh) | 零部件图像识别的方法和装置 | |
US9984280B2 (en) | Object recognition system using left and right images and method | |
CN111104925B (zh) | 图像处理方法、装置、存储介质和电子设备 | |
JP2017062778A (ja) | 画像のオブジェクトを分類するための方法およびデバイスならびに対応するコンピュータプログラム製品およびコンピュータ可読媒体 | |
CN112200057B (zh) | 人脸活体检测方法、装置、电子设备及存储介质 | |
CN112801047B (zh) | 缺陷检测方法、装置、电子设备及可读存储介质 | |
JPWO2018207334A1 (ja) | 画像認識装置、画像認識方法および画像認識プログラム | |
CN111950633A (zh) | 神经网络的训练、目标检测方法及装置和存储介质 | |
CN116503399A (zh) | 基于yolo-afps的绝缘子污闪检测方法 | |
CN116188825A (zh) | 一种基于并行注意力机制的高效特征匹配方法 | |
CN117765363A (zh) | 一种基于轻量型记忆库的图像异常检测方法及系统 | |
CN112084887A (zh) | 一种基于注意力机制的自适应视频分类方法及系统 | |
CN115564030A (zh) | 目标检测模型的压缩方法、检测方法、装置及相关设备 | |
CN110866484A (zh) | 驾驶员人脸检测方法、计算机装置及计算机可读存储介质 | |
CN115471863A (zh) | 三维姿态的获取方法、模型训练方法和相关设备 | |
CN113888498A (zh) | 图像异常检测方法、装置、电子设备及存储介质 | |
CN114677611B (zh) | 数据识别方法、存储介质及设备 | |
CN114820755B (zh) | 一种深度图估计方法及系统 | |
CN116152542A (zh) | 图像分类模型的训练方法、装置、设备及存储介质 | |
CN115937596A (zh) | 目标检测方法及其模型的训练方法、设备以及存储介质 | |
Wang et al. | Unsupervised anomaly detection with local-sensitive VQVAE and global-sensitive transformers | |
KR20230106057A (ko) | 인공신경망을 이용한 6자유도 자세 추정 방법 및 장치 | |
CN113743308B (zh) | 基于特征质量的人脸识别方法、装置、存储介质及系统 | |
US20240196086A1 (en) | Method and apparatus for detecting best shot in long-range face recognition system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |