CN116958131A - 一种图像处理方法、装置、设备及存储介质 - Google Patents
一种图像处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116958131A CN116958131A CN202311199367.6A CN202311199367A CN116958131A CN 116958131 A CN116958131 A CN 116958131A CN 202311199367 A CN202311199367 A CN 202311199367A CN 116958131 A CN116958131 A CN 116958131A
- Authority
- CN
- China
- Prior art keywords
- image
- detected
- denoised
- anomaly score
- denoising
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 29
- 238000003860 storage Methods 0.000 title claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 112
- 238000001514 detection method Methods 0.000 claims abstract description 96
- 238000003384 imaging method Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 67
- 230000000875 corresponding effect Effects 0.000 claims description 57
- 230000002159 abnormal effect Effects 0.000 claims description 52
- 238000012549 training Methods 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 19
- 238000010586 diagram Methods 0.000 claims description 16
- 230000004927 fusion Effects 0.000 claims description 16
- 230000002441 reversible effect Effects 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 8
- 230000000873 masking effect Effects 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000009792 diffusion process Methods 0.000 description 70
- 230000008569 process Effects 0.000 description 40
- 230000005856 abnormality Effects 0.000 description 32
- 238000013528 artificial neural network Methods 0.000 description 11
- 238000003062 neural network model Methods 0.000 description 10
- 230000002829 reductive effect Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000007689 inspection Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000010606 normalization Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 101100391182 Dictyostelium discoideum forI gene Proteins 0.000 description 1
- 101150064138 MAP1 gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 101150077939 mapA gene Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007847 structural defect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
- G06T7/001—Industrial image inspection using an image reference approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种图像处理方法、装置、设备及存储介质,应用于云技术、人工智能、智慧交通、辅助驾驶和工业应用等各种基于图像的检测场景;该图像处理方法包括:基于待检测图像的待重建特征进行信息重建,得到信息重建结果,其中,待检测图像为待检测实体的成像信息;基于信息重建结果相对于待检测图像的差异,确定第一异常分数图;对待检测图像的掩码图像进行去噪,得到去噪图像;基于去噪图像与待检测图像之间的差异,确定第二异常分数图;结合第一异常分数图和第二异常分数图,确定目标异常分数图;基于目标异常分数图,确定待检测实体的检测结果。通过本申请,能够提升检测准确性。
Description
技术领域
本申请涉及计算机应用领域中的图像处理技术,尤其涉及一种图像处理方法、装置、设备及存储介质。
背景技术
在质检场景中,常常需要对质检对象进行异常检测;比如,工业制造场景中的工件质检;一般来说,为了进行异常检测,通常采用信息重建的方式;然而,信息重建过程中存在降采样等操作,影响了输出精度,也就影响了检测准确性。
发明内容
本申请实施例提供一种图像处理方法、装置、设备、存储介质及程序产品,能够提升检测准确性。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种图像处理方法,所述方法包括:
基于待检测图像的待重建特征进行信息重建,得到信息重建结果,其中,所述待检测图像为待检测实体的成像信息;
基于所述信息重建结果相对于所述待检测图像的差异,确定第一异常分数图;
对所述待检测图像的掩码图像进行去噪,得到去噪图像;
基于所述去噪图像与所述待检测图像之间的差异,确定第二异常分数图;
结合所述第一异常分数图和所述第二异常分数图,确定目标异常分数图;
基于所述目标异常分数图,确定所述待检测实体的检测结果。
本申请实施例提供一种图像处理装置,所述图像处理装置包括:
信息重建模块,用于基于待检测图像的待重建特征进行信息重建,得到信息重建结果,其中,所述待检测图像为待检测实体的成像信息;
差异确定模块,用于基于所述信息重建结果相对于所述待检测图像的差异,确定第一异常分数图;
图像去噪模块,用于对所述待检测图像的掩码图像进行去噪,得到去噪图像;
所述差异确定模块,还用于基于所述去噪图像与所述待检测图像之间的差异,确定第二异常分数图;
所述差异确定模块,还用于结合所述第一异常分数图和所述第二异常分数图,确定目标异常分数图;
结果确定模块,用于基于所述目标异常分数图,确定所述待检测实体的检测结果。
在本申请实施例中,所述图像处理装置还包括网格划分模块,用于将所述待检测图像划分为包括L1个网格的网格图像,将所述网格图像划分为L2个独立网格集,其中,L1和L2为大于1的正整数;根据L2个所述独立网格集,得到L2张待去噪图像,将L2张所述待去噪图像确定为所述掩码图像,每张所述待去噪图像是将所述网格图像中的一个目标独立网格集进行掩码得到的,其中,所述目标独立网格集是L2个所述独立网格集中的一个。
在本申请实施例中,所述图像去噪模块,还用于采用指定去噪次数对所述掩码图像中的每张所述待去噪图像进行去噪,得到与L2张所述待去噪图像对应的L2张已去噪图像;叠加L2张所述已去噪图像中与所述目标独立网格集对应的区域,得到所述去噪图像。
在本申请实施例中,所述图像去噪模块,还用于当所述指定去噪次数对应T个时间点序列时,基于所述掩码图像中的每张所述待去噪图像,确定第t个预测图像,其中,T为正整数;迭代t执行以下处理,其中,t表示所述预测图像的次序,,且t为正整数:基于第t个所述预测图像,预测第t-1个所述预测图像;基于迭代t预测出的第0个所述预测图像,得到所述已去噪图像;由每张所述待去噪图像的所述已去噪图像,得到与L2张所述待去噪图像对应的L2张所述已去噪图像。
在本申请实施例中,所述图像去噪模块,还用于从所述指定去噪次数对应的倒序时间点序列中,依次选择指定数量的最小时间点,其中,各个时间点之间的顺序与待去噪程度正相关;从所述指定数量的最小时间点中等间隔选择T个时间点序列。
在本申请实施例中,所述图像去噪模块,还用于当所述指定去噪次数对应T个时间点序列时,将T个时间点序列在所述指定去噪次数包括的原始时间点序列中的占比,确定为噪声幅度;基于所述噪声幅度向所述待去噪图像叠加噪声,得到第t个所述预测图像。
在本申请实施例中,所述图像去噪模块,还用于对第t个所述预测图像进行特征提取,得到待预测特征;以所述待去噪图像为指导条件对所述待预测特征进行噪声预测,得到预测噪声;从第t个所述预测图像中去除所述预测噪声,得到第t-1个所述预测图像。
在本申请实施例中,所述图像去噪模块,还用于基于所述预测噪声,确定第t个所述预测图像中与所述目标独立网格集对应的均值预测噪声和方差预测噪声;结合所述均值预测噪声和所述方差预测噪声,对第t个所述预测图像中与所述目标独立网格集对应的区域进行去噪,得到掩码预测结果;获取所述待检测图像扩散至t时间点时的未掩码预测结果;结合所述掩码预测结果和所述未掩码预测结果,得到第t-1个所述预测图像。
在本申请实施例中,所述图像去噪模块,还用于基于第t-1个所述预测图像,预测相对于时间点0时的预测结果;当迭代结束时,得到T个所述预测结果;融合T个所述预测结果和第0个所述预测图像,得到所述已去噪图像。
在本申请实施例中,所述差异确定模块,还用于针对多个指定平滑尺度中的每个所述指定平滑尺度,执行以下处理:将所述待检测图像下采样所述指定平滑尺度,得到第一待上采样图像,将所述去噪图像下采样所述指定平滑尺度,得到第二待上采样图像;将所述第一待上采样图像与第二待上采样图像的差信息上采样所述指定平滑尺度,得到尺度异常分数图;对多个所述指定平滑尺度对应的多个所述尺度异常分数图进行融合,得到时空融合异常分数图;对所述时空融合异常分数图进行均值过滤卷积,得到所述第二异常分数图。
在本申请实施例中,所述信息重建模块,还用于基于待检测图像的待重建特征进行特征重建,得到重建特征,将所述重建特征确定为所述信息重建结果;或者,基于待检测图像的待重建特征进行图像重建,得到重建图像,将所述重建图像确定为所述信息重建结果;当所述信息重建结果为所述重建特征时,基于所述重建特征与所述待检测图像的所述待重建特征之间的差异,确定所述第一异常分数图;当所述信息重建结果为所述重建图像时,基于所述重建图像与所述待检测图像之间的差异,确定所述第一异常分数图。
在本申请实施例中,所述结果确定模块,还用于将所述目标异常分数图中目标异常分数大于异常分数阈值的区域,确定为异常区域;将所述目标异常分数图中最大目标异常分数,确定为所述待检测实体的异常程度;将所述异常区域和所述异常程度,确定为所述待检测实体的所述检测结果。
在本申请实施例中,所述信息重建和所述去噪通过异常检测模型实现,所述图像处理装置还包括模型训练模块,用于对正样本图像进行特征提取,得到待重建样本特征;利用第一待训练模型对所述待重建样本特征进行信息重建,得到基础异常分数样本图,基于所述基础异常分数样本图和所述正样本图像之间的差异训练所述第一待训练模型,得到基础检测模型;利用第二待训练模型对所述正样本图像的掩码样本图像进行去噪,得到优化异常分数样本图,基于所述优化异常分数样本图和所述正样本图像之间的差异训练所述第二待训练模型,得到优化检测模型;将所述基础检测模型和所述优化检测模型,确定为所述异常检测模型。
本申请实施例提供一种用于图像处理的电子设备,所述电子设备包括:
存储器,用于存储计算机可执行指令或者计算机程序;
处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现本申请实施例提供的图像处理方法。
本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令或者计算机程序,所述计算机可执行指令或者计算机程序用于被处理器执行时,实现本申请实施例提供的图像处理方法。
本申请实施例提供一种计算机程序产品,包括计算机可执行指令或者计算机程序,所述计算机可执行指令或者计算机程序被处理器执行时,实现本申请实施例提供的图像处理方法。
本申请实施例至少具有以下有益效果:在对待待检测图像进行信息重建获得的第一异常分数图的基础上,还对待检测图像的掩码图像进行去噪来获得第二异常分数图;而在第二异常分数图的获取过程中,对掩码图像进行去噪不影响图像尺寸,减少了信息损失;从而,在结合第一异常分数图和第二异常分数图确定待检测实体的检测结果时,能够提升检测准确性。
附图说明
图1是本申请实施例提供的图像处理系统的架构示意图;
图2是本申请实施例提供的一种图1中的终端的结构示意图;
图3是本申请实施例提供的图像处理方法的流程示意图一;
图4是本申请实施例提供的图像处理方法的流程示意图二;
图5是本申请实施例提供的图像去噪流程示意图;
图6是本申请实施例提供的获取第二异常分数图的流程示意图;
图7是本申请实施例提供的模型训练流程示意图;
图8是本申请实施例提供的一种示例性的模型结构示意图;
图9是本申请实施例提供的一种示例性的获取受损图像的示意图;
图10是本申请实施例提供的一种示例性的U型网络模型的结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二等”用于区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二等”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与所属技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)人工智能(Artificial Intelligence,AI),是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。本申请实施例提供的图像处理方法可以通过人工智能实现。
2)机器学习(Machine Learning,ML),是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析和算法复杂度理论等多门学科。用于研究计算机模拟或实现人类的学习行为,以获取新的知识或技能;重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,机器学习应用遍及人工智能的各个领域。机器学习通常包括人工神经网络、置信网络、强化学习、迁移学习和归纳学习等技术。本申请实施例中可以通过机器学习中的人工神经网络进行目标异常分数图的获取。
3)人工神经网络,是一种模仿生物神经网络结构和功能的数学模型,本申请实施例中人工神经网络的示例性结构包括图卷积网络(Graph Convolutional Network,GCN,一种用于处理图结构的数据的神经网络)、深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(RecurrentNeuralNetwork,RNN)、神经状态机(Neural State Machine,NSM)和相位函数神经网络(Phase-FunctionedNeural Network,PFNN)等。本申请实施例中所涉及的第一待训练模型、第二待训练模型、基础检测模型和优化检测模型等均为人工神经网络对应的模型(以下简称为神经网络模型)。
4)扩散模型(Diffusion Model),一种图像生成模型,用于学习由噪声引起的信息衰减,然后采用学习到的模式来生成图像。扩散模型包含两个阶段,一个阶段是从原图逐步到噪声的正向过程/扩散过程(Forward / Diffusion Process)另一个阶段是从噪声逐步到原图的逆向过程(ReverseProcess)。扩散模型能够实现归纳偏置(Inductive Bias),归纳偏置是指通过指定偏好(比如,人为偏好),将某一种解决方案优先于其他解;既可以应用在底层数据分布假设上,也可以应用在模型设计上;归纳偏置是一种在模型的无限解空间中所引入的合理假设与约束,通过该假设与约束,能够缩小求解空间并提高所得模型在目标域的泛化性。本申请实施例中的第一待训练模型可以为扩散模型。
5)异常检测(Anomaly Detection),用于识别异常图像并定位异常区域。在工业场景中,用于异常检测的异常样本很少(少于指定数量),而且异常类型包括从细微异常到结构缺陷多种异常种类,故当本申请实施例应用在工业场景时,可以采用正常样本进行学习,以检测异常样本。本申请实施例提供的图像处理方法用于异常检测。
6)图像修复(Image Inpainting),用于恢复残缺图像中损坏部分的像素特征,可以应用在计算机视觉应用领域。本申请实施例中通过图像修复提升异常分数图的准确性。
需要说明的是,在质检场景中,常常需要对质检对象进行异常检测;比如,工业制造场景中的工件质检;一般来说,为了进行异常检测,通常采用信息重建的方式;然而,信息重建过程中存在降采样等操作,影响了输出精度,也就影响了检测准确性。
示例性地,在工业制造场景中,常用人工智能和深度学习等技术对产品外观部分进行工件质检,以确保产品的一致性、良品率和安全性,实现产线质检的全自动化。由于成熟产线良品率高(大于指定良品率),缺陷产品的数量较低(低于指定产品数量),影响了正负样本的平衡;又由于缺陷种类多样,影响了人工标注成本;从而,影响了有监督分类方法性能。
为了实现异常检测,还可以采用无监督方式。当采用一个模型针对一个类别的无监督方案时,因为该模型用于单一的产品,需要每种产品单独训练一个模型,提升了资源消耗,且难以处理多种语义类别工件联合判断的情况,在产品形状变化时影响了模型的准确度,影响了泛化性和适用性。
此外,当采用一个模型针对全类别的无监督方案时,即为通过一个统一的框架来检测各种类别的异常;由于无监督方案是基于特征重建的,通过对输入图像或输入特征进行重建,计算原始输入和重建结果的差异进行异常检测和定位;模型在正常训练集上训练后,不论输入正常样本还是异常样本,最终重建出正常样本的图像。然而,实际情况中,模型对应有重建异常样本的情况,此时,存在重建误差,重建结果为异常样本,不能表达异常区域,从而存在重建异常样本的问题。以及,基于重建的方法涉及降采样等操作,比如,生成对抗网络(Generative Adversarial Network,GAN)和变自分编码器(Variational Auto-Encoder,VAE),存在由于池化(Pooling)和大步长(大于指定步长)卷积操作(StridedConvolutions)导致的分辨率损失问题,导致输出模糊,并可能导致细微缺陷的损失,进而影响异常检测的性能,从而,存在模糊重建的问题。如此,也就影响了异常检测的准确性。
基于此,本申请实施例提供一种图像处理方法、装置、设备、计算机可读存储介质及计算机程序产品,能够提升的检测准确性。下面说明本申请实施例提供的用于图像处理的电子设备(以下简称为图像处理设备)的示例性应用,本申请实施例提供的图像处理设备可以实施为智能手机、智能手表、笔记本电脑、平板电脑、台式计算机、智能家电、机顶盒、智能车载设备、便携式音乐播放器、个人数字助理、专用消息设备、智能语音交互设备、便携式游戏设备和智能音箱等各种类型的终端,也可以实施为服务器,又可以实施为终端和服务器。下面,将通过图1说明图像处理设备实施为终端时的示例性应用。
参见图1,图1是本申请实施例提供的图像处理系统的架构示意图;如图1所示,为支撑一个图像处理应用,在图像处理系统100中,终端400(示例性示出了终端400-1和终端400-2)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,服务器200用于通过网络300向终端400提供图像处理相关的服务(比如,待检测图像与检测结果的存储等)。另外,该图像处理系统100中还包括数据库500,用于向服务器200提供数据支持;并且,图1中示出的为数据库500独立于服务器200的一种情况,此外,数据库500还可以集成在服务器200中,本申请实施例对此不作限定。
终端400,用于基于待检测图像的待重建特征进行信息重建,得到信息重建结果,其中,待检测图像为待检测实体的成像信息;基于信息重建结果相对于待检测图像的差异,确定第一异常分数图;对待检测图像的掩码图像进行去噪,得到去噪图像;基于去噪图像与待检测图像之间的差异,确定第二异常分数图;结合第一异常分数图和第二异常分数图,确定目标异常分数图;基于目标异常分数图,确定待检测实体的检测结果,并呈现检测结果(示例性示出了图形界面410-1和图形界面410-2)。还用于通过网络300向服务器200发送待检测图像与检测结果的对应信息。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不作限制。
参见图2,图2是本申请实施例提供的一种图1中的终端的结构示意图;如图2所示,终端400包括:至少一个处理器410、存储器450、至少一个网络接口420和用户接口430。终端400中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统440。
处理器410可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(Digital Signal Processor,DSP),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口430包括使得能够呈现媒体内容的一个或多个输出装置431,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口430还包括一个或多个输入装置432,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器410的一个或多个存储设备。
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(Read Only Memory,ROM),易失性存储器可以是随机存取存储器(Random Access Memory,RAM)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块452,用于经由一个或多个(有线或无线)网络接口420到达其他电子设备,示例性的网络接口420包括:蓝牙、无线相容性认证(Wi-Fi)、和通用串行总线(Universal Serial Bus,USB)等;
呈现模块453,用于经由一个或多个与用户接口430相关联的输出装置431(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块454,用于对来自一个或多个输入装置432之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的图像处理装置可以采用软件方式实现,图2示出了存储在存储器450中的图像处理装置455,其可以是程序和插件等形式的软件,包括以下软件模块:信息重建模块4551、差异确定模块4552、图像去噪模块4553、结果确定模块4554、网格划分模块4555和模型训练模块4556,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在一些实施例中,本申请实施例提供的图像处理装置可以采用硬件方式实现,作为示例,本申请实施例提供的图像处理装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的图像处理方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(Application Specific Integrated Circuit,ASIC)、DSP、可编程逻辑器件(Programmable Logic Device,PLD)、复杂可编程逻辑器件(Complex Programmable Logic Device,CPLD)、现场可编程门阵列(Field-ProgrammableGate Array,FPGA)或其他电子元件。
在一些实施例中,终端或服务器可以通过运行各种计算机可执行指令或者计算机程序来实现本申请实施例提供的图像处理方法。举例来说,计算机可执行指令可以是微程序级的命令、机器指令或软件指令。计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APPlication,APP),即需要在操作系统中安装才能运行的程序,如异常检测APP;也可以是能够嵌入至任意APP中的小程序,即只需要下载到浏览器环境中就可以运行的程序。总而言之,上述的计算机可执行指令可以是任意形式的指令,上述计算机程序可以是任意形式的应用程序、模块或插件。
下面,将结合本申请实施例提供的图像处理设备的示例性应用和实施,说明本申请实施例提供的图像处理方法。另外,本申请实施例提供的图像处理方法应用于云技术、人工智能和工业应用等各种基于图像的检测场景。
参见图3,图3是本申请实施例提供的图像处理方法的流程示意图一,其中,图3中各步骤的执行主体是图像处理设备;下面将结合图3示出的步骤进行说明。
步骤101、基于待检测图像的待重建特征进行信息重建,得到信息重建结果。
在本申请实施例中,图像处理设备在基于待检测图像对待检测实体进行异常检测时,一方面提取待检测图像的待重建特征,并对该待重建特征进行信息重建,以基于信息重建结果获得基于信息重建的异常检测结果。其中,信息重建包括图像重建和特征重建中的至少一种。
需要说明的是,待检测图像为待检测实体的成像信息,而待检测实体为待进行异常检测的实体对象,比如,牙刷、金属器件、玻璃器件等各种类型的工件;由于待检测实体对应有正常规范(比如,牙刷合格规范,杯子合格规范等),从而异常检测是指检测待检测实体是否符合正常规范。待重建特征通过提取待检测图像的特征获得;这里,可以对待检测图像进行下采样后再对下采样后的待检测图像进行待重建特征的提取,以降低信息重建的计算消耗,提升信息重建效率。另外,信息重建结果是指对待重建特征进行信息重建所获得的结果;当信息重建为图像重建时,信息重建结果为待重建特征的重建特征;当信息重建为特征重建时,信息重建结果为待重建特征的重建图像;当信息重建为特征重建和图像重建时,信息重建结果为重建特征和重建图像。
在本申请实施例中,图像处理设备基于待检测图像的待重建特征进行信息重建,得到信息重建结果,包括:图像处理设备基于待检测图像的待重建特征进行特征重建,得到重建特征,将重建特征确定为信息重建结果;或者,图像处理设备基于待检测图像的待重建特征进行图像重建,得到重建图像,将重建图像确定为信息重建结果;或者,图像处理设备基于待检测图像的待重建特征进行特征重建,得到重建特征,基于待检测图像的待重建特征进行图像重建,得到重建图像,将重建特征和重建图像确定为信息重建结果。
步骤102、基于信息重建结果相对于待检测图像的差异,确定第一异常分数图。
在本申请实施例中,图像处理设备获取信息重建结果相对于待检测图像的差异,并将获得的信息重建结果相对于待检测图像的差异确定为第一异常分数图。其中,信息重建结果相对于待检测图像的差异基于信息重建结果的内容确定。当信息重建结果包括重建特征时,信息重建结果相对于待检测图像的差异,是指重建特征与待重建特征之间的差异;当信息重建结果包括重建图像时,信息重建结果相对于待检测图像的差异,是指重建图像与待检测图像之间的差异;当信息重建结果包括重建特征和重建图像时,信息重建结果相对于待检测图像的差异,是指重建特征与待重建特征之间的差异、以及重建图像与待检测图像之间的差异。
需要说明的是,第一异常分数图在尺寸上与待检测图像对应,能够确定待检测图像中的初始异常区域、以及待检测图像的初始异常程度。
在本申请实施例中,图像处理设备将信息重建结果相对于待检测图像的差异,确定为第一异常分数图,包括:当信息重建结果为重建特征时,图像处理设备基于重建特征与待检测图像的待重建特征之间的差异,确定第一异常分数图;当信息重建结果为重建图像时,图像处理设备基于重建图像与待检测图像之间的差异,确定第一异常分数图;当信息重建结果为重建特征和重建图像时,图像处理设备基于重建特征与待检测图像的待重建特征之间的差异、以及重建图像与待检测图像之间的差异,确定第一异常分数图。
步骤103、对待检测图像的掩码图像进行去噪,得到去噪图像。
在本申请实施例中,图像处理设备还用于对待检测图像进行掩码,以获得掩码图像;接着,采用逆扩散的方式对掩码图像进行去噪,并将去噪结果确定为去噪图像。其中,图像处理设备可以随机对待检测图像进行掩码,还可以基于指定掩码位置对待检测图像进行掩码,又可以是基于指定掩码组合方式(比如,所有掩码位置所组合的区域为待检测图像对应的区域)对待检测图像进行掩码,也可以是上述的组合,等等,本申请实施例对此不作限定;逆扩散的方式为对掩码图像逐步去噪的修复方式。
需要说明的是,去噪图像为待检测图像对应的预测出的正常图像,正常图像为符合待检测实体的正常规范的图像,从而,通过比较去噪图像和待检测图像能够准确地确定异常检测结果。另外,掩码图像的每一步的去噪结果均与上一步的去噪结果的维度一致,以确定图像信息的完整性。
参见图4,图4是本申请实施例提供的图像处理方法的流程示意图二,其中,图4中各步骤的执行主体是图像处理设备;如图4所示,在本申请实施例中,步骤103中图像处理设备对待检测图像的掩码图像进行去噪,得到去噪图像,包括步骤1031和步骤1032,下面对各步骤分别进行说明。
步骤1031、采用指定去噪次数对掩码图像中的每张待去噪图像进行去噪,得到与L2张待去噪图像对应的L2张已去噪图像。
在本申请实施例中,图像处理设备对掩码图像中的每张待去噪图像进行逐步去噪,得到与每张待去噪图像对应的已去噪图像;从而,针对掩码图像中的L2张待去噪图像,能够获得L2张已去噪图像。其中,L2张待去噪图像和L2张已去噪图像一一对应,L2为大于1的正整数。
需要说明的是,图像处理设备能够获得用于去噪的指定去噪次数(比如,1000次,500次,等等),从而采用该指定去噪次数对掩码图像进行逐步去噪。这里,掩码图像包括L2张待去噪图像,每张待去噪图像对应待检测图像的一种掩码方式,各张待去噪图像对应的各个掩码方式可以独立,也可以基于掩码规律关联(比如,待检测图像中的每个独立网格集在一张待去噪图像中被掩码),本申请实施例对此不作限定。
步骤1032、叠加L2张已去噪图像中与目标独立网格集对应的区域,得到去噪图像。
在本申请实施例中,当待去噪图像中的一个独立网格集(称为目标独立网格集)在L2张待去噪图像中的一张待去噪图像中被掩码、而在其他L2-1张待去噪图像中保持待去噪图像中的原有信息时,当获得了L2张已去噪图像时,叠加L2张已去噪图像中与目标独立网格集对应的区域,并将叠加结果确定为去噪图像。
需要说明的是,待检测图像对应L1个网格,L1为大于1的正整数。
示例性地,当L2为3,L1为6时,如果待去噪图像A中的网格1和网格3(称为目标独立网格集)被掩码,待去噪图像B中的网格2和网格5(称为目标独立网格集)被掩码,待去噪图像C中的网格4和网格6(称为目标独立网格集)被掩码;此时,叠加待去噪图像A的已去噪图像中的网格1和网格3、待去噪图像B的已去噪图像中的网格2和网格5、以及待去噪图像C的已去噪图像中的网格4和网格6,以得到去噪图像。
可以理解的是,通过对待检测图像进行掩码,并对掩码图像采用逆扩散方式进行去噪,以及通过叠加各个已去噪图像中的掩码网格获得去噪图像,实现了去噪的处理,降低了对待检测图像的信息损失,从而能够提升去噪图像的准确度。
参见图5,图5是本申请实施例提供的图像去噪流程示意图,其中,图5中各步骤的执行主体是图像处理设备;如图5所示,在本申请实施例中,步骤1031包括步骤10311至步骤10314;也就是说,图像处理设备采用指定去噪次数对掩码图像中的每张待去噪图像进行去噪,得到与L2张待去噪图像对应的L2张已去噪图像,包括步骤10311至步骤10314,下面对各步骤分别进行说明。
步骤10311、当指定去噪次数对应T个时间点序列时,基于掩码图像中的每张待去噪图像,确定第t个预测图像。
需要说明的是,指定去噪次数对应的T个时间点序列,可以是指定去噪次数对应的原始时间点序列,还可以是从原始时间点序列中选择出的时间点序列,本申请实施例对此不作限定。这里,图像处理设备可以将掩码图像中的每张待去噪图像直接确定为第t个预测图像,还可以将叠加噪声后的待去噪图像确定为第t个预测图像,本申请实施例对此不作限定。其中,T为正整数,t从T开始迭代;原始时间点序列中的时间点数量与指定去噪次数在数值上相等。
继续参见图5,在本申请实施例中,步骤10311可通过步骤103111和步骤103112实现;也就是说,当指定去噪次数对应T个时间点序列时,图像处理设备基于掩码图像中的每张待去噪图像,确定第t个预测图像,包括步骤103111和步骤103112,下面对各步骤分别进行说明。
步骤103111、当指定去噪次数对应T个时间点序列时,将T个时间点序列在指定去噪次数对应的原始时间点序列中的占比,确定为噪声幅度。
需要说明的是,图像处理设备在将叠加噪声后的待去噪图像确定为第t个预测图像时,所叠加噪声的幅度可以为T个时间点序列在原始时间点序列中的占比;其中,所叠加噪声的幅度即为噪声幅度。另外,原始时间点序列为指定去噪次数对应的全部时间点,比如,指定去噪次数为1000,则原始时间点序列为时间点1000至时间点0。这里,T个时间点序列在原始时间点序列中的占比,可以是T个时间点序列中最大时间点的数值与原始时间点序列中最大时间点的数值的比值,还可以是T个时间点序列中的时间点数量与原始时间点序列中的时间点数量的比值,本申请实施例对此不作限定。
步骤103112、基于噪声幅度向待去噪图像叠加噪声,得到第t个预测图像。
需要说明的是,图像处理设备获得的叠加噪声后的待去噪图像即为第t个预测图像。
可以理解的是,在简化原始时间点序列的情况下,通过向待去噪图像叠加噪声,能够降低简化时间点带来的影响,在对掩码区域(在位置上与目标独立网格集对应的区域,即为掩码的目标独立网格集所对应的区域)无影响的情况下,提升未掩码区域(网格图像中除掩码的目标独立网格集所对应的区域之外的区域)的预测精度。
在本申请实施例中,迭代t执行以下处理(步骤10312),其中,t表示预测图像的次序,等于去噪次数,,且t为正整数。
步骤10312、基于第t个预测图像,预测第t-1个预测图像。
需要说明的是,正扩散是指由待检测图像逐时间点扩散出第T个预测图像的过程,逆扩散是指由第T个预测图像逐时间点恢复出待检测图像的过程;由于去噪是逆扩散过程,从而,图像处理设备从第T个预测图像开始,在每个时间点t时,由第t个预测图像预测时间点t-1时的第t-1个预测图像,完成一次图像恢复。
在本申请实施例中,图像处理设备基于第t个预测图像,预测第t-1个预测图像,包括:图像处理设备对第t个预测图像进行特征提取,得到待预测特征;以待去噪图像为指导条件对待预测特征进行噪声预测,得到预测噪声;从第t个预测图像中去除预测噪声,得到第t-1个预测图像。其中,图像处理设备从第t个预测图像中去除预测噪声,得到第t-1个预测图像,包括:图像处理设备基于预测噪声,确定第t个预测图像中与目标独立网格集对应的均值预测噪声和方差预测噪声;结合均值预测噪声和方差预测噪声,对第t个预测图像中与目标独立网格集对应的区域进行去噪,得到掩码预测结果;获取待检测图像扩散至t时间点时的未掩码预测结果;结合掩码预测结果和未掩码预测结果,得到第t-1个预测图像
需要说明的是,待预测特征为第t个预测图像的特征提取结果;预测噪声是指从时间点t到时间点t-1之间第t个预测图像上待去除的噪声。这里,图像处理设备可以基于待去噪图像中的二进制掩码来结合掩码预测结果和未掩码预测结果。
可以理解的是,图像处理设备对第t个预测图像进行特征提取,所提取到的待预测特征与第t个预测图像在维度上一致,如此,能够提升预测准确度。另外,图像处理设备以待去噪图像为指导条件,能够准确地学习到待检测实体的类别的噪声分布,进而在逆扩散时提升每一时间点的预测准确性。此外,图像处理设备在去除噪声时,将掩码区域和未掩码区域分别进行处理,控制降噪方向,以控制逆扩散的恢复,降低预测结果与输入图像的类别差异。
步骤10313、基于迭代t预测出的第0个预测图像,得到已去噪图像。
需要说明的是,图像处理设备通过变量t从时间点T迭代至时间点1,当由第1个预测图像预测出第0个预测图像时,确定t迭代结束;此时,将第0个预测图像确定为已去噪图像,或者基于第0个预测图像确定已去噪图像。
步骤10314、由每张待去噪图像的已去噪图像,得到与L2张待去噪图像对应的L2张已去噪图像。
需要说明的是,针对每种待去噪图像均获得了已去噪图像之后,针对L2张待去噪图像,能够获得L2张已去噪图像。
还需要说明的是,步骤103和步骤101在执行顺序上不分先后顺序,可以是并行执行,还可以是串行执行,又可以是交错执行,也可以是上述的组合,等等,本申请实施例对此不作限定。
可以理解的是,通过对待检测图像进行不同规格的掩码,得到L2张待去噪图像,再对每张待去噪图像进行去噪,最后对去噪出的L2张已去噪图像进行融合,以获得最终的去噪图像;如此,实现多种修复,从而能够提升去噪准确度。
步骤104、基于去噪图像与待检测图像之间的差异,确定第二异常分数图。
在本申请实施例中,图像处理设备对比去噪图像与待检测图像,以获取去噪图像与待检测图像之间的差异;这里,图像处理设备可以直接将去噪图像与待检测图像之间的差异确定为第二异常分数图,还可以对去噪图像与待检测图像之间的差异进行平滑处理后,再将平滑处理结果确定为第二异常分数图。
需要说明的是,第二异常分数图与待检测图像在像素上一一对应;从而,第二异常分数图的精度高于第一异常分数图的精度。
参见图6,图6是本申请实施例提供的获取第二异常分数图的流程示意图,其中,图6中各步骤的执行主体是图像处理设备;如图6所示,在本申请实施例中,步骤104可包括步骤1041至步骤1044;也就是说,图像处理设备基于去噪图像与待检测图像之间的差异,确定第二异常分数图,包括步骤1041至步骤1044,下面对各步骤分别进行说明。
在本申请实施例中,图像处理设备针对多个指定平滑尺度中的每个指定平滑尺度,执行以下处理(步骤1041和步骤1042)。
需要说明的是,图像处理设备能够获得多个用于对去噪图像与待检测图像之间的差异进行平滑的指定平滑尺度,每个指定平滑尺度表示上下采样的尺度,比如,128×128,256×256,512×512。这里,图像处理设备可以遍历多个指定平滑尺度,针对遍历到的每个指定平滑尺度执行步骤1041和步骤1042。
步骤1041、将待检测图像下采样指定平滑尺度,得到第一待上采样图像,将去噪图像下采样指定平滑尺度,得到第二待上采样图像。
需要说明的是,图像处理设备先将待检测图像和去噪图像分别下采样指定平滑尺度,得到与待检测图像对应的第一待上采样图像、以及与去噪图像对应的第二待上采样图像。
步骤1042、将第一待上采样图像与第二待上采样图像的差信息上采样指定平滑尺度,得到尺度异常分数图。
需要说明的是,图像处理设备获取第一待上采样图像与第二待上采样图像的差信息,并将该差信息进行指定平滑尺度的上采样,再将上采样结果确定为尺度异常分数图。
步骤1043、对多个指定平滑尺度对应的多个尺度异常分数图进行融合,得到时空融合异常分数图。
在本申请实施例中,当图像处理设备针对每个指定平滑尺度均获得了尺度异常分数图之后,针对多个指定平滑尺度,能够获得多个尺度异常分数图;其中,多个指定平滑尺度与多个尺度异常分数图一一对应。
步骤1044、对时空融合异常分数图进行均值过滤卷积,得到第二异常分数图。
在本申请实施例中,图像处理设备还用于对时空融合异常分数图进行均值过滤卷积,并将均值过滤卷积结果确定为第二异常分数图。其中,均值过滤卷积是指利用均值滤波器对时空融合异常分数图进行卷积的处理。
需要说明的是,平滑处理包括通过上下采样获取尺度异常分数图的处理、融合多个尺度异常分数图的处理、以及均值过滤卷积处理。
可以理解的是,通过对去噪图像与待检测图像之间的差异进行平滑处理,能够平滑异常分数图中异常区域的边缘,提升异常检测的准确度。
步骤105、结合第一异常分数图和第二异常分数图,确定目标异常分数图。
在本申请实施例中,由于第一异常分数图和第二异常分数图在维度上存在差异,图像处理设备可以对第一异常分数图和第二异常分数图分别进行归一化后,再对两个归一化结果进行结合;以及在结合两个归一化结果时,可以是累加,还可以是加权求和,等等,本申请实施例对此不作限定。这里,图像处理设备将两个归一化结果的结合结果,确定为目标异常分数图。
需要说明的是,图像处理设备可以将第一异常分数图与第一异常分数图的特征通道数的比值,确定为第一异常分数图的归一化结果;并将第二异常分数图与第二异常分数图的特征通道数的比值,确定为第二异常分数图的归一化结果。另外,目标异常分数图中的每个像素对应的异常分数表示该像素对应的异常程度。
步骤106、基于目标异常分数图,确定待检测实体的检测结果。
需要说明的是,目标异常分数图为待检测图像的最终异常检测分数图;这里,可以将目标异常分数图直接作为待检测实体的检测结果,也可以将目标异常分数图的分析结果确定为待检测实体的检测结果,还可以是上述的组合,等等,本申请实施例对此不作限定。
在本申请实施例中,图像处理设备基于目标异常分数图,确定待检测实体的检测结果,包括:图像处理设备将目标异常分数图中目标异常分数大于异常分数阈值的区域,确定为异常区域;将目标异常分数图中最大目标异常分数,确定为待检测实体的异常程度;将异常区域和异常程度,确定为待检测实体的检测结果。
需要说明的是,图像处理设备能够获得异常分数阈值,该异常分数阈值表示正常情况下的最大异常分数;从而,图像处理设备将目标异常分数图中的每个目标异常分数与异常分数阈值进行比较,并将第一异常分数阈值的目标异常分数所对应的区域称为异常区域。另外,图像处理设备还用于从目标异常分数图中选择最大目标异常分数,并将该最大目标异常分数确定为待检测实体的异常程度。最后,图像处理设备可以将异常区域和异常程度中的至少一种确定为待检测实体的检测结果。
在本申请实施例中,图像处理设备对待检测图像的掩码图像进行去噪,得到去噪图像之前,该图像处理方法还包括:图像处理设备将待检测图像划分为包括L1个网格的网格图像,将网格图像划分为L2个独立网格集;并根据L2个独立网格集,得到L2张待去噪图像,最后,将L2张待去噪图像,确定为掩码图像。
需要说明的是,网格图像为待检测图像进行网格划分后的结果;L1个网格在尺寸和形状上可以相等,也可以不等,还可以是上述两者的结合,本申请实施例对此不做限定。每张待去噪图像是将网格图像中的一个目标独立网格集进行掩码得到的,其中,目标独立网格集是L2个独立网格集中的一个;在均匀划分的情况下,每张待去噪图像包括个掩码网格,为正整数,掩码网格为掩码的网格。
在本申请实施例中,当指定去噪次数对应T个时间点序列时,图像处理设备基于掩码图像中的每张待去噪图像,确定第T个预测图像之前,该图像处理方法还包括:图像处理设备从指定去噪次数对应的倒序时间点序列中,依次选择指定数量的最小时间点;从指定数量的最小时间点中等间隔选择T个时间点序列。
需要说明的是,各个时间点之间的顺序与待去噪程度正相关,也就是说,噪声越大的图像对应的时间点的顺序越大;而去噪是从最大时间点开始的。
示例性地,当倒序时间点序列包括从时间点1000开始至时间点0的全部时间点时,从倒序时间点序列中选择250(称为指定数量)个最小时间点,即为时间点250至时间点0;接着对时间点250至时间点0进行等间隔选择,比如,间隔为50,则获得的T个时间点序列为时间点250、时间点200、时间点150、时间点100、时间点50和时间点0。
在本申请实施例中,信息重建和去噪通过异常检测模型实现,异常检测模型为通过信息重建和去噪进行异常检测的神经网络模型。参见图7,图7是本申请实施例提供的模型训练流程示意图,其中,图7中各步骤的执行主体是图像处理设备;如图7所示,异常检测模型通过步骤107至步骤110训练获得,下面对各步骤分别进行说明。
步骤107、对正样本图像进行特征提取,得到待重建样本特征。
需要说明的是,图像处理设备获取正样本图像的待重建样本特征的过程,与获取待检测图像的待重建特征的过程类似,本申请实施例在此不再重复描述。另外,正样本图像为异常检测模型的训练样本,且标签为正常实体。
步骤108、利用第一待训练模型对待重建样本特征进行信息重建,得到基础异常分数样本图,基于基础异常分数样本图和正样本图像之间的差异训练第一待训练模型,得到基础检测模型。
需要说明的是,第一待训练模型为待训练的基于信息重建进行异常检测的神经网络模型,可以是构建的原始神经网络模型,还可以是预训练出的神经网络模型,等等,本申请实施例对此不作限定。另外,图像处理设备获取基础异常分数样本图的过程,与获取第一异常分数样本图的过程类似,本申请实施例在此不再重复描述。
步骤109、利用第二待训练模型对正样本图像的掩码样本图像进行去噪,得到优化异常分数样本图,基于优化异常分数样本图和正样本图像之间的差异训练第二待训练模型,得到优化检测模型。
需要说明的是,第二待训练模型为待训练的基于逆扩散进行异常检测的神经网络模型,可以是构建的原始神经网络模型,还可以是预训练出的神经网络模型,等等,本申请实施例对此不作限定。另外,图像处理设备获取优化异常分数样本图的过程,与获取第二异常分数样本图的过程类似,本申请实施例在此不再重复描述。
在本申请实施例中,训练第一待训练模型和训练第二待训练模型的过程可以是迭代的,当满足分别对应的迭代结束条件时,结束训练,并将最后迭代训练出的第一待训练模型确定为基础检测模型,将最后迭代训练出的第二待训练模型确定为优化检测模型。其中,迭代结束条件可以是达到准确度指标阈值,也可以是达到迭代次数阈值,还可以是达到迭代时长阈值,又可以是以上的结合,等等,本申请实施例对此不作限定。以及,训练第一待训练模型和训练第二待训练模型的过程,均是通过反向传播调整各自的模型参数的过程。
步骤110、将基础检测模型和优化检测模型,确定为异常检测模型。
需要说明的是,异常检测模型包括两个训练好的神经网络模型,这两个训练好的神经网络模型即为基础检测模型和优化检测模型。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。该示例性应用描述了在工业零件质量检测领域,基于扩散模型进行图像去噪的异常检测过程。
需要说明的是,基于扩散模型进行图像去噪的工业异常检测方法用于工业零件质量检测领域。训练时的数据为正常样品,不区分种类,可以同时输入不同产品(比如,金属器件,玻璃器件等)的正常样品进行训练。训练包括两个阶段,一个阶段是对重建模型(基于Transformer的模型,称为第一待训练模型)的训练,另一个阶段是对扩散模型(称为第二待训练模型)的训练。推理时加载训练好的重建模型和训练好的扩散模型这两个模型(称为异常检测模型),即可自适应地重建最接近输入图像(称为待检测图像)的正常样品特征(称为信息重建结果)和图像(称为去噪图像),进而生成基于特征的异常分数图(称为第一异常分数图)和基于图像的异常分数图(称为第二异常分数图)。最后通过时空融合模块融合基于图像的异常分数图和基于特征的异常分数图,以精确地确定出输入图像对应的待检测样品(称为待检测实体)和正常样品的差异,得到最终的异常分数图(称为目标异常分数图)。最终的异常分数图中差异分数大于异常分数阈值的位置即为异常区域,最终异常分数图中最大异常分数即为待检测样品的异常值(称为异常程度)。
参见图8,图8是本申请实施例提供的一种示例性的模型结构示意图;如图8所示,模型结构包括基础模型8-1、扩散细化模型8-2和时空融合模型8-3。
基础模型8-1,用于对原始图像8-41的输入特征8-42(称为待重建特征)进行重建,得到输出特征8-43(称为重建特征),其中,输入特征8-42通过骨干网络8-11获得,输出特征8-43通过重建模型8-12获得;接着,通过对比输入特征8-42和输出特征8-43,得到基于特征的异常分数图8-44,将该基于特征的异常分数图8-44作为基础异常分数图。重建模型8-12比如为基于翻译(Transformer)的模型,自动编码器,GAN,VAE等。
在训练基础模型8-1时,将各种正常样品的图像输入到基础模型8-1中;训练过程可以采用二范数损失进行优化训练。另外,基础模型8-1还包括查找特征模块(QueryEmbedding),在获得输入特征8-42时以编码类别信息。
扩散细化模型8-2中的扩散模型8-21是一个输入维度和输出维度一致的模型,比如,U型网络模型(UNet模型),自动编码器,基于翻译的模型等。通过结合不同的时间点和掩码规格,生成包含高频信息的异常分数图。另外,扩散模型是由双条件策略调制的,使得扩散模型能够识别出不同的输入语义类别,从而能够提升通过逆扩散进行预测的准确性。
下面对扩散细化模型8-2的高频修正进行说明。
原始图像8-41被划分成L1个等长等宽的矩形网格,每个网格的像素数量为c×c;将L1个网格均匀划分成L2个不相交集(称为独立网格集),每个不相交集对应一张与原始图像8-41尺寸相同的图像;在L2张不相交集图像中,同一不相交集仅在一张不相交集图像中被掩码为纯高斯噪声,而在其他L2-1张不相交集图像中保持原有信息,从而获得的L2张不相交集图像为L2张受损图像(称为L2张待去噪图像)。
参见图9,图9是本申请实施例提供的一种示例性的获取受损图像的示意图;如9所示,当L2为2时,基于原始图像8-41,能够获得两张受损图像8-42,即为图8中的两张受损图像8-42。
这里,在采用逆扩散过程对每张受损图像进行去噪之前,对每张受损图像统一加噪声,其中,噪声幅度与逆扩散过程的时间点序列的最大值正相关;比如,当时间点从250至0时,噪声幅度为1/4,当时间点从500至0时,噪声幅度为1/2。
需要说明的是,在正扩散过程对应的方向上,原始图像逐渐失去信息(先失去的为高频信息,其次失去的为中频信息,最后失去的为低频信息),其中,高频信息、中频信息和低频信是基于图像中信息的清晰度划分的,且与清晰度正相关;而在逆扩散过程对应的方向上,原始图像的信息从纯高斯噪声中逐渐恢复(先恢复的为低频信息,其次恢复的为中频信息,最后恢复的为高频信息)。因此,为了提升逆扩散速度,加快图像去噪,当正扩散过程包括1000个时间点时,执行属于正扩散过程最早执行的部分时间步骤,比如执行处理的时间点为[0,50,100,150,200,250],以获得高频信息。同时,由于简化了逆扩散的时间点,从而通过对受损图像增加噪声,能够提升正常区域重建精度,且由于受损区域为纯高斯噪声,对受损区域无影响。
这里,在采用逆扩散过程对每张受损图像进行去噪时,通过扩散细化模型8-2中的去噪预测模块8-22针对每个时间点t,由时间点t时的图像预测对应于时间点0时的图像(称为相对于时间点0时的预测结果),如式(1)所示。
(1);
其中,的计算参见式(12),为基于扩散模型8-21从图像中预测出的噪声。最终,能够获得时间点数量个预测出的对应于时间点0时的图像。
需要说明的是,当扩散模型8-21为U型网络模型时,基于U型网络模型预测噪声,以通过去噪预测模块8-22去除,进而恢复图像中的掩码网格对应的掩码区域。
参见图10,图10是本申请实施例提供的一种示例性的U型网络模型的结构示意图;如图10所示,U型网络模型10-1包括特征提取部分10-11(编码器)和上采样部分10-12(解码器);其中,特征提取部分10-11用于提取特征,提取出的特征通过长连接的方式拼接至上采样部分10-12获得的特征上,以在逆扩散过程中辅助预测噪声;特征提取部分10-11中的每个下采样模块包括两个的卷积层(RELU)和一个的最大池化层。上采样部分10-12中的每个上采样模块包括一个的转置卷积层、特征拼接和两个和的卷积层。
在本申请实施例中,扩散模型8-21在预测噪声时,可以将受损图像作为模型引导,从而噪声还可以表示为;另外,还可以通过测试时条件降低原始图像与去噪图像的类别差异;在获得了之后,基于,能够获得在时间点t-1时的掩码区域的预测信息的噪声分布,如式(2)所示。
(2);
其中,表示由获得的均值,表示由获得的方差。
另外,在时间点t-1时的未掩码区域的预测信息可以由原始图像推导得到,即为通过数学方法获取原始图像从时间点0时扩散至时间点t-1时的图像,如式(3)所示。
(3);
其中,为所服从的分布,且该分布的均值为,方差为。
需要说明的是,是利用已知像素的扩散得到的,而是根据前一次迭代出的进行逆扩散得到的。最后,利用掩码将和合并为,如式(4)所示。
(4);
其中,为不相交集中L1个矩形网格被均分之后的对应的二进制遮罩。
在本申请实施例中,当每个加噪后的受损图像通过逆扩散过程预测出之后,融合、、……和,得到去噪图像;如此,能够获得L2张去噪图像,这里,将L2张去噪图像中的掩码网格结合起来,也就获得了最终的去噪图像;将最终的去噪图像与原始图像求取二范数(差值的平方),就能够得到基于图像的异常分数图8-45。
需要说明的是,扩散模型8-21可通过式(5)训练得到,式(5)如下所示。
(5);
其中,为损失值,为通过数学方法推导出的实际噪声,可以通过正向扩散获得。
时空融合模型8-3,用于融合基于特征的异常分数图和基于图像的异常分数图。这里示例性示出了三个尺度,每个尺度的异常分数图是通过将原始图像和最终的去噪图像均下采样到尺度,然后将两个下采样结果均上采样到原始分辨率来计算的,如式(6)所示。
(6);
其中,表示上采样处理,表示下采样处理。
此时,时空融合分数的获取过程如式(7)所示。
(7);
其中,表示所有尺度的异常分数图集合,表示异常分数图的数量。
通过均值过滤卷积对时空融合分数进行后处理,得到平滑的时空异常分数图,如式(8)所示。
(8);
其中,为尺寸的均值滤波器,为卷积操作。
此外,在融合过程中,设定了一个超参用来调整异常分数图的权重,以得到最终的异常分数图(像素级异常分数图)8-46,如式(9)所示。
(9);
其中,为像素级异常分数图,为超参,用来调整异常分数图的权重。为基于特征的异常分数图的特征通道数,为时空异常分数图的特征通道数,以实现归一化处理。
需要说明的是,在获得了像素级异常分数图之后,在像素级异常分数图中,异常分数大于异常分数阈值的区域即为异常区域;另外,从像素级异常分数图中获取最大异常分数,并将获取的最大异常分数作为产品图像的图像级异常分数。
需要说明的是,这里异常检测的训练和推理的硬件环境不作限定(比如,包括8255C CPU和NVIDIA Tesla V100显卡的服务器,编码语言为Python 3.6.8,采用的框架为pytorch版本1.10.1,opencv-python版本4.6.0.66,numpy版本1.18.2,scikit-learn版本0.24.2)。
下面对扩散模型进行说明。
对于一张图像,如果每次都在该图像的每个像素上加指定量的噪声,经过多个轮次之后,图像中的信息将被丢失掉,称为一张噪声图。如果从最后得到的噪声图逐步还原到原图像,每次还原指定量的信息,该分布还原的过程可以通过神经网络模型实现,即为扩散模型的处理过程。
扩散模型包括两个过程,分别为扩散过程和逆扩散过程。
扩散过程为的过程,表示对图像逐步加噪。且是在上加噪声得到的,受的影响,因此,扩散过程是一个马尔科夫过程。表示从真实数据集中采样得到的一张图像,对添加T次噪声,图像逐渐变得模糊,当T足够大时,为标准正态分布。在训练过程中,每次添加的噪声是已知的,即是已知的,根据马尔科夫过程的性质,可以递归得到,即是已知的。
逆扩散过程为的过程,表示从噪声中逐渐复原出原图像。如果能够在给定的条件下得到的分布,即为,那么就能够从任意一张噪声图像中经过一次次的采样得到一张图像而生成原始图像。这里,可以用来近似,为扩散模型,比如为一个U-Net模型。此外,虽然无法确定,但是可以采用和表示,即是可知的,因此,可以采用来指导的训练。
在扩散过程中,如式(10)所示,即为在给定的条件下,服从均值为、方差为的正态分布。
(10);
重参数化技巧表示,令,令,如式(11)所示。
(11);
令(式(12)),结合式(11)可得式(13)。
(13);
设随机变量为式(14)所示。
(14);
则的期望如式(15)所示,方差如式(16)所示。
(15);
(16);
所以如式(17)所示。
(17);
根据和,可以利用原始图像直接计算出时间点t对应的扩散状态,也可以利用时间点t-1对应的图像,计算出时间点t对应的扩散状态。
在逆扩散过程中,如式(18)所示。
(18);
由于扩散过程是马尔科夫过程,与前一时刻有关,故如式(19)所示。
(19);
由式(18)和式(19),可得式(20),式(20)如下所示。
(20);
由于式(21)、式(22)和式(23),如下所示,可得式(24)。
(21);
(22);
(23);
(24);
其中,为不涉及的函数。按照标准的高斯密度函数,均值可以被参数化为式(25),方差可以被参数化为式(26),如下所示。
(25);
(26);
由于式(24)、式(25)和式(26),可得式(27),如下所示。
(27);
又由于式(28),可得式(29),如下所示。
(28);
(29);
至此,也就得到了的分布表达式。
在本申请实施例中,目标函数为:。
由于很难对噪声空间进行积分,直接优化目标函数是很困难的。我们转而优化目标函数的变分上界来实现对目标函数的优化,如式(30)所示。
(30);
整理式(30)可得式(31),如下所示。
(31);
其中,各参数如式(32)至式(34)所示。
(32);
(33);
(34);
从式(32)可以得到,对的监督就是最小化和的相对熵(Kullback-Leibler divergence,KL)散度。
可以理解的是,基础模型中的重建模型获得的异常分数图无法定位细微缺陷,比如,螺钉和胶囊等细条状缺陷;从而采用扩散模型,以通过添加噪声并通过反向扩散过程减少噪声来进行图像去噪,进而对基于特征重建的异常分数图进行高频细化,以解决重建模糊问题;其中,高频细化是通过将扩散模型应用于图像去噪任务来实现的,该图像去噪任务通过预测来隔离掩码区域与未掩码区域的关联,防止模型将输入直接映射到输出,从而缓解重建异常样本的趋势,提升异常检测的准确度。另外,通过在模型训练中加入所有不同语义类别的正常工件,训练一个统一的模型,无需显式的进行样品分类或者区分不同的工件,使得多种样品可以采用统一的模型进行异常检测模型,降低了模型部署消耗,提升了异常检测效率。以及,扩散模型为空间数据提供了归纳偏置,使得扩散模型中间变量的空间尺寸在每个时间点下都与原始图像一致,从而减少了空间信息的损失;如此,能够解决模糊重建的问题;并且,扩散模型用于预测噪声,与图像画面的预测无关,在一定程度上实现了输入输出的隔离,从而能够解决重建异常样本的问题。
还可以理解的是,通过简化逆扩散过程中的时间点,选择扩散过程中最早执行的多个时间点进行逆扩散处理,使得提升去噪效率的同时,还提升了预测准确度和精度。此外,通过针对扩散模型加入模型引导条件和测试时条件,使得能够学习到工件的不同语义类别,从而能够实现多类异常检测。最后,通过时空融合的方法来融合不同时间段、不同尺度和不同掩码规格来获得最终的异常分数图,能够提高异常检测的性能。
下面继续说明本申请实施例提供的图像处理装置455的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器450的图像处理装置455中的软件模块可以包括:
信息重建模块4551,用于基于待检测图像的待重建特征进行信息重建,得到信息重建结果,其中,所述待检测图像为待检测实体的成像信息;
差异确定模块4552,用于将所述信息重建结果相对于所述待检测图像的差异,确定为第一异常分数图;
图像去噪模块4553,用于对所述待检测图像的掩码图像进行去噪,得到去噪图像;
所述差异确定模块4552,还用于基于所述去噪图像与所述待检测图像之间的差异,确定第二异常分数图;
所述差异确定模块4552,还用于结合所述第一异常分数图和所述第二异常分数图,确定目标异常分数图;
结果确定模块4554,用于基于所述目标异常分数图,确定所述待检测实体的检测结果。
在本申请实施例中,所述图像处理装置455还包括网格划分模块4555,用于将所述待检测图像划分为包括L1个网格的网格图像,将所述网格图像划分为L2个独立网格集,其中,L1和L2为大于1的正整数;将与L2个所述独立网格集对应的L2张待去噪图像,确定为所述掩码图像,其中,每个所述网格在一张所述待去噪图像中被掩码为掩码网格,每张所述待去噪图像包括个所述掩码网格。
在本申请实施例中,所述图像去噪模块4553,还用于采用指定去噪次数对所述掩码图像中的每张所述待去噪图像进行去噪,得到与L2张所述待去噪图像对应的L2张已去噪图像;叠加L2张所述已去噪图像中的所述掩码网格,得到所述去噪图像。
在本申请实施例中,所述图像去噪模块4553,还用于当所述指定去噪次数对应T个时间点序列时,基于所述掩码图像中的每张所述待去噪图像,确定第T个预测图像,其中,T为正整数;迭代t执行以下处理,其中,t表示去噪次数,,且t为正整数:基于第t个所述预测图像,预测第t-1个所述预测图像;基于迭代t预测出的第0个所述预测图像,得到所述已去噪图像;由每张所述待去噪图像的所述已去噪图像,得到与L2张所述待去噪图像对应的L2张所述已去噪图像。
在本申请实施例中,所述图像去噪模块4553,还用于从所述指定去噪次数包括的倒序时间点序列中,依次选择指定数量的最小时间点,其中,各个时间点之间的顺序与待去噪程度正相关;从所述指定数量的最小时间点中等间隔选择T个所述时间点序列。
在本申请实施例中,所述图像去噪模块4553,还用于当所述指定去噪次数对应T个时间点序列时,将T个时间点序列在所述指定去噪次数包括的时间点序列的占比,确定为噪声幅度;基于所述噪声幅度向所述待去噪图像叠加噪声,得到第T个所述预测图像。
在本申请实施例中,所述图像去噪模块4553,还用于对第t个所述预测图像进行特征提取,得到待预测特征;以所述待去噪图像为指导条件对所述待预测特征进行噪声预测,得到预测噪声;从第t个所述预测图像中去除所述预测噪声,得到第t-1个所述预测图像。
在本申请实施例中,所述图像去噪模块4553,还用于基于所述预测噪声,确定第t个所述预测图像中与所述目标独立网格集对应的均值预测噪声和方差预测噪声;结合所述均值预测噪声和所述方差预测噪声,对第t个所述预测图像中各个所述掩码网格进行去噪,得到掩码预测结果;获取所述待检测图像扩散至t时间点时的未掩码预测结果;结合所述掩码预测结果和所述未掩码预测结果,得到第t-1个所述预测图像。
在本申请实施例中,所述图像去噪模块4553,还用于基于第t-1个所述预测图像,预测相对于时间点0时的预测结果;当迭代结束时,得到T个所述预测结果;融合T个所述预测结果和第0个所述预测图像,得到所述已去噪图像。
在本申请实施例中,所述差异确定模块4552,还用于针对多个指定平滑尺度中的每个所述指定平滑尺度,执行以下处理:将所述待检测图像下采样所述指定平滑尺度,得到第一待上采样图像,将所述去噪图像下采样所述指定平滑尺度,得到第二待上采样图像;将所述第一待上采样图像与第二待上采样图像的差信息上采样所述指定平滑尺度,得到尺度异常分数图;对多个所述指定平滑尺度对应的多个所述尺度异常分数图进行融合,得到时空融合异常分数图;对所述时空融合异常分数图进行均值过滤卷积,得到所述第二异常分数图。
在本申请实施例中,所述信息重建模块4551,还用于基于待检测图像的待重建特征进行特征重建,得到重建特征,将所述重建特征确定为所述信息重建结果;或者,基于待检测图像的待重建特征进行图像重建,得到重建图像,将所述重建图像确定为所述信息重建结果;当所述信息重建结果为所述重建特征时,将所述重建特征与所述待检测图像的所述待重建特征之间的差异,确定为所述第一异常分数图;当所述信息重建结果为所述重建图像时,将所述重建图像与所述待检测图像之间的差异,确定为所述第一异常分数图。
在本申请实施例中,所述结果确定模块4554,还用于将所述目标异常分数图中目标异常分数大于异常分数阈值的区域,确定为异常区域;将所述目标异常分数图中最大目标异常分数,确定为所述待检测实体的异常程度;将所述异常区域和所述异常程度,确定为所述待检测实体的所述检测结果。
在本申请实施例中,所述信息重建和所述去噪通过异常检测模型实现,所述图像处理装置455还包括模型训练模块4556,用于对正样本图像进行特征提取,得到待重建样本特征;利用第一待训练模型对所述待重建样本特征进行信息重建,得到基础异常分数样本图,基于所述基础异常分数样本图和所述正样本图像之间的差异训练所述第一待训练模型,得到基础检测模型;利用第二待训练模型对所述正样本图像的掩码样本图像进行去噪,得到优化异常分数样本图,基于所述优化异常分数样本图和所述正样本图像之间的差异训练所述第二待训练模型,得到优化检测模型;将所述基础检测模型和所述优化检测模型,确定为所述异常检测模型。
本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机可执行指令或者计算机程序,该计算机可执行指令或者计算机程序存储在计算机可读存储介质中。图像处理设备的处理器从计算机可读存储介质读取该计算机可执行指令或者计算机程序,处理器执行该计算机可执行指令或者计算机程序,使得该图像处理设备执行本申请实施例上述的图像处理方法。
本申请实施例提供一种计算机可读存储介质,其中存储有计算机可执行指令或者计算机程序,当计算机可执行指令或者计算机程序被处理器执行时,将引起处理器执行本申请实施例提供的图像处理方法,例如,如图3示出的图像处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,计算机可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,计算机可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(Hyper TextMarkup Language,HTML)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,计算机可执行指令可被部署为在一个电子设备上执行(此时,这一个电子设备即为图像处理设备),或者在位于一个地点的多个电子设备上执行(此时,位于一个地点的多个电子设备即为图像处理设备),又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行(此时,分布在多个地点且通过通信网络互连的多个电子设备即为图像处理设备)。
可以理解的是,在本申请实施例中,涉及到待检测图像、正常样品的图像等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。另外,在本申请中,涉及到的正常样品的图像抓取技术方案实施,在本申请以上实施例运用到具体产品或技术中时,相关数据收集、使用和处理过程应该遵守国家法律法规要求,符合合法、正当、必要的原则,不涉及获取法律法规禁止或限制的数据类型,不会妨碍目标网站的正常运行。
综上所述,本申请实施例在对待待检测图像进行信息重建获得的第一异常分数图的基础上,还通过对待检测图像的掩码图像进行去噪来获得第二异常分数图;而第二异常分数图的获取过程中,对掩码图像的去噪不影响图像尺寸,减少了信息损失;从而,在结合第一异常分数图和第二异常分数图确定待检测实体的检测结果时,能够提升检测准确性。另外,通过简化去噪过程中逆扩散步骤,能够提升检测效率。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (15)
1.一种图像处理方法,其特征在于,所述方法包括:
基于待检测图像的待重建特征进行信息重建,得到信息重建结果,其中,所述待检测图像为待检测实体的成像信息;
基于所述信息重建结果相对于所述待检测图像的差异,确定第一异常分数图;
对所述待检测图像的掩码图像进行去噪,得到去噪图像;
基于所述去噪图像与所述待检测图像之间的差异,确定第二异常分数图;
结合所述第一异常分数图和所述第二异常分数图,确定目标异常分数图;
基于所述目标异常分数图,确定所述待检测实体的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述待检测图像的掩码图像进行去噪,得到去噪图像之前,所述方法还包括:
将所述待检测图像划分为包括L1个网格的网格图像,将所述网格图像划分为L2个独立网格集,其中,L1和L2为大于1的正整数;
根据L2个所述独立网格集,得到L2张待去噪图像,将L2张所述待去噪图像确定为所述掩码图像,每张所述待去噪图像是将所述网格图像中的一个目标独立网格集进行掩码得到的,其中,所述目标独立网格集是L2个所述独立网格集中的一个;
所述对所述待检测图像的掩码图像进行去噪,得到去噪图像,包括:
采用指定去噪次数对所述掩码图像中的每张所述待去噪图像进行去噪,得到与L2张所述待去噪图像对应的L2张已去噪图像;
叠加L2张所述已去噪图像中与所述目标独立网格集对应的区域,得到所述去噪图像。
3.根据权利要求2所述的方法,其特征在于,所述采用指定去噪次数对所述掩码图像中的每张所述待去噪图像进行去噪,得到与L2张所述待去噪图像对应的L2张已去噪图像,包括:
当所述指定去噪次数对应T个时间点序列时,基于所述掩码图像中的每张所述待去噪图像,确定第t个预测图像,其中,T为正整数;
迭代t执行以下处理,其中,t表示所述预测图像的次序,,且t为正整数:
基于第t个所述预测图像,预测第t-1个所述预测图像;
基于迭代t预测出的第0个所述预测图像,得到所述已去噪图像;
由每张所述待去噪图像的所述已去噪图像,得到与L2张所述待去噪图像对应的L2张所述已去噪图像。
4.根据权利要求3所述的方法,其特征在于,所述当所述指定去噪次数对应T个时间点序列时,基于所述掩码图像中的每张所述待去噪图像,确定第t个预测图像之前,所述方法还包括:
从所述指定去噪次数对应的倒序时间点序列中,依次选择指定数量的最小时间点,其中,各个时间点之间的顺序与待去噪程度正相关;
从所述指定数量的最小时间点中等间隔选择T个时间点序列。
5.根据权利要求3所述的方法,其特征在于,所述当所述指定去噪次数对应T个时间点序列时,基于所述掩码图像中的每张所述待去噪图像,确定第t个预测图像,包括:
当所述指定去噪次数对应T个时间点序列时,将T个时间点序列在所述指定去噪次数对应的原始时间点序列中的占比,确定为噪声幅度;
基于所述噪声幅度向所述待去噪图像叠加噪声,得到第t个所述预测图像。
6.根据权利要求3所述的方法,其特征在于,所述基于第t个所述预测图像,预测第t-1个所述预测图像,包括:
对第t个所述预测图像进行特征提取,得到待预测特征;
以所述待去噪图像为指导条件对所述待预测特征进行噪声预测,得到预测噪声;
从第t个所述预测图像中去除所述预测噪声,得到第t-1个所述预测图像。
7.根据权利要求6所述的方法,其特征在于,所述从第t个所述预测图像中去除所述预测噪声,得到第t-1个所述预测图像,包括:
基于所述预测噪声,确定第t个所述预测图像中与所述目标独立网格集对应的均值预测噪声和方差预测噪声;
结合所述均值预测噪声和所述方差预测噪声,对第t个所述预测图像中与所述目标独立网格集对应的区域进行去噪,得到掩码预测结果;
获取所述待检测图像扩散至t时间点时的未掩码预测结果;
结合所述掩码预测结果和所述未掩码预测结果,得到第t-1个所述预测图像。
8.根据权利要求3所述的方法,其特征在于,所述基于第t个所述预测图像,预测第t-1个所述预测图像之后,所述方法还包括:
基于第t-1个所述预测图像,预测相对于时间点0时的预测结果;
当迭代结束时,得到T个所述预测结果;
所述基于迭代t预测出的第0个所述预测图像,得到所述已去噪图像,包括:
融合T个所述预测结果和第0个所述预测图像,得到所述已去噪图像。
9.根据权利要求1所述的方法,其特征在于,所述基于所述去噪图像与所述待检测图像之间的差异,确定第二异常分数图,包括:
针对多个指定平滑尺度中的每个所述指定平滑尺度,执行以下处理:
将所述待检测图像下采样所述指定平滑尺度,得到第一待上采样图像,将所述去噪图像下采样所述指定平滑尺度,得到第二待上采样图像;
将所述第一待上采样图像与第二待上采样图像的差信息上采样所述指定平滑尺度,得到尺度异常分数图;
对多个所述指定平滑尺度对应的多个所述尺度异常分数图进行融合,得到时空融合异常分数图;
对所述时空融合异常分数图进行均值过滤卷积,得到所述第二异常分数图。
10.根据权利要求1所述的方法,其特征在于,所述基于待检测图像的待重建特征进行信息重建,得到信息重建结果,包括:
基于所述待检测图像的所述待重建特征进行特征重建,得到重建特征,将所述重建特征确定为所述信息重建结果;
或者,基于所述待检测图像的所述待重建特征进行图像重建,得到重建图像,将所述重建图像确定为所述信息重建结果;
所述基于所述信息重建结果相对于所述待检测图像的差异,确定第一异常分数图,包括:
当所述信息重建结果为所述重建特征时,基于所述重建特征与所述待检测图像的所述待重建特征之间的差异,确定所述第一异常分数图;
当所述信息重建结果为所述重建图像时,基于所述重建图像与所述待检测图像之间的差异,确定所述第一异常分数图。
11.根据权利要求1至10任一项所述的方法,其特征在于,所述基于所述目标异常分数图,确定所述待检测实体的检测结果,包括:
将所述目标异常分数图中目标异常分数大于异常分数阈值的区域,确定为异常区域;
将所述目标异常分数图中最大目标异常分数,确定为所述待检测实体的异常程度;
将所述异常区域和所述异常程度,确定为所述待检测实体的所述检测结果。
12.根据权利要求1至10任一项所述的方法,其特征在于,所述信息重建和所述去噪通过异常检测模型实现,所述异常检测模型通过以下方式训练获得:
对正样本图像进行特征提取,得到待重建样本特征;
利用第一待训练模型对所述待重建样本特征进行信息重建,得到基础异常分数样本图,基于所述基础异常分数样本图和所述正样本图像之间的差异训练所述第一待训练模型,得到基础检测模型;
利用第二待训练模型对所述正样本图像的掩码样本图像进行去噪,得到优化异常分数样本图,基于所述优化异常分数样本图和所述正样本图像之间的差异训练所述第二待训练模型,得到优化检测模型;
将所述基础检测模型和所述优化检测模型,确定为所述异常检测模型。
13.一种图像处理装置,其特征在于,所述图像处理装置包括:
信息重建模块,用于基于待检测图像的待重建特征进行信息重建,得到信息重建结果,其中,所述待检测图像为待检测实体的成像信息;
差异确定模块,用于基于所述信息重建结果相对于所述待检测图像的差异,确定第一异常分数图;
图像去噪模块,用于对所述待检测图像的掩码图像进行去噪,得到去噪图像;
所述差异确定模块,还用于基于所述去噪图像与所述待检测图像之间的差异,确定第二异常分数图;
所述差异确定模块,还用于结合所述第一异常分数图和所述第二异常分数图,确定目标异常分数图;
结果确定模块,用于基于所述目标异常分数图,确定所述待检测实体的检测结果。
14.一种用于图像处理的电子设备,其特征在于,所述电子设备包括:
存储器,用于存储计算机可执行指令或者计算机程序;
处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现权利要求1至12任一项所述的图像处理方法。
15.一种计算机可读存储介质,存储有计算机可执行指令或者计算机程序,其特征在于,所述计算机可执行指令或者计算机程序被处理器执行时,实现权利要求1至12任一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311199367.6A CN116958131B (zh) | 2023-09-18 | 2023-09-18 | 一种图像处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311199367.6A CN116958131B (zh) | 2023-09-18 | 2023-09-18 | 一种图像处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116958131A true CN116958131A (zh) | 2023-10-27 |
CN116958131B CN116958131B (zh) | 2024-01-05 |
Family
ID=88449467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311199367.6A Active CN116958131B (zh) | 2023-09-18 | 2023-09-18 | 一种图像处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116958131B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117496003A (zh) * | 2023-11-01 | 2024-02-02 | 合肥高斯智能科技有限公司 | 一种工业元件的缺陷图像生成方法 |
CN117808816A (zh) * | 2024-03-01 | 2024-04-02 | 腾讯科技(深圳)有限公司 | 图像异常检测方法、装置及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619618A (zh) * | 2018-06-04 | 2019-12-27 | 杭州海康威视数字技术股份有限公司 | 一种表面缺陷检测方法、装置及电子设备 |
CN114419014A (zh) * | 2022-01-19 | 2022-04-29 | 河北工业大学 | 基于特征重构的表面缺陷检测方法 |
CN114723631A (zh) * | 2022-04-01 | 2022-07-08 | 西安交通大学 | 基于深度上下文先验与多尺度重建子网络的图像去噪方法、系统及装置 |
US20220222794A1 (en) * | 2021-01-08 | 2022-07-14 | Beihang University | Image anomaly detection method based on zero-shot learning |
CN115018954A (zh) * | 2022-08-08 | 2022-09-06 | 中国科学院自动化研究所 | 图像生成方法、装置和电子设备 |
CN115345806A (zh) * | 2022-07-13 | 2022-11-15 | 成都中科创达软件有限公司 | 对象检测方法、装置、电子设备及可读存储介质 |
CN116309483A (zh) * | 2023-03-24 | 2023-06-23 | 国网浙江省电力有限公司电力科学研究院 | 基于ddpm的半监督变电设备表征缺陷检测方法及系统 |
-
2023
- 2023-09-18 CN CN202311199367.6A patent/CN116958131B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619618A (zh) * | 2018-06-04 | 2019-12-27 | 杭州海康威视数字技术股份有限公司 | 一种表面缺陷检测方法、装置及电子设备 |
US20220222794A1 (en) * | 2021-01-08 | 2022-07-14 | Beihang University | Image anomaly detection method based on zero-shot learning |
CN114419014A (zh) * | 2022-01-19 | 2022-04-29 | 河北工业大学 | 基于特征重构的表面缺陷检测方法 |
CN114723631A (zh) * | 2022-04-01 | 2022-07-08 | 西安交通大学 | 基于深度上下文先验与多尺度重建子网络的图像去噪方法、系统及装置 |
CN115345806A (zh) * | 2022-07-13 | 2022-11-15 | 成都中科创达软件有限公司 | 对象检测方法、装置、电子设备及可读存储介质 |
CN115018954A (zh) * | 2022-08-08 | 2022-09-06 | 中国科学院自动化研究所 | 图像生成方法、装置和电子设备 |
CN116309483A (zh) * | 2023-03-24 | 2023-06-23 | 国网浙江省电力有限公司电力科学研究院 | 基于ddpm的半监督变电设备表征缺陷检测方法及系统 |
Non-Patent Citations (2)
Title |
---|
HUI ZHANG等: "DiffusionAD: Denoising Diffusion for Anomaly Detection", 《ARXIV:2303.08730》, pages 1 - 12 * |
罗敏: "基于RGB的高光谱图像重建算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 01, pages 138 - 2477 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117496003A (zh) * | 2023-11-01 | 2024-02-02 | 合肥高斯智能科技有限公司 | 一种工业元件的缺陷图像生成方法 |
CN117496003B (zh) * | 2023-11-01 | 2024-05-14 | 合肥高斯智能科技有限公司 | 一种工业元件的缺陷图像生成方法 |
CN117808816A (zh) * | 2024-03-01 | 2024-04-02 | 腾讯科技(深圳)有限公司 | 图像异常检测方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN116958131B (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116958131B (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN111476719A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN114266894A (zh) | 一种图像分割方法、装置、电子设备及存储介质 | |
CN114742802B (zh) | 基于3Dtransformer混合卷积神经网络的胰腺CT图像分割方法 | |
CN114549374A (zh) | 对使用蒙特卡罗绘制进行绘制的图像去噪 | |
CN113920538A (zh) | 目标检测方法、装置、设备、存储介质及计算机程序产品 | |
CN113538281A (zh) | 图像去噪方法、装置、计算机设备和存储介质 | |
CN113052775A (zh) | 一种图像去阴影方法及装置 | |
CN113920208A (zh) | 图像处理方法及装置、计算机可读存储介质和电子设备 | |
CN116805387B (zh) | 基于知识蒸馏的模型训练方法、质检方法和相关设备 | |
CN116309612B (zh) | 基于频率解耦监督的半导体硅晶圆检测方法、装置及介质 | |
CN117392293A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116773534A (zh) | 一种检测方法及装置、电子设备、计算机可读介质 | |
Hepburn et al. | Enforcing perceptual consistency on generative adversarial networks by using the normalised laplacian pyramid distance | |
CN116645365A (zh) | 基于频谱的石英玻璃检测方法、装置、设备及介质 | |
CN117078574A (zh) | 一种图像去雨方法及装置 | |
CN116977195A (zh) | 复原模型的调整方法、装置、设备及存储介质 | |
CN116543246A (zh) | 图像去噪模型的训练方法、图像去噪方法、装置及设备 | |
CN114529463A (zh) | 一种图像去噪方法及系统 | |
CN117940951A (zh) | 确定图像信号处理参数的方法、装置和感知系统 | |
CN110349088A (zh) | 一种图像处理方法和系统 | |
CN117216500A (zh) | 电磁信息降噪方法、装置、电子设备及存储介质 | |
CN116958028A (zh) | 产品的异常检测方法、装置、电子设备、存储介质及产品 | |
CN118840559A (zh) | 基于有序跨尺度特征交互的钢轨表面缺陷分割方法及装置 | |
CN118154561A (zh) | 基于优化内存模块和U-Net++的表面缺陷检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |