CN115810011B - 异常检测网络的训练及异常检测方法、装置和设备 - Google Patents
异常检测网络的训练及异常检测方法、装置和设备 Download PDFInfo
- Publication number
- CN115810011B CN115810011B CN202310069954.7A CN202310069954A CN115810011B CN 115810011 B CN115810011 B CN 115810011B CN 202310069954 A CN202310069954 A CN 202310069954A CN 115810011 B CN115810011 B CN 115810011B
- Authority
- CN
- China
- Prior art keywords
- image
- images
- products
- normal
- anomaly detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Image Analysis (AREA)
Abstract
本申请实施例提供一种异常检测网络的训练及异常检测方法、装置和设备。在本申请实施例中,能够获取多种类别产品的正常图像;对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像;基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络;其中,所述异常检测网络包括特征提取模块和特征编码模块,所述特征提取模块包括掩膜模块、特征局部对齐模块和深度残差网络,所述掩膜模块在所述深度残差网络之前,用于对输入的图像进行局部掩膜以对所述输入的图像进行图像增强;所述特征局部对齐模块利用所述特征提取模块提取的特征图上当前单元格周围的单元格信息对所述当前单元格进行表示。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种异常检测网络的训练及异常检测方法、装置和设备。
背景技术
在工业缺陷检测领域中,由于工业产品的种类繁多,而且每类工业产品的异常种类也很多,如果采用人工肉眼进行质检,效率极低而且对人工的精力和熟练程度也是极大的考验。而如果利用深度学习进行缺陷检测,以锂电池为例,模切软包锂电池工艺流程生产一颗电芯通常需要20个工序,每个工序又需要几十上百个机台,每个机台产生的缺陷也是各式各样的,那么搜集齐所有类别的缺陷图像用于深度学习模型训练则需要耗费巨大的工作量。
针对此,相关技术提出一系列的仅依赖正样本的异常检测算法,该类算法通常是在正常产品的图像(即无缺陷的产品图像)上随机添加噪声,生成伪异常标签来模拟异常图像进行异常检测模型的训练。显然,采用这种方式中生成的伪异常标签质量决定了异常检测模型的性能。而且,生成的伪标签与实际的异常图像往往存在一定的差异,在实际异常检测场景中,效果往往欠佳。并且,基于现有异常检测技术得到的深度学习模型的泛化能力也较差,一个模型通常仅能鉴定一种异常。若需检测多种类别的异常,则需要训练多个模型。
发明内容
本申请的多个方面提供一种异常检测网络的训练及异常检测方法、装置和设备,用以提高训练得到的异常检测网络的泛化能力,提高训练效率。
本申请实施例提供一种异常检测网络的训练方法,包括:获取多种类别产品的正常图像;对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像;基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络;其中,所述异常检测网络包括特征提取模块和特征编码模块,所述特征提取模块包括掩膜模块、特征局部对齐模块和深度残差网络,所述掩膜模块在所述深度残差网络之前,用于对输入的图像进行局部掩膜以对所述输入的图像进行图像增强;所述特征局部对齐模块利用所述特征提取模块提取的特征图上当前单元格周围的单元格信息对所述当前单元格进行表示,并对特征进行矫正对齐;所述特征编码模块包括特征金字塔,用于通过串联或并联不同扩容率的空洞卷积对所述特征局部对齐模块提取的特征进行多个尺度的融合。
本申请实施例提供一种异常检测方法,包括:获取待检测的目标产品的目标图像;通过异常检测网络提取所述目标图像的特征,所述异常检测网络为基于多种类别产品的正常图像训练得到;通过所述目标产品的多元正态分布基于所述目标图像的特征,确定所述目标图像的异常概率和异常区域,其中,所述目标产品的多元正态分布为基于所述目标产品的第一数量的正常图像,通过异常检测网络提取的特征构建得到。
本申请实施例还提供一种异常检测网络的训练装置,包括:图像获取模块,用于获取多种类别产品的正常图像;类别均衡模块,用于对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像;网络训练模块,用于基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络;其中,所述异常检测网络包括特征局部对齐模块和特征编码模块,所述特征局部对齐模块包括掩膜模块和深度残差网络,所述掩膜模块在所述深度残差网络之前,用于对输入的图像进行局部掩膜以对所述输入的图像进行图像增强;所述特征编码模块包括特征金字塔,用于通过串联或并联不同扩容率的空洞卷积对所述特征局部对齐模块提取的特征进行多个尺度的融合。
本申请实施例还提供一种异常检测装置,包括:图像获取模块,用于获取待检测的目标产品的目标图像;特征提取模块,用于通过异常检测网络提取所述目标图像的特征,所述异常检测网络为基于多种类别产品的正常图像训练得到;异常确定模块,用于通过所述目标产品的多元正态分布基于所述目标图像的特征,确定所述目标图像的异常概率和异常区域,其中,所述目标产品的多元正态分布为基于所述目标产品的第一数量的正常图像,通过异常检测网络提取的特征构建得到。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的异常检测网络的训练方法,或如上述的异常检测方法。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被处理器执行时,致使所述处理器实现本申请实施例提供的异常检测网络的训练方法或异常检测方法中的步骤。
在本申请实施例中,能够获取多种类别产品的正常图像,以及对这多种类别产品的正常图像进行类别均衡化,使得各个类别产品的正常图像在数量上相差不大,进而基于类别均衡化的多种类别产品的正常图像训练得到的异常检测网络能够对多个类别产品进行特征提取,而且该异常检测网络中包括的掩膜模块能够对输入的图像进行图像增强,有效加强异常检测网络的特征学习能力并且减少直接对图像进行掩膜操作带来的计算复杂度。由于采用的都是产品的正常图像进行训练,能够大幅降低数据标注和收集异常图像数据的工作量,训练得到的异常检测网络由于是基于多种类型的产品图像训练的,因此,其应用场景相较于只针对某一种类型产品图像进行训练得到的异常检测网络或缺陷检测网络也更为广泛。
在本申请实施例中,在获取待检测的目标产品的目标图像之后,能够通过异常检测网络提取目标图像的特征,该异常检测网络为基于多种类别产品的正常图像训练得到,以及通过目标产品的多元正态分布基于目标图像的特征,确定目标图像的异常概率和异常区域,其中,目标产品的多元正态分布为基于目标产品的第一数量的正常图像,通过异常检测网络提取的特征构建得到。由于所利用的异常检测网络和目标产品的多元正态分布都是基于产品的正常图像构建得到,使得在仅有产品正样品的情况下仍然能够实现产品的异常检测。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请示例性实施例提供的一种异常检测网络的训练方法的流程示意图;
图2为本申请实施例提供的一种基于孪生网络AD_Net改进得到的异常检测网络的结构示意图;
图3为本申请实施例提供异常检测网络的训练方法中的一种掩膜模块的结构示意图;
图4为本申请实施例根据异常检测网络的训练方法提供的特征局部对齐模块的结构示意图;
图5为本申请实施例提供的异常检测网络的训练过程示意图;
图6为本申请示例性实施例提供的一种异常检测方法的流程示意图;
图7为本申请实施例提供的异常检测方法中的一种多元正态分布的构建过程示意图;
图8为本申请实施例提供的通过异常检测网络和多元正态分布确定图像中的异常区域和异常概率的过程示意图;
图9为本申请实施例提供的一种异常检测和缺陷检测的过程示意图;
图10为本申请示例性实施例提供的一种异常检测网络的训练装置的结构示意图;
图11为本申请示例性实施例提供的一种异常检测装置的结构示意图;
图12为本申请示例性实施例提供的一种电子设备的结构示意图;
图13为本申请示例性实施例提供的另一种电子设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为解决现有异常检测技术需要训练多种模型来检测多种缺陷或异常的问题,在本申请一些实施例中提供一种异常检测网络的训练,能够获取多种类别产品的正常图像,以及对这多种类别产品的正常图像进行类别均衡化,使得各个类别产品的正常图像在数量上相差不大,进而基于类别均衡化的多种类别产品的正常图像训练得到的异常检测网络能够对多个类别产品进行特征提取,而且该异常检测网络中包括的掩膜模块能够对输入的图像进行图像增强,有效加强异常检测网络的特征学习能力并且减少直接对图像进行掩膜操作带来的计算复杂度。由于采用的都是产品的正常图像进行训练,能够大幅降低数据标注和收集异常图像数据的工作量,训练得到的异常检测网络由于是基于多种类型的产品图像训练的,因此,其应用场景相较于只针对某一种类型产品图像进行训练得到的异常检测网络或缺陷检测网络也更为广泛。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本申请示例性实施例提供的一种异常检测网络的训练的流程示意图。如图1所示,该方法包括:
步骤110,获取多种类别产品的正常图像。
其中,多种类别产品的正常图像为不存在缺陷或异常的产品图像。
步骤120,对多种类别产品的正常图像进行类别均衡化,得到类别均衡化的多种类别产品的正常图像。
在一些示例性的实施例中,为了使得训练得到的异常检测网络能够对各种类别的产品都具备同样的特征提取能力,本申请实施例可在异常检测网络训练之前,对用于训练异常检测网络的样本数据进行类别均衡化操作。具体地,对多种类别产品的正常图像进行类别均衡化,得到类别均衡化的多种类别产品的正常图像,包括:
从多种类别产品的正常图像中,确定多种类别产品中各类别产品的图像数量;
从多种类别产品中各类别产品的图像数量中,确定最少类别的产品的图像数量、最多类别的产品的图像数量以及多种类别产品的平均图像数量;
在最多类别的产品的图像数量大于或等于最少类别的产品的图像数量的预设倍数时,对图像数量小于多种类别产品的平均图像数量的类别的第一产品的图像进行图像扩充,使得所述多种类别产品的正常图像的数量实现类别均衡化,得到所述类别均衡化的多种类别产品的正常图像。
例如,可从多种类别产品的正常图像中,统计每个类别产品的图像数量,其中,最少类别的产品的图像数量可记为和最大类别的图像数量可记为,以及多种类别产品的平均图像数量可记为/>。作为一种示例可假设/>,则认为多种类别产品的图像数量较为均衡,此时不进行类别均衡化的操作;而如果/>,则认为多种类别产品的图像数量出现失衡,即最少类别的产品的图像数量太少,而最大类别的图像数量较多,此时可对图像数量小于多种类别产品的平均图像数量(/>)的类别的数据集/>(即上文所述的第一产品的图像数据集),以图像数量达到/>为目标进行图像扩充。
在一些示例性的实施例中,为丰富第一产品的图像数据集中的图像,可采用几何变化操作对第一产品的图像数据集中已有的图像进行图像变换操作。具体地,对图像数量小于多种类别产品的平均图像数量的类别的第一产品的图像进行图像扩充,包括:
基于多种类别产品的平均图像数量和第一产品的正常图像数量,确定第一产品待扩充的图像数量;
从第一产品的正常图像中选取第一图像,第一图像为所述第一产品的正常图像中的任意一张图像;
对第一图像进行几何图像变化操作,得到第二图像,并将第二图像加入至第一产品的正常图像中;其中,几何图像变化操作包括翻转、平移、旋转、缩放和仿射变换中的至少一种操作;
重复执行从第一产品的正常图像中选取第一图像的步骤,直至第一产品的正常图像中扩充的图像数量达到第一产品待扩充的图像数量。
例如,待扩充的第一产品的正常图像的数据集记为数据集,该数据集/>中正常图像的数量记为/>需要扩充到的目标数量为/>,可计算数据集/>需扩充的图像数量/>;第二步,初始化数据集/>的图像扩充集合为/>;第三步,随机从数据集/>中选取一张第一图像/>,对第一图像/>进行几何图像变化操作得到第二图像/>,其中,几何图像变化操作包括翻转、平移、旋转、缩放、仿射变换等操作中的一个或多个;第四步,将第二图像/>到图像扩充集合/>中。重复执行步骤第三步和第四步,第三步和第四步的执行次数为/>次,直至数据集/>中的图像数量达到目标数量/>。最后,将图像扩充集合/>并入到数据集/>中,得到图像扩充后的数据集。
步骤130,基于类别均衡化的多种类别产品的正常图像,训练得到异常检测网络。
其中,异常检测网络包括特征提取模块和特征编码模块,特征提取模块包括掩膜模块、特征局部对齐表示模块和深度残差网络,掩膜模块在深度残差网络之前,用于对输入的图像进行局部掩膜以对输入的图像进行图像增强;特征局部对齐模块利用特征提取模块提取的特征图上当前单元格周围的单元格信息对当前单元格进行表示并进行特征对齐;特征编码模块包括特征金字塔,用于通过串联或并联不同扩容率的空洞卷积对特征局部对齐模块提取的特征进行多个尺度的融合。
可选地,该异常检测网络可基于孪生网络AD_Net改进得到。图2为本申请实施例提供的一种基于孪生网络AD_Net改进得到的异常检测网络的结构示意图。如图2所示,该异常检测网络可包括特征提取模块、特征编码模块和预测头。其中,特征提取模块有掩膜模块、特征局部对齐模块和深度残差网络构成。在图2中,由于采用了孪生网络AD_Net,因此网络的输入为一个图像对,即两个图像Ia和Ib同时输入进行训练,依次通过掩膜模块进行图像掩膜、卷积神经网络进行特征提取、特征局部表示、特征编码模块进行编码以及预测器确定两个图像Ia和Ib之间的相似度。
其中,特征提取模块为基于深度残差网络(ResNet),用于提取对各产品图像的类别无关特征,该类别无关特征也可理解为各产品图像的通用特征,即不带有特定类别属性的特征。而且为了提高对不同尺度的异常目标检测,本申请实施例在特征局部对齐模块引入特征金字塔层,通过串联或并联使用不同扩张率的空洞卷积来实现对图像的多尺度上下文的语义信息捕捉。
为了能在少样本条件下仍然能够保证异常检测网络的特征提取能力,本申请实施例在深度残差网络之前新增掩膜模块M,该掩膜模块M能够通过对输入图像进行局部掩膜以对输入图像进行增强,从而能够提升深度残差网络特征提取、特征局部表征以及特征编码等的难度,使得异常检测网络能够学习到更有区分度的特征表示。与常规的掩膜操作不同的是,本申请实施例采自注意力机制和位置编码等操作,对图像进行通道级的掩膜,可以利用其他通道的信息来恢复掩膜掉的通道的信息,从而有效增加网络学习的难度,能够更好地加强异常检测网络的特征学习,同时减少直接对图像进行掩膜操作所带来的计算复杂度。另外,增加特征局部对齐模块,进一步提升网络的特征表达能力,保证对不同姿态物体的唯一特征表示。
图3为本申请实施例提供异常检测网络的训练方法中的一种掩膜模块的结构示意图。在图3中,该掩膜模块也可称为掩膜卷积(即Masked Convolution),输入图像依次经过区域掩膜、平均池化、Flatten(拉平)、位置编码、线性映射、自注意力机制、非线性激活以及权重乘积,对输入图像进行通道级的掩膜,得到Lmask。
参照图4,图4为本申请实施例根据异常检测网络的训练方法提供的特征局部对齐模块的结构示意图,该模块能够进一步提升网络特征表示能力。深度残差网络每个阶段提取得到的特征图,可通过公式(1)来表示,对于特征图第/>位置的单元格可利用其周围单元格的信息对其进行表征如公式(2)。如图4所示,非边缘区域的单元格/>的周围通常有8个相邻的单元格/>~/>,该单元格/>可由这8个相邻的单元格进行特征表示。
在一些示例性的实施例中,由于本申请实施例采用的异常检测网络为基于孪生的AD_Net构建得到,因此,在异常检测网络训练时,需要两个输入和/>。具体地,基于类别均衡化的多种类别产品的正常图像,训练得到异常检测网络,包括:
从类别均衡化的多种类别产品的正常图像中选择多批图像,多批图像中的每批图像包含有N个图像对,该N个图像对中的每个图像对包含有第一输入图像和第二输入图像;其中,第一输入图像为从多种类别产品的正常图像中随机选取的任意一张图像,第二输入图像为按照第一预设概率,从所述多种类别产品的正常图像中与第一输入图像为同一产品类别的图像中选择的不重复的K张图像,或者,第二输入图像为按照第二预设概率,从所述多种类别产品的正常图像中除第一输入图像所属的产品类别以外的产品类别的图像中选择的不重复的K张图像,第一预设概率和第二预设概率之和为1;
基于多批图像,训练得到异常检测网络。
例如,可从类别均衡化的多种类别产品的正常图像中选择多批图像对孪生的AD_Net进行训练。由于孪生的AD_Net有和/>两个输入,因此,对应的,每批图像可为N个图像对,记为/>其中,/>其中/>表示一批图像中/>输入源的第/>幅图像,表示对应的/>输入源第/>幅训练图像对应的支撑集。/>可以是随机的从一批图像中选取,/>则可按照一定的概率/>从与图像/>同一类别/>中选择的不重复的K张图片,或者,按照/>的概率从与图像/>选择的K张图片。
作为一种实施方式,异常检测网络的优化器选用动量随机梯度下降优化算法,其中,参数momentum: 0.9,初始化学习率0.0001,训练数据规模为三千六百多张图片,训练50轮后停止。图5为本申请实施例提供的异常检测网络的训练过程示意图。在图5中,可从类别均衡化的多种类别产品的正常图像(即图5所示的训练集)中选择多批图像(即图5所示的第一批图像~第M批图像),每批图像,以第一批图像为例,第一批图像包含有N个图像对,每个图像对又包含有第一输入图像和第二输入图像,第一输入图像和第二输入图像可以是同一类别中不重复的两张图像,也可以是所属两个不同类别中的两张图像,第一输入图像作为孪生的AD_Net的输入至Net1中,第二输入图像作为孪生的AD_Net的/>输入至Net2中,基于Loss函数联合训练得到异常检测网络。
在本申请实施例中提供的异常检测网络的训练方法,能够获取多种类别产品的正常图像,以及对这多种类别产品的正常图像进行类别均衡化,使得各个类别产品的正常图像在数量上相差不大,进而基于类别均衡化的多种类别产品的正常图像训练得到的异常检测网络能够对多个类别产品进行特征提取,而且该异常检测网络中包括的掩膜模块能够对输入的图像进行图像增强,有效加强异常检测网络的特征学习能力并且减少直接对图像进行掩膜操作带来的计算复杂度。由于采用的都是产品的正常图像进行训练,能够大幅降低数据标注和收集异常图像数据的工作量,训练得到的异常检测网络由于是基于多种类型的产品图像训练的,因此,其应用场景相较于只针对某一种类型产品图像进行训练得到的异常检测网络或缺陷检测网络也更为广泛。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤110至步骤130的执行主体可以为设备A;又比如,步骤110至步骤120的执行主体可以为设备A,步骤130的执行主体可以为设备B;等等。
图6为本申请示例性实施例提供的一种异常检测方法的流程示意图。如图6所示,该方法包括:
步骤610,获取待检测的目标产品的目标图像。
其中,目标产品可以是有缺陷检测需求的任意一种类型的产品,以锂电池生产制造领域,该目标产品可以是锂电池电芯,目标产品的目标图像可以是锂电池电芯的某一拍摄角度的照片。
步骤620,通过异常检测网络提取目标图像的特征,异常检测网络为基于多种类别产品的正常图像训练得到。
其中,异常检测网络的训练过程请参见异常检测网络的训练方法的实施例,本申请实施例在此不再赘述。
步骤630,通过目标产品的多元正态分布基于目标图像的特征,确定目标图像的异常概率和异常区域,其中,目标产品的多元正态分布为基于目标产品的第一数量的正常图像,通过异常检测网络提取的特征构建得到。
在一些示例性的实施例中,为利用目标产品的正样本进行异常检测,可预先基于目标产品的多个正常图像构建目标产品的多元正态分布,以确定目标产品的正常图像的分布情况。具体地,目标产品的多元正态分布的构建过程可包括:
获取目标产品的第一数量的正常图像;
利用K中心点聚类的方式对目标产品的第一数量的正常图像进行无监督聚类,得到K个类簇中心,一个类簇中心对应于一张目标产品的正常图像;
通过特征提取网络提取K个类簇中心的每个类簇中心对应的目标产品的正常图像的特征;
基于K个类簇中心对应的目标产品的正常图像的特征,构建目标产品的多元正态分布。
例如,获取待异常鉴定的目标产品的样本数据C,可从目标产品的样本数据C中取一批正常样本集,即目标产品的一批正常图像,该正常图像的数量为第一数量,再利用K中心点(K-Medoide)聚类的方式对/>进行无监督聚类,得到K个类簇{/>},然后从每个类簇/>(i=1,2,……,k)中选择该类簇中心对应的原始图片/>作为该类簇/>的代表图片(即上文所述的类簇中心对应于的一张目标产品的正常图像),得到目标产品的多元正态分布的支撑集S={/>}。最后,基于目标产品的多元正态分布的支撑集S={},构建目标产品的多元正态分布。
其中,基于K个类簇中心对应的目标产品的正常图像的特征,构建目标产品的多元正态分布,具体可通过AD_Net获取支撑集S中每个类簇中心对应的特征/>,这些特征构成样本数据C的注册特征集SF,由SF获得样本数据C的多元正态分布/>。其中,多元正态分布/>的均值/>和方差/>的公式如公式(4)和(5)。
在一些示例性的实施例中,为避免用于构建目标产品的多元正态分布的样本数据集较小,不能保证样本的多样性,使得构建的多元正态分布不能代表目标产品的正常图像的分布情况,本申请实施例在利用K中心点聚类的方式对目标产品的第一数量的正常图像进行无监督聚类之前,可对目标产品的第一数量的正常图像进行图像增强,以丰富样本的多样性。具体地,利用K中心点聚类的方式对目标产品的第一数量的正常图像进行无监督聚类,得到K个类簇中心,包括:
对目标产品的第一数量的正常图像进行图像增强,得到目标产品的第二数量的正常图像,第二数量大于第一数量;
利用预训练网络ResNet34分别对目标产品的第二数量的正常图像进行特征提取,获取目标产品的第二数量的正常图像中各正常图像的全连接之前的一层特征,作为目标产品的第二数量的正常图像中各正常图像的特征表示;
利用K中心点聚类的方式对目标产品的第二数量的正常图像的特征表示进行聚类,将目标产品的第二数量的正常图像划分为K个类簇;
分别确定K个类簇中心对应的目标产品的正常图像,作为K个类簇的代表图像。
S2,随机从样本集中选取一张图像/>,对/>进行几何图像变化操作得到,该几何图像变化操作包括翻转、平移、旋转、缩放、仿射变换等操作中的一种或多种,再将几何图像变化操作后得到的/>放入到图像增强集合/>中;
图7为本申请实施例提供的异常检测方法中的一种多元正态分布的构建过程示意图。在图7中,目标产品的多元正态分布的构建过程可包括:S71,获取目标产品的样本集;S72,筛选出目标产品的正常图像;S73,对目标产品的正常图像进行图像增强,S74,通过特征提取网络对图像增强后的图像集中的各个图像进行特征提取;S75,利用K-Medoide聚类基于各个图像的特征对图像增强后的图像集进行无监督聚类,其中,聚类得到的类簇包括C1~CK;S76,获取K个聚类中心的代表图像;S77,基于K个聚类中心的代表图像获得支撑集;S78,通过AD_Net提取支撑集中每个图像的特征;S79,基于支撑集中每个图像的特征,构建目标产品的多元正态分布。其中,AD_Net为特征提取网络的一种实施方式。
例如,可利用预训练网络ResNet34对中的每个图像进行特征提取操作,本申请实施例可选取全连接之前一层的特征为每个图像的特征表示;再基于提取得到的/>的特征表示的集合,利用K中心点距离算法进行聚类,将划分成K个类簇{/>}。
在一些示例性的实施例中,上述通过异常检测网络提取得到的目标图像的特征可包括多个单元格的特征,即可以将目标图像划分为多个单元格,每个单元格的大小相等,再通过异常检测网络提取目标图像的每个单元格的特征,即通过异常检测网络获取得到的目标图像的特征中包含有每个单元格的特征,而且每个单元格的特征携带有该单元格的位置信息。相应的,为了便于定位目标图像中的异常区域,目标产品的多元正态分布也包含有目标产品的每一类图像的多个单元格的特征分布。具体地,目标图像的特征包括目标图像的多个单元格的特征,目标产品的多元正态分布包括目标产品的正常图像的多个单元格的特征分布,通过目标产品的多元正态分布基于目标图像的特征,确定目标图像的异常概率和异常区域,包括:
确定目标图像的多个单元格的各单元格的特征和目标产品的正常图像的对应的单元格的特征分布之间的距离;
基于目标图像的多个单元格的各单元格的特征和目标产品的正常图像的对应的单元格的特征分布之间的距离,确定目标图像的异常概率和异常区域。
可以理解,目标图像的多个单元格的各单元格的特征和目标产品的正常图像的对应的单元格的特征分布之间的距离越大,表明该单元格为异常区域的概率越大,即该单元格的异常概率越大。图8为本申请实施例提供的通过异常检测网络和多元正态分布确定图像中的异常区域和异常概率的过程示意图,该过程可包括:S81,获取待检测的目标图像;S82,通过AD_Net提取目标图像的图像特征;S83,通过多元正态分布基于目标图像的图像特征对目标图像进行异常鉴定;S84,确定目标图像的异常概率和区域异常概率/>,可通过公式(7)和(8)来确定。
可选地,在目标图像的异常概率大于或等于预设异常概率阈值时,还可通过缺陷检测网络确定目标图像的异常区域对应的缺陷类别。
其中,预设异常概率阈值可包括第一预设异常概率阈值和第二预设异常概率阈值/>,其中,第一预设异常概率阈值/>小于第二预设异常概率阈值/>,即第一预设异常概率阈值/>用于筛选出轻微异常的图像,第二预设异常概率阈值/>用于筛选出高度异常的图像。具体地,在目标图像的异常概率大于或等于预设异常概率阈值时,通过缺陷检测网络确定目标图像中缺陷的位置和类别,包括:
在目标图像的异常概率大于或等于第一异常概率阈值且小于或等于第二异常概率阈值时,通过缺陷检测网络确定目标图像中缺陷的位置和类别;
在目标图像的异常概率大于第二异常概率阈值时,若通过缺陷检测网络确定目标图像的异常区域没有缺陷,则确定目标图像为异常图像。
其中,缺陷检测网络可采用任意通用的缺陷检测网络,只要该缺陷检测网络能够检测出图像中的缺陷及缺陷类别即可,本申请实施例对此不作具体限定。
图9为本申请实施例提供的一种异常检测和缺陷检测的过程示意图,可包括:
S91,输入目标产品的目标图像。
S92,通过异常检测网络和目标产品的多元正态分布对目标图像进行异常检测。
S951,通过缺陷检测网络检测目标图像。
S952,确定缺陷检测网络是否能检测出缺陷区域。
若缺陷检测网络能检测出异常的缺陷区域,则执行S753,否则确定该目标图像无异常。
S953,输出缺陷类别和缺陷区域。
S961,通过缺陷检测网络检测目标图像。
S962,确定缺陷检测网络是否能检测出缺陷。
另外,本实施例提供的方法可应用于任何存在缺陷或异常检测的应用场景中,仅利用有限产品的正常图像,即可构建得到异常检测模型,和各产品的多元正态分布,而且结合缺陷检测网络,有效提高缺陷检测的准确率。
在本申请实施例中提供的异常检测方法中,在获取待检测的目标产品的目标图像之后,能够通过异常检测网络提取目标图像的特征,该异常检测网络为基于多种类别产品的正常图像训练得到,以及通过目标产品的多元正态分布基于目标图像的特征,确定目标图像的异常概率和异常区域,其中,目标产品的多元正态分布为基于目标产品的第一数量的正常图像,通过异常检测网络提取的特征构建得到。由于所利用的异常检测网络和目标产品的多元正态分布都是基于产品的正常图像构建得到,使得在仅有产品正样品的情况下仍然能够实现产品的异常检测。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤610至步骤630的执行主体可以为设备A;又比如,步骤610至步骤620的执行主体可以为设备A,步骤530的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如110、120、610、等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类别。
图10为本申请示例性实施例提供的一种异常检测网络的训练装置1000的结构示意图。如图10所示,该装置1000包括:图像获取模块1010、类别均衡模块1020、网络训练模块1030,其中:
图像获取模块1010,用于获取多种类别产品的正常图像;
类别均衡模块1020,用于对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像;
网络训练模块1030,用于基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络;其中,所述异常检测网络包括特征局部对齐模块和特征编码模块,所述特征局部对齐模块包括掩膜模块和深度残差网络,所述掩膜模块在所述深度残差网络之前,用于对输入的图像进行局部掩膜以对所述输入的图像进行图像增强;所述特征编码模块包括特征金字塔,用于通过串联或并联不同扩容率的空洞卷积对所述特征局部对齐模块提取的特征进行多个尺度的融合。
进一步可选地,所述类别均衡模块1020对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像时,具体用于:
从所述多种类别产品的正常图像中,确定所述多种类别产品中各类别产品的图像数量;
从所述多种类别产品中各类别产品的图像数量中,确定最少类别的产品的图像数量、最多类别的产品的图像数量以及所述多种类别产品的平均图像数量;
在所述最多类别的产品的图像数量大于或等于所述最少类别的产品的图像数量的预设倍数时,对图像数量小于所述多种类别产品的平均图像数量的类别的第一产品的图像进行图像扩充,使得所述多种类别产品的正常图像的数量实现类别均衡化,得到所述类别均衡化的多种类别产品的正常图像。
进一步可选地,所述类别均衡模块1020对图像数量小于所述多种类别产品的平均图像数量的类别的第一产品的图像进行图像扩充时,具体用于:
基于所述多种类别产品的平均图像数量和所述第一产品的正常图像数量,确定所述第一产品待扩充的图像数量;
从所述第一产品的正常图像中选取第一图像,所述第一图像为所述第一产品的正常图像中的任意一张图像;
对所述第一图像进行几何图像变化操作,得到第二图像,并将所述第二图像加入至所述第一产品的正常图像中;其中,所述几何图像变化操作包括翻转、平移、旋转、缩放和仿射变换中的至少一种操作;
重复执行从所述第一产品的正常图像中选取第一图像的步骤,直至所述第一产品的正常图像中扩充的图像数量达到所述第一产品待扩充的图像数量。
进一步可选地,所述网络训练模块1030基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络时,具体用于:
从所述类别均衡化的多种类别产品的正常图像中选择多批图像,所述多批图像中的每批图像包含有N个图像对,所述N个图像对中的每个图像对包含有第一输入图像和第二输入图像;其中,所述第一输入图像为从所述多种类别产品的正常图像中随机选取的任意一张图像,所述第二输入图像为按照第一预设概率,从所述多种类别产品的正常图像中与第一输入图像为同一产品类别的图像中选择的不重复的K张图像,或者,第二输入图像为按照第二预设概率,从所述多种类别产品的正常图像中除第一输入图像所属的产品类别以外的产品类别的图像中选择的不重复的K张图像,第一预设概率和第二预设概率之和为1;
基于所述多批图像,训练得到所述异常检测网络。
异常检测网络的训练装置能够实现图1~图5的方法实施例的方法,具体可参考图1~图5所示实施例的异常检测网络的训练方法,不再赘述。
图11为本申请示例性实施例提供的一种异常检测装置的结构示意图。如图11所示,该装置1100包括:图像获取模块1110、特征提取模块1120、异常确定模块1130,其中:
图像获取模块1110,用于获取待检测的目标产品的目标图像;
特征提取模块1120,用于通过异常检测网络提取所述目标图像的特征,所述异常检测网络为基于多种类别产品的正常图像训练得到;
异常确定模块1130,用于通过所述目标产品的多元正态分布基于所述目标图像的特征,确定所述目标图像的异常概率和异常区域,其中,所述目标产品的多元正态分布为基于所述目标产品的第一数量的正常图像,通过异常检测网络提取的特征构建得到。
进一步可选地,所述装置还包括多元正态分布构建模块,用于:
获取所述目标产品的第一数量的正常图像;
利用K中心点聚类的方式对所述目标产品的第一数量的正常图像进行无监督聚类,得到K个类簇中心,一个所述类簇中心对应于一张所述目标产品的正常图像;
通过特征提取网络提取所述K个类簇中心对应的所述目标产品的正常图像的特征;
基于所述K个类簇中心对应的所述目标产品的正常图像的特征,构建所述目标产品的多元正态分布。
进一步可选地,所述多元正态分布构建模块利用K中心点聚类的方式对所述目标产品的第一数量的正常图像进行无监督聚类,得到K个类簇中心时,具体用于:
对所述目标产品的第一数量的正常图像进行图像增强,得到所述目标产品的第二数量的正常图像,所述第二数量大于所述第一数量;
利用预训练网络ResNet34分别对所述目标产品的第二数量的正常图像进行特征提取,获取所述目标产品的第二数量的正常图像中各正常图像的全连接之前的一层特征,作为所述目标产品的第二数量的正常图像中各正常图像的特征表示;
利用K中心点聚类的方式对所述目标产品的第二数量的正常图像的特征表示进行聚类,将所述目标产品的第二数量的正常图像划分为所述K个类簇;
分别确定所述K个类簇的类簇中心对应的所述目标产品的正常图像,作为所述K个类簇的代表图像。
进一步可选地,所述目标图像的特征包括所述目标图像的多个单元格的特征,所述目标产品的多元正态分布包括所述目标产品的正常图像的多个单元格的特征分布,所述异常确定模块1130通过所述目标产品的多元正态分布基于所述目标图像的特征,确定所述目标图像的异常概率和异常区域时,具体用于:
确定所述目标图像的多个单元格的各单元格的特征和所述目标产品的正常图像的对应的单元格的特征分布之间的距离;
基于所述目标图像的多个单元格的各单元格的特征和所述目标产品的正常图像的对应的单元格的特征分布之间的距离,确定所述目标图像的异常概率和异常区域。
异常检测装置能够实现图6~图9的方法实施例的方法,具体可参考图6~图9所示实施例的异常检测方法,不再赘述。
图12为本申请示例性实施例提供的一种电子设备的结构示意图。如图12所示,该设备包括:存储器121和处理器122。
存储器121,用于存储计算机程序,并可被配置为存储其它各种数据以支持在计算设备上的操作。这些数据的示例包括用于在计算设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图像,视频等。
处理器122,与存储器121耦合,用于执行存储器121中的计算机程序,以用于:获取多种类别产品的正常图像;对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像;基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络;其中,所述异常检测网络包括特征提取模块和特征编码模块,所述特征提取模块包括掩膜模块、特征局部对齐模块和深度残差网络,所述掩膜模块在所述深度残差网络之前,用于对输入的图像进行局部掩膜以对所述输入的图像进行图像增强;所述特征局部对齐模块利用所述特征提取模块提取的特征图上当前单元格周围的单元格信息对所述当前单元格进行表示,并对特征进行矫正对齐;所述特征编码模块包括特征金字塔,用于通过串联或并联不同扩容率的空洞卷积对所述特征局部对齐模块提取的特征进行多个尺度的融合。
进一步,如图12所示,该电子设备还包括:通信组件123、显示器124、电源组件125、音频组件126等其它组件。图12中仅示意性给出部分组件,并不意味着电子设备只包括图12所示组件。另外,根据流量回放设备的实现形态的不同,图12中虚线框内的组件为可选组件,而非必选组件。例如,当电子设备实现为智能手机、平板电脑或台式电脑等终端设备时,可以包括图12中虚线框内的组件;当电子设备实现为常规服务器、云服务器、数据中心或服务器阵列等服务端设备时,可以不包括图12中虚线框内的组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被处理器执行时,致使处理器能够实现上述异常检测网络的训练方法实施例中的步骤。
上述图12中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件还可以包括近场通信(NFC)模块,射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术等。
上述图12中的存储器可以由任何类别的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述图12中的显示器包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
上述图12中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
上述图12中的音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(MIC),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
图13为本申请示例性实施例提供的另一种电子设备的结构示意图。如图13所示,该设备包括:存储器131和处理器132。
存储器131,用于存储计算机程序,并可被配置为存储其它各种数据以支持在计算设备上的操作。这些数据的示例包括用于在计算设备上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图像,视频等。
处理器132,与存储器131耦合,用于执行存储器131中的计算机程序,以用于:获取待检测的目标产品的目标图像;通过异常检测网络提取所述目标图像的特征,所述异常检测网络为基于多种类别产品的正常图像训练得到;通过所述目标产品的多元正态分布基于所述目标图像的特征,确定所述目标图像的异常概率和异常区域,其中,所述目标产品的多元正态分布为基于所述目标产品的第一数量的正常图像,通过异常检测网络提取的特征构建得到。
进一步,如图13所示,该电子设备还包括:通信组件133、显示器134、电源组件135、音频组件136等其它组件。图13中仅示意性给出部分组件,并不意味着电子设备只包括图13所示组件。另外,根据流量回放设备的实现形态的不同,图13中虚线框内的组件为可选组件,而非必选组件。例如,当电子设备实现为智能手机、平板电脑或台式电脑等终端设备时,可以包括图13中虚线框内的组件;当电子设备实现为常规服务器、云服务器、数据中心或服务器阵列等服务端设备时,可以不包括图13中虚线框内的组件。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被处理器执行时,致使处理器能够实现上述异常检测方法实施例中的步骤。
上述图13中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件还可以包括近场通信(NFC)模块,射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术等。
上述图13中的存储器可以由任何类别的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
上述图13中的显示器包括屏幕,其屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
上述图13中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
上述图13中的音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(MIC),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类别的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (11)
1.一种异常检测网络的训练方法,其特征在于,包括:
获取多种类别产品的正常图像;
对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像;
基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络;其中,所述异常检测网络包括特征提取模块和特征编码模块,所述特征提取模块用于提取所述多种类别产品的正常图像中各产品图像的类别无关特征,所述特征提取模块包括掩膜模块、特征局部对齐模块和深度残差网络,所述掩膜模块在所述深度残差网络之前,采用自注意力机制和位置编码操作,对输入的图像进行通道级掩膜,利用其他通道的信息来恢复掩膜掉的通道的信息,用于对输入的图像进行局部掩膜以对所述输入的图像进行图像增强;所述特征局部对齐模块利用所述特征提取模块提取的特征图上当前单元格周围的单元格信息对所述当前单元格进行表示,并对特征进行矫正对齐;所述特征编码模块包括特征金字塔,用于通过串联或并联不同扩容率的空洞卷积对所述特征局部对齐模块提取的特征进行多个尺度的融合。
2.如权利要求1所述的方法,其特征在于,所述对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像,包括:
从所述多种类别产品的正常图像中,确定所述多种类别产品中各类别产品的图像数量;
从所述多种类别产品中各类别产品的图像数量中,确定最少类别的产品的图像数量、最多类别的产品的图像数量以及所述多种类别产品的平均图像数量;
在所述最多类别的产品的图像数量大于或等于所述最少类别的产品的图像数量的预设倍数时,对图像数量小于所述多种类别产品的平均图像数量的类别的第一产品的图像进行图像扩充,使得所述多种类别产品的正常图像的数量实现类别均衡化,得到所述类别均衡化的多种类别产品的正常图像。
3.如权利要求2所述的方法,其特征在于,所述对图像数量小于所述多种类别产品的平均图像数量的类别的第一产品的图像进行图像扩充,包括:
基于所述多种类别产品的平均图像数量和所述第一产品的正常图像数量,确定所述第一产品待扩充的图像数量;
从所述第一产品的正常图像中选取第一图像,所述第一图像为所述第一产品的正常图像中的任意一张图像;
对所述第一图像进行几何图像变化操作,得到第二图像,并将所述第二图像加入至所述第一产品的正常图像中;其中,所述几何图像变化操作包括翻转、平移、旋转、缩放和仿射变换中的至少一种操作;
重复执行从所述第一产品的正常图像中选取第一图像的步骤,直至所述第一产品的正常图像中扩充的图像数量达到所述第一产品待扩充的图像数量。
4.如权利要求1~3中任一所述的方法,其特征在于,所述基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络,包括:
从所述类别均衡化的多种类别产品的正常图像中选择多批图像,所述多批图像中的每批图像包含有N个图像对,所述N个图像对中的每个图像对包含有第一输入图像和第二输入图像;其中,所述第一输入图像为从所述多种类别产品的正常图像中随机选取的任意一张图像,所述第二输入图像为按照第一预设概率,从所述多种类别产品的正常图像中与第一输入图像为同一产品类别的图像中选择的不重复的K张图像,或者,第二输入图像为按照第二预设概率,从所述多种类别产品的正常图像中除第一输入图像所属的产品类别以外的产品类别的图像中选择的不重复的K张图像,第一预设概率和第二预设概率之和为1;
基于所述多批图像,训练得到所述异常检测网络。
5.一种异常检测方法,其特征在于,包括:
获取待检测的目标产品的目标图像;
通过异常检测网络提取所述目标图像的特征,所述异常检测网络为基于多种类别产品的正常图像训练得到;
通过所述目标产品的多元正态分布确定所述目标图像的异常概率和异常区域,其中,所述目标产品的多元正态分布为基于所述目标产品的第一数量的正常图像,通过权利要求1~4中任一所述的异常检测网络提取的特征构建得到。
6.如权利要求5所述的方法,其特征在于,所述目标产品的多元正态分布的构建过程包括:
获取所述目标产品的第一数量的正常图像;
利用K中心点聚类的方式对所述目标产品的第一数量的正常图像进行无监督聚类,得到K个类簇中心,一个所述类簇中心对应于一张所述目标产品的正常图像;
通过特征提取网络提取所述K个类簇中心对应的所述目标产品的正常图像的特征;
基于所述K个类簇中心对应的所述目标产品的正常图像的特征,构建所述目标产品的多元正态分布。
7.如权利要求6所述的方法,其特征在于,所述利用K中心点聚类的方式对所述目标产品的第一数量的正常图像进行无监督聚类,得到K个类簇中心,包括:
对所述目标产品的第一数量的正常图像进行图像增强,得到所述目标产品的第二数量的正常图像,所述第二数量大于所述第一数量;
利用预训练网络ResNet34分别对所述目标产品的第二数量的正常图像进行特征提取,获取所述目标产品的第二数量的正常图像中各正常图像的全连接之前的一层特征,作为所述目标产品的第二数量的正常图像中各正常图像的特征表示;
利用K中心点聚类的方式对所述目标产品的第二数量的正常图像的特征表示进行聚类,将所述目标产品的第二数量的正常图像划分为所述K个类簇;
分别确定所述K个类簇的类簇中心对应的所述目标产品的正常图像,作为所述K个类簇的代表图像。
8.一种异常检测网络的训练装置,其特征在于,包括:
图像获取模块,用于获取多种类别产品的正常图像;
类别均衡模块,用于对所述多种类别产品的正常图像进行类别均衡化,得到所述类别均衡化的多种类别产品的正常图像;
网络训练模块,用于基于所述类别均衡化的多种类别产品的正常图像,训练得到所述异常检测网络;其中,所述异常检测网络包括特征提取模块和特征编码模块,所述特征提取模块用于提取所述多种类别产品的正常图像中各产品图像的类别无关特征,所述特征提取模块包括掩膜模块、特征局部对齐模块和深度残差网络,所述掩膜模块在所述深度残差网络之前,采用自注意力机制和位置编码操作,对输入的图像进行通道级掩膜,利用其他通道的信息来恢复掩膜掉的通道的信息,用于对输入的图像进行局部掩膜以对所述输入的图像进行图像增强;所述特征局部对齐模块利用所述特征提取模块提取的特征图上当前单元格周围的单元格信息对所述当前单元格进行表示,并对特征进行矫正对齐;所述特征编码模块包括特征金字塔,用于通过串联或并联不同扩容率的空洞卷积对所述特征局部对齐模块提取的特征进行多个尺度的融合。
9.一种异常检测装置,其特征在于,包括:
图像获取模块,用于获取待检测的目标产品的目标图像;
特征提取模块,用于通过异常检测网络提取所述目标图像的特征,所述异常检测网络为基于多种类别产品的正常图像训练得到;
异常确定模块,用于通过所述目标产品的多元正态分布基于所述目标图像的特征,确定所述目标图像的异常概率和异常区域,其中,所述目标产品的多元正态分布为基于所述目标产品的第一数量的正常图像,通过权利要求1~4中任一所述的异常检测网络提取的特征构建得到。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4任一项所述的异常检测网络的训练方法,或如权利要求5至7任一所述的异常检测方法中的步骤。
11.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器实现如权利要求1至4任一项所述的异常检测网络的训练方法,或如权利要求5至7任一所述的异常检测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310069954.7A CN115810011B (zh) | 2023-02-07 | 2023-02-07 | 异常检测网络的训练及异常检测方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310069954.7A CN115810011B (zh) | 2023-02-07 | 2023-02-07 | 异常检测网络的训练及异常检测方法、装置和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115810011A CN115810011A (zh) | 2023-03-17 |
CN115810011B true CN115810011B (zh) | 2023-07-07 |
Family
ID=85487548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310069954.7A Active CN115810011B (zh) | 2023-02-07 | 2023-02-07 | 异常检测网络的训练及异常检测方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115810011B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112014399B (zh) * | 2020-07-22 | 2023-08-25 | 湖北工业大学 | 粮箱内带式谷物破碎率和含杂率检测装置和方法 |
CN113888542B (zh) * | 2021-12-08 | 2022-03-22 | 常州微亿智造科技有限公司 | 产品缺陷检测方法和装置 |
CN114707706A (zh) * | 2022-03-17 | 2022-07-05 | 广西科学院 | 一种基于不均衡数据的柴油发动机故障诊断方法 |
CN115439804A (zh) * | 2022-08-29 | 2022-12-06 | 北京格灵深瞳信息技术股份有限公司 | 一种用于高铁检修的监测方法以及装置 |
-
2023
- 2023-02-07 CN CN202310069954.7A patent/CN115810011B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN115810011A (zh) | 2023-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109214343B (zh) | 用于生成人脸关键点检测模型的方法和装置 | |
CN109816589B (zh) | 用于生成漫画风格转换模型的方法和装置 | |
US11538246B2 (en) | Method and apparatus for training feature extraction model, computer device, and computer-readable storage medium | |
CN109829433B (zh) | 人脸图像识别方法、装置、电子设备及存储介质 | |
CN115797349B (zh) | 一种缺陷检测方法、装置和设备 | |
CN111860573B (zh) | 模型训练方法、图像类别检测方法、装置和电子设备 | |
CN108121952A (zh) | 人脸关键点定位方法、装置、设备及存储介质 | |
CA3066029A1 (en) | Image feature acquisition | |
CN111950528B (zh) | 图表识别模型训练方法以及装置 | |
CN112819686B (zh) | 基于人工智能的图像风格处理方法、装置及电子设备 | |
US10803571B2 (en) | Data-analysis pipeline with visual performance feedback | |
Cruciani et al. | Comparing CNN and human crafted features for human activity recognition | |
CN116310850B (zh) | 基于改进型RetinaNet的遥感图像目标检测方法 | |
CN111539256B (zh) | 一种虹膜特征提取方法、装置及存储介质 | |
TW202229871A (zh) | 稀疏光流估計 | |
CN115810011B (zh) | 异常检测网络的训练及异常检测方法、装置和设备 | |
CN116152576B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN116977336A (zh) | 摄像头缺陷检测方法、装置、计算机设备及存储介质 | |
CN116048682A (zh) | 一种终端系统界面布局对比方法及电子设备 | |
CN113963282A (zh) | 视频替换检测及其模型的训练方法及装置 | |
CN113869198A (zh) | 虹膜图像处理方法、装置、电子设备和计算机可读介质 | |
Burdukovskaya et al. | Improving of action localization in videos using the novel feature extraction | |
CN115471893B (zh) | 训练人脸识别模型、人脸识别的方法和装置 | |
CN113516141B (zh) | 深度度量模型的优化方法、设备及存储介质 | |
CN111311616B (zh) | 用于分割图像的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |