CN111062918B - 一种基于计算机视觉的异常检测方法及装置 - Google Patents

一种基于计算机视觉的异常检测方法及装置 Download PDF

Info

Publication number
CN111062918B
CN111062918B CN201911258334.8A CN201911258334A CN111062918B CN 111062918 B CN111062918 B CN 111062918B CN 201911258334 A CN201911258334 A CN 201911258334A CN 111062918 B CN111062918 B CN 111062918B
Authority
CN
China
Prior art keywords
picture
target picture
detected
target
difference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911258334.8A
Other languages
English (en)
Other versions
CN111062918A (zh
Inventor
谢馥励
张一凡
刘杰
田继锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Inc
Original Assignee
Goertek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Inc filed Critical Goertek Inc
Priority to CN201911258334.8A priority Critical patent/CN111062918B/zh
Publication of CN111062918A publication Critical patent/CN111062918A/zh
Priority to US17/309,306 priority patent/US12002195B2/en
Priority to PCT/CN2020/123475 priority patent/WO2021114896A1/zh
Application granted granted Critical
Publication of CN111062918B publication Critical patent/CN111062918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于计算机视觉的异常检测方法和装置。该方法包括:根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,利用各个目标图片对应的特征区域分别组成训练集;选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,得到对应不同特征区域的各GAN网络模型;执行异常检测时,对待测目标图片进行同样的特征区域划分,将待测目标图片的不同特征区域分别输入到对应的GAN网络模型中,获得生成图片,对生成图片和待测目标图片进行基于像素值的差异检测。由于本申请对目标图片进行了不同特征区域的划分和像素级别的差异检测,因而提高了判断目标正常与否的准确度。

Description

一种基于计算机视觉的异常检测方法及装置
技术领域
本发明涉及异常检测技术领域,特别涉及一种基于计算机视觉的异常检测方法及装置。
背景技术
计算机视觉(computer vision)是指用摄影机和计算机代替人眼对目标进行识别、跟踪、测量等操作,也可以看作是研究如何使人工系统从图像或多维数据中感知的科学。异常检测(anomaly detection)是指对不符合预期模式或数据集中的其他项目的项目、事件或观测的识别,常用的领域包括数据挖掘和结构缺陷检测等。在工业生产中,一些需要检测的产品具备不同的特征,基于此,可以利用异常检测算法,对其进行基于计算机视觉的异常检测。
然而,现有的异常检测算法研究及应用中,主要是针对安检机之类的语义级别的异常检测,即当图片中出现了语义级别的异常时才能判断,而语义级别是将像素按照图像中表达语义含义的不同进行分组或分割的,比如安检机中检测违禁物品(枪支)时,违禁品异常通常占画面比例较高,且与画面中其他成分(如其他正常箱包)存在语义级的区别。而工业产品中的异常产品与正常产品不存在语义级别的差别,因而应用现有检测方法不能取得较好的效果。
发明内容
鉴于现有技术异常检测算法不能很好应用于工业产品检测的问题,提出了本发明的一种基于计算机视觉的异常检测方法及装置,以便克服上述问题。
为了实现上述目的,本发明采用了如下技术方案:
依据本发明的一个方面,提供了一种基于计算机视觉的异常检测方法,该方法包括:
根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,利用各个目标图片对应的特征区域分别组成训练集;
选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,得到对应不同特征区域的各GAN网络模型;
执行异常检测时,对待测目标图片进行同样的特征区域划分,将待测目标图片的不同特征区域分别输入到对应的GAN网络模型中,获得生成图片,对生成图片和待测目标图片进行基于像素值的差异检测。
可选地,所述利用各个目标图片对应的特征区域分别组成训练集,包括:
利用状态正常的目标图片的各特征区域分别组成训练集;
所述选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,包括:
选取基于wasserstein距离的GAN网络WGAN作为使用的网络模型,利用训练集训练得到WGAN网络模型,该WGAN网络模型能够依据输入图片生成具有正常目标特征的图片。
可选地,所述根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,包括:
根据目标图片内容的多样性,将目标图片划分为低多样性区域和高多样性区域。
可选地,对生成图片和待测目标图片进行基于像素值的差异检测,包括:
对生成图片和待测目标图片对应的低多样性区域进行差异检测,当检测结果为异常时,停止计算,直接判定待测目标异常;
当检测结果为正常时,继续对生成图片和待测目标图片对应的高多样性区域进行差异检测。
可选地,所述对生成图片和待测目标图片进行基于像素值的差异检测,包括:
计算待测目标图片和生成图片低多样性区域的像素值差异,若计算结果不小于第一阈值,则判断待测目标图片低多样性区域异常,并停止计算,若计算结果小于第一阈值,则判断待测目标图片低多样性区域正常;
继续计算待测目标图片和生成图片高多样性区域的像素值差异,若计算结果不小于第二阈值,则判断待测目标图片高多样性区域异常,若计算结果小于第二阈值,则判断待测目标图片正常。
可选地,所述计算待测目标图片和生成图片低多样性区域的像素值差异,包括:计算待测目标图片与生成图片的每个像素值差值的二阶范数平方的平均值,将该平均值作为指示低多样性区域差异的计算结果;
所述计算待测目标图片和生成图片高多样性区域的像素值差异,包括:计算待测目标图片与生成图片的最大像素值差异和像素值累积差异;所述第二阈值为一组值,当所述最大像素值差异和所述像素值累积差异均不小于所述第二阈值中的对应值时,才认为计算结果不小于第二阈值,判断待测目标图片高多样性区域异常,其中,
最大像素值差异指示了单张待测目标图片与对应的生成图片的像素值差异的最大值;
像素值累积差异指示了属于同一待测目标的所有目标图片与对应的生成图片的像素值差异的累积值。
可选地,针对低多样性区域,采用如下第一公式计算每个像素值差值的二阶范数平方的平均值:
其中,n为低多样性区域总像素数,x为待测目标图片的像素值,G(x)为生成图片的像素值;
针对高多样性区域,采用如下第二公式计算待测目标图片与生成图片的最大像素值差异:
采用如下第三公式计算待测目标图片与生成图片的像素值累积差异:
在第二公式和第三公式中,(i,j)代表高多样性区域每张图片中各像素的坐标,M为高多样性区域总的图片张数。
可选地,所述方法还包括:
将状态正常的目标图片各特征区域训练集分别输入到训练后的GAN网络模型,得到生成图片,计算低多样性区域中每个像素值差值的二阶范数平方的平均值,选取计算结果的中位数以上预设位置处的数值作为所述第一阈值;计算高多样性区域的最大像素值差异和像素值累积差异,分别选取计算结果的中位数以上的预设位置处的数值组成所述第二阈值。
可选地,该方法还包括:
在将目标图片输入GAN网络模型之前,重置目标图片的分辨率,使目标图片调整至预设像素尺寸的整数倍,并按照预设像素尺寸将目标图片分割成多张图片。
依据本发明的另一个方面,提供了一种基于计算机视觉的异常检测装置,该装置包括:训练集生成模块、训练模块和检测模块;
所述训练集生成模块,用于根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,利用各个目标图片对应的特征区域分别组成训练集;
所述训练模块,用于选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,得到对应不同特征区域的各GAN网络模型;
所述检测模块,用于对待测目标图片进行同样的特征区域划分,将待测目标图片的不同特征区域分别输入到对应的GAN网络模型中,获得生成图片,对生成图片和待测目标图片进行基于像素值的差异检测。
可选地,所述训练集生成模块,用于根据目标图片内容的多样性,将目标图片划分为低多样性区域和高多样性区域;
所述检测模块,用于对生成图片和待测目标图片对应的低多样性区域进行差异检测,当检测结果为异常时,停止计算,直接判定待测目标异常;当检测结果为正常时,继续对生成图片和待测目标图片对应的高多样性区域进行差异检测。
可选地,所述检测模块,具体用于:计算待测目标图片和生成图片低多样性区域的像素值差异,若计算结果不小于第一阈值,则判断待测目标图片低多样性区域异常,并停止计算,若计算结果小于第一阈值,则判断待测目标图片低多样性区域正常,继续计算待测目标图片和生成图片高多样性区域的像素值差异,若计算结果不小于第二阈值,则判断待测目标图片高多样性区域异常,若计算结果小于第二阈值,则判断待测目标图片正常。
综上所述,本发明的有益效果是:
本申请通过划分目标图片的不同特征区域获得训练集,训练得到对应各特征区域的GAN网络模型,借助训练后的GAN网络模型,可以输入待测目标图片各特征区域得到生成图片,继而通过对生成图片和待测目标图片进行基于像素值的差异检测,判断待测目标是否正常,由于本申请对目标图片进行了不同特征区域的划分和像素级别的差异检测,因而提高了判断目标正常与否的准确度。
附图说明
图1为本发明一个实施例提供的基于计算机视觉的异常检测方法的流程示意图;
图2为本发明一个实施例提供的WGAN网络模型训练流程示意图;
图3为本发明一个实施例提供的网格状目标图片切割示意图;
图4为本发明图3所示切割示意图的中央区域和边缘区域划分示意图;
图5为本发明一个实施例提供的基于中央区域和边缘区域的WGAN网络模型检测流程示意图;
图6为本发明一个实施例提供的基于计算机视觉的异常检测方法的异常检测判定流程图;
图7为本发明一个实施例提供的基于计算机视觉的异常检测装置的结构示意图;
图8为本发明另一个实施例提供的基于计算机视觉的异常检测装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
在本申请的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
本发明的技术构思是:通过划分目标图片的不同特征区域来获得训练集,训练得到对应各特征区域的GAN网络模型,借助训练后的GAN网络模型,可以输入待测目标图片各特征区域得到生成图片,继而通过对生成图片和待测目标图片进行基于像素值的差异检测,判断待测目标是否正常,由于本申请对目标图片进行了不同特征区域的划分和像素级别的差异检测,因而提高了判断目标正常与否的准确度。
图1为本发明一个实施例提供的基于计算机视觉的异常检测方法的流程示意图。如图1所示,一种基于计算机视觉的异常检测方法,该方法包括:
步骤S110:根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,利用各个目标图片对应的特征区域分别组成训练集。
由于工业生产中,需要检测的产品不同区域具有不同的特征,基于此,本申请首先将目标图片划分成不同的特征区域,对各特征区域分别处理,根据各特征区别是否正常来综合判断目标产品是否正常。
步骤S120:选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,得到对应不同特征区域的各GAN网络模型。
基于对抗生成网络GAN(Generative Adversarial Network),包括生成器G和鉴别器D(见图2)。训练完成后的GAN网络模块中,生成器G首先根据输入原图(真实图片x)重建获得生成图片(如生成图片G(z)),然后将生成图片送入鉴别器D中进行判断,若原图和重建的生成图片差别很大,则可以判断原图异常,也就是说,通过计算原图和重建的生成图片的差异即可判定目标正常与否。本申请针对目标划分后的两个以上特征区域,分别训练得到对应的GAN网络模型,从而可以对待测目标图片的各特征区域分别进行全面的差异检测。
步骤S130:执行异常检测时,对待测目标图片进行同样的特征区域划分,将待测目标图片的不同特征区域分别输入到对应的GAN网络模型中,获得生成图片,对生成图片和待测目标图片进行基于像素值的差异检测。
由于本申请对待测目标图片进行了同样的特征区域划分,并且利用训练得到的对应GAN网络模型分别对待测目标图片的各特征区域进行像素级别的差异检测,从而可以充分检测待测目标图片各个特征区域是否存在异常,根据各个特征区域正常与否的结果,综合判断待测目标是否正常,因而提高了判断目标正常与否的准确度。
在本申请的一个实施例中,步骤S110中,利用各个目标图片对应的特征区域分别组成训练集,包括:利用状态正常的目标图片的各特征区域分别组成训练集。
步骤S120中,选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,包括:选取基于wasserstein距离的GAN网络WGAN作为使用的网络模型,利用训练集训练得到WGAN网络模型,该WGAN网络模型能够依据输入图片生成具有正常目标特征的图片。
本实施例中,选择状态正常的目标图片的各特征区域构成训练集,以此训练生成WGAN网络模型,由于WGAN网络模型没有经过异常图片的训练,因此异常检测时就只能生成具有正常目标特征的生产图片,从而当输入的待测目标图片异常时,生成图片与输入的待测目标原图差别很大,根据对二者基于像素值的差异检测就可以准确判断待测目标异常。
在本申请的一个实施例中,根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,包括:根据目标图片内容的多样性,将目标图片划分为低多样性区域和高多样性区域。
本实施例中,根据目标图片内容的多样性不同,分别划分目标图片的低多样性区域和高多样性区域,低多样性区域和高多样性区域的数量可以分别为一个或多个。参考图3所示,以网布等网格状产品为例,通常网格中央部分的图案较为均匀一致,而边缘图案则存在变形,因此,本实施例将目标的中央区域划分为低多样性区域,将目标的边缘区域划分为高多样性区域,高多样性区域涵盖的图像信息的复杂度大于低多样性区域涵盖的图像信息的复杂度。参考图4所示,图3分割示意图中最外侧一圈划分为高多样性区域,内部划分为低多样性区域。
继而,如本申请图5所示,本实施例训练得到的WGAN网络模型也对应包括中央区域WGAN模型和边缘区域WGAN模型,在对待测目标图片进行基于计算机视觉的异常检测时,将待测目标图片也进行中央区域和边缘区域的划分,并分别使用对应的WGAN模型对待测目标图片的中央区域和边缘区域进行异常检测,其检测结果经过综合处理后,实现对待测目标正常与否的最终判断。
在本申请的一个实施例中,该方法还包括图片预处理,以应对GAN模型处理图片的尺寸限制,包括:在将目标图片输入GAN网络模型之前,重置目标图片的分辨率,使目标图片调整至预设像素尺寸的整数倍,并按照预设像素尺寸将目标图片分割成多张图片。
GAN网络受制于生成空间不能过大,否则会造成网络不稳定,因此生成的图片大小最多稳定在64X64尺寸大小,而实际检测中的图片多数远大于这个数值。因此,本申请在将目标图片输入GAN网络模型前,对原图片进行整数化和切割处理,首先将原图的分辨率重置为64的整数倍,然后裁切成数个64X64尺寸的小图(见图3、4所示),经过切割后每张小图足以采用64X64的大小完整显示。当然,这里的64X64尺寸仅是示意性实施例,实际应用中,也可根据需要,选择不同的预设像素尺寸,在此不再赘述。
在本申请的一个实施例中,对生成图片和待测目标图片进行基于像素值的差异检测,包括:
对生成图片和待测目标图片对应的低多样性区域进行差异检测,当检测结果为异常时,停止计算,直接判定待测目标异常;当检测结果为正常时,继续对生成图片和待测目标图片对应的高多样性区域进行差异检测。也就是说,在本实施例中,优先检测待测目标图片的低多样性区域正常与否,在检测确认低多样性区域正常后,才进行高多样性区域的检测。
由于低多样性区域中,目标图片的变化不多,多样性不高,因此即使是极细微的异常也会引起GAN模型重构生成图片与输入原图之间的显著差异,因此,因此本实施例首先对低多样性区域进行差异检测,若判断低多样性区域异常,则直接判断待测目标异常,停止计算,若判断低多样性区域正常,再进一步对高多样性区域进行差异检测,这样可以使异常检测过程更加简单和准确。
如图6所示,仍以中央-边缘划分的特征区域为例,本实施例输入待测图到GAN网络模型,生成重建图后,首先判定中央区域(低多样性区域)是否正常,若异常则直接判断待测目标异常,停止计算;若判定中央区域正常,再进一步判定边缘区域(高多样性区域)是否正常,若高多样性区域也正常,则可以判定待测目标正常,若高多样性区域异常,则判定待测目标异常。
在本申请的一个实施例中,对生成图片和待测目标图片进行基于像素值的差异检测,包括:
计算待测目标图片和生成图片低多样性区域的像素值差异,若计算结果不小于第一阈值,则判断待测目标图片低多样性区域异常,并停止计算,若计算结果小于第一阈值,则判断待测目标图片低多样性区域正常;继续计算待测目标图片和生成图片高多样性区域的像素值差异,若计算结果不小于第二阈值,则判断待测目标图片高多样性区域异常,若计算结果小于第二阈值,则判断待测目标图片正常。
在优选实施例中,计算待测目标图片和生成图片低多样性区域的像素值差异,包括:计算待测目标图片与生成图片的每个像素值差值的二阶范数平方的平均值,将该平均值作为指示低多样性区域差异的计算结果。
具体地,针对低多样性区域,可以采用如下第一公式计算每个像素值差值的二阶范数平方的平均值:
其中,n为低多样性区域总像素数,x为待测目标图片的像素值,G(x)为生成图片的像素值。通常情况下,当待测目标图片正常时,计算结果Lc的值会比较低,而当待测目标图片为异常图片时,计算结果Lc的值会远高于正常图片,通过设置合适的第一阈值即可判定待测目标图片的异常,实现待测目标的差异检测。
由于高多样性区域具有更高的多样性,因此生成图片的重构精度不如低多样性区域,对此,本实施例采用另一种评价体系计算高多样性区域的像素值差异。
优选地,计算待测目标图片和生成图片高多样性区域的像素值差异,包括:计算待测目标图片与生成图片的最大像素值差异和像素值累积差异;第二阈值为一组值,当最大像素值差异和像素值累积差异均不小于第二阈值中的对应值时,才认为计算结果不小于第二阈值,判断待测目标图片高多样性区域异常,其中,最大像素值差异指示了单张待测目标图片与对应的生成图片的像素值差异的最大值;像素值累积差异指示了属于同一待测目标的所有目标图片与对应的生成图片的像素值差异的累积值。
具体地,针对高多样性区域,采用如下第二公式计算待测目标图片与生成图片的最大像素值差异:
采用如下第三公式计算待测目标图片与生成图片的像素值累积差异:
在第二公式和第三公式中,(i,j)代表高多样性区域每张图片中各像素的坐标,M为高多样性区域总的图片张数。
综合第二公式和第三公式即可判定高多样性区域是否为异常。其中,Lbmax可以体现高多样性区域内,单张图片的像素值最大差异,Lbsum可以体现整个高多样性区域的像素值累积差异。由于高多样性区域的生成图片精确程度不如低多样性区域,因此如果仍采用与低多样性区域同一判定方式会造成过多的误判,将正常的图片判为异常。所以,本实施例设计这种双重损失函数叠加的方式,仅有当高多样性区域的像素值累积差异和单张图片的像素值最大差异均达到对应阈值时,才判定待测目标异常,这样可以保证目标图片分割后每张小图的最大异常和连续跨越多张小图的微小异常均能够被识别。对应地,第二阈值为一组值,分别针对Lbmax和Lbsum设置两个阈值,当Lbmax和Lbsum全都不小于对应阈值时即判定高多样性区域为异常。
在本申请的一个实施例中,方法还包括利用状态正常的图片训练集确定第一阈值和第二阈值的步骤,包括:
将状态正常的目标图片各特征区域训练集分别输入到训练后的GAN网络模型,得到生成图片,计算低多样性区域中每个像素值差值的二阶范数平方的平均值,选取计算结果的中位数以上预设位置处的数值作为第一阈值;计算高多样性区域的最大像素值差异和像素值累积差异,分别选取计算结果的中位数以上的预设位置处的数值组成第二阈值。优选地,在本实施例中,分别选取计算结果的中位数以上的15%或者20%或者25%位置处的数值作为对应阈值。
本申请还公开了一种基于计算机视觉的异常检测装置,如图7所示,该装置包括:训练集生成模块710、训练模块720和检测模块730。
训练集生成模块710,用于根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,利用各个目标图片对应的特征区域分别组成训练集。
训练模块720,用于选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,得到对应不同特征区域的各GAN网络模型。
检测模块730,用于对待测目标图片进行同样的特征区域划分,将待测目标图片的不同特征区域分别输入到对应的GAN网络模型中,获得生成图片,对生成图片和待测目标图片进行基于像素值的差异检测。
在本申请的一个实施例中,训练集生成模块710,用于根据目标图片内容的多样性,将目标图片划分为低多样性区域和高多样性区域。
检测模块730,用于对生成图片和待测目标图片对应的低多样性区域进行差异检测,当检测结果为异常时,停止计算,直接判定待测目标异常;当检测结果为正常时,继续对生成图片和待测目标图片对应的高多样性区域进行差异检测。
在本申请的一个实施例中,训练集生成模块710,具体用于利用状态正常的目标图片的各特征区域分别组成训练集。
训练模块720,具体用于选取基于wasserstein距离的GAN网络WGAN作为使用的网络模型,利用训练集训练得到WGAN网络模型,该WGAN网络模型能够依据输入图片生成具有正常目标特征的图片。
在本申请的一个实施例中,训练集生成模块710,用于根据目标图片内容的多样性,将目标图片划分为低多样性区域和高多样性区域。
在本申请的一个实施例中,训练集生成模块710以及检测模块730,还用于在将目标图片输入GAN网络模型之前,重置目标图片的分辨率,使目标图片调整至预设像素尺寸的整数倍,并按照预设像素尺寸将目标图片分割成多张图片。
在本申请的一个实施例中,检测模块730,具体用于:计算待测目标图片和生成图片低多样性区域的像素值差异,若计算结果不小于第一阈值,则判断待测目标图片低多样性区域异常,并停止计算,若计算结果小于第一阈值,则判断待测目标图片低多样性区域正常,继续计算待测目标图片和生成图片高多样性区域的像素值差异,若计算结果不小于第二阈值,则判断待测目标图片高多样性区域异常,若计算结果小于第二阈值,则判断待测目标图片正常。
在本申请的一个实施例中,检测模块730,具体用于:计算待测目标图片与生成图片的每个像素值差值的二阶范数平方的平均值,将该平均值作为指示低多样性区域差异的计算结果。以及,计算待测目标图片与生成图片的最大像素值差异和像素值累积差异;其中,第二阈值为一组值,当最大像素值差异和像素值累积差异均不小于第二阈值中的对应值时,才认为计算结果不小于第二阈值,判断待测目标图片高多样性区域异常,最大像素值差异指示了单张待测目标图片与对应的生成图片的像素值差异的最大值;像素值累积差异指示了属于同一待测目标的所有目标图片与对应的生成图片的像素值差异的累积值。
具体地,针对低多样性区域,检测模块730可以采用如下第一公式计算每个像素值差值的二阶范数平方的平均值:
其中,n为低多样性区域总像素数,x为待测目标图片的像素值,G(x)为生成图片的像素值。
针对高多样性区域,检测模块730可以采用如下第二公式计算待测目标图片与生成图片的最大像素值差异:
采用如下第三公式计算待测目标图片与生成图片的像素值累积差异:
在第二公式和第三公式中,(i,j)代表高多样性区域每张图片中各像素的坐标,M为高多样性区域总的图片张数。
图8示出了本申请基于计算机视觉的异常检测装置的另一个实施例,如图8所示,该装置包括:训练集生成模块810、训练模块820、检测模块830以及阈值确定模块840。
阈值确定模块840,用于将状态正常的目标图片各特征区域训练集分别输入到训练后的GAN网络模型,得到生成图片,计算低多样性区域中每个像素值差值的二阶范数平方的平均值,选取计算结果的中位数以上预设位置处的数值作为第一阈值;计算高多样性区域的最大像素值差异和像素值累积差异,分别选取计算结果的中位数以上的预设位置处的数值组成第二阈值。优选地,在本实施例中,分别选取计算结果的中位数以上的20%位置处的数值作为对应阈值。
本申请基于计算机视觉的异常检测装置的工作原理,与上述基于计算机视觉的异常检测方法对应相同,具体使用的公式以及参数选择,可以参考上述方法实施例的介绍,在此不再赘述。
以上所述,仅为本发明的具体实施方式,在本发明的上述教导下,本领域技术人员可以在上述实施例的基础上进行其他的改进或变形。本领域技术人员应该明白,上述的具体描述只是更好的解释本发明的目的,本发明的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种基于计算机视觉的异常检测方法,其特征在于,该方法包括:
根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,利用各个目标图片对应的特征区域分别组成训练集;
选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,得到对应不同特征区域的各GAN网络模型;
执行异常检测时,对待测目标图片进行同样的特征区域划分,将待测目标图片的不同特征区域分别输入到对应的GAN网络模型中,获得生成图片,对生成图片和待测目标图片进行基于像素值的差异检测;
所述对生成图片和待测目标图片进行基于像素值的差异检测包括:
计算待测目标图片与生成图片中的低多样性区域的每个像素值差值的二阶范数平方的平均值,将该平均值作为指示低多样性区域差异的计算结果;
计算待测目标图片与生成图片中的高多样性区域的最大像素值差异和像素值累积差异;当所述最大像素值差异和所述像素值累积差异均不小于各自对应的阈值时,判断待测目标图片高多样性区域异常,其中,
最大像素值差异指示了单张待测目标图片与对应的生成图片的像素值差异的最大值;
像素值累积差异指示了属于同一待测目标的所有目标图片与对应的生成图片的像素值差异的累积值。
2.根据权利要求1所述的基于计算机视觉的异常检测方法,其特征在于,所述利用各个目标图片对应的特征区域分别组成训练集,包括:
利用状态正常的目标图片的各特征区域分别组成训练集;
所述选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,包括:
选取基于wasserstein距离的GAN网络WGAN作为使用的网络模型,利用训练集训练得到WGAN网络模型,该WGAN网络模型能够依据输入图片生成具有正常目标特征的图片。
3.根据权利要求1或2所述的基于计算机视觉的异常检测方法,其特征在于,所述根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,包括:
根据目标图片内容的多样性,将目标图片划分为低多样性区域和高多样性区域。
4.根据权利要求3所述的基于计算机视觉的异常检测方法,其特征在于,对生成图片和待测目标图片进行基于像素值的差异检测,包括:
对生成图片和待测目标图片对应的低多样性区域进行差异检测,当检测结果为异常时,停止计算,直接判定待测目标异常;
当检测结果为正常时,继续对生成图片和待测目标图片对应的高多样性区域进行差异检测。
5.根据权利要求4所述的基于计算机视觉的异常检测方法,其特征在于,所述对生成图片和待测目标图片进行基于像素值的差异检测,包括:
计算待测目标图片和生成图片低多样性区域的像素值差异,若计算结果不小于第一阈值,则判断待测目标图片低多样性区域异常,并停止计算,若计算结果小于第一阈值,则判断待测目标图片低多样性区域正常;
继续计算待测目标图片和生成图片高多样性区域的像素值差异,若计算结果不小于第二阈值,则判断待测目标图片高多样性区域异常,若计算结果小于第二阈值,则判断待测目标图片正常。
6.根据权利要求5所述的基于计算机视觉的异常检测方法,其特征在于,针对低多样性区域,采用如下第一公式计算每个像素值差值的二阶范数平方的平均值:
其中,n为低多样性区域总像素数,x为待测目标图片的像素值,G(x)为生成图片的像素值;
针对高多样性区域,采用如下第二公式计算待测目标图片与生成图片的最大像素值差异:
采用如下第三公式计算待测目标图片与生成图片的像素值累积差异:
在第二公式和第三公式中,(i,j)代表高多样性区域每张图片中各像素的坐标,M为高多样性区域总的图片张数。
7.根据权利要求5所述的基于计算机视觉的异常检测方法,其特征在于,所述方法还包括:
将状态正常的目标图片各特征区域训练集分别输入到训练后的GAN网络模型,得到生成图片,计算低多样性区域中每个像素值差值的二阶范数平方的平均值,选取计算结果的中位数以上预设位置处的数值作为所述第一阈值;计算高多样性区域的最大像素值差异和像素值累积差异,分别选取计算结果的中位数以上的预设位置处的数值组成所述第二阈值。
8.根据权利要求1所述的基于计算机视觉的异常检测方法,其特征在于,该方法还包括:
在将目标图片输入GAN网络模型之前,重置目标图片的分辨率,使目标图片调整至预设像素尺寸的整数倍,并按照预设像素尺寸将目标图片分割成多张图片。
9.一种基于计算机视觉的异常检测装置,其特征在于,该装置包括:训练集生成模块、训练模块和检测模块;
所述训练集生成模块,用于根据目标图片的不同区域特征,将目标图片划分为至少两个特征区域,利用各个目标图片对应的特征区域分别组成训练集;
所述训练模块,用于选取对抗生成网络GAN作为使用的网络模型,分别使用不同特征区域的训练集训练GAN网络模型,得到对应不同特征区域的各GAN网络模型;
所述检测模块,用于对待测目标图片进行同样的特征区域划分,将待测目标图片的不同特征区域分别输入到对应的GAN网络模型中,获得生成图片,对生成图片和待测目标图片进行基于像素值的差异检测;
所述检测模块具体用于:
计算待测目标图片与生成图片中的低多样性区域的每个像素值差值的二阶范数平方的平均值,将该平均值作为指示低多样性区域差异的计算结果;
计算待测目标图片与生成图片中的高多样性区域的最大像素值差异和像素值累积差异;当所述最大像素值差异和所述像素值累积差异均不小于各自对应的阈值时,判断待测目标图片高多样性区域异常,其中,
最大像素值差异指示了单张待测目标图片与对应的生成图片的像素值差异的最大值;
像素值累积差异指示了属于同一待测目标的所有目标图片与对应的生成图片的像素值差异的累积值。
10.根据权利要求9所述的基于计算机视觉的异常检测装置,其特征在于,所述训练集生成模块,用于根据目标图片内容的多样性,将目标图片划分为低多样性区域和高多样性区域;
所述检测模块,用于对生成图片和待测目标图片对应的低多样性区域进行差异检测,当检测结果为异常时,停止计算,直接判定待测目标异常;当检测结果为正常时,继续对生成图片和待测目标图片对应的高多样性区域进行差异检测。
11.根据权利要求10所述的基于计算机视觉的异常检测装置,其特征在于,所述检测模块,具体用于:计算待测目标图片和生成图片低多样性区域的像素值差异,若计算结果不小于第一阈值,则判断待测目标图片低多样性区域异常,并停止计算,若计算结果小于第一阈值,则判断待测目标图片低多样性区域正常,继续计算待测目标图片和生成图片高多样性区域的像素值差异,若计算结果不小于第二阈值,则判断待测目标图片高多样性区域异常,若计算结果小于第二阈值,则判断待测目标图片正常。
CN201911258334.8A 2019-12-10 2019-12-10 一种基于计算机视觉的异常检测方法及装置 Active CN111062918B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201911258334.8A CN111062918B (zh) 2019-12-10 2019-12-10 一种基于计算机视觉的异常检测方法及装置
US17/309,306 US12002195B2 (en) 2019-12-10 2020-10-24 Computer vision-based anomaly detection method, device and electronic apparatus
PCT/CN2020/123475 WO2021114896A1 (zh) 2019-12-10 2020-10-24 一种基于计算机视觉的异常检测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911258334.8A CN111062918B (zh) 2019-12-10 2019-12-10 一种基于计算机视觉的异常检测方法及装置

Publications (2)

Publication Number Publication Date
CN111062918A CN111062918A (zh) 2020-04-24
CN111062918B true CN111062918B (zh) 2023-11-21

Family

ID=70300371

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911258334.8A Active CN111062918B (zh) 2019-12-10 2019-12-10 一种基于计算机视觉的异常检测方法及装置

Country Status (3)

Country Link
US (1) US12002195B2 (zh)
CN (1) CN111062918B (zh)
WO (1) WO2021114896A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111062918B (zh) * 2019-12-10 2023-11-21 歌尔股份有限公司 一种基于计算机视觉的异常检测方法及装置
CN114078108B (zh) * 2020-08-11 2023-12-22 北京阅影科技有限公司 图像中异常区域的处理方法、装置和图像分割方法、装置
CN113554605B (zh) * 2021-07-07 2023-09-26 常州大学 一种基于特征匹配的织物异常区域检测方法
CN114612449A (zh) * 2022-03-17 2022-06-10 腾讯科技(深圳)有限公司 图像检测方法、装置、电子设备及存储介质
CN114596308A (zh) * 2022-04-02 2022-06-07 卡奥斯工业智能研究院(青岛)有限公司 基于5g网络的信息处理方法、装置、设备及介质
CN118351284B (zh) * 2024-04-29 2024-09-24 常州机电职业技术学院 工业异源视觉识别系统及方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104458748A (zh) * 2013-09-25 2015-03-25 中国科学院沈阳自动化研究所 基于机器视觉的铝型材表面缺陷检测方法
CN108009628A (zh) * 2017-10-30 2018-05-08 杭州电子科技大学 一种基于生成对抗网络的异常检测方法
CN108961272A (zh) * 2018-07-02 2018-12-07 浙江工业大学 一种基于深度卷积对抗生成网络的皮肤病图像的生成方法
CN109447895A (zh) * 2018-09-03 2019-03-08 腾讯科技(武汉)有限公司 图片生成方法和装置、存储介质及电子装置
CN109461458A (zh) * 2018-10-26 2019-03-12 合肥工业大学 一种基于生成对抗网络的音频异常检测方法
CN109583364A (zh) * 2018-11-27 2019-04-05 上海鹰瞳医疗科技有限公司 图像识别方法及设备
CN109584221A (zh) * 2018-11-16 2019-04-05 聚时科技(上海)有限公司 一种基于监督式生成对抗网络的异常图像检测方法
CN109829895A (zh) * 2019-01-09 2019-05-31 武汉精立电子技术有限公司 一种基于gan的aoi缺陷检测方法
CN109872313A (zh) * 2019-02-15 2019-06-11 苏州晓创光电科技有限公司 一种基于深度卷积自编码器的产品表面缺陷检测方法
CN109949305A (zh) * 2019-03-29 2019-06-28 北京百度网讯科技有限公司 产品表面缺陷检测方法、装置及计算机设备
CN110097543A (zh) * 2019-04-25 2019-08-06 东北大学 基于生成式对抗网络的热轧带钢表面缺陷检测方法
CN110135273A (zh) * 2019-04-19 2019-08-16 中铁第一勘察设计院集团有限公司 接触网视频图像云端智能监测与故障识别方法
CN110211114A (zh) * 2019-06-03 2019-09-06 浙江大学 一种基于深度学习的装箱缺条视觉检测方法
CN110349135A (zh) * 2019-06-27 2019-10-18 歌尔股份有限公司 目标检测方法和装置
CN110490858A (zh) * 2019-08-21 2019-11-22 西安工程大学 一种基于深度学习的织物缺陷像素级分类方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101996308A (zh) * 2009-08-19 2011-03-30 北京中星微电子有限公司 人脸认证方法及系统、人脸模型训练方法及系统
US8705866B2 (en) * 2010-12-07 2014-04-22 Sony Corporation Region description and modeling for image subscene recognition
CN102609680B (zh) 2011-12-22 2013-12-04 中国科学院自动化研究所 一种基于三维深度图像信息的并行统计学习人体部位检测方法
CN103226616A (zh) 2013-05-16 2013-07-31 南京龙渊微电子科技有限公司 一种图像内容检索系统及其图像内容稀疏学习方法
JP6642161B2 (ja) * 2016-03-18 2020-02-05 株式会社リコー 検査装置、検査方法及びプログラム
US10624558B2 (en) * 2017-08-10 2020-04-21 Siemens Healthcare Gmbh Protocol independent image processing with adversarial networks
CN111062918B (zh) * 2019-12-10 2023-11-21 歌尔股份有限公司 一种基于计算机视觉的异常检测方法及装置

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104458748A (zh) * 2013-09-25 2015-03-25 中国科学院沈阳自动化研究所 基于机器视觉的铝型材表面缺陷检测方法
CN108009628A (zh) * 2017-10-30 2018-05-08 杭州电子科技大学 一种基于生成对抗网络的异常检测方法
CN108961272A (zh) * 2018-07-02 2018-12-07 浙江工业大学 一种基于深度卷积对抗生成网络的皮肤病图像的生成方法
CN109447895A (zh) * 2018-09-03 2019-03-08 腾讯科技(武汉)有限公司 图片生成方法和装置、存储介质及电子装置
CN109461458A (zh) * 2018-10-26 2019-03-12 合肥工业大学 一种基于生成对抗网络的音频异常检测方法
CN109584221A (zh) * 2018-11-16 2019-04-05 聚时科技(上海)有限公司 一种基于监督式生成对抗网络的异常图像检测方法
CN109583364A (zh) * 2018-11-27 2019-04-05 上海鹰瞳医疗科技有限公司 图像识别方法及设备
CN109829895A (zh) * 2019-01-09 2019-05-31 武汉精立电子技术有限公司 一种基于gan的aoi缺陷检测方法
CN109872313A (zh) * 2019-02-15 2019-06-11 苏州晓创光电科技有限公司 一种基于深度卷积自编码器的产品表面缺陷检测方法
CN109949305A (zh) * 2019-03-29 2019-06-28 北京百度网讯科技有限公司 产品表面缺陷检测方法、装置及计算机设备
CN110135273A (zh) * 2019-04-19 2019-08-16 中铁第一勘察设计院集团有限公司 接触网视频图像云端智能监测与故障识别方法
CN110097543A (zh) * 2019-04-25 2019-08-06 东北大学 基于生成式对抗网络的热轧带钢表面缺陷检测方法
CN110211114A (zh) * 2019-06-03 2019-09-06 浙江大学 一种基于深度学习的装箱缺条视觉检测方法
CN110349135A (zh) * 2019-06-27 2019-10-18 歌尔股份有限公司 目标检测方法和装置
CN110490858A (zh) * 2019-08-21 2019-11-22 西安工程大学 一种基于深度学习的织物缺陷像素级分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
于科为.基于卷积神经网络的工件缺陷检测研究.信息与电脑(理论版).2018,(第21期),第12-14、17页. *

Also Published As

Publication number Publication date
US20220309635A1 (en) 2022-09-29
WO2021114896A1 (zh) 2021-06-17
CN111062918A (zh) 2020-04-24
US12002195B2 (en) 2024-06-04

Similar Documents

Publication Publication Date Title
CN111062918B (zh) 一种基于计算机视觉的异常检测方法及装置
CN109076198B (zh) 基于视频的对象跟踪遮挡检测系统、方法和设备
CN109870461B (zh) 一种电子元器件质量检测系统
CN103716579B (zh) 视频监控方法及系统
KR101618814B1 (ko) 단일객체에 대한 기울기를 추정하는 영상을 감시하는 장치 및 방법
CN111353506B (zh) 自适应的视线估计方法和设备
US9025875B2 (en) People counting device, people counting method and people counting program
CN104657993B (zh) 一种镜头遮挡检测方法及装置
CN110458157B (zh) 一种电力电缆生产过程智能监控系统
CN104902246A (zh) 视频监视方法和装置
CN110995153B (zh) 一种光伏电站的异常数据检测方法、装置及电子设备
CN104954747A (zh) 视频监视方法和装置
CN110211021B (zh) 图像处理装置、图像处理方法和存储介质
CN111815578A (zh) 图像条纹检测方法、视频监控系统及相关装置
CN115171218A (zh) 一种基于图像识别技术的物资送样异常行为识别系统
CN104657997B (zh) 一种镜头移位检测方法及装置
CN112347818B (zh) 一种视频目标检测模型的困难样本图像筛选方法及装置
KR101581162B1 (ko) 실시간 영상 기반의 화염, 연기 및 물체 움직임 자동 감지 방법, 장치 및 시스템
CN104427210B (zh) 一种随机异常闪烁点检测方法及装置
CN114202797A (zh) 行为识别方法、装置和存储介质
CN117173468A (zh) 集装箱门异开检测方法、装置、电子设备和存储介质
CN112347830A (zh) 一种工厂防疫管理方法以及防疫管理系统
CN110956616A (zh) 一种基于立体视觉的目标检测方法及系统
KR101180965B1 (ko) 차영상을 이용한 클러스터 분석 방법 및 시스템
US11748876B2 (en) Joint surface safety evaluation apparatus

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant