CN113255738A - 一种基于自注意力生成对抗网络的异常图像检测方法 - Google Patents
一种基于自注意力生成对抗网络的异常图像检测方法 Download PDFInfo
- Publication number
- CN113255738A CN113255738A CN202110491567.3A CN202110491567A CN113255738A CN 113255738 A CN113255738 A CN 113255738A CN 202110491567 A CN202110491567 A CN 202110491567A CN 113255738 A CN113255738 A CN 113255738A
- Authority
- CN
- China
- Prior art keywords
- image
- abnormal
- sequence
- self
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 40
- 238000001514 detection method Methods 0.000 title claims abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 abstract description 6
- 230000003042 antagnostic effect Effects 0.000 abstract description 3
- 230000007547 defect Effects 0.000 abstract description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 2
- 230000007246 mechanism Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Abstract
本发明涉及工业自动化技术领域,尤其为一种基于自注意力生成对抗网络的异常图像检测方法,其具体步骤如下:S1,获取待检图像;S2,将待检测图像输入TransGANormaly,并获取异常分数;S3,判断异常分数是否大于某特定阈值,本发明通过设计并且使用自注意力机制替代卷积操作,能够有效地克服卷积操作只能提取局部特征的缺陷,实现更大尺度层面上的特征提取,有效提升模型的异常检测性能,解决了目前需要同时使用正常和异常样本,限制了其应用范围以及目前使用卷积神经网络对图像进行特征提取及编码,卷积操作侧重于局部信息的提取,对于全局信息的把握具有较大局限性,而工业图像中的异常区域的尺度可能比较大,基于卷积操作的方法无法很好地适用的问题。
Description
技术领域
本发明涉及工业自动化技术领域,具体为一种基于自注意力生成对抗网络的异常图像检测方法。
背景技术
异常图像检测是工业自动化领域的一个重要问题。考虑到大多数情况下,异常样本极其稀缺,因此,仅使用正常样本构建检测模型的半监督方法具有较强的实际应用价值,基于生成对抗网络(Generative Adversarial Networ k,GAN)的异常检测方法可以在通过对比原图像与重建图像在隐空间中的特征差异来推断图像是否异常,从而提升其对噪声的抗干扰能力,具有较强的鲁棒性,现有基于GAN的方法,引用专利为一种基于监督式生成对抗网络的异常图像检测方法,申请号为201811368737.3的专利,但是具有两个明显缺陷:1.该方法需要同时使用正常和异常样本,限制了其应用范围;2.该方法使用卷积神经网络对图像进行特征提取及编码,卷积操作侧重于局部信息的提取,对于全局信息的把握具有较大局限性,而工业图像中的异常区域的尺度可能比较大,基于卷积操作的方法无法很好地适用。
综上所述,本发明通过设计一种基于自注意力生成对抗网络的异常图像检测方法来解决存在的问题。
发明内容
本发明的目的在于提供一种基于自注意力生成对抗网络的异常图像检测方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于自注意力生成对抗网络的异常图像检测方法,其具体步骤如下:
S1,获取待检图像;
S2,将待检测图像输入TransGANormaly,并获取异常分数;
S3,判断异常分数是否大于某特定阈值,若是,则认为该待检图像为异常图像,若不是,则认为其为正常图像。
作为本发明优选的方案,所述S2中TransGANormaly主要包括生成器(G)、判别器(D)及编码器(E),其中生成器包括一个编码器(GE)和一个解码器(GD),所述上述部件均是基于自注意力层构建,完全没有使用卷积层,并且其模型训练流程具体如下:
S22,使用编码器获取原始图像的特征嵌入Em(I)∈RN×D;
S24,使用编码器获取重构图像的特征嵌入Em′(I)∈RN×D,编码器与S22中完全一致,且二者共享参数;
S25,将S21和S23的一维图像序列输入到判别器中,判断其来源于原始图像还是重构图像,其操作同步骤S22,但二者不共享参数,并且训练的损失函数包括四个:
(1)对抗损失:
(2)重构损失:
(3)编码损失:
(4)总损失为:
L=λadvLadv+λrecLrec+λencLenc
其中,X代表正常样本的分布,λadv、λrec、λenc为超参,用于平衡各个不同的损失函数。
TransGANormaly通过L的反向传播更新参数,并完成模型训练;
TransGANormaly的测试过程,异常分数计算公式为:
作为本发明优选的方案,所述S22中使用编码器获取原始图像的特征嵌入Em(I)∈RN×D,具体操作步骤如下:
a)使用多层感知机将各一维图像序列变换为长度为D的特征序列;
b)引入长度为D的位置编码,并将其以逐元素求和的方式叠加到上述特征序列中,获取带位置信息的特征序列;
c)将带位置信息的特征序列输入到Transformer编码器中,获取原始图像的特征嵌入Em(I)∈RN×D。
与现有技术相比,本发明的有益效果是:
1、本发明中,通过设计并且使用自注意力机制(Self-Attention)替代卷积操作,能够有效地克服卷积操作只能提取局部特征的缺陷,实现更大尺度层面上的特征提取,有效提升模型的异常检测性能,解决了目前需要同时使用正常和异常样本,限制了其应用范围以及目前使用卷积神经网络对图像进行特征提取及编码,卷积操作侧重于局部信息的提取,对于全局信息的把握具有较大局限性,而工业图像中的异常区域的尺度可能比较大,基于卷积操作的方法无法很好地适用的问题。
附图说明
图1为本发明训练流程结构示意图;
图2为本发明预处理结构示意图;
图3为本发明编码器结构示意图;
图4为本发明解码器结构示意图;
图5为本发明测试流程结构示意图。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述,给出了本发明的若干实施例,但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例,相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件,当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件,本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同,本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明,本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
请参阅图1-5,本发明提供一种技术方案:
一种基于自注意力生成对抗网络的异常图像检测方法,其具体步骤如下:
S1,获取待检图像;
S2,将待检测图像输入TransGANormaly,并获取异常分数;
S3,判断异常分数是否大于某特定阈值,若是,则认为该待检图像为异常图像,若不是,则认为其为正常图像。
具体实施案例
步骤1,获取待检图像;
步骤2,将待检测图像输入TransGANormaly,并获取异常分数;
步骤3,判断异常分数是否大于某特定阈值,若是,则认为该待检图像为异常图像,若不是,则认为其为正常图像.
其中步骤2中TransGANormaly主要包括生成器(G)、判别器(D)及编码器(E),其中生成器包括一个编码器(GE)和一个解码器(GD),所述上述部件均是基于自注意力层构建,完全没有使用卷积层,并且其模型训练流程具体如下:
步骤22,使用编码器获取原始图像的特征嵌入Em(I)∈RN×D,具体操作如图3所示:
a)使用多层感知机将各一维图像序列变换为长度为D的特征序列;
b)引入长度为D的位置编码,并将其以逐元素求和的方式叠加到上述特征序列中,获取带位置信息的特征序列;
c)将带位置信息的特征序列输入到Transformer编码器中,获取原始图像的特征嵌入Em(I)∈RN×D。
步骤24,使用编码器获取重构图像的特征嵌入Em′(I)∈RN×D,编码器与步骤22中完全一致,且二者共享参数。
步骤25,将步骤21和步骤23的一维图像序列输入到判别器中,判断其来源于原始图像还是重构图像,其操作同步骤22,但二者不共享参数。
训练的损失函数包括四个:
(1)对抗损失:
(2)重构损失:
(3)编码损失:
(4)总损失为:
L=λadvLadv+λrecLrec+λencLenc
其中,X代表正常样本的分布,λadv、λrec、λenc为超参,用于平衡各个不同的损失函数;
TransGANormaly通过L的反向传播更新参数,并完成模型训练。
TransGANormaly的测试过程如图5,异常分数计算公式为:
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (5)
1.一种基于自注意力生成对抗网络的异常图像检测方法,其具体步骤如下:
S1,获取待检图像;
S2,将待检测图像输入TransGANormaly,并获取异常分数;
S3,判断异常分数是否大于某特定阈值,若是,则认为该待检图像为异常图像,若不是,则认为其为正常图像。
2.根据权利要求1所述的一种基于自注意力生成对抗网络的异常图像检测方法,其特征在于:所述S2中TransGANormaly主要包括生成器(G)、判别器(D)及编码器(E),其中生成器包括一个编码器(GE)和一个解码器(GD),所述上述部件均是基于自注意力层构建,完全没有使用卷积层,并且其模型训练流程具体如下:
S22,使用编码器获取原始图像的特征嵌入Em(I)∈RN×D;
S24,使用编码器获取重构图像的特征嵌入Em′(I)∈RN×D,编码器与S22中完全一致,且二者共享参数;
S25,将S21和S23的一维图像序列输入到判别器中,判断其来源于原始图像还是重构图像,其操作同步骤S22,但二者不共享参数,并且训练的损失函数包括四个:
(1)对抗损失:
(2)重构损失:
(3)编码损失:
(4)总损失为:
L=λadvLadv+λrecLrec+λencLenc
其中,X代表正常样本的分布,λadv、λrec、λenc为超参,用于平衡各个不同的损失函数。
TransGANormaly通过L的反向传播更新参数,并完成模型训练;
TransGANormaly的测试过程,异常分数计算公式为:
4.根据权利要求2所述的一种基于自注意力生成对抗网络的异常图像检测方法,其特征在于:所述S22中使用编码器获取原始图像的特征嵌入Em(I)∈RN×D,具体操作步骤如下:
a)使用多层感知机将各一维图像序列变换为长度为D的特征序列;
b)引入长度为D的位置编码,并将其以逐元素求和的方式叠加到上述特征序列中,获取带位置信息的特征序列;
c)将带位置信息的特征序列输入到Transformer编码器中,获取原始图像的特征嵌入Em(I)∈RN×D。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110491567.3A CN113255738A (zh) | 2021-05-06 | 2021-05-06 | 一种基于自注意力生成对抗网络的异常图像检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110491567.3A CN113255738A (zh) | 2021-05-06 | 2021-05-06 | 一种基于自注意力生成对抗网络的异常图像检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113255738A true CN113255738A (zh) | 2021-08-13 |
Family
ID=77223702
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110491567.3A Pending CN113255738A (zh) | 2021-05-06 | 2021-05-06 | 一种基于自注意力生成对抗网络的异常图像检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113255738A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114611409A (zh) * | 2022-03-25 | 2022-06-10 | 国网江苏省电力有限公司泰州供电分公司 | 一种配电终端异常检测模型的建立方法及装置 |
CN114913148A (zh) * | 2022-05-11 | 2022-08-16 | 武汉象点科技有限公司 | 基于无监督学习的丝印疵点检测方法、装置及存储介质 |
CN114943641A (zh) * | 2022-07-26 | 2022-08-26 | 北京航空航天大学 | 基于模型共享结构的对抗纹理图像生成方法和装置 |
WO2023184918A1 (zh) * | 2022-03-31 | 2023-10-05 | 苏州浪潮智能科技有限公司 | 一种图像异常检测方法、装置、系统及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584221A (zh) * | 2018-11-16 | 2019-04-05 | 聚时科技(上海)有限公司 | 一种基于监督式生成对抗网络的异常图像检测方法 |
CN110147323A (zh) * | 2019-04-24 | 2019-08-20 | 北京百度网讯科技有限公司 | 一种基于生成对抗网络的变更智能检查方法及装置 |
CN111260620A (zh) * | 2020-01-14 | 2020-06-09 | 三峡大学 | 图像异常检测方法、装置和电子设备 |
WO2020168731A1 (zh) * | 2019-02-19 | 2020-08-27 | 华南理工大学 | 一种基于生成对抗机制与注意力机制的标准人脸生成方法 |
CN111767475A (zh) * | 2020-03-20 | 2020-10-13 | 吉利汽车研究院(宁波)有限公司 | 一种目标行人轨迹预测模型训练方法、装置、电子设备及存储介质 |
CN112508862A (zh) * | 2020-11-19 | 2021-03-16 | 电子科技大学 | 一种通过改进gan增强裂纹磁光图像的方法 |
-
2021
- 2021-05-06 CN CN202110491567.3A patent/CN113255738A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584221A (zh) * | 2018-11-16 | 2019-04-05 | 聚时科技(上海)有限公司 | 一种基于监督式生成对抗网络的异常图像检测方法 |
WO2020168731A1 (zh) * | 2019-02-19 | 2020-08-27 | 华南理工大学 | 一种基于生成对抗机制与注意力机制的标准人脸生成方法 |
CN110147323A (zh) * | 2019-04-24 | 2019-08-20 | 北京百度网讯科技有限公司 | 一种基于生成对抗网络的变更智能检查方法及装置 |
CN111260620A (zh) * | 2020-01-14 | 2020-06-09 | 三峡大学 | 图像异常检测方法、装置和电子设备 |
CN111767475A (zh) * | 2020-03-20 | 2020-10-13 | 吉利汽车研究院(宁波)有限公司 | 一种目标行人轨迹预测模型训练方法、装置、电子设备及存储介质 |
CN112508862A (zh) * | 2020-11-19 | 2021-03-16 | 电子科技大学 | 一种通过改进gan增强裂纹磁光图像的方法 |
Non-Patent Citations (1)
Title |
---|
马力: "《结合自注意力机制的进化GAN人脸图像生成》", 西安邮电大学学报, pages 172 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114611409A (zh) * | 2022-03-25 | 2022-06-10 | 国网江苏省电力有限公司泰州供电分公司 | 一种配电终端异常检测模型的建立方法及装置 |
CN114611409B (zh) * | 2022-03-25 | 2024-02-02 | 国网江苏省电力有限公司泰州供电分公司 | 一种配电终端异常检测模型的建立方法及装置 |
WO2023184918A1 (zh) * | 2022-03-31 | 2023-10-05 | 苏州浪潮智能科技有限公司 | 一种图像异常检测方法、装置、系统及可读存储介质 |
CN114913148A (zh) * | 2022-05-11 | 2022-08-16 | 武汉象点科技有限公司 | 基于无监督学习的丝印疵点检测方法、装置及存储介质 |
CN114943641A (zh) * | 2022-07-26 | 2022-08-26 | 北京航空航天大学 | 基于模型共享结构的对抗纹理图像生成方法和装置 |
CN114943641B (zh) * | 2022-07-26 | 2022-10-28 | 北京航空航天大学 | 基于模型共享结构的对抗纹理图像生成方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113255738A (zh) | 一种基于自注意力生成对抗网络的异常图像检测方法 | |
CN109000930B (zh) | 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法 | |
CN109801230B (zh) | 一种基于编码器结构的图像修复方法 | |
Ferris et al. | Tensor networks and quantum error correction | |
CN106210748A (zh) | Hevc视频编码中的逻辑帧内模式命名 | |
CN104010193B (zh) | 基于宏块划分方式扰动的视频隐写方法 | |
CN110866604A (zh) | 一种电力变压器状态监测数据的清洗方法 | |
CN110334478B (zh) | 机器设备异常检测模型构建方法、检测方法及模型 | |
CN111914705A (zh) | 提升电抗器健康状态评估准确率的信号生成方法及装置 | |
CN114970774B (zh) | 一种智能变压器故障预测方法和装置 | |
CN106127667A (zh) | 一种jpeg图像自适应隐写方法 | |
CN112465798B (zh) | 一种基于生成对抗网络和记忆模块的异常检测方法 | |
CN113705424A (zh) | 基于时间卷积降噪网络的演艺装备故障诊断模型构建方法 | |
CN107292315B (zh) | 基于多尺度ltp特征的隐写分析方法和隐写分析装置 | |
CN113744153A (zh) | 双分支图像修复伪造检测方法、系统、设备及存储介质 | |
CN114487673A (zh) | 一种基于Transformer的电力设备故障检测模型和电子设备 | |
CN106169189A (zh) | 基于嵌入量双层最优分配比的stc编码方法 | |
CN117057394A (zh) | 一种图异常检测系统构建方法、图异常检测系统及方法 | |
Wang et al. | Cover selection for steganography using image similarity | |
CN116979970A (zh) | 一种漏磁数据的压缩和重构方法、系统、电子设备及介质 | |
CN116484192A (zh) | 一种无监督异配异质图的异常节点检测方法 | |
CN115174178B (zh) | 基于生成对抗网络的半监督网络流量异常检测方法 | |
CN115733673A (zh) | 一种基于多尺度残差分类器的数据异常检测方法 | |
CN115345192A (zh) | 一种变工况和复杂噪音环境下滚动轴承的故障诊断方法 | |
CN114630207A (zh) | 基于降噪自编码器的多传感节点感知数据收集方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |