CN112561383A - 一种基于生成对抗网络的实时异常检测方法 - Google Patents
一种基于生成对抗网络的实时异常检测方法 Download PDFInfo
- Publication number
- CN112561383A CN112561383A CN202011547340.8A CN202011547340A CN112561383A CN 112561383 A CN112561383 A CN 112561383A CN 202011547340 A CN202011547340 A CN 202011547340A CN 112561383 A CN112561383 A CN 112561383A
- Authority
- CN
- China
- Prior art keywords
- data
- time
- real
- network
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 79
- 230000002159 abnormal effect Effects 0.000 claims abstract description 96
- 238000012549 training Methods 0.000 claims abstract description 84
- 238000004519 manufacturing process Methods 0.000 claims abstract description 65
- 238000011897 real-time detection Methods 0.000 claims abstract description 14
- 238000004140 cleaning Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000010992 reflux Methods 0.000 claims abstract description 4
- 238000000034 method Methods 0.000 claims description 35
- 238000013528 artificial neural network Methods 0.000 claims description 29
- 230000008569 process Effects 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002547 anomalous effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/219—Managing data history or versioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明涉及一种基于生成对抗网络的实时异常检测方法,其中,包括:离线训练和实时检测;离线训练包括:将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,对抗网络模型生成异常数据并进行鉴别检测,训练完成后将对抗网络模型部署到实时检测环境;实时检测包括:从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到对抗网络模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。
Description
技术领域
本发明涉及数据监督检测技术,特别涉及一种基于生成对抗网络的实时异常检测方法。
背景技术
基于生产线采集的时序过程数据对产品质量的异常做预测和判断的机器学习方法,已经在生产制造企业得到了广泛应用。
通过数据标注方式可以将这些方法归类为三种:
有监督异常检测方法,首先将产线数据标注为正常和异常两种类别,再使用经过标注的产线数据输入神经网络或随机森林等有监督机器学习模型做训练,然后使用模型对新采集的产线数据做预测。中国专利“异常指标检测方法、装置、计算机设备和存储介质”中,通过聚类筛选和人工标注的方式对正常、异常数据分别进行标注,然后将标注数据输入到循环神经网络模型进行训练,实施中通过无监督方法对异常数据进行预筛选,再使用循环神经网络有模型的有监督方法对异常情况进行预测。
无监督异常检测方法,常用无监督方法有基于密度的方法和基于聚类的方法等,将产线数据表示为多维空间的数据点,通过判断特定数据点与其它数据点的距离关系,判断数据的异常情况。中国专利“一种利用时序聚类算法实现故障检测的方法”提供了一种使用DBSCAN聚类算法对故障进行无监督检测的方法,对时序数据计算聚类后的异常分数值,根据异常分数值是否超过阈值判断是否存在异常。
半监督异常检测方法,适用于历史数据没有异常数据,或只包含极少异常数据的情况,只使用正常数据输入模型进行训练。中国专利“一种基于生成对抗网络的异常检测方法”提供了一种通过生成对抗网络模型对异常图像进行检测的方法,将真实图像输入到模型,模型的生产网络部分基于真实图像生成异常图像,模型的鉴别网络部分对图像判断是否存在异常。
有监督异常检测方法需要比较多的标注数据对模型进行训练,由于在制造业生产线中,异常数据通常较为稀少,且标注数据需要专业知识,标注成本较高,在很多产线质量异常检测的实际应用时,只会有很少的标注数据,或者甚至没有异常数据,有监督方法难以找到足够的数据对模型进行训练,无法有效识别异常数据。
无监督异常检测方法中对特定场景的先验参数通常难易确定,容易造成算法偏差,很多无监督方法需要人工确定类别个数或者类别间距离阈值,在只有正常数据的情况下,无监督方法难以发挥作用。
半监督异常检测方法,在通过正常数据生成异常数据时,产线的训练数据通常无法覆盖正常数据的完整数据分布。在使用历史数据训练完成后,产线数据经常有新的变化,半监督模型受限于历史数据,容易将正常数据误检测为异常数据。
发明内容
本发明的目的在于提供一种基于生成对抗网络的实时异常检测方法,用于有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。
本发明一种基于生成对抗网络的实时异常检测方法,其中,包括:离线训练和实时检测;离线训练包括:将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,对抗网络模型生成异常数据并进行鉴别检测,训练完成后将对抗网络模型部署到实时检测环境;实时检测包括:从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到对抗网络模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,离线训练具体包括:从生产设备采集实时数据;从生产设备的传感器实时采集过程数据以及生产结果数据;将采集的数据存储到历史数据库;对历史数据进行数据清洗,清洗为适合输入模型的数据格式。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,过程数据包括:转速、温度以及每一生产步骤持续时长。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,数据清洗具体包括:(1)将时序数据按时间排序;(2)去除重复数据;(3)补全缺失数据;(4)进行数据转换,对于生产数据特征,根据生产经验或者依据特征和产品质量的单调区间变化,进行阈值划分;(5)对生产数据进行数据特征间的组合,并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后,一起输入到由全连接神经网络构成的编码器。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,训练生成对抗网络模型包括:将训练数据输入对抗网络模型,通过生成网络生成异常数据,并与正常数据一起输入到鉴别网络进行有监督训练,生成对抗网络模型;训练数据是由生产数据经过数据处理后生成的数据集,初始训练数据由正常数据组成。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,在训练生成对抗网络模型过程中,将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布;后将训练数据中时间步1和时间步2的数据字段输入到生成网络,输出为预测时间步3的数据字段;将原始时间步1、时间步2的数据字段和预测得到的时间步3数据做拼接,异常数据标签值设置为1,作为异常数据输入鉴别网络,对鉴别网络做训练;鉴别网络经过梯度下降对网络参数权重做调整,并将梯度传播到生成网络,对生成网络做调整,以生成更难以区分的异常数据。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,在对抗网络模型中的神经网络类型选取全连接神经网络作为基础结构。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,异常检测包括:
使用生成对抗网络模型进行异常检测;
将数据输入到对抗网络模型的鉴别网络部分,对数据进行异常检测,实时的生产数据与训练数据相比缺少标签数据,对一个由3层神经网络构成的鉴别网络,其中第i层第j个神经元的计算公式为其中x为生产数据中各时间步的数据字段,w为已训练收敛的网络权重,y为单个神经网络节点的输出数据;第i层神经网络的输出数据,构成第i+1层神经网络的输入数据;最后一层为单个神经网络节点,取大于阈值m的输出数据为异常数据,小于等于阈值m的输出数据为正常数据;
将检测为正常的数据回流到对抗网络模型进行增量训练;
首先将正常数据加上标签数据,在最后补上标签字段0,表示数据为正常数据,将增量正常训练数据输入到鉴别网络进行训练和参数更新;然后将正常数据的前两个时间步数据提取,输入到生成网络,预测输出第三个时间步的数据字段,与前两个时间步数据拼接后,生成新的异常数据;并将异常数据,输入鉴别网络进行训练和参数更新。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,阈值a为0.5。
根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例,其中,检测为异常的数据触发异常报警,异常数据回流到对抗网络模型进行增量训练。
本发明的提出一种在只有正常数据的情况下,实时对训练完成的半监督模型进行更新,不断增加模型异常检测能力的异常检测方法。
本发明使用了对抗生成网络的半监督异常检测方式:使用生成网络生成异常数据,将鉴别网络训练为识别正常数据和异常数据的二分类有监督异常检测模型,避免了有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。
附图说明
图1为本发明整体方案流程图;
图2为生成对抗网络模型架构图。
具体实施方式
为使本发明的目的、内容、和优点更加清楚,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。
本发明分为离线训练和实时检测两个部分,整体方案流程图如图1所示。离线部分首先将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,模型自主生成异常数据并进行鉴别检测,训练完成后将模型部署到实时检测环境。
实时检测部分首先从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。
离线训练流程主要分为如下几个部分:
从生产设备采集实时数据
从生产设备的传感器实时采集转速、温度、每一生产步骤持续时长等过程数据,以及产品性状等生产结果数据。
将实时数据存储到历史数据库;
对历史数据进行数据清洗;
将数据清洗为适合输入模型的数据格式。主要包括以下方面:
(1)将时序数据按时间排序;
(2)去除重复数据;
(3)补全缺失数据;
(4)数据转换,如数值类型数据做归一化,类别数据转换为枚举数据等。对于转速、温度等生产数据特征,可根据生产经验,或者依据特征和产品质量的单调区间变化,进行阈值划分。如某种产品的生产中,温度小于10摄氏度时,产品质量随着温度升高而提升;温度大于100摄氏度时,产品质量随温度升高而降低;温度位于10到100摄氏度区间时,产品质量保持一定。可将温度的生产数据特征划分为温度小于10摄氏度、温度位于10到100摄氏度之间、温度大于100摄氏度等三个类别的枚举数据,当生产数据中温度为50摄氏度时,温度小于10摄氏度和温度大于100摄氏度的枚举类别数据值为0,温度位于10到100摄氏度之间的枚举类别数据值为1;
(5)数据特征组合。生产数据属于离散数据,且产品质量通常会依赖于生产数据特征的组合,如温度位于10到100摄氏度的区间且转速大于8000转/分时,产品质量较好。基于生产数据的这些特性,首先对生产数据进行数据特征间的组合,并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后,一起输入到由全连接神经网络构成的编码器。
训练生成对抗网络模型,将训练数据输入模型,通过生成网络生成异常数据,并与正常数据一起输入到鉴别网络进行有监督训练。生成对抗网络模型架构图如图2所示。
其中训练数据是由生产数据经过数据处理后生成的数据集。初始训练数据由正常数据组成,设定时间序列为3,即每条训练数据由3个时间步的生产数据组成。如经过数据清洗和特征组合之后的训练数据字段为:【时间1】温度小于10摄氏度、【时间1】温度位于10到100摄氏度之间、【时间1】温度大于100摄氏度、【时间1】转速小于等于8000转/分、【时间1】转速大于8000转/分、【时间1】温度位于10到100摄氏度的区间且转速大于8000转/分、【时间2】温度小于10摄氏度、【时间2】温度位于10到100摄氏度之间、【时间2】温度大于100摄氏度、【时间2】转速小于等于8000转/分、【时间2】转速大于8000转/分、【时间2】温度位于10到100摄氏度的区间且转速大于8000转/分、【时间3】温度小于10摄氏度、【时间3】温度位于10到100摄氏度之间、【时间1】温度大于100摄氏度、【时间3】转速小于等于8000转/分、【时间3】转速大于8000转/分、【时间3】温度位于10到100摄氏度的区间且转速大于8000转/分、【标签】是否异常数据;一条训练数据的值为[0 1 0 0 1 1 0 1 0 0 1 1 0 1 0 0 1 1 0],其中每一位为对应字段的取值,如第二位取值为1意义为在时间步1生产过程温度位于10到100摄氏度之间,最后一位取值为0意义为此条训练数据不是异常数据。
在训练过程中,首先将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布;然后将训练数据中时间步1和时间步2的数据字段输入到生成网络,输出为预测时间步3的数据字段,如输入数据为[0 1 0 0 1 1 0 1 0 0 1 1],经过神经网络计算后输出为[0 0 1 0 0 0];将原始时间步1、时间步2的数据字段,和预测得到的时间步3数据做拼接,异常数据标签值设置为1,作为异常数据输入鉴别网络,对鉴别网络做训练;鉴别网络经过梯度下降对网络参数权重做调整,并将梯度传播到生成网络,对生成网络做调整,以生成更难以区分的异常数据,加强后续生成网络对异常数据的生成能力,和鉴别网络对异常数据的检测能力。
在模型中神经网络类型的选取上,由于生产数据中各种数据特征的位置可以随意排列,通常不存在明显的局部特征,通过共享局部特征进行学习的卷积神经网络不适用于生产数据的训练;由于生产系统对响应延时要求较高,不选用训练和检测时间依赖于时间序列长度的循环神经网络;同时由于产品质量常依赖于多种数据特征的组合,选用全连接神经网络作为模型中的基础结构。
在神经网络优化器的选取上,为了加速训练的收敛速度,同时适应在生成过程中的增量训练,选用适用于在线学习的FTRL技术作为神经网络的优化器。FTRL是一种优化的梯度更新技术,能根据线上实时反馈的数据,快速训练调整模型参数,使模型及时反映线上的数据变化,从而提高模型的效果。
部署完成训练的模型到实时检测环境;
实时检测流程主要分为如下几个部分:
1、从生产设备采集实时数据
从生产设备的传感器实时采集转速、温度、每一生产步骤持续时长等过程数据,以及产品性状等生产结果数据。
2、对实时数据进行数据清洗
使用和对历史数据完全一致的数据清洗方式。
使用生成对抗网络模型进行异常检测;
将数据输入到模型的鉴别网络部分,对数据进行异常检测。实时的生产数据与训练数据相比,也是由3个时间步组成的数据字段,但是缺少标签数据,如[0 1 0 0 1 1 0 10 0 1 1 0 1 0 0 1 1],其中每个数值字段表示温度范围特征、转速范围特征及温度和转速的组合特征。对一个由3层神经网络构成的鉴别网络,其中第i层第j个神经元的计算公式为其中x为生产数据中各时间步的数据字段,w为已训练收敛的网络权重,y为单个神经网络节点的输出数据。第i层神经网络的输出数据,构成第i+1层神经网络的输入数据。最后一层为单个神经网络节点,取大于阈值0.5的输出数据为异常数据,小于等于阈值0.5的输出数据为正常数据。
将检测为正常的数据回流到模型进行增量训练;
首先将正常数据加上标签数据,如正常三个时间步的生成数据为[0 1 0 0 1 1 01 0 0 1 1],在最后补上标签字段0,表示数据为正常数据,将增量正常训练数据[0 1 0 01 1 0 1 0 0 1 1 0]输入到鉴别网络进行训练和参数更新;然后将正常数据的前两个时间步数据提取,输入到生成网络,预测输出时间步3的数据字段,与前两个时间步数据拼接后,生成新的异常数据;并将异常数据,输入鉴别网络进行训练和参数更新。
检测为异常的数据触发异常报警;
人工处理报警数据;
异常数据回流到模型进行增量训练;
将异常数据输入到生成对抗网络模型的鉴别网络部分,进行增量训练。
本发明使用了对抗生成网络的半监督异常检测方式:使用生成网络生成异常数据,将鉴别网络训练为识别正常数据和异常数据的二分类有监督异常检测模型,避免了有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。使用实时数据对模型进行实时增量更新:通过将检测过的数据回流输入到模型进行增量训练,实现模型的实时更新,增强了模型检测数据的有效范围,避免了数据随时间变化对模型的扰动问题。
本发明提出的技术方案在只有正常数据的异常检测场景下,实现了对半监督模型的实时更新。在这种方法中,我们使用对抗生成网络模型中的生成网络生成异常数据,输入到鉴别网络进行有监督学习,避免了有监督异常检测方法和无监督异常检测方法无法应用到没有异常训练数据场景的问题。同时,我们使用实时数据对生成对抗网络模型做实时增量更新,避免了半监督学习受限于历史训练数据,对新数据无法做出有效异常检测的问题。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (10)
1.一种基于生成对抗网络的实时异常检测方法,其特征在于,包括:
离线训练和实时检测;
离线训练包括:
将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型,对抗网络模型生成异常数据并进行鉴别检测,训练完成后将对抗网络模型部署到实时检测环境;
实时检测包括:
从生产设备采集实时数据,并同步将数据存储到历史数据库,实时数据经过数据清洗后,输入到生成对抗网络模型进行异常检测;当检测结果为正常时,将实时数据标注为正常数据,并回流输入到对抗网络模型进行增量训练;当检测结果为异常时,触发异常报警,等待人工处理,确认为异常结果时,将实时数据标注为异常数据,并回流到模型的鉴别网络部分进行增量训练。
2.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,离线训练具体包括:
从生产设备采集实时数据;
从生产设备的传感器实时采集过程数据以及生产结果数据;
将采集的数据存储到历史数据库;
对历史数据进行数据清洗,清洗为适合输入模型的数据格式。
3.如权利要求2所述的基于生成对抗网络的实时异常检测方法,其特征在于,过程数据包括:转速、温度以及每一生产步骤持续时长。
4.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,数据清洗具体包括:
(1)将时序数据按时间排序;
(2)去除重复数据;
(3)补全缺失数据;
(4)进行数据转换,对于生产数据特征,根据生产经验或者依据特征和产品质量的单调区间变化,进行阈值划分;
(5)对生产数据进行数据特征间的组合,并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后,一起输入到由全连接神经网络构成的编码器。
5.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,训练生成对抗网络模型包括:
将训练数据输入对抗网络模型,通过生成网络生成异常数据,并与正常数据一起输入到鉴别网络进行有监督训练,生成对抗网络模型;
训练数据是由生产数据经过数据处理后生成的数据集,初始训练数据由正常数据组成。
6.如权利要求5所述的基于生成对抗网络的实时异常检测方法,其特征在于,在训练生成对抗网络模型过程中,将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布;后将训练数据中时间步1和时间步2的数据字段输入到生成网络,输出为预测时间步3的数据字段;将原始时间步1、时间步2的数据字段和预测得到的时间步3数据做拼接,异常数据标签值设置为1,作为异常数据输入鉴别网络,对鉴别网络做训练;鉴别网络经过梯度下降对网络参数权重做调整,并将梯度传播到生成网络,对生成网络做调整,以生成更难以区分的异常数据。
7.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,在对抗网络模型中的神经网络类型选取全连接神经网络作为基础结构。
8.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,异常检测包括:
使用生成对抗网络模型进行异常检测;
将数据输入到对抗网络模型的鉴别网络部分,对数据进行异常检测,实时的生产数据与训练数据相比缺少标签数据,对一个由3层神经网络构成的鉴别网络,其中第i层第j个神经元的计算公式为其中x为生产数据中各时间步的数据字段,w为已训练收敛的网络权重,y为单个神经网络节点的输出数据;第i层神经网络的输出数据,构成第i+1层神经网络的输入数据;最后一层为单个神经网络节点,取大于阈值m的输出数据为异常数据,小于等于阈值m的输出数据为正常数据;
将检测为正常的数据回流到对抗网络模型进行增量训练;
首先将正常数据加上标签数据,在最后补上标签字段0,表示数据为正常数据,将增量正常训练数据输入到鉴别网络进行训练和参数更新;然后将正常数据的前两个时间步数据提取,输入到生成网络,预测输出第三个时间步的数据字段,与前两个时间步数据拼接后,生成新的异常数据;并将异常数据,输入鉴别网络进行训练和参数更新。
9.如权利要求8所述的基于生成对抗网络的实时异常检测方法,其特征在于,阈值a为0.5。
10.如权利要求1所述的基于生成对抗网络的实时异常检测方法,其特征在于,检测为异常的数据触发异常报警,异常数据回流到对抗网络模型进行增量训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011547340.8A CN112561383A (zh) | 2020-12-24 | 2020-12-24 | 一种基于生成对抗网络的实时异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011547340.8A CN112561383A (zh) | 2020-12-24 | 2020-12-24 | 一种基于生成对抗网络的实时异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112561383A true CN112561383A (zh) | 2021-03-26 |
Family
ID=75032452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011547340.8A Pending CN112561383A (zh) | 2020-12-24 | 2020-12-24 | 一种基于生成对抗网络的实时异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112561383A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113114673A (zh) * | 2021-04-12 | 2021-07-13 | 西北工业大学 | 一种基于生成对抗网络的网络入侵检测方法及系统 |
CN113435258A (zh) * | 2021-06-06 | 2021-09-24 | 西安电子科技大学 | 转子系统异常智能检测方法、系统、计算机设备、终端 |
CN113570566A (zh) * | 2021-07-22 | 2021-10-29 | 深圳市人工智能与机器人研究院 | 一种产品外观缺陷发展性认知检测方法及相关装置 |
CN113645231A (zh) * | 2021-08-10 | 2021-11-12 | 北京易通信联科技有限公司 | 工业控制系统的入侵检测方法、存储器和处理器 |
CN115589608A (zh) * | 2022-12-05 | 2023-01-10 | 合肥工业大学 | 物联网数据异常检测模型训练方法、异常检测方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779069A (zh) * | 2016-12-08 | 2017-05-31 | 国家电网公司 | 一种基于神经网络的异常用电检测方法 |
CN108009628A (zh) * | 2017-10-30 | 2018-05-08 | 杭州电子科技大学 | 一种基于生成对抗网络的异常检测方法 |
CN110598851A (zh) * | 2019-08-29 | 2019-12-20 | 北京航空航天大学合肥创新研究院 | 一种融合lstm和gan的时间序列数据异常检测方法 |
-
2020
- 2020-12-24 CN CN202011547340.8A patent/CN112561383A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106779069A (zh) * | 2016-12-08 | 2017-05-31 | 国家电网公司 | 一种基于神经网络的异常用电检测方法 |
CN108009628A (zh) * | 2017-10-30 | 2018-05-08 | 杭州电子科技大学 | 一种基于生成对抗网络的异常检测方法 |
CN110598851A (zh) * | 2019-08-29 | 2019-12-20 | 北京航空航天大学合肥创新研究院 | 一种融合lstm和gan的时间序列数据异常检测方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113114673A (zh) * | 2021-04-12 | 2021-07-13 | 西北工业大学 | 一种基于生成对抗网络的网络入侵检测方法及系统 |
CN113435258A (zh) * | 2021-06-06 | 2021-09-24 | 西安电子科技大学 | 转子系统异常智能检测方法、系统、计算机设备、终端 |
CN113435258B (zh) * | 2021-06-06 | 2024-04-23 | 西安电子科技大学 | 转子系统异常智能检测方法、系统、计算机设备、终端 |
CN113570566A (zh) * | 2021-07-22 | 2021-10-29 | 深圳市人工智能与机器人研究院 | 一种产品外观缺陷发展性认知检测方法及相关装置 |
CN113570566B (zh) * | 2021-07-22 | 2024-03-19 | 深圳市人工智能与机器人研究院 | 一种产品外观缺陷发展性认知检测方法及相关装置 |
CN113645231A (zh) * | 2021-08-10 | 2021-11-12 | 北京易通信联科技有限公司 | 工业控制系统的入侵检测方法、存储器和处理器 |
CN115589608A (zh) * | 2022-12-05 | 2023-01-10 | 合肥工业大学 | 物联网数据异常检测模型训练方法、异常检测方法和系统 |
CN115589608B (zh) * | 2022-12-05 | 2023-03-07 | 合肥工业大学 | 物联网数据异常检测模型训练方法、异常检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112561383A (zh) | 一种基于生成对抗网络的实时异常检测方法 | |
US11204602B2 (en) | Early anomaly prediction on multi-variate time series data | |
CN111475804A (zh) | 一种告警预测方法及系统 | |
CN111860897A (zh) | 一种异常检测方法、装置、设备及计算机可读存储介质 | |
EP3552067B1 (en) | Methods and systems for discovery of prognostic subsequences in time series | |
CN104598984B (zh) | 一种基于模糊神经网络的故障预测方法 | |
Charbonnier et al. | A weighted dissimilarity index to isolate faults during alarm floods | |
CN110247910A (zh) | 一种异常流量的检测方法、系统及相关组件 | |
CN111488946A (zh) | 基于信息融合的雷达伺服系统故障诊断方法 | |
KR20230030542A (ko) | 랜덤 컷 포레스트 알고리즘을 이용한 ai 기반의 설비 데이터 이상 감지 시스템과 그 방법 | |
US20230221684A1 (en) | Explaining Machine Learning Output in Industrial Applications | |
Alfarizi et al. | An extreme gradient boosting aided fault diagnosis approach: A case study of fuse test bench | |
CN115496384A (zh) | 工业设备的监控管理方法、装置和计算机设备 | |
Yu et al. | Morstreaming: A multioutput regression system for streaming data | |
Park | Anomaly pattern detection on data streams | |
CN117091825A (zh) | 阀冷状态检测方法及系统 | |
CN111079348A (zh) | 一种缓变信号检测方法和装置 | |
Guan et al. | Application of a novel PNN evaluation algorithm to a greenhouse monitoring system | |
CN117874612A (zh) | 一种基于人工智能的电力系统设备模型异常检测方法 | |
Sina et al. | Intelligent fault diagnosis of manufacturing processes using extra tree classification algorithm and feature selection strategies | |
CN115047313B (zh) | 基于oc-svm和dnn的zpw-2000r轨道电路故障诊断方法及装置 | |
CN113835973B (zh) | 一种模型训练方法及相关装置 | |
Lopes et al. | AGN simulation and validation model | |
Shen et al. | Long-term multivariate time series forecasting in data centers based on multi-factor separation evolutionary spatial–temporal graph neural networks | |
Xiaozhi et al. | Fault Diagnosis Based on Sparse Semi-supervised GAN Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |