CN112561383A

CN112561383A - 一种基于生成对抗网络的实时异常检测方法

Info

Publication number: CN112561383A
Application number: CN202011547340.8A
Authority: CN
Inventors: 崔向阳; 刘佳雯; 牛慧博; 王楠; 孟庆磊
Original assignee: Aerospace Science And Technology Network Information Development Co ltd
Current assignee: Aerospace Science And Technology Network Information Development Co ltd
Priority date: 2020-12-24
Filing date: 2020-12-24
Publication date: 2021-03-26

Abstract

本发明涉及一种基于生成对抗网络的实时异常检测方法，其中，包括：离线训练和实时检测；离线训练包括：将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型，对抗网络模型生成异常数据并进行鉴别检测，训练完成后将对抗网络模型部署到实时检测环境；实时检测包括：从生产设备采集实时数据，并同步将数据存储到历史数据库，实时数据经过数据清洗后，输入到生成对抗网络模型进行异常检测；当检测结果为正常时，将实时数据标注为正常数据，并回流输入到对抗网络模型进行增量训练；当检测结果为异常时，触发异常报警，等待人工处理，确认为异常结果时，将实时数据标注为异常数据，并回流到模型的鉴别网络部分进行增量训练。

Description

一种基于生成对抗网络的实时异常检测方法

技术领域

本发明涉及数据监督检测技术，特别涉及一种基于生成对抗网络的实时异常检测方法。

背景技术

基于生产线采集的时序过程数据对产品质量的异常做预测和判断的机器学习方法，已经在生产制造企业得到了广泛应用。

通过数据标注方式可以将这些方法归类为三种：

有监督异常检测方法，首先将产线数据标注为正常和异常两种类别，再使用经过标注的产线数据输入神经网络或随机森林等有监督机器学习模型做训练，然后使用模型对新采集的产线数据做预测。中国专利“异常指标检测方法、装置、计算机设备和存储介质”中，通过聚类筛选和人工标注的方式对正常、异常数据分别进行标注，然后将标注数据输入到循环神经网络模型进行训练，实施中通过无监督方法对异常数据进行预筛选，再使用循环神经网络有模型的有监督方法对异常情况进行预测。

无监督异常检测方法，常用无监督方法有基于密度的方法和基于聚类的方法等，将产线数据表示为多维空间的数据点，通过判断特定数据点与其它数据点的距离关系，判断数据的异常情况。中国专利“一种利用时序聚类算法实现故障检测的方法”提供了一种使用DBSCAN聚类算法对故障进行无监督检测的方法，对时序数据计算聚类后的异常分数值，根据异常分数值是否超过阈值判断是否存在异常。

半监督异常检测方法，适用于历史数据没有异常数据，或只包含极少异常数据的情况，只使用正常数据输入模型进行训练。中国专利“一种基于生成对抗网络的异常检测方法”提供了一种通过生成对抗网络模型对异常图像进行检测的方法，将真实图像输入到模型，模型的生产网络部分基于真实图像生成异常图像，模型的鉴别网络部分对图像判断是否存在异常。

有监督异常检测方法需要比较多的标注数据对模型进行训练，由于在制造业生产线中，异常数据通常较为稀少，且标注数据需要专业知识，标注成本较高，在很多产线质量异常检测的实际应用时，只会有很少的标注数据，或者甚至没有异常数据，有监督方法难以找到足够的数据对模型进行训练，无法有效识别异常数据。

无监督异常检测方法中对特定场景的先验参数通常难易确定，容易造成算法偏差，很多无监督方法需要人工确定类别个数或者类别间距离阈值，在只有正常数据的情况下，无监督方法难以发挥作用。

半监督异常检测方法，在通过正常数据生成异常数据时，产线的训练数据通常无法覆盖正常数据的完整数据分布。在使用历史数据训练完成后，产线数据经常有新的变化，半监督模型受限于历史数据，容易将正常数据误检测为异常数据。

发明内容

本发明的目的在于提供一种基于生成对抗网络的实时异常检测方法，用于有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。

本发明一种基于生成对抗网络的实时异常检测方法，其中，包括：离线训练和实时检测；离线训练包括：将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型，对抗网络模型生成异常数据并进行鉴别检测，训练完成后将对抗网络模型部署到实时检测环境；实时检测包括：从生产设备采集实时数据，并同步将数据存储到历史数据库，实时数据经过数据清洗后，输入到生成对抗网络模型进行异常检测；当检测结果为正常时，将实时数据标注为正常数据，并回流输入到对抗网络模型进行增量训练；当检测结果为异常时，触发异常报警，等待人工处理，确认为异常结果时，将实时数据标注为异常数据，并回流到模型的鉴别网络部分进行增量训练。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，离线训练具体包括：从生产设备采集实时数据；从生产设备的传感器实时采集过程数据以及生产结果数据；将采集的数据存储到历史数据库；对历史数据进行数据清洗，清洗为适合输入模型的数据格式。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，过程数据包括：转速、温度以及每一生产步骤持续时长。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，数据清洗具体包括：(1)将时序数据按时间排序；(2)去除重复数据；(3)补全缺失数据；(4)进行数据转换，对于生产数据特征，根据生产经验或者依据特征和产品质量的单调区间变化，进行阈值划分；(5)对生产数据进行数据特征间的组合，并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后，一起输入到由全连接神经网络构成的编码器。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，训练生成对抗网络模型包括：将训练数据输入对抗网络模型，通过生成网络生成异常数据，并与正常数据一起输入到鉴别网络进行有监督训练，生成对抗网络模型；训练数据是由生产数据经过数据处理后生成的数据集，初始训练数据由正常数据组成。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，在训练生成对抗网络模型过程中，将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布；后将训练数据中时间步1和时间步2的数据字段输入到生成网络，输出为预测时间步3的数据字段；将原始时间步1、时间步2的数据字段和预测得到的时间步3数据做拼接，异常数据标签值设置为1，作为异常数据输入鉴别网络，对鉴别网络做训练；鉴别网络经过梯度下降对网络参数权重做调整，并将梯度传播到生成网络，对生成网络做调整，以生成更难以区分的异常数据。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，在对抗网络模型中的神经网络类型选取全连接神经网络作为基础结构。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，异常检测包括：

使用生成对抗网络模型进行异常检测；

将数据输入到对抗网络模型的鉴别网络部分，对数据进行异常检测，实时的生产数据与训练数据相比缺少标签数据，对一个由3层神经网络构成的鉴别网络，其中第i层第j个神经元的计算公式为

其中x为生产数据中各时间步的数据字段，w为已训练收敛的网络权重，y为单个神经网络节点的输出数据；第i层神经网络的输出数据，构成第i+1层神经网络的输入数据；最后一层为单个神经网络节点，取大于阈值m的输出数据为异常数据，小于等于阈值m的输出数据为正常数据；

将检测为正常的数据回流到对抗网络模型进行增量训练；

首先将正常数据加上标签数据，在最后补上标签字段0，表示数据为正常数据，将增量正常训练数据输入到鉴别网络进行训练和参数更新；然后将正常数据的前两个时间步数据提取，输入到生成网络，预测输出第三个时间步的数据字段，与前两个时间步数据拼接后，生成新的异常数据；并将异常数据，输入鉴别网络进行训练和参数更新。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，阈值a为0.5。

根据本发明所述的基于生成对抗网络的实时异常检测方法的一实施例，其中，检测为异常的数据触发异常报警，异常数据回流到对抗网络模型进行增量训练。

本发明的提出一种在只有正常数据的情况下，实时对训练完成的半监督模型进行更新，不断增加模型异常检测能力的异常检测方法。

本发明使用了对抗生成网络的半监督异常检测方式：使用生成网络生成异常数据，将鉴别网络训练为识别正常数据和异常数据的二分类有监督异常检测模型，避免了有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。

附图说明

图1为本发明整体方案流程图；

图2为生成对抗网络模型架构图。

具体实施方式

为使本发明的目的、内容、和优点更加清楚，下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

本发明分为离线训练和实时检测两个部分，整体方案流程图如图1所示。离线部分首先将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型，模型自主生成异常数据并进行鉴别检测，训练完成后将模型部署到实时检测环境。

实时检测部分首先从生产设备采集实时数据，并同步将数据存储到历史数据库，实时数据经过数据清洗后，输入到生成对抗网络模型进行异常检测；当检测结果为正常时，将实时数据标注为正常数据，并回流输入到模型进行增量训练；当检测结果为异常时，触发异常报警，等待人工处理，确认为异常结果时，将实时数据标注为异常数据，并回流到模型的鉴别网络部分进行增量训练。

离线训练流程主要分为如下几个部分：

从生产设备采集实时数据

从生产设备的传感器实时采集转速、温度、每一生产步骤持续时长等过程数据，以及产品性状等生产结果数据。

将实时数据存储到历史数据库；

对历史数据进行数据清洗；

将数据清洗为适合输入模型的数据格式。主要包括以下方面：

(1)将时序数据按时间排序；

(2)去除重复数据；

(3)补全缺失数据；

(4)数据转换，如数值类型数据做归一化，类别数据转换为枚举数据等。对于转速、温度等生产数据特征，可根据生产经验，或者依据特征和产品质量的单调区间变化，进行阈值划分。如某种产品的生产中，温度小于10摄氏度时，产品质量随着温度升高而提升；温度大于100摄氏度时，产品质量随温度升高而降低；温度位于10到100摄氏度区间时，产品质量保持一定。可将温度的生产数据特征划分为温度小于10摄氏度、温度位于10到100摄氏度之间、温度大于100摄氏度等三个类别的枚举数据，当生产数据中温度为50摄氏度时，温度小于10摄氏度和温度大于100摄氏度的枚举类别数据值为0，温度位于10到100摄氏度之间的枚举类别数据值为1；

(5)数据特征组合。生产数据属于离散数据，且产品质量通常会依赖于生产数据特征的组合，如温度位于10到100摄氏度的区间且转速大于8000转/分时，产品质量较好。基于生产数据的这些特性，首先对生产数据进行数据特征间的组合，并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后，一起输入到由全连接神经网络构成的编码器。

训练生成对抗网络模型，将训练数据输入模型，通过生成网络生成异常数据，并与正常数据一起输入到鉴别网络进行有监督训练。生成对抗网络模型架构图如图2所示。

其中训练数据是由生产数据经过数据处理后生成的数据集。初始训练数据由正常数据组成，设定时间序列为3，即每条训练数据由3个时间步的生产数据组成。如经过数据清洗和特征组合之后的训练数据字段为：【时间1】温度小于10摄氏度、【时间1】温度位于10到100摄氏度之间、【时间1】温度大于100摄氏度、【时间1】转速小于等于8000转/分、【时间1】转速大于8000转/分、【时间1】温度位于10到100摄氏度的区间且转速大于8000转/分、【时间2】温度小于10摄氏度、【时间2】温度位于10到100摄氏度之间、【时间2】温度大于100摄氏度、【时间2】转速小于等于8000转/分、【时间2】转速大于8000转/分、【时间2】温度位于10到100摄氏度的区间且转速大于8000转/分、【时间3】温度小于10摄氏度、【时间3】温度位于10到100摄氏度之间、【时间1】温度大于100摄氏度、【时间3】转速小于等于8000转/分、【时间3】转速大于8000转/分、【时间3】温度位于10到100摄氏度的区间且转速大于8000转/分、【标签】是否异常数据；一条训练数据的值为[0 1 0 0 1 1 0 1 0 0 1 1 0 1 0 0 1 1 0]，其中每一位为对应字段的取值，如第二位取值为1意义为在时间步1生产过程温度位于10到100摄氏度之间，最后一位取值为0意义为此条训练数据不是异常数据。

在训练过程中，首先将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布；然后将训练数据中时间步1和时间步2的数据字段输入到生成网络，输出为预测时间步3的数据字段，如输入数据为[0 1 0 0 1 1 0 1 0 0 1 1]，经过神经网络计算后输出为[0 0 1 0 0 0]；将原始时间步1、时间步2的数据字段，和预测得到的时间步3数据做拼接，异常数据标签值设置为1，作为异常数据输入鉴别网络，对鉴别网络做训练；鉴别网络经过梯度下降对网络参数权重做调整，并将梯度传播到生成网络，对生成网络做调整，以生成更难以区分的异常数据，加强后续生成网络对异常数据的生成能力，和鉴别网络对异常数据的检测能力。

在模型中神经网络类型的选取上，由于生产数据中各种数据特征的位置可以随意排列，通常不存在明显的局部特征，通过共享局部特征进行学习的卷积神经网络不适用于生产数据的训练；由于生产系统对响应延时要求较高，不选用训练和检测时间依赖于时间序列长度的循环神经网络；同时由于产品质量常依赖于多种数据特征的组合，选用全连接神经网络作为模型中的基础结构。

在神经网络优化器的选取上，为了加速训练的收敛速度，同时适应在生成过程中的增量训练，选用适用于在线学习的FTRL技术作为神经网络的优化器。FTRL是一种优化的梯度更新技术，能根据线上实时反馈的数据，快速训练调整模型参数，使模型及时反映线上的数据变化，从而提高模型的效果。

部署完成训练的模型到实时检测环境；

实时检测流程主要分为如下几个部分：

1、从生产设备采集实时数据

2、对实时数据进行数据清洗

使用和对历史数据完全一致的数据清洗方式。

使用生成对抗网络模型进行异常检测；

将数据输入到模型的鉴别网络部分，对数据进行异常检测。实时的生产数据与训练数据相比，也是由3个时间步组成的数据字段，但是缺少标签数据，如[0 1 0 0 1 1 0 10 0 1 1 0 1 0 0 1 1]，其中每个数值字段表示温度范围特征、转速范围特征及温度和转速的组合特征。对一个由3层神经网络构成的鉴别网络，其中第i层第j个神经元的计算公式为

其中x为生产数据中各时间步的数据字段，w为已训练收敛的网络权重，y为单个神经网络节点的输出数据。第i层神经网络的输出数据，构成第i+1层神经网络的输入数据。最后一层为单个神经网络节点，取大于阈值0.5的输出数据为异常数据，小于等于阈值0.5的输出数据为正常数据。

将检测为正常的数据回流到模型进行增量训练；

首先将正常数据加上标签数据，如正常三个时间步的生成数据为[0 1 0 0 1 1 01 0 0 1 1]，在最后补上标签字段0，表示数据为正常数据，将增量正常训练数据[0 1 0 01 1 0 1 0 0 1 1 0]输入到鉴别网络进行训练和参数更新；然后将正常数据的前两个时间步数据提取，输入到生成网络，预测输出时间步3的数据字段，与前两个时间步数据拼接后，生成新的异常数据；并将异常数据，输入鉴别网络进行训练和参数更新。

检测为异常的数据触发异常报警；

人工处理报警数据；

异常数据回流到模型进行增量训练；

将异常数据输入到生成对抗网络模型的鉴别网络部分，进行增量训练。

本发明使用了对抗生成网络的半监督异常检测方式：使用生成网络生成异常数据，将鉴别网络训练为识别正常数据和异常数据的二分类有监督异常检测模型，避免了有监督异常检测方式无法应用到缺失标注数据场景、无监督异常检测方式无法应用到缺失异常数据场景的问题。使用实时数据对模型进行实时增量更新：通过将检测过的数据回流输入到模型进行增量训练，实现模型的实时更新，增强了模型检测数据的有效范围，避免了数据随时间变化对模型的扰动问题。

本发明提出的技术方案在只有正常数据的异常检测场景下，实现了对半监督模型的实时更新。在这种方法中，我们使用对抗生成网络模型中的生成网络生成异常数据，输入到鉴别网络进行有监督学习，避免了有监督异常检测方法和无监督异常检测方法无法应用到没有异常训练数据场景的问题。同时，我们使用实时数据对生成对抗网络模型做实时增量更新，避免了半监督学习受限于历史训练数据，对新数据无法做出有效异常检测的问题。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种基于生成对抗网络的实时异常检测方法，其特征在于，包括：

离线训练和实时检测；

离线训练包括：

将从生产设备采集的批量历史正常数据经过数据清洗后输入到生成对抗网络模型，对抗网络模型生成异常数据并进行鉴别检测，训练完成后将对抗网络模型部署到实时检测环境；

实时检测包括：

从生产设备采集实时数据，并同步将数据存储到历史数据库，实时数据经过数据清洗后，输入到生成对抗网络模型进行异常检测；当检测结果为正常时，将实时数据标注为正常数据，并回流输入到对抗网络模型进行增量训练；当检测结果为异常时，触发异常报警，等待人工处理，确认为异常结果时，将实时数据标注为异常数据，并回流到模型的鉴别网络部分进行增量训练。

2.如权利要求1所述的基于生成对抗网络的实时异常检测方法，其特征在于，离线训练具体包括：

从生产设备采集实时数据；

从生产设备的传感器实时采集过程数据以及生产结果数据；

将采集的数据存储到历史数据库；

对历史数据进行数据清洗，清洗为适合输入模型的数据格式。

3.如权利要求2所述的基于生成对抗网络的实时异常检测方法，其特征在于，过程数据包括：转速、温度以及每一生产步骤持续时长。

4.如权利要求1所述的基于生成对抗网络的实时异常检测方法，其特征在于，数据清洗具体包括：

(1)将时序数据按时间排序；

(2)去除重复数据；

(3)补全缺失数据；

(4)进行数据转换，对于生产数据特征，根据生产经验或者依据特征和产品质量的单调区间变化，进行阈值划分；

(5)对生产数据进行数据特征间的组合，并且对位于时间序列不同时间的数据特征进行组合。将未组合的离散数据和组合后的数据与拼接后，一起输入到由全连接神经网络构成的编码器。

5.如权利要求1所述的基于生成对抗网络的实时异常检测方法，其特征在于，训练生成对抗网络模型包括：

将训练数据输入对抗网络模型，通过生成网络生成异常数据，并与正常数据一起输入到鉴别网络进行有监督训练，生成对抗网络模型；

训练数据是由生产数据经过数据处理后生成的数据集，初始训练数据由正常数据组成。

6.如权利要求5所述的基于生成对抗网络的实时异常检测方法，其特征在于，在训练生成对抗网络模型过程中，将正常的带标签有监督训练数据输入到鉴别网络学习正常的数据分布；后将训练数据中时间步1和时间步2的数据字段输入到生成网络，输出为预测时间步3的数据字段；将原始时间步1、时间步2的数据字段和预测得到的时间步3数据做拼接，异常数据标签值设置为1，作为异常数据输入鉴别网络，对鉴别网络做训练；鉴别网络经过梯度下降对网络参数权重做调整，并将梯度传播到生成网络，对生成网络做调整，以生成更难以区分的异常数据。

7.如权利要求1所述的基于生成对抗网络的实时异常检测方法，其特征在于，在对抗网络模型中的神经网络类型选取全连接神经网络作为基础结构。

8.如权利要求1所述的基于生成对抗网络的实时异常检测方法，其特征在于，异常检测包括：

使用生成对抗网络模型进行异常检测；

将检测为正常的数据回流到对抗网络模型进行增量训练；

9.如权利要求8所述的基于生成对抗网络的实时异常检测方法，其特征在于，阈值a为0.5。

10.如权利要求1所述的基于生成对抗网络的实时异常检测方法，其特征在于，检测为异常的数据触发异常报警，异常数据回流到对抗网络模型进行增量训练。