CN112991579B - 一种基于生成对抗网络的直升机动部件异常检测方法 - Google Patents

一种基于生成对抗网络的直升机动部件异常检测方法 Download PDF

Info

Publication number
CN112991579B
CN112991579B CN202110255485.9A CN202110255485A CN112991579B CN 112991579 B CN112991579 B CN 112991579B CN 202110255485 A CN202110255485 A CN 202110255485A CN 112991579 B CN112991579 B CN 112991579B
Authority
CN
China
Prior art keywords
sample
data
training
helicopter
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110255485.9A
Other languages
English (en)
Other versions
CN112991579A (zh
Inventor
程玉杰
马梁
丁宇
李商羽
陶来发
马剑
吕琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Publication of CN112991579A publication Critical patent/CN112991579A/zh
Application granted granted Critical
Publication of CN112991579B publication Critical patent/CN112991579B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C5/00Registering or indicating the working of vehicles
    • G07C5/08Registering or indicating performance data other than driving, working, idle, or waiting time, with or without registering driving, working, idle or waiting time
    • G07C5/0808Diagnosing performance data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种基于生成对抗网络的直升机动部件异常检测方法,该方法包括如下步骤,步骤一、直升机健康数据预处理;步骤二、生成对抗网络设计与构件;步骤三、生成对抗网络无监督训练;步骤四、报警阈值设定;步骤五、异常检测;步骤六、阈值自适应在线调整;本发明可充分利用海量直升机动部件健康数据,利用生成对抗网络对健康数据分布进行无监督学习,提高数据利用率,不需大量异常样本即可设置异常检测报警阈值,降低了对数据收集的要求,可随着模型的使用,结合不断补充的健康与异常样本,对异常检测报警阈值进行在线调整,以适应异常检测需求,降低虚警率、提升检测率。

Description

一种基于生成对抗网络的直升机动部件异常检测方法
技术领域
本发明涉及直升机动部件异常检测技术领域,具体涉及一种基于生成对抗网络的直升机动部件异常检测方法。
背景技术
直升机由于其独特的性能,广泛的用途,受到了各领域的普遍关注。传动系统是直升机中基本而重要的关键系统,承担了直升机的动力传输功能。直升机传动系统的结构特点是存在大量的旋转动部件,从发动机输出的动力经传动系统传输给主旋翼、尾桨等直升机子系统中,动力或载荷传递路径单一,并且飞行过程中始终保持着旋转运行,其中任何一个部件的功能异常或失效都可能导致灾难性事故的发生。因此,对直升机动部件开展异常检测,对提高直升机传动系统运行可靠性与安全性有重要意义。
机器学习、深度学习等数据驱动的方法优于其具备较好的自适应性、不依赖过多专家知识等特点,在直升机动部件异常检测任务中得到了广泛应用。数据驱动的异常检测算法,通过采集直升机健康和异常状态下的数据,训练分类器等模型,使模型学习到区分健康与异常样本的最优分类平面,进而具备异常检测能力。典型的数据驱动的直升机动部件异常检测算法包括基于时频信号分解的异常检测方法、基于阈值的异常检测方法、基于神经网络的异常检测方法等。然而,通常情况下,直升机动部件大多数时间处于正常的工作状态,且故障注入试验难度大、成本高、具备危险性,因此用于异常检测模型训练的异常数据样本难以大量获取。如何在基于大量健康数据与少量异常数据,对直升机动部件开展异常检测,成为亟待解决的问题。
生成对抗网络是一种深度学习模型,其能够通过生成器和判别器的对抗训练,使模型具备对满足特定分布样本的生成和判别能力。因此,利用大量直升机健康状态下的数据对生成对抗网络进行训练,可以得到具备如下能力的模型:1)能够生成与直升机健康数据相似的数据的生成器;2)能够区分输入数据是否来自直升机真实健康样本分布的判别器。进而,利用上述判别器,结合少量异常样本,能够实现基于不平衡样本集的直升机动部件异常检测。此外,在实际在线异常检测过程中,可以随着异常样本的增多,自适应地对报警阈值进行自适应调整,实现检测能力的持续提升。
发明内容
本发明所解决的问题是,当前直升机动部件异常检测方法所具有的:对故障样本数据量要求高、异常判定阈值设置依赖专家经验、难以随着模型使用对阈值进行在线更新等弊端,导致其实际工程适用性较差的问题。
本发明提出了一种基于生成对抗网络的直升机动部件异常检测方法。该方法步骤如下。
步骤一、直升机健康数据预处理:对直升机动部件振动数据进行切割、快速傅里叶变换,完成数据健康数据预处理,得到生成对抗网络训练样本;
步骤二、生成对抗网络设计与构建:根据样本维度与具体任务需要,设计生成对抗网络中生成器网络与判别器网络的结构、激活函数等属性;
步骤三、生成对抗网络无监督训练:根据生成器、判别器网络的目标函数,利用步骤一得到的训练健康样本集对生成对抗网络进行无监督训练,得到具有样本生成能力的生成器和真实分布判别能力的判别器;
步骤四、报警阈值设定:结合少量以同样方式进行预处理之后的异常样本,根据分类错误率最低准则,进行报警阈值设定;
步骤五、异常检测:利用训练得到的判别器和设置的报警阈值,对测试集样本进行异常检测;
步骤六、阈值自适应在线调整:随着在线使用阶段的样本(测试集样本)不断增多,对步骤四中设定的报警阈值,根据分类错误率最低准则进行再调整。
本发明相较于其他直升机动部件异常检测方法,优势在于:
1)可充分利用海量直升机动部件健康数据,利用生成对抗网络对健康数据分布进行无监督学习,提高数据利用率;
2)不需大量异常样本即可设置异常检测报警阈值,降低了对数据收集的要求;
3)可随着模型的使用,结合不断补充的健康与异常样本,对异常检测报警阈值进行在线调整,以适应异常检测需求,降低虚警率、提升检测率。
附图说明
图1为本发明方法流程图;
图2为本发明实施例所用的完整原始振动信号样本图;
图3为数据切割得到的单个振动信号原始样本图;
图4为数据切割得到的单个振动信号的频谱图;
图5A为生成对抗网络第一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;
图5B为生成对抗网络第一代训练结束后,网络生成的一个频谱图;
图6A为生成对抗网络第十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;
图6B为生成对抗网络第十一代训练结束后,网络生成的一个频谱图;
图7A为生成对抗网络第二十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;
图7B为生成对抗网络第二十一代训练结束后,网络生成的一个频谱图;
图8A为生成对抗网络第三十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;
图8B为生成对抗网络第三十一代训练结束后,网络生成的一个频谱图;
图9A为生成对抗网络第四十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图;
图9B为生成对抗网络第四十一代训练结束后,网络生成的一个频谱图;
图10A为生成对抗网络第五十代训练结束后,在真实样本集中随机抽样得到的一个频谱图;
图10B为生成对抗网络第五十代训练结束后,网络生成的一个频谱图;
图11A为生成对抗网络训练全过程中,生成器的损失值变化曲线图;
图11B为生成对抗网络训练全过程中,判别器的损失值变化曲线图;
图12为第一次报警阈值设定结果示意图;
图13为根据第一次设定的报警阈值,对测试集样本进行检测的结果示意图;
图14为报警阈值在线调整之后,根据新的报警阈值对新的测试集样本进行检测的结果示意图;
图15为健康样本数据RMS特征图;
图16为测试样本数据RMS特征图。
具体实施方式
以下结合附图,通过具体实施例,对本发明的基于生成对抗网络的直升机动部件异常检测方法的各个步骤进行详细说明。
本发明提出了一种基于生成对抗网络的直升机动部件异常检测方法。该方法步骤如下。
步骤一、直升机健康数据预处理S1:对直升机动部件振动数据进行切割、快速傅里叶变换,完成数据健康数据预处理,得到生成对抗网络训练样本;
首先对用于模型训练的直升机健康数据进行预处理。
数据切割S11:
由于直升机动部件包含大量旋转机械,振动信号中包含了大量与系统运行状态以及故障相关的模式和信息,因此本发明中采用直升机动部件振动信号作为用于异常检测的原始数据。振动信号的采集和存储通常持续一段时间,因此直升机动部件健康数据表现为一定长度的时间序列。设健康数据采集频率为f(Hz),数据采集时长为t(s),则健康数据总长度为f×t。将完整健康数据切割为长度w的数据段,每段间无重叠点;若健康数据总长度不是w的倍数,则考虑数据采集起始阶段的不稳定等因素,舍弃数据起始段不满样本长度w的点。则完整健康数据共能够切割出样本
Figure BDA0002966875290000041
个。其中[]为取整符号。
快速傅里叶变换S12:
数据切割之后,对每段样本进行快速傅里叶变换,得到每个样本的频谱。
由于振动信号中包含的直升机健康与故障特征大部分在频域中体现,为提升异常检测效果,对切割得到的每个时域振动信号样本进行快速傅里叶变换(FFT),得到样本频谱,作为训练生成对抗网络的输入样本,也作为异常检测阶段给模型的输入样本。记第i个样本的时域振动信号向量为xi,进行FFT之后的频谱样本向量为fi=FFT(xi),则经过预处理后的用于模型训练的直升机动部件健康数据样本集可表示为
Figure BDA0002966875290000042
步骤二、生成对抗网络设计与构建:根据样本维度与具体任务需要,设计生成对抗网络中生成器网络与判别器网络的结构、激活函数等属性;
生成器构建S22,生成器构建S22也为生成器网络构建。
生成器采用多层神经网络来实现,以维度为znoise的随机噪声向量为输入,以维度为w的生成样本向量为输出。由于异常检测任务中样本的复杂度不同,可根据具体需求设置生成器网络的隐藏层数与每个隐藏层的神经元节点数。同时,为除输入层外的所有层设置激活函数,结合权重矩阵与偏置向量完成逐层的非线性组合与映射。
判别器构建S22,判别器构建S22也为判别器网络构建。
与生成器类似,判别器网络也采用多层神经网络来实现。判别器网络以维度w的样本为输入,以单个神经元为输出。由于异常检测任务中样本的复杂度不同,可根据具体需求设置判别器网络的隐藏层数与每个隐藏层的神经元节点数。同时,为除输入层、输出层外的所有层设置激活函数;输出层激活函数设置为Sigmoid函数(表达式为S(x)=1/(1+e-x)),以输出一个0-1之间的概率值,表征判别器输入的样本是否来自真实数据分布。
步骤三、生成对抗网络无监督训练S3:根据生成器、判别器网络的目标函数,利用步骤一得到的训练健康样本集对生成对抗网络进行无监督训练,得到具有样本生成能力的生成器和真实分布判别能力的判别器;
生成器训练S31:
生成器网络目标函数,在对抗训练过程中,生成器的目的是基于输入的随机噪声向量生成与来自真实数据分布的样本尽可能相似的生成样本,以“欺骗”判别器给出错误的判别结果。因此,生成器的训练目标是使自身生成的样本输入判别器后,判别器给出的判别结果尽可能接近于1。基于此,生成器的目标函数如下公式(1)。
Figure BDA0002966875290000051
其中,z是输入生成器的随机噪声向量,Pz是随机噪声向量分布(可以是高斯分布、均匀分布等),G()是生成器表达的非线性映射函数,D()是判别器表达的非线性映射函数,log是以10为底的对数。
判别器训练S32:
判别器网络目标函数,判别器的目的是对输入的样本进行特征提取和判断,以判别样本是否来自真实数据分布。对于来自真实分布的样本,判别器的目标是给出概率1;对于不是来自真实分布的样本,判别器的目标是给出概率0。基于此,判别器的目标函数如下公式(2)
Figure BDA0002966875290000061
其中,z是输入生成器的随机噪声向量,Pz是随机噪声向量分布(可以是高斯分布、均匀分布等),x是输入判别器的样本,Pdata是真实数据分布;G()是生成器表达的非线性映射函数,D()是判别器表达的非线性映射函数,log是以10为底的对数。
生成器与判别器的联合对抗训练:
首先,对判别器进行训练。从某种先验分布(如均匀分布、正态分布等)中采集一批噪声样本,记为
Figure BDA0002966875290000062
将这批样本输入生成器,进行前向传播得到一批生成样本,记为
Figure BDA0002966875290000063
从真实直升机动部件健康数据样本集中采集一批真实样本,记为
Figure BDA0002966875290000064
设置真实样本的标签为1,生成样本的标签为0;将生成样本和真实样本输入判别器,获得判别结果;根据判别结果与标签,按照判别器目标函数计算此轮训练的判别器损失,根据损失值利用优化器对判别器网络进行训练。在判别器网络训练时,冻结生成器网络的权重,即生成器网络在此过程中参数不做更新。
按上述方法对判别器训练q次之后,停止此轮判别器训练,开始生成器训练。其中,q是人为设定的控制判别器与生成器训练强度比例的超参数,需要结合具体情况进行设定。在生成器训练时,从上述先验噪声分布中采集一批噪声样本,设置其真实标签为1;将这批样本输入生成器,获得生成样本,再输入判别器,得到判别结果;根据判别结果与真实标签,按照生成器目标函数计算此轮训练的生成器损失,根据损失值利用优化器对生成器网络进行训练。在生成器网络训练时,冻结判别器网络的权重,即判别器网络在此过程中参数不做更新。
以上为生成器与判别器的一轮联合对抗训练。在实际应用中,需要根据具体情况设置对抗训练的轮次数,以使生成器与判别器达到纳什均衡状态。
当联合对抗训练结束后,获得了能够以随机噪声为输入,生成与直升机真实健康数据非常相似的样本的生成器网络;以及能够准确判别输入样本是否来自直升机健康数据分布的判别器网络。
步骤四、报警阈值设定S4:结合少量以同样方式进行预处理之后的异常样本,根据分类错误率最低准则,进行报警阈值设定;
报警阈值设定,结合少量直升机动部件异常数据,对判别器报警阈值进行设定。
使用与健康数据预处理的方式对异常数据进行预处理,包括样本切割与快速傅里叶变换。记预处理之后的少量异常样本集合为
Figure BDA0002966875290000076
其中Na为少量异常样本的数量。将大量正常样本与少量异常样本合并,得到用于报警阈值设定的样本集合,记为
Figure BDA0002966875290000071
为样本集合打标签,其中正常样本标签为1,异常样本标签为0,得到用于报警阈值设定的样本标签集合,记为
Figure BDA0002966875290000072
设经过无监督对抗训练的网络判别器为
Figure BDA0002966875290000073
报警阈值为概率值T。当某样本输入判别器之后,输出概率值高于报警阈值,则认为判别器对该样本识别结果为正常样本;若输出概率值不高于报警阈值,则认为判别器对该样本识别结果为异常样本。数学表达如下公式(3):
Figure BDA0002966875290000074
基于此,最终设定的最优报警阈值为使正常/异常样本识别错误数量最少的值。数学表达如下公式(4):
Figure BDA0002966875290000075
其中,I(·)函数当括号内逻辑表达式为真时,函数值为1;逻辑表达式为假时,函数值为0。
步骤五、异常检测S5:利用训练得到的判别器和设置的报警阈值,对测试集样本进行异常检测;
设定完最优报警阈值Topt后,即可对新的直升机动部件振动样本开展异常检测。在直升机运行过程中,采集新的动部件振动信号;当样本长度达到w之后,采用与模型训练阶段相同的预处理方式(即快速傅里叶变换),得到样本频谱,输入经过训练的判别器模型;若模型输出概率值大于最优报警阈值Topt,则判断该样本为正常样本;若模型输出概率值不大于最优报警阈值Topt,则判断该样本为异常样本。
步骤六、阈值自适应在线调整S6:随着在线使用阶段的样本(测试集样本)不断增多,对步骤四中设定的报警阈值,根据分类错误率最低准则进行再调整。
当样本数量增多时,可能由于报警阈值设定不合理等问题,导致异常检测虚警率、漏报率升高,不满足实际异常检测需求的问题。可结合在线检测阶段收集到的新的异常样本,对设定的报警阈值进行自适应在线调整。具体调整方式与上述报警阈值设定方法所述类似,区别在于在此阈值调整阶段,所使用的样本和标签包含在线检测中补充的样本。
阈值自适应在线调整之后,可使阈值更加满足直升机动部件异常检测需求,降低虚警率和漏报率等指标。
实施例一
在本发明中,以HUMS系统实测的直升机飞行数据为例,对所述方法的有效性进行验证。数据采样率为32768,采样持续时间2秒,共包含65536个点。所述振动传感器布设在直升机附件机匣上,其中正常数据在直升机健康状态下采集,异常数据在直升机尾桨输出轴故障的状态下采集。
步骤一、直升机健康数据预处理S1
图2为本发明实施例所用的完整原始振动信号样本图,图2显示HUMS实测原始数据共持续2秒,飞行振动信号,横轴为数据点个数,纵轴为振动信号振幅。
图3为数据切割得到的单个振动信号原始样本图,横轴为数据点个数,纵轴为振动信号振幅,设定切片长度为2048,即每个样本包含2048个振动样本点。切片后的振动信号样本图。
图4为数据切割得到的单个振动信号的频谱图,图中横轴为频率,纵轴为对应频率位置的能量幅值,
对每个样本时域振动信号进行快速傅里叶变换,得到所有样本的频谱向量。以其中一个样本为例,原始时域信号与对应的频谱向量如下图所示。
由频谱图可以看出,直升机振动信号的特征主要集中在几个关键的特征频率上,相对时域信号而言更能够体现旋转机械的运行关键信息,因此更适合作为异常检测的原始样本。
生成对抗网络设计与构建S2
根据本实施例中数据的复杂程度与实际需求,构建生成器网络,其结构信息如下表1所示。
表1:生成器网络结构信息表
第一层节点数 128
激活函数 Relu
第二层节点数 128
激活函数 Relu
第三层节点数 256
激活函数 Sigmoid
第四次节点数 1025
优化器 随机梯度下降优化器(动量参数0.1)
损失函数 交叉熵损失函数
批数据大小 100
训练代数 50
类似地,根据对称原则,构建判别器网络,其结构信息如下表2所示。
表2:判别器网络结构信息表
Figure BDA0002966875290000091
Figure BDA0002966875290000101
生成对抗网络无监督训练S3
利用方法流程中定义的生成器损失函数与判别器损失函数对生成对抗网络进行对抗训练。图5A和5B分别为生成对抗网络第一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第一代训练结束后,网络生成的一个频谱图;当网络训练至不同阶段时,生成器输出的生成样本和真实样本情况如图5A和5B所示。
生成对抗网络第一代训练结果。
图6A和6B分别为生成对抗网络第十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第十一代训练结束后,网络生成的一个频谱图;生成对抗网络第十一代训练结果。
图7A和7B分别为生成对抗网络第二十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第二十一代训练结束后,网络生成的一个频谱图;生成对抗网络第二十一代训练结果。
图8A和8B分别为生成对抗网络第三十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第三十一代训练结束后,网络生成的一个频谱图;生成对抗网络第三十一代训练结果。
图9A和9B分别为生成对抗网络第四十一代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第四十一代训练结束后,网络生成的一个频谱图;生成对抗网络第四十一代训练结果。
图10A和10B分别为生成对抗网络第五十代训练结束后,在真实样本集中随机抽样得到的一个频谱图和生成对抗网络第五十代训练结束后,网络生成的一个频谱图;50代训练结束结果图
可以看出,随着生成对抗网络对抗训练的不断进行,生成器所输出的频谱样本与真实样本之间越来越相似,说明生成器的生成能力得到了不断增强,与之对应地,判别器的判别能力也不断提升。
图11A和11B分别为生成对抗网络训练全过程中,生成器的损失值变化曲线图和生成对抗网络训练全过程中,判别器的损失值变化曲线图;
生成器与判别器的损失函数曲线如下图11A和11B所示。
由生成器和判别器的损失曲线可知,在经历训练初始阶段的震荡之后,两个网络的损失值逐渐趋于平稳,且收敛至相近值附近,在收敛值上下小幅波动。说明生成器与判别器在经过一定循环的对抗训练之后,达到纳什均衡状态。
报警阈值设定S4
首先选取选取1800条用于训练的正常样本与400条已知为异常的样本,根据所述方法进行报警阈值设定。设定的最优报警阈值为使正常/异常样本识别错误数量最少的值,即0.5271。
图12为第一次报警阈值设定结果示意图;
异常检测S5
根据此报警阈值对测试集样本进行异常检测,计算得到的混淆矩阵如下表3所示。
表3:报警阈值对测试集样本进行异常检测计算的混淆矩阵表
Figure BDA0002966875290000111
为体现本发明所提出的异常检测方法的优势,选取工程实际中常用的异常检测方法:特征提取与阈值法,利用相同的数据进行训练和测试。
在目前工程实际应用中,对于只具有健康状态数据而缺少异常故障样本的对象进行诊断时,常用的方法为通过对时域的振动信号样本进行特征提取,提取其信号中的特征信息,之后根据健康状态的特征信息分布获取其分布阈值,并以此阈值为标准进行样本故障诊断。目前工程应用中,对振动信号特征提取应用较为广泛的为提取健康样本时域信号的均方根值(Root Mean Square,RMS),并根据其均方根值分布分析健康状态的上下限阈值,并以此阈值进行测试样本的异常检测。
计算每一个样本的RMS的公式如下式所示:
Figure BDA0002966875290000112
利用训练集的健康数据样本计算RMS值,计算结果如下图15所示。
图15中横轴为训练集健康样本的序号,纵轴为对应样本的RMS值计算结果。根据健康样本数据分布,可以得到健康样本数据RMS特征阈值上限为7.7682,阈值下限为0.1459。
确定RMS特征阈值上下限后,对测试样本进行同样的计算,RMS特征值分布及与阈值之间的相对关系如下图16所示。
图16中横轴为测试集样本的序号,前1800个样本为健康样本,后400个样本为异常样本。图中两条黑色实线为前述根据训练集健康样本确定的RMS上下限阈值。超过阈值范围的样本被判定为异常样本,落在阈值区间内的样本被判定为健康样本。
根据设定的阈值与测试集样本RMS值计算结果进行异常检测,得到表4的混淆矩阵。
表4:混淆矩阵
Figure BDA0002966875290000121
可知利用特征值阈值方法进行异常检测,得到的检测准确率为89.6%,低于本发明所提出的基于生成对抗网络的方法。
报警阈值自适应在线调整S6
在实际在线异常检测过程中,由于用于模型训练和阈值设定的样本数量较少,且可能未能完全体现样本真实分布的全貌,因此随着在线样本的增加,模型异常检测率、虚警率等性能指标可能逐渐不满足实际应用要求。在本实施例中,测试集样本可视为在线检测过程中补充的样本,当获取这些在线样本之后,可对设定的报警阈值进行自适应调整,从而提升后续异常检测的性能。
将上一节中的测试集样本纳入到模型训练和初始报警阈值设定所用样本的集合中,对报警阈值进行重新设定。即此时设置的报警阈值,在第一阶段所有样本和第二阶段补充的所有在线样本上取得的检测准确率最高。
阈值调整完毕之后,在新的一批正常和异常样本上进行测试。计算得到的混淆矩阵如下表5所示。
表5:阈值调整完毕之后的新一批正常和异常样本的混淆矩阵表
Figure BDA0002966875290000131
图14为报警阈值在线调整之后,根据新的报警阈值对新的测试集样本进行检测的结果示意图;异常检测结果可视化如下图14所示。
可以看出,经过自适应调整后的阈值能够更好地对正常和异常样本进行划分,从而实现提高异常检测率、降低虚警率的目的,提升模型在线使用阶段的性能。
需要注意的是,本申请公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

Claims (10)

1.一种基于生成对抗网络的直升机动部件异常检测方法,主要包括如下步骤:
步骤一、直升机健康数据预处理:对直升机动部件振动数据进行切割、快速傅里叶变换,完成数据健康数据预处理,得到生成对抗网络训练样本;
所述的直升机健康数据预处理,包括:数据切割,具体是设健康数据采集频率为f(Hz),数据采集时长为t(s),则健康数据总长度为f×t;将完整健康数据切割为长度w的数据段,每段间无重叠点;若健康数据总长度不是w的倍数,则考虑数据采集起始阶段的不稳定因素,舍弃数据起始段不满样本长度w的点;则完整健康数据共能够切割出样本
Figure FDA0003335650840000011
个;其中[]为取整符号;
步骤二、生成对抗网络设计与构建:根据样本维度与具体任务需要,设计生成对抗网络中生成器网络与判别器网络的结构、激活函数;
步骤三、生成对抗网络无监督训练:根据生成器、判别器网络的目标函数,利用步骤一得到的训练样本集对生成对抗网络进行无监督训练,得到具有样本生成能力的生成器和真实分布判别能力的判别器;
步骤四、报警阈值设定:选取少量异常样本,对异常样本进行切割、快速傅里叶变换,完成异常样本的预处理,根据分类错误率最低准则,进行报警阈值设定;
步骤五、异常检测:利用训练得到的判别器和设置的报警阈值,对测试集样本进行异常检测;
步骤六、阈值自适应在线调整:随着在线使用阶段的样本不断增多,对步骤四中设定的报警阈值,根据分类错误率最低准则进行再调整。
2.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤一、直升机健康数据预处理,包括:快速傅里叶变换,具体为对切割得到的每个时域振动信号样本进行快速傅里叶变换,得到样本频谱,作为训练生成对抗网络的输入样本,也作为异常检测阶段给模型的输入样本;记第i个样本的时域振动信号向量为xi,进行快速傅里叶变换之后的频谱样本向量为fi=FFT(xi),则经过预处理后的用于模型训练的直升机动部件健康数据样本集可表示为
Figure FDA0003335650840000012
3.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤二、生成对抗网络设计与构建包括生成器构建,生成器采用多层神经网络来实现,以维度为znoise的随机噪声向量为输入,以维度为w的生成样本向量为输出。
4.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤二、生成对抗网络设计与构建包括判别器构建,判别器网络以维度w的样本为输入,以单个神经元为输出。
5.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤三、生成对抗网络无监督训练包括生成器训练,生成器网络目标函数,生成器的目标函数如下公式(1)
Figure FDA0003335650840000021
其中,z是输入生成器的随机噪声向量,Pz是随机噪声向量分布,G()是生成器表达的非线性映射函数,D()是判别器表达的非线性映射函数,log是以10为底的对数,E为取期望函数。
6.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤三、生成对抗网络无监督训练包括判别器训练,判别器的目标函数如下公式(2):
Figure FDA0003335650840000022
其中,z是输入生成器的随机噪声向量,Pz是随机噪声向量分布,x是输入判别器的样本,Pdata是真实数据分布;G()是生成器表达的非线性映射函数,D()是判别器表达的非线性映射函数,log是以10为底的对数,E为取期望函数。
7.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤三、生成对抗网络无监督训练包括:生成器与判别器的联合对抗训练;
首先,对判别器进行训练,从某种先验分布中采集一批噪声样本,记为
Figure FDA0003335650840000023
将这批样本输入生成器,进行前向传播得到一批生成样本,记为
Figure FDA0003335650840000024
从真实直升机动部件健康数据样本集中采集一批真实样本,记为
Figure FDA0003335650840000025
设置真实样本的标签为1,生成样本的标签为0;将生成样本和真实样本输入判别器,获得判别结果;
根据判别结果与标签,按照判别器目标函数计算此轮训练的判别器损失,根据损失值利用优化器对判别器网络进行训练。
8.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤四、报警阈值设定具体是:
使用与健康数据预处理的方式对异常数据进行预处理,包括样本切割与快速傅里叶变换;记预处理之后的少量异常样本集合为
Figure FDA0003335650840000031
其中Na为少量异常样本的数量;将大量正常样本与少量异常样本合并,得到用于报警阈值设定的样本集合,记为
Figure FDA0003335650840000032
为样本集合打标签,其中正常样本标签为1,异常样本标签为0,得到用于报警阈值设定的样本标签集合,记为
Figure FDA0003335650840000033
设经过无监督对抗训练的网络判别器为
Figure FDA0003335650840000034
报警阈值为概率值T,当某样本输入判别器之后,输出概率值高于报警阈值,则认为判别器对该样本识别结果为正常样本;若输出概率值不高于报警阈值,则认为判别器对该样本识别结果为异常样本;数学表达如下公式(3):
Figure FDA0003335650840000035
基于此,最终设定的最优报警阈值为使正常/异常样本识别错误数量最少的值,数学表达如下公式(4):
Figure FDA0003335650840000036
其中,I(·)函数当括号内逻辑表达式为真时,函数值为1;逻辑表达式为假时,函数值为0。
9.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,所述的步骤五、异常检测,具体是:设定完最优报警阈值Topt后,即可对新的直升机动部件振动样本开展异常检测;在直升机运行过程中,采集新的动部件振动信号;当样本长度达到w之后,采用与模型训练阶段相同的预处理方式,得到样本频谱,输入经过训练的判别器模型;若模型输出概率值大于最优报警阈值Topt,则判断该样本为正常样本;若模型输出概率值不大于最优报警阈值Topt,则判断该样本为异常样本。
10.根据权利要求1所述的基于生成对抗网络的直升机动部件异常检测方法,其特征在于,步骤四、报警阈值设定所述的异常样本的预处理包括:
数据切割,具体是设异常数据采集频率为f(Hz),数据采集时长为t(s),则异常数据总长度为f×t;将完整异常数据切割为长度w的数据段,每段间无重叠点;若异常数据总长度不是w的倍数,则考虑数据采集起始阶段的不稳定因素,舍弃数据起始段不满样本长度w的点;则完整异常数据共能够切割出样本
Figure FDA0003335650840000041
个;其中[]为取整符号;
异常样本预处理结束后,根据分类错误率最低准则,进行报警阈值设定。
CN202110255485.9A 2021-01-14 2021-03-09 一种基于生成对抗网络的直升机动部件异常检测方法 Active CN112991579B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2021100480102 2021-01-14
CN202110048010 2021-01-14

Publications (2)

Publication Number Publication Date
CN112991579A CN112991579A (zh) 2021-06-18
CN112991579B true CN112991579B (zh) 2021-12-07

Family

ID=76336167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110255485.9A Active CN112991579B (zh) 2021-01-14 2021-03-09 一种基于生成对抗网络的直升机动部件异常检测方法

Country Status (1)

Country Link
CN (1) CN112991579B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114004258B (zh) * 2021-11-03 2024-04-02 大连大学 一种半监督的心电异常检测方法
CN114184879B (zh) * 2021-11-08 2024-01-23 陕西千山航空电子有限责任公司 一种直升机振动数据的异常频点监测方法
CN115267541A (zh) * 2022-07-29 2022-11-01 中国汽车工程研究院股份有限公司 一种基于对抗学习的新能源汽车电池异常检测方法
CN115392317A (zh) * 2022-08-31 2022-11-25 广东石油化工学院 一种石化机组旋转机械故障诊断方法、装置、设备及介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190147343A1 (en) * 2017-11-15 2019-05-16 International Business Machines Corporation Unsupervised anomaly detection using generative adversarial networks
CN107991876A (zh) * 2017-12-14 2018-05-04 南京航空航天大学 基于生成式对抗网络的航空发动机状态监测数据生成方法
CN109447263B (zh) * 2018-11-07 2021-07-30 任元 一种基于生成对抗网络的航天异常事件检测方法
CN109660206B (zh) * 2018-12-20 2020-05-19 福州大学 一种基于Wasserstein GAN的光伏阵列故障诊断方法
US10742516B1 (en) * 2019-02-06 2020-08-11 Cisco Technology, Inc. Knowledge aggregation for GAN-based anomaly detectors
CN110823574B (zh) * 2019-09-30 2021-04-06 安徽富煌科技股份有限公司 一种基于半监督学习深度对抗网络的故障诊断方法
CN111914873A (zh) * 2020-06-05 2020-11-10 华南理工大学 一种两阶段云服务器无监督异常预测方法
CN112200244B (zh) * 2020-10-09 2022-12-09 西安交通大学 一种基于递阶对抗训练的航天发动机异常智能检测方法
CN112435221B (zh) * 2020-11-10 2024-03-26 东南大学 一种基于生成式对抗网络模型的图像异常检测方法

Also Published As

Publication number Publication date
CN112991579A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN112991579B (zh) 一种基于生成对抗网络的直升机动部件异常检测方法
CN108731923B (zh) 一种旋转机械设备的故障检测方法及装置
CN111222549B (zh) 一种基于深度神经网络的无人机故障预测方法
CN105973594B (zh) 一种基于连续深度置信网络的滚动轴承故障预测方法
Cococcioni et al. Robust diagnosis of rolling element bearings based on classification techniques
CN110823576B (zh) 基于生成对抗网络的机械异常检测方法
CN113255848B (zh) 基于大数据学习的水轮机空化声信号辨识方法
CN110702418A (zh) 航空发动机故障预测方法
CN111680875B (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN111412977A (zh) 一种机械设备振动感知数据的预处理方法
CN110044623A (zh) 经验模态分解剩余信号特征的滚动轴承故障智能识别方法
CN108444696A (zh) 一种齿轮箱故障分析方法
CN114004091B (zh) 一种基于CEEMDAN-BNs的风力变桨距系统故障诊断方法
CN110737976A (zh) 一种基于多维度信息融合的机械设备健康评估方法
Zhao et al. A novel deep fuzzy clustering neural network model and its application in rolling bearing fault recognition
CN107463872A (zh) 一种旋转机械转轴裂纹故障诊断方法
Xu et al. A vibration signal anomaly detection method based on frequency component clustering and isolated forest algorithm
Zhong et al. A novel anomaly detection method for gas turbines using weight agnostic neural network search
CN116625686A (zh) 一种航空发动机轴承故障在线诊断方法
Zhang et al. Gearbox health condition identification by neuro-fuzzy ensemble
CN116383661A (zh) 离心泵故障诊断模型训练方法、故障诊断方法及装置
CN115293189A (zh) 一种基于堆栈自编码降维的旋转机械状态监测方法
CN109828548A (zh) 基于时间序列变化突变点检测的性能退化特征评估方法
Lindh et al. Automatic bearing fault classification combining statistical classification and fuzzy logic
CN115374827A (zh) 基于pca-lstm的粘滑振动水平评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant