CN114692506A - 一种基于改进TimeGAN模型的小样本故障诊断方法 - Google Patents

一种基于改进TimeGAN模型的小样本故障诊断方法 Download PDF

Info

Publication number
CN114692506A
CN114692506A CN202210388562.2A CN202210388562A CN114692506A CN 114692506 A CN114692506 A CN 114692506A CN 202210388562 A CN202210388562 A CN 202210388562A CN 114692506 A CN114692506 A CN 114692506A
Authority
CN
China
Prior art keywords
time
model
temporal
network
timegan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210388562.2A
Other languages
English (en)
Inventor
郭方洪
窦云飞
刘师硕
吴祥
董辉
陈积明
姚荣康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202210388562.2A priority Critical patent/CN114692506A/zh
Publication of CN114692506A publication Critical patent/CN114692506A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于改进TimeGAN模型的小样本故障诊断方法,包括:采集电梯运行数据,包括正常样本和故障样本;建立改进TimeGAN模型;将故障样本输入改进TimeGAN模型生成故障数据;将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征;将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练;将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。该方法通过生成具备时序特征的故障样本,降低原始数据分布不平衡性,并充分提取样本的时频特征,获得高效准确的故障诊断结果,从而实现智能化设备的安全维护。

Description

一种基于改进TimeGAN模型的小样本故障诊断方法
技术领域
本发明属于故障诊断技术领域,具体涉及一种基于改进TimeGAN模型的小样本故障诊断方法。
背景技术
近年来,随着经济飞速发展,居民的日常用电设备使用量也大幅上升,如电梯。故障存在于人们日常使用的每一个设备中,很多设备结构复杂难以排查故障且潜在威胁大,一旦发生故障难免造成巨大损失。此外,故障样本稀缺、振动信号复杂等问题也降低了故障诊断的精度。因此,在电梯日常使用环节对潜在故障进行诊断和预测,及时预防故障的发生,对维护居民的生命和财产安全具有重要意义。
目前,随着大数据和人工智能技术的发展,故障诊断也得到了广泛研究。但人工智能算法模型是由数据驱动的,因此结合相关算法实现故障诊断和预测往往需要海量的数据,尤其是故障数据。而电梯设备的特殊性使得很难采集到故障数据,也就无法保证有足够的训练样本支撑模型训练,所以样本生成和扩充的相关研究愈发广泛。生成对抗网络(Generative adversarial networks,GAN)、最小二乘对抗网络(Least SquareGenerative adversarial networks,LSGAN)、深度卷积生成对抗网络(DeepConvolutional Generative adversarial networks,DCGAN)等生成模型可以生成所需图片,因此被广泛应用于图片扩充和还原中。由于故障诊断中的样本通常为一维数据,相关研究先将样本转换为二维图片,再利用生成模型扩充图片,最后输入到相关算法中进行训练得到诊断结果。这些方法解决了训练样本不足的问题,但是它们没有充分考虑振动信号之间特有的时间相关性,传统生成模型无法确保网络能动态有效地捕获信号中的逐步依赖关系,也没有充分利用振动信号的时域、频域和空间域特征。因此,亟需开发新的电梯故障诊断方法,实现高效准确故障诊断及智能化的设备安全维护。
发明内容
本发明的目的在于针对上述问题,提出一种基于改进TimeGAN模型的小样本故障诊断方法,该方法通过生成具备时序特征的故障样本,降低原始数据分布的不平衡性,并充分提取样本的时频特征,获得高效准确的故障诊断结果,从而实现智能化设备的安全维护。
为实现上述目的,本发明所采取的技术方案为:
本发明提出的一种基于改进TimeGAN模型的小样本故障诊断方法,包括如下步骤:
S1、采集电梯运行数据,电梯运行数据包括正常样本和故障样本;
S2、建立改进TimeGAN模型,改进TimeGAN模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,嵌入函数基于循环网络实现;
恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,恢复函数基于前馈网络实现;
序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,生成函数基于循环网络实现;
序列判别器利用判别函数接收合成潜在编码,返回分类结果,判别函数基于带有前馈输出层的双向循环网络实现;
改进TimeGAN模型的损失函数包括重建损失lR、对抗损失lU和监督损失lS,并构建如下目标函数:
Figure BDA0003594692650000021
Figure BDA0003594692650000022
Figure BDA0003594692650000023
Figure BDA0003594692650000024
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,
Figure BDA0003594692650000031
为恢复后的静态特征向量,xt为t时刻的时态特征向量,
Figure BDA0003594692650000032
为恢复后的t时刻的时态特征向量,yS为真实静态特征分类结果,yt为t时刻的真实时态特征分类结果,
Figure BDA0003594692650000033
为生成的静态特征分类结果,
Figure BDA0003594692650000034
为t时刻生成的时态特征分类结果,hS为潜在静态表征,ht为t时刻的潜在时态表征,ht-1为t-1时刻的潜在时态表征,zt为t时刻的时态随机向量,gχ为时态特征生成网络,
Figure BDA0003594692650000035
为服从随机变量s,x1:T概率分布P的期望,
Figure BDA0003594692650000036
为服从随机变量s,x1:T生成概率分布
Figure BDA0003594692650000037
的期望;
S3、将故障样本输入改进TimeGAN模型生成故障数据;
S4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征,小波包分解包括分解操作和重构操作,具体如下:
1)设输入信号为离散信号
Figure BDA0003594692650000038
分解操作计算如下:
Figure BDA0003594692650000039
其中,n为离散时间序列,k为时移因子,N为尺度因子,i为层数,
Figure BDA00035946926500000310
Figure BDA00035946926500000311
为待分解的分量(0≤i≤2N-1),
Figure BDA00035946926500000312
为低频时小波包系数,
Figure BDA00035946926500000313
为高频时小波包系数,h0(·)为低通滤波器,g0(·)为高通滤波器;
2)重构操作计算如下:
Figure BDA00035946926500000314
其中,
Figure BDA00035946926500000315
为低频信号分量,
Figure BDA00035946926500000316
为高频信号分量,h1(·)为高通滤波器,g1(·)为低通滤波器;
S5、将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练,获得训练好的CNN模型;
S6、将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。
优选地,CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
优选地,各池化层为最大池化层,各卷积层和全连接层的输出端还设有激活函数,激活函数为ReLU函数,输出层选用SoftMax分类器。
优选地,小波包分解采用db3小波基。
优选地,目标函数满足λ=1,η=10。
与现有技术相比,本发明的有益效果为:
该方法将最小二乘损失函数引入时间序列生成对抗网络(TimeGAN)改善模型的目标函数,生成具备时序特征的故障样本,降低原始数据分布的不平衡性,解决样本不足问题;并利用小波包分解扩充后的样本,计算各节点的小波包系数并重构信号,充分提取样本的时频特征;最后结合CNN模型强大的空间特征提取能力提取信号空间特征,建立故障诊断模型,实现高效准确的故障诊断,从而实现智能化设备的安全维护。
附图说明
图1为本发明基于改进TimeGAN模型的小样本故障诊断方法的流程图;
图2为本发明小波包分解提取的时频特征示意图;
图3为本发明的CNN模型结构示意图;
图4为本发明所提方法、BP、LSTM、GAN+CNN和WPD+BP五种方法的准确率对比图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本申请。
如图1-4所示,一种基于改进TimeGAN模型的小样本故障诊断方法,包括如下步骤:
S1、采集电梯运行数据,电梯运行数据包括正常样本和故障样本。电梯运行数据可通过加速度传感器采集获得。
S2、建立改进TimeGAN模型,改进TimeGAN模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,嵌入函数基于循环网络实现;
恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,恢复函数基于前馈网络实现;
序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,生成函数基于循环网络实现;
序列判别器利用判别函数接收合成潜在编码,返回分类结果,判别函数基于带有前馈输出层的双向循环网络实现;
改进TimeGAN模型的损失函数包括重建损失lR、对抗损失lU和监督损失lS,并构建如下目标函数:
Figure BDA0003594692650000051
Figure BDA0003594692650000052
Figure BDA0003594692650000053
Figure BDA0003594692650000054
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,
Figure BDA0003594692650000061
为恢复后的静态特征向量,xt为t时刻的时态特征向量,
Figure BDA0003594692650000062
为恢复后的t时刻的时态特征向量,yS为真实静态特征分类结果,yt为t时刻的真实时态特征分类结果,
Figure BDA0003594692650000063
为生成的静态特征分类结果,
Figure BDA0003594692650000064
为t时刻生成的时态特征分类结果,hS为潜在静态表征,ht为t时刻的潜在时态表征,ht-1为t-1时刻的潜在时态表征,zt为t时刻的时态随机向量,gχ为时态特征生成网络,
Figure BDA0003594692650000065
为服从随机变量s,x1:T概率分布P的期望,
Figure BDA0003594692650000066
为服从随机变量s,x1:T生成概率分布
Figure BDA0003594692650000067
的期望。
在一实施例中,目标函数满足λ=1,η=10。
其中,该方法通过结合TimeGAN模型和最小二乘对抗网络(Least SquareGenerative adversarial networks,LSGAN)中的最小二乘损失函数得到LS-Time GAN模型(即改进TimeGAN模型),改进TimeGAN模型包括:嵌入网络(Embedding network)、恢复网络(Recovery network)、序列生成器和序列判别器。嵌入网络和恢复网络作为自编码组件与作为对抗组件的序列生成器和序列判别器联合训练,以使模型在随时间迭代的过程中同时学习特征分布和变量间潜在关系。嵌入网络为对抗网络(序列生成器和序列判别器)提供了潜在空间(Latent Space),真实数据和生成数据的潜在动态关联性(Temporal Dynamics)通过监督损失实现同步,具体如下:
2.1)嵌入网络和恢复网络
嵌入函数和恢复函数提供了特征和潜在空间之间的映射,允许对抗网络通过低维表示来学习数据之间的潜在时间动态。
设HS、Hχ分别为静态特征向量空间S和时态特征向量空间χ对应的潜在向量空间,嵌入函数e:S×Πtχ→HS×ΠtHχ将静态特征和时态特征转化为潜在表征(LatentRepresentations)hS,h1:T=e(s,x1:T),嵌入函数e通过循环网络实现:
hS=eS(s), ht=eχ(hS,ht-1,xt) (1)
其中,eS:S→HS为静态特征的嵌入网络,eχ:HS×Hχ×χ→Hχ为时间特征的嵌入网络,hS为潜在静态表征,ht为t时刻的潜在时态表征,h1:T为[1,T]区间的潜在时态表征集合,T为时间,s为静态特征向量,x1:T为[1,T]区间的时态特征向量集合,ht-1为t-1时刻的潜在时态表征,xt为t时刻的时态特征向量。
与之相反,恢复函数r:HS×ΠtHχ→S×Πtχ将潜在表征hS,h1:T=e(s,x1:T)恢复为它们原本的静态特征和时态特征,结果表示为
Figure BDA0003594692650000071
恢复函数r通过前馈网络实现:
Figure BDA0003594692650000072
其中,rS:HS→S为静态特征嵌入的恢复网络,rχ:Hχ→χ为时态特征嵌入的恢复网络,
Figure BDA0003594692650000073
为恢复后的静态特征向量,
Figure BDA0003594692650000074
为恢复后的t时刻的时态特征向量,
Figure BDA0003594692650000075
为恢复后的[1,T]区间的时态特征向量集合。
2.2)序列生成器和序列判别器
序列生成器不直接在特征空间输出生成数据,而是先输出到嵌入网络的输出空间。设ZS,Zχ分别表示已知分布的静态特征向量空间和时态特征向量空间,并从中提取随机向量作为静态随机向量和时态随机向量输入生成HS,Hχ
然后生成函数g:ZS×ПtZχ→HS×ПtHχ将静态随机向量和时态随机向量转换为合成潜在编码
Figure BDA0003594692650000076
生成函数g通过循环网络实现:
Figure BDA0003594692650000077
其中,gS:ZS→HS为静态特征生成网络,gχ:HS×Hχ×Zχ→Hχ为时态特征生成网络,
Figure BDA0003594692650000078
为合成潜在静态表征,
Figure BDA0003594692650000079
为[1,T]区间的合成时态特征向量集合,zS为静态随机向量,z1:T为[1,T]区间的时态随机向量集合,
Figure BDA0003594692650000081
为t时刻的合成潜在时态表征,
Figure BDA0003594692650000082
为t-1时刻的合成潜在时态表征,zt为t时刻的时态随机向量,遵循随机过程。
最后,序列判别器也从嵌入网络的输出空间进行操作。判别函数d:HS×ПtHχ→[0,1]×Пt[0,1]接收合成潜在编码,返回分类结果
Figure BDA0003594692650000083
d通过一个带有前馈输出层的双向循环网络实现:
Figure BDA0003594692650000084
其中,
Figure BDA0003594692650000085
Figure BDA0003594692650000086
分别表示前向和后向隐藏状态序列,
Figure BDA0003594692650000087
为前向循环函数,
Figure BDA0003594692650000088
为后向循环函数,dS为静态特征输出层分类函数,dχ为时态特征输出层分类函数,
Figure BDA0003594692650000089
为静态特征分类结果,
Figure BDA00035946926500000810
为t时刻的时态特征分类结果,
Figure BDA00035946926500000811
为[1,T]区间的时态特征分类结果集合,
Figure BDA00035946926500000812
代表hS
Figure BDA00035946926500000813
Figure BDA00035946926500000814
代表h1:T
Figure BDA00035946926500000815
Figure BDA00035946926500000816
表示真实数据的(h*)或合成数据的
Figure BDA00035946926500000817
嵌入;类似地,
Figure BDA00035946926500000818
表示真实数据(y*)或合成数据
Figure BDA00035946926500000819
的分类结果,*号表示任意下标,真实数据(原始数据)即采集的电梯运行数据。
2.3)目标函数
作为特征空间和潜在空间之间的可逆映射,嵌入函数应该能够从原始数据s,x1:T中提取其潜在表征hS,h1:T,恢复函数能从其潜在表征hS,h1:T中精确重构原始数据的特征分布
Figure BDA00035946926500000820
目标函数总体定义为:
Figure BDA00035946926500000821
其中,θe、θr、θg、θd分别表示嵌入网络、恢复网络、序列生成器和序列判别器的参数。λ≥0、η≥0是分别平衡两种损失的超参数,本实施例设λ=1,η=10。
其中,重建损失(Reconstruction Loss)计算如下:
Figure BDA00035946926500000822
对抗损失采用最小二乘损失函数,计算如下:
Figure BDA0003594692650000091
现有技术对抗损失采用交叉熵损失只关注分类结果是否正确,并不关注距离,所以很容易达到饱和状态,而最小二乘损失只在一点达到饱和,可以使训练过程更加稳定,生成数据质量更高;
应用最大似然法定义监督损失(Supervised Loss):
Figure BDA0003594692650000092
其中,当对抗损失lU推动生成器创建逼真的序列,监督损失lS进一步确保它产生类似的逐步依赖关系。
S3、将故障样本输入改进TimeGAN模型生成故障数据。
具体地,表1是改进TimeGAN、TimeGAN和1DGAN三种方法的判别分数(Discriminative Score)和预测分数(Predictive Score)。判别分数和预测分数是定性度量生成数据与原始数据之间差异性的指标,数值越小说明两者越接近。
表1
Figure BDA0003594692650000093
从表1可以看出,与其他方法相比,本申请的改进TimeGAN在原始数据与生成数据的判别分数和预测分数上得分更低,说明它生成的数据与原始数据差距最小,质量和实用性也更好。
S4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征,小波包分解包括分解操作和重构操作,具体如下:
1)设输入信号为离散信号
Figure BDA0003594692650000101
分解操作计算如下:
Figure BDA0003594692650000102
其中,n为离散时间序列,k为时移因子,N为尺度因子,i.e.为层数,
Figure BDA0003594692650000103
Figure BDA0003594692650000104
表示待分解的分量(0≤i≤2N-1),
Figure BDA0003594692650000105
Figure BDA0003594692650000106
为小波包系数,h0(·)为低通滤波器,g0(·)为高通滤波器;
2)重构操作计算如下:
Figure BDA0003594692650000107
其中,
Figure BDA0003594692650000108
Figure BDA0003594692650000109
为信号分量,h1(·)为高通滤波器,g1(·)为低通滤波器。
其中,小波包分解可以同时分解信号的低频和高频部分,适用于处理具有高频扰动和强背景噪声的非平稳振动信号。小波包是为了克服小波分解在高频段分辨率较差、而在低频段分辨率较好的问题提出的,是一种更精细的信号分析方法,提高了信号的时频分辨率。
在一实施例中,小波包分解采用db3小波基。
其中,将原始数据和生成的故障数据合并为样本集,并利用小波包分解(WaveletPacket Decomposition,WPD)经过分解运算得到小波包系数后,再进行重构运算得到分量,提取样本集的时频特征。
具体的:运用db3小波基,对电梯运行数据(如电梯振动信号)进行3层小波包分解重构,得到8个故障特征值组成的特征向量
Figure BDA00035946926500001010
Figure BDA00035946926500001011
如图2所示,时频特征包括各节点频段信号及对应频谱,左侧为经过重构的各节点频段信号,右侧为相应的傅里叶频谱。
本实施例采用的传感器采样频率为512Hz,根据香农采样定理,奈奎斯特采样频率为256Hz,信号经过小波包三层分解后包含2^3=8个频率段,每个频率段的频率区间为256/8=32Hz,因此经过小波包分解后的重构信号
Figure BDA0003594692650000111
应分布于[0-32Hz,32-64Hz,64-96Hz,96-128Hz,128-160Hz,160-192Hz,192-224Hz,224-256Hz]之间,和频谱图相符。而且从频谱图中可以看出各节点频谱差异较明显,频域区间重叠较少,因此小波包三层分解可以有效提取电梯振动信号的时频特征。
S5、将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练,获得训练好的CNN模型。
在一实施例中,CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
在一实施例中,各池化层为最大池化层,各卷积层和全连接层的输出端还设有激活函数,激活函数为ReLU函数,输出层选用SoftMax分类器。
具体地,CNN模型如图3所示,输入特征图(即时频特征)的大小为100×100×3;第一到第四卷积层的卷积核个数分别为32、64、128和128,第一和第二卷积层的卷积核大小为5×5,第三和第四卷积层的卷积核大小为3×3,激活函数选择ReLU函数;池化层的池化方式选择最大池化,即对输入特征图求其p×p区域内的最大值,区域大小取2×2;第一全连接层的节点数为1024,第二全连接层的节点数为512;输出层节点数为输入样本数的类别数,分类器选择SoftMax分类。
表2为不同数量原始样本添加不同数量生成样本后,提取的时频特征输入CNN模型的准确率。其中,CNN模型学习率统一设为0.001,训练集与测试集比例为4:1,步长为8。
表2
Figure BDA0003594692650000112
Figure BDA0003594692650000121
从表2可以看出,样本总数量相近时不平衡比例越低训练效果越好,不平衡比例相同时样本越多训练效果越好。从样本集1的训练结果可以看出,虽然数据量过少时训练集准确率能达到91%,但是模型泛化性差,测试集准确率只有75%,验证了样本扩充的必要性。样本集3和4的准确率差别较小,说明了生成样本与原始样本差异较小,再次证明了改进TimeGAN的有效性。样本集10的准确率并没有达到平衡样本的效果,相较于不平衡比例相同但样本数较少的样本集1、3、4、7,准确率反而下降。这是由于生成器模型本身也存在误差,当生成样本数多于原始数据时可能会使误差增大,造成适得其反的效果,因此往往生成样本数和原始样本数相等时就停止扩充样本。综上,添加512个生成样本至训练集的训练效果最好,因此训练集准确率对比实验采用样本集7作为训练集。
参照图4,BP神经网络训练周期最长且准确率最低,LSTM训练周期最短但准确率同样不高,原始GAN和CNN结合方法的准确率可达到94.41%,相较于CNN模型略有提升,WPD+BP神经网络的效果较好,准确率为95.75%,比BP神经网络提高了近6%,验证了WPD的有效性。和以上四种方法相比,本文方法结合了生成模型(TimeGAN模型)、WPD和CNN的优势,在数据集相同情况下,训练准确率达到了99.01%,显著提升了模型训练效果。
S6、将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。
表3为不同方法不同样本下的平均测试准确率,测试集准确率可以反映模型的泛化能力,也是判断模型最终故障诊断效果的重要指标。
表3
Figure BDA0003594692650000122
Figure BDA0003594692650000131
从表3可以看出,极限学习机(Extreme Learning Machine,ELM)算法的准确率最低,只有79.76%,BP神经网络次之;而经过WPD分解后,BP神经网络准确率提升至94.05%,优于其他算法,说明了BP、LSTM、SVM等浅层机器学习算法难以充分提取振动信号中的特征,以及WPD在特征提取方面的优势;CNN模型的准确率高于其他浅层机器学习算法,验证了其强大的特征提取能力;而经过原始GAN扩充样本后再输入到CNN中分类的准确率并没有提升,甚至有所下降,因为原始GAN等生成模型虽然能生成以假乱真的图片,但是无法考虑振动信号间的时序关系,难以处理一维数据。本方法在平衡样本集和不平衡样本集下的准确率均高于其他方法,在样本集7下的准确率达到95.19%,相较于样本扩充和WPD处理前有明显提升,充分体现了本申请基于改进TimeGAN模型的小样本故障诊断方法的有效性。
本申请基于改进TimeGAN模型的小样本故障诊断方法将最小二乘损失函数引入时间序列生成对抗网络(TimeGAN)改善模型的目标函数,生成具备时序特征的故障样本,降低原始数据分布的不平衡性,解决样本不足问题;并利用小波包分解扩充后的样本,计算各节点的小波包系数并重构信号,充分提取样本的时频特征;最后结合CNN卷积神经网络强大的空间特征提取能力提取信号空间特征,建立故障诊断模型,实现高效准确的故障诊断,从而实现智能化设备的安全维护。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请描述较为具体和详细的实施例,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (5)

1.一种基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述基于改进TimeGAN模型的小样本故障诊断方法包括如下步骤:
S1、采集电梯运行数据,所述电梯运行数据包括正常样本和故障样本;
S2、建立改进TimeGAN模型,所述改进TimeGAN模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
所述嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,所述嵌入函数基于循环网络实现;
所述恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,所述恢复函数基于前馈网络实现;
所述序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,所述生成函数基于循环网络实现;
所述序列判别器利用判别函数接收合成潜在编码,返回分类结果,所述判别函数基于带有前馈输出层的双向循环网络实现;
所述改进TimeGAN模型的损失函数包括重建损失
Figure FDA0003594692640000019
对抗损失
Figure FDA0003594692640000017
和监督损失
Figure FDA0003594692640000018
并构建如下目标函数:
Figure FDA0003594692640000011
Figure FDA0003594692640000012
Figure FDA0003594692640000013
Figure FDA0003594692640000014
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,
Figure FDA0003594692640000015
为恢复后的静态特征向量,xt为t时刻的时态特征向量,
Figure FDA0003594692640000016
为恢复后的t时刻的时态特征向量,yS为真实静态特征分类结果,yt为t时刻的真实时态特征分类结果,
Figure FDA0003594692640000021
为生成的静态特征分类结果,
Figure FDA0003594692640000022
为t时刻生成的时态特征分类结果,hS为潜在静态表征,ht为t时刻的潜在时态表征,ht-1为t-1时刻的潜在时态表征,zt为t时刻的时态随机向量,gχ为时态特征生成网络,
Figure FDA0003594692640000023
为服从随机变量s,x1:T概率分布P的期望,
Figure FDA0003594692640000024
为服从随机变量s,x1:T生成概率分布
Figure FDA0003594692640000025
的期望;
S3、将故障样本输入所述改进TimeGAN模型生成故障数据;
S4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取所述样本集的时频特征,所述小波包分解包括分解操作和重构操作,具体如下:
1)设输入信号为离散信号
Figure FDA0003594692640000026
分解操作计算如下:
Figure FDA0003594692640000027
其中,n为离散时间序列,k为时移因子,N为尺度因子,i为层数,n,k,
Figure FDA0003594692640000028
Figure FDA0003594692640000029
为待分解的分量(0≤i≤2N-1),
Figure FDA00035946926400000210
为低频时小波包系数,
Figure FDA00035946926400000211
为高频时小波包系数,h0(·)为低通滤波器,g0(·)为高通滤波器;
2)重构操作计算如下:
Figure FDA00035946926400000212
其中,
Figure FDA00035946926400000213
为低频信号分量,
Figure FDA00035946926400000214
为高频信号分量,h1(·)为高通滤波器,g1(·)为低通滤波器;
S5、将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练,获得训练好的CNN模型;
S6、将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。
2.如权利要求1所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
3.如权利要求2所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:各所述池化层为最大池化层,各所述卷积层和全连接层的输出端还设有激活函数,所述激活函数为ReLU函数,所述输出层选用SoftMax分类器。
4.如权利要求1所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述小波包分解采用db3小波基。
5.如权利要求1所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述目标函数满足λ=1,η=10。
CN202210388562.2A 2022-04-13 2022-04-13 一种基于改进TimeGAN模型的小样本故障诊断方法 Pending CN114692506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210388562.2A CN114692506A (zh) 2022-04-13 2022-04-13 一种基于改进TimeGAN模型的小样本故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210388562.2A CN114692506A (zh) 2022-04-13 2022-04-13 一种基于改进TimeGAN模型的小样本故障诊断方法

Publications (1)

Publication Number Publication Date
CN114692506A true CN114692506A (zh) 2022-07-01

Family

ID=82142293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210388562.2A Pending CN114692506A (zh) 2022-04-13 2022-04-13 一种基于改进TimeGAN模型的小样本故障诊断方法

Country Status (1)

Country Link
CN (1) CN114692506A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837002A (zh) * 2021-08-18 2021-12-24 西安理工大学 基于改进TimeGan模型的小样本数据故障诊断方法
CN115169506A (zh) * 2022-09-06 2022-10-11 中铁第四勘察设计院集团有限公司 一种供变电关键设备故障快速诊断方法及系统
CN115356599A (zh) * 2022-10-21 2022-11-18 国网天津市电力公司城西供电分公司 一种多模态城市电网故障诊断方法及系统
CN115659224A (zh) * 2022-11-07 2023-01-31 苏州大学 概率引导的域对抗轴承故障诊断方法及系统
CN116701948A (zh) * 2023-08-03 2023-09-05 东北石油大学三亚海洋油气研究院 管道故障诊断方法及系统、存储介质和管道故障诊断设备
CN117354058A (zh) * 2023-12-04 2024-01-05 武汉安域信息安全技术有限公司 基于时间序列预测的工控网络apt攻击检测系统及方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837002A (zh) * 2021-08-18 2021-12-24 西安理工大学 基于改进TimeGan模型的小样本数据故障诊断方法
CN113837002B (zh) * 2021-08-18 2024-04-23 西安理工大学 基于改进TimeGan模型的小样本数据故障诊断方法
CN115169506A (zh) * 2022-09-06 2022-10-11 中铁第四勘察设计院集团有限公司 一种供变电关键设备故障快速诊断方法及系统
CN115356599A (zh) * 2022-10-21 2022-11-18 国网天津市电力公司城西供电分公司 一种多模态城市电网故障诊断方法及系统
CN115356599B (zh) * 2022-10-21 2023-04-07 国网天津市电力公司城西供电分公司 一种多模态城市电网故障诊断方法及系统
CN115659224A (zh) * 2022-11-07 2023-01-31 苏州大学 概率引导的域对抗轴承故障诊断方法及系统
CN115659224B (zh) * 2022-11-07 2023-08-25 苏州大学 概率引导的域对抗轴承故障诊断方法及系统
CN116701948A (zh) * 2023-08-03 2023-09-05 东北石油大学三亚海洋油气研究院 管道故障诊断方法及系统、存储介质和管道故障诊断设备
CN116701948B (zh) * 2023-08-03 2024-01-23 东北石油大学三亚海洋油气研究院 管道故障诊断方法及系统、存储介质和管道故障诊断设备
CN117354058A (zh) * 2023-12-04 2024-01-05 武汉安域信息安全技术有限公司 基于时间序列预测的工控网络apt攻击检测系统及方法

Similar Documents

Publication Publication Date Title
CN114692506A (zh) 一种基于改进TimeGAN模型的小样本故障诊断方法
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN109000930B (zh) 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法
CN109884419B (zh) 一种智慧电网电能质量在线故障诊断方法
JP7441553B2 (ja) ローリング時系列及びサポートベクトルマシンに基づく短期風速の予測方法及びシステム
CN109214356A (zh) 一种基于dcnn模型的风机传动系统故障智能诊断方法
CN110161343A (zh) 一种智能列车外部受电装置的非侵入式实时动态监测方法
CN114970774B (zh) 一种智能变压器故障预测方法和装置
CN111582551A (zh) 风电场短期风速预测方法、系统及电子设备
CN115114965B (zh) 风电机组齿轮箱故障诊断方法、装置、设备及存储介质
CN113688869A (zh) 一种基于生成对抗网络的光伏数据缺失重构方法
CN117892207B (zh) 多元强相关信号数据增强和数据均衡方法
CN116863959B (zh) 一种基于生成对抗网络的海豚叫声生成方法
CN110222386A (zh) 一种行星齿轮退化状态识别方法
Zhu et al. Wind Speed Short-Term Prediction Based on Empirical Wavelet Transform, Recurrent Neural Network and Error Correction
Shen et al. Time series data augmentation classifier for industrial process imbalanced fault diagnosis
CN117668609A (zh) 基于RTSGAN-CatBoost的故障分类方法
CN115356599B (zh) 一种多模态城市电网故障诊断方法及系统
CN114547976B (zh) 基于金字塔变分自编码器的多采样率数据软测量建模方法
CN114383845B (zh) 一种基于嵌入式零样本学习模型的轴承复合故障诊断方法
Aihong et al. Notice of Retraction: Fault diagnosis based on adaptive genetic algorithm and BP neural network
CN112633371A (zh) 一种基于vmd-msst的轴承故障诊断方法
Xiaosheng et al. Short-Term wind power prediction based on wavelet transform and convolutional neural networks
Lin et al. Data Augmentation for Industrial Multivariate Time Series via a Spatial and Frequency Domain Knowledge GAN
Li et al. Research of Gearbox Failure Diagnosis Based On Nerve Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination