CN114692506A - 一种基于改进TimeGAN模型的小样本故障诊断方法 - Google Patents
一种基于改进TimeGAN模型的小样本故障诊断方法 Download PDFInfo
- Publication number
- CN114692506A CN114692506A CN202210388562.2A CN202210388562A CN114692506A CN 114692506 A CN114692506 A CN 114692506A CN 202210388562 A CN202210388562 A CN 202210388562A CN 114692506 A CN114692506 A CN 114692506A
- Authority
- CN
- China
- Prior art keywords
- time
- model
- temporal
- network
- timegan
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000003745 diagnosis Methods 0.000 title claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 25
- 238000009826 distribution Methods 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims abstract description 12
- 230000006870 function Effects 0.000 claims description 67
- 230000002123 temporal effect Effects 0.000 claims description 61
- 239000013598 vector Substances 0.000 claims description 49
- 230000003068 static effect Effects 0.000 claims description 44
- 238000011084 recovery Methods 0.000 claims description 27
- 238000011176 pooling Methods 0.000 claims description 18
- 238000012512 characterization method Methods 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 7
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 2
- 230000002829 reductive effect Effects 0.000 abstract description 5
- 238000012423 maintenance Methods 0.000 abstract description 4
- 238000013527 convolutional neural network Methods 0.000 description 22
- 230000000694 effects Effects 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 238000013256 Gubra-Amylin NASH model Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种基于改进TimeGAN模型的小样本故障诊断方法,包括:采集电梯运行数据,包括正常样本和故障样本;建立改进TimeGAN模型;将故障样本输入改进TimeGAN模型生成故障数据;将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征;将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练;将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。该方法通过生成具备时序特征的故障样本,降低原始数据分布不平衡性,并充分提取样本的时频特征,获得高效准确的故障诊断结果,从而实现智能化设备的安全维护。
Description
技术领域
本发明属于故障诊断技术领域,具体涉及一种基于改进TimeGAN模型的小样本故障诊断方法。
背景技术
近年来,随着经济飞速发展,居民的日常用电设备使用量也大幅上升,如电梯。故障存在于人们日常使用的每一个设备中,很多设备结构复杂难以排查故障且潜在威胁大,一旦发生故障难免造成巨大损失。此外,故障样本稀缺、振动信号复杂等问题也降低了故障诊断的精度。因此,在电梯日常使用环节对潜在故障进行诊断和预测,及时预防故障的发生,对维护居民的生命和财产安全具有重要意义。
目前,随着大数据和人工智能技术的发展,故障诊断也得到了广泛研究。但人工智能算法模型是由数据驱动的,因此结合相关算法实现故障诊断和预测往往需要海量的数据,尤其是故障数据。而电梯设备的特殊性使得很难采集到故障数据,也就无法保证有足够的训练样本支撑模型训练,所以样本生成和扩充的相关研究愈发广泛。生成对抗网络(Generative adversarial networks,GAN)、最小二乘对抗网络(Least SquareGenerative adversarial networks,LSGAN)、深度卷积生成对抗网络(DeepConvolutional Generative adversarial networks,DCGAN)等生成模型可以生成所需图片,因此被广泛应用于图片扩充和还原中。由于故障诊断中的样本通常为一维数据,相关研究先将样本转换为二维图片,再利用生成模型扩充图片,最后输入到相关算法中进行训练得到诊断结果。这些方法解决了训练样本不足的问题,但是它们没有充分考虑振动信号之间特有的时间相关性,传统生成模型无法确保网络能动态有效地捕获信号中的逐步依赖关系,也没有充分利用振动信号的时域、频域和空间域特征。因此,亟需开发新的电梯故障诊断方法,实现高效准确故障诊断及智能化的设备安全维护。
发明内容
本发明的目的在于针对上述问题,提出一种基于改进TimeGAN模型的小样本故障诊断方法,该方法通过生成具备时序特征的故障样本,降低原始数据分布的不平衡性,并充分提取样本的时频特征,获得高效准确的故障诊断结果,从而实现智能化设备的安全维护。
为实现上述目的,本发明所采取的技术方案为:
本发明提出的一种基于改进TimeGAN模型的小样本故障诊断方法,包括如下步骤:
S1、采集电梯运行数据,电梯运行数据包括正常样本和故障样本;
S2、建立改进TimeGAN模型,改进TimeGAN模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,嵌入函数基于循环网络实现;
恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,恢复函数基于前馈网络实现;
序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,生成函数基于循环网络实现;
序列判别器利用判别函数接收合成潜在编码,返回分类结果,判别函数基于带有前馈输出层的双向循环网络实现;
改进TimeGAN模型的损失函数包括重建损失lR、对抗损失lU和监督损失lS,并构建如下目标函数:
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,为恢复后的静态特征向量,xt为t时刻的时态特征向量,为恢复后的t时刻的时态特征向量,yS为真实静态特征分类结果,yt为t时刻的真实时态特征分类结果,为生成的静态特征分类结果,为t时刻生成的时态特征分类结果,hS为潜在静态表征,ht为t时刻的潜在时态表征,ht-1为t-1时刻的潜在时态表征,zt为t时刻的时态随机向量,gχ为时态特征生成网络,为服从随机变量s,x1:T概率分布P的期望,为服从随机变量s,x1:T生成概率分布的期望;
S3、将故障样本输入改进TimeGAN模型生成故障数据;
S4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征,小波包分解包括分解操作和重构操作,具体如下:
2)重构操作计算如下:
S5、将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练,获得训练好的CNN模型;
S6、将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。
优选地,CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
优选地,各池化层为最大池化层,各卷积层和全连接层的输出端还设有激活函数,激活函数为ReLU函数,输出层选用SoftMax分类器。
优选地,小波包分解采用db3小波基。
优选地,目标函数满足λ=1,η=10。
与现有技术相比,本发明的有益效果为:
该方法将最小二乘损失函数引入时间序列生成对抗网络(TimeGAN)改善模型的目标函数,生成具备时序特征的故障样本,降低原始数据分布的不平衡性,解决样本不足问题;并利用小波包分解扩充后的样本,计算各节点的小波包系数并重构信号,充分提取样本的时频特征;最后结合CNN模型强大的空间特征提取能力提取信号空间特征,建立故障诊断模型,实现高效准确的故障诊断,从而实现智能化设备的安全维护。
附图说明
图1为本发明基于改进TimeGAN模型的小样本故障诊断方法的流程图;
图2为本发明小波包分解提取的时频特征示意图;
图3为本发明的CNN模型结构示意图;
图4为本发明所提方法、BP、LSTM、GAN+CNN和WPD+BP五种方法的准确率对比图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是在于限制本申请。
如图1-4所示,一种基于改进TimeGAN模型的小样本故障诊断方法,包括如下步骤:
S1、采集电梯运行数据,电梯运行数据包括正常样本和故障样本。电梯运行数据可通过加速度传感器采集获得。
S2、建立改进TimeGAN模型,改进TimeGAN模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,嵌入函数基于循环网络实现;
恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,恢复函数基于前馈网络实现;
序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,生成函数基于循环网络实现;
序列判别器利用判别函数接收合成潜在编码,返回分类结果,判别函数基于带有前馈输出层的双向循环网络实现;
改进TimeGAN模型的损失函数包括重建损失lR、对抗损失lU和监督损失lS,并构建如下目标函数:
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,为恢复后的静态特征向量,xt为t时刻的时态特征向量,为恢复后的t时刻的时态特征向量,yS为真实静态特征分类结果,yt为t时刻的真实时态特征分类结果,为生成的静态特征分类结果,为t时刻生成的时态特征分类结果,hS为潜在静态表征,ht为t时刻的潜在时态表征,ht-1为t-1时刻的潜在时态表征,zt为t时刻的时态随机向量,gχ为时态特征生成网络,为服从随机变量s,x1:T概率分布P的期望,为服从随机变量s,x1:T生成概率分布的期望。
在一实施例中,目标函数满足λ=1,η=10。
其中,该方法通过结合TimeGAN模型和最小二乘对抗网络(Least SquareGenerative adversarial networks,LSGAN)中的最小二乘损失函数得到LS-Time GAN模型(即改进TimeGAN模型),改进TimeGAN模型包括:嵌入网络(Embedding network)、恢复网络(Recovery network)、序列生成器和序列判别器。嵌入网络和恢复网络作为自编码组件与作为对抗组件的序列生成器和序列判别器联合训练,以使模型在随时间迭代的过程中同时学习特征分布和变量间潜在关系。嵌入网络为对抗网络(序列生成器和序列判别器)提供了潜在空间(Latent Space),真实数据和生成数据的潜在动态关联性(Temporal Dynamics)通过监督损失实现同步,具体如下:
2.1)嵌入网络和恢复网络
嵌入函数和恢复函数提供了特征和潜在空间之间的映射,允许对抗网络通过低维表示来学习数据之间的潜在时间动态。
设HS、Hχ分别为静态特征向量空间S和时态特征向量空间χ对应的潜在向量空间,嵌入函数e:S×Πtχ→HS×ΠtHχ将静态特征和时态特征转化为潜在表征(LatentRepresentations)hS,h1:T=e(s,x1:T),嵌入函数e通过循环网络实现:
hS=eS(s), ht=eχ(hS,ht-1,xt) (1)
其中,eS:S→HS为静态特征的嵌入网络,eχ:HS×Hχ×χ→Hχ为时间特征的嵌入网络,hS为潜在静态表征,ht为t时刻的潜在时态表征,h1:T为[1,T]区间的潜在时态表征集合,T为时间,s为静态特征向量,x1:T为[1,T]区间的时态特征向量集合,ht-1为t-1时刻的潜在时态表征,xt为t时刻的时态特征向量。
2.2)序列生成器和序列判别器
序列生成器不直接在特征空间输出生成数据,而是先输出到嵌入网络的输出空间。设ZS,Zχ分别表示已知分布的静态特征向量空间和时态特征向量空间,并从中提取随机向量作为静态随机向量和时态随机向量输入生成HS,Hχ。
其中,gS:ZS→HS为静态特征生成网络,gχ:HS×Hχ×Zχ→Hχ为时态特征生成网络,为合成潜在静态表征,为[1,T]区间的合成时态特征向量集合,zS为静态随机向量,z1:T为[1,T]区间的时态随机向量集合,为t时刻的合成潜在时态表征,为t-1时刻的合成潜在时态表征,zt为t时刻的时态随机向量,遵循随机过程。
其中,和分别表示前向和后向隐藏状态序列,为前向循环函数,为后向循环函数,dS为静态特征输出层分类函数,dχ为时态特征输出层分类函数,为静态特征分类结果,为t时刻的时态特征分类结果,为[1,T]区间的时态特征分类结果集合,代表hS或 代表h1:T或即表示真实数据的(h*)或合成数据的嵌入;类似地,表示真实数据(y*)或合成数据的分类结果,*号表示任意下标,真实数据(原始数据)即采集的电梯运行数据。
2.3)目标函数
其中,θe、θr、θg、θd分别表示嵌入网络、恢复网络、序列生成器和序列判别器的参数。λ≥0、η≥0是分别平衡两种损失的超参数,本实施例设λ=1,η=10。
其中,重建损失(Reconstruction Loss)计算如下:
对抗损失采用最小二乘损失函数,计算如下:
现有技术对抗损失采用交叉熵损失只关注分类结果是否正确,并不关注距离,所以很容易达到饱和状态,而最小二乘损失只在一点达到饱和,可以使训练过程更加稳定,生成数据质量更高;
应用最大似然法定义监督损失(Supervised Loss):
其中,当对抗损失lU推动生成器创建逼真的序列,监督损失lS进一步确保它产生类似的逐步依赖关系。
S3、将故障样本输入改进TimeGAN模型生成故障数据。
具体地,表1是改进TimeGAN、TimeGAN和1DGAN三种方法的判别分数(Discriminative Score)和预测分数(Predictive Score)。判别分数和预测分数是定性度量生成数据与原始数据之间差异性的指标,数值越小说明两者越接近。
表1
从表1可以看出,与其他方法相比,本申请的改进TimeGAN在原始数据与生成数据的判别分数和预测分数上得分更低,说明它生成的数据与原始数据差距最小,质量和实用性也更好。
S4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取样本集的时频特征,小波包分解包括分解操作和重构操作,具体如下:
2)重构操作计算如下:
其中,小波包分解可以同时分解信号的低频和高频部分,适用于处理具有高频扰动和强背景噪声的非平稳振动信号。小波包是为了克服小波分解在高频段分辨率较差、而在低频段分辨率较好的问题提出的,是一种更精细的信号分析方法,提高了信号的时频分辨率。
在一实施例中,小波包分解采用db3小波基。
其中,将原始数据和生成的故障数据合并为样本集,并利用小波包分解(WaveletPacket Decomposition,WPD)经过分解运算得到小波包系数后,再进行重构运算得到分量,提取样本集的时频特征。
具体的:运用db3小波基,对电梯运行数据(如电梯振动信号)进行3层小波包分解重构,得到8个故障特征值组成的特征向量 如图2所示,时频特征包括各节点频段信号及对应频谱,左侧为经过重构的各节点频段信号,右侧为相应的傅里叶频谱。
本实施例采用的传感器采样频率为512Hz,根据香农采样定理,奈奎斯特采样频率为256Hz,信号经过小波包三层分解后包含2^3=8个频率段,每个频率段的频率区间为256/8=32Hz,因此经过小波包分解后的重构信号应分布于[0-32Hz,32-64Hz,64-96Hz,96-128Hz,128-160Hz,160-192Hz,192-224Hz,224-256Hz]之间,和频谱图相符。而且从频谱图中可以看出各节点频谱差异较明显,频域区间重叠较少,因此小波包三层分解可以有效提取电梯振动信号的时频特征。
S5、将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练,获得训练好的CNN模型。
在一实施例中,CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
在一实施例中,各池化层为最大池化层,各卷积层和全连接层的输出端还设有激活函数,激活函数为ReLU函数,输出层选用SoftMax分类器。
具体地,CNN模型如图3所示,输入特征图(即时频特征)的大小为100×100×3;第一到第四卷积层的卷积核个数分别为32、64、128和128,第一和第二卷积层的卷积核大小为5×5,第三和第四卷积层的卷积核大小为3×3,激活函数选择ReLU函数;池化层的池化方式选择最大池化,即对输入特征图求其p×p区域内的最大值,区域大小取2×2;第一全连接层的节点数为1024,第二全连接层的节点数为512;输出层节点数为输入样本数的类别数,分类器选择SoftMax分类。
表2为不同数量原始样本添加不同数量生成样本后,提取的时频特征输入CNN模型的准确率。其中,CNN模型学习率统一设为0.001,训练集与测试集比例为4:1,步长为8。
表2
从表2可以看出,样本总数量相近时不平衡比例越低训练效果越好,不平衡比例相同时样本越多训练效果越好。从样本集1的训练结果可以看出,虽然数据量过少时训练集准确率能达到91%,但是模型泛化性差,测试集准确率只有75%,验证了样本扩充的必要性。样本集3和4的准确率差别较小,说明了生成样本与原始样本差异较小,再次证明了改进TimeGAN的有效性。样本集10的准确率并没有达到平衡样本的效果,相较于不平衡比例相同但样本数较少的样本集1、3、4、7,准确率反而下降。这是由于生成器模型本身也存在误差,当生成样本数多于原始数据时可能会使误差增大,造成适得其反的效果,因此往往生成样本数和原始样本数相等时就停止扩充样本。综上,添加512个生成样本至训练集的训练效果最好,因此训练集准确率对比实验采用样本集7作为训练集。
参照图4,BP神经网络训练周期最长且准确率最低,LSTM训练周期最短但准确率同样不高,原始GAN和CNN结合方法的准确率可达到94.41%,相较于CNN模型略有提升,WPD+BP神经网络的效果较好,准确率为95.75%,比BP神经网络提高了近6%,验证了WPD的有效性。和以上四种方法相比,本文方法结合了生成模型(TimeGAN模型)、WPD和CNN的优势,在数据集相同情况下,训练准确率达到了99.01%,显著提升了模型训练效果。
S6、将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。
表3为不同方法不同样本下的平均测试准确率,测试集准确率可以反映模型的泛化能力,也是判断模型最终故障诊断效果的重要指标。
表3
从表3可以看出,极限学习机(Extreme Learning Machine,ELM)算法的准确率最低,只有79.76%,BP神经网络次之;而经过WPD分解后,BP神经网络准确率提升至94.05%,优于其他算法,说明了BP、LSTM、SVM等浅层机器学习算法难以充分提取振动信号中的特征,以及WPD在特征提取方面的优势;CNN模型的准确率高于其他浅层机器学习算法,验证了其强大的特征提取能力;而经过原始GAN扩充样本后再输入到CNN中分类的准确率并没有提升,甚至有所下降,因为原始GAN等生成模型虽然能生成以假乱真的图片,但是无法考虑振动信号间的时序关系,难以处理一维数据。本方法在平衡样本集和不平衡样本集下的准确率均高于其他方法,在样本集7下的准确率达到95.19%,相较于样本扩充和WPD处理前有明显提升,充分体现了本申请基于改进TimeGAN模型的小样本故障诊断方法的有效性。
本申请基于改进TimeGAN模型的小样本故障诊断方法将最小二乘损失函数引入时间序列生成对抗网络(TimeGAN)改善模型的目标函数,生成具备时序特征的故障样本,降低原始数据分布的不平衡性,解决样本不足问题;并利用小波包分解扩充后的样本,计算各节点的小波包系数并重构信号,充分提取样本的时频特征;最后结合CNN卷积神经网络强大的空间特征提取能力提取信号空间特征,建立故障诊断模型,实现高效准确的故障诊断,从而实现智能化设备的安全维护。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请描述较为具体和详细的实施例,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (5)
1.一种基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述基于改进TimeGAN模型的小样本故障诊断方法包括如下步骤:
S1、采集电梯运行数据,所述电梯运行数据包括正常样本和故障样本;
S2、建立改进TimeGAN模型,所述改进TimeGAN模型包括嵌入网络、恢复网络、序列生成器和序列判别器,其中:
所述嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征,所述嵌入函数基于循环网络实现;
所述恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征,所述恢复函数基于前馈网络实现;
所述序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量,并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码,所述生成函数基于循环网络实现;
所述序列判别器利用判别函数接收合成潜在编码,返回分类结果,所述判别函数基于带有前馈输出层的双向循环网络实现;
其中,θe、θr、θg、θd依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数,λ≥0、η≥0,s为静态特征向量,为恢复后的静态特征向量,xt为t时刻的时态特征向量,为恢复后的t时刻的时态特征向量,yS为真实静态特征分类结果,yt为t时刻的真实时态特征分类结果,为生成的静态特征分类结果,为t时刻生成的时态特征分类结果,hS为潜在静态表征,ht为t时刻的潜在时态表征,ht-1为t-1时刻的潜在时态表征,zt为t时刻的时态随机向量,gχ为时态特征生成网络,为服从随机变量s,x1:T概率分布P的期望,为服从随机变量s,x1:T生成概率分布的期望;
S3、将故障样本输入所述改进TimeGAN模型生成故障数据;
S4、将电梯运行数据和生成的故障数据合并为样本集,并利用小波包分解提取所述样本集的时频特征,所述小波包分解包括分解操作和重构操作,具体如下:
2)重构操作计算如下:
S5、将提取的时频特征划分为训练集和测试集,并将训练集输入CNN模型中进行训练,获得训练好的CNN模型;
S6、将测试集输入训练好的CNN模型,获得故障诊断结果并对故障诊断结果进行验证。
2.如权利要求1所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。
3.如权利要求2所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:各所述池化层为最大池化层,各所述卷积层和全连接层的输出端还设有激活函数,所述激活函数为ReLU函数,所述输出层选用SoftMax分类器。
4.如权利要求1所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述小波包分解采用db3小波基。
5.如权利要求1所述的基于改进TimeGAN模型的小样本故障诊断方法,其特征在于:所述目标函数满足λ=1,η=10。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210388562.2A CN114692506A (zh) | 2022-04-13 | 2022-04-13 | 一种基于改进TimeGAN模型的小样本故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210388562.2A CN114692506A (zh) | 2022-04-13 | 2022-04-13 | 一种基于改进TimeGAN模型的小样本故障诊断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114692506A true CN114692506A (zh) | 2022-07-01 |
Family
ID=82142293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210388562.2A Pending CN114692506A (zh) | 2022-04-13 | 2022-04-13 | 一种基于改进TimeGAN模型的小样本故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114692506A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837002A (zh) * | 2021-08-18 | 2021-12-24 | 西安理工大学 | 基于改进TimeGan模型的小样本数据故障诊断方法 |
CN115169506A (zh) * | 2022-09-06 | 2022-10-11 | 中铁第四勘察设计院集团有限公司 | 一种供变电关键设备故障快速诊断方法及系统 |
CN115356599A (zh) * | 2022-10-21 | 2022-11-18 | 国网天津市电力公司城西供电分公司 | 一种多模态城市电网故障诊断方法及系统 |
CN115659224A (zh) * | 2022-11-07 | 2023-01-31 | 苏州大学 | 概率引导的域对抗轴承故障诊断方法及系统 |
CN116701948A (zh) * | 2023-08-03 | 2023-09-05 | 东北石油大学三亚海洋油气研究院 | 管道故障诊断方法及系统、存储介质和管道故障诊断设备 |
CN117354058A (zh) * | 2023-12-04 | 2024-01-05 | 武汉安域信息安全技术有限公司 | 基于时间序列预测的工控网络apt攻击检测系统及方法 |
-
2022
- 2022-04-13 CN CN202210388562.2A patent/CN114692506A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837002A (zh) * | 2021-08-18 | 2021-12-24 | 西安理工大学 | 基于改进TimeGan模型的小样本数据故障诊断方法 |
CN113837002B (zh) * | 2021-08-18 | 2024-04-23 | 西安理工大学 | 基于改进TimeGan模型的小样本数据故障诊断方法 |
CN115169506A (zh) * | 2022-09-06 | 2022-10-11 | 中铁第四勘察设计院集团有限公司 | 一种供变电关键设备故障快速诊断方法及系统 |
CN115356599A (zh) * | 2022-10-21 | 2022-11-18 | 国网天津市电力公司城西供电分公司 | 一种多模态城市电网故障诊断方法及系统 |
CN115356599B (zh) * | 2022-10-21 | 2023-04-07 | 国网天津市电力公司城西供电分公司 | 一种多模态城市电网故障诊断方法及系统 |
CN115659224A (zh) * | 2022-11-07 | 2023-01-31 | 苏州大学 | 概率引导的域对抗轴承故障诊断方法及系统 |
CN115659224B (zh) * | 2022-11-07 | 2023-08-25 | 苏州大学 | 概率引导的域对抗轴承故障诊断方法及系统 |
CN116701948A (zh) * | 2023-08-03 | 2023-09-05 | 东北石油大学三亚海洋油气研究院 | 管道故障诊断方法及系统、存储介质和管道故障诊断设备 |
CN116701948B (zh) * | 2023-08-03 | 2024-01-23 | 东北石油大学三亚海洋油气研究院 | 管道故障诊断方法及系统、存储介质和管道故障诊断设备 |
CN117354058A (zh) * | 2023-12-04 | 2024-01-05 | 武汉安域信息安全技术有限公司 | 基于时间序列预测的工控网络apt攻击检测系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114692506A (zh) | 一种基于改进TimeGAN模型的小样本故障诊断方法 | |
CN109492822B (zh) | 空气污染物浓度时空域关联预测方法 | |
CN109000930B (zh) | 一种基于堆叠去噪自编码器的涡轮发动机性能退化评估方法 | |
CN109884419B (zh) | 一种智慧电网电能质量在线故障诊断方法 | |
JP7441553B2 (ja) | ローリング時系列及びサポートベクトルマシンに基づく短期風速の予測方法及びシステム | |
CN109214356A (zh) | 一种基于dcnn模型的风机传动系统故障智能诊断方法 | |
CN110161343A (zh) | 一种智能列车外部受电装置的非侵入式实时动态监测方法 | |
CN114970774B (zh) | 一种智能变压器故障预测方法和装置 | |
CN111582551A (zh) | 风电场短期风速预测方法、系统及电子设备 | |
CN115114965B (zh) | 风电机组齿轮箱故障诊断方法、装置、设备及存储介质 | |
CN113688869A (zh) | 一种基于生成对抗网络的光伏数据缺失重构方法 | |
CN117892207B (zh) | 多元强相关信号数据增强和数据均衡方法 | |
CN116863959B (zh) | 一种基于生成对抗网络的海豚叫声生成方法 | |
CN110222386A (zh) | 一种行星齿轮退化状态识别方法 | |
Zhu et al. | Wind Speed Short-Term Prediction Based on Empirical Wavelet Transform, Recurrent Neural Network and Error Correction | |
Shen et al. | Time series data augmentation classifier for industrial process imbalanced fault diagnosis | |
CN117668609A (zh) | 基于RTSGAN-CatBoost的故障分类方法 | |
CN115356599B (zh) | 一种多模态城市电网故障诊断方法及系统 | |
CN114547976B (zh) | 基于金字塔变分自编码器的多采样率数据软测量建模方法 | |
CN114383845B (zh) | 一种基于嵌入式零样本学习模型的轴承复合故障诊断方法 | |
Aihong et al. | Notice of Retraction: Fault diagnosis based on adaptive genetic algorithm and BP neural network | |
CN112633371A (zh) | 一种基于vmd-msst的轴承故障诊断方法 | |
Xiaosheng et al. | Short-Term wind power prediction based on wavelet transform and convolutional neural networks | |
Lin et al. | Data Augmentation for Industrial Multivariate Time Series via a Spatial and Frequency Domain Knowledge GAN | |
Li et al. | Research of Gearbox Failure Diagnosis Based On Nerve Network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |