CN114692506A

CN114692506A - 一种基于改进TimeGAN模型的小样本故障诊断方法

Info

Publication number: CN114692506A
Application number: CN202210388562.2A
Authority: CN
Inventors: 郭方洪; 窦云飞; 刘师硕; 吴祥; 董辉; 陈积明; 姚荣康
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2022-04-13
Filing date: 2022-04-13
Publication date: 2022-07-01
Anticipated expiration: 2042-04-13
Also published as: CN114692506B

Abstract

本发明公开了一种基于改进TimeGAN模型的小样本故障诊断方法，包括：采集电梯运行数据，包括正常样本和故障样本；建立改进TimeGAN模型；将故障样本输入改进TimeGAN模型生成故障数据；将电梯运行数据和生成的故障数据合并为样本集，并利用小波包分解提取样本集的时频特征；将提取的时频特征划分为训练集和测试集，并将训练集输入CNN模型中进行训练；将测试集输入训练好的CNN模型，获得故障诊断结果并对故障诊断结果进行验证。该方法通过生成具备时序特征的故障样本，降低原始数据分布不平衡性，并充分提取样本的时频特征，获得高效准确的故障诊断结果，从而实现智能化设备的安全维护。

Description

一种基于改进TimeGAN模型的小样本故障诊断方法

技术领域

本发明属于故障诊断技术领域，具体涉及一种基于改进TimeGAN模型的小样本故障诊断方法。

背景技术

近年来，随着经济飞速发展，居民的日常用电设备使用量也大幅上升，如电梯。故障存在于人们日常使用的每一个设备中，很多设备结构复杂难以排查故障且潜在威胁大，一旦发生故障难免造成巨大损失。此外，故障样本稀缺、振动信号复杂等问题也降低了故障诊断的精度。因此，在电梯日常使用环节对潜在故障进行诊断和预测，及时预防故障的发生，对维护居民的生命和财产安全具有重要意义。

目前，随着大数据和人工智能技术的发展，故障诊断也得到了广泛研究。但人工智能算法模型是由数据驱动的，因此结合相关算法实现故障诊断和预测往往需要海量的数据，尤其是故障数据。而电梯设备的特殊性使得很难采集到故障数据，也就无法保证有足够的训练样本支撑模型训练，所以样本生成和扩充的相关研究愈发广泛。生成对抗网络(Generative adversarial networks，GAN)、最小二乘对抗网络(Least SquareGenerative adversarial networks，LSGAN)、深度卷积生成对抗网络(DeepConvolutional Generative adversarial networks，DCGAN)等生成模型可以生成所需图片，因此被广泛应用于图片扩充和还原中。由于故障诊断中的样本通常为一维数据，相关研究先将样本转换为二维图片，再利用生成模型扩充图片，最后输入到相关算法中进行训练得到诊断结果。这些方法解决了训练样本不足的问题，但是它们没有充分考虑振动信号之间特有的时间相关性，传统生成模型无法确保网络能动态有效地捕获信号中的逐步依赖关系，也没有充分利用振动信号的时域、频域和空间域特征。因此，亟需开发新的电梯故障诊断方法，实现高效准确故障诊断及智能化的设备安全维护。

发明内容

本发明的目的在于针对上述问题，提出一种基于改进TimeGAN模型的小样本故障诊断方法，该方法通过生成具备时序特征的故障样本，降低原始数据分布的不平衡性，并充分提取样本的时频特征，获得高效准确的故障诊断结果，从而实现智能化设备的安全维护。

为实现上述目的，本发明所采取的技术方案为：

本发明提出的一种基于改进TimeGAN模型的小样本故障诊断方法，包括如下步骤：

S1、采集电梯运行数据，电梯运行数据包括正常样本和故障样本；

S2、建立改进TimeGAN模型，改进TimeGAN模型包括嵌入网络、恢复网络、序列生成器和序列判别器，其中：

嵌入网络利用嵌入函数将静态特征和时态特征转化为潜在表征，嵌入函数基于循环网络实现；

恢复网络利用恢复函数将潜在表征恢复为原来的静态特征和时态特征，恢复函数基于前馈网络实现；

序列生成器从电梯运行数据中采样提取静态随机向量和时态随机向量，并利用生成函数将静态随机向量和时态随机向量转换为合成潜在编码，生成函数基于循环网络实现；

序列判别器利用判别函数接收合成潜在编码，返回分类结果，判别函数基于带有前馈输出层的双向循环网络实现；

改进TimeGAN模型的损失函数包括重建损失l_R、对抗损失l_U和监督损失l_S，并构建如下目标函数：

其中，θ_e、θ_r、θ_g、θ_d依次表示嵌入网络、恢复网络、序列生成器和序列判别器的参数，λ≥0、η≥0，s为静态特征向量，

为恢复后的静态特征向量，x_t为t时刻的时态特征向量，

为恢复后的t时刻的时态特征向量，y_S为真实静态特征分类结果，y_t为t时刻的真实时态特征分类结果，

为生成的静态特征分类结果，

为t时刻生成的时态特征分类结果，h_S为潜在静态表征，h_t为t时刻的潜在时态表征，h_t-1为t-1时刻的潜在时态表征，z_t为t时刻的时态随机向量，g_χ为时态特征生成网络，

为服从随机变量s,x_1:T概率分布P的期望，

为服从随机变量s,x_1:T生成概率分布

的期望；

S3、将故障样本输入改进TimeGAN模型生成故障数据；

S4、将电梯运行数据和生成的故障数据合并为样本集，并利用小波包分解提取样本集的时频特征，小波包分解包括分解操作和重构操作，具体如下：

1)设输入信号为离散信号

分解操作计算如下：

其中，n为离散时间序列，k为时移因子，N为尺度因子，i为层数，

为待分解的分量(0≤i≤2^N-1)，

为低频时小波包系数，

为高频时小波包系数，h₀(·)为低通滤波器,g₀(·)为高通滤波器；

2)重构操作计算如下：

其中，

为低频信号分量，

为高频信号分量，h₁(·)为高通滤波器，g₁(·)为低通滤波器；

S5、将提取的时频特征划分为训练集和测试集，并将训练集输入CNN模型中进行训练，获得训练好的CNN模型；

S6、将测试集输入训练好的CNN模型，获得故障诊断结果并对故障诊断结果进行验证。

优选地，CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。

优选地，各池化层为最大池化层，各卷积层和全连接层的输出端还设有激活函数，激活函数为ReLU函数，输出层选用SoftMax分类器。

优选地，小波包分解采用db3小波基。

优选地，目标函数满足λ＝1，η＝10。

与现有技术相比，本发明的有益效果为：

该方法将最小二乘损失函数引入时间序列生成对抗网络(TimeGAN)改善模型的目标函数，生成具备时序特征的故障样本，降低原始数据分布的不平衡性，解决样本不足问题；并利用小波包分解扩充后的样本，计算各节点的小波包系数并重构信号，充分提取样本的时频特征；最后结合CNN模型强大的空间特征提取能力提取信号空间特征，建立故障诊断模型，实现高效准确的故障诊断，从而实现智能化设备的安全维护。

附图说明

图1为本发明基于改进TimeGAN模型的小样本故障诊断方法的流程图；

图2为本发明小波包分解提取的时频特征示意图；

图3为本发明的CNN模型结构示意图；

图4为本发明所提方法、BP、LSTM、GAN+CNN和WPD+BP五种方法的准确率对比图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是在于限制本申请。

如图1-4所示，一种基于改进TimeGAN模型的小样本故障诊断方法，包括如下步骤：

S1、采集电梯运行数据，电梯运行数据包括正常样本和故障样本。电梯运行数据可通过加速度传感器采集获得。

为恢复后的静态特征向量，x_t为t时刻的时态特征向量，

为生成的静态特征分类结果，

为服从随机变量s,x_1:T概率分布P的期望，

为服从随机变量s,x_1:T生成概率分布

的期望。

在一实施例中，目标函数满足λ＝1，η＝10。

其中，该方法通过结合TimeGAN模型和最小二乘对抗网络(Least SquareGenerative adversarial networks，LSGAN)中的最小二乘损失函数得到LS-Time GAN模型(即改进TimeGAN模型)，改进TimeGAN模型包括：嵌入网络(Embedding network)、恢复网络(Recovery network)、序列生成器和序列判别器。嵌入网络和恢复网络作为自编码组件与作为对抗组件的序列生成器和序列判别器联合训练，以使模型在随时间迭代的过程中同时学习特征分布和变量间潜在关系。嵌入网络为对抗网络(序列生成器和序列判别器)提供了潜在空间(Latent Space)，真实数据和生成数据的潜在动态关联性(Temporal Dynamics)通过监督损失实现同步，具体如下：

2.1)嵌入网络和恢复网络

嵌入函数和恢复函数提供了特征和潜在空间之间的映射，允许对抗网络通过低维表示来学习数据之间的潜在时间动态。

设H_S、H_χ分别为静态特征向量空间S和时态特征向量空间χ对应的潜在向量空间，嵌入函数e:S×Π_tχ→H_S×Π_tH_χ将静态特征和时态特征转化为潜在表征(LatentRepresentations)h_S,h_1:T＝e(s,x_1:T)，嵌入函数e通过循环网络实现：

h_S＝e_S(s)， h_t＝e_χ(h_S,h_t-1,x_t) (1)

其中，e_S:S→H_S为静态特征的嵌入网络，e_χ:H_S×H_χ×χ→H_χ为时间特征的嵌入网络，h_S为潜在静态表征，h_t为t时刻的潜在时态表征，h_1:T为[1,T]区间的潜在时态表征集合，T为时间，s为静态特征向量，x_1:T为[1,T]区间的时态特征向量集合，h_t-1为t-1时刻的潜在时态表征，x_t为t时刻的时态特征向量。

与之相反，恢复函数r:H_S×Π_tH_χ→S×Π_tχ将潜在表征h_S,h_1:T＝e(s,x_1:T)恢复为它们原本的静态特征和时态特征，结果表示为

恢复函数r通过前馈网络实现：

其中，r_S:H_S→S为静态特征嵌入的恢复网络，r_χ:H_χ→χ为时态特征嵌入的恢复网络，

为恢复后的静态特征向量，

为恢复后的t时刻的时态特征向量，

为恢复后的[1,T]区间的时态特征向量集合。

2.2)序列生成器和序列判别器

序列生成器不直接在特征空间输出生成数据，而是先输出到嵌入网络的输出空间。设Z_S,Z_χ分别表示已知分布的静态特征向量空间和时态特征向量空间，并从中提取随机向量作为静态随机向量和时态随机向量输入生成H_S,H_χ。

然后生成函数g:Z_S×П_tZ_χ→H_S×П_tH_χ将静态随机向量和时态随机向量转换为合成潜在编码

生成函数g通过循环网络实现：

其中，g_S:Z_S→H_S为静态特征生成网络，g_χ:H_S×H_χ×Z_χ→H_χ为时态特征生成网络，

为合成潜在静态表征，

为[1,T]区间的合成时态特征向量集合，z_S为静态随机向量，z_1:T为[1,T]区间的时态随机向量集合，

为t时刻的合成潜在时态表征，

为t-1时刻的合成潜在时态表征，z_t为t时刻的时态随机向量，遵循随机过程。

最后，序列判别器也从嵌入网络的输出空间进行操作。判别函数d:H_S×П_tH_χ→[0,1]×П_t[0,1]接收合成潜在编码，返回分类结果

d通过一个带有前馈输出层的双向循环网络实现：

其中，

和

分别表示前向和后向隐藏状态序列，

为前向循环函数，

为后向循环函数，d_S为静态特征输出层分类函数，d_χ为时态特征输出层分类函数，

为静态特征分类结果，

为t时刻的时态特征分类结果，

为[1,T]区间的时态特征分类结果集合，

代表h_S或

代表h_1:T或

即

表示真实数据的(h_*)或合成数据的

嵌入；类似地，

表示真实数据(y_*)或合成数据

的分类结果，*号表示任意下标，真实数据(原始数据)即采集的电梯运行数据。

2.3)目标函数

作为特征空间和潜在空间之间的可逆映射，嵌入函数应该能够从原始数据s,x_1:T中提取其潜在表征h_S,h_1:T，恢复函数能从其潜在表征h_S,h_1:T中精确重构原始数据的特征分布

目标函数总体定义为：

其中，θ_e、θ_r、θ_g、θ_d分别表示嵌入网络、恢复网络、序列生成器和序列判别器的参数。λ≥0、η≥0是分别平衡两种损失的超参数，本实施例设λ＝1，η＝10。

其中，重建损失(Reconstruction Loss)计算如下：

对抗损失采用最小二乘损失函数，计算如下：

现有技术对抗损失采用交叉熵损失只关注分类结果是否正确，并不关注距离，所以很容易达到饱和状态，而最小二乘损失只在一点达到饱和，可以使训练过程更加稳定，生成数据质量更高；

应用最大似然法定义监督损失(Supervised Loss)：

其中，当对抗损失l_U推动生成器创建逼真的序列，监督损失l_S进一步确保它产生类似的逐步依赖关系。

S3、将故障样本输入改进TimeGAN模型生成故障数据。

具体地，表1是改进TimeGAN、TimeGAN和1DGAN三种方法的判别分数(Discriminative Score)和预测分数(Predictive Score)。判别分数和预测分数是定性度量生成数据与原始数据之间差异性的指标，数值越小说明两者越接近。

表1

从表1可以看出，与其他方法相比，本申请的改进TimeGAN在原始数据与生成数据的判别分数和预测分数上得分更低，说明它生成的数据与原始数据差距最小，质量和实用性也更好。

1)设输入信号为离散信号

分解操作计算如下：

其中，n为离散时间序列，k为时移因子，N为尺度因子，i.e.为层数，

表示待分解的分量(0≤i≤2^N-1)，

和

为小波包系数，h₀(·)为低通滤波器,g₀(·)为高通滤波器；

2)重构操作计算如下：

其中，

和

为信号分量，h₁(·)为高通滤波器，g₁(·)为低通滤波器。

其中，小波包分解可以同时分解信号的低频和高频部分，适用于处理具有高频扰动和强背景噪声的非平稳振动信号。小波包是为了克服小波分解在高频段分辨率较差、而在低频段分辨率较好的问题提出的，是一种更精细的信号分析方法，提高了信号的时频分辨率。

在一实施例中，小波包分解采用db3小波基。

其中，将原始数据和生成的故障数据合并为样本集，并利用小波包分解(WaveletPacket Decomposition，WPD)经过分解运算得到小波包系数后，再进行重构运算得到分量，提取样本集的时频特征。

具体的：运用db3小波基，对电梯运行数据(如电梯振动信号)进行3层小波包分解重构，得到8个故障特征值组成的特征向量

如图2所示，时频特征包括各节点频段信号及对应频谱，左侧为经过重构的各节点频段信号，右侧为相应的傅里叶频谱。

本实施例采用的传感器采样频率为512Hz，根据香农采样定理，奈奎斯特采样频率为256Hz，信号经过小波包三层分解后包含2^3＝8个频率段，每个频率段的频率区间为256/8＝32Hz，因此经过小波包分解后的重构信号

应分布于[0-32Hz，32-64Hz，64-96Hz，96-128Hz，128-160Hz，160-192Hz，192-224Hz，224-256Hz]之间，和频谱图相符。而且从频谱图中可以看出各节点频谱差异较明显，频域区间重叠较少，因此小波包三层分解可以有效提取电梯振动信号的时频特征。

S5、将提取的时频特征划分为训练集和测试集，并将训练集输入CNN模型中进行训练，获得训练好的CNN模型。

在一实施例中，CNN模型包括依次连接的输入层、第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第一全连接层、第二全连接层和输出层。

在一实施例中，各池化层为最大池化层，各卷积层和全连接层的输出端还设有激活函数，激活函数为ReLU函数，输出层选用SoftMax分类器。

具体地，CNN模型如图3所示，输入特征图(即时频特征)的大小为100×100×3；第一到第四卷积层的卷积核个数分别为32、64、128和128，第一和第二卷积层的卷积核大小为5×5，第三和第四卷积层的卷积核大小为3×3，激活函数选择ReLU函数；池化层的池化方式选择最大池化，即对输入特征图求其p×p区域内的最大值，区域大小取2×2；第一全连接层的节点数为1024，第二全连接层的节点数为512；输出层节点数为输入样本数的类别数，分类器选择SoftMax分类。

表2为不同数量原始样本添加不同数量生成样本后，提取的时频特征输入CNN模型的准确率。其中，CNN模型学习率统一设为0.001，训练集与测试集比例为4:1，步长为8。

表2

从表2可以看出，样本总数量相近时不平衡比例越低训练效果越好，不平衡比例相同时样本越多训练效果越好。从样本集1的训练结果可以看出，虽然数据量过少时训练集准确率能达到91％，但是模型泛化性差，测试集准确率只有75％，验证了样本扩充的必要性。样本集3和4的准确率差别较小，说明了生成样本与原始样本差异较小，再次证明了改进TimeGAN的有效性。样本集10的准确率并没有达到平衡样本的效果，相较于不平衡比例相同但样本数较少的样本集1、3、4、7，准确率反而下降。这是由于生成器模型本身也存在误差，当生成样本数多于原始数据时可能会使误差增大，造成适得其反的效果，因此往往生成样本数和原始样本数相等时就停止扩充样本。综上，添加512个生成样本至训练集的训练效果最好，因此训练集准确率对比实验采用样本集7作为训练集。

参照图4，BP神经网络训练周期最长且准确率最低，LSTM训练周期最短但准确率同样不高，原始GAN和CNN结合方法的准确率可达到94.41％，相较于CNN模型略有提升，WPD+BP神经网络的效果较好，准确率为95.75％，比BP神经网络提高了近6％，验证了WPD的有效性。和以上四种方法相比，本文方法结合了生成模型(TimeGAN模型)、WPD和CNN的优势，在数据集相同情况下，训练准确率达到了99.01％，显著提升了模型训练效果。

表3为不同方法不同样本下的平均测试准确率，测试集准确率可以反映模型的泛化能力，也是判断模型最终故障诊断效果的重要指标。

表3

从表3可以看出，极限学习机(Extreme Learning Machine，ELM)算法的准确率最低，只有79.76％，BP神经网络次之；而经过WPD分解后，BP神经网络准确率提升至94.05％，优于其他算法，说明了BP、LSTM、SVM等浅层机器学习算法难以充分提取振动信号中的特征，以及WPD在特征提取方面的优势；CNN模型的准确率高于其他浅层机器学习算法，验证了其强大的特征提取能力；而经过原始GAN扩充样本后再输入到CNN中分类的准确率并没有提升，甚至有所下降，因为原始GAN等生成模型虽然能生成以假乱真的图片，但是无法考虑振动信号间的时序关系，难以处理一维数据。本方法在平衡样本集和不平衡样本集下的准确率均高于其他方法，在样本集7下的准确率达到95.19％，相较于样本扩充和WPD处理前有明显提升，充分体现了本申请基于改进TimeGAN模型的小样本故障诊断方法的有效性。

本申请基于改进TimeGAN模型的小样本故障诊断方法将最小二乘损失函数引入时间序列生成对抗网络(TimeGAN)改善模型的目标函数，生成具备时序特征的故障样本，降低原始数据分布的不平衡性，解决样本不足问题；并利用小波包分解扩充后的样本，计算各节点的小波包系数并重构信号，充分提取样本的时频特征；最后结合CNN卷积神经网络强大的空间特征提取能力提取信号空间特征，建立故障诊断模型，实现高效准确的故障诊断，从而实现智能化设备的安全维护。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请描述较为具体和详细的实施例，但并不能因此而理解为对申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。