CN115510965A - 一种基于生成数据融合的轴承不平衡故障诊断方法 - Google Patents

一种基于生成数据融合的轴承不平衡故障诊断方法 Download PDF

Info

Publication number
CN115510965A
CN115510965A CN202211159329.3A CN202211159329A CN115510965A CN 115510965 A CN115510965 A CN 115510965A CN 202211159329 A CN202211159329 A CN 202211159329A CN 115510965 A CN115510965 A CN 115510965A
Authority
CN
China
Prior art keywords
samples
fault
data
layer
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211159329.3A
Other languages
English (en)
Inventor
刘敏
王晨泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202211159329.3A priority Critical patent/CN115510965A/zh
Publication of CN115510965A publication Critical patent/CN115510965A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明涉及一种基于生成数据融合的轴承不平衡故障诊断方法,包括:数据预处理:获取轴承振动时序信号数据集,所述数据集包括带有标签的少数类故障样本和多数类正常样本,对少数类故障样本进行归一化处理;基于Wasserstein生成式对抗网络对少数类故障样本进行一次数据扩充;基于聚类的少数类样本合成技术进行少数类故障样本的二次数据扩充;对一次和二次数据扩充的样本按照相同样本数量进行拼接融合,并与多数类正常样本汇总得到融合数据集;利用融合数据集训练基于注意力机制的卷积神经网络诊断模型;利用训练完成的卷积神经网络诊断模型进行故障诊断。与现有技术相比,本发明在数据集不平衡率较高的情况下依然具有可靠的准确率。

Description

一种基于生成数据融合的轴承不平衡故障诊断方法
技术领域
本发明涉及故障诊断技术领域,尤其是涉及一种基于生成数据融合的轴承不平衡故障诊断方法。
背景技术
故障诊断对于识别机械设备的健康状态具有重要意义。轴承作为旋转机械的核心部件,是许多工业器械中必不可少的一环。近几年有大量的工业事故都是由于轴承零件的损坏而导致,因此能够准确及时的评估检测轴承的运行健康状况是非常重要的。
随着机器学习和深度学习方法的出现,数据驱动的故障诊断方法成为近年来的研究热点,如支持向量机、模糊逻辑、神经网络等方法已广泛应用于故障诊断。采用深度学习模型可以将各种轴承数据集的诊断精度提高到非常高的水平。然而,各种深度学习模型通常需要大量的数据样本进行训练,如果训练样本具有不平衡的类别分布,则其性能将受到一定的影响。在实际的工业背景下,轴承通常在正常条件下运行,可以提供的故障样本数量远小于正常运行的轴承样本,这通常会导致数据驱动模型诊断方法的准确性降低。
发明内容
本发明的目的就是为了提供一种基于生成数据融合的轴承不平衡故障诊断方法,提高样本数据不平衡情况下的故障诊断准确率。
本发明的目的可以通过以下技术方案来实现:
一种基于生成数据融合的轴承不平衡故障诊断方法,包括以下步骤:
数据预处理:基于滑窗切割和拼接处理获取轴承振动时序信号数据集,所述数据集包括带有标签的少数类故障样本和多数类正常样本,对带有标签的少数类故障样本进行归一化处理;
基于Wasserstein生成式对抗网络对归一化后的少数类故障样本进行一次数据扩充;
基于聚类的少数类样本合成技术进行少数类故障样本的二次数据扩充;
对一次数据扩充的样本和二次数据扩充的样本按照相同样本数量进行拼接融合,并与多数类正常样本汇总得到融合数据集;
模型训练:利用融合数据集训练基于注意力机制的卷积神经网络诊断模型;
故障诊断:利用训练完成的卷积神经网络诊断模型进行故障诊断。
所述归一化处理为:
Figure BDA0003858858080000021
其中,a代表数据集中的振动信号点,A是a的集合,a’表示归一后的振动信号点,归一化处理通过最大最小标准化将原始信号值映射到[0,1]区间内。
所述Wasserstein生成式对抗网络由生成器和判别器组成,其中生成器由一层线性变换层以及四层转置卷积层组成,判别器则由四层卷积层以及一层全连接层组成,每一层的激活函数均为Relu函数;Wasserstein生成对抗网络使用Wasserstein距离度量两个分布之间的差异,采用梯度惩罚机制优化判别器的损失函数,其中,所述Wasserstein距离为:
Figure BDA0003858858080000022
其中,pr指真实数据的分布,pg指生成器生成数据的分布,∏(Pr,Pg)表示两个分布组合起来的所有联合分布的集合,γ表示其中每一个可能的联合分布,x,y指γ中得到的样本,||x-y||指两个分布之间的距离,E表示样本对距离的期望值。
所述Wasserstein生成对抗网络的生成器以及判别器的损失函数基于Wasserstein距离确定,其中,生成器的损失函数为:
Figure BDA0003858858080000023
其中,pz是输入随机噪声的分布,z指的是服从随机噪声分布的样本,E表示数学期望,D(·)和G(·)分别表示判别器网络以及生成器网络;
判别器的损失函数为:
Figure BDA0003858858080000024
其中,
Figure BDA0003858858080000025
为梯度惩罚机制,λ代表惩罚系数,
Figure BDA0003858858080000026
指的是在生成器生成的样本与真实样本之间的随机插值取样,
Figure BDA0003858858080000027
表示
Figure BDA0003858858080000028
所满足的分布,
Figure BDA0003858858080000029
表示判别器的梯度,
Figure BDA0003858858080000031
表示梯度的欧几里得范数。
Wasserstein生成式对抗网络对归一化后的故障样本进行数据扩充包括以下步骤:
将归一化后的少数类故障样本作为训练集输入生成式对抗网络模型,同时输入随机噪声z=(z1,z2,z3,...,zm);
训练生成器G并初始化参数θG,根据输入的随机噪声生成模拟数据
Figure BDA0003858858080000032
根据生成器G生成的模拟数据以及带有标签的真实数据,训练判别器D,同时更新判别器D的参数ωD,所述参数ωD的更新方式为:
Figure BDA0003858858080000033
Figure BDA0003858858080000034
其中,ηD表示学习率,m表示生成信号的长度,zi表示噪声样本,xi表示真实样本;
固定训练后的判别器参数,训练并更新生成器G的参数,所述参数θG的更新方式为:
Figure BDA0003858858080000035
Figure BDA0003858858080000036
其中ηG表示学习率,
Figure BDA0003858858080000037
表示生成器的梯度;
对生成器G和判别器D进行交替的循环训练,直到生成器生成的数据分布与真实分布小于设定的阈值,则判定达到纳什均衡,完成模型训练;
基于训练完成的生成器G实现少数类故障样本的一次数据扩充。
所述基于聚类的少数类样本合成技术进行少数类故障样本的二次数据扩充采用基于过采样算法的生成策略,包括以下步骤:
3-1)将每一类少数类故障样本分别与多数类正常样本进行拼接形成备用数据集;
3-2)在备用数据集样本中随机选取k个样本作为k均值聚类的簇中心;
3-3)基于欧氏距离分别计算样本点到各个簇中心的距离:
Figure BDA0003858858080000038
其中,xi和yi表示空间中的两个样本点,n表示样本的维度,各个样本点选择与其距离最近的簇中心形成k个簇;
3-4)对形成的k个簇,计算该簇内距离其他样本点距离之和最小的样本点作为该簇新的簇中心;
3-5)重复步骤3-3)-步骤3-4),直到簇中心不再改变,完成聚类;
3-6)对聚类完成的所有簇按照簇中包含的少数类故障样本数量从大到小进行排序,选择前k个簇,完成过滤步骤;
3-7)在过滤后的簇中,基于采样倍率R从少数类故障样本中选择一个样本xi及其相邻的R个最近邻样本xRi
3-8)依次在xi和xRi之间合成新的样本点,合成公式如下:
xR=xi+rand(0,1)×|xRi-xi|
其中rand(0,1)表示取0到1之间的随机数,xR表示合成的新样本;
3-9)对每一类少数类故障样本和多数类正常样本拼接成的数据集重复步骤3-1)-步骤3-8),获得二次数据扩充的少数类故障样本。
所述卷积神经网络诊断模型包括卷积神经网络和注意力机制,卷积神经网络对输入数据进行特征提取,其输出的特征作为注意力机制的输入来进行信息的权重分配,注意力机制输出包含重要信息标记的故障特征,并通过全连接层和Softmax函数得到诊断模型的故障诊断分类结果,卷积神经网络诊断模型的损失函数为交叉熵损失函数:
Figure BDA0003858858080000041
其中J(θ)为损失值,θ为模型的训练参数,hk为输出类别,fk(θ)表示样本的预测概率值,N为故障类别的数量。
所述卷积神经网络基于卷积层和池化层进行特征提取,其中,卷积层的计算过程为:
Figure BDA0003858858080000042
其中
Figure BDA0003858858080000043
为卷积之后第l层的第j个特征映射,f(·)表示激活函数,M为输入的特征映射个数,
Figure BDA0003858858080000044
为输入的第l-1层的第i个特征映射,*为卷积操作,
Figure BDA0003858858080000045
为卷积核,
Figure BDA0003858858080000046
表示偏置参数;激活函数f采用的是ReLU激活函数:
Figure BDA0003858858080000047
卷积层之后紧接一层池化层,池化的过程为:
xj l+1=f[down(xj l)+bl+1 j]
其中
Figure BDA0003858858080000051
为池化之后l+1层的第j个特征映射,down为下采样函数,
Figure BDA0003858858080000052
为l+1层的偏置参数;
输入数据经过2次卷积层和池化层的特征提取得到各通道输出的特征F=[f1,f2,f3,...,fn],n为特征序列的长度。
所述注意力机制基于一个全连接层计算特征的注意力分值si
si=sigmoid(wafi+ba)
其中wa是注意力层的权重参数,ba是注意力层的偏置参数,fi为输入的特征,sigmoid是激活函数,其表达式为:
Figure BDA0003858858080000053
将卷积神经网络输出的特征序列F=[f1,f2,f3,...,fn]输入全连接层后得到注意力分值序列S=[s1,s2,s3,...,sn];
利用注意力分值计算待训练的注意力权重参数,并基于注意力权重参数对特征进行权重重新分配:
Figure BDA0003858858080000054
fi'=αifi
其中αi为训练得到的注意力权重参数,fi′为经过注意力机制进行权重重新分配之后包含重要信息标记的的特征,注意力机制的输出特征序列表示为F′=[f1′,f2′,f3′,...,fn′]。
全连接层将包含重要信息标记的故障特征展平为一维:
Figure BDA0003858858080000055
其中yi表示全连接层的输出,σ(·)为激活函数,wf和bf为相邻层之间的权重矩阵以及偏置参数;
在全连接层之后通过Softmax函数得到故障诊断分类结果:
Figure BDA0003858858080000056
其中fk(y)表示对第k个输出的预测值,yk表示全连接层第k个输出。
与现有技术相比,本发明具有以下有益效果:
(1)本发明生成数据融合的过程采用了生成式对抗网络以及过采样算法两种策略进行数据生成,在保持新数据集中样本特征完善的情况下丰富了生成数据中的样本特征。
(2)本发明采用融入注意力机制的卷积神经网络,能够更好的对提取出的特征信息进行判断,提升关键性特征的权重,降低非必要特征的影响,提高了提取有效特征的能力。
(3)本发明在样本的不平衡率较高时能够保持较高的故障诊断准确率。
(4)Wasserstein生成式对抗网络通过引入Wasserstein距离优化了模型的损失函数,提高了生成对抗网络在训练过程中的稳定性以及生成样本的质量。
(5)过采样算法的采样过程不需要复杂的计算过程,计算量少并且能够有效补足少数类样本的数量,同时丰富数据集的特征。
附图说明
图1为本发明的方法流程图;
图2为本发明的模型结构示意图;
图3为注意力机制结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
一种基于生成数据融合的轴承不平衡故障诊断方法,其方法流程如图1所示,采用的模型结构与数据处理过程如图2所示,具体包括以下步骤:
1)数据预处理
本实施例选取公开的凯斯西储大学轴承数据集作为原始的数据库。所选择的数据类型为采样频率12khz的驱动端故障数据。数据中所包含的故障类型分为直径0.07、0.14以及0.21英寸的内圈、滚动体以及外圈共9类故障类型,加上无故障的正常样本共有10类的数据样本。
为了实现更趋近于真实工况中的样本不平衡情况,通过滑窗切割和拼接处理的方式从原始数据集中提取出不同数量的样本,得到轴承振动时序信号数据集,所述数据集包括带有标签的少数类故障样本和多数类正常样本,如表1所示。
表1轴承振动时序信号数据集
故障类型 故障尺寸 样本数量 标签
正常 0 300 1
内圈故障 0.07 30 2
内圈故障 0.14 30 3
内圈故障 0.21 30 4
球体故障 0.07 30 5
球体故障 0.14 30 6
球体故障 0.21 30 7
外圈故障 0.07 30 8
外圈故障 0.14 30 9
外圈故障 0.21 30 10
其中初始的不平衡数据集中包含的正常样本数量为300,其余9类故障样本数量为30;用来测试的平衡数据集中包含各类样本数量为50。
对带有标签的少数类故障样本进行归一化处理;
Figure BDA0003858858080000071
其中,a代表数据集中的振动信号点,A是a的集合,a’表示归一后的振动信号点,归一化处理通过最大最小标准化将原始信号值映射到[0,1]区间内。
2)基于Wasserstein生成式对抗网络对归一化后的少数类故障样本进行一次数据扩充;
所述Wasserstein生成式对抗网络由生成器和判别器组成,其中生成器由一层线性变换层以及四层转置卷积层组成,判别器则由四层卷积层以及一层全连接层组成,每一层的激活函数均为Relu函数。与原始的生成对抗网络模型相比,Wasserstein生成对抗网络使用Wasserstein距离代替JS散度来度量两个分布之间的差异,采用梯度惩罚机制优化判别器的损失函数,其中,所述Wasserstein距离为:
Figure BDA0003858858080000072
其中,pr指真实数据的分布,pg指生成器生成数据的分布,∏(Pr,Pg)表示两个分布组合起来的所有联合分布的集合,γ表示其中每一个可能的联合分布,x,y指γ中得到的样本,||x-y||指两个分布之间的距离,E表示样本对距离的期望值。
所述Wasserstein生成对抗网络的生成器以及判别器的损失函数基于Wasserstein距离确定,其中,生成器的损失函数为:
Figure BDA0003858858080000073
其中,pz是输入随机噪声的分布,z指的是服从随机噪声分布的样本,E表示数学期望,D(·)和G(·)分别表示判别器网络以及生成器网络;
判别器的损失函数为:
Figure BDA0003858858080000081
其中,
Figure BDA0003858858080000082
为梯度惩罚机制,λ代表惩罚系数,
Figure BDA0003858858080000083
指的是在生成器生成的样本与真实样本之间的随机插值取样,
Figure BDA0003858858080000084
表示
Figure BDA0003858858080000085
所满足的分布,
Figure BDA0003858858080000086
表示判别器的梯度,
Figure BDA0003858858080000087
表示梯度的欧几里得范数。
Wasserstein生成式对抗网络对归一化后的故障样本进行数据扩充包括以下步骤:
将归一化后的少数类故障样本作为训练集输入生成式对抗网络模型,同时输入随机噪声z=(z1,z2,z3,...,zm);
训练生成器G并初始化参数θG,根据输入的随机噪声生成模拟数据
Figure BDA0003858858080000088
根据生成器G生成的模拟数据以及带有标签的真实数据,训练判别器D,同时更新判别器D的参数ωD,所述参数ωD的更新方式为:
Figure BDA0003858858080000089
Figure BDA00038588580800000810
其中,ηD表示学习率,m表示生成信号的长度,zi表示噪声样本,xi表示真实样本;
固定训练后的判别器参数,训练并更新生成器G的参数,所述参数θG的更新方式为:
Figure BDA00038588580800000811
Figure BDA00038588580800000812
其中ηG表示学习率,
Figure BDA00038588580800000813
表示生成器的梯度;
对生成器G和判别器D进行交替的循环训练,直到生成器生成的数据分布与真实分布小于设定的阈值,则判定达到纳什均衡,完成模型训练;
基于训练完成的生成器G实现少数类故障样本的一次数据扩充。
3)基于聚类的少数类样本合成技术进行少数类故障样本的二次数据扩充;
仅用一种生成式网络策略进行数据生成可以很好的扩充原始数据集中包含的特征,为了保证生成特征的多样性,使用过采样算法策略的方法同时被引入进行数据扩充。通过对不平衡样本进行聚类后再采用少数类样本合成技术进行数据扩充可以使数据的生成尽量保持在安全域内,减少样本边缘化的趋势以及保持生成样本的高质量。
3-1)将9类少数类故障样本的每一类分别与多数类正常样本进行拼接形成备用数据集;
3-2)在备用数据集样本中随机选取k个样本作为k均值聚类的簇中心;
3-3)基于欧氏距离分别计算样本点到各个簇中心的距离:
Figure BDA0003858858080000091
其中,xi和yi表示空间中的两个样本点,n表示样本的维度,各个样本点选择与其距离最近的簇中心形成k个簇;
3-4)对形成的k个簇,计算该簇内距离其他样本点距离之和最小的样本点作为该簇新的簇中心;
3-5)重复步骤3-3)-步骤3-4),直到簇中心不再改变,完成聚类;
3-6)对聚类完成的所有簇按照簇中包含的少数类故障样本数量从大到小进行排序,选择前k个簇,完成过滤步骤;
3-7)在过滤后的簇中,基于采样倍率R从少数类故障样本中选择一个样本xi及其相邻的R个最近邻样本xRi
3-8)依次在xi和xRi之间合成新的样本点,合成公式如下:
xR=xi+rand(0,1)×|xRi-xi|
其中rand(0,1)表示取0到1之间的随机数,xR表示合成的新样本;
3-9)对每一类少数类故障样本和多数类正常样本拼接成的数据集重复步骤3-1)-步骤3-8),获得二次数据扩充的少数类故障样本。
4)对一次数据扩充的样本和二次数据扩充的样本按照相同样本数量(即1:1的比例)进行拼接融合,并与多数类正常样本汇总得到融合数据集,融合数据集中的每一个样本的数量都为300;
对3)和4)生成的少数类故障样本按照相同样本数量拼接,生成新的故障样本数据集是完全平衡的,并且包含两种不同生成策略侧重的特征类型。将新的故障样本集和多数类正常样本进行汇总后作为训练集送入基于注意力机制的卷积神经网络诊断模型中。
5)模型训练:利用融合数据集训练基于注意力机制的卷积神经网络诊断模型;
所述卷积神经网络诊断模型包括卷积神经网络和注意力机制,卷积神经网络对输入数据进行特征提取,其输出的特征作为注意力机制的输入来进行信息的权重分配,注意力机制输出包含重要信息标记的故障特征,并通过全连接层和Softmax函数得到诊断模型的故障诊断分类结果,卷积神经网络诊断模型的损失函数为交叉熵损失函数:
Figure BDA0003858858080000101
其中J(θ)为损失值,θ为模型的训练参数,hk为输出类别,fk(θ)表示样本的预测概率值,N为故障类别的数量。
所述卷积神经网络基于卷积层和池化层进行特征提取,其中,卷积层的计算过程为:
Figure BDA0003858858080000102
其中
Figure BDA0003858858080000103
为卷积之后第l层的第j个特征映射,f(·)表示激活函数,M为输入的特征映射个数,
Figure BDA0003858858080000104
为输入的第l-1层的第i个特征映射,*为卷积操作,
Figure BDA0003858858080000105
为卷积核,
Figure BDA0003858858080000106
表示偏置参数;激活函数f采用的是ReLU激活函数:
Figure BDA0003858858080000107
卷积层之后紧接一层池化层,池化的过程为:
xj l+1=f[down(xj l)+bl+1 j]
其中
Figure BDA0003858858080000108
为池化之后l+1层的第j个特征映射,down为下采样函数,
Figure BDA0003858858080000109
为l+1层的偏置参数;
输入数据经过2次卷积层和池化层的特征提取得到各通道输出的特征F=[f1,f2,f3,...,fn],n为特征序列的长度。
所述注意力机制基于一个全连接层计算特征的注意力分值si
si=sigmoid(wafi+ba)
其中wa是注意力层的权重参数,ba是注意力层的偏置参数,fi为输入的特征,sigmoid是激活函数,其表达式为:
Figure BDA00038588580800001010
将卷积神经网络输出的特征序列F=[f1,f2,f3,...,fn]输入全连接层后得到注意力分值序列S=[s1,s2,s3,...,sn];
利用注意力分值计算待训练的注意力权重参数,并基于注意力权重参数对特征进行权重重新分配:
Figure BDA0003858858080000111
fi'=αifi
其中αi为训练得到的注意力权重参数,fi′为经过注意力机制进行权重重新分配之后包含重要信息标记的的特征,注意力机制的输出特征序列表示为F′=[f1′,f2′,f3′,...,fn′]。注意力机制结构示意图如图3所示。
全连接层将包含重要信息标记的故障特征展平为一维:
Figure BDA0003858858080000112
其中yi表示全连接层的输出,σ(·)为激活函数,wf和bf为相邻层之间的权重矩阵以及偏置参数;
在全连接层之后通过Softmax函数得到故障诊断分类结果:
Figure BDA0003858858080000113
其中fk(y)表示对第k个输出的预测值,yk表示全连接层第k个输出。
6)故障诊断:利用训练完成的卷积神经网络诊断模型进行故障诊断。
本实施例的故障诊断结果如表2所示。
表2故障诊断分类准确率
Figure BDA0003858858080000114
可以看出,当存在数据不平衡时,随着不平衡的加剧,现有方法的识别精度出现大幅下降,而本发明所提出的生成数据融合的故障诊断方法的分类准确率要大于两种生成式方法单独使用的准确率,且远远大于现有方法的识别准确率。
表3展示了本发明所述方法与增强GAN的识别准确率提升效果对比,从表中可以明显发现,与增强GAN相比,本发明所提出方法在1:10以及1:20两个不平衡率的条件下对准确率的提升更高。
表3本发明方法与增强GAN识别准确率提升效果对比
Figure BDA0003858858080000121
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。

Claims (10)

1.一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,包括以下步骤:
数据预处理:基于滑窗切割和拼接处理获取轴承振动时序信号数据集,所述数据集包括带有标签的少数类故障样本和多数类正常样本,对带有标签的少数类故障样本进行归一化处理;
基于Wasserstein生成式对抗网络对归一化后的少数类故障样本进行一次数据扩充;
基于聚类的少数类样本合成技术进行少数类故障样本的二次数据扩充;
对一次数据扩充的样本和二次数据扩充的样本按照相同样本数量进行拼接融合,并与多数类正常样本汇总得到融合数据集;
模型训练:利用融合数据集训练基于注意力机制的卷积神经网络诊断模型;
故障诊断:利用训练完成的卷积神经网络诊断模型进行故障诊断。
2.根据权利要求1所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,所述归一化处理为:
Figure FDA0003858858070000011
其中,a代表数据集中的振动信号点,A是a的集合,a’表示归一后的振动信号点,归一化处理通过最大最小标准化将原始信号值映射到[0,1]区间内。
3.根据权利要求1所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,所述Wasserstein生成式对抗网络由生成器和判别器组成,其中生成器由一层线性变换层以及四层转置卷积层组成,判别器则由四层卷积层以及一层全连接层组成,每一层的激活函数均为Relu函数;Wasserstein生成对抗网络使用Wasserstein距离度量两个分布之间的差异,采用梯度惩罚机制优化判别器的损失函数,其中,所述Wasserstein距离为:
Figure FDA0003858858070000012
其中,pr指真实数据的分布,pg指生成器生成数据的分布,∏(Pr,Pg)表示两个分布组合起来的所有联合分布的集合,γ表示其中每一个可能的联合分布,x,y指γ中得到的样本,||x-y||指两个分布之间的距离,E表示样本对距离的期望值。
4.根据权利要求3所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,所述Wasserstein生成对抗网络的生成器以及判别器的损失函数基于Wasserstein距离确定,其中,生成器的损失函数为:
Figure FDA0003858858070000021
其中,pz是输入随机噪声的分布,z指的是服从随机噪声分布的样本,E表示数学期望,D(·)和G(·)分别表示判别器网络以及生成器网络;
判别器的损失函数为:
Figure FDA0003858858070000022
其中,
Figure FDA0003858858070000023
为梯度惩罚机制,λ代表惩罚系数,
Figure FDA0003858858070000024
指的是在生成器生成的样本与真实样本之间的随机插值取样,
Figure FDA0003858858070000025
表示
Figure FDA0003858858070000026
所满足的分布,
Figure FDA0003858858070000027
表示判别器的梯度,
Figure FDA0003858858070000028
表示梯度的欧几里得范数。
5.根据权利要求4所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,Wasserstein生成式对抗网络对归一化后的故障样本进行数据扩充包括以下步骤:
将归一化后的少数类故障样本作为训练集输入生成式对抗网络模型,同时输入随机噪声z=(z1,z2,z3,...,zm);
训练生成器G并初始化参数θG,根据输入的随机噪声生成模拟数据
Figure FDA0003858858070000029
根据生成器G生成的模拟数据以及带有标签的真实数据,训练判别器D,同时更新判别器D的参数ωD,所述参数ωD的更新方式为:
Figure FDA00038588580700000210
Figure FDA00038588580700000211
其中,ηD表示学习率,m表示生成信号的长度,zi表示噪声样本,xi表示真实样本;
固定训练后的判别器参数,训练并更新生成器G的参数,所述参数θG的更新方式为:
Figure FDA00038588580700000212
Figure FDA00038588580700000213
其中ηG表示学习率,
Figure FDA00038588580700000214
表示生成器的梯度;
对生成器G和判别器D进行交替的循环训练,直到生成器生成的数据分布与真实分布小于设定的阈值,则判定达到纳什均衡,完成模型训练;
基于训练完成的生成器G实现少数类故障样本的一次数据扩充。
6.根据权利要求1所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,所述基于聚类的少数类样本合成技术进行少数类故障样本的二次数据扩充采用基于过采样算法的生成策略,包括以下步骤:
3-1)将每一类少数类故障样本分别与多数类正常样本进行拼接形成备用数据集;
3-2)在备用数据集样本中随机选取k个样本作为k均值聚类的簇中心;
3-3)基于欧氏距离分别计算样本点到各个簇中心的距离:
Figure FDA0003858858070000031
其中,xi和yi表示空间中的两个样本点,n表示样本的维度,各个样本点选择与其距离最近的簇中心形成k个簇;
3-4)对形成的k个簇,计算该簇内距离其他样本点距离之和最小的样本点作为该簇新的簇中心;
3-5)重复步骤3-3)-步骤3-4),直到簇中心不再改变,完成聚类;
3-6)对聚类完成的所有簇按照簇中包含的少数类故障样本数量从大到小进行排序,选择前k个簇,完成过滤步骤;
3-7)在过滤后的簇中,基于采样倍率R从少数类故障样本中选择一个样本xi及其相邻的R个最近邻样本xRi
3-8)依次在xi和xRi之间合成新的样本点,合成公式如下:
xR=xi+rand(0,1)×|xRi-xi|
其中rand(0,1)表示取0到1之间的随机数,xR表示合成的新样本;
3-9)对每一类少数类故障样本和多数类正常样本拼接成的数据集重复步骤3-1)-步骤3-8),获得二次数据扩充的少数类故障样本。
7.根据权利要求1所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,所述卷积神经网络诊断模型包括卷积神经网络和注意力机制,卷积神经网络对输入数据进行特征提取,其输出的特征作为注意力机制的输入来进行信息的权重分配,注意力机制输出包含重要信息标记的故障特征,并通过全连接层和Softmax函数得到诊断模型的故障诊断分类结果,卷积神经网络诊断模型的损失函数为交叉熵损失函数:
Figure FDA0003858858070000041
其中J(θ)为损失值,θ为模型的训练参数,hk为输出类别,fk(θ)表示样本的预测概率值,N为故障类别的数量。
8.根据权利要求7所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,所述卷积神经网络基于卷积层和池化层进行特征提取,其中,卷积层的计算过程为:
Figure FDA0003858858070000042
其中
Figure FDA0003858858070000043
为卷积之后第l层的第j个特征映射,f(·)表示激活函数,M为输入的特征映射个数,
Figure FDA0003858858070000044
为输入的第l-1层的第i个特征映射,*为卷积操作,
Figure FDA0003858858070000045
为卷积核,
Figure FDA0003858858070000046
表示偏置参数;激活函数f采用的是ReLU激活函数:
Figure FDA0003858858070000047
卷积层之后紧接一层池化层,池化的过程为:
Figure FDA0003858858070000048
其中
Figure FDA0003858858070000049
为池化之后l+1层的第j个特征映射,down为下采样函数,
Figure FDA00038588580700000410
为l+1层的偏置参数;
输入数据经过2次卷积层和池化层的特征提取得到各通道输出的特征F=[f1,f2,f3,...,fn],n为特征序列的长度。
9.根据权利要求7所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,所述注意力机制基于一个全连接层计算特征的注意力分值si
si=sigmoid(wafi+ba)
其中wa是注意力层的权重参数,ba是注意力层的偏置参数,fi为输入的特征,sigmoid是激活函数,其表达式为:
Figure FDA00038588580700000411
将卷积神经网络输出的特征序列F=[f1,f2,f3,...,fn]输入全连接层后得到注意力分值序列S=[s1,s2,s3,...,sn];
利用注意力分值计算待训练的注意力权重参数,并基于注意力权重参数对特征进行权重重新分配:
Figure FDA0003858858070000051
fi'=αifi
其中αi为训练得到的注意力权重参数,fi′为经过注意力机制进行权重重新分配之后包含重要信息标记的的特征,注意力机制的输出特征序列表示为F′=[f1′,f2′,f3′,...,fn′]。
10.根据权利要求9所述的一种基于生成数据融合的轴承不平衡故障诊断方法,其特征在于,全连接层将包含重要信息标记的故障特征展平为一维:
Figure FDA0003858858070000052
其中yi表示全连接层的输出,σ(·)为激活函数,wf和bf为相邻层之间的权重矩阵以及偏置参数;
在全连接层之后通过Softmax函数得到故障诊断分类结果:
Figure FDA0003858858070000053
其中fk(y)表示对第k个输出的预测值,yk表示全连接层第k个输出。
CN202211159329.3A 2022-09-22 2022-09-22 一种基于生成数据融合的轴承不平衡故障诊断方法 Pending CN115510965A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211159329.3A CN115510965A (zh) 2022-09-22 2022-09-22 一种基于生成数据融合的轴承不平衡故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211159329.3A CN115510965A (zh) 2022-09-22 2022-09-22 一种基于生成数据融合的轴承不平衡故障诊断方法

Publications (1)

Publication Number Publication Date
CN115510965A true CN115510965A (zh) 2022-12-23

Family

ID=84506346

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211159329.3A Pending CN115510965A (zh) 2022-09-22 2022-09-22 一种基于生成数据融合的轴承不平衡故障诊断方法

Country Status (1)

Country Link
CN (1) CN115510965A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116383737A (zh) * 2023-06-05 2023-07-04 四川大学 基于聚类对比学习的旋转机械故障诊断方法及系统
CN116405368A (zh) * 2023-06-02 2023-07-07 南京信息工程大学 一种高维不平衡数据条件下的网络故障诊断方法、系统
CN116432091A (zh) * 2023-06-15 2023-07-14 山东能源数智云科技有限公司 基于小样本的设备故障诊断方法、模型的构建方法及装置
CN116484258A (zh) * 2023-04-26 2023-07-25 成都市特种设备检验检测研究院(成都市特种设备应急处置中心) 电梯曳引机轴承故障诊断方法
CN116595444A (zh) * 2023-07-19 2023-08-15 北京大学第一医院 一种基于深度学习的医疗器械的故障类别检测方法和系统
CN117077736A (zh) * 2023-10-12 2023-11-17 国网浙江省电力有限公司余姚市供电公司 故障诊断模型训练方法、电网故障诊断方法及存储介质
CN117332268A (zh) * 2023-10-08 2024-01-02 上海交通大学 一种改进gan的gis局放数据增强方法及系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116484258A (zh) * 2023-04-26 2023-07-25 成都市特种设备检验检测研究院(成都市特种设备应急处置中心) 电梯曳引机轴承故障诊断方法
CN116405368A (zh) * 2023-06-02 2023-07-07 南京信息工程大学 一种高维不平衡数据条件下的网络故障诊断方法、系统
CN116405368B (zh) * 2023-06-02 2023-08-22 南京信息工程大学 一种高维不平衡数据条件下的网络故障诊断方法、系统
CN116383737A (zh) * 2023-06-05 2023-07-04 四川大学 基于聚类对比学习的旋转机械故障诊断方法及系统
CN116383737B (zh) * 2023-06-05 2023-08-11 四川大学 基于聚类对比学习的旋转机械故障诊断方法及系统
CN116432091A (zh) * 2023-06-15 2023-07-14 山东能源数智云科技有限公司 基于小样本的设备故障诊断方法、模型的构建方法及装置
CN116432091B (zh) * 2023-06-15 2023-09-26 山东能源数智云科技有限公司 基于小样本的设备故障诊断方法、模型的构建方法及装置
CN116595444A (zh) * 2023-07-19 2023-08-15 北京大学第一医院 一种基于深度学习的医疗器械的故障类别检测方法和系统
CN116595444B (zh) * 2023-07-19 2023-09-26 北京大学第一医院 一种基于深度学习的医疗器械的故障类别检测方法和系统
CN117332268A (zh) * 2023-10-08 2024-01-02 上海交通大学 一种改进gan的gis局放数据增强方法及系统
CN117077736A (zh) * 2023-10-12 2023-11-17 国网浙江省电力有限公司余姚市供电公司 故障诊断模型训练方法、电网故障诊断方法及存储介质

Similar Documents

Publication Publication Date Title
CN115510965A (zh) 一种基于生成数据融合的轴承不平衡故障诊断方法
CN110516305B (zh) 基于注意机制元学习模型的小样本下故障智能诊断方法
CN110969191B (zh) 基于相似性保持度量学习方法的青光眼患病概率预测方法
CN105738109A (zh) 基于稀疏表示与集成学习的轴承故障分类诊断方法
CN104038792B (zh) 用于iptv监管的视频内容分析方法及设备
CN111340034A (zh) 一种针对自然场景的文本检测与识别方法及系统
CN111833310A (zh) 一种基于神经网络架构搜索的表面缺陷分类方法
CN110414587A (zh) 基于渐进学习的深度卷积神经网络训练方法与系统
CN114429152A (zh) 基于动态指数对抗性自适应的滚动轴承故障诊断方法
CN115358337A (zh) 一种小样本故障诊断方法、装置及存储介质
CN104504361B (zh) 基于方向特征的手掌静脉主方向特征提取方法
CN115730241A (zh) 一种水轮机空化噪声识别模型的构建方法
CN109299251A (zh) 一种基于深度学习算法的异常垃圾短信识别方法及系统
CN115587290A (zh) 基于变分自编码生成对抗网络的航空发动机故障诊断方法
CN112747924A (zh) 一种基于注意力机制和残差神经网络的轴承寿命预测方法
CN117516937A (zh) 基于多模态特征融合增强的滚动轴承未知故障检测方法
CN115908842A (zh) 变压器局部放电数据增强与识别方法
CN110929761A (zh) 智能系统安全体系态势感知构架中采集样本的平衡方法
CN113298184B (zh) 用于小样本图像识别的样本抽取、扩充方法及存储介质
CN117390411A (zh) 基于元迁移学习的变工况轴承故障诊断方法
CN111984790A (zh) 一种实体关系抽取方法
CN108898157B (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法
CN115563500A (zh) 基于数据增强技术的配电设备局部放电模式识别方法、装置及系统
CN114610882A (zh) 一种基于电力短文本分类的异常设备编码检测方法和系统
CN111126455B (zh) 一种基于Lightweight CNN与SVM的磨粒两阶段识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination