CN112763215B - 一种基于模块化联邦深度学习的多工况在线故障诊断方法 - Google Patents

一种基于模块化联邦深度学习的多工况在线故障诊断方法 Download PDF

Info

Publication number
CN112763215B
CN112763215B CN202110053434.8A CN202110053434A CN112763215B CN 112763215 B CN112763215 B CN 112763215B CN 202110053434 A CN202110053434 A CN 202110053434A CN 112763215 B CN112763215 B CN 112763215B
Authority
CN
China
Prior art keywords
condition
network
working
federal
fault diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110053434.8A
Other languages
English (en)
Other versions
CN112763215A (zh
Inventor
周福娜
李思洁
胡雄
王天真
张志强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Maritime University
Original Assignee
Shanghai Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Maritime University filed Critical Shanghai Maritime University
Priority to CN202110053434.8A priority Critical patent/CN112763215B/zh
Publication of CN112763215A publication Critical patent/CN112763215A/zh
Application granted granted Critical
Publication of CN112763215B publication Critical patent/CN112763215B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings
    • G01M13/045Acoustic or vibration analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Acoustics & Sound (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于模块化联邦深度学习的多工况在线故障诊断方法。大型机械设备工作在多工况环境中,会破坏数据独立同分布的特性导致采集的数据质量较低,且单个神经网络在故障诊断时存在数据利用不充分、特征提取不全面等问题,进而影响故障诊断精度。针对上述问题,提出一种模块化联邦学习的方法,首先根据单工况序列数据建立深度神经网络模块进行特征抽取,同时利用新的网络对多工况序列数据进行特征抽取,之后多模块联邦进行决策层的特征联邦学习,并利用胶囊模块网络进一步进行模块划分,通过自适应联邦以实现模块间权重自适应分配给顶层故障诊断模块,从而更加精确的进行多工况故障诊断。该方法通过模块化联邦使得故障诊断更加准确。

Description

一种基于模块化联邦深度学习的多工况在线故障诊断方法
技术领域
本发明涉及基于深度学习的轴承故障诊断技术领域,尤其涉及一种基于模块化联邦深度学习的多工况在线故障诊断方法,实现基于模块化联邦深度学习的轴承故障诊断。
背景技术
由于大型机械设备通常拥有复杂的结构,并且大多在恶劣的环境中工作。经调查显示滚动轴承的故障是导致机械设备故障的主要因素之一,所以对其进行状态检测和故障诊断是很有必要的。并且智能故障诊断的挑战在于,实际工作中,大型机械设备由于外界环境,过程负荷等条件的变化,导致设备运行在多个工况中。因此提供一种效果较好的多工况故障诊断方法来进行故障诊断是本领域技术人员需要研究的问题。
近年来,随着机器学习的发展,多种多样滚动轴承进行故障诊断的方法应运而生。目前的滚动轴承故障诊断方法主要有两大类:基于物理模型的故障诊断和基于数据驱动模型的故障诊断。基于物理模型的故障诊断技术通过动态建模来模拟对象,其参数具有实际物理意义。但是,随着大型机械设备复杂性的增加,掌握设备准确的物理模型几乎是不可能的。与此相比,随着传感器等技术的飞速发展,采集数据变得非常容易,而基于数据驱动模型的故障诊断方法是通过采集到的设备的历史数据进行处理并建立模型,从而得到准确的故障诊断结果,所以基于数据驱动的故障诊断方法成为了主流。
深度学习作为机器学习的一个重要分支,在数据分析方面具有较强的非线性特征提取能力和较好的泛化性能,所以其在故障诊断中应用越来越多。传统的深度学习方法在处理多工况问题时,大多先对时变的多工况数据进行工况划分,这样就需要大量有工况标签的数据训练工况划分网络,但是在一些复杂的工业场景中其工况的采集较为艰难,所以面临有工况标签的数据数量较少的问题。并且多工况数据破坏了深度学习所希望的数据独立同分布的假设,导致数据质量低,无法直接训练出诊断精度较高的故障诊断模型。
联邦学习通过远程单组设备的孤立数据中心训练统计模型,保持数据本地化的同时实现多个孤立数据中心对机器学习模型进行联合优化的目的,本专利利用联邦学习的思想,通过把多个工况下建立的多个深度学习网络进行联邦优化,有望解决上述传统神经网络所面临的数据数量少,质量低的问题。本专利发明了一种基于模块化联邦深度学习的多工况在线故障诊断方法,在面临多工况故障数据时不需进行模块划分即可进行多工况故障诊断。
发明内容
针对现有故障诊断方法中多工况数据质量不高、有工况标签数据较少、标量神经元无法充分的表示特征、神经网络不能最大效率的利用已有的训练数据进行故障诊断等技术问题。本发明提出一种基于模块化联邦深度学习的多工况在线故障诊断方法,用不同的神经网络提取单工况的局部特征和多工况的全局特征,对有工况标签数据和无工况标签数据进行模块化联邦使得数据利用更加充分,并利用矢量神经元使得特征表达更加完善,从而使得故障诊断更加准确。
具体的,本发明通过以下方案达到上述目的:
一种基于模块化联邦深度学习的多工况在线故障诊断方法,包括以下步骤:
S1、首先,建立各模块所需的数据集,所述数据集包括训练集和测试集,且均为一维序列振动数据;
所述步骤S1包含以下步骤:
S1.1、选取已知的单工况的轴承一维序列样本数据,构成联邦学习中多参与者的训练集,并设置不同故障类型标签;
S1.2、选取与步骤S1.1不同的轴承一维序列数据按P1:P2:…:P4构造多工况一维序列样本数据;
S1.3、对步骤S1.1和S1.2中所述的一维数据作为训练集和测试集,两者比例为10:1;
S2、根据已知的单工况数据建立工况间模块化联邦深度学习的故障诊断模型:
所述步骤S2包含以下步骤:
S2.1、根据训练集中单工况的轴承数据搭建i个深度神经网络
Figure BDA00028999982200000315
如公式(16)所示:
Figure BDA0002899998220000031
其中,Feedforward是生成神经网络的函数,
Figure BDA0002899998220000032
是DNN的网络参数,
Figure BDA0002899998220000033
是权值矩阵,
Figure BDA0002899998220000034
为偏置向量;i是已知DNN单工况网络的个数;
Figure BDA0002899998220000035
表示隐藏层的神经元个数,Xi表示输入第i个DNN的一维序列数据;基于一维序列数据训练i个DNN网络;
S2.2、利用训练好的i个深度神经网络和网络参数提取一维序列数据特征
Figure BDA0002899998220000036
并将提取到的局部特征
Figure BDA0002899998220000037
进行联邦得到Fmul
Figure BDA0002899998220000038
Figure BDA0002899998220000039
其中,
Figure BDA00028999982200000310
是DNN网络的非线性输出函数,
Figure BDA00028999982200000311
表示训练好的第i个DNN网络模型参数,Fmul是训练好的i个DNN网络所提取的局部特征
Figure BDA00028999982200000312
的联邦拼接结果;
S3、根据训练集中的多工况一维序列数据,通过另一个深度神经网络DNN提取其全局特征
Figure BDA00028999982200000313
所述步骤S3包含以下步骤:
S3.1、根据训练集中的一维序列数据搭建深度神经网络
Figure BDA00028999982200000314
如公式(19)所示:
Figure BDA0002899998220000041
其中,
Figure BDA0002899998220000042
是DNN的网络参数,
Figure BDA0002899998220000043
是权值矩阵,
Figure BDA0002899998220000044
为偏置向量;λ是网络训练中批量归一化的系数,β是网络训练中批量归一化的参数;
Figure BDA0002899998220000045
表示隐藏层的神经元个数,X表示输入的多工况一维序列数据,基于一维序列数据训练DNN网络;
S3.2、利用训练好的网络结构参数提取一维序列数据特征Fglobal
Figure BDA0002899998220000046
其中,
Figure BDA0002899998220000047
是DNN网络的非线性输出函数,
Figure BDA0002899998220000048
表示训练好的DNN的网络模型参数,λ和β是可训练的网络批量归一化参数;
S4、根据步骤S2中i个DNN提取的单工况的局部特征
Figure BDA0002899998220000049
和步骤S3中新的DNN提取的序列的全局特征
Figure BDA00028999982200000410
将局部特征
Figure BDA00028999982200000411
联邦为Fmul后对其进行多层特征压缩后,实现有工况标签特征Fmul和无工况标签特征Fglobal之间的联邦学习,通过上述联邦机制融合两种不同尺度的特征得到Ffusion
所述步骤S4包含以下步骤:
S4.1、将步骤S2中i个DNN提取的单工况的局部特征先进行联邦得到的Fmul,对得到的Fmul进行特征压缩:
Flocal=Netll;Fmul) (21)
其中,θl={Wl,bl}是特征压缩网络的参数,Wl是权值矩阵,bl为偏置向量,Fmul为不同工况间的联邦特征;
S4.2、根据不同尺度提取出的特征Flocal和Fglobal进行拼接后再通过(22)式进行批量归一化,将其统一到同一量纲上:
Figure BDA00028999982200000412
其中,E(·)和Var(·)为输入fs的平均值和标准差;γ和β是可以训练的,ε是一个非常小的数,以保证分母不为0;Ffusion为不同尺度特征拼接后的结果,fs为mini-batch的Ffusion
S5、建立基于动态路由机制的自适应联邦学习网络Netfusion,通过动态路由算法更新联邦学习模块间的权重分配,训练联邦网络参数:
Fv=Netfusionf;Flocal;Fglobal) (23)
其中θf={Wnm,cnm},其中m为故障种类数,Wnm为权重矩阵,两者乘积用来计算预测向量
Figure BDA0002899998220000051
Flocal表示根据单工况所提取的局部特征,Fglobal表示根据多工况数据提取的全局特征;
所述步骤S5包含以下步骤:
S5.1、对归一化后的特征
Figure BDA0002899998220000052
进行胶囊模块划分bn
Figure BDA0002899998220000053
其中,m为故障种类数,Wnm为权重矩阵,两者乘积用来计算预测向量
Figure BDA0002899998220000054
S5.2、通过动态路由机制自适应联邦以实现模块间权重自适应的分配:
Figure BDA0002899998220000055
Figure BDA0002899998220000056
其中,∑mcnm=1,cnm通过动态路由算法更新,在初始迭代时bnm=0;
S5.3、在联邦学习得到的vm后加入Squashing函数得到预测的输出vc,vc的长度代表了故障诊断的概率分布,具体操作如下:
Figure BDA0002899998220000057
fl(vc)=Tcmax(0,m+-||vc||)2+λ(1-Tc)max(0,||vc||-m-)2 (28)
其中,vc表示代表故障诊断结果概率分布的联邦后模块的长度,Tc是当前故障的目标类别;m+=0.9和m-=0.1;λ为未出现故障的损失权重;
S6、步骤S5中所述的故障诊断概率分布vc其总和并不为1,为了将其输出到标准概率同时调整联邦学习网络,结合S4建立的Ffusion作为联邦学习网络的输入的同时,将S3建立的Fglobal作为Softmax分类器的输入,进行故障诊断分类,如公式(29)所示:
R=Lossfusionf;Fs;Fglobal} (29)
其中,R表示分类准确率,θ表示Softmax网络模型参数;
S7、同时调整网络
Figure BDA0002899998220000061
Netfusion、Lossfusion的网络参数进行多模块联邦;
S8、将步骤S2中所述测试集中的所有数据输入所述网络模型,得到测试集的故障诊断分类结果,并评价所述网络模型的效果。
与现有技术相比,本发明的有益效果在于:根据少量的有工况标签数据进行不同工况所建立的局部深度学习模型之间的联邦学习,用深度神经网络对不同工况下的数据进行特征预抽取,从各个工况得到局部特征。同时使用新的神经网络对大量无工况标签的多工况数据进行全局特征抽取,并与上述少量有工况标签数据建立新的联邦学习网络,实现多个神经网络抽取的不同尺度的特征联邦。将联邦学习后的特征进行归一化后,基于联邦融合的特征进一步进行胶囊模块的划分,通过动态路由机制实现模块间自适应联邦并将权重分配给各个故障诊断模块,实现无工况标签数据和有工况标签数据的全局联邦,并且以误差反向传播算法进一步优化整个联邦学习网络,优化各联邦学习模块以实现对轴承的多工况故障诊断。该方法通过模块化联邦使得数据利用更加充分,并且利用矢量神经元使得其拥有比标量神经元更加完善的特征表达,从而提高故障诊断的精度。在无工况标签的情况下,本发明可以有效的提高小样本对轴承多工况故障诊断的精度。对基于工业大数据分析的智能诊断技术的发展和应用落地有一定的促进作用,对智能制造行业亟需的设备健康状态智能监测问题具有现实问题解决层面的意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于模块化联邦深度学习的多工况在线故障诊断方法的结构图。
图2为实验中故障尺寸为0.014英寸时2种工况时,样本序列长度为400的情况下传统DNN的多工况故障诊断精度图。
图3为实验中故障尺寸为0.014英寸2种工况时,样本序列长度为400的情况下本发明基于模块化联邦深度学习的多工况在线故障诊断精度图。
图4为实验中故障尺寸为0.014英寸时3种工况时,样本序列长度为400的情况下传统DNN的多工况故障诊断精度图。
图5为实验中故障尺寸为0.014英寸3种工况时,样本序列长度为400的情况下本发明基于模块化联邦深度学习的多工况在线故障诊断精度图。
图6为实验中故障尺寸为0.014英寸4种工况时,样本序列长度为400的情况下传统DNN的多工况故障诊断精度图。
图7为实验中故障尺寸为0.014英寸4种工况时,样本序列长度为400的情况下本发明基于模块化联邦深度学习的多工况在线故障诊断精度图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示一种基于模块化联邦深度学习的多工况在线故障诊断方法,包括以下步骤:
S1、建立数据集,
每种原始轴承故障数据集共有121840个序列样本数据,总的数据集包括四种工况和四种故障类型,四种工况对应于轴承的四种载荷分别为:0hp,1hp,2hp,3hp;四种故障类型分别为:内圈故障、外圈故障、滚动体故障和正常状态;将故障标签分别设置为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15;将数据集按照10:1的比例划分为训练集和测试集;
S2、通过建立各工况模块化深度学习的故障诊断模型,以实现各个有工况标签的轴承数据进行工况间联邦学习:
所述步骤S2包含以下步骤:
S2.1、根据训练集中4种单工况的轴承数据搭建深度神经网络NetDNN,如公式(30)所示:
Figure BDA0002899998220000081
其中,Feedforward是生成神经网络的函数,
Figure BDA0002899998220000082
是DNN的网络参数,
Figure BDA0002899998220000083
是权值矩阵,
Figure BDA0002899998220000084
为偏置向量;已知DNN单工况网络的个数为i=4;
Figure BDA0002899998220000085
表示隐藏层的神经元个数,Xi表示输入第i个DNN的一维序列数据;基于一维序列数据训练4个DNN网络;
S2.2、利用训练好的4个深度神经网络和网络参数提取各工况一维序列数据特征
Figure BDA0002899998220000086
并将提取到的各工况的局部特征
Figure BDA0002899998220000087
进行拼接得到Fmul
Figure BDA0002899998220000088
Figure BDA0002899998220000089
其中,
Figure BDA00028999982200000810
是DNN网络的非线性输出函数,
Figure BDA00028999982200000811
表示训练好的第i个DNN网络模型参数,Fmul是训练好的4个DNN网络所提取的局部特征
Figure BDA00028999982200000812
的拼接结果;
S3、根据训练集中的轴承多工况的一维序列数据,通过另一个深度神经网络DNN5提取其全局特征
Figure BDA0002899998220000091
所述步骤S3包含以下步骤:
S3.1、根据训练集中的一维序列数据搭建深度神经网络
Figure BDA0002899998220000092
如公式(33)所示:
Figure BDA0002899998220000093
其中,
Figure BDA0002899998220000094
是DNN的网络参数,
Figure BDA0002899998220000095
是权值矩阵,
Figure BDA0002899998220000096
为偏置向量;λ是网络训练中批量归一化的系数,β是网络训练中批量归一化的参数;
Figure BDA0002899998220000097
表示隐藏层的神经元个数,X表示输入的多工况一维序列数据,基于一维序列数据训练DNN网络;
S3.2、利用训练好的多工况神经网络模块的结构参数提取多工况一维序列数据的全局特征Fglobal
Figure BDA0002899998220000098
其中,
Figure BDA0002899998220000099
是DNN5网络的非线性输出函数,
Figure BDA00028999982200000910
表示训练好的DNN5的网络模型参数,λ和β是训练好的网络批量归一化参数;
S4、根据步骤S2中4个DNN提取的单工况的局部特征
Figure BDA00028999982200000911
和步骤S3中全局特征提取网络提取的多工况序列的全局特征
Figure BDA00028999982200000912
先将有工况标签特征局部特征
Figure BDA00028999982200000913
联邦为Fmul,并对Fmul进行多层特征压缩后,与无工况标签特征Fglobal进行联邦学习,通过上述联邦机制融合两种不同尺度的特征得到Ffusion
所述步骤S4包含以下步骤:
S4.1、将步骤S2中4个DNN提取的单工况的局部特征进行联邦得到的Fmul并对其进行特征压缩,提取出更具代表性的特征:
Flocal=Netll;Fmul) (35)
其中,θl={Wl,bl}是特征压缩网络的参数,Wl是权值矩阵,bl为偏置向量,Fmul为拼接后的联邦特征;
S4.2、将根据不同尺度提取出的特征Flocal和Fglobal联邦后再通过(37)式进行批量归一化,将其统一到同一量纲上:
Ffusion=[Flocal,Fglobal] (36)
Figure BDA0002899998220000101
其中,E(·)和Var(·)为输入fs的平均值和标准差;γ和β是可以训练的,ε是一个非常小的数,以保证分母不为0;Ffusion为不同尺度特征联邦后的结果,fs为mini-batch的Ffusion
S5、建立基于动态路由机制的有工况标签的单工况数据和无工况标签的多工况数据的联邦网络Netfusion,通过动态路由算法更新联邦学习模块间的权重分配,训练联邦网络参数:
Fv=Netfusionf;Flocal;Fglobal) (38)
其中θf={Wnm,cnm},其中m为故障种类数,Wnm为权重矩阵,两者乘积用来计算预测向量
Figure BDA0002899998220000102
Flocal表示根据单工况所提取的局部特征,Fglobal表示根据多工况数据提取的全局特征;
所述步骤S5包含以下步骤:
S5.1、对归一化后的联邦特征
Figure BDA0002899998220000103
进行胶囊模块划分bn
Figure BDA0002899998220000104
其中,m为故障种类数,Wnm为权重矩阵,两者乘积用来计算预测向量
Figure BDA0002899998220000105
S5.2、通过动态路由机制进行联邦,并自适应更新顶层故障诊断胶囊模块的权重分配:
Figure BDA0002899998220000106
Figure BDA0002899998220000107
其中,∑mcnm=1,cnm通过动态路由机制更新,在初始迭代时bnm=0;
S5.3、在联邦优化后的vm后加入Squashing函数得到预测的输出vc,vc的长度代表了故障诊断的概率分布,具体操作如下:
Figure BDA0002899998220000111
fl(vc)=Tcmax(0,m+-||vc||)2+λ(1-Tc)max(0,||vc||-m-)2 (43)
其中,vc表示代表故障诊断结果概率分布的联邦后模块的长度,Tc是当前故障的目标类别;m+=0.9和m-=0.1;本发明中λ=0.6为未出现故障的损失权重;
S6、将步骤S5中所述的故障诊断概率分布vc,其输出不满足标准概率,所以结合S4建立的Ffusion作为联邦学习网络的输入的同时,将S3建立的Fglobal作为Softmax分类器的输入,同时调整整个联邦学习网络,再进行故障诊断,如公式(44)所示:
R=Lossfusionf;Fs;Fglobal} (44)
Figure BDA0002899998220000112
Figure BDA0002899998220000113
其中,R表示分类准确率,θ表示Softmax网络模型参数,label(X)为多工况故障诊断网络DNN5的输出样本类别数;
S7、同时调整网络
Figure BDA0002899998220000114
Netfusion、Lossfusion的网络参数,总的损失函数的公式如(48)所示;
Figure BDA0002899998220000115
Jall(vc;θ)=Fl(vc)+J(θ) (48)
其中labelreal为真实标签,通过最小化Jall(vc,θ)来优化全局网络;
S8、将步骤S2中所述测试集中的所有数据输入所述网络模型,得到测试集的故障诊断分类结果,并评价所述网络模型的效果。
为了验证本发明的有效性和泛化性,采用凯斯西储大学的轴承实验平台采集到的多工况轴承数据进行下述实验:
使用凯斯西储大学的轴承实验平台采集到的多工况轴承数据进行仿真,该数据集是世界公认的故障诊断标准数据集。通过更换由于加工中电火花导致的不同尺寸和处在不同故障位置的点蚀故障的轴承进行振动序列数据采集。本发明的实验选取该数据中轴承故障的尺寸分别为:0.007英寸,0.014英寸,0.021英寸,采样频率为12kHz时的多工况数据。实验中利用加速度传感器采集不同负载情况电机驱动端轴承的振动信号,轴承的状态分为四种:内圈故障,外圈故障,滚珠故障和正常状态,同时传感器采集的数据包含有4种不同的工况,分别为电机负载为0hp,1hp,2hp,3hp情况下轴承的运转情况。利用轴承多工况故障数据来对本发明的可行性进行讨论,并与只使用一维多工况序列数据作为传统DNN网络的输入进行障诊断的情况对比。
(1)数据预处理
如图1所示为本发明具体框图,本发明采用滑动窗进行数据预处理。每一个滑动窗口为一个样本。滑动窗口大小设置为400,即每个样本的参数个数为400,滑动步长设置为20。每类故障包含1000个训练样本和100个测试样本。工况划分及单工况数据设置如表1所示,故障标签设置如表2所示。
表1工况划分及分工况数据设置
工况 负载(hp) 转速(rpm) 每类单工况样本数
工况1 0 1797 200
工况2 1 1772 200
工况3 2 1750 200
工况4 3 1730 200
表2故障标签设置
Figure BDA0002899998220000131
(2)实验设计
实验设置使用多工况轴承故障数据对本发明方法DR-FLMNN的可行性进行讨论,并设置对比实验:a.传统神经网络对多工况数据,b.使用本发明模块化联邦学习的方法DR-FLMNN进行多工况故障诊断,具体实验设置如表3所示。每组实验都用上述两种方法做对比。
表3实验设计表
Figure BDA0002899998220000132
(3)参数设置
本发明实验的具体网络参数如表4所示。
表4各模型参数设置
Figure BDA0002899998220000141
(4)实验结果分析
实验结果如表5所示。
表5多工况故障诊断实验结果
Figure BDA0002899998220000142
Figure BDA0002899998220000151
从表5的第3列可以看到,本发明的方法拟合效果要优于传统神经网络,同时对比实验1到实验4中可以看到,对于大故障尺寸的轴承故障振动信号来说,随着多工况种数的增多,多工况故障数据破坏了数据独立同分布的性质导致数据质量较低,传统DNN神经网络的对其故障诊断精度也逐步降低,而本发明的DR-FLMNN方法,在利用根据单工况所提取的局部特征与根据多工况数据提取得全局特征共同进行联邦学习的情况下,增加了特征提取的充分性,并且利用适量神经元的思想增加了特征的表达能力,可以看到在实验1到实验4中DR-FLMNN均保持良好的故障诊断精度。在工况数增大到4类时,DR-FLMNN相较于传统DNN的故障诊断精度提高了13%,所以本发明方法可以良好的解决轴承多工况故障诊断问题。在图中若“+”和“o”重叠则证明其故障诊断结果正确,反之则错误。图2和图3分别是实验2中的2种工况时的DNN和DR-FLMNN的多工况故障诊断精度图。图4和图5为实验3中0.014英寸下的的3种工况的多工况故障诊断精度图,可以看到对于多工况故障诊断DR-FLMNN具有较好的精确性。
从表5的实验4和实验6可以看出,本发明所提出的方法在面对小样本时,多工况故障诊断精度虽然有所下降,但较传统的DNN神经网络其诊断精度提高了19%,说明本发明在小样本时对多工况故障诊断依然具有很好的有效性。
同时对比实验5到实验7,在其第4列可以看到在小样本的条件下,0.007英寸为小故障尺寸,0.014英寸和0.021英寸属于较大的故障尺寸,随着故障尺寸增大其故障诊断精度也会增加。在图中若“+”和“o”重叠则证明其故障诊断结果正确,反之则错误。在图6中可以看到,其故障诊断结果错误数量较多,说明DNN无法将16中轴承的状态分辨出来,在图7中使用本发明的DR-FLMNN方法解决多工况轴承故障诊断问题,可以看到其故障诊断结果有明显提高。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于模块化联邦深度学习的多工况在线故障诊断方法,其特征在于,包括以下步骤:
S1、建立数据集,所述数据集包括训练集和测试集,所述训练集和测试集均包含一维序列数据;
所述步骤S1包含以下步骤:
S1.1、选取已知的单工况的轴承一维序列数据,构成联邦学习中多参与者的训练集,并设置不同故障类型标签;
S1.2、选取与步骤S1.1不同的轴承一维序列数据按P1:P2:…:PN构造多工况一维序列数据;
S1.3、对步骤S1.1和S1.2中所述的一维序列数据作为训练集,同时按10:1分为训练集和测试集;
S2、建立不同工况模块间的联邦深度学习的故障诊断模型:
所述步骤S2包含以下步骤:
S2.1、根据训练集中已知的i种单工况的轴承数据搭建i个深度神经网络
Figure FDA0003554231680000011
如公式(1)所示:
Figure FDA0003554231680000012
其中,Feedforward是生成神经网络的函数,
Figure FDA0003554231680000013
是DNN的网络参数,
Figure FDA0003554231680000014
是权值矩阵,
Figure FDA0003554231680000015
为偏置向量;i是已知DNN单工况网络的个数;
Figure FDA0003554231680000016
表示隐藏层的神经元个数,Xi表示输入第i个DNN的一维序列数据;基于一维序列数据训练i个DNN网络;
S2.2、利用训练好的i个深度神经网络和网络参数提取一维序列数据特征
Figure FDA0003554231680000017
并将提取到的局部特征
Figure FDA0003554231680000018
进行联邦得到Fmul
Figure FDA0003554231680000021
Figure FDA0003554231680000022
其中,
Figure FDA0003554231680000023
是DNN网络的非线性输出函数,
Figure FDA0003554231680000024
表示训练好的第i个DNN网络模型参数,Fmul是训练好的i个DNN网络所提取的局部特征
Figure FDA0003554231680000025
的联邦拼接结果;
S3、根据训练集中的多工况一维序列数据,通过另一个深度神经网络DNN提取其全局特征
Figure FDA0003554231680000026
所述步骤S3包含以下步骤:
S3.1、根据训练集中的一维序列数据搭建深度神经网络
Figure FDA0003554231680000027
如公式(4)所示:
Figure FDA0003554231680000028
其中,
Figure FDA0003554231680000029
是DNN的网络参数,
Figure FDA00035542316800000210
是权值矩阵,
Figure FDA00035542316800000211
为偏置向量;λ和β是网络训练中批量归一化的参数;
Figure FDA00035542316800000212
表示隐藏层的神经元个数,X表示输入的多工况一维序列数据,基于一维多工况序列数据训练DNN网络;
S3.2、利用训练好的网络结构参数提取一维序列数据特征Fglobal
Figure FDA00035542316800000213
其中,
Figure FDA00035542316800000214
是DNN网络的非线性输出函数,
Figure FDA00035542316800000215
表示训练好的DNN的网络模型参数,λ和β是训练好的网络批量归一化参数;
S4、根据步骤S2中i个DNN提取的单工况的局部特征
Figure FDA00035542316800000216
和步骤S3中新的DNN提取的多工况全局特征
Figure FDA00035542316800000217
先将局部特征
Figure FDA00035542316800000218
联邦为Fmul,并对Fmul进行多层特征压缩后,实现有工况标签特征Fmul和无工况标签特征Fglobal之间的联邦学习,通过上述联邦机制融合两种不同尺度的特征得到Ffusion
所述步骤S4包含以下步骤:
S4.1、将步骤S2中i个DNN提取的单工况的局部特征先进行联邦得到的Fmul,对得到的Fmul进行特征压缩:
Flocal=Netll;Fmul) (6)
其中,θl={Wl,bl}是特征压缩网络的参数,Wl是权值矩阵,bl为偏置向量,Fmul为不同工况间的联邦特征;
S4.2、根据不同尺度提取出的特征Flocal和Fglobal进行拼接后再通过(8)式进行批量归一化,将其统一到同一量纲上:
Ffusion=[Flocal,Fglobal] (7)
Figure FDA0003554231680000031
其中,E(·)和Var(·)为输入fs的平均值和标准差;γ和β是可以训练的,ε是一个非常小的数,以保证分母不为0;Ffusion为不同尺度特征拼接后的结果,fs为mini-batch的Ffusion
S5、建立联邦学习网络Netfusion,训练联邦网络参数:
Fv=Netfusionf;Flocal;Fglobal) (9)
其中θf={Wnm,cnm},其中m为故障种类数,Wnm为权重矩阵,两者乘积用来计算预测向量
Figure FDA0003554231680000032
Flocal表示根据单工况所提取的局部特征,Fglobal表示根据多工况数据提取的全局特征;
所述步骤S5包含以下步骤:
S5.1、对归一化后的特征
Figure FDA0003554231680000033
进行胶囊模块划分bn
Figure FDA0003554231680000034
其中,m为故障种类数,Wnm为权重矩阵,两者乘积用来计算预测向量
Figure FDA0003554231680000035
S5.2、通过动态路由算法自适应联邦以实现故障诊断模块间权重自适应的分配:
Figure FDA0003554231680000036
Figure FDA0003554231680000041
其中,∑mcnm=1,cnm通过动态路由算法更新,在初始迭代时bnm=0;
S5.3、在联邦学习得到的vm后加入Squashing函数得到预测的故障诊断结果vc,vc的长度代表了故障诊断的概率分布,具体操作如下:
Figure FDA0003554231680000042
fl(vc)=Tcmax(0,m+-||vc||)2+λ(1-Tc)max(0,||vc||-m-)2 (14)
其中,vc表示代表故障诊断结果概率分布的联邦后模块的长度,Tc是当前故障的目标类别;m+=0.9和m-=0.1;λ为未出现故障的损失权重;
S6、步骤S5中的故障诊断vc概率分布总和并不为1,为了将其输出到标准概率且同时优化整个联邦学习网络,结合S4建立的Ffusion作为联邦学习网络的输入的同时,将S3建立的Fglobal作为Softmax分类器的输入,实现多模型联邦学习从而进行故障诊断分类,如公式(15)所示:
R=Lossfusionf;Fs;Fglobal} (15)
其中,R表示分类准确率,θ表示Softmax网络模型参数;
S7、同时调整网络
Figure FDA0003554231680000043
Netfusion、Lossfusion的网络参数;
S8、将所述测试集中的所有数据输入所述网络模型,得到测试集的故障诊断分类结果,并评价所述网络模型的效果。
CN202110053434.8A 2021-01-15 2021-01-15 一种基于模块化联邦深度学习的多工况在线故障诊断方法 Active CN112763215B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110053434.8A CN112763215B (zh) 2021-01-15 2021-01-15 一种基于模块化联邦深度学习的多工况在线故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110053434.8A CN112763215B (zh) 2021-01-15 2021-01-15 一种基于模块化联邦深度学习的多工况在线故障诊断方法

Publications (2)

Publication Number Publication Date
CN112763215A CN112763215A (zh) 2021-05-07
CN112763215B true CN112763215B (zh) 2022-04-29

Family

ID=75700849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110053434.8A Active CN112763215B (zh) 2021-01-15 2021-01-15 一种基于模块化联邦深度学习的多工况在线故障诊断方法

Country Status (1)

Country Link
CN (1) CN112763215B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113255210B (zh) * 2021-05-13 2022-12-02 燕山大学 一种风电机组联邦故障诊断方法及系统
CN116028509B (zh) * 2023-03-27 2023-06-06 合肥工业大学 一种基于因果机制的最优工况索引生成方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103576594A (zh) * 2013-11-11 2014-02-12 浙江工业大学 一种基于张量全局-局部保持投影的间歇过程在线监控方法
CN110555446A (zh) * 2019-08-19 2019-12-10 北京工业大学 基于多尺度深度特征融合和迁移学习的遥感影像场景分类方法
WO2020115273A1 (en) * 2018-12-07 2020-06-11 Telefonaktiebolaget Lm Ericsson (Publ) Predicting network communication performance using federated learning
CN111537945A (zh) * 2020-06-28 2020-08-14 南方电网科学研究院有限责任公司 基于联邦学习的智能电表故障诊断方法及设备
CN111678696A (zh) * 2020-06-17 2020-09-18 南昌航空大学 基于联邦学习的机械智能故障诊断方法
CN112101489A (zh) * 2020-11-18 2020-12-18 天津开发区精诺瀚海数据科技有限公司 一种联邦学习与深度学习融合驱动的设备故障诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN2015MU01447A (zh) * 2015-04-07 2015-04-24 Vasant Dudul Sanjay

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103576594A (zh) * 2013-11-11 2014-02-12 浙江工业大学 一种基于张量全局-局部保持投影的间歇过程在线监控方法
WO2020115273A1 (en) * 2018-12-07 2020-06-11 Telefonaktiebolaget Lm Ericsson (Publ) Predicting network communication performance using federated learning
CN110555446A (zh) * 2019-08-19 2019-12-10 北京工业大学 基于多尺度深度特征融合和迁移学习的遥感影像场景分类方法
CN111678696A (zh) * 2020-06-17 2020-09-18 南昌航空大学 基于联邦学习的机械智能故障诊断方法
CN111537945A (zh) * 2020-06-28 2020-08-14 南方电网科学研究院有限责任公司 基于联邦学习的智能电表故障诊断方法及设备
CN112101489A (zh) * 2020-11-18 2020-12-18 天津开发区精诺瀚海数据科技有限公司 一种联邦学习与深度学习融合驱动的设备故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Federated learning for machinery fault diagnosis with dynamic validation and self-supervision;WeiZhang 等;《Knowledge-Based Systems》;20201224;第212卷;全文 *
一个面向电力计量系统的联邦学习框架;郑楷洪 等;《中国电机工程学报》;20200831;第40卷;全文 *
基于动态限的非周期非稳定工况故障检测模型;王天真 等;《上海交通大学学报》;20120430;第46卷(第4期);全文 *

Also Published As

Publication number Publication date
CN112763215A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN110361176B (zh) 一种基于多任务特征共享神经网络的智能故障诊断方法
CN111709448B (zh) 一种基于迁移关系网络的机械故障诊断方法
Zhao et al. Deep multi-scale convolutional transfer learning network: A novel method for intelligent fault diagnosis of rolling bearings under variable working conditions and domains
CN111460728B (zh) 一种工业设备剩余寿命预测方法、装置、存储介质及设备
CN111914883B (zh) 一种基于深度融合网络的主轴轴承状态评估方法及装置
CN111046916A (zh) 一种基于空洞卷积胶囊网络的电机故障诊断方法及系统
CN111505424A (zh) 一种基于深度卷积神经网络的大型实验装置电力设备故障诊断方法
CN109829236A (zh) 一种基于XGBoost特征提取的压缩机故障诊断方法
CN114295377B (zh) 一种基于遗传算法的cnn-lstm轴承故障诊断方法
CN111382542A (zh) 一种面向全寿命周期的公路机电设备寿命预测系统
CN112763215B (zh) 一种基于模块化联邦深度学习的多工况在线故障诊断方法
CN111046961B (zh) 基于双向长短时记忆单元和胶囊网络的故障分类方法
Yao et al. Multiscale domain adaption models and their application in fault transfer diagnosis of planetary gearboxes
CN114429152A (zh) 基于动态指数对抗性自适应的滚动轴承故障诊断方法
CN114118138A (zh) 一种基于多标签领域自适应模型的轴承复合故障诊断方法
CN115358259A (zh) 一种基于自学习的无监督跨工况轴承故障诊断方法
CN113887342A (zh) 基于多源信号和深度学习的设备故障诊断方法
CN115165366A (zh) 一种旋转机械变工况故障诊断方法及系统
CN115859077A (zh) 一种变工况下多特征融合的电机小样本故障诊断方法
US20230350402A1 (en) Multi-task learning based rul predication method under sensor fault condition
CN112163474A (zh) 一种基于模型融合的齿轮箱智能诊断方法
CN114764538B (zh) 一种设备声音信号模式识别方法
CN115452376A (zh) 基于改进轻量级深度卷积神经网络的轴承故障诊断方法
Shuai Research on Fault Diagnosis Technology of Industrial Robot Operation Based on Deep Belief Network
Wang et al. Intelligent Diagnosis of Gearbox Based on Spatial Attention Convolutional Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant