CN114491828A - 一种基于多门控混合专家多任务学习的复合故障诊断方法 - Google Patents

一种基于多门控混合专家多任务学习的复合故障诊断方法 Download PDF

Info

Publication number
CN114491828A
CN114491828A CN202111503426.5A CN202111503426A CN114491828A CN 114491828 A CN114491828 A CN 114491828A CN 202111503426 A CN202111503426 A CN 202111503426A CN 114491828 A CN114491828 A CN 114491828A
Authority
CN
China
Prior art keywords
fault diagnosis
data
unit
fault
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111503426.5A
Other languages
English (en)
Inventor
陈彦萍
夏虹
任乐乐
张恒山
王忠民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Posts and Telecommunications
Original Assignee
Xian University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Posts and Telecommunications filed Critical Xian University of Posts and Telecommunications
Priority to CN202111503426.5A priority Critical patent/CN114491828A/zh
Publication of CN114491828A publication Critical patent/CN114491828A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明涉及一种基于多门控混合专家多任务学习的复合故障诊断方法,包括:获取待测数据;对待测数据进行预处理,得到待测数据对应的频域数据;将频域数据输入至预先训练完成的故障诊断模型,得到待测数据对应的故障诊断结果;其中,故障诊断模型是基于训练样本集训练获得的,故障诊断模型包括:多任务学习模块,用于对频域数据进行特征提取,得到若干共享特征,并对共享特征进行加权求和,得到不同任务对应的输出结果;故障诊断模块,用于对输出结果进行特征提取和故障分类,得到故障诊断结果。本发明的方法可以在多种工况下,对变速箱内轴承和齿轮不同故障进行准确诊断。

Description

一种基于多门控混合专家多任务学习的复合故障诊断方法
技术领域
本发明属于故障诊断领域,具体涉及一种基于多门控混合专家多任务学习的复合故障诊断方法。
背景技术
现代工业系统正呈现出大规模、复杂化的发展趋势。变速箱作为工业系统和轨道交通系统中重要的动力传动部件,长期处于高速、大负荷、高温的恶劣工作环境中。其零部件容易损坏,导致整个机械系统失。因此,有必要研究有效的故障诊断方法,以确保安全生产,预防和避免重大事故的发生。
在实际工业过程中,机械设备多为复杂系统,故障往往不是单独出现的,一些故障会诱发其他故障,导致复合故障。复合故障诊断的常用方法有经验模式分解(EMD)、支持向量机(SVM)和神经网络。
经验模态分解适用于故障诊断中处理随负载变化的非线性振动信号。该算法的缺点是模式混叠容易频繁发生,影响诊断精度。此外,在提取出振动信号的主要故障特征后,需要使用智能模式分类方法自动完成故障诊断。
支持向量机学习是已成功地应用于故障诊断领域,但是,支持向量机学习在处理大规模数据时非常耗时。虽然一些优化算法减少了计算时间,但也降低了分类性能。
基于神经网络的故障诊断方法不同于传统的信号处理方法,它根据故障信号的特点,经过一系列预处理,将振动信号数据输入神经网络进行训练,完成故障诊断。然而,由于复合故障诊断的目标是两个或两个以上,仅依靠单个神经网络是不可能实现复合故障诊断的。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于多门控混合专家多任务学习的复合故障诊断方法。本发明要解决的技术问题通过以下技术方案实现:
本发明提供了一种基于多门控混合专家多任务学习的复合故障诊断方法,包括:
获取待测数据;
对所述待测数据进行预处理,得到所述待测数据对应的频域数据;
将所述频域数据输入至预先训练完成的故障诊断模型,得到所述待测数据对应的故障诊断结果;
其中,所述故障诊断模型是基于训练样本集训练获得的,所述故障诊断模型包括:
多任务学习模块,用于对所述频域数据进行特征提取,得到若干共享特征,并对所述共享特征进行加权求和,得到不同任务对应的输出结果;
故障诊断模块,用于对所述输出结果进行特征提取和故障分类,得到故障诊断结果。
在本发明的一个实施例中,所述待测数据为变速箱的振动信号。
在本发明的一个实施例中,所述故障诊断结果包括齿轮故障诊断结果和轴承故障诊断结果,其中,
所述齿轮故障诊断结果的种类包括正常、断齿、裂纹、偏心、缺齿和过渡磨损;
所述轴承故障诊断结果的种类包括正常、滚动体故障、内圈故障、外圈故障和复合故障。
在本发明的一个实施例中,所述多任务学习模块为ML-MMoE网络,包括数据输入单元、专家单元、第一门控单元、第二门控单元、第一任务单元和第二任务单元,其中,
所述数据输入单元,用于接收所述频域数据,并将其传输至所述专家单元、所述第一门控单元和所述第二门控单元;
所述专家单元,用于对所述频域数据进行特征提取,得到若干共享特征;
所述第一门控单元,用于根据学习得到的第一权重值,对所述共享特征进行加权求和得到第一融合数据,并将其传输至所述第一任务单元;
所述第二门控单元,用于根据学习得到的第二权重值,对所述共享特征进行加权求和得到第二融合数据,并将其传输至所述第二任务单元;
所述第一任务单元和所述第二任务单元,分别将所述第一融合数据和所述第二融合数据传输至所述故障诊断模块。
在本发明的一个实施例中,所述故障诊断模块包括齿轮故障诊断单元和轴承故障诊断单元,其中,
所述齿轮故障诊断单元,用于对所述第一融合数据进行特征提取和故障分类,得到齿轮故障诊断结果;
所述轴承故障诊断单元,用于对所述第二融合数据进行特征提取和故障分类,得到轴承故障诊断结果。
在本发明的一个实施例中,所述齿轮故障诊断单元和所述轴承故障诊断单元均包括依次连接的卷积网络和分类网络,其中,
所述卷积网络为一维卷积神经网络,包括级联的第一卷积层、第一最大池化层、第二卷积层和第二最大池化层;
所述分类网络包括依次连接的全连接层和softmax层。
在本发明的一个实施例中,所述故障诊断模型训练时采用联合训练的方法,训练的损失函数为每个任务的损失函数相加求平均。
在本发明的一个实施例中,所述训练样本集包括若干具有轴承和齿轮故障分类标签的变速箱振动信号。
与现有技术相比,本发明的有益效果在于:
本发明的基于多门控混合专家多任务学习的复合故障诊断方法,提出了一种基于ML MMoE的复合故障检测方法,该方法利用多任务学习将变速箱中的轴承和齿轮故障诊断作为两个任务,并利用多门控网络对这两个任务之间的关系进行建模建立故障诊断模型,利用该故障诊断模型从待测数据中自适应的提取不同目标的特征,然后进行故障分类,可以在多种工况下对变速箱内轴承和齿轮不同故障进行准确诊断。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1是本发明实施例提供的一种基于多门控混合专家多任务学习的复合故障诊断方法的流程图;
图2是本发明实施例提供的一种故障诊断模型的结构框图;
图3是本发明实施例提供的一种基于多门控混合专家多任务学习的复合故障诊断框架;
图4是本发明实施例提供的一种多任务学习模块的结构示意图;
图5是本发明实施例提供的一种故障诊断单元的结构示意图;
图6是本发明实施例提供的一种模拟实验结果图。
具体实施方式
为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及具体实施方式,对依据本发明提出的一种基于多门控混合专家多任务学习的复合故障诊断方法进行详细说明。
有关本发明的前述及其他技术内容、特点及功效,在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解,然而所附附图仅是提供参考与说明之用,并非用来对本发明的技术方案加以限制。
实施例一
本实施例提供了一种基于多门控混合专家多任务学习的复合故障诊断方法,请参见图1,图1是本发明实施例提供的一种基于多门控混合专家多任务学习的复合故障诊断方法的流程图,如图所示,该方法包括以下步骤:
S10:获取待测数据;
在本实施例中,待测数据为变速箱的振动信号,该振动信号通过安装在变速箱内的传感器获得。
S20:对待测数据进行预处理,得到待测数据对应的频域数据;
变速箱的振动信号为时域信号,与原始时域信号数据相比,频域数据具有很强的规律性,包含了更多关于原始信号的有用信息,有助于对振动信号进行定量分析,因此,在本实施例中对待测数据进行预处理,得到待测数据对应的频域数据。
S30:将频域数据输入至预先训练完成的故障诊断模型,得到待测数据对应的故障诊断结果。
其中,故障诊断模型是基于训练样本集训练获得的,训练样本集包括若干具有轴承和齿轮故障分类标签的变速箱振动信号。
请参见图2,图2是本发明实施例提供的一种故障诊断模型的结构框图,如图所示,故障诊断模型包括多任务学习模块和故障诊断模块。
其中,多任务学习模块用于对频域数据进行特征提取,得到若干共享特征,并对共享特征进行加权求和,得到不同任务对应的输出结果。
具体地,在本实施例中多任务学习模块为ML-MMoE(multi task learning Multi-gate Mixture-of-Experts)网络。在多任务学习中,共享底层是最多的常用的参数共享方法,其共享层的参数在所有任务中共享,当任务相关性较低时,该方法训练效果较差。由于变速箱通常在恶劣环境下高速连续运行,工况的变化对信号的影响很大,导致轴承故障与齿轮故障的相关性变化。因此,在本实施例中,多任务学习模块使用ML-MMoE网络实现共享层,它的共享层也是基于共享底层的多任务结构。
请结合参见图4,图4是本发明实施例提供的一种多任务学习模块的结构示意图,如图所示,本实施例的多任务学习模块包括数据输入单元、专家单元、第一门控单元、第二门控单元、第一任务单元和第二任务单元。
具体地,数据输入单元用于接收频域数据,并将其传输至专家单元、第一门控单元和第二门控单元;
具体地,专家单元用于对频域数据进行特征提取,得到若干共享特征。在本实施例中,共享特征为一些初步提取的浅层特征,例如重心频率、均方频率、均方根频率、频率方差、频率标准差等。
在本实施例中,专家单元为一组专家网络,将其作为共享模块,每个专家网络(expert0-2)可以理解为一个隐层神经网络。
具体地,第一门控单元用于根据学习得到的第一权重值,对共享特征进行加权求和得到第一融合数据,并将其传输至第一任务单元;第二门控单元用于根据学习得到的第二权重值,对共享特征进行加权求和得到第二融合数据,并将其传输至第二任务单元。
在本实施例中,为每个任务引入一个门控单元,门控单元将具有不同权重的专家组合在一起,以便不同的任务可以不同地使用专家,而不是让所有任务共享一个底层网络。门控单元(Gate A和Gate B)可以理解为一个隐藏层,其用于决定每个任务对应的加权的权重值。
需要说明的是,门控单元产生的权重值是利用softmax函数对输入的特征生产类似于一个概率的权值,也是在模型训练过程中,训练学习得到的。
具体地,第一任务单元和第二任务单元,分别将第一融合数据和第二融合数据传输至故障诊断模块。
在本实施例中,第一融合数据和第二融合数据被传递到相应的任务单元的塔网络中,针对不同任务的门控单元就可以学习不同的专家集混合模式来获得任务关系。任务单元(Tower A和Tower B)也可以理解为一个隐层神经网络。
进一步地,故障诊断模块用于对输出结果进行特征提取和故障分类,得到故障诊断结果。
在本实施例中,故障诊断结果包括齿轮故障诊断结果和轴承故障诊断结果,其中,齿轮故障诊断结果的种类包括正常、断齿、裂纹、偏心、缺齿和过渡磨损。轴承故障诊断结果的种类包括正常、滚动体故障、内圈故障、外圈故障和复合故障。
具体地,故障诊断模块包括齿轮故障诊断单元和轴承故障诊断单元,其中,齿轮故障诊断单元用于对第一融合数据进行特征提取和故障分类,得到齿轮故障诊断结果;轴承故障诊断单元用于对第二融合数据进行特征提取和故障分类,得到轴承故障诊断结果。
在本实施例中,齿轮故障诊断单元和轴承故障诊断单元均包括依次连接的卷积网络和分类网络。请结合参见图5,图5是本发明实施例提供的一种故障诊断单元的结构示意图,其中,卷积网络为一维卷积神经网络,包括级联的第一卷积层、第一最大池化层、第二卷积层和第二最大池化层;分类网络包括依次连接的全连接层和softmax层。
由于,从传感器采集的变速箱的振动信号是一维数据,因此在特征提取阶段,采用一维卷积神经网络(1D-CNN)来提取振动信号特征。1D-CNN是一种特殊的卷积神经网络,适用于一维数据的特征提取,它的卷积核可以在输入的所有位置提取特征。在分类阶段使用softmax对全连接层扩展的特征进行分类。
具体地,卷积层首先将序列数据与一维卷积核进行卷积,然后由激活单元生成输出特征。每个卷积层使用相同的内核来提取输入的不同特征,以实现权重共享。
池化层主要进行特征采样,主要通过采样来减小特征的空间大小。在本实施例中采用最大池化方式,它是以一定的步长在得到的具有一定宽度窗口的特征图上滑动,得到窗口中特征值的最大值。最大池化方法可以减少参数个数,提高模型的鲁棒性。
在经过一系列的卷积和采样操作后,会连接一个或多个全连接层,整合通过卷积层和采样层提取的局部信息。然后,将这些局部信息输入到softmax层中进行故障分类,Softmax层本质上是逻辑回归二分类器的进化。
需要说明的是,由于卷积网络中线性计算较多,为了弥补线性模型表达能力的不足,通常引入激活函数进行非线性运算,从而增强整个网络的非线性表达能力,提高网络在非线性场景中的分类能力。常用的激活函数有Relu函数和Sigmoid函数,在本实施例中,使用的激活函数是Relu函数,可以避免神经网络梯度消失的问题,收敛速度快。
进一步地,为了方案更为清楚,下面对故障诊断模型的训练过程进行示例性的说明,请结合参见图3,图3是本发明实施例提供的一种基于多门控混合专家多任务学习的复合故障诊断框架。具体地,训练样本集包括若干具有轴承和齿轮故障分类标签的变速箱振动信号,首先,对每个样本
Figure BDA0003402532280000091
Figure BDA0003402532280000092
进行FFT处理并标记,以获得其对应的频域样本
Figure BDA0003402532280000093
Figure BDA0003402532280000094
其中,i表示第i个样本,n表示每个样本的维度,li表示与样本对应的标签。分批次将训练样本输入到多任务学习模块中,预测输出两个不同任务的结果,该结果输入至对应的故障诊断单元,通过反向传播算法对每个卷积层的参数进行优化。
在本实施例中,两个任务为变速箱内的齿轮故障及轴承故障,输入的训练样本都是具有两个标签的数据。为了提升故障诊断的效果,采用联合训练方式对模型进行训练,训练的损失函数为每个任务的损失函数相加求平均,然后使用优化器进行参数优化。联合训练既保证了不同任务之间的独立性,又提高了齿轮故障及轴承故障的诊断效果。
本实施例的基于多门控混合专家多任务学习的复合故障诊断方法,提出了一种基于ML MMoE的复合故障检测方法,该方法利用多任务学习将变速箱中的轴承和齿轮故障诊断作为两个任务,并利用多门控网络对这两个任务之间的关系进行建模建立故障诊断模型,利用该故障诊断模型从待测数据中自适应的提取不同目标的特征,然后进行故障分类,可以在多种工况下对变速箱内轴承和齿轮不同故障进行准确诊断。
实施例二
本实施例通过仿真实验对实施例一的基于多门控混合专家多任务学习的复合故障诊断方法的效果进行说明。
故障诊断模型训练需要大量的数据,模型训练的效果受训练数据的影响。在本实施例中,利用东南大学的变速箱数据集进行仿真实验,该数据集采用了动力传动故障诊断试验台,该实验台可模拟直齿和斜齿的齿面磨损、轮齿裂纹、齿面点蚀和缺齿等故障,也可模拟滚动轴承内圈、外圈、滚动体故障及其耦合故障,能够同时引入多个故障,研究其相互间的耦合效应。通过更换变速箱内的故障齿轮和故障轴承,模拟变速箱可能会发生的多故障情况。为了增加样本的多样性,在本实施例中,设置了20r/s、30r/s两种转速以及四种负载种类,具体负载种类如表1所示。
表1负载种类
负载 电流/a 电压/v
1 0 0
2 0.27 3
3 0.55 6
4 083 9
为了充分说明本实施例故障诊断模型的故障识别能力,在实验前先将原始振动信号文件切分为1000个[1,2048]时域信号,使用快速傅里叶变换求解其对应的频域信号,得到的1000个信号长度为1024的频域信号,将该频域信号作为训练故障诊断模型的输入。同时按照以下划分方式,将该频域信号划分为不同的训练集和测试集,得到如表2所示的实验数据划分结果,具体划分方式如下,
1.按百分比切分:随机选取每个信号文件的75%作为训练集,剩余25%作为测试集。
2.按照转速切分:选取1种转速下的所有信号作为测试集,另外一种转速下的信号作为训练集。
3.按照负载切分:选取1种负载下的所有信号作为测试机,余下3种负载下的信号作为训练集。
表2实验数据划分结果
Figure BDA0003402532280000111
在本实施例中,采用One-Hot编码方式,对数据标签进行编码,具体编码如表3所示。在训练、测试及实际诊断时,表3中轴承和齿轮故障分别对应轴承和齿轮两个任务的Softmax层输出,该层输出一个长度为5和6的概率向量,将概率向量的最大值位置标记为1,其余位置标记为0,则可得到故障诊断模型预测出的两个One-Hot编码,根据预测编码得到诊断结果并统计准确率。
表3.故障编码
轴承故障 编码 齿轮故障 编码
正常 10000 正常 100000
滚动体故障 01000 断齿 010000
内圈故障 00100 裂纹 001000
外圈故障 00010 偏心 000100
复合故障 00001 缺齿 000010
过度磨损 000001
使用表2中划分好的7组数据分别对故障诊断模型进行训练和测试,并统计实验中故障诊断模型的准确率变化,实验结果参见表4,表4列出了各个实验取得的联合准确率,即任务一诊断(齿轮故障诊断)正确且任务二诊断(轴承故障诊断)正确,以及对应的单任务准确率。
表4多任务实验结果
Figure BDA0003402532280000121
从表4实验结果可以看出,当按照百分比进行切分时候,模型的联合训练准确率最高可达95.8%,且轴承和齿轮识别任务的单独准确率达97.8%和98.3%。训练集准确率上升曲线如图6所示,随着不停的迭代训练,准确率平稳上升,训练loss逐渐下降。使用其中一种转速的数据训练网络,另外一种转速进行测试时,联合准确率也能达到较高准确率。而使用缺失某种负载的数据进行网络训练,且使用该缺失数据进行网络测试时,单一任务准确率能够达到95±2%,且联合训练的准确率能够达到94±2%。
本实施例通过采用不同的方式对采集到的数据集进行划分,来模拟实际应用中可能遇到的缺失某种工况或负载数据的情况,从而验证故障诊断模型的性能,实验结果表明,本实施例的基于多门控混合专家多任务学习的复合故障诊断方法,可以实现在多种工况下对变速箱内轴承和齿轮不同故障的准确诊断。
基于同一发明构思,本发明实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器用于存放计算机程序;处理器用于执行存储器上所存放的程序时,实现上述任一种基于多门控混合专家多任务学习的复合故障诊断方法所述的方法步骤,或者,实现上述任一种故障诊断模型所实现的功能。
本发明实施例还提供了一种计算机可读存储介质,在该计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时,实现上述任一种基于多门控混合专家多任务学习的复合故障诊断方法所述的方法步骤,或者,实现上述任一种故障诊断模型所实现的功能。
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (8)

1.一种基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,包括:
获取待测数据;
对所述待测数据进行预处理,得到所述待测数据对应的频域数据;
将所述频域数据输入至预先训练完成的故障诊断模型,得到所述待测数据对应的故障诊断结果;
其中,所述故障诊断模型是基于训练样本集训练获得的,所述故障诊断模型包括:
多任务学习模块,用于对所述频域数据进行特征提取,得到若干共享特征,并对所述共享特征进行加权求和,得到不同任务对应的输出结果;
故障诊断模块,用于对所述输出结果进行特征提取和故障分类,得到故障诊断结果。
2.根据权利要求1所述的基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,所述待测数据为变速箱的振动信号。
3.根据权利要求1所述的基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,所述故障诊断结果包括齿轮故障诊断结果和轴承故障诊断结果,其中,
所述齿轮故障诊断结果的种类包括正常、断齿、裂纹、偏心、缺齿和过渡磨损;
所述轴承故障诊断结果的种类包括正常、滚动体故障、内圈故障、外圈故障和复合故障。
4.根据权利要求1所述的基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,所述多任务学习模块为ML-MMoE网络,包括数据输入单元、专家单元、第一门控单元、第二门控单元、第一任务单元和第二任务单元,其中,
所述数据输入单元,用于接收所述频域数据,并将其传输至所述专家单元、所述第一门控单元和所述第二门控单元;
所述专家单元,用于对所述频域数据进行特征提取,得到若干共享特征;
所述第一门控单元,用于根据学习得到的第一权重值,对所述共享特征进行加权求和得到第一融合数据,并将其传输至所述第一任务单元;
所述第二门控单元,用于根据学习得到的第二权重值,对所述共享特征进行加权求和得到第二融合数据,并将其传输至所述第二任务单元;
所述第一任务单元和所述第二任务单元,分别将所述第一融合数据和所述第二融合数据传输至所述故障诊断模块。
5.根据权利要求4所述的基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,所述故障诊断模块包括齿轮故障诊断单元和轴承故障诊断单元,其中,
所述齿轮故障诊断单元,用于对所述第一融合数据进行特征提取和故障分类,得到齿轮故障诊断结果;
所述轴承故障诊断单元,用于对所述第二融合数据进行特征提取和故障分类,得到轴承故障诊断结果。
6.根据权利要求5所述的基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,所述齿轮故障诊断单元和所述轴承故障诊断单元均包括依次连接的卷积网络和分类网络,其中,
所述卷积网络为一维卷积神经网络,包括级联的第一卷积层、第一最大池化层、第二卷积层和第二最大池化层;
所述分类网络包括依次连接的全连接层和softmax层。
7.根据权利要求1所述的基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,所述故障诊断模型训练时采用联合训练的方法,训练的损失函数为每个任务的损失函数相加求平均。
8.根据权利要求1所述的基于多门控混合专家多任务学习的复合故障诊断方法,其特征在于,所述训练样本集包括若干具有轴承和齿轮故障分类标签的变速箱振动信号。
CN202111503426.5A 2021-12-09 2021-12-09 一种基于多门控混合专家多任务学习的复合故障诊断方法 Pending CN114491828A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111503426.5A CN114491828A (zh) 2021-12-09 2021-12-09 一种基于多门控混合专家多任务学习的复合故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111503426.5A CN114491828A (zh) 2021-12-09 2021-12-09 一种基于多门控混合专家多任务学习的复合故障诊断方法

Publications (1)

Publication Number Publication Date
CN114491828A true CN114491828A (zh) 2022-05-13

Family

ID=81493026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111503426.5A Pending CN114491828A (zh) 2021-12-09 2021-12-09 一种基于多门控混合专家多任务学习的复合故障诊断方法

Country Status (1)

Country Link
CN (1) CN114491828A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115409217A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于多专家混合网络的多任务预测性维护方法
CN115762484A (zh) * 2023-01-09 2023-03-07 季华实验室 用于语音识别的多模态数据融合方法、装置、设备及介质
CN117390407A (zh) * 2023-12-13 2024-01-12 国网山东省电力公司济南供电公司 变电站设备的故障识别方法、系统、介质和设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115409217A (zh) * 2022-11-01 2022-11-29 之江实验室 一种基于多专家混合网络的多任务预测性维护方法
CN115409217B (zh) * 2022-11-01 2023-09-26 之江实验室 一种基于多专家混合网络的多任务预测性维护方法
CN115762484A (zh) * 2023-01-09 2023-03-07 季华实验室 用于语音识别的多模态数据融合方法、装置、设备及介质
CN117390407A (zh) * 2023-12-13 2024-01-12 国网山东省电力公司济南供电公司 变电站设备的故障识别方法、系统、介质和设备
CN117390407B (zh) * 2023-12-13 2024-04-05 国网山东省电力公司济南供电公司 变电站设备的故障识别方法、系统、介质和设备

Similar Documents

Publication Publication Date Title
Chen et al. Intelligent fault diagnosis for rotary machinery using transferable convolutional neural network
CN110361176B (zh) 一种基于多任务特征共享神经网络的智能故障诊断方法
CN109947086B (zh) 基于对抗学习的机械故障迁移诊断方法及系统
Zhao et al. Deep multi-scale convolutional transfer learning network: A novel method for intelligent fault diagnosis of rolling bearings under variable working conditions and domains
Zou et al. Bearing fault diagnosis method based on EEMD and LSTM
CN114491828A (zh) 一种基于多门控混合专家多任务学习的复合故障诊断方法
CN110657984B (zh) 一种基于强化胶囊网络的行星齿轮箱故障诊断方法
Wang et al. Intelligent fault diagnosis for planetary gearbox using transferable deep q network under variable conditions with small training data
Zhao et al. Multiscale graph-guided convolutional network with node attention for intelligent health state diagnosis of a 3-PRR planar parallel manipulator
CN113792758A (zh) 一种基于自监督学习和聚类的滚动轴承故障诊断方法
Zhang et al. A novel data-driven method based on sample reliability assessment and improved CNN for machinery fault diagnosis with non-ideal data
CN116793682A (zh) 基于iCORAL-MMD和对抗迁移学习的轴承故障诊断方法
CN114429152A (zh) 基于动态指数对抗性自适应的滚动轴承故障诊断方法
Wang et al. A fault diagnosis method using improved prototypical network and weighting similarity-Manhattan distance with insufficient noisy data
CN117009916A (zh) 基于多传感器信息融合与迁移学习的促动器故障诊断方法
Li et al. A 2-D long short-term memory fusion networks for bearing remaining useful life prediction
CN114048787B (zh) 一种基于Attention CNN模型的轴承故障实时智能诊断方法与系统
CN116956215A (zh) 一种传动系统故障诊断方法及系统
CN116842379A (zh) 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法
CN116227586A (zh) 基于深度残差收缩原型网络的元学习故障诊断方法及装置
CN114722520A (zh) 基于增强字典学习的行星轴承智能故障诊断方法
CN112763215B (zh) 一种基于模块化联邦深度学习的多工况在线故障诊断方法
Zheng et al. An unsupervised transfer learning method based on SOCNN and FBNN and its application on bearing fault diagnosis
CN117312948A (zh) 一种基于多传感器融合和eca-cnn的旋转机械故障诊断方法
CN116204781A (zh) 旋转机械故障迁移诊断方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination