CN114048568B - 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 - Google Patents

一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 Download PDF

Info

Publication number
CN114048568B
CN114048568B CN202111363881.XA CN202111363881A CN114048568B CN 114048568 B CN114048568 B CN 114048568B CN 202111363881 A CN202111363881 A CN 202111363881A CN 114048568 B CN114048568 B CN 114048568B
Authority
CN
China
Prior art keywords
domain
source
feature
data
target domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111363881.XA
Other languages
English (en)
Other versions
CN114048568A (zh
Inventor
覃振权
张璇
卢炳先
王雷
朱明�
孙伟峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202111363881.XA priority Critical patent/CN114048568B/zh
Publication of CN114048568A publication Critical patent/CN114048568A/zh
Application granted granted Critical
Publication of CN114048568B publication Critical patent/CN114048568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/10Noise analysis or noise optimisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Medical Informatics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Complex Calculations (AREA)

Abstract

一种基于多源迁移融合收缩框架的旋转机械故障诊断方法。对高噪声标注数据进行预处理;用源域带标签样本对模型进行预训练,通过深度残差收缩网络结构处理高噪声数据,提取出高维特征并训练好模型的分类模块;输入用于训练的目标域无标签样本,通过混合损失函数策略进行域对齐,得到对迁移后目标域数据特征的分类结果,再将所有域分类器的分类结果进行聚合决策,对未知状态新增类别标签,加权计算平均值得到最终分类结果;对目标域待测样本进行状态诊断。该模型能有效降低公共特征易受到与底层公共分布相关的噪声污染对诊断性能的影响,能将从多个源域获得的决策信息用于无标注的目标域数据实现高精度跨域故障诊断,并能够识别目标域中的未知状态。

Description

一种基于多源迁移融合收缩框架的旋转机械故障诊断方法
技术领域
本发明属于旋转机械智能故障诊断领域,特别涉及一种基于多源迁移融合收缩框架的旋转机械故障诊断方法。
背景技术
智能故障诊断领域中,从大型旋转机器收集的振动信号,往往会包含大量噪声,基于深度学习的方法在局部特征提取的时候容易受到噪声干扰无法监测到与故障相关的特征,从而降低诊断准确率。另一个关键问题是在实际应用中,训练和测试数据存在一定程度分布差异会降低分类模型的泛化性和准确率,考虑到故障样本数量不足且实际监测数据缺乏标签信息,近年来的广泛研究是引入深度迁移学习来解决标签缺失和样本不足问题,在不需要重新训练模型的基础上提高模型的泛化性。在滚动轴承实际工作中,常伴随着不同噪声干扰、不同工作负荷的情况,过强的噪声和有限的标签样本会使故障诊断及其困难,本发明主要针对这种复杂易变工作状况下旋转机械故障诊断问题,同时考虑到对不完备运行状态和处于工况变化的未知工况下的健康状态以及目标机器中的未知故障进行正确分类。
2019年,Liang Guo等人在论文《Deep Convolutional Transfer LearningNetwork:A New Method for Intelligent Fault Diagnosis of Machines WithUnlabeled Data》中提出一种使用深度卷积迁移网络对具有未标记数据的机器进行智能故障诊断的新方法,使用双模块结构分别进行状态识别和域适应。该方案使用一维深卷积网络来学习深层特征,通过最大化域识别误差和最小化概率分布距离来促进学习域不变特征。但是,该论文提出的方案假设源域和目标域的健康状态重叠,健康状态样本和故障样本数量均衡,在某些简单迁移场景下具有良好表现,但对于域差异较大的情况性能会明显下降,且难以处理旋转部件噪声差异大的问题,不适用于实际场景和复杂工况场景下的故障诊断。2021年,Na Lu和Tao Yin在论文《Transferable common feature space mining forfault diagnosis with imbalanced data》提出了一种使用公共特征和比较网络(CFCNet)的两阶段可迁移公共特征空间挖掘方法,在第一阶段,CFCNet训练弱监督域自适应卷积自动编码器来学习多域数据背后的共同特征。第二阶段,将经过训练的公共特征网络和唯一特征网络结合起来,构建双通道特征提取和比较架构,双阶段挖掘不同故障的可迁移共同特征和独特特征。但是,该方法采用小样本学习训练策略来训练CFCNet,可以平衡训练进度但并不一定完全适用于不平衡数据,不过对于数据样本及其有限的情况能显著提高诊断性能。此外,该方法对诊断过程中出现的未知状态缺少敏感性,容易导致边缘样本和未知状态错误分类。
综上所述,基于深度神经网络的单源迁移故障诊断技术主要有如下缺陷:(1)来自单个源机器的诊断知识不足以识别从所有健康状态中提取的目标机器样本,且模型对未知健康状态分类易出错。(2)公共特征表示容易受到与底层公共分布相关的噪声的污染,从而削弱诊断性能。不同旋转部件之间的噪声差异更大,这种情况在跨部件诊断任务中可能更为严重。(3)用于智能故障诊断的域适应方法大多考虑优化和使用更好的损失函数来减少域差异,但选取的损失函数往往不能适应会出现的所有迁移场景。针对这些缺陷,本发明提出一种多源迁移融合收缩框架来实现不同工况和不同部件之间的跨域故障诊断。
发明内容
本发明的目的是提出一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,以解决单源域诊断知识不足,跨域噪声差异问题和未知状态分类问题。
为实现上述目的,本发明提供了如下方案:
基于多源迁移融合收缩框架的旋转机械故障诊断方法,其特征在于,包括以下步骤:
(1)对多源数据分别进行预处理;
旋转机械故障数据是一维的振动信号,包括健康工况、内圈故障、外圈故障和滚珠故障四种健康状态,每个源域和目标域各划分200个样本,每种健康状态各50个,各域样本在健康状态之间是平衡的;其中所有带标签源域数据和20%无标签目标域数据用作训练集,其余80%无标签目标域数据用作测试集;
(2)将源域带标签样本输入到多源迁移融合收缩模型,训练特征提取模块对高噪声信号的提取能力,并训练模型的分类模块;
所述的多源迁移融合收缩模型包括四个组件:公共特征提取器,域特征提取器,域分类器和聚合决策组件,前两个是特征提取模块的主要构成组件,后两个是分类模块的关键组件;
公共特征提取器提取将所有域样本映射到公共特征空间并全局对齐,得到公共特征表示;
域特征提取器数量为源域数量,接收公共特征提取器提取的公共特征表示,并分别将每对源域和目标域数据映射到特定的域特征空间,得到域不变特征表示;
域分类器接收到对应源域的域不变特征表示,通过全连接层和激活函数得到样本特征的诊断输出,应用混合损失函数策略得到对应标签损失;
聚合决策组件将域分类器输出集成并计算加权平均值,得到最终分类结果;
具体如下:
(2.1)将带标签源域样本输入到多源迁移融合收缩模型,随机初始化各网络层权值,将对多源数据进行预处理后生成的批量数据输入到公共特征提取器开始训练;
(2.2)针对公共特征提取器接收到的批量数据,使用深度残差收缩网络结构提取输入样本的高层特征表示,提高多源迁移融合收缩模型的特征提取能力,并将每个域的样本输入到公共特征提取器的下一层和对应的域特征提取器中;
(2.3)域特征提取器对接收到的特征进一步提取,再输出到相对应的域分类器中,公共特征提取器通过自适应层将公共特征空间中各域特征分布对齐,得到所有域的公共特征表示;
(2.4)域分类器接收到域特征提取器输出的特征表示,使用交叉熵函数作为源域训练的损失函数,优化分类器卷积层权值,保证多源迁移融合收缩模型的分类性能,其计算如下:
式中,M是类别数量,是符号函数,如果样本i的真实类别等于c则取1,否则为0,是观测样本i属于类别c的预测概率;
(3)将用于训练的无标签目标域样本输入到多源迁移融合收缩模型,通过混合损失函数策略获取公共特征提取器提取的多源数据的公共特征表示,和域特征提取器提取的各个源域对应目标域的域不变特征表示,精调多源迁移融合收缩模型的特征提取模块和分类模块;
(3.1)无标签的目标域样本输入到公共特征提取器中,特征提取阶段和步骤(2.1)、(2.2)一致,区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中;
(3.2)域特征提取器中,添加自适应层对齐目标域数据和源域数据的特征分布,在对齐过程中,使用混合损失函数作为度量,计算出域对齐损失,挑选出未见故障的目标域样本放入未知健康状态中,在多个域分类器中得到不同分类器的预测值;
(3.3)在聚合决策组件中,对不同域分类器预测结果融合诊断,当每个域分类器都认为目标域样本为未知健康状态时,则目标域样本为未知健康状态,若至少一个域分类器认为目标域来自共享的健康状态,则对多个域分类器预测概率进行加权,较大相似性的源域和目标域提供高置信度,较小相似性的源域和目标域提供低置信度,计算加权平均值为最终预测结果;
(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。
进一步,步骤(2.2)具体为:
在公共特征提取器和各个域特征提取器中都分别设置一个残差块,在每层卷积层添加批归一化处理,协调内部协变偏移,使用ReLU非线性激活函数防止梯度消失,批归一化过程如下:
式中,μb和σb 2是当前批Nbatch个数据的均值和方差,是对每个数据的归一化,最后对归一化数据进行缩放和变换,xn和yn表示小批量中的n个样本的输入和输出特征,γ和β是两个用于缩放和移动分布的可训练参数,∈是一个接近0的常数;
将软阈值化作为非线性变化层分别插入公共特征提取器和与特征提取器来有效消除与噪声相关的特征,残差块自适应为每个振动信号确定一组阈值;
软阈值函数计算如下:
式中,x是输入特征,y是输出特征,δ是阈值,软阈值在ReLU激活函数中将接近0的特征设置为0;残差块中,使用全局平均池化层从输入特征中获得缩放参数,在全连接层末端应用sigmoid函数将缩放参数缩放到(0,1)之间,得到阈值的计算如下:
式中,yfc是残差块中全连接层的输出,是相应的缩放参数,avg(·)是平均值函数,xw,h,c是输入特征图,w,h,c是特征图的宽度、高度和通道索引,阈值是缩放参数和输入特征的平均值的乘积。
进一步,步骤(3.2)中的混合损失函数策略具体为:
最大均值差异MMD是衡量两个域数据之间分布差异的方法,具体操作为将源域和目标域数据映射到再生核希尔伯特空间,再计算两类数据均值的距离,计算如下:
式中,Xs表示源域样本空间,Xt表示目标域样本空间,xs∈Xs为源域样本,xt∈Xt为目标域样本,Ps和Pt分别表示源域和目标域的数据分布,Φ(·)表示再生核希尔伯特空间H中的一系列函数,和/>分别表示源域分布和目标域分布的数学期望;
使用多核最大均值差异MK-MMD作为必要的损失函数应用在域特征提取器的自适应层,用多个核加权构造最终的核,计算如下:
式中,Hk表示具有特有核k的再生核希尔伯特空间,βk表示不同核函数的权重;则该部分域适应损失函数计算如下:
式中,a为添加MK-MMD领域适配的网络层数;
考虑到目标域是无标签样本,引入coral损失作为额外损失函数帮助模型在无标签情况下更好地完成对目标域数据的训练分类,计算如下:
式中,Cs和Ct是源域数据和目标域数据的协方差矩阵,d表示输入特征维度;
则模型的总体损失函数可以表示如下:
L=Lclass+λLmk-mmd+ωLcoral
式中,λ和ω分别为对应损失函数的权值。
本发明的有益效果为:本发明提出了不同部件和不同工况之间高噪声信号的多源深度收缩迁移故障诊断方法,在所发明的多源迁移融合收缩模型中,利用公共特征提取器处理所有源域数据,使用收缩结构能够有效降低噪声影响,提取出更具有代表性的高维特征;然后将提取的特征分别输入域特征提取器进行特有于领域的特征提取,再对提取特征进行分类,实现对模型的预训练;在模型中输入目标域用于训练的无标签数据,同样进行特征提取,将提取出的目标域特征输入到所有域特征提取器和域分类器,通过混合损失函数策略进行域对齐,精细的损失函数策略能够有效提高迁移性能,得到对迁移后目标域数据特征的分类结果;之后将所有域分类器的分类结果进行聚合决策,加权计算平均值得到最终分类结果;最后将测试的目标域数据输入到训练好的模型,实现最终的高噪声无标签样本高精度故障诊断。
附图说明
图1是本发明提供的不同部件和不同工况之间高噪声信号的多源深度收缩迁移故障诊断方法实现流程图;
图2是本发明提供的多源迁移融合收缩模型结构图;
图3是本发明提供的多源迁移融合收缩模型预训练阶段示意图;
图4是本发明提供的多源迁移融合收缩模型迁移学习阶段示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,应用于源域标记样本少时,融合多源域高噪声数据信息对无标注的另一个目标域数据进行跨域高精度故障诊断。本发明的流程如图1所示,首先,对来自多个源域收集的高噪声标注数据分别进行预处理;其次,用带标签源域样本训练特征提取模块对高噪声信号的提取能力和模型的分类模块;然后,输入用于训练的无标签目标域样本精调模型的特征提取模块和分类模块,通过混合损失函数策略获取多源数据的公共特征表示和特定于域的特征表示;最后,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。
具体步骤如下:
(1)对多源数据分别进行预处理;
旋转机械故障数据是一维的振动信号,包括健康工况、内圈故障、外圈故障和滚珠故障四种健康状态,每个源域和目标域各划分200个样本,每种健康状态各50个,各域样本在健康状态之间是平衡的;其中所有带标签源域数据和20%无标签目标域数据用作训练集,其余80%无标签目标域数据用作测试集;
(2)将源域带标签样本输入到多源迁移融合收缩模型,训练特征提取模块对高噪声信号的提取能力,并训练模型的分类模块;
如图2所示,所述的多源迁移融合收缩模型包括四个组件:公共特征提取器,域特征提取器,域分类器和聚合决策组件,前两个是特征提取模块的主要构成组件,后两个是分类模块的关键组件;
公共特征提取器提取将所有域样本映射到公共特征空间并全局对齐,得到公共特征表示;
域特征提取器数量为源域数量,接收公共特征提取器提取的公共特征表示,并分别将每对源域和目标域数据映射到特定的域特征空间,得到域不变特征表示;
域分类器接收到对应源域的域不变特征表示,通过全连接层和激活函数得到样本特征的诊断输出,应用混合损失函数策略得到对应标签损失;
聚合决策组件将域分类器输出集成并计算加权平均值,得到最终分类结果;
训练过程如图3所示,具体如下:
(2.1)将带标签源域样本输入到多源迁移融合收缩模型,随机初始化各网络层权值,将对多源数据进行预处理后生成的批量数据输入到公共特征提取器开始训练;
(2.2)针对公共特征提取器接收到的批量数据,使用深度残差收缩网络结构提取输入样本的高层特征表示,提高多源迁移融合收缩模型的特征提取能力,并将每个域的样本输入到公共特征提取器的下一层和对应的域特征提取器中;
(2.3)域特征提取器对接收到的特征进一步提取,再输出到相对应的域分类器中,公共特征提取器通过自适应层将公共特征空间中各域特征分布对齐,得到所有域的公共特征表示;
(2.4)域分类器接收到域特征提取器输出的特征表示,使用交叉熵函数作为源域训练的损失函数,优化分类器卷积层权值,保证多源迁移融合收缩模型的分类性能,其计算如下:
式中,M是类别数量,是符号函数,如果样本i的真实类别等于c则取1,否则为0,是观测样本i属于类别c的预测概率;
(3)将用于训练的无标签目标域样本输入到多源迁移融合收缩模型,通过混合损失函数策略获取公共特征提取器提取的多源数据的公共特征表示,和域特征提取器提取的各个源域对应目标域的域不变特征表示,精调多源迁移融合收缩模型的特征提取模块和分类模块;
(3.1)无标签的目标域样本输入到公共特征提取器中,特征提取阶段和步骤(2.1)、(2.2)一致,区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中;
(3.2)域特征提取器中,添加自适应层对齐目标域数据和源域数据的特征分布,在对齐过程中,使用混合损失函数作为度量,计算出域对齐损失,挑选出未见故障的目标域样本放入未知健康状态中,在多个域分类器中得到不同分类器的预测值;
(3.3)在聚合决策组件中,对不同域分类器预测结果融合诊断,当每个域分类器都认为目标域样本为未知健康状态时,则目标域样本为未知健康状态,若至少一个域分类器认为目标域来自共享的健康状态,则对多个域分类器预测概率进行加权,较大相似性的源域和目标域提供高置信度,较小相似性的源域和目标域提供低置信度,计算加权平均值为最终预测结果;
(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断。
进一步,步骤(2.2)具体为:
在公共特征提取器和各个域特征提取器中都分别设置一个残差块,在每层卷积层添加批归一化处理,协调内部协变偏移,使用ReLU非线性激活函数防止梯度消失,批归一化过程如下:
式中,μb和σb 2是当前批Nbatch个数据的均值和方差,是对每个数据的归一化,最后对归一化数据进行缩放和变换,xn和yn表示小批量中的n个样本的输入和输出特征,γ和β是两个用于缩放和移动分布的可训练参数,∈是一个接近0的常数;
将软阈值化作为非线性变化层分别插入公共特征提取器和与特征提取器来有效消除与噪声相关的特征,残差块自适应为每个振动信号确定一组阈值;
软阈值函数计算如下:
式中,x是输入特征,y是输出特征,δ是阈值,软阈值在ReLU激活函数中将接近0的特征设置为0;残差块中,使用全局平均池化层从输入特征中获得缩放参数,在全连接层末端应用sigmoid函数将缩放参数缩放到(0,1)之间,得到阈值的计算如下:
式中,yfc是残差块中全连接层的输出,是相应的缩放参数,avg(·)是平均值函数,xw,h,c是输入特征图,w,h,c是特征图的宽度、高度和通道索引,阈值是缩放参数和输入特征的平均值的乘积。
进一步,如图4所示,步骤(3.2)中的混合损失函数策略具体为:
最大均值差异MMD是衡量两个域数据之间分布差异的方法,具体操作为将源域和目标域数据映射到再生核希尔伯特空间,再计算两类数据均值的距离,计算如下:
式中,Xs表示源域样本空间,Xt表示目标域样本空间,xs∈Xs为源域样本,xt∈Xt为目标域样本,Ps和Pt分别表示源域和目标域的数据分布,Φ(·)表示再生核希尔伯特空间H中的一系列函数,和/>分别表示源域分布和目标域分布的数学期望;
使用多核最大均值差异MK-MMD作为必要的损失函数应用在域特征提取器的自适应层,用多个核加权构造最终的核,计算如下:
式中,Hk表示具有特有核k的再生核希尔伯特空间,βk表示不同核函数的权重;则该部分域适应损失函数计算如下:
式中,a为添加MK-MMD领域适配的网络层数;
考虑到目标域是无标签样本,引入coral损失作为额外损失函数帮助模型在无标签情况下更好地完成对目标域数据的训练分类,计算如下:
式中,Cs和Ct是源域数据和目标域数据的协方差矩阵,d表示输入特征维度;
则模型的总体损失函数可以表示如下:
L=Lclass+λLmk-mmd+ωLcoral
式中,λ和ω分别为对应损失函数的权值。
综上所述:
本发明提出一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,通过深度残差收缩网络结构处理高噪声数据,并使用多源迁移框架将多源域数据诊断结果融合决策,使得该模型能够将从多个源域获得的决策信息用于无标注的目标域数据实现跨域故障诊断,并能够识别目标域中的未知状态。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (2)

1.一种基于多源迁移融合收缩框架的旋转机械故障诊断方法,其特征在于,包括以下步骤:
(1)对多源数据分别进行预处理;
旋转机械故障数据是一维的振动信号,包括健康工况、内圈故障、外圈故障和滚珠故障四种健康状态,每个源域和目标域各划分200个样本,每种健康状态各50个,各域样本在健康状态之间是平衡的;其中所有带标签源域数据和20%无标签目标域数据用作训练集,其余80%无标签目标域数据用作测试集;
(2)将带标签源域样本输入到多源迁移融合收缩模型,训练特征提取模块对高噪声信号的提取能力,并训练多源迁移融合收缩模型的分类模块;
所述的多源迁移融合收缩模型包括四个组件:公共特征提取器、域特征提取器、域分类器和聚合决策组件;公共特征提取器和域特征提取器是特征提取模块的主要构成组件,域分类器和聚合决策组件是分类模块的关键组件;
公共特征提取器将所有域样本映射到公共特征空间并全局对齐,得到公共特征表示;
域特征提取器数量为源域数量,接受公共特征提取器提取的公共特征表示,并分别将每对源域和目标域数据映射到特定的域特征空间,得到域不变特征表示;
域分类器接收到对应源域的域不变特征表示,通过全连接层和激活函数得到样本特征的诊断输出,应用混合损失函数策略得到对应标签损失;
聚合决策组件将域分类器输出集成并计算加权平均值,得到最终分类结果;
具体如下:
(2.1)将带标签源域样本输入到多源迁移融合收缩模型,随机初始化各网络层权值,将对多源数据进行预处理后生成的批量数据输入到公共特征提取器开始训练;
(2.2)针对公共特征提取器接收到的批量数据,使用深度残差收缩网络结构提取输入样本的高层特征表示,提高多源迁移融合收缩模型的特征提取能力,并将每个域的样本分别输入到公共特征提取器的下一层和对应的域特征提取器中;
(2.3)域特征提取器对接收到的特征进一步提取,再输出到相对应的域分类器中,公共特征提取器通过自适应层将公共特征空间中各域特征分布对齐,得到所有域的公共特征表示;
(2.4)域分类器接收到域特征提取器输出的特征表示,使用交叉熵函数作为源域训练的损失函数,优化分类器卷积层权值,保证多源迁移融合收缩模型的分类性能,其计算如下:
式中,M是类别数量,是符号函数,如果样本i的真实类别等于c则取1,否则为0,/>是观测样本i属于类别c的预测概率;
(3)将用于训练的无标签目标域样本输入到多源迁移融合收缩模型,通过混合损失函数策略获取公共特征提取器提取的多源数据的公共特征表示,和域特征提取器提取的各个源域对应目标域的域不变特征表示,精调多源迁移融合收缩模型的特征提取模块和分类模块;
(3.1)无标签目标域样本输入到公共特征提取器中,特征提取阶段和步骤(2.1)、(2.2)一致,区别是在(2.2)中将公共特征提取器提取的公共特征表示和目标域数据特征输入到所有域特征提取器中;
(3.2)域特征提取器中,添加自适应层对齐目标域数据和源域数据的特征分布,在对齐过程中,使用混合损失函数作为度量,计算出域对齐损失,挑选出未见故障的目标域样本放入未知健康状态中,在多个域分类器中得到不同分类器的预测值;
(3.3)在聚合决策组件中,对不同域分类器预测结果融合诊断,若每个域分类器都认为目标域样本为未知健康状态时,则目标域样本为未知健康状态;若至少一个域分类器认为目标域来自共享的健康状态,则对多个域分类器预测概率进行加权,较大相似性的源域和目标域提供高置信度,较小相似性的源域和目标域提供低置信度,计算加权平均值为最终预测结果;
(4)将无标签目标域待测样本输入到训练好的多源迁移融合收缩模型,对目标域待测样本进行状态诊断,实现不同工况和不同部件之间的高噪声信号跨域高精度故障诊断;
步骤(3.2)中的混合损失函数策略具体为:
最大均值差异MMD是衡量两个域数据之间分布差异的方法,具体操作为将源域和目标域数据映射到再生核希尔伯特空间RKHS,再计算两类数据均值的距离,计算如下:
式中,Xs表示源域样本空间,Xt表示目标域样本空间,xs∈Xs为源域样本,xt∈Xt为目标域样本,Ps和Pt分别表示源域和目标域的数据分布,φ(·)表示再生核希尔伯特空间H中的一系列函数,和/>分别表示源域分布和目标域分布的数学期望;
使用多核最大均值差异MK-MMD作为必要的损失函数应用在域特征提取器的自适应层,用多个核加权构造最终的核,计算如下:
式中,Hk表示具有特有核k的再生核希尔伯特空间,βk表示不同核函数的权重;则该部分域适应损失函数计算如下:
式中,a为添加MK-MMD领域适配的网络层数;
考虑到目标域时无标签样本,引入coral损失作为额外损失函数帮助模型在无标签情况下完成对目标域数据的训练分类,计算如下:
式中,Cs和Ct是源域数据和目标域数据的协方差矩阵,d表示输入特征维度;
则模型的总体损失函数表示如下:
L=Lclass+λLmk-mmd+ωLcoral
式中,λ和ω分别为对应损失函数的权值。
2.根据权利要求1所述的基于多源迁移融合收缩框架的旋转机械故障诊断方法,其特征在于,步骤(2.2)具体为:
在公共特征提取器和各个域特征提取器中都分别设置一个残差块,在每层卷积层添加批归一化处理,协调内部协变偏移,使用ReLU非线性激活函数防止梯度消失,批归一化过程如下:
式中,μb和σb 2是当前批Nbatch个数据的均值和方差,是对每个数据的归一化,最后对归一化数据进行缩放和变换,xn和yn表示小批量中的n个样本的输入和输出特征,γ和β是两个用于缩放和移动分布的可训练参数,∈是一个接近0的常数;
将软阈值化作为非线性变化层分别插入公共特征提取器和域特征提取器来有效消除与噪声相关的特征,残差块自适应为每个振动信号确定一组阈值;
软阈值函数计算如下:
式中,x是输入特征,y是输出特征,δ是阈值,软阈值在ReLU激活函数中将接近0的特征设置为0;残差块中,使用全局平均池化层从输入特征中获得缩放参数,在全连接层末端应用sigmoid函数将缩放参数缩放到(0,1)之间,得到阈值的计算如下:
式中,yfc是残差块中全连接层的输出,是相应的缩放参数,avg(·)是平均值函数,xw,h,c是输入特征图,w,h,c是特征图的宽度、高度和通道索引,阈值是缩放参数和输入特征的平均值的乘积。
CN202111363881.XA 2021-11-17 2021-11-17 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法 Active CN114048568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111363881.XA CN114048568B (zh) 2021-11-17 2021-11-17 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111363881.XA CN114048568B (zh) 2021-11-17 2021-11-17 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法

Publications (2)

Publication Number Publication Date
CN114048568A CN114048568A (zh) 2022-02-15
CN114048568B true CN114048568B (zh) 2024-04-09

Family

ID=80209960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111363881.XA Active CN114048568B (zh) 2021-11-17 2021-11-17 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法

Country Status (1)

Country Link
CN (1) CN114048568B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115146675B (zh) * 2022-06-28 2023-09-26 江苏大学 一种深度多特征动态对抗的变工况下旋转机械迁移诊断方法
CN115329853B (zh) * 2022-08-04 2023-04-21 西南交通大学 一种基于多源域迁移的装备参数预测与知识转移方法
CN115482927B (zh) * 2022-09-21 2023-05-23 浙江大学 一种基于小样本的儿童肺炎诊断系统
CN115795313A (zh) * 2023-01-16 2023-03-14 中国科学院合肥物质科学研究院 核主泵故障诊断模型的训练方法、故障诊断方法和系统
CN116383739B (zh) * 2023-03-30 2024-01-30 东北林业大学 基于域自适应的多模态数据融合的智能故障诊断方法
CN116992954A (zh) * 2023-09-26 2023-11-03 南京航空航天大学 一种基于umap数据降维的相似度度量迁移学习方法
CN117349749B (zh) * 2023-10-09 2024-03-15 石家庄铁道大学 基于混合卷积的多源域轴承故障诊断方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166787A (zh) * 2014-07-17 2014-11-26 南京航空航天大学 一种基于多阶段信息融合的航空发动机剩余寿命预测方法
CN105971901A (zh) * 2016-05-03 2016-09-28 北京航空航天大学 一种基于完备总体经验模态分解与随机森林的离心泵故障诊断方法
CN110186680A (zh) * 2019-05-30 2019-08-30 盐城工学院 一种对抗判别域适应一维卷积神经网络智能故障诊断方法
CN111310786A (zh) * 2020-01-15 2020-06-19 青岛海信网络科技股份有限公司 基于随机森林分类器的交通检测器异常诊断方法及装置
CN111709448A (zh) * 2020-05-20 2020-09-25 西安交通大学 一种基于迁移关系网络的机械故障诊断方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902798A (zh) * 2018-05-31 2019-06-18 华为技术有限公司 深度神经网络的训练方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166787A (zh) * 2014-07-17 2014-11-26 南京航空航天大学 一种基于多阶段信息融合的航空发动机剩余寿命预测方法
CN105971901A (zh) * 2016-05-03 2016-09-28 北京航空航天大学 一种基于完备总体经验模态分解与随机森林的离心泵故障诊断方法
CN110186680A (zh) * 2019-05-30 2019-08-30 盐城工学院 一种对抗判别域适应一维卷积神经网络智能故障诊断方法
CN111310786A (zh) * 2020-01-15 2020-06-19 青岛海信网络科技股份有限公司 基于随机森林分类器的交通检测器异常诊断方法及装置
CN111709448A (zh) * 2020-05-20 2020-09-25 西安交通大学 一种基于迁移关系网络的机械故障诊断方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于ResNet和领域自适应的轴承故障诊断研究;杨冰如;李奇;陈良;沈长青;朱忠奎;测控技术;20210407;第40卷(第012期);全文 *
基于增强迁移卷积神经网络的机械智能故障诊断;陈祝云;钟琪;黄如意;廖奕校;李霁蒲;李巍华;机械工程学报;20210609(第021期);全文 *
流形模糊C均值方法及其在滚动轴承性能退化评估中的应用;王奉涛;陈旭涛;闫达文;李宏坤;王雷;朱泓;;机械工程学报;20151228(第15期);全文 *

Also Published As

Publication number Publication date
CN114048568A (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
CN114048568B (zh) 一种基于多源迁移融合收缩框架的旋转机械故障诊断方法
CN113792758B (zh) 一种基于自监督学习和聚类的滚动轴承故障诊断方法
CN112763214A (zh) 基于多标签零样本学习的滚动轴承故障诊断方法
CN112883994A (zh) 一种均衡分布适配的旋转机械变工况故障诊断方法
CN114358124B (zh) 基于深度对抗卷积神经网络的旋转机械新故障诊断方法
CN107220663B (zh) 一种基于语义场景分类的图像自动标注方法
CN114417913B (zh) 基于pc-tcn和迁移学习的轴承寿命预测方法
CN116894187A (zh) 一种基于深度迁移学习的齿轮箱故障诊断方法
CN114118138A (zh) 一种基于多标签领域自适应模型的轴承复合故障诊断方法
CN116051479A (zh) 融合跨域迁移和异常检测的纺织品缺陷识别方法
CN115358337A (zh) 一种小样本故障诊断方法、装置及存储介质
CN114564987A (zh) 一种基于图数据的旋转机械故障诊断方法及系统
CN111504680B (zh) 一种基于wsvm和dcae的涤纶长丝生产的故障诊断方法和系统
CN117516937A (zh) 基于多模态特征融合增强的滚动轴承未知故障检测方法
CN115791174B (zh) 一种滚动轴承异常诊断方法、系统、电子设备及存储介质
CN113158878B (zh) 一种基于子空间的异构迁移故障诊断方法、系统和模型
CN108898157B (zh) 基于卷积神经网络的数值型数据的雷达图表示的分类方法
CN116304941A (zh) 一种基于多模型组合的海洋数据质量控制方法及装置
CN116150635A (zh) 基于跨域关联性表示的滚动轴承未知故障检测方法
CN116089812A (zh) 基于半监督对抗域泛化智能模型的故障诊断方法
CN113310689B (zh) 基于域自适应图卷积网络的航发传动系统故障诊断方法
CN115165366A (zh) 一种旋转机械变工况故障诊断方法及系统
Duan Automatic identification of conodont species using fine-grained convolutional neural networks
Chakroun et al. Hierarchical convolutional neural networks for leaf disease detection
CN113505817A (zh) 不均衡数据下轴承故障诊断模型样本自适应加权训练方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant