CN112966345B - 基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法 - Google Patents

基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法 Download PDF

Info

Publication number
CN112966345B
CN112966345B CN202110234849.5A CN202110234849A CN112966345B CN 112966345 B CN112966345 B CN 112966345B CN 202110234849 A CN202110234849 A CN 202110234849A CN 112966345 B CN112966345 B CN 112966345B
Authority
CN
China
Prior art keywords
training
sample
features
threshold
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110234849.5A
Other languages
English (en)
Other versions
CN112966345A (zh
Inventor
王艺玮
周健
郑联语
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN202110234849.5A priority Critical patent/CN112966345B/zh
Publication of CN112966345A publication Critical patent/CN112966345A/zh
Application granted granted Critical
Publication of CN112966345B publication Critical patent/CN112966345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • G06F30/17Mechanical parametric or variational design
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/04Ageing analysis or optimisation against ageing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T90/00Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Geometry (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了一种基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,首先利用振动波动检测算法区分设备的健康和退化状态,再设置多个模块,利用阈值自学习模块剔除提取特征中的干扰,通过模块间的对抗训练提高特征域融合度的同时保证特征各状态的分离度,引入最大均值差异控制不同数据集合的分布误差,最后基于源域特征训练状态预测模块,实现旋转机械的迁移预测。以上特点使得本发明方法能有效解决旋转机械状态预测问题,并消除不同设备和不同工况差异的影响,提高状态预测稳定性。

Description

基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩 方法
技术领域
本发明属于旋转机械剩余寿命预测方法技术领域,具体涉及基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法。
背景技术
大型机器设备的安全稳定运行至关重要,无论是从设备增产的层面还是生产安全的层面。旋转机械组件作为大型设备的关键耗损部件,其状态直接影响着设备的运行。因此,旋转组件的状态预测对于防止部件性能恶化、意外宕机,保障运行安全,促进预测性维护决策的制定有重要意义。状态预测方法可分为三大类:基于统计模型的方法,基于物理模型的方法和数据驱动的方法,各有优缺点。数据驱动的方法也称为人工智能的方法,主要是通过人工智能来学习到状态监测数据与机器退化状态之间的直接关系,而不需要什么专业知识,这有利于工业应用。得益于智能制造的大力发展,采集的数据量显著增长、数据质量明显提高,计算硬件和算法也快速发展,深度学习方法的桎梏得以突破,开始广泛应用于寿命预测,表现令人满意。
建立全寿命数据和剩余使用寿命(RUL)之间的映射关系难度非常大,也不太符合实际情况。一般来讲,机器在运行初期通常是健康的,在这个时间段里设备的RUL认为是不变的,只有在某一时刻一个初始故障发生,机器才会开始退化。如何准确找到这个初始故障发生点(FOT),是提高预测方法准确性的关键。有的文献中以某些时域特征如峰度、均方根作为退化指标,设定阈值,超过阈值的时间即为FOT;也有以频域特征作为退化指标的,如Zhang等人提出了波形熵指数来识别退化信号的FOT;比较巧妙的,也有利用深度学习方法来确定FOT,Li利用生成对抗神经网络学习设备全寿命退化过程的特征,以判别器的输出作为衡量其稳定性的指标,当其开始波动时即认为初始故障出现。
实际上因为轴承退化过程历时较长,采集轴承全寿命数据的价格相对较高,所以公开全寿命数据集都是间隔采集数据,这样获取的全寿命数据都是有缺失的,不能覆盖数据分布的全部特征。此外,不同设备导致退化的初始故障通常是不同的,这就导致不同轴承设备的退化行为不同,体现在运行数据上就是数据之间存在分布差异。不同的工况则会加剧这种差异。在旋转机械RUL预测问题中,训练和测试数据来自不同的设备,包括在相同工况下以及不同工况间,这种分布差异使得很难将从训练数据中学习到的预测知识推广到测试数据中。针对分布差异问题,迁移学习技术是当下主流的解决方案。迁移学习在很多领域如文本分类、图像分类都已经有了大量的实践和成功应用,近年来也开始应用到了旋转机械预测领域。Mao等人提出基于迁移学习的预测方法,在离线阶段用自编码器提取深层特征,利用最小二乘支持向量机训练退化状态预测模型;在线阶段基于辅助轴承以此调整目标轴承的特征,修正预测模型。
发明内容
针对现有技术存在的不足,本发明的目的在于提供一种不同轴承设备之间的多阶段深度卷积迁移学习故障诊断方法,该方法解决了目标轴承标签样本数据难以获取,训练数据和测试数据特征分布相似性难以保证,而造成的不同设备之间迁移学习时,对待测样本故障诊断准确率较低的问题。
针对现有技术方法存在的不足,本发明的目的在于提供一种基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,该方法解决了准确划分设备健康和退化状态以及消除不同设备不同工况导致的数据分布差异实现高精度迁移预测的问题。
为实现上述目的,本发明一种基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,具体包括以下步骤:
S1、利用振动波动检测算法区分设备的健康和退化状态;
S2、设置软阈值剔除特征中的干扰成分;
S3、设置6个模块通过模块间的对抗训练提高特征域融合度的同时保证特征的状态分离度;
S4、引入最大均值差异通过迁移学习控制不同数据集合的分布误差;
S5、基于源域特征利用特定评价指标训练状态预测模块,实现旋转机械的迁移预测。
进一步,所述步骤S1中的振动波动检测算法用以安全可靠地从振动数据中确定初始故障出现的时间(FOT);
所述振动波动检测算法表示如下:
Figure BDA0002959558240000031
式中,Pp()表示振动信号的峰峰值,Std()表示峰峰值标准差;N表示样本量,也代表区间数(通过重复首区间值将区间数补至同样本量);μ为倍数,阈值为初始标准差的指定倍数;i即超过阈值的区间序数,即样本序数;I表示超过阈值的样本序数的集合,T()表示样本对应的时间。
进一步,所述步骤S1具体为:
S11、将全部原始信号划分为多个连续的样本,计算每个样本的振幅峰峰值;
S12、以固定样本数量划分区间,通过重复首区间值将区间数补至同样本量,计算每个区间内的峰峰值标准差;
S13、以首区间标准差为基准值,指定其倍数为阈值;
S14、确定正向超过该阈值即从小于阈值到大于等于阈值的区间,进一步确定对应的样本,并判断后续样本的峰峰值是否都大于该样本峰峰值,若是,则该样本对应时间点为FOT,若否,则继续逐满足条件的区间、样本判断;
S15、若只有一个样本满足条件,其对应时间点即为FOT;若有多个样本满足条件,则取最早时间点为FOT。
进一步,所述步骤S2中的软阈值为一种信号降噪方法,通过设定阈值τ将信号中在区间[-τ,τ]内的值置为0,让区间外的特征也朝着原点收缩τ个单位。
所述软阈值思想在深度学习中的应用,是通过创建阈值自学习模块TS来实现的,阈值τ由TS学习得到,进而对特征进行软阈值化。
进一步,所述步骤S2具体为:
S21、TS模块将从原始数据中提取出的二维特征平均池化,变为一个行向量,保存为阈值基;
S22、阈值基通过TS中全连接层和标准化层的计算得到阈值系数;
S23、将阈值系数转置为列向量,与阈值基相乘得到与原二维特征尺寸相同的阈值矩阵;
S24、二维特征与阈值矩阵作差,小于0的特征值置0,大于0的特征值保留。
进一步,所述步骤S3中的6个模块包括特征提取模块(FE)、阈值自学习模块(FE)、状态区分模块(SS)、域判别模块(DD)、MMD计算模块(MC)和状态预测模块(SP);
所述6个模块均由神经网络层搭建而成;
所述FE用于从原始振动信号中提取特征;
所述TS用于对提取特征进行软阈值化,剔除特征中的干扰成分;
所述SS用于区分特征的不同寿命状态;
所述DD用于判别特征所属的不同域;
所述MC用于计算不同域特征的分布差异;
所述SP用于预测特征对应的寿命状态。
进一步,所述步骤S3中的域融合度即不同数据集合的相似程度;
所述状态分离度即相同数据集合中对应旋转机械不同寿命状态的特征的差异程度。
进一步,所述步骤S3中的提高域融合度是通过FE和DD对抗训练来实现的;
所述对抗训练即通过不同且相对的损失来训练FE和DD,训练DD的目的是使得其能准确判别特征所属的不同域,训练FE的目的则是使得其能从原始信号中提取出迷惑DD的特征。
进一步,所述步骤S3中的提高状态分离度是通过FE和SS对抗训练来实现的;
所述对抗训练即通过不同且相对的损失来训练FE和SS,训练SS的目的是使得其认为不同特征对应的寿命状态都是相同的,训练FE的目的则是使得其能从原始信号中提取出被SS区分开的特征。
进一步,所述步骤S3具体为:
S31、利用域判别损失训练DD,让其能准确判断各域特征所属的不同域;
S32、利用相对的域判别损失训练FE,让其能从原始信号中提取出迷惑住DD的特征;
S33、FE和DD交替训练,直至达到平衡;
S34、利用状态区分损失训练SS,让其无法区分特征对应的不同状态;
S35、利用相对的状态区分损失训练FE,让其能从原始信号中提取出被SS准确区分开不同状态的特征;
S36、FE和SS交替训练,直至达到平衡。
所述步骤S31中的域判别损失表示如下:
Figure BDA0002959558240000051
式中,N为批量大小,K表示判别器输出的维度;
Figure BDA0002959558240000052
表示一个批次中第j个样本的第i维输出的标签,
Figure BDA0002959558240000053
表示判别器具体输出。
所述步骤S32中相对的域判别损失表示如下:
Figure BDA0002959558240000054
式中
Figure BDA0002959558240000055
表示输出标签,与
Figure BDA0002959558240000056
不同,其独热编码值代表所有样本均属于同一域。
所述步骤S34中的状态区分损失表示如下:
Figure BDA0002959558240000057
式中
Figure BDA0002959558240000058
表示SS对第i个样本的预测输出,si为第i个样本的标签,所有的样本标签均为相同的值。
所述步骤S35中的状态区分损失表示如下:
Figure BDA0002959558240000061
式中标签
Figure BDA0002959558240000062
对应不同状态的样本标签值不同。
进一步,所述步骤S4中的最大均值差异MMD表示两个数据集合的分布差异。
所述MMD能够巧妙简单地计算出不同数据集合的分布差异,其计算表示如下:
Figure BDA0002959558240000063
式中ns代表源域样本数,nt代表目标域样本数,||·||H为再生核希尔伯特空间(reproducing kernel Hilbert space(RKHS)),φ:xs,xt→H,表示将两域数据映射至RKHS的映射函数。
进一步,所述步骤S4中的迁移学习通过MC模块计算指定源域特征和目标域特征的MMD并将其作为目标损失训练FE使之从原始数据中提取出域不变特征来实现;
所述源域特征fs和目标域特征ft为FE的输出;
所述目标损失MMD表示如下:
Figure BDA0002959558240000064
式中σ为高斯核带宽,通常取几个不同的值,最后求平均。
进一步,所述步骤S5中的评价指标是在R2决定系数的基础上进行了适应寿命预测问题的改进;
所述评价指标表示如下:
Figure BDA0002959558240000065
Figure BDA0002959558240000066
ω1=0.35
ω2=0.65
其中n表示样本数,
Figure BDA0002959558240000071
表示模型对第i个样本的预测RUL,yi表示第i个样本对应的真实RUL,
Figure BDA0002959558240000072
则表示RUL标签的均值。将包含n个样本的退化过程划分为前后期,前期包括m个样本,分别给前后期分配权重0.35和0.65,赋予后期更高的影响;并且当预测值大于真实值时,设置惩罚因子1.1,当预测值小于真实值时,设置惩罚因子0.9。
本发明的有益效果为:
本发明提出了一种基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,在所发明的方法中,首先利用振动波动检测算法区分设备的健康和退化状态,再设置包括FE、TS、MC、DD、SS和SP在内的6个模块,利用TS设置软阈值剔除特征中的干扰成分,通过FE、TS和DD的对抗训练提高特征域融合度,同时通过FE、TS和SS的对抗训练保证特征的状态分离度,利用MC引入最大均值差异控制不同数据集合的分布误差,最后基于源域特征训练SP,实现旋转机械的迁移预测。以上特点得本发明方法能有效解决旋转机械状态迁移预测问题,并消除不同设备和不同工况差异的影响,提高状态预测稳定性。
附图说明
图1为本发明提供的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法实现流程图;
图2为本发明提供的振动波动检测算法示意图;
图3为本发明提供的方法训练策略总览图;
图4为本发明提供的软阈值原理图;
图5为本发明提供的FE和TS网络结构图;
图6为本发明提供的MC、DD、SS和SP网络结构图;
图7为本发明提供的相同工况下实验的方法预测结果;
图8为本发明提供的特定工况下实验的方法预测结果对比;
具体实施方式
如图1所示,本发明一种基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,包括以下步骤:
S1、利用振动波动检测算法区分设备的健康和退化状态;
S2、设置软阈值剔除特征中的干扰成分;
S3、设置6个模块通过模块间的对抗训练提高特征域融合度的同时保证特征的状态分离度;
S4、引入最大均值差异通过迁移学习控制不同数据集合的分布误差;
S5、基于源域特征利用特定评价指标训练状态预测模块,实现旋转机械的迁移预测。
本发明方法训练策略总览如图2所示,整体上分为原始振动信号健康退化状态划分、特征调整和预测模块优化三个部分。
上述步骤S1中的振动波动检测算法用以安全可靠地从振动数据中确定初始故障出现的时间(FOT),示意如图3所示。
振动波动检测算法表示如下:
Figure BDA0002959558240000081
式中,Pp()表示振动信号的峰峰值,Std()表示峰峰值标准差;N表示样本量,也代表区间数(通过重复首区间值将区间数补至同样本量);μ为倍数,阈值为初始标准差的指定倍数;i即超过阈值的区间序数,即样本序数;I表示超过阈值的样本序数的集合,T()表示样本对应的时间。
上述步骤S1具体为:
S11、将全部原始信号划分为多个连续的样本,计算每个样本的振幅峰峰值;
S12、以固定样本数量划分区间,通过重复首区间值将区间数补至同样本量,计算每个区间内的峰峰值标准差;
S13、以首区间标准差为基准值,指定其倍数为阈值;
S14、确定正向超过该阈值即从小于阈值到大于等于阈值的区间,进一步确定对应的样本,并判断后续样本的峰峰值是否都大于该样本峰峰值,若是,则该样本对应时间点为FOT,若否,则继续逐满足条件的区间、样本判断;
S15、若只有一个样本满足条件,其对应时间点即为FOT;若有多个样本满足条件,则取最早时间点为FOT。
上述步骤S2中的软阈值为一种信号降噪方法,通过设定阈值τ将信号中在区间[-τ,τ]内的值置为0,让区间外的特征也朝着原点收缩τ个单位。软阈值思想在深度学习中的应用,是通过创建阈值自学习模块(TS)来实现的,阈值τ由TS学习得到,进而消除特征中的干扰成分,其原理示意如图4所示。
上述步骤S2具体为:
S21、TS模块将从原始数据中提取出的二维特征平均池化,变为一个行向量,保存为阈值基;
S22、阈值基通过TS中全连接层和标准化层的计算得到阈值系数;
S23、将阈值系数转置为列向量,与阈值基相乘得到与原二维特征尺寸相同的阈值矩阵;
S24、二维特征与阈值矩阵作差,小于0的特征值置0,大于0的特征值保留。
上述步骤S3中的6个模块包括特征提取模块(FE)、阈值自学习模块(FE)、状态区分模块(SS)、域判别模块(DD)、MMD计算模块(MC)和状态预测模块(SP);其中FE用于从原始振动信号中提取特征、TS用于对提取特征进行软阈值化,剔除特征中的干扰成分、SS用于区分特征的不同寿命状态、DD用于判别特征所属的不同域、MC用于计算不同域特征的分布差异、SP用于预测特征对应的寿命状态。FE、TS模块的网络结构如图5所示,其余4个模块的网络结构以及6个模块的相互关系如图6所示。
FE模块从原始信号中挖掘特征,主要由卷积池化网络层构成,激活函数选用LeakyReLU;TS模块则是通过自定义的操作求取阈值基、阈值系数得到阈值矩阵,对提取特征进行干扰过滤;MC模块是自定义的计算最大均值差异的网络层;DD模块是由卷积层和全连接层构成的分类器;SS模块是由长短时记忆网络层和全连接层构成的回归器;SP模块结构与SS模块相同。
上述步骤S3中的域融合度即不同数据集合的相似程度,状态分离度即相同数据集合中对应旋转机械不同寿命状态的特征的差异程度。
上述步骤S3中提高域融合度是通过FE和DD对抗训练来实现的,通过不同且相对的损失来分别训练FE和DD,训练DD的目的是使得其能准确判别特征所属的不同域,训练FE的目的则是使得其能从原始信号中提取出迷惑DD的特征。
上述步骤S3中的提高状态分离度是通过FE和SS对抗训练来实现的,通过不同且相对的损失来分别训练FE和SS,训练SS的目的是使得其认为不同特征对应的寿命状态都是相同的,训练FE的目的则是使得其能从原始信号中提取出被SS区分开的特征。
上述步骤S3具体为:
S31、利用域判别损失训练DD,让其能准确判断各域特征所属的不同域;
S32、利用相对的域判别损失训练FE,让其能从原始信号中提取出迷惑住DD的特征;
S33、FE和DD交替训练,直至达到平衡;
S34、利用状态区分损失训练SS,让其无法区分特征对应的不同状态;
S35、利用相对的状态区分损失训练FE,让其能从原始信号中提取出被SS准确区分开不同状态的特征;
S36、FE和SS交替训练,直至达到平衡。
上述步骤S31中的域判别损失表示如下:
Figure BDA0002959558240000101
式中,N为批量大小,K表示判别器输出的维度;
Figure BDA0002959558240000102
表示一个批次中第j个样本的第i维输出的标签,
Figure BDA0002959558240000103
表示判别器具体输出。
上述步骤S32中相对的域判别损失表示如下:
Figure BDA0002959558240000104
式中
Figure BDA0002959558240000105
表示输出标签,与
Figure BDA0002959558240000106
不同,其独热编码值代表所有样本均属于同一域。
上述步骤S34中的状态区分损失表示如下:
Figure BDA0002959558240000111
式中
Figure BDA0002959558240000112
表示SS对第i个样本的预测输出,si为第i个样本的标签,所有的样本标签均为相同的值。
上述步骤S35中的状态区分损失表示如下:
Figure BDA0002959558240000113
式中标签
Figure BDA0002959558240000114
对应不同状态的样本标签值不同。
上述步骤S4中的最大均值差异MMD表示两个数据集合的分布差异,能够巧妙简单地计算出不同数据集合的分布差异,其计算表示如下:
Figure BDA0002959558240000115
式中ns代表源域样本数,nt代表目标域样本数,||·||H为再生核希尔伯特空间(reproducing kernel Hilbert space(RKHS)),φ:xs,xt→H,表示将两域数据映射至RKHS的映射函数。
上述步骤S4中的迁移学习通过MC计算指定源域特征和目标域特征的MMD并将其作为目标损失训练FE使之从原始数据中提取出域不变特征来实现,目标损失MMD表示如下:
Figure BDA0002959558240000116
式中σ为高斯核带宽,通常取几个不同的值,最后求平均,源域特征fs,目标域特征ft均为FE的输出。
如图6所示,在各模块训练即提取特征调整过程中,DD将分类损失见公式(2)的梯度反向传递至自身的各网络层,朝着最小化损失的方向优化网络层的参数。同样地,SS模块也是如此,优化过程如下式:
Figure BDA0002959558240000117
式中θd,θs分别表示DD和SS模块的网络层参数;δ为学习率,
Figure BDA0002959558240000121
表示损失梯度,fAdam,d()表示Adam函数对损失梯度求取一阶矩、二阶矩的运算。
训练FE和TS的损失由式(3)(5)(7)组合而成,两模块的参数优化过程如式(18)所示:
Figure BDA0002959558240000122
式中α、β、γ为各损失所占的权重。
上述步骤S5中的评价指标是在R2决定系数的基础上进行了适应寿命预测问题的改进,考虑到剩余寿命预测问题相比于一般的回归问题有其独特性,主要包括以下两点:1)后期准确预测更重要;通常设备运行过程会先经历健康状态,即便进入退化状态也会经历一个过程才会失效,所以后期的准确预测关乎设备的安全正常运行,相对更重要;2)预测值比真实值低好过比真实值高;当预测的RUL低于实际的RUL时只会提前报废设备造成浪费,而一旦预测的RUL高于实际RUL则会带来更严重的后果。评价指标表示如下:
Figure BDA0002959558240000123
Figure BDA0002959558240000124
ω1=0.35
ω2=0.65 (10)
式中n表示样本数,
Figure BDA0002959558240000125
表示模型对第i个样本的预测RUL,yi表示第i个样本对应的真实RUL,
Figure BDA0002959558240000126
则表示RUL标签的均值。将包含n个样本的退化过程划分为前后期,前期包括m个样本,分别给前后期分配权重0.35和0.65,赋予后期更高的影响;并且当预测值大于真实值时,设置惩罚因子1.1,当预测值小于真实值时,设置惩罚因子0.9。
方法训练的第三阶段优化SP,其预测损失选用RMSE,表示如下:
Figure BDA0002959558240000127
那么参见图6,SP模块的参数优化过程如下式所示:
Figure BDA0002959558240000128
在本发明的实施例中,提供了采用本发明方法完成旋转机械迁移预测的实验过程:
1.实验装置:
验证用到了XJTU轴承全寿命数据集,其试验台由交流电机、转速控制器、支承轴承、液压加载系统等组成,还有两个采集振动信号的PCB 352C33型加速度计分别在被测轴承外壳的水平轴和垂直轴上。采样频率为25.6kHz,每1min记录32,768个数据点(即采集1.28s)。如表1所示,该数据集包含15个LDK UER204滚珠轴承在三种不同工况下的全寿命数据。
表1 XJTU数采实验工况
Figure BDA0002959558240000131
2.实验方案
利用XJTU数据集设计了两类预测实验,相同工况下的预测实验设置为:对每种工况任取其中一个设备的退化数据作为测试数据,另外四个设备的退化数据为训练数据,总共有15组实验;不同工况间的预测实验设置为:三种工况相互迁移包括六种情况,其中一种情况如从工况1迁移预测工况2时,取工况1下的所有五个设备的退化数据作为训练数据,分别取工况2下每一个设备的退化数据作为测试数据,有5组实验,那么总共便有30组实验。
按照数据集的设置描述,取每隔一分钟采样的数据作为一个样本。采用本发明提出的振动波动检测算法将各设备的数据划分为健康状态和退化状态,各设备的退化数据所包含的样本数如表2所示。
表2各设备对应的退化状态样本数
Figure BDA0002959558240000132
相同工况下的预测实验,如表2所示其中工况一下各设备退化数据总和为262个样本量,分别取一个设备数据作为测试数据,剩下的四个设备数据作为训练数据,有5组实验,各组训练和测试数据样本量如表3所示,工况二和工况三下实验设置相同。
表3相同工况下实验数据设置
Figure BDA0002959558240000133
Figure BDA0002959558240000141
不同工况间的预测实验,以工况二迁移预测工况三为例,如表2所示工况二下五个设备退化数据总和为480个样本量,以之为训练数据,分别取工况三下一个设备的退化数据为测试数据,总共有5组实验,实验设置和训练测试数据样本量如表4所示。其它迁移预测实验设置相同。
表4不同工况间实验数据设置
Figure BDA0002959558240000142
3.性能对比
本发明提出的预测方法包含多个模块,训练过程也分为多个阶段,为了更好的验证提出方法的有效性和准确性,也为了证明提出多模块方法的合理性,将方法中的多模块进行组合、对比,有五种情况,除了完整的方法之外,还包括下面四种:没有进行软阈值化(Without Self-learner)、没有进行FE与DD的对抗训练(Without Discriminator)、没有计算域间特征的MMD(Without Calculator)、没有进行FE与SS的对抗训练(WithoutSeparator)。在设置的相同工况下的15组实验中,提出方法分别和这四种组合进行预测损失和表现分数的对比。
4.实验输出
15组相同工况下的预测实验,提出方法和四种组合方法的预测损失和表现分数如表5所示。
表5提出方法在相同工况下的实验对比结果
Figure BDA0002959558240000143
Figure BDA0002959558240000151
与表5对应,提出方法在各组实验中测试的预测结果曲线如图7所示。每个子图,横轴为设备运行时间,纵轴为设备健康状态,蓝色线为设备真实状态,红色线表示方法的预测状态结果。
为了让更清楚地展示提出方法和四个组合方法的预测表现差异,分别从表5三种工况下的实验中取1_3、2_5、3_1组实验,展示五种方法的预测结果曲线,如图8所示。
不同工况间的预测实验总共有30组,提出方法在各组实验中的预测损失和表现分数如表6所示。
表6提出方法在不同工况间的实验结果
Figure BDA0002959558240000152
相同工况下的实验对比结果以及不同工况间的实验结果充分表明,本发明提出的方法不仅在预测准确性上前进了一大步,并且可以实现不同工况数据之间的迁移预测,降低工况波动对旋转机械寿命预测带来的影响。
本发明的有益效果为:
本发明提出了基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,在所发明的方法中,首先利用振动波动检测算法区分设备的健康和退化状态,再设置包括FE、TS、MC、DD、SS和SP在内的6个模块,利用TS设置软阈值剔除特征中的干扰成分,通过FE、TS和DD的对抗训练提高特征域融合度,同时通过FE、TS和SS的对抗训练保证特征的状态分离度,利用MC引入最大均值差异控制不同数据集合的分布误差,最后基于源域特征训练SP,实现旋转机械的迁移预测。以上特点使得本发明方法能有效解决旋转机械状态迁移预测问题,并消除不同设备和不同工况差异的影响,提高状态预测稳定性。

Claims (11)

1.基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于,包括以下步骤:
S1、利用振动波动检测算法区分设备的健康和退化状态;
S2、设置软阈值剔除特征中的干扰成分;
S3、设置6个模块,通过模块间的对抗训练提高特征域融合度的同时保证特征的状态分离度;
所述步骤S3中的6个模块包括特征提取模块FE、阈值自学习模块TS、状态区分模块SS、域判别模块DD、MMD计算模块MC和状态预测模块SP;
所述6个模块均由神经网络层搭建而成;
所述FE用于从原始振动信号中提取特征;
所述TS用于对提取特征进行软阈值化,剔除特征中的干扰成分;
所述SS用于区分特征的不同寿命状态;
所述DD用于判别特征所属的不同域;
所述MC用于计算不同域特征的分布差异;
所述SP用于预测特征对应的寿命状态;
所述步骤S3中的域融合度即不同数据集合的相似程度,状态分离度即相同数据集合中对应旋转机械不同寿命状态的特征的差异程度;所述步骤S3具体为:
S31、利用域判别损失训练DD,让其能准确判断各域特征所属的不同域;
S32、利用相对的域判别损失训练FE,让其能从原始信号中提取出迷惑住DD的特征;
S33、FE和DD交替训练,直至达到平衡;
S34、利用状态区分损失训练SS,让其无法区分特征对应的不同状态;
S35、利用相对的状态区分损失训练FE,让其能从原始信号中提取出被SS准确区分开不同状态的特征;
S36、FE和SS交替训练,直至达到平衡;
S4、引入最大均值差异,通过迁移学习控制不同数据集合的分布误差;
S5、基于源域特征利用评价指标训练状态预测模块,实现旋转机械的迁移预测。
2.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于,所述步骤S1中的振动波动检测算法用以安全可靠地从振动数据中确定初始故障出现的时间FOT;
所述振动波动检测算法表示如下:
Figure FDA0003605467590000021
式中,Pp()表示振动信号的峰峰值,Std()表示峰峰值标准差;N表示样本量,也代表区间数;μ为倍数,阈值为初始标准差的指定倍数;i即超过阈值的区间序数,即样本序数;I表示超过阈值的样本序数的集合,T()表示样本对应的时间。
3.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于,所述步骤S1具体为:
S11、将全部原始信号划分为多个连续的样本,计算每个样本的振幅峰峰值;
S12、以固定样本数量划分区间,通过重复首区间值将区间数补至同样本量,计算每个区间内的峰峰值标准差;
S13、以首区间标准差为基准值,指定其倍数为阈值;
S14、确定正向超过该阈值的区间,即从小于阈值到大于等于阈值的区间,进一步确定对应的样本,并判断后续样本的峰峰值是否都大于该样本的峰峰值,若是,则该样本对应时间点为FOT,若否,则继续逐满足条件的区间、样本判断;
S15、若只有一个样本满足条件,其对应时间点即为FOT;若有多个样本满足条件,则取最早时间点为FOT。
4.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S2中的软阈值为一种信号降噪方法,通过设定阈值τ将信号中在区间[-τ,τ]内的值置为0,让区间外的特征也朝着原点收缩τ个单位;
所述软阈值思想在深度学习中的应用,是通过创建阈值自学习模块TS来实现的,阈值τ由TS学习得到,进而对特征进行软阈值化。
5.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S2具体为:
S21、TS模块将从原始数据中提取出的二维特征平均池化,变为一个行向量,保存为阈值基;
S22、阈值基通过TS中全连接层和标准化层的计算得到阈值系数;
S23、将阈值系数转置为列向量,与阈值基相乘得到与原二维特征尺寸相同的阈值矩阵;
S24、二维特征与阈值矩阵作差,小于0的特征值置0,大于0的特征值保留。
6.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S3中的提高域融合度是通过FE和DD对抗训练来实现的;
所述对抗训练即通过不同且相对的损失来训练FE和DD,训练DD的目的是使得其能准确判别特征所属的不同域,训练FE的目的则是使得其能从原始信号中提取出迷惑DD的特征。
7.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S3中的提高状态分离度是通过FE和SS对抗训练来实现的;
所述对抗训练即通过不同且相对的损失来训练FE和SS,训练SS的目的是使得其认为不同特征对应的寿命状态都是相同的,训练FE的目的则是使得其能从原始信号中提取出被SS区分开的特征。
8.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S31中的域判别损失表示如下:
Figure FDA0003605467590000041
式中,N为批量大小,K表示判别器输出的维度;
Figure FDA0003605467590000042
表示一个批次中第j个样本的第i维输出的标签,
Figure FDA0003605467590000043
表示判别器具体输出;
所述步骤S32中相对的域判别损失表示如下:
Figure FDA0003605467590000044
式中
Figure FDA0003605467590000045
表示输出标签,与
Figure FDA0003605467590000046
不同,其独热编码值代表所有样本均属于同一域;
所述步骤S34中的状态区分损失表示如下:
Figure FDA0003605467590000047
式中
Figure FDA0003605467590000048
表示SS对第i个样本的预测输出,si为第i个样本的标签,所有的样本标签均为相同的值;
所述步骤S35中的状态区分损失表示如下:
Figure FDA0003605467590000049
式中标签
Figure FDA00036054675900000410
对应不同状态的样本标签值不同。
9.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S4中的最大均值差异MMD能表示两个数据集合的分布差异;其计算表示如下:
Figure FDA00036054675900000411
式中ns代表源域样本数,nt代表目标域样本数,‖·‖H为再生核希尔伯特空间,φ:xs,xt→H,表示将两域数据映射至RKHS的映射函数。
10.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S4中的迁移学习通过MC模块计算指定源域特征和目标域特征的MMD并将其作为目标损失训练FE使之从原始数据中提取出域不变特征来实现;
源域特征fs和目标域特征ft为FE的输出;
所述目标损失MMD表示如下:
Figure FDA0003605467590000051
式中σ为高斯核带宽。
11.如权利要求1所述的基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法,其特征在于所述步骤S5中的评价指标是在R2决定系数的基础上进行了适应寿命预测问题的改进;
所述评价指标表示如下:
Figure FDA0003605467590000052
Figure FDA0003605467590000053
ω1=0.35
ω2=0.65
其中n表示样本数,
Figure FDA0003605467590000054
表示模型对第i个样本的预测RUL,yi表示第i个样本对应的真实RUL,
Figure FDA0003605467590000055
则表示RUL标签的均值,将包含n个样本的退化过程划分为前后期,前期包括m个样本,分别给前后期分配权重0.35和0.65,赋予后期更高的影响;并且当预测值大于真实值时,设置惩罚因子1.1,当预测值小于真实值时,设置惩罚因子0.9。
CN202110234849.5A 2021-03-03 2021-03-03 基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法 Active CN112966345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110234849.5A CN112966345B (zh) 2021-03-03 2021-03-03 基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110234849.5A CN112966345B (zh) 2021-03-03 2021-03-03 基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法

Publications (2)

Publication Number Publication Date
CN112966345A CN112966345A (zh) 2021-06-15
CN112966345B true CN112966345B (zh) 2022-06-07

Family

ID=76276308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110234849.5A Active CN112966345B (zh) 2021-03-03 2021-03-03 基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法

Country Status (1)

Country Link
CN (1) CN112966345B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113342476B (zh) * 2021-07-05 2023-04-07 中山大学 一种基于迁移学习的设备集群跨域故障预测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019228358A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 深度神经网络的训练方法和装置
CN110555273A (zh) * 2019-09-05 2019-12-10 苏州大学 基于隐马尔科夫模型和迁移学习的轴承寿命预测方法
CN111060318A (zh) * 2020-01-09 2020-04-24 山东科技大学 一种基于深度对抗迁移网络的轴承故障诊断方法
CN111504644A (zh) * 2020-04-01 2020-08-07 西安交通大学 基于嵌入区分性的条件对抗域自适应的轴承故障诊断方法
CN112241608A (zh) * 2020-10-13 2021-01-19 国网湖北省电力有限公司电力科学研究院 一种基于lstm网络和迁移学习的锂电池寿命预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109710636B (zh) * 2018-11-13 2022-10-21 广东工业大学 一种基于深度迁移学习的无监督工业系统异常检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019228358A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 深度神经网络的训练方法和装置
CN110555273A (zh) * 2019-09-05 2019-12-10 苏州大学 基于隐马尔科夫模型和迁移学习的轴承寿命预测方法
CN111060318A (zh) * 2020-01-09 2020-04-24 山东科技大学 一种基于深度对抗迁移网络的轴承故障诊断方法
CN111504644A (zh) * 2020-04-01 2020-08-07 西安交通大学 基于嵌入区分性的条件对抗域自适应的轴承故障诊断方法
CN112241608A (zh) * 2020-10-13 2021-01-19 国网湖北省电力有限公司电力科学研究院 一种基于lstm网络和迁移学习的锂电池寿命预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIAN ZHOU 等.A Multistage Deep Transfer Learning Method for Machinery Fault Diagnostics Across Diverse Working Conditions and Devices.《IEEE Access》.2020,第8卷全文. *
陈仁祥等.多分类器集成加权均衡分布适配的滚动轴承寿命阶段识别.《仪器仪表学报》.2019,(第10期), *

Also Published As

Publication number Publication date
CN112966345A (zh) 2021-06-15

Similar Documents

Publication Publication Date Title
CN110276416B (zh) 一种滚动轴承故障预测方法
CN109324604A (zh) 一种基于多源信号的智能列车综合故障分析方法
CN110297479B (zh) 一种基于卷积神经网络信息融合的水电机组故障诊断方法
CN112257530B (zh) 基于盲信号分离和支持向量机的滚动轴承故障诊断方法
CN109186964B (zh) 基于角度重采样与roc-svm的旋转机械故障诊断方法
CN112418277A (zh) 旋转机械零部件剩余寿命预测方法、系统、介质、设备
CN109781411A (zh) 一种结合改进稀疏滤波器与kelm的轴承故障诊断方法
CN113076834B (zh) 旋转机械故障信息处理方法、处理系统、处理终端、介质
CN116308300B (zh) 一种电力设备状态监测评价与指挥方法及系统
CN112966345B (zh) 基于对抗训练和迁移学习的旋转机械剩余寿命预测混合收缩方法
CN111275108A (zh) 基于生成对抗网络对局部放电数据进行样本扩展的方法
CN109376794A (zh) 一种铁水脱硫搅拌器的智能故障诊断方法及系统
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN115859077A (zh) 一种变工况下多特征融合的电机小样本故障诊断方法
CN116561517A (zh) 基于奖励优化深度强化学习不平衡智能故障定量诊断方法
CN116595319A (zh) 应用于轨道交通电机健康状态评估的预测方法及系统
CN111985528A (zh) 一种基于pdgan的电缆局放数据增强方法
CN115758083A (zh) 一种基于时域和时频域融合的电机轴承故障诊断方法
CN114330430A (zh) 一种基于大数据特征分析的电梯故障判断方法及系统
CN112816200B (zh) 一种基于深度学习的旋转机械轴心轨迹识别方法
CN112163474B (zh) 一种基于模型融合的齿轮箱智能诊断方法
CN114186602A (zh) 一种基于稀疏滤波域对抗神经网络的机械故障诊断方法
CN111884236A (zh) 一种电网智能暂态稳定评估系统
CN115791174B (zh) 一种滚动轴承异常诊断方法、系统、电子设备及存储介质
CN110956308A (zh) 基于时间序列的化工设备健康状态预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant