CN116680554A - 一种基于概率化元学习模型的旋转机械寿命预测方法 - Google Patents
一种基于概率化元学习模型的旋转机械寿命预测方法 Download PDFInfo
- Publication number
- CN116680554A CN116680554A CN202310725270.8A CN202310725270A CN116680554A CN 116680554 A CN116680554 A CN 116680554A CN 202310725270 A CN202310725270 A CN 202310725270A CN 116680554 A CN116680554 A CN 116680554A
- Authority
- CN
- China
- Prior art keywords
- prediction
- probabilistic
- learning
- model
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 53
- 238000009826 distribution Methods 0.000 claims abstract description 36
- 238000012360 testing method Methods 0.000 claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 16
- 230000007246 mechanism Effects 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 claims description 7
- 238000006731 degradation reaction Methods 0.000 claims description 6
- 230000015556 catabolic process Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 4
- 230000006978 adaptation Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 239000006185 dispersion Substances 0.000 claims description 2
- 230000009467 reduction Effects 0.000 claims description 2
- 238000013519 translation Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 abstract description 10
- 238000002679 ablation Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000005562 fading Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- NUHSROFQTUXZQQ-UHFFFAOYSA-N isopentenyl diphosphate Chemical compound CC(=C)CCO[P@](O)(=O)OP(O)(O)=O NUHSROFQTUXZQQ-UHFFFAOYSA-N 0.000 description 3
- 238000005096 rolling process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000011088 calibration curve Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000004519 grease Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000314 lubricant Substances 0.000 description 1
- 238000005461 lubrication Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000003071 polychlorinated biphenyls Chemical class 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01M—TESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
- G01M13/00—Testing of machine parts
- G01M13/02—Gearings; Transmission mechanisms
- G01M13/028—Acoustic or vibration analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Acoustics & Sound (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于概率化元学习模型的旋转机械寿命预测方法,获取振动信号进行预处理;然后进行衰退特征提取,形成衰退特征矩阵,经无监督多源域自适应处理得到寿命指标;对寿命指标进行训练数据、测试数据的划分;对编码‑解码预测模型进行概率化重建;将概率化编码‑解码预测模型嵌入元学习场景训练中,最终得到任务间元参数,生成通用概率化元学习预测模型;进行模型微调实现跨工况预测,通过模型进行旋转机械寿命预测。对旋转机械寿命预测进行区间估计,贝叶斯近似的模型能够层层反演预测中不确定度的来源,贯通“模型参数不确定度‑预测结果的统计分布‑区间预测结果”链路,提升预测算法的可信度、可解释性。
Description
技术领域
本发明涉及旋转机械的服役性能评估及寿命预测,具体是涉及一种基于概率化元学习模型的旋转机械寿命预测方法。
背景技术
在科学技术飞速发展的今天,汽轮发电机组、风力发电机、以及盾构机等一系列高可靠性装备存有量飞速增长,其设计、研制、生产、使用尤其是后期维护与保障成本越来越高,滚动轴承作为现代工业诸如航空装备、卫星制造与应用、轨道交通设备制造、海洋工程装备制造、数控加工制造以及流程工业等智能制造应用场景中不可或缺的关键基础部件之一,其故障导致的事故停机往往造成重大经济损失和恶劣社会影响甚至人员伤亡等,对其进行有效的故障预测与健康管理(prognostic and health management,PHM)已成为业界共识。目前状态监测与故障诊断技术发展迅速且较为成熟,但实现智能化运维以及PHM仍需要大力研究高精度预测技术从而助力故障溯源、视情维修、备件预测及应急决策调度等精准服务技术真正落地,具有重大理论意义与实用价值。
目前主流的数据驱动技术因其灵活的寿命建模能力与出色的变工况泛化性能逐步在高端装备PHM研究中占据主导,伴随着计算机硬件水平以及大数据,高效传感测试技术的不断发展,尤其是以深度学习、迁移学习为代表的新一代人工智能技术主导的预测预报研究逐渐成为寿命预测领域的研究热点。然而该类技术很大程度依赖大规模含标签状态数据,小样本下学习、泛化建模能力较弱。同时由于某些高端应用场景失效样本稀少且大量截尾数据存在,导致正常服役状态数据与失效样本规模不对等,即退化、损伤样本不平衡现象,迁移学习虽能在一定程度弥补样本分布差异带来的过拟合等现象,但仍需一定相关程度且成规模的学习样本提供支持,如何在有限数据下实现较高精度寿命预测仍需进一步研究。上述因素直接阻碍了现有智能算法驱动技术的精确实施。因此,亟待研制一种小规模样本下在线快速适配服役工况及待预测件特性的建模方法以解决这一困境。
元学习旨在抽象一种通用知识并高效适应新任务的能力,有望充分理解退化过程机制和该机制与具体适用背景间的相互作用关系,为小样本下快速迁移、适应提供可能。该方法的提出有效解决了机器学习领域中小样本学习问题,这一难题也广泛存在于实际工程中,尤其是退化数据不充分且标签稀缺的高端装备行业。然而现有元学习方法稍微摆脱数据驱动中点估计决策的固有缺点,即结果缺乏可信度并且最终预测结果不具备不确定度。
发明内容
发明目的:针对以上缺点,本发明提供一种泛化可信的基于概率化元学习模型(Bayesian approximation enhanced probabilistic meta-learning,BA-PML)的旋转机械寿命预测方法。
技术方案:为解决上述问题,本发明采用一种基于概率化元学习模型的旋转机械寿命预测方法,包括以下步骤:
(1)获取不同工况的旋转机械的振动信号,并进行预处理;
(2)对预处理后的振动信号进行衰退特征提取,形成衰退特征矩阵,衰退特征矩阵经无监督多源域自适应处理得到寿命指标;
(3)对不同工况的寿命指标分别进行训练数据、测试数据的划分,并将训练数据、测试数据分别划分为若干子集,每个子集划分为支撑集、查询集;
(4)对编码-解码预测模型进行概率化重建,利用变分推理结合贝叶斯的反向传播方法学习编码-解码预测模型的参数的后验分布,构建概率化编码-解码预测模型;
(5)将概率化编码-解码预测模型嵌入元学习场景训练中,将训练数据中每一子集的支撑集输入概率化编码-解码预测模型并参与内循环训练,对各子集内循环训练下的模型参数进行二次梯度下降更新,其中二次梯度下降更新通过测试数据的支撑集完成跨子任务间的外循环训练,最终得到任务间元参数,生成通用概率化元学习预测模型;
(6)对所述的通用概率化元学习预测模型进行模型微调实现跨工况预测,具体通过学习训练数据的查询集与通用概率化元学习预测模型梯度反向传播更新机制生成贝叶斯近似的概率化元学习预测模型;
(7)通过概率化元学习预测模型进行旋转机械寿命预测得到预测值的概率分布。
有益效果:本发明相对于现有技术,其显著优点是将区间估计思想拓展至有限数据驱动的旋转机械寿命预测预报领域,深入探讨了有限数据下预测不确定度问题,并建立了概率化少样本预测模式;将点估计预测推广至区间估计的范畴,贝叶斯近似的概率元学习预测模型能够层层反演预测预报决策中不确定度的来源,贯通“模型参数不确定度-预测结果的统计分布-区间预测结果(预测置信带)”链路,全面提升有限数据预测算法的可信度、可解释性。
附图说明
图1是本发明预测方法的流程示意图。
图2是本发明中ABLT实验台及多通道疲劳加速实验的原始信号。
图3是本发明中概率化重塑后的编码-解码基础预测模型示意图。
图4是本发明中概率化元学习方法BA-PML的结构逻辑图。
图5是本发明中概率化元学习方法BA-PML在ABLT-Prognostics-I任务下的预测结果。
图6是本发明中概率化元学习方法BA-PML在ABLT-Prognostics-II任务下的预测结果。
图7是本发明中概率化元学习方法BA-PML在ABLT-Prognostics-III任务下的预测结果。
图8是本发明中概率化元学习方法BA-PML在ABLT-Prognostics-Ⅳ任务下的预测结果。
图9是本发明中概率化元学习方法BA-PML不同预设参数ρ和κ下的预测误差情况。
图10是本发明中概率化元学习方法BA-PML在消融实验下,预测结果中置信区间的校准曲线。
具体实施方式
如图1所示,本实施例中一种基于概率化元学习模型的旋转机械寿命预测方法,包括以下步骤:
S1:通过三轴压电式加速度计拾取不同工况的旋转机械振动信号,对采集的多通道数据进行高频噪音剔除。
本实施例通过三轴压电式加速度计采集四组不同工况的6308型号滚动轴承运行至失效时刻的振动信号进行分析,其中所用实验台主要由轴承座本体,测试与控制模块以及加载模块组成。本实验台所进行的全寿命耐久试验,均采用油脂(即轴承防尘片内自带的脂润滑剂)以及32#机械油润滑,且所加负载均未超过额定当量动载荷,最大程度模拟真实工况,尽可能保持轴承试件疲劳失效机理和常规服役一致。四组全寿命试验的原始信号及运行工况简介参见图2和表1。随后初步对采集的振动信号进行频域降噪剔除原始信号中的高频成分,并基于动态滑动窗技术剔除原始信号中的奇异值点、离群点等。
表1 ABLT轴承数据集工况信息
试验 | 轴承序号 | 转速(rpm) | 负载(kN) | 寿命时长(s) |
ABLT-1# | Bearing-A | 2000 | 20 | 2.8579e+05 |
ABLT-2# | Bearing-B | 2000 | 25 | 5.9568e+04 |
ABLT-3# | Bearing-C | 3000 | 20 | 6.1240e+04 |
ABLT-4# | Bearing-D | 3000 | 25 | 2.0279e+04 |
上述试验利用三轴加速度计拾取了x,y,z轴的振动信号(采样频率为10kHz,采样间隔与时长为30秒和1秒),其中测试部分硬件通过NI CDAQ-9174及2块9234模块以及2个PCB 356B21支持,软件部分则通过Labview实现多通道信号的同步采集。并建立了四组不同转速、负载下的全寿命数据的交叉验证任务,具体如下所示:
1)ABLT-Prognostics-Ⅰ:使用ABLT-1#作为测试集合(即目标域),剩余来自于表1的ABLT-2#,ABLT-3#及ABLT-4#的实验数据集构成训练集,即多源域;
2)ABLT-Prognostics-Ⅱ:使用ABLT-2#作为测试集合(即目标域),剩余来自于表1的ABLT-1#,ABLT-3#及ABLT-4#的实验数据集构成训练集,即多源域;
3)ABLT-Prognostics-Ⅲ:使用ABLT-3#作为测试集合(即目标域),剩余来自于表1的ABLT-1#,ABLT-2#及ABLT-4#的实验数据集构成训练集,即多源域;
4)ABLT-Prognostics-Ⅳ:使用ABLT-4#作为测试集合(即目标域),剩余来自于表1的ABLT-1#,ABLT-2#及ABLT-3#的实验数据集构成训练集,即多源域。
S2:对所述每一通道信号预处理后的振动信号进行衰退特征提取:分别提取时域衰退特征、频域衰退特征,以及稀疏域衰退特征,具体统计学参数包括:
时域衰退特征的统计学参数包括:
平均值:标准差:/>平方根振幅:绝对平均值:/>偏度:/> 峰度:/>方差:/>最大值:DF8=max|x(n)|;最小值:DF9=min|x(n)|;峰均值:DF10=DF8-DF9;均方根:/>波形指数:/>峰值指数:/>脉冲指数:/>裕度指数:/>偏度指数:/>峰度指数:/>
其中,x(n)表示预处理后的振动信号,n=1,2,...,N;N表示振动信号长度;
频域衰退特征的统计学参数包括:
以及/>
其中,y(k)是给定振动信号的快速傅里叶频谱,fk则对应于第k个频谱的频率值,K表示总的频谱数量,DF18在频域上反映振动能量,DF19~DF21、DF23和DF27~DF30描述频谱的集中和离散程度,DF22和DF24~DF26表示主频带的位置变化;
为了得到振动信号x的复信号,对经过带通滤波后的信号xl,h[n]进行希尔伯特变换,并构建了如下解析信号其中H(*)为希尔伯特变换。从而可以得到xl,j[n]的包络/>与平方包络/>
基于上述变换稀疏域衰退特征的统计学参数包括:
谱峭度:谱基尼指数:/> 谱负熵:/>谱平滑指数:/>
其中<*>为算术平均算子,e-γ为复高斯信号的平滑指数的理论值,1-γ为复高斯信号的谱负熵值。
基于上述提取的三域特征,对每一通道原始信号channeli#均提取高维衰退矩阵 dflm代表第lth时刻的第mth个特征。每一通道信号所提取特征均在维度M上串联,从而可以得到总计S+1个领域(S个源域,一个目标域)的高维衰退矩阵 供无监督多源域自适应处理提取具有域不变特性的一维寿命指标/>
S3:对所述不同工况的寿命指标分别划分训练数据、测试数据,保证数据间无交叉现象发生。对提取的不同工况的寿命指标DDI划分训练数据(多源域数据{DDIsource1,...,DDIsourceR})、测试数据(目标域数据{DDItarget}),其中源域、目标域选取来自无交叉的不同工况振动数据。随后依据预先设定的子任务个数Nsubtask对两域中数据划分子集合,在每一子集合内按时间先后顺序划分支撑、查询集。
这里以预测任务ABLT-Prognostics-Ⅰ为例简要分析特定任务下输入数据及相应参数选择,其中ABLT-2#、ABLT-3#与ABLT-4#构成训练集样本Bearing-A为测试集样本在输入BA-PML算法前被进一步依照时间先后划分为支撑集/>与查询集/>首先采用滑动窗方式对/>和/>构建输入-输出样本对,并在按时间先后指定前k%数据对作为支撑集,后1-k%数据作为查询集。也就是说来自ABLT-2#、ABLT-3#与ABLT-4#的前k%数据M个子任务的/>参与子任务内循环训练,Bearing-A的前k%数据为M个子任务的/>参与子任务间外循环训练,最后通过来自Bearing-B、Bearing-C与Bearing-D的后1-k%数据,即M个子任务的/>作为模型微调使用。其中k与M的选取参见表2所示,M通过综合比较相同算力下计算时长与泛化误差进行折中选择得到。
表2BA-PML算法中预设参数设定
S4:对具有变长预测能力的编码-解码预测模型进行概率化重建,通过变分推理结合贝叶斯反向传播方法估计基础预测模型的参数后验分布,由此建立概率化重塑后的编码-解码基础预测模型,参与内循环寿命建模使用(inner-cycle probabilisticpredictor,IPP),如图3所示。
概率化重建具有变长预测能力的编码-解码预测模型,即利用贝叶斯的反向传播方法学习预测模型的参数的后验分布。核心在于找到变分推理中合适的参数并最小化变分分布qη(Φ)与真实后验分布/>的Kullback-Leibler距离。值得注意的是η的后验分布通常被假设为均值为/>方差为/>的高斯分布/>其中d为编码-解码预测模型参数的维度。相应的损失函数如下所示,它旨在最小化给定序列长度T的变分自由能,如下式所示:
其中损失函数通过计算变分分布qη(Φ)的期望值/>实现,P(y1:T|η,x1:T)代表对数似然,P(Φ)为编码-解码预测模型参数的先验分布。这里进一步将上式中最小化自由能的损失转变为最大化logP(y1:T|η,x1:T)的对数似然加上Kullback-Leibler散度的形式,具体如下式所示:
此外通过时间截断反向传播技术来处理长序列数据并减少计算梯度的方差。因此上式可以进一步转换为:
其中表示为变分参数η的损失函数,b和c为批量大小与截断序列b和c为批量大小与截断序列,B与C代表批量大小与截断序列的总数。总而言之,上述训练优化过程存在于每一子任务/>中,其中可训练参数μ和σ可以通过以下方式更新:
其中表示梯度,上式中/>其被用来重参数化η=μ+σ∈;/>以及/>为参数η,μ以及σ各自所计算的梯度;β作为学习率协助参数更新过程。
S5:将所述概率化编码-解码基础预测模型嵌入元学习场景训练中,投入多源域训练数据中每一子集的支撑集至预测模型并参与内循环训练,对各子集内循环训练下的模型参数进行二次梯度下降更新,其中二次梯度下降更新通过测试数据的支撑集完成跨子任务间的外循环训练建模,最终得到任务间元参数,生成可泛化至未知工况的通用概率元学习预测模型。所建立的概率化元学习模型(Bayesian approximation enhancedprobabilistic meta-learning,BA-PML)的结构逻辑图如图4所示,具体包括如下基本步骤:
S51:考虑变分分布与真实分布间的距离的损失函数构建,即
贝叶斯近似的概率元学习算法中子任务场景训练时对应的损失函数需要考虑变分分布与真实分布间的距离,主要通过量化Kullback-Leibler散度距离作为损失的正则化项参入训练。结合μ以及σ的参数更新规则考虑Kullback-Leibler散度距离与拟合误差的复合损失函数,即:
其中,为预测真实值,/>为预测模型估计值,λ为场景训练时对应的损失函数/>的惩罚系数,具体为给定序列{y1:Tx1:T}长度T的倒数。
S52:元学习场景训练中内、外循环训练的参数更新机制及任务间元参数推导,即:
将IPP模型嵌入元学习场景训练中,首先将每一子任务内的编码-解码预测模型的训练学习过程即子任务内循环,抽象表达为下式所示:
其中,θ为概率化元学习模型参数,α为学习率,为计算的损失函数。/>作为训练样本中第i个子任务/>的支撑集参与训练,/>表示在特定子任务内的待训练参数。
随后外循环训练通过测试数据的支撑集聚合所有M个子任务内更新的参数/>并最小化损失函数结合梯度反向更新机制得到任务间元参数Θ*,生成可泛化至未知工况的通用概率元学习预测模型。
S6:对所述的预测通用模型进行模型微调实现跨工况预测,其中具体通过学习训练数据的查询集与预测模型梯度反向传播更新机制生成贝叶斯近似的概率化元学习预测模型,并实现迁移预测。最终将所述测试数据查询集投入到所述贝叶斯近似的概率化元学习预测模型进行寿命预测研究。通过构建的概率化元学习预测模型进行旋转机械寿命预测时,得到预测值的概率分布。
对所述的预测通用模型进行模型微调实现跨工况预测并推倒预测结果的概率分布情况。在经过内外循环训练、学习后,得到了更加通用且易于泛化的预测模型参数,即任务间元参数Θ*,经过基于梯度下降的模型微调策略便可实现对未知标签数据集的迁移预测,具体下式所示:
其中,Θ为概率化元学习模型元参数,为梯度求解算子,γ为微调阶段学习率,Θ*为内外循环训练完毕后的元参数,/>则为经适配微调后属于服从特定子任务分布的模型参数。
因此再进行旋转机械寿命预测时,来自未知域的预测值的概率分布可以由下式推导,
其中,未知测试样本的输入特征值,/>代表第zth个预测模型参数,l表示似然函数,/>表示为第zth个适配至特定域Ti的概率化元学习模型,Z表示从最优η*的变分分布/>中采样的总个数。
依据表2中关于BA-PML算法的参数设定与步骤一中预测任务划分,共进行4组寿命预测验证分别测试四种不同规格超参数τ下所提算法的有限数据泛化能力。图5至图8展示了其中的极限情况,即τ=1/100时的预测结果,其中预测阶段的置信区间通过概率化基础预测模型参数的区间估计结合上式生成的,并且不难发现这种基于贝叶斯理论的区间预测结果(如图5至图8所示)基本覆盖了上述4个预测任务的寿命指标真实值,相较于采用bootstrap方法的后处理步骤实现区间预测而言,BA-PML更具可信度且预测不确定度量化过程直接溯源于模型参数。
为了深入探索申请所述方法中某些重要预设参数(其实预测时刻k与微调、适配阶段的有限数据规格τ)的选择以及该概率预测算法中不确定度的校准分析。首先对本发明中四组预测任务分别进行4种τ取值,即1/10,1/20,1/50和1/100,和3种k取值,即65%,80%和95%的遍历实验,随后为了消除偶然误差影响对上述12种组合分别重复验证100次,并绘制均方根误差(root mean square error,RMSE)均值与方差,如图9所示。经过比较可以清晰发现在相同k取值下更低的比例(即τ变小)将带了更大的有限数据预测误差;同时由于源域和目标域之间退化尾部数据的显著差异,越晚进行预测(即取k更大值)将取得更差的性能表现。
最后对所提出的贝叶斯近似的概率元学习有限数据预测算法(BA-PML)进行不确定性校准测试,这里利用了可靠度指标。它用于对落入给定预测区间的预测值进行计数,范围从0%到100%,其中0%没有预测值落入给定预测区间,100%则是其对立情况。理论上,观察到的可靠度总是小于预期的置信水平,如果预测任务使用90%的置信区间,理想情况下,最多90%的预测值落入此区间。并且两者越接近,使用的预测模型越可靠。
为了便于比较,这里仍然设置了七组消融实验,他们分别是:
(1)消融实验-Ⅰ:采用基于RNN的基本预测单元,其他设定与BA-PML一致;
(2)消融实验--Ⅱ:采用基于LSTM的基本预测单元,其他设定与BA-PML一致;
(3)消融实验--Ⅲ:采用基于Just Another NETwork的基本预测单元,其他设定与BA-PML一致;
(4)消融实验--Ⅳ:采用隐式预测不确定度量化方法(Monte Carlo dropout,MCdropout),其他设定与BA-PML一致;
(5)消融实验--Ⅴ:采用基于RNN的基本预测单元,MC dropout的隐式预测不确定度量化方法,其他设定与BA-PML一致;
(6)消融实验--Ⅵ:采用基于LSTM的基本预测单元,MC dropout的隐式预测不确定度量化方法,其他设定与BA-PML一致;
(7)消融实验--Ⅶ:采用基于JANET的基本预测单元,MC dropout的隐式预测不确定度量化方法,其他设定与BA-PML一致;
图10展示了两组验证案例的校准曲线,不难观测到贝叶斯的反向传播(Bayes bybackprop)方法比隐式方法(MC dropout)具有更好的校准性能,后者严重低估了置信区间,而本发明提出的BA-PML表现最优。此外构建的的IPP预测单元可以可靠生成接近理想状态的区间估计,确保了有限数据下预测结果的可信度,这对于高端设备的运维决策至关重要。
Claims (10)
1.一种基于概率化元学习模型的旋转机械寿命预测方法,其特征在于,包括以下步骤:
(1)获取不同工况的旋转机械的振动信号,并进行预处理;
(2)对预处理后的振动信号进行衰退特征提取,形成衰退特征矩阵,衰退特征矩阵经无监督多源域自适应处理得到寿命指标;
(3)对不同工况的寿命指标分别进行训练数据、测试数据的划分,并将训练数据、测试数据分别划分为若干子集,每个子集划分为支撑集、查询集;
(4)对编码-解码预测模型进行概率化重建,利用变分推理结合贝叶斯的反向传播方法学习编码-解码预测模型的参数的后验分布,构建概率化编码-解码预测模型;
(5)将概率化编码-解码预测模型嵌入元学习场景训练中,将训练数据中每一子集的支撑集输入概率化编码-解码预测模型并参与内循环训练,对各子集内循环训练下的模型参数进行二次梯度下降更新,其中二次梯度下降更新通过测试数据的支撑集完成跨子任务间的外循环训练,最终得到任务间元参数,生成通用概率化元学习预测模型;
(6)对所述的通用概率化元学习预测模型进行模型微调实现跨工况预测,具体通过学习训练数据的查询集与通用概率化元学习预测模型梯度反向传播更新机制生成贝叶斯近似的概率化元学习预测模型;
(7)通过概率化元学习预测模型进行旋转机械寿命预测得到预测值的概率分布。
2.根据权利要求1所述的旋转机械寿命预测方法,其特征在于,所述步骤(1)中通过三轴加速度计获得不同工况下多通道的旋转机械振动信号,对振动信号进行预处理具体为:通过频域降噪去除所述振动信号中的高频成分,并基于动态滑动窗平移法剔除所述振动信号中的离群点。
3.根据权利要求2所述的旋转机械寿命预测方法,其特征在于,所述步骤(2)中对每一通道预处理后的振动信号分别提取时域衰退特征、频域衰退特征以及稀疏域衰退特征。
4.根据权利要求3所述的旋转机械寿命预测方法,其特征在于,所述时域衰退特征的统计学参数包括:平均值、标准差、平方根振幅、绝对平均值、偏度、峰度、方差、最大值、最小值、峰均值、均方根、波形指数、峰值指数、脉冲指数、裕度指数、偏度指数、峰度指数;
频域衰退特征的统计学参数包括:振动能量、频谱的集中和离散程度、主频带的位置变化;
稀疏域衰退特征的统计学参数包括:谱峭度、谱基尼指数、谱负熵、谱平滑指数。
5.根据权利要求4所述的旋转机械寿命预测方法,其特征在于,所述步骤(3)中每个子集按照时间先后顺序,将前k%的数据划分为支撑集,后1-k%的数据划分为查询集。
6.根据权利要求5所述的旋转机械寿命预测方法,其特征在于,所述步骤(4)中利用变分推理结合贝叶斯的反向传播方法学习编码-解码预测模型的参数的后验分布,具体为:找到变分推理中合适的参数η为d维实数集合,并最小化变分分布qη(Φ)与真实后验分布/>的Kullback-Leibler距离;η的后验分布被假设为均值为/>方差为/>的高斯分布/>其中d为编码-解码预测参数的维度,通过损失函数/>最小化给定序列{y1:T x1:T}长度T的变分自由能,如下式所示:
其中,为变分分布qη(Φ)的期望值,P(y1:T|η,x1:T)代表对数似然,P(Φ)为编码-解码预测模型参数的先验分布;
将上式中最小化变分自由能的损失转变为最大化logP(y1:T|η,x1:T)的对数似然加上Kullback-Leibler散度的形式,具体如下式所示:
其中,KL[qη(Φ)|P(Φ)]为变分分布qη(Φ)与先验分布P(Φ)的Kullback-Leibler距离;
此外通过时间截断反向传播技术来处理长序列数据并减少计算梯度的方差;因此上式可以进一步转换为:
其中表示为批量大小与截断序列分别为b和c情况下的变分参数η的损失函数,b和c为批量大小与截断序列,B与C代表批量大小与截断序列的总数。
参数μ和σ的更新公式为:
其中,表示梯度,/>其被用来重参数化η=μ+σ∈;
以及/>为参数η,μ以及σ各自所计算的梯度;β为学习率。
7.根据权利要求6所述的旋转机械寿命预测方法,其特征在于,变分分布与真实后验分布间的距离的损失函数构建:
其中,为预测真实值,/>为预测模型估计值,/>为训练数据中参与第i个子任务/>训练的支撑集;/>表示在第i个子任务/>内的待训练参数;λ为场景训练时对应的损失函数/>的惩罚系数,具体为给定序列{y1:Tx1:T}长度T的倒数。
8.根据权利要求7所述的旋转机械寿命预测方法,其特征在于,
内循环训练过程为:
其中,θ为概率化元学习模型参数,α为学习率,为计算的损失函数。
外循环训练通过测试数据的支撑集聚合所有M个子任务内的更新的待训练参数/>并最小化损失函数结合梯度反向更新机制得到任务间元参数Θ*:
9.根据权利要求8所述的旋转机械寿命预测方法,其特征在于,基于梯度下降的模型微调策略实现对未知标签数据集的迁移预测,具体下式所示:
其中,Θ为概率化元学习模型的元参数,为梯度求解算子,γ为微调阶段学习率,Θ*为内外循环训练完毕后的元参数,/>则为经适配微调后属于服从特定子任务分布的模型参数。
10.根据权利要求8所述的旋转机械寿命预测方法,其特征在于,所述步骤(7)中通过概率化元学习预测模型进行旋转机械寿命预测,具体为预测值的概率分布可以由下式推导:
其中,未知测试样本的输入特征值,/>代表第zth个预测模型参数,l表示似然函数,/>表示为第zth个适配至特定域/>的概率化元学习预测模型,Z表示从最优η*的变分分布/>中采样的总个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310725270.8A CN116680554B (zh) | 2023-06-19 | 2023-06-19 | 一种基于概率化元学习模型的旋转机械寿命预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310725270.8A CN116680554B (zh) | 2023-06-19 | 2023-06-19 | 一种基于概率化元学习模型的旋转机械寿命预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116680554A true CN116680554A (zh) | 2023-09-01 |
CN116680554B CN116680554B (zh) | 2024-04-19 |
Family
ID=87780840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310725270.8A Active CN116680554B (zh) | 2023-06-19 | 2023-06-19 | 一种基于概率化元学习模型的旋转机械寿命预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116680554B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110942101A (zh) * | 2019-11-29 | 2020-03-31 | 湖南科技大学 | 基于深度生成式对抗网络的滚动轴承剩余寿命预测方法 |
CN111695209A (zh) * | 2020-05-13 | 2020-09-22 | 东南大学 | 元深度学习驱动的旋转机械小样本健康评估方法 |
CN112765890A (zh) * | 2021-01-26 | 2021-05-07 | 西安电子科技大学 | 基于动态域适应网络的多工况旋转机械剩余寿命预测方法 |
CN113469219A (zh) * | 2021-06-08 | 2021-10-01 | 中国地质大学(武汉) | 基于元迁移学习的复杂工况下的旋转机械故障诊断方法 |
CN113705869A (zh) * | 2021-08-17 | 2021-11-26 | 东南大学 | 无监督元学习网络的机电设备少样本退化趋势预测方法 |
CN114844545A (zh) * | 2022-05-05 | 2022-08-02 | 东南大学 | 基于sub6GHz信道以及部分毫米波导频的通信波束选择方法 |
CN116204774A (zh) * | 2022-12-14 | 2023-06-02 | 中国航空工业集团公司金城南京机电液压工程研究中心 | 一种基于分层元学习的刀具磨损稳定预测方法 |
-
2023
- 2023-06-19 CN CN202310725270.8A patent/CN116680554B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110942101A (zh) * | 2019-11-29 | 2020-03-31 | 湖南科技大学 | 基于深度生成式对抗网络的滚动轴承剩余寿命预测方法 |
CN111695209A (zh) * | 2020-05-13 | 2020-09-22 | 东南大学 | 元深度学习驱动的旋转机械小样本健康评估方法 |
CN112765890A (zh) * | 2021-01-26 | 2021-05-07 | 西安电子科技大学 | 基于动态域适应网络的多工况旋转机械剩余寿命预测方法 |
CN113469219A (zh) * | 2021-06-08 | 2021-10-01 | 中国地质大学(武汉) | 基于元迁移学习的复杂工况下的旋转机械故障诊断方法 |
CN113705869A (zh) * | 2021-08-17 | 2021-11-26 | 东南大学 | 无监督元学习网络的机电设备少样本退化趋势预测方法 |
CN114844545A (zh) * | 2022-05-05 | 2022-08-02 | 东南大学 | 基于sub6GHz信道以及部分毫米波导频的通信波束选择方法 |
CN116204774A (zh) * | 2022-12-14 | 2023-06-02 | 中国航空工业集团公司金城南京机电液压工程研究中心 | 一种基于分层元学习的刀具磨损稳定预测方法 |
Non-Patent Citations (1)
Title |
---|
MEIRE FORTUNATO: "《BAYESIAN RECURRENT NEURAL NETWORKS》", ARXIV, pages 69 - 14 * |
Also Published As
Publication number | Publication date |
---|---|
CN116680554B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Self-attention ConvLSTM and its application in RUL prediction of rolling bearings | |
Kumar et al. | Novel convolutional neural network (NCNN) for the diagnosis of bearing defects in rotary machinery | |
Zhang et al. | A fault diagnosis method for wind turbines gearbox based on adaptive loss weighted meta-ResNet under noisy labels | |
Wang et al. | A deep learning method for bearing fault diagnosis based on time-frequency image | |
Haidong et al. | Intelligent fault diagnosis of rolling bearing using deep wavelet auto-encoder with extreme learning machine | |
Jamil et al. | A deep boosted transfer learning method for wind turbine gearbox fault detection | |
CN108985335B (zh) | 核反应堆包壳材料辐照肿胀的集成学习预测方法 | |
Zhou et al. | Automated model generation for machinery fault diagnosis based on reinforcement learning and neural architecture search | |
Zhang et al. | Intelligent machine fault diagnosis using convolutional neural networks and transfer learning | |
Zhou et al. | Differentiable architecture search for aeroengine bevel gear fault diagnosis | |
Li et al. | Intelligent fault diagnosis for bearing dataset using adversarial transfer learning based on stacked auto-encoder | |
Meng et al. | A novel convolution network based on temporal attention fusion mechanism for remaining useful life prediction of rolling bearings | |
Saberi et al. | Lightgbm-based fault diagnosis of rotating machinery under changing working conditions using modified recursive feature elimination | |
Li et al. | Neural architecture search for fault diagnosis | |
Wei et al. | WSAFormer-DFFN: A model for rotating machinery fault diagnosis using 1D window-based multi-head self-attention and deep feature fusion network | |
CN113504768B (zh) | 面向装配质量预测的高精密产品数字孪生可计算性方法 | |
CN114861349A (zh) | 一种基于模型迁移和维纳过程的滚动轴承rul预测方法 | |
Xu et al. | Intelligent fault diagnosis methodology under varying operating conditions using multi-layer domain adversarial learning strategy | |
CN116680554B (zh) | 一种基于概率化元学习模型的旋转机械寿命预测方法 | |
He et al. | A hybrid matching network for fault diagnosis under different working conditions with limited data | |
CN113505879B (zh) | 一种基于多注意力特征记忆模型的预测方法和装置 | |
CN114925723A (zh) | 采用编码器和解码器的滚动轴承剩余使用寿命预测方法 | |
CN114298408A (zh) | 一种基于ceemd-lstm-mlr的短期电力负荷预测方法 | |
Wang et al. | Intelligent Diagnosis of Gearbox Based on Spatial Attention Convolutional Neural Network | |
Wei et al. | Few-shot bearing fault diagnosis using GAVMD–PWVD time–frequency image based on meta-transfer learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |