一种基于多变量关联数据的设备剩余寿命预测方法
技术领域
本发明属于预测与健康管理技术领域,具体涉及一种基于多变量关联数据的设备剩余寿命预测方法。
背景技术
预测与健康管理技术是一种对产品或系统在实际应用条件下进行可靠性评估的方法,可以大大提高系统设备的可靠性和安全性,还能降低复杂系统设备的维护费用。当建立一个完整的预测与健康管理系统时,估计系统目前状态以及预测系统未来状态的能力,对之后的视情维修决策定量化、精细化有很大影响。针对具体设备来说,预测设备的未来状态,即为对设备剩余寿命的预测。因此,剩余寿命(Remaining Useful Life,RUL)预测技术是设备故障预测与健康管理技术中一项核心问题。
工业系统正朝着复杂化的方向发展,仅仅考虑单一变量对系统剩余寿命的影响存在一定的局限性,多种监测变量均和退化过程有关,全面考虑多种关联数据与剩余寿命之间的关系将能够得到更加准确的预测结果。面向多变量关联数据的剩余寿命预测,首先,分析设备状态监测数据与剩余寿命之间的相关性;然后对具有相关性的状态监测数据选用主成分分析算法进行降维处理;并采用循环神经网络的改进算法—长短时记忆网络寻找降维处理后的序列和剩余寿命之间的映射关系,从而得到剩余寿命预测模型;最后当给预测模型中输入新的状态监测数据将能够得到对应的剩余寿命。
发明内容
本发明的目的是提供一种基于多变量关联数据的设备剩余寿命预测方法,解决了现有技术中存在的基于多传感器关联数据的退化模型建模难度大、模型复杂、参数辨识困难的问题。
本发明所采用的技术方案是,基于多变量关联数据的设备剩余寿命预测方法,具体按照以下步骤实施:
步骤1、分析设备状态监测数据与剩余寿命之间的相关性;
步骤2、对具有相关性的状态监测数据选用主成分分析算法进行降维处理;
步骤3、采用长短时记忆网络搭建剩余寿命预测模型并进行剩余寿命预测。
本发明的特点还在于,
步骤1具体为:
步骤1.1、采集设备的状态监测量和对应的剩余寿命,假设设备有n个状态监测量,共监测t个时刻的状态特征,则状态监测量X表示为:
X={x1,x2,...,xn}
其中,xi=[xi1,xi2,...,xit]T,i=1,2,....n,即状态监测量X可以表示为:
设备的状态监测量对应的剩余寿命Y表示为:
Y=[y1,y2,...,yt]T;
其中,yj表示j时刻的设备剩余寿命,j=1,2,...,t;
步骤1.2、判断多种监测量X={x1,x2,...,xn}和剩余寿命Y=[y1,y2,...,yt]T之间的相关性,采用计算Spearman系数的方法判断相似性,相关系数ρ计算公式为:
其中,x
i为第i个状态监测序列,
为状态监测序列x
i的均值,Y为与x
i相对应的剩余寿命,
为时间序列Y的均值;
步骤1.3、选取出具有相关性的监测量:当相关系数越接近1或者-1,状态监测量和剩余寿命之间相关性越强;相关系数越接近0,状态监测量和剩余寿命之间相关性越弱,据此选取和剩余寿命具有相关性的状态监测量。
步骤2具体为:
步骤2.2、计算监测数据的相关系数矩阵,R样本相关系数矩阵表示各个指标之间的相关性,该系数矩阵是对称矩阵,相关系数矩阵表示如下:
其中,rnn为监测数据X中第n列与第n列的相关系数,其他的以此类推;
步骤2.3、计算特征值λi和特征向量;通过特征方程|R-λE|=0求解特征值λi,i=1,2,...,n,将特征根按从小到大排列λ1≥λ2≥...≥λn,求出相应的特征向量Li=(Li1,Li2,...,Lin)T,其中Lin表示特征向量中第n个元素的值,其他的以此类推;
步骤2.4、求贡献率和累积贡献率,第k个主成分的贡献率为
(k∈1,2,...,n),累积贡献率为
提取累积贡献率E≥85%的特征值λ1,λ2,...,λm(m<n);
步骤2.5、计算成分载荷矩阵:成分载荷矩阵为各个指标在每个主成分中所占的比例;
步骤2.6、计算主成分矩阵:
设zi为综合指标,Fij为载荷因子,Xi为指标变量,则:
zi=fi1X1+fi1X2+...+fimXm,i=1,2,...,m
步骤2.7、计算主成分得分,并对指标体系进行评价。
步骤3具体为:
步骤3.1、长短时记忆网络结构中共有三个门,分别为输入门、遗忘门和输出门:
遗忘门公式为:
f(t)=σ(Wfx(t)+Wfh(t-1)+bf)
输入门公式为:
i(t)=σ(Wix(t)+Wih(t-1)+bi)
g(t)=tanh(Wgx(t)+Wgh(t-1)+bg)
s(t)=gt×i(t)+s(t-1)×f(t)
输出门公式为:
o(t)=σ(Wox(t)+Woh(t-1)+bo)
h(t)=tanh(s(t))×o(t)
其中,x(t)是t时刻的输入层,即采用主成分分析法进行降维处理后的数据序列;h(t-1)是t-1时刻的隐层;Wf,Wi,Wo分别为遗忘门、输入门、输出门的权重矩阵,bf,bi,bo分别是遗忘门、输入门、输出门的偏置项;σ和tanh均为激活函数,其中,σ为sigmoid函数,tanh为双曲正切函数;
步骤3.2、采取小批量梯度下降算法MBGD对长短时记忆网络进行训练:首先采用随机初始化权重和偏置的方式进行网络初始化,然后运用小批量梯度下降算法进行参数更新,即在每次更新参数时只使用一部分样本进行,给定最小批量m个训练样本执行梯度更新,从而获得更加准确的剩余寿命预测模型;
步骤3.3、将新的状态监测值X'={x1',x2',...,xn'},输入到剩余寿命预测模型中,从而得到对应的剩余寿命,其中,xi'=[xi(t+1)',xi(t+2)',...,xi(t+q)']T,i=1,2,....n,q为预测长度。
本发明的有益效果是,基于多变量关联数据的设备剩余寿命预测方法,全面考虑监测量对剩余寿命的影响能够更加准确地估计出剩余寿命。长短时记忆网络作为循环神经网络的一种改进算法对于长序列的预测问题具有很好的效果,为了降低网络的复杂度,防止网络出现过拟合问题,对监测数据预先进行相关性分析以及降维处理,从而得到更加准确地预测结果。
附图说明
图1是本发明基于多变量关联数据的设备剩余寿命预测方法的总体流程图;
图2是本发明基于多变量关联数据的设备剩余寿命预测方法中相关性分析流程图;
图3是本发明基于多变量关联数据的设备剩余寿命预测方法中降维方法主成分分析算法流程图。
图4是本发明基于多变量关联数据的设备剩余寿命预测方法中长短时记忆网络原理图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明基于多变量关联数据的设备剩余寿命预测方法,流程图如图1所示,具体按照以下步骤实施:
步骤1、分析设备状态监测数据与剩余寿命之间的相关性,具体为:
步骤1.1、采集设备的状态监测量和对应的剩余寿命,假设设备有n个状态监测量,共监测t个时刻的状态特征,则状态监测量X表示为:
X={x1,x2,...,xn}
其中,xi=[xi1,xi2,...,xit]T,i=1,2,....n,即状态监测量X可以表示为:
设备的状态监测量对应的剩余寿命Y表示为:
Y=[y1,y2,...,yt]T;
其中,yj表示j时刻的设备剩余寿命,j=1,2,...,t;
步骤1.2、判断多种监测量X={x1,x2,...,xn}和剩余寿命Y=[y1,y2,...,yt]T之间的相关性,采用计算Spearman系数的方法判断相似性,相关系数ρ计算公式为:
其中,x
i为第i个状态监测序列,
为状态监测序列x
i的均值,Y为与x
i相对应的剩余寿命,
为时间序列Y的均值;
步骤1.3、选取出具有相关性的监测量:当相关系数越接近1或者-1,状态监测量和剩余寿命之间相关性越强;相关系数越接近0,状态监测量和剩余寿命之间相关性越弱,据此选取和剩余寿命具有相关性的状态监测量。
步骤2、对具有相关性的状态监测数据选用主成分分析算法进行降维处理,具体为:
如图2、图3所示,步骤2.2、计算监测数据的相关系数矩阵,R样本相关系数矩阵表示各个指标之间的相关性,该系数矩阵是对称矩阵,相关系数矩阵表示如下:
其中,rnn为监测数据X中第n列与第n列的相关系数,其他的以此类推;
步骤2.3、计算特征值λi和特征向量;通过特征方程|R-λE|=0求解特征值λi,i=1,2,...,n,将特征根按从小到大排列λ1≥λ2≥...≥λn,求出相应的特征向量Li=(Li1,Li2,...,Lin)T,其中Lin表示特征向量中第n个元素的值,其他的以此类推;
步骤2.4、求贡献率和累积贡献率,第k个主成分的贡献率为
(k∈1,2,...,n),累积贡献率为
提取累积贡献率E≥85%的特征值λ1,λ2,...,λm(m<n);
步骤2.5、计算成分载荷矩阵:成分载荷矩阵为各个指标在每个主成分中所占的比例;
步骤2.6、计算主成分矩阵:
设zi为综合指标,Fij为载荷因子,Xi为指标变量,则:
zi=fi1X1+fi1X2+...+fimXm,i=1,2,...,m
步骤2.7、计算主成分得分,并对指标体系进行评价。
步骤3、采用长短时记忆网络搭建剩余寿命预测模型并进行剩余寿命预测,原理图如图4所示,具体为:
步骤3.1、长短时记忆网络结构中共有三个门,分别为输入门、遗忘门和输出门:
遗忘门公式为:
f(t)=σ(Wfx(t)+Wfh(t-1)+bf)
输入门公式为:
i(t)=σ(Wix(t)+Wih(t-1)+bi)
g(t)=tanh(Wgx(t)+Wgh(t-1)+bg)
s(t)=gt×i(t)+s(t-1)×f(t)
输出门公式为:
o(t)=σ(Wox(t)+Woh(t-1)+bo)
h(t)=tanh(s(t))×o(t)
其中,x(t)是t时刻的输入层,即采用主成分分析法进行降维处理后的数据序列;h(t-1)是t-1时刻的隐层;Wf,Wi,Wo分别为遗忘门、输入门、输出门的权重矩阵,bf,bi,bo分别是遗忘门、输入门、输出门的偏置项;σ和tanh均为激活函数,其中,σ为sigmoid函数,tanh为双曲正切函数;
步骤3.2、采取小批量梯度下降算法MBGD对长短时记忆网络进行训练:首先采用随机初始化权重和偏置的方式进行网络初始化,然后运用小批量梯度下降算法进行参数更新,即在每次更新参数时只使用一部分样本进行,给定最小批量m个训练样本执行梯度更新,与批量梯度下降算法(BGD)和随机梯度下降算法(SGD)相比,MBGD通过使用高度优化的矩阵来同时计算m个样本的梯度,有利于提高深度学习的效率,并且降低了梯度更新的方差,可以获得更稳定的收敛,从而获得更加准确的剩余寿命预测模型;
步骤3.3、将新的状态监测值X'={x1',x2',...,xn'},输入到剩余寿命预测模型中,从而得到对应的剩余寿命,其中,xi'=[xi(t+1)',xi(t+2)',...,xi(t+q)']T,i=1,2,....n,q为预测长度。
复杂的工业设备具有多种传感器的监测数据,全面考虑其与剩余寿命之间的关系,能够提高预测精度。故本发明采用相关性分析以及降维算法对多变量关联数据进行处理,然后采用深度学习算法——长短时记忆网络搭建剩余寿命预测模型,进而对设备剩余寿命进行预测。将传统数据处理算法和深度学习算法相结合进行剩余寿命预测能够进一步提高预测精度。