发明内容
本发明为了解决实际中轴承带标签振动数据获取困难,目标域样本不含标签,健康指标难以构建,结果精准度低的问题,提供一种基于PC-TCN和迁移学习的轴承寿命预测方法。
本发明采取以下技术方案:一种基于PC-TCN和迁移学习的轴承寿命预测方法,包括以下步骤,S1~获取某种工况下的全寿命周期的轴承振动信号,将它定为源域,将同一工况或者不同工况的非全寿命周期的轴承振动信号定为目标域;将轴承的原始X轴振动信号和Y轴振动信号进行融合,融合归一化处理;S2~将源域全寿命周期的振动信号,以剩余寿命百分比的形式,标记0到1之内的健康状态标签,然后将源域训练数据输入模型;S3~输入源域训练数据经过CNN提取振动信号特征后,将时间序列数据输出,然后TCN模型对接收的时间序列数据进行高层特征的信息抽象,对TCN输出时域信号进行最大值池化,并进入全连接层;S4~设置PSO算法的参数,对CNN和TCN的参数进行寻优,得到最优参数,用最优参数训练出PC-TCN模型,对源域测试数据进行状态识别和寿命预测;S5~将目标域无标签振动信号输入到训练好的PC-TCN模型,进行自适应衍生成相应的特殊标注标签,使用源域有标签训练数据和目标域衍生标签训练数据参数初始化并重新训练,即迁移训练,经过多次迭代寻优,建立迁移模型,实现无监督条件下的轴承状态识别;S6~将目标域测试数据输入迁移模型,进行目标域轴承状态识别和寿命预测。
步骤S1中,将X轴和Y轴振动信号堆叠在一起,将信号进行归一化处理。其运算表示为:
式中a
i为第i个原数据,x
i为第i个新数据,
为原数据的平均值,n为数据的总数量。
步骤S3中包括以下步骤,
S301~源域训练数据输入CNN,设定CNN层数、滤波器数量、卷积尺寸大小,将归一化后的数据作为CNN的输入,运用CNN中的卷积层、池化层遍历整个输入数据序列,以振动信号为局部信息挖取深层特征;
具体卷积层运算表示为:
式中:x为输入的数据,
为第l层的第i个卷积核的第j′个权值,
为第l层中第j个被卷积的局部区域r,*代表卷积运算,W为卷积核宽度;
池化层:采用最大值池化进行降采样操作来最小化网络参数,并获取深层特征,最大值池化的数学描述表示为:
式中:yl(i,t)为第l层第i个特征映射的第t个神经元输出的激活值,V为池化区域宽度,Ol(i,j)为池化层输出值。
S302~使用改进的TCN模型对接收的时间序列数据进行高层特征的信息抽象;
改进的TCN网络特征为:
1)采用参数化线性修正单元激活函数LeakyReLU,LeakyReLU给所有负值赋予一个非零斜率;
数学表达式:l=max(0,o)+leak×min(0,o)
Leak是一个很小的常数,这样保留了一些负轴的值,使得负轴的信息不会全部丢失;
2)TCN中扩展卷积运算表示为:
式中:b(ot)为扩张卷积计算过程中t时刻输入ot对应的网络输出;f为过滤器;f(i)为对第i个输入过滤操作;u为过滤器窗口大小;i∈(0,1,...,u-1);d为扩张系数。
3)改进的TCN引入注意力机制,其运算表示为:
pr=Relu(W[bt;ct])
式中:W为可训练参数;sofmax、Relu均为激活函数;T为转置;在对轴承进行寿命预测时,当前t刻输出向量为bt,t时刻之前的t-1个TCN的输出向量为M=[b0,b1,...,bt-2,bt-1],通过bt和M之间的关系得到注意力分数向量rt,根据rt得到向量ct,将ct和bt结合用于轴承的寿命预测,pr为预测概率。
4)改进TCN引入软阈值,映射保留正或负特征,并将接近零的特征设置为零。
步骤S4采取以下方法,
S401~初始化PSO的各种参数,其中包括:种群规模m;学习因子c1、c2以及惯性权重ω的初始值和最终值;最大速度Vmax;最大迭代次数kmax;待优化参数的搜索阈值;粒子的初始位置和速度,更新每个粒子的速度与位置,公式为:
viD(k+1)=t×viD(k)+c1×r1(piD(k)-xiD(k))+c2×r2(pgD(k)-xiD(k))
xiD(k+1)=xiD(k)+viD(k+1)
其中t为惯性权重,D代表搜索空间的维度,这里为2,c1是每个粒子的个体学习因子,c2是每个粒子的社会学习因子,r1和r2为0到1之间的随机数,pgD(k)为整个种群前K次中的最优位置,piD(k)为第i个粒子前K次中的最优位置,xiD(k)为第i个粒子第k次的位置,viD(k+1)为第i个粒子第k次的速度。
S402~计算每个粒子的适应度,将各粒子的当前适应度与其经过的最优位置的适应度值作比较,若当前适应度较好,则将该粒子当前位置作为其自身最优位置,得到CNN和TCN最优参数。
S403~用最优参数训练出PC-TCN模型,对源域测试数据进行寿命预测。
步骤S5采取以下方法,S501~获取目标域未标注的振动信号数据,输入模型进行自适应衍生成相应的特殊标注标签;S502~使用源域有标签训练数据和目标域衍生标签训练数据进行再次训练,训练出迁移模型。
与现有技术相比,本发明通过CNN挑取振动信号中的时间序列,减少了提取特征值的时间,增加特征提取的准确率;在原有TCN的基础之上,引入改进后的一维卷积神经网络和注意力机制,并且通过改进激活函数等方式进一步优化神经网络模型性能。使用PSO自动调整超参数使得经过训练好的模型具有很好的泛化能力,而且灵活度更高,在不改变模型的情况下适用各类不同工况的有无标签轴承的状态识别和寿命预测。解决了同一工况或不同工况轴承间的状态识别和寿命预测问题。
具体实施方式
为了更了解本发明的技术内容。下面结合附图对本申请进行详细说明。
如图1所示为基于PC-TCN和迁移学习的轴承寿命预测方法流程图,主要包括以下几个部分:
S1:获取某种工况下的全寿命周期的轴承振动信号,将它定为源域,将同一工况或者不同工况的非全寿命周期的轴承振动信号定为目标域;将轴承的原始X轴振动信号和Y轴振动信号进行融合,融合归一化处理。其运算表示为:
式中a
i为第i个原数据,x
i为第i个新数据,
为原数据的平均值,n为数据的总数量。其中原数据即X轴和Y轴振动信号堆叠后的数据。
S2:将源域全寿命周期的振动信号,以剩余寿命百分比的形式,标记0到1之内的健康状态标签,然后将源域训练数据输入模型。
S3:输入数据经过CNN提取特征后,将时间序列数据导出,然后TCN模型对接收的时间序列数据进行高层特征的信息抽象,对TCN输出时域信号进行平均值池化,并进入全连接层。
具体过程如下:S301~源域训练数据输入CNN,设定CNN层数、滤波器数量、卷积尺寸大小,将归一化后的数据作为CNN的输入,运用CNN中的卷积层、池化层遍历整个输入数据序列,以振动信号为局部信息挖取深层特征。
具体卷积层运算表示为:
式中:x为输入的数据,
为第l层的第i个卷积核的第j′个权值,
为第l层中第j个被卷积的局部区域r,*代表卷积运算,W为卷积核宽度。
池化层:采用最大值池化进行降采样操作来最小化网络参数,并获取深层特征,最大值池化的数学描述表示为:
式中:yl(i,t)为第l层第i个特征映射的第t个神经元输出的激活值,V为池化区域宽度,ol(i,j)为池化层输出值。
S302~使用改进的TCN模型对接收的时间序列数据进行高层特征的信息抽象。改进TCN的构架元素有因果卷积、扩展卷积、残差连接层、激活函数、具有注意力机制的软阈分割。改进TCN的流程图如图3所示。
因果卷积,TCN基于两个原则:网络生成和输入同样长度的输出,以及未来到过去不会泄露的事实。为了实现第一点,TCN使用1D全卷积网络(FCN)架构,其中每个隐藏层的长度与输入层相同,长度为零填充(内核大小-1)被添加以保持后续层与先前层的长度相同。为了实现第二点,TCN使用因果卷积,其中时间t为输出仅与来自前一层中的时间t和更早的元素卷积。数学描述表示为:
式中:P(ot)为预测的概率;T为总时刻;П为求积操作。
改进的TCN网络特征为:
扩张卷积与传统卷积的不同在于扩张卷积拥有更大的感受野。扩张卷积结构示意图如图2所示。扩张卷积中的过滤器通过跳过部分输入值来获取距离当前输入更远的信息,并且一般以2的指数(1,2,4,8,…,2m)作为扩张率,因此随着网络层数的增加,网络的感受野东方第三个以2的指数方增大,从而保证了网络可以记忆更多历史信息,同时避免了网络太深的不足。
TCN中扩展卷积运算表示为:
式中:b(ot)为扩张卷积计算过程中t时刻输入ot对应的网络输出;f为过滤器;f(i)为对第i个输入过滤操作;u为过滤器窗口大小;i∈(0,1,...,u-1);d为扩张系数。
本质上,残差学习是一个过程,而不是直接使用堆叠的非线性层来适应期望的底层映射h(x),使堆叠的非线性层适应残差映射f(x),其中f(x):=h(x)-x,随后,原来期望的映射h(x)被重新转换成f(x)+x,在残差学习中引入了绕过残差层的标识跳过连接,允许数据x直接流向任何后续层。批量归一化在深度网络的训练中是必不可少的。Bn使用小批量的平均值和标准差值调整网络的中间输出,提高中间层输出的稳定性,同时最大限度地减少过度拟合。
激活函数采用参数化线性修正单元激活函数LeakyReLU,LeakyReLU给所有负值赋予一个非零斜率;数学表达式:l=max(0,o)+leak×min(0,o),Leak是一个很小的常数,这样保留了一些负轴的值,使得负轴的信息不会全部丢失。
为了利用过去时刻TCN输出信息,文本加入注意力机制,改进的TCN引入注意力机制,其运算表示为:
pr=Relu(W[bt;ct])
式中:W为可训练参数;sofmax、Relu均为激活函数;T为转置。
在对轴承进行寿命预测时,当前t刻输出向量为bt,t时刻之前的t-1个TCN的输出向量为M=[b0,b1,...,bt-2,bt-1],通过bt和M之间的关系得到注意力分数向量rt,根据rt得到向量ct,将ct和bt结合用于轴承的寿命预测,pr为预测概率。
软阈值的基本含义是设计一个非线性映射,该映射保留正或负特征,并将接近零的特征设置为零。结果,所有有用的信息都得到了很好的保留,并且消除了与噪声相关的特征。
阈值自学习经过一系列卷积运算后,网络结构的原始输入的维数发生变化。假设当前输入张量为α,有N列(即N个特征映射),在对全局平均池层中的列进行平均后,α成为形状为1×N的行向量,表示为β。然后β继续流过其余批量归一化层和完全连接层,并获得形状不变向量χ。将β和χ元素相乘,得到最终阈值向量γ=[τ1,τ2,...,τN]。通过这个过程,每个特征映射都有自己的阈值,这是注意力机制的结果。
改进TCN引入软阈值,映射保留正或负特征,并将接近零的特征设置为零。
S400:设置PSO算法的参数,对CNN和TCN的参数进行寻优,得到最优参数。用最优参数训练出PC-TCN模型,对源域测试数据进行状态识别和寿命预测。
具体步骤为:
S401~初始化PSO的各种参数,其中包括:种群规模m;学习因子c1、c2以及惯性权重ω的初始值和最终值;最大速度Vmax;最大迭代次数kmax;待优化参数的搜索阈值;粒子的初始位置和速度,更新每个粒子的速度与位置,公式为:
viD(k+1)=t×viD(k)+c1×r1(piD(k)-xiD(k))+c2×r2(pgD(k)-xiD(k))
xiD(k+1)=xiD(k)+viD(k+1)
其中t为惯性权重,D代表搜索空间的维度,这里为2,c1是每个粒子的个体学习因子,c2是每个粒子的社会学习因子,r1和r2为0到1之间的随机数,pgD(k)为整个种群前K次中的最优位置,piD(k)为第i个粒子前K次中的最优位置,xiD(k)为第i个粒子第k次的位置,viD(k+1)为第i个粒子第k次的速度。
S402~计算每个粒子的适应度,将各粒子的当前适应度与其经过的最优位置的适应度值作比较,若当前适应度较好,则将该粒子当前位置作为其自身最优位置,得到CNN和TCN最优参数。
S403~用最优参数训练出PC-TCN模型,对源域测试数据进行寿命预测。
S500~将目标域无标签振动信号输入训练好的模型,进行自适应衍生成相应的特殊标注标签,使用源于有标签训练数据和目标域衍生标签训练数据参数初始化并重新训练,即迁移训练,经过多次迭代寻优,建立迁移模型,实现无监督条件下的轴承状态识别。
S501~获取目标域未标注的振动信号数据,输入模型进行自适应衍生成相应的特殊标注标签。
S502~用最优参数训练出PC-TCN模型,对源域测试数据进行寿命预测。
S6:将目标域测试数据输入迁移模型,进行目标域轴承状态识别和寿命预测。迁移模型输出的数据是0-1之间的数字,该数字则是轴承剩余寿命的百分比。
最后可以保存迁移模型,可对在线监测数据进行寿命预测。
应用分析,实验数据:
采用IEEE PHM 2012 Data Challenge轴承数据挑战发布的轴承运行至故障数据集用于本实验研究。数据是在加速老化平台PRONOSTIA上收集的。水平和垂直放置两个加速计,以收集这两个方向的振动信号。抽样率为25.6kHz,记录时间为0.1秒,即每次采集2560个数据点。为了安全起见,当振动数据的振幅超过20g(1g=9.8m/s2)时,停止实验。
实验包括3种工况条件:工况1(1800rpm和4000N),工况2(1650rpm和4200N)和工况3(1500rpm和5000N)。3种工况条件下的试验轴承分别为轴承1_1至轴承1_7共7组,轴承2_1至轴承2_7共7组,轴承3_1至轴承3_3共3组。轴承1_1至轴承1_6振动信号图如图4所示。
预测误差指标使用MAE和RMSE其运算表示为:
式中
是实际RUL和预测RUL在时间步长t(可以视为第t个样本)之间的误差,n是时间步长的总数(即样本数)。
本次实验使用轴承1_1至轴承1_7为源域数据,测试源域数据时,以轴承1_1为测试数据,以工况1其余6个轴承有标签数据为训练数据;以轴承1_2为测试数据,以工况1其余6个轴承有标签数据为训练数据;以此类推。
本次实验使用轴承2_1至轴承2_3为目标域数据,测试目标域数据时,以轴承2_1为测试数据,以轴承2_2和2_3无标签数据和S804源域有标签训练数据为训练数据;以轴承2_2为测试数据,以轴承2_1和2_3无标签数据和S804源域有标签训练数据为训练数据;以此类推。
通过实验数据,进行对比实验,通过对比实验发现,本发明可以提高预测结果的精度。
几种对比实验的模型预测指标值如表1所示
表1PC-TCN对比实验模型预测指标值
表1中选取的对比模型有CNN、TCN、PC-TCN三种模型,表中加粗字体代表效果最好的值。对比可知PC-TCN模型可以有效的提高模型的预测精度。
几种实验的模型对比目标域无标签预测指标值如表2所示
表2迁移PC-TCN对比实验模型预测指标值
由表2可知有标签的PC-TCN预测精度是最高的,但是针对大多数场景只能使用无标签数据迁移PC-TCN的预测精度虽然低于有标签的PC-TCN模型但是仍然高于有标签的CNN和TCN模型,说明迁移PC-TCN可以很好的适用于无标签的轴承寿命预测场景中。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。