CN116663419A

CN116663419A - 一种基于优化的Elman神经网络的无传感器设备故障预测方法

Info

Publication number: CN116663419A
Application number: CN202310652709.9A
Authority: CN
Inventors: 李岩; 宋佩林; 崔振丰; 陆鹏; 王清云; 胡成威; 刘克平
Original assignee: Changchun University of Technology
Current assignee: Changchun University of Technology
Priority date: 2023-06-05
Filing date: 2023-06-05
Publication date: 2023-08-29

Abstract

本发明属于无传感器设备故障预测技术领域，具体的说是一种基于优化的Elman神经网络的无传感器设备故障预测方法。包括：一、根据产线设备的历史故障信息得到设备的故障间隔时间，建立Elman神经网络时间预测的数学模型；二、采用灰狼算法优化建立的Elman神经网络，建立优化的神经网络模型数学模型；三、建立故障间隔时间预测的映射函数，并对数据进行滑动窗口处理，将处理后的数据输入到优化后的网络中，进行网络训练；四、利用训练完成的网络对产线设备的故障间隔时间进行预测，得到最终预测结果。本发明充分发挥各自优势，实现对于产线中所有设备的全面故障预测，提高产线故障预测的准确性和全面性，为实现车间科学管理与制定合理的维护计划提供有力支撑。

Description

一种基于优化的Elman神经网络的无传感器设备故障预测方法

技术领域

本发明属于无传感器设备故障预测技术领域，具体的说是一种基于优化的Elman神经网络的无传感器设备故障预测方法。

背景技术

随着智能制造的不断发展，企业对生产线整体可靠性提出了更高的要求，设备因故障预测缺陷引发生产事故的问题变得格外突出。生产线加装传感器进行故障预测可以帮助企业及时发现潜在故障，预测设备故障时间，从而制定合理的维护计划，进而减少停机时间和维修成本，增强生产线的稳定性和可靠性。在此背景下，传统仅采用单一有传感器设备故障预测的方法存在着一定的局限性。在智能制造的背景下，传感器设备故障预测技术已经成为生产线故障预测的重要手段，但该技术存在着一定的局限性。一方面，传感器的应用范围和安装位置通常受到限制，只能获取部分设备的运行状态信息，对于其他设备可能存在的故障情况无法有效监测。另一方面，传感器的使用也会增加设备的成本和数据复杂性，特别是对于一些老旧设备而言，安装传感器可能需要进行改造和升级，增加了维护成本和数据分析处理的难度。因此，仅采用单一有传感器设备故障预测的方法已难以满足智能制造对于高效、低成本、高质量的生产要求。

为克服这些局限性，无传感器设备故障预测技术的应用显得尤为重要。无传感器设备故障预测技术是指在无传感器设备的情况下，利用机器学习和人工智能算法来整合和分析历史故障数据，预测设备未来一定时间段内可能发生故障的间隔时间。该技术可以应用于不易安装传感器的设备上，并降低设备成本和数据传输和处理的负担，有效解决单一有传感器设备故障预测的方法的局限性。因此，在已有的有传感器设备故障预测基础上增加无传感器设备故障预测，可以更全面地应对复杂多变的生产环境和设备状态，提高整个产线的故障预测精度和生产效率，具有重要的应用意义和实际价值。

发明内容

本发明提供了一种基于优化的Elman神经网络的无传感器设备故障预测方法，在有传感器设备故障预测基础上增加无传感器设备故障预测。充分发挥各自优势，实现对于产线中所有设备的全面故障预测，提高产线故障预测的准确性和全面性，为实现车间科学管理与制定合理的维护计划提供有力支撑，解决了仅使用有传感器设备故障预测存在局限性的问题。

本发明技术方案结合附图说明如下：

一种基于优化的Elman神经网络的无传感器设备故障预测方法，包括以下步骤：

步骤一、根据产线设备的历史故障信息得到设备的故障间隔时间，建立Elman神经网络时间预测的数学模型；

步骤二、采用灰狼算法优化步骤一建立的Elman神经网络，建立优化的神经网络模型数学模型；

步骤三、建立故障间隔时间预测的映射函数，并对数据进行滑动窗口处理，将处理后的数据输入到步骤二优化后的网络中，进行网络训练；

步骤四、利用步骤三训练完成的网络对产线设备的故障间隔时间进行预测，得到最终预测结果。

所述步骤一的具体方法如下：

11)对目标车间的产线设备的历史故障信息所记录的故障时间数据进行分析和处理，得到设备故障间隔时间信息；

12)根据设备故障间隔时间信息建立Elman神经网络时间预测的数学模型；具体如下：

网络的输入层接受外部输入，然后将输入层输入到隐含层；

式中，v_i ^(t)表示输入层输入；A表示输入层；B表示承接层；

在隐含层中，神经元接收到当前时刻的输入和前一时刻的承接层输出，将当前时刻的输入和前一时刻的承接层输出加权求和并通过sigmoid激活函数进行非线性转换，如下所示：

式中，t为神经网络迭代次序；U_k ^(t)为输入层净输入；h_n ^(t)、x_n(t)为隐含层输入和输出；f(*)为隐含层神经元的激活函数；

隐含层的输出作为下一时刻的输入通过承接层反馈到网络中，与当前输入一起计算输出层的输出，如下所示：

C_k ^(t)＝q(U_k ^(t))

训练网络参数过程中Elman网络使用反向传播算法，通过计算输出层和隐含层之间的误差来更新网络权重；设ωⁱ(t)表示网络权重，则权重表示为：

式中，ω¹、ω²分别为输入层到隐含层、承接层到隐含层的连接权值；

由于Elman网络具有反馈结构，因此反向传播算法还需计算和更新每个时刻的误差；随着输入数据的不断增加，自循环的结构把上一次的状态传递给当前输入，一起作为新的输入数据进行当前轮次的训练和学习，一直到输入或者训练结束，最终得到的输出即为最终的预测结果；

P_m ^(t+1)＝∑ω³(t+1)x_n(t+1)

y(t+1)＝g(P_m(t+1))

式中，P_m ^(t)、y(t)为输出层输入和输出；g(*)为输出层神经元的激活函数。

Elman神经网络时间预测的数学模型为：

所述步骤二的具体方法如下：

21)确定神经网络的结构和参数；

Elman神经网络的参数包括权重和偏差；假设神经网络有N个输入节点，M个隐藏节点和K个输出节点，则权重和偏差表示为：

ω¹∈R^(M×N),b¹∈R^(M×1)

ω²∈R^(M×N),b²∈R^(M×1)

ω³∈R^(M×N),b³∈R^(K×1)

式中，b¹、b²、b³分别为输入层到隐含层、承接层到隐含层和隐含层到输出层的偏差；

22)初始化灰狼种群；

灰狼算法的种群由多个灰狼组成；每个灰狼表示一个可能的神经网络；因此，灰狼的位置包括权重和偏差；设X_i,j表示第i只灰狼在第j个维度上的位置，则初始化种群表示为：

X_i,j＝x_min,j+rand()×(x_max,j-x_min,j)

式中，x_min,j和x_max,j分别表示第j个维度上的取值范围的下限和上限；rand()为[0,1]之间的随机数；

23)计算适应度函数；

适应度函数用来计算神经网络的性能；使用均方误差作为适应度函数，假设训练集有n个样本，预测结果为y_i，实际结果为t_i，则均方误差表示为：

24)确定灰狼等级；

灰狼的等级基于适应度函数值的大小；适应度函数值越小，等级越高；按照适应度函数值对灰狼进行排序，并为每个灰狼分配一个等级r_i；

25)确定领袖灰狼；

领袖灰狼是种群中适应度函数值最小的灰狼；假设领袖灰狼的位置为x_α，则将x_α作为种群中的最优解决；

26)确定灰狼个体位置；

根据每个灰狼的等级和距离领袖灰狼的距离更新个体位置；更新后的灰狼位置表示为：

x_i＝x_α-AD×(2rand()-1)+Cx_i

式中，A是缩放因子，D是灰狼之间的距离，C是控制参数，x_i是当前灰狼的位置；

27)更新神经网络参数；

根据新的灰狼位置更新神经网络参数；假设新的权重和偏差为ω′和b′，更新后的表达式为：

ω′＝w+r₁·(x_α-w)+r₂·(x₁-x₂)

b′＝b+r₃·(x_α-b)+r₄·(x₁-x₂)

式中，r₁、r₂、r₃和r₄是均匀分布的随机数；x₁和x₂是两个随机选取的灰狼的位置；

28)重复执行步骤21)-步骤27)，直达达到停止准则，生成了优化的神经网络模型数学模型。

所述步骤三的具体方法如下：

31)将故障间隔时间预测问题转化为时间序列问题，使用过去的故障间隔时间来预测下一次故障时间间隔；假设通过前N期的故障间隔时间来预测下一次故障时间间隔，映射函数表示为：

x_n＝f(x_n-1,x_n-2,…,x_n-N)

32)Elman网络对数据进行滑动窗口处理，将长序列数据拆分成多个小序列数据，抽取x₁～x_n，以(x₁,x₂,…,x_n-1)为自变量，以x_n为目标函数值，构成第一个样本；抽取x₂～x_n+1，以(x₂,x₃,…,x_n)为自变量，以x_n+1为函数值，构成第二个样本，依次类推，最终构成以下训练矩阵：

对于给定的故障间隔时间数据，按6：1的比例划分为训练样本和测试样本；将训练样本输入到网络中进行训练，即可得到训练完成的网络。

所述步骤四的具体方法如下：

将训练样本输入训练完成的优化的Elman神经网络进行预测，得到预测结果；并与原始期望值数据进行误差分析，最终得到网络预测精度。

本发明的有益效果为：

1)本发明针对基于优化的Elman神经网络为无传感器设备故障预测技术提供了一种新的方法，与有传感器设备故障预测技术结合使用可以充分发挥各自优势，实现对于产线中所有设备的全面故障预测，提高产线故障预测的准确性和全面性；

2)本发明解决由于Elman神经网络内部初值和网络参数随机生产，并且连接权重更新中使用传统方法，易导致网络预测精度不高、训练结果陷入局部最优的问题，提高网络的稳定性和泛化能力，进而提高生产线设备故障间隔时间模型的预测精度。可为车间设备预知维护提供有效决策，并减少了传感器设备投入，对于车间科学管理和成本节约具有重要意义。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例的生产线无传感器设备故障预测方法流程图；

图2为本发明实施例中Elman网络结构图；

图3为本发明实施例中优化Elman网络流程框图；

图4为本发明实施例中训练时Elman网络均方误差的变化曲线；

图5为本发明实施例中训练时GWO-Elman网络均方误差的变化曲线；

图6为本发明实施例中Elman神经网络训练样本预测结果示意图；

图7为本发明实施例中GWO-Elman网络训练样本预测结果示意图；

图8为本发明实施例中BP神经网络训练样本预测结果示意图；

图9为本发明实施例中三种方法测试样本预测结果对比示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

参阅图1，一种基于优化Elman神经网络的设备故障间隔时间预测方法根据产线设备的历史故障信息得到设备的故障间隔时间，首先建立Elman神经网络时间预测的数学模型；然后采用灰狼算法优化Elman神经网络，建立优化神经网络模型数学模型,解决由于Elman神经网络内部初值和网络参数随机生产，并且连接权重更新中使用传统方法，易导致网络预测精度不高、训练结果陷入局部最优的问题，提高网络的稳定性和泛化能力，进而提高生产线设备故障间隔时间模型的预测精度。具体方法如下：

参阅图1和图2，步骤一、根据产线设备的历史故障信息得到设备的故障间隔时间，建立Elman神经网络时间预测的数学模型；

具体方法如下：

对目标车间的产线设备的历史故障信息所记录的故障时间数据进行指标一致化处理，解决数据之间不同性质的问题；并对数据进行了滑动窗口处理，将原始数据重塑为多个小序列样本，增加样本数量，得到用于模型预测的故障间隔时间；所述故障间隔时间作为数学模型的训练及预测数据，为数学模型的输入量；

12)根据设备故障间隔时间信息建立Elman神经网络时间预测的数学模型；

网络的输入层接受外部输入，然后将输入层输入到隐含层；

式中，v_i ^(t)表示输入层输入；A表示输入层；B表示承接层；

C_k ^(t)＝q(U_k ^(t))

P_m ^(t+1)＝∑ω³(t+1)x_n(t+1)

y(t+1)＝g(P_m(t+1))

Elman神经网络时间预测的数学模型为：

参阅图3，步骤二、采用灰狼算法优化步骤一建立的Elman神经网络，建立优化的神经网络模型数学模型；

所述步骤二的具体方法如下：

21)确定神经网络的结构和参数；

ω¹∈R^(M×N),b¹∈R^(M×1)

ω²∈R^(M×N),b²∈R^(M×1)

ω³∈R^(M×N),b³∈R^(K×1)

22)初始化灰狼种群；

灰狼算法的种群由多个灰狼组成；每个灰狼表示一个潜在的解决方案，其位置用一组参数表示。本发明中每个灰狼表示一个可能的神经网络。因此，灰狼的位置包括权重和偏差。设X_i,j表示第i只灰狼在第j个维度上的位置，则初始化种群表示为：

X_i,j＝x_min,j+rand()×(x_max,j-x_min,j)

23)计算适应度函数；

适应度函数用于评估每个灰狼的解决方案的质量，在本发明中，适应度函数用来计算神经网络的性能；使用均方误差作为适应度函数，假设训练集有n个样本，预测结果为y_i，实际结果为t_i，则均方误差表示为：

24)确定灰狼等级；

25)确定领袖灰狼；

26)确定灰狼个体位置；

x_i＝x_α-AD×(2rand()-1)+Cx_i

27)更新神经网络参数；

ω′＝w+r₁·(x_α-w)+r₂·(x₁-x₂)

b′＝b+r₃·(x_α-b)+r₄·(x₁-x₂)

所述停止准则为达到设定的收敛精度或达到最大的训练轮次，本发明的收敛指标为均方误差。

所述步骤三的具体方法如下：

将问故障间隔时间预测问题转化为时间序列问题，使用过去的故障间隔时间来预测下一次故障时间间隔。假设通过前N期的故障间隔时间来预测下一次故障时间间隔，映射函数可以表示为：

x_n＝f(x_n-1,x_n-2,…,x_n-N)

Elman网络对数据进行滑动窗口处理，将长序列数据拆分成多个小序列数据，抽取x₁～x_n，以(x₁,x₂,…,x_n-1)为自变量，以x_n为目标函数值，构成第一个样本；抽取x₂～x_n+1，以(x₂,x₃,…,x_n)为自变量，以x_n+1为函数值，构成第二个样本，依次类推，最终构成以下训练矩阵：

对于给定的故障间隔时间数据，按6：1的比例将其划分为训练样本和测试样本。将训练样本输入到网络中进行训练，即可得到训练完成的网络。

所述步骤四的具体方法如下：

将训练样本输入训练完成的优化Elman神经网络进行预测，得到预测结果。并与原始期望值数据进行误差分析，得到网络预测精度。

实施例二

下面以发动机生产线设备运行的故障间隔时间为例，来进一步解释本发明的实际应用。

使用某车间产线设备的故障间隔时间作为实验数据，旨在预测发生下一次故障的时间间隔。对于给定的82个故障间隔时间数据，按6：1的比例将其划分为训练样本和测试样本。图4和图5显示了Elman神经网络和GWO-Elman神经网络的均方误差随着训练轮次的变化情况。对于Elman神经网络，当训练轮次达到最大训练轮次3000时，均方误差为0.063，仍然比目标误差0.0001大很多。相比之下，采用GWO-Elman神经网络进行训练时，均方误差在1439轮就已经下降到了0.0001，表明GWO-Elman神经网络具有更好的收敛性和计算精度。

图6和图7为Elman神经网络与GWO-Elman神经网络在训练过程中的预测结果。从图中可以看出，相对于Elman神经网络，GWO-Elman神经网络的预测值更接近期望值。具体而言，使用Elman神经网络预测时，平均相对误差为14.7％，使用GWO-Elman神经网络预测时，平均相对误差为4.1％，说明GWO-Elman神经网络的预测精度更高。

本发明与广泛应用的BP神经网络进行比较实验。如图8所示，该图为BP神经网络的预测情况。可以看出，BP神经网络的预测结果偏差较大。综合图6和图7可知，与Elman神经网络和GWO-Elman神经网络相比，BP神经网络的预测精度较差。

表1为三种预测方法训练样本的误差，本发明提出的GWO-Elman模型相比传统的Elman神经网络，均方根误差(RMSE)、平均绝对误差(MAE)和平均相对误差(MAPE)上分别降低了6.7、8.2和10.6％；相比BP神经网络，误差分别降低了30.7、16.3和22.6％。因此，本发明提出的模型在训练效果上优于其他两种模型。

表1三种方法训练样本的误差

图9为三种算法在12个测试样本上的预测结果。结果表明，GWO-Elman神经网络的预测精度明显高于Elman神经网络和BP神经网络。具体而言，使用Elman神经网络预测时，平均相对误差16.7％，预测准确率为83.3％；使用BP神经网络预测时，平均相对误差为27.5％，预测准确率为72.5％；而使用GWO-Elman神经网络预测时，平均相对误差仅为5.2％，预测准确率为94.8％，相对于传统Elman神经网络和BP神经网络预测准确率分别提升了11.5％和22.3％。因此，本文提出的模型在整体预测效果和预测精度上均优于其他两种模型。

表2三种方法预测样本的误差

综上，本发明针对仅采用单一有传感器设备故障预测技术的局限性，引入了无传感器设备故障预测技术。同时，通过引入Elman神经网络算法，有效提升无传感器设备故障预测技术的预测能力和准确性。并进一步对Elman网络进行改进优化，在网络的误差函数中引入正则化操作，提高网络的泛化性能；利用灰狼算法优化Elman神经网络的网络参数，减小了网络初始值的随机性对设备故障间隔时间预测精度和准确性的影响。通过真实数据仿真表明，与传统的Elman神经网络和BP神经网络预测模型相比，本发明建立的GWO-Elman神经网络预测模型具有更快的预测速度，可有效提升预测精度。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种基于优化的Elman神经网络的无传感器设备故障预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法，其特征在于，所述步骤一的具体方法如下：

网络的输入层接受外部输入，然后将输入层输入到隐含层；

式中，v_i ^(t)表示输入层输入；A表示输入层；B表示承接层；

h_n ^(t+1)＝∑ωⁱ(t)v_i(t)

C_k ^(t)＝q(U_k ^(t))

P_m ^(t+1)＝∑ω³(t+1)x_n(t+1)

y(t+1)＝g(P_m(t+1))

Elman神经网络时间预测的数学模型为：

3.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法，其特征在于，所述步骤二的具体方法如下：

21)确定神经网络的结构和参数；

ω¹∈R^(M×N),b¹∈R^(M×1)

ω²∈R^(M×N),b²∈R^(M×1)

ω³∈R^(M×N),b³∈R^(K×1)

22)初始化灰狼种群；

X_i,j＝x_min,j+rand()×(x_max,j-x_min,j)

23)计算适应度函数；

24)确定灰狼等级；

25)确定领袖灰狼；

26)确定灰狼个体位置；

x_i＝x_α-AD×(2rand()-1)+Cx_i

27)更新神经网络参数；

ω′＝w+r₁·(x_α-w)+r₂·(x₁-x₂)

b′＝b+r₃·(x_α-b)+r₄·(x₁-x₂)

4.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法，其特征在于，所述步骤三的具体方法如下：

x_n＝f(x_n-1,x_n-2,…,x_n-N)

5.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法，其特征在于，所述步骤四的具体方法如下：