CN116663419A - 一种基于优化的Elman神经网络的无传感器设备故障预测方法 - Google Patents
一种基于优化的Elman神经网络的无传感器设备故障预测方法 Download PDFInfo
- Publication number
- CN116663419A CN116663419A CN202310652709.9A CN202310652709A CN116663419A CN 116663419 A CN116663419 A CN 116663419A CN 202310652709 A CN202310652709 A CN 202310652709A CN 116663419 A CN116663419 A CN 116663419A
- Authority
- CN
- China
- Prior art keywords
- neural network
- network
- input
- fault
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 93
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000012549 training Methods 0.000 claims abstract description 51
- 241000282461 Canis lupus Species 0.000 claims abstract description 50
- 238000004519 manufacturing process Methods 0.000 claims abstract description 34
- 238000013178 mathematical model Methods 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000003062 neural network model Methods 0.000 claims abstract description 8
- 238000013507 mapping Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 44
- 241000282421 Canidae Species 0.000 claims description 24
- 230000004913 activation Effects 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 239000010797 grey water Substances 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 abstract description 6
- 238000009472 formulation Methods 0.000 abstract 1
- 239000000203 mixture Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明属于无传感器设备故障预测技术领域,具体的说是一种基于优化的Elman神经网络的无传感器设备故障预测方法。包括:一、根据产线设备的历史故障信息得到设备的故障间隔时间,建立Elman神经网络时间预测的数学模型;二、采用灰狼算法优化建立的Elman神经网络,建立优化的神经网络模型数学模型;三、建立故障间隔时间预测的映射函数,并对数据进行滑动窗口处理,将处理后的数据输入到优化后的网络中,进行网络训练;四、利用训练完成的网络对产线设备的故障间隔时间进行预测,得到最终预测结果。本发明充分发挥各自优势,实现对于产线中所有设备的全面故障预测,提高产线故障预测的准确性和全面性,为实现车间科学管理与制定合理的维护计划提供有力支撑。
Description
技术领域
本发明属于无传感器设备故障预测技术领域,具体的说是一种基于优化的Elman神经网络的无传感器设备故障预测方法。
背景技术
随着智能制造的不断发展,企业对生产线整体可靠性提出了更高的要求,设备因故障预测缺陷引发生产事故的问题变得格外突出。生产线加装传感器进行故障预测可以帮助企业及时发现潜在故障,预测设备故障时间,从而制定合理的维护计划,进而减少停机时间和维修成本,增强生产线的稳定性和可靠性。在此背景下,传统仅采用单一有传感器设备故障预测的方法存在着一定的局限性。在智能制造的背景下,传感器设备故障预测技术已经成为生产线故障预测的重要手段,但该技术存在着一定的局限性。一方面,传感器的应用范围和安装位置通常受到限制,只能获取部分设备的运行状态信息,对于其他设备可能存在的故障情况无法有效监测。另一方面,传感器的使用也会增加设备的成本和数据复杂性,特别是对于一些老旧设备而言,安装传感器可能需要进行改造和升级,增加了维护成本和数据分析处理的难度。因此,仅采用单一有传感器设备故障预测的方法已难以满足智能制造对于高效、低成本、高质量的生产要求。
为克服这些局限性,无传感器设备故障预测技术的应用显得尤为重要。无传感器设备故障预测技术是指在无传感器设备的情况下,利用机器学习和人工智能算法来整合和分析历史故障数据,预测设备未来一定时间段内可能发生故障的间隔时间。该技术可以应用于不易安装传感器的设备上,并降低设备成本和数据传输和处理的负担,有效解决单一有传感器设备故障预测的方法的局限性。因此,在已有的有传感器设备故障预测基础上增加无传感器设备故障预测,可以更全面地应对复杂多变的生产环境和设备状态,提高整个产线的故障预测精度和生产效率,具有重要的应用意义和实际价值。
发明内容
本发明提供了一种基于优化的Elman神经网络的无传感器设备故障预测方法,在有传感器设备故障预测基础上增加无传感器设备故障预测。充分发挥各自优势,实现对于产线中所有设备的全面故障预测,提高产线故障预测的准确性和全面性,为实现车间科学管理与制定合理的维护计划提供有力支撑,解决了仅使用有传感器设备故障预测存在局限性的问题。
本发明技术方案结合附图说明如下:
一种基于优化的Elman神经网络的无传感器设备故障预测方法,包括以下步骤:
步骤一、根据产线设备的历史故障信息得到设备的故障间隔时间,建立Elman神经网络时间预测的数学模型;
步骤二、采用灰狼算法优化步骤一建立的Elman神经网络,建立优化的神经网络模型数学模型;
步骤三、建立故障间隔时间预测的映射函数,并对数据进行滑动窗口处理,将处理后的数据输入到步骤二优化后的网络中,进行网络训练;
步骤四、利用步骤三训练完成的网络对产线设备的故障间隔时间进行预测,得到最终预测结果。
所述步骤一的具体方法如下:
11)对目标车间的产线设备的历史故障信息所记录的故障时间数据进行分析和处理,得到设备故障间隔时间信息;
12)根据设备故障间隔时间信息建立Elman神经网络时间预测的数学模型;具体如下:
网络的输入层接受外部输入,然后将输入层输入到隐含层;
式中,vi (t)表示输入层输入;A表示输入层;B表示承接层;
在隐含层中,神经元接收到当前时刻的输入和前一时刻的承接层输出,将当前时刻的输入和前一时刻的承接层输出加权求和并通过sigmoid激活函数进行非线性转换,如下所示:
式中,t为神经网络迭代次序;Uk (t)为输入层净输入;hn (t)、xn(t)为隐含层输入和输出;f(*)为隐含层神经元的激活函数;
隐含层的输出作为下一时刻的输入通过承接层反馈到网络中,与当前输入一起计算输出层的输出,如下所示:
Ck (t)=q(Uk (t))
训练网络参数过程中Elman网络使用反向传播算法,通过计算输出层和隐含层之间的误差来更新网络权重;设ωi(t)表示网络权重,则权重表示为:
式中,ω1、ω2分别为输入层到隐含层、承接层到隐含层的连接权值;
由于Elman网络具有反馈结构,因此反向传播算法还需计算和更新每个时刻的误差;随着输入数据的不断增加,自循环的结构把上一次的状态传递给当前输入,一起作为新的输入数据进行当前轮次的训练和学习,一直到输入或者训练结束,最终得到的输出即为最终的预测结果;
Pm (t+1)=∑ω3(t+1)xn(t+1)
y(t+1)=g(Pm(t+1))
式中,Pm (t)、y(t)为输出层输入和输出;g(*)为输出层神经元的激活函数。
Elman神经网络时间预测的数学模型为:
所述步骤二的具体方法如下:
21)确定神经网络的结构和参数;
Elman神经网络的参数包括权重和偏差;假设神经网络有N个输入节点,M个隐藏节点和K个输出节点,则权重和偏差表示为:
ω1∈R(M×N),b1∈R(M×1)
ω2∈R(M×N),b2∈R(M×1)
ω3∈R(M×N),b3∈R(K×1)
式中,b1、b2、b3分别为输入层到隐含层、承接层到隐含层和隐含层到输出层的偏差;
22)初始化灰狼种群;
灰狼算法的种群由多个灰狼组成;每个灰狼表示一个可能的神经网络;因此,灰狼的位置包括权重和偏差;设Xi,j表示第i只灰狼在第j个维度上的位置,则初始化种群表示为:
Xi,j=xmin,j+rand()×(xmax,j-xmin,j)
式中,xmin,j和xmax,j分别表示第j个维度上的取值范围的下限和上限;rand()为[0,1]之间的随机数;
23)计算适应度函数;
适应度函数用来计算神经网络的性能;使用均方误差作为适应度函数,假设训练集有n个样本,预测结果为yi,实际结果为ti,则均方误差表示为:
24)确定灰狼等级;
灰狼的等级基于适应度函数值的大小;适应度函数值越小,等级越高;按照适应度函数值对灰狼进行排序,并为每个灰狼分配一个等级ri;
25)确定领袖灰狼;
领袖灰狼是种群中适应度函数值最小的灰狼;假设领袖灰狼的位置为xα,则将xα作为种群中的最优解决;
26)确定灰狼个体位置;
根据每个灰狼的等级和距离领袖灰狼的距离更新个体位置;更新后的灰狼位置表示为:
xi=xα-AD×(2rand()-1)+Cxi
式中,A是缩放因子,D是灰狼之间的距离,C是控制参数,xi是当前灰狼的位置;
27)更新神经网络参数;
根据新的灰狼位置更新神经网络参数;假设新的权重和偏差为ω′和b′,更新后的表达式为:
ω′=w+r1·(xα-w)+r2·(x1-x2)
b′=b+r3·(xα-b)+r4·(x1-x2)
式中,r1、r2、r3和r4是均匀分布的随机数;x1和x2是两个随机选取的灰狼的位置;
28)重复执行步骤21)-步骤27),直达达到停止准则,生成了优化的神经网络模型数学模型。
所述步骤三的具体方法如下:
31)将故障间隔时间预测问题转化为时间序列问题,使用过去的故障间隔时间来预测下一次故障时间间隔;假设通过前N期的故障间隔时间来预测下一次故障时间间隔,映射函数表示为:
xn=f(xn-1,xn-2,…,xn-N)
32)Elman网络对数据进行滑动窗口处理,将长序列数据拆分成多个小序列数据,抽取x1~xn,以(x1,x2,…,xn-1)为自变量,以xn为目标函数值,构成第一个样本;抽取x2~xn+1,以(x2,x3,…,xn)为自变量,以xn+1为函数值,构成第二个样本,依次类推,最终构成以下训练矩阵:
对于给定的故障间隔时间数据,按6:1的比例划分为训练样本和测试样本;将训练样本输入到网络中进行训练,即可得到训练完成的网络。
所述步骤四的具体方法如下:
将训练样本输入训练完成的优化的Elman神经网络进行预测,得到预测结果;并与原始期望值数据进行误差分析,最终得到网络预测精度。
本发明的有益效果为:
1)本发明针对基于优化的Elman神经网络为无传感器设备故障预测技术提供了一种新的方法,与有传感器设备故障预测技术结合使用可以充分发挥各自优势,实现对于产线中所有设备的全面故障预测,提高产线故障预测的准确性和全面性;
2)本发明解决由于Elman神经网络内部初值和网络参数随机生产,并且连接权重更新中使用传统方法,易导致网络预测精度不高、训练结果陷入局部最优的问题,提高网络的稳定性和泛化能力,进而提高生产线设备故障间隔时间模型的预测精度。可为车间设备预知维护提供有效决策,并减少了传感器设备投入,对于车间科学管理和成本节约具有重要意义。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例的生产线无传感器设备故障预测方法流程图;
图2为本发明实施例中Elman网络结构图;
图3为本发明实施例中优化Elman网络流程框图;
图4为本发明实施例中训练时Elman网络均方误差的变化曲线;
图5为本发明实施例中训练时GWO-Elman网络均方误差的变化曲线;
图6为本发明实施例中Elman神经网络训练样本预测结果示意图;
图7为本发明实施例中GWO-Elman网络训练样本预测结果示意图;
图8为本发明实施例中BP神经网络训练样本预测结果示意图;
图9为本发明实施例中三种方法测试样本预测结果对比示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
参阅图1,一种基于优化Elman神经网络的设备故障间隔时间预测方法根据产线设备的历史故障信息得到设备的故障间隔时间,首先建立Elman神经网络时间预测的数学模型;然后采用灰狼算法优化Elman神经网络,建立优化神经网络模型数学模型,解决由于Elman神经网络内部初值和网络参数随机生产,并且连接权重更新中使用传统方法,易导致网络预测精度不高、训练结果陷入局部最优的问题,提高网络的稳定性和泛化能力,进而提高生产线设备故障间隔时间模型的预测精度。具体方法如下:
一种基于优化的Elman神经网络的无传感器设备故障预测方法,包括以下步骤:
参阅图1和图2,步骤一、根据产线设备的历史故障信息得到设备的故障间隔时间,建立Elman神经网络时间预测的数学模型;
具体方法如下:
11)对目标车间的产线设备的历史故障信息所记录的故障时间数据进行分析和处理,得到设备故障间隔时间信息;
对目标车间的产线设备的历史故障信息所记录的故障时间数据进行指标一致化处理,解决数据之间不同性质的问题;并对数据进行了滑动窗口处理,将原始数据重塑为多个小序列样本,增加样本数量,得到用于模型预测的故障间隔时间;所述故障间隔时间作为数学模型的训练及预测数据,为数学模型的输入量;
12)根据设备故障间隔时间信息建立Elman神经网络时间预测的数学模型;
网络的输入层接受外部输入,然后将输入层输入到隐含层;
式中,vi (t)表示输入层输入;A表示输入层;B表示承接层;
在隐含层中,神经元接收到当前时刻的输入和前一时刻的承接层输出,将当前时刻的输入和前一时刻的承接层输出加权求和并通过sigmoid激活函数进行非线性转换,如下所示:
式中,t为神经网络迭代次序;Uk (t)为输入层净输入;hn (t)、xn(t)为隐含层输入和输出;f(*)为隐含层神经元的激活函数;
隐含层的输出作为下一时刻的输入通过承接层反馈到网络中,与当前输入一起计算输出层的输出,如下所示:
Ck (t)=q(Uk (t))
训练网络参数过程中Elman网络使用反向传播算法,通过计算输出层和隐含层之间的误差来更新网络权重;设ωi(t)表示网络权重,则权重表示为:
式中,ω1、ω2分别为输入层到隐含层、承接层到隐含层的连接权值;
由于Elman网络具有反馈结构,因此反向传播算法还需计算和更新每个时刻的误差;随着输入数据的不断增加,自循环的结构把上一次的状态传递给当前输入,一起作为新的输入数据进行当前轮次的训练和学习,一直到输入或者训练结束,最终得到的输出即为最终的预测结果;
Pm (t+1)=∑ω3(t+1)xn(t+1)
y(t+1)=g(Pm(t+1))
式中,Pm (t)、y(t)为输出层输入和输出;g(*)为输出层神经元的激活函数。
Elman神经网络时间预测的数学模型为:
参阅图3,步骤二、采用灰狼算法优化步骤一建立的Elman神经网络,建立优化的神经网络模型数学模型;
所述步骤二的具体方法如下:
21)确定神经网络的结构和参数;
Elman神经网络的参数包括权重和偏差;假设神经网络有N个输入节点,M个隐藏节点和K个输出节点,则权重和偏差表示为:
ω1∈R(M×N),b1∈R(M×1)
ω2∈R(M×N),b2∈R(M×1)
ω3∈R(M×N),b3∈R(K×1)
式中,b1、b2、b3分别为输入层到隐含层、承接层到隐含层和隐含层到输出层的偏差;
22)初始化灰狼种群;
灰狼算法的种群由多个灰狼组成;每个灰狼表示一个潜在的解决方案,其位置用一组参数表示。本发明中每个灰狼表示一个可能的神经网络。因此,灰狼的位置包括权重和偏差。设Xi,j表示第i只灰狼在第j个维度上的位置,则初始化种群表示为:
Xi,j=xmin,j+rand()×(xmax,j-xmin,j)
式中,xmin,j和xmax,j分别表示第j个维度上的取值范围的下限和上限;rand()为[0,1]之间的随机数;
23)计算适应度函数;
适应度函数用于评估每个灰狼的解决方案的质量,在本发明中,适应度函数用来计算神经网络的性能;使用均方误差作为适应度函数,假设训练集有n个样本,预测结果为yi,实际结果为ti,则均方误差表示为:
24)确定灰狼等级;
灰狼的等级基于适应度函数值的大小;适应度函数值越小,等级越高;按照适应度函数值对灰狼进行排序,并为每个灰狼分配一个等级ri;
25)确定领袖灰狼;
领袖灰狼是种群中适应度函数值最小的灰狼;假设领袖灰狼的位置为xα,则将xα作为种群中的最优解决;
26)确定灰狼个体位置;
根据每个灰狼的等级和距离领袖灰狼的距离更新个体位置;更新后的灰狼位置表示为:
xi=xα-AD×(2rand()-1)+Cxi
式中,A是缩放因子,D是灰狼之间的距离,C是控制参数,xi是当前灰狼的位置;
27)更新神经网络参数;
根据新的灰狼位置更新神经网络参数;假设新的权重和偏差为ω′和b′,更新后的表达式为:
ω′=w+r1·(xα-w)+r2·(x1-x2)
b′=b+r3·(xα-b)+r4·(x1-x2)
式中,r1、r2、r3和r4是均匀分布的随机数;x1和x2是两个随机选取的灰狼的位置;
28)重复执行步骤21)-步骤27),直达达到停止准则,生成了优化的神经网络模型数学模型。
所述停止准则为达到设定的收敛精度或达到最大的训练轮次,本发明的收敛指标为均方误差。
所述步骤三的具体方法如下:
将问故障间隔时间预测问题转化为时间序列问题,使用过去的故障间隔时间来预测下一次故障时间间隔。假设通过前N期的故障间隔时间来预测下一次故障时间间隔,映射函数可以表示为:
xn=f(xn-1,xn-2,…,xn-N)
Elman网络对数据进行滑动窗口处理,将长序列数据拆分成多个小序列数据,抽取x1~xn,以(x1,x2,…,xn-1)为自变量,以xn为目标函数值,构成第一个样本;抽取x2~xn+1,以(x2,x3,…,xn)为自变量,以xn+1为函数值,构成第二个样本,依次类推,最终构成以下训练矩阵:
对于给定的故障间隔时间数据,按6:1的比例将其划分为训练样本和测试样本。将训练样本输入到网络中进行训练,即可得到训练完成的网络。
所述步骤四的具体方法如下:
将训练样本输入训练完成的优化Elman神经网络进行预测,得到预测结果。并与原始期望值数据进行误差分析,得到网络预测精度。
实施例二
下面以发动机生产线设备运行的故障间隔时间为例,来进一步解释本发明的实际应用。
使用某车间产线设备的故障间隔时间作为实验数据,旨在预测发生下一次故障的时间间隔。对于给定的82个故障间隔时间数据,按6:1的比例将其划分为训练样本和测试样本。图4和图5显示了Elman神经网络和GWO-Elman神经网络的均方误差随着训练轮次的变化情况。对于Elman神经网络,当训练轮次达到最大训练轮次3000时,均方误差为0.063,仍然比目标误差0.0001大很多。相比之下,采用GWO-Elman神经网络进行训练时,均方误差在1439轮就已经下降到了0.0001,表明GWO-Elman神经网络具有更好的收敛性和计算精度。
图6和图7为Elman神经网络与GWO-Elman神经网络在训练过程中的预测结果。从图中可以看出,相对于Elman神经网络,GWO-Elman神经网络的预测值更接近期望值。具体而言,使用Elman神经网络预测时,平均相对误差为14.7%,使用GWO-Elman神经网络预测时,平均相对误差为4.1%,说明GWO-Elman神经网络的预测精度更高。
本发明与广泛应用的BP神经网络进行比较实验。如图8所示,该图为BP神经网络的预测情况。可以看出,BP神经网络的预测结果偏差较大。综合图6和图7可知,与Elman神经网络和GWO-Elman神经网络相比,BP神经网络的预测精度较差。
表1为三种预测方法训练样本的误差,本发明提出的GWO-Elman模型相比传统的Elman神经网络,均方根误差(RMSE)、平均绝对误差(MAE)和平均相对误差(MAPE)上分别降低了6.7、8.2和10.6%;相比BP神经网络,误差分别降低了30.7、16.3和22.6%。因此,本发明提出的模型在训练效果上优于其他两种模型。
表1三种方法训练样本的误差
图9为三种算法在12个测试样本上的预测结果。结果表明,GWO-Elman神经网络的预测精度明显高于Elman神经网络和BP神经网络。具体而言,使用Elman神经网络预测时,平均相对误差16.7%,预测准确率为83.3%;使用BP神经网络预测时,平均相对误差为27.5%,预测准确率为72.5%;而使用GWO-Elman神经网络预测时,平均相对误差仅为5.2%,预测准确率为94.8%,相对于传统Elman神经网络和BP神经网络预测准确率分别提升了11.5%和22.3%。因此,本文提出的模型在整体预测效果和预测精度上均优于其他两种模型。
表2三种方法预测样本的误差
综上,本发明针对仅采用单一有传感器设备故障预测技术的局限性,引入了无传感器设备故障预测技术。同时,通过引入Elman神经网络算法,有效提升无传感器设备故障预测技术的预测能力和准确性。并进一步对Elman网络进行改进优化,在网络的误差函数中引入正则化操作,提高网络的泛化性能;利用灰狼算法优化Elman神经网络的网络参数,减小了网络初始值的随机性对设备故障间隔时间预测精度和准确性的影响。通过真实数据仿真表明,与传统的Elman神经网络和BP神经网络预测模型相比,本发明建立的GWO-Elman神经网络预测模型具有更快的预测速度,可有效提升预测精度。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (5)
1.一种基于优化的Elman神经网络的无传感器设备故障预测方法,其特征在于,包括以下步骤:
步骤一、根据产线设备的历史故障信息得到设备的故障间隔时间,建立Elman神经网络时间预测的数学模型;
步骤二、采用灰狼算法优化步骤一建立的Elman神经网络,建立优化的神经网络模型数学模型;
步骤三、建立故障间隔时间预测的映射函数,并对数据进行滑动窗口处理,将处理后的数据输入到步骤二优化后的网络中,进行网络训练;
步骤四、利用步骤三训练完成的网络对产线设备的故障间隔时间进行预测,得到最终预测结果。
2.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法,其特征在于,所述步骤一的具体方法如下:
11)对目标车间的产线设备的历史故障信息所记录的故障时间数据进行分析和处理,得到设备故障间隔时间信息;
12)根据设备故障间隔时间信息建立Elman神经网络时间预测的数学模型;具体如下:
网络的输入层接受外部输入,然后将输入层输入到隐含层;
式中,vi (t)表示输入层输入;A表示输入层;B表示承接层;
在隐含层中,神经元接收到当前时刻的输入和前一时刻的承接层输出,将当前时刻的输入和前一时刻的承接层输出加权求和并通过sigmoid激活函数进行非线性转换,如下所示:
hn (t+1)=∑ωi(t)vi(t)
式中,t为神经网络迭代次序;Uk (t)为输入层净输入;hn (t)、xn(t)为隐含层输入和输出;f(*)为隐含层神经元的激活函数;
隐含层的输出作为下一时刻的输入通过承接层反馈到网络中,与当前输入一起计算输出层的输出,如下所示:
Ck (t)=q(Uk (t))
训练网络参数过程中Elman网络使用反向传播算法,通过计算输出层和隐含层之间的误差来更新网络权重;设ωi(t)表示网络权重,则权重表示为:
式中,ω1、ω2分别为输入层到隐含层、承接层到隐含层的连接权值;
由于Elman网络具有反馈结构,因此反向传播算法还需计算和更新每个时刻的误差;随着输入数据的不断增加,自循环的结构把上一次的状态传递给当前输入,一起作为新的输入数据进行当前轮次的训练和学习,一直到输入或者训练结束,最终得到的输出即为最终的预测结果;
Pm (t+1)=∑ω3(t+1)xn(t+1)
y(t+1)=g(Pm(t+1))
式中,Pm (t)、y(t)为输出层输入和输出;g(*)为输出层神经元的激活函数。
Elman神经网络时间预测的数学模型为:
3.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法,其特征在于,所述步骤二的具体方法如下:
21)确定神经网络的结构和参数;
Elman神经网络的参数包括权重和偏差;假设神经网络有N个输入节点,M个隐藏节点和K个输出节点,则权重和偏差表示为:
ω1∈R(M×N),b1∈R(M×1)
ω2∈R(M×N),b2∈R(M×1)
ω3∈R(M×N),b3∈R(K×1)
式中,b1、b2、b3分别为输入层到隐含层、承接层到隐含层和隐含层到输出层的偏差;
22)初始化灰狼种群;
灰狼算法的种群由多个灰狼组成;每个灰狼表示一个可能的神经网络;因此,灰狼的位置包括权重和偏差;设Xi,j表示第i只灰狼在第j个维度上的位置,则初始化种群表示为:
Xi,j=xmin,j+rand()×(xmax,j-xmin,j)
式中,xmin,j和xmax,j分别表示第j个维度上的取值范围的下限和上限;rand()为[0,1]之间的随机数;
23)计算适应度函数;
适应度函数用来计算神经网络的性能;使用均方误差作为适应度函数,假设训练集有n个样本,预测结果为yi,实际结果为ti,则均方误差表示为:
24)确定灰狼等级;
灰狼的等级基于适应度函数值的大小;适应度函数值越小,等级越高;按照适应度函数值对灰狼进行排序,并为每个灰狼分配一个等级ri;
25)确定领袖灰狼;
领袖灰狼是种群中适应度函数值最小的灰狼;假设领袖灰狼的位置为xα,则将xα作为种群中的最优解决;
26)确定灰狼个体位置;
根据每个灰狼的等级和距离领袖灰狼的距离更新个体位置;更新后的灰狼位置表示为:
xi=xα-AD×(2rand()-1)+Cxi
式中,A是缩放因子,D是灰狼之间的距离,C是控制参数,xi是当前灰狼的位置;
27)更新神经网络参数;
根据新的灰狼位置更新神经网络参数;假设新的权重和偏差为ω′和b′,更新后的表达式为:
ω′=w+r1·(xα-w)+r2·(x1-x2)
b′=b+r3·(xα-b)+r4·(x1-x2)
式中,r1、r2、r3和r4是均匀分布的随机数;x1和x2是两个随机选取的灰狼的位置;
28)重复执行步骤21)-步骤27),直达达到停止准则,生成了优化的神经网络模型数学模型。
4.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法,其特征在于,所述步骤三的具体方法如下:
31)将故障间隔时间预测问题转化为时间序列问题,使用过去的故障间隔时间来预测下一次故障时间间隔;假设通过前N期的故障间隔时间来预测下一次故障时间间隔,映射函数表示为:
xn=f(xn-1,xn-2,…,xn-N)
32)Elman网络对数据进行滑动窗口处理,将长序列数据拆分成多个小序列数据,抽取x1~xn,以(x1,x2,…,xn-1)为自变量,以xn为目标函数值,构成第一个样本;抽取x2~xn+1,以(x2,x3,…,xn)为自变量,以xn+1为函数值,构成第二个样本,依次类推,最终构成以下训练矩阵:
对于给定的故障间隔时间数据,按6:1的比例划分为训练样本和测试样本;将训练样本输入到网络中进行训练,即可得到训练完成的网络。
5.根据权利要求1所述的一种基于优化的Elman神经网络的无传感器设备故障预测方法,其特征在于,所述步骤四的具体方法如下:
将训练样本输入训练完成的优化的Elman神经网络进行预测,得到预测结果;并与原始期望值数据进行误差分析,最终得到网络预测精度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310652709.9A CN116663419A (zh) | 2023-06-05 | 2023-06-05 | 一种基于优化的Elman神经网络的无传感器设备故障预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310652709.9A CN116663419A (zh) | 2023-06-05 | 2023-06-05 | 一种基于优化的Elman神经网络的无传感器设备故障预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116663419A true CN116663419A (zh) | 2023-08-29 |
Family
ID=87714884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310652709.9A Pending CN116663419A (zh) | 2023-06-05 | 2023-06-05 | 一种基于优化的Elman神经网络的无传感器设备故障预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116663419A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117289685A (zh) * | 2023-11-27 | 2023-12-26 | 青岛创新奇智科技集团股份有限公司 | 一种基于人工智能的生产线故障预测与自愈方法及系统 |
CN117557113A (zh) * | 2023-10-10 | 2024-02-13 | 国网湖北省电力有限公司经济技术研究院 | 一种考虑设备特征的电网运维方案规划方法及系统 |
-
2023
- 2023-06-05 CN CN202310652709.9A patent/CN116663419A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117557113A (zh) * | 2023-10-10 | 2024-02-13 | 国网湖北省电力有限公司经济技术研究院 | 一种考虑设备特征的电网运维方案规划方法及系统 |
CN117289685A (zh) * | 2023-11-27 | 2023-12-26 | 青岛创新奇智科技集团股份有限公司 | 一种基于人工智能的生产线故障预测与自愈方法及系统 |
CN117289685B (zh) * | 2023-11-27 | 2024-02-02 | 青岛创新奇智科技集团股份有限公司 | 一种基于人工智能的生产线故障预测与自愈方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109214599B (zh) | 一种对复杂网络进行链路预测的方法 | |
CN116663419A (zh) | 一种基于优化的Elman神经网络的无传感器设备故障预测方法 | |
CN106529701B (zh) | 基于改进的萤火虫算法优化神经网络的光纤状态预测方法 | |
CN111079931A (zh) | 一种基于图神经网络的状态空间概率性多时间序列预测方法 | |
CN110751318A (zh) | 一种基于ipso-lstm的超短期电力负荷预测方法 | |
CN112418482A (zh) | 一种基于时间序列聚类的云计算能耗预测方法 | |
CN110309537B (zh) | 一种飞行器的智能健康预测方法及系统 | |
CN111814401A (zh) | 基于遗传算法的bp神经网络的led寿命预测方法 | |
CN112308298B (zh) | 一种面向半导体生产线的多场景性能指标预测方法及系统 | |
Abdalla et al. | Optimizing the multilayer feed-forward artificial neural networks architecture and training parameters using genetic algorithm | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN109787821B (zh) | 一种大规模移动客户流量消费智能预测方法 | |
CN111754034A (zh) | 一种基于混沌优化神经网络模型的时间序列预测方法 | |
CN109754122A (zh) | 一种基于随机森林特征提取的bp神经网络的数值预测方法 | |
CN115114128A (zh) | 一种卫星健康状态评估系统及评估方法 | |
CN115907122A (zh) | 区域电动汽车充电负荷预测方法 | |
CN115062528A (zh) | 一种针对工业过程时序数据的预测方法 | |
CN113128666A (zh) | 基于Mo-S-LSTMs模型的时间序列多步预测方法 | |
CN109886316B (zh) | 基于云系相似度权重分配的变压器状态参量组合预测方法 | |
CN112232570A (zh) | 一种正向有功总电量预测方法、装置及可读存储介质 | |
CN116432359A (zh) | 基于元迁移学习的变拓扑网络潮流计算方法 | |
CN115619028A (zh) | 一种基于聚类算法融合的电力负荷精准预测方法 | |
CN115907000A (zh) | 一种用于电力系统最优潮流预测的小样本学习方法 | |
CN115130662A (zh) | 一种基于迁移学习的配电网时变拓扑状态估计方法 | |
CN115630320A (zh) | 一种云边协同下基于深度迁移网络的配电台区异常工况诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |