CN111930728A - 一种设备的特征参数和故障率的预测方法及系统 - Google Patents
一种设备的特征参数和故障率的预测方法及系统 Download PDFInfo
- Publication number
- CN111930728A CN111930728A CN202010616435.4A CN202010616435A CN111930728A CN 111930728 A CN111930728 A CN 111930728A CN 202010616435 A CN202010616435 A CN 202010616435A CN 111930728 A CN111930728 A CN 111930728A
- Authority
- CN
- China
- Prior art keywords
- data
- characteristic parameters
- equipment
- parameters
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 44
- 238000012549 training Methods 0.000 claims abstract description 41
- 230000007774 longterm Effects 0.000 claims abstract description 11
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims abstract description 10
- 238000013145 classification model Methods 0.000 claims abstract description 10
- 238000005070 sampling Methods 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 4
- 238000003860 storage Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 230000004913 activation Effects 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 5
- 238000002790 cross-validation Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000013256 Gubra-Amylin NASH model Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000013499 data model Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种设备特征参数和故障率的预测方法及系统,所述方法包括:对采集的设备原始特征参数进行离群值与缺失值处理及标准化处理后得到规范化数据,并输入至生成对抗网络进行训练;利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,得到生成对抗网络模型;将实时采集新的特征参数作为待测试数据并输入至生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测,将预测值结合分类模型结果对设备状态进行二值化信号输出,进而判断设备的故障状态。本发明提供的设备特征参数和故障率的预测方法及系统,克服了采集数据的严重不均衡问题,实现了不同参数维度的统一及多任务问题的同时解决。
Description
技术领域
本发明涉及大数据分析技术领域,尤其涉及一种设备特征参数和故障率的预测方法及系统。
背景技术
随着设备可靠性提高,企业先进生产管理方式的应用,以及质量监督和安全风险分析等手段的管控,通常在很长的周期内难以检测到设备故障的发生。目前,主要采用机器学习方法中的监督学习和半监督学习进行故障预测,但是使用监督学习和半监督学习这两种方法通常会面临如下问题:第一,算法受到监督信息的偏见的约束,因而监督算法在解决问题时无法去考虑其他可能出现的情况;第二,由于学习在监督或半监督下进行,为算法创建标签需要花费巨大成本,采集周期很长。手动创建的标签越少,算法可以用于训练的数据就越少;第三,半监督学习方法中利用未标记数据,有时不仅不能提高泛化能力,反而会导致性能下降;第四,半监督学习方法中在模型假设不符合真实情况下,或者标记样本与无标记样本差异较大时,会导致性能下降;第五,半监督学习方法中随着训练的不断进行,自动标记的样本噪声会不断积累,模型性能可能会不断下降。
发明内容
本发明的目的在于提供一种设备特征参数和故障率的预测方法及系统,通过离群值与缺失值处理克服了采集数据的严重不均衡问题;采用数据标准化处理实现了不同参数维度的统一,并且实现了多任务问题的同时解决。
为了克服上述现有技术中的缺陷,本发明实施例提供了一种设备特征参数和故障率的预测方法,包括:
对采集的设备特征参数进行离群值与缺失值处理及标准化处理,得到特征参数规范化数据;
将所述规范化数据输入至生成对抗网络进行训练,利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,当达到规定的训练迭代次数或辨别器无法分辨真假即判别概率为0.5时停止训练,得到生成对抗网络模型;
实时采集新的特征参数作为待测试数据,将所述待测试数据输入至所述生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测三种方式的回归值预测,将所述预测后的值结合分类模型对设备状态进行二值化信号输出,进而判断设备的故障状态。
优选地,所述预测模型利用动态滑动窗技术,所述训练包括对所述规范化数据中各个参数的平稳波动部分进行跟踪。
优选地,所述对采集的设备特征参数进行离群值与缺失值处理,包括:
计算第一周期内特征参数的每个时刻的实测值与均值的差值,根据所述差值计算第一周期内的相对误差和平均绝对相对偏差,当所述相对误差大于等于所述平均绝对相对偏差的四倍,则判断为离群点;
采用四倍标准差法处理所述离群点;
按照预设时间间隔进行特征参数采样,当采样率周期大于预设时间时,通过中位数插值法对所述特征参数进行拟合;否则,计算所述特征参数的平均数;
通过中位数插值法对所述缺失值进行填充。
优选地,在所述对采集的原始数据进行离群值与缺失值处理及标准化处理之前,还包括,对所述原始数据进行.xml数据解析,所述原始数据为.xml格式。
优选地,所述训练中的神经网络采用卷积神经网络和循环神经网络。
本发明实施例还提供了一种设备特征参数和故障率的预测系统,包括:
数据采集单元,用于对采集的设备特征参数进行离群值与缺失值处理及标准化处理,得到特征参数规范化数据;
模型构建单元,用于将所述规范化数据输入至生成对抗网络进行训练,利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,当达到规定的训练迭代次数或辨别器无法分辨真假即判别概率为0.5时停止训练,得到生成对抗网络模型;
故障预测单元,用于实时采集新的特征参数作为待测试数据,将所述待测试数据输入至所述生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测三种方式的回归值预测,将所述预测后的值结合分类模型对设备状态进行二值化信号输出,进而判断设备的故障状态。
优选地,所述预测模型利用动态滑动窗技术,所述训练包括对所述规范化数据中各个参数的平稳波动部分进行跟踪。
本发明实施例还提供了一种计算机终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例所述的设备特征参数和故障率的预测方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述实施例所述的设备特征参数和故障率的预测方法。
相对于现有技术,本发明实施例至少存在以下有益效果:
(1)通过离群值与缺失值处理进行数据清洗,克服采集数据的不均衡;利用生成网络模型,大量生成故障数据,有助于深度神经网络模型的训练;
(2)在模型的测试环节,利用正态分布的随机噪声叠加到原始特征参数中,扩充了故障数据集数量,使得评价模型性能更加客观;
(3)采用数据标准化处理,实现了不同参数维度的统一;
(4)使用预测模型动态滑动窗技术,实现不同时间段的预测方式(短期预测、中期预测、长期预测),使用单设备多参数生成对抗网络分类模型,提高故障诊断性能。
附图说明
图1是本发明某一实施例提供的设备特征参数和故障率的预测方法的流程示意图;
图2是本发明某一实施例提供的5折交叉验证法的流程示意图;
图3是本发明某一实施例提供的生成对抗网络的原理示意图;
图4是本发明某一实施例提供的设备特征参数和故障率的预测系统的模块示意图;
图5是本发明某一实施例提供的设备判断结果为正常状态的概率曲线图;
图6是本发明某一实施例提供的设备判断结果为故障状态的概率曲线图;
图7是本发明某一实施例提供的滑动窗口步长为1时的滑动过程示意图;
图8是本发明某一实施例提供的设备电流原始特征参数与未来5分钟预测数值曲线图;
图9是本发明某一实施例提供的设备电流原始特征参数与未来30分钟预测数值曲线图;
图10是本发明某一实施例提供的设备电流原始特征参数与未来1天预测数值曲线图;
图11是本发明某一实施例提供的设备电流原始特征参数与未来1周预测数值曲线图;
图12是本发明某一实施例提供的设备预测特征参数未来5分钟的数据模型的ROC曲线图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,文中所使用的步骤编号仅是为了方便描述,不对作为对步骤执行先后顺序的限定。
应当理解,在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,本发明某一实施例提供了一种设备特征参数和故障率的预测方法,包括:
S10、对采集的设备特征参数进行离群值与缺失值处理及标准化处理,得到特征参数规范化数据;
在本步骤中,首先需要说明的是,离群值与缺失值处理和标准化处理分别作为数据预处理的第二步和第三步,数据预处理还包括第一步对采集数据进行数据解析,以及第四步将标准化处理后的数据进行数据集的划分;采集的数据通常为用于预测设备故障率的特征参数,规定一个时间周期,例如1小时,然后对这1小时内的数据按照一定时间间隔进行数据采集,例如每1分钟采集一次;然而实际应用中,本领域人员可以根据实际所需进行设置,在此不作任何限定;为了方便理解数据采集及数据预处理的整个过程,下面将通过对1B设备的特征参数的数据采集和数据预处理来说明整个过程:
1).xml数据解析:
所采集的数据来第三方系统,其原始数据为.xml格式:
然后通过Python的Pandas模块对该格式的内容进行解析,具体步骤如下:
1.1)找到所有的<Row>根节点;
1.2)对每个<Row>根节点迭代其子节点,分别解析标签中的数据;
1.3)对解析后的数据进行结构化处理:表1为解析并筛选后的1B设备的局部数据,如表1所示,选出全部1B设备的特征(共有“19维”,“12960行”),然后对不同监测仪器数据的时间进行规整,并保存为.csv格式数据,供第二步数据处理使用。
表1
此外,由于监测设备本身错综复杂的工作环境以及监测仪器的故障和操作不当等因素,会导致数据中存在部分缺失值和离群点。表2为1B设备部分特征统计表,如表2所示,1B设备最后的max行中,有部分特征参数的数值离群,明显要大于对应特征参数的均值。此类缺失值和离群点虽只在数据集占极小一部分,但会对GAN模型的预测和分类结果产生重要影响。
表2
2)对缺失值和离群值进行处理:
离群点(outlier)是指和其他观测点偏离非常大的数据点,离群点是离群的数据点,但是不一定是错误的数据点。确定离群点对于数据分析会带来不利的影响,比如,增大错误方差、影响预测和影响正态性。本发明采用均值±4倍标准差来处理离群点,首先,假设设备的特征参数服从正态分布;然后计算每个时刻的实测值与均值的差值,若该差值距离标准差4倍距离以上,则该数据点判断为离群点;针对这种离群值,没有使用均值或者中值替代,而是使用前向替代,即离群值数据的以前一个值替换,这样能保留数据的发展趋势,更真实模拟实际情况。
此外,由于不同检测仪器的采样率并不统一,本发明统一规整为每5分钟采一次样本:对于采样率高于5分钟的,通过中位数插值法拟合;对于采样率低于5分钟的,求取平均数。对缺失值也使用中位数插值法填充。
3)数据标准化:
若输入的数值属性具有非常大的比例差异,将会导致算法的泛化能力不佳。所以要预先将输入数据缩放到相同的数量级当中;特征缩放的过程会被预先储存,在输出结果时通过逆过程恢复到原来的数量级。
采用如下公式对特征参数进行标准化处理:
4)数据集划分:
请参阅图2,由于本发明提供的设备特征参数和故障率的预测系统主要有两种任务,分别是构建故障诊断模型和单指标预测模型。对于故障诊断模型采用5折交叉验证进行性能评估。具体操作如下:
k折交叉验证(k-fold cross validation),此处k=5。
将数据集等分为k份,k-1份用来训练模型,剩下一份用来模型性能评估。重复k次,得到k个模型和性能评估结果。得到k个性能评估后,取平均求出最终性能评估。即:
第一步:将原始数据按时间顺序等分为k份。
第二步:每一次挑选其中1份作为测试集,挑选方式具体见图2,剩余k-1份作为训练集用于模型训练。
第三步:重复第二步k次,每个子集都有一次作为测试集,其余子集作为训练集。在每个训练集上训练后得到一个模型,用这个模型在相应测试集上测试,计算并保存模型的评估指标。
第四步:计算k组测试结果的平均值作为模型精度的估计,并作为当前k折交叉验证下模型的性能指标。
S20、将所述规范化数据输入至生成对抗网络进行训练,利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,当达到规定的训练迭代次数或辨别器无法分辨真假即判别概率为0.5时停止训练,得到生成对抗网络模型;
请参阅图3,该图提供了生成对抗网络的结构,需要说明的是,无监督方法中的生成对抗网络(GAN)是生成模型的一种神经网络架构。生成模型指在现存样本的基础上,使用模型来生成新案例。GAN是使用两个神经网络模型训练而成的一种生成模型。其中一个称为“生成器”或“生成网络”模型,可学习生成新的可用案例,解决特征参数预测这个回归问题。另一个称为“判别器”或“判别网络”,可学习判别生成的案例与实际案例,可解决故障判断这个分类问题。
其中,GAN模型可以处理高维度数据,同时在分类任务和回归任务中性能良好。综合考虑到任务过程中既要分类又要预测的情况,在实际建立模型过程中选用了多个生成模型对设备特征参数进行模拟。由于采用数据中故障数据极少,可以考虑主动模拟故障情况对数据进行预测。通过生成网络生成故障数据,然后通过对抗网络来对设备健康情况进行分类。与此同时在预测任务中,可以复用训练良好的生成模型,通过快速的优化步骤对设备未来数据情况进行预测。通过最大化对抗网络的预测准确度和最小化生成网络所生成结果和真实数据的差异,网络的总体性能得到优化。这样处理可使得模拟错误数据的效果更好,并且对抗网络不会过于激进的将正常运行结果分类到离群过程中,还能有效避免训练过程中出现过拟合。
S30、实时采集新的特征参数作为待测试数据,将所述待测试数据输入至所述生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测三种方式的回归值预测,将所述预测后的值结合分类模型对设备状态进行二值化信号输出,进而判断设备的故障状态。
由于步骤S20已经得到训练好的生成对抗网络模型,此时继续保持实时采集新的特征参数,将这部分数据作为待测试数据,输入至生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测三种方式的回归值预测,同时结合特征参数预测值和分类模型结果对设备状态进行二值化信号输出,进而判断设备的故障状态。然后根据已经记录的数据特征输出受试者工作特征曲线ROC,作为模型性能判断的主要参考依据。其中,1B设备判断结果为正常状态及故障状态的概率曲线如图5-6所示。
本发明实施例通过离群值与缺失值处理克服了采集数据的严重不均衡问题,通过采用数据标准化处理实现了不同参数维度的统一,并且实现了多任务问题的同时解决。
本发明某一实施例中,所述预测模型利用动态滑动窗技术,所述训练包括对所述规范数据中各个参数的平稳波动部分进行跟踪。在时间维度,通过迭代滑动窗大小,选择不同的滑动窗,构造成二维图像。通过不同的滑动步长提取不同范围的数据作为训练输入,这里采样周期为5分钟一次,可以实现了短期预测、中期预测以及长期预测三种预测方式。通过对预处理后的数据通过预测模型对各个参数的平稳波动部分高精度的跟踪,降低了参数背景波动对预测残差数据的影响。综合多维参数的时间序列及预测残差,利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,得到生成对抗网络模型。利用ROC曲线检验模型的性能,融合设备各特征参数的预测结果,得出故障预测概率值;其中,模型可自适应调整窗口大小,提升预测效果。同时还充分利用据在时间上的关联性,提升故障判别的效果,有助于降低误报率。
可以理解的是,在训练时,会自适应选择最优的滑动窗大小。请参阅图7,该图提供了滑动窗口步长为1时的滑动过程。如图所示,在时间维度,通过迭代滑动窗大小,2-19个步长宽度,选择不同的滑动窗,构造成N*19的二维图像。通过不同的滑动步长提取不同范围的数据作为训练输入。这里采样周期为5分钟一次,可以实现短期预测(包含三类,预测设备特征参数未来5分钟的数据,即一采样周期的1个点;预测设备特征参数未来30分钟的数据,即6个采样周期的6个点;以及预测设备特征参数未来1小时的数据,即12个采样周期的12个点);中期预测(预测设备特征参数未来一天的数据,即12×24=288个采样周期的1440个点)以及长期预测(预测设备特征参数未来一周的数据1440×7=10080个点)三种预测方式。例如有1-100共100组数据,要预测设备特征参数未来5分钟的数据,即使用1-100的数据预测第101个数据,当数据更新后使用2-101的数据预测第102个点的数据,依次类推;要预测设备特征参数未来1小时的数据,首先使用1-100个数据预测第101,102,103,104,105,106个点的数据,待新数据更新后使用“7-106的数据预测107,108,109,110,111,112”个点的数据,依次类推。
其中,预测未来5分钟的滑动窗口步长设置为1,预测未来30分钟的滑动窗口步长设置为3,预测未来1小时的滑动窗口步长设置为6,预测未来1天的滑动窗口步长设置为12,预测未来一周的滑动窗口步长设置为24。1B设备电流原始特征参数与短周期、中周期及长周期预测数值曲线如图8-11所示,其中,粗线为设备原始特征曲线,细线为对应预测曲线。1B设备短周期中预测设备特征参数未来5分钟的数据模型的ROC曲线如图12所示。
其中,短周期、中周期以及长周期均计算最新3000个数据点的对称平均绝对百分比误差(SMAPE)如表3所示:
表3
需要说明的是,使用对称平均绝对百分比误差(SMAPE),作为设备单特征参数预测效果的评估指标。SMAPE的公式如下:
SMAPE目前可以对整个预测批次的整体误差进行计算,SMAPE的取值范围为0-200,值越小表示预测效果越好。其中,xi是测试集目标真实值,yi是测试集目标预测值。
本实施例中,通过汇总和比对激活函数的发展历程,ReLU激活函数在优化求导过程中数值缩放保留最好,不会使得优化过程长期滞留在某一数值。同时在数值大小上没有最大值的限制可以更好地对特征进行表达。通过比对ReLU激活函数的两个变种,LeakyReLU和ELU发现,后两种方法准确率提升不明显,计算复杂度增高过快。综合预测效果和计算复杂度选择ReLU激活函数。
此外,参数优化采用Adam优化器:Adam优化器结合了AdaGrad和RMSProp两种优化算法的优点,实现简单,计算高效,对内存需求少,参数的更新不受梯度的伸缩变换影响,超参数具有很好的解释性,且通常无需调整或仅需很少的微调,能自动调整学习率,适合应用于不稳定目标函数大和规模的数据及参数的场景,且适用于梯度稀疏或梯度存在大噪声场景。
请参阅表4,本发明某一实施例中,提供了分类模型网络结构(GAN)及预测模型网络结构,包括输入层、卷积层、最大池化层、全连接层对应的相关参数信息。
表4
本发明某一实施例中,所述对采集的设备特征参数进行离群值与缺失值处理,具体包括:
计算第一周期内特征参数的每个时刻的实测值与均值的差值,根据所述差值计算第一周期内的相对误差和平均绝对相对偏差,当所述相对误差大于等于所述平均绝对相对偏差的四倍,则判断为离群点;
采用四倍标准差法处理所述离群点;
按照预设时间间隔进行特征参数采样,当采样率周期大于预设时间时,通过中位数插值法对所述特征参数进行拟合;否则,计算所述特征参数的平均数;
通过中位数插值法对所述缺失值进行填充。
本实施例中,首先,假设设备的特征参数服从正态分布;然后计算每个时刻的实测值与均值的差值,若该差值距离标准差4倍距离以上,则该数据点判断为离群点;针对这种离群值,没有使用均值或者中值替代,而是使用前向替代,即离群值数据的以前一个值替换,这样能保留数据的发展趋势,更真实模拟实际情况;
按照采样周期为每5分钟一次进行特征参数采样,当采样率大于5分钟,通过中位数插值法对所述特征参数进行拟合;否则,计算所述特征参数的平均数;
通过中位数插值法对缺失值进行填充。
在本步骤中,可以理解的是,由于采集的数据严重不均衡,本发明通过离群值与缺失值处理进行数据清洗。利用生成模型,可大量生成故障数据,有助于深度神经网络模型的训练。为了进一步提升模型的鲁棒性,模型在测试环节,还利用了正态分布的随机噪声,叠加到原始型号中,扩充故障数据集数量,用于评价模型性能,使之更加客观。离群值是由于外部的随机干扰或者设备的内部抖动造成,这些数据不在模型预测范围之内,因此需要对这类数据进行数据清洗,针对这种离群离群值,没有使用均值或者中值替代,而是使用前向替代,即离群值数据的以前一个值替换,这样能保留数据的发展趋势,更真实模拟实际情况。
本发明某一实施例中,在在所述对采集的原始数据进行离群值与缺失值处理及标准化处理之前,还包括,对所述原始数据进行.xml数据解析,所述原始数据为.xml格式。
本发明某一实施例中,所述训练中的神经网络采用卷积神经网络和循环神经网络,可以理解的是,深度学习中的神经网络选择:较为主流的网络结构一般由全连接层或卷积神经网络和循环神经网络及其衍生网络结构组成。其中,全连接层,是深度学习中全连接层是最基本的结构,通过输入特征的加权求和。对求和结果通过非线性激活函数传递到下一层中。公式如下:
其中,每一个输出Outj是通过输入Xi乘上权重Wij加上偏置项bj,通过Relu激活函数处理得到。每一个输出是通过输入乘上权重加上偏置项,通过Relu激活函数处理得到。在实际部署过程中,通过分析任务难度量级,选择了五层网络结构,输入层含19个神经元,中间层通道数依次为16,128,128,32;输出层为概率输出的1个神经元。各层的权值及偏置保存在模型checkpoint-model文件夹中。
此外,卷积神经网络被广泛应用于图片识别任务当中,或者输入维度过高需要快速降低维度,同时保留相对位置关系的任务当中。通过将时间序列的数据转换为二维序列数据模拟图像数据,这样针对设备特征参数数据,可以使用LSTM/RNN/CNN网络结构,或者使用三者的任意组合,作为GAN模型的基础网络进行训练,以提高模型性能。
本发明某一实施例还提供了一种设备特征参数和故障率的预测系统,包括:
数据采集单元,用于对采集的设备特征参数进行离群值与缺失值处理及标准化处理,得到特征参数规范化数据;
模型构建单元,用于将所述规范化数据输入至生成对抗网络进行训练,利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,当达到规定的训练迭代次数或辨别器无法分辨真假即判别概率为0.5时停止训练,得到生成对抗网络模型;
故障预测单元,用于实时采集新的特征参数作为待测试数据,将所述待测试数据输入至所述生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测三种方式的回归值预测,将所述预测后的值结合分类模型对设备状态进行二值化信号输出,进而判断设备的故障状态。
本发明某一实施例还提供了一种计算机终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任意一个实施例所述的设备特征参数和故障率的预测方法。
其中,处理器用于控制该计算机终端设备的整体操作,以完成上述的全自动用电量预测方法的全部或部分步骤。存储器用于存储各种类型的数据以支持在该计算机终端设备的操作,这些数据例如可以包括用于在该计算机终端设备上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
计算机终端设备可以被一个或多个应用专用集成电路(ApplicationSpecific1ntegrated Circuit,简称AS1C)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述任一项实施例所述的设备特征参数和故障率的预测方法,并达到如上述方法一致的技术效果。
本发明某一实施例还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的设备特征参数和故障率的预测方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由计算机终端设备的处理器执行以完成上述的设备特征参数和故障率的预测方法,并达到如上述方法一致的技术效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种设备特征参数和故障率的预测方法,其特征在于,包括:
对采集的设备特征参数进行离群值与缺失值处理及标准化处理,得到特征参数规范化数据;
将所述规范化数据输入至生成对抗网络进行训练,利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,当达到规定的训练迭代次数或辨别器无法分辨真假即判别概率为0.5时停止训练,得到生成对抗网络模型;
实时采集新的特征参数作为待测试数据,将所述待测试数据输入至所述生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测三种方式的回归值预测,将所述预测后的值结合分类模型对设备状态进行二值化信号输出,进而判断设备的故障状态。
2.根据权利要求1所述的设备特征参数和故障率的预测方法,其特征在于,所述预测模型利用动态滑动窗技术,所述训练包括对所述规范化数据中各个参数的平稳波动部分进行跟踪。
3.根据权利要求1所述的设备特征参数和故障率的预测方法,其特征在于,所述对采集的设备特征参数进行离群值与缺失值处理,包括:
计算第一周期内特征参数的每个时刻的实测值与均值的差值,根据所述差值计算第一周期内的相对误差和平均绝对相对偏差,当所述相对误差大于等于所述平均绝对相对偏差的四倍,则判断为离群点;
采用四倍标准差法处理所述离群点;
按照预设时间间隔进行特征参数采样,当采样率周期大于预设时间时,通过中位数插值法对所述特征参数进行拟合;否则,计算所述特征参数的平均数;
通过中位数插值法对所述缺失值进行填充。
5.根据权利要求1所述的设备特征参数和故障率的预测方法,其特征在于,在所述对采集的原始数据进行离群值与缺失值处理及标准化处理之前,还包括,对所述原始数据进行.xml数据解析,所述原始数据为.xml格式。
6.根据权利要求1所述的设备特征参数和故障率的预测方法,其特征在于,所述训练中的神经网络采用卷积神经网络和循环神经网络。
7.一种设备特征参数和故障率的预测系统,其特征在于,包括:
数据采集单元,用于对采集的设备特征参数进行离群值与缺失值处理及标准化处理,得到特征参数规范化数据;
模型构建单元,用于将所述规范化数据输入至生成对抗网络进行训练,利用Adam优化器结合最小化交叉熵模型损失函数不断更新所述生成对抗网络的参数,当达到规定的训练迭代次数或辨别器无法分辨真假即判别概率为0.5时停止训练,得到生成对抗网络模型;
故障预测单元,用于实时采集新的特征参数作为待测试数据,将所述待测试数据输入至所述生成对抗网络模型,对设备的特征参数做出短期预测、中期预测及长期预测三种方式的回归值预测,将所述预测后的值结合分类模型对设备状态进行二值化信号输出,进而判断设备的故障状态。
8.根据权利要求7所述的设备特征参数和故障率的预测系统,其特征在于,还包括,所述预测模型利用动态滑动窗技术,所述训练包括对所述规范化数据中各个参数的平稳波动部分进行跟踪。
9.一种计算机终端设备,其特征在于,包括:
一个或多个处理器;
存储器,与所述处理器耦接,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至6任一项所述的设备特征参数和故障率的预测方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的设备特征参数和故障率的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010616435.4A CN111930728B (zh) | 2020-06-30 | 2020-06-30 | 一种设备的特征参数和故障率的预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010616435.4A CN111930728B (zh) | 2020-06-30 | 2020-06-30 | 一种设备的特征参数和故障率的预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111930728A true CN111930728A (zh) | 2020-11-13 |
CN111930728B CN111930728B (zh) | 2023-11-24 |
Family
ID=73316283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010616435.4A Active CN111930728B (zh) | 2020-06-30 | 2020-06-30 | 一种设备的特征参数和故障率的预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111930728B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598188A (zh) * | 2020-12-29 | 2021-04-02 | 沃太能源南通有限公司 | 神经网络的生成方法、功率预测方法、装置和存储介质 |
CN113657623A (zh) * | 2021-07-13 | 2021-11-16 | 国网河北省电力有限公司电力科学研究院 | 电力设备状态诊断效果确定方法、装置、终端及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180336471A1 (en) * | 2017-05-19 | 2018-11-22 | Mehdi Rezagholizadeh | Semi-supervised regression with generative adversarial networks |
US20180357542A1 (en) * | 2018-06-08 | 2018-12-13 | University Of Electronic Science And Technology Of China | 1D-CNN-Based Distributed Optical Fiber Sensing Signal Feature Learning and Classification Method |
US20190155709A1 (en) * | 2017-11-21 | 2019-05-23 | Siemens Healthcare Gmbh | Automatic failure detection in magnetic resonance apparatuses |
CN110414601A (zh) * | 2019-07-30 | 2019-11-05 | 南京工业大学 | 基于深度卷积对抗网络的光伏组件故障诊断方法、系统及设备 |
CN110617966A (zh) * | 2019-09-23 | 2019-12-27 | 江南大学 | 一种基于半监督生成对抗网络的轴承故障诊断方法 |
CN110647923A (zh) * | 2019-09-04 | 2020-01-03 | 西安交通大学 | 小样本下基于自我学习的变工况机械故障智能诊断方法 |
CN111159416A (zh) * | 2020-04-02 | 2020-05-15 | 腾讯科技(深圳)有限公司 | 语言任务模型训练方法、装置、电子设备及存储介质 |
-
2020
- 2020-06-30 CN CN202010616435.4A patent/CN111930728B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180336471A1 (en) * | 2017-05-19 | 2018-11-22 | Mehdi Rezagholizadeh | Semi-supervised regression with generative adversarial networks |
US20190155709A1 (en) * | 2017-11-21 | 2019-05-23 | Siemens Healthcare Gmbh | Automatic failure detection in magnetic resonance apparatuses |
US20180357542A1 (en) * | 2018-06-08 | 2018-12-13 | University Of Electronic Science And Technology Of China | 1D-CNN-Based Distributed Optical Fiber Sensing Signal Feature Learning and Classification Method |
CN110414601A (zh) * | 2019-07-30 | 2019-11-05 | 南京工业大学 | 基于深度卷积对抗网络的光伏组件故障诊断方法、系统及设备 |
CN110647923A (zh) * | 2019-09-04 | 2020-01-03 | 西安交通大学 | 小样本下基于自我学习的变工况机械故障智能诊断方法 |
CN110617966A (zh) * | 2019-09-23 | 2019-12-27 | 江南大学 | 一种基于半监督生成对抗网络的轴承故障诊断方法 |
CN111159416A (zh) * | 2020-04-02 | 2020-05-15 | 腾讯科技(深圳)有限公司 | 语言任务模型训练方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
包萍;刘运节;: "不均衡数据集下基于生成对抗网络的改进深度模型故障识别研究", 电子测量与仪器学报, no. 03 * |
王静;邹慧敏;曲东东;白丽;: "基于经验模态分解生成对抗网络的金融时间序列预测", 计算机应用与软件, no. 05 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112598188A (zh) * | 2020-12-29 | 2021-04-02 | 沃太能源南通有限公司 | 神经网络的生成方法、功率预测方法、装置和存储介质 |
CN113657623A (zh) * | 2021-07-13 | 2021-11-16 | 国网河北省电力有限公司电力科学研究院 | 电力设备状态诊断效果确定方法、装置、终端及存储介质 |
CN113657623B (zh) * | 2021-07-13 | 2023-09-29 | 国网河北省电力有限公司电力科学研究院 | 电力设备状态诊断效果确定方法、装置、终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111930728B (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11334407B2 (en) | Abnormality detection system, abnormality detection method, abnormality detection program, and method for generating learned model | |
Lindemann et al. | Anomaly detection in discrete manufacturing using self-learning approaches | |
CN116757534B (zh) | 一种基于神经训练网络的智能冰箱可靠性分析方法 | |
US20200371491A1 (en) | Determining Operating State from Complex Sensor Data | |
CN112131212A (zh) | 基于集成学习技术面向混合云场景的时序数据异常预测方法 | |
CN113518011B (zh) | 异常检测方法和装置、电子设备及计算机可读存储介质 | |
US20240144043A1 (en) | Prediction model for predicting product quality parameter values | |
US11640328B2 (en) | Predicting equipment fail mode from process trace | |
CN111400850B (zh) | 设备故障分析方法、装置、设备和存储介质 | |
CN114091930B (zh) | 业务指标预警方法、装置、电子设备和存储介质 | |
CN111930728B (zh) | 一种设备的特征参数和故障率的预测方法及系统 | |
CN112416662A (zh) | 多时间序列数据异常检测方法与装置 | |
KR20190008515A (ko) | 개선된 sax 기법 및 rtc 기법을 이용한 공정 모니터링 장치 및 방법 | |
Sepe et al. | A physics-informed machine learning framework for predictive maintenance applied to turbomachinery assets | |
CN116306806A (zh) | 故障诊断模型确定方法、装置及非易失性存储介质 | |
CN114169460A (zh) | 样本筛选方法、装置、计算机设备和存储介质 | |
Jiang et al. | A timeseries supervised learning framework for fault prediction in chiller systems | |
Zhao et al. | Software reliability growth model based on fuzzy wavelet neural network | |
CN117785522A (zh) | 利用经训练机器学习模型执行根本原因分析的方法和系统 | |
Moon et al. | AD 2: Improving quality of IoT data through compressive anomaly detection | |
RU2699685C1 (ru) | Способ анализа и контроля состояния технической установки, содержащей множество динамических систем | |
Hu et al. | Online sequential extreme learning machines for fault detection | |
Egedorf et al. | Adverse condition and critical event prediction in cranfield multiphase flow facility | |
CN116451786A (zh) | 一种基于单变量时序数据生成知识点的方法 | |
CN116991137B (zh) | 一种面向概念漂移的可适应可解释的工控系统异常检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |