CN110969185A - 基于数据重构的设备异常状态检测方法 - Google Patents

基于数据重构的设备异常状态检测方法 Download PDF

Info

Publication number
CN110969185A
CN110969185A CN201910981585.2A CN201910981585A CN110969185A CN 110969185 A CN110969185 A CN 110969185A CN 201910981585 A CN201910981585 A CN 201910981585A CN 110969185 A CN110969185 A CN 110969185A
Authority
CN
China
Prior art keywords
data
distribution
probability
model
reconstruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910981585.2A
Other languages
English (en)
Inventor
刘井泉
曾聿赟
解光耀
张昊宇
刘正藩
秦楚晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhengan Ruihua Technology Co.,Ltd.
Original Assignee
Beijing Huaxin Vision Technology Co Ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huaxin Vision Technology Co Ltd, Tsinghua University filed Critical Beijing Huaxin Vision Technology Co Ltd
Priority to CN201910981585.2A priority Critical patent/CN110969185A/zh
Publication of CN110969185A publication Critical patent/CN110969185A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开了一种基于数据重构的设备异常状态检测方法,包括以下步骤:步骤10,离线基准工况重构模型训练,包括:数据收集;对收集的原始数据进行加工;将处理后的数据分为两个子集:模型训练集与模型测试集,基于训练数据和选定的建模算法建立信号重构模型;将训练得到的重构模型应用于测试集,得到模型预测值与实际工况观测值残差的分布;计算测试集残差分布的包括μ*、σ*2、90%分位点δ*的统计量;步骤20,在线实时状态监测与异常探测,具体如下:实时计算重构模型预测值和在线观测值的残差;统计异常判定时刻前一段固定时长内的预测残差;根据定义计算包括MF、VF、QF、PMF、PVF和QFP;得到单一部件实时运行状态的健康度指标。

Description

基于数据重构的设备异常状态检测方法
技术领域
本发明属于设备检测技术领域,具体涉及一种基于数据重构的设备异常状态检测方法。
背景技术
现有技术中,对于机械设备的故障检测及告警多采用设置固定阈值的方法,将设备的某一参数设定一阈值范围,在超过阈值时进行告警。阈值判定法最大的不足在于其阈值通常较为固定,多数情况下需要依赖专家或使用经验划定,判定条件单一,难以平衡虚警和漏警率。以SPRT方法为例,该方法中需要设定四个参数才能得出异常状态判断的上下阈值线,参数选择需要依赖使用者经验。此外,阈值判定法的情景适应能力通常较弱,在故障或异常的晚期识别效果较好,在早期故障识别方面尚难以取得理想的结果。
设备正常运行工况下,其一些状态监测参数之间存在一定的依赖关系,当异常发生时,参数的变化会与这一依赖关系所确定的变化范围发生较为显著的偏离。
发明内容
鉴于以上存在的技术问题,本发明用于提供一种基于数据重构的设备异常状态检测方法。
为解决上述技术问题,本发明采用如下的技术方案:
一种基于数据重构的设备异常状态检测方法,记部件正常运行状态下重构模型预测残差的分布为r*,其均值为μ*、方差为σ*2、90%分位点为δ*,记部件实时运行状态下重构模型预测残差的分布为r,其均值为μ、方差为σ2,包括以下步骤:
步骤10,离线基准工况重构模型训练,包括:
步骤101,数据收集,从当前设备或同类设备历史运行数据库中选取正常运行阶段的数据作为基准运行工况数据;
步骤102,对收集的原始数据进行加工,包括数据清洗、特征提取、特征选择和数据归一化;
步骤103,将处理后的数据分为两个子集:模型训练集与模型测试集,基于训练数据和选定的建模算法建立信号重构模型;
步骤104,将训练得到的重构模型应用于测试集,得到模型预测值与实际工况观测值残差的分布;
步骤105,计算测试集残差分布的包括均值μ*、方差σ*2、90%分位点δ*的统计量,存储计算的统计量,作为后续异常识别的参考基准;
步骤20,在线实时状态监测与异常探测,用于当信号重构模型和异常判定参考基准都已经准备完善,将模型部署在部件上开展实时状态监测与异常探测,具体步骤如下:
步骤201,实时计算重构模型预测值和在线观测值的残差;
步骤202,统计异常判定时刻点前一段固定时长内的预测残差,确保该固定时长内有足够的数据样本,计算预测残差的均值μ、方差σ2
步骤203,根据定义计算包括均值特征因子、方差特征因子、分位点特征因子、偏离概率、波动概率和显著概率的指标量;
步骤204,得到单一部件实时运行状态的健康度指标。
优选地,所述均值特征因子用于衡量预测残差分布均值偏离程度的标准分数,其定义公式如下:
Figure BDA0002235359290000021
优选地,偏离概率用于反映残差分布的均值偏离基准运行状态的概率,采用Z检验对偏离度指标均值特征因子MF进行概率转换,定义如公式如下:
PMF=2·Φ(MF)-1,
其中Φ(·)是标准正态分布的累计分布函数。
优选地,所述方差特征因子用于衡量预测残差分布方差偏离程度的F统计量,其定义公式如下:
Figure BDA0002235359290000031
优选地,所述波动概率用于反映残差分布的方差偏离基准运行状态的概率,选择F检验对方差特征因子VF进行概率转换,其定义公式如下:
PVF=F(VF,n,n*)
其中F(VF,n,n*)是F分布的累计分布函数,n是异常判定时刻点前选定时段内的样本数,n*是基准工况下重构模型建模时的测试样本数。
优选地,所述分位点特征因子用于衡量预测残差分布中大于某一设定阈值的样本的比例,其定义公式如下:
QF=P(r≥δ*|r∈r)。
优选地,所述显著概率反映残差分布中有较多大残差值出现时部件发生异常的概率,选取双曲正切函数tanh(·)作为分位点特征因子QF的激活函数,其定义公式如下:
Figure BDA0002235359290000032
显著概率QFPQF定义中的比例因子α由用户自己设定,其作用是抑制虚警率,α的数值越大,QFPQF的值越小,发生虚警的概率越低。
优选地,数据清洗中采用切比雪夫不等式方法剔除样本中异常点。
优选地,采用缩放法进行数据归一化。
优选地,进一步包括,通过上述方法得到设备N个部件的健康度指标HI,进而估计设备的整体健康度指标integral-HI,其定义公式如下:
Figure BDA0002235359290000033
其中HI1:N是设备中N个部件的健康度指标的集合,max(HI1:N,K)是指从N个健康度指标中选取数值最大的K个,根据使用经验,将K设定为2或3。
附图说明
图1为本发明实施例的基于数据重构的设备异常状态检测方法的步骤流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
参照图1,所示为本发明实施例的基于数据重构的设备异常状态检测方法的步骤流程图,基于重构模型的设备实时监测与异常探测方法框架,该框架可分为两大步骤:离线基准工况重构模型训练步骤、在线实时状态监测与异常探测步骤,记部件正常运行状态下重构模型预测残差的分布为r*,其均值为μ*、方差为σ*2、90%分位点为δ*,记部件实时运行状态下重构模型预测残差的分布为r,其均值为μ、方差为σ2,各步骤具体如下:
步骤10:离线基准工况重构模型训练,进一步包括:
步骤101,数据收集。从当前设备或同类设备历史运行数据库中选取正常运行阶段的数据作为基准运行工况数据;
步骤102,对收集的原始数据进行加工。主要包括数据清洗、特征提取(FeatureExtraction)、特征选择(Feature Selection)、数据归一化等;
步骤103,将处理后的数据分为两个子集:模型训练集与模型测试集,基于训练数据和选定的建模算法建立信号重构模型。这里需要注意,测试集里应该有足够的样本数,以确保后续基于测试集得到的测试残差相关统计量的可信度;
步骤104,将训练得到的重构模型应用于测试集,得到模型预测值与实际工况观测值残差的分布;
步骤105,计算测试集残差分布的均值μ*、方差σ*2、90%分位点δ*等统计量,将这些统计量存储下来,作为后续异常识别的参考基准。
步骤20:在线实时状态监测与异常探测。
当信号重构模型和异常判定参考基准都已经准备完善,接下来就可以将模型部署在部件上开展实时状态监测与异常探测,具体步骤如下:
步骤201,实时计算重构模型预测值和在线观测值的残差;
步骤202,统计异常判定时刻点前一段固定时长(如1小时,1天等)内的预测残差,确保该固定时长内有足够的数据样本,计算预测残差的均值μ、方差σ2
步骤203,根据定义计算包括均值特征因子MF、方差特征因子VF、分位点特征因子QF、偏离概率PMF、波动概率PVF和显著概率的指标量PQF等指标量;
步骤204,得到单一部件(单一观测信号)实时运行状态的健康度指标HI。
为了使本领域技术人员更好的理解本发明实施例的实施过程和有益效果,以下进一步结合具体应用场景进行说明。
为了提高重构模型法中异常判定在早期故障的识别、虚/漏警平衡上的不足,本发明实施例创新性的构建了一组可以高精度识别信号异常状态的指标体系。构建这些指标的基本假设在于认为部件正常运行状态下重构模型预测残差分布较为稳定,异常运行状态下重构模型预测残差的分布将和其正常运行状态下的残差分布不同,通过衡量重构模型预测残差分布的偏离程度来判定部件是否处于异常状态及其可能性或严重程度。
本发明实施例从三个维度来刻画重构模型预测残差的分布,分别是均值、方差和尾端分位点(如90%分位点、95%分位点等),并构建三个分布统计量(故障指标)来量化两个残差分布的偏离程度。记部件正常运行状态(基准工况)下重构模型预测残差的分布为r*,其均值为μ*、方差为σ*2、90%分位点为δ*,记部件实时运行状态下重构模型预测残差的分布为r,其均值为μ、方差为σ2,论文构建的部件健康状态衡量指标体系如下:
均值特征因子(Mean Feature,MF)用于衡量预测残差分布均值偏离程度的标准分数(standard score),其定义如公式(1)所示。
Figure BDA0002235359290000061
方差特征因子(Variance Feature,VF)用于衡量预测残差分布方差偏离程度的F统计量(F Statistic),其定义如公式(2)所示。
Figure BDA0002235359290000062
分位点特征因子(Quantile Factor,QF)用于衡量预测残差分布中大于某一设定阈值(如基准运行工况下重构模型预测残差分布的90%分位点δ*)的样本的比例,其定义如公式(3)所示。单一异常点的出现能够对分布的均值和方差产生较大影响,分位点特征因子QF的构建是为了克服残差分布中少数异常点的存在对均值特征因子MF和方差特征因子VF的影响,减少偶发异常点触发误报警。QF变大意味着预测残差分布中有更多的点发生了较大程度的偏离,运维人员将更有把握认为部件发生了异常。理想情况下,如果设定比较阈值为基准运行下残差分布的90%分位点δ*,则当部件运行在正常工况时分位点特征因子QF的数值应该稳定在0.1附近。
QF=P(r≥δ*|r∈r) (3)
均值特征因子MF、方差特征因子VF、分位点特征因子QF三个故障指标从不同的维度刻画了部件当前运行状态与基准运行状态的偏离程度,但是它们彼此之间是孤立的且彼此的量级差异可能较大,因而需要进一步构建能融合三个故障指标所含信息的统计量来全面反映部件的健康状态。为了能更好的实现信息的融合,本发明实施例中采用将MF、VF、QF三个指标进行概率转换的思路,从而方便指标的横向比较与融合。根据各故障指标的构成特点及其所反映的物理意义的不同,采用假设检验函数和激活函数的方式对故障指标进行概率转化,具体转换方式如下:
偏离概率(Probablistic Mean Feature,PMF)用于反映残差分布的均值偏离基准运行状态的概率。由于Z检验是均值假设检验中最常用的一种工具,本发明实施例也采用Z检验对均值特征因子MF进行概率转换。偏离概率PMF的定义如公式(4)所示,其中Φ(·)是标准正态分布的累计分布函数(cumulative distribution function,CDF)。
PMF=2·Φ(MF)-1 (4)
波动概率(Probabilistic Variance Feature,PVF),反映残差分布的方差偏离基准运行状态的概率。由于F检验常用于方差检验,本论文中选择F检验对方差特征因子VF进行概率转换。波动概率PVF的定义如公式(5)所示,其中F(VF,n,n*)是F分布的累计分布函数,n是异常判定时刻点前选定时段内的样本数,n*是基准工况下重构模型建模时的测试样本数。
PVF=F(VF,n,n*) (5)
显著概率(Probabilisitc Quantile Factor,PQF)用于反映残差分布中有较多大残差值出现时部件发生异常的概率。本发明实施例中选取双曲正切函数tanh(·)作为分位点特征因子QF的激活函数,主要原因有两个:一是tanh(·)函数是单调函数且当自变量为正时函数输出为不大于1的正数,二是当输入大于一定数值后该函数逐渐逼近1且增长的非常缓慢,这也意味着当残差分布中有一定数量的异常样本后基本就能认定部件确实发生了异常。显著概率PQF的定义如公式(6)所示。
Figure BDA0002235359290000071
显著概率PQF定义中的比例因子α可以由用户自己设定,其作用是抑制虚警率,因此也可以称为虚警抑制因子。虚警抑制因子α的数值越大,PQF的值越小,发生虚警的概率越低。α的值越大漏检率也会增加。通常情况下,为了平衡PQF对异常探测的灵敏度和对虚警的抑制,将α设为0.1(当δ*为90%分位点)或0.05(当δ*为95%分位点)。
将MF、VF和QF转化为表征异常状态发生概率的PMF、PVF、PQF后,对其进一步的信息融合就变得非常简单。本发明实施例中融合上述三个维度的信息构建了表征部件发生异常可能性的健康度指标(Health Index,HI),并用其作为表征不同部件故障严重程度的指标,HI的值越大表示发生异常的可能性越大。健康度指标的定义如公式(7)所示,这一定义既表征了部件发生异常的可能性也兼顾了对虚警的抑制。
HI=PMF*PVF*PQF (7)
将以上设置的技术方案应用于基于某电力集团风力发电机组轴承等旋转部件超温预警的实际应用场景案例进行验证。
风力发电机组是将风的机械能转换为电能的设备,一个风力发电机组的系统通常包括的部件依次是:叶片、主轴、齿轮箱高速转轴轴承、发电机驱动端轴承、风速仪、机舱、电力输出线、发电机非驱动端轴承、发电机、齿轮箱。此外,风力发电机组还包括偏航系统、液压系统、冷却系统等重要部件。
风力发电机组通常都安装有数据采集和监视控制(Supervisory Control andData Acquisition,SCADA)系统以实现对机组状态的掌握,SCADA能给出风电机组各监测参数的实时数据,并根据设定的报警阈值给出报警信号。在本案例所用机组的SCADA数据库中,存储有200多个观测信号过去数年的运行数据,这些信号的采样频率为每5分钟一次。SCADA系统为重构模型的建立提供了充足的样本数据,同时其给出的系统报警也为模型验证提供了比较基准。
发电机驱动端轴承温度超温停机(generator drive end bearing temperaturehigh stop,DETHS)故障是系统中常见的故障类型。故应用中从SCADA数据库众多的监测信号中挑选了与超温故障相关的信号,以期利用这些信号来建立正常状态的重构模型,这些信号既包括直接的温度信号,也包括与温度信号可能有关的功率、转速、偏航角度等信号,具体包括:发电机驱动端轴承温度、非驱动端轴承温度、齿轮箱高速轴承温度、齿轮箱油过滤器压力、主轴轴承温度、机舱温度、室外温度、输出功率、主轴转速和叶片偏转角度。
SCADA系统实际采集的信号中存在一定的噪声和异常点,在正式利用这些数据进行重构模型建模前需要对这些原始信号进行一定的处理,包括数据清洗、数据归一化、特征选择等,以提高数据利用的效率和模型计算速度、减少信息冗余。
(1)数据清洗
数据清洗(data cleansing)的目的是修正或剔除样本数据中不精确或不相关的记录,本发明实施例中选取切比雪夫不等式(Chebyshev inequality)方法作为剔除样本中异常点的技术手段。根据切比雪夫不等式,在任一个均值为μ、方差为σ2的数据集,至少有(1-1/λ2)比例的样本分布在均值的λ个标准差范围内(或者是不超过1/λ2比例的样本分布在远离均值的λ个标准差外的区间里)。本发明实施例中选取该方法的原因主要是因为切比雪夫不等式不对样本数据的分布做出假设,而当前大部分异常点剔除方法都假设数据样本分布是高斯分布。
Figure BDA0002235359290000091
切比雪夫不等式进行数据异常点去除的前提是确定信号的均值和方差,针对实时测量信号均值和方差不恒定的问题,本发明实施例采用自适应的信号均值和方差确定方式,即用当前时刻点前一段时间(如1周、1天、1小时)内的信号片段的均值和方差作为切比雪夫不等式的对应参数。
对于参考信号片段时长以及参数λ的选择,本发明实施例中基于正常运行工况下驱动端轴承温度信号的实际测量数据对比了几种不同参数组合下的数据异常点去除效果。λ越大、参考信号片段选取时长越短,异常点的判断标准较松,数据异常点剔除的比例越低,但这存在异常点仍未被全部清除的风险;λ越小、参考信号片段选取时长越长,异常点的判断标准越严格,数据异常点剔除的比例提升,但存在丢失部分正常数据的风险。实际的参数选择必须在这两种风险中取得一定的平衡,且要考虑到信号片段中有一定数量的样本保证参数的前后一致性。在发明实施例中选择了一组较为严格的参数组合用来数据异常点剔除,即设定参考信号片段时长为1周、设定λ=3。
(2)数据归一化
原始数据中各信号的类型和数值差异很大,甚至存在数个量级上的差异,直接采用这些数据进行建模时,量级小的信号存在被忽略的可能。数据归一化(datanormalization)的主要作用是将原始数据中各维度的信号都归一到统一的数值区间,方便数据间的横向比较。数据归一化的方式有很多种,缩放(rescaling)、均值归一化(meannormalization)、标准差归一化(standardization)等线性归一化和非线性归一化方法都可以采用,本发明实施例采用的数据归一化方法是缩放法,将所有的信号都缩放到[0 1]区间,具体的计算如公式(9),其中S表示单一信号的整个数据集,s表示原始数据,s*表示归一化后的数据。
Figure BDA0002235359290000101
(3)特征选择
为了减少模型复杂度、提高重构模型的建模效率,本发明实施例中还进一步采取了特征选择(feature selection)手段对上述初步挑选出来了的信号数据进行二次选择,从中选取一部分信号作为建模输入。采用了相关分析方法计算了驱动端轴承温度信号和其他信号间的相关关系,表3.3列出了驱动端轴承温度信号和其他信号之间的相关系数,并从高到低进行了排序,本发明实施例选取了相关度较高的7个信号作为建模的输入,分别是非驱动段轴承温度、主轴轴承温度、机舱温度、齿轮箱高速转轴轴承温度、齿轮箱油过滤器压力、叶片转速、输出功率、偏航角度等。
考虑到部件当前时刻的温度和其自身的历史温度也有一定的自相关性,在建模中需要将过往温度信息考虑进去。本发明实施例中采用了滑动时间窗的技术来将信号的历史信息考虑进去,来提高模型预测的精度。时间窗长度的选择可以通过对信号的自相关分析来确定。本发明实施例中选取的时间窗口长度为120分钟,一是因为超过120分钟后相关系数的变化逐渐平缓,二是更长的时间窗口将带来更多的模型输入维度,模型复杂度以及建模需要的计算时间和计算资源都会更大。
通过以上设置的本发明实施例提出的健康状态指标体系有以下优势:(1)相比于设定固定判定阈值的YES/NO式的异常判断方法,本发明实施例定义的健康度指标均为刻画异常发生可能性的概率量,能够为运维人员提供异常状态发生的可能性和时间演变信息,而不仅仅告诉运维人员当前是否发生异常,运维人员有一定的自主权来根据自身使用经验判定;(2)对于某一特定故障,不同维度的诊断指标能提供更多的异常判定依据,本发明实施例提出的概率化指标体系能够很容易的将各维度的诊断信息进行融合,同时兼顾虚警和漏警问题;(3)概率化的指标体系让不同部件间的比较更加直观,包括故障概率和时间先后,这在多个部件的报警信号同时出现时的优势更加明显,能够帮助运维人员快速定位故障点及故障顺序,及时找出根原因并给出故障诊断结果;(4)概率化的部件健康度指标能进一步融合成表征系统或设备整体健康状态的指标量,让系统的健康状态表征更加直观;(5)本发明实施例所提指标是通过判定是否偏离基准状态来识别异常,而不仅仅是当异常发展到一定程度时才触发报警,识别精度较高,使得对早期异常和细微异常的发现成为可能;(6)本发明实施例给出的异常判定指标中基本不需要设置或调整参数,对运行经验和专家知识的依赖程度很低,结果的可解释性更高。
实施例2
实施例1通过对设备单一部件的基于数据重构的设备异常状态检测方法进行了详细的说明。但对于一个设备或者系统,其往往包含多个部件,对于大多数的时间设备或系统都运行在正常状态,在工程实际应用中,首先最需要显示的是设备或系统整体的健康状态,而不需要同时对多个部件的实时状态进行显示。
对设备或系统整体的健康状态进行评估并得出其健康度指标有诸多的好处:一是方便同时对多个设备或包含多个设备的系统的监测跟踪,;二是部分单一监测信号的异常可能对设备的安全运行影响不大,但如果设备的多个监测信号出现异常则需要引起重视,监测系统需要具备融合分析多个信号的能力;三是某一故障的出现可能会同时触发多个报警信号,短时间内多个报警信号的出现可能会运维人员的决策判断造成干扰,需要对这些单一信号进行合理的组织以避免信息干扰。
在实施例1单一部件健康状态监测的基础上,实施例2提出一种适用于设备或系统整体健康状态监测的方法。该方法的核心是构建基于单一部件健康度指标的设备整体健康度指标(integral Health Index,integral-HI),部件健康度指标HI的计算可以直接参考实施例1的方法,整体健康度指标integral-HI的计算如公式(10)所示,其中HI1:N是设备中N个部件的健康度指标的集合,max(HI1:N,K)是指从N个健康度指标中选取数值最大的K个。根据使用经验,推荐将K设定为2或3。
Figure BDA0002235359290000121
应当理解,本文所述的示例性实施例是说明性的而非限制性的。尽管结合附图描述了本发明的一个或多个实施例,本领域普通技术人员应当理解,在不脱离通过所附权利要求所限定的本发明的精神和范围的情况下,可以做出各种形式和细节的改变。

Claims (10)

1.一种基于数据重构的设备异常状态检测方法,其特征在于,记部件正常运行状态下重构模型预测残差的分布为r*,其均值为μ*、方差为σ*2、90%分位点为δ*,记部件实时运行状态下重构模型预测残差的分布为r,其均值为μ、方差为σ2,包括以下步骤:
步骤10,离线基准工况重构模型训练,包括:
步骤101,数据收集,从当前设备或同类设备历史运行数据库中选取正常运行阶段的数据作为基准运行工况数据;
步骤102,对收集的原始数据进行加工,包括数据清洗、特征提取、特征选择和数据归一化;
步骤103,将处理后的数据分为两个子集:模型训练集与模型测试集,基于训练数据和选定的建模算法建立信号重构模型;
步骤104,将训练得到的重构模型应用于测试集,得到模型预测值与实际工况观测值残差的分布;
步骤105,计算测试集残差分布的包括均值μ*、方差σ*2、90%分位点δ*的统计量,存储计算的统计量,作为后续异常识别的参考基准;
步骤20,在线实时状态监测与异常探测,用于当信号重构模型和异常判定参考基准都已经准备完善,将模型部署在部件上开展实时状态监测与异常探测,具体步骤如下:
步骤201,实时计算重构模型预测值和在线观测值的残差;
步骤202,统计异常判定时刻点前一段固定时长内的预测残差,确保该固定时长内有足够的数据样本,计算预测残差的均值μ、方差σ2和分位点;
步骤203,根据定义计算包括均值特征因子、方差特征因子、分位点特征因子、偏离概率、波动概率和显著概率的指标量;
步骤204,得到单一部件实时运行状态的健康度指标。
2.如权利要求1所述的基于数据重构的设备异常状态检测方法,其特征在于,所述均值特征因子用于衡量预测残差分布均值偏离程度的标准分数,其定义公式如下:
Figure FDA0002235359280000021
3.如权利要求2所述的基于数据重构的设备异常状态检测方法,其特征在于,偏离概率用于反映残差分布的均值偏离基准运行状态的概率,采用Z检验对偏离度指标均值特征因子MF进行概率转换,定义如公式如下:
PMF=2·Φ(MF)-1,
其中Φ(·)是标准正态分布的累计分布函数。
4.如权利要求1所述的基于数据重构的设备异常状态检测方法,其特征在于,所述方差特征因子用于衡量预测残差分布方差偏离程度的F统计量,其定义公式如下:
Figure FDA0002235359280000022
5.如权利要求4所述的基于数据重构的设备异常状态检测方法,其特征在于,所述波动概率用于反映残差分布的方差偏离基准运行状态的概率,选择F检验对方差特征因子VF进行概率转换,其定义公式如下:
PVF=F(VF,n,n*)
其中F(VF,n,n*)是F分布的累计分布函数,n是异常判定时刻点前选定时段内的样本数,n*是基准工况下重构模型建模时的测试样本数。
6.如权利要求1所述的基于数据重构的设备异常状态检测方法,其特征在于,所述分位点特征因子用于衡量预测残差分布中大于某一设定阈值的样本的比例,其定义公式如下:
QF=P(r≥δ*|r∈r)。
7.如权利要求6所述的基于数据重构的设备异常状态检测方法,其特征在于,所述显著概率反映残差分布中有较多大残差值出现时部件发生异常的概率,选取双曲正切函数tanh(·)作为分位点特征因子QF的激活函数,其定义公式如下:
Figure FDA0002235359280000031
显著概率PQF定义中的比例因子α由用户自己设定,其作用是抑制虚警率,α的数值越大,PQF的值越小,发生虚警的概率越低。
8.如权利要求1所述的基于数据重构的设备异常状态检测方法,其特征在于,数据清洗中采用切比雪夫不等式方法剔除样本中异常点。
9.如权利要求1所述的基于数据重构的设备异常状态检测方法,其特征在于,采用缩放法进行数据归一化。
10.如权利要求1至10任一所述的基于数据重构的设备异常状态检测方法,进一步包括,通过上述方法得到设备N个部件的健康度指标HI,进而估计设备的整体健康度指标integral-HI,其定义公式如下:
Figure FDA0002235359280000032
其中HI1:N是设备中N个部件的健康度指标的集合,max(HI1:N,K)是指从N个健康度指标中选取数值最大的K个,根据使用经验,将K设定为2或3。
CN201910981585.2A 2019-10-16 2019-10-16 基于数据重构的设备异常状态检测方法 Pending CN110969185A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910981585.2A CN110969185A (zh) 2019-10-16 2019-10-16 基于数据重构的设备异常状态检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910981585.2A CN110969185A (zh) 2019-10-16 2019-10-16 基于数据重构的设备异常状态检测方法

Publications (1)

Publication Number Publication Date
CN110969185A true CN110969185A (zh) 2020-04-07

Family

ID=70029665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910981585.2A Pending CN110969185A (zh) 2019-10-16 2019-10-16 基于数据重构的设备异常状态检测方法

Country Status (1)

Country Link
CN (1) CN110969185A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111881617A (zh) * 2020-07-02 2020-11-03 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及系统
CN112308391A (zh) * 2020-10-22 2021-02-02 清华大学 一种基于神经网络的设备状态实时监测与异常探测方法
CN113671904A (zh) * 2020-05-13 2021-11-19 Tcl科技集团股份有限公司 机台监测方法、装置、机台、可读存储介质及终端设备
CN113790766A (zh) * 2021-11-15 2021-12-14 江苏未来智慧信息科技有限公司 电厂智慧侦测系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6892163B1 (en) * 2002-03-08 2005-05-10 Intellectual Assets Llc Surveillance system and method having an adaptive sequential probability fault detection test
CN105719002A (zh) * 2016-01-18 2016-06-29 重庆大学 一种基于组合预测的风电机组状态参数异常辨识方法
CN108051211A (zh) * 2017-12-29 2018-05-18 湖南优利泰克自动化系统有限公司 一种风电机组主轴承温度预警诊断方法
CN109298697A (zh) * 2018-11-13 2019-02-01 远光软件股份有限公司 基于动态基线模型的火电厂系统各部件工作状态评估方法
CN109458308A (zh) * 2018-12-28 2019-03-12 中国大唐集团新能源科学技术研究院有限公司 风机主轴超温预警方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6892163B1 (en) * 2002-03-08 2005-05-10 Intellectual Assets Llc Surveillance system and method having an adaptive sequential probability fault detection test
CN105719002A (zh) * 2016-01-18 2016-06-29 重庆大学 一种基于组合预测的风电机组状态参数异常辨识方法
CN108051211A (zh) * 2017-12-29 2018-05-18 湖南优利泰克自动化系统有限公司 一种风电机组主轴承温度预警诊断方法
CN109298697A (zh) * 2018-11-13 2019-02-01 远光软件股份有限公司 基于动态基线模型的火电厂系统各部件工作状态评估方法
CN109458308A (zh) * 2018-12-28 2019-03-12 中国大唐集团新能源科学技术研究院有限公司 风机主轴超温预警方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CHUNZHEN YANG 等: "Real-time condition monitoring and fault detection of components based on machine-learning reconstruction model", 《RENEWABLE ENERGY》 *
FRANCISCO SERDIO等: "Improved fault detection employing hybrid memetic fuzzy modeling and adaptive filters", 《APPLIED SOFT COMPUTING》 *
安学利等: "抽水蓄能电站机组异常状态检测模型研究", 《水电能源科学》 *
郭鹏等: "多变量风电机组功率曲线建模与监测研究", 《电网技术》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113671904A (zh) * 2020-05-13 2021-11-19 Tcl科技集团股份有限公司 机台监测方法、装置、机台、可读存储介质及终端设备
CN113671904B (zh) * 2020-05-13 2022-09-06 Tcl科技集团股份有限公司 机台监测方法、装置、机台、可读存储介质及终端设备
CN111881617A (zh) * 2020-07-02 2020-11-03 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及系统
CN111881617B (zh) * 2020-07-02 2024-03-26 上海电气风电集团股份有限公司 数据处理方法、风力发电机组的性能评估方法及系统
CN112308391A (zh) * 2020-10-22 2021-02-02 清华大学 一种基于神经网络的设备状态实时监测与异常探测方法
CN113790766A (zh) * 2021-11-15 2021-12-14 江苏未来智慧信息科技有限公司 电厂智慧侦测系统及方法

Similar Documents

Publication Publication Date Title
CN110414155B (zh) 一种带有单测点的风机部件温度异常检测和报警方法
CN110969185A (zh) 基于数据重构的设备异常状态检测方法
CN111597682B (zh) 预测风力机齿轮箱轴承剩余寿命的方法
Cui et al. An anomaly detection approach based on machine learning and scada data for condition monitoring of wind turbines
CN110414154B (zh) 一种带有双测点的风机部件温度异常检测和报警方法
CN111415070A (zh) 一种基于scada数据的风电机组齿轮箱油温过温故障预警方法
CN110763997A (zh) 一种同步电机定子早期故障预警方法
Butler et al. A feasibility study into prognostics for the main bearing of a wind turbine
CN111103137A (zh) 基于深度神经网络的风力涡轮机齿轮箱故障诊断方法
CN112487910A (zh) 核电汽轮机系统故障预警方法及系统
CN114841580A (zh) 基于混合注意力机制的发电机故障检测方法
CN112633614A (zh) 一种基于特征提取的实时故障程度诊断系统及方法
CN112308391A (zh) 一种基于神经网络的设备状态实时监测与异常探测方法
CN115877205A (zh) 一种伺服电机的故障智能诊断系统及其诊断方法
CN111563685B (zh) 一种基于自联想核回归算法的发电设备状态预警方法
CN117195121A (zh) 基于改进对抗自动编码器的风电机组异常状态识别方法及系统
De Oliveira-Filho et al. Condition monitoring of wind turbine main bearing using SCADA data and informed by the principle of energy conservation
US11339763B2 (en) Method for windmill farm monitoring
CN116070368A (zh) 一种海上风电机组高速轴承剩余寿命预测方法
CN115326393A (zh) 一种基于温度信息的风电机组轴承对故障诊断方法
Souza et al. Evaluation of data based normal behavior models for fault detection in wind turbines
CN114819261A (zh) 一种基于设备实时运行状态的故障预测方法及系统
Zhang Comparison of data-driven and model-based methodologies of wind turbine fault detection with SCADA data
Zhang et al. Health status characterization and RUL prediction method of escalator bearing based on VMD-GRU
Qian et al. Condition monitoring of turbine generator using stator winding temperature

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201104

Address after: 100084 Tsinghua University, Beijing, Haidian District

Applicant after: TSINGHUA University

Address before: 100084 Tsinghua University, Beijing, Haidian District

Applicant before: TSINGHUA University

Applicant before: Beijing Huaxin Vision Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210425

Address after: 100190 cg05-232, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing

Applicant after: Beijing Zhengan Ruihua Technology Co.,Ltd.

Address before: 100084 Tsinghua University, Beijing, Haidian District

Applicant before: TSINGHUA University

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200407