CN114492588A - 一种火电厂辅机设备故障识别方法、系统、设备和存储介质 - Google Patents

一种火电厂辅机设备故障识别方法、系统、设备和存储介质 Download PDF

Info

Publication number
CN114492588A
CN114492588A CN202111637049.4A CN202111637049A CN114492588A CN 114492588 A CN114492588 A CN 114492588A CN 202111637049 A CN202111637049 A CN 202111637049A CN 114492588 A CN114492588 A CN 114492588A
Authority
CN
China
Prior art keywords
fault
data
sample
historical
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111637049.4A
Other languages
English (en)
Inventor
邓中乙
徐民
陈俊
毛刘军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datang Boiler Pressure Vessel Examination Center Co Ltd
East China Electric Power Test Institute of China Datang Corp Science and Technology Research Institute Co Ltd
Original Assignee
Datang Boiler Pressure Vessel Examination Center Co Ltd
East China Electric Power Test Institute of China Datang Corp Science and Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datang Boiler Pressure Vessel Examination Center Co Ltd, East China Electric Power Test Institute of China Datang Corp Science and Technology Research Institute Co Ltd filed Critical Datang Boiler Pressure Vessel Examination Center Co Ltd
Priority to CN202111637049.4A priority Critical patent/CN114492588A/zh
Publication of CN114492588A publication Critical patent/CN114492588A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • G06F2218/06Denoising by applying a scale-space analysis, e.g. using wavelet analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明提供了一种火电厂辅机设备故障识别方法,包括,采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;对故障数据进行小波分解重构;对重构后的历史故障数据进行聚类;对历史数据进行归一化处理;对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。本发明通过小波分解重构,滤除高频噪声,还原故障数据的真实表征,然后将故障数据进行无监督分类,之后再通过参数的变化值和实际值两个维度比对待识别数据和历史故障数据,考虑了不同区间参数表征不同且就参数本身与变化值两方面分析,提高分类结果的准确性,能够准确的判断待识别数据的故障类型。

Description

一种火电厂辅机设备故障识别方法、系统、设备和存储介质
技术领域
本发明涉及火力发电技术领域,尤其涉及一种火电厂辅机设备故障识别方法、系统、设备和存储介质。
背景技术
火电厂辅机设备是影响锅炉安全运行的重要因素,随着信息技术发展,电厂DCS系统产生大量设备运行参数,如何高效处理、分析这些数据资源是进一步提高电站管理水平、保障安全运行的重要手段。
设备的异常或故障是在设备运行过程中通过运行参数的变化表现出来的,以设备运行过程出现的主要异常或故障为线索,获得反映设备状态的特征参数,可以有效评估设备的运行状态。辅机故障发生后因数据表征不明确,故障发生时间过短等原因,现场运行人员难以第一时间判别故障类型并展开针对性应对措施。
因煤质变化、转动机械磨损、长期烟气、风粉冲刷等影响,磨煤机、风机等辅机设备容易发生例如磨煤机堵磨、粉管漏粉、风机轴承温度高、风机叶片损坏、x、y方向轴瓦振动异常等辅机运行故障,严重影响了燃煤机组安全稳定运行。对于磨煤机的故障,现有技术中已经提出了大量的识别方法,如公开号为CN112215286A的发明专利申请公开的一种基于小波分解重构及近邻算法的磨煤机运行状态判别方法,然而目前并没有有效的方法能够识别辅机设备的故障。
发明内容
本发明所要解决的技术问题在于提供一种针对火电厂辅机设备进行故障识别的方法。
本发明是通过以下技术方案解决上述技术问题的:一种火电厂辅机设备故障识别方法,包括,
S1:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
S2:对故障数据进行小波分解,对分解后的低频信号进行重构;
S3:对重构后的历史故障数据进行聚类;
S4:对历史数据进行归一化处理;
S5:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
本发明通过小波分解重构,滤除高频噪声,还原故障数据的真实表征,然后将故障数据进行无监督分类,之后再通过参数的变化值和实际值两个维度比对待识别数据和历史故障数据,考虑了不同区间参数表征不同且就参数本身与变化值两方面分析,提高分类结果的准确性,能够准确的判断待识别数据的故障类型。
优选的,所述的小波分解和重构方法包括,
步骤i:对每一项参数x(t),共计n项,添加项生成分解特征矩阵,进行5次分解,新生成特征矩阵x(t)′共计n+10项,其中x(t)′前5项依次为x(t)5,x(t)4,x(t)3,x(t)2,x(t)1,中间n项为x(t)且顺序不变,最后5项依次为x(t)n,x(t)n-1,x(t)n-2,x(t)n-3,x(t)n-4,其中,x(t)1表示x(t)中的第1项;
步骤ii:定义低频分解滤波器Lo_D矩阵与高频分解滤波器Hi_D矩阵,“db3”小波Lo_D=[0.0352,-0.0854,-0.1350,0.4599,0.8069,0.3327],Hi_D=[-0.3327,0.8069,-0.4599, -0.1350,0.0854,0.0352],使用“valid”方式对x(t)′与Lo_D进行卷积,卷积结果x1L(t)共计(n+5)/2项,x1L(t)为1层低频分解信号;
步骤iii:使用步骤ii中的方法继续对x1L(t)再进行4层小波分解,获取x2L(t),x3L(t),x4L(t), x5L(t);
步骤iv:对5层低频分解信号x5L(t)进行小波重构,定义重构特征矩阵为x5L(t)′,x5L(t)′中偶数项为0,奇数项为x5L(t)不变;
步骤v:定义重构低频滤波器Lo_R=[0.3327,0.8069,0.4599,-0.1350,-0.0854,0.0352],重构高频滤波器Hi_R=[0.0352,0.0854,-0.1350,-0.4599,0.8069,-0.3327],使用“full”方式对x5L(t)′与 Lo_R进行卷积,得到x4L(t)′,x5L(t)′共有a项,x4L(t)′共有b项,计算D=(a-b)/2,令C为 D最小整数部分,E为D最大整数部分,计算F=a-E;获取x4L(t)′中由C项开始至F项结束项生成4层重构低频信号x4(t)″;
步骤vi:再重复步骤iv和v进行4次分解重构,依次获得x3(t)″,x2(t)″,x1(t)″,x(t)″;其中x(t)″即为对x(t)进行5层小波分解重构后得到的结果。
优选的,使用k-means算法对历史故障数据进行聚类,方法为,
随机选择k个初始质心;将所有样本分别分配到距离最近的质心所属的簇中;更新质心为每个簇中所有样本的平均值;重新对样本进行聚类,直到更新前后所有簇中的元素不再变化。
优选的,在不同的质心数k下,分别对故障数据进行聚类,然后分别计算不同质心数k 下的聚类轮廓系数S(i),
Figure RE-GDA0003532766400000031
其中,a(i)代表样本i到同簇其他样本的平均距离;b(i)代表样本i到其他簇的样本平均距离;S(i)接近1,说明样本聚类合理;S(i)接近-1,说明样本i更应该被分到另外的簇;S(i)接近0,说明样本i在两个簇边界上;
对所有样本的轮廓系数进行求和,数值最高的结果对应的质心数k及其分类结果即为最优聚类结果。
优选的,所述k-means聚类的分类数为k∈[3,25]。
优选的,所述归一化处理的方法为,
Figure RE-GDA0003532766400000032
其中,x(t)″max和x(t)″min别为x(t)″中各项参数的最大值和最小值。
优选的,通过随机森林算法对待识别故障数据进行分类匹配识别,方法为,
步骤a:将样本数据分为训练集和测试集,有放回的选取训练集内的N个样本构成样本集Dt={Z1,Z2......,ZN},其中,Zj为样本的归一化特征向量,j=1,2,···,N,总共选取T个样本集,构建T棵决策树,即t=1,2,···,T;
步骤b:对归一化特征向量Zj随机选择u个划分特征,设第v个划分特征为WV∈[1,n],并对每个划分特征随机选择一个阈值δv,其中v=1,2,···,u;判断Zt[WV]是否小于δv,若小于δv,则将Zt划分到根节点的左子节点集
Figure RE-GDA0003532766400000033
中,否则划分到根节点的右子节点子集
Figure RE-GDA0003532766400000034
中;
步骤c:针对第v种划分特征,计算其基尼系数,计算公式如下:
Figure RE-GDA0003532766400000035
其中
Figure RE-GDA0003532766400000036
Figure RE-GDA0003532766400000037
的纯度用基尼值来度量,数据集Gini()计算公式如下:
Figure RE-GDA0003532766400000041
Figure RE-GDA0003532766400000042
其中γ为故障的类别总数,pz为第z类样本所占的比例,z=1,2,···,γ;
步骤d:在u种划分方式中,选取基尼系数最小的作为最优划分方式,标记为v*,是最优划分特征WV*及其相应最佳阈值δv*的序号,
Figure RE-GDA0003532766400000043
Figure RE-GDA0003532766400000044
分别为该根节点的左右子节点子集,简单记为
Figure RE-GDA0003532766400000045
Figure RE-GDA0003532766400000046
步骤e:当决策树深度大于等于d时,不再对子节点进行划分,当决策树深度小于d时,如果
Figure RE-GDA0003532766400000047
包含样本个数小于阈值ε,或
Figure RE-GDA0003532766400000048
属于同一类别,则
Figure RE-GDA0003532766400000049
作为叶子节点不再划分;如果
Figure RE-GDA00035327664000000410
中的样本数超过阈值ε,或者
Figure RE-GDA00035327664000000411
中包括至少两个类别的数据,则重复步骤c和d,直到所有叶子节点不再划分;对右子节点
Figure RE-GDA00035327664000000412
进行同样的操作。
步骤f:将第t棵决策树上的叶子节点记为xt,其分类概率计算公式如下:
Figure RE-GDA00035327664000000413
其中,Y是xt样本所包含的样本个数,yu是属于第u类故障的样本个数;
步骤g:综合T棵决策树的分析结果,样本属于第u类故障的概率H(u)的计算公式如下:
Figure RE-GDA00035327664000000414
其中,ht(u)为第t棵决策树上分类概率计算结果
Figure RE-GDA00035327664000000416
步骤h:判断测试样本属于第c类分类,其置信概率为H(c),公式如下,
c=argmax(H(u))
其中,argmax表示返回最大置信概率的分类;
步骤i:计算分类结果的准确率gi
Figure RE-GDA00035327664000000415
其中,ei为测试集中被正确分类的数目,Ei为该组合中测试集样本总数;
步骤j:通过公式τi=argmax(gi)找出准确率最高的随机森林模型,并输出对应的模型。
本发明还提供了一种火电厂辅机设备故障识别系统,包括,
样本采集模块:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
分解重构模块:对故障数据进行小波分解,对分解后的低频信号进行重构;
聚类模块:对重构后的历史故障数据进行聚类;
归一化模块:对历史数据进行归一化处理;
分类匹配模块:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
本发明还提供了一种电子处理设备,包括至少一个处理器和存储有至少一个执行程序的存储装置,当所述至少一个执行程序被所述至少一个处理器执行,所述至少一个处理器实现如所述的辅机设备故障识别方法。
本发明还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时能够实现所述的辅机设备故障识别方法。
本发明提供的火电厂辅机设备故障识别方法、系统、设备和存储介质的优点在于:通过小波分解重构,滤除高频噪声,还原故障数据的真实表征,然后将故障数据进行无监督分类,之后再通过参数的变化值和实际值两个维度比对待识别数据和历史故障数据,考虑了不同区间参数表征不同且就参数本身与变化值两方面分析,提高分类结果的准确性,能够准确的判断待识别数据的故障类型,摆脱对运行人员经验的依赖。
附图说明
图1为本发明的实施例提供的火电厂辅机设备故障识别方法的流程图;
图2为本发明的实施例提供的火电厂辅机设备故障识别方法对电流聚类的轮廓系数变化图;
图3为本发明的实施例提供的火电厂辅机设备故障识别方法对给煤量聚类的轮廓系数变化图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本实施例公开了一种火电厂辅机设备故障识别方法,包括,
S1:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
S2:对故障数据进行小波分解,对分解后的低频信号进行重构;
S3:对重构后的历史故障数据进行聚类;
S4:对历史数据进行归一化处理;
S5:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
本实施例通过小波分解重构,滤除高频噪声,还原故障数据的真实表征,然后将故障数据进行无监督分类,之后再通过参数的变化值和实际值两个维度比对待识别数据和历史故障数据,考虑了不同区间参数表征不同且就参数本身与变化值两方面分析,提高分类结果的准确性,能够准确的判断待识别数据的故障类型。
具体的,本实施例提供的火电厂辅机设备故障识别方法包括,
S1:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
本实施例分析的故障包括异物导致磨煤机本体振动大、粉管漏粉和堵磨;选取的磨煤机参数包括:电流(A)、给煤量(t/h)、进口风压(KPa)、磨煤机差压(KPa)、进口风温(℃)、出口风温(℃)、进口风量(t/h)、负荷(MW)、1粉管风速(m/s)、2粉管风速(m/s)、3粉管风速(m/s)、4粉管风速(m/s)、轴承x方向振动(mm)、磨辊温度1(℃)、磨辊温度2(℃)、磨辊温度3(℃)、磨本体CO浓度(ppm)、密封风压(KPa)、密封风一次风差压(KPa)、磨辊加载油压反馈共计20项。
S2:对故障数据进行小波分解,对分解后的低频信号进行重构,具体方法为:
步骤i:对每一项参数x(t),共计n项,添加项生成分解特征矩阵,进行5次分解,新生成特征矩阵x(t)′共计n+10项,其中x(t)′前5项依次为x(t)5,x(t)4,x(t)3,x(t)2,x(t)1,中间n项为x(t)且顺序不变,最后5项依次为x(t)n,x(t)n-1,x(t)n-2,x(t)n-3,x(t)n-4,其中,x(t)1表示x(t)中的第1项;
步骤ii:定义低频分解滤波器Lo_D矩阵与高频分解滤波器Hi_D矩阵,“db3”小波Lo_D=[0.0352,-0.0854,-0.1350,0.4599,0.8069,0.3327],Hi_D=[-0.3327,0.8069,-0.4599, -0.1350,0.0854,0.0352],使用“valid”方式对x(t)′与Lo_D进行卷积,卷积结果x1L(t)共计(n+5)/2项,x1L(t)为1层低频分解信号;
步骤iii:使用步骤ii中的方法继续对x1L(t)再进行4层小波分解,获取x2L(t),x3L(t),x4L(t), x5L(t);
步骤iv:对5层低频分解信号x5L(t)进行小波重构,定义重构特征矩阵为x5L(t)′,x5L(t)′中偶数项为0,奇数项为x5L(t)不变;
步骤v:定义重构低频滤波器Lo_R=[0.3327,0.8069,0.4599,-0.1350,-0.0854,0.0352],重构高频滤波器Hi_R=[0.0352,0.0854,-0.1350,-0.4599,0.8069,-0.3327],使用“full”方式对x5L(t)′与 Lo_R进行卷积,得到x4L(t)′,x5L(t)′共有a项,x4L(t)′共有b项,计算D=(a-b)/2,令C为 D最小整数部分,E为D最大整数部分,计算F=a-E;获取x4L(t)′中由C项开始至F项结束项生成4层重构低频信号x4(t)″;
步骤vi:再重复步骤iv和v进行4次分解重构,依次获得x3(t)″,x2(t)″,x1(t)″,x(t)″;其中x(t)″即为对x(t)进行5层小波分解重构后得到的结果。
本实施例中小波分解共进行5层分解,这是根据数据特征来确定的,对于其他数据类型,可根据经验确定分解层数,一般分解5~10层。
S3:对重构后的历史故障数据进行聚类;本实施例中选择k-means算法进行无监督的分类,方法为,随机选择k个初始质心;将所有样本分别分配到距离最近的质心所属的簇中;更新质心为每个簇中所有样本的平均值;重新对样本进行聚类,直到更新前后所有簇中的元素不再变化。为了得到最优的分类结果,在不同的分类数k下分别进行聚类,具体的,分类数的取值为k∈[3,25],对聚类结果,分别计算轮廓系数S(i),
Figure RE-GDA0003532766400000071
其中,a(i)代表样本i到同簇其他样本的平均距离;b(i)代表样本i到其他簇的样本平均距离;S(i)接近1,说明样本聚类合理;S(i)接近-1,说明样本i更应该被分到另外的簇;S(i)接近0,说明样本i在两个簇边界上;对所有样本的轮廓系数进行求和,数值最高的结果对应的质心数k及其分类结果即为最优聚类结果。
对于电流和给煤量两个参数进行聚类的结果参考图2和图3,从图2可以得出,当电流聚类的质心数为6时,轮廓系数最高,图3可以看出,当给煤量聚类的质心数为3时,轮廓系数最高,各聚类区间参考下表,
1 2 3 4 5 6
电流(A) 0~10.32 10.32~19.14 19.14~25.26 25.26~31.44 31.44~38.29 >38.29
给煤量(t/h) 0~17.67 17.67~32.53 >32.53
表1,电流、给煤量聚类区间
根据电流与给煤量分类区间,将历史故障数据分为18个区间,各区间划分方式如下表,
Figure RE-GDA0003532766400000072
Figure RE-GDA0003532766400000081
表2,历史故障数据区间划分
S4:对历史数据进行归一化处理;方式为,
Figure RE-GDA0003532766400000082
其中,x(t)″max和x(t)″min别为x(t)″中各项参数的最大值和最小值。
S5:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
数据分类可使用现有技术中的支持向量机、xgboost、k-近邻、BP神经网络等常规的分类算法实现,本实施例选择随机森林算法,具体方法为,
步骤a:将样本数据分为训练集和测试集,有放回的选取训练集内的N个样本构成样本集Dt={Z1,Z2......,ZN},其中,Zj为样本的归一化特征向量,j=1,2,···,N,总共选取T个样本集,构建T棵决策树,即t=1,2,···,T;
步骤b:对归一化特征向量Zj随机选择u个划分特征,设第v个划分特征为WV∈[1,n],并对每个划分特征随机选择一个阈值δv,其中v=1,2,···,u;判断Zt[WV]是否小于δv,若小于δv,则将Zt划分到根节点的左子节点集
Figure RE-GDA0003532766400000091
中,否则划分到根节点的右子节点子集
Figure RE-GDA0003532766400000092
中,
步骤c:针对第v种划分特征,计算其基尼系数,计算公式如下:
Figure RE-GDA0003532766400000093
其中
Figure RE-GDA0003532766400000094
Figure RE-GDA0003532766400000095
的纯度用基尼值来度量,数据集Gini()计算公式如下:
Figure RE-GDA0003532766400000096
其中γ为故障的类别总数,pz为第z类样本所占的比例,z=1,2,···,γ;
步骤d:在u种划分方式中,选取基尼系数最小的作为最优划分方式,标记为v*,是最优划分特征WV*及其相应最佳阈值δv*的序号,
Figure RE-GDA0003532766400000097
Figure RE-GDA0003532766400000098
分别为该根节点的左右子节点子集,简单记为
Figure RE-GDA0003532766400000099
Figure RE-GDA00035327664000000910
步骤e:当决策树深度大于等于d时,不再对子节点进行划分,当决策树深度小于d时,如果
Figure RE-GDA00035327664000000911
包含样本个数小于阈值ε,或
Figure RE-GDA00035327664000000912
属于同一类别,则
Figure RE-GDA00035327664000000913
作为叶子节点不再划分;如果
Figure RE-GDA00035327664000000914
中的样本数超过阈值ε,或者
Figure RE-GDA00035327664000000915
中包括至少两个类别的数据,则重复步骤c和d,直到所有叶子节点不再划分;对右子节点
Figure RE-GDA00035327664000000916
进行同样的操作。
步骤f:将第t棵决策树上的叶子节点记为xt,其分类概率计算公式如下:
Figure RE-GDA00035327664000000917
其中,Y是xt样本所包含的样本个数,yu是属于第u类故障的样本个数;
步骤g:综合T棵决策树的分析结果,样本属于第u类故障的概率H(u)的计算公式如下:
Figure RE-GDA00035327664000000918
其中,ht(u)为第t棵决策树上分类概率计算结果
Figure RE-GDA00035327664000000919
步骤h:判断测试样本属于第c类分类,其置信概率为H(c),公式如下,
c=argmax(H(u))
其中,argmax表示返回最大置信概率的分类;
步骤i:计算分类结果的准确率gi
Figure RE-GDA00035327664000000920
其中,ei为测试集中被正确分类的数目,Ei为该组合中测试集样本总数;
步骤j:通过公式τi=argmax(gi)找出准确率最高的随机森林模型,并输出对应的模型。
本实施例通过python算法对磨煤机历史故障数据按4:1分为训练集和测试集,分别根据每秒变化值和实际值进行分类测试模型的准确率,验证结果如下表,
Figure RE-GDA0003532766400000101
表3,火电厂辅机故障测试集分类结果
由此可见通过随机森林方法对数据进行分类的准确率达到92%以上,综合每秒变化值和实际值共同进行判定的情况下,准确率高达93%,能够满足故障识别的需求。
实施例2
本实施例还提供了一种火电厂辅机设备故障识别系统,包括,
样本采集模块:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
分解重构模块:对故障数据进行小波分解,对分解后的低频信号进行重构;
聚类模块:对重构后的历史故障数据进行聚类;
归一化模块:对历史数据进行归一化处理;
分类匹配模块:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
实施例3
本实施例还提供了一种电子处理设备,包括至少一个处理器和存储有至少一个执行程序的存储装置,当所述至少一个执行程序被所述至少一个处理器执行,所述至少一个处理器如下方法:
S1:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
S2:对故障数据进行小波分解,对分解后的低频信号进行重构;
S3:对重构后的历史故障数据进行聚类;
S4:对历史数据进行归一化处理;
S5:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
实施例4
本实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时能够实现如下方法:
S1:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
S2:对故障数据进行小波分解,对分解后的低频信号进行重构;
S3:对重构后的历史故障数据进行聚类;
S4:对历史数据进行归一化处理;
S5:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种火电厂辅机设备故障识别方法,其特征在于:包括,
S1:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
S2:对故障数据进行小波分解,对分解后的低频信号进行重构;
S3:对重构后的历史故障数据进行聚类;
S4:对历史数据进行归一化处理;
S5:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
2.根据权利要求1所述的一种火电厂估计设备故障识别方法,其特征在于:所述的小波分解和重构方法包括,
步骤i:对每一项参数x(t),共计n项,添加项生成分解特征矩阵,进行5次分解,新生成特征矩阵x(t)′共计n+10项,其中x(t)′前5项依次为x(t)5,x(t)4,x(t)3,x(t)2,x(t)1,中间n项为x(t)且顺序不变,最后5项依次为x(t)n,x(t)n-1,x(t)n-2,x(t)n-3,x(t)n-4,其中,x(t)1表示x(t)中的第1项;
步骤ii:定义低频分解滤波器Lo_D矩阵与高频分解滤波器Hi_D矩阵,“db3”小波Lo_D=[0.0352,-0.0854,-0.1350,0.4599,0.8069,0.3327],Hi_D=[-0.3327,0.8069,-0.4599,-0.1350,0.0854,0.0352],使用“valid”方式对x(t)′与Lo_D进行卷积,卷积结果x1L(t)共计(n+5)/2项,x1L(t)为1层低频分解信号;
步骤iii:使用步骤ii中的方法继续对x1L(t)再进行4层小波分解,获取x2L(t),x3L(t),x4L(t),x5L(t);
步骤iv:对5层低频分解信号x5L(t)进行小波重构,定义重构特征矩阵为x5L(t)′,x5L(t)′中偶数项为0,奇数项为x5L(t)不变;
步骤v:定义重构低频滤波器Lo_R=[0.3327,0.8069,0.4599,-0.1350,-0.0854,0.0352],重构高频滤波器Hi_R=[0.0352,0.0854,-0.1350,-0.4599,0.8069,-0.3327],使用“full”方式对x5L(t)′与Lo_R进行卷积,得到x4L(t)′,x5L(t)′共有a项,x4L(t)′共有b项,计算D=(a-b)/2,令C为D最小整数部分,E为D最大整数部分,计算F=a-E;获取x4L(t)′中由C项开始至F项结束项生成4层重构低频信号x4(t)″;
步骤vi:再重复步骤iv和v进行4次分解重构,依次获得x3(t)″,x2(t)″,x1(t)″,x(t)″;其中x(t)″即为对x(t)进行5层小波分解重构后得到的结果。
3.根据权利要求1所述的一种火电厂辅机设备故障识别方法,其特征在于:使用k-means算法对历史故障数据进行聚类,方法为,
随机选择k个初始质心;将所有样本分别分配到距离最近的质心所属的簇中;更新质心为每个簇中所有样本的平均值;重新对样本进行聚类,直到更新前后所有簇中的元素不再变化。
4.根据权利要求3所述的一种火电厂辅机设备故障识别方法,其特征在于:在不同的质心数k下,分别对故障数据进行聚类,然后分别计算不同质心数k下的聚类轮廓系数S(i),
Figure FDA0003441953350000021
其中,a(i)代表样本i到同簇其他样本的平均距离;b(i)代表样本i到其他簇的样本平均距离;S(i)接近1,说明样本聚类合理;S(i)接近-1,说明样本i更应该被分到另外的簇;S(i)接近0,说明样本i在两个簇边界上;
对所有样本的轮廓系数进行求和,数值最高的结果对应的质心数k及其分类结果即为最优聚类结果。
5.根据权利要求3所述的一种火电厂辅机设备故障识别方法,其特征在于:所述k-means聚类的分类数为k∈[3,25]。
6.根据权利要求1所述的一种火电厂辅机设备故障识别方法,其特征在于:所述归一化处理的方法为,
Figure FDA0003441953350000022
其中,x(t)″max和x(t)″min别为x(t)″中各项参数的最大值和最小值。
7.根据权利要求1所述的一种火电厂辅机设备故障识别方法,其特征在于:通过随机森林算法对待识别故障数据进行分类匹配识别,方法为,
步骤a:将样本数据分为训练集和测试集,有放回的选取训练集内的N个样本构成样本集Dt={Z1,Z2......,ZN},其中,Zj为样本的归一化特征向量,j=1,2,···,N,总共选取T个样本集,构建T棵决策树,即t=1,2,···,T;
步骤b:对归一化特征向量Zj随机选择u个划分特征,设第v个划分特征为WV∈[1,n],并对每个划分特征随机选择一个阈值δv,其中v=1,2,···,u;判断Zt[WV]是否小于δv,若小于δv,则将Zt划分到根节点的左子节点集
Figure FDA0003441953350000031
中,否则划分到根节点的右子节点子集
Figure FDA0003441953350000032
中;
步骤c:针对第v种划分特征,计算其基尼系数,计算公式如下:
Figure FDA0003441953350000033
其中
Figure FDA0003441953350000034
Figure FDA0003441953350000035
的纯度用基尼值来度量,数据集Gini()计算公式如下:
Figure FDA0003441953350000036
其中γ为故障的类别总数,pz为第z类样本所占的比例,z=1,2,···,γ;
步骤d:在u种划分方式中,选取基尼系数最小的作为最优划分方式,标记为v*,是最优划分特征WV*及其相应最佳阈值δv*的序号,
Figure FDA0003441953350000037
Figure FDA0003441953350000038
分别为该根节点的左右子节点子集,简单记为
Figure FDA0003441953350000039
Figure FDA00034419533500000310
步骤e:当决策树深度大于等于d时,不再对子节点进行划分,当决策树深度小于d时,如果
Figure FDA00034419533500000311
包含样本个数小于阈值ε,或
Figure FDA00034419533500000312
属于同一类别,则
Figure FDA00034419533500000313
作为叶子节点不再划分;如果
Figure FDA00034419533500000314
中的样本数超过阈值ε,或者
Figure FDA00034419533500000315
中包括至少两个类别的数据,则重复步骤c和d,直到所有叶子节点不再划分;对右子节点
Figure FDA00034419533500000316
进行同样的操作。
步骤f:将第t棵决策树上的叶子节点记为xt,其分类概率计算公式如下:
Figure FDA00034419533500000317
其中,Y是xt样本所包含的样本个数,yu是属于第u类故障的样本个数;
步骤g:综合T棵决策树的分析结果,样本属于第u类故障的概率H(u)的计算公式如下:
Figure FDA00034419533500000318
其中,ht(u)为第t棵决策树上分类概率计算结果
Figure FDA00034419533500000319
步骤h:判断测试样本属于第c类分类,其置信概率为H(c),公式如下,
c=argmax(H(u))
其中,argmax表示返回最大置信概率的分类;
步骤i:计算分类结果的准确率gi
Figure FDA0003441953350000041
其中,ei为测试集中被正确分类的数目,Ei为该组合中测试集样本总数;
步骤j:通过公式τi=argmax(gi)找出准确率最高的随机森林模型,并输出对应的模型。
8.一种火电厂辅机设备故障识别系统,其特征在于:包括,
样本采集模块:采集历史故障时刻的辅机运行参数,并根据故障类型对数据进行标注;
分解重构模块:对故障数据进行小波分解,对分解后的低频信号进行重构;
聚类模块:对重构后的历史故障数据进行聚类;
归一化模块:对历史数据进行归一化处理;
分类匹配模块:对聚类后的历史故障数据与待识别故障数据基于运行参数的变化值和实际值进行分类匹配,输出故障类型。
9.一种电子处理设备,其特征在于:包括至少一个处理器和存储有至少一个执行程序的存储装置,当所述至少一个执行程序被所述至少一个处理器执行,所述至少一个处理器实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于:所述计算机程序被处理器执行时能够实现如权利要求1-7任一项所述的方法。
CN202111637049.4A 2021-12-29 2021-12-29 一种火电厂辅机设备故障识别方法、系统、设备和存储介质 Pending CN114492588A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111637049.4A CN114492588A (zh) 2021-12-29 2021-12-29 一种火电厂辅机设备故障识别方法、系统、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111637049.4A CN114492588A (zh) 2021-12-29 2021-12-29 一种火电厂辅机设备故障识别方法、系统、设备和存储介质

Publications (1)

Publication Number Publication Date
CN114492588A true CN114492588A (zh) 2022-05-13

Family

ID=81508724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111637049.4A Pending CN114492588A (zh) 2021-12-29 2021-12-29 一种火电厂辅机设备故障识别方法、系统、设备和存储介质

Country Status (1)

Country Link
CN (1) CN114492588A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115169709A (zh) * 2022-07-18 2022-10-11 华能汕头海门发电有限责任公司 一种基于数据驱动的电站辅机故障诊断方法及系统
CN115545085A (zh) * 2022-11-04 2022-12-30 南方电网数字电网研究院有限公司 微弱故障电流的故障类型识别方法、装置、设备和介质
CN116430015A (zh) * 2023-03-09 2023-07-14 华能山东发电有限公司白杨河发电厂 一种电厂辅机用油监测方法及系统
CN117112448A (zh) * 2023-10-18 2023-11-24 浙江东安检测技术有限公司 基于森林算法的软件测试故障定位方法、系统及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104792520A (zh) * 2015-04-09 2015-07-22 中山火炬职业技术学院 风力发电机组齿轮箱故障诊断方法
CN109142317A (zh) * 2018-08-29 2019-01-04 厦门大学 一种基于随机森林模型的拉曼光谱物质识别方法
CN109490704A (zh) * 2018-10-16 2019-03-19 河海大学 一种基于随机森林算法的配电网故障区段定位方法
CN109754110A (zh) * 2017-11-03 2019-05-14 株洲中车时代电气股份有限公司 一种牵引变流器故障的预警方法及系统
CN110501122A (zh) * 2019-08-19 2019-11-26 重庆大学 一种基于聚类的压力容器自适应泄漏检测方法
CN112215286A (zh) * 2020-10-13 2021-01-12 中国大唐集团科学技术研究院有限公司华东电力试验研究院 基于小波分解重构及近邻算法的磨煤机运行状态判别方法
CN113408068A (zh) * 2021-06-18 2021-09-17 浙江大学 一种随机森林分类的机泵故障诊断方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104792520A (zh) * 2015-04-09 2015-07-22 中山火炬职业技术学院 风力发电机组齿轮箱故障诊断方法
CN109754110A (zh) * 2017-11-03 2019-05-14 株洲中车时代电气股份有限公司 一种牵引变流器故障的预警方法及系统
CN109142317A (zh) * 2018-08-29 2019-01-04 厦门大学 一种基于随机森林模型的拉曼光谱物质识别方法
CN109490704A (zh) * 2018-10-16 2019-03-19 河海大学 一种基于随机森林算法的配电网故障区段定位方法
CN110501122A (zh) * 2019-08-19 2019-11-26 重庆大学 一种基于聚类的压力容器自适应泄漏检测方法
CN112215286A (zh) * 2020-10-13 2021-01-12 中国大唐集团科学技术研究院有限公司华东电力试验研究院 基于小波分解重构及近邻算法的磨煤机运行状态判别方法
CN113408068A (zh) * 2021-06-18 2021-09-17 浙江大学 一种随机森林分类的机泵故障诊断方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115169709A (zh) * 2022-07-18 2022-10-11 华能汕头海门发电有限责任公司 一种基于数据驱动的电站辅机故障诊断方法及系统
CN115545085A (zh) * 2022-11-04 2022-12-30 南方电网数字电网研究院有限公司 微弱故障电流的故障类型识别方法、装置、设备和介质
CN116430015A (zh) * 2023-03-09 2023-07-14 华能山东发电有限公司白杨河发电厂 一种电厂辅机用油监测方法及系统
CN117112448A (zh) * 2023-10-18 2023-11-24 浙江东安检测技术有限公司 基于森林算法的软件测试故障定位方法、系统及介质
CN117112448B (zh) * 2023-10-18 2024-01-30 浙江东安检测技术有限公司 基于森林算法的软件测试故障定位方法、系统及介质

Similar Documents

Publication Publication Date Title
CN114492588A (zh) 一种火电厂辅机设备故障识别方法、系统、设备和存储介质
US20210041862A1 (en) Malfunction early-warning method for production logistics delivery equipment
CN112116058B (zh) 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法
CN109213121B (zh) 一种风机制动系统卡缸故障诊断方法
CN110795690A (zh) 风电场运行异常数据检测方法
CN107728059A (zh) 一种变桨系统状态评估方法
CN111582406A (zh) 一种电力设备状态监测数据聚类方法和系统
CN117148045A (zh) 配电网运行状态的故障研判管理系统
CN115021679A (zh) 一种基于多维离群点检测的光伏设备故障检测方法
CN113128567A (zh) 一种基于用电量数据的异常用电行为识别方法
CN109948738B (zh) 涂装烘干室的能耗异常检测方法、装置
CN114386452B (zh) 核电循环水泵太阳轮故障检测方法
Sharma et al. A semi-supervised generalized vae framework for abnormality detection using one-class classification
CN117113264B (zh) 一种实时在线的污水厂溶解氧仪表异常检测的方法
CN117171544B (zh) 基于多通道融合卷积神经网络的电机振动故障诊断方法
CN112215286B (zh) 基于小波分解重构及近邻算法的磨煤机运行状态判别方法
US20080091715A1 (en) Method and system of creating health operating envelope for dynamic systems by unsupervised learning of a sequence of discrete event codes
CN111623905A (zh) 风电机组轴承温度预警方法及装置
Hempelmann et al. Evaluation of unsupervised anomaly detection approaches on photovoltaic monitoring data
CN116433049A (zh) 一种基于模糊粗糙熵的用电异常检测方法
CN115905992A (zh) 一种电力数据预处理方法、系统、存储介质及计算设备
Rahman et al. Multiple classifier system for automated quality assessment of marine sensor data
Sato et al. Degradation estimation of turbines in wind farm using denoising autoencoder model
CN113378116A (zh) 一种航空发动机载荷谱载荷等级临界值确定方法
CN117948295A (zh) 一种实时在线的污水厂鼓风机异常检测的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220513