CN110874584B - 一种基于改进原型聚类的叶片故障诊断方法 - Google Patents
一种基于改进原型聚类的叶片故障诊断方法 Download PDFInfo
- Publication number
- CN110874584B CN110874584B CN201911147507.9A CN201911147507A CN110874584B CN 110874584 B CN110874584 B CN 110874584B CN 201911147507 A CN201911147507 A CN 201911147507A CN 110874584 B CN110874584 B CN 110874584B
- Authority
- CN
- China
- Prior art keywords
- sample
- sample points
- points
- samples
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Abstract
本发明提出一种基于改进原型聚类的叶片故障诊断方法,方法包括:首先将采集到的叶片的声音信号利用梅尔倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)法提取样本点,找到欧式距离最大两点;然后以这两点为参照点对样本点进行聚类得到不同集合;将不同集合取交集并计算交集样本的中心点,再将样本原型聚类为两类样本点并设置标签;刻画样本标签类别时序图以此诊断叶片是否发生故障。同时构建样本类别概率矩阵,并定义相应的评价指标来判断叶片故障的可信度。本发明对原型聚类的聚类方法进行了改进,使得样本的聚类更加准确,能够提高叶片故障诊断的准确性,而且本发明还建立了相应的评价指标,以此来判断叶片发生故障的可信度大小。
Description
技术领域
本发明涉及一种基于改进原型聚类方法的叶片故障诊断方法及其评价指标,在对样本进行原型聚类时,对聚类中心的选取进行改进使得样本聚类更加准确,可以提高故障诊断的精确性,并定义评价指标以此判定叶片发生故障的可信度,本发明属于故障诊断技术领域。
背景技术
风电场叶片长期运行在恶劣的露天环境中,经常会出现开裂、表面脱落、磨蚀等故障,叶片的这些故障不但会影响风机捕获风能的效率,还会降低叶片的使用寿命,增加运维的成本。
目前基于声音信号的叶片的故障诊断具有潜在的应用价值,国内外研究中针对叶片的故障诊断步骤总体上分为两步,第一步是利用信号处理的理论算法从风机叶片的声音信号中提取特征信息,第二步则是利用神经网络、SVM、聚类等机器学习的智能算法将声音信号分类,实现叶片的故障诊断。在将声音信号进行分类时常用的方法有原型聚类方法等,但是原型聚类在选取聚类中心时是随机选取,计算缓慢而且最终的分类准确性不高,而本发明对原有的原型聚类方法进行改进,提高了分类准确性从而提高了故障诊断的精度,并建立了相应的评价指标来判断叶片发生故障的可信度。
发明内容
本发明旨在研究一种改进原型聚类的叶片故障诊断方法及其评价指标,首先利用MFCC法处理声音信号得到样本点,之后通过计算欧氏距离、计算皮尔逊系数、利用K_means方法进行聚类的方法对样本点进行处理并找到处理后的两个中心样本点,以得到的中心样本点作为聚类中心,利用K均值原型聚类法对样本点分类并设置标签,之后在时域上刻画样本类别标签时序图,根据周期性诊断风机叶片是否故障。根据聚类结果建立具有周期性的样本类别的概率矩阵,并建立相应的评价指标判断风机叶片发生故障的可信度。
本发明采用的技术方案是:
一种基于改进原型聚类的叶片故障诊断方法,该方法包括:
步骤1.获取叶片声音信号,利用MFCC法从待测叶片声音信号中提取特征向量矩阵,得到全部的S个样本点,分别计算S个样本点中任意两个样本点的欧氏距离,并找到欧氏距离最大的两个样本点,记为A1点和B1点;
步骤2.将欧氏距离最大两点作为参照点计算剩余S-2个样本点与A1点和B1点的皮尔逊系数,并利用K_means法对样本点进行聚类,与A1点相关性大的样本点聚为一类构成集合Mb,与A1点相关性小的样本点聚为一类构成集合Ms,与B1点相关性大样本点的聚为一类构成集合Nb,与B1点相关性小的样本点聚为一类构成集合Ns;
步骤3.将集合Mb与集合Ns取交集得到新的集合M,将集合Ms与集合Nb取交集得到新的集合N,分别将集合M和N中的样本点求和并取平均值,得到集合M和集合N中的中心样本点;
步骤4.以两个中心样本点作为聚类中心,利用K均值原型聚类法对步骤1得到的S个样本点分为两类并设置标签,刻画样本的类别标签时序图,根据时序图的周期性诊断叶片是否故障,如果时序图的类别有突变,则叶片可能发生故障。
一种叶片故障诊断可信度评价方法,该方法是:
步骤1.将叶片声音信号进行特征向量提取后的所有样本点分成具有周期性的K组样本,每个周期都有K个样本点,每组样本个数为λ,根据故障诊断方法确定标签为1和标签为2的各自样本数量,各组样本中用标签为1的样本个数除以λ得到该周期性样本被划分为类别1的概率pi1,i=1,2......K,同理用标签为2的样本个数除以λ得到该周期性样本被划分为类别2的概率pi2,i=1,2......K,依照此原则建立样本的类别概率矩阵,其中矩阵大小为K*2;类别1和类别2中一个为故障类,一个为非故障类;
步骤2.定义评价指标m,判定叶片发生故障的可信度;
m计算公式为:
m的值越接近0,则样本的分类准确度越低,样本的周期性越不明显,叶片发生故障的可信度越低;相反,m的值越接近1,则样本的分类准确度越高,样本的周期性越明显,样本发生故障的可信度越高。
与现有技术相比,本发明的有益效果是:在利用K均值原型聚类法对样本聚类时,不再随机选取聚类中心,而是通过对样本进行处理直接找到两个样本中心点作为聚类中心,与传统的原型聚类方法相比,提高了聚类的准确度。另外在对样本进行聚类时,有些样本的聚类结果可能是错误的,从而对叶片是否故障产生错误判断,因此定义相应的评价指标,评价值越低,说明错误分类的样本越多,则叶片发生故障的可信度越低,降低叶片故障误诊的可能性。本发明故障诊断可信度评价方法可以用于现有技术中其他叶片故障诊断中,能评价现有方法是否可行。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明公开的一种基于改进原型聚类的叶片故障诊断方法及其评价流程图;
图2为改进原型聚类前的样本聚类图;
图3为改进原型聚类后的样本聚类图;
图4为改进原型聚类前的样本类别标签时序图;
图5为改进原型聚类后的样本类别标签时序图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明一种基于改进原型聚类的叶片故障诊断方法流程图,其步骤包括:
步骤1.通过录音设备获取叶片声音信号,利用已有的声音特征提取技术梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)法处理叶片声音信号并提取特征向量矩阵,得到全部的S个样本点以及每个周期的样本点个数K。在二维空间中分别计算S个样本中任意两个样本的欧氏距离,欧氏距离的计算公式如下:
式中,d为欧氏距离的值,x1,y1为第一个样本点的横纵坐标,x2,y2为第二个样本点的横纵坐标。将计算得到的所有欧氏距离的值进行比较,找到欧氏距离最大的两个样本点,并记为A1点和B1点。
步骤2.分别将A1点和B1点作为参照点,计算剩余S-2个样本点与A1点和B1点的皮尔逊相关系数。根据所得到的系数,利用K_means法对样本点进行聚类,与A1点相关性大的样本点聚为一类构成集合Mb,与A1点相关性小的样本点聚为一类构成集合Ms,与B1点相关性大样本点的聚为一类构成集合Nb,与B1点相关性小的样本点聚为一类构成集合Ns。
步骤3.将集合Mb与集合Ns取交集得到新的集合M,将集合Ms与集合Nb取交集得到新的集合N。集合M,N的计算公式如下:
M=(Mb∩Ns)
N=(Ms∩Nb)
分别将集合M和N中的样本点求和并取平均值,得到集合M和集合N中的中心样本点。
步骤4.将得到的两个中心样本点作为聚类中心,对步骤1得到的S个样本点利用K均值原型聚类法分为两类,记为类别1与类别2。将类别1中的样本点设置标签为1,类别2中的样本点设置标签为2,类别1和类别2中一个为故障类,一个为非故障类;在时域上按照时间刻画S个样本的类别标签的时序图,根据时序图的周期性诊断叶片是否故障,如果时序图的类别有突变,则叶片可能发生故障。图5中时序图周期性明显,由类别1突变为类别2,说明叶片发生故障。
一种叶片故障诊断可信度评价方法,该方法是:
步骤1.每个周期都有K个样本点,将所有的样本点分成具有周期性K组样本,每组样本个数为λ。各组样本中用标签为1的样本个数除以λ得到该周期性样本被划分为类别1的概率pi1(i=1,2......K),同理用标签为2的样本个数除以λ得到该周期性样本被划分为类别2的概率pi2(i=1,2......K),依照此原则建立样本的类别概率矩阵,其中矩阵大小为K*2。
步骤2.定义评价指标m,m计算公式如下:
m的值越接近0,则样本的周期性越不明显,样本的分类准确度越低,叶片发生故障的可信度越低。相反,m的值越接近1,则样本的分类准确度越高,样本的周期性越明显,样本发生故障的可信度越高。
实验分析:
从图2可以看出K均值原型聚类法改进之前,重合的样本点较多,分类准确度较低,而从图3可以看出,将K均值原型聚类法进行改进后,样本点的分类更加准确,重合点大大减少,准确度提高。从图4可以看出改进K均值原型聚类之前,样本标签时序图较混乱,故障诊断方法分类准确性较低,而从图5可以看出改进原型聚类后,样本分类准确度较高,样本标签时序图更具有周期性,以上都符合实验的预期要求。改进K均值原型聚类之前,计算出的评价指标m的值为0.5,改进后计算出m的值为0.7,叶片发生故障的可信度提高,同样符合实验的预期结果。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本发明未述及之处适用于现有技术。
Claims (2)
1.一种基于改进原型聚类的叶片故障诊断方法,该方法包括:
步骤1.获取叶片声音信号,利用MFCC法从待测叶片声音信号中提取特征向量矩阵,得到全部的S个样本点,分别计算S个样本点中任意两个样本点的欧氏距离,并找到欧氏距离最大的两个样本点,记为A1点和B1点;
步骤2.将欧氏距离最大两点作为参照点计算剩余S-2个样本点与A1点和B1点的皮尔逊系数,并利用K_means法对样本点进行聚类,与A1点相关性大的样本点聚为一类构成集合Mb,与A1点相关性小的样本点聚为一类构成集合Ms,与B1点相关性大样本点的聚为一类构成集合Nb,与B1点相关性小的样本点聚为一类构成集合Ns;
步骤3.将集合Mb与集合Ns取交集得到新的集合M,将集合Ms与集合Nb取交集得到新的集合N,分别将集合M和N中的样本点求和并取平均值,得到集合M和集合N中的中心样本点;
步骤4.以两个中心样本点作为聚类中心,利用K均值原型聚类法对步骤1得到的S个样本点分为两类并设置标签,刻画样本的类别标签时序图,根据时序图的周期性诊断叶片是否故障,如果时序图的类别有突变,则叶片可能发生故障。
2.一种叶片故障诊断可信度评价方法,该方法是:
步骤1.将叶片声音信号进行特征向量提取后的所有样本点分成具有周期性的K组样本,每个周期都有K个样本点,每组样本个数为λ,根据权利要求1所述的故障诊断方法确定标签为1和标签为2的各自样本数量,各组样本中用标签为1的样本个数除以λ得到该周期性样本被划分为类别1的概率pi1,i=1,2......K,同理用标签为2的样本个数除以λ得到该周期性样本被划分为类别2的概率pi2,i=1,2......K,依照此原则建立样本的类别概率矩阵,其中矩阵大小为K*2;类别1和类别2中一个为故障类,一个为非故障类;
步骤2.定义评价指标m,判定叶片发生故障的可信度;
m计算公式为:
m的值越接近0,则样本的分类准确度越低,样本的周期性越不明显,叶片发生故障的可信度越低;相反,m的值越接近1,则样本的分类准确度越高,样本的周期性越明显,样本发生故障的可信度越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911147507.9A CN110874584B (zh) | 2019-11-21 | 2019-11-21 | 一种基于改进原型聚类的叶片故障诊断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911147507.9A CN110874584B (zh) | 2019-11-21 | 2019-11-21 | 一种基于改进原型聚类的叶片故障诊断方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110874584A CN110874584A (zh) | 2020-03-10 |
CN110874584B true CN110874584B (zh) | 2021-08-31 |
Family
ID=69717185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911147507.9A Active CN110874584B (zh) | 2019-11-21 | 2019-11-21 | 一种基于改进原型聚类的叶片故障诊断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110874584B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113933012B (zh) * | 2021-10-14 | 2024-01-30 | 西安现代控制技术研究所 | 基于K-means聚类的螺旋桨转速测量方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102741882B (zh) * | 2010-11-29 | 2015-11-25 | 松下电器(美国)知识产权公司 | 图像分类装置、图像分类方法、集成电路、模型制作装置 |
CN103984746B (zh) * | 2014-05-26 | 2017-03-29 | 西安电子科技大学 | 基于半监督分类与区域距离测度的sar图像识别方法 |
WO2019028269A2 (en) * | 2017-08-02 | 2019-02-07 | Strong Force Iot Portfolio 2016, Llc | METHODS AND SYSTEMS FOR DETECTION IN AN INDUSTRIAL ENVIRONMENT OF COLLECTING INTERNET DATA FROM OBJECTS WITH LARGE DATA SETS |
CN106600138A (zh) * | 2016-12-09 | 2017-04-26 | 贵州大学 | 一种二次设备风险评估方法 |
CN106951915B (zh) * | 2017-02-23 | 2020-02-21 | 南京航空航天大学 | 一种基于类别置信度的一维距离像多分类器融合识别法 |
CN109255333B (zh) * | 2018-09-25 | 2022-01-28 | 内蒙古工业大学 | 一种大型风电机组滚动轴承故障混合诊断方法 |
CN110232398A (zh) * | 2019-04-24 | 2019-09-13 | 广东交通职业技术学院 | 一种基于Canopy+Kmeans聚类的路网子区划分及其评估方法 |
CN110259648B (zh) * | 2019-07-05 | 2020-10-09 | 河北工业大学 | 一种基于优化K-means聚类的风机叶片故障诊断方法 |
-
2019
- 2019-11-21 CN CN201911147507.9A patent/CN110874584B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110874584A (zh) | 2020-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109102005B (zh) | 基于浅层模型知识迁移的小样本深度学习方法 | |
CN109582003B (zh) | 基于伪标签半监督核局部费舍尔判别分析轴承故障诊断方法 | |
CN111914883B (zh) | 一种基于深度融合网络的主轴轴承状态评估方法及装置 | |
CN113935406B (zh) | 基于对抗流模型的机械设备无监督故障诊断方法 | |
CN101907681A (zh) | 基于gsd_svdd的模拟电路动态在线故障诊断方法 | |
CN110259648B (zh) | 一种基于优化K-means聚类的风机叶片故障诊断方法 | |
WO2008148289A1 (fr) | Système et procédé d'identification audio intelligents | |
CN112990286A (zh) | 一种数据不平衡场景下的恶意流量检测方法 | |
CN111667135B (zh) | 一种基于典型特征提取的负荷结构解析方法 | |
CN113298128B (zh) | 基于时间序列聚类的云服务器异常检测方法 | |
CN110161388A (zh) | 一种高压设备的故障类型识别方法及其系统 | |
CN109030790A (zh) | 一种电力变压器故障诊断方法和装置 | |
CN111398798B (zh) | 基于振动信号区间特征提取的断路器储能状态辨识方法 | |
CN108803555B (zh) | 一种基于性能监测数据的亚健康在线识别和诊断方法 | |
CN116796271A (zh) | 一种居民用能异常识别方法 | |
CN110874584B (zh) | 一种基于改进原型聚类的叶片故障诊断方法 | |
CN111833175A (zh) | 基于knn算法的互联网金融平台申请欺诈行为检测方法 | |
CN115345255A (zh) | 一种故障诊断方法、控制装置、终端及存储介质 | |
CN110569888A (zh) | 基于有向无环图支持向量机的变压器故障诊断方法及装置 | |
CN112860183B (zh) | 基于高阶矩匹配的多源蒸馏-迁移机械故障智能诊断方法 | |
CN109000924B (zh) | 一种基于k均值的滚珠丝杠副状态监测方法 | |
CN104809328A (zh) | 一种基于信息瓶颈的变压器故障诊断方法 | |
CN111061626B (zh) | 基于神经元激活频率分析的测试用例优先级排序方法 | |
CN115982621A (zh) | 一种基于时间卷积网络的旋转机械剩余使用寿命预测方法 | |
CN112014821B (zh) | 一种基于雷达宽带特征的未知车辆目标识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |