CN110805534A - 一种风力发电机的故障检测方法、装置及设备 - Google Patents
一种风力发电机的故障检测方法、装置及设备 Download PDFInfo
- Publication number
- CN110805534A CN110805534A CN201911128793.4A CN201911128793A CN110805534A CN 110805534 A CN110805534 A CN 110805534A CN 201911128793 A CN201911128793 A CN 201911128793A CN 110805534 A CN110805534 A CN 110805534A
- Authority
- CN
- China
- Prior art keywords
- data
- main characteristic
- characteristic variables
- fault
- preset threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F03—MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
- F03D—WIND MOTORS
- F03D17/00—Monitoring or testing of wind motors, e.g. diagnostics
Abstract
本发明公开了一种风力发电机的故障检测方法,本申请中不仅能将运行数据中的与(用以表征预设类型故障的)主要特征变量线性相关性较小的非主要特征变量剔除,而且还能将与主要特征变量的非线性相关性较小的非主要特征变量剔除,由于剔除了上述对故障检测结果帮助不大的运行数据特征变量,从而减小了风电机组运行数据的特征变量数,因此能提风力发电机故障检测的检测速度,降低故障检测的漏报率和误报率。本发明还公开了一种风力发电机的故障检测装置及设备,具有如上风力发电机的故障检测方法相同的有益效果。
Description
技术领域
本发明涉及风力发电机领域,特别是涉及一种风力发电机的故障检测方法,本发明还涉及一种风力发电机的故障检测装置及设备。
背景技术
某些场景下的发电机(例如风力发电机)发生故障时,需要提取出故障前后预设时间段内的运行数据,然后依靠这些运行数据并结合分类器对故障进行检测,但是运行数据中某些数据(例如某些与故障相关性较弱的特征变量)对于故障检测的作用微乎其微,现有技术中对于运行数据没有一种成熟的筛选方法,无法很好地剔除掉运行数据中对于故障检测作用不大的数据,导致了分类器在进行故障检测时速度较慢且故障检测的准确性较低。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种风力发电机的故障检测方法,提高了风力发电机的故障检测的速度以及准确度;本发明的另一目的是提供一种风力发电机的故障检测装置及设备,提高了风力发电机的故障检测的速度以及准确度。
为解决上述技术问题,本发明提供了一种风力发电机的故障检测方法,包括:
提取发电机在故障发生时刻前后的共预设时段内的运行数据;
确定出所述运行数据中的表征预设类型故障的主要特征变量,除所述主要特征变量之外的均为非主要特征变量;
将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除;
将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除,并将剩余的所述运行数据作为检测运行数据;
利用分类器并结合所述检测运行数据检测所述发电机是否存在所述预设类型故障。
优选地,所述将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除之后,所述将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除,并将剩余的所述运行数据作为检测运行数据之前,该风力发电机的故障检测方法还包括:
将剔除后的所述运行数据中的线性相关性大于第三预设阈值的N个非主要特征变量剔除掉N-1个。
优选地,所述将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除之后,所述并将剩余的所述运行数据作为检测运行数据之前,该风力发电机的故障检测方法还包括:
将剔除掉与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量后的所述运行数据中,与所述主要特征变量的非线性相关性大于第四预设阈值的所述非主要特征变量对应的数据剔除。
优选地,所述提取发电机在故障发生时刻前后的共预设时段内的运行数据之后,所述确定出所述运行数据中的表征预设类型故障的主要特征变量之前,该风力发电机的故障检测方法还包括:
删除所述运行数据中的无效数据。
优选地,所述删除所述运行数据中的无效数据具体为:
删除所述运行数据中含有空值或缺失值的样本、所有特征变量均为0的样本以及所有数据均为0的特征变量。
优选地,所述将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除具体为:
利用Pearson相关性分析法,将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除。
优选地,所述将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除具体为:
利用最大信息系数法,将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除。
优选地,所述分类器为极端随机森林故障检测装置。
为解决上述技术问题,本发明还提供了一种风力发电机的故障检测装置,包括:
数据获取模块,用于提取发电机在故障发生时刻前后的共预设时段内的运行数据;
特征选择模块,用于确定出所述运行数据中的表征预设类型故障的主要特征变量,除所述主要特征变量之外的均为非主要特征变量;
第一特征剔除模块,用于将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除;
第二特征剔除模块,用于将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除,并将剩余的所述运行数据作为检测运行数据;
故障检测模块,用于利用分类器并结合所述检测运行数据检测所述发电机是否存在所述预设类型故障。
为解决上述技术问题,本发明还提供了一种风力发电机的故障检测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上任一项所述风力发电机的故障检测方法的步骤。
本发明提供了一种风力发电机的故障检测方法,本申请中不仅能将运行数据中的与(用以表征预设类型故障的)主要特征变量线性相关性较小的非主要特征变量剔除,而且还能将与主要特征变量的非线性相关性较小的非主要特征变量剔除,由于剔除了上述对故障检测结果帮助不大的运行数据特征变量,从而减小了风电机组运行数据的特征变量数,因此能提风力发电机故障检测的检测速度,降低故障检测的漏报率和误报率。
本发明还提供了一种风力发电机的故障检测装置及设备,具有如上风力发电机的故障检测方法相同的有益效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种风力发电机的故障检测方法的流程示意图;
图2为本发明提供的一种基于不同相关性分析过程的故障检测速度的柱状对比图;
图3为不同分类器的运行时间对比图;
图4为不同分类器的故障检测性能的对比示意图;
图5为本发明提供的一种风力发电机的故障检测装置的结构示意图;
图6为本发明提供的另一种风力发电机的故障检测装置的结构示意图;
图7为本发明提供的一种风力发电机的故障检测设备的结构示意图。
具体实施方式
本发明的核心是提供一种风力发电机的故障检测方法,提高了风力发电机的故障检测的速度以及准确度;本发明的另一核心是提供一种风力发电机的故障检测装置及设备,提高了风力发电机的故障检测的速度以及准确度。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明提供的一种风力发电机的故障检测方法的流程示意图,包括:
步骤S1:提取发电机在故障发生时刻前后的共预设时段内的运行数据;
具体的,发电机可以为多种类型,例如可以为风力发电机等,本发明实施例在此不做限定。
具体的,在发电机发生故障以后,要分析发电机发生故障的类型,以便为后续的查因以及维修做准备,本发明实施例中提取出的运行数据可以为后续步骤提供数据基础。
其中,发电机在故障发生时刻前后的运行数据很可能都与故障有关,因此可以提取出发电机在故障发生时刻前后的运行数据,其中,预设时段可以自主设定,例如可以为工作人员根据经验值自主设定的预设时段等,本发明实施例在此不做限定。
步骤S2:确定出运行数据中的表征预设类型故障的主要特征变量,除主要特征变量之外的均为非主要特征变量;
具体的,本发明实施例中的故障检测方式为每次判断发电机是否存在一种预设类型故障,然后经过多次的判断,直至判断出发电机的故障类型为止,预设类型故障可以为工作人员预先设定的,例如可以为U1绕组温度超限等,本发明实施例在此不做限定。
具体的,在运行数据中有很多中特征变量,例如各个绕组温度、以及发电机周围的环境温度等,而对于每一种预设类型故障来说,都有可以表征该预设类型故障的主要特征变量,主要特征变量与预设类型故障的相关性较强,例如对于U1绕组温度超限故障来说,它的主要特征变量便可以确定为U1绕组温度,本发明实施例在此不做限定。
其中,在运行数据中,主要特征变量之外的其他特征变量便可以统称为非主要特征变量。
其中,对于一种预设类型故障来说,主要特征变量的数目可以为一个或多个,本发明实施例在此不做限定。
步骤S3:将运行数据中与主要特征变量的线性相关性小于第一预设阈值的非主要特征变量对应的数据剔除;
具体的,若对于一个非主要特征变量来说,其与主要特征变量的线性相关性小于一定程度,那么其对应的运行数据在后续的故障检测过程中所起到的作用是微乎其微的,甚至会对故障起到负面作用,影响故障检测结果的准确性,而且增加了运行数据的总量,使得故障检测的总时间增长,因此本发明实施例中可以将与主要特征变量的线性相关性小于第一预设阈值的非主要特征变量对应的数据从运行数据中剔除,如此一来便可以提升故障检测结果的准确性以及检测速度。
其中,第一预设阈值可以进行自主设定,可以在工作人员的经验下进行自主设定,例如可以设置为+0.2以及-0.2(线性相关系数具有正负两个方向)等,本发明实施例在此不做限定。
步骤S4:将剔除后的运行数据中与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量对应的数据剔除,并将剩余的运行数据作为检测运行数据;
具体的,由于发电机的运行数据中的各个特征变量之间不仅包含线性关系,还包含许多其他函数性质的非线性关系,在剔除掉了线性相关性较弱的特征变量后,所保留下来的非主要特征变量虽然与主要特征向量具有一定的线性相关性,但是若其与主要特征变量的非线性相关性较弱的话,保留下来的非主要特征变量依然无法在后续的故障检测过程中起到很大的作用,因此本发明实施例中可以继续将与主要特征变量的非线性相关性较弱的非主要特征变量对应的数据剔除,可以进一步地提高故障检测的速度以及准确性。
其中,第二预设阈值可以进行自主设定例如可以设置为0.4等,本发明实施例在此不做限定。
步骤S5:利用分类器并结合检测运行数据检测发电机是否存在预设类型故障。
具体的,前述步骤中的数据剔除工作是基于预设类型故障进行的,因此基于剔除之后得到的检测运行数据,可以在分类器的帮助下判断发电机是否发生了预设类型故障,由于此前步骤中的数据剔除,本发明实施例中在进行故障检测时的速度以及准确性均得以提升。
其中,可以将检测运行数据中的一部分作为训练数据对分类器进行与预训练,然后将检测运行数据中的另一部分数据输入到训练好的分类器中进行故障的判定。
本发明提供了一种风力发电机的故障检测方法,本申请中不仅能将运行数据中的与(用以表征预设类型故障的)主要特征变量线性相关性较小的非主要特征变量剔除,而且还能将与主要特征变量的非线性相关性较小的非主要特征变量剔除,由于剔除了上述对故障检测结果帮助不大的运行数据特征变量,从而减小了风电机组运行数据的特征变量数,因此能提风力发电机故障检测的检测速度,降低故障检测的漏报率和误报率。
在上述实施例的基础上:
作为一种优选的实施例,将运行数据中与主要特征变量的线性相关性小于第一预设阈值的非主要特征变量对应的数据剔除之后,将剔除后的运行数据中与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量对应的数据剔除,并将剩余的运行数据作为检测运行数据之前,该风力发电机的故障检测方法还包括:
将剔除后的运行数据中的线性相关性大于第三预设阈值的N个非主要特征变量剔除掉N-1个。
具体的,在剔除后的运行数据中,所有的非主要特征变量之间可能会存在一些相互之间线性相关性非常强的非主要特征变量,例如现有ABCD四个非主要特征变量,它们互相之间的线性相关性大于第三预设阈值,线性相关性非常强,实际上在这种情况下,ABCD对于后续故障判断过程所起到的作用相同,也就是说,其中三个特征变量属于冗余的特征变量,其中任意一个特征变量对于故障检测所起到的作用与四个特征变量共同起到的作用相同,因此可以将线性相关性大于第三预设阈值的N个非主要特征变量剔除掉N-1个,剩余一个即可,能够进一步地剔除掉冗余的特征变量并降低数据纬度,有利于提高故障检测速度。
其中,N可以多大一1的多种数值,N的具体数值是在对非主要特征变量进行相关性分析后根据分析结果结合第三预设阈值自然确定出来的数值。
其中,剔除掉的N-1个非主要特征变量可以为从N个非主要特征变量中随机选择出的N-1个,当然,这里剔除掉的也是非主要特征变量对应的数据。
其中,第三预设阈值可以自主设定,例如可以设置为0.99等,本发明实施例在此不做限定。
作为一种优选的实施例,将剔除后的运行数据中与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量对应的数据剔除之后,并将剩余的运行数据作为检测运行数据之前,该风力发电机的故障检测方法还包括:
将剔除掉与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量后的运行数据中,与主要特征变量的非线性相关性大于第四预设阈值的非主要特征变量对应的数据剔除。
具体的,考虑到对于任一非主要特征变量来说,若其与主要特征变量的非线性相关性过大的话,那么其在后续故障检测过程中所起到的作用实质上与主要特征变量所起作用相同,其实应该预先将符合这种情况的非主要特征变量剔除掉,以便进一步地减少运行数据,并提升后续的故障检测的速度。
其中,第四预设阈值可以进行自主设定,例如可以设置为0.99等,本发明实施例在此不做限定。
作为一种优选的实施例,提取发电机在故障发生时刻前后的共预设时段内的运行数据之后,确定出运行数据中的表征预设类型故障的主要特征变量之前,该风力发电机的故障检测方法还包括:
删除运行数据中的无效数据。
具体的,无效数据为没有实质内容的数据,例如破损数据或者数据为0的数据等,其对于后续故障检测过程没有正面意义,反而会影响故障检测精度以及速度,本发明实施例中预先删除掉运行数据中的无效数据,可以使得后续各个步骤的处理速度均得到提高。
作为一种优选的实施例,删除运行数据中的无效数据具体为:
删除运行数据中含有空值或缺失值的样本、所有特征变量均为0的样本以及所有数据均为0的特征变量。
具体的,由于传感器故障以及数据保存过程中的异常等原因,会产生部分无效数据,通常情况下包括含有空值或缺失值的样本、所有特征变量均为0的样本以及所有数据均为0的特征变量,其中,样本可以为某一时刻采集到所有特征变量,样本中的特征变量均为0,那么该样本就是毫无意义的,而每个样本下均有多个不同的特征变量,若所有样本对应的某个相同的特征变量的数据均为0,那么则可以在每个样本中删除该特征变量,能够有效减少运行数据总量且不会影响故障检测的准确性。
当然,除了本发明实施例中的无效数据外,无效数据还可以为其他多种类型,本发明实施例在此不做限定。
作为一种优选的实施例,将运行数据中与主要特征变量的线性相关性小于第一预设阈值的非主要特征变量对应的数据剔除具体为:
利用Pearson相关性分析法,将运行数据中与主要特征变量的线性相关性小于第一预设阈值的非主要特征变量对应的数据剔除。
具体的,Pearson相关性分析法具有准确度高、速度快以及稳定性高等优点。
当然,除了Pearson相关性分析法外,还可以其他其他的方法对主要特征变量与非主要特征变量之间的线性相关性进行判定,本发明实施例在此不做限定。
作为一种优选的实施例,将剔除后的运行数据中与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量对应的数据剔除具体为:
利用最大信息系数法,将剔除后的运行数据中与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量对应的数据剔除。
具体的,MIC(Maximum Information Coefficient,最大信息系数)是一种度量变量之间的相关性程度的指标,它能从海量数据集中广泛、大量的探寻到潜在的紧密相关的变量对。最大信息系数不仅能度量两个变量间线性和非线性的关系,还能最大限度的挖掘两个变量之间非函数的、未被发现的关系,因此采用最大信息系数法能够更加深度地挖掘出非主要特征变量与主要特征变量之间的关系,并进行部分数据的剔除。
其中,最大信息系数结合互信息理论和网格划分理论的思想。其原理为:在给定数据集D中,将两个变量X={x1,x2...xn}和Y={y1,y2...yn}进行网格划分,根据不同网格划分次数和不同网格划分位置计算相应的互信息。允许划分后网格为空,直到划分到最大分辨率为止。最大信息系数的目的是使大多数的点集中在某几个网格内。网格划分次数是指对X轴,Y轴划分的次数。网格划分位置是指对X轴或Y轴划分点的位置。对于给定变量A={a1,a2...an},B={b1,b2...bn}其互信息定义为:
其中D为给定数据集,p(a,b)为变量A和变量B的联合概率密度,p(a)和p(b)分别代表不同的两个变量A和变量B的概率,获取数值最大的互信息记为Ixy。为方便不同分辨率之间进行比较,用以下公式进行标准化:
因此可以得到在样本集D下,最大网格划分次数为B(n)。Reshef指出最大网格划分次数B(n)=n0.6时,在获得较高性能的同时也降低计算量。样本容量为n的最大信息系数定义如下:
当然,除了MIC外,还可以采用其他的方法对主要特征变量以及非主要特征变量的非线性相关性进行分析,本发明实施例在此不做限定。
作为一种优选的实施例,分类器为极端随机森林故障检测装置。
具体的,极端随机森林(Extremely Random Trees,ERT)是在决策树的基础上提出了一种具有完全随机性的集成树算法。极端随机森林算法根据经典的自顶向下过程建立一个非剪枝决策树(回归决策树或分类决策树)集合。极端随机森林与传统树集成方法的主要区别是:在模型学习阶段,它不是利用装袋的方法训练每个弱分类器,而是每棵树都利用整个训练样本进行学习。利用完整的训练样本学习的目的是最大限度地减少偏差。在分割树节点时,随机森林等集成方法通过评估gini指数等目标函数获取划分数据的最佳特征和阈值。极端随机森林对于分裂特征和分割值的获取具有极强的随机性。对于一个n×m维数据集,给定样本xi用m维特征向量fi表示样本的特征。然后在该变量K的最大值和最小值之间随机挑选一个分割值ac。将变量K的值小于分割值ac的样本(a<ac)放入左叶子节点,变量K的值大于等于分割值ac的样本(a≥ac)放入右叶子节点,直到满足停止分裂的条件。鉴于节点分裂过程的简单性,极端随机森林在空间复杂度上远优于其它集成算法。每个样本的最终概率为所有树的概率平均值,定义如下:
其中M表示树的总数,fi表示样本xi的特征向量,Pt表示在向量fi的条件下样本属于类别c的条件概率。公式(4)定义样本在决策树中的分类概率。最后在极端随机森林上,公式(5)利用投票原则决定该样本的类别。
当然,除了ERT外,分类器还可以为其他类型,本发明实施例在此不做限定。
具体的,本发明实施例中,为验证上述风力发电机组发电机故障检测模型的实用性,以山东某风场1.5MW风电机组发电机的运行数据为研究对象,研究发电机在运行状态下可能出现的4种典型故障,包括U1绕阻温度超限、V1绕阻温度超限、W1绕阻温度超限和轴承a温度超限。从SCADA(Supervisory Control And Data Acquisition,数据采集与监视控制系统)系统中导出以上4种故障的发电机温度信号数据作为运行数据。起始采样点为故障开始前半小时,结束采样点为故障结束之后半小时,数据采样间隔为2s。样本总共包括213个监控变量,总共运行20h,正常运行时间11.7h,故障时间8.3h。当三项绕阻温度大于175℃并持续5秒,系统触发绕阻温度超限故障(F1~F3)。当发电机轴承a温度大于95℃,并持续5秒后,系统触发轴承a温度超限故障(F4)。下表1为故障类别(预设类型故障)及其对应的主要特征参数:
表1
(1)数据预处理
在实际的SCADA系统中,传感器故障和数据保存异常等问题会导致部分数据存在缺失。缺失值或空值会降低故障诊断模型的故障检测率。因此,需要对数据集进行数据清洗,具体包括:删除数据集中含有空值或缺失值的样本和所有特征均为0的样本;删除所有数据均为0的特征,然后对余下所有样本数据进行z-score归一化处理得到标准数据集:
其中,xi表示一个特征变量,μ表示特征变量xi的均值,σ表示特征变量xi的方差。
(2)相关性分析
针对U1绕阻温度超限故障(F1)、V1绕阻温度超限故障(F2)、W1绕阻温度超限故障(F3)和轴承a温度超限故障(F4)4种不同的故障,分别选取U1绕阻温度、V1绕阻温度、W1绕阻温度和轴承a温度作为故障主要特征变量。进行相关性分析之前,需要保留F1~F4四个数据集中的故障样本,需要分析发生故障时,哪些特征变量会随主要特征一同变化。在对不同故障类型数据进行特征选择时,选取对主要特征影响大的特征变量。
根据PMIC(即Pearson相关性分析与MIC的结合)相关性分析法,分析数据集中4种故障状态下,主要特征变量与各个非主要特征变量的Pearson相关系数,下表2为F1-F4四类故障部分Pearson相关性分析结果表:
表2
表2显示四类故障数据部分Pearson相关性分析结果。通过Pearson相关性分析,计算每个非主要特征变量与主要特征之间的线性相关程度,剔除Pearson相关系数在[-0.2,0.2]之间的弱相关变量。其次,计算出不处于上述区间的非主要特征变量之间的的Pearson相关系数矩阵,得到每种故障类别中非主要特征变量之间的相关系数。以F1故障为例,表3为用于进行冗余特征确定的相关系数矩阵:
表3
表3说明了在F1类故障情况下,发电机轴承b温度与塔底柜温度、塔顶柜温度和主轴叶轮侧温度成极强相关性,Pearson相关系数大于0.999。如果将这些变量带入模型计算,会提高模型复杂度。由于多数特征与发电机轴承b温度成极强相关。在F1类故障数据中剔除塔底柜温度、塔顶柜温度和主轴叶轮侧温度和W1绕阻温度四个冗余特征。
最后,引入最大信息系数(MIC)进一步挖掘主要特征与其余特征之间的非线性相关性。获取MIC>0.4并且MIC<0.99的较强相关变量。
(3)相关性分析性能比较
此次实验可以利用Python3.6实现。为验证采用PMIC相关性分析方法相较于采用单一的最大信息系数(MIC)进行相关性分析具有更高的故障检测速度。利用山东某风力发电场发电机的4种故障的数据进行分析。对比不同故障数据集下PMIC相关性分析方法和最大信息系数(MIC)的计算速度,实验结果表明,对于F1-F4四种故障检测来说,采用PMIC相关性分析方法均比采用单一的MIC相关性分析具有更高的故障检测速率,特别是在大样本数据集(F3类故障)上更为明显。图2为一种基于不同相关性分析过程的故障检测速度的柱状对比图,在F3类故障上,利用PMIC方法可以节约近一半的时间。在小样本数据集上也能提高20-50%的速度。造成这种现象的原因是在大样本数据集中每个特征变量对应的特征值比小样本数据集多。特征值越多在计算最大信息系数时网格划分次数和互信息计算也就越多,增加了计算的复杂度。因此在处理海量数据时,PMIC相关性分析可以高效的实现特征提取。
(4)不同分类器性能的比较
为证明极端随机森林算法计算速度的优越性,将极端随机森林和其它两种经典的故障检测方法RF(Random Forest,随机森林)以及Bagging(Bootstrap Aggregating,引导聚集算法)进行对比,实验结果如图3所示,图3为不同分类器的运行时间对比图,针对样本不平衡问题,三种故障检测方法均采用十折交叉验证和分层抽样的方式进行计算。同时,上述三种故障检测方法均利用sklearn库的GridSearchCV函数进行超参数调参。
实验结果表明,极端随机森林算法在四个不同故障类型数据集上的计算速度均比其它两种算法要快,特别是在F3类故障数据集中更为明显。这说明极端随机森林算法在处理海量数据集上拥有更好的性能。极端随机森林算法具有它独特的是树生长方式,使它的计算速度优于其它算法。极端随机森林在完全随机的条件下获取分裂特征和特征值,以此降低模型的空间复杂度。Bagging模型的每个子分类器的样本均采用Bootstrap方式获取。在树的分裂过程中,Bagging模型要计算整个数据集的全体特征的信息增益,这些方式都增加了Bagging模型的计算复杂度。随机森林模型与Bagging一样采用Bootstrap对子分类器采样。但随机森林模型只获取部分特征进行计算。综上所述,在风力发电机组海量数据故障检测中,极端随机森林故障诊断方法具有更好的实时性。
为验证本文提到的极端随机森林故障检测装置具有比传统故障诊断方法更低的误报率和漏报率。利用PMIC-ERT,PMIC-RF和PMIC-Bagging这三种算法进行对比。从误报率、漏报率和检测正确率三个方面分析故障诊断方法的性能。由于数据集中存在样本不平衡现象,同时在计算评价指标时引入混淆矩阵。混淆矩阵和评价指标计算公式如下,表4为混淆矩阵:
表4
评价指标计算公式为:
误报率:FNR=FN/(TP+FN) (7)
漏报率:FPR=FP/(TP+FP) (8)
极端随机森林模型弱分类器个数可以为50,弱分类器最大特征个数为样本全体特征,分裂过程不剪枝。利用Python软件的sklearn机器学习库网格搜索GridSearchCV函数获取最优的超参数。随机森林模型弱分类器个数为50,单颗决策树最大特征个数为其中d代表特征总个数,分裂规则遵循Gini指数。Bagging模型弱分类器个数为20,单颗决策树最大特征个数为5。请参考图4,图4为不同分类器的故障检测性能的对比示意图,下表5为不同分类器的故障检测性能的正确率对比表。
表5
图4和表5利用4种不同的故障数据对三种分类器进行了性能分析。明显可以看出改进的极端随机森林算法具有最低的误报率以及漏报率,还有最高的正确率,其中在F1和F2类故障数据集中,改进极端随机森林算法的漏报率和误报率为0,正确率为100%。体现出良好的故障检测性能。特别在处理海量数据集上(F3类故障),极端随机森林的漏报率为0.003%,误报率为1.33%,远低于其它3种故障检测方法。PMIC-RF和PMIC-Bagging两种故障检测方法在处理海量数据时出现了很高的漏报率,不利于设备的安全运行。评估海量数据样本时,改进极端随机森林故障检测正确率比PMIC-RF高出3%,比PMIC-Bagging高出7%。因此,改进极端随机森林的故障检测性能优于其它两种故障检测方法。
请参考图5,图5为本发明提供的一种风力发电机的故障检测装置的结构示意图,包括:
数据获取模块1,用于提取发电机在故障发生时刻前后的共预设时段内的运行数据;
特征选择模块2,用于确定出运行数据中的表征预设类型故障的主要特征变量,除主要特征变量之外的均为非主要特征变量;
第一特征剔除模块3,用于将运行数据中与主要特征变量的线性相关性小于第一预设阈值的非主要特征变量对应的数据剔除;
第二特征剔除模块4,用于将剔除后的运行数据中与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量对应的数据剔除,并将剩余的运行数据作为检测运行数据;
故障检测模块5,用于利用分类器并结合检测运行数据检测发电机是否存在预设类型故障。
请参考图6,图6为本发明提供的另一种风力发电机的故障检测装置的结构示意图,包括:
数据获取模块1,用于提取发电机在故障发生时刻前后的共预设时段内的运行数据;
数据清洗模块8,用于删除运行数据中的无效数据;
归一化处理单元21,用于对删除掉无效数据的运行数据进行归一化处理;
特征选择单元22,用于确定出运行数据中的表征预设类型故障的主要特征变量,除主要特征变量之外的均为非主要特征变量;
第一特征剔除模块3,用于将运行数据中与主要特征变量的线性相关性小于第一预设阈值的非主要特征变量对应的数据剔除;
第二特征剔除模块6,用于将剔除后的运行数据中与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量对应的数据剔除;
第三特征剔除模块4,用于将剔除后的运行数据中的线性相关性大于第三预设阈值的N个非主要特征变量剔除掉N-1个;
第四特征剔除模块7,用于将剔除掉与主要特征变量的非线性相关性小于第二预设阈值的非主要特征变量后的运行数据中,与主要特征变量的非线性相关性大于第四预设阈值的非主要特征变量对应的数据剔除;
故障检测模块5,用于利用分类器并结合检测运行数据检测发电机是否存在预设类型故障。
对于本发明实施例提供的风力发电机的故障检测装置的介绍请参照前述的风力发电机的故障检测方法的实施例,本发明实施例在此不再赘述。
请参考图7,图7为本发明提供的一种风力发电机的故障检测设备的结构示意图,包括:
存储器9,用于存储计算机程序;
处理器10,用于执行计算机程序时实现如上任一项风力发电机的故障检测方法的步骤。
对于本发明实施例提供的风力发电机的故障检测设备的介绍请参照前述的风力发电机的故障检测方法的实施例,本发明实施例在此不再赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种风力发电机的故障检测方法,其特征在于,包括:
提取发电机在故障发生时刻前后的共预设时段内的运行数据;
确定出所述运行数据中的表征预设类型故障的主要特征变量,除所述主要特征变量之外的均为非主要特征变量;
将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除;
将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除,并将剩余的所述运行数据作为检测运行数据;
利用分类器并结合所述检测运行数据检测所述发电机是否存在所述预设类型故障。
2.根据权利要求1所述的风力发电机的故障检测方法,其特征在于,所述将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除之后,所述将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除,并将剩余的所述运行数据作为检测运行数据之前,该风力发电机的故障检测方法还包括:
将剔除后的所述运行数据中的线性相关性大于第三预设阈值的N个非主要特征变量剔除掉N-1个。
3.根据权利要求2所述的风力发电机的故障检测方法,其特征在于,所述将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除之后,所述并将剩余的所述运行数据作为检测运行数据之前,该风力发电机的故障检测方法还包括:
将剔除掉与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量后的所述运行数据中,与所述主要特征变量的非线性相关性大于第四预设阈值的所述非主要特征变量对应的数据剔除。
4.根据权利要求3所述的风力发电机的故障检测方法,其特征在于,所述提取发电机在故障发生时刻前后的共预设时段内的运行数据之后,所述确定出所述运行数据中的表征预设类型故障的主要特征变量之前,该风力发电机的故障检测方法还包括:
删除所述运行数据中的无效数据。
5.根据权利要求4所述的风力发电机的故障检测方法,其特征在于,所述删除所述运行数据中的无效数据具体为:
删除所述运行数据中含有空值或缺失值的样本、所有特征变量均为0的样本以及所有数据均为0的特征变量。
6.根据权利要求1所述的风力发电机的故障检测方法,其特征在于,所述将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除具体为:
利用Pearson相关性分析法,将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除。
7.根据权利要求1所述的风力发电机的故障检测方法,其特征在于,所述将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除具体为:
利用最大信息系数法,将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除。
8.根据权利要求1至7任一项所述的风力发电机的故障检测方法,其特征在于,所述分类器为极端随机森林故障检测装置。
9.一种风力发电机的故障检测装置,其特征在于,包括:
数据获取模块,用于提取发电机在故障发生时刻前后的共预设时段内的运行数据;
特征选择模块,用于确定出所述运行数据中的表征预设类型故障的主要特征变量,除所述主要特征变量之外的均为非主要特征变量;
第一特征剔除模块,用于将所述运行数据中与所述主要特征变量的线性相关性小于第一预设阈值的所述非主要特征变量对应的数据剔除;
第二特征剔除模块,用于将剔除后的所述运行数据中与所述主要特征变量的非线性相关性小于第二预设阈值的所述非主要特征变量对应的数据剔除,并将剩余的所述运行数据作为检测运行数据;
故障检测模块,用于利用分类器并结合所述检测运行数据检测所述发电机是否存在所述预设类型故障。
10.一种风力发电机的故障检测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至8任一项所述风力发电机的故障检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911128793.4A CN110805534B (zh) | 2019-11-18 | 2019-11-18 | 一种风力发电机的故障检测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911128793.4A CN110805534B (zh) | 2019-11-18 | 2019-11-18 | 一种风力发电机的故障检测方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110805534A true CN110805534A (zh) | 2020-02-18 |
CN110805534B CN110805534B (zh) | 2021-02-12 |
Family
ID=69490294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911128793.4A Active CN110805534B (zh) | 2019-11-18 | 2019-11-18 | 一种风力发电机的故障检测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110805534B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553482A (zh) * | 2020-04-09 | 2020-08-18 | 哈尔滨工业大学 | 机器学习模型超参数的调优方法 |
CN112505494A (zh) * | 2020-10-30 | 2021-03-16 | 西安交通大学 | 一种油纸绝缘含水量评估方法及装置 |
CN113310693A (zh) * | 2021-06-07 | 2021-08-27 | 华润电力技术研究院有限公司 | 一种机械故障检测方法、装置、设备及存储介质 |
CN113503232A (zh) * | 2021-08-20 | 2021-10-15 | 西安热工研究院有限公司 | 一种风机运行健康状态预警方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2122164A1 (en) * | 2007-01-05 | 2009-11-25 | Lm Glasfiber A/S | Wind turbine blade with lift-regulating means in form of slots or holes |
KR101781753B1 (ko) * | 2016-09-29 | 2017-09-25 | 성균관대학교산학협력단 | 출력 변동 경감을 위해 피어슨 상관계수를 이용한 ess의 제어 장치 및 그 방법 |
CN107478963A (zh) * | 2017-09-30 | 2017-12-15 | 山东海兴电力科技有限公司 | 基于电网大数据的小电流接地系统单相接地故障选线方法 |
CN107701378A (zh) * | 2017-09-29 | 2018-02-16 | 上海电力设计院有限公司 | 一种风力发电机故障预警方法 |
CN110135064A (zh) * | 2019-05-15 | 2019-08-16 | 上海交通大学 | 一种发电机后轴承温度故障预测方法、系统及控制器 |
CN110175195A (zh) * | 2019-04-23 | 2019-08-27 | 哈尔滨工业大学 | 基于极端随机树的混合气体检测模型构建方法 |
CN110286279A (zh) * | 2019-06-05 | 2019-09-27 | 武汉大学 | 基于极端随机森林与堆栈式稀疏自编码算法的电力电子电路故障诊断方法 |
-
2019
- 2019-11-18 CN CN201911128793.4A patent/CN110805534B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2122164A1 (en) * | 2007-01-05 | 2009-11-25 | Lm Glasfiber A/S | Wind turbine blade with lift-regulating means in form of slots or holes |
KR101781753B1 (ko) * | 2016-09-29 | 2017-09-25 | 성균관대학교산학협력단 | 출력 변동 경감을 위해 피어슨 상관계수를 이용한 ess의 제어 장치 및 그 방법 |
CN107701378A (zh) * | 2017-09-29 | 2018-02-16 | 上海电力设计院有限公司 | 一种风力发电机故障预警方法 |
CN107478963A (zh) * | 2017-09-30 | 2017-12-15 | 山东海兴电力科技有限公司 | 基于电网大数据的小电流接地系统单相接地故障选线方法 |
CN110175195A (zh) * | 2019-04-23 | 2019-08-27 | 哈尔滨工业大学 | 基于极端随机树的混合气体检测模型构建方法 |
CN110135064A (zh) * | 2019-05-15 | 2019-08-16 | 上海交通大学 | 一种发电机后轴承温度故障预测方法、系统及控制器 |
CN110286279A (zh) * | 2019-06-05 | 2019-09-27 | 武汉大学 | 基于极端随机森林与堆栈式稀疏自编码算法的电力电子电路故障诊断方法 |
Non-Patent Citations (1)
Title |
---|
向健平,凌永志,詹俊,李鹏辉: "基于SCADA系统的风电机组主轴承故障预警方法", 《电力科学与技术学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553482A (zh) * | 2020-04-09 | 2020-08-18 | 哈尔滨工业大学 | 机器学习模型超参数的调优方法 |
CN111553482B (zh) * | 2020-04-09 | 2023-08-08 | 哈尔滨工业大学 | 机器学习模型超参数的调优方法 |
CN112505494A (zh) * | 2020-10-30 | 2021-03-16 | 西安交通大学 | 一种油纸绝缘含水量评估方法及装置 |
CN112505494B (zh) * | 2020-10-30 | 2022-05-03 | 西安交通大学 | 一种油纸绝缘含水量评估方法及装置 |
CN113310693A (zh) * | 2021-06-07 | 2021-08-27 | 华润电力技术研究院有限公司 | 一种机械故障检测方法、装置、设备及存储介质 |
CN113503232A (zh) * | 2021-08-20 | 2021-10-15 | 西安热工研究院有限公司 | 一种风机运行健康状态预警方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110805534B (zh) | 2021-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110805534B (zh) | 一种风力发电机的故障检测方法、装置及设备 | |
Abdallah et al. | Fault diagnosis of wind turbine structures using decision tree learning algorithms with big data | |
CN105677791B (zh) | 用于分析风力发电机组的运行数据的方法和系统 | |
CN113962259B (zh) | 一种燃料电池系统多模式双层故障诊断方法 | |
CN111314329A (zh) | 流量入侵检测系统和方法 | |
Ge et al. | Comparative study on defect prediction algorithms of supervised learning software based on imbalanced classification data sets | |
CN117077044B (zh) | 一种发电机用真空断路器故障判别方法及装置 | |
CN111881159A (zh) | 一种基于代价敏感极端随机森林的故障检测方法及装置 | |
CN116401532B (zh) | 一种电力系统受扰后频率失稳识别方法及系统 | |
CN116070206B (zh) | 一种异常行为检测方法、系统、电子设备及存储介质 | |
KR20170097092A (ko) | 신경 언어 행동 인식 시스템의 어휘 분석기 | |
Schneider et al. | Detecting anomalies within time series using local neural transformations | |
CN115935286A (zh) | 铁路轴承状态监测数据的异常点检测方法、装置及终端 | |
CN113127464B (zh) | 农业大数据环境特征处理方法、装置及电子设备 | |
Sun et al. | Application of deep belief networks for precision mechanism quality inspection | |
KR102486463B1 (ko) | 열화에 따른 시계열 데이터를 이용한 실시간 이상 감지 방법 및 그를 위한 장치 | |
Zhang et al. | Web log anomaly detection based on isolated forest algorithm | |
Duarte et al. | Feature ranking in hoeffding algorithms for regression | |
Nguyen | Feature Engineering and Health Indicator Construction for Fault Detection and Diagnostic | |
Nagolu et al. | Real-Time Forest Fire Detection Using IoT and Smart Sensors | |
Jian et al. | Research on Network Intrusion Detection Based on Improved Machine Learning Method | |
CN117826771B (zh) | 基于ai分析的冷轧机控制系统异常检测方法及系统 | |
Zhu et al. | Research of system fault diagnosis method based on imbalanced data | |
CN117148805B (zh) | 一种多场景适应的电厂设备预警方法及系统 | |
Yu et al. | A feature extraction method for XML documents based on PCA |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |