CN108304350B - 基于大数据集近邻策略的风机指标预测与故障预警方法 - Google Patents

基于大数据集近邻策略的风机指标预测与故障预警方法 Download PDF

Info

Publication number
CN108304350B
CN108304350B CN201711415910.6A CN201711415910A CN108304350B CN 108304350 B CN108304350 B CN 108304350B CN 201711415910 A CN201711415910 A CN 201711415910A CN 108304350 B CN108304350 B CN 108304350B
Authority
CN
China
Prior art keywords
output
indexes
index
prediction
generator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711415910.6A
Other languages
English (en)
Other versions
CN108304350A (zh
Inventor
孙启涛
尹磊
余小六
周春容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MingYang Smart Energy Group Co Ltd
Original Assignee
MingYang Smart Energy Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MingYang Smart Energy Group Co Ltd filed Critical MingYang Smart Energy Group Co Ltd
Priority to CN201711415910.6A priority Critical patent/CN108304350B/zh
Publication of CN108304350A publication Critical patent/CN108304350A/zh
Application granted granted Critical
Publication of CN108304350B publication Critical patent/CN108304350B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F03MACHINES OR ENGINES FOR LIQUIDS; WIND, SPRING, OR WEIGHT MOTORS; PRODUCING MECHANICAL POWER OR A REACTIVE PROPULSIVE THRUST, NOT OTHERWISE PROVIDED FOR
    • F03DWIND MOTORS
    • F03D17/00Monitoring or testing of wind motors, e.g. diagnostics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

本发明公开了一种基于大数据集近邻策略的风机指标预测与故障预警方法,该方法是基于风机运行状态的历史数据,结合统计学和机器学习方法,以风机的多个监测指标作为输入指标,多个监测指标作为预测估计的输出指标,并对输出指标的预测值进行统计分析,设定分位数与报警等级的关系,最终通过查看输出指标的实际值所对应的预测区间来确定预警等级。本发明能够对风机指标进行准确预警监控,可以用于风力发电机组的各部件,普适性高。

Description

基于大数据集近邻策略的风机指标预测与故障预警方法
技术领域
本发明涉及风力发电的技术领域,尤其是指一种基于大数据集近邻策略的风机指标预测与故障预警方法。
背景技术
业内习知,风力发电机组作为大型机械设备,长期处于恶劣的环境中,有较高故障风险,及时准确预警能够降低风机健康恶化的风险,以降低部件报废和停机过长带来的损失。
现阶段风场以执行例行检修维护,且对风机状态评估及故障的诊断过于依赖工作人员的经验;另一方面,目前阶段的风机监控系统会对超限指标进行报警,但是由于其主要采用的是较宽的阈值,其触发预警时间已经很晚,不能做到更早的发现的作用。
目前也已经有不少关于风力发电机组预警的报道,其中不少结合风速基于功率异常的方法来预警;一方面,该类方法的拓展性不够,只能局限于特定部件或者不具有针对性;另一方面,该类方法对现有的数据及其风机指标字段利用不够,容易造成误报。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于大数据集近邻策略的风机指标预测与故障预警方法,能够对风机指标进行准确预警监控,该方法可以用于风力发电机组的各部件,普适性高。
为实现上述目的,本发明所提供的技术方案为:基于大数据集近邻策略的风机指标预测与故障预警方法,该方法是基于风机运行状态的历史数据,结合统计学和机器学习方法,以风机的多个监测指标作为输入指标,多个监测指标作为预测估计的输出指标,并对输出指标的预测值进行统计分析,设定分位数与报警等级的关系,最终通过查看输出指标的实际值所对应的预测区间来确定预警等级;其包括有以下步骤:
1)数据准备
选取所分析的风机部件的指标集及其历史运行数据,并对数据进行异常值处理,准备大量干净的历史数据作为训练集,存入数据库中;其中,所述指标集包括机舱温度、室外温度、风速实时值、发电机功率实时值、发电机转速实时值、发电机驱动端轴承温度、发电机非驱动端轴承温度、发电机定子绕组U相温度、发电机定子绕组V相温度及发电机定子绕组W相温度,所述异常值包括空值、跳变值、重复值、离群点;
2)相关性分析
对步骤1)清洗过后的数据进行相关性分析,分析出各指标之间的相关性,确认预测输入指标与预测输出指标的相关性,若分析的指标集间存在相关性,则进行步骤3),若不存在,则重新筛选指标集,重复步骤1)、2),直到指标集间存在相关性为止;
3)根据相关性分析,指定外生变量与内生变量作为输入变量和输出变量,并设定各输入变量的近邻域的半径大小值;其中,所述输入变量包括机舱温度、室外温度、风速实时值、发电机功率实时值、发电机转速实时值,所述输出变量包括发电机驱动端轴承温度、发电机非驱动端轴承温度、发电机定子绕组U相温度、发电机定子绕组V相温度及发电机定子绕组W相温度;
4)根据确定的输入指标和输出指标,重新准备待分析的数据作为测试集,根据测试集中各输入变量的近邻域半径大小,从训练集中搜索测试集的各输入变量近邻域内对应的各输出变量的历史数据集作为测试集的预测集输出;
5)对计算得到的输出指标的预测集进行统计分析,得到输出指标预测集的点估计及界限估计,并设定分位数与报警等级的关系,划定不同的预警等级;
6)最后查看测试集的输出变量的实际值所处界限范围进而给出机组预警等级。
在步骤4)中,使用测试集输入指标值及其邻域半径参数,构建测试集输出指标的SQL查询语句,将该SQL查询语句查询出的数据集作为输出指标的测试集,并统计测试集中各输出变量的百分位数值,以各输出指标的50%分位数作为点估计。
在步骤5)中,统计分析方法采用的是百分位数,要求50%分位数作为输出指标的点估计,其余分位数估计作为输出指标的预警评估界限。
本发明与现有技术相比,具有如下优点与有益效果:
1、大数据的重要作用在于数据集足够大,使用风机运行的所有历史数据,数据集是空间中一张超密集高维数据网,其中拥有几乎完整的知识。
2、本方法采用无参数模型的算法,完全基于数据,避免了参数模型的强约束(比如不能多重共线性,误差符合正态分布的假设等)以及大量数据的耗时训练,算法对数据的要求极低,几乎没有任何要求,唯一的需求是数据够多,服务器够快就可以了。
3、本方法思路简单清晰,没有任何复杂计算,计算过程转换成了数据的检索出预测值,充分利用数据的高速的数据检索查询能力。
4、本方法充分利用与部件相关的标签排除各种工况的影响,只要认为与输出指标的相关的输入指标可以随时动态的加入,没有重新训练的风险。
5、本方法是动态的,每时每刻记录的数据都可以动态纳入到下次的计算中去,随着数据的积累越来越大,该算法的准确性会进一步提高。
附图说明
图1为本发明的相关分析结果图。
图2为风机发电机驱动端轴承温度发生异常时的运行图。
图3为风机发电机驱动端轴承温度正常的运行图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本实施方法的数学思路具体如下所示:
设有自变量N1,N2,…,Nn、F1,F2,…,Fn,因变量R,误差项为ε,则关系表达为:
h(N1,N2,…,Nn,F1,F2,…,Fn)+ε=R (1)
若自变量能够分为两个变量组:{N1,N2,…,Nn}及{F1,F2,…,Fn},则关系表达为:
f(N1,N2,…,Nn)+g(F1,F2,…,Fn)+ε=R (2)
对式(2)进行变形得表达式:
R-f(N1,N2,…,Nn)=g(F1,F2,…,Fn)+ε (3)
从上可知,若g(F1,F2,…,Fn)+ε>>ε,则F1,F2,…,Fn是存在影响的,对R-f(N1,N2,…,Nn)具有解释作用;就统计学而言,若一个模型不使用F变量组,拟合结果效果不好,就会认为F变量是重要影响变量;就风机发电机而言,能够把N变量组理解为正常外生变量组,而把F变量组理解为对异常进行解释的变量组;因此若g(F1,F2,…,Fn)+ε>>ε,则认为存在异常,这也说明一个模型必不在所有数据空间都有效,仍然具有作用。
在确定好数学思路后,逐步实现,主要有以下步骤
1)数据准备:选取所分析的风机发电机部件相关的12个指标及其历史运行数据,并对数据进行异常值(包括空值、跳变值、重复值、离群点等)处理,准备大量干净的历史数据作为训练集,存入数据库中。选取的12个指标见表1。
表1:标签点说明
标准标签名 英文标签名 中文标签名
GeneratorTorque grCAN_GeneratorTorque 实际转矩
WindSpeed grWindSpeed 风速实时值
GenPower grGenPowerForProcess 发电机功率实时值
GenSpeed grGenSpeedForProcess 发电机转速实时值
TempGenCoolingAir grTempGenCoolingAir_1sec 发电机冷风温度1秒平均值
TempNacelle grTempNacelle_1sec 机舱温度1秒平均值
TempOutdoor grTempOutdoor_1sec 机舱外温度1秒平均值
TempGenBearDE grTempGenBearDE_1sec 发电机驱动端轴承温度1秒平均值
TempGenBearNDE grTempGenBearNDE_1sec 发电机非驱动端轴承温度1秒平均值
TempGenStatorU grTempGenStatorU_1sec 发电机定子绕组U相温度1秒平均值
TempGenStatorV grTempGenStatorV_1sec 发电机定子绕组V相温度1秒平均值
TempGenStatorW grTempGenStatorW_1sec 发电机定子绕组W相温度1秒平均值
2)将步骤1)准备好的干净数据做相关性分析,如附图1所示:相关性系数(r)越大,相关性越强。从图1可知发电机定子三相WUV绕组强相关,室外温度与机舱温度相关性强,风速几乎与所有变量相关,功率也与其他变量存在相关性,而发电机驱动端轴承温度与发电机非驱动端轴承温度相关性也强相关。若分析的数据间不存在相关性,则重新筛选指标集,直到数据间存在相关性为止。而后根据相关性分析结果,指定外生变量(exogenous_variable)与内生变量(endogenous_variable)作为输入变量和输出变量,如表2所示。
表2:内外生变量说明
Figure GDA0002882227360000051
Figure GDA0002882227360000061
3)本方法实质为一种基于近邻策略的非参回归算法,与KNN近邻策略需要设定邻近对象个数K值类似,也需要设定各输入指标邻近邻域半径的大小,邻近半径分为左边界(LB)和右边界(RB)。根据相关性分析结果,用各指标的标准标签英文名加上边界英文简称,形成新的参数。即风速实时值左边界和右边界可简写为WindSpeedLB和WindSpeedRB,其他指标依次类推,对输入变量各指标设定参数如表3。
表3:各指标近邻左右边界参数设置值
Figure GDA0002882227360000062
4)重新准备待分析的数据作为测试集,使用测试集输入指标值及其邻域半径参数,构建测试集输出指标的SQL查询语句:"SELECT real_time,wtid AS TurbineID,iTempGenBearDE_1sec AS GenBearDETemp,iTempGenBearNDE_1sec AS GenBearNDETemp,iTempGenStatorU_1sec AS GenStatorUTemp,iTempGenStatorV_1sec ASGenStatorVTemp,iTempGenStatorW_1sec AS GenStatorWTemp FROM{TurbineTableName}WHERE 1AND iWindSpeed BETWEEN{WindSpeedLB}AND{WindSpeedRB}AND iReactivePowerBETWEEN{GenPowerLB}AND{GenPowerRB}AND iGenSpeed BETWEEN{GenSpeedLB}AND{GenSpeedRB}AND iTempOutdoor_1sec BETWEEN{OutDoorTempLB}AND{OutDoorTempRB}ANDiTempNacelle_1sec BETWEEN{NacelleTempLB}AND{NacelleTempRB}"。将该SQL查询语句查询出的数据集作为输出指标的测试集,并统计测试集中各输出变量的百分位数值,以各输出指标的50%分位数作为点估计。其他分位数作为界限估计。
5)设定各分位数与报警等级的关系,设置的详细参数见表4;
表4:分位数与预警等级参数设定说明
百分位数(%) 报警等级 报警边界英文简称
<2.5 严重
2.5 警告 l4mp
5 注意 l3mp
10 合格 l2mp
25 良好 l1m_p
50 点估计值 mp
75 良好 r1mp
90 合格 r2mp
95 注意 r3mp
97.5 警告 r4mp
>97.5 严重
6)查看测试集输出指标的真实值所对应的预警区间,给出预警信息。附图2、图3分别是某两台机组发电机驱动端端轴承温度1秒平均值的时间报警(time_vs_tag alarm)结果。其中,图2展示的是风机发电机驱动端轴承温度发生异常时的运行图,图3展示的风机发电机驱动端轴承温度正常的运行图,从该两个图,很明显看出,本发明方法能够非常早的发现部件标签的异常,效果显著,具有实际推广价值,值得推广。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (3)

1.基于大数据集近邻策略的风机指标预测与故障预警方法,其特征在于:该方法是基于风机运行状态的历史数据,结合统计学和机器学习方法,以风机的多个监测指标作为输入指标,多个监测指标作为预测估计的输出指标,并对输出指标的预测值进行统计分析,设定分位数与报警等级的关系,最终通过查看输出指标的实际值所对应的预测区间来确定预警等级;其包括有以下步骤:
1)数据准备
选取所分析的风机部件的指标集及其历史运行数据,并对数据进行异常值处理,准备大量干净的历史数据作为训练集,存入数据库中;其中,所述指标集包括机舱温度、室外温度、风速实时值、发电机功率实时值、发电机转速实时值、发电机驱动端轴承温度、发电机非驱动端轴承温度、发电机定子绕组U相温度、发电机定子绕组V相温度及发电机定子绕组W相温度,所述异常值包括空值、跳变值、重复值、离群点;
2)相关性分析
对步骤1)清洗过后的数据进行相关性分析,分析出各指标之间的相关性,确认预测输入指标与预测输出指标的相关性,若分析的指标集间存在相关性,则进行步骤3),若不存在,则重新筛选指标集,重复步骤1)、2),直到指标集间存在相关性为止;
3)根据相关性分析,指定外生变量与内生变量作为输入变量和输出变量,并设定各输入变量的近邻域的半径大小值;其中,所述输入变量包括机舱温度、室外温度、风速实时值、发电机功率实时值、发电机转速实时值,所述输出变量包括发电机驱动端轴承温度、发电机非驱动端轴承温度、发电机定子绕组U相温度、发电机定子绕组V相温度及发电机定子绕组W相温度;
4)根据确定的输入指标和输出指标,重新准备待分析的数据作为测试集,根据测试集中各输入变量的近邻域半径大小,从训练集中搜索测试集的各输入变量近邻域内对应的各输出变量的历史数据集作为测试集的预测集输出;
5)对计算得到的输出指标的预测集进行统计分析,得到输出指标预测集的点估计及界限估计,并设定分位数与报警等级的关系,划定不同的预警等级;
6)最后查看测试集的输出变量的实际值所处界限范围进而给出机组预警等级。
2.根据权利要求1所述的基于大数据集近邻策略的风机指标预测与故障预警方法,其特征在于:在步骤4)中,使用测试集输入指标值及其邻域半径参数,构建测试集输出指标的SQL查询语句,将该SQL查询语句查询出的数据集作为输出指标的测试集,并统计测试集中各输出变量的百分位数值,以各输出指标的50%分位数作为点估计。
3.根据权利要求1所述的基于大数据集近邻策略的风机指标预测与故障预警方法,其特征在于:在步骤5)中,统计分析方法采用的是百分位数,而预测集要求50%分位数作为输出指标的点估计,其余分位数估计作为输出指标的预警评估界限。
CN201711415910.6A 2017-12-25 2017-12-25 基于大数据集近邻策略的风机指标预测与故障预警方法 Active CN108304350B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711415910.6A CN108304350B (zh) 2017-12-25 2017-12-25 基于大数据集近邻策略的风机指标预测与故障预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711415910.6A CN108304350B (zh) 2017-12-25 2017-12-25 基于大数据集近邻策略的风机指标预测与故障预警方法

Publications (2)

Publication Number Publication Date
CN108304350A CN108304350A (zh) 2018-07-20
CN108304350B true CN108304350B (zh) 2021-04-30

Family

ID=62870952

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711415910.6A Active CN108304350B (zh) 2017-12-25 2017-12-25 基于大数据集近邻策略的风机指标预测与故障预警方法

Country Status (1)

Country Link
CN (1) CN108304350B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109711053A (zh) * 2018-12-27 2019-05-03 北京航天智造科技发展有限公司 基于工业大数据风机故障预测方法及系统
CN111068230A (zh) * 2019-12-30 2020-04-28 中祖建设安装工程有限公司 一种消防设施维保方法及系统
CN113643522B (zh) * 2021-08-31 2023-06-06 中国银行股份有限公司 报警预测方法、装置、设备和存储介质
CN115434878B (zh) * 2022-11-09 2023-02-03 东方电气风电股份有限公司 风力发电机组温度集群管控方法、装置、设备及介质
CN116049157A (zh) * 2023-01-04 2023-05-02 北京京航计算通讯研究所 一种质量数据分析方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102765643A (zh) * 2012-05-31 2012-11-07 天津大学 基于数据驱动的电梯故障诊断与预警方法
CN104200396A (zh) * 2014-08-26 2014-12-10 燕山大学 一种风力发电机部件故障预警方法
CN106050559A (zh) * 2016-06-20 2016-10-26 大唐(赤峰)新能源有限公司 一种风电机组超速保护系统的检测方法及检测装置
CN106053090A (zh) * 2016-08-22 2016-10-26 中国船舶重工集团公司第七�三研究所 一种燃气轮机的近邻异常检测系统
CN106651031A (zh) * 2016-12-21 2017-05-10 山东大学 基于历史信息的雷击闪络预警方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10184985B2 (en) * 2015-12-16 2019-01-22 General Electric Company Systems and methods for crack detection in doubly-fed induction generators

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102765643A (zh) * 2012-05-31 2012-11-07 天津大学 基于数据驱动的电梯故障诊断与预警方法
CN104200396A (zh) * 2014-08-26 2014-12-10 燕山大学 一种风力发电机部件故障预警方法
CN106050559A (zh) * 2016-06-20 2016-10-26 大唐(赤峰)新能源有限公司 一种风电机组超速保护系统的检测方法及检测装置
CN106053090A (zh) * 2016-08-22 2016-10-26 中国船舶重工集团公司第七�三研究所 一种燃气轮机的近邻异常检测系统
CN106651031A (zh) * 2016-12-21 2017-05-10 山东大学 基于历史信息的雷击闪络预警方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种风力发电机自动故障诊断及预测方法;向健平 等;《动力工程学报》;20171031;全文 *

Also Published As

Publication number Publication date
CN108304350A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN108304350B (zh) 基于大数据集近邻策略的风机指标预测与故障预警方法
CN113946952A (zh) 风机孪生体的生成方法、装置及电子设备
CN115453356B (zh) 一种动力设备运行状态监测分析方法、系统、终端及介质
CN107607342B (zh) 空调机房设备群的健康能效检测方法
CN113759876A (zh) 基于案例推理的风电机组故障诊断方法及系统
Karuppusamy Machine learning approach to predictive maintenance in manufacturing industry-a comparative study
CN113740666A (zh) 一种数据中心电力系统告警风暴根源故障的定位方法
CN116771610A (zh) 一种调整风电机组变桨系统故障评估值的方法
CN113033673B (zh) 电机工况异常检测模型的训练方法及系统
CN113111314B (zh) 一种基于多机组协同的并网风电机组健康状态评估方法
CN115906437A (zh) 一种风机状态确定方法、装置、设备和存储介质
CN107545355B (zh) 一种故障原因诊断方法和装置
CN115441456A (zh) 一种电网调度支持系统故障诊断方法及装置
Zhang Comparison of data-driven and model-based methodologies of wind turbine fault detection with SCADA data
Souza et al. Evaluation of data based normal behavior models for fault detection in wind turbines
CN113268552A (zh) 一种基于局部敏感哈希的发电机设备隐患预警方法
CN114295367A (zh) 一种风电机组齿轮箱工况在线监测方法
CN114215705A (zh) 风电机组故障预警方法和系统
CN112699598A (zh) 齿轮箱油温异常智能诊断方法及装置
CN113064075A (zh) 一种基于边缘计算及深度学习的电机寿命预估方法
CN112836424A (zh) 一种风机叶片早期结冰故障预测方法
CN112696481A (zh) 风电机组齿轮箱轴温异常智能诊断方法及装置
CN114135449B (zh) 风电机组叶片故障预警方法
Han et al. Application of Sparse Representation in SCADA: Wind Turbine Fault Diagnosis Based on K-SVD
CN113721207B (zh) 一种基于大数据的雷达时寿件更换的预警方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant