CN111380686A - 一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法 - Google Patents

一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法 Download PDF

Info

Publication number
CN111380686A
CN111380686A CN202010337698.1A CN202010337698A CN111380686A CN 111380686 A CN111380686 A CN 111380686A CN 202010337698 A CN202010337698 A CN 202010337698A CN 111380686 A CN111380686 A CN 111380686A
Authority
CN
China
Prior art keywords
model
fault
data
xgboost algorithm
main bearing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010337698.1A
Other languages
English (en)
Inventor
黄文广
刘广臣
陈文�
孙涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huafeng Data Shenzhen Co ltd
Original Assignee
Huafeng Data Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huafeng Data Shenzhen Co ltd filed Critical Huafeng Data Shenzhen Co ltd
Priority to CN202010337698.1A priority Critical patent/CN111380686A/zh
Publication of CN111380686A publication Critical patent/CN111380686A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M13/00Testing of machine parts
    • G01M13/04Bearings

Abstract

本发明公开了一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选特征变量作为训练模型的总数据,对总数据进行训练集和检验集的划分;确定模型参数建立基于XGBoost算法故障监测模型;将检验集带入基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。

Description

一种基于XGBoost算法模型的风机主轴承故障监测与诊断 方法
技术领域
本发明涉及一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,主涉及风机的主轴承的故障监测与故障诊断技术领域。
背景技术
目前深度学习网络在风电机组主轴承状态分析运用广泛,深度网络在主轴承变量间提取重要特征;利用指数加权移动平均法提取其特征变化,判断其趋势是否偏离正常状态。其中,对振动信号的研究常作为风机主轴承故障诊断的方案之一,利用小波包分解作为信号分析、图像处理的方法,即分析树表示小波包,多次迭代小波转换输入细节信息,对高频带信号的分辨率处理精细,根据分析信号引入最佳基函数与信号匹配。以及,在风机主轴承故障预测中,使用XGBoost算法的特征选取工具,对输入变量特征的重要性进行排序,筛选出与被解释变量最相关的特征变量,确定关联程度,判断其可作为主轴承故障的指标。然而现有技术在实际使用中:
(1)深度学习网络优化存在梯度消失问题,很难进行优化,深度学习网络大多缺乏时效性,时间成本过大。
(2)小波包分析常用于振动信号的研究,对数据类型更有要求。
(3)在故障原因诊断的过程之中,现有的回归模型只能够给出故障状态判断,缺少对故障部位或者原因进行分析且准确性欠缺,单模型排序在实际中仍然不能为风机维修给出具有较高准确性的实质性建议。
因此,迫切需要一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,以解决现有技术中存在的这一问题。为了解决上述技术问题,特提出一种新的技术方案。
发明内容
本发明的目的在于提供一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,所述方法包含下述步骤:
步骤一,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;
步骤二,运用Pearson相关系数、XGBoost算法、CatBoost算法和随机森林算法对原始数据集中的特征变量进行综合打分,从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;
步骤三,根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选在并网状态下的特征变量作为训练模型的总数据,并对总数据进行训练集和检验集的划分;
步骤四,利用机器学习常用调参方法网格搜索的方式检索最优的参数组合,确定模型参数建立基于XGBoost算法故障监测模型;
步骤五,将步骤三的检验集带入步骤四的基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;
步骤六,在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。
优选地,所述步骤一通过删除日期时间列,删除控制状态列的列处理方式把数据处理成以一分钟为时间间隔。
优选地,所述SCADA系统的数据库提取了2018-2019年以10秒钟为时间间隔的数据。
优选地,所述以10秒钟为时间间隔的数据的数量为310万条。
优选地,所述总数据进行划分的方式为80%作为训练集,20%作为检验集。
与现有技术相比,本发明的有益效果是:
(1)引入XGBoost算法建立模型,准确度相对较高,计算速度较快,比通过神经网络的方式更加灵活有效。
(2)本文在特征变量选取和相关性分析方式上,融合4种算法模型,即Pearson相关系数,CatBoost算法和XGBoost算法,随机森林算法综合筛选特征集,进行特征相关性排序。
(3)利用特征相关性排序作为故障原因诊断与定位的参考。
(4)故障监测与故障诊断分开进行,确保在发现故障的基础上,优化结果,剖析原因,并最终联系实际给出本质的结论以及建议。
附图说明
图1为本发明的模型参数表。
图2为本发明检验样本模型预测温度与实际温度残差图。
图3为本发明的变量排序表。
图4为本发明的主轴承故障监测及故障诊断流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅说明书附图,本发明提供一种技术方案:一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,所述方法包含下述步骤:
步骤一,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;
步骤二,运用Pearson相关系数、XGBoost算法、CatBoost算法和随机森林算法对原始数据集中的特征变量进行综合打分,从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;
步骤三,根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选在并网状态下的特征变量作为训练模型的总数据,并对总数据进行训练集和检验集的划分;
步骤四,利用机器学习常用调参方法网格搜索的方式检索最优的参数组合,确定模型参数建立基于XGBoost算法故障监测模型;
步骤五,将步骤三的检验集带入步骤四的基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;
步骤六,在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。
具体实施时:1)本文基于日照莒县风场的一号风机进行建模研究,从SCADA数据库中提取了2018-2019年以10秒钟为时间间隔的数据,共约310万条。从控制状态筛选出并网状态下的数据作为输入数据,删去含有缺失值的数据行、删除其他控制状态下的数据行;列处理:删除日期时间列,删除控制状态列,最终把数据处理成以一分钟为时间间隔。
2)综合四种变量排序方法:Pearson相关系数、XGBoost算法、CatBoost算法、随机森林算法,对风场集控主轴承相关特征变量进行相关性分析,对四种算法排序结果赋予平均权重打分进行综合排序,从模型结果得到建立模型所需要的排名靠前的特征变量(详细排名见表2)。
3)根据公司集控中心相关部件故障记录表,即故障发生起始和停止时间详细记录表,删去故障时间段以及其前后各一天的所有数据,筛选该风机在并网正常运行的状态下的数据作为本研究的总数据,采用机器学习常用方案,将总数据随机进行划分,80%作为训练集,用于训练模型,20%作为检验集,用于对模型优劣的检验。
4)以主轴承叶轮侧温度、主轴承齿轮箱侧温度作为因变量,利用机器学习常用调参方法网格搜索的方式检索局部最优的参数组合(如图1本发明模型参数表所示),确定模型参数建立基于XGBoost算法故障监测模型。
5)将数据检验集带入训练完成的模型,得到检验样本对应的模型预测曲线与实际温度曲线,绘制两条曲线残差图方便与人工观察风机的运行状态(如残差曲线的长时间大幅度波动,可诊断为发生故障),设定均方误差(MSE)、平均绝对误差(MAE)、平均相对误差绝对值(MAPE)、R2(R Squared)等作为模型的评价指标。
6)如图2所示,本发明检验样本模型预测温度与实际温度残差图。在XGBoost算法模型进行故障状态监测中若出现异常,可将特征变量排序用作风机检修过程中故障原因诊断与定位的参照。
本发明取自2000余个连续样本,图中标红区域的残差曲线长时间大幅度波动为风机运行时异常阶段,即发生故障,可将变量排序表(图3本发明的变量排序表)作为故障检修的参考,关联程度排名靠前的特征变量对应部位可定为首要的检修对象。
本发明采用的数据来源于日照莒县某风场的联合动力2.0MW系统数据,选取其一号风机的一段包含故障样本的连续数据作为模型的出发点,检验本发明的实际操作性和准确度。实验数据以一分钟为时间间隔,故障时间段为2019年1月3日18:54:08至2019年1月3日23:59:00约300条数据,选取包含该故障时间段的前后一段共约2500条作为最终验证集。
本发明的实施例具体步骤流程如图4本发明的主轴承故障监测及故障诊断流程图所示,根据Pearson相关系数、XGBoost算法、CatBoost算法、随机森林算法对特征变量进行综合打分的过程如下:
(1)计算各个特征变量之间的Pearson相关系数
(2)将特征变量嵌入XGBoost算法、CatBoost算法、随机森林算法模型之中,得到变量的主成分排序结果
(3)综合所有方式的排名结果赋予平均权重,计算综合排名,结果如图3本发明变量排序综合表所示。
进而实现通过将模型嵌入风机运行系统的方式对主轴承的状态进行监测,依据故障之前的征兆判断其发生的可能性,并对未来可能出现的故障进行原因诊断。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法,其特征在于,所述方法包含下述步骤:
步骤一,从SCADA系统的数据库提取以一分钟为时间间隔的数据作为原始数据集;
步骤二,运用Pearson相关系数、XGBoost算法、CatBoost算法和随机森林算法对原始数据集中的特征变量进行综合打分,从提取的原始数据中得到建立模型所需要的排名靠前的特征变量;
步骤三,根据系统故障记录表删去故障时间段以及其前后各一天的所有数据,并且筛选在并网状态下的特征变量作为训练模型的总数据,并对总数据进行训练集和检验集的划分;
步骤四,利用机器学习常用调参方法网格搜索的方式检索最优的参数组合,确定模型参数建立基于XGBoost算法故障监测模型;
步骤五,将步骤三的检验集带入步骤四的基于XGBoost算法故障监测模型,得到测试样本对应的实际曲线与预测曲线对比图、残差图和评价指标的计算结果;
步骤六,在基于XGBoost算法故障监测模型,发现异常后,将排名靠前的特征变量用作风机检修过程中故障原因诊断与定位的参照。
2.根据权利要求1所述的基于XGBoost算法模型的风机主轴承故障监测与诊断方法,其特征在于:所述步骤一通过删除日期时间列,删除控制状态列的列处理方式把数据处理成以一分钟为时间间隔。
3.根据权利要求1所述的基于XGBoost算法模型的风机主轴承故障监测与诊断方法,其特征在于:所述SCADA系统的数据库提取了2018-2019年以10秒钟为时间间隔的数据。
4.根据权利要求1所述的基于XGBoost算法模型的风机主轴承故障监测与诊断方法,其特征在于:所述以10秒钟为时间间隔的数据的数量为310万条。
5.根据权利要求1所述的基于XGBoost算法模型的风机主轴承故障监测与诊断方法,其特征在于:所述总数据进行划分的方式为80%作为训练集,20%作为检验集。
CN202010337698.1A 2020-04-26 2020-04-26 一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法 Pending CN111380686A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010337698.1A CN111380686A (zh) 2020-04-26 2020-04-26 一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010337698.1A CN111380686A (zh) 2020-04-26 2020-04-26 一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法

Publications (1)

Publication Number Publication Date
CN111380686A true CN111380686A (zh) 2020-07-07

Family

ID=71214311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010337698.1A Pending CN111380686A (zh) 2020-04-26 2020-04-26 一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法

Country Status (1)

Country Link
CN (1) CN111380686A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035716A (zh) * 2020-08-21 2020-12-04 华风数据(深圳)有限公司 基于XGBoost算法的风机发电机故障监测与诊断方法
CN112633368A (zh) * 2020-12-21 2021-04-09 四川大学 基于改进多粒度级联森林的扁平振动电机缺陷检测系统及方法
CN113221453A (zh) * 2021-04-30 2021-08-06 华风数据(深圳)有限公司 风电机组齿轮箱输出轴故障监测预警方法
CN113392575A (zh) * 2021-05-17 2021-09-14 桂林电子科技大学 基于滑窗特征的风机主轴故障预测方法
CN113570146A (zh) * 2021-07-30 2021-10-29 国电电力内蒙古新能源开发有限公司 基于LightGBM的风电机组齿轮箱油温故障预警方法
CN113607413A (zh) * 2021-08-26 2021-11-05 上海航数智能科技有限公司 一种基于可控温湿度的轴承部件故障监测预测方法
CN114969953A (zh) * 2022-07-28 2022-08-30 华中科技大学 基于CatBoost-NSGA-Ⅲ的盾构下穿隧道优化设计方法及设备
CN115310216A (zh) * 2022-07-05 2022-11-08 华能国际电力股份有限公司上海石洞口第二电厂 一种基于优化XGBoost的磨煤机故障预警方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543210A (zh) * 2018-09-28 2019-03-29 国电电力宁夏新能源开发有限公司 一种基于机器学习算法平台的风电机组故障预测系统
CN110120265A (zh) * 2019-04-29 2019-08-13 天津大学 基于多维特征和模型融合的提高预测血尿酸精度的方法
CN110197706A (zh) * 2019-04-26 2019-09-03 深圳市宁远科技股份有限公司 一种基于sbs的层次化特征选择方法、系统及应用
CN110674842A (zh) * 2019-08-26 2020-01-10 明阳智慧能源集团股份公司 一种风电机组主轴轴承故障预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109543210A (zh) * 2018-09-28 2019-03-29 国电电力宁夏新能源开发有限公司 一种基于机器学习算法平台的风电机组故障预测系统
CN110197706A (zh) * 2019-04-26 2019-09-03 深圳市宁远科技股份有限公司 一种基于sbs的层次化特征选择方法、系统及应用
CN110120265A (zh) * 2019-04-29 2019-08-13 天津大学 基于多维特征和模型融合的提高预测血尿酸精度的方法
CN110674842A (zh) * 2019-08-26 2020-01-10 明阳智慧能源集团股份公司 一种风电机组主轴轴承故障预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐芊: ""基于XGBoost两层算法模型的风机齿轮箱输入轴故障监测与诊断方法"", 《电力设备管理》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035716A (zh) * 2020-08-21 2020-12-04 华风数据(深圳)有限公司 基于XGBoost算法的风机发电机故障监测与诊断方法
CN112633368A (zh) * 2020-12-21 2021-04-09 四川大学 基于改进多粒度级联森林的扁平振动电机缺陷检测系统及方法
CN112633368B (zh) * 2020-12-21 2022-07-01 四川大学 基于改进多粒度级联森林的扁平振动电机缺陷检测系统及方法
CN113221453A (zh) * 2021-04-30 2021-08-06 华风数据(深圳)有限公司 风电机组齿轮箱输出轴故障监测预警方法
CN113392575A (zh) * 2021-05-17 2021-09-14 桂林电子科技大学 基于滑窗特征的风机主轴故障预测方法
CN113570146A (zh) * 2021-07-30 2021-10-29 国电电力内蒙古新能源开发有限公司 基于LightGBM的风电机组齿轮箱油温故障预警方法
CN113607413A (zh) * 2021-08-26 2021-11-05 上海航数智能科技有限公司 一种基于可控温湿度的轴承部件故障监测预测方法
CN115310216A (zh) * 2022-07-05 2022-11-08 华能国际电力股份有限公司上海石洞口第二电厂 一种基于优化XGBoost的磨煤机故障预警方法
CN115310216B (zh) * 2022-07-05 2023-09-19 华能国际电力股份有限公司上海石洞口第二电厂 一种基于优化XGBoost的磨煤机故障预警方法
CN114969953A (zh) * 2022-07-28 2022-08-30 华中科技大学 基于CatBoost-NSGA-Ⅲ的盾构下穿隧道优化设计方法及设备

Similar Documents

Publication Publication Date Title
CN111380686A (zh) 一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法
CN112035716A (zh) 基于XGBoost算法的风机发电机故障监测与诊断方法
CN110414155B (zh) 一种带有单测点的风机部件温度异常检测和报警方法
CN115034248A (zh) 用于设备的自动诊断方法、系统和存储介质
CN111337244B (zh) 一种风机齿轮箱输入轴故障监测和诊断的方法及装置
CN110929918A (zh) 一种基于CNN和LightGBM的10kV馈线故障预测方法
KR102627062B1 (ko) 비정상 장비 트레이스 검출 및 분류
CN111581597A (zh) 基于自组织核回归模型的风电机组齿轮箱轴承温度状态监测方法
CN111458149B (zh) 一种滚动轴承性能及使用寿命的预测方法及系统
CN114372504A (zh) 一种基于图神经网络的风电机组故障预警方法
CN112179691A (zh) 基于对抗学习策略的机械装备运行状态异常检测系统和方法
CN112598172A (zh) 一种风电机组轴承温度预警方法
CN110580492A (zh) 一种基于小幅波动检测的轨道电路故障前兆发现方法
CN112633611A (zh) 基于大数据分析的海底电缆状态检修策略优化方法及系统
CN113221453A (zh) 风电机组齿轮箱输出轴故障监测预警方法
CN112906764A (zh) 基于改进bp神经网络的通信安全设备智能诊断方法及系统
CN112632148A (zh) 一种考虑极端气候条件下配电网元器件智能预警方法
CN117150418B (zh) 基于状态特征故障树的变压器运检周期制定方法和系统
CN117034001A (zh) 一种风电机组故障预测方法、装置及电子设备
CN116677570A (zh) 基于海上风电机组机舱温度监测的故障预警方法及系统
CN116189802A (zh) 一种基于气体浓度时序数据的变压器故障预警方法
CN115292820A (zh) 一种城轨列车轴承剩余使用寿命的预测方法
CN116224950A (zh) 面向无人生产线自组织重构的智能故障诊断方法和系统
CN113570146A (zh) 基于LightGBM的风电机组齿轮箱油温故障预警方法
CN117232809A (zh) 基于dematel-anp-critic组合赋权的风机主轴故障预诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200707