CN115687864A - 基于XGBoost-KDE的风机主轴承故障预警方法 - Google Patents

基于XGBoost-KDE的风机主轴承故障预警方法 Download PDF

Info

Publication number
CN115687864A
CN115687864A CN202211089338.XA CN202211089338A CN115687864A CN 115687864 A CN115687864 A CN 115687864A CN 202211089338 A CN202211089338 A CN 202211089338A CN 115687864 A CN115687864 A CN 115687864A
Authority
CN
China
Prior art keywords
xgboost
main bearing
early warning
fan
kde
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211089338.XA
Other languages
English (en)
Inventor
万安平
龚志鹏
张银龙
纪云松
马士东
刘海南
张运宁
敖立争
陈希
彭晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou City University
Original Assignee
Hangzhou City University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou City University filed Critical Hangzhou City University
Priority to CN202211089338.XA priority Critical patent/CN115687864A/zh
Publication of CN115687864A publication Critical patent/CN115687864A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)

Abstract

本发明公开了基于XGBoost‑KDE的风机主轴承故障预警方法,应用于机电系统故障诊断技术领域,包括:获取风机运行数据集,并进行数据预处理、特征工程处理以及归一化处理,得到训练集;构建XGBoost模型,并将训练集输入至XGBoost模型进行训练,直至模型收敛,得到最优XGBoost模型;通过最优XGBoost模型,预测风机主轴承温度,得到预测温度值与正常温度值的残差;应用非参数核密度估计法KDE确定残差的预警阈值,并通过滑动窗口分析法进行风机主轴承故障预警。本发明实现了对风机主轴承及时精确的故障诊断和分析,减少了停机时间,降低了风机运维成本,对于提高风力发电机可靠性和可用性具有重要意义。

Description

基于XGBoost-KDE的风机主轴承故障预警方法
技术领域
本发明涉及机电系统故障诊断技术领域,特别涉及基于XGBoost-KDE的风机主轴承故障预警方法。
背景技术
由于风力发电机组的运行环境普遍恶劣,致使风电机组故障频发,这严重影响机组运行的安全可靠性,制约了风电的发展步伐。
轴承是风力发电机中广泛使用的重要部件,风机的主轴与叶片直接相连,属于低转速区域,主轴轴承的运行工况为低速重载。风机主轴作为风力发电机的核心旋转部件,主轴轴承一旦发生故障,可能会导致主轴受力不均匀、转轴中心偏转等现象,进而致使风机长时间停机,产生高昂的维修成本。根据欧洲风能学会(EAWE)的声明,风电行业已将主轴承的故障诊断确定为提高风力发电机可靠性和可用性的关键问题。
目前,有关风力发电机组轴承故障诊断的研究已经取得一定的进展,相关学者提出了不同的诊断方法来诊断风力发电机的轴承故障。目前主流的轴承故障诊断方法都是基于傅立叶变换(FFT)、经验模态分解(EMD)、经验小波变换(EWT)、变分模态分解(VMD)等信号处理技术对振动信号处理和分析。然而,振动信号的提取需要安装大量的振动传感器和数据采集设备,这会增加风机动力传输系统的成本和线路复杂性,且对工作人员的技术和经验要求很高,不利于推广至各风电场域。
近些年由于人工智能技术的成熟,基于机器学习和深度学习的风力发电机故障诊断研究不断涌现:一方面,风力发电机的SCADA系统在风机运行过程中储存着大量的非振动信号数据亟待分析和挖掘,另一方面,计算机的硬件设备不断提升,能够承载更大体量的数据的计算。
为此,如何提供一种能够利用SCADA系统中的非振动信号数据和机器学习方法对风机主轴承进行及时精确的故障诊断和分析的基于XGBoost-KDE 的风机主轴承故障预警方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提出了基于XGBoost-KDE的风机主轴承故障预警方法。本发明通过基于风机SCADA系统中的数据,通过XGBoost学习风机主轴承正常工况下的温度变化特性,用训练好的模型去预测风机主轴承的温度,最后用非参数核密度估计法KDE和滑动窗口的组合方法分析预测值和真实值之间的残差,提前发现风机主轴承故障并发出预警,实现对风机主轴承及时精确的故障诊断和分析,减少了停机时间,降低了风机运维成本,对于提高风力发电机可靠性和可用性具有重要意义。
为了实现上述目的,本发明采用如下技术方案:
基于XGBoost-KDE的风机主轴承故障预警方法,包括:
步骤(1):获取风机运行数据集,并进行数据预处理、特征工程处理以及归一化处理,得到训练集。
步骤(2):构建XGBoost模型,并将训练集输入至XGBoost模型进行训练,直至模型收敛,得到最优XGBoost模型。
步骤(3):通过最优XGBoost模型,预测风机主轴承温度,得到预测温度值与正常温度值的残差。
步骤(4):应用非参数核密度估计法KDE确定残差的预警阈值,并通过滑动窗口分析法进行风机主轴承故障预警。
可选的,步骤(1)中,风机运行数据集由风力发电机SCADA系统读取。
可选的,步骤(1)中,数据预处理具体为:去除风机运行数据集中的缺失值、异常值和非正常工作时的数据以及剔除风机维修完成重启后预设时间内的数据。
可选的,步骤(1)中,特征工程处理具体为:采用XGBoost模型中的特征重要性指标筛选特征,计算方法采用“weight”权重形式。
可选的,归一化处理为最大最小值归一化,表达式如下:
Figure BDA0003836519350000031
其中,xmin为某个特征参数中的最小值;xmax为某个特征参数中的最大值; x为某个特征参数中的某个值;x*为归一化处理后的值,数值区间为[0,1]。
可选的,步骤(2)中,构建XGBoost模型具体为:
给定一个拥有n个样本和m个特征的训练集:
D=(xi,yi)(|D|=n,xi∈Rm,yi∈R);
定义函数如下:
Figure BDA0003836519350000032
其中,
Figure BDA0003836519350000033
为预测值;fk为第k棵树的权重函数。
定义损失函数:
Figure BDA0003836519350000034
其中,T为叶子节点的个数,
Figure BDA0003836519350000041
为正则化项;ω是每个叶节点的得分;γ和λ是用来避免过拟合的控制因子。
在给定的训练参数范围内,XGBoost模型训练的最终结果需使得损失函数最小,得到最优XGBoost模型。
可选的,步骤(4)中,应用非参数核密度估计法KDE确定残差的预警阈值具体为:
设定最优XGBoost模型的预测值和真实值之间的残差是符合某种概率密度分布的单变量同分布的样本序列,为{x1,x2,...,xn},则核密度估计函数为:
Figure BDA0003836519350000042
其中,K为非负核函数;h>0为平滑参数,为带宽;核函数选用高斯核函数;带宽的表达式如下:
Figure BDA0003836519350000043
其中,
Figure BDA0003836519350000044
为样本标准差,n为样本个数。
根据拟合结果,依据正态分布中“-3σ<x<3σ”准则,设定残差预警阈值。
可选的,步骤(4)中,通过滑动窗口分析法进行风机主轴承故障预警具体为:
将发现故障时间点之前的风机运行数据输入最优XGBoost模型,对预测结果的残差用滑动窗口分析,每个窗口内有第一预设数量个样本点,取其平均值。
设定当滑动窗口的输出值为连续第二预设数量个点,超过正常范围时,即判定主轴轴承发生故障。
经由上述的技术方案可知,与现有技术相比,本发明提出了基于 XGBoost-KDE的风机主轴承故障预警方法。本发明通过基于风机SCADA系统中的数据,通过XGBoost学习风机主轴承正常工况下的温度变化特性,用训练好的模型去预测风机主轴承的温度,最后用非参数核密度估计法KDE和滑动窗口的组合方法分析预测值和真实值之间的残差,提前发现风机主轴承故障并发出预警,具有如下优点:
本发明仅需提取风机本身SCADA系统中的数据对风机主轴承故障实现预警,不需要额外振动信号数据。
本发明能对风机主轴承温度实现精准预测,具有较好的泛化能力,将其他风电机组数据输入模型进行测试,仍取得很好的预测效果。
将故障机组数据输入模型,用滑动窗口分析法对预测结果进行处理,根据设定的故障预警阈值对滑窗分析结果进行判断,结果表明本发明所提出的基于XGBoost-KDE的风机主轴承故障预警方法能及时、有效识别出风机主轴承故障,提前近一个月发出预警。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明的流程示意图。
图2为本发明的特征重要性排序示意图。
图3为本发明的部分特征曲线示意图。
图4-图6为本发明的故障诊断方法与其他方法训练过程中准确率的对比示意图。
图7为本发明的核密度估计曲线示意图。
图8为本发明的故障机组原残差分布曲线示意图。
图9为本发明的滑动窗口分析后残差分布曲线示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明实施例1公开了基于XGBoost-KDE的风机主轴承故障预警方法,包括:
步骤(1):通过风力发电机SCADA系统读取风机运行数据集,并进行数据预处理、特征工程处理以及归一化处理,得到训练集。
数据预处理具体为:去除风机运行数据集中的缺失值、异常值和非正常工作时的数据以及剔除风机维修完成重启后48小时内的数据(由于风机维修后会经过一段重启和适应的时间,这段时间内的温度曲线的差异性会影响模型的训练结果)。
特征工程处理具体为:采用XGBoost模型中的特征重要性指标筛选特征,计算方法采用“weight”权重形式,这表示在所有树中,一个特征在分裂节点时被使用的次数,由模型在训练中自动输出。
归一化处理为最大最小值归一化,表达式如下:
Figure BDA0003836519350000061
其中,xmin为某个特征参数中的最小值;xmax为某个特征参数中的最大值; x为某个特征参数中的某个值;x*为归一化处理后的值,数值区间为[0,1]。
步骤(2):构建XGBoost模型,并将训练集输入至XGBoost模型进行训练,直至模型收敛,得到最优XGBoost模型,具体为:
XGBoost是一个树集成模型,训练时采用前向分布算法进行贪婪的学习,每次迭代都学习一棵CART树来拟合之前t-1棵树的预测结果与训练样本真实值的残差。
给定一个拥有n个样本和m个特征的训练集:
D=(xi,yi)(|D|=n,xi∈Rm,yi∈R);
定义函数如下:
Figure BDA0003836519350000071
其中,
Figure BDA0003836519350000072
为预测值;fk为第k棵树的权重函数。
定义损失函数:
Figure BDA0003836519350000073
其中,T为叶子节点的个数,
Figure BDA0003836519350000074
为正则化项;ω是每个叶节点的得分;γ和λ是用来避免过拟合的控制因子。
在给定的训练参数范围内,XGBoost模型训练的最终结果需使得损失函数最小,得到最优XGBoost模型。
步骤(3):通过最优XGBoost模型,预测风机主轴承温度,得到预测温度值与正常温度值的残差。
步骤(4):应用非参数核密度估计法KDE确定残差的预警阈值,并通过滑动窗口分析法进行风机主轴承故障预警。
应用非参数核密度估计法KDE确定残差的预警阈值具体为:
设定最优XGBoost模型的预测值和真实值之间的残差是符合某种概率密度分布的单变量同分布的样本序列,为{x1,x2,...,xn},则核密度估计函数为:
Figure BDA0003836519350000081
其中,K为非负核函数;h>0为平滑参数,为带宽;核函数选用高斯核函数;带宽的表达式如下:
Figure BDA0003836519350000082
其中,
Figure BDA0003836519350000083
为样本标准差,n为样本个数。
根据拟合结果,依据正态分布中“-3σ<x<3σ”准则,设定残差预警阈值。
可选的,步骤(4)中,通过滑动窗口分析法进行风机主轴承故障预警具体为:
将发现故障时间点之前的风机运行数据输入最优XGBoost模型,对预测结果的残差用滑动窗口分析,每个窗口内有72个样本点(6个小时),取其平均值。
设定当滑动窗口的输出值为连续96个点(8个小时),超过正常范围时,即判定主轴轴承发生故障。
实施例2:
本发明实施例2公开了基于XGBoost-KDE的风机主轴承故障预警方法,如图1所示,包括:
(一)数据采集与处理部分
所用数据集取自云南大黑山风电场15号、18号2MW级风力发电机组的 SCADA数据采集系统,从中提取了包括风速、功率、齿轮箱油温、主轴承温度在内的32个特征值。数据的时间分布为2021年1月1日至2021年12月 31日,数据的时间序列为5分钟级(样本间隔时间为5分钟),一共91038 条原始数据。
去除数据集中的缺失值、异常值和非正常工作时的数据。15号风电机组于2021年7月27日7点10分被发现存在主轴承滚动体碎裂故障,因此15 号风机自故障发生时刻至2021年8月7日都处于停机维修状态。主轴承的实际故障发生时间点肯定处于人工发现故障的时间点之前,因此以风机维修时间段为时间节点,将数据分为发现故障前和维修后风机处于正常运行工况两个部分。风机处在正常工作情况下的数据用来做模型训练和模型测试。同时,由于风机维修后会经过一段重启和适应的时间,这段时间内的温度曲线的差异性会影响模型的训练结果,所以需将风机刚重启后一段时间的数据剔除。根据风场的风机维护记录,本文将风机开始重启后48小时的数据删除,最终用于模型训练和测试的数据共28334条。
从SCADA系统导出的数据集共有32个特征参数,其中有风速、功率、齿轮箱油温、主轴承温度等。并不是所有特征值都对模型训练有益,为防止特征冗余,同时降低数据量,加快模型训练速度,需对特征进行一定的筛选处理。本发明采用XGBoost中的特征重要性指标筛选特征,计算方法采用“weight”权重形式,这表示在所有树中,一个特征在分裂节点时被使用的次数。
如图2所示,为重要性排名靠前的11个特征。风机的动力和风速直接相关,主轴承温度很大程度受风速的影响;风机发电功率与主轴承负载相关,发电机转速和主轴转速成正比,这两个参数对主轴承温度也有很大的影响;齿轮箱油温等温度参数与主轴承温度同为温度类参数,它们之间会存在一定的相似性,这些参数对提高主轴承温度预测的准确性有很大帮助。
通过对比发现,机舱温度和环境温度这两个特征的变化趋势近乎相同。这与实际情况相符,机舱温度相当于机舱内部的环境温度,与机舱外温度密切相关。为防止特征冗余,这两个特征只能选取一个。根据特征重要性排序结果,选取机舱温度作为输入变量。
由于模型中采用的优化方法为梯度下降法,还需将数据归一化为相同尺度,这样可以大大提高训练效率,有助于模型的快速收敛。本发明采用最大最小值归一化方法:
Figure BDA0003836519350000101
其中,xmin为某个特征参数中的最小值;xmax为某个特征参数中的最大值; x为某个特征参数中的某个值;x*为归一化处理后的值,数值区间为[0,1]。
部分参数归一化后的曲线如图3所示。
(二)模型训练部分
XGBoost是一个树集成模型,训练时采用前向分布算法进行贪婪的学习,每次迭代都学习一棵CART树来拟合之前t-1棵树的预测结果与训练样本真实值的残差。
给定一个拥有n个样本和m个特征的训练集:
D=(xi,yi)(|D|=n,xi∈Rm,yi∈R);
定义函数如下:
Figure BDA0003836519350000102
其中,
Figure BDA0003836519350000103
为预测值;fk为第k棵树的权重函数。
定义损失函数:
Figure BDA0003836519350000111
其中,T为叶子节点的个数,
Figure BDA0003836519350000112
为正则化项;ω是每个叶节点的得分;γ和λ是用来避免过拟合的控制因子。
在给定的训练参数范围内,XGBoost模型训练的最终结果需使得损失函数最小,得到最优XGBoost模型。
经数据预处理后,用于模型训练的数据尺寸维28334×10,前者为风机正常工况下样本点个数,后者为特征变量个数,如表1所示,输出值为主轴承温度。
表1输入参数表
Figure BDA0003836519350000113
所有变量参数都经过归一化处理为无量纲参数,训练模型时无需考虑量纲的问题。
这里在python3.9环境中搭建XGBoost模型。根据XGBoost算法原理,一些超参数对XGBoost的训练性能至关重要。由于主轴承温度预测是一项回归任务,这里选用最大深度(max_depth)、学习率(learning_rate)、弱学习器数目(n_estimators)为调节参数。树的深度越深,模型的复杂度就越高,就越容易过拟合;学习率控制模型的学习速度,数值越低,模型训练速度越慢,但不易陷入局部最优;弱学习器数量越多,模型学习能力越强,但容易过拟合。
调参方式选用网格搜索交叉验证法(GridSearchCV),根据以往经验设定参数调节范围,调参范围与最终结果如表2所示:
表2模型参数表
Figure BDA0003836519350000121
(三)模型对比与验证
模型的优劣需要通过一定的评价指标来进行判断,本文拟采用统计指标 RMSE和R2对预测值和实际值进行分析,以评估已建立的XGBoost模型的准确性。
均方根误差(RMSE)代表预测值和实际值之间的误差,定义如下:
Figure BDA0003836519350000122
决定系数(R2)可以衡量一组数据的偏差,并表示回归拟合的良好程度:
Figure BDA0003836519350000123
其中yi表示主轴轴承温度的实际值,
Figure BDA0003836519350000124
表示实际值的平均值,
Figure BDA0003836519350000125
表示预测值。决定系数的值介于0和1之间,R2值越接近1,样本中预测值和真实值误差越小,表示回归分析中自变量对因变量的解释越好。
为验证XGBoost模型的准确性和有效性,在选用合适的参数后,采用反向传播人工神经网络(Back Propagation Artificial Neuron Network,简称 BP-ANN)和线性回归算法(LinearRegression,简称LR)作为类比模型进行风机主轴承温度预测。三个模型输入值均为同一批风机正常运行工况的数据,将模型输出结果反归一化后,不同模型的实验结果对比如表3所示。
从表3中可以看出,XGBoost模型的预测精度明显高于其它模型,训练集RMSE值仅为0.093℃,验证集RMSE为0.571℃,远低于其它模型。同时, XGBoost模型训练集R2值达到了0.999,验证集R2值也达到了0.976,这表明XGBoost模型能够高精度拟合风机主轴承温度在正常工况下的变化曲线。
表3不同模型实验结果对比
Figure BDA0003836519350000131
图4-图6为三个不同模型预测结果的直观对比,可以看出XGBoost的拟合精度远高于BP-ANN和LR。
为进一步验证模型的预测效果,将同型号的18号风电机组正常工况下的数据用相同的数据预处理方式处理后,输入模型进行测试。18号机组预测结果的RMSE值为0.353℃,R2值为0.988,可以看出该模型对不同机组的预测效果也很好,具有较好的泛化能力。
(四)主轴承故障预警方法研究
得到一个样本集的分布密度函数有两种方法,分别是参数估计法和非参数估计法。参数估计法需先假定样本集符合某一概率分布,很难拟合出与真实分布相符的模型。非参数估计不需要加入任何先验知识,而是根据数据本身的特点、性质来拟合分布,拟合结果与实际情况相近。这里采用非参数估计法中的核密度估计法KDE来拟合模型预测的残差分布情况。
假设模型测试集中的预测值和真实值之间的残差是符合某种概率密度分布的单变量同分布的样本序列,为{x1,x2,...,xn},则核密度估计函数为:
Figure BDA0003836519350000141
其中,K为非负核函数;h>0为平滑参数,为带宽;核函数选用高斯核函数;带宽的表达式如下:
Figure BDA0003836519350000142
其中,
Figure BDA0003836519350000143
为样本标准差,n为样本个数。
拟合的概率分布效果如图7所示。从图7中可以看出,拟合残差概率密度分布曲线近似于标准正态分布,平均值近似为0,拟合曲线关于轴x=0近乎对称。下方的小线段代表实际误差概率密度分布情况。
根据拟合的残差概率密度曲线和“3σ准则”,设定风机正常工况下残差分布为-3.5~3.5℃。将发现故障时间点之前的数据输入模型,对预测结果的残差用滑动窗口分析,每个窗口内有72个样本点(6个小时),取其平均值。
如图8所示,为发现故障时间点之前的主轴承温度预测误差分布曲线,经滑动窗口分析处理后,误差分布曲线如图9所示。为排除偶然因素影响,设定当滑动窗口的输出值连续96个点(8个小时)超过正常范围时,即判定主轴轴承发生故障。从图8中可已看出,在大约第6000个时间点时,误差值发生巨大波动,且之后8个小时持续超出设定的正常范围[-3.5,3.5]。由此可判定该风机主轴承在该时间点发生故障,经查得该时间点对应的时间为2021年 6月28日,而该机组被发现主轴承滚动体碎裂故障的时间为2021年7月27 日,比实际发现故障的时间提前一个月左右。
轴承滚子外滚道常出现缺损、摩擦损伤以及个别方位凹陷等问题,轴承滚子会持续受到冲击力。时间一长,受该类冲击力的影响,滚动轴承会接连发生保持架和滚子裂纹,最终产生轴承“过热”,滚子碎裂。经拟合该时间点前后的风速功率曲线后发现,受主轴承故障影响,相同风速条件下,风机的发电功率有所下降。
本发明实施例公开了基于XGBoost-KDE的风机主轴承故障预警方法。本发明通过基于风机SCADA系统中的数据,通过XGBoost学习风机主轴承正常工况下的温度变化特性,用训练好的模型去预测风机主轴承的温度,最后用非参数核密度估计法KDE和滑动窗口的组合方法分析预测值和真实值之间的残差,提前发现风机主轴承故障并发出预警,实现对风机主轴承及时精确的故障诊断和分析,减少了停机时间,降低了风机运维成本,对于提高风力发电机可靠性和可用性具有重要意义。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,包括:
步骤(1):获取风机运行数据集,并进行数据预处理、特征工程处理以及归一化处理,得到训练集;
步骤(2):构建XGBoost模型,并将所述训练集输入至所述XGBoost模型进行训练,直至模型收敛,得到最优XGBoost模型;
步骤(3):通过所述最优XGBoost模型,预测风机主轴承温度,得到所述预测温度值与正常温度值的残差;
步骤(4):应用非参数核密度估计法KDE确定所述残差的预警阈值,并通过滑动窗口分析法进行风机主轴承故障预警。
2.根据权利要求1所述的基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,步骤(1)中,所述风机运行数据集由风力发电机SCADA系统读取。
3.根据权利要求1所述的基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,步骤(1)中,所述数据预处理具体为:去除所述风机运行数据集中的缺失值、异常值和非正常工作时的数据以及剔除风机维修完成重启后预设时间内的数据。
4.根据权利要求1所述的基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,步骤(1)中,所述特征工程处理具体为:采用XGBoost模型中的特征重要性指标筛选特征,计算方法采用“weight”权重形式。
5.根据权利要求1所述的基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,所述归一化处理为最大最小值归一化,表达式如下:
Figure FDA0003836519340000011
其中,xmin为某个特征参数中的最小值;xmax为某个特征参数中的最大值;x为某个特征参数中的某个值;x*为归一化处理后的值,数值区间为[0,1]。
6.根据权利要求1所述的基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,步骤(2)中,所述构建XGBoost模型具体为:
给定一个拥有n个样本和m个特征的训练集:
D=(xi,yi)(|D|=n,xi∈Rm,yi∈R);
定义函数如下:
Figure FDA0003836519340000021
其中,
Figure FDA0003836519340000022
为预测值;fk为第k棵树的权重函数;
定义损失函数:
Figure FDA0003836519340000023
其中,T为叶子节点的个数,
Figure FDA0003836519340000024
为正则化项;ω是每个叶节点的得分;γ和λ是用来避免过拟合的控制因子;
在给定的训练参数范围内,XGBoost模型训练的最终结果需使得损失函数最小,得到最优XGBoost模型。
7.根据权利要求1所述的基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,步骤(4)中,应用非参数核密度估计法KDE确定所述残差的预警阈值具体为:
设定最优XGBoost模型的预测值和真实值之间的残差是符合某种概率密度分布的单变量同分布的样本序列,为{x1,x2,...,xn},则核密度估计函数为:
Figure FDA0003836519340000031
其中,K为非负核函数;h>0为平滑参数,为带宽;核函数选用高斯核函数;带宽的表达式如下:
Figure FDA0003836519340000032
其中,
Figure FDA0003836519340000033
为样本标准差,n为样本个数;
根据拟合结果,依据正态分布中“-3σ<x<3σ”准则,设定残差预警阈值。
8.根据权利要求1所述的基于XGBoost-KDE的风机主轴承故障预警方法,其特征在于,步骤(4)中,通过滑动窗口分析法进行风机主轴承故障预警具体为:
将发现故障时间点之前的风机运行数据输入最优XGBoost模型,对预测结果的残差用滑动窗口分析,每个窗口内有第一预设数量个样本点,取其平均值;
设定当滑动窗口的输出值为连续第二预设数量个点,超过正常范围时,即判定主轴轴承发生故障。
CN202211089338.XA 2022-09-07 2022-09-07 基于XGBoost-KDE的风机主轴承故障预警方法 Pending CN115687864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211089338.XA CN115687864A (zh) 2022-09-07 2022-09-07 基于XGBoost-KDE的风机主轴承故障预警方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211089338.XA CN115687864A (zh) 2022-09-07 2022-09-07 基于XGBoost-KDE的风机主轴承故障预警方法

Publications (1)

Publication Number Publication Date
CN115687864A true CN115687864A (zh) 2023-02-03

Family

ID=85063550

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211089338.XA Pending CN115687864A (zh) 2022-09-07 2022-09-07 基于XGBoost-KDE的风机主轴承故障预警方法

Country Status (1)

Country Link
CN (1) CN115687864A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117911009A (zh) * 2024-03-19 2024-04-19 江苏金恒信息科技股份有限公司 一种基于XGBoost算法的设备故障预警方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117911009A (zh) * 2024-03-19 2024-04-19 江苏金恒信息科技股份有限公司 一种基于XGBoost算法的设备故障预警方法及系统
CN117911009B (zh) * 2024-03-19 2024-06-11 江苏金恒信息科技股份有限公司 一种基于XGBoost算法的设备故障预警方法及系统

Similar Documents

Publication Publication Date Title
Wang et al. An integrated fault diagnosis and prognosis approach for predictive maintenance of wind turbine bearing with limited samples
CN112036547B (zh) 自动特征提取结合lstm的滚动轴承剩余寿命预测方法
CN111537219B (zh) 一种基于温度参数的风机齿轮箱性能检测与健康评估方法
CN111709490A (zh) 一种基于gru神经网络的风机健康状态评估方法
CN110119787B (zh) 一种旋转型机械设备工况检测方法及设备
CN116624343B (zh) 一种风电机组塔筒异常振动监测及健康度评价方法及系统
CN111380686A (zh) 一种基于XGBoost算法模型的风机主轴承故障监测与诊断方法
CN116226646B (zh) 轴承健康状态及剩余寿命的预测方法、系统、设备及介质
CN114372504A (zh) 一种基于图神经网络的风电机组故障预警方法
CN110007660B (zh) 一种火电厂汽轮机组瞬态等效热应力在线软测量方法
CN112052871B (zh) 一种基于支持向量机的火箭发动机健康诊断方法及系统
CN111209934A (zh) 风机故障预报警方法及系统
CN111103137A (zh) 基于深度神经网络的风力涡轮机齿轮箱故障诊断方法
CN115828466A (zh) 一种基于宽核卷积的风机主轴部件故障预测方法
CN115687864A (zh) 基于XGBoost-KDE的风机主轴承故障预警方法
CN116025529A (zh) 一种风电机组自主健康评估方法及自愈调控方法及系统
CN114169718A (zh) 一种基于风电机组状态评估提高机组可靠性的方法
CN114463143A (zh) 一种海上双馈风力发电机scada故障数据增强方法
CN118188342A (zh) 一种面向风机的故障预警与寿命预测方法
CN114004059A (zh) 一种水轮发电机组健康画像方法
CN117034001A (zh) 一种风电机组故障预测方法、装置及电子设备
CN116521406A (zh) 一种基于残差门gru-vae模型的航空发动机未超限飞参数据异常检测方法
Arellano et al. Prediction of jet engine parameters for control design using genetic programming
CN114320773B (zh) 一种基于功率曲线分析与神经网络的风电机组故障预警方法
CN114254904B (zh) 一种风电机组机舱运行健康度评价方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination