CN118332318A - 一种风机齿轮箱轴承故障定位方法、装置、介质及设备 - Google Patents
一种风机齿轮箱轴承故障定位方法、装置、介质及设备 Download PDFInfo
- Publication number
- CN118332318A CN118332318A CN202410772463.3A CN202410772463A CN118332318A CN 118332318 A CN118332318 A CN 118332318A CN 202410772463 A CN202410772463 A CN 202410772463A CN 118332318 A CN118332318 A CN 118332318A
- Authority
- CN
- China
- Prior art keywords
- bearing
- gear box
- temperature
- fan
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000012549 training Methods 0.000 claims abstract description 48
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims abstract description 29
- 238000012360 testing method Methods 0.000 claims description 37
- 230000003993 interaction Effects 0.000 claims description 21
- 230000000694 effects Effects 0.000 claims description 19
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 230000015654 memory Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 12
- 238000003860 storage Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 239000002826 coolant Substances 0.000 claims description 4
- 230000006870 function Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 13
- 239000011159 matrix material Substances 0.000 description 10
- 239000013598 vector Substances 0.000 description 10
- 230000004913 activation Effects 0.000 description 7
- 238000010248 power generation Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000005070 sampling Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 239000000306 component Substances 0.000 description 4
- 125000004122 cyclic group Chemical group 0.000 description 4
- 230000017525 heat dissipation Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000004836 empirical method Methods 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000005299 abrasion Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本申请揭示了一种风机齿轮箱轴承故障定位方法、装置、介质及设备,所述方法包括:采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对原始特征数据进行预处理;构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;将预测温度与预警温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。本申请可以找到关键性特征,实现轴承故障精准定位。
Description
技术领域
本申请属于风机齿轮箱轴承技术领域,具体涉及一种风机齿轮箱轴承故障定位方法、装置、介质及设备。
背景技术
在风力发电领域,风机齿轮箱的可靠性对于整个风力发电系统的稳定运行至关重要。齿轮箱作为将风轮的低速旋转转化为发电机所需的高速旋转的关键设备,其性能优劣直接影响风电场的发电效率和运营成本。然而,齿轮箱在长期运行过程中,由于受到复杂的外部环境影响以及内部零件的磨损,往往容易发生轴承故障等问题,这些问题一旦发生,不仅会导致风力发电设备停机,还会增加维修成本,甚至影响到整个电网的稳定供电。
目前,关于风机齿轮箱轴承故障的定位方法主要包括经验法、机理建模法、智能分析法和振动信号分析法等。其中,经验法和机理建模法虽然能够在特定条件下提供一定的故障诊断信息,但通常依赖于专业人员丰富的专业知识和经验,难以适用于复杂多变的实际操作环境;智能分析法和振动信号分析法虽然能够实现故障诊断自动化,但故障定位精确度仍存在一定局限性。综上,在面对处理大量数据和复杂系统时,上述方法往往难以实现对风机齿轮箱故障进行准确定位。
发明内容
针对以上问题,本申请的目的在于提出一种风机齿轮箱轴承故障定位方法、装置、介质及设备,本方法通过对风机齿轮箱轴承的原始特征数据进行量化评估,以确定各原始特征数据对于风机齿轮箱轴承故障的贡献度,并基于贡献度提取出关键特征数据,以实现对风机齿轮箱轴承故障的精确定位。
为实现上述目的,本申请提出以下解决方案:
一种风机齿轮箱轴承故障定位方法,所述方法包括:采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对所述原始特征数据进行预处理;构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;将所述待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。
可选的,所述待测风机齿轮箱轴承的原始特征数据包括:叶轮转速、轮毂温度、低速轴前轴温度、低速轴后轴温度、齿轮箱转速、齿轮箱入口油温、齿轮箱入口压力、发电机转速、发电机扭矩、桨叶角度偏差、偏航误差和变流器冷却介质温度。
可选的,对所述原始特征数据进行预处理,包括:剔除原始特征数据中的异常数据;对异常数据剔除后的原始特征数据进行归一化处理。
可选的,所述风机齿轮箱轴承原始特征数据包括桨叶角度偏差,对桨叶角度偏差进行预处理,包括:获取多个传感器采集的桨叶角度数据;基于多个传感器采集的桨叶角度数据利用如下公式确定桨叶角度偏差:
其中,Dev表示桨叶角度偏差,表示第i个桨叶的角度,表示三个桨叶角度的均值。
可选的,所述对所构建的模型进行训练,包括:获取风机齿轮箱轴承历史数据并预处理,将预处理后的历史数据划分为训练集和测试集;设置训练参数,利用训练集对预设模型进行训练,直至训练满足最大迭代次数;利用测试集对训练后的模型进行测试,在测试过程中,若作为模型性能评价指标的平均绝对误差MAE、均方误差MSE以及均方根误差RMSE均小于阈值,则模型测试通过;否则调整训练参数或扩大训练集样本重新对模型进行训练,直至测试通过。
可选的,所述利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,包括:通过排列组合生成不包含原始特征数据的所有特征子集;对于每个特征子集,计算将原始特征数据加入子集后的边际贡献值;对每一个边际贡献值分配权重并加权求和,得到原始特征数据的贡献度值。
可选的,在所述利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析之后,所述方法还包括:基于贡献度对原始特征数据进行交互效应分析。
此外,为实现上述目的,本申请还提供一种风机齿轮箱轴承故障定位装置,所述装置包括:采集及预处理模块,用于采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对所述原始特征数据进行预处理;模型构建及训练模块,用于构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;预测模块,用于将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;判定模块,用于将所述待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;定位模块,用于利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。
此外,为实现上述目的,本申请还提供一种存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行如本申请任意实施例所述的风机齿轮箱轴承故障定位方法。
此外,为实现上述目的,本申请还提供一种电子设备,所述电子设备包括:存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现如本申请任意实施例所述的风机齿轮箱轴承故障定位方法。
与现有技术相比,本申请能够带来以下有益效果:
本申请提供的故障定位方法,通过采用不同的预测方式对原始特征数据进行预测,并通过将两种预测结果进行融合,相比现有模型能够取得更准确的预测结果。此外,本申请通过利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,能够基于分析结果识别出对高温预警贡献度最大的关键特征数据,进而能够基于该关键特征数据实现风机齿轮箱轴承故障的精准定位。
附图说明
图1是本申请一个实施例提出的一种风机齿轮箱轴承故障定位方法的流程示意图;
图2是本申请另一个实施例提出的风机齿轮箱轴承故障预测模型的结构示意图;
图3是图2所示模型中第一预测单元的结构示意图;
图4是图2所示模型中第二预测单元的结构示意图;
图5是本申请另一个实施例提出的风机齿轮箱轴承各特征数据的可视化分析示意图;
图6是本申请另一个实施例提出的单个风机的日均温度示意图;
图7是本申请另一个实施例提出的单个风机的高温异常点特征影响示意图;
图8是本申请另一个实施例提出的风机齿轮箱轴承各特征数据的交互效应热力图;
图9是本申请另一个实施例提出的一种风机齿轮箱轴承故障定位装置的结构示意图;
图10是本申请另一个实施例提出的存储介质的结构示意图;
图11是本申请另一个实施例提出的电子设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
图1是本申请提出的一种风机齿轮箱轴承故障定位方法的流程示意图,该方法可以由电子设备执行,所述电子设备例如可以为具有计算能力的计算机、服务器等。如图1所示,所述方法包括以下步骤:
S100:采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对所述原始特征数据进行预处理;
S200:构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;
S300:将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;
S400:将所述待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;
S500:利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。
本实施例中,通过对原始特征数据采用不同的预测方式进行预测,并将两种预测结果进行融合,能够使得模型取得更准确的预测结果。此外,本实施例通过对存在高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度排序,能够基于排序结果识别出其中对于高温预警起主导作用的关键特征(即贡献度最高的特征),从而能够掌握导致齿轮箱轴承产生高温的根本原因,进而实现对待测齿轮箱轴承故障的精确定位。
在上述实施例中,所述待测风机齿轮箱轴承的特征数据包括:叶轮转速、轮毂温度、低速轴前轴温度、低速轴后轴温度、齿轮箱转速、齿轮箱入口油温、齿轮箱入口压力、发电机转速、发电机扭矩、桨叶角度偏差、偏航误差和变流器冷却介质温度。
在一个示例性实施例中,步骤S100中,具体可基于以下示例性方法对所述原始特征数据进行预处理,包括:
S101:剔除原始特征数据中的异常数据;
该步骤中,由于原始特征数据中存在一定的异常值和停机期间的无效数据,因此需要对此类数据进行剔除处理,以提高数据质量,进而提高模型对于风机齿轮箱轴承故障定位的准确度。示例性的,若检测到风机在连续10分钟内的有功功率平均值小于或等于0,即表明风机未处于正常发电状态,在此期间所采集到的数据就认定为异常值,应当被删除。具体的,首先需要按照时间序列对所采集的原始特征数据进行分组,每组数据对应10分钟的有功功率记录,然后计算每组的平均值,以下,本实施例基于python对以上所述的数据剔除步骤进行示例性说明:
import pandas as pd
# 读取数据
df = pd.read_csv('your_data.csv')# 请替换为你的数据文件路径
# 确保时间戳列是datetime类型
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 将时间戳设置为DataFrame的索引
df.set_index('timestamp', inplace=True)
# 按照10分钟的时间间隔对数据进行重采样,计算有功功率的平均值
# '10T' 表示10分钟的时间间隔
df_10min_avg_power = df['power'].resample('10T').mean()
# 打印结果查看
print(df_10min_avg_power)
电子设备通过执行上述代码将会输出一个新DataFrame,每一行代表一个10分钟时间段内的有功功率平均值。
S102:对异常数据剔除后的原始特征数据进行归一化处理。
该步骤中,通过采用最大最小标准化技术,对异常数据剔除后的特征数据进行归一化处理,以将数值压缩到[0,1]的区间内,从而消除了不同量纲带来的影响,具体的,可借助以下标准化公式来实现特征数据的归一化处理:
其中,表示标准化后的原始特征数据,表示净化后的原始特征数据,和分别是净化后的原始特征数据的最小值和最大值。
需要说明的是,以上所示的原始特征数据中,区别于其它通过一个传感器采集的原始特征数据,桨叶角度偏差是基于三个传感器采集的,因此,针对该特征数据的预处理有别于上述预处理方式,具体的,桨叶角度偏差数据可通过以下方式进行预处理:
S1001:获取多个传感器采集的桨叶角度数据;
S1002:基于多个传感器采集的桨叶角度数据利用如下公式确定桨叶角度偏差:
其中,Dev表示桨叶角度偏差,表示第i个桨叶的角度,表示三个桨叶角度的均值。
图2为根据本申请一种实施方式的风机齿轮箱轴承温度预测模型200的结构示意图,如图2所示,在示例性实施例中,所述模型包括:第一预测单元210,第二预测单元220和第三预测单元230。
具体的,所述第一预测单元210采用XGBoost模型,如图3所示,该模型具体包括:
输入层,用于接收风机齿轮箱轴承的原始特征数据x t;
基学习器(Base Learner):决策树;
XGBoost模型的核心组件是决策树,每个决策树都是一个弱学习器。在训练过程中,每棵树都会针对前一棵树的预测结果之残差(即拟合不足的部分)进行学习,逐步提升模型的整体预测能力。每个决策树对输入数据进行一系列二元划分(基于特征值的阈值),形成内部节点(split nodes)和叶节点(leaf nodes)。
输出层(Output Layer),用于输出第一预测结果。
具体的,所述第二预测单元220采用Regression线性模型,如图4所示,该模型具体包括:
输入层(Input Layer),同样用于接收风机齿轮箱轴承的原始特征数据xt;
线性变换层(Linear Transformation),用于通过矩阵乘法和加法运算实现对原始特征数据xt的线性变换,具体可通过以下计算过程实现:
Z=Wxt+b
其中,z表示线性变换层的输出,W表示权重矩阵,xt表示输入的原始特征数据,b表示偏置向量。
激活函数(Activation Function),通常采用非线性激活函数ReLU、sigmoid、tanh等,线性函数作用于线性变换层的输出结果z上,以生成非线性特征:
Out_Re t=σ(z)
其中,σ表示所选的激活函数。
输出层(Output Layer),用于输出第二预测结果,即非线性特征。
所述第三预测单元230采用LSTM模型,具体包括:输入门、遗忘门、更新门和输出门,由第一预测单元和第二预测单元的输出合并后的特征向量作为第三预测单元的输入分别输入以上各门中。
进一步的,特征向量与时刻的隐藏状态加权组合后通过sigmoid函数映射至输入门获得;特征向量与时刻的隐藏状态加权组合后通过sigmoid函数映射至遗忘门获得;特征向量与时刻的隐藏状态加权组合后通过sigmoid函数映射至更新门获得;特征向量与时刻的隐藏状态加权组合后通过sigmoid函数映射至输出门获得。进一步的,与时刻的细胞状态相乘,与相乘,且与与相乘的结果相加后输出时刻的细胞状态,同时,经激活函数Tanh激活后与相乘,即获得模型的最终输出,即风机齿轮箱轴承的最终预测温度。
具体的,上述模型的计算过程可通过下式表示:
其中,表示在时间步的输入特征向量;表示XGBoost模型的第棵树;表示树的数量;表示XGBoost模型对输入特征向量的预测输出;表示Regression线性模型对输入特征向量的预测输出;表示将XGBoost模型和Regression线性模型的输出合并为一个新的特征向量;表示sigmoid激活函数;表示LSTM单元的输入门值;、、分别表示输入门的权重矩阵、循环权重矩阵和偏置项;表示LSTM单元的遗忘门值;、、分别表示遗忘门的权重矩阵、循环权重矩阵和偏置项;表示LSTM单元的输出门值;、、分别表示输出门的权重矩阵、循环权重矩阵和偏置项;是一个中间向量,用于决定流入输入门的信息量;、、分别表示的权重矩阵、循环权重矩阵和偏置项;表示LSTM单元的长期记忆;表示LSTM单元的短期记忆,即模型输出结果;表示激活函数;表示元素-wise乘法(Hadamard积)。
本申请所设计的上述模型对于风机齿轮箱轴承温度预测具有以下效果:
1、多模态融合:通过结合XGBoost模型和线性模型两种不同的预测方式,实现了多模态融合。其中,XGBoost模型是一种强大的梯度提升树算法,擅长处理非线性关系和特征交互。而线性模型则易于解释且在某些情况下表现稳健。这两种模型对于不同特征数据有不同的敏感度,通过采用多模态融合策略能够充分利用两种模型各自的优势,以捕捉到特征数据中更多的方面和复杂性。两种模型之间通过相互补偿,可以在一定程度上平衡偏差和方差,从而能够减少整体的预测误差,进而提高模型的预测性能和泛化能力,尤其对于复杂、非线性的轴承温度数据,能够获得更准确的预测结果。
2、时序建模能力:本模型采用了LSTM单元进行时序建模,能够有效捕捉轴承温度随时间变化的动态规律和长期依赖关系。通过输入门、遗忘门和输出门的精细控制,既能保留历史信息,又能适应新输入的变化,从而适应轴承温度数据的时间序列特性。
3、自适应信息筛选:通过门控机制能够根据当前输入和前一时刻隐藏状态自动调整对新信息和历史信息的重视程度。对于轴承温度预测而言,意味着模型能灵活应对不同工况、运行条件下的温度变化趋势,自适应地筛选出对预测结果影响最大的特征信息。
4、鲁棒性和抗过拟合:XGBoost本身具有较好的抗过拟合能力,可通过集成多个弱分类器降低单个模型的误差,提高整体预测稳定性。线性模型结构简单,参数较少,也具有一定的抗过拟合特性。而LSTM单元通过循环连接和门控机制,能够在保持长期依赖的同时避免过拟合问题。这些特性使得模型在面对轴承温度数据时具有较好的鲁棒性和泛化性能。
5、实时预测与在线更新:XGBoost和线性模型计算相对高效,结合LSTM单元的递归性质,本模型在实际应用中能够快速响应新的观测数据,进行实时预测。同时,当有新的轴承原始特征数据可用时,模型参数可以方便地在线更新,持续优化预测性能。
综上所述,本模型通过多模态融合、时序建模、自适应信息筛选以及良好的鲁棒性和在线更新能力,特别适合于轴承温度的预测任务,有助于提高预测精度,及时发现异常温度变化,为设备维护、故障预警等提出有力支持。
在上述实施例的基础上,本申请还提出一种风机齿轮箱轴承温度预测模型训练方法,包括:
S201:获取风机齿轮箱轴承的历史数据并预处理,将预处理后的历史数据按7:3的比例划分为训练集和测试集;
该步骤中,所述对历史数据预处理依据上述预处理方法,此处不再赘述。
S202:设置训练参数,例如,booster默认选择基于树的模型gbtree,learning_rate设置为0.01,max_depth设置为3,最大迭代次数设置为300,利用训练集对模型进行训练,在模型训练过程中,当模型迭代次数满足预设值,则模型训练完成;
S203:利用测试集对训练后的模型进行测试,在测试过程中,若作为模型性能评价指标的平均绝对误差(MAE)、均方误差(MSE)以及均方根误差(RMSE)均小于阈值(在本模型测试中,更关注高温样本所带来的误差,所以MAE的阈值设置为比较能容忍的0.05,MSE的阈值设置为比较严格的0.001),则模型测试通过;否则调整训练参数或扩大训练集样本重新对模型进行训练,例如,可将learning_rate调整为0.005,将max_depth调整为5,然后对模型重新进行训练,直至测试通过。
上述各指标中,平均绝对误差(MAE)表示如下:
均方误差(MSE)表示如下:
均方根误差(RMSE)表示如下:
其中,是样本数量,是第个样本的预测值,是第个样本的实际值。
在一个具体实施例中,本申请结合具体场景对所述风机齿轮箱轴承温度预测模型的性能进行了验证。
2023年7月6号这一天,该风机齿轮箱轴承平均预测温度为61.90度,标准差为6.30度,出现了持续不断的高温预警,实际平均温度超过81度,超过三倍标准差。风机在2023年7月的日均温度如图6所示,由图6中可以看出,7月6号这一天确实出现了异于平常的高温,证明了齿轮箱轴承温度预测模型的准确性。
另一个实施例中,所述利用预设的解释模型对所述处于高温预警的待测风机齿轮箱轴承的原始特征数据(以原始特征j为例)进行贡献度分析,包括:
S501:通过排列组合生成不含特征j的所有特征子集;
S502:对于每一个特征子集,计算将特征j加入特征子集的边际贡献值;
S503:对步骤S502中的每一个边际贡献值分配权重并加权求和,得到特征j的贡献度值。
具体的,上述步骤可通过以下公式实现:
其中,表示所有特征集合,表示集合中的特征,表示不含特征的特征子集,表示的基数,即中特征的个数,表示原始模型,表示特征对样本的贡献超过平均预测基准的部分,表示集合内特征的个数,表示所有特征排列的总数,表示包含子集不含特征的预测值,表示特征对特征的边际贡献,表示同时包含子集和特征的预测值。
示例性的,电子设备通过执行以下代码具体计算出各特征数据的贡献度:
importnumpy as np
fromsklearn.utils import resample
fromconcurrent.futures import ProcessPoolExecutor
# 定义一个辅助函数,用于并行计算给定子集(不包含特征i)加入特征i后的预测误差均值。
# 使用Bootstrap抽样进行多次估计以提高稳健性。
defparallel_compute_shapley(subset, i, X, y, model, n_bootstrap=100):
"""
#计算给定子集(不包含特征i)加入特征i后的预测误差均值,
#使用Bootstrap抽样进行多次估计以提高稳健性。
#参数:
subset (tuple): 不包含特征i的子集索引集合。
i (int): 待计算贡献度值的特征索引。
X (np.ndarray): 原始特征数据。
y (np.ndarray): 真实标签。
model (sklearn-compatible model): 已训练好的模型。
n_bootstrap (int, optional): Bootstrap抽样的次数,默认为100。
返回:
float: 子集加入特征i后预测误差的均值。
"""
errors_with_i = []
# 对于指定的Bootstrap抽样次数
for _ in range(n_bootstrap):
# 从原始数据集中进行Bootstrap抽样,得到新的样本集
sampled_X, sampled_y = resample(X, y, replace=True)
# 创建包含子集特征但不包含特征i的样本集
model_with_subset = np.delete(sampled_X, [j for j in subset], axis=1)
# 在指定位置插入特征i,形成包含子集和特征i的样本集
model_with_subset = np.insert(model_with_subset, i, sampled_X[:, i],axis=1)
# 使用模型对新样本集进行预测
y_pred_with_subset = model.predict(model_with_subset)
# 计算预测误差的均方差
error_with_subset = np.mean((y_pred_with_subset - sampled_y) ** 2)
# 将本次抽样得到的预测误差添加到列表中
errors_with_i.append(error_with_subset)
# 计算子集加入特征i后预测误差的均值作为返回结果
returnnp.mean(errors_with_i)
# 定义主函数 `shapley_values`,计算所有特征的贡献度值
defshapley_values(model, X, y, n_bootstrap=100, n_jobs=-1):
"""
#计算模型中所有特征的贡献度值,通过并行计算提高效率。
#参数:
model (sklearn-compatible model): 已训练好的模型。
X (np.ndarray): 原始特征数据。
y (np.ndarray): 真实标签。
n_bootstrap (int, optional): Bootstrap抽样的次数,默认为100。
n_jobs (int, optional): 并行执行的最大工作进程数,默认为-1(使用所有可用CPU核心)。
返回:
dict: 包含所有特征索引及其对应贡献度值的字典。
"""
n = X.shape[1]# 特征个数
# 初始化一个字典,用于存储每个特征的贡献度值
shapley_dict = {}
# 使用多进程执行器进行并行计算
withProcessPoolExecutor(max_workers=n_jobs) as executor:
futures = {}# 用于存储待完成的子任务
# 对于每一个特征
fori in range(n):
# 计算无特征i的平均预测误差
model_without_i = np.delete(X, i, axis=1)# 删除特征i
y_pred_without_i=model.predict(model_without_i)# 预测删除特征i后的结果
error_without_i=np.mean((y_pred_without_i - y) ** 2)# 计算预测误差的均方差
# 生成所有不包含特征i的子集
subsets = list(combinations(range(n), n - 1))
# 提交并行计算任务到执行器
future_tasks = {
executor.submit(parallel_compute_shapley,subset,i,X,y,model, n_bootstrap)
for subset in subsets
}
# 初始化一个列表,用于存储子集加入特征i后的预测误差均值
errors_with_i = []
# 遍历并收集所有子任务的完成结果
for future in futures.as_completed(future_tasks):
errors_with_i.append(future.result())# 获取子任务结果并添加到列表
# 计算特征i的贡献度值
shapley_i = (np.mean(errors_with_i) - error_without_i) / (n - 1)
# 将特征i的贡献度值存入字典
shapley_dict[i] = shapley_i
# 返回包含所有特征贡献度值的字典
returnshapley_dict
本实施例通过电子设备执行以上代码计算贡献度,具有以下几个方面的优势:
1、能够实现并行计算:
通过使用concurrent.futures.ProcessPoolExecutor实现并行计算,允许同时处理多个子任务。对于每个特征,其贡献度值的计算涉及对所有不包含该特征的子集进行评估,这一步骤非常适合并行化。通过并行计算,可以显著减少总体计算时间,特别是在特征数量较大时,充分利用多核处理器资源,提高了计算效率。
2、能够实现Bootstrap抽样:
在parallel_compute_shapley函数中,采用了Bootstrap抽样方法来估计给定子集加入特征i后的预测误差均值。Bootstrap抽样通过对原始数据集进行有放回抽样,生成多个不同的数据子集,从而对统计量(如预测误差均值)进行多次估计。这种方法增强了计算结果的稳健性,减少了由于单一数据分割造成的偶然性,提出了对特征贡献更稳定、更可信的估计。
3、误差指标选择:
以上代码采用预测误差均方差作为衡量特征贡献的标准,直接反映了特征加入后模型预测性能的变化,与实际应用场景中关注的预测准确性紧密相关,因此计算出的贡献度值具有较强的解释力和实用价值。
综上,以上所述代码在计算贡献度值时,通过并行计算、Bootstrap抽样、选择合适的误差指标,实现了计算效率提升、结果稳健性增强、广泛应用场景覆盖、易于理解和维护等多重优势。
下面,本申请以某一具体场景为例对以上所述风机齿轮箱轴承故障定位方法进行说明:
场景描述:测试集中A3号风机在2023年7月6号这一天,齿轮箱轴承出现了持续不断的高温,即实际温度比模型预测温度高出三倍标准差,对此进行高温预警并进行故障原因定位。
第一,在双馈式风力发电系统中,针对齿轮箱轴承温度产生显著影响的关键环节。为了确保精准和高效的监测,精选了一系列传感器参数,以便于进行深入的数据分析、模型构建以及故障诊断。中心部件包括了叶轮、轮毂、低速轴、齿轮箱、发电机、变桨系统、偏航系统以及散热系统等。以下是具体检测指标及其对应的特征编号,此指标体系将构成后续工作的基础:
表1特征选择
第二,基于上述特征数据进行预处理,以剔除不符合物理实际的异常值。具体的,首先需要筛选掉数据中所有有功功率、轴承温度或风速为负数的数据点,确保数据集的准确性和可靠性。其次,对经过筛选的有效数据进行标准化处理,以便能够在统一的量度下进行比较和分析,增强了数据的一致性。表2是对部分标准化后的数据的展示(保留3位小数),其中,y表示风机齿轮箱轴承的温度标准值:
表2标准化数值展示
第三,将从20台风机采集到的共891419条记录作为按照8:2的比例划分为训练集和测试集,将训练集输入风机齿轮箱轴承温度预测模型,训练出齿轮箱轴承温度预测模型。经过反复的优化和验证,确定了模型的关键参数,并以平均绝对误差(MAE)、均方误差(MSE)以及均方根误差(RMSE)作为评价指标评估模型性能。
进一步的,以XGBoost模型、Regression模型、LSTM模型为基准模型,与本申请所述模型进行效果比对,具体比对结果如表3所示:
表3模型比对结果
由表3可见,相比上述三个基础模型,本申请提出的风机齿轮箱轴承温度预测模型中,MAE、MSE、RMSE指标均有所下降。其中,相比于Regression线性模型和LSTM模型,本模型有比较明显的精度提升,相比于XGBoost模型,MSE和RMSE有略微提升,MAE不变。由此证实,本模型的预测能力主要来自XGBoost模型的树结构优势,同时吸收了线性模型的线性优势和LSTM模型的时间序列信息的攫取能力。
第四,采用测试集基于上述训练好的风机齿轮箱轴承温度预测模型进行解释,解释结果包含了每个样本中每个特征对预测结果的贡献度(保留5位小数),具体如表4所示:
表4每个特征的贡献度值
进一步的,本实施例还对以上各特征的贡献度进行了可视化分析,即借助summary_plot展示每个特征如何影响预测结果及样本的分布情况,具体的可视化分析结果如图5所示。
在一个具体实施例中,本申请对图6所示的温度异常情况进行了特征数据贡献度分析,具体分析结果如图7所示,由图7可以看出,该样本的标准化预测输出为0.968,基准预测值为0.697,该样本超出基准预测值0.271,其中F6的贡献值为0.11,其次是F5的0.04,所以F6所对应的贡献度最大。因此,导致A3号风机在2023年7月6号这一天齿轮箱轴承温度上升的最主要原因是F6,即齿轮箱入口油温,可能是由于过度负载、滤芯堵塞或油位低等原因造成的,需要重点排查。
此外,在齿轮箱轴承实际运行过程中,由于齿轮箱轴承温度的影响特征之间具有关联性,因此导致往往难以明确高温异常是由单个因素引起,还是多个因素共同作用引起的。本申请基于贡献度对待测风机齿轮箱轴承的原始特征数据进行交互效应分析,通过计算如表4所示的贡献度的shap_interaction值能够明确各特征数据之间的关联性。具体的,所述shap_interaction值可通过执行以下代码计算:
explainer = shap.TreeExplainer(model)
#创建了一个SHAP解释器
shap_interaction_values = explainer.shap_interaction_values(X_test)
#利用创建的SHAP解释器计算数据集X_test上的特征交互效应的SHAP值,存储在变量shap_interaction_values中
基于上述代码计算获得的shap_interaction值最终以热力图的形式体现,具体的,可通过执行以下代码绘制热力图:
# 假设要查看特征A和特征B的交互效应
feature_names = X_test.columns.tolist()# 获取特征名称列表
# 提取特定特征的交互效应
interactions=shap_interaction_values[:,feature_names.index('A'),feature_names.index('B')]
# 转换为DataFrame以便于绘图
df_interactions=pd.DataFrame(interactions,columns=X_test['A'].unique(), index=X_test['B'].unique())
# 绘制热力图
plt.figure(figsize=(10, 8))
sns.heatmap(df_interactions, annot=True, cmap='coolwarm', xticklabels=True, yticklabels=True)
plt.title('Interaction Effect Heatmap between Feature A and B')
plt.xlabel('Feature A Values')
plt.ylabel('Feature B Values')
plt.show()
基于上述代码绘制获得的shap_interaction值的热力图如图8所示。图8中,不同特征之间均存在一定程度的交互效应,说明在风力发电系统中,特征之间的交互效应也会对齿轮箱轴承温度产生较大影响。而F12变流器冷却介质温度对绝大部分特征具有交互作用,交互效应越大,热力图的颜色越亮,反之越暗。如图8所示,F12与其他特征的交互效应值普遍偏高,更趋近于黄色,而由于F12代表散热系统,所以要精准定位齿轮箱轴承温度异常,应该首先排查散热系统,因为其会干扰其他部件的温度。基于贡献度值的交互效应分析,本实施例计算所述特征之间的交互效应值,并通过热力图展示这些交互效应的大小。热力图提出了一种直观的方式来观察不同特征组合如何共同影响齿轮箱轴承温度,揭示了可能的复合故障因素,有助于更深层次的故障原因分析。
综上所述,本申请通过双馈式风力发电机组的构造,得到一系列影响齿轮箱轴承温度的指标,并进行数据过滤与处理。然后,通过实际工况数据建立齿轮箱轴承温度预警模型,从而精准发现A3号风机2023年7月6号的温度异常点。根据整体的贡献度特征分析,A3号风机异常点的特征分析以及交互效应分析,得出产生该异常最可能的原因是F6齿轮箱入口油温过高,应该着重排查过度负载、滤芯堵塞或油位低等问题,其次F5、F9、F4也具有一定影响,并且在采取干预措施之前,应该首先保证散热系统是正常运行的。
在上述实施例的基础上,如图9所示,本申请还提出一种风机齿轮箱轴承故障定位装置900,包括:采集及预处理模块910、模型构建及训练模块920、预测模块930、判定模块940及定位模块950,其中,
所述采集及预处理模块910用于采集待测风机齿轮箱轴承的实际温度及原始特征数据;
所述模型构建及训练模块920用于构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;
所述预测模块930用于将所述待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,输出待测风机齿轮箱轴承的预测温度;
所述判定模块940用于将待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;
所述定位模块950用于利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。
可选的,所述风机齿轮箱轴承故障定位装置还包括预处理模块,用于对所述原始特征数据依照以下方式进行预处理:剔除原始特征数据中的异常数据;对异常数据剔除后的原始特征数据进行归一化处理。
可选的,所述风机齿轮箱轴承故障定位装置还包括桨叶角度偏差预处理模块,用于对桨叶角度偏差依照以下方式进行预处理:获取多个传感器采集的桨叶角度数据;基于多个传感器采集的桨叶角度数据利用如下公式确定桨叶角度偏差:
其中,Dev表示桨叶角度偏差,代表第i个桨叶的角度,代表三个桨叶角度的均值。
可选的,所述模型构建及训练模块包括数据集获取及划分子模块、模型训练子模块和模型测试子模块,其中,所述数据集获取及划分子模块用于获取风机齿轮箱轴承历史数据并预处理,以及用于将预处理后的历史数据划分为训练集和测试集;所述模型训练子模块用于设置训练参数,以及用于利用训练集对预设模型进行训练,直至训练满足最大迭代次数;所述模型测试子模块用于利用测试集对训练后的模型进行测试,在测试过程中,若作为模型性能评价指标的平均绝对误差(MAE)、均方误差(MSE)以及均方根误差(RMSE)均小于阈值,则模型测试通过;否则调整训练参数或扩大训练集样本重新对模型进行训练,直至测试通过。
可选的,所述定位模块进一步包括特征子集生成子模块、边际贡献值计算子模块和加权子模块,其中,所述特征子集生成子模块用于通过排列组合生成不包含原始特征数据的所有特征子集;所述边际贡献值计算子模块用于计算将原始特征数据加入子集后的边际贡献值;所述加权子模块用于对每一个边际贡献值分配权重并加权求和,以得到原始特征数据的贡献度值。
可选的,所述定位模块还包括交互效应分析子模块,用于基于贡献度对原始特征数据进行交互效应分析。
并且,可以理解的,本实施例提供的风机齿轮箱轴承故障定位装置具有上述任意方法所述实施例描述的有益效果,此处不再赘述。
在上述实施例的基础上,参考图10,对本申请示例性实施方式的计算机可读存储介质进行说明,请参考图10,其示出的计算机可读存储介质为光盘40,其上存储有计算机程序(即程序产品),所述计算机程序在被处理器运行时,会实现上述方法实施方式中所记载的各步骤,例如,采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对所述原始特征数据进行预处理;构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;将所述待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。各步骤的具体实现方法在此不在进行重复说明。
需要说明的是,所述计算机可读存储介质包括但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
在上述实施例的基础上,本申请还提供一种电子设备,下面参考图11对本申请示例性实施方式的用于文件下载的电子设备进行说明。
图11示出了适于用来实现本申请实施方式的示例性电子设备50的框图,该电子设备50可以是计算机系统或云端服务器。图11显示的电子设备50仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图11所示,电子设备50包括但不限于:一个或者多个处理器或者处理单元501,系统存储器502,连接不同系统组件(包括系统存储器502和处理单元501)的总线503。
电子设备50典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备50访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器502可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)5021和/或高速缓存存储器5022。电子设备50可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,ROM5023可以用于读写不可移动的、非易失性磁介质(图11中未显示,通常称为“硬盘驱动器”)。尽管未在图11中示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线503相连。系统存储器502中可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块5024的程序/实用工具5025,可以存储在例如系统存储器502中,且这样的程序模块5024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块5024通常执行本申请所描述的实施例中的功能和/或方法。
电子设备50也可以与一个或多个外部设备504(如键盘、指向设备、显示器等)通信。这种通信可以通过输入/输出(I/O)接口505进行。并且,电子设备50还可以通过网络适配器506与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图11所示,网络适配器506通过总线503与电子设备50的其它模块(如处理单元501等)通信。应当明白,尽管图11中未示出,可以结合电子设备50使用其它硬件和/或软件模块。
处理单元501通过运行存储在系统存储器502中的程序,从而执行各种功能应用以及数据处理,例如,采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对所述原始特征数据进行预处理;构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;将所述待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。各步骤的具体实现方式在此不再重复说明。应当注意,尽管在上文详细描述中提及了文件并发下载装置的若干单元/模块或子单元/子模块,但是这种划分仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅是示意性的,例如,所述单元的划分,仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用并将得一台计算机设备(可以是个人计算机,云端服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
上述实施例只为说明本申请的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本申请的内容并据以实施,并不能以此限制本申请的保护范围。凡根据本申请精神实质所作的等效变化或修饰,都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种风机齿轮箱轴承故障定位方法,其特征在于,所述方法包括:
采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对所述原始特征数据进行预处理;
构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;
将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;
将所述待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;
利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。
2.根据权利要求1所述的方法,其特征在于,所述待测风机齿轮箱轴承的原始特征数据包括:叶轮转速、轮毂温度、低速轴前轴温度、低速轴后轴温度、齿轮箱转速、齿轮箱入口油温、齿轮箱入口压力、发电机转速、发电机扭矩、桨叶角度偏差、偏航误差和变流器冷却介质温度。
3.根据权利要求1所述的方法,其特征在于,对所述原始特征数据进行预处理,包括:
剔除原始特征数据中的异常数据;
对异常数据剔除后的原始特征数据进行归一化处理。
4.根据权利要求3所述的方法,其特征在于,所述风机齿轮箱轴承原始特征数据包括桨叶角度偏差,对桨叶角度偏差进行预处理,包括:
获取多个传感器采集的桨叶角度数据;
基于多个传感器采集的桨叶角度数据利用如下公式确定桨叶角度偏差:
其中,Dev表示桨叶角度偏差,表示第i个桨叶的角度,表示三个桨叶角度的均值。
5.根据权利要求1所述的方法,其特征在于,所述对所构建的模型进行训练,包括:
获取风机齿轮箱轴承历史数据并预处理,将预处理后的历史数据划分为训练集和测试集;
设置训练参数,利用训练集对预设模型进行训练,直至训练满足最大迭代次数;
利用测试集对训练后的模型进行测试,在测试过程中,若作为模型性能评价指标的平均绝对误差MAE、均方误差MSE以及均方根误差RMSE均小于阈值,则模型测试通过;否则调整训练参数或扩大训练集样本重新对模型进行训练,直至测试通过。
6.根据权利要求1所述的方法,其特征在于,所述利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,包括:
通过排列组合生成不包含原始特征数据的所有特征子集;
对于每个特征子集,计算将原始特征数据加入子集后的边际贡献值;
对每一个边际贡献值分配权重并加权求和,得到原始特征数据的贡献度值。
7.根据权利要求1所述的方法,其特征在于,在所述利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析之后,所述方法还包括:
基于贡献度对原始特征数据进行交互效应分析。
8.一种风机齿轮箱轴承故障定位装置,其特征在于,所述装置包括:
采集及预处理模块,用于采集待测风机齿轮箱轴承的实际温度及原始特征数据,并对所述原始特征数据进行预处理;
模型构建及训练模块,用于构建风机齿轮箱轴承温度预测模型,并对所构建的模型进行训练;其中,所述风机齿轮箱轴承温度预测模型通过采用两种不同的预测方式同时对所述待测风机齿轮箱轴承的原始特征数据进行预测,以实现多模态融合;
预测模块,用于将预处理后的待测风机齿轮箱轴承的原始特征数据输入训练好的风机齿轮箱轴承温度预测模型,获得待测风机齿轮箱轴承的预测温度;
判定模块,用于将所述待测风机齿轮箱轴承的预测温度与实际温度进行比对,以判定待测风机齿轮箱轴承是否处于高温预警;
定位模块,用于利用预设的解释模型对处于高温预警的待测风机齿轮箱轴承的原始特征数据进行贡献度分析,以识别其中的关键特征数据,基于关键特征数据对待测风机齿轮箱轴承进行故障定位。
9.一种存储介质,其特征在于,其包括指令,当其在计算机上运行时,使得计算机执行权利要求1~7中的任一项所述的方法。
10.一种电子设备,其特征在于,所述电子设备包括:
存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,
所述处理器执行所述程序时实现如权利要求1~7任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410772463.3A CN118332318A (zh) | 2024-06-17 | 2024-06-17 | 一种风机齿轮箱轴承故障定位方法、装置、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410772463.3A CN118332318A (zh) | 2024-06-17 | 2024-06-17 | 一种风机齿轮箱轴承故障定位方法、装置、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118332318A true CN118332318A (zh) | 2024-07-12 |
Family
ID=91780806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410772463.3A Pending CN118332318A (zh) | 2024-06-17 | 2024-06-17 | 一种风机齿轮箱轴承故障定位方法、装置、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118332318A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111537219A (zh) * | 2020-01-20 | 2020-08-14 | 内蒙古工业大学 | 一种基于温度参数的风机齿轮箱性能检测与健康评估方法 |
CN112431726A (zh) * | 2020-11-22 | 2021-03-02 | 华能国际电力股份有限公司 | 一种风电机组齿轮箱轴承状态监测方法 |
CN113591728A (zh) * | 2021-08-03 | 2021-11-02 | 天津大学 | 基于集成深度学习的电能质量扰动分类方法 |
CN115450858A (zh) * | 2022-10-18 | 2022-12-09 | 山东大学 | 基于数字孪生的风机叶片状态检测方法及系统 |
CN115788887A (zh) * | 2022-11-28 | 2023-03-14 | 山东海福德机械有限公司 | 基于数据分析的罗茨鼓风机运行工况监管预警系统 |
CN116739118A (zh) * | 2023-06-27 | 2023-09-12 | 国网江苏省电力有限公司南通供电分公司 | 一种基于LSTM-XGBoost实现误差修正机制的电力负荷预测方法 |
CN116838550A (zh) * | 2023-07-13 | 2023-10-03 | 浙江工业大学 | 一种基于风电机组故障机理的虚拟样本生成方法 |
CN117520960A (zh) * | 2023-11-08 | 2024-02-06 | 西南交通大学 | 基于XGBoost和特征组合的轴承故障诊断方法 |
WO2024065777A1 (en) * | 2022-09-30 | 2024-04-04 | Siemens Aktiengesellschaft | Method, apparatus, electronic device, and storage medium for diagnosing industrial fault |
-
2024
- 2024-06-17 CN CN202410772463.3A patent/CN118332318A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111537219A (zh) * | 2020-01-20 | 2020-08-14 | 内蒙古工业大学 | 一种基于温度参数的风机齿轮箱性能检测与健康评估方法 |
CN112431726A (zh) * | 2020-11-22 | 2021-03-02 | 华能国际电力股份有限公司 | 一种风电机组齿轮箱轴承状态监测方法 |
CN113591728A (zh) * | 2021-08-03 | 2021-11-02 | 天津大学 | 基于集成深度学习的电能质量扰动分类方法 |
WO2024065777A1 (en) * | 2022-09-30 | 2024-04-04 | Siemens Aktiengesellschaft | Method, apparatus, electronic device, and storage medium for diagnosing industrial fault |
CN115450858A (zh) * | 2022-10-18 | 2022-12-09 | 山东大学 | 基于数字孪生的风机叶片状态检测方法及系统 |
CN115788887A (zh) * | 2022-11-28 | 2023-03-14 | 山东海福德机械有限公司 | 基于数据分析的罗茨鼓风机运行工况监管预警系统 |
CN116739118A (zh) * | 2023-06-27 | 2023-09-12 | 国网江苏省电力有限公司南通供电分公司 | 一种基于LSTM-XGBoost实现误差修正机制的电力负荷预测方法 |
CN116838550A (zh) * | 2023-07-13 | 2023-10-03 | 浙江工业大学 | 一种基于风电机组故障机理的虚拟样本生成方法 |
CN117520960A (zh) * | 2023-11-08 | 2024-02-06 | 西南交通大学 | 基于XGBoost和特征组合的轴承故障诊断方法 |
Non-Patent Citations (4)
Title |
---|
QIANG MIAO 等: "Cooling fan bearing fault identification using vibration measurement", 《 PROGNOSTICS AND HEALTH MANAGEMENT (PHM)》, 31 July 2011 (2011-07-31), pages 1 - 6 * |
李伟: "数据驱动的消费金融违约风险预测方法研究", 《中国博士学位论文全文数据库 (经济与管理科学辑)》, 15 March 2020 (2020-03-15), pages 157 - 4 * |
郝俊虎 等: "基于XGBoost和自回归模型的轴承故障诊断和预警方法研究", 《组合机床与自动化加工技术 》, no. 2, 20 February 2020 (2020-02-20), pages 140 - 143 * |
魏乐 等: "基于优化XGBoost的风电机组发电机前轴承故障预警", 《系统仿真学报》, vol. 33, no. 10, 12 October 2020 (2020-10-12), pages 2335 - 2343 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112818604A (zh) | 一种基于风功率预测的风电机组风险度评估方法 | |
CN113822418A (zh) | 一种风电场功率预测方法、系统、设备和存储介质 | |
CN115438726A (zh) | 一种基于数字孪生技术的设备寿命与故障类型预测方法及系统 | |
CN117078114B (zh) | 引水工程影响下受水湖泊水质评价方法和系统 | |
CN114548494B (zh) | 一种可视化造价数据预测智能分析系统 | |
CN115034278A (zh) | 性能指标异常检测方法、装置、电子设备和存储介质 | |
CN112801315A (zh) | 电力二次设备的状态诊断方法、装置及终端 | |
CN114742363A (zh) | 风电机组的能效状态评价方法、系统及介质 | |
CN116307282A (zh) | 一种基于机理模型和数据驱动的风电功率预测方法及系统 | |
CN115238573A (zh) | 考虑工况参数的水电机组性能劣化趋势预测方法和系统 | |
CN118134046A (zh) | 一种基于机器学习的风电场功率预测方法及系统 | |
CN118014137A (zh) | 一种基于数据驱动的换电站换电需求预测方法及系统 | |
CN110162743A (zh) | 一种基于k邻域非线性状态估计算法的数据治理方法 | |
CN117520118A (zh) | 一种基于作业名层次化聚类算法的作业运行时间用的预测方法 | |
CN118332318A (zh) | 一种风机齿轮箱轴承故障定位方法、装置、介质及设备 | |
Lin et al. | Design and implementation of a CPS‐based predictive maintenance and automated management platform | |
CN116149895A (zh) | 大数据集群性能预测方法、装置和计算机设备 | |
Macedo et al. | A Machine Learning Approach for Spare Parts Lifetime Estimation. | |
CN111915129A (zh) | 一种计量器具智能仓库绩效评价方法 | |
Galatro et al. | Data Analytics for Process Engineers: Prediction, Control and Optimization | |
CN117435870B (zh) | 一种负荷数据实时填充方法、系统、设备和介质 | |
CN118428702B (zh) | 一种虚拟电厂的资源优化管理方法 | |
CN117495195A (zh) | 一种基于Johnson分布体系的风电场群容量价值评估方法 | |
Lassus | Validation of a simulator for an engine power plant | |
CN118296311A (zh) | 水文水质缺失数据的插补方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |