CN113792762B - 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 - Google Patents
基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 Download PDFInfo
- Publication number
- CN113792762B CN113792762B CN202110974961.2A CN202110974961A CN113792762B CN 113792762 B CN113792762 B CN 113792762B CN 202110974961 A CN202110974961 A CN 202110974961A CN 113792762 B CN113792762 B CN 113792762B
- Authority
- CN
- China
- Prior art keywords
- data
- lightgbm
- model
- feature
- fault
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- F—MECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
- F24—HEATING; RANGES; VENTILATING
- F24F—AIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
- F24F11/00—Control or safety arrangements
- F24F11/30—Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
- F24F11/32—Responding to malfunctions or emergencies
- F24F11/38—Failure diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Combustion & Propulsion (AREA)
- Mechanical Engineering (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质,方法包括以下步骤:通过传感器采集并存储冷水机组的现场历史数据;对历史数据进行预处理;利用嵌入法和递归特征消除法相结合的两步法进行特征选择;用经过数据预处理和特征选择的历史数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式确定LightGBM的最优超参数组合,进而得到训练好的LightGBM诊断模型;将实时运行数据进行预处理并输入诊断模型,得到冷水机组故障诊断结果。本发明可快速确定诊断模型的参数,迅速准确地对冷水机组的运行状态进行评估,还可提取关键故障特征,用于指导工程实际并加强冷水机组现场的运行维护。
Description
技术领域
本发明属于制冷领域,具体涉及一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质。
背景技术
冷水机组是水冷式中央空调系统的主要用能设备,其用能占据了建筑总能耗的40%以上。冷水机组运行过程中由于维保不及时、维护不当、运行参数设置不合理等问题均可能引发相应的故障,这些故障可能引起中央空调系统运行效率降低、设备使用寿命缩短、甚至可能导致安全事故。故障检测与诊断(Fault Detection and Diagnosis,FDD)技术根据对系统运行参数的实时监测,判断其是否发生故障,并确定其故障类型,对于降低中央空调系统故障发生率,提高其运行可靠性,降低中央空调运行能耗意义重大。
目前,暖通空调领域的FDD常用方法分为机理模型和机器学习方法。由于制冷系统的复杂性,机理模型的建立非常困难,所需参数众多,甚至一些无法获取的参数只能靠估计进行取值。因此,冷水机组机理模型大多需要诸多的假设,以简化建模过程,可能会导致检测性能下降。近年来,楼宇自控系统和建筑能源管理系统的普及为获取大量中央空调实际运行数据的获取提供了有效技术手段,基于机器学习的冷水机组FDD方法成为研究热点,该方法不需要构建机理模型,完全依靠数据建立模型,包括支持向量机、神经网络、贝叶斯网络等多种方法,但随之可能存在可解释性较弱的问题。
LightGBM(Light Gradient Boosting Machine)算法是近年来在梯度提升决策树上发展起来的机器学习方法,与其他机器学习算法相比,LightGBM在考虑模型性能的同时,更加注重模型复杂度的控制,能有效地解决冷水机组数据存在的非高斯性、非线性、共线性和高维海量的问题,并且具有较好的特征提取能力。然而LightGBM算法模型的性能受到自身超参数的影响,而网格搜索算法、随机搜索算法、粒子群优化算法等寻优算法超参数搜索效率低下。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质,该方法提出的特征选择方法能够有效提取关键故障特征,提高模型的可解释性;提出的贝叶斯优化算法能够有效提高LightGBM模型超参数的寻优效率;提出的LightGBM模型能够充分利用冷水机组的历史运行数据挖掘输入故障特征与冷水机组运行状态的映射关系,实现对冷水机组运行状态的快速评估。
为了达到上述目的,本发明采用以下技术方案:
本发明一方面提供了一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法,包括下述步骤:
S1、数据获取:采集并存储冷水机组的现场历史数据,获得无故障历史数据和故障历史数据,并得到数据的标签集,标签集的每行标签表示与其对应的数据的状态,包括是否为故障状态及发生故障时的故障类型;
S2、数据预处理:对获取的历史数据进行预处理,包括稳态工况提取、异常值检测和数据归一化;
S3、数据特征选择:采用嵌入法和递归特征消除法相结合的两步法对预处理后的历史数据进行特征选择,包括以下步骤:
S31、基于LightGBM的嵌入法:
S311、冷水机组历史数据序列定义为:S={s1,s2,...,sn},其中s1表示第1个特征,n为冷水机组特征总个数,用S训练LightGBM模型;
S312、在S311的训练过程中,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R={r1,r2,...,rn},其中r1表示第1个特征与所有特征作为分裂节点次数总和的比值,rn表示第n个特征与所有特征作为分裂节点次数总和的比值;
S314、获得特征子集Si,并用于测试LightGBM模型,得到评价指标P(Si);
S32、基于LightGBM的递归特征消除法:
S321、使用S315中的特征子集S'0训练LightGBM模型;
S322、在S321的训练过程中,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R′={r1,r2,...,rk},k为步骤S315中特征子集S′0所包含的特征的数量;
S323、剔除特征相对重要型分数最小的特征,获得特征子集S′i,并用于测试LightGBM模型,得到评价指标P(S′i);
S324、重复步骤S321-S323的操作,直到特征子集S′i仅包含一个特征;
S4、模型训练:使用S3中特征选择后的数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,进而得到训练好的LightGBM诊断模型;
S5、故障诊断:使用与步骤S2相同的数据预处理方法对实时采集到的数据进行处理,并采用步骤S3中选择的特征构建待检数据,输入训练好的LightGBM诊断模型,得到冷水机组故障诊断结果。
作为优选的技术方案,步骤S2中,所述数据预处理包括:
S21、所述稳态工况提取的方法为基于滑动窗口的几何加权方差法:
若滑动窗口中数据的几何加权方差不高于设定的阈值,则滑动窗口中的该组数据为稳态工况数据,并顺时递推m步,重新判稳;若滑动窗中数据的几何加权方差高于设定的阈值,则顺时递推1步,重新判稳;
S22、所述异常值检测的方法为3σ准则:
L1=μ-3σ
L2=μ+3σ
其中,Xi为某列第i个数据,N为样本总数,μ为该列数据的均值,σ为该列数据的标准差,L1为异常阈值的判定下限,L2为异常阈值的判定上限,异常值判定标准为样本数值小于判定下限L1或大于判定上限L2;
S23、对步骤S22中剔除异常值后的数据进行归一化处理,公式为:
其中,X*为归一化后数据;X为冷水机组运行数据原始数值;Xmin,Xmax分别为冷水机组运行数据的最小值和最大值。
作为优选的技术方案,步骤S3中,所述评价指标P(·)为模型性能和模型复杂性,其中模型性能采用十折交叉法验证总体精度来衡量,十折交叉法验证的平均总体精度越大或总体精度方差越小,模型性能越好,评价指标P(·)越大;模型复杂性采用输入特征维度来衡量,输入特征数量越少,模型复杂性越低,评价指标P(·)越大;总体精度的计算公式为:
其中OA为总体精度,ncorrect为正确诊断的样本数,N为样本总数。
作为优选的技术方案,步骤S4中,所述LightGBM模型需要寻优的超参数包括学习率learning_rate、树深度max_depth、叶子结点数num_leaves、叶子上最小数据数min_child_samples。
作为优选的技术方案,步骤S4中,所述使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,包括如下计算步骤:
S42、在集合Dt基础上采用高斯过程建立目标函数的后验分布;
S43、最大化PI函数确定下一个采样点xt+1;计算目标函数值ft+1;
S44、将评估点(xt+1,ft+1)加入到集合Dt中,得到集合Dt+1;
S45、重复步骤S42-S44的操作,直到迭代结束;
S46、输出max{f}对应的特征子集LightGBM超参数组合x。
作为优选的技术方案,步骤S4中,所述贝叶斯优化算法采用的概率代理模型为高斯过程,具体为:
高斯过程是LightGBM模型中待调超参数的随机组合,表示为:
f(x)~GP(μ(x),k(x,x′))
其中f(x)为目标函数,μ(x)为均值函数,μ(x)=E(f(x)),k(x,x′)为协方差函数,E(f(x))为目标函数f(x)的期望;
其中K为k(x,x′)构成的矩阵,Kt+1为k(x,x′t+1)构成的矩阵,Kt+1,t+1为k(xt+1,x′t+1)构成的矩阵,为Kt+1的转置,则ft+1的后验分布P(ft+1|Dt,xt+1)可表示为:
作为优选的技术方案,步骤S4中,所述贝叶斯优化算法采用的采集函数为PI函数,具体为:
其中xt+1为下一个采样点,Φ(·)为标准正态累积分布函数,ft(x+)为当前目标函数的最大值,ε为平衡探索和开发的权衡系数,μt(x)为高斯过程的后验分布均值,σt(x)为高斯过程的后验分布方差。
作为优选的技术方案,步骤S4中,用于LightGBM模型超参数寻优的目标函数为训练集的十折交叉验证平均总体精度。
本发明另一个方面提供了一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统,应用于所述的一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法,包括数据获取模块、数据预处理模块、特征选择模块、模型训练模块、故障诊断模块;
所述数据获取模块,用于通过传感器采集并存储冷水机组的现场历史数据,获得无故障历史数据和故障历史数据;
所述数据预处理模块,用于对获取的历史数据进行预处理,包括稳态工况提取、异常值检测和数据归一化;
所述特征选择模块,用于采用嵌入法和递归特征消除法相结合的两步法对预处理后的历史数据进行特征选择;
所述模型训练模块,用于使用特征选择后的数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,进而得到训练好的LightGBM诊断模型;
所述故障诊断模块,用于将待检数据输入到训练好的LightGBM诊断模型中,得到冷水机组故障诊断结果。
本发明又一方面提供了一种计算机可读存储介质,存储有程序,所述程序被处理器执行时,实现所述的一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法。
本发明与现有技术相比,具有如下优点和有益效果:
(1)本发明提出的一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法可快速准确的对复杂非线性冷源系统下的冷水机组运行状态进行评估,有利于冷源机房运行维护人员根冷水机组运行状态评估结果快速制定相应的决策,防止冷水机组运行情况进一步恶化,提高冷源系统的可靠性。
(2)本发明提出的嵌入法和递归特征消除法相结合的两步特征选择方法,并结合具有良好特征提取能力的LightGBM算法,能够有效剔除冗余特征,降低特征维度,筛选出能较好映射冷水机组各种故障类型和正常状态的关键故障特征,可提高模型的可解释性,揭示故障机理。
(3)本发明提出的LightGBM冷水机组故障诊断模型,与其他机器学习方法相比,离线训练时间大大降低,在此基础上提出的贝叶斯优化方法可进一步缩短其离线建模时间,便于实现在线增量学习。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例基于贝叶斯优化LightGBM的冷水机组故障诊断方法的框架图;
图2是本发明实施例中基于贝叶斯优化的LightGBM超参数优化流程图;
图3是本发明实施例基于贝叶斯优化LightGBM的冷水机组故障诊断系统的方框图;
图4是本发明实施例计算机可读存储介质的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
如图1所示,本实施例提供了一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法,包括下述步骤:
S1、数据获取:通过传感器采集并存储冷水机组的现场历史数据,获得无故障历史数据和故障历史数据,并得到数据的标签集,标签集的每行标签表示与其对应的数据的状态,包括是否为故障状态及发生故障时的故障类型;
本实施例使用的冷水机组运行数据来自ASHARE RP-1043项目提供的数据,该项目实验对象是一台以R134a为制冷剂并由管壳式蒸发器、管壳式冷凝器、先导式膨胀阀和离心式压缩机组成的90冷吨离心式冷水机组,实验对冷凝器结垢、润滑油过量、存在不凝性气体、冷却水流量减少、冷冻水流量减少、制冷剂泄漏或充注不足和制冷剂充注过量7种冷水机组典型故障进行四个故障级别的模拟,并加正常组作为参照;每组实验时间为51910s,每隔10秒采集64个参数,其中48个参数直接通过传感器读取,包括温度29个,流量2个,压力5个,阀门位置7个,压缩机功率和电流等,16个参数实时计算获得,包括流量3个,主机性能系数,压缩机效率和冷热量计算等,此处仅考虑48个传感器直接测量得到的参数。根据每组实验的实验目的,得到相应数据的标签,构成数据的标签集,包括是否为故障状态及发生故障时的故障类型。
S2、数据预处理:对获取的历史数据进行预处理,包括稳态工况提取、异常值检测和数据归一化,包括:
S21、稳态工况提取,实验根据冷冻供水温度、冷却回水温度和主机负荷三个参数调节运行工况,故在恒定水流量下冷冻回水温度、冷冻供水温度和冷却回水温度被选为表征主机运行工况并用来执行稳态工况提取的特征参数;稳态工况提取采用基于滑动窗口的几何加权方差法,其几何加权系数、几何加权平均和几何加权方差的公式分别为:
式中xi为滑动窗口中第i个数据,m为滑动窗口长度,αm-i为滑动窗口中第i个数据的权重,采用试凑法,将滑动窗口长度设为8,阈值设为0.2℉;当滑动窗口中冷冻回水温度、冷冻供水温度和冷却回水温度的几何加权方差都不高于阈值时,滑动窗中的该组数据为稳态工况数据,并顺时递推8步,重新判稳;若滑动窗中数据的几何加权方差高于阈值,则顺时递推1步,重新判稳。
S22、异常值检测,异常值判定标准为3σ准则,计算原始数据中每个特征参数的均值μ和标准差σ:
L1=μ-3σ
L2=μ+3σ
其中,Xi为某列第i个数据,N为样本总数,μ为该列数据的均值,σ为该列数据的标准差,L1为异常阈值的判定下限,L2为异常阈值的判定上限,异常值判定标准为样本数值小于判定下限L1或大于判定上限L2;
如果某特征数据不落在[μ-3σ,μ+3σ]区间内,就判断其为异常值,且该异常值所在的数据点被认为是异常点,并剔除该行数据;
经过稳态工况提取和异常值检测后,对正常数据和包含4个故障级别的7种典型故障数据,进行分层抽样,随机各抽取9375个数据样本,得到12800个数据样本。按3:1的比例随机划分原始训练集和测试集,在此实施例中原始训练集用来作为历史运行数据,测试集用来作为实时运行数据。
S23、数据归一化,对原始训练集数据进行归一化处理:
其中,X*为归一化后数据;X为冷水机组运行数据原始数值;Xmin,Xmax分别为冷水机组运行数据的最小值和最大值;对原始训练集的每个特征参数进行[-1,1]归一化处理。
S3、数据特征选择:采用嵌入法和递归特征消除法相结合的两步法对预处理后的历史数据进行特征选择;
其中嵌入法和递归特征消除法相结合的两步法包括以下步骤:
S31、基于LightGBM的嵌入法:
S311、冷水机组历史数据序列定义如下:
S={s1,s2,...,sn},其中s1表示第1个特征,n为冷水机组特征总个数,用S训练LightGBM模型;
S312、在S311的训练过程中,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R={r1,r2,...,rn},其中r1表示第1个特征与所有特征作为分裂节点次数总和的比值;
S314、获得特征子集Si,并用于测试LightGBM模型,得到评价指标P(Si);
S32、基于LightGBM的递归特征消除法:
S321、使用S315中的特征子集S'0训练LightGBM模型;
S322、在S321的训练过程中,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R′={r1,r2,...,rk},k为步骤S315中特征子集S′0所包含的特征的数量;
S323、剔除特征相对重要型分数最小的特征,获得特征子集S′i,并用于测试LightGBM模型,得到评价指标P(S′i);
S324、重复步骤S321-S323的操作,直到特征子集S′i仅包含一个特征;
本实施例采用经过数据归一化后的数据训练LightGBM模型,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R={r1,r2,...,r48},用来作为基于LightGBM的嵌入法选择特征时的阈值,在此基础上采用基于LightGBM的嵌入法进行初步特征选择;将模型性能和模型复杂性作为评价指标,模型性能采用训练集的十折交叉验证总体精度进行衡量,模型复杂性采用输入特征维度进行衡量,初步选择出具有10个特征的特征子集,见表1。
表1初步选择的特征
采用基于LightGBM的递归特征消除法进行特征终选,用嵌入法初步选择的特征重新训练LightGBM模型,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R′={r1,r2,...,r10},对当前建立的LightGBM模型进行评价,递归地从当前集合中剔除具有最小相对重要性的特征,并在每次迭代中重新训练模型和重新评价模型。将模型性能和模型复杂性作为评价指标,模型性能采用训练集的十折交叉验证总体精度进行衡量,模型复杂性采用输入特征维度进行衡量,最终选择出具有5个特征的特征子集,见表2。
表2最终选择的特征
S4、模型训练:使用S3中特征选择后的数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,进而得到训练好的LightGBM诊断模型,具体步骤为:
S42、在集合Dt基础上采用高斯过程建立目标函数的后验分布;
S43、最大化PI函数确定下一个采样点xt+1;计算目标函数值ft+1;
S44、将评估点(xt+1,ft+1)加入到集合Dt中,得到集合Dt+1;
S45、重复步骤S42-S44的操作,直到迭代结束;
S46、输出max{f}对应的特征子集LightGBM超参数组合x;
更具体的,高斯过程是LightGBM模型中待调超参数的随机组合,表示为:
f(x)~GP(μ(x),k(x,x′))
其中f(x)为目标函数,μ(x)为均值函数,μ(x)=E(f(x)),k(x,x′)为协方差函数,E(f(x))为目标函数f(x)的期望;
其中K为k(x,x′)构成的矩阵,Kt+1为k(x,x′t+1)构成的矩阵,Kt+1,t+1为k(xt+1,x′t+1)构成的矩阵,为Kt+1的转置,则ft+1的后验分布P(ft+1|Dt,xt+1)可表示为:
更具体的,使用PI函数计算下一采样点具体为:
其中xt+1为下一个采样点,Φ(·)为标准正态累积分布函数,ft(x+)为当前目标函数的最大值,ε为平衡探索和开发的权衡系数,μt(x)为高斯过程的后验分布均值,σt(x)为高斯过程的后验分布方差。
本实施例从原始训练集中随机抽取5000样本量作为训练集,采用LightGBM模型对训练集数据进行训练并结合训练效果,采用贝叶斯优化算法并结合十折交叉验证方式进行超参数寻优与确定,如图2所示。寻优的超参数为学习率(learning_rate)、树深度(max_depth)、叶子节点数(num_samples)、叶子上最小数据数(min_child_samples),超参数搜索范围分别设置学习率为0.1~1,树深度为1~30,叶子节点数为10~150,叶子上最小数据数为1~30;本例中超参数寻优的目标函数选择训练集的十折交叉验证平均总体精度,迭代次数设为30次;在寻优过程中,使用贝叶斯优化算法,对此四个超参数在一定范围内进行寻优,达到迭代次数为止,最终完成此四个超参数的寻优;采用上述贝叶斯优化算法寻优得到的超参数组合作为LightGBM模型的超参数设置,并输入训练集样本,最终得到训练好的LightGBM冷水机组故障诊断模型。
S5、故障诊断:使用与步骤S2相同的数据预处理方法对实时采集到的数据进行处理,并采用步骤S3中选择的特征构建待检数据,输入训练好的LightGBM诊断模型,得到冷水机组故障诊断结果;
根据S23中对原始训练集进行归一化处理的方法,在此基础上采用相同的规则对测试集进行归一化处理,并将归一化处理后的测试集数据传入训练好的LightGBM冷水机组故障诊断模型中,并输出诊断结果。
结果分析
表3为冷水机组六种故障诊断模型诊断结果分析,其中LightGBM、XGBoost(极限梯度提升树)和核函数为RBF的SVM(支持向量机)模型均是采用其本身默认参数,而BOA-LightGBM、BOA-XGBoost和BOA-SVM模型均是采用了本发明中的贝叶斯优化算法结合十折交叉验证方式对其超参数进行优化;由结果可得,LightGBM、XGBoost和SVM三种模型进行参数寻优后模型诊断性能均有明显进步,相较默认参数时的模型诊断总体精度分别提高约1.02%、0.59%和36.58%,Kappa系数分别提高约1.16%、0.68%和44.56%。进行参数寻优后,三种模型的建模用时均增加,BOA-LightGBM的诊断总体精度和Kappa系数最高,分别为96.11%和0.9555,建模用时为61.49s,是BOA-SVM的1.12倍,是BOA-XGBoost的26.81%,诊断用时为0.65s,是BOA-SVM的13.54%,和BOA-XGBoost相差不大。从诊断精度、建模用时、诊断用时及输入特征维度四方面进行比较分析可知,本发明的方法具有高诊断精度、建模用时少,诊断用时少且可解释性高的优势。
表3冷水机组六种故障诊断模型诊断结果分析
通过本实施例的技术方案,建立的冷水机组故障诊断模型诊断结果可靠性高,可解释性强,可用于诊断冷源机房中冷水机组的实时运行状态、冷水机组的在线维护及对其进行相关控制和决策的依据。
需要说明的是,对于前述的各方法实施例,为了简便描述,将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。
基于与上述实施例中的一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法相同的思想,本发明还提供一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统,该系统可用于执行上述一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法。为了便于说明,一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统实施例的结构示意图中,仅仅示出了与本发明实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,在本申请的另一个实施例中,提供了一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统100,该系统包括数据获取模块101、预处理模块102、特征选择模块103、模型训练模块104、故障诊断模块105;
数据获取模块101,用于通过传感器采集并存储冷水机组的现场历史数据,获得无故障历史数据和故障历史数据;
预处理模块102,用于对获取的历史数据进行预处理,包括稳态工况提取、异常值检测和数据归一化;
特征选择模块103,用于采用嵌入法和递归特征消除法相结合的两步法对预处理后的历史数据进行特征选择;
模型训练模块104,用于使用特征选择后的数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,进而得到训练好的LightGBM诊断模型;
故障诊断模块105,用于将待检数据输入到训练好的LightGBM诊断模型中,得到冷水机组故障诊断结果。
需要说明的是,本发明的一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统与本发明的一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法一一对应,在上述一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法的实施例阐述的技术特征及其有益效果均适用于一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统的实施例中,具体内容可参见本发明方法实施例中的叙述,此处不再赘述,特此声明。
此外,上述实施例的一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统的实施方式中,各程序模块的逻辑划分仅是举例说明,实际应用中可以根据需要,例如出于相应硬件的配置要求或者软件的实现的便利考虑,将上述功能分配由不同的程序模块完成,即将所述一种基于贝叶斯优化LightGBM的冷水机组故障诊断系统的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分功能。
如图4所示,在一个实施例中,提供了一种计算机可读存储介质200,存储有程序于存储器201中,所述程序被处理器202执行时,实现所述的一种基于贝叶斯优化LightGBM的冷水机组故障诊断方法,具体为:
通过传感器采集并存储冷水机组的现场历史数据,获得无故障历史数据和故障历史数据;
对获取的历史数据进行预处理,包括稳态工况提取、异常值检测和数据归一化;
采用嵌入法和递归特征消除法相结合的两步法对预处理后的历史数据进行特征选择;
使用特征选择后的数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,进而得到训练好的LightGBM诊断模型;
将待检数据输入到训练好的LightGBM诊断模型中,得到冷水机组故障诊断结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (9)
1.基于贝叶斯优化LightGBM的冷水机组故障诊断方法,其特征在于,包括下述步骤:
S1、数据获取:采集并存储冷水机组的现场历史数据,获得无故障历史数据和故障历史数据,并得到数据的标签集,标签集的每行标签表示与其对应的数据的状态,包括是否为故障状态及发生故障时的故障类型;
S2、数据预处理:对获取的历史数据进行预处理,包括稳态工况提取、异常值检测和数据归一化;
S3、数据特征选择:采用嵌入法和递归特征消除法相结合的两步法对预处理后的历史数据进行特征选择,包括以下步骤:
S31、基于LightGBM的嵌入法:
S311、冷水机组历史数据序列定义为:S={s1,s2,...,sn},其中s1表示第1个特征,n为冷水机组特征总个数,用S训练LightGBM模型;
S312、在S311的训练过程中,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R={r1,r2,...,rn},其中r1表示第1个特征与所有特征作为分裂节点次数总和的比值,rn表示第n个特征与所有特征作为分裂节点次数总和的比值;
S314、获得特征子集Si,并用于测试LightGBM模型,得到评价指标P(Si);
S32、基于LightGBM的递归特征消除法:
S321、使用S315中的特征子集S′0训练LightGBM模型;
S322、在S321的训练过程中,统计所有特征作为分裂节点的次数,并计算各个特征与所有特征作为分裂节点次数总和的比值,得到特征相对重要性分数R′={r1,r2,...,rk},k为步骤S315中特征子集S'0所包含的特征的数量;
S323、剔除特征相对重要型分数最小的特征,获得特征子集S′i,并用于测试LightGBM模型,得到评价指标P(S′i);
S324、重复步骤S321-S323的操作,直到特征子集S′i仅包含一个特征;
S4、模型训练:使用S3中特征选择后的数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,进而得到训练好的LightGBM诊断模型;步骤S4中,所述使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,包括如下计算步骤:
S42、在集合Dt基础上采用高斯过程建立目标函数的后验分布;
S43、最大化PI函数确定下一个采样点xt+1;计算目标函数值ft+1;
S44、将评估点(xt+1,ft+1)加入到集合Dt中,得到集合Dt+1;
S45、重复步骤S42-S44的操作,直到迭代结束;
S46、输出max{f}对应的特征子集LightGBM超参数组合x;
S5、故障诊断:使用与步骤S2相同的数据预处理方法对实时采集到的数据进行处理,并采用步骤S3中选择的特征构建待检数据,输入训练好的LightGBM诊断模型,得到冷水机组故障诊断结果。
2.根据权利要求1所述基于贝叶斯优化LightGBM的冷水机组故障诊断方法,其特征在于,步骤S2中,所述数据预处理包括:
S21、所述稳态工况提取的方法为基于滑动窗口的几何加权方差法:
若滑动窗口中数据的几何加权方差不高于设定的阈值,则滑动窗口中的数据为稳态工况数据,并顺时递推n步,重新判稳;若滑动窗中数据的几何加权方差高于设定的阈值,则顺时递推1步,重新判稳;
S22、所述异常值检测的方法为3σ准则:
L1=μ-3σ
L2=μ+3σ
其中,Xi为某列第i个数据,N为样本总数,μ为该列数据的均值,σ为该列数据的标准差,L1为异常阈值的判定下限,L2为异常阈值的判定上限,异常值判定标准为样本数值小于判定下限L1或大于判定上限L2;
S23、对步骤S22中剔除异常值后的数据进行归一化处理,公式为:
其中,X*为归一化后数据;X为冷水机组运行数据原始数值;Xmin,Xmax分别为冷水机组运行数据的最小值和最大值。
4.根据权利要求1所述基于贝叶斯优化LightGBM的冷水机组故障诊断方法,其特征在于,步骤S4中,所述LightGBM模型需要寻优的超参数包括学习率learning_rate、树深度max_depth、叶子结点数num_leaves、叶子上最小数据数min_child_samples。
5.根据权利要求1所述基于贝叶斯优化LightGBM的冷水机组故障诊断方法,其特征在于,步骤S4中,所述贝叶斯优化算法采用的概率代理模型为高斯过程,具体为:
高斯过程是LightGBM模型中待调超参数的随机组合,表示为:
f(x)~GP(μ(x),k(x,x′))
其中f(x)为目标函数,μ(x)为均值函数,μ(x)=E(f(x)),k(x,x′)为协方差函数,E(f(x))为目标函数f(x)的期望;
其中K为k(x,x′)构成的矩阵,Kt+1为k(x,x′t+1)构成的矩阵,Kt+1,t+1为k(xt+1,x′t+1)构成的矩阵,为Kt+1的转置,则ft+1的后验分布P(ft+1|Dt,xt+1)可表示为:
7.根据权利要求1所述基于贝叶斯优化LightGBM的冷水机组故障诊断方法,其特征在于,步骤S4中,用于LightGBM模型超参数寻优的目标函数为训练集的十折交叉验证平均总体精度。
8.基于贝叶斯优化LightGBM的冷水机组故障诊断系统,其特征在于,应用于权利要求1-7中任一项所述的基于贝叶斯优化LightGBM的冷水机组故障诊断方法,包括数据获取模块、数据预处理模块、特征选择模块、模型训练模块、故障诊断模块;
所述数据获取模块,用于通过传感器采集并存储冷水机组的现场历史数据,获得无故障历史数据和故障历史数据;
所述数据预处理模块,用于对获取的历史数据进行预处理,包括稳态工况提取、异常值检测和数据归一化;
所述特征选择模块,用于采用嵌入法和递归特征消除法相结合的两步法对预处理后的历史数据进行特征选择;
所述模型训练模块,用于使用特征选择后的数据训练LightGBM模型,使用贝叶斯优化算法结合十折交叉验证方式对LightGBM模型超参数进行寻优,进而得到训练好的LightGBM诊断模型;
所述故障诊断模块,用于将待检数据输入到训练好的LightGBM诊断模型中,得到冷水机组故障诊断结果。
9.一种计算机可读存储介质,存储有程序,其特征在于,所述程序被处理器执行时,实现权利要求1-7任一项所述的基于贝叶斯优化LightGBM的冷水机组故障诊断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974961.2A CN113792762B (zh) | 2021-08-24 | 2021-08-24 | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110974961.2A CN113792762B (zh) | 2021-08-24 | 2021-08-24 | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113792762A CN113792762A (zh) | 2021-12-14 |
CN113792762B true CN113792762B (zh) | 2023-06-20 |
Family
ID=79182155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110974961.2A Active CN113792762B (zh) | 2021-08-24 | 2021-08-24 | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113792762B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114418144B (zh) * | 2022-01-06 | 2022-09-27 | 合肥工业大学 | 一种除湿机故障分析方法及系统 |
CN114492236A (zh) * | 2022-01-17 | 2022-05-13 | 成都飞机工业(集团)有限责任公司 | 主冷凝器的预防性维修判断方法、装置、设备及存储介质 |
CN114811858B (zh) * | 2022-03-22 | 2023-11-10 | 国网上海市电力公司 | 一种空调负荷在线学习方法 |
CN114974581A (zh) * | 2022-04-26 | 2022-08-30 | 重庆市急救医疗中心(重庆市第四人民医院、重庆市急救医学研究所) | 高血糖危象长期死亡风险预测与评估方法 |
CN114757291B (zh) * | 2022-04-26 | 2023-05-23 | 国网四川省电力公司电力科学研究院 | 基于机器学习算法的单相故障识别优化方法、系统及设备 |
CN115081518B (zh) * | 2022-06-06 | 2023-05-16 | 冰山松洋生物科技(大连)有限公司 | 基于智能搜索的低温制冷系统故障诊断方法及系统 |
CN114880959B (zh) * | 2022-07-11 | 2022-12-30 | 广东电网有限责任公司佛山供电局 | 一种用于建筑能耗混合模型的输入变量获取方法和系统 |
CN115544115A (zh) * | 2022-09-24 | 2022-12-30 | 湖南万脉医疗科技有限公司 | 一种呼吸机故障预测方法和呼吸机 |
CN116151495A (zh) * | 2023-04-24 | 2023-05-23 | 北京智芯微电子科技有限公司 | 基于联邦学习的用电预测方法及系统、计算机设备 |
CN117171508A (zh) * | 2023-09-05 | 2023-12-05 | 石家庄铁道大学 | 基于贝叶斯优化的深度q学习轴承故障诊断方法 |
CN116956757A (zh) * | 2023-09-21 | 2023-10-27 | 中国民航工程咨询有限公司 | 出港航班滑行时间预测方法、电子设备和存储介质 |
CN117373247A (zh) * | 2023-10-24 | 2024-01-09 | 广东联合电子服务股份有限公司 | 一种新型etc卡休眠预测诊断方法、系统及可存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858140A (zh) * | 2019-01-28 | 2019-06-07 | 西安建筑科技大学 | 一种基于信息熵离散型贝叶斯网络冷水机组故障诊断方法 |
CN110413494A (zh) * | 2019-06-19 | 2019-11-05 | 浙江工业大学 | 一种改进贝叶斯优化的LightGBM故障诊断方法 |
CN113177594A (zh) * | 2021-04-29 | 2021-07-27 | 浙江大学 | 基于贝叶斯优化的pca-极限随机树的空调故障诊断方法 |
-
2021
- 2021-08-24 CN CN202110974961.2A patent/CN113792762B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858140A (zh) * | 2019-01-28 | 2019-06-07 | 西安建筑科技大学 | 一种基于信息熵离散型贝叶斯网络冷水机组故障诊断方法 |
CN110413494A (zh) * | 2019-06-19 | 2019-11-05 | 浙江工业大学 | 一种改进贝叶斯优化的LightGBM故障诊断方法 |
CN113177594A (zh) * | 2021-04-29 | 2021-07-27 | 浙江大学 | 基于贝叶斯优化的pca-极限随机树的空调故障诊断方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113792762A (zh) | 2021-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113792762B (zh) | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 | |
CN108376298B (zh) | 一种风电机组发动机温度故障预警诊断方法 | |
CN107844799B (zh) | 一种集成svm机制的冷水机组故障诊断方法 | |
CN110410282A (zh) | 基于som-mqe和sfcm的风电机组健康状态在线监测及故障诊断方法 | |
CN108758969B (zh) | 一种冷水机组故障检测方法和系统 | |
CN114484731B (zh) | 一种基于stacking融合算法的中央空调故障诊断方法及装置 | |
CN109213127A (zh) | 一种基于深度学习的hvac系统渐变故障诊断方法 | |
CN108376264A (zh) | 一种基于支持向量机增量学习的冷水机组故障诊断方法 | |
CN111414703B (zh) | 一种滚动轴承剩余寿命预测方法及装置 | |
CN112199890B (zh) | 一种综合式核动力装置系统级故障诊断方法 | |
CN115187832A (zh) | 一种基于深度学习与格拉姆角场图像的能源系统故障诊断方法 | |
Chen et al. | A whole building fault detection using weather based pattern matching and feature based PCA method | |
CN111723925A (zh) | 一种在途智能列车空调机组故障诊断方法、装置、设备及介质 | |
Gao et al. | Comprehensive study on sensitive parameters for chiller fault diagnosis | |
CN115899964A (zh) | 基于多维的空调智能监测方法与系统 | |
CN111999088A (zh) | 一种船舶制冷系统故障诊断方法、装置及存储介质 | |
CN108491580A (zh) | 一种设备故障诊断装置及系统 | |
CN112884012A (zh) | 基于支持向量机原理的建筑能耗预测方法 | |
CN110500709A (zh) | 空调器运行状态在线判别方法 | |
CN112529053A (zh) | 一种服务器中时序数据短期预测方法及系统 | |
CN110427019B (zh) | 一种基于多变量判别分析的工业过程故障分类方法及控制装置 | |
CN115146718A (zh) | 基于深度表示的风电机组异常检测方法 | |
CN113432247B (zh) | 基于图神经网络的冷水机组能耗预测方法、系统及存储介质 | |
CN114353261A (zh) | 空调机组故障分析方法、装置、终端设备及存储介质 | |
CN110289112B (zh) | 基于层次分析和模糊评价的核动力装置健康状态诊断方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |