CN112990272A - 用于冷水机组故障诊断的传感器优化选择方法 - Google Patents
用于冷水机组故障诊断的传感器优化选择方法 Download PDFInfo
- Publication number
- CN112990272A CN112990272A CN202110188717.3A CN202110188717A CN112990272A CN 112990272 A CN112990272 A CN 112990272A CN 202110188717 A CN202110188717 A CN 202110188717A CN 112990272 A CN112990272 A CN 112990272A
- Authority
- CN
- China
- Prior art keywords
- diagnosis
- characteristic
- data
- random forest
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 103
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 27
- 238000005457 optimization Methods 0.000 title claims abstract description 16
- 238000010187 selection method Methods 0.000 title claims abstract description 11
- 238000007637 random forest analysis Methods 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000010219 correlation analysis Methods 0.000 claims abstract description 13
- 230000000694 effects Effects 0.000 claims abstract description 9
- 238000012549 training Methods 0.000 claims description 55
- 238000003066 decision tree Methods 0.000 claims description 28
- 230000035945 sensitivity Effects 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 23
- 230000011218 segmentation Effects 0.000 claims description 15
- 238000002790 cross-validation Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000005057 refrigeration Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 5
- 238000002474 experimental method Methods 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 238000010206 sensitivity analysis Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 13
- 239000003507 refrigerant Substances 0.000 description 11
- 238000004140 cleaning Methods 0.000 description 9
- 230000001502 supplementing effect Effects 0.000 description 7
- 239000003921 oil Substances 0.000 description 6
- 239000013598 vector Substances 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 239000008399 tap water Substances 0.000 description 3
- 235000020679 tap water Nutrition 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000017525 heat dissipation Effects 0.000 description 2
- 239000010687 lubricating oil Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000001816 cooling Methods 0.000 description 1
- 239000000498 cooling water Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000009916 joint effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000005461 lubrication Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000004781 supercooling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
Abstract
本发明涉及一种用于冷水机组故障诊断的传感器优化选择方法,引入随机森林作为故障诊断元模型,同时采用敏感性分析与典型相关性分析为诊断模型选择最合适的特征参数(传感器)。敏感性分析能够结合诊断模型找到每类故障的敏感参数,具有很强的可解释性,而典型相关性分析可以去除参数间的相关性进一步简化参数。通过这两类方法的结合为诊断模型选择合适的特征集,从而确定需要安装的传感器。本发明能够大幅度减少安装传感器的数量,同时兼顾了系统复杂度以及诊断效果之间的平衡,具有优越的适用价值。
Description
技术领域
本发明涉及一种诊断技术,特别涉及一种用于冷水机组故障诊断的传感器优化选择方法。
背景技术
制冷系统经过长期的运行难免会发生故障(制冷剂不足,冷凝器结垢等),故障的发生会导致机组寿命缩减、能耗增大、维修成本增加等问题,因此需要建立故障诊断模型在故障发生之初对机组进行调节,而故障诊断模型的建立需要大量的数据支撑,数据的采集往往通过传感器(温度、压力、功率等传感器)实现,在安装少量传感器的情况下,训练一个诊断效果较好诊断模型是故障诊断的一个关键问题。
在现有的传感器优化选择技术中一般会通过制冷先验知识或者特征选择算法进行传感器的优化选择。通过先验知识选择的传感器对于数据驱动诊断模型并不适用,诊断效果较差。传统的特征选择算法有两类,一种是无模型的,它仅仅关注数据本身,能够去除特征间的相关性(信息交叉部分),但缺乏与故障的关联,因此对于模型的适用性并不强;另一种是基于模型的,它依据模型诊断结果选择最适合模型的特征集,但是这类方法对于单个故障的可解释性较差,因为此方法选择的特征集是针对所有故障的,无法为每一类故障找到它在诊断过程中倚重的特征。
发明内容
本发明是针对现在通过传感器参数进行故障诊断中存在的参数难以选择问题,提出了一种用于冷水机组故障诊断的传感器优化选择方法,结合了敏感性性分析与典型相关性分析为诊断模型选择最合适的传感器组合;兼顾了安装成本、系统复杂度以及诊断效果三者的平衡;为每一类故障找到敏感参数,有较强的可解释性,能够方便技术人员进行调整分析。
本发明的技术方案为一种用于冷水机组故障诊断的传感器优化选择方法,具体包括如下步骤:
1)数据预处理:针对制冷系统常见故障,设置需要采集的特征参数,通过实验采集特征参数数据,特征参数包括直接由一个传感器测量出的直接测量特征参数和由数个传感器测量数据计算转换的间接计算特征参数,每组数据包含M个特征参数作为一样本数据,总共N组特征参数数据;对实验样本数据进行预处理,即将采集到的各类故障的特征数据随机划分为训练数据与测试数据,并将数据进行归一化处理,消除量纲影响;
2)建立并优化随机森林诊断模型,具体步骤如下:
2.1)从经过预处理后的训练数据中有放回的随机抽取特征数据组成子训练集,得到n个子训练集,形成的n个子训练集用来训练决策树,即每个子训练集作为一个决策树根节点处的样本,形成n个决策树的根节点处样本;
2.2)对于每个子训练集,从子训练集中随机选取特征作为节点分裂特征,构建决策树;
2.3)按照步骤2.1)~2.2)建立n个决策树,构成随机森林,在形成随机森林的过程中使用网格搜索与交叉验证对随机森林参数进行优化;
2.4)投票法类别判定:利用测试集对随机森林进行测试,根据每一棵决策树的类别输出,采用投票法进行类别判定;
3)生成分析样本集并输入训练好的随机森林诊断模型中:将未做预处理的训练数据中每一类故障的数据分开,依据各故障数据中各特征参数的最大值与最小值定义每一类故障的分析样本集的特征参数空间,使用Sobol序列生成每一类故障的样本特征参数集并进行归一化处理,将生成的各类故障样本特征参数集分别输入到训练好的随机森林模型中,并保存模型输出;
4)针对步骤3)输入和输出数据,采用Sobol法对模型进行方差分解,计算每类故障下特征的总敏感指数以及平均敏感指数;
5)针对步骤1)中未经过预处理的采集特征数据,采用典型相关性分析计算特征参数间的相关性;
6)选择步骤4)中各类故障中的高灵敏特征参数以及灵敏特征参数组成特征集,利用步骤5)典型相关性分析的结果对相关系数在0.8以上的特征进行合并,去除平均敏感指数较低的特征;
7)将步骤6)获得的特征参数送入步骤2)的建立的随机森林诊断模型,将测试数据送入随机森林诊断模型进行模型诊断;若诊断准确率达到要求,则确认随机森林诊断模型;若特征参数诊断效果不能达到诊断准确率,可选择中等灵敏特征参数或多相关性特征参数作为增补特征参数以进一步提高诊断性能,再次运用训练、测试数据对随机森林诊断模型按照步骤2)重新训练优化并测试其诊断性能,直到满足要求;
8)若步骤7)获得的特征参数中,除了温度差特征参数,其他间接计算特征参数去除,按此重新设置需要采集的特征参数,重复步骤1)、2)对随机森林诊断模型进行建立和优化,再用测试数据对优化后随机森林诊断模型进行验证,如符合诊断准确率,则以此特征集作为最优特征集,实现高效准确的故障诊断;如不符合诊断准确率,再调整部分去除的间接计算特征参数重新加入,再去验证模型,直到符合诊断准确率。
优选的,所述步骤2.2)具体实现方法:每个样本有M个特征,在决策树上的每M;然后从这m个特征中采用Gini系数来选择1个特征作为该节点的分裂特征,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中;对于下一个节点,重复再从这m个特征中采用Gini系数来选择1个特征作为这个节点的分裂特征,直到决策树不能再分裂;决策树形成过程中如果出现节点选出来的那一个特征是刚刚其父节点分裂时用过的特征,则该节点已经达到了叶子节点,无须继续分裂了;Gini系数计算公式如下:
其中,D为子训练集,A为某特征,D1、D2分别为对集合D进行二元切分后得到的两个子集合;对于每一个特征A及其可能取得的每个值a将样本D分为D1及D2两部分,计算所有A=a时的Gini系数;Gini系数表示一个集合的不确定性,Gini系数值越大,不确定性就越大;在所有可能的特征A以及它们所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点;依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中。
优选的,所述步骤2.3)在形成随机森林的过程中使用网格搜索与交叉验证对随机森林参数进行优化,具体方法为:使用网络搜索将各个特征可能的取值进行排列组合,列出所有可能的组合结果生成“网格”;然后将各组合用于随机森林模型的训练,并使用交叉验证对表现进行评估,最后返回模型的最佳特征组合。
本发明的有益效果在于:本发明用于冷水机组故障诊断的传感器优化选择方法,引入随机森林作为故障诊断元模型,同时采用敏感性分析与典型相关性分析为诊断模型选择最合适的特征参数(传感器)。敏感性分析能够结合诊断模型找到每类故障的敏感参数,具有很强的可解释性,而典型相关性分析可以去除参数间的相关性进一步简化参数。通过这两类方法的结合为诊断模型选择合适的特征集,从而确定需要安装的传感器。本发明能够大幅度减少安装传感器的数量,同时兼顾了系统复杂度以及诊断效果之间的平衡,具有优越的适用价值。
附图说明
图1为本发明用于冷水机组故障诊断的传感器优化选择方法流程示意图;
图2为本发明实施例随机森林寻优诊断结果图;
图3为本发明实施例正常状态的前20位敏感参数示意图;
图4为本发明实施例制冷剂泄漏或不足故障的前20位敏感参数示意图;
图5为本发明实施例冷凝器结垢故障的前20位敏感参数示意图;
图6为本发明实施例冷凝器水流量不足故障的前20位敏感参数示意图;
图7为本发明实施例制冷剂含不凝性气体故障的前20位敏感参数示意图;
图8为本发明实施例蒸发器水流量不足故障的前18位敏感参数示意图;
图9为本发明实施例制冷剂过量故障的前20位敏感参数示意图;
图10为本发明实施例润滑油过量故障的前20位敏感参数示意图;
图11为本发明实施例灵敏参数集诊断结果示意图;
图12为本发明实施例特征参数相关性示意图;
图13为本发明实施例灵敏参数清洗增补集1诊断结果示意图;
图14为本发明实施例灵敏参数清洗增补集2诊断结果示意图;
图15为本发明实施例各特征集诊断结果示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
本发明用于冷水机组故障诊断的传感器优化选择方法,如图1所示流程图,具体包括如下步骤:
1.数据预处理。针对制冷系统常见故障,设置需要采集的特征参数,通过实验采集特征参数数据,每组数据包括M个特征参数作为一样本数据,总共N组特征参数数据,构成一个N×M的矩阵,每行为一组特征参数数据。数据预处理:将采集到的各类故障的特征参数数据随机划分为训练数据与测试数据(一般情况下,训练占80%,测试占20%),划分方法为:采用交叉验证的方法将训练数据划分为k个大小相同的互斥子集,对于每个子集尽可能保持数据分布的一致性;然后每次选用其中k-1个子集的并集作为训练集,剩下的那个子集作为验证集,遍历k个子集,即可获得k组训练/验证集,从而可以进行k次训练与验证,将验证正确率的平均值作为评价最终训练结果的指标。并将数据进行归一化处理,消除量纲影响。归一化公式如下:
其中,下标i表示行号、j表示列号,tij、tij *为归一化前、后第i行、第j列的值,tmax,j,tmin,j表示第j列数据中的最大值与最小值。
2.建立并优化随机森林诊断模型,具体步骤如下:
(1)从经过预处理后的训练数据中随机抽样,组建子训练集。具体方法就是从经过预处理后的训练集中先随机采集一个样本n1,然后再将n1放回到原始训练集,继续进行随机采样,可能下一次仍然会采集到样本n1,如此采集n次就会得到n个子训练集,形成的n个子训练集用来训练决策树,即每个子训练集作为一个决策树根节点处的样本,形成n个决策树的根节点处样本。
(2)对于每个子训练集,从子训练集中随机选取特征作为节点分裂特征,构建决策树。每个样本有M个特征,在决策树上的每个节点需要分裂时,随机从这M个特征中选取出m个特征,满足条件m<<M。然后从这m个特征中采用某种策略(比如说Gini系数)来选择1个特征作为该节点的分裂特征,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中。对于下一个节点,重复再从这m个特征中采用某种策略(比如说Gini系数)来选择1个特征作为这个节点的分裂特征,直到决策树不能再分裂。决策树形成过程中如果出现节点选出来的那一个特征是刚刚其父节点分裂时用过的特征,则该节点已经达到了叶子节点,无须继续分裂了。Gini系数计算公式如下:
其中,D为子训练集,A为某特征,D1、D2分别为对集合D进行二元切分后得到的两个子集合。对于每一个特征A及其可能取得的每个值a将样本D分为D1及D2两部分,计算所有A=a时的Gini系数。Gini系数与熵类似,表示一个集合的不确定性,Gini系数值越大,不确定性就越大。在所有可能的特征A以及它们所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点。依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中。
(3)建立大量决策树,形成随机森林。按照步骤(1)~(2)建立n个决策树,构成随机森林。在形成随机森林的过程中,使用网格搜索与交叉验证优化随机森林参数。其中,网格搜索法是指定特征的一种穷举搜索方法,将各个特征可能的取值进行排列组合,列出所有可能的组合结果生成“网格”。然后将各组合用于模型的训练,并使用交叉验证对表现进行评估,最后返回模型的最佳特征组合。
(4)投票法类别判定。利用测试集对随机森林进行测试,对每一棵决策树的类别输出结果,采用投票法进行最终故障类别判定。
3.生成分析样本集并输入训练好的随机森林诊断模型中。将未做预处理的训练数据中每一类故障的数据分开,依据各故障数据中各特征参数的最大值与最小值定义每一类故障的分析样本集的特征参数空间,使用Sobol序列生成每一类故障的样本特征参数集并进行归一化处理(其中Sobol序列是一个随机数生成,它是一个低偏差序列,能保证产生点具有更强的均匀特征),将生成的各类故障样本特征参数集分别输入到训练好的随机森林模型中,并保存模型输出。
4.针对步骤3输入和输出数据,采用Sobol法对模型进行方差分解,计算每类故障下特征的总敏感指数以及平均敏感指数。计算方法如下:
方差分解就是把模型分解为单个特征参数及特征参数之间相互组合的函数。假设模型为y=f(x),其中x=(x1,x2,…,xM)是模型的输入值,xj是第j列数据,为一列向量,服从[0,1]上的均匀分布,且f2(x)可积,y是对应的输出值,模型可分解成不同维数的函数之和:
f0=∫f(x)dx
则模型总的方差v可以用下式来计算:
则模型总的方差也可以分解为单个特征参数和每个特征参数项组合的影响:
对上式进行归一化,可以得到第j个特征参数的总敏感指数STj,它可以用来表示第j特征参数对模型的总影响及特征参数间的相互影响。
一般可以将敏感指数划分为四个等级,如表1所示敏感度等级划分。
表1
平均敏感指数是指该特征参数在几类故障中的总敏感指数的平均值,计算公式如下:
其中r表示故障类别的总数量。
5.针对步骤1中未经过预处理的采集特征数据,采用典型相关性分析计算特征参数间的相关性(相关系数在0.8以上的表示具有强相关性)。计算方法如下:
假设给定两组向量X=(x1,x2,x3,…,xp)T,Y=(xp+1,xp+2,…,xp+q)T,其中p、q为两组向量的维数,且p≤q,p+q=M。分别在X、Y中选取若干具有代表性的线性变量Ui、Vi,使得该线性变量都是原变量的线性组合,即Ui=αTX,Vi=βTY。为了得到两组典型变量的最大相关性,计算其pearson相关系数ρ(Ui,Vi)。
Subject to(受限于):
αTSxxα=1
βTSyyβ=1
式中,α、β是表示投影方向;Ui,Vi之间的典型相关关系。其中Sxx,Syy分别指向量X,Y自身的协方差矩阵,Sxy是指X,Y之间的协方差矩阵。在求得第一组典型相关变量后,再利用上述思想求与前一组典型变量不相关的线性组合,如此直到变量之间的相关性提取完毕。
6.选择步骤4中各类故障中的高灵敏特征参数以及灵敏特征参数组成特征集,利用步骤5典型相关性分析的结果对相关性极强(相关性系数在0.8以上)的特征进行合并,去除平均敏感指数较低的特征。
7.将步骤6获得的特征参数送入步骤2的建立的随机森林诊断模型,将测试数据送入随机森林诊断模型进行模型诊断;若诊断准确率达到要求,则确认随机森林诊断模型;若特征参数诊断效果不能达到诊断准确率,可选择中等灵敏特征参数或多相关性特征参数作为增补特征参数以进一步提高诊断性能,再次运用训练、测试数据对随机森林诊断模型按照步骤2重新训练优化并测试其诊断性能,直到满足要求;
8.若步骤7获得的特征参数中,除了温度差特征参数,其他间接计算特征参数去除,按此重新设置需要采集的特征参数,重复步骤1、2对随机森林诊断模型进行建立和优化,再用测试数据对优化后随机森林诊断模型进行验证,如符合诊断准确率,则以此特征集作为最优特征集,实现高效准确的故障诊断;如不符合诊断准确率,再调整部分去除的间接计算特征参数重新加入,再去验证模型,直到符合诊断准确率。
实例:
数据描述:诊断数据来自ASHRAE 1043-RP项目,该项目的实验对象为一台制冷量为90冷吨(约316kW)的离心式冷水机组,蒸发器和冷凝器均为壳管式换热器,制冷剂为R134a。实验系统主要有以下五部分:冷冻水回路、冷却水回路、热水回路、自来水供应、蒸汽供应。实验针对离心式冷水机组最常见的7中典型故障与正常工况(如表2所示)共采集温度、压力、功率、流量、冷量等64维故障特征参数,其中传感器直接测量获得的特征参数48个,间接计算获得的特征参数16个,包括温度特征参数29个,压力特征参数5个,流量特征参数5个,阀位特征参数7个,压缩机功率和电流,制冷性能系数、压缩机效率等。特征参数列表3,值得注意的是,在开始故障检测与诊断之前,原始数据需先通过稳态筛查,去除非稳态数据。
表2
表3
2.随机森林模型的建立与优化
进行敏感性分析时,先要找到一个精度较高的元模型,采用随机森林模型对离心式冷水机组的7种故障状态与正常状态进行诊断识别,采用bootstrap法抽取训练样本(即有放回的选择数据),同时加入网格搜索与3折交叉验证对max_feature和n_estimators进行参数调优,寻优范围分别为[2,8]和[50,400],寻优结果如图2所示。从图2中可以看出,随机森林诊断模型对于离心式冷水机组的故障诊断具有较高的识别率,准确率稳定在99.75%以上,在max_feature=3,n_estimators=300时诊断准确率达到最大(99.90%)。
3.每类故障的总敏感指数计算
通过对所有状态的敏感性分析获得的敏感参数并不能够看出每一个状态对哪些参数会更加敏感,针对此问题对7种故障状态和正常状态进行单类别敏感性分析。依据各故障数据中各特征参数的最大值与最小值定义每一类故障的分析样本集的参数空间,使用Sobol序列生成每一类故障的样本参数集将生成的各类故障样本参数集分别输入到训练好的随机森林模型中,采用Sobol法对模型进行方差分解,计算每类故障下特征的总敏感指数,结果如图3~10所示。
4.选择灵敏参数组成特征集
将每一种状态的灵敏参数取出并组成灵敏参数集,如表4所示灵敏参数集。红色星号代表该参数为该故障的灵敏参数,并按照平均敏感指数进行排序(平均敏感指数是8种状态对应总敏感指数和的平均值)。将灵敏参数集放入随机森林模型中重新训练测试,诊断结果如图11所示。诊断准确率为97.58%,同时从图中可以看到正常状态、制冷剂泄漏或不足、制冷剂过量、润滑油过量4种状态的三项指标均不理想。造成这种现象的可能原因一方面是因为特征参数的大大减少,另一方面是因为参数间存在强相干性参数,比如油箱内油温与供油温度、蒸发器侧水阀开度与蒸发器侧水流量、冷凝器侧水阀开度与冷凝器侧水流量等参数两两之间相关性极大,在诊断识别时可能会相互干扰。
表4
5.典型相关性分析去除相关性并增补参数
针对灵敏参数集诊断准确率较低的两方面原因,对64维特征参数(表3)进行相关性分析以去除冗余参数,图12所示展示了8种状态敏感参数间的相关性(仅相关系数在0.8以上的参数),将相关性达到0.8及以上的参数进行清洗合并,剔除平均敏感指数较低的6个参数(油箱内油温度、进出口油压差、制冷剂过冷度、冷凝器侧水阀开度、蒸发器侧水阀开度、机组能量平衡百分比)。同时为了保证特征参数不至于太少,从相关性图中观察到冷凝器计算散热量、蒸发器计算冷量、压缩机功率、冷凝器内制冷剂压力4个参数与多个参数都具有极强的相关性,同时其平均敏感指数也较高,含有的信息量可能较多,而蒸发器侧出水温度能过够同时反映压缩机进口状态和蒸发器出口状态,对故障的诊断可能有利,因此将这5个参数与特征参数清洗后的灵敏参数集中的剩余6个参数组成灵敏参数清洗增补集1(如表5所示),在随机森林模型上重新对其进行训练测试,诊断准确率提升到了99.0%。
表5
从灵敏参数清洗增补集1的诊断结果(图13)中发现,N0、F1、F2、F6、F7五种状态的诊断效果并不是很理想,还有进一步提高的潜力,于是针对这五种状态,分别从其对应的中等灵敏参数中各自挑选指数最高的2个参数(若该参数已包含在灵敏参数清洗增补集1或灵敏参数集中则顺延一个),所选参数如表所示,但是发现所选参数中依然存在与之前特征集中有极强相关性的参数,比如冷凝器内制冷剂压力与冷凝温度、压缩机压力提升值与压缩机效率、冷凝器进出水温差与冷凝器计算散热量,因此将这三个参数剔除,最终选择的参数为蒸发器环路能量平衡、自来水进水温度、自来水计算冷量,将这3个参数作为二次增补参数加入灵敏参数清洗增补集1,新的特征集命名为灵敏参数清洗增补集2(如表6所示)其中直接测量参数9个,间接测量参数5个,再次利用随机森林模型诊断,结果如图14所示,诊断正确率提升至99.67%,与原始数据集99.90%的诊断准确率相比仅下降了0.23%,同时正常状态、制冷剂泄漏、润滑油过量识别率均有所提升。
表6
考虑到在实际应用中,灵敏参数清洗增补集2的获取需要9个直接测量参数与5个间接计算参数(如表6所示),共需要15个传感器,间接计算参数的加入会额外增加TCI、TEI、TBO、TBI、TSI 5个温度传感器,而且会使数据采集系统复杂化,因此利用9个直接测量参数组建直接测量参数集,并测试其诊断性能,结果如图15所示,诊断准确率为99.79%要略低于原始数据集的表现,但是在实际应用中这样的准确率基本达到诊断要求,最重要的是,直接测量参数集的获得仅仅需要10个传感器,其中5个温度传感器,2个压力传感器,2个流量传感器,1个功率传感器,这对于实际工程应用十分有利,简化了系统复杂度,提高了诊断效率。
Claims (3)
1.一种用于冷水机组故障诊断的传感器优化选择方法,其特征在于,具体包括如下步骤:
1)数据预处理:针对制冷系统常见故障,设置需要采集的特征参数,通过实验采集特征参数数据,特征参数包括直接由一个传感器测量出的直接测量特征参数和由数个传感器测量数据计算转换的间接计算特征参数,每组数据包含M个特征参数作为一样本数据,总共N组特征参数数据;对实验样本数据进行预处理,即将采集到的各类故障的特征数据随机划分为训练数据与测试数据,并将数据进行归一化处理,消除量纲影响;
2)建立并优化随机森林诊断模型,具体步骤如下:
2.1)从经过预处理后的训练数据中有放回的随机抽取特征数据组成子训练集,得到n个子训练集,形成的n个子训练集用来训练决策树,即每个子训练集作为一个决策树根节点处的样本,形成n个决策树的根节点处样本;
2.2)对于每个子训练集,从子训练集中随机选取特征作为节点分裂特征,构建决策树;
2.3)按照步骤2.1)~2.2)建立n个决策树,构成随机森林,在形成随机森林的过程中使用网格搜索与交叉验证对随机森林参数进行优化;
2.4)投票法类别判定:利用测试集对随机森林进行测试,根据每一棵决策树的类别输出,采用投票法进行类别判定;
3)生成分析样本集并输入训练好的随机森林诊断模型中:将未做预处理的训练数据中每一类故障的数据分开,依据各故障数据中各特征参数的最大值与最小值定义每一类故障的分析样本集的特征参数空间,使用Sobol序列生成每一类故障的样本特征参数集并进行归一化处理,将生成的各类故障样本特征参数集分别输入到训练好的随机森林模型中,并保存模型输出;
4)针对步骤3)输入和输出数据,采用Sobol法对模型进行方差分解,计算每类故障下特征的总敏感指数以及平均敏感指数;
5)针对步骤1)中未经过预处理的采集特征数据,采用典型相关性分析计算特征参数间的相关性;
6)选择步骤4)中各类故障中的高灵敏特征参数以及灵敏特征参数组成特征集,利用步骤5)典型相关性分析的结果对相关系数在0.8以上的特征进行合并,去除平均敏感指数较低的特征;
7)将步骤6)获得的特征参数送入步骤2)的建立的随机森林诊断模型,将测试数据送入随机森林诊断模型进行模型诊断;若诊断准确率达到要求,则确认随机森林诊断模型;若特征参数诊断效果不能达到诊断准确率,可选择中等灵敏特征参数或多相关性特征参数作为增补特征参数以进一步提高诊断性能,再次运用训练、测试数据对随机森林诊断模型按照步骤2)重新训练优化并测试其诊断性能,直到满足要求;
8)若步骤7)获得的特征参数中,除了温度差特征参数,其他间接计算特征参数去除,按此重新设置需要采集的特征参数,重复步骤1)、2)对随机森林诊断模型进行建立和优化,再用测试数据对优化后随机森林诊断模型进行验证,如符合诊断准确率,则以此特征集作为最优特征集,实现高效准确的故障诊断;如不符合诊断准确率,再调整部分去除的间接计算特征参数重新加入,再去验证模型,直到符合诊断准确率。
2.根据权利要求1所述用于冷水机组故障诊断的传感器优化选择方法,其特征在于,所述步骤2.2)具体实现方法:每个样本有M个特征,在决策树上的每M;然后从这m个特征中采用Gini系数来选择1个特征作为该节点的分裂特征,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中;对于下一个节点,重复再从这m个特征中采用Gini系数来选择1个特征作为这个节点的分裂特征,直到决策树不能再分裂;决策树形成过程中如果出现节点选出来的那一个特征是刚刚其父节点分裂时用过的特征,则该节点已经达到了叶子节点,无须继续分裂了;Gini系数计算公式如下:
其中,D为子训练集,A为某特征,D1、D2分别为对集合D进行二元切分后得到的两个子集合;对于每一个特征A及其可能取得的每个值a将样本D分为D1及D2两部分,计算所有A=a时的Gini系数;Gini系数表示一个集合的不确定性,Gini系数值越大,不确定性就越大;在所有可能的特征A以及它们所有可能的切分点a中,选择Gini系数最小的特征及其对应的切分点作为最优特征与最优切分点;依最优特征与最优切分点,从现节点生成两个子节点,将训练数据依特征分配到两个子节点中。
3.根据权利要求1所述用于冷水机组故障诊断的传感器优化选择方法,其特征在于,所述步骤2.3)在形成随机森林的过程中使用网格搜索与交叉验证对随机森林参数进行优化,具体方法为:使用网络搜索将各个特征可能的取值进行排列组合,列出所有可能的组合结果生成网格;然后将各组合用于随机森林模型的训练,并使用交叉验证对表现进行评估,最后返回模型的最佳特征组合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110188717.3A CN112990272B (zh) | 2021-02-19 | 2021-02-19 | 用于冷水机组故障诊断的传感器优化选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110188717.3A CN112990272B (zh) | 2021-02-19 | 2021-02-19 | 用于冷水机组故障诊断的传感器优化选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112990272A true CN112990272A (zh) | 2021-06-18 |
CN112990272B CN112990272B (zh) | 2022-08-16 |
Family
ID=76393445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110188717.3A Active CN112990272B (zh) | 2021-02-19 | 2021-02-19 | 用于冷水机组故障诊断的传感器优化选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112990272B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839085A (zh) * | 2014-03-14 | 2014-06-04 | 中国科学院自动化研究所 | 一种列车车厢异常人群密度的检测方法 |
CN104155596A (zh) * | 2014-08-12 | 2014-11-19 | 北京航空航天大学 | 一种基于随机森林的模拟电路故障诊断系统 |
CN107886161A (zh) * | 2017-11-03 | 2018-04-06 | 南京航空航天大学 | 一种提高复杂信息系统效能的全局敏感性分析方法 |
CN108197639A (zh) * | 2017-12-14 | 2018-06-22 | 佛山科学技术学院 | 一种基于随机森林的变压器故障诊断方法 |
CN109212347A (zh) * | 2018-08-31 | 2019-01-15 | 西华大学 | 一种基于isos-dbn模型的光伏并网逆变故障特征提取诊断方法 |
CN110705525A (zh) * | 2019-10-24 | 2020-01-17 | 北京建筑大学 | 一种诊断滚动轴承故障的方法及装置 |
US20200200648A1 (en) * | 2018-02-12 | 2020-06-25 | Dalian University Of Technology | Method for Fault Diagnosis of an Aero-engine Rolling Bearing Based on Random Forest of Power Spectrum Entropy |
-
2021
- 2021-02-19 CN CN202110188717.3A patent/CN112990272B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103839085A (zh) * | 2014-03-14 | 2014-06-04 | 中国科学院自动化研究所 | 一种列车车厢异常人群密度的检测方法 |
CN104155596A (zh) * | 2014-08-12 | 2014-11-19 | 北京航空航天大学 | 一种基于随机森林的模拟电路故障诊断系统 |
CN107886161A (zh) * | 2017-11-03 | 2018-04-06 | 南京航空航天大学 | 一种提高复杂信息系统效能的全局敏感性分析方法 |
CN108197639A (zh) * | 2017-12-14 | 2018-06-22 | 佛山科学技术学院 | 一种基于随机森林的变压器故障诊断方法 |
US20200200648A1 (en) * | 2018-02-12 | 2020-06-25 | Dalian University Of Technology | Method for Fault Diagnosis of an Aero-engine Rolling Bearing Based on Random Forest of Power Spectrum Entropy |
CN109212347A (zh) * | 2018-08-31 | 2019-01-15 | 西华大学 | 一种基于isos-dbn模型的光伏并网逆变故障特征提取诊断方法 |
CN110705525A (zh) * | 2019-10-24 | 2020-01-17 | 北京建筑大学 | 一种诊断滚动轴承故障的方法及装置 |
Non-Patent Citations (1)
Title |
---|
张文雅,等: ""基于交叉验证网格寻优支持向量机的产品销售预测"", 《计算机系统应用》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112990272B (zh) | 2022-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112257530B (zh) | 基于盲信号分离和支持向量机的滚动轴承故障诊断方法 | |
CN110596492A (zh) | 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法 | |
CN113792762A (zh) | 基于贝叶斯优化LightGBM的冷水机组故障诊断方法、系统及介质 | |
CN111401785A (zh) | 一种基于模糊关联规则的电力系统设备故障预警方法 | |
CN115510965A (zh) | 一种基于生成数据融合的轴承不平衡故障诊断方法 | |
CN116894187A (zh) | 一种基于深度迁移学习的齿轮箱故障诊断方法 | |
CN111999088A (zh) | 一种船舶制冷系统故障诊断方法、装置及存储介质 | |
CN112036480A (zh) | 一种船舶制冷系统故障诊断方法、装置及存储介质 | |
CN110427019B (zh) | 一种基于多变量判别分析的工业过程故障分类方法及控制装置 | |
CN112990272B (zh) | 用于冷水机组故障诊断的传感器优化选择方法 | |
CN114707706A (zh) | 一种基于不均衡数据的柴油发动机故障诊断方法 | |
CN113469252A (zh) | 一种考虑不平衡样本的特高压换流阀运行状态评估方法 | |
CN110702438B (zh) | 一种离心式冷水机组与新风系统联合故障诊断方法 | |
CN117349786A (zh) | 基于数据均衡的证据融合变压器故障诊断方法 | |
CN116738204A (zh) | 基于生成对抗Transformer的电力负荷数据异常检测方法 | |
CN115392710A (zh) | 一种基于数据过滤的风电机组运行决策方法及系统 | |
CN115017978A (zh) | 一种基于加权概率神经网络的故障分类方法 | |
CN115905806A (zh) | 一种包含注意力机制的深度神经网络轴承故障诊断方法 | |
CN113051530A (zh) | 一种基于kde-fa的冷水机组故障特征刻画方法 | |
CN114383846B (zh) | 基于故障标签信息向量的轴承复合故障诊断方法 | |
CN117149551B (zh) | 一种车载无线通信芯片的测试方法 | |
Wang et al. | Improvement of Power Transformer Faults Diagnosis Using Random Search with Classification and Regression Tree | |
CN115084593B (zh) | 一种基于非线性阻抗谱的燃料电池故障诊断方法 | |
CN114781507B (zh) | 一种基于1dcnn-ds的冷水机组故障诊断方法 | |
CN113673471B (zh) | 一种变压器绕组振动信号特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240228 Address after: Room 302, Building 1, Hengda Dijing, No. 63 Wenhua East Road, Lixia District, Jinan City, Shandong Province, 250000 Patentee after: Kong Xiaoxiao Country or region after: China Address before: 200093 No. 516, military road, Shanghai, Yangpu District Patentee before: University of Shanghai for Science and Technology Country or region before: China |