CN111461263A - 一种基于emd-rf的变压器油中溶解气体浓度预测方法 - Google Patents
一种基于emd-rf的变压器油中溶解气体浓度预测方法 Download PDFInfo
- Publication number
- CN111461263A CN111461263A CN202010422179.5A CN202010422179A CN111461263A CN 111461263 A CN111461263 A CN 111461263A CN 202010422179 A CN202010422179 A CN 202010422179A CN 111461263 A CN111461263 A CN 111461263A
- Authority
- CN
- China
- Prior art keywords
- imf
- concentration
- sequence
- model
- emd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000007789 gas Substances 0.000 claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 37
- 238000007637 random forest analysis Methods 0.000 claims abstract description 32
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 29
- 238000010606 normalization Methods 0.000 claims abstract description 28
- 238000012549 training Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000010276 construction Methods 0.000 claims abstract description 5
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 claims description 9
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims description 9
- 229910002091 carbon monoxide Inorganic materials 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 8
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 239000001257 hydrogen Substances 0.000 claims description 4
- 229910052739 hydrogen Inorganic materials 0.000 claims description 4
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 claims description 3
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 claims description 3
- 239000005977 Ethylene Substances 0.000 claims description 3
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 3
- 239000001569 carbon dioxide Substances 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 claims description 3
- 238000012854 evaluation process Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000013138 pruning Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000005192 partition Methods 0.000 claims 2
- 238000012423 maintenance Methods 0.000 abstract description 4
- 230000003449 preventive effect Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 10
- 238000012706 support-vector machine Methods 0.000 description 10
- 238000011161 development Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000004090 dissolution Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012806 monitoring device Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于EMD‑RF的变压器油中溶解气体浓度预测方法,首先对变压器油中溶解的七种特征气体原始浓度序列进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;构建随机森林预测模型RF 1 ~RF n+1,将分解好的子序列分别进行归一化处理后作为随机森林模型的输入向量,并针对构建好的随机森林模型RF 1 ~RF n+1进行训练,获得各子序列分量的预测值并进行反归一化处理,通过叠加所有反归一化处理后的数据得到最终预测结果;对比特征气体浓度的实际值,通过预测结果和实际值的误差分析来评估模型的预测性能,该方法解决了7种特征气体浓度之间的互相影响和预测精度低的问题,可以精确预测油中溶解气体浓度的变化趋势,为后续的变压器预防性检修提供重要依据。
Description
技术领域
本发明涉及电力设备监控技术领域,尤其涉及一种油浸式变压器油中溶解气体浓度的预测方法。
背景技术
随着能源互联互通的发展,电力变压器作为电网安全运行的基础设备,一旦发生故障将危及整个电力系统的安全稳定运行。因此,快速准确地了解变压器的潜伏性故障,从而进行检修工作,可以为电力系统的正常运行提供重要保障。
油中溶解气体分析(dissolved gas analysis,DGA)可以及时确定变压器内部存在的潜伏性故障,通过变压器在线检测装置提取出油中溶解特征气体的含量,形成历史特征气体含量序列,对7种油中溶解特征气体的浓度预测其发展趋势,可以提前发现变压器运行过程中存在的故障隐患,为预防性检修提供重要依据。通过机器学习方法对变压器的气体浓度进行预测,常见的有反向传播神经网络(Back propagation neural network,BPNN)、支持向量机(Support Vector Machines,SVM)等。由于传统的机器学习方法调整参数复杂,训练时间长,对样本容量的需求高,导致模型的预测精度较低。
发明内容
本发明要解决的技术问题是提供一种基于经验模态分解和随机森林模型的变压器油中溶解气体浓度预测方法,解决了变压器油中溶解的7种特征气体的互相影响导致预测精度低的问题,使用该方法模型调整参数简单,训练效率快,可以对变压器油中溶解气体浓度发展趋势进行精准预测,可对变压器的预防性检修提供重要依据。
为解决上述技术问题,本发明提供了一种基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,包括如下步骤:
S01、选取变压器油中溶解的气体,包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)的原始浓度作为特征向量;
S02、针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;
S03、对步骤S02中分解好的各子序列分别进行归一化处理;
S04、构建随机森林模型RF1~RFn+1,将步骤S03中归一化处理后的数据作为随机森林模型的输入向量,对构建好的模型RF1~RFn+1进行训练,获得各子序列分量的预测值1~预测值n+1;
S05、对步骤S04中获得的各子序列分量的预测值1~预测值n+1进行反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果;
S06、将步骤S05中得到的最终预测结果与变压器油中溶解气体浓度的实际值进行对比,通过预测结果和实际值的误差分析来评估模型预测性能,评估标准采用平均相对百分比误差和最大相对百分比误差两个指标。
所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES,具体分解步骤如下:
S021、针对七种特征向量的原始浓度序列y(t),确定每种特征向量的所有局部极大值点和极小值点;
S022、采用三次样条曲线函数拟合每种特征向量的全部极值点,构造出上包络线a(t)和下包络线b(t),每种特征向量的所有数据点信息均包含在上下包络线之间,从而计算出上下包络线的平均值,如式(1)所示:
S023、计算每种特征向量的原始浓度序列y(t)与其上下包络线平均值c(t)的差值,得到d(t),如式(2)所示:
d(t)=y(t)-c(t) (2)
d(t)不符合经验模态分解的IMF分量条件时,将其作为原始浓度序列,重复以上步骤,直至满足IMF分量条件,得到的d(t)就是原始浓度序列y(t)的IMF分量之一,记为l1(t)=d(t),代表原始浓度序列y(t)的最大频率IMF分量;
S024、从原始浓度序列y(t)分解得到第一个IMF分量l1(t)后,计算两者的差值,如式(3)所示:
r1(t)=y(t)-l1(t) (3)
式中:r1(t)是剩余分量序列,并将其作为原始序列,不断重复以上步骤,判断ri(t)(i=1,2,…,n)是否满足终止条件,当剩余分量rn(t)是单调函数或常量时,则结束经验模态分解过程;同时,原始浓度序列y(t)分解得到n个IMF分量和一个剩余分量rn(t),如式(4)所示:
剩余分量rn(t)是原始浓度序列y(t)的平均趋势,IMF分量从1到n频率由高到低,分别反映了各不相同的特征尺度信号分量。
所述步骤S03中对步骤S02中分解好的各子序列分别进行归一化处理,归一化公式如式(5)所示:
其中,y与y*分别表示归一化前后的数据;ymax与ymin分别表示某序列归一化前的最大值和最小值。
所述步骤S04中构建的随机森林模型由多棵回归树CART构成,回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示,即:{h(X,Ψk)|k=1,2,…,N},X表示输入向量矩阵,Ψk表示生成k棵子回归树,其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本,且具有相同的分布,随机森林模型的具体构建步骤如下:
S041、划分训练集数据样本为N,从中采用Bootstrap抽样方法抽取容量相同的样本,形成训练子集;
S042、步骤S041中的训练子集有M个特征,从中随机抽取m个作为分裂特征子集(m≤M),后续采用CART回归算法分裂而不剪枝;
S043、重复n次步骤S041~S042,生成相应数量的子回归树(Ψ1、Ψ2、…、Ψn)进行结果预测,构成随机森林回归预测模型RF1~RFn+1;
S044、使用划分的测试集数据验证步骤S043构建的随机森林回归预测模型的可靠性,采用Forest-RI形式,设置训练集有M维,随机选择F(F≤M)个特征向量进行,按照经验公式(6)确定F值:
F=1+log2M (6)
其中,M为原始输入特征向量数为7;
S045、统计输出的预测值,并将所有子树输出的平均预测值反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果。
所述步骤S06中采用平均相对百分比误差和最大相对百分比误差两个指标作为评估标准,表达如式(7)和(8)所示:
本发明提供的预测方法与现有技术相比具备如下特点:本发明首先对变压器油中溶解的七种特征气体原始浓度序列进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;构建随机森林预测模型RF1~RFn+1,将分解好的子序列分别进行归一化处理后作为随机森林模型的输入向量,并针对构建好的随机森林模型RF1~RFn+1进行训练,获得各子序列分量的预测值并进行反归一化处理,通过叠加所有反归一化处理后的数据得到最终预测结果;对比特征气体浓度的实际值,通过预测结果和实际值的误差分析来评估模型的预测性能,该方法解决了7种特征气体浓度之间的互相影响和预测精度低的问题,可以精确预测油中溶解气体浓度的变化趋势,为后续的变压器预防性检修提供重要依据。
附图说明
图1为本发明基于EMD-RF的变压器油中溶解气体浓度预测方法的预测流程图;
图2为本发明实施例中H2的经验模态分解图;
图3为本发明实施例中H2的预测结果对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于EMD-RF的变压器油中溶解气体浓度预测方法,包括如下步骤:
S01、选取变压器油中溶解的气体,包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)的原始浓度作为特征向量;
S02、针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;
S03、对步骤S02中分解好的各子序列分别进行归一化处理;
S04、构建随机森林模型RF1~RFn+1,将步骤S03中归一化处理后的数据作为随机森林模型的输入向量,对构建好的模型RF1~RFn+1进行训练,获得各子序列分量的预测值1~预测值n+1;
S05、对步骤S04中获得的各子序列分量的预测值1~预测值n+1进行反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果;
S06、将步骤S05中得到的最终预测结果与变压器油中溶解气体浓度的实际值进行对比,通过预测结果和实际值的误差分析来评估模型预测性能,评估标准采用平均相对百分比误差和最大相对百分比误差两个指标。
所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES,具体分解步骤如下:
S021、针对七种特征向量的原始浓度序列y(t),确定每种特征向量的所有局部极大值点和极小值点;
S022、采用三次样条曲线函数拟合每种特征向量的全部极值点,构造出上包络线a(t)和下包络线b(t),每种特征向量的所有数据点信息均包含在上下包络线之间,从而计算出上下包络线的平均值,如式(1)所示:
S023、计算每种特征向量的原始浓度序列y(t)与其上下包络线平均值c(t)的差值,得到d(t),如式(2)所示:
d(t)=y(t)-c(t) (2)
d(t)不符合经验模态分解的IMF分量条件时,将其作为原始浓度序列,重复以上步骤,直至满足IMF分量条件,得到的d(t)就是原始浓度序列y(t)的IMF分量之一,记为l1(t)=d(t),代表原始浓度序列y(t)的最大频率IMF分量;
S024、从原始浓度序列y(t)分解得到第一个IMF分量l1(t)后,计算两者的差值,如式(3)所示:
r1(t)=y(t)-l1(t) (3)
式中:r1(t)是剩余分量序列,并将其作为原始序列,不断重复以上步骤,判断ri(t)(i=1,2,…,n)是否满足终止条件,当剩余分量rn(t)是单调函数或常量时,则结束经验模态分解过程;同时,原始浓度序列y(t)分解得到n个IMF分量和一个剩余分量rn(t),如式(4)所示:
剩余分量rn(t)是原始浓度序列y(t)的平均趋势,IMF分量从1到n频率由高到低,分别反映了各不相同的特征尺度信号分量。
所述步骤S03中对步骤S02中分解好的各子序列分别进行归一化处理,归一化公式如式(5)所示:
其中,y与y*分别表示归一化前后的数据;ymax与ymin分别表示某序列归一化前的最大值和最小值。
所述步骤S04中构建的随机森林模型由多棵回归树CART构成,回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示,即:{h(X,Ψk)|k=1,2,…,N},X表示输入向量矩阵,Ψk表示生成k棵子回归树,其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本,且具有相同的分布,随机森林模型的具体构建步骤如下:
S041、划分训练集数据样本为N,从中采用Bootstrap抽样方法抽取容量相同的样本,形成训练子集;
S042、步骤S041中的训练子集有M个特征,从中随机抽取m个作为分裂特征子集(m≤M),后续采用CART回归算法分裂而不剪枝;
S043、重复n次步骤S041~S042,生成相应数量的子回归树(Ψ1、Ψ2、…、Ψn)进行结果预测,构成随机森林回归预测模型RF1~RFn+1;
S044、使用划分的测试集数据验证步骤S043构建的随机森林回归预测模型的可靠性,采用Forest-RI形式,设置训练集有M维,随机选择F(F≤M)个特征向量进行,按照经验公式(6)确定F值:
F=1+log2M (6)
其中,M为原始输入特征向量数为7;
S045、统计输出的预测值,并将所有子树输出的平均预测值反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果。
所述步骤S06中采用平均相对百分比误差和最大相对百分比误差两个指标作为评估标准,表达如式(7)和(8)所示:
实施例
在本发明中,对相关术语说明如下:
经验模态分解方法EMD
反向传播神经网络预测模型简称为:BPNN
基于经验模态分解的反向传播神经网络预测模型简称为:EMD-BPNN
支持向量机预测模型简称为:SVM
基于经验模态分解的支持向量机预测模型简称为:EMD-SVM
随机森林预测模型简称为:RF
基于经验模态分解的随机森林预测模型简称为:EMD-RF
在实际运行中,变压器油中溶解气体浓度受到油温、油压以及运行环境的影响,通过在线监测装置观察其趋势为非平稳波动。直接使用随机森林模型预测油中溶解气体浓度的变化过程具有一定的局限性,本实施例中考虑利用经验模态分解方法对其输入的变压器中溶解气体的非平稳序列进行分解,进一步提升随机森林模型的准确性。使用相同的样本数据集在不同方法下进行变压器油中溶解气体浓度预测,验证本发明提出的一种基于经验模态分解和随机森林模型的变压器油中溶解气体浓度预测方法的有效性。
以某110kV变压器油色谱在线监测装置2018年8月15日至2019年2月18日的油色谱数据为例,其中监测周期为1天,共188组数据。将2018年8月15日至2019年1月19日的158组作为训练数据集,将2019年1月20日至2019年2月18日的30组作为测试数据集。在本发明中,所有溶解气体浓度的单位均为μL/L。
以油中溶解特征气体氢气(H2)浓度的预测为例。随机森林预测模型的两大关键参数取值分别是:子树棵树(trees)取默认值为500,分裂特征数(m_features)根据经验公式取值为4。利用随机森林预测模型进行训练,可得到经验模态分解的H2子序列预测模型,进一步叠加H2子序列分量的预测结果,便可得到未来一天的H2浓度预测值,研究的测试结果如表1所示,预测结果对比如图2所示。
表1基于EMD-RF预测H2浓度的结果
表1进一步计算预测模型性能的评估指标,从而得到平均相对百分误差和最大相对百分误差。预测结果表明,EMD-RF预测模型的平均相对百分比误差e为1.43%,最大相对百分比误差emax为3.95%。上述结果表明,针对油中溶解特征气体H2的浓度预测,EMD-RF预测模型具有优异且稳定的性能,此外,EMD-RF模型具有调参少、容错性好、不易过拟合等优点。
在变压器油中溶解特征气体预测领域,将EMD-RF预测模型分别与BPNN模型和SVM模型进行比较研究,以对比验证EMD-RF预测模型的有效性。BPNN模型的神经元取值10,激活函数采用“relu”函数,学习率为0.01,训练次数为200次。SVM模型的核函数选择径向基核函数(RBF),惩罚因子为1.0。以H2浓度的预测为例,各预测模型的性能对比如表2所示。
表2不同模型下H2预测结果
模型 | 平均相对百分误差e | 最大相对百分误差e<sub>max</sub> |
EMD-RF | 1.43 | 3.95 |
EMD-BPNN | 2.12 | 4.82 |
EMD-SVM | 2.49 | 5.26 |
RF | 2.68 | 5.74 |
BPNN | 3.22 | 7.41 |
SVM | 3.67 | 8.23 |
从表2可知,对比BPNN模型和SVM模型,RF预测模型的平均相对百分误差e分别降低了0.54%和0.99%,最大相对百分误差emax分别降低了1.67%和2.49%,由此可知在样本数据集下预测油中溶解气体时,RF预测模型具备一定优势。与此同时,经过经验模态分解的EMD-RF、EMD-BPNN和EMD-SVM模型相较不经过经验模态分解的各自模型,平均相对百分误差e分别降低了1.25%、1.10%和1.18%,最大相对百分误差emax分别降低了1.79%、2.59%和2.97%,由此说明经验模态分解方法能够有效的将变压器油中溶解的7种特征气体序列分解为相对平稳的子序列,以便结合回归模型预测油中溶解气体的变化趋势。总而言之,在相同数据集基础上,与常用的BPNN、SVM以及加入经验模态分解的EMD-BPNN、EMD-SVM模型相较而言,无论是从平均相对误差方面,还是最大相对误差方面,EMD-RF回归模型预测特征气体H2浓度的性能都是最优的。
如前所述均是以H2的溶解浓度预测为例,验证了所提EMD-RF预测模型的有效性。同理,在相同的数据集和模型的基础上,对其他6种特征气体浓度变化趋势进行预测,结果如下表3所示。
表3其他气体浓度预测结果
由表3可知,在相同的数据集基础上预测其余6种特征气体浓度时,采用EMD-RF模型预测油中溶解气体浓度的平均相对误差和最大相对误差均低于对比研究的5种模型(EMD-BPNN、EMD-SVM、RF、BPNN和SVM),具有较高的预测稳定性和可靠性,可以对变压器油中溶解气体浓度发展趋势进行精准预测,可对变压器的预防性检修提供重要依据。
本发明提出的一种EMD-RF的变压器油中溶解气体浓度预测方法,解决了7种油中溶解特征气体的互相影响导致预测精度低的问题,使用该方法模型调整参数简单,训练效率快,可以对变压器油中溶解气体浓度发展趋势进行精准预测,可对变压器的预防性检修提供重要依据。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,包括如下步骤:
S01、选取变压器油中溶解的气体,包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)的原始浓度作为特征向量;
S02、针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;
S03、对步骤S02中分解好的各子序列分别进行归一化处理;
S04、构建随机森林模型RF1~RFn+1,将步骤S03中归一化处理后的数据作为随机森林模型的输入向量,对构建好的模型RF1~RFn+1进行训练,获得各子序列分量的预测值1~预测值n+1;
S05、对步骤S04中获得的各子序列分量的预测值1~预测值n+1进行反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果;
S06、将步骤S05中得到的最终预测结果与变压器油中溶解气体浓度的实际值进行对比,通过预测结果和实际值的误差分析来评估模型预测性能,评估标准采用平均相对百分比误差和最大相对百分比误差两个指标。
2.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES,具体分解步骤如下:
S021、针对七种特征向量的原始浓度序列y(t),确定每种特征向量的所有局部极大值点和极小值点;
S022、采用三次样条曲线函数拟合每种特征向量的全部极值点,构造出上包络线a(t)和下包络线b(t),每种特征向量的所有数据点信息均包含在上下包络线之间,从而计算出上下包络线的平均值,如式(1)所示:
S023、计算每种特征向量的原始浓度序列y(t)与其上下包络线平均值c(t)的差值,得到d(t),如式(2)所示:
d(t)=y(t)-c(t) (2)
d(t)不符合经验模态分解的IMF分量条件时,将其作为原始浓度序列,重复以上步骤,直至满足IMF分量条件,得到的d(t)就是原始浓度序列y(t)的IMF分量之一,记为l1(t)=d(t),代表原始浓度序列y(t)的最大频率IMF分量;
S024、从原始浓度序列y(t)分解得到第一个IMF分量l1(t)后,计算两者的差值,如式(3)所示:
r1(t)=y(t)-l1(t) (3)
式中:r1(t)是剩余分量序列,并将其作为原始序列,不断重复以上步骤,判断ri(t)(i=1,2,…,n)是否满足终止条件,当剩余分量rn(t)是单调函数或常量时,则结束经验模态分解过程;同时,原始浓度序列y(t)分解得到n个IMF分量和一个剩余分量rn(t),如式(4)所示:
剩余分量rn(t)是原始浓度序列y(t)的平均趋势,IMF分量从1到n频率由高到低,分别反映了各不相同的特征尺度信号分量。
4.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,所述步骤S04中构建的随机森林模型由多棵回归树CART构成,回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示,即:{h(X,Ψk)|k=1,2,…,N},X表示输入向量矩阵,Ψk表示生成k棵子回归树,其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本,且具有相同的分布,随机森林模型的具体构建步骤如下:
S041、划分训练集数据样本为N,从中采用Bootstrap抽样方法抽取容量相同的样本,形成训练子集;
S042、步骤S041中的训练子集有M个特征,从中随机抽取m个作为分裂特征子集(m≤M),后续采用CART回归算法分裂而不剪枝;
S043、重复n次步骤S041~S042,生成相应数量的子回归树(Ψ1、Ψ2、…、Ψn)进行结果预测,构成随机森林回归预测模型RF1~RFn+1;
S044、使用划分的测试集数据验证步骤S043构建的随机森林回归预测模型的可靠性,采用Forest-RI形式,设置训练集有M维,随机选择F(F≤M)个特征向量进行,按照经验公式(6)确定F值:
F=1+log2M (6)
其中,M为原始输入特征向量数为7;
S045、统计输出的预测值,并将所有子树输出的平均预测值反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010422179.5A CN111461263A (zh) | 2020-05-19 | 2020-05-19 | 一种基于emd-rf的变压器油中溶解气体浓度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010422179.5A CN111461263A (zh) | 2020-05-19 | 2020-05-19 | 一种基于emd-rf的变压器油中溶解气体浓度预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111461263A true CN111461263A (zh) | 2020-07-28 |
Family
ID=71678722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010422179.5A Pending CN111461263A (zh) | 2020-05-19 | 2020-05-19 | 一种基于emd-rf的变压器油中溶解气体浓度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461263A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985707A (zh) * | 2020-08-17 | 2020-11-24 | 云南电力技术有限责任公司 | 一种绝缘油中气体浓度的预测方法及装置 |
CN114184695A (zh) * | 2021-11-09 | 2022-03-15 | 国网内蒙古东部电力有限公司电力科学研究院 | 基于参数优化的随机森林油中气体浓度预测方法及系统 |
CN116702063A (zh) * | 2023-05-06 | 2023-09-05 | 中国长江电力股份有限公司 | 一种基于EMD-gcForest模型的变压器油中溶解气体浓度预测方法 |
CN117408299A (zh) * | 2023-09-08 | 2024-01-16 | 国网湖北省电力有限公司宜昌供电公司 | 一种基于深度学习的变压器油中溶解气体浓度预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537444A (zh) * | 2015-01-13 | 2015-04-22 | 安徽理工大学 | 一种基于emd和elm的瓦斯突出预测方法 |
US20190311262A1 (en) * | 2018-04-05 | 2019-10-10 | Toyota Jidosha Kabushiki Kaisha | Machine learning device, machine learning method, electronic control unit and method of production of same, learned model, and machine learning system |
CN110428113A (zh) * | 2019-08-09 | 2019-11-08 | 云南电网有限责任公司电力科学研究院 | 一种基于随机森林的变压器油中溶解气体浓度预测方法 |
CN110766222A (zh) * | 2019-10-22 | 2020-02-07 | 太原科技大学 | 基于粒子群参数优化和随机森林的pm2.5浓度预测方法 |
-
2020
- 2020-05-19 CN CN202010422179.5A patent/CN111461263A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537444A (zh) * | 2015-01-13 | 2015-04-22 | 安徽理工大学 | 一种基于emd和elm的瓦斯突出预测方法 |
US20190311262A1 (en) * | 2018-04-05 | 2019-10-10 | Toyota Jidosha Kabushiki Kaisha | Machine learning device, machine learning method, electronic control unit and method of production of same, learned model, and machine learning system |
CN110428113A (zh) * | 2019-08-09 | 2019-11-08 | 云南电网有限责任公司电力科学研究院 | 一种基于随机森林的变压器油中溶解气体浓度预测方法 |
CN110766222A (zh) * | 2019-10-22 | 2020-02-07 | 太原科技大学 | 基于粒子群参数优化和随机森林的pm2.5浓度预测方法 |
Non-Patent Citations (2)
Title |
---|
刘云鹏等: "基于经验模态分解和长短期记忆神经网络的变压器油中溶解气体浓度预测方法", 《中国电机工程学报》 * |
徐肖伟等: "基于随机森林的变压器油中溶解气体浓度预测", 《电子测量技术》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985707A (zh) * | 2020-08-17 | 2020-11-24 | 云南电力技术有限责任公司 | 一种绝缘油中气体浓度的预测方法及装置 |
CN114184695A (zh) * | 2021-11-09 | 2022-03-15 | 国网内蒙古东部电力有限公司电力科学研究院 | 基于参数优化的随机森林油中气体浓度预测方法及系统 |
CN116702063A (zh) * | 2023-05-06 | 2023-09-05 | 中国长江电力股份有限公司 | 一种基于EMD-gcForest模型的变压器油中溶解气体浓度预测方法 |
CN117408299A (zh) * | 2023-09-08 | 2024-01-16 | 国网湖北省电力有限公司宜昌供电公司 | 一种基于深度学习的变压器油中溶解气体浓度预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111562358B (zh) | 基于联合模型的变压器油中气体含量预测方法及系统 | |
CN111461263A (zh) | 一种基于emd-rf的变压器油中溶解气体浓度预测方法 | |
Kock et al. | Oracle inequalities for high dimensional vector autoregressions | |
CN108663582A (zh) | 一种变压器的故障诊断方法及系统 | |
US9135557B2 (en) | Internal abnormality diagnosis method, internal abnormality diagnosis system, and decision tree generation method for internal abnormality diagnosis of oil-filled electric apparatus utilizing gas concentration in oil | |
CN111722046A (zh) | 一种基于深度森林模型的变压器故障诊断方法 | |
Amer | The impact of renewable energy consumption on the human development index in selected countries: panel analysis (1990–2015) | |
CN114548586B (zh) | 一种基于混合模型的短期电力负荷预测方法及系统 | |
CN112181706A (zh) | 一种基于对数区间隔离的电力调度数据异常检测方法 | |
CN116010884A (zh) | 基于主成分分析的SSA-LightGBM油浸式变压器的故障诊断方法 | |
Hill et al. | The accuracy of extrapolation methods; an automatic Box–Jenkins package Sift | |
CN117473424A (zh) | 基于随机森林的变压器故障诊断方法、系统、设备及介质 | |
CN114239999B (zh) | 基于交叉熵重要抽样的元件可靠性参数优化解析方法 | |
CN113238908B (zh) | 一种服务器性能测试数据分析方法及相关装置 | |
Mahrukh et al. | Prediction of power transformer oil chromatography based on LSTM and RF model | |
CN114019282A (zh) | 基于主成分分析和随机森林相融合的变压器故障诊断方法 | |
CN117454113A (zh) | 一种基于CNN-BiLSTM及RF模型的电力变压器故障预警方法 | |
CN117609818A (zh) | 基于聚类与信息熵的电网关联关系发现方法 | |
CN104834816A (zh) | 一种短期风速预测方法 | |
CN115730246A (zh) | 一种变压器故障预警模型建立方法、预警方法及装置 | |
CN116522138A (zh) | 一种基于弱监督集成的多元时间序列异常检测方法及系统 | |
CN115577873A (zh) | 一种基于选择性集成学习的海上事故类型预测方法 | |
Li et al. | Decomposition of carbon emission driving factors and judgment of peak status in countries along the Belt and Road | |
CN113868304A (zh) | 一种配电网冗余数据的确定方法及系统 | |
CN114184695B (zh) | 基于参数优化的随机森林油中气体浓度预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200728 |