CN111461263A - 一种基于emd-rf的变压器油中溶解气体浓度预测方法 - Google Patents

一种基于emd-rf的变压器油中溶解气体浓度预测方法 Download PDF

Info

Publication number
CN111461263A
CN111461263A CN202010422179.5A CN202010422179A CN111461263A CN 111461263 A CN111461263 A CN 111461263A CN 202010422179 A CN202010422179 A CN 202010422179A CN 111461263 A CN111461263 A CN 111461263A
Authority
CN
China
Prior art keywords
imf
concentration
sequence
model
emd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010422179.5A
Other languages
English (en)
Inventor
刘可真
吴世浙
李鹤健
徐玥
苟家萁
和婧
王骞
刘通
陈镭丹
陈雪鸥
阮俊枭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202010422179.5A priority Critical patent/CN111461263A/zh
Publication of CN111461263A publication Critical patent/CN111461263A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于EMD‑RF的变压器油中溶解气体浓度预测方法,首先对变压器油中溶解的七种特征气体原始浓度序列进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;构建随机森林预测模型RF 1 ~RF n+1,将分解好的子序列分别进行归一化处理后作为随机森林模型的输入向量,并针对构建好的随机森林模型RF 1 ~RF n+1进行训练,获得各子序列分量的预测值并进行反归一化处理,通过叠加所有反归一化处理后的数据得到最终预测结果;对比特征气体浓度的实际值,通过预测结果和实际值的误差分析来评估模型的预测性能,该方法解决了7种特征气体浓度之间的互相影响和预测精度低的问题,可以精确预测油中溶解气体浓度的变化趋势,为后续的变压器预防性检修提供重要依据。

Description

一种基于EMD-RF的变压器油中溶解气体浓度预测方法
技术领域
本发明涉及电力设备监控技术领域,尤其涉及一种油浸式变压器油中溶解气体浓度的预测方法。
背景技术
随着能源互联互通的发展,电力变压器作为电网安全运行的基础设备,一旦发生故障将危及整个电力系统的安全稳定运行。因此,快速准确地了解变压器的潜伏性故障,从而进行检修工作,可以为电力系统的正常运行提供重要保障。
油中溶解气体分析(dissolved gas analysis,DGA)可以及时确定变压器内部存在的潜伏性故障,通过变压器在线检测装置提取出油中溶解特征气体的含量,形成历史特征气体含量序列,对7种油中溶解特征气体的浓度预测其发展趋势,可以提前发现变压器运行过程中存在的故障隐患,为预防性检修提供重要依据。通过机器学习方法对变压器的气体浓度进行预测,常见的有反向传播神经网络(Back propagation neural network,BPNN)、支持向量机(Support Vector Machines,SVM)等。由于传统的机器学习方法调整参数复杂,训练时间长,对样本容量的需求高,导致模型的预测精度较低。
发明内容
本发明要解决的技术问题是提供一种基于经验模态分解和随机森林模型的变压器油中溶解气体浓度预测方法,解决了变压器油中溶解的7种特征气体的互相影响导致预测精度低的问题,使用该方法模型调整参数简单,训练效率快,可以对变压器油中溶解气体浓度发展趋势进行精准预测,可对变压器的预防性检修提供重要依据。
为解决上述技术问题,本发明提供了一种基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,包括如下步骤:
S01、选取变压器油中溶解的气体,包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)的原始浓度作为特征向量;
S02、针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;
S03、对步骤S02中分解好的各子序列分别进行归一化处理;
S04、构建随机森林模型RF1~RFn+1,将步骤S03中归一化处理后的数据作为随机森林模型的输入向量,对构建好的模型RF1~RFn+1进行训练,获得各子序列分量的预测值1~预测值n+1;
S05、对步骤S04中获得的各子序列分量的预测值1~预测值n+1进行反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果;
S06、将步骤S05中得到的最终预测结果与变压器油中溶解气体浓度的实际值进行对比,通过预测结果和实际值的误差分析来评估模型预测性能,评估标准采用平均相对百分比误差和最大相对百分比误差两个指标。
所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES,具体分解步骤如下:
S021、针对七种特征向量的原始浓度序列y(t),确定每种特征向量的所有局部极大值点和极小值点;
S022、采用三次样条曲线函数拟合每种特征向量的全部极值点,构造出上包络线a(t)和下包络线b(t),每种特征向量的所有数据点信息均包含在上下包络线之间,从而计算出上下包络线的平均值,如式(1)所示:
Figure BDA0002497331380000021
S023、计算每种特征向量的原始浓度序列y(t)与其上下包络线平均值c(t)的差值,得到d(t),如式(2)所示:
d(t)=y(t)-c(t) (2)
d(t)不符合经验模态分解的IMF分量条件时,将其作为原始浓度序列,重复以上步骤,直至满足IMF分量条件,得到的d(t)就是原始浓度序列y(t)的IMF分量之一,记为l1(t)=d(t),代表原始浓度序列y(t)的最大频率IMF分量;
S024、从原始浓度序列y(t)分解得到第一个IMF分量l1(t)后,计算两者的差值,如式(3)所示:
r1(t)=y(t)-l1(t) (3)
式中:r1(t)是剩余分量序列,并将其作为原始序列,不断重复以上步骤,判断ri(t)(i=1,2,…,n)是否满足终止条件,当剩余分量rn(t)是单调函数或常量时,则结束经验模态分解过程;同时,原始浓度序列y(t)分解得到n个IMF分量和一个剩余分量rn(t),如式(4)所示:
Figure BDA0002497331380000031
剩余分量rn(t)是原始浓度序列y(t)的平均趋势,IMF分量从1到n频率由高到低,分别反映了各不相同的特征尺度信号分量。
所述步骤S03中对步骤S02中分解好的各子序列分别进行归一化处理,归一化公式如式(5)所示:
Figure BDA0002497331380000032
其中,y与y*分别表示归一化前后的数据;ymax与ymin分别表示某序列归一化前的最大值和最小值。
所述步骤S04中构建的随机森林模型由多棵回归树CART构成,回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示,即:{h(X,Ψk)|k=1,2,…,N},X表示输入向量矩阵,Ψk表示生成k棵子回归树,其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本,且具有相同的分布,随机森林模型的具体构建步骤如下:
S041、划分训练集数据样本为N,从中采用Bootstrap抽样方法抽取容量相同的样本,形成训练子集;
S042、步骤S041中的训练子集有M个特征,从中随机抽取m个作为分裂特征子集(m≤M),后续采用CART回归算法分裂而不剪枝;
S043、重复n次步骤S041~S042,生成相应数量的子回归树(Ψ1、Ψ2、…、Ψn)进行结果预测,构成随机森林回归预测模型RF1~RFn+1
S044、使用划分的测试集数据验证步骤S043构建的随机森林回归预测模型的可靠性,采用Forest-RI形式,设置训练集有M维,随机选择F(F≤M)个特征向量进行,按照经验公式(6)确定F值:
F=1+log2M (6)
其中,M为原始输入特征向量数为7;
S045、统计输出的预测值,并将所有子树输出的平均预测值反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果。
所述步骤S06中采用平均相对百分比误差和最大相对百分比误差两个指标作为评估标准,表达如式(7)和(8)所示:
Figure BDA0002497331380000041
Figure BDA0002497331380000042
式中,
Figure BDA0002497331380000043
和yt分别表示油中溶解气体含量的预测值和真实值;N表示评估过程中需要检验的数据个数;t表示数据序列编号。
本发明提供的预测方法与现有技术相比具备如下特点:本发明首先对变压器油中溶解的七种特征气体原始浓度序列进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;构建随机森林预测模型RF1~RFn+1,将分解好的子序列分别进行归一化处理后作为随机森林模型的输入向量,并针对构建好的随机森林模型RF1~RFn+1进行训练,获得各子序列分量的预测值并进行反归一化处理,通过叠加所有反归一化处理后的数据得到最终预测结果;对比特征气体浓度的实际值,通过预测结果和实际值的误差分析来评估模型的预测性能,该方法解决了7种特征气体浓度之间的互相影响和预测精度低的问题,可以精确预测油中溶解气体浓度的变化趋势,为后续的变压器预防性检修提供重要依据。
附图说明
图1为本发明基于EMD-RF的变压器油中溶解气体浓度预测方法的预测流程图;
图2为本发明实施例中H2的经验模态分解图;
图3为本发明实施例中H2的预测结果对比图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于EMD-RF的变压器油中溶解气体浓度预测方法,包括如下步骤:
S01、选取变压器油中溶解的气体,包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)的原始浓度作为特征向量;
S02、针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;
S03、对步骤S02中分解好的各子序列分别进行归一化处理;
S04、构建随机森林模型RF1~RFn+1,将步骤S03中归一化处理后的数据作为随机森林模型的输入向量,对构建好的模型RF1~RFn+1进行训练,获得各子序列分量的预测值1~预测值n+1;
S05、对步骤S04中获得的各子序列分量的预测值1~预测值n+1进行反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果;
S06、将步骤S05中得到的最终预测结果与变压器油中溶解气体浓度的实际值进行对比,通过预测结果和实际值的误差分析来评估模型预测性能,评估标准采用平均相对百分比误差和最大相对百分比误差两个指标。
所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES,具体分解步骤如下:
S021、针对七种特征向量的原始浓度序列y(t),确定每种特征向量的所有局部极大值点和极小值点;
S022、采用三次样条曲线函数拟合每种特征向量的全部极值点,构造出上包络线a(t)和下包络线b(t),每种特征向量的所有数据点信息均包含在上下包络线之间,从而计算出上下包络线的平均值,如式(1)所示:
Figure BDA0002497331380000061
S023、计算每种特征向量的原始浓度序列y(t)与其上下包络线平均值c(t)的差值,得到d(t),如式(2)所示:
d(t)=y(t)-c(t) (2)
d(t)不符合经验模态分解的IMF分量条件时,将其作为原始浓度序列,重复以上步骤,直至满足IMF分量条件,得到的d(t)就是原始浓度序列y(t)的IMF分量之一,记为l1(t)=d(t),代表原始浓度序列y(t)的最大频率IMF分量;
S024、从原始浓度序列y(t)分解得到第一个IMF分量l1(t)后,计算两者的差值,如式(3)所示:
r1(t)=y(t)-l1(t) (3)
式中:r1(t)是剩余分量序列,并将其作为原始序列,不断重复以上步骤,判断ri(t)(i=1,2,…,n)是否满足终止条件,当剩余分量rn(t)是单调函数或常量时,则结束经验模态分解过程;同时,原始浓度序列y(t)分解得到n个IMF分量和一个剩余分量rn(t),如式(4)所示:
Figure BDA0002497331380000062
剩余分量rn(t)是原始浓度序列y(t)的平均趋势,IMF分量从1到n频率由高到低,分别反映了各不相同的特征尺度信号分量。
所述步骤S03中对步骤S02中分解好的各子序列分别进行归一化处理,归一化公式如式(5)所示:
Figure BDA0002497331380000063
其中,y与y*分别表示归一化前后的数据;ymax与ymin分别表示某序列归一化前的最大值和最小值。
所述步骤S04中构建的随机森林模型由多棵回归树CART构成,回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示,即:{h(X,Ψk)|k=1,2,…,N},X表示输入向量矩阵,Ψk表示生成k棵子回归树,其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本,且具有相同的分布,随机森林模型的具体构建步骤如下:
S041、划分训练集数据样本为N,从中采用Bootstrap抽样方法抽取容量相同的样本,形成训练子集;
S042、步骤S041中的训练子集有M个特征,从中随机抽取m个作为分裂特征子集(m≤M),后续采用CART回归算法分裂而不剪枝;
S043、重复n次步骤S041~S042,生成相应数量的子回归树(Ψ1、Ψ2、…、Ψn)进行结果预测,构成随机森林回归预测模型RF1~RFn+1
S044、使用划分的测试集数据验证步骤S043构建的随机森林回归预测模型的可靠性,采用Forest-RI形式,设置训练集有M维,随机选择F(F≤M)个特征向量进行,按照经验公式(6)确定F值:
F=1+log2M (6)
其中,M为原始输入特征向量数为7;
S045、统计输出的预测值,并将所有子树输出的平均预测值反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果。
所述步骤S06中采用平均相对百分比误差和最大相对百分比误差两个指标作为评估标准,表达如式(7)和(8)所示:
Figure BDA0002497331380000071
Figure BDA0002497331380000072
式中,
Figure BDA0002497331380000073
和yt分别表示油中溶解气体含量的预测值和真实值;N表示评估过程中需要检验的数据个数;t表示数据序列编号。
实施例
在本发明中,对相关术语说明如下:
经验模态分解方法EMD
反向传播神经网络预测模型简称为:BPNN
基于经验模态分解的反向传播神经网络预测模型简称为:EMD-BPNN
支持向量机预测模型简称为:SVM
基于经验模态分解的支持向量机预测模型简称为:EMD-SVM
随机森林预测模型简称为:RF
基于经验模态分解的随机森林预测模型简称为:EMD-RF
在实际运行中,变压器油中溶解气体浓度受到油温、油压以及运行环境的影响,通过在线监测装置观察其趋势为非平稳波动。直接使用随机森林模型预测油中溶解气体浓度的变化过程具有一定的局限性,本实施例中考虑利用经验模态分解方法对其输入的变压器中溶解气体的非平稳序列进行分解,进一步提升随机森林模型的准确性。使用相同的样本数据集在不同方法下进行变压器油中溶解气体浓度预测,验证本发明提出的一种基于经验模态分解和随机森林模型的变压器油中溶解气体浓度预测方法的有效性。
以某110kV变压器油色谱在线监测装置2018年8月15日至2019年2月18日的油色谱数据为例,其中监测周期为1天,共188组数据。将2018年8月15日至2019年1月19日的158组作为训练数据集,将2019年1月20日至2019年2月18日的30组作为测试数据集。在本发明中,所有溶解气体浓度的单位均为μL/L。
以油中溶解特征气体氢气(H2)浓度的预测为例。随机森林预测模型的两大关键参数取值分别是:子树棵树(trees)取默认值为500,分裂特征数(m_features)根据经验公式取值为4。利用随机森林预测模型进行训练,可得到经验模态分解的H2子序列预测模型,进一步叠加H2子序列分量的预测结果,便可得到未来一天的H2浓度预测值,研究的测试结果如表1所示,预测结果对比如图2所示。
表1基于EMD-RF预测H2浓度的结果
Figure BDA0002497331380000081
Figure BDA0002497331380000091
表1进一步计算预测模型性能的评估指标,从而得到平均相对百分误差和最大相对百分误差。预测结果表明,EMD-RF预测模型的平均相对百分比误差e为1.43%,最大相对百分比误差emax为3.95%。上述结果表明,针对油中溶解特征气体H2的浓度预测,EMD-RF预测模型具有优异且稳定的性能,此外,EMD-RF模型具有调参少、容错性好、不易过拟合等优点。
在变压器油中溶解特征气体预测领域,将EMD-RF预测模型分别与BPNN模型和SVM模型进行比较研究,以对比验证EMD-RF预测模型的有效性。BPNN模型的神经元取值10,激活函数采用“relu”函数,学习率为0.01,训练次数为200次。SVM模型的核函数选择径向基核函数(RBF),惩罚因子为1.0。以H2浓度的预测为例,各预测模型的性能对比如表2所示。
表2不同模型下H2预测结果
模型 平均相对百分误差e 最大相对百分误差e<sub>max</sub>
EMD-RF 1.43 3.95
EMD-BPNN 2.12 4.82
EMD-SVM 2.49 5.26
RF 2.68 5.74
BPNN 3.22 7.41
SVM 3.67 8.23
从表2可知,对比BPNN模型和SVM模型,RF预测模型的平均相对百分误差e分别降低了0.54%和0.99%,最大相对百分误差emax分别降低了1.67%和2.49%,由此可知在样本数据集下预测油中溶解气体时,RF预测模型具备一定优势。与此同时,经过经验模态分解的EMD-RF、EMD-BPNN和EMD-SVM模型相较不经过经验模态分解的各自模型,平均相对百分误差e分别降低了1.25%、1.10%和1.18%,最大相对百分误差emax分别降低了1.79%、2.59%和2.97%,由此说明经验模态分解方法能够有效的将变压器油中溶解的7种特征气体序列分解为相对平稳的子序列,以便结合回归模型预测油中溶解气体的变化趋势。总而言之,在相同数据集基础上,与常用的BPNN、SVM以及加入经验模态分解的EMD-BPNN、EMD-SVM模型相较而言,无论是从平均相对误差方面,还是最大相对误差方面,EMD-RF回归模型预测特征气体H2浓度的性能都是最优的。
如前所述均是以H2的溶解浓度预测为例,验证了所提EMD-RF预测模型的有效性。同理,在相同的数据集和模型的基础上,对其他6种特征气体浓度变化趋势进行预测,结果如下表3所示。
表3其他气体浓度预测结果
Figure BDA0002497331380000101
由表3可知,在相同的数据集基础上预测其余6种特征气体浓度时,采用EMD-RF模型预测油中溶解气体浓度的平均相对误差和最大相对误差均低于对比研究的5种模型(EMD-BPNN、EMD-SVM、RF、BPNN和SVM),具有较高的预测稳定性和可靠性,可以对变压器油中溶解气体浓度发展趋势进行精准预测,可对变压器的预防性检修提供重要依据。
本发明提出的一种EMD-RF的变压器油中溶解气体浓度预测方法,解决了7种油中溶解特征气体的互相影响导致预测精度低的问题,使用该方法模型调整参数简单,训练效率快,可以对变压器油中溶解气体浓度发展趋势进行精准预测,可对变压器的预防性检修提供重要依据。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,包括如下步骤:
S01、选取变压器油中溶解的气体,包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、一氧化碳(CO)、二氧化碳(CO2)的原始浓度作为特征向量;
S02、针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES;
S03、对步骤S02中分解好的各子序列分别进行归一化处理;
S04、构建随机森林模型RF1~RFn+1,将步骤S03中归一化处理后的数据作为随机森林模型的输入向量,对构建好的模型RF1~RFn+1进行训练,获得各子序列分量的预测值1~预测值n+1;
S05、对步骤S04中获得的各子序列分量的预测值1~预测值n+1进行反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果;
S06、将步骤S05中得到的最终预测结果与变压器油中溶解气体浓度的实际值进行对比,通过预测结果和实际值的误差分析来评估模型预测性能,评估标准采用平均相对百分比误差和最大相对百分比误差两个指标。
2.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF1~IMFn以及剩余分量RES,具体分解步骤如下:
S021、针对七种特征向量的原始浓度序列y(t),确定每种特征向量的所有局部极大值点和极小值点;
S022、采用三次样条曲线函数拟合每种特征向量的全部极值点,构造出上包络线a(t)和下包络线b(t),每种特征向量的所有数据点信息均包含在上下包络线之间,从而计算出上下包络线的平均值,如式(1)所示:
Figure FDA0002497331370000011
S023、计算每种特征向量的原始浓度序列y(t)与其上下包络线平均值c(t)的差值,得到d(t),如式(2)所示:
d(t)=y(t)-c(t) (2)
d(t)不符合经验模态分解的IMF分量条件时,将其作为原始浓度序列,重复以上步骤,直至满足IMF分量条件,得到的d(t)就是原始浓度序列y(t)的IMF分量之一,记为l1(t)=d(t),代表原始浓度序列y(t)的最大频率IMF分量;
S024、从原始浓度序列y(t)分解得到第一个IMF分量l1(t)后,计算两者的差值,如式(3)所示:
r1(t)=y(t)-l1(t) (3)
式中:r1(t)是剩余分量序列,并将其作为原始序列,不断重复以上步骤,判断ri(t)(i=1,2,…,n)是否满足终止条件,当剩余分量rn(t)是单调函数或常量时,则结束经验模态分解过程;同时,原始浓度序列y(t)分解得到n个IMF分量和一个剩余分量rn(t),如式(4)所示:
Figure FDA0002497331370000021
剩余分量rn(t)是原始浓度序列y(t)的平均趋势,IMF分量从1到n频率由高到低,分别反映了各不相同的特征尺度信号分量。
3.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,所述步骤S03中对步骤S02中分解好的各子序列分别进行归一化处理,归一化公式如式(5)所示:
Figure FDA0002497331370000022
其中,y与y*分别表示归一化前后的数据;ymax与ymin分别表示某序列归一化前的最大值和最小值。
4.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,所述步骤S04中构建的随机森林模型由多棵回归树CART构成,回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示,即:{h(X,Ψk)|k=1,2,…,N},X表示输入向量矩阵,Ψk表示生成k棵子回归树,其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本,且具有相同的分布,随机森林模型的具体构建步骤如下:
S041、划分训练集数据样本为N,从中采用Bootstrap抽样方法抽取容量相同的样本,形成训练子集;
S042、步骤S041中的训练子集有M个特征,从中随机抽取m个作为分裂特征子集(m≤M),后续采用CART回归算法分裂而不剪枝;
S043、重复n次步骤S041~S042,生成相应数量的子回归树(Ψ1、Ψ2、…、Ψn)进行结果预测,构成随机森林回归预测模型RF1~RFn+1
S044、使用划分的测试集数据验证步骤S043构建的随机森林回归预测模型的可靠性,采用Forest-RI形式,设置训练集有M维,随机选择F(F≤M)个特征向量进行,按照经验公式(6)确定F值:
F=1+log2M (6)
其中,M为原始输入特征向量数为7;
S045、统计输出的预测值,并将所有子树输出的平均预测值反归一化处理,叠加所有反归一化处理后的数据得到最终预测结果。
5.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法,其特征在于,所述步骤S06中采用平均相对百分比误差和最大相对百分比误差两个指标作为评估标准,表达如式(7)和(8)所示:
Figure FDA0002497331370000031
Figure FDA0002497331370000032
式中,
Figure FDA0002497331370000033
和yt分别表示油中溶解气体含量的预测值和真实值;N表示评估过程中需要检验的数据个数;t表示数据序列编号。
CN202010422179.5A 2020-05-19 2020-05-19 一种基于emd-rf的变压器油中溶解气体浓度预测方法 Pending CN111461263A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010422179.5A CN111461263A (zh) 2020-05-19 2020-05-19 一种基于emd-rf的变压器油中溶解气体浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010422179.5A CN111461263A (zh) 2020-05-19 2020-05-19 一种基于emd-rf的变压器油中溶解气体浓度预测方法

Publications (1)

Publication Number Publication Date
CN111461263A true CN111461263A (zh) 2020-07-28

Family

ID=71678722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010422179.5A Pending CN111461263A (zh) 2020-05-19 2020-05-19 一种基于emd-rf的变压器油中溶解气体浓度预测方法

Country Status (1)

Country Link
CN (1) CN111461263A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985707A (zh) * 2020-08-17 2020-11-24 云南电力技术有限责任公司 一种绝缘油中气体浓度的预测方法及装置
CN114184695A (zh) * 2021-11-09 2022-03-15 国网内蒙古东部电力有限公司电力科学研究院 基于参数优化的随机森林油中气体浓度预测方法及系统
CN116702063A (zh) * 2023-05-06 2023-09-05 中国长江电力股份有限公司 一种基于EMD-gcForest模型的变压器油中溶解气体浓度预测方法
CN117408299A (zh) * 2023-09-08 2024-01-16 国网湖北省电力有限公司宜昌供电公司 一种基于深度学习的变压器油中溶解气体浓度预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537444A (zh) * 2015-01-13 2015-04-22 安徽理工大学 一种基于emd和elm的瓦斯突出预测方法
US20190311262A1 (en) * 2018-04-05 2019-10-10 Toyota Jidosha Kabushiki Kaisha Machine learning device, machine learning method, electronic control unit and method of production of same, learned model, and machine learning system
CN110428113A (zh) * 2019-08-09 2019-11-08 云南电网有限责任公司电力科学研究院 一种基于随机森林的变压器油中溶解气体浓度预测方法
CN110766222A (zh) * 2019-10-22 2020-02-07 太原科技大学 基于粒子群参数优化和随机森林的pm2.5浓度预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537444A (zh) * 2015-01-13 2015-04-22 安徽理工大学 一种基于emd和elm的瓦斯突出预测方法
US20190311262A1 (en) * 2018-04-05 2019-10-10 Toyota Jidosha Kabushiki Kaisha Machine learning device, machine learning method, electronic control unit and method of production of same, learned model, and machine learning system
CN110428113A (zh) * 2019-08-09 2019-11-08 云南电网有限责任公司电力科学研究院 一种基于随机森林的变压器油中溶解气体浓度预测方法
CN110766222A (zh) * 2019-10-22 2020-02-07 太原科技大学 基于粒子群参数优化和随机森林的pm2.5浓度预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘云鹏等: "基于经验模态分解和长短期记忆神经网络的变压器油中溶解气体浓度预测方法", 《中国电机工程学报》 *
徐肖伟等: "基于随机森林的变压器油中溶解气体浓度预测", 《电子测量技术》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985707A (zh) * 2020-08-17 2020-11-24 云南电力技术有限责任公司 一种绝缘油中气体浓度的预测方法及装置
CN114184695A (zh) * 2021-11-09 2022-03-15 国网内蒙古东部电力有限公司电力科学研究院 基于参数优化的随机森林油中气体浓度预测方法及系统
CN116702063A (zh) * 2023-05-06 2023-09-05 中国长江电力股份有限公司 一种基于EMD-gcForest模型的变压器油中溶解气体浓度预测方法
CN117408299A (zh) * 2023-09-08 2024-01-16 国网湖北省电力有限公司宜昌供电公司 一种基于深度学习的变压器油中溶解气体浓度预测方法

Similar Documents

Publication Publication Date Title
CN111562358B (zh) 基于联合模型的变压器油中气体含量预测方法及系统
CN111461263A (zh) 一种基于emd-rf的变压器油中溶解气体浓度预测方法
Kock et al. Oracle inequalities for high dimensional vector autoregressions
CN108663582A (zh) 一种变压器的故障诊断方法及系统
US9135557B2 (en) Internal abnormality diagnosis method, internal abnormality diagnosis system, and decision tree generation method for internal abnormality diagnosis of oil-filled electric apparatus utilizing gas concentration in oil
CN111722046A (zh) 一种基于深度森林模型的变压器故障诊断方法
Amer The impact of renewable energy consumption on the human development index in selected countries: panel analysis (1990–2015)
CN114548586B (zh) 一种基于混合模型的短期电力负荷预测方法及系统
CN112181706A (zh) 一种基于对数区间隔离的电力调度数据异常检测方法
CN116010884A (zh) 基于主成分分析的SSA-LightGBM油浸式变压器的故障诊断方法
Hill et al. The accuracy of extrapolation methods; an automatic Box–Jenkins package Sift
CN117473424A (zh) 基于随机森林的变压器故障诊断方法、系统、设备及介质
CN114239999B (zh) 基于交叉熵重要抽样的元件可靠性参数优化解析方法
CN113238908B (zh) 一种服务器性能测试数据分析方法及相关装置
Mahrukh et al. Prediction of power transformer oil chromatography based on LSTM and RF model
CN114019282A (zh) 基于主成分分析和随机森林相融合的变压器故障诊断方法
CN117454113A (zh) 一种基于CNN-BiLSTM及RF模型的电力变压器故障预警方法
CN117609818A (zh) 基于聚类与信息熵的电网关联关系发现方法
CN104834816A (zh) 一种短期风速预测方法
CN115730246A (zh) 一种变压器故障预警模型建立方法、预警方法及装置
CN116522138A (zh) 一种基于弱监督集成的多元时间序列异常检测方法及系统
CN115577873A (zh) 一种基于选择性集成学习的海上事故类型预测方法
Li et al. Decomposition of carbon emission driving factors and judgment of peak status in countries along the Belt and Road
CN113868304A (zh) 一种配电网冗余数据的确定方法及系统
CN114184695B (zh) 基于参数优化的随机森林油中气体浓度预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200728