CN111461263A

CN111461263A - 一种基于emd-rf的变压器油中溶解气体浓度预测方法

Info

Publication number: CN111461263A
Application number: CN202010422179.5A
Authority: CN
Inventors: 刘可真; 吴世浙; 李鹤健; 徐玥; 苟家萁; 和婧; 王骞; 刘通; 陈镭丹; 陈雪鸥; 阮俊枭
Original assignee: Kunming University of Science and Technology
Current assignee: Kunming University of Science and Technology
Priority date: 2020-05-19
Filing date: 2020-05-19
Publication date: 2020-07-28

Abstract

本发明公开了一种基于EMD‑RF的变压器油中溶解气体浓度预测方法，首先对变压器油中溶解的七种特征气体原始浓度序列进行经验模态分解并获得各子序列IMF₁~IMFn以及剩余分量RES；构建随机森林预测模型RF₁~RF_n+1，将分解好的子序列分别进行归一化处理后作为随机森林模型的输入向量，并针对构建好的随机森林模型RF₁~RF_n+1进行训练，获得各子序列分量的预测值并进行反归一化处理，通过叠加所有反归一化处理后的数据得到最终预测结果；对比特征气体浓度的实际值，通过预测结果和实际值的误差分析来评估模型的预测性能，该方法解决了7种特征气体浓度之间的互相影响和预测精度低的问题，可以精确预测油中溶解气体浓度的变化趋势，为后续的变压器预防性检修提供重要依据。

Description

一种基于EMD-RF的变压器油中溶解气体浓度预测方法

技术领域

本发明涉及电力设备监控技术领域，尤其涉及一种油浸式变压器油中溶解气体浓度的预测方法。

背景技术

随着能源互联互通的发展，电力变压器作为电网安全运行的基础设备，一旦发生故障将危及整个电力系统的安全稳定运行。因此，快速准确地了解变压器的潜伏性故障，从而进行检修工作，可以为电力系统的正常运行提供重要保障。

油中溶解气体分析(dissolved gas analysis，DGA)可以及时确定变压器内部存在的潜伏性故障，通过变压器在线检测装置提取出油中溶解特征气体的含量，形成历史特征气体含量序列，对7种油中溶解特征气体的浓度预测其发展趋势，可以提前发现变压器运行过程中存在的故障隐患，为预防性检修提供重要依据。通过机器学习方法对变压器的气体浓度进行预测，常见的有反向传播神经网络(Back propagation neural network,BPNN)、支持向量机(Support Vector Machines,SVM)等。由于传统的机器学习方法调整参数复杂，训练时间长，对样本容量的需求高，导致模型的预测精度较低。

发明内容

本发明要解决的技术问题是提供一种基于经验模态分解和随机森林模型的变压器油中溶解气体浓度预测方法，解决了变压器油中溶解的7种特征气体的互相影响导致预测精度低的问题，使用该方法模型调整参数简单，训练效率快，可以对变压器油中溶解气体浓度发展趋势进行精准预测，可对变压器的预防性检修提供重要依据。

为解决上述技术问题，本发明提供了一种基于EMD-RF的变压器油中溶解气体浓度预测方法，其特征在于，包括如下步骤：

S01、选取变压器油中溶解的气体，包括氢气(H₂)、甲烷(CH₄)、乙烷(C₂H₆)、乙烯(C₂H₄)、乙炔(C₂H₂)、一氧化碳(CO)、二氧化碳(CO₂)的原始浓度作为特征向量；

S02、针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF₁～IMF_n以及剩余分量RES；

S03、对步骤S02中分解好的各子序列分别进行归一化处理；

S04、构建随机森林模型RF₁～RF_n+1，将步骤S03中归一化处理后的数据作为随机森林模型的输入向量，对构建好的模型RF₁～RF_n+1进行训练，获得各子序列分量的预测值1～预测值n+1；

S05、对步骤S04中获得的各子序列分量的预测值1～预测值n+1进行反归一化处理，叠加所有反归一化处理后的数据得到最终预测结果；

S06、将步骤S05中得到的最终预测结果与变压器油中溶解气体浓度的实际值进行对比，通过预测结果和实际值的误差分析来评估模型预测性能，评估标准采用平均相对百分比误差和最大相对百分比误差两个指标。

所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF₁～IMF_n以及剩余分量RES，具体分解步骤如下：

S021、针对七种特征向量的原始浓度序列y(t)，确定每种特征向量的所有局部极大值点和极小值点；

S022、采用三次样条曲线函数拟合每种特征向量的全部极值点，构造出上包络线a(t)和下包络线b(t)，每种特征向量的所有数据点信息均包含在上下包络线之间，从而计算出上下包络线的平均值，如式(1)所示：

S023、计算每种特征向量的原始浓度序列y(t)与其上下包络线平均值c(t)的差值，得到d(t)，如式(2)所示：

d(t)＝y(t)-c(t) (2)

d(t)不符合经验模态分解的IMF分量条件时，将其作为原始浓度序列，重复以上步骤，直至满足IMF分量条件，得到的d(t)就是原始浓度序列y(t)的IMF分量之一，记为l₁(t)＝d(t)，代表原始浓度序列y(t)的最大频率IMF分量；

S024、从原始浓度序列y(t)分解得到第一个IMF分量l₁(t)后，计算两者的差值，如式(3)所示：

r₁(t)＝y(t)-l₁(t) (3)

式中：r₁(t)是剩余分量序列，并将其作为原始序列，不断重复以上步骤，判断r_i(t)(i＝1，2，…，n)是否满足终止条件，当剩余分量r_n(t)是单调函数或常量时，则结束经验模态分解过程；同时，原始浓度序列y(t)分解得到n个IMF分量和一个剩余分量r_n(t)，如式(4)所示：

剩余分量r_n(t)是原始浓度序列y(t)的平均趋势，IMF分量从1到n频率由高到低，分别反映了各不相同的特征尺度信号分量。

所述步骤S03中对步骤S02中分解好的各子序列分别进行归一化处理，归一化公式如式(5)所示：

其中，y与y^*分别表示归一化前后的数据；y_max与y_min分别表示某序列归一化前的最大值和最小值。

所述步骤S04中构建的随机森林模型由多棵回归树CART构成，回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示，即：{h(X,Ψ_k)|k＝1,2,…,N}，X表示输入向量矩阵，Ψ_k表示生成k棵子回归树，其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本，且具有相同的分布，随机森林模型的具体构建步骤如下：

S041、划分训练集数据样本为N，从中采用Bootstrap抽样方法抽取容量相同的样本，形成训练子集；

S042、步骤S041中的训练子集有M个特征，从中随机抽取m个作为分裂特征子集(m≤M)，后续采用CART回归算法分裂而不剪枝；

S043、重复n次步骤S041～S042,生成相应数量的子回归树(Ψ₁、Ψ₂、…、Ψ_n)进行结果预测，构成随机森林回归预测模型RF₁～RF_n+1；

S044、使用划分的测试集数据验证步骤S043构建的随机森林回归预测模型的可靠性，采用Forest-RI形式，设置训练集有M维，随机选择F(F≤M)个特征向量进行，按照经验公式(6)确定F值：

F＝1+log₂M (6)

其中，M为原始输入特征向量数为7；

S045、统计输出的预测值，并将所有子树输出的平均预测值反归一化处理，叠加所有反归一化处理后的数据得到最终预测结果。

所述步骤S06中采用平均相对百分比误差和最大相对百分比误差两个指标作为评估标准，表达如式(7)和(8)所示：

式中，

和y_t分别表示油中溶解气体含量的预测值和真实值；N表示评估过程中需要检验的数据个数；t表示数据序列编号。

本发明提供的预测方法与现有技术相比具备如下特点：本发明首先对变压器油中溶解的七种特征气体原始浓度序列进行经验模态分解并获得各子序列IMF₁～IMFn以及剩余分量RES；构建随机森林预测模型RF₁～RF_n+1，将分解好的子序列分别进行归一化处理后作为随机森林模型的输入向量，并针对构建好的随机森林模型RF₁～RF_n+1进行训练，获得各子序列分量的预测值并进行反归一化处理，通过叠加所有反归一化处理后的数据得到最终预测结果；对比特征气体浓度的实际值，通过预测结果和实际值的误差分析来评估模型的预测性能，该方法解决了7种特征气体浓度之间的互相影响和预测精度低的问题，可以精确预测油中溶解气体浓度的变化趋势，为后续的变压器预防性检修提供重要依据。

附图说明

图1为本发明基于EMD-RF的变压器油中溶解气体浓度预测方法的预测流程图；

图2为本发明实施例中H₂的经验模态分解图；

图3为本发明实施例中H₂的预测结果对比图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例；基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供了一种基于EMD-RF的变压器油中溶解气体浓度预测方法，包括如下步骤：

S03、对步骤S02中分解好的各子序列分别进行归一化处理；

d(t)＝y(t)-c(t) (2)

r₁(t)＝y(t)-l₁(t) (3)

F＝1+log₂M (6)

其中，M为原始输入特征向量数为7；

式中，

实施例

在本发明中，对相关术语说明如下：

经验模态分解方法EMD

反向传播神经网络预测模型简称为：BPNN

基于经验模态分解的反向传播神经网络预测模型简称为：EMD-BPNN

支持向量机预测模型简称为：SVM

基于经验模态分解的支持向量机预测模型简称为：EMD-SVM

随机森林预测模型简称为：RF

基于经验模态分解的随机森林预测模型简称为：EMD-RF

在实际运行中，变压器油中溶解气体浓度受到油温、油压以及运行环境的影响，通过在线监测装置观察其趋势为非平稳波动。直接使用随机森林模型预测油中溶解气体浓度的变化过程具有一定的局限性，本实施例中考虑利用经验模态分解方法对其输入的变压器中溶解气体的非平稳序列进行分解，进一步提升随机森林模型的准确性。使用相同的样本数据集在不同方法下进行变压器油中溶解气体浓度预测，验证本发明提出的一种基于经验模态分解和随机森林模型的变压器油中溶解气体浓度预测方法的有效性。

以某110kV变压器油色谱在线监测装置2018年8月15日至2019年2月18日的油色谱数据为例，其中监测周期为1天，共188组数据。将2018年8月15日至2019年1月19日的158组作为训练数据集，将2019年1月20日至2019年2月18日的30组作为测试数据集。在本发明中，所有溶解气体浓度的单位均为μL/L。

以油中溶解特征气体氢气(H₂)浓度的预测为例。随机森林预测模型的两大关键参数取值分别是：子树棵树(trees)取默认值为500，分裂特征数(m_features)根据经验公式取值为4。利用随机森林预测模型进行训练，可得到经验模态分解的H₂子序列预测模型，进一步叠加H₂子序列分量的预测结果，便可得到未来一天的H₂浓度预测值，研究的测试结果如表1所示，预测结果对比如图2所示。

表1基于EMD-RF预测H₂浓度的结果

表1进一步计算预测模型性能的评估指标，从而得到平均相对百分误差和最大相对百分误差。预测结果表明，EMD-RF预测模型的平均相对百分比误差e为1.43％，最大相对百分比误差e_max为3.95％。上述结果表明，针对油中溶解特征气体H₂的浓度预测，EMD-RF预测模型具有优异且稳定的性能，此外，EMD-RF模型具有调参少、容错性好、不易过拟合等优点。

在变压器油中溶解特征气体预测领域，将EMD-RF预测模型分别与BPNN模型和SVM模型进行比较研究，以对比验证EMD-RF预测模型的有效性。BPNN模型的神经元取值10，激活函数采用“relu”函数，学习率为0.01，训练次数为200次。SVM模型的核函数选择径向基核函数(RBF)，惩罚因子为1.0。以H₂浓度的预测为例，各预测模型的性能对比如表2所示。

表2不同模型下H₂预测结果

模型	平均相对百分误差e	最大相对百分误差e<sub>max</sub>
			EMD-RF	1.43	3.95
EMD-BPNN	2.12	4.82
			EMD-SVM	2.49	5.26
RF	2.68	5.74
			BPNN	3.22	7.41
SVM	3.67	8.23

从表2可知，对比BPNN模型和SVM模型，RF预测模型的平均相对百分误差e分别降低了0.54％和0.99％，最大相对百分误差e_max分别降低了1.67％和2.49％，由此可知在样本数据集下预测油中溶解气体时，RF预测模型具备一定优势。与此同时，经过经验模态分解的EMD-RF、EMD-BPNN和EMD-SVM模型相较不经过经验模态分解的各自模型，平均相对百分误差e分别降低了1.25％、1.10％和1.18％，最大相对百分误差e_max分别降低了1.79％、2.59％和2.97％，由此说明经验模态分解方法能够有效的将变压器油中溶解的7种特征气体序列分解为相对平稳的子序列，以便结合回归模型预测油中溶解气体的变化趋势。总而言之，在相同数据集基础上，与常用的BPNN、SVM以及加入经验模态分解的EMD-BPNN、EMD-SVM模型相较而言，无论是从平均相对误差方面，还是最大相对误差方面，EMD-RF回归模型预测特征气体H₂浓度的性能都是最优的。

如前所述均是以H₂的溶解浓度预测为例，验证了所提EMD-RF预测模型的有效性。同理，在相同的数据集和模型的基础上，对其他6种特征气体浓度变化趋势进行预测，结果如下表3所示。

表3其他气体浓度预测结果

由表3可知，在相同的数据集基础上预测其余6种特征气体浓度时，采用EMD-RF模型预测油中溶解气体浓度的平均相对误差和最大相对误差均低于对比研究的5种模型(EMD-BPNN、EMD-SVM、RF、BPNN和SVM)，具有较高的预测稳定性和可靠性，可以对变压器油中溶解气体浓度发展趋势进行精准预测，可对变压器的预防性检修提供重要依据。

本发明提出的一种EMD-RF的变压器油中溶解气体浓度预测方法，解决了7种油中溶解特征气体的互相影响导致预测精度低的问题，使用该方法模型调整参数简单，训练效率快，可以对变压器油中溶解气体浓度发展趋势进行精准预测，可对变压器的预防性检修提供重要依据。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于EMD-RF的变压器油中溶解气体浓度预测方法，其特征在于，包括如下步骤：

S03、对步骤S02中分解好的各子序列分别进行归一化处理；

2.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法，其特征在于，所述步骤S02中针对步骤S01中选取的七种特征向量进行经验模态分解并获得各子序列IMF₁～IMF_n以及剩余分量RES，具体分解步骤如下：

d(t)＝y(t)-c(t) (2)

r₁(t)＝y(t)-l₁(t) (3)

3.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法，其特征在于，所述步骤S03中对步骤S02中分解好的各子序列分别进行归一化处理，归一化公式如式(5)所示：

4.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法，其特征在于，所述步骤S04中构建的随机森林模型由多棵回归树CART构成，回归树对应输入空间的划分以及在划分单元上的输出值采用集合来表示，即：{h(X,Ψ_k)|k＝1,2,…,N}，X表示输入向量矩阵，Ψ_k表示生成k棵子回归树，其集合中生长的子回归树都是基于Bootstrap方法抽取的独立样本，且具有相同的分布，随机森林模型的具体构建步骤如下：

F＝1+log₂M (6)

其中，M为原始输入特征向量数为7；

5.根据权利要求1所述的基于EMD-RF的变压器油中溶解气体浓度预测方法，其特征在于，所述步骤S06中采用平均相对百分比误差和最大相对百分比误差两个指标作为评估标准，表达如式(7)和(8)所示：

式中，