CN114358213B

CN114358213B - 非线性时序数据预测的误差消融处理方法及系统与介质

Info

Publication number: CN114358213B
Application number: CN202210217929.4A
Authority: CN
Inventors: 金敏; 张寒雪
Original assignee: Hunan University
Current assignee: Hunan University
Priority date: 2022-03-08
Filing date: 2022-03-08
Publication date: 2022-06-10
Anticipated expiration: 2042-03-08
Also published as: CN114358213A

Abstract

本发明一种非线性时序数据预测的误差消融处理方法及系统与介质，包括：获取非线性时序参数的历史数据及多元溯源型相关数据并进行规范化预处理；提取多元溯源型相关数据的特征值构成数据集；对数据集多重采样获得多个样本集；获取多个预设的不同算法分别训练多个样本集，得到多个算法模型；通过多算法模型构建融合矩阵；采用GRU和Transformer竞争算法对每个融合矩阵进行动态学习，评估性能较优的算法作为误差消融算法；结果预测。本发明还提供对应预测系统与存储介质。本发明的方法能有效降低支持向量算法或决策树算法等机器学习算法可能出现的过拟合，增强泛化能力，学习到每个算法的优点，降低预测误差，提高结果的预测精度。

Description

非线性时序数据预测的误差消融处理方法及系统与介质

技术领域

本发明涉及非线性时序数据的处理领域，特别涉及一种非线性时序数据预测的误差消融处理方法及系统与介质。

背景技术

非线性时序数据预测在工业、交通等领域对于智能电网的管理规划、电网经济调度运行、交通运输规划与管理具有重要意义。随着我国电力系统建设的不断完善和推进，非线性时序电力负荷数据的准确预测能保证智能电网稳定运行、能源优化配置的重要工作。非线性时序交通流量数据的准确预测能够对城市交通协调与控制起着关键作用。电力负荷变化与交通流量变化都表现为强非线性时序数据的非线性和随机干扰特性。

LSSVM（Least Squares Support Vector Machine，最小二乘支持向量机）是标准SVM（Support Vector Machine，支持向量机）的一种扩展，能克服神经网络结构难以确定和标准SVM的缺点，降低计算复杂度，加快求解速度，在负荷增长时预测效果依然较好，但LSSVM对异常值的鲁棒性不够好，且训练参数需要通过寻优的方法获得，增加了训练时间和难度。集成学习预测方法主要有随机森林（RF，Random Forest）、GBRT(Gradient BoostingRegression Trees，梯度提升回归树)，这两种算法本质是树型算法，克服了LSSVM的缺点，对异常值的鲁棒性好，训练所需参数少，预测精度较高，但GBRT算法在迭代过程中可能出现过拟合问题。用RF算法去学习一个回归模型，将模型的预测输出初始化GBRT（即iGBRT），可以有效避免过拟合问题，且训练效率更高，预测性能相比RF和GBRT有所提升，但树型算法在负荷增长较大时预测精度不高。

针对上述LSSVM和iGBRT算法的优缺点以及在训练时可能出现过拟合，泛化能力受限，在模型预测时，支持向量算法或决策树算法在相同的时间点上预测效果不一样，对于非线性时序数据的预测精度仍有提升空间等问题。

专利文献CN105761488A公开一基于融合的实时极限学习机短时交通流预测方法，主要种基于短时交通流实时性、准确性、可靠性三大特征和融合的实时极限学习机来预测短时交通流。基于简化的单隐层前馈神经网络结构，能够在交通流峰值期快速的训练历史数据并能增量地更新到达的数据，在保证一定预测精度的同时节省学习时间。

专利文献CN112801388A公开一种基于非线性时间序列算法的电力负荷预测方法及系统，采用的是非线性时间序列算法对未来时间段的每日用电负荷进行预测，其主要基于BPNN（Back Propagation Neural Network，反向传播神经网络）回归模型的自动化寻优方法，减少人工调参工作量，有效降低模型构建难度，进一步提高模型构建效率和预测精度。

专利文献CN108011367A公开一种基于深度决策树算法的电力负荷特性挖掘方法，该方法通过采用深度决策树算法来对电力负荷特性进行深度的挖掘，以提高预测效率和精度。

但以上算法的预测精度都有进一步提升的空间。

发明内容

本发明要解决的技术问题是：提供一种非线性时序数据预测的误差消融处理方法及系统与介质，其目的在于有效降低数据处理过程中采用支持向量算法或决策树算法等机器学习算法可能出现的过拟合问题，增强泛化能力，学习每个算法的优点，进而提高非线性时序参数的预测精度。

为了解决上述技术问题，本发明采用以下技术方案：首先，提供一种非线性时序数据预测的误差消融处理方法，具体包括如下步骤：

S1、获取非线性时序性参数的历史数据及多元溯源型相关数据，并对获取的数据进行规范化预处理；

S2、提取多元溯源型相关数据的特征值，并将提取的特征值与某一时刻前一段时间的各个时刻的该参数历史数据作为全部特征值，与该时刻的该参数实际值一起构成数据集；

S3、对数据集多重采样获得多个样本集；

S4、获取多个预设的不同算法分别训练步骤S3获得的多个样本集，得到多个算法模型，所述算法模型的数量为样本集数量与预设的算法的种类数量的乘积；

S5、利用每种算法模型分别对待预测时刻前某一时刻的该参数值进行预测，将该参数预测值作为特征值，与该时刻的该参数实际值构成融合矩阵，得到多个融合矩阵，融合矩阵的数量与步骤S4中采用的预设算法的种类数量一致；

S6、采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果，评估性能较优的算法作为误差消融算法；

S7、利用步骤S6所得误差消融算法对待预测时刻的该参数值进行预测。

进一步地，步骤S1中的规范化预处理具体包括：缺失值处理，即对缺失的数据进行线性插值补充；以及异常点检测，即对异常数据进行平滑处理。

进一步地，多元溯源型相关数据包括气象及天文数据、节假日数据、日期数据、时间数据等。

例如用于电力技术领域，用于电力负荷预测，电力负荷的多元溯源型相关数据中的气象数据一般包括每日最高温度、最低温度、平均温度、平均水气压、最高本站气压、最低本站气压、平均本站气压、日最低本站气压、日最高本站气压、最小相对湿度、平均相对湿度；日期数据包括节假日数量、时间区间。还可能包括经济数据，如国内生产总值GDP、人口数量、物价指数PI、通货膨胀率。

进一步地，步骤S2中采用互信息提取多元溯源型相关数据的特征值，互信息标准中，两个随机变量X和Y的统计依存关系用如下式（1）来度量：

（1）

其中I(X;Y)代表变量X和Y的互信息其中 p(x _i ,y _i ) 是 X 和 Y 的联合概率分布函数， p(x _i )、p(y _i )分别是 X 、Y 的边缘概率分布函数；一般互信息越大，表示两变量之间的相关性越大。

得到互信息后，根据预设的互信息阈值，选择符合互信息阈值的N个特征值F_j,j=1,2,…,N，作为部分特征值；一般互信息阈值是在0-1之间，假设符合预设互信息阈值的特征值有N个；

对于第i时刻，其前M时刻的历史负荷Y_i-k，k=1,2,…,M；将F_j与Y_i-k作为全部特征值与负荷实际值Y_i构成数据集D，其中i=1,2,…,n； n代表总样本数，采用如下式（2）表示：

D = [F_i1,F_i2,…,F_iN,Y_i,i-M,Y_i,i-M+1…,Y_i,i-1,Y_i]，i=1,2,…,n (2)。

进一步地，步骤S3具体为：通过采样率

的Bootstrap算法对数据集D进行m次可重复采样，获得m个样本集；

进一步地，步骤S4中不同算法包括支持向量算法、决策树算法、K-Means、深度学习算法等其他机器学习算法。

优选地，支持向量算法包括SVR或LSSVM等；决策树算法包括GBDT（GradientBoosted Decision Trees）或iGBRT（Gradient Boosted Regression Tree）等；深度学习算法包括RNN、LSTM算法等。

进一步地，步骤S4具体为：分别利用支持向量算法训练m个样本集，得到m个模型L₁₁,L₁₂,…,L_1m；利用决策树算法训练m个样本集，得到m个模型G₁₁,G₁₂,…,G_1m；利用K-Means算法训练m个样本集，得到m个模型T₁₁,T₁₂,…,T_1m，最后得到3m个算法模型的总和Multi-model。

进一步地，步骤S5具体为：

利用Multi-mode中的算法的差异化对待预测时刻前K时刻的该参数值分别进行预测，将每种算法模型的参数预测值作为矩阵的特征值，与该时刻的参数实际值构成关于每种算法的融合矩阵，用如下式（3）表示：

(3)，

融合矩阵的数量与步骤S4中采用的预设算法的种类数量一致。

具体地，步骤S6中，GRU算法训练过程表示为：

其中：

、

分别表示重置门、更新，W表示权重，

表示上一个传输的状态，

为当前时刻的参数预测值与真实值的负荷误差，

为sigmoid函数可以将数据变换为0-1范围内的数值，tanh激活函数将参数误差放缩到-1~1的范围内，

包含当前输入的参数误差，

忘记

的维度信息并加入

的维度信息，

为预测值。

具体地，Transformer由编码器（Encoder）和解码器（Decoder）组成，其中Encoder包含多头注意力机制和前馈网络，Decoder包含遮蔽多头注意力机制、注意力机制和前馈网络。Transformer算法的训练过程为：编码器首先流入一个self-attention层，该层可以帮助获取当前参数数据及前后参数误差信息，该层输出作为前馈网络的输入，并在每层之间引入残差来稳定梯度。解码器在编码器的基础上在中间加入了一层获取编码器信息的attention层，可以让解码器更关注到编码器每一层输出的参数误差信息。

进一步地，步骤S7具体为：利用步骤S4得到的Multi-model对待预测时刻的该参数值进行预测，得到3m个预测值（步骤S4采用3种不同算法即得到3m个预测值，若采用两种算法则得到3m个预测值，预测值的数量与Multi-model所包含的算法模型一致，为样本集数量与预设的算法的种类数量的乘积），将3m个预测值作为误差消融算法的输入，得到待预测时刻的该参数预测值。

进一步地，所述非线性时序性数据包括交通、电力、经济等领域相关的非线性时序性数据。例如：电力负荷、交通流量等。

本发明还提供一种采用如上所述的非线性时序性数据预测的误差消融处理方法的非线性时序性数据预测系统，具体包括：

数据获取及预处理模块，用于获取非线性时序性参数的历史数据及多元溯源型相关数据，并对获取的数据进行规范化预处理；

特征值提取与数据集构建模块，包括特征值提取模块和数据集构建模块，其中：特征值提取模块用于提取多元溯源型相关数据中的特征值；数据集构建模块用于将提取的特征值与某一时刻前一段时间的该参数历史数据、及该时刻的实际参数值一起构成数据集；

多样本采集模块，用于对数据集多重采样获得多个样本集；

多算法模型构建模块，用于利用不同算法分别训练多个样本集得到多算法模型；

融合矩阵建立模块，用于利用多算法模型对待预测时刻前某一时刻的该参数进行预测，将参数预测值作为融合矩阵的特征值，与该参数实际值构成融合矩阵，得到多个融合矩阵；

误差消融算法分析模块，用于采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，利用融合矩阵进行误差消融分析，比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果，评估性能较优的算法作为误差消融算法；

负荷预测模块，用于获取误差消融算法对待预测时刻的该参数值进行预测。

本发明还提供一种计算机存储介质，其上存储有计算机程序，其中所述计算机程序被执行器执行时实现如上所述的非线性时序性数据预测的误差消融处理方法。本发明还提供一种电子设备，包括：

存储器，其上存储一个或多个程序；一个或多个处理器；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上所述的非线性时序性数据预测的误差消融处理方法。

本发明具有如下有益效果：

本发明提供一种非线性时序性数据预测的误差消融处理方法及系统，通过采样的多样性，利用支持向量算法或决策树算法或其他机器学习算法训练得到多个差异化较大的预测算法，利用多个预测算法预测每个待预测时刻最近一段时间的非线性时序性参数值，将预测到的每个待预测时刻最近一段时间的参数预测值与实际值构成融合矩阵，使用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，得到最终误差消融预测算法。该方法能够有效降低每个算法可能出现的过拟合现象，增强泛化能力，学习每个算法的优点，通过误差消融处理后得到的预测结果具有更高的预测精度。

与已有的方法相比，本发明提供的非线性时序性数据预测的误差消融处理方法具有以下优点：

（1）提出将支持向量算法或决策树算法或其他机器学习算法训练得到多个差异化较大的预测方法进行误差消融的概念，可以应用于电力、交通等领域非线性时序性数据的预测。

（2）本发明使用误差消融预测方法，将每个待预测时刻最近一段时间的参数预测值与实际值构成融合矩阵，使用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，能够有效降低可能出现的过拟合，增强泛化能力，学习每个算法的优点，提高预测精度。融合矩阵就是multi model的预测值和真实值构成的，通过训练他们之间的误差，然后预测到更准确的结果，也就是误差消融。

（3）本发明将GRU和Transformer竞争算法进行动态学习，具有广泛应用性，单模型算法包括但不限于已有的统计学算法、机器学习算法、深度学习算法、组合算法等。

经过实验验证，本发明的方法能够显著提升非线性时序性数据预测的精度，并且降低预测过程汇中单一向量算法或决策树算法或其他机器学习算法可能出现的过拟合现象。本发明提供的方法与单一支持向量算法或决策树算法或其他机器学习算法进行预测性能比较方法进行比较，能较显著地降低预测误差。

附图说明

图1为本发明实施例1提供的非线性时序性数据预测的误差消融处理方法的流程示意图；

图2为本发明实施例2提供的非线性时序性数据预测系统的结构示意图；

图3为实施例4日总负荷平均绝对百分比误差对比图；

图4为实施例4日峰值负荷平均绝对百分比误差对比图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围不受下面公开的具体实施例的限制。

实施例1

如图1所示，本实施例提供一种非线性时序性数据预测的误差消融处理方法，包括以下步骤：

所述非线性时序性数据包括交通、电力、经济等领域相关的非线性时序性数据。例如：电力负荷、交通流量等。多元溯源型相关数据包括气象及天文数据、节假日数据、日期数据、时间数据等。

规范化预处理具体包括：缺失值处理，即对缺失的数据进行线性插值补充；以及异常点检测，即对异常数据进行平滑处理。

用于短期电力负荷预测，气象数据的影响较大，一般提取气象数据的特征值。

具体地，一般采用互信息提取多元溯源型相关数据的特征值，互信息标准中，两个随机变量X和Y的统计依存关系用如下式（1）来度量：

（1）

其中I(X;Y)代表变量X和Y的互信息，其中 p(x _i ,y _i ) 是 X 和 Y 的联合概率分布函数， p(x _i )、p(y _i )分别是 X 、Y 的边缘概率分布函数；一般互信息越大，表示两变量之间的相关性越大。

D = [F_i1,F_i2,…,F_iN,Y_i,i-M,Y_i,i-M+1…,Y_i,i-1,Y_i]，i=1,2,…,n (2)。

S3、对数据集多重采样获得多个样本集；一般通过采样率

S4、获取多个预设的不同算法分别训练步骤S3获得的多个样本集，得到多个算法模型；

作为优选实施例，不同算法采用支持向量算法、决策树算法、K-Means、深度学习算法等其他机器学习算法。更优选地，支持向量算法采用SVR或LSSVM等；决策树算法采用GBDT（Gradient Boosted Decision Trees）或iGBRT（Gradient Boosted Regression Tree）等；深度学习算法包括RNN、LSTM算法等。

分别利用支持向量算法训练m个样本集，得到m个模型L₁₁,L₁₂,…,L_1m；利用决策树算法训练m个样本集，得到m个模型G₁₁,G₁₂,…,G_1m；利用K-Means算法训练m个样本集，得到m个模型T₁₁,T₁₂,…,T_1m，最后得到3m个算法模型的总和Multi-model；所述算法模型的数量为样本集数量与预设的算法的种类数量的乘积。

具体地，利用Multi-mode中的算法的差异化对待预测时刻前K时刻的该参数值分别进行预测，将每种算法模型的参数预测值作为矩阵的特征值，与该时刻的参数实际值构成关于每种算法的融合矩阵，用如下式（3）表示：

(3)。

S6、采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果，评估性能较优的算法作为误差消融算法；其中：

GRU算法训练过程表示为：

其中：

、

分别表示重置门、更新，W表示权重，

表示上一个传输的状态，

为当前时刻的参数预测值与真实值的负荷误差，

包含当前输入的参数误差，

忘记

的维度信息并加入

的维度信息，

为预测值。

S7、利用步骤S6所得误差消融算法对待预测时刻的该参数值进行预测。具体是利用步骤S4得到的Multi-model对待预测时刻的该参数值进行预测，得到3m个预测值（步骤S4采用3种不同算法即得到3m个预测值，若采用两种算法则得到2m个预测值，预测值的数量与Multi-model所包含的算法模型一致，为样本集数量与预设的算法的种类数量的乘积），将3m个预测值作为误差消融算法的输入，得到待预测时刻的该参数预测值。

实施例2

如图2所示，本实施例提供一种采用实施例1所述方法的非线性时序数据预测系统20，具体包括：

数据获取及预处理模块21，用于获取非线性时序性参数的历史数据及多元溯源型相关数据，并对获取的数据进行规范化预处理；规范化预处理具体包括：缺失值处理，即对缺失的数据进行线性插值补充；以及异常点检测，即对异常数据进行平滑处理。

特征值提取与数据集构建模块22，包括特征值提取模块221和数据集构建模块222，其中：特征值提取模块221用于提取多元溯源型相关数据中的特征值；数据集构建模块222用于将提取的特征值与某一时刻前一段时间的该参数历史数据、及该时刻的实际参数值一起构成数据集；

多样本采集模块23，用于对数据集多重采样获得多个样本集；

多算法模型构建模块24，用于利用不同算法分别训练多个样本集得到多算法模型；

融合矩阵建立模块25，用于利用多算法模型对待预测时刻前某一时刻的该参数进行预测，将参数预测值作为融合矩阵的特征值，与该参数实际值构成融合矩阵，得到多个融合矩阵；

误差消融算法分析模块26，用于采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，利用融合矩阵进行误差消融分析，比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果，评估性能较优的算法作为误差消融算法；

预测模块27，用于获取误差消融算法对待预测时刻的该参数值进行预测。

实施例3

本发明实施例3提供一种计算机存储介质，其上存储有计算机程序，其中所述计算机程序被执行器执行时实现如图1所示的方法。

所述计算机可读存储介质可包括但不限于，软盘、光盘、CD-ROM（只读光盘存储器）、磁光盘、ROM（只读存储器）、RAM（随机存取存储器）、EPROM（可擦除可编程只读存储器）、EEPROM（电可擦除可编程只读存储器）、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品，也可以是已接入计算机设备使用的部件。

实施例4：应用实施例

为了验证本发明提供的非线性时序数据预测的误差消融处理方法的有效性，本实施例以LSSVM和iGBRT为支持向量算法和决策树算法，将本方法应用于中国广东省广州市的电力负荷预测。数据包括2007年-2009年的日峰值电力数据和气象数据。根据实施例1公式(1)计算气象候选特征值和负荷之间的互信息，如表1所示。本实例选择取值为0.5作为互信息阈值，因此选择1-7号影响因素作为气象特征值。

表1变量与负荷之间的互信息值

针对电力负荷预测的性能评估方法有很多，其中平均绝对百分误差百分比（MAPE）是衡量预测准确性的统计指标，也是值使用最多的误差衡量方法，本实施例选择MAPE作为评估指标，采用如下式（4）表示：

(4)

式（4）中：N为预测时刻数，

为t时刻的实际负荷值，

为t时刻的预测负荷值， MAPE越小，表示预测精度越高。

为了验证本发明提供的方法在预测精度上优于支持向量算法和决策树算法，将 LSSVM和iGBRT作为支持向量算法和决策树算法的代表，与本实施例提供的多模型误差消融预测算法（即下表和图3、4中的EAFM）对每日总负荷和峰值负荷预测精度进行对比。训练时，数据集特征值包括7个气象特征值和待预测日前7天的负荷值，LSSVM中核函数参数和正规化参数C采用十字交叉验证和网格搜索进行参数的寻优，iGBRT中的RF算法树数目为M_RF= 500，GBRT算法树总数为M_GBRT=30，学习速率为

，基学习器为CART。本实施例方法选择

的采样率进行多次重复采样，得到m=15组训练数据集，取待预测日前k=30天的负荷预测值和实际值构成融合矩阵，进行算法融合。表2和图3显示了各算法日总负荷平均绝对百分比误差。从表2可知，本发明的EAFM方法在全年有10个月预测精度最高，有1个月是次高的，全年预测精度也是最高的，误差消融算法的全年平均误差与LSSVM和iGBRT相比较分别减小了0.64%和0.97%。1、2、5、10月份因为重大节假日的存在，预测精度受到一定影响，总体而言，EAFM方法相比支持向量算法或决策树算法预测精度有一定程度提升。

表2平均绝对百分误差统计（Monthly MAPE (%)）

为了进一步验证本实施例方法的有效性，对每日峰值负荷进行预测。表3和图4显示了模型日峰值负荷平均绝对百分比误差。从表3可知，本发明实施例的EAFM方法在全年有9个月预测精度最高，有2个月是次高的，整体而言，全年预测精度最高，EAFM模型的平均绝对百分比误差相较于LSSVM和iGBRT算法分别减小了0.48%和0.58%，进一步说明了本实施例方法的有效性。

表3日峰值负荷平均绝对百分误差统计（Monthly MAPE (%)）

综上表明：本发明提供的非线性时序数据预测的误差消融处理方法，通过采样的多样性，利用支持向量算法或决策树算法或其他机器学习算法训练得到多个差异化较大的预测算法，利用多个预测算法预测每个待预测时刻最近一段时间的非线性时序性参数值，将预测到的每个待预测时刻最近一段时间的参数预测值与实际值构成融合矩阵，使用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，得到最终误差消融预测算法。该方法能够有效降低每个算法可能出现的过拟合现象，增强泛化能力，学习每个算法的优点，通过误差消融处理后得到的预测结果具有更高的预测精度。能够有效地应用于电力、交通等领域的非线性时序数据的预测，例如电力负荷的预测、交通流量负荷的预测等，降低预测误差，提高预测结果的精度。

以上所述仅为本发明的部分较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种电力负荷预测的误差消融处理方法，其特征在于，具体包括如下步骤：

S1、获取电力负荷历史数据及电力负荷相关的多元溯源型气象数据，并对获取的数据进行规范化预处理；多元溯源型气象数据包括气象影响因素的气温、气压、风速方向、湿度、风速数据；

S2、提取多元溯源型气象数据的特征值，并将提取的特征值与某一时刻前一段时间的各个时刻的电力负荷历史数据作为全部特征值，与该时刻的电力负荷实际值一起构成数据集；

S3、对数据集多重采样获得多个样本集；

S5、利用每种算法模型分别对待预测时刻前某一时刻的电力负荷进行预测，将该电力负荷预测值作为特征值，与该时刻的电力负荷实际值构成融合矩阵，得到多个融合矩阵，融合矩阵的数量与步骤S4中采用的预设算法的种类数量一致；

S6、采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，比较GRU和Transformer算法在训练该电力负荷预测值与该电力负荷真实值误差的性能与结果，评估性能较优的算法作为误差消融算法；

S7、利用步骤S6所得误差消融算法对待预测时刻的电力负荷进行预测。

2.根据权利要求1所述的电力负荷预测的误差消融处理方法，其特征在于，

步骤S1中的规范化预处理具体包括：缺失值处理，即对缺失的数据进行线性插值补充；以及异常点检测，即对异常数据进行平滑处理。

3.根据权利要求1所述的电力负荷预测的误差消融处理方法，其特征在于，

步骤S2中采用互信息提取多元溯源型气象数据的特征值，

得到互信息后，根据预设的互信息阈值，选择符合互信息阈值的N个特征值F_j,j=1,2,…,N，作为部分特征值；对于第i时刻，其前M时刻的历史电力负荷Y_i-k，k=1,2,…,M；将F_j与Y_i-k作为全部特征值与电力负荷实际值Y_i构成数据集D，D = [F_i1,F_i2,…,F_iN,Y_i,i-M,Y_i,i-M+1…,Y_i,i-1,Y_i]，其中i=1,2,…,n；n代表总样本数。

4.根据权利要求3所述的电力负荷预测的误差消融处理方法，其特征在于，

步骤S3具体为：通过采样率

步骤S4中不同算法种类包括支持向量算法、决策树算法、K-Means算法、深度学习算法，步骤S4具体为：分别利用支持向量算法训练m个样本集，得到m个模型L₁₁,L₁₂,…,L_1m；利用决策树算法训练m个样本集，得到m个模型G₁₁,G₁₂,…,G_1m；利用K-Means算法训练m个样本集，得到m个模型T₁₁,T₁₂,…,T_1m，最后得到3m个算法模型的总和Multi-model。

5.根据权利要求4所述的电力负荷预测的误差消融处理方法，其特征在于，

支持向量算法包括SVR、LSSVM算法；决策树算法包括GBDT、iGBRT算法；深度学习算法包括RNN、LSTM算法。

6.根据权利要求5所述的电力负荷预测的误差消融处理方法，其特征在于，

步骤S5具体为：

利用Multi-mode中的算法的差异化对待预测时刻前K时刻的电力负荷值分别进行预测，将每种算法模型的电力负荷预测值作为矩阵的特征值，与该时刻的电力负荷实际值构成关于每种算法的融合矩阵：

。

7.根据权利要求6所述的电力负荷预测的误差消融处理方法，其特征在于，

步骤S7具体为：利用步骤S4得到的Multi-model对待预测时刻的电力负荷值进行预测，得到3m个预测值，将3m个预测值作为误差消融算法的输入，得到待预测时刻的电力负荷预测值。

8.一种电力负荷预测系统，其特征在于，采用权利要求1-7任一所述的电力负荷的误差消融处理方法，具体包括：

数据获取及预处理模块，用于获取电力负荷的历史数据及多元溯源型气象数据，并对获取的数据进行规范化预处理；多元溯源型气象数据包括气象影响因素的气温、气压、风速方向、湿度、风速数据；

特征值提取与数据集构建模块，包括特征值提取模块和数据集构建模块，其中：特征值提取模块用于提取多元溯源型气象数据中的特征值；数据集构建模块用于将提取的特征值与某一时刻前一段时间各个时刻的电力负荷历史数据、及各时刻的电力负荷实际值一起构成数据集；

多样本采集模块，用于对数据集多重采样获得多个样本集；

融合矩阵建立模块，用于利用多算法模型对待预测时刻前某一时刻的电力负荷进行预测，将该电力负荷预测值作为融合矩阵的特征值，与该时刻的电力负荷实际值构成融合矩阵，得到多个融合矩阵；

误差消融算法分析模块，用于采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习，利用融合矩阵进行误差消融分析，比较GRU和Transformer算法在训练该电力负荷预测值与该电力负荷真实值误差的性能与结果，评估性能较优的算法作为误差消融算法；

负荷预测模块，用于获取误差消融算法对待预测时刻的电力负荷进行预测。

9.一种计算机存储介质，其特征在于，其上存储有计算机程序，其中所述计算机程序被执行器执行时实现如权利要求1-7中任一所述的电力负荷预测的误差消融处理方法。