CN114358213B - 非线性时序数据预测的误差消融处理方法及系统与介质 - Google Patents

非线性时序数据预测的误差消融处理方法及系统与介质 Download PDF

Info

Publication number
CN114358213B
CN114358213B CN202210217929.4A CN202210217929A CN114358213B CN 114358213 B CN114358213 B CN 114358213B CN 202210217929 A CN202210217929 A CN 202210217929A CN 114358213 B CN114358213 B CN 114358213B
Authority
CN
China
Prior art keywords
algorithm
power load
error
data
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210217929.4A
Other languages
English (en)
Other versions
CN114358213A (zh
Inventor
金敏
张寒雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202210217929.4A priority Critical patent/CN114358213B/zh
Publication of CN114358213A publication Critical patent/CN114358213A/zh
Application granted granted Critical
Publication of CN114358213B publication Critical patent/CN114358213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明一种非线性时序数据预测的误差消融处理方法及系统与介质,包括:获取非线性时序参数的历史数据及多元溯源型相关数据并进行规范化预处理;提取多元溯源型相关数据的特征值构成数据集;对数据集多重采样获得多个样本集;获取多个预设的不同算法分别训练多个样本集,得到多个算法模型;通过多算法模型构建融合矩阵;采用GRU和Transformer竞争算法对每个融合矩阵进行动态学习,评估性能较优的算法作为误差消融算法;结果预测。本发明还提供对应预测系统与存储介质。本发明的方法能有效降低支持向量算法或决策树算法等机器学习算法可能出现的过拟合,增强泛化能力,学习到每个算法的优点,降低预测误差,提高结果的预测精度。

Description

非线性时序数据预测的误差消融处理方法及系统与介质
技术领域
本发明涉及非线性时序数据的处理领域,特别涉及一种非线性时序数据预测的误差消融处理方法及系统与介质。
背景技术
非线性时序数据预测在工业、交通等领域对于智能电网的管理规划、电网经济调度运行、交通运输规划与管理具有重要意义。随着我国电力系统建设的不断完善和推进,非线性时序电力负荷数据的准确预测能保证智能电网稳定运行、能源优化配置的重要工作。非线性时序交通流量数据的准确预测能够对城市交通协调与控制起着关键作用。电力负荷变化与交通流量变化都表现为强非线性时序数据的非线性和随机干扰特性。
LSSVM(Least Squares Support Vector Machine,最小二乘支持向量机)是标准SVM(Support Vector Machine,支持向量机)的一种扩展,能克服神经网络结构难以确定和标准SVM的缺点,降低计算复杂度,加快求解速度,在负荷增长时预测效果依然较好,但LSSVM对异常值的鲁棒性不够好,且训练参数需要通过寻优的方法获得,增加了训练时间和难度。集成学习预测方法主要有随机森林(RF,Random Forest) 、GBRT(Gradient BoostingRegression Trees,梯度提升回归树),这两种算法本质是树型算法,克服了LSSVM的缺点,对异常值的鲁棒性好,训练所需参数少,预测精度较高,但GBRT算法在迭代过程中可能出现过拟合问题。用RF算法去学习一个回归模型,将模型的预测输出初始化GBRT(即iGBRT),可以有效避免过拟合问题,且训练效率更高,预测性能相比RF和GBRT有所提升 ,但树型算法在负荷增长较大时预测精度不高。
针对上述LSSVM和iGBRT算法的优缺点以及在训练时可能出现过拟合,泛化能力受限,在模型预测时,支持向量算法或决策树算法在相同的时间点上预测效果不一样,对于非线性时序数据的预测精度仍有提升空间等问题。
专利文献CN105761488A公开一基于融合的实时极限学习机短时交通流预测方法,主要种基于短时交通流实时性、准确性、可靠性三大特征和融合的实时极限学习机来预测短时交通流。基于简化的单隐层前馈神经网络结构,能够在交通流峰值期快速的训练历史数据并能增量地更新到达的数据,在保证一定预测精度的同时节省学习时间。
专利文献CN112801388A公开一种基于非线性时间序列算法的电力负荷预测方法及系统,采用的是非线性时间序列算法对未来时间段的每日用电负荷进行预测,其主要基于BPNN(Back Propagation Neural Network,反向传播神经网络)回归模型的自动化寻优方法,减少人工调参工作量,有效降低模型构建难度,进一步提高模型构建效率和预测精度。
专利文献CN108011367A公开一种基于深度决策树算法的电力负荷特性挖掘方法,该方法通过采用深度决策树算法来对电力负荷特性进行深度的挖掘,以提高预测效率和精度。
但以上算法的预测精度都有进一步提升的空间。
发明内容
本发明要解决的技术问题是:提供一种非线性时序数据预测的误差消融处理方法及系统与介质,其目的在于有效降低数据处理过程中采用支持向量算法或决策树算法等机器学习算法可能出现的过拟合问题,增强泛化能力,学习每个算法的优点,进而提高非线性时序参数的预测精度。
为了解决上述技术问题,本发明采用以下技术方案:首先,提供一种非线性时序数据预测的误差消融处理方法,具体包括如下步骤:
S1、获取非线性时序性参数的历史数据及多元溯源型相关数据,并对获取的数据进行规范化预处理;
S2、提取多元溯源型相关数据的特征值,并将提取的特征值与某一时刻前一段时间的各个时刻的该参数历史数据作为全部特征值,与该时刻的该参数实际值一起构成数据集;
S3、对数据集多重采样获得多个样本集;
S4、获取多个预设的不同算法分别训练步骤S3获得的多个样本集,得到多个算法模型,所述算法模型的数量为样本集数量与预设的算法的种类数量的乘积;
S5、利用每种算法模型分别对待预测时刻前某一时刻的该参数值进行预测,将该参数预测值作为特征值,与该时刻的该参数实际值构成融合矩阵,得到多个融合矩阵,融合矩阵的数量与步骤S4中采用的预设算法的种类数量一致;
S6、采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果,评估性能较优的算法作为误差消融算法;
S7、利用步骤S6所得误差消融算法对待预测时刻的该参数值进行预测。
进一步地,步骤S1中的规范化预处理具体包括:缺失值处理,即对缺失的数据进行线性插值补充;以及异常点检测,即对异常数据进行平滑处理。
进一步地,多元溯源型相关数据包括气象及天文数据、节假日数据、日期数据、时间数据等。
例如用于电力技术领域,用于电力负荷预测,电力负荷的多元溯源型相关数据中的气象数据一般包括每日最高温度、最低温度、平均温度、平均水气压、最高本站气压、最低本站气压、平均本站气压、日最低本站气压、日最高本站气压、最小相对湿度、平均相对湿度;日期数据包括节假日数量、时间区间。还可能包括经济数据,如国内生产总值GDP、人口数量、物价指数PI、通货膨胀率。
进一步地,步骤S2中采用互信息提取多元溯源型相关数据的特征值,互信息标准中,两个随机变量X和Y的统计依存关系用如下式(1)来度量:
Figure 455638DEST_PATH_IMAGE001
(1)
其中I(X;Y)代表变量X和Y的互信息其中 p(x i ,y i ) 是 X 和 Y 的联合概率分布函数, p(x i )p(y i )分别是 X 、Y 的边缘概率分布函数;一般互信息越大,表示两变量之间的相关性越大。
得到互信息后,根据预设的互信息阈值,选择符合互信息阈值的N个特征值Fj,j=1,2,…,N,作为部分特征值;一般互信息阈值是在0-1之间,假设符合预设互信息阈值的特征值有N个;
对于第i时刻,其前M时刻的历史负荷Yi-k,k=1,2,…,M;将Fj与Yi-k作为全部特征值与负荷实际值Yi构成数据集D,其中i=1,2,…,n; n代表总样本数,采用如下式(2)表示:
D = [Fi1,Fi2,…,FiN,Yi,i-M,Yi,i-M+1…,Yi,i-1,Yi],i=1,2,…,n (2)。
进一步地,步骤S3具体为:通过采样率
Figure 466319DEST_PATH_IMAGE002
的Bootstrap算法对数据集D进行m次可重 复采样,获得m个样本集;
进一步地,步骤S4中不同算法包括支持向量算法、决策树算法、K-Means、深度学习算法等其他机器学习算法。
优选地,支持向量算法包括SVR或LSSVM等;决策树算法包括GBDT(GradientBoosted Decision Trees)或iGBRT(Gradient Boosted Regression Tree)等;深度学习算法包括RNN、LSTM算法等。
进一步地,步骤S4具体为:分别利用支持向量算法训练m个样本集,得到m个模型L11,L12,…,L1m;利用决策树算法训练m个样本集,得到m个模型G11,G12,…,G1m;利用K-Means算法训练m个样本集,得到m个模型T11,T12,…,T1m,最后得到3m个算法模型的总和Multi-model。
进一步地,步骤S5具体为:
利用Multi-mode中的算法的差异化对待预测时刻前K时刻的该参数值分别进行预测,将每种算法模型的参数预测值作为矩阵的特征值,与该时刻的参数实际值构成关于每种算法的融合矩阵,用如下式(3)表示:
Figure 496592DEST_PATH_IMAGE003
(3),
融合矩阵的数量与步骤S4中采用的预设算法的种类数量一致。
具体地,步骤S6中,GRU算法训练过程表示为:
Figure 655041DEST_PATH_IMAGE004
Figure 963050DEST_PATH_IMAGE005
Figure 359396DEST_PATH_IMAGE006
Figure 29412DEST_PATH_IMAGE007
Figure 940736DEST_PATH_IMAGE008
其中:
Figure 721611DEST_PATH_IMAGE009
Figure 238043DEST_PATH_IMAGE010
分别表示重置门、更新,W表示权重,
Figure 813380DEST_PATH_IMAGE011
表示上一个传输的状态,
Figure 680842DEST_PATH_IMAGE012
为 当前时刻的参数预测值与真实值的负荷误差,
Figure 734249DEST_PATH_IMAGE013
为sigmoid函数可以将数据变换为0-1范围 内的数值,tanh激活函数将参数误差放缩到-1~1的范围内,
Figure 636346DEST_PATH_IMAGE014
包含当前输入的参数误差,
Figure 117006DEST_PATH_IMAGE015
忘记
Figure 471764DEST_PATH_IMAGE011
的维度信息并加入
Figure 328861DEST_PATH_IMAGE014
的维度信息,
Figure 85465DEST_PATH_IMAGE016
为预测值。
具体地,Transformer由编码器(Encoder)和解码器(Decoder)组成,其中Encoder包含多头注意力机制和前馈网络,Decoder包含遮蔽多头注意力机制、注意力机制和前馈网络。Transformer算法的训练过程为:编码器首先流入一个self-attention层,该层可以帮助获取当前参数数据及前后参数误差信息,该层输出作为前馈网络的输入,并在每层之间引入残差来稳定梯度。解码器在编码器的基础上在中间加入了一层获取编码器信息的attention层,可以让解码器更关注到编码器每一层输出的参数误差信息。
进一步地,步骤S7具体为:利用步骤S4得到的Multi-model对待预测时刻的该参数值进行预测,得到3m个预测值(步骤S4采用3种不同算法即得到3m个预测值,若采用两种算法则得到3m个预测值,预测值的数量与Multi-model所包含的算法模型一致,为样本集数量与预设的算法的种类数量的乘积),将3m个预测值作为误差消融算法的输入,得到待预测时刻的该参数预测值。
进一步地,所述非线性时序性数据包括交通、电力、经济等领域相关的非线性时序性数据。例如:电力负荷、交通流量等。
本发明还提供一种采用如上所述的非线性时序性数据预测的误差消融处理方法的非线性时序性数据预测系统,具体包括:
数据获取及预处理模块,用于获取非线性时序性参数的历史数据及多元溯源型相关数据,并对获取的数据进行规范化预处理;
特征值提取与数据集构建模块,包括特征值提取模块和数据集构建模块,其中:特征值提取模块用于提取多元溯源型相关数据中的特征值;数据集构建模块用于将提取的特征值与某一时刻前一段时间的该参数历史数据、及该时刻的实际参数值一起构成数据集;
多样本采集模块,用于对数据集多重采样获得多个样本集;
多算法模型构建模块,用于利用不同算法分别训练多个样本集得到多算法模型;
融合矩阵建立模块,用于利用多算法模型对待预测时刻前某一时刻的该参数进行预测,将参数预测值作为融合矩阵的特征值,与该参数实际值构成融合矩阵,得到多个融合矩阵;
误差消融算法分析模块,用于采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,利用融合矩阵进行误差消融分析,比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果,评估性能较优的算法作为误差消融算法;
负荷预测模块,用于获取误差消融算法对待预测时刻的该参数值进行预测。
本发明还提供一种计算机存储介质,其上存储有计算机程序,其中所述计算机程序被执行器执行时实现如上所述的非线性时序性数据预测的误差消融处理方法。本发明还提供一种电子设备,包括:
存储器,其上存储一个或多个程序;一个或多个处理器;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的非线性时序性数据预测的误差消融处理方法。
本发明具有如下有益效果:
本发明提供一种非线性时序性数据预测的误差消融处理方法及系统,通过采样的多样性,利用支持向量算法或决策树算法或其他机器学习算法训练得到多个差异化较大的预测算法,利用多个预测算法预测每个待预测时刻最近一段时间的非线性时序性参数值,将预测到的每个待预测时刻最近一段时间的参数预测值与实际值构成融合矩阵,使用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,得到最终误差消融预测算法。该方法能够有效降低每个算法可能出现的过拟合现象,增强泛化能力,学习每个算法的优点,通过误差消融处理后得到的预测结果具有更高的预测精度。
与已有的方法相比,本发明提供的非线性时序性数据预测的误差消融处理方法具有以下优点:
(1)提出将支持向量算法或决策树算法或其他机器学习算法训练得到多个差异化较大的预测方法进行误差消融的概念,可以应用于电力、交通等领域非线性时序性数据的预测。
(2)本发明使用误差消融预测方法,将每个待预测时刻最近一段时间的参数预测值与实际值构成融合矩阵,使用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,能够有效降低可能出现的过拟合,增强泛化能力,学习每个算法的优点,提高预测精度。融合矩阵就是multi model的预测值和真实值构成的,通过训练他们之间的误差,然后预测到更准确的结果,也就是误差消融。
(3)本发明将GRU和Transformer竞争算法进行动态学习,具有广泛应用性,单模型算法包括但不限于已有的统计学算法、机器学习算法、深度学习算法、组合算法等。
经过实验验证,本发明的方法能够显著提升非线性时序性数据预测的精度,并且降低预测过程汇中单一向量算法或决策树算法或其他机器学习算法可能出现的过拟合现象。本发明提供的方法与单一支持向量算法或决策树算法或其他机器学习算法进行预测性能比较方法进行比较, 能较显著地降低预测误差。
附图说明
图1为本发明实施例1提供的非线性时序性数据预测的误差消融处理方法的流程示意图;
图2为本发明实施例2提供的非线性时序性数据预测系统的结构示意图;
图3为实施例4日总负荷平均绝对百分比误差对比图;
图4为实施例4日峰值负荷平均绝对百分比误差对比图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围不受下面公开的具体实施例的限制。
实施例1
如图1所示,本实施例提供一种非线性时序性数据预测的误差消融处理方法,包括以下步骤:
S1、获取非线性时序性参数的历史数据及多元溯源型相关数据,并对获取的数据进行规范化预处理;
所述非线性时序性数据包括交通、电力、经济等领域相关的非线性时序性数据。例如:电力负荷、交通流量等。多元溯源型相关数据包括气象及天文数据、节假日数据、日期数据、时间数据等。
例如用于电力技术领域,用于电力负荷预测,电力负荷的多元溯源型相关数据中的气象数据一般包括每日最高温度、最低温度、平均温度、平均水气压、最高本站气压、最低本站气压、平均本站气压、日最低本站气压、日最高本站气压、最小相对湿度、平均相对湿度;日期数据包括节假日数量、时间区间。还可能包括经济数据,如国内生产总值GDP、人口数量、物价指数PI、通货膨胀率。
规范化预处理具体包括:缺失值处理,即对缺失的数据进行线性插值补充;以及异常点检测,即对异常数据进行平滑处理。
S2、提取多元溯源型相关数据的特征值,并将提取的特征值与某一时刻前一段时间的各个时刻的该参数历史数据作为全部特征值,与该时刻的该参数实际值一起构成数据集;
用于短期电力负荷预测,气象数据的影响较大,一般提取气象数据的特征值。
具体地,一般采用互信息提取多元溯源型相关数据的特征值,互信息标准中,两个随机变量X和Y的统计依存关系用如下式(1)来度量:
Figure 737026DEST_PATH_IMAGE017
(1)
其中I(X;Y)代表变量X和Y的互信息,其中 p(x i ,y i ) 是 X 和 Y 的联合概率分布函数, p(x i )p(y i )分别是 X 、Y 的边缘概率分布函数;一般互信息越大,表示两变量之间的相关性越大。
得到互信息后,根据预设的互信息阈值,选择符合互信息阈值的N个特征值Fj,j=1,2,…,N,作为部分特征值;一般互信息阈值是在0-1之间,假设符合预设互信息阈值的特征值有N个;
对于第i时刻,其前M时刻的历史负荷Yi-k,k=1,2,…,M;将Fj与Yi-k作为全部特征值与负荷实际值Yi构成数据集D,其中i=1,2,…,n; n代表总样本数,采用如下式(2)表示:
D = [Fi1,Fi2,…,FiN,Yi,i-M,Yi,i-M+1…,Yi,i-1,Yi],i=1,2,…,n (2)。
S3、对数据集多重采样获得多个样本集;一般通过采样率
Figure 378747DEST_PATH_IMAGE002
的Bootstrap算法对数 据集D进行m次可重复采样,获得m个样本集;
S4、获取多个预设的不同算法分别训练步骤S3获得的多个样本集,得到多个算法模型;
作为优选实施例,不同算法采用支持向量算法、决策树算法、K-Means、深度学习算法等其他机器学习算法。更优选地,支持向量算法采用SVR或LSSVM等;决策树算法采用GBDT(Gradient Boosted Decision Trees)或iGBRT(Gradient Boosted Regression Tree)等;深度学习算法包括RNN、LSTM算法等。
分别利用支持向量算法训练m个样本集,得到m个模型L11,L12,…,L1m;利用决策树算法训练m个样本集,得到m个模型G11,G12,…,G1m;利用K-Means算法训练m个样本集,得到m个模型T11,T12,…,T1m,最后得到3m个算法模型的总和Multi-model;所述算法模型的数量为样本集数量与预设的算法的种类数量的乘积。
S5、利用每种算法模型分别对待预测时刻前某一时刻的该参数值进行预测,将该参数预测值作为特征值,与该时刻的该参数实际值构成融合矩阵,得到多个融合矩阵,融合矩阵的数量与步骤S4中采用的预设算法的种类数量一致;
具体地,利用Multi-mode中的算法的差异化对待预测时刻前K时刻的该参数值分别进行预测,将每种算法模型的参数预测值作为矩阵的特征值,与该时刻的参数实际值构成关于每种算法的融合矩阵,用如下式(3)表示:
Figure 305115DEST_PATH_IMAGE018
(3)。
S6、采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果,评估性能较优的算法作为误差消融算法;其中:
GRU算法训练过程表示为:
Figure 385066DEST_PATH_IMAGE004
Figure 207529DEST_PATH_IMAGE019
Figure 474562DEST_PATH_IMAGE006
Figure 735779DEST_PATH_IMAGE020
Figure 139079DEST_PATH_IMAGE008
其中:
Figure 460339DEST_PATH_IMAGE009
Figure 214668DEST_PATH_IMAGE010
分别表示重置门、更新,W表示权重,
Figure 13997DEST_PATH_IMAGE011
表示上一个传输的状态,
Figure 662016DEST_PATH_IMAGE012
为 当前时刻的参数预测值与真实值的负荷误差,
Figure 91860DEST_PATH_IMAGE013
为sigmoid函数可以将数据变换为0-1范围 内的数值,tanh激活函数将参数误差放缩到-1~1的范围内,
Figure 121434DEST_PATH_IMAGE014
包含当前输入的参数误差,
Figure 662137DEST_PATH_IMAGE015
忘记
Figure 367925DEST_PATH_IMAGE011
的维度信息并加入
Figure 703091DEST_PATH_IMAGE014
的维度信息,
Figure 494330DEST_PATH_IMAGE016
为预测值。
具体地,Transformer由编码器(Encoder)和解码器(Decoder)组成,其中Encoder包含多头注意力机制和前馈网络,Decoder包含遮蔽多头注意力机制、注意力机制和前馈网络。Transformer算法的训练过程为:编码器首先流入一个self-attention层,该层可以帮助获取当前参数数据及前后参数误差信息,该层输出作为前馈网络的输入,并在每层之间引入残差来稳定梯度。解码器在编码器的基础上在中间加入了一层获取编码器信息的attention层,可以让解码器更关注到编码器每一层输出的参数误差信息。
S7、利用步骤S6所得误差消融算法对待预测时刻的该参数值进行预测。具体是利用步骤S4得到的Multi-model对待预测时刻的该参数值进行预测,得到3m个预测值(步骤S4采用3种不同算法即得到3m个预测值,若采用两种算法则得到2m个预测值,预测值的数量与Multi-model所包含的算法模型一致,为样本集数量与预设的算法的种类数量的乘积),将3m个预测值作为误差消融算法的输入,得到待预测时刻的该参数预测值。
实施例2
如图2所示,本实施例提供一种采用实施例1所述方法的非线性时序数据预测系统20,具体包括:
数据获取及预处理模块21,用于获取非线性时序性参数的历史数据及多元溯源型相关数据,并对获取的数据进行规范化预处理;规范化预处理具体包括:缺失值处理,即对缺失的数据进行线性插值补充;以及异常点检测,即对异常数据进行平滑处理。
特征值提取与数据集构建模块22,包括特征值提取模块221和数据集构建模块222,其中:特征值提取模块221用于提取多元溯源型相关数据中的特征值;数据集构建模块222用于将提取的特征值与某一时刻前一段时间的该参数历史数据、及该时刻的实际参数值一起构成数据集;
多样本采集模块23,用于对数据集多重采样获得多个样本集;
多算法模型构建模块24,用于利用不同算法分别训练多个样本集得到多算法模型;
融合矩阵建立模块25,用于利用多算法模型对待预测时刻前某一时刻的该参数进行预测,将参数预测值作为融合矩阵的特征值,与该参数实际值构成融合矩阵,得到多个融合矩阵;
误差消融算法分析模块26,用于采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,利用融合矩阵进行误差消融分析,比较GRU和Transformer算法在训练该参数预测值与该参数真实值误差的性能与结果,评估性能较优的算法作为误差消融算法;
预测模块27,用于获取误差消融算法对待预测时刻的该参数值进行预测。
实施例3
本发明实施例3提供一种计算机存储介质,其上存储有计算机程序,其中所述计算机程序被执行器执行时实现如图1所示的方法。
所述计算机可读存储介质可包括但不限于,软盘、光盘、CD-ROM(只读光盘存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光卡、闪存、或适于存储机器可执行指令的其他类型的介质/机器可读介质。所述计算机可读存储介质可以是未接入计算机设备的产品,也可以是已接入计算机设备使用的部件。
实施例4:应用实施例
为了验证本发明提供的非线性时序数据预测的误差消融处理方法的有效性,本实施例以LSSVM和iGBRT为支持向量算法和决策树算法,将本方法应用于中国广东省广州市的电力负荷预测。数据包括2007年-2009年的日峰值电力数据和气象数据。根据实施例1公式(1)计算气象候选特征值和负荷之间的互信息,如表1所示。本实例选择取值为0.5作为互信息阈值,因此选择1-7号影响因素作为气象特征值。
表1变量与负荷之间的互信息值
Figure 573144DEST_PATH_IMAGE021
针对电力负荷预测的性能评估方法有很多,其中平均绝对百分误差百分比(MAPE)是衡量预测准确性的统计指标,也是值使用最多的误差衡量方法,本实施例选择MAPE作为评估指标,采用如下式(4)表示:
Figure 133439DEST_PATH_IMAGE022
(4)
式(4)中:N为预测时刻数,
Figure 701823DEST_PATH_IMAGE023
为t时刻的实际负荷值,
Figure 918041DEST_PATH_IMAGE024
为t时刻的预测负荷值, MAPE越小,表示预测精度越高。
为了验证本发明提供的方法在预测精度上优于支持向量算法和决策树算法,将 LSSVM和iGBRT作为支持向量算法和决策树算法的代表,与本实施例提供的多模型误差消融 预测算法(即下表和图3、4中的EAFM)对每日总负荷和峰值负荷预测精度进行对比。训练时, 数据集特征值包括7个气象特征值和待预测日前7天的负荷值,LSSVM中核函数参数和正规 化参数C采用十字交叉验证和网格搜索进行参数的寻优,iGBRT中的RF算法树数目为MRF= 500,GBRT算法树总数为MGBRT=30,学习速率为
Figure 394022DEST_PATH_IMAGE025
,基学习器为CART。本实施例方法选择
Figure 543243DEST_PATH_IMAGE026
的采样率进行多次重复采样,得到m=15组训练数据集,取待预测日前k=30天的负荷 预测值和实际值构成融合矩阵,进行算法融合。表2和图3显示了各算法日总负荷平均绝对 百分比误差。从表2可知,本发明的EAFM方法在全年有10个月预测精度最高,有1个月是次高 的,全年预测精度也是最高的,误差消融算法的全年平均误差与LSSVM和iGBRT相比较分别 减小了0.64%和0.97%。1、2、5、10月份因为重大节假日的存在,预测精度受到一定影响,总体 而言,EAFM方法相比支持向量算法或决策树算法预测精度有一定程度提升。
表2平均绝对百分误差统计(Monthly MAPE (%))
Figure 485791DEST_PATH_IMAGE027
为了进一步验证本实施例方法的有效性,对每日峰值负荷进行预测。表3和图4显示了模型日峰值负荷平均绝对百分比误差。从表3可知,本发明实施例的EAFM方法在全年有9个月预测精度最高,有2个月是次高的,整体而言,全年预测精度最高,EAFM模型的平均绝对百分比误差相较于LSSVM和iGBRT算法分别减小了0.48%和0.58%,进一步说明了本实施例方法的有效性。
表3日峰值负荷平均绝对百分误差统计(Monthly MAPE (%))
Figure 986043DEST_PATH_IMAGE028
综上表明:本发明提供的非线性时序数据预测的误差消融处理方法,通过采样的多样性,利用支持向量算法或决策树算法或其他机器学习算法训练得到多个差异化较大的预测算法,利用多个预测算法预测每个待预测时刻最近一段时间的非线性时序性参数值,将预测到的每个待预测时刻最近一段时间的参数预测值与实际值构成融合矩阵,使用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,得到最终误差消融预测算法。该方法能够有效降低每个算法可能出现的过拟合现象,增强泛化能力,学习每个算法的优点,通过误差消融处理后得到的预测结果具有更高的预测精度。能够有效地应用于电力、交通等领域的非线性时序数据的预测,例如电力负荷的预测、交通流量负荷的预测等,降低预测误差,提高预测结果的精度。
以上所述仅为本发明的部分较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种电力负荷预测的误差消融处理方法,其特征在于,具体包括如下步骤:
S1、获取电力负荷历史数据及电力负荷相关的多元溯源型气象数据,并对获取的数据进行规范化预处理;多元溯源型气象数据包括气象影响因素的气温、气压、风速方向、湿度、风速数据;
S2、提取多元溯源型气象数据的特征值,并将提取的特征值与某一时刻前一段时间的各个时刻的电力负荷历史数据作为全部特征值,与该时刻的电力负荷实际值一起构成数据集;
S3、对数据集多重采样获得多个样本集;
S4、获取多个预设的不同算法分别训练步骤S3获得的多个样本集,得到多个算法模型,所述算法模型的数量为样本集数量与预设的算法的种类数量的乘积;
S5、利用每种算法模型分别对待预测时刻前某一时刻的电力负荷进行预测,将该电力负荷预测值作为特征值,与该时刻的电力负荷实际值构成融合矩阵,得到多个融合矩阵,融合矩阵的数量与步骤S4中采用的预设算法的种类数量一致;
S6、采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,比较GRU和Transformer算法在训练该电力负荷预测值与该电力负荷真实值误差的性能与结果,评估性能较优的算法作为误差消融算法;
S7、利用步骤S6所得误差消融算法对待预测时刻的电力负荷进行预测。
2.根据权利要求1所述的电力负荷预测的误差消融处理方法,其特征在于,
步骤S1中的规范化预处理具体包括:缺失值处理,即对缺失的数据进行线性插值补充;以及异常点检测,即对异常数据进行平滑处理。
3.根据权利要求1所述的电力负荷预测的误差消融处理方法,其特征在于,
步骤S2中采用互信息提取多元溯源型气象数据的特征值,
得到互信息后,根据预设的互信息阈值,选择符合互信息阈值的N个特征值Fj,j=1,2,…,N,作为部分特征值;对于第i时刻,其前M时刻的历史电力负荷Yi-k,k=1,2,…,M;将Fj与Yi-k作为全部特征值与电力负荷实际值Yi构成数据集D,D = [Fi1,Fi2,…,FiN,Yi,i-M,Yi,i-M+1…,Yi,i-1,Yi],其中i=1,2,…,n;n代表总样本数。
4.根据权利要求3所述的电力负荷预测的误差消融处理方法,其特征在于,
步骤S3具体为:通过采样率
Figure DEST_PATH_IMAGE001
的Bootstrap算法对数据集D进行m次可重复采样,获得m个样本集;
步骤S4中不同算法种类包括支持向量算法、决策树算法、K-Means算法、深度学习算法,步骤S4具体为:分别利用支持向量算法训练m个样本集,得到m个模型L11,L12,…,L1m;利用决策树算法训练m个样本集,得到m个模型G11,G12,…,G1m;利用K-Means算法训练m个样本集,得到m个模型T11,T12,…,T1m,最后得到3m个算法模型的总和Multi-model。
5.根据权利要求4所述的电力负荷预测的误差消融处理方法,其特征在于,
支持向量算法包括SVR、LSSVM算法;决策树算法包括GBDT、iGBRT算法;深度学习算法包括RNN、LSTM算法。
6.根据权利要求5所述的电力负荷预测的误差消融处理方法,其特征在于,
步骤S5具体为:
利用Multi-mode中的算法的差异化对待预测时刻前K时刻的电力负荷值分别进行预测,将每种算法模型的电力负荷预测值作为矩阵的特征值,与该时刻的电力负荷实际值构成关于每种算法的融合矩阵:
Figure 878109DEST_PATH_IMAGE002
7.根据权利要求6所述的电力负荷预测的误差消融处理方法,其特征在于,
步骤S7具体为:利用步骤S4得到的Multi-model对待预测时刻的电力负荷值进行预测,得到3m个预测值,将3m个预测值作为误差消融算法的输入,得到待预测时刻的电力负荷预测值。
8.一种电力负荷预测系统,其特征在于,采用权利要求1-7任一所述的电力负荷的误差消融处理方法,具体包括:
数据获取及预处理模块,用于获取电力负荷的历史数据及多元溯源型气象数据,并对获取的数据进行规范化预处理;多元溯源型气象数据包括气象影响因素的气温、气压、风速方向、湿度、风速数据;
特征值提取与数据集构建模块,包括特征值提取模块和数据集构建模块,其中:特征值提取模块用于提取多元溯源型气象数据中的特征值;数据集构建模块用于将提取的特征值与某一时刻前一段时间各个时刻的电力负荷历史数据、及各时刻的电力负荷实际值一起构成数据集;
多样本采集模块,用于对数据集多重采样获得多个样本集;
多算法模型构建模块,用于利用不同算法分别训练多个样本集得到多算法模型;
融合矩阵建立模块,用于利用多算法模型对待预测时刻前某一时刻的电力负荷进行预测,将该电力负荷预测值作为融合矩阵的特征值,与该时刻的电力负荷实际值构成融合矩阵,得到多个融合矩阵;
误差消融算法分析模块,用于采用GRU和Transformer竞争算法对每个融合矩阵分别进行动态学习,利用融合矩阵进行误差消融分析,比较GRU和Transformer算法在训练该电力负荷预测值与该电力负荷真实值误差的性能与结果,评估性能较优的算法作为误差消融算法;
负荷预测模块,用于获取误差消融算法对待预测时刻的电力负荷进行预测。
9.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中所述计算机程序被执行器执行时实现如权利要求1-7中任一所述的电力负荷预测的误差消融处理方法。
CN202210217929.4A 2022-03-08 2022-03-08 非线性时序数据预测的误差消融处理方法及系统与介质 Active CN114358213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210217929.4A CN114358213B (zh) 2022-03-08 2022-03-08 非线性时序数据预测的误差消融处理方法及系统与介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210217929.4A CN114358213B (zh) 2022-03-08 2022-03-08 非线性时序数据预测的误差消融处理方法及系统与介质

Publications (2)

Publication Number Publication Date
CN114358213A CN114358213A (zh) 2022-04-15
CN114358213B true CN114358213B (zh) 2022-06-10

Family

ID=81094897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210217929.4A Active CN114358213B (zh) 2022-03-08 2022-03-08 非线性时序数据预测的误差消融处理方法及系统与介质

Country Status (1)

Country Link
CN (1) CN114358213B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115108595A (zh) * 2022-06-27 2022-09-27 重庆远通电子技术开发有限公司 基于机器学习的净水剂智能投加方法
CN115167133A (zh) * 2022-07-18 2022-10-11 北方工业大学 非线性系统的自适应控制方法及装置
CN115238583B (zh) * 2022-07-27 2024-02-13 山东理工大学 一种支持增量日志的业务流程剩余时间预测方法与系统
CN116667326B (zh) * 2023-05-30 2024-02-23 淮阴工学院 一种电动汽车充电负荷预测方法
CN116881854B (zh) * 2023-09-08 2023-12-22 国际关系学院 融合XGBoost计算特征权重的时间序列预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3101276A1 (en) * 2018-05-25 2019-11-28 University Of Johannesburg System and method for real time prediction of water level and hazard level of a dam
CN110674993A (zh) * 2019-09-26 2020-01-10 广东电网有限责任公司 一种用户负荷短期预测方法和装置
CN110991713A (zh) * 2019-11-21 2020-04-10 杭州电子科技大学 基于多图卷积和gru的不规则区域流量预测方法
CN112836870A (zh) * 2021-01-25 2021-05-25 华北电力大学 预测风电功率的方法、装置、设备和计算机可读存储介质
CN112884230A (zh) * 2021-02-26 2021-06-01 润联软件系统(深圳)有限公司 基于多元时间序列的电力负荷预测方法、装置及相关组件
CN113592169A (zh) * 2021-07-26 2021-11-02 清华大学 基于区域影响关系的节假日供需预测方法与装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10692099B2 (en) * 2016-04-11 2020-06-23 International Business Machines Corporation Feature learning on customer journey using categorical sequence data
US20220058240A9 (en) * 2019-08-27 2022-02-24 Nec Laboratories America, Inc. Unsupervised multivariate time series trend detection for group behavior analysis

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3101276A1 (en) * 2018-05-25 2019-11-28 University Of Johannesburg System and method for real time prediction of water level and hazard level of a dam
CN110674993A (zh) * 2019-09-26 2020-01-10 广东电网有限责任公司 一种用户负荷短期预测方法和装置
CN110991713A (zh) * 2019-11-21 2020-04-10 杭州电子科技大学 基于多图卷积和gru的不规则区域流量预测方法
CN112836870A (zh) * 2021-01-25 2021-05-25 华北电力大学 预测风电功率的方法、装置、设备和计算机可读存储介质
CN112884230A (zh) * 2021-02-26 2021-06-01 润联软件系统(深圳)有限公司 基于多元时间序列的电力负荷预测方法、装置及相关组件
CN113592169A (zh) * 2021-07-26 2021-11-02 清华大学 基于区域影响关系的节假日供需预测方法与装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
An Adaptive and Parallel Forecasting Strategy for Short-Term Power Load Based on Second Learning of Error Trend;MD FAZLA ELAHE et al.;《IEEE Access》;20201118;第201889-201897页 *
Short-Term Firm-Level Energy-Consumption Forecasting for Energy-Intensive Manufacturing: A Comparison of Machine Learning and Deep Learning Models;Andrea Maria N. C. Ribeiro et al.;《MDPI》;20201030;第1-19页 *
基于循环扩张机制的 ConvGRU-Transformer 短期电力负荷预测方法;遆宝中 等;《华北电力大学学报》;20220208;第1-10页 *

Also Published As

Publication number Publication date
CN114358213A (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN114358213B (zh) 非线性时序数据预测的误差消融处理方法及系统与介质
CN113962364B (zh) 一种基于深度学习的多因素用电负荷预测方法
CN109063911B (zh) 一种基于门控循环单元网络的负荷聚合体分组预测方法
Piltan et al. Energy demand forecasting in Iranian metal industry using linear and nonlinear models based on evolutionary algorithms
CN111260136A (zh) 一种基于arima-lstm组合模型的楼宇短期负荷预测方法
CN112116144B (zh) 一种区域配电网短期负荷预测方法
CN109948845A (zh) 一种配电网负荷长短期记忆神经网络预测方法
CN110751318A (zh) 一种基于ipso-lstm的超短期电力负荷预测方法
CN111915092B (zh) 基于长短时记忆神经网络的超短期风电功率预测方法
CN110648014A (zh) 一种基于时空分位数回归的区域风电预测方法及系统
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN113344288B (zh) 梯级水电站群水位预测方法、装置及计算机可读存储介质
CN115860177A (zh) 基于组合式机器学习模型光伏发电功率预测方法及其应用
CN114595861A (zh) 基于mstl和lstm模型的中长期电力负荷预测方法
CN116341613A (zh) 一种基于Informer encoder和LSTM的超短期光伏功率预测方法
CN113762591B (zh) 一种基于gru和多核svm对抗学习的短期电量预测方法及系统
CN114819395A (zh) 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法
CN114118401A (zh) 基于神经网络的配电网络流量预测方法、系统、装置及存储介质
CN117114438A (zh) 一种具备灵活性与可解释性的建筑区域能源系统冷热负荷数据驱动预测方法
CN115481788B (zh) 相变储能系统负荷预测方法及系统
CN115759343A (zh) 一种基于e-lstm的用户电量预测方法和装置
CN113723670A (zh) 变时间窗口的光伏发电功率短期预测方法
CN113191526A (zh) 一种基于随机敏感度的短期风速区间多目标优化预测方法及系统
CN112446550A (zh) 一种短期建筑负荷概率密度预测方法
Haque et al. Short-Term Electrical Load Prediction for Future Generation Using Hybrid Deep Learning Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant