CN113222234A - 基于集成模态分解的用气需求预测方法及其系统 - Google Patents
基于集成模态分解的用气需求预测方法及其系统 Download PDFInfo
- Publication number
- CN113222234A CN113222234A CN202110481674.8A CN202110481674A CN113222234A CN 113222234 A CN113222234 A CN 113222234A CN 202110481674 A CN202110481674 A CN 202110481674A CN 113222234 A CN113222234 A CN 113222234A
- Authority
- CN
- China
- Prior art keywords
- svr
- training
- data
- model
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 61
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims abstract description 106
- 238000012549 training Methods 0.000 claims abstract description 88
- 239000003345 natural gas Substances 0.000 claims abstract description 53
- 238000012795 verification Methods 0.000 claims abstract description 41
- 238000012545 processing Methods 0.000 claims abstract description 29
- 239000007789 gas Substances 0.000 claims abstract description 21
- 230000008859 change Effects 0.000 claims abstract description 18
- 238000010606 normalization Methods 0.000 claims abstract description 17
- 238000012706 support-vector machine Methods 0.000 claims description 36
- 239000002245 particle Substances 0.000 claims description 28
- 238000012360 testing method Methods 0.000 claims description 18
- 238000007781 pre-processing Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 6
- 230000001131 transforming effect Effects 0.000 claims description 4
- 238000013500 data storage Methods 0.000 claims description 2
- 230000010354 integration Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 8
- 238000010438 heat treatment Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Water Supply & Treatment (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于集成模态分解的用气需求预测方法及其系统,该方法包括以下步骤:数据收集和处理、对数据中天然气负荷变化规律进行分析确定数据集选择范围、对数据进行归一化处理、对归一化后的数据序列进行集成模态分解得到IMF分量和残差量、利用IMF分量、残差量训练SVR模型、使用原始序列训练SVR模型、预测结果的嵌套模型训练和模型验证;对应的,该系统包括处理模块、分解模块、第一训练模块、第二训练模块、第三训练模块和预测模块;本发明采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练提高了预测结果的准确性且适用性更为广泛。
Description
技术领域
本发明属于天然气需求预测方法领域,特别涉及一种基于集成模态分解的用气需求预测方法及其系统。
背景技术
2017年初“气荒”事件发生引发社会广泛关注,2020年“新冠”病毒冲击局部地区天然气市场,实现天然气消费量精准预测关乎到国家民生大计。受宏观经济及能源调控影响,天然气市场处于快速变化态势,不均匀性愈加明显,实现天然气需求预测对优化调度、储气调峰具有着重要意义。
天然气需求预测是通过分析某一地区或用户天然气历史日负荷(消费量)的变化规律,建立预测模型来预测未来天然气需求的方法。非供暖季时期无供暖需求,因此天然气日负荷多以时序为主要变量进行需求预测。近年来天然气消费结构快速变化,采用多年的大数据集有欠拟合风险。经实验发现,采用同样为非供暖季时期、与预测时间相近、数据变化规律相近的小数据集作为训练集可提升预测精度。经典的机器学习算法如BP神经网络、RBF神经网络、小波神经网络等存在需要大量数据进行训练的问题。
天然气日负荷受天气、节假日、人口流动等多因素影响随机性明显。传统的时序预测模型算法如自回归移动平均模型(ARMA)等必须以时间序列平稳为前提条件,因此需要对原时间序列进行处理。电力系统负荷预测中有部分模型采用经验模态分解(EMD),基于经验模态分解理论可以将时间序列自适应地分解原始序列生成内涵模态分量(IMF)和一个代表信号总体趋势的剩余分量之和。将该方法应用于天然气负荷预测中发现,天然气日负荷随机性较强,分解过程中可能因不同模态分量频率相差较大致使三次样条插值法无法有效分离得到不同的IMF分量,或由于低频信号的高幅值特征峰缺少足够极值点,产生模态混叠效应,导致预测精度偏低。此外,在使用模态分解与预测算法组合进行预测过程中存在部分IMF高频分量精度较低易导致预测结果失真。本发明公开了一种涉及集成模态分解(EEMD)、粒子群算法(PSO)、支持向量机回归模型(SVR)的综合非供暖季天然气负荷预测方法。
发明内容
针对上述问题,本发明提供了一种基于集成模态分解的用气需求预测方法,所述预测方法包括以下步骤:
将训练集和验证集中的天然气日负荷按时序特征组成原始序列,其中,所述时序特征包括日期、节假日;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
用所述训练集分量和验证集分量训练若干个支持向量机回归模型SVR,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
用所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs;
用所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm;
将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
进一步地,对所述支持向量机回归模型进行训练前需要对使用的数据进行处理,所述处理包括以下步骤:
收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
将所述数据集进行归一化处理。
进一步地,所述处理还包括构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
进一步地,得到所述预测结果后,对预测结果进行反归一化处理,得到预测值;所述反归一化处理与数据集采用的归一化处理规则一致。
进一步地,所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
进一步地,所述原始序列训练支持向量机回归模型时采用所述训练集训练,以时序特征为输入变量,以归一化后的天然气日负荷为输出变量。
进一步地,所述训练集分量和验证集分量训练所述支持向量机回归模型时,以所述训练集分量和验证集分量的时序特征作为输入变量,模态分解后的训练集分量和验证集分量为输出变量。
一种基于集成模态分解的用气需求预测系统,所述预测系统包括以下模块:
分解模块:将训练集和验证集中的天然气日负荷按时序特征组成原始序列;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
第一训练模块:用于采用所述训练集分量和验证集分量训练若干个支持向量机回归模型,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
第二训练模块:用于将所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs;
第三训练模块:用于将所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm;
预测模块:用于将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
进一步地,所述预测系统还包括处理模块,所述处理模块包括预处理单元、数据集单元、归一化单元;
预处理单元:用于收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
数据集单元:用于将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
归一化单元:用于将所述数据集进行归一化处理。
进一步地,所述处理模块还包括构建单元,用于构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
进一步地,所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
一种对所述预测方法和系统进行有效性评价的方法,所述方法包括以下步骤:
将对数据不进行处理,直接采用粒子群优化的支持向量机模型进行预测作为对照组1;将采用集成模态分解后使用滑动平均方法进行预测为对照组2;将采用集成模态分解后利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法作为对照组3;在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测作为对照组4;将所述预测方法作为实验组;
根据对照组1、对照组2、对照组3、对照组4和实验组的模型预测结果,计算每组预测结果的百分比误差和均方根误差,根据所述百分比误差和均方根误差对所述预测结果进行评价。
本发明所公开的基于集成模态分解的用气需求预测方法。选取适用小数据集的支持向量机回归模型(SVR)进行预测,超参数选取采用粒子群算法(PSO)进行参数寻优。针对经验模态分解中模态混叠问题采用集成模态分解(EEMD)进行改进(EEMD-SVR模型),降低时序模型建立条件中对于原始数据序列平稳的要求,使得模型适用面更广。针对高频IMF分量预测精度低导致的预测结果失真问题,采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练以建立综合预测模型的方法(IEEMD-SVR-SVR)提升天然气日负荷预测精度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例的IEEMD-SVR-SVR的基本数据流向图;
图2示出了本发明实施例的EEMD分解流程图;
图3示出了本发明实施例的EMD分解流程图;
图4示出了本发明实施例PSO优化SVR预测模型流程图;
图5示出了传统的基于EEMD分解的预测模型流程图;
图6示出了本发明实施例2015-2017年A市天然气月度消费量不均匀系数图;
图7示出了PSO-SVR模型、EEMD-ARMA模型、EEMD-SVR模型、EEMD-SVR-SVR模型、EEMD-SVR-SVR五种模型对非供暖季时期天然气日负荷的预测误差以及实际值对比结果图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明针对天然气消费结构逐年快速变化、非供暖季时期日负荷变化随机性较强的特征,选取适用小数据集的支持向量机回归模型(SVR)进行预测,超参数选取采用粒子群算法(PSO)进行参数寻优。针对经验模态分解中模态混叠问题采用集成模态分解(EEMD)进行改进(EEMD-SVR模型)。针对高频IMF分量预测精度低导致的预测结果失真问题,采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练以建立综合预测模型(IEEMD-SVR-SVR)的方法,提升天然气日负荷预测精度。
该预测方法包括以下步骤:
A、数据收集及数据预处理;采集被预测地区近3年的天然气年度分日消费量与时序特征值(如日期、节假日、相似日等),进行数据清洗、数据变换、数据集成等数据预处理,形成标准化数据集格式。
B、天然气负荷变化规律分析与数据集选择范围;分析天然气日负荷变化规律,厘清天然气日负荷变化阶段性特征,依据测试集选取训练集和验证集数据,验证集用于辅助构建模型。根据天然气年度消费量规模大小、天然气消费结构的相似程度、供暖季起止时间、分日消费量的变化规律按照“就近原则”以测试集起始时间向前选取同一年份、去年同一时期数据作为模型训练集与验证集。
C、数据归一化;将选取的训练集、验证集、测试集组成数据集,按照统一规则进行归一化,统一规则指训练集、验证集、测试集中的数据归一化公式、最大值、最小值选取保持一致。
D、EEMD分解;将归一化后的训练集和验证集中的天然气日负荷按时序组成天然气日负荷序列(即按时间排序的、归一化后的天然气日负荷序列)进行EEMD分解,得到多个不同时间尺度的内涵模态分量IMF(记作IMF1,IMF2…IMFn-1)和一个残差分量(记作Res)。将分解后的内涵模态分量和残差分量按日期重新分为训练集分量(IMF1',IMF2'…IMFn',Res')和验证集分量(IMF1”,IMF2”…IMFn”,Res”)。
具体地,对EEMD分解进行详细说明,EEMD分解是针对EMD分解出现的模态混叠问题,在信号分解中不断添加频率均匀分布的高斯白噪声以平滑异常信号,通过多次EMD分解得到IMF分量做整体平均以克服模态混叠,使信号在不同尺度上具有连续性。EEMD分解流程如图2所示:
①向原始序列中加入均匀频率但不等幅的高斯白噪声序列:
ym(t)=y(t)+nm(t) (1-1)
其中,y(t)为原始序列,nm(t)为高斯白噪声序列,ym(t)为添加高斯白噪声序列后的混合序列,t表示时间,单位为天。
②对ym(t)进行EMD分解,得到n个IMF分量IMF(i)及残余项。
a=ek或lne+0.5alnk=0 (1-2)
式中,e为原始序列标准差,表征原始序列和EMD重构结果的差异程度,a为高斯白噪声幅值,k为预设分解次数。即分解次数与高斯白噪声幅值呈负相关,以减少噪声对分解结果的影响。
④对k组IMF分量取算数平均,把n个IMF均值作为EEMD最终分解的结果。
其中,IMFeemd(i)为EEMD分解后第i个IMF分量,IMFm(i)为k组IMF分量中第m组的第i个IMF分量,k为预设分解次数。
其中步骤②中EMD分解流程可参照图3,
经验模态分解(EMD)的主要思想为:EMD可将任何信号(序列)中不同时间尺度的波动逐级分解为若干不同内涵模态分量(IMF)和一个代表信号总体趋势的剩余分量之和。其中IMF分量需要满足以下两个假设:
一是在整个波形内,信号波的极值点与过零点次数至多相差1;
二是在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称。
具体分解步骤如图3所示:
1)确定原始序列y(t)的极大值和极小值点,利用三次样条函数拟合上下包络线bup(t),bdown(t),取二者均值得到平均包络线bi(t);
2)计算原始序列y(t)与平均包络线bi(t)的差值hi(t);
3)若序列hi(t)不满足上述IMF两个假设条件,则将hi(t)作为新序列重复上述①②步骤直至hi(t)满足条件;若序列hi(t)满足上述IMF两个假设条件,此时hi(t)为第1个IMF序列,记作IMF1(t);
4)计算剩余信号(剩余序列),计算公式如式1-5所示:
r(t)=y(t)-∑IMFi(t) (1-5)
将剩余序列作为新序列,重复1)~3)继续进行分解直至r(t)无法继续分解或满足预设条件,此时得到一系列IMFi(t)(i=1,2,3……)与残余项,将残余项计作rn(t),此时原始序列可以写作:
此时,原始序列分解成为n个幅值、频率均不同的IMF分量和余项rn(t),根据分解序列的调频特性可分辨噪声及有用信号。
E、IMF分量、残差量(Res)训练SVR模型;将训练集分量和验证集分量的时序特征作为输入变量,以模态分解后的训练集分量(IMF1',IMF2'…IMFn',Res')和验证集分量(IMF1”,IMF2”…IMFn”,Res”)为输出变量训练n+1个SVR模型;其中,n个模型的输入变量为时序特征,1个模型的输出变量为剩余分量(Res),训练后的SVR模型,记为{SVR1,SVR2…SVRn,SVRr}。
建立SVR模型过程中,核函数直接决定了支持向量与核方法的最终性能,但核函数的选择一直是一个未解决的问题。SVR模型主要采用台湾大学林智仁提供的LibSVM工具箱,其中核函数简化成表1所示的四种形式。
表1常用核函数
本发明通过试算对比的方法选取核函数。此外,超参数选取决定影响SVR拟合效果。超参数C值选取的大小决定模型对落在“间隔带”外点的宽度,超参数是在选择高斯核或拉欧拉斯核函数时高斯带宽参数。参数寻优过程中采用全局搜索方法占用资源率较高,本发明采用粒子群寻优算法(PSO)方法进行全局寻优,PSO一种基于群体智能的全局随机搜索算法,假设在l维搜索空间中,有n个粒子形成群落,其中第i个粒子在第k次迭代的位移参数和速度参数分别为:
第i个粒子迭代至第k次为止搜索到的最优位置为个体极值,记为:
粒子群迄今为止搜索到的最优位置为全局极值,记为:
迭代过程中,粒子速度和位移的更新公式为:
其中:代表第i个粒子在第k次迭代中第d维数值速度标量,范围为[vmin,vmax],防止速度过快飞过最优解;ωk-1代表第k-1次迭代中的惯性权重,加快收敛速度;表示第i个粒子在第k-1次迭代中第d维数值速度标量;c1、c2为加速因子;r1、r2为分布在[0,1]中的正态随机数。表示在第i个粒子迭代至第k-1次时,第d维数值的最优位置;代表第i个粒子在第k-1次迭代中第d维数值的位置标量,表示在迭代至第k-1次时,第d维数值中群体的最优位置,代表第i个粒子在第k次迭代中第d维数值的位置标量,表示代表第i个粒子在第k-1次迭代中第d维数值速度标量。
采用PSO算法进行SVR参数寻优步骤如附图4所示:
(1)输入SVR训练集数据,设置PSO算法初始值包括c1,c2,种群迭代最大代数k值、个体更新权重wv,整体更新权重wp,交叉验证折数k,参数C及γ最大变化范围。
(2)初始化种群,生成随机粒子及随机解,计算初代粒子适应度,适应度函数选用对训练集进行k折交叉验证的均方误差。
其中,yi、yri分别为k折计算中原始样本的预测值及真实值。
(5)判断是否达到最大迭代次数或是否满足终止条件,若满足,则输出全局最优的C、γ。否则返回步骤(4)继续迭代。
F、原始序列的SVR模型训练。将归一化后的训练集以时序特征输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRs。
G、预测结果的嵌套模型训练。将{SVR1,SVR2…SVRn}及SVRs输出值为输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRm。
H、模型验证。将测试集代入{SVR1,SVR2…SVRn}、SVRs中,将模型所得结果代入SVRm后得出预测结果,最后按照步骤C中的规则反归一化,得到测试集的预测值。
示例性地,以以预测Y城市2017年8月20日-8月29日天然气日需求为例对该预测方法进行说明。
数据收集及数据预处理。收集Y城市2015年1月1日-2017年8月19日天然气历史日负荷数据,进行数据清洗、数据变换、数据集成等数据预处理。将数据集转化为格式统一、无异常值、无缺省数据集。
从获取的数据中对天然气日负荷变化规律进行分析和数据集的选择范围,包括训练集、测试集和验证集。以月度为单位分析天然气的月负荷不均匀性,观察天然气日负荷变化规律,不均匀系数的计算公式如公式1-14所示:
其中,η为月不均匀系数,Qm为当月负荷,m3/月,为年平均月负荷,m3/月。计算结果如图6所示,从图中可以看出天然气不均匀性逐年升高并且具有明显的季节性,2015年-2017年期间非供暖季5月-9月之间,不均匀系数变化范围0.24-0.30。选择2017年8月10日-8月19日为数据验证集,选取2016年8月1日-2016年9月30日、2017年5月1日-8月9日的消费量为训练集。
将选取的162组训练集、10组验证集和10组测试集组成数据集,按照统一规则进行归一化,输入端数据集为时序特征变量,包括日期、节假日特征值,输出端为天然气日负荷。
EEMD分解。将归一化后的训练集和验证集中的天然气消费量共172组数据按日期时序组成天然气日负荷序列进行EEMD分解,得到6个不同时间尺度的内涵模态分量IMF(记作IMF1,IMF2…,IMF6)和1个残差分量(记作Res);将分解后的模态分量和残差分量按日期的前162组分为训练集分量(IMF1',IMF2'…IMFn-1',Res'),后10组为验证集分量(IMF1",IMF2"…,IMFn-1",Res")。
用IMF分量、残差量(Res)训练SVR模型,将时序特征变量作为输入变量,模态分解后的训练集分量(IMF1',IMF2'…IMF6',Res')和验证集分量(IMF1”,IMF2”…IMF6”,Res”)分别训练7个SVR模型,记为{SVR1,SVR2…SVR6,SVRr}。
原始序列的SVR模型训练。将归一化后的训练集以时序特征值为输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRs。
预测结果的嵌套模型训练。将{SVR1,SVR2…SVR6,SVRr}及SVRs输出值为输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRm。
模型预测输出。将选取的测试集代入{SVR1,SVR2…SVRn}、SVRs中,将模型所得结果代入SVRm后得出预测结果,最后按照归一化的规则反归一化,得到测试集在IEEMD-SVR-SVR的预测值。
模型效果评价。为评价IEEMD-SVR-SVR模型预测效果,分别将步骤F中训练完成的SVRs模型作为未添加模态分解的单一模型对照组模型(记作PSO-SVR)、参照附图5的传统EEMD分解模型中将预测模型分别用ARMA和SVR模型作为预测算法对照组(记作EEMD-ARMA模型、EEMD-SVR模型),在步骤G中取消添加原始序列的训练模型SVRs作为改进算法对照组(记作EEMD-SVR-SVR模型)分别观察预测效果,采用本发明方法的模型记为IEEMD-SVR-SVR模型。
PSO-SVR表示不进行数据处理,直接采用粒子群优化的支持向量机模型进行预测;EEMD-ARMA表示在进行集成模态分解后采用滑动平均方法进行预测,EEMD-SVR表示在集成模态分解后,利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法;EEMD-SVR-SVR表示在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测;IEEMD-SVR-SVR表示改进的EEMD-SVR-SVR模型,即本文提出的方法,重新引入了最原始天然气日负荷序列所构建的SVR模型作为最终模型的参考变量之一进行预测(保留原始数据中的部分细节变量)。
表2五种模型预测误差对比表
五种模型的的预测结果如表2所示,IEEMD-SVR-SVR的百分比误差(MAPE)值为2.13%、均方根误差(RSME)值为4.80,相对其余四种模型明显下降,具有较好的预测效果。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (12)
1.一种基于集成模态分解的用气需求预测方法,其特征在于,所述预测方法包括以下步骤:
将训练集和验证集中的天然气日负荷按时序特征组成原始序列,其中,所述时序特征包括日期、节假日;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
用所述训练集分量和验证集分量训练若干个支持向量机回归模型SVR,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
用所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs;
用所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm;
将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
2.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
对所述支持向量机回归模型进行训练前需要对使用的数据进行处理,所述处理包括以下步骤:
收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
将所述数据集进行归一化处理。
3.根据权利要求2所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述处理还包括构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
4.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
得到所述预测结果后,对预测结果进行反归一化处理,得到预测值;所述反归一化处理与数据集采用的归一化处理规则一致。
5.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
6.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述原始序列训练支持向量机回归模型时采用所述训练集训练,以时序特征为输入变量,以归一化后的天然气日负荷为输出变量。
7.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述训练集分量和验证集分量训练所述支持向量机回归模型时,以所述训练集分量和验证集分量的时序特征变量作为输入变量,模态分解后的训练集分量和验证集分量为输出变量。
8.一种基于集成模态分解的用气需求预测系统,其特征在于,所述预测系统包括以下模块:
分解模块:将训练集和验证集中的天然气日负荷按时序特征组成原始序列;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
第一训练模块:用于采用所述训练集分量和验证集分量训练若干个支持向量机回归模型,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
第二训练模块:用于将所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs;
第三训练模块:用于将所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm;
预测模块:用于将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
9.根据权利要求8所述的一种基于集成模态分解的用气需求预测系统,其特征在于,
所述预测系统还包括处理模块,所述处理模块包括预处理单元、数据集单元、归一化单元;
预处理单元:用于收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
数据集单元:用于将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
归一化单元:用于将所述数据集进行归一化处理。
10.根据权利要求9所述的一种基于集成模态分解的用气需求预测系统,其特征在于,
所述处理模块还包括构建单元,用于构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
11.根据权利要求8所述的一种基于集成模态分解的用气需求预测系统,其特征在于,
所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
12.一种对权利要求1-11所述的预测方法和系统进行有效性评价的方法,其特征在于,所述方法包括以下步骤:
将对数据不进行处理,直接采用粒子群优化的支持向量机模型进行预测作为对照组1;将采用集成模态分解后使用滑动平均方法进行预测为对照组2;将采用集成模态分解后利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法作为对照组3;在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测作为对照组4;将所述预测方法作为实验组;
根据对照组1、对照组2、对照组3、对照组4和实验组的模型预测结果,计算每组预测结果的百分比误差和均方根误差,根据所述百分比误差和均方根误差对所述预测结果进行评价。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110481674.8A CN113222234B (zh) | 2021-04-30 | 2021-04-30 | 基于集成模态分解的用气需求预测方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110481674.8A CN113222234B (zh) | 2021-04-30 | 2021-04-30 | 基于集成模态分解的用气需求预测方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113222234A true CN113222234A (zh) | 2021-08-06 |
CN113222234B CN113222234B (zh) | 2024-04-09 |
Family
ID=77090515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110481674.8A Active CN113222234B (zh) | 2021-04-30 | 2021-04-30 | 基于集成模态分解的用气需求预测方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113222234B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114723173A (zh) * | 2022-04-27 | 2022-07-08 | 西安建筑科技大学 | 基于garch模型的天然气负荷波动对称性分析方法及系统 |
CN115166176A (zh) * | 2022-06-24 | 2022-10-11 | 山东科技大学 | 一种基于tcn模型的池塘溶解氧浓度预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794550A (zh) * | 2015-05-13 | 2015-07-22 | 山东科技大学 | 基于wt-kpca-svr耦合模型的瓦斯涌出量预测方法 |
CN107730054A (zh) * | 2017-11-15 | 2018-02-23 | 西南石油大学 | 一种基于支持向量回归的燃气负荷组合预测方法 |
CN109359778A (zh) * | 2018-11-13 | 2019-02-19 | 中石化石油工程技术服务有限公司 | 基于优化经验模态分解的短期天然气负荷预测方法 |
US20190130425A1 (en) * | 2017-10-31 | 2019-05-02 | Oracle International Corporation | Demand forecasting using weighted mixed machine learning models |
KR20190088092A (ko) * | 2017-12-28 | 2019-07-26 | 한국가스공사 | 공조기에서 가스 사용량 예측 알고리즘 적용 방법 |
CN110309965A (zh) * | 2019-06-26 | 2019-10-08 | 国家电网有限公司 | 一种基于改进支持向量机的电网投资需求预测方法及系统 |
-
2021
- 2021-04-30 CN CN202110481674.8A patent/CN113222234B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794550A (zh) * | 2015-05-13 | 2015-07-22 | 山东科技大学 | 基于wt-kpca-svr耦合模型的瓦斯涌出量预测方法 |
US20190130425A1 (en) * | 2017-10-31 | 2019-05-02 | Oracle International Corporation | Demand forecasting using weighted mixed machine learning models |
CN111295681A (zh) * | 2017-10-31 | 2020-06-16 | 甲骨文国际公司 | 使用加权混合机器学习模型进行需求预测 |
CN107730054A (zh) * | 2017-11-15 | 2018-02-23 | 西南石油大学 | 一种基于支持向量回归的燃气负荷组合预测方法 |
KR20190088092A (ko) * | 2017-12-28 | 2019-07-26 | 한국가스공사 | 공조기에서 가스 사용량 예측 알고리즘 적용 방법 |
CN109359778A (zh) * | 2018-11-13 | 2019-02-19 | 中石化石油工程技术服务有限公司 | 基于优化经验模态分解的短期天然气负荷预测方法 |
CN110309965A (zh) * | 2019-06-26 | 2019-10-08 | 国家电网有限公司 | 一种基于改进支持向量机的电网投资需求预测方法及系统 |
Non-Patent Citations (2)
Title |
---|
王平;王克凡;石雪涛;朱帮助;: "基于EEMD与LSSVR的能源消费量多尺度预测――以广东省为例", 内蒙古大学学报(自然科学版), no. 03, 15 May 2015 (2015-05-15), pages 234 - 240 * |
舒漫 等: "《城市天然气短期日需求量预测新模型》", 《天然气工业》, vol. 38, no. 6, pages 128 - 132 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114723173A (zh) * | 2022-04-27 | 2022-07-08 | 西安建筑科技大学 | 基于garch模型的天然气负荷波动对称性分析方法及系统 |
CN115166176A (zh) * | 2022-06-24 | 2022-10-11 | 山东科技大学 | 一种基于tcn模型的池塘溶解氧浓度预测方法 |
CN115166176B (zh) * | 2022-06-24 | 2024-03-26 | 山东科技大学 | 一种基于tcn模型的池塘溶解氧浓度预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113222234B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105391083B (zh) | 基于变分模态分解和相关向量机的风功率区间短期预测方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
Wang et al. | Wind speed forecasting based on multi-objective grey wolf optimisation algorithm, weighted information criterion, and wind energy conversion system: A case study in Eastern China | |
CN109345027B (zh) | 基于独立成分分析与支持向量机的微电网短期负荷预测方法 | |
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN110443417A (zh) | 基于小波变换的多模型集成负荷预测方法 | |
CN111027775A (zh) | 基于长短期记忆网络的梯级水电站发电量预测方法 | |
CN115099511A (zh) | 基于优化copula的光伏功率概率估计方法及系统 | |
CN116307652A (zh) | 一种智能电网人工智能资源分配方法 | |
CN110648017A (zh) | 一种基于二层分解技术的短期冲击负荷预测方法 | |
CN107609671A (zh) | 一种基于综合因素评价模型的短期电力负荷预测方法 | |
CN114912077B (zh) | 一种融合随机搜索与混合分解误差订正的海浪预报方法 | |
CN113222234A (zh) | 基于集成模态分解的用气需求预测方法及其系统 | |
CN112581172A (zh) | 一种基于经验模态分解的多模型融合售电量预测方法 | |
Boumaiza et al. | Modeling multi-criteria decision analysis in residential PV adoption | |
CN115239029B (zh) | 考虑功率时序及气象相依特性的风电功率预测方法及系统 | |
CN115186923A (zh) | 光伏发电功率的预测方法、装置及电子设备 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN114266416A (zh) | 基于相似日的光伏发电功率短期预测方法、装置及存储介质 | |
CN114548586A (zh) | 一种基于混合模型的短期电力负荷预测方法及系统 | |
Wang et al. | Multivariate time series prediction based on optimized temporal convolutional networks with stacked auto-encoders | |
CN117114160A (zh) | 一种短期光伏功率预测方法 | |
CN115809719A (zh) | 一种基于形态聚类的短期负荷预测修正方法 | |
CN117592593A (zh) | 基于改进二次模态分解和WOA优化BILSTM-attention的短期电力负荷预测方法 | |
CN116611859A (zh) | 基于梯度提升决策树的电力交易现货价差趋势预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |