CN113222234A - 基于集成模态分解的用气需求预测方法及其系统 - Google Patents

基于集成模态分解的用气需求预测方法及其系统 Download PDF

Info

Publication number
CN113222234A
CN113222234A CN202110481674.8A CN202110481674A CN113222234A CN 113222234 A CN113222234 A CN 113222234A CN 202110481674 A CN202110481674 A CN 202110481674A CN 113222234 A CN113222234 A CN 113222234A
Authority
CN
China
Prior art keywords
svr
training
data
model
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110481674.8A
Other languages
English (en)
Other versions
CN113222234B (zh
Inventor
付川
郝迎鹏
陈进殿
赵忠德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Petrochina Co Ltd
Original Assignee
Petrochina Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Petrochina Co Ltd filed Critical Petrochina Co Ltd
Priority to CN202110481674.8A priority Critical patent/CN113222234B/zh
Publication of CN113222234A publication Critical patent/CN113222234A/zh
Application granted granted Critical
Publication of CN113222234B publication Critical patent/CN113222234B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Water Supply & Treatment (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于集成模态分解的用气需求预测方法及其系统,该方法包括以下步骤:数据收集和处理、对数据中天然气负荷变化规律进行分析确定数据集选择范围、对数据进行归一化处理、对归一化后的数据序列进行集成模态分解得到IMF分量和残差量、利用IMF分量、残差量训练SVR模型、使用原始序列训练SVR模型、预测结果的嵌套模型训练和模型验证;对应的,该系统包括处理模块、分解模块、第一训练模块、第二训练模块、第三训练模块和预测模块;本发明采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练提高了预测结果的准确性且适用性更为广泛。

Description

基于集成模态分解的用气需求预测方法及其系统
技术领域
本发明属于天然气需求预测方法领域,特别涉及一种基于集成模态分解的用气需求预测方法及其系统。
背景技术
2017年初“气荒”事件发生引发社会广泛关注,2020年“新冠”病毒冲击局部地区天然气市场,实现天然气消费量精准预测关乎到国家民生大计。受宏观经济及能源调控影响,天然气市场处于快速变化态势,不均匀性愈加明显,实现天然气需求预测对优化调度、储气调峰具有着重要意义。
天然气需求预测是通过分析某一地区或用户天然气历史日负荷(消费量)的变化规律,建立预测模型来预测未来天然气需求的方法。非供暖季时期无供暖需求,因此天然气日负荷多以时序为主要变量进行需求预测。近年来天然气消费结构快速变化,采用多年的大数据集有欠拟合风险。经实验发现,采用同样为非供暖季时期、与预测时间相近、数据变化规律相近的小数据集作为训练集可提升预测精度。经典的机器学习算法如BP神经网络、RBF神经网络、小波神经网络等存在需要大量数据进行训练的问题。
天然气日负荷受天气、节假日、人口流动等多因素影响随机性明显。传统的时序预测模型算法如自回归移动平均模型(ARMA)等必须以时间序列平稳为前提条件,因此需要对原时间序列进行处理。电力系统负荷预测中有部分模型采用经验模态分解(EMD),基于经验模态分解理论可以将时间序列自适应地分解原始序列生成内涵模态分量(IMF)和一个代表信号总体趋势的剩余分量之和。将该方法应用于天然气负荷预测中发现,天然气日负荷随机性较强,分解过程中可能因不同模态分量频率相差较大致使三次样条插值法无法有效分离得到不同的IMF分量,或由于低频信号的高幅值特征峰缺少足够极值点,产生模态混叠效应,导致预测精度偏低。此外,在使用模态分解与预测算法组合进行预测过程中存在部分IMF高频分量精度较低易导致预测结果失真。本发明公开了一种涉及集成模态分解(EEMD)、粒子群算法(PSO)、支持向量机回归模型(SVR)的综合非供暖季天然气负荷预测方法。
发明内容
针对上述问题,本发明提供了一种基于集成模态分解的用气需求预测方法,所述预测方法包括以下步骤:
将训练集和验证集中的天然气日负荷按时序特征组成原始序列,其中,所述时序特征包括日期、节假日;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
用所述训练集分量和验证集分量训练若干个支持向量机回归模型SVR,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
用所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs
用所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm;
将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
进一步地,对所述支持向量机回归模型进行训练前需要对使用的数据进行处理,所述处理包括以下步骤:
收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
将所述数据集进行归一化处理。
进一步地,所述处理还包括构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
进一步地,得到所述预测结果后,对预测结果进行反归一化处理,得到预测值;所述反归一化处理与数据集采用的归一化处理规则一致。
进一步地,所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
进一步地,所述原始序列训练支持向量机回归模型时采用所述训练集训练,以时序特征为输入变量,以归一化后的天然气日负荷为输出变量。
进一步地,所述训练集分量和验证集分量训练所述支持向量机回归模型时,以所述训练集分量和验证集分量的时序特征作为输入变量,模态分解后的训练集分量和验证集分量为输出变量。
一种基于集成模态分解的用气需求预测系统,所述预测系统包括以下模块:
分解模块:将训练集和验证集中的天然气日负荷按时序特征组成原始序列;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
第一训练模块:用于采用所述训练集分量和验证集分量训练若干个支持向量机回归模型,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
第二训练模块:用于将所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs
第三训练模块:用于将所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm
预测模块:用于将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
进一步地,所述预测系统还包括处理模块,所述处理模块包括预处理单元、数据集单元、归一化单元;
预处理单元:用于收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
数据集单元:用于将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
归一化单元:用于将所述数据集进行归一化处理。
进一步地,所述处理模块还包括构建单元,用于构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
进一步地,所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
一种对所述预测方法和系统进行有效性评价的方法,所述方法包括以下步骤:
将对数据不进行处理,直接采用粒子群优化的支持向量机模型进行预测作为对照组1;将采用集成模态分解后使用滑动平均方法进行预测为对照组2;将采用集成模态分解后利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法作为对照组3;在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测作为对照组4;将所述预测方法作为实验组;
根据对照组1、对照组2、对照组3、对照组4和实验组的模型预测结果,计算每组预测结果的百分比误差和均方根误差,根据所述百分比误差和均方根误差对所述预测结果进行评价。
本发明所公开的基于集成模态分解的用气需求预测方法。选取适用小数据集的支持向量机回归模型(SVR)进行预测,超参数选取采用粒子群算法(PSO)进行参数寻优。针对经验模态分解中模态混叠问题采用集成模态分解(EEMD)进行改进(EEMD-SVR模型),降低时序模型建立条件中对于原始数据序列平稳的要求,使得模型适用面更广。针对高频IMF分量预测精度低导致的预测结果失真问题,采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练以建立综合预测模型的方法(IEEMD-SVR-SVR)提升天然气日负荷预测精度。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例的IEEMD-SVR-SVR的基本数据流向图;
图2示出了本发明实施例的EEMD分解流程图;
图3示出了本发明实施例的EMD分解流程图;
图4示出了本发明实施例PSO优化SVR预测模型流程图;
图5示出了传统的基于EEMD分解的预测模型流程图;
图6示出了本发明实施例2015-2017年A市天然气月度消费量不均匀系数图;
图7示出了PSO-SVR模型、EEMD-ARMA模型、EEMD-SVR模型、EEMD-SVR-SVR模型、EEMD-SVR-SVR五种模型对非供暖季时期天然气日负荷的预测误差以及实际值对比结果图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明针对天然气消费结构逐年快速变化、非供暖季时期日负荷变化随机性较强的特征,选取适用小数据集的支持向量机回归模型(SVR)进行预测,超参数选取采用粒子群算法(PSO)进行参数寻优。针对经验模态分解中模态混叠问题采用集成模态分解(EEMD)进行改进(EEMD-SVR模型)。针对高频IMF分量预测精度低导致的预测结果失真问题,采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练以建立综合预测模型(IEEMD-SVR-SVR)的方法,提升天然气日负荷预测精度。
该预测方法包括以下步骤:
A、数据收集及数据预处理;采集被预测地区近3年的天然气年度分日消费量与时序特征值(如日期、节假日、相似日等),进行数据清洗、数据变换、数据集成等数据预处理,形成标准化数据集格式。
B、天然气负荷变化规律分析与数据集选择范围;分析天然气日负荷变化规律,厘清天然气日负荷变化阶段性特征,依据测试集选取训练集和验证集数据,验证集用于辅助构建模型。根据天然气年度消费量规模大小、天然气消费结构的相似程度、供暖季起止时间、分日消费量的变化规律按照“就近原则”以测试集起始时间向前选取同一年份、去年同一时期数据作为模型训练集与验证集。
C、数据归一化;将选取的训练集、验证集、测试集组成数据集,按照统一规则进行归一化,统一规则指训练集、验证集、测试集中的数据归一化公式、最大值、最小值选取保持一致。
D、EEMD分解;将归一化后的训练集和验证集中的天然气日负荷按时序组成天然气日负荷序列(即按时间排序的、归一化后的天然气日负荷序列)进行EEMD分解,得到多个不同时间尺度的内涵模态分量IMF(记作IMF1,IMF2…IMFn-1)和一个残差分量(记作Res)。将分解后的内涵模态分量和残差分量按日期重新分为训练集分量(IMF1',IMF2'…IMFn',Res')和验证集分量(IMF1”,IMF2”…IMFn”,Res”)。
具体地,对EEMD分解进行详细说明,EEMD分解是针对EMD分解出现的模态混叠问题,在信号分解中不断添加频率均匀分布的高斯白噪声以平滑异常信号,通过多次EMD分解得到IMF分量做整体平均以克服模态混叠,使信号在不同尺度上具有连续性。EEMD分解流程如图2所示:
①向原始序列中加入均匀频率但不等幅的高斯白噪声序列:
ym(t)=y(t)+nm(t) (1-1)
其中,y(t)为原始序列,nm(t)为高斯白噪声序列,ym(t)为添加高斯白噪声序列后的混合序列,t表示时间,单位为天。
②对ym(t)进行EMD分解,得到n个IMF分量IMF(i)及残余项。
③重复步骤①②k次,分解得到k组,每组n个IMF分量IMFm(i)残余项
Figure BDA0003049492940000071
其中每次加入的高斯白噪声满足下式条件:
a=ek或lne+0.5alnk=0 (1-2)
式中,e为原始序列标准差,表征原始序列和EMD重构结果的差异程度,a为高斯白噪声幅值,k为预设分解次数。即分解次数与高斯白噪声幅值呈负相关,以减少噪声对分解结果的影响。
④对k组IMF分量取算数平均,把n个IMF均值作为EEMD最终分解的结果。
Figure BDA0003049492940000072
其中,IMFeemd(i)为EEMD分解后第i个IMF分量,IMFm(i)为k组IMF分量中第m组的第i个IMF分量,k为预设分解次数。
其中步骤②中EMD分解流程可参照图3,
经验模态分解(EMD)的主要思想为:EMD可将任何信号(序列)中不同时间尺度的波动逐级分解为若干不同内涵模态分量(IMF)和一个代表信号总体趋势的剩余分量之和。其中IMF分量需要满足以下两个假设:
一是在整个波形内,信号波的极值点与过零点次数至多相差1;
二是在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称。
具体分解步骤如图3所示:
1)确定原始序列y(t)的极大值和极小值点,利用三次样条函数拟合上下包络线bup(t),bdown(t),取二者均值得到平均包络线bi(t);
Figure BDA0003049492940000073
2)计算原始序列y(t)与平均包络线bi(t)的差值hi(t);
3)若序列hi(t)不满足上述IMF两个假设条件,则将hi(t)作为新序列重复上述①②步骤直至hi(t)满足条件;若序列hi(t)满足上述IMF两个假设条件,此时hi(t)为第1个IMF序列,记作IMF1(t);
4)计算剩余信号(剩余序列),计算公式如式1-5所示:
r(t)=y(t)-∑IMFi(t) (1-5)
将剩余序列作为新序列,重复1)~3)继续进行分解直至r(t)无法继续分解或满足预设条件,此时得到一系列IMFi(t)(i=1,2,3……)与残余项,将残余项计作rn(t),此时原始序列可以写作:
Figure BDA0003049492940000081
此时,原始序列分解成为n个幅值、频率均不同的IMF分量和余项rn(t),根据分解序列的调频特性可分辨噪声及有用信号。
E、IMF分量、残差量(Res)训练SVR模型;将训练集分量和验证集分量的时序特征作为输入变量,以模态分解后的训练集分量(IMF1',IMF2'…IMFn',Res')和验证集分量(IMF1”,IMF2”…IMFn”,Res”)为输出变量训练n+1个SVR模型;其中,n个模型的输入变量为时序特征,1个模型的输出变量为剩余分量(Res),训练后的SVR模型,记为{SVR1,SVR2…SVRn,SVRr}。
建立SVR模型过程中,核函数直接决定了支持向量与核方法的最终性能,但核函数的选择一直是一个未解决的问题。SVR模型主要采用台湾大学林智仁提供的LibSVM工具箱,其中核函数简化成表1所示的四种形式。
表1常用核函数
Figure BDA0003049492940000091
本发明通过试算对比的方法选取核函数。此外,超参数选取决定影响SVR拟合效果。超参数C值选取的大小决定模型对落在“间隔带”外点的宽度,超参数是在选择高斯核或拉欧拉斯核函数时高斯带宽参数。参数寻优过程中采用全局搜索方法占用资源率较高,本发明采用粒子群寻优算法(PSO)方法进行全局寻优,PSO一种基于群体智能的全局随机搜索算法,假设在l维搜索空间中,有n个粒子形成群落,其中第i个粒子在第k次迭代的位移参数和速度参数分别为:
Figure BDA0003049492940000092
Figure BDA0003049492940000093
第i个粒子迭代至第k次为止搜索到的最优位置为个体极值,记为:
Figure BDA0003049492940000094
粒子群迄今为止搜索到的最优位置为全局极值,记为:
Figure BDA0003049492940000095
其中,
Figure BDA0003049492940000096
分别表示从1维至l维空间内每一次迭代的最优位置。
迭代过程中,粒子速度和位移的更新公式为:
Figure BDA0003049492940000097
Figure BDA0003049492940000098
其中:
Figure BDA0003049492940000101
代表第i个粒子在第k次迭代中第d维数值速度标量,范围为[vmin,vmax],防止速度过快飞过最优解;ωk-1代表第k-1次迭代中的惯性权重,加快收敛速度;
Figure BDA0003049492940000102
表示第i个粒子在第k-1次迭代中第d维数值速度标量;c1、c2为加速因子;r1、r2为分布在[0,1]中的正态随机数。
Figure BDA0003049492940000103
表示在第i个粒子迭代至第k-1次时,第d维数值的最优位置;
Figure BDA0003049492940000104
代表第i个粒子在第k-1次迭代中第d维数值的位置标量,
Figure BDA0003049492940000105
表示在迭代至第k-1次时,第d维数值中群体的最优位置,
Figure BDA0003049492940000106
代表第i个粒子在第k次迭代中第d维数值的位置标量,
Figure BDA0003049492940000107
表示代表第i个粒子在第k-1次迭代中第d维数值速度标量。
采用PSO算法进行SVR参数寻优步骤如附图4所示:
(1)输入SVR训练集数据,设置PSO算法初始值包括c1,c2,种群迭代最大代数k值、个体更新权重wv,整体更新权重wp,交叉验证折数k,参数C及γ最大变化范围。
(2)初始化种群,生成随机粒子及随机解,计算初代粒子适应度,适应度函数选用对训练集进行k折交叉验证的均方误差。
Figure BDA0003049492940000108
其中,yi、yri分别为k折计算中原始样本的预测值及真实值。
(3)计算本次迭代中个体适应度的粒子。将每个粒子的个体极值
Figure BDA0003049492940000109
设为当前位置
Figure BDA00030494929400001010
计算种群中适应度最高(即均方误差最低)的粒子为初代的种群最优位置
Figure BDA00030494929400001011
(4)根据式1-11,式1-12进行的迭代更新计算。若更新后个体适应度优于
Figure BDA00030494929400001012
则该粒子位置替代
Figure BDA00030494929400001013
(5)判断是否达到最大迭代次数或是否满足终止条件,若满足,则输出全局最优的C、γ。否则返回步骤(4)继续迭代。
F、原始序列的SVR模型训练。将归一化后的训练集以时序特征输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRs
G、预测结果的嵌套模型训练。将{SVR1,SVR2…SVRn}及SVRs输出值为输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRm
H、模型验证。将测试集代入{SVR1,SVR2…SVRn}、SVRs中,将模型所得结果代入SVRm后得出预测结果,最后按照步骤C中的规则反归一化,得到测试集的预测值。
示例性地,以以预测Y城市2017年8月20日-8月29日天然气日需求为例对该预测方法进行说明。
数据收集及数据预处理。收集Y城市2015年1月1日-2017年8月19日天然气历史日负荷数据,进行数据清洗、数据变换、数据集成等数据预处理。将数据集转化为格式统一、无异常值、无缺省数据集。
从获取的数据中对天然气日负荷变化规律进行分析和数据集的选择范围,包括训练集、测试集和验证集。以月度为单位分析天然气的月负荷不均匀性,观察天然气日负荷变化规律,不均匀系数的计算公式如公式1-14所示:
Figure BDA0003049492940000111
其中,η为月不均匀系数,Qm为当月负荷,m3/月,
Figure BDA0003049492940000112
为年平均月负荷,m3/月。计算结果如图6所示,从图中可以看出天然气不均匀性逐年升高并且具有明显的季节性,2015年-2017年期间非供暖季5月-9月之间,不均匀系数变化范围0.24-0.30。选择2017年8月10日-8月19日为数据验证集,选取2016年8月1日-2016年9月30日、2017年5月1日-8月9日的消费量为训练集。
将选取的162组训练集、10组验证集和10组测试集组成数据集,按照统一规则进行归一化,输入端数据集为时序特征变量,包括日期、节假日特征值,输出端为天然气日负荷。
EEMD分解。将归一化后的训练集和验证集中的天然气消费量共172组数据按日期时序组成天然气日负荷序列进行EEMD分解,得到6个不同时间尺度的内涵模态分量IMF(记作IMF1,IMF2…,IMF6)和1个残差分量(记作Res);将分解后的模态分量和残差分量按日期的前162组分为训练集分量(IMF1',IMF2'…IMFn-1',Res'),后10组为验证集分量(IMF1",IMF2"…,IMFn-1",Res")。
用IMF分量、残差量(Res)训练SVR模型,将时序特征变量作为输入变量,模态分解后的训练集分量(IMF1',IMF2'…IMF6',Res')和验证集分量(IMF1”,IMF2”…IMF6”,Res”)分别训练7个SVR模型,记为{SVR1,SVR2…SVR6,SVRr}。
原始序列的SVR模型训练。将归一化后的训练集以时序特征值为输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRs
预测结果的嵌套模型训练。将{SVR1,SVR2…SVR6,SVRr}及SVRs输出值为输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVRm
模型预测输出。将选取的测试集代入{SVR1,SVR2…SVRn}、SVRs中,将模型所得结果代入SVRm后得出预测结果,最后按照归一化的规则反归一化,得到测试集在IEEMD-SVR-SVR的预测值。
模型效果评价。为评价IEEMD-SVR-SVR模型预测效果,分别将步骤F中训练完成的SVRs模型作为未添加模态分解的单一模型对照组模型(记作PSO-SVR)、参照附图5的传统EEMD分解模型中将预测模型分别用ARMA和SVR模型作为预测算法对照组(记作EEMD-ARMA模型、EEMD-SVR模型),在步骤G中取消添加原始序列的训练模型SVRs作为改进算法对照组(记作EEMD-SVR-SVR模型)分别观察预测效果,采用本发明方法的模型记为IEEMD-SVR-SVR模型。
PSO-SVR表示不进行数据处理,直接采用粒子群优化的支持向量机模型进行预测;EEMD-ARMA表示在进行集成模态分解后采用滑动平均方法进行预测,EEMD-SVR表示在集成模态分解后,利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法;EEMD-SVR-SVR表示在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测;IEEMD-SVR-SVR表示改进的EEMD-SVR-SVR模型,即本文提出的方法,重新引入了最原始天然气日负荷序列所构建的SVR模型作为最终模型的参考变量之一进行预测(保留原始数据中的部分细节变量)。
表2五种模型预测误差对比表
Figure BDA0003049492940000131
五种模型的的预测结果如表2所示,IEEMD-SVR-SVR的百分比误差(MAPE)值为2.13%、均方根误差(RSME)值为4.80,相对其余四种模型明显下降,具有较好的预测效果。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种基于集成模态分解的用气需求预测方法,其特征在于,所述预测方法包括以下步骤:
将训练集和验证集中的天然气日负荷按时序特征组成原始序列,其中,所述时序特征包括日期、节假日;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
用所述训练集分量和验证集分量训练若干个支持向量机回归模型SVR,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
用所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs
用所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm
将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
2.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
对所述支持向量机回归模型进行训练前需要对使用的数据进行处理,所述处理包括以下步骤:
收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
将所述数据集进行归一化处理。
3.根据权利要求2所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述处理还包括构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
4.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
得到所述预测结果后,对预测结果进行反归一化处理,得到预测值;所述反归一化处理与数据集采用的归一化处理规则一致。
5.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
6.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述原始序列训练支持向量机回归模型时采用所述训练集训练,以时序特征为输入变量,以归一化后的天然气日负荷为输出变量。
7.根据权利要求1所述的一种基于集成模态分解的用气需求预测方法,其特征在于,
所述训练集分量和验证集分量训练所述支持向量机回归模型时,以所述训练集分量和验证集分量的时序特征变量作为输入变量,模态分解后的训练集分量和验证集分量为输出变量。
8.一种基于集成模态分解的用气需求预测系统,其特征在于,所述预测系统包括以下模块:
分解模块:将训练集和验证集中的天然气日负荷按时序特征组成原始序列;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;
第一训练模块:用于采用所述训练集分量和验证集分量训练若干个支持向量机回归模型,训练后的模型记为{SVR1,SVR2…SVRn,SVRr};
第二训练模块:用于将所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVRs
第三训练模块:用于将所述{SVR1,SVR2…SVRn,SVRr}及SVRs模型训练所述支持向量机回归模型,记为SVRm
预测模块:用于将测试集代入{SVR1,SVR2…SVRn}和SVRs模型中,将所述{SVR1,SVR2…SVRn}模型所得结果代入SVRm后得出预测结果。
9.根据权利要求8所述的一种基于集成模态分解的用气需求预测系统,其特征在于,
所述预测系统还包括处理模块,所述处理模块包括预处理单元、数据集单元、归一化单元;
预处理单元:用于收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;
数据集单元:用于将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;
归一化单元:用于将所述数据集进行归一化处理。
10.根据权利要求9所述的一种基于集成模态分解的用气需求预测系统,其特征在于,
所述处理模块还包括构建单元,用于构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。
11.根据权利要求8所述的一种基于集成模态分解的用气需求预测系统,其特征在于,
所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。
12.一种对权利要求1-11所述的预测方法和系统进行有效性评价的方法,其特征在于,所述方法包括以下步骤:
将对数据不进行处理,直接采用粒子群优化的支持向量机模型进行预测作为对照组1;将采用集成模态分解后使用滑动平均方法进行预测为对照组2;将采用集成模态分解后利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法作为对照组3;在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测作为对照组4;将所述预测方法作为实验组;
根据对照组1、对照组2、对照组3、对照组4和实验组的模型预测结果,计算每组预测结果的百分比误差和均方根误差,根据所述百分比误差和均方根误差对所述预测结果进行评价。
CN202110481674.8A 2021-04-30 2021-04-30 基于集成模态分解的用气需求预测方法及其系统 Active CN113222234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110481674.8A CN113222234B (zh) 2021-04-30 2021-04-30 基于集成模态分解的用气需求预测方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110481674.8A CN113222234B (zh) 2021-04-30 2021-04-30 基于集成模态分解的用气需求预测方法及其系统

Publications (2)

Publication Number Publication Date
CN113222234A true CN113222234A (zh) 2021-08-06
CN113222234B CN113222234B (zh) 2024-04-09

Family

ID=77090515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110481674.8A Active CN113222234B (zh) 2021-04-30 2021-04-30 基于集成模态分解的用气需求预测方法及其系统

Country Status (1)

Country Link
CN (1) CN113222234B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723173A (zh) * 2022-04-27 2022-07-08 西安建筑科技大学 基于garch模型的天然气负荷波动对称性分析方法及系统
CN115166176A (zh) * 2022-06-24 2022-10-11 山东科技大学 一种基于tcn模型的池塘溶解氧浓度预测方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794550A (zh) * 2015-05-13 2015-07-22 山东科技大学 基于wt-kpca-svr耦合模型的瓦斯涌出量预测方法
CN107730054A (zh) * 2017-11-15 2018-02-23 西南石油大学 一种基于支持向量回归的燃气负荷组合预测方法
CN109359778A (zh) * 2018-11-13 2019-02-19 中石化石油工程技术服务有限公司 基于优化经验模态分解的短期天然气负荷预测方法
US20190130425A1 (en) * 2017-10-31 2019-05-02 Oracle International Corporation Demand forecasting using weighted mixed machine learning models
KR20190088092A (ko) * 2017-12-28 2019-07-26 한국가스공사 공조기에서 가스 사용량 예측 알고리즘 적용 방법
CN110309965A (zh) * 2019-06-26 2019-10-08 国家电网有限公司 一种基于改进支持向量机的电网投资需求预测方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794550A (zh) * 2015-05-13 2015-07-22 山东科技大学 基于wt-kpca-svr耦合模型的瓦斯涌出量预测方法
US20190130425A1 (en) * 2017-10-31 2019-05-02 Oracle International Corporation Demand forecasting using weighted mixed machine learning models
CN111295681A (zh) * 2017-10-31 2020-06-16 甲骨文国际公司 使用加权混合机器学习模型进行需求预测
CN107730054A (zh) * 2017-11-15 2018-02-23 西南石油大学 一种基于支持向量回归的燃气负荷组合预测方法
KR20190088092A (ko) * 2017-12-28 2019-07-26 한국가스공사 공조기에서 가스 사용량 예측 알고리즘 적용 방법
CN109359778A (zh) * 2018-11-13 2019-02-19 中石化石油工程技术服务有限公司 基于优化经验模态分解的短期天然气负荷预测方法
CN110309965A (zh) * 2019-06-26 2019-10-08 国家电网有限公司 一种基于改进支持向量机的电网投资需求预测方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王平;王克凡;石雪涛;朱帮助;: "基于EEMD与LSSVR的能源消费量多尺度预测――以广东省为例", 内蒙古大学学报(自然科学版), no. 03, 15 May 2015 (2015-05-15), pages 234 - 240 *
舒漫 等: "《城市天然气短期日需求量预测新模型》", 《天然气工业》, vol. 38, no. 6, pages 128 - 132 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723173A (zh) * 2022-04-27 2022-07-08 西安建筑科技大学 基于garch模型的天然气负荷波动对称性分析方法及系统
CN115166176A (zh) * 2022-06-24 2022-10-11 山东科技大学 一种基于tcn模型的池塘溶解氧浓度预测方法
CN115166176B (zh) * 2022-06-24 2024-03-26 山东科技大学 一种基于tcn模型的池塘溶解氧浓度预测方法

Also Published As

Publication number Publication date
CN113222234B (zh) 2024-04-09

Similar Documents

Publication Publication Date Title
CN105391083B (zh) 基于变分模态分解和相关向量机的风功率区间短期预测方法
CN111563706A (zh) 一种基于lstm网络的多变量物流货运量预测方法
Wang et al. Wind speed forecasting based on multi-objective grey wolf optimisation algorithm, weighted information criterion, and wind energy conversion system: A case study in Eastern China
CN109345027B (zh) 基于独立成分分析与支持向量机的微电网短期负荷预测方法
CN111860982A (zh) 一种基于vmd-fcm-gru的风电场短期风电功率预测方法
CN110443417A (zh) 基于小波变换的多模型集成负荷预测方法
CN111027775A (zh) 基于长短期记忆网络的梯级水电站发电量预测方法
CN115099511A (zh) 基于优化copula的光伏功率概率估计方法及系统
CN116307652A (zh) 一种智能电网人工智能资源分配方法
CN110648017A (zh) 一种基于二层分解技术的短期冲击负荷预测方法
CN107609671A (zh) 一种基于综合因素评价模型的短期电力负荷预测方法
CN114912077B (zh) 一种融合随机搜索与混合分解误差订正的海浪预报方法
CN113222234A (zh) 基于集成模态分解的用气需求预测方法及其系统
CN112581172A (zh) 一种基于经验模态分解的多模型融合售电量预测方法
Boumaiza et al. Modeling multi-criteria decision analysis in residential PV adoption
CN115239029B (zh) 考虑功率时序及气象相依特性的风电功率预测方法及系统
CN115186923A (zh) 光伏发电功率的预测方法、装置及电子设备
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN114266416A (zh) 基于相似日的光伏发电功率短期预测方法、装置及存储介质
CN114548586A (zh) 一种基于混合模型的短期电力负荷预测方法及系统
Wang et al. Multivariate time series prediction based on optimized temporal convolutional networks with stacked auto-encoders
CN117114160A (zh) 一种短期光伏功率预测方法
CN115809719A (zh) 一种基于形态聚类的短期负荷预测修正方法
CN117592593A (zh) 基于改进二次模态分解和WOA优化BILSTM-attention的短期电力负荷预测方法
CN116611859A (zh) 基于梯度提升决策树的电力交易现货价差趋势预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant