CN110633846A - 燃气负荷预测方法和装置 - Google Patents
燃气负荷预测方法和装置 Download PDFInfo
- Publication number
- CN110633846A CN110633846A CN201910822953.9A CN201910822953A CN110633846A CN 110633846 A CN110633846 A CN 110633846A CN 201910822953 A CN201910822953 A CN 201910822953A CN 110633846 A CN110633846 A CN 110633846A
- Authority
- CN
- China
- Prior art keywords
- gas load
- prediction
- prediction model
- predicted
- relative error
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000009499 grossing Methods 0.000 claims description 29
- 238000012417 linear regression Methods 0.000 claims description 23
- 238000007477 logistic regression Methods 0.000 claims description 19
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 6
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims 2
- 230000001419 dependent effect Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 210000002569 neuron Anatomy 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000011161 development Methods 0.000 description 7
- 238000005311 autocorrelation function Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000036961 partial effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000000611 regression analysis Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000005314 correlation function Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000013178 mathematical model Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000000630 rising effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Public Health (AREA)
- Algebra (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
Abstract
本发明提供一种燃气负荷预测方法和装置,所述方法包括以下步骤:通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值;基于信息熵获取每个预测模型对应的加权系数;根据每个预测模型对应的燃气负荷预测值和加权系数获取待预测对象的燃气负荷组合预测结果。本发明能够方便而又准确地实现对燃气负荷的预测。
Description
技术领域
本发明涉及燃气负荷预测技术领域,具体涉及一种燃气负荷预测方法和一种燃气负荷预测装置。
背景技术
城市燃气负荷是各种不同类型用户负荷的汇总,是一个随时间变化的动态过程。随着时间推移,目前普遍采用的单一数学模型不一定适用于未来负荷的预测,而且进行数学建模都是基于一种理想抽象稳定的假设,而用单一的数学模型很难反应负荷发展的自然规律,如果只是简单地将预测误差较大的一些模型舍弃,将很可能丢弃一些有价值的模型。因此,目前的燃气负荷预测方式难以对燃气负荷进行准确的预测。
发明内容
本发明为解决上述技术问题,提供了一种燃气负荷预测方法和装置,能够方便而又准确地实现对燃气负荷的预测。
本发明采用的技术方案如下:
一种燃气负荷预测方法,包括以下步骤:通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值;基于信息熵获取每个预测模型对应的加权系数;根据每个预测模型对应的所述燃气负荷预测值和所述加权系数获取所述待预测对象的燃气负荷组合预测结果。
基于信息熵获取每个预测模型对应的加权系数,具体包括:获取每个预测模型对应的燃气负荷预测值的相对误差;将每个预测模型对应的燃气负荷预测值的相对误差进行归一化;根据每个预测模型对应的燃气负荷预测值的相对误差归一化结果计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵;根据每个预测模型对应的燃气负荷预测值的相对误差的信息熵计算每个预测模型对应的加权系数。
根据下式将每个预测模型对应的燃气负荷预测值的相对误差进行归一化:
其中,pit为所述归一化结果,eit为通过第i个预测模型在第t时刻预测得到的燃气负荷预测值的相对误差,i=1,2,…,m,t=1,2,…,n,m为预测模型的总个数,n为总时刻数;
根据下式计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵:
其中,hi为第i个预测模型对应的燃气负荷预测值的相对误差的信息熵,k为常数;
根据下式计算每个预测模型对应的加权系数:
根据下式计算所述待预测对象的燃气负荷组合预测结果:
所述多个预测模型包括岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指数平滑法、ARIMA时间序列、MLP神经网络、指标法、Xgboost模型中的多个。
一种燃气负荷预测装置,包括:单模型预测模块,所述单模型预测模块用于通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值;系数获取模块,所述系数获取模块用于基于信息熵获取每个预测模型对应的加权系数;结果获取模块,所述结果获取模块用于根据每个预测模型对应的所述燃气负荷预测值和所述加权系数获取所述待预测对象的燃气负荷组合预测结果。
所述系数获取模块具体用于:获取每个预测模型对应的燃气负荷预测值的相对误差;将每个预测模型对应的燃气负荷预测值的相对误差进行归一化;根据每个预测模型对应的燃气负荷预测值的相对误差归一化结果计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵;根据每个预测模型对应的燃气负荷预测值的相对误差的信息熵计算每个预测模型对应的加权系数。
所述系数获取模块根据下式将每个预测模型对应的燃气负荷预测值的相对误差进行归一化:
其中,pit为所述归一化结果,eit为通过第i个预测模型在第t时刻预测得到的燃气负荷预测值的相对误差,i=1,2,…,m,t=1,2,…,n,m为预测模型的总个数,n为总时刻数;
所述系数获取模块根据下式计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵:
其中,hi为第i个预测模型对应的燃气负荷预测值的相对误差的信息熵,k为常数;
所述系数获取模块根据下式计算每个预测模型对应的加权系数:
其中,li为第i个预测模型对应的加权系数,
所述结果获取模块根据下式计算所述待预测对象的燃气负荷组合预测结果:
所述多个预测模型包括岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指数平滑法、ARIMA时间序列、MLP神经网络、指标法、Xgboost模型中的多个。
本发明的有益效果:
本发明首先通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值,然后基于信息熵获取每个预测模型对应的加权系数,最后根据每个预测模型对应的燃气负荷预测值和加权系数获取待预测对象的燃气负荷组合预测结果,由此,采用信息熵组合预测方式能有效较低整体预测方差,降低某个预测值存在较大误差的可能性,使预测结果整体平稳,从而能够方便而又准确地实现对燃气负荷的预测。
附图说明
图1为本发明实施例的燃气负荷预测方法的流程图;
图2为利用Xgboost模型的建模预测流程图;
图3为本发明实施例的燃气负荷预测装置的方框示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例的燃气负荷预测方法包括以下步骤:
S1,通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值。
在本发明的一个实施例中,多个预测模型可包括岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指数平滑法、ARIMA时间序列、MLP神经网络、指标法、Xgboost模型中的多个。
一般地,基于各模型自身的适用范围及特点,年、月、日负荷预测所采用的模型不同。其中,年负荷可采用岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指标法模型进行预测;月负荷可采用岭回归、Lasso回归、Xgboost、线性回归、灰色理论、Logistic回归、指数平滑法和ARIMA模型进行预测;日负荷预测可采用岭回归、Lasso回归、Xgboost、线性回归、MLP神经网络、ARIMA、指数平滑法模型进行预测。
下面对上述各模型进行简单介绍。
一、线性回归模型:
在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合(自变量都是一次方)。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。
线性回归的模型函数:
hθ=θTx
其损失函数如下:
通过训练数据集寻找参数的最优解,即求解可以得到min(J(θ))的参数向量θ,其中这里的参数向量也可以分为参数和w和b,分别表示权重和偏置值,常见的求解最优解的方法有最小二乘法和梯度下降法。
如果采用梯度下降法,则θ的迭代公式如下:
θ=θ-αXT(Xθ-Y)
如果采用最小二乘法,则θ的迭代公式如下:
θ=(XTX)-1XTY
二、岭回归模型:
岭回归是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。是对不适定问题进行回归分析时最经常使用的一种正则化方法。
在有些情况下,靠传统典型的回归分析的方法去训练样本进行无偏估计会遇到问题,比如若训练样本数量少,甚至少于样本维数,这样将导致数据矩阵无法求逆;又比如样本特征中存在大量相似的特征,将导致很多参数所代表的意义重复。这个时候岭回归在求取参数的解析解的时候,在原来的基础上在求逆矩阵内部加上一个对角矩阵,原来不可求逆的数据矩阵就可以求逆了。此外,对角矩阵其实是由一个参数λ和单位对角矩阵相乘组成。λ越大,说明偏差就越大,原始数据对回归求取参数的作用就越小,当λ取到一个合适的值,就能在一定意义上解决过拟合的问题:原先过拟合的特别大或者特别小的参数会被约束到正常甚至很小的值,但不会为零。
综上,通常岭回归方程的R平方值会稍低于普通回归分析,但回归系数的显著性往往明显高于普通回归,在存在共线性问题和病态数据偏多的研究中有较大的实用价值。
三、Lasso回归模型:
Lasso(Least absolute shrinkage and selection operator)是一种压缩估计,它通过构造一个惩罚函数得到一个较为精炼的模型,使得它压缩一些系数,同时设定一些系数为零。因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。
Lasso回归有时也叫做线性回归的L1正则化,和Ridge回归的主要区别就是在正则化项,Ridge回归用的是L2正则化,而Lasso回归用的是L1正则化。Lasso回归的特色就是在建立广义线型模型的时候,这里广义线型模型包含一维连续因变量、多维连续因变量、非负次数因变量、二元离散因变量、多元离散因变,除此之外,无论因变量是连续的还是离散的,Lasso都能处理,总的来说,lasso对于数据的要求是极其低的,所以应用程度较广;除此之外,lasso还能够对变量进行筛选和对模型的复杂程度进行降低。这里的变量筛选是指不把所有的变量都放入模型中进行拟合,而是有选择的把变量放入模型从而得到更好的性能参数。复杂度调整是指通过一系列参数控制模型的复杂度,从而避免过度拟合(Overfitting)。对于线性模型来说,复杂度与模型的变量数有直接关系,变量数越多,模型复杂度就越高。更多的变量在拟合时往往可以给出一个看似更好的模型,但是同时也面临过度拟合的危险。
lasso的复杂程度由λ来控制,λ越大对变量较多的线性模型的惩罚力度就越大,从而最终获得一个变量较少的模型。除此之外,另一个参数α来控制应对高相关性(highlycorrelated)数据时模型的性状。Lasso回归α=1,Ridge回归α=0,这就对应了惩罚函数的形式和目的。可以通过尝试若干次不同值下的λ,来选取最优λ下的参数。
四、Logistic回归模型:
Logistic回归是二分类任务中最常用的机器学习算法之一。它的设计思路简单,易于实现,可以用作性能基准,且在很多任务中都表现很好。
logistic回归(Logistic regression)与多重线性回归有很多相同之处,最大的区别就在于他们的因变量不同,正是因为如此,这两种回归可以归为广义线性模型(generalized linear model)。如果因变量是连续的,就是多重线性回归,如果因变量是二项分布,就是logistic回归
Logistic回归是一种被人们广泛使用的算法,因为它非常高效,不需要太大的计算量,又通俗易懂,不需要缩放输入特征,不需要任何调整,且很容易调整,并且输出校准好的预测概率。它的另外一个优点是是它非常容易实现,且训练起来比较高效。
五、灰色理论模型:
如果一个系统具有层次、结构关系的模糊性,动态变化的随机性,指标数据的不完备或不确定性,则称这些特性为灰色性。具有灰色性的系统称为灰色系统。对灰色系统建立的预测模型称为灰色模型(Grey Model),简称GM模型,它揭示了系统内部事物连续发展变化的过程。
灰色模型(grey models)就是通过少量的、不完全的信息,建立灰色微分预测模型,对事物发展规律作出模糊性的长期描述。从灰色系统中抽象出来的模型。灰色系统是既含有已知信息,又含有未知信息或非确知信息的系统,这样的系统普遍存在。研究灰色系统的重要内容之一是如何从一个不甚明确的、整体信息不足的系统中抽象并建立起一个模型,该模型能使灰色系统的因素由不明确到明确,由知之甚少发展到知之较多提供研究基础。灰色系统理论是控制论的观点和方法延伸到社会、经济领域的产物,也是自动控制科学与运筹学数学方法相结合的结果。
灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。
灰色预测的优点主要有如下几点:1、不需要大量样本;2、样本不需要有规律性分布;3、计算工作量小;4、定量分析结果与定性分析结果不会不一致;5、可用于Recent、短期、中长期预测。
本发明实施例所采用的灰色理论模型可为GM(1,1)模型,其建模预测步骤如下:
(1)数据的检验与处理
为了保证GM(1,1)建模方法的可行性,需要对已知数据做必要的检验处理。设原始数据列为x(0)=(x0(1),x0(2),….x0(n)),然后利用如下公式计算数列的级比:
如果所有的级比都落在可容覆盖区间内,则数列x(0)可以建立GM(1,1)模型且可以进行灰色预测。否则,对数据做适当的变换处理。
(2)建立GM(1,1)模型
以之前满足条件的数列x(0)建立GM(1,1)模型:
x(0)(k)+αz(1)(k)=b
用回归分析求得a,b的估计值,于是相应的白化模型为:
它的解为:
于是得到预测值:
从而相应地得到GM(1,1)的预测值:
X(0)(k+1)=X(1)(k+1)-X(1)(k)
(3)检验预测值
①残差检验
如果对所有的|ε(k)|<0.1,则认为到达较高的要求;否则,若对所有的|ε(k)|<0.2,则认为达到一般要求。
②级比偏差值检验:
如果对所有的|ρ(k)|<0.1,则认为达到较高的要求;否则,若对于所有的|ρ(k)|<0.2,则认为达到一般要求。
六、指数平滑法:
指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测,所有预测方法中,指数平滑是用得最多的一种。简单的全期平均法是对时间数列的过去数据一个不漏地全部加以同等利用;移动平均法则不考虑较远期的数据,并在加权移动平均法中给予近期资料更大的权重;而指数平滑法则兼容了全期平均和移动平均所长,不舍弃过去的数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。
一般常用到的指数平滑法为一次指数平滑、二次指数平滑和三次指数平滑。一次指数平滑一般应用于直线型数据,且一次指数平滑具有滞后性,可以说明有明显的时间性、季节性。二次指数平滑一般也应用于直线型,但是效果会比一次指数平滑好很多,也就相当于加强版的一次指数平滑。三次指数平滑可以应用于抛物线型的数据,因为数据在二次平滑过后还是具有斜率,那么可以继续使用三次指数平滑。
指数平滑系数α确定的参考方法如下:
①当时间序列呈现较稳定的水平趋势时,应选较小的α,一般可在0.05~0.20之间取值;②当时间序列有波动,但长期趋势变化不大时,可选稍大的α值,常在0.1~0.4之间取值;③当时间序列波动很大,长期趋势变化幅度较大,呈现明显且迅速的上升或下降趋势时,宜选择较大的α值,如可在0.6~0.8间选值,以使预测模型灵敏度高些,能迅速跟上数据的变化。④当时间序列数据是上升(或下降)的发展趋势类型,α应取较大的值,在0.6~1之间。
本发明实施例所采用的指数平滑法可为三次指数平滑,其计算公式为:
预测未来期的值的计算公式为:
xt+T=AT+BTT+CTT2
其中:
七、ARIMA时间序列模型:
ARIMA模型全称为自回归积分滑动平均模型(Autoregressive IntegratedMoving Average Model,简记ARIMA),是一种时间序列(Time-series Approach)预测方法,其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项,MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及自回归积分滑动平均过程(ARIMA)。
ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。现代统计方法、计量经济模型在某种程度上已经能够帮助企业对未来进行预测。
ARIMA预测建模的基本程序如下:
①根据时间序列的散点图、自相关函数和偏自相关函数图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。
②对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。
③根据时间序列模型的识别规则,建立相应的模型。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。
④进行参数估计,检验是否具有统计意义。
⑤进行假设检验,诊断残差序列是否为白噪声。
⑥利用已通过检验的模型进行预测分析。
八、MLP神经网络模型:
神经网络(Neural Networks)是一种模仿生物神经系统的机器学习算法。MLP(Multi-Layer Perceptron),即多层感知器,是一种前向结构的人工神经网络,映射一组输入向量到一组输出向量。MLP可以被看做是一个有向图,由多个节点层组成,每一层全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元(或称处理单元)。一种被称为反向传播算法的监督学习方法常被用来训练MLP。MLP是感知器的推广,克服了感知器无法实现对线性不可分数据识别的缺点。
最简单的MLP是三层结构(输入层-隐藏层-输出层)。在这个模型中,输入的x特征会连接到隐层的神经元,隐层的神经元再连接到输入层的神经元。多层感知机的层与层之间是全连接的,即每一层的任意一个神经元均与其前一层的所有神经元有连接,这种连接其实代表了一种权重加和。
MLP的误差可以用平方误差函数来进行表示。设某个样本x对应的目标值为t,样本x有n个特征属性,即x={x1,x2,…,xn},目标值t有J种可能的值,即t={t1,t2,…,tJ},因此该MLP的输入层(即第一层)一共有n个神经元,输出层(即第L层,设MLP一共有L层)一共有J个神经元。设样本x经过前向通路得到的最终输出为y={y1L,y2L,…,yJL},输出y的下标表示y所在层的神经元索引,上标表示y所在的层,则该样本的平方误差为:
误差E是全体权值w的函数,通过改变权值w,就可达到使误差E最小的目的,而MLP算法的目标就是使E最小。
九、Xgboost模型:
Xgboost的全称是eXtreme Uradient Boosting,即极端梯度提升树,是梯度提升机器算法(Gradient Boosting Machine)的扩展。Boosting分类器属于集成学习模型,其基本思想是把成百上千个分类准确率较低的树模型组合成一个准确率较高的模型。
该模型不断迭代,每次迭代生成一棵新的树,如何在每一步生成合理的树是Boosting分类器的核心。Uradient Boosting Machine算法在生成每一棵树的时候采用梯度下降的思想,以上一步生成的所有树为基础,向着最小化给定目标函数的方向前进。在合理的参数设置下,需要生成一定数量的树才能达到预期准确率,在数据集较大且较复杂的时候,Uradient Boosting Machine算法的计算量巨大。
Xgboost是Uradient Boosting Machine的实现,能自动利用CPU的多线程进行并行,并对算法加以改进以提高精度。Xgboost的学习器既有树(gb-tree)又有线性分类器(gblinear),从而得到带L1+L2惩罚的线性回归或逻辑回归,其损失函数采用二阶泰勒展开,具有高准确度、不易过拟合、可扩展性等特点,能分布式处理高维稀疏特征,因此在同等情况下,Xgboost算法比同类算法快10倍以上。
此外,Xgboost还具有速度快、效果好、能处理大规模数据、支持多种语言、支持自定义损失函数等多种优点。
利用Xgboost模型的建模预测流程如图2所示。
十、指标法预测模型:
指标法预测是基于各用气用户的用气指标和用户数据的一种预测方法,本发明实施例中可将用气用户分为两大类,分别为电厂用户和其他用气用户。预测人员可以将各用气用户的信息存储到对应的数据库表中,并可以通过输入未来年份的采暖季日平均温度来对计算出的预测用气量进行温度修正。
S2,基于信息熵获取每个预测模型对应的加权系数。
具体地,可获取每个预测模型对应的燃气负荷预测值的相对误差,并将每个预测模型对应的燃气负荷预测值的相对误差进行归一化,再根据每个预测模型对应的燃气负荷预测值的相对误差归一化结果计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵,然后根据每个预测模型对应的燃气负荷预测值的相对误差的信息熵计算每个预测模型对应的加权系数。
设同一预测对象,例如某一城市的燃气负荷序列为{xt,t=1,2,…,n},存在m个单项预测模型对其进行预测,即m为预测模型的总个数,n为总时刻数。设通过第i个预测模型在第t时刻预测得到的燃气负荷预测值为xit,令eit为通过第i个预测模型在第t时刻预测得到的燃气负荷预测值的相对误差,i=1,2,…,m。
可根据下式将每个预测模型对应的燃气负荷预测值的相对误差进行归一化:
其中,pit为归一化结果。
然后可根据下式计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵:
其中,hi为第i个预测模型对应的燃气负荷预测值的相对误差的信息熵,k为常数。在本发明的一个具体实施例中,k可取1。
最后,可根据下式计算每个预测模型对应的加权系数:
S3,根据每个预测模型对应的燃气负荷预测值和加权系数获取待预测对象的燃气负荷组合预测结果。
具体地,可根据下式计算待预测对象的燃气负荷组合预测结果:
其中,为在第t时刻预测得到的燃气负荷组合预测结果。
根据本发明实施例的燃气负荷预测方法,首先通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值,然后基于信息熵获取每个预测模型对应的加权系数,最后根据每个预测模型对应的燃气负荷预测值和加权系数获取待预测对象的燃气负荷组合预测结果,由此,采用信息熵组合预测方式能有效较低整体预测方差,降低某个预测值存在较大误差的可能性,使预测结果整体平稳,从而能够方便而又准确地实现对燃气负荷的预测。
对应上述实施例的燃气负荷预测方法,本发明还提出一种燃气负荷预测装置。
如图3所示,本发明实施例的燃气负荷预测装置包括单模型预测模块10、系数获取模块20和结果获取模块30。其中,单模型预测模块10用于通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值;系数获取模块20用于基于信息熵获取每个预测模型对应的加权系数;结果获取模块30用于根据每个预测模型对应的燃气负荷预测值和加权系数获取待预测对象的燃气负荷组合预测结果。
在本发明的一个实施例中,多个预测模型可包括岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指数平滑法、ARIMA时间序列、MLP神经网络、指标法、Xgboost模型中的多个。
一般地,基于各模型自身的适用范围及特点,年、月、日负荷预测所采用的模型不同。其中,年负荷可采用岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指标法模型进行预测;月负荷可采用岭回归、Lasso回归、Xgboost、线性回归、灰色理论、Logistic回归、指数平滑法和ARIMA模型进行预测;日负荷预测可采用岭回归、Lasso回归、Xgboost、线性回归、MLP神经网络、ARIMA、指数平滑法模型进行预测。
具体地,系数获取模块20可用于获取每个预测模型对应的燃气负荷预测值的相对误差,并将每个预测模型对应的燃气负荷预测值的相对误差进行归一化,再根据每个预测模型对应的燃气负荷预测值的相对误差归一化结果计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵,然后根据每个预测模型对应的燃气负荷预测值的相对误差的信息熵计算每个预测模型对应的加权系数。
设同一预测对象,例如某一城市的燃气负荷序列为{xt,t=1,2,…,n},单模型预测模块10共采用m个单项预测模型对其进行预测,即m为预测模型的总个数,n为总时刻数。设单模型预测模块10通过第i个预测模型在第t时刻预测得到的燃气负荷预测值为xit,令eit为通过第i个预测模型在第t时刻预测得到的燃气负荷预测值的相对误差,i=1,2,…,m。
系数获取模块20首先可根据下式将每个预测模型对应的燃气负荷预测值的相对误差进行归一化:
其中,pit为归一化结果。
然后系数获取模块20可根据下式计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵:
其中,hi为第i个预测模型对应的燃气负荷预测值的相对误差的信息熵,k为常数。在本发明的一个具体实施例中,k可取1。
最后,系数获取模块20可根据下式计算每个预测模型对应的加权系数:
结果获取模块30具体可根据下式计算待预测对象的燃气负荷组合预测结果:
根据本发明实施例的燃气负荷预测装置,首先单模型预测模块通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值,然后系数获取模块基于信息熵获取每个预测模型对应的加权系数,最后结果获取模块根据每个预测模型对应的燃气负荷预测值和加权系数获取待预测对象的燃气负荷组合预测结果,由此,采用信息熵组合预测方式能有效较低整体预测方差,降低某个预测值存在较大误差的可能性,使预测结果整体平稳,从而能够方便而又准确地实现对燃气负荷的预测。
在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种燃气负荷预测方法,其特征在于,包括以下步骤:
通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值;
基于信息熵获取每个预测模型对应的加权系数;
根据每个预测模型对应的所述燃气负荷预测值和所述加权系数获取所述待预测对象的燃气负荷组合预测结果。
2.根据权利要求1所述的燃气负荷预测方法,其特征在于,基于信息熵获取每个预测模型对应的加权系数,具体包括:
获取每个预测模型对应的燃气负荷预测值的相对误差;
将每个预测模型对应的燃气负荷预测值的相对误差进行归一化;
根据每个预测模型对应的燃气负荷预测值的相对误差归一化结果计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵;
根据每个预测模型对应的燃气负荷预测值的相对误差的信息熵计算每个预测模型对应的加权系数。
5.根据权利要求1-4中任一项所述的燃气负荷预测方法,其特征在于,所述多个预测模型包括岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指数平滑法、ARIMA时间序列、MLP神经网络、指标法、Xgboost模型中的多个。
6.一种燃气负荷预测装置,其特征在于,包括:
单模型预测模块,所述单模型预测模块用于通过多个预测模型分别对待预测对象的燃气负荷进行预测,以得到每个预测模型对应的燃气负荷预测值;
系数获取模块,所述系数获取模块用于基于信息熵获取每个预测模型对应的加权系数;
结果获取模块,所述结果获取模块用于根据每个预测模型对应的所述燃气负荷预测值和所述加权系数获取所述待预测对象的燃气负荷组合预测结果。
7.根据权利要求6所述的燃气负荷预测装置,其特征在于,所述系数获取模块具体用于:
获取每个预测模型对应的燃气负荷预测值的相对误差;
将每个预测模型对应的燃气负荷预测值的相对误差进行归一化;
根据每个预测模型对应的燃气负荷预测值的相对误差归一化结果计算每个预测模型对应的燃气负荷预测值的相对误差的信息熵;
根据每个预测模型对应的燃气负荷预测值的相对误差的信息熵计算每个预测模型对应的加权系数。
10.根据权利要求6-9中任一项所述的燃气负荷预测装置,其特征在于,所述多个预测模型包括岭回归、Lasso回归、线性回归、灰色理论、Logistic回归、指数平滑法、ARIMA时间序列、MLP神经网络、指标法、Xgboost模型中的多个。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910822953.9A CN110633846A (zh) | 2019-09-02 | 2019-09-02 | 燃气负荷预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910822953.9A CN110633846A (zh) | 2019-09-02 | 2019-09-02 | 燃气负荷预测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110633846A true CN110633846A (zh) | 2019-12-31 |
Family
ID=68969973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910822953.9A Pending CN110633846A (zh) | 2019-09-02 | 2019-09-02 | 燃气负荷预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110633846A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259340A (zh) * | 2020-01-16 | 2020-06-09 | 天津大学 | 一种基于logistic回归的饱和负荷预测方法 |
CN112213230A (zh) * | 2020-10-16 | 2021-01-12 | 西南林业大学 | 一种云南松地表可燃物含水率确定方法及系统 |
CN113190535A (zh) * | 2021-01-19 | 2021-07-30 | 云南卫士盾科技有限公司 | 一种基于改进灰色-长短期记忆神经网络组合模型的瓦斯浓度预测方法 |
CN113672642A (zh) * | 2021-07-07 | 2021-11-19 | 德特赛维技术有限公司 | 一种基于时序预测移动网络性能的方法及其系统 |
CN114001278A (zh) * | 2021-09-16 | 2022-02-01 | 北京市燃气集团有限责任公司 | 一种城市燃气门站掺氢混气方法和系统 |
CN114580852A (zh) * | 2022-01-30 | 2022-06-03 | 江苏苏华泵业有限公司 | 基于工业大数据的水泵挡水板清理实时提醒系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073785A (zh) * | 2010-11-26 | 2011-05-25 | 哈尔滨工程大学 | 基于广义动态模糊神经网络的燃气日负荷组合预报方法 |
CN102663224A (zh) * | 2012-03-07 | 2012-09-12 | 吉首大学 | 基于信息熵的交通流量集成预测模型 |
CN103023065A (zh) * | 2012-11-20 | 2013-04-03 | 广东工业大学 | 一种基于相对误差熵值法的风电短期功率预测方法 |
WO2015172560A1 (zh) * | 2014-05-16 | 2015-11-19 | 华南理工大学 | 基于bp神经网络的中央空调冷负荷的预测方法 |
CN108537379A (zh) * | 2018-04-04 | 2018-09-14 | 北京科东电力控制系统有限责任公司 | 自适应变权重组合负荷预测方法及装置 |
-
2019
- 2019-09-02 CN CN201910822953.9A patent/CN110633846A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073785A (zh) * | 2010-11-26 | 2011-05-25 | 哈尔滨工程大学 | 基于广义动态模糊神经网络的燃气日负荷组合预报方法 |
CN102663224A (zh) * | 2012-03-07 | 2012-09-12 | 吉首大学 | 基于信息熵的交通流量集成预测模型 |
CN103023065A (zh) * | 2012-11-20 | 2013-04-03 | 广东工业大学 | 一种基于相对误差熵值法的风电短期功率预测方法 |
WO2015172560A1 (zh) * | 2014-05-16 | 2015-11-19 | 华南理工大学 | 基于bp神经网络的中央空调冷负荷的预测方法 |
CN108537379A (zh) * | 2018-04-04 | 2018-09-14 | 北京科东电力控制系统有限责任公司 | 自适应变权重组合负荷预测方法及装置 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259340A (zh) * | 2020-01-16 | 2020-06-09 | 天津大学 | 一种基于logistic回归的饱和负荷预测方法 |
CN111259340B (zh) * | 2020-01-16 | 2023-04-28 | 天津大学 | 一种基于logistic回归的饱和负荷预测方法 |
CN112213230A (zh) * | 2020-10-16 | 2021-01-12 | 西南林业大学 | 一种云南松地表可燃物含水率确定方法及系统 |
CN112213230B (zh) * | 2020-10-16 | 2022-09-02 | 西南林业大学 | 一种云南松地表可燃物含水率确定方法及系统 |
CN113190535A (zh) * | 2021-01-19 | 2021-07-30 | 云南卫士盾科技有限公司 | 一种基于改进灰色-长短期记忆神经网络组合模型的瓦斯浓度预测方法 |
CN113190535B (zh) * | 2021-01-19 | 2023-04-18 | 云南卫士盾科技有限公司 | 一种基于改进灰色-长短期记忆神经网络组合模型的瓦斯浓度预测方法 |
CN113672642A (zh) * | 2021-07-07 | 2021-11-19 | 德特赛维技术有限公司 | 一种基于时序预测移动网络性能的方法及其系统 |
CN114001278A (zh) * | 2021-09-16 | 2022-02-01 | 北京市燃气集团有限责任公司 | 一种城市燃气门站掺氢混气方法和系统 |
CN114580852A (zh) * | 2022-01-30 | 2022-06-03 | 江苏苏华泵业有限公司 | 基于工业大数据的水泵挡水板清理实时提醒系统 |
CN114580852B (zh) * | 2022-01-30 | 2022-11-29 | 江苏苏华泵业有限公司 | 基于工业大数据的水泵挡水板清理实时提醒系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110633846A (zh) | 燃气负荷预测方法和装置 | |
Rahimi et al. | Uniform approximation of functions with random bases | |
Khan et al. | A higher prediction accuracy–based alpha–beta filter algorithm using the feedforward artificial neural network | |
Wang et al. | Correlation aware multi-step ahead wind speed forecasting with heteroscedastic multi-kernel learning | |
Ding et al. | Point and interval forecasting for wind speed based on linear component extraction | |
CN113591728A (zh) | 基于集成深度学习的电能质量扰动分类方法 | |
Suryo et al. | Improved time series prediction using LSTM neural network for smart agriculture application | |
Han et al. | Self-organization of a recurrent RBF neural network using an information-oriented algorithm | |
Hu et al. | Ensemble echo network with deep architecture for time-series modeling | |
Chen et al. | The optimal design and application of LSTM neural network based on the hybrid coding PSO algorithm | |
Leung et al. | On the regularization of forgetting recursive least square | |
Hu et al. | An efficient Long Short-Term Memory model based on Laplacian Eigenmap in artificial neural networks | |
Subbotin | Radial-basis function neural network synthesis on the basis of decision tree | |
Qiao et al. | An online self-organizing algorithm for feedforward neural network | |
Yu et al. | DWE-IL: a new incremental learning algorithm for non-stationary time series prediction via dynamically weighting ensemble learning | |
Kumar et al. | Machine learning algorithms: A conceptual review | |
CN113850438A (zh) | 公共建筑能耗预测方法、系统、设备及介质 | |
CN113255739A (zh) | 一种鱼饲料检测与配方系统 | |
Dewi et al. | Ensemble learning for predicting mortality rates affected by air quality | |
Wang et al. | Mutual information-weighted principle components identified from the depth features of stacked autoencoders and original variables for oil dry point soft sensor | |
Liu et al. | Approximation of stochastic processes by T–S fuzzy systems | |
Deng et al. | Ensemble SVR for prediction of time series | |
Abiyev | Time series prediction using fuzzy wavelet neural network model | |
Mendel et al. | Type-1 Fuzzy Systems: Design Methods and Applications | |
Rao et al. | Functional approach for two way dimension reduction in time series |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191231 |
|
RJ01 | Rejection of invention patent application after publication |