CN105488595A - 用于月度用电预测模型的先行性指数构建方法 - Google Patents
用于月度用电预测模型的先行性指数构建方法 Download PDFInfo
- Publication number
- CN105488595A CN105488595A CN201510918254.6A CN201510918254A CN105488595A CN 105488595 A CN105488595 A CN 105488595A CN 201510918254 A CN201510918254 A CN 201510918254A CN 105488595 A CN105488595 A CN 105488595A
- Authority
- CN
- China
- Prior art keywords
- index
- power consumption
- factor
- antephase
- leading
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 9
- 230000005611 electricity Effects 0.000 claims description 23
- 230000001276 controlling effect Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract 1
- 230000003111 delayed effect Effects 0.000 description 5
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000007637 random forest analysis Methods 0.000 description 4
- 229910000831 Steel Inorganic materials 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 239000010959 steel Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241001123248 Arma Species 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009021 linear effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用于月度用电预测模型的先行性指数构建方法,包括以下步骤:通过专家评定法梳理了预测售电量的先行指标;确定先行期的因素称为影响指标x,其他因素称为控制指标z,用电量称为被影响指标y,使用售电量y对其他影响因素z进行回归得到残差e1,再把要确定先行期的因素x对其他影响因素z进行回归,得到残差e2,计算e1和e2的简单相关系数r;根据x的所有先行期,分别计算偏相关系数,并选择较大的期数,形成x的先行期集合;在集合中选择预测误差最小的先行期,从而构建月度预测的先行指标体系。本发明提高用电内生因素刻画能力和用电预测精度,捕捉不可观测因素带来的用电波动,提高模型对用电变动的预测能力。
Description
技术领域
本发明涉及到用电预测领域,特别涉及一种用于月度用电预测模型的先行性指数构建方法。
背景技术
现有的用电预测模型有GM灰色预测模型、ARIMA模型、回归模型等。
1、GM灰色预测模型
基于用电数据本身的趋势,通过实际数据的累加生成灰色系统,得到规律较强的曲线之后,用指数曲线拟合生成模型,再利用生成模型得到的数据通过累加逆运算——累减生成得到还原模型,由还原模型作为预测模型。
2、电力弹性系数
一种系数计算法,把影响用电的因素(如气温)和用电量两者之间计算弹性系数,即气温每增加1%,带来用电量变量百分之多少。根据历史数据对弹性进行估算,把得到的弹性系数和新的气温变化结合,对新的用电量的变化进行估计和预测。
3、ARIMA模型
自回归移动平均模型(ARIMA)是基于用电量本身的自身规律进行刻画的模型。如果用电序列{yt}的当前值不仅与自身过去值有关,而且还与其以前进入系统的外部冲击e存在一定依存关系,则在用模型刻画这种动态特征时,模型中既包括自身的滞后项,也包括过去的外部冲击。一般模型表达为ARIMA(p,d,q)其中,p为用电序列{yt}的滞后阶数,q为外部冲击e的滞后阶数,d为差分次数。其一般结构为:
yt=φ1yt-1+φ2yt-2+…+φpyt-p+εt+θ1εt-1+θ2εt-2+…+θqεt-q
利用滞后算子,此模型可写为:
Φ(B)yt=Θ(B)εt
实际中,为了保证数据的平稳性,常常先对数据进行差分,然后建立模型,即:Φ(B)Bdyt=Θ(B)εt,这就是ARIMA模型。
若序列的当前值还受到其他变量的影响,则需要建立ARIMA-X模型,即:
其中{yt},{xt}为平稳序列,或者经过差分后的平稳序列,{yt}为用电量,{xt}为影响用电的因素。
4、多元线性回归
为了刻画多个因素对用电的线性影响,线性回归模型可对用电量先估计系数后,在使用拟合的模型进行预测。其基本回归表达式为:
yt=b0+b1x1t+b2x2t+...+bqxqt+et
其中q个x为影响用电的因素,y为用电量。通过最小二乘估计法,估计系数b。然后利用估计的系数和x的取值,以及方程式表达的关系,求得y的预测值。
5、随机森林模型
随机森林回归模型,由很多决策树回归组成的组合回归模型,且参数集是独立同分布的随机向量,在给定自变量X下,每个决策树回归模型都有一票投票权来选择最优的回归结果,最后输出所有的投票判别结果或是得到估计的平均值。
随机森林回归的基本方法是:首先利用自助法从原始训练集抽取k个样本,然后对k个样本分别建立k个决策树模型,得到k种回归结果;最后根据k种回归结果对每个记录进行投票表决决定其最终回归。不仅可有效抑制训练样本噪音和解决属性缺失,还不容易出现过度拟合。在构建随机森林的过程中生成一个泛化误差的内部无偏估计,使预测结果更加精确。
在上述预测模型的输入量中,指标输入量的常规做法是:首先,对用电影响的因素一般选取外部指标,通常选择宏观经济指标,产业行业指标,如GDP、固定资产投资额等。其次,使用指标进行预测时,当月输入量对当月的用电进行建模,即同期指标预测。因此,在预测未来用电指标时,必须使用与未来时期一致的输入量。如果没有未来期的输入量,则首先需要对此时期的输入量本身进行预测,最后再用预测值作为输入量。
根据上述常规指标预测方法,其有如下不足。首先,现有预测指标来自外部宏观经济变量,缺乏反映电力行业内部规律(内生性)的指标。宏观经济变量发布滞后,传导机制复杂。而电力数据统计核算及时,信息反应灵敏,使用电力行业内生性指标,能及时有效刻画生产经营运行规律。其次,现有预测因素多使用同期指标,即预测因素和被预测的用电量是同期的。当期的用电数据获得较为及时,而当期的其他经济数据相比发布滞后,预测期的数据不可获得。尤其是这种基于同期指标的预测,需要先对预测期的预测因素进行预测,再使用预测数据作为输入变量,对预测期的用电进行预测,这里对变量的双重预测,会使预测误差加大。
因此,我们一方面需要使用具有先行意义的指标进行预测,并科学地确定指标的先行期;另一方面,我们也要在指标结构上进行完善,在外部指标的基础上加入内生性指标,从而构建完善的预测指标体系。
发明内容
本发明所要解决的技术问题是提供一种用于月度用电预测模型的先行性指标的构建方法,并且,加入的内生性指标对用电的影响更为直接和敏感,相对于外部经济指标而言,对数据变动的反应更有效,预测精度提高。
为解决上述技术问题,本发明采用的技术方案是:
一种用于月度用电预测模型的先行性指标的构建方法,包括以下步骤:
通过专家评定法梳理了影响售电量的先行指标,其中加入了业扩指标,作为反映行业内生性增长的因素,与外部指标一起形成用电预测的先行指标体系;
将影响因素分为要确定先行期的因素和其他因素,确定先行期的因素称为影响指标x,其他因素称为控制指标z,用电量称为被影响指标y,使用售电量y对其他影响因素z进行回归得到残差e1,再把要确定先行期的因素x对其他影响因素z进行回归,得到残差e2,计算e1和e2的简单相关系数r,回归方程为1)yt=Γzt+e1,2)xt=Πzt+e2,其中,1)式和2)式是回归方程,t为时间下标,Γ,Π为系数矩阵;
根据相关系数的计算公式,可得偏相关系数r,
根据x的每个时期,分别计算所有时期的偏相关系数,选择相关系数较大的期数,确定x的先行期的初步预选集;
根据上述方案,分别按照这个初步先行期集进行模型预测,最终确定预测误差小的先行期,为指标最终的先行期。
确定了最终先行期的所有指标,区分为外部和内部指标,以及通过时间维度构建出横向纵向的预测指标体系
与现有技术相比,本发明的有益效果是:
1、具有行业内生性增长的指标(业扩)作为模型预测的输入因素,对用电影响更为直接和显著。
2、具有先行意义的指标作为模型预测的输入因素,克服使用同期指标预测,造成双重误差的缺点。另外,先行意义的指标也考虑了输入因素对用电的滞后影响和传导效应。
3、确定了指标的先行期之后,模型因素对用电的影响刻画的更为准确,提高了模型的拟合程度和预测精度。
附图说明
图1是本发明中状态空间模型的观测量与状态量对应关系示意图。
图2是本发明中状态空间模型基本流程示意图。
图3是发明用于月度用电预测模型的先行性指数构建方法。
具体实施方式
1、确定初选指标
通过专家评定法梳理了影响售电量的先行指标,其中加入了业扩指标,作为反映行业内生性增长的因素,与常用的外部指标一起形成用电预测的先行指标体系。这些指标根据经验判断,和行业自身的运行规律具有先行意义,但是并未通过实际检验来确定是否具备先行期以及先行期期数。因此,需要通过模型测算和系数计算来确定先行期。
2、售电量和影响因素分别对其他控制因素做回归
将影响因素分为要确定先行期的因素和其他因素。要确定先行期的因素称为影响指标x,其他因素称为控制指标z,用电量称为被影响指标y。使用售电量y对其他影响因素z进行回归得到残差e1,再把要确定先行期的因素x对其他影响因素z进行回归,得到残差e2,最后计算e1和e2的简单相关系数r。回归方程如下:
1)yt=Γzt+e1
2)xt=Πzt+e2
其中1)式和2)式是回归方程,t为时间下标。Γ,Π为系数矩阵。要注意的是2)式中的x变量是要确定先行期的影响指标,它是指标当期值或前期值等。逐步对x使用其当期值,滞后一期,滞后两期等进行回归,计算所有的残差。
3、对所有指标引入“偏相关系数响应法”
得到回归残差e1和e2后,根据相关系数的计算公式,可得偏相关系数r:
根据x的每个时期,分别计算所有时期的偏相关系数。最终选择相关系数较大的期数,作为x的先行期初选集合。
例如,需要计算钢铁行业业扩完成容量的偏相关系数,把售电量对其他所有影响因素比如商品房新开工面积等进行回归,得到残差e1;再把钢铁行业业扩完成容量对其他影响因素进行回归,得到残差e2。最后,利用上述公式计算e1和e2的简单相关系数。这仅仅得到钢铁业扩完成本期值和本期售电量的一个偏相关系数,按照上述步骤,再把刚也业扩完成前一期,前两期等所有先行期分别计算相应的偏相关系数,最后选择系数值较大的时期,作为指标的先行期。如经测算,影响较大的先行期在1-5期之间,那么这就形成了先行期的初选集合。
4、确定指标体系
最后,在初选的先行期集内进行模型预测,确定预测误差小的先行期作为最终指标的先行期。确定了最终先行期的所有指标,区分为外部和内部指标,以及通过时间维度构建出横向纵向的预测指标体系。最终确立的先行指标如表1所示。
表1确立后的先行指标
Claims (2)
1.一种用于月度用电预测模型的先行性指数构建方法,其特征在于,包括以下步骤:
通过专家评定法梳理了影响售电量的先行指标,其中加入了业扩指标,作为反映行业内生性增长的因素,与外部指标一起形成用电预测的先行指标体系;
将影响因素分为要确定先行期的因素和其他因素,确定先行期的因素称为影响指标x,其他因素称为控制指标z,用电量称为被影响指标y,使用售电量y对其他影响因素z进行回归得到残差e1,再把要确定先行期的因素x对其他影响因素z进行回归,得到残差e2,计算e1和e2的简单相关系数r,回归方程为1)yt=Γzt+e1,2)xt=Πzt+e2,其中,1)式和2)式是回归方程,t为时间下标,Γ,Π为系数矩阵;
根据相关系数的计算公式,可得偏相关系数r,
根据x的每个时期,分别计算所有时期的偏相关系数,选择相关系数较大的期数,确定x的先行期初选集;
确定了最终先行期的所有指标,区分为外部和内部指标,以及通过时间维度构建出横向纵向的预测指标体系。
2.如权利要求1所述的用于月度用电预测模型的先行性指数构建方法,其特征在于,分别按照这个初选的先行期集进行模型预测,最终确定预测误差小的先行期为指标最终的先行期。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510918254.6A CN105488595A (zh) | 2015-12-10 | 2015-12-10 | 用于月度用电预测模型的先行性指数构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510918254.6A CN105488595A (zh) | 2015-12-10 | 2015-12-10 | 用于月度用电预测模型的先行性指数构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105488595A true CN105488595A (zh) | 2016-04-13 |
Family
ID=55675564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510918254.6A Pending CN105488595A (zh) | 2015-12-10 | 2015-12-10 | 用于月度用电预测模型的先行性指数构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105488595A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635830A (zh) * | 2018-10-24 | 2019-04-16 | 吉林大学 | 用于估算汽车质量的有效数据的筛选方法 |
CN109784979A (zh) * | 2018-12-19 | 2019-05-21 | 重庆邮电大学 | 一种大数据驱动的供应链需求预测方法 |
CN112734340A (zh) * | 2021-01-21 | 2021-04-30 | 上海东普信息科技有限公司 | 快递件量的预测指标筛选方法、装置、设备及存储介质 |
CN114118633A (zh) * | 2022-01-26 | 2022-03-01 | 之江实验室 | 一种基于先行关系的指标自优化预测方法及装置 |
-
2015
- 2015-12-10 CN CN201510918254.6A patent/CN105488595A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635830A (zh) * | 2018-10-24 | 2019-04-16 | 吉林大学 | 用于估算汽车质量的有效数据的筛选方法 |
CN109784979A (zh) * | 2018-12-19 | 2019-05-21 | 重庆邮电大学 | 一种大数据驱动的供应链需求预测方法 |
CN109784979B (zh) * | 2018-12-19 | 2023-06-16 | 中交(厦门)电子商务有限公司 | 一种大数据驱动的供应链需求预测方法 |
CN112734340A (zh) * | 2021-01-21 | 2021-04-30 | 上海东普信息科技有限公司 | 快递件量的预测指标筛选方法、装置、设备及存储介质 |
CN112734340B (zh) * | 2021-01-21 | 2023-09-01 | 上海东普信息科技有限公司 | 快递件量的预测指标筛选方法、装置、设备及存储介质 |
CN114118633A (zh) * | 2022-01-26 | 2022-03-01 | 之江实验室 | 一种基于先行关系的指标自优化预测方法及装置 |
CN114118633B (zh) * | 2022-01-26 | 2022-06-10 | 之江实验室 | 一种基于先行关系的指标自优化预测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Richardson et al. | Nowcasting GDP using machine-learning algorithms: A real-time assessment | |
Rusnák | Nowcasting Czech GDP in real time | |
CN104391849A (zh) | 融入时间上下文信息的协同过滤推荐方法 | |
CN105488595A (zh) | 用于月度用电预测模型的先行性指数构建方法 | |
CN105574607A (zh) | 一种电力市场月度用电预测方法 | |
CN101950395A (zh) | 市场营销模型确定系统 | |
Bessec | Short‐Term Forecasts of French GDP: A Dynamic Factor Model with Targeted Predictors | |
Girardi et al. | The role of indicator selection in nowcasting euro-area GDP in pseudo-real time | |
CN109447332A (zh) | 一种适用于s型负荷曲线的中长期电力负荷组合预测方法 | |
Doz et al. | Dating business cycle turning points for the french economy: An MS-DFM approach | |
CN105488598A (zh) | 一种基于模糊聚类的中长期电力负荷预测方法 | |
CN114066004A (zh) | 一种基于电力大数据的gdp现时预测方法 | |
KR101606322B1 (ko) | 중고차량 가치 평가 방법 및 장치 | |
Franta et al. | Forecasting Czech GDP using mixed-frequency data models | |
CN103955769A (zh) | 基于协同过滤的零售点产品销量预测方法 | |
Prastyo et al. | Survival analysis of companies’ delisting time in Indonesian stock exchange using Bayesian multiple-period logit approach | |
Ferrara et al. | GDP nowcasting with ragged‐edge data: a semi‐parametric modeling | |
Castle et al. | Nowcasting from disaggregates in the face of location shifts | |
Berg | Multivariate forecasting with BVARs and DSGE models | |
Kissi et al. | Forecasting construction tender price index in Ghana using autoregressive integrated moving average with exogenous variables model | |
Walk et al. | Half-empty or half-full? A hybrid approach to predict recycling behavior of consumers to increase reverse vending machine uptime | |
Folmer et al. | Investment premiums: Expensive but hardly effective. | |
CN114792196A (zh) | 一种电力综合评价方法及装置 | |
Wang et al. | Markov chain analysis and prediction of consumer price index in Xinjiang | |
CN110264260A (zh) | 一种电网设备材料价格的智能预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160413 |