CN113537553A - 一种区域配电网负荷需求混合预测方法 - Google Patents
一种区域配电网负荷需求混合预测方法 Download PDFInfo
- Publication number
- CN113537553A CN113537553A CN202110598894.9A CN202110598894A CN113537553A CN 113537553 A CN113537553 A CN 113537553A CN 202110598894 A CN202110598894 A CN 202110598894A CN 113537553 A CN113537553 A CN 113537553A
- Authority
- CN
- China
- Prior art keywords
- prediction
- data
- model
- distribution network
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 146
- 238000012417 linear regression Methods 0.000 claims abstract description 38
- 238000012706 support-vector machine Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 230000000694 effects Effects 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 43
- 239000013598 vector Substances 0.000 claims description 33
- 238000012217 deletion Methods 0.000 claims description 28
- 230000037430 deletion Effects 0.000 claims description 28
- 238000011161 development Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 14
- 230000009977 dual effect Effects 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 7
- 238000009825 accumulation Methods 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 4
- 230000014759 maintenance of location Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 4
- 239000002245 particle Substances 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 19
- 238000004364 calculation method Methods 0.000 abstract description 13
- 238000013480 data collection Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 238000012896 Statistical algorithm Methods 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种区域配电网负荷需求混合预测方法,包含数据收集、数据处理、不同方法预测、不同方法预测结果综合计算。数据预处理结合收集的数据,对数据信息中存在的异常值、遗漏数据等进行处理。组合预测方法,包含了多元线性回归、灰色预测、支持向量机预测三种预测方法,结合样本收集,计算出不同方法的预测偏差。组合预测方法结果的权重确定是应用变异系数方法,根据预测偏差对不同方法的权重进行最终确定。该组合方法有效避免了无关数据和异常数据的干扰及其影响,同时结合不同方法的组合应用并结合相应的预测误差效果确定各个方法计算结果的权重,能够有效提升预测结果的精确程度,从而实现区域配电网电力需求的精准预测。
Description
技术领域
本发明涉及属于区域配电网用负荷预测应用领域,特别是一种区域配电网负荷需求混合预测方法。
背景技术
电力工业是国民经济的基础产业,电网企业投资策略的科学性、合理性是企业管理策略研究的核心内容之一。当前经济社会发展与内外部环境变化,给电网公司经营带来了严峻挑战。因此结合负荷需求的增长,科学合理的确定投资规模,优化投资策略是重中之重,通过系统分析结合区域发展现状,结合不同类型预测方法,精准确定负荷需求,能够为资源的科学合理配置提供辅助决策支撑,实现投入产出成效清晰化、投资安排科学合理化、业务管理精益化。
目前,当前主要的区域配电网负荷需求预测方法主要有线性规划、灰色预测、神经网络等智能预测方法。该类方法各有特点,适用性较为单一,预测精度无法满足当前精准规划需求,例如灰色预测只考虑数据的内在联系,没有充分结合当前负荷需求的复杂影响要素,BP神经网络预测模型在小样本数据处理上存在一定的问题,在学习样本数量有限时,精度难以保证;样本数量很多时,泛化性能又不高。综上所述,单一模型相对简单,且由于负荷需求受多种内外部复杂因素影响,因此单一方法对于区域负荷需求的预测存在一定的缺陷与问题。
支持向量机是一种以结构风险最小化原理为基础的新算法,具有其它以经验风险最小化原理为基础的算法难以比拟的优越性,同时由于它是一个凸二次优化问题,能够保证得到的极值解是全局最优解。即支持向量机能在有限样本情况下,精度既高同时泛化性能也强。随着深度学习算法的引用与运用能够为负荷需求的精准预测提供一定支撑与参考,但是当前研究深度不足,实践性不强,仍存在训练效率低以及迭代次数多等问题,且没有充分考量当前电网企业投资惯性等特点,没有充分考量不同形势下负荷需求的变化特性,预测精准程度有待进一步加强。
发明内容
有鉴于此,本发明的目的是提供一种区域配电网负荷需求混合预测方法,该方法有效避免了相关方法模型单一的影响,充分融合不同方法模型特点,并结合预测偏差科学设定不同方法模型预测结果权重,可以保证负荷需求的预测结果科学合理,并且综合考量电网企业发展以及社会经济发展的相关特点。
本发明采用以下方案实现:一种区域配电网负荷需求混合预测方法,包括以下步骤:
步骤S1:获取基础数据;
步骤S2:进行数据预处理;
步骤S3:进行组合预测模型构建;
步骤S4:通过步骤S3构建的模型进行混合预测。
进一步地,所述基础数据包括历史负荷数据、经济总量、经济结构、经济布局和供电面积。
进一步地,步骤S2中所述数据预处理包括但不限于直接删除、暂且保留、使用统计量替换、缺失值填补和稳健统计量与稳健回归。
进一步地,所述步骤S3的具体内容为:
步骤S31:搭建灰色预测模型;
步骤S32:搭建多元线性回归预测模型;
步骤S33:搭建支持向量机预测模型。
进一步地,所述步骤S31的具体内容为:
灰色预测模型GM(1,1)具体建模步骤如下:
设时间序列X(0)有n个观察值:
x(0)={x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)}
通过累加生成新序列x(1)={x(1)(1),x(1)(2),x(1)(3),…,x(1)(n)},则GM(1,1)模型相应的微分方程为:
其中:a称为发展灰数;u称为内生控制灰数;
求解微分方程即得预测模型如下:
模型检验灰色预测检验包括残差检验、关联度检验或后验差检验,通过模型检验验证模型预测效果,用以进行模型修正。
进一步地,所述步骤S32的具体内容为:
设变量x1,x2,…,xp是p(p>1)个线性无关的可控变量,y是随机变量,他们之间的关系为:
式中:b0,b1,…,bp,σ2都是待求的未知参数,ε为随机误差,这就是p元线性回归模型。
对变量x1,x2,…,xp和y作n次独立观察,可得容量为n的一个样本(xi1,xi2…,xip,yi)(i=1,2,…,n)
在负荷预测中,这些常量是过去的历史资料,由p元线性回归关系式得:
为了数学处理上的方便,将上式用矩阵形式来表示;记
则线性回归模型改写为:
Y=XB+ε
因此得:
称这个方程为p元线性回归方程;b0,b1,b2,...,bp称为回归方程的系数。
进一步地,所述步骤S33的具体内容为:
设基于用于考虑训练样本集{(xi,yi),i=1,2,···,l},其中xi∈Rn是输入模式的第i个粒子,yi∈{+1,-1}是两类分类问题对应的目标输出;支持向量分类机的目标就是构造一个决策函数即分类超平面,将测试数据尽可能正确地分类;
如果存在分类超平面:
<ω,x>+b=0
满足约束条件:
yi(<ω,x>+b)-1≥0,i=1,2,···,l
则称训练集是线性可分的;其中<·,·>表示向量的内积;ω∈Rn为可调的权值向量,b∈R为偏置;
由统计学习理论可知,如果训练样本集没有被超平面错误分开,并且距超平面最近的样本数据与分类超平面之间的距离最大,则该超平面为最优超平面 (OptimalHyperplane),由此得到的决策函数:f(x)=sgn(<ω,x>+b)
其推广能力最佳;其中sgn(·)为符号函数;
利用Lagrange优化方法及Wofle对偶理论,能够将上述问题转化为其对偶问题,即最大化泛函:
其中,αi为样本i对应的Lagrange乘子;
上式是具有不等式约束的二次规划问题,存在唯一解,且解中只有少部分αi不为零,其对应的样本就是支持向量,解上述问题得到最优分类函数为:
其中,nsv为支持向量个数,b是分类阈值,可用两类中任意一对支持向量取中值求得;
对于非线性问题,则通过非线性变换将其转化为某个高维空间中的线性问题,然后在这个高维空间中寻求最优分类面;仅有样本间的内积运算(xi·xj)被涉及,因此在高维空间中只需进行内积运算,而内积运算可通过原空间中的函数实现;根据Hilbert-schmidt原理,只要核函数K(xi·xj)满足Mercer条件,它就对应某一交换空间中的内积;因此,用满足Mercer条件的核函数K(xi·xj)代替式中的内积,就能够实现某种非线性变换后的线性分类,则最优分类函数变为:
其中,常数C是惩罚系数。
其对偶空间的优化问题为:
进一步地,所述步骤S4的具体内容为:
依据变异系数方法,来确定不同预测方法的权重,原理如下:
设f1、f2、f3分别是灰色预测、多元回归预测、支持向量机预测三种预测方法预测结果的标准差,e1、e2、e3分别为三种预测结果的平均数;求三种方法的变异系数分别为:
三种方法的权重分别为:
最终的预测结果为:
A=A1*v1+A2*v2+A3*v3
其中A为最终的预测结果,A1、A2、A3分别为灰色预测、多元回归预测、支持向量机预测三种预测的初步结果,v1、v2、v3为上述权重计算结果。
与现有技术相比,本发明具有以下有益效果:
本发明包含数据收集、数据处理、不同方法预测、不同方法预测结果综合计算等几个步骤。所述数据预处理结合收集的数据,对数据信息中存在的异常值、遗漏数据等进行处理。所述组合预测方法,包含了多元线性回归、灰色预测、支持向量机预测三种预测方法,结合样本收集,计算出不同方法的预测偏差。所属组合预测方法结果的权重确定是应用变异系数方法,根据预测偏差对不同方法的权重进行最终确定。该组合方法有效避免了无关数据和异常数据的干扰及其影响,同时结合不同方法的组合应用并结合相应的预测误差效果确定各个方法计算结果的权重,能够有效提升预测结果的精确程度,从而实现区域配电网电力需求的精准预测,为支撑决策规划提供支撑与参考。
附图说明
图1为本发明实施例的区域配电网负荷需求预测流程图。
图2为本发明实施例的SVM最优超平面图。
图3为本发明实施例的SVM结构图
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供一种区域配电网负荷需求混合预测方法,包括以下步骤:
步骤S1:获取基础数据;
步骤S2:进行数据预处理;
步骤S3:进行组合预测模型构建;
步骤S4:通过步骤S3构建的模型进行混合预测。
在本实施例中,所述基础数据包括历史负荷数据、经济总量、经济结构、经济布局和供电面积。
在本实施例中,步骤S2中所述数据预处理包括但不限于直接删除、暂且保留、使用统计量替换、缺失值填补和稳健统计量与稳健回归。
在本实施例中,所述步骤S3的具体内容为:
步骤S31:搭建灰色预测模型;
灰色预测模型GM(1,1)具体建模步骤如下:
设时间序列X(0)有n个观察值:
x(0)={x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)}
通过累加生成新序列x(1)={x(1)(1),x(1)(2),x(1)(3),…,x(1)(n)},则GM(1, 1)模型相应的微分方程为:
其中:a称为发展灰数;u称为内生控制灰数;
求解微分方程即得预测模型如下:
模型检验灰色预测检验包括残差检验、关联度检验或后验差检验,通过模型检验验证模型预测效果,用以进行模型修正;
步骤S32:搭建多元线性回归预测模型;
设变量x1,x2,…,xp是p(p>1)个线性无关的可控变量,y是随机变量,他们之间的关系为:
式中:b0,b1,…,bp,σ2都是待求的未知参数,ε为随机误差,这就是p元线性回归模型。
对变量x1,x2,…,xp和y作n次独立观察,可得容量为n的一个样本(xi1,xi2…,xip,yi)(i=1,2,…,n)
在负荷预测中,这些常量是过去的历史资料,由p元线性回归关系式得:
为了数学处理上的方便,将上式用矩阵形式来表示;记
则线性回归模型改写为:
Y=XB+ε
因此得:
称这个方程为p元线性回归方程;b0,b1,b2,...,bp称为回归方程的系数。
步骤S33:搭建支持向量机预测模型;
设基于用于考虑训练样本集{(xi,yi),i=1,2,···,l},其中xi∈Rn是输入模式的第i个粒子,yi∈{+1,-1}是两类分类问题对应的目标输出;支持向量分类机的目标就是构造一个决策函数即分类超平面,将测试数据尽可能正确地分类;
如果存在分类超平面:
<ω,x>+b=0
满足约束条件:
yi(<ω,x>+b)-1≥0,i=1,2,···,l
则称训练集是线性可分的;其中<·,·>表示向量的内积;ω∈Rn为可调的权值向量,b∈R为偏置;
由统计学习理论可知,如果训练样本集没有被超平面错误分开,并且距超平面最近的样本数据与分类超平面之间的距离最大,则该超平面为最优超平面(OptimalHyperplane),如下图2所示。由此得到的决策函数:f(x)=sgn(<ω,x>+b)
其推广能力最佳;其中sgn(·)为符号函数;
利用Lagrange优化方法及Wofle对偶理论,能够将上述问题转化为其对偶问题,即最大化泛函:
其中,αi为样本i对应的Lagrange乘子;
上式是具有不等式约束的二次规划问题,存在唯一解,且解中只有少部分αi不为零,其对应的样本就是支持向量,解上述问题得到最优分类函数为:
其中,nsv为支持向量个数,b是分类阈值,可用两类中任意一对支持向量取中值求得;
对于非线性问题,则通过非线性变换将其转化为某个高维空间中的线性问题,然后在这个高维空间中寻求最优分类面;仅有样本间的内积运算(xi·xj)被涉及,因此在高维空间中只需进行内积运算,而内积运算可通过原空间中的函数实现;根据Hilbert-schmidt原理,只要核函数K(xi·xj)满足Mercer条件,它就对应某一交换空间中的内积;因此,用满足Mercer条件的核函数K(xi·xj)代替式中的内积,就能够实现某种非线性变换后的线性分类,则最优分类函数变为:
引入松驰变量ξi和ξi *,构造如下优化问题:
其中,常数C是惩罚系数。
其对偶空间的优化问题为:
在本实施例中,步骤S4的具体内容为:
依据变异系数方法,来确定不同预测方法的权重,原理如下:
设f1、f2、f3分别是灰色预测、多元回归预测、支持向量机预测三种预测方法预测结果的标准差,e1、e2、e3分别为三种预测结果的平均数;求三种方法的变异系数分别为:
三种方法的权重分别为:
最终的预测结果为:
A=A1*v1+A2*v2+A3*v3
其中A为最终的预测结果,A1、A2、A3分别为灰色预测、多元回归预测、支持向量机预测三种预测的初步结果,v1、v2、v3为上述权重计算结果。
较佳的,在本实施例中,首先收集区域配电网负荷需求预测的相关数据,其次对数据进行预处理,再次运用三种不同预测方法,根据数据处理结果,分别进行预测模拟与偏差分析,其中灰色预测方法是通过累加或累减生成并逐步白化,从而建立起的微分方程形式的模型,主要基于数据的内在规律。多元线性回归预测方法可以较好地把握影响因素与最终结果之间的关系,通过相应的因素确定最后的预测结果。支持向量机预测方法在在充分考虑负荷变化的周期性及延续性特点的基础上,将气象等相关特征指标纳入模型输入,能够进一步提升预测精度。最后通过变异系数方法根据不同方法预测偏差,确定计算权重,得出最终的预测结果,组合预测具有如下特点:预测性能更高以及出现极端预测误差的风险较小。组合预测更强调来源于不同信息的各种预测,而非构造复杂的单项预测。组合权重可以解释为模型符合真实的可能性,从而建立更“真实”的模型。
较佳的,在本实施例中,结合负荷需求的相关影响要素,从规模以上工业增加值、固定资产投资、社会消费零售总额、出口总值、气象环境等指标以及历史用负荷数据进行收集,形成基础数据库。
结合数据收集结果,对缺失值、异常值进行检查,根据检查结果剔除异常数据、完善缺失值数据,从而缩小所计算的数据样本和提高样本的可靠性。
灰色预测方法通过数据分析发现每年的对应数据按规律增长,于是在符合灰色预测样本小、自身按指数增长的特点的情况下,依据以往的数据来进行预测。多元线性回归预测方法是结合负荷预测的相关要求,筛选重要因素,结合影响程度判断,剔除影响程度较低的数据,建立因变量和自变量之间的线性回归方程,并对之进行假设检验,证明该回归方程是符合要求的,然后把该回归方程作为预测模型,代入已知的自变量的值,预测出相应的负荷需求结果。支持向量机预测方法结合上述多元回归方法种重要因素的判断,构建支持向量机预测模型,然后使用一定的样本数进行模型训练,得到适用的模型算法。最后输入自变量,得到相应的预测结果。
通过上述三种方法模型的预测结果,分析不同方法模型的预测偏差,依据方差—协方差方法来确定不同预测方法的权重。结合权重计算结果,确定最终的组合预测模型。
较佳的,在本实施例中,区域配电网负荷需求源自多个层面的诉求,包括国家对社会、经济发展等诸多层面。因此结合相应数据收集与整理。
(1)历史负荷数据
负荷是指电力系统中负荷的大小以及所需负荷的大小。负荷的大小直接决定了电网建设发展的最终规模,决定了区域内供需平衡情况,其增长速度决定了电网建设发展的速度。
(2)经济总量
经济总量是指在当前社会生产力情况下,经济整体运行状况的经济变量。是从经济总体的角度来看的经济变量。受经济波动的影响,电力需求亦表现出明显的波动性,GDP与电力消费之间存在着显著且稳定的正相关关系。
(3)经济结构
经济结构是指指国民经济的组成和构造。经济结构是一个由许多系统构成的多层次、多因素的复合体。经济结构状况是衡量国家和地区经济发展水平的重要尺度。一般以工业为主的第二产业比重越大,电力需求也就越大,随着经济结构逐步调整,电力消费的弹性系数也会发生变化。
(4)经济布局
经济布局指生产力布局、科技布局和流通布局的总和。也就是指生产力、商品流通、科技发展在空间的配置。经济布局影响到该地区的产业发展及升级情况,会间接对电网需求的发展产生影响。
(5)供电面积
供电面积是指某区域内电力系统所能覆盖的供电范围。供电面积的覆盖范围会直接驱动该区域内电力建设项目的实施,从而影响电力系统发展建设需求。
数据预处理:
(1)填补缺失信息
信息缺失是几乎不可避免的事项,在问卷环境中的缺失比较常见,同时在统计分析及信息集合构建时缺失相对严重,同时还存在不合理取值、异常值等情况。总结来说,缺失信息包含三种类型:完全随机缺失、随机缺失、非随机缺失。
1)完全随机缺失
完全随机缺失指缺失值时完全随机的,与自身或其他变量没有关系,该缺失类型较为常见,在直观上可以用缺失比例进行判断一般采用直接删除法,或者使用平均数法来替补缺失信息。如果数据是完全随机缺失,那么我们选择合适的删除方法或使用平均数填补法都可以,但因完全随机缺失检验的备择假设是随机缺失或非随机缺失,且随机缺失是最常见的一种缺失类型,所以我们更倾向于认为是随机缺失。
2)随机缺失
随机缺失类型是最常见的一种缺失类型,可以理解为变量的缺失值与其他完整值存在某种概率关系,由于变量与其他变量可能存在相关,所以可以使用非缺失数据信息与其他变量建立函关系,对缺失进行预测填补,这可以理解为对得分集的预测。直观上也可以使用行的缺失比例来判断∶如果行的缺失比例在5%~50%,则可以认为该缺失是随机缺失。
3)非随机缺失
数据的缺失不仅与其自身有关,还与其他变量有关,如在作业成本测算过程中对于地理环境、气象环境类型的缺失数据的缺失比例往往比较大,几乎无法使用成熟的统计方法处理,所以在收集数据时应尽量避免这种情况。
(2)处理异常值
单变量和双变量存在的异常值构成了多变量异常值分析的基础,多变量分析包括有监督类和无监督类的方法,如监督类的回归模型,无监督类的聚类分析等。
1)直接删除
简单易行,但其缺点也很明显。首先,一般情况下,部分信息的观测值很少,采用删除法选成样本量不足;其次,如果直接删除的观测值很多,可能会改变信息原有的分布,从而造成估计稳定问题。
2)暂且保留
有时我们观测到的异常值产生的异常性质对于整个模型而言并有观察到的那么明显,因此建议对信息进行综合分析。对于回归分析可利用残差分布判断模型优劣,如残差有没有超出经验范围、呈现什么分布等,如此,残差分析相当于综合所有变量后查看异常。如果异常对于整个模型而言并不是很明显的,则建议保留。
3)使用统计量替换
使用统计量替换。这不失为一种折中的方法,大部分参数方法针对的是均值构建模型。用均值替换异常值,实际上克服了丢失信息样本的缺陷。
4)缺失值填补
此方法的好处是可以利用现有变量的信息,对异常值(令其缺失)进行填补。但这要视异常值的特点而定,需要考虑完全随机缺失、随机缺失、非随机缺失等不同情况。
5)稳健统计量与稳健回归
稳健统计量可以直接将分布两端的异常值直接删除或者使用其他统计量替换,也可以使用更稳健的统计算法,如M估计法来获得稳定指标。
组合预测模型构建:
(1)灰色预测模型
灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。
GM(1,1)具体建模步骤如下:
设时间序列X(0)有n个观察值:
x(0)={x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)}
通过累加生成新序列x(1)={x(1)(1),x(1)(2),x(1)(3),…,x(1)(n)},则GM(1, 1)模型相应的微分方程为:
其中:a称为发展灰数;u称为内生控制灰数。
求解微分方程即可得预测模型如下:
模型检验灰色预测检验一般有残差检验、关联度检验和后验差检验,通过模型检验验证模型预测效果,以便进行模型修正。
(2)多元线性回归预测模型
多元线性回归预测技术主要是研究一个因变量与多个自变量之间的相关关系。在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。
设变量x1,x2,…,xp是p(p>1)个线性无关的可控变量,y是随机变量,他们之间的关系为:
式中:b0,b1,…,bp,σ2都是待求的未知参数,ε为随机误差,这就是p元线性回归模型。
对变量x1,x2,…,xp和y作n次独立观察,可得容量为n的一个样本(xi1,xi2…,xip,yi)(i=1,2,…,n)
在负荷预测中,这些常量是过去的历史资料,由p元线性回归关系式可得
为了数学处理上的方便,将上式用矩阵形式来表示。记
则线性回归模型可改写为:
Y=XB+ε
因此可得:
将得到的b0,b1,b2,...,bp代入p元线性回归关系式,可以得到
称这个方程为p元线性回归方程。b0,b1,b2,...,bp称为回归方程的系数。
(3)支持向量机预测模型
支持向量机最初用于解决分类问题,预测技术是在其基础上的发展,因此下文从分类理论出发,并扩展到预测技术的研究讨论中。设基于用于考虑训练样本集{(xi,yi),i=1,2,···,l},其中xi∈Rn是输入模式的第i个例子,yi∈{+1,-1}是两类分类问题对应的目标输出。支持向量分类机的目标就是构造一个决策函数(分类超平面),将测试数据尽可能正确地分类,下面就对此进行讨论。
如果存在分类超平面:
<ω,x>+b=0
满足约束条件:
yi(<ω,x>+b)-1≥0,i=1,2,···,l
则称训练集是线性可分的。其中<·,·>表示向量的内积。ω∈Rn为可调的权值向量,b∈R为偏置。
由统计学习理论可知,如果训练样本集没有被超平面错误分开,并且距超平面最近的样本数据与分类超平面之间的距离最大,则该超平面为最优超平面(OptimalHyperplane),如下图2所示。由此得到的决策函数:f(x)=sgn(<ω,x>+b)
其推广能力最佳。其中sgn(·)为符号函数。
利用Lagrange优化方法及Wofle对偶理论,可以将上述问题转化为其对偶问题,即最大化泛函:
其中,αi为样本i对应的Lagrange乘子。
上式是具有不等式约束的二次规划问题,存在唯一解,且解中只有少部分αi不为零,其对应的样本就是支持向量,解上述问题得到最优分类函数为:
其中,nsv为支持向量个数,b是分类阈值,可用两类中任意一对支持向量取中值求得。
1995年Cortes&Vapnild是出通过引入松驰项ξi实现广义分类面,解决训练样本线性不可分的情况,即折衷考虑最小错分样本和最大分类间隔。对于非线性问题,可通过非线性变换将其转化为某个高维空间中的线性问题,然后在这个高维空间中寻求最优分类面。仅有样本间的内积运算(xi·xj)被涉及,因此在高维空间中只需进行内积运算,而内积运算可通过原空间中的函数实现。根据Hilbert-schmidt 原理,只要核函数K(xi·xj)满足Mercer条件,它就对应某一交换空间中的内积。
因此,用满足Mercer条件的核函数K(xi·xj)代替式中的内积,就可实现某种非线性变换后的线性分类,则最优分类函数变为:
总之,SVM就是通过某种事先选择的非线性映射,将输入向量映射到一个高维特征空间,在这个特征空问中构造最优分类超平面。在形式上,SVM分类函数类似于神经网络,输出是中间节点的线性组合,每个中间节点对应一个支持向量,如下图所示。神经网络的中间节点数要靠经验或对比实验进行选取,逸辑的不同会对网络性能产生很大影响;而SVM的中间节点数由计算自动确定。
Vapnik通过引入ε不敏感损失函数,将SVM分类理论中得到的结果推广,使其可用于函数拟合有了这种推广,SVM方法成为高维空间中函数表达的一般方法,它可以用于各种函数估计问题,包括密度估计问题和求解线性算子方程问题。引入松驰变量ξi和构造如下优化问题:如图3所示;
其中,常数C是惩罚系数。
其对偶空间的优化问题为:
混合预测:
混合预测是指将几种预测方法所得的预测结果,选取适当的权重进行加权平均的一种预测方法。而如何来选取权值的问题是优选组合预测的中心问题,本文主要依据变异系数方法,来确定不同预测方法的权重,原理如下:
设f1、f2、f3是三种预测方法预测结果的标准差,e1、e2、e3分别为三种预测结果的平均数。
求三种方法的变异系数分别为:
三种方法的权重分别为:
较佳的,本实施例主要包含了地区经济、人后数量、产业结构、用负荷等数据的收集与整理,然后结合数据收集的具体情况对数据进行差异值、缺失值处理,再次分别构建三种不同的预测方法模型,结合模拟与实际对比分析偏差结果,最后根据变异系数法,结合预测偏差结果的计算,得出不同预测模型的权重,从而得出混合预测模型。具体实施流程如图1所示。
首先,收集区域配电网负荷需求预测的相关数据,包含人口、经济、自然环境、负荷历史数据等等。
其次对数据进行预处理,结合数据收集情况,对数据异常值与缺失值进行处理,得到基础数据库。
其次,运用三种不同预测方法,根据数据处理结果,分别进行预测模拟与偏差分析,其中灰色预测方法是通过累加或累减生成并逐步白化,从而建立起的微分方程形式的模型,主要基于数据的内在规律。多元线性回归预测方法可以较好地把握影响因素与最终结果之间的关系,通过相应的因素确定最后的预测结果。支持向量机预测方法在在充分考虑负荷变化的周期性及延续性特点的基础上,将气象等相关特征指标纳入模型输入,能够进一步提升预测精度
最后,通过变异系数方法根据不同方法预测偏差,确定计算权重,得出最终的预测结果,组合预测具有如下特点:预测性能更高以及出现极端预测误差的风险较小。组合预测更强调来源于不同信息的各种预测,而非构造复杂的单项预测。
其中,在本实施例中,
(1)数据收集:结合负荷需求的相关影响要素,从规模以上工业增加值、固定资产投资、社会消费零售总额、出口总值、气象环境等指标以及历史用负荷数据进行收集,形成基础数据库。
(2)数据预处理,结合数据收集结果,对缺失值、异常值进行检查,根据检查结果剔除异常数据、完善缺失值数据,从而缩小所计算的数据样本和提高样本的可靠性。
(3)构建组合预测方法,灰色预测方法通过数据分析发现每年的对应数据按规律增长,于是在符合灰色预测样本小、自身按指数增长的特点的情况下,依据以往的数据来进行预测。多元线性回归预测方法是结合负荷预测的相关要求,筛选重要因素,结合影响程度判断,剔除影响程度较低的数据,建立因变量和自变量之间的线性回归方程,并对之进行假设检验,证明该回归方程是符合要求的,然后把该回归方程作为预测模型,代入已知的自变量的值,预测出相应的负荷需求结果。支持向量机预测方法结合上述多元回归方法种重要因素的判断,构建支持向量机预测模型,然后使用一定的样本数进行模型训练,得到适用的模型算法。最后输入自变量,得到相应的预测结果。
(4)组合预测方法权重计算,通过上述三种方法模型的预测结果,分析不同方法模型的预测偏差,依据方差—协方差方法来确定不同预测方法的权重。结合权重计算结果,确定最终的组合预测模型。
综上,本实施例包含数据收集、数据处理、不同方法预测、不同方法预测结果综合计算等几个步骤。所述数据预处理结合收集的数据,对数据信息中存在的异常值、遗漏数据等进行处理。所述组合预测方法,包含了多元线性回归、灰色预测、支持向量机预测三种预测方法,结合样本收集,计算出不同方法的预测偏差。所属组合预测方法结果的权重确定是应用变异系数方法,根据预测偏差对不同方法的权重进行最终确定。该组合方法有效避免了无关数据和异常数据的干扰及其影响,同时结合不同方法的组合应用并结合相应的预测误差效果确定各个方法计算结果的权重,能够有效提升预测结果的精确程度,从而实现区域配电网电力需求的精准预测,为支撑决策规划提供支撑与参考。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (8)
1.一种区域配电网负荷需求混合预测方法,其特征在于:包括以下步骤:
步骤S1:获取基础数据;
步骤S2:进行数据预处理;
步骤S3:进行组合预测模型构建;
步骤S4:通过步骤S3构建的模型进行混合预测。
2.根据权利要求1所述的一种区域配电网负荷需求混合预测方法,其特征在于:所述基础数据包括历史负荷数据、经济总量、经济结构、经济布局和供电面积。
3.根据权利要求1所述的一种区域配电网负荷需求混合预测方法,其特征在于:步骤S2中所述数据预处理包括但不限于直接删除、暂且保留、使用统计量替换、缺失值填补和稳健统计量与稳健回归。
4.根据权利要求1所述的一种区域配电网负荷需求混合预测方法,其特征在于:所述步骤S3的具体内容为:
步骤S31:搭建灰色预测模型;
步骤S32:搭建多元线性回归预测模型;
步骤S33:搭建支持向量机预测模型。
5.根据权利要求1所述的一种区域配电网负荷需求混合预测方法,其特征在于:所述步骤S31的具体内容为:
灰色预测模型GM(1,1)具体建模步骤如下:
设时间序列X(0)有n个观察值:
x(0)={x(0)(1),x(0)(2),x(0)(3),…,x(0)(n)}
通过累加生成新序列x(1)={x(1)(1),x(1)(2),x(1)(3),…,x(1)(n)},则GM(1,1)模型相应的微分方程为:
其中:a称为发展灰数;u称为内生控制灰数;
求解微分方程即得预测模型如下:
模型检验灰色预测检验包括残差检验、关联度检验或后验差检验,通过模型检验验证模型预测效果,用以进行模型修正。
6.根据权利要求1所述的一种区域配电网负荷需求混合预测方法,其特征在于:所述步骤S32的具体内容为:
设变量x1,x2,…,xp是p(p>1)个线性无关的可控变量,y是随机变量,他们之间的关系为:
式中:b0,b1,…,bp,σ2都是待求的未知参数,ε为随机误差,这就是p元线性回归模型。
对变量x1,x2,…,xp和y作n次独立观察,可得容量为n的一个样本(xi1,xi2…,xip,yi)(i=1,2,…,n)
在负荷预测中,这些常量是过去的历史资料,由p元线性回归关系式得:
为了数学处理上的方便,将上式用矩阵形式来表示;记
则线性回归模型改写为:
Y=XB+ε
因此得:
7.根据权利要求1所述的一种区域配电网负荷需求混合预测方法,其特征在于:
所述步骤S33的具体内容为:
设基于用于考虑训练样本集{(xi,yi),i=1,2,···,l},其中xi∈Rn是输入模式的第i个粒子,yi∈{+1,-1}是两类分类问题对应的目标输出;支持向量分类机的目标就是构造一个决策函数即分类超平面,将测试数据尽可能正确地分类;
如果存在分类超平面:
<ω,x>+b=0
满足约束条件:
yi(<ω,x>+b)-1≥0,i=1,2,···,l
则称训练集是线性可分的;其中<·,·>表示向量的内积;ω∈Rn为可调的权值向量,b∈R为偏置;
由统计学习理论可知,如果训练样本集没有被超平面错误分开,并且距超平面最近的样本数据与分类超平面之间的距离最大,则该超平面为最优超平面,由此得到的决策函数:f(x)=sgn(<ω,x>+b)
其推广能力最佳;其中sgn(·)为符号函数;
利用Lagrange优化方法及Wofle对偶理论,能够将上述问题转化为其对偶问题,即最大化泛函:
其中,αi为样本i对应的Lagrange乘子;
上式是具有不等式约束的二次规划问题,存在唯一解,且解中只有少部分αi不为零,其对应的样本就是支持向量,解上述问题得到最优分类函数为:
其中,nsv为支持向量个数,b是分类阈值,可用两类中任意一对支持向量取中值求得;
对于非线性问题,则通过非线性变换将其转化为某个高维空间中的线性问题,然后在这个高维空间中寻求最优分类面;仅有样本间的内积运算(xi·xj)被涉及,因此在高维空间中只需进行内积运算,而内积运算可通过原空间中的函数实现;根据Hilbert-schmidt原理,只要核函数K(xi·xj)满足Mercer条件,它就对应某一交换空间中的内积;因此,用满足Mercer条件的核函数K(xi·xj)代替式中的内积,就能够实现某种非线性变换后的线性分类,则最优分类函数变为:
其中,常数C是惩罚系数。
其对偶空间的优化问题为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110598894.9A CN113537553A (zh) | 2021-05-31 | 2021-05-31 | 一种区域配电网负荷需求混合预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110598894.9A CN113537553A (zh) | 2021-05-31 | 2021-05-31 | 一种区域配电网负荷需求混合预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113537553A true CN113537553A (zh) | 2021-10-22 |
Family
ID=78094894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110598894.9A Pending CN113537553A (zh) | 2021-05-31 | 2021-05-31 | 一种区域配电网负荷需求混合预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113537553A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117638919A (zh) * | 2023-12-11 | 2024-03-01 | 安徽易加能数字科技有限公司 | 基于多能互补的充电桩补能优化方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021882A (zh) * | 2016-05-11 | 2016-10-12 | 中国南方电网有限责任公司电网技术研究中心 | 指标权重获取方法和系统 |
CN109325880A (zh) * | 2018-09-21 | 2019-02-12 | 国网天津市电力公司 | 一种基于Verhulst-SVM的中长期负荷预测方法 |
CN110751327A (zh) * | 2019-10-17 | 2020-02-04 | 武汉大学 | 基于多元线性回归和灰色Verhulst模型的长期负荷组合预测法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
-
2021
- 2021-05-31 CN CN202110598894.9A patent/CN113537553A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106021882A (zh) * | 2016-05-11 | 2016-10-12 | 中国南方电网有限责任公司电网技术研究中心 | 指标权重获取方法和系统 |
CN109325880A (zh) * | 2018-09-21 | 2019-02-12 | 国网天津市电力公司 | 一种基于Verhulst-SVM的中长期负荷预测方法 |
CN110751327A (zh) * | 2019-10-17 | 2020-02-04 | 武汉大学 | 基于多元线性回归和灰色Verhulst模型的长期负荷组合预测法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
Non-Patent Citations (4)
Title |
---|
吴川东: "基于变异系数加权的旅游需求组合预测模型", 《科技广场》 * |
唐杰明等: "基于灰色模型和最小二乘支持向量机的电力短期负荷组合预测", 《电网技术》 * |
张仁寿: "《统计学》", 31 May 2018 * |
胡忠义: "《基于计算智能技术的电力负荷预测理论及应用》", 31 January 2019 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117638919A (zh) * | 2023-12-11 | 2024-03-01 | 安徽易加能数字科技有限公司 | 基于多能互补的充电桩补能优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110414788B (zh) | 一种基于相似日和改进lstm的电能质量预测方法 | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN110135635B (zh) | 一种区域电力饱和负荷预测方法及系统 | |
CN112990556A (zh) | 一种基于Prophet-LSTM模型的用户用电能耗预测方法 | |
CN108694470B (zh) | 一种基于人工智能的数据预测方法及装置 | |
CN110571792A (zh) | 一种电网调控系统运行状态的分析评估方法及系统 | |
CN107045569B (zh) | 基于聚类多目标分布估计算法的齿轮减速器优化设计方法 | |
CN111738477A (zh) | 基于深层特征组合的电网新能源消纳能力预测方法 | |
CN111008726A (zh) | 一种电力负荷预测中类图片转换方法 | |
CN112308305B (zh) | 一种基于多模型综合的售电量预测方法 | |
CN114066073A (zh) | 电网负荷预测方法 | |
CN115600729A (zh) | 一种考虑多属性网格电网负荷预测方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN112990587A (zh) | 一种对台区用电进行精准预测的方法及系统、设备、介质 | |
CN113537553A (zh) | 一种区域配电网负荷需求混合预测方法 | |
Adjakossa et al. | Kalman recursions aggregated online | |
CN113052395A (zh) | 融合网络特征的神经网络预测金融数据的方法 | |
CN113033898A (zh) | 基于k均值聚类与bi-lstm神经网络的电负荷预测方法及系统 | |
Zhai et al. | Combining PSO-SVR and Random Forest Based Feature Selection for Day-ahead Peak Load Forecasting. | |
CN114971092B (zh) | 一种变电站主控楼混凝土用量预测方法和装置 | |
Безкоровайний et al. | Mathematical models of a multi-criteria problem of reengineering topological structures of ecological monitoring networks | |
CN108596781A (zh) | 一种电力系统数据挖掘与预测整合方法 | |
CN114140158A (zh) | 基于组合预测的配电网投资需求确定方法、装置、设备及存储介质 | |
CN115148307A (zh) | 一种材料性能自动预测系统 | |
CN112990603A (zh) | 考虑频域分解后数据特征的空调冷负荷预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211022 |