CN110458374A - 一种基于arima和svm的企业用电最大需量预测方法 - Google Patents
一种基于arima和svm的企业用电最大需量预测方法 Download PDFInfo
- Publication number
- CN110458374A CN110458374A CN201910782943.7A CN201910782943A CN110458374A CN 110458374 A CN110458374 A CN 110458374A CN 201910782943 A CN201910782943 A CN 201910782943A CN 110458374 A CN110458374 A CN 110458374A
- Authority
- CN
- China
- Prior art keywords
- arima
- svm
- model
- maximum demand
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 title claims abstract 23
- 230000005611 electricity Effects 0.000 claims abstract description 54
- 230000008569 process Effects 0.000 claims abstract description 21
- 238000000714 time series forecasting Methods 0.000 claims abstract description 14
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000004519 manufacturing process Methods 0.000 claims abstract description 7
- 238000003064 k means clustering Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 42
- 206010019133 Hangover Diseases 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000007476 Maximum Likelihood Methods 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 claims description 2
- 230000009514 concussion Effects 0.000 claims description 2
- 238000002790 cross-validation Methods 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000009795 derivation Methods 0.000 claims description 2
- 238000009826 distribution Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 238000012804 iterative process Methods 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- 238000006116 polymerization reaction Methods 0.000 claims description 2
- 238000006467 substitution reaction Methods 0.000 claims description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 abstract description 12
- 230000001932 seasonal effect Effects 0.000 abstract description 4
- 238000010801 machine learning Methods 0.000 abstract description 2
- 238000012706 support-vector machine Methods 0.000 description 20
- 238000005311 autocorrelation function Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 102000008297 Nuclear Matrix-Associated Proteins Human genes 0.000 description 1
- 108010035916 Nuclear Matrix-Associated Proteins Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012812 general test Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000000299 nuclear matrix Anatomy 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E40/00—Technologies for an efficient electrical power generation, transmission or distribution
- Y02E40/70—Smart grids as climate change mitigation technology in the energy generation sector
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Strategic Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述方法实现过程包括:从电网公司计费表TSDB中读数;使用滑动平均方法添补缺失值;使用K‑Means聚类算法剔除离群点;使用ARIMA时序预测用电量;结合天气因素和生产状况的预测,使用训练好的SVM模型决策;取预测月最大值,计算未来月月最大需量。本发明充分考虑了历史电量的时序性,包括趋势性,周期性和季节性,同时也兼顾了天气因素和生产情况的预测,使用机器学习决策和时序预测的算法将两种因素统一在一种模型中,通过训练得到准确的结果,而且随着数据越来越多,使用年数越来越长,未来月最大需量的预测误差就越小,为企业节省更多的电费。
Description
技术领域
本发明涉及在线监测技术领域,具体涉及一种基于ARIMA和SVM的企业用电最大需量预测方法。
背景技术
按照中国法律规定,用户以计量点方式计费(一个计量点内可以有多个变压器)缴费,而不是按照变压器或用电设备,缴纳电费包括容量收费、电度电费和力率调整电费。根据经验,节省电费最多的情况是调整容量收费的申报方式,容量收费即用户每月根据运行的变压器容量向电网公司缴纳的固定电费,即使用户当月不消耗电量,电网公司也会收取这笔费用。我国国内工商业用户可按变压器容量计费和以最大需量计费两种方式缴费。虽然按变压器容量计费单价低,但一般企业每月的最大需量也低于固定的按变压器容量计费,根据经验调整容量收费为最大需量计费的申报方式可以节省较多电费。最大需量是电网公司计费表记录用户每15分钟的平均运行负荷,当月所有记录值中最大的数为最大需量值。以最大需量计费的收费方式为按最大需量缴费以“多罚少不退”的基本计算原则,即当最大需量小于申报需量时,容量电费为(例如)[申报需量*32元],最大需量超过申报需量的5%时,超出部分按照2倍价格执行,即64元/kW。需要特别说明的是最大需量的申报值和高压变压器安装容量的大小无关,用户无需进行繁琐的变压器容量报停操作。从而节省的电费即:
F节约费用=F容量计费费用-F最大需量计费费用
期中容量计费电费为:
容量计费电费=计费变压器容量×变压器容量计费电价+W峰电量·T1用电峰电价+W平电量·T1用电平电价+W谷电量·T1用电谷电价
最大需量计费电费为:
最大需量电费=最大需量费用+W峰电量·T2用电峰电价+W平电量·T2用电平电价+W谷电量·T2用电谷电价
现阶段,对企业或工厂的最大需量预测的方法、算法还比较少,大多数企业要么采用按变压器固定的容量收费,要么就是凭自身经验来预估未来月的月用电最大需量,这种方式得出的最大需量误差通常较大,并不能起到节约较多电费的作用,还有可能面临高额罚款。近几年,也有一些研究尝试去通过数据分析的方式去预测月最大需量,如上海申瑞继保电气有限公司提出的一种企业用电月最大需量的预测方法,根据企业用电负荷的特性,分别使用不同的系数来确定特征表达式,再结合历史月的月最大需量数据,对未来月月最大需量进行预测。这些系数是通过公式理论计算得来,还有一些经验上的改进,不是经过训练得来,没有结合企业实际情况,而且结合历史月的月最大需量并没有充分利用历史数据进行分析,忽略了历史数据的周期性,季节性和整体趋势性,所以这一方法存在许多不足。
中深科技能源(深圳)有限公司也介绍了一种预测未来月月最大需量的方案,在其提出的具体方案步骤中只对用户的用电曲线数据和用电行为进行分析,缺少对企业用电负荷特性的考虑,以及对采集的数据进行数据清洗的步骤,会对未来月月最大需量的预测造成偏差,从而不能充分地为企业用户节省电费。
发明内容
本发明要解决的技术问题是:针对上述问题,基于差分整合移动平均自回归模型(ARIMA)时序预测和支持向量机(SVM),本发明提供一种基于ARIMA和SVM的企业用电最大需量预测方法。
ARIMA模型全称为自回归积分滑动平均模型(Autoregressive IntegratedMoving Average Model,简记ARIMA),是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。
SVM(Support Vector Machine)指的是支持向量机,是常见的一种判别方法。在机器学习领域,是一个有监督的学习模型,通常用来进行模式识别、分类以及回归分析。
本发明所采用的技术方案为:
一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述方法实现过程包括:
1.从电网公司计费表TSDB中读数;
2.使用滑动平均方法添补缺失值;
3.使用K-Means聚类算法剔除离群点;
4.使用ARIMA时序预测用电量;
5.结合天气因素和生产状况的预测,使用训练好的SVM模型决策;
6.取预测月最大值,计算未来月月最大需量。
所述ARIMA时序预测用电量计算公式包括内容如下:
ARIMA模型包括三部分:p阶自回归模型,q阶移动平均模型和d阶差分,其中:
P阶自回归模型公式表示为:描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测;
q阶移动平均模型公式表示为:关注的是自回归模型中的误差项的累加;
d阶差分为时间序列t与t-1时刻的差值的d阶差,以使时间序列平稳;
ARIMA公式表示为:
所述ARIMA时序预测用电量计算过程如下:
确定好p、q和d后,ARIMA模型的μ、γ、θ由最大似然和卡尔曼滤波优化得到,具体根据历史数据、当前时刻真实数据和该时刻的估计值估算该时刻的最优值,保留该时刻的协方差,再用相同方法估算下一时刻的最优值,不断的把均方误差递归得出训练数据时刻的最优值,根据训练最优值不断更新ARIMA模型的μ、γ、θ,得到ARIMA模型的具体公式;本发明使用的时间序列及一个月每天、每时或每刻的用电量,自变量为时间。
使用ARIMA时序预测用电量的实现过程包括步骤如下:
1.根据数据得出ACF和PACF;
2.根据ACF和PACF的拖尾得到ARIMA的p,q;
3.选择差分系数I;
4.获得预测数据曲线和数据。
所述ACF(自相关函数,autocorrelation function)计算公式如下:
k代表滞后期数。
PACF(偏自相关函数,partial autocorrelation function)描述的是在给定中间观测值的条件下,时间序列观测值预期过去的观测值之间的线性相关性。
1、对于一个平稳AR(p)模型,求出滞后期数k自相关系数p(k)时实际上得到的并不是x(t)与x(t-k)之间单纯的相关关系;
2、x(t)同时还会受到中间k-1个随机变量x(t-1)、x(t-2)……、x(t-k+1)的影响,而这k-1个随机变量又都和x(t-k)具有相关关系,所以自相关系数p(k)里实际掺杂了其他变量对x(t)与x(t-k)的影响;
3、剔除了中间k-1个随机变量x(t-1)、x(t-2)……、x(t-k+1))的干扰之后
x(t-k)对x(t)影响的相关程度;
4、ACF还包含了其他变量的影响而偏自相关系数PACF是严格这两个变量之间的相关性。
这两个函数根据编程得出,也可以通过分析软件直接得出查看。
所述p、q根据ACF和PACF判断截尾得出。时间序列中拖尾指序列以指数率单调递减或震荡衰减,而截尾指序列从某个时点变得非常小。
根据ARIMA的相关性质,AR模型通过PACF得出p,MA模型通过ACF得出q:
模型(序列) | AR(p) | MA(q) | ARMA(p,q) |
自相关函数(ACF) | 拖尾 | 第q个后截尾 | 拖尾 |
偏自相关函数(PACF) | 第p个后截尾 | 拖尾 | 拖尾 |
根据上面表格,可以根据ACF和PACF图判断截尾位置得出p,q的值。
K-Means基于给定的聚类目标函数,算法采用迭代更新的方法,每一次迭代过程都是向目标函数减小的方向进行,最终聚类结果使得目标函数取得极小值,达到较好的分类效果。
所述K-Means聚类算法计算过程如下:
1)给定大小为n的数据集,令O=1,选取k个初始聚类中心Zj(O),j=1,2,3,...,k,O代表不同迭代轮数的聚类中心;
2)计算每个样本数据对象与聚合中心的距离D(xi,Zj(O)),i=1,2,3,…,并分类;
3)令O=O+1,计算新的聚类中心和误差平方和准则f(目标函数)值:
4)判断:若|f(O+1)-f(O)|<θ(f收敛)或者对象无类别变化,则算法结束,否则,O=O+1,返回2)步。
计算过程:
1.随机选择K个中心点
2.把每个数据点分配到离它最近的中心点;
3.重新计算每类中的点到该类中心点距离的平均值
4.分配每个数据到它最近的中心点;
5.重复步骤3和4,直到所有的观测值不再被分配或是达到最大的迭代次数(R把10次作为默认迭代次数)。
我们使用K-Means来对所需数据进行预处理,剔除异常值,使模型易于收敛并提高准确性。
所述SVM模型训练过程包括内容如下:
SVM的基本思路就是,通过寻找一个能够正确划分的数据集,并且几何间隔最大的超平面,即最优超平面;
点(x,y)到平面(w,b)的距离公式是:
SVM模型公式表达为:
等价于:
训练过程即最优超平面求解,求最优超平面:ωT·x+b,即求其中的ω,b参数:
根据上述公式,先求最大几何间隔: n为训练样本数;
把约束条件融合到优化目标函数中,建立拉格朗日公式:
优化目标变为:满足KKT条件(在优化理论中,KKT条件是非线性规划(nonlinear programming)最佳解的必要条件。KKT条件将lagrange乘数法(Lagrange multipliers)中的等式约束优化问题推广至不等式约束。),能够求其对偶问题:对ω和α求偏导并令其值为0:
将ω和α回代L(ω,b,α),则得:
采用序列最小最优化算法求解对偶问题,对αi求导,即求出最优超平面。
所述SVM模型的核函数包括:
线性核函数:k(x,xi)=x·xi,主要用于线性可分的情况;
或,高斯径向基核函数:
高斯径向基函数是一种局部性强的核函数,其可以将一个样本映射到一个更高维的空间内,该核函数是应用最广的一个,无论大样本还是小样本都有比较好的性能,而且其相对于多项式核函数参数要少,因此大多数情况下在不知道用什么核函数的时候,优先使用高斯核函数;
或,多项式核函数:
k(x,xi)=((x·xi)+1)d
多项式核函数可以实现将低维的输入空间映射到高纬的特征空间,但是多项式核函数的参数多,当多项式的阶数比较高的时候,核矩阵的元素值将趋于无穷大或者无穷小,计算复杂度会大到无法计算,但其他核函数效果不好时,可以使用多项式核函数;
或,神经元的非线性作用核函数Sigmoid:
k(x,xi)=tanh(η<x,xi>θ)
采用sigmoid核函数,支持向量机实现的就是一种多层神经网络;
在选用核函数的时候,如果对我们的数据有一定的先验知识,就利用先验来选择符合数据分布的核函数;如果不知道的话,通常使用交叉验证的方法,来试用不同的核函数,误差最小的即为效果最好的核函数,或者也可以将多个核函数结合起来,形成混合核函数。
本发明的有益效果为:
本发明充分考虑了历史电量的时序性,包括趋势性,周期性和季节性,同时也兼顾了天气因素和生产情况的预测,使用机器学习决策和时序预测的算法将两种因素统一在一种模型中,通过训练得到准确的结果,而且随着数据越来越多,使用年数越来越长,未来月最大需量的预测误差就越小,为企业节省更多的电费。
附图说明
图1为基于ARIMA和SVM的月最大需量预测流程图;
图2为ARIMA流程图;
图3为ACF拖尾示意图;
图4为PACF截尾示意图;
图5为K-Means对所需数据进行预处理流程图;
图6为SVM决策流程图。
具体实施方式
下面结合说明书附图,通过具体实施方式对本发明进一步说明:
实施例1
如图1所示,一种基于差分整合移动平均自回归模型(ARIMA)时序预测和支持向量机(SVM)的未来月月最大需量预测方法,所述方法实现过程如下:
1、对数据进行预处理,首先填补上传数据中的缺失值,因为上传的抄表值为每十五分钟记录电表显示的总电量,算时间段电量就要做差,有时会上传“0”值,造成数据错误,我们使用滑动平均法来填补缺失值;
2、如图5所示,使用K-Means聚类方法剔除离群值,使曲线更好收敛,具体计算过程如下:
1)随机选择K个中心点;
2)把每个数据点分配到离它最近的中心点;
3)重新计算每类中的点到该类中心点距离的平均值
4)分配每个数据到它最近的中心点;
5)重复步骤3)和4),直到所有的观测值不再被分配或是达到最大的迭代次数(R把10次作为默认迭代次数)。
3、如图2所示,基于大数据算法对数据进行训练并作出预测,考虑到用电的趋势性,周期性和季节性,使用ARIMA时序预测算法,首先确定p、q值,根据ACF和PACF(局部ACF)图,判定这两个值,如图3、4所示,得到的ACF和PACF图,选择p为3,q为0;
然后选择差分系数,一般测试1或2,使用RMSE检验发现1的误差小,所以选择ARIMA系数为3,0,1;
RMSE(均方根误差)公式表示为:
使用一段时间的用电量,通过多次迭代训练,得到ARIMA预测曲线和测试集曲线;
4、对SVM模型进行训练,选择核函数,输入为预测的已知年份的用电量(时间间隔15分钟),已知年份的天气情况包括温度、湿度、光照和已知年份每月生产情况预测,输出为已知年份的用电量最终预测值(时间间隔15分钟),真实值为已知年份的月用电量(时间间隔15分钟)。比较得出均方根误差,选择合适的核函数,并记住误差。
5、如图6所示,使用SVM进行决策,输入为预测下月的用电量(时间间隔15分钟),下月的天气情况包括温度、湿度、光照和下月生产情况预测,输出为下月的用电量最终预测值(时间间隔15分钟);
6、取得预测月的用电量最大值,加上误差,然后再除以0.25即需要申报的下月最大需量值(单位:KW)。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (10)
1.一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述方法实现过程包括:
1)从电网公司计费表TSDB中读数;
2)使用滑动平均方法添补缺失值;
3)使用K-Means聚类算法剔除离群点;使用ARIMA时序预测用电量;
4)结合天气因素和生产状况的预测,使用训练好的SVM模型决策;
5)取预测月最大值,计算未来月月最大需量。
2.根据权利要求1所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述ARIMA时序预测用电量计算公式包括内容如下:
ARIMA模型包括三部分:p阶自回归模型,q阶移动平均模型和d阶差分,其中:
P阶自回归模型公式表示为:描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测;
q阶移动平均模型公式表示为:关注的是自回归模型中的误差项的累加;
d阶差分为时间序列t与t-1时刻的差值的d阶差,以使时间序列平稳;
ARIMA公式表示为:。
3.根据权利要求2所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述ARIMA时序预测用电量计算过程如下:
确定好p、q和d后,ARIMA模型的μ、γ、θ由最大似然和卡尔曼滤波优化得到,具体根据历史数据、当前时刻真实数据和该时刻的估计值估算该时刻的最优值,保留该时刻的协方差,再用相同方法估算下一时刻的最优值,不断的把均方误差递归得出训练数据时刻的最优值,根据训练最优值不断更新ARIMA模型的μ、γ、θ,得到ARIMA模型的具体公式;本发明使用的时间序列及一个月每天、每时或每刻的用电量,自变量为时间。
4.根据权利要求3所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,使用ARIMA时序预测用电量的实现过程包括步骤如下:
1)根据数据得出ACF和PACF;
2)根据ACF和PACF的拖尾得到ARIMA的p,q;
3)选择差分系数I;
4)获得预测数据曲线和数据。
5.根据权利要求4所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述ACF计算公式如下:
k代表滞后期数。
6.根据权利要求5所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述PACF是在给定中间观测值的条件下,时间序列观测值预期过去的观测值之间的线性相关性。
7.根据权利要求4所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述p、q根据ACF和PACF判断截尾得出,时间序列中拖尾指序列以指数率单调递减或震荡衰减,截尾指序列从某个时点变得非常小。
8.根据权利要求1所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述K-Means聚类算法采用迭代更新的方法,每一次迭代过程都是向目标函数减小的方向进行,最终聚类结果使得目标函数取得极小值,计算过程如下:
1)给定大小为n的数据集,令O=1,选取k个初始聚类中心Zj(O),j=1,2,3,...,k,O代表不同迭代轮数的聚类中心;
2)计算每个样本数据对象与聚合中心的距离D(xi,Zj(O)),i=1,2,3,…,并分类;
3)令O=O+1,计算新的聚类中心和误差平方和准则f(目标函数)值:
4)判断:若|f(O+1)-f(O)|<θ(f收敛)或者对象无类别变化,则算法结束,否则,O=O+1,返回2)步。
9.根据权利要求1所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述SVM模型训练是通过寻找一个能够正确划分的数据集,并且几何间隔最大的超平面,即最优超平面,具体过程包括内容如下:
点(x,y)到平面(w,b)的距离公式是:
SVM模型公式表达为:
等价于:
训练过程即最优超平面求解,求最优超平面:ωT·x+b,即求其中的ω,b参数:
根据上述公式,先求最大几何间隔: n为训练样本数;
把约束条件融合到优化目标函数中,建立拉格朗日公式:
优化目标变为:满足KKT条件,能够求其对偶问题:对ω和α求偏导并令其值为0:
将ω和α回代L(ω,b,α),则得:
采用序列最小最优化算法求解对偶问题,对αi求导,即求出最优超平面。
10.根据权利要求9所述的一种基于ARIMA和SVM的企业用电最大需量预测方法,其特征在于,所述SVM模型的核函数包括:
线性核函数:k(x,xi)=x·xi,主要用于线性可分的情况;
或,高斯径向基核函数:
或,多项式核函数:
k(x,xi)=((x·xi)+1)d
或,神经元的非线性作用核函数Sigmoid:
k(x,xi)=tanh(η<x,xi>θ)
在选用核函数的时候,如果对数据有一定的先验知识,利用先验来选择符合数据分布的核函数;如果无先验知识,使用交叉验证的方法,来试用不同的核函数,误差最小的即为效果最好的核函数,或者将多个核函数结合起来,形成混合核函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910782943.7A CN110458374A (zh) | 2019-08-23 | 2019-08-23 | 一种基于arima和svm的企业用电最大需量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910782943.7A CN110458374A (zh) | 2019-08-23 | 2019-08-23 | 一种基于arima和svm的企业用电最大需量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110458374A true CN110458374A (zh) | 2019-11-15 |
Family
ID=68488789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910782943.7A Pending CN110458374A (zh) | 2019-08-23 | 2019-08-23 | 一种基于arima和svm的企业用电最大需量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110458374A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112486760A (zh) * | 2020-11-13 | 2021-03-12 | 北京航空航天大学 | 基于arima的软件运行环境要素行为趋势分析方法 |
CN112651927A (zh) * | 2020-12-03 | 2021-04-13 | 北京信息科技大学 | 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法 |
CN112686463A (zh) * | 2021-01-07 | 2021-04-20 | 合肥阳光新能源科技有限公司 | 一种需量数据处理方法、装置及电子设备 |
CN113126019A (zh) * | 2021-04-19 | 2021-07-16 | 广东电网有限责任公司计量中心 | 一种智能电表误差远程估计方法、系统、终端和存储介质 |
CN113312587A (zh) * | 2021-06-16 | 2021-08-27 | 福建中锐网络股份有限公司 | 基于arima预测和回归预测的传感器采集数据缺失值处理方法 |
CN113420422A (zh) * | 2021-05-31 | 2021-09-21 | 济南浪潮数据技术有限公司 | 一种告警日志占比预测方法、系统、设备以及介质 |
US11288602B2 (en) | 2019-09-18 | 2022-03-29 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
CN114372666A (zh) * | 2021-12-03 | 2022-04-19 | 金保数科(北京)技术有限公司 | 一种评估最大需量超标风险的测算方法 |
CN114401398A (zh) * | 2022-03-24 | 2022-04-26 | 北京华创方舟科技集团有限公司 | 智能视频运维管理系统 |
US11328177B2 (en) | 2019-09-18 | 2022-05-10 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
US11334645B2 (en) | 2011-08-19 | 2022-05-17 | Hartford Steam Boiler Inspection And Insurance Company | Dynamic outlier bias reduction system and method |
US11550874B2 (en) | 2014-04-11 | 2023-01-10 | Hartford Steam Boiler Inspection And Insurance Company | Future reliability prediction based on system operational and performance data modelling |
US11615348B2 (en) | 2019-09-18 | 2023-03-28 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
CN115860797A (zh) * | 2022-12-08 | 2023-03-28 | 国网江苏省电力有限公司南通供电分公司 | 一种适应新电价改革形势的电量需求预测方法 |
US11636292B2 (en) | 2018-09-28 | 2023-04-25 | Hartford Steam Boiler Inspection And Insurance Company | Dynamic outlier bias reduction system and method |
CN116756493A (zh) * | 2023-08-15 | 2023-09-15 | 湖南湘江智慧科技股份有限公司 | 一种安消防集指平台数据管理方法 |
-
2019
- 2019-08-23 CN CN201910782943.7A patent/CN110458374A/zh active Pending
Non-Patent Citations (1)
Title |
---|
刘龙龙: "基于ARIMA和SVM的企业用电最大需量预测方法", 《中国优秀硕士学位论文全文数据库工程科技II.辑》 * |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11334645B2 (en) | 2011-08-19 | 2022-05-17 | Hartford Steam Boiler Inspection And Insurance Company | Dynamic outlier bias reduction system and method |
US11550874B2 (en) | 2014-04-11 | 2023-01-10 | Hartford Steam Boiler Inspection And Insurance Company | Future reliability prediction based on system operational and performance data modelling |
US11803612B2 (en) | 2018-09-28 | 2023-10-31 | Hartford Steam Boiler Inspection And Insurance Company | Systems and methods of dynamic outlier bias reduction in facility operating data |
US11636292B2 (en) | 2018-09-28 | 2023-04-25 | Hartford Steam Boiler Inspection And Insurance Company | Dynamic outlier bias reduction system and method |
US11288602B2 (en) | 2019-09-18 | 2022-03-29 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
US11615348B2 (en) | 2019-09-18 | 2023-03-28 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
US11328177B2 (en) | 2019-09-18 | 2022-05-10 | Hartford Steam Boiler Inspection And Insurance Company | Computer-based systems, computing components and computing objects configured to implement dynamic outlier bias reduction in machine learning models |
CN112486760A (zh) * | 2020-11-13 | 2021-03-12 | 北京航空航天大学 | 基于arima的软件运行环境要素行为趋势分析方法 |
CN112651927A (zh) * | 2020-12-03 | 2021-04-13 | 北京信息科技大学 | 一种基于卷积神经网络与支持向量机的拉曼光谱智能识别方法 |
CN112686463A (zh) * | 2021-01-07 | 2021-04-20 | 合肥阳光新能源科技有限公司 | 一种需量数据处理方法、装置及电子设备 |
CN113126019A (zh) * | 2021-04-19 | 2021-07-16 | 广东电网有限责任公司计量中心 | 一种智能电表误差远程估计方法、系统、终端和存储介质 |
CN113420422A (zh) * | 2021-05-31 | 2021-09-21 | 济南浪潮数据技术有限公司 | 一种告警日志占比预测方法、系统、设备以及介质 |
CN113312587B (zh) * | 2021-06-16 | 2023-09-22 | 福建中锐网络股份有限公司 | 基于arima预测和回归预测的传感器采集数据缺失值处理方法 |
CN113312587A (zh) * | 2021-06-16 | 2021-08-27 | 福建中锐网络股份有限公司 | 基于arima预测和回归预测的传感器采集数据缺失值处理方法 |
CN114372666A (zh) * | 2021-12-03 | 2022-04-19 | 金保数科(北京)技术有限公司 | 一种评估最大需量超标风险的测算方法 |
CN114401398A (zh) * | 2022-03-24 | 2022-04-26 | 北京华创方舟科技集团有限公司 | 智能视频运维管理系统 |
CN115860797A (zh) * | 2022-12-08 | 2023-03-28 | 国网江苏省电力有限公司南通供电分公司 | 一种适应新电价改革形势的电量需求预测方法 |
CN115860797B (zh) * | 2022-12-08 | 2023-07-18 | 国网江苏省电力有限公司南通供电分公司 | 一种适应新电价改革形势的电量需求预测方法 |
CN116756493A (zh) * | 2023-08-15 | 2023-09-15 | 湖南湘江智慧科技股份有限公司 | 一种安消防集指平台数据管理方法 |
CN116756493B (zh) * | 2023-08-15 | 2023-10-27 | 湖南湘江智慧科技股份有限公司 | 一种安消防集指平台数据管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110458374A (zh) | 一种基于arima和svm的企业用电最大需量预测方法 | |
Macedo et al. | Demand side management using artificial neural networks in a smart grid environment | |
Rejc et al. | Short-term transmission-loss forecast for the slovenian transmission power system based on a fuzzy-logic decision approach | |
Lu et al. | A reinforcement learning-based decision system for electricity pricing plan selection by smart grid end users | |
Liu et al. | Dynamic pricing strategy of electric vehicle aggregators based on DDPG reinforcement learning algorithm | |
CN109308571B (zh) | 配电线路线变关系检测方法 | |
Ghadimi et al. | PSO based fuzzy stochastic long-term model for deployment of distributed energy resources in distribution systems with several objectives | |
CN102567636B (zh) | 基于相关向量机的高精度风电场功率区间预测方法 | |
Jin et al. | Impact of cost–benefit analysis on financial benefit evaluation of investment projects under back propagation neural network | |
CN113642787A (zh) | 基于配售电竞争态势下区域配电网网格化负荷区间预测方法 | |
CN103514566A (zh) | 一种风险控制系统及方法 | |
CN107706932B (zh) | 一种基于动态自适应模糊逻辑控制器的能量调度优化方法 | |
CN101888087A (zh) | 一种在配网终端中实现分布式超短期区域负荷预测的方法 | |
CN106126923B (zh) | 流域梯级龙头水电站效益补偿方法及系统 | |
CN110796307A (zh) | 一种综合能源系统分布式负荷预测方法及系统 | |
CN107565585A (zh) | 储能装置调峰回报时间预测方法及其模型创建方法 | |
CN113869616A (zh) | 一种自适应的居民用户负荷预测方法 | |
Mutanen | Improving electricity distribution system state estimation with AMR-based load profiles | |
CN110570023A (zh) | 一种基于sarima-grnn-svm的短期商业电力负荷预测方法 | |
CN104881718A (zh) | 基于多尺度经济先行指标的区域电力景气指数构建方法 | |
Zhang et al. | Joint planning of residential electric vehicle charging station integrated with photovoltaic and energy storage considering demand response and uncertainties | |
Hu et al. | Probabilistic net load forecasting based on transformer network and Gaussian process-enabled residual modeling learning method | |
Xiong et al. | Interpretable deep reinforcement learning for optimizing heterogeneous energy storage systems | |
CN115829101B (zh) | 一种基于多尺度时间卷积网络的用电成本预测及优化方法 | |
Xu et al. | CVaR‐based method for optimizing the contract bidding strategy of PV power stations |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191115 |