CN105913141A - 一种支持大数据的负荷预测方法 - Google Patents
一种支持大数据的负荷预测方法 Download PDFInfo
- Publication number
- CN105913141A CN105913141A CN201610210313.9A CN201610210313A CN105913141A CN 105913141 A CN105913141 A CN 105913141A CN 201610210313 A CN201610210313 A CN 201610210313A CN 105913141 A CN105913141 A CN 105913141A
- Authority
- CN
- China
- Prior art keywords
- omega
- network
- sample
- formula
- max
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 30
- 239000011159 matrix material Substances 0.000 claims abstract description 29
- 230000008569 process Effects 0.000 claims abstract description 16
- 238000005457 optimization Methods 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims abstract description 5
- 238000007906 compression Methods 0.000 claims abstract description 4
- 230000006835 compression Effects 0.000 claims abstract description 3
- 230000009466 transformation Effects 0.000 claims description 10
- 238000000354 decomposition reaction Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000013277 forecasting method Methods 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 5
- 210000002569 neuron Anatomy 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 3
- 238000000137 annealing Methods 0.000 abstract description 5
- 238000004088 simulation Methods 0.000 abstract 2
- 230000006870 function Effects 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012706 support-vector machine Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- CVXBEEMKQHEXEN-UHFFFAOYSA-N carbaryl Chemical compound C1=CC=C2C(OC(=O)NC)=CC=CC2=C1 CVXBEEMKQHEXEN-UHFFFAOYSA-N 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 1
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000000714 time series forecasting Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2111—Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Water Supply & Treatment (AREA)
- Physiology (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种支持大数据的负荷预测方法。本发明在网络训练时,通过改进模拟退火算法根据测试误差反馈寻找最优信息熵比对原始输入矩阵经行维度压缩及最小样本集合半径后作为构建径向基神经元内核函数的参数。改进型模拟退火算法在全局优化时不宜陷入局域最优的基础上,实现了优化初始阶段全局寻优,优化过程后期局域寻优的优点,缩短了优化过程,提升了优化效率,增强了预测的准确度及泛化能力。
Description
技术领域
本发明一种支持大数据训练样本的负荷预测模型优化方法,属于人工智能技术领域。
背景技术
电力负荷预测是电力系统经济潮流规划的基石,准确的未来负荷预测对电网的优化调度起到了至关重要的作用,对减少电网的备用容量,降低电网投资有重要意义。随着《电改九号文》的出台,对用户侧的能源管理提出了新的指导意见。负荷预测从电网主干节点的用电预测拓展至单位更小的工厂、商业区、住宅区,甚至工业生产线、商业楼宇特定功能区域以及家庭。相比传统的负荷预测,主要影响因素不仅需考虑季节性、气象环境、预测日类型,还需考虑预测目标所特有负荷特征的影响因素,这些影响因素或可由预先认知知识获得,例如分时电价激励;也可选择一些影响权重未知的因素,例如机场的航班起降信息,航站楼的实时人口密度,等。小微化的预测区域使得负荷预测样本具大样本数据(Volume)、多样性(Variety)、真实性(Veracity)的特点,而负荷预测模型需具有处理以上数据的高速性(Velocity)和准确性。
1988年,Broomhead和Low在他们合作撰写的论文“Radial Basis Functions,Multi-Variable Functional Interpolation and Adaptive Networks”首次提出了径向基网络的理论模型。在之后的27年里,径向基网络广泛的运用在函数逼近、时间序列预测、分类、系统控制等领域,包括电力负荷预测模型中。
应用径向基网络预测电力负荷的具体流程如图1所示。首先将历史数据去奇异化,然后通过Max-Min法或Z-score法,将数据归一化:
或
在式(1)及式(2)中,xi,norm是指一个归一化后的样本,max(X)、min(X)、μ、σ分别是所有样本中各因素最大值、最小值、均值、标准差的集合。
在归一化后,按照式(3)构建径向基神经元,将其与网络输出的线性回归系数作为网络的链接权重。将非线性关系通过输入空间低维至高维的转换变化为简单的线性关系,应用Moore-Penrose广义逆矩阵求解径向基神经元与预测目标的线性系数,确定连接权重,降低了学习的复杂性。
式(3)中,gσ(·)为高斯置换算子,xi为输入样本,输入样本为1×m的向量,其纬度为m,输入样本共有n个,xj为径向基,σ为扩散系数。经过映射后,输入空间从n×m变为一个n×(N+1)的矩阵,n+1>>m。
式(4)中,第一列元素等于1的向量为隐含层与输出层的偏置权重。最后线性求和层的权重W通过Moore-Penrose广义逆矩阵式(5)及(6)来求:
G·W=Y (5)
W=(GTG)-1GTY (6)
预测值由下式求得:
由于对训练样本没有事先聚类过程,将所有的样本直接作为径向基,径向基隐含层的输出为一n×(n+1)的矩阵,且径向基方程的扩散系数σ选取也由经验确定。这种方法在训练样本数较少时,加快了训练速度。然而在大数据环境下,基于径向基网络开发的预测模型需对4V样本数据进行学习,若采取这种方法,必然造成训练时间缓慢、精度不高的结果。
公开号为CN 104881706 A的发明专利申请涉及一种基于大数据技术的电力系统短期负荷预测方法,提出了对负荷根据形状特征分类,并对每一类建立基于支持向量机的负荷预测模型。通过分布式运算的概念,从形式分散了大训练样本对单一神经网络预测模型的计算压力。但对于某一类别中包含大量训练样本,另一类别中包含少量训练样本的预测事件,其创新点无法发挥其声明的作用。且技术中采用的支持向量机在计算最后线性权重时,需对n个训练样本的在n+1维的空间映射进行支持向量的寻优。此算法已被普遍认为不适合运用在大数据环境下。
公开号为CN 103488869的发明专利申请涉及一种最小二乘支持向量机的风力发电短期负荷预测方法,提出对负荷预测模型输入因数进行主成分分析,确定预测模型的输入主成分。这一种主成分分析的方法是不正确的,因为当对输入因素进行特征根值的信息熵贡献度排序后所得的变换矩阵实质上对原始输入数据中的信息进行压缩处理。当原始因素与转换矩阵相乘后得到新的降维后的输入矩阵并不能表征哪些因素是主成分,哪些是次要成分。只能表述转换后降维的输入矩阵包含了原输入矩阵中大部分的信息量,是一个压缩过程而不是主成分筛选的过程。技术中采用的支持向量机在使用最小二乘法计算最后线性权重时,需对n个训练样本的在n+1维的空间映射进行支持向量的寻优。此算法已被普遍认为不适合运用在大数据环境下。
申请号为201210390738.4的发明专利申请涉及一种需求响应下的短期负荷预测方法,也应用了支持向量机作为预测模型主体,在计算最后线性权重时,需对n个训练样本的在n+1维的空间映射进行支持向量的寻优。此算法已被普遍认为不适合运用在大数据环境下。
发明内容
本发明要解决的技术问题是:在大数据环境下,提高预测模型的训练时间及精度。
为了解决上述技术问题,本发明的技术方案是提供了一种支持大数据的负荷预测方法,其特征在于,包括以下步骤:
步骤1、利用傅里叶系数分解方法对负荷进行奇异值的剥离及插值估算;
步骤2、卡洛变换:
U=X·WT,式中,X为输入数据样本集合,大小为n×m;W为投影向量,U为变换后的输入数据;
步骤3、对变换后的输入样本数据进行归一化、随机化,生成训练样本;
步骤4、运用层次分裂分析算法对训练样本进行分类,将隐含层的大小从n×(n+1)的矩阵缩小为n×(k+1)的矩阵,k为分类后得到的集合数,k<<n;
步骤5、构建径向基网络隐含层;
步骤6、网络误差评估;
步骤7、误差反馈优化网络参数,在网络训练时,通过改进模拟退火算法根据测试误差反馈寻找最优信息熵比对原始输入矩阵经行维度压缩及最小样本集合半径后作为构建径向基神经元内核函数的参数。
优选地,在所述步骤7中,所述改进模拟退火算法包括以下步骤:
步骤7.1、设定迭代数i=0、初始温度t0、温度下降系数α,并生成包含N个随机解ω0,1,ω0,2,…,ω0,N的初始解集合Ω0,则有:
步骤7.2、计算能量值E0,有:
式中,ω0,1,ω0,2,…,ω0,N为e0,1,e0,2,…,e0,N对应的解,将初始最小能量值作为目前网络最优表现,记为ebest,0,ebest,0所对应的解作为目前最优解,记做ωbest,0;
步骤7.3、i=i+1,ti=α·ti-1,ti为第i次迭代的温度,ti-1为第i-1次迭代的温度,进入下一次迭代过程;
步骤7.4、运用改进的变异方程计算第i次迭代的集合Ωi,则集合Ωi中第i个元素ωi,n为:
式中:
n为该解在解集中的序号;b为不均匀随机系数;r是均匀分布随机数,r∈[0,1],η是一个均等概率的随机整数;ωmax=[ρ=1,r′=max(R)],ρ为卡洛变换信息量的比例,r′为分类时集合最小半径,max(R)为最大的训练数据样本间的距离;ωmin=[ρ=0,r′=min(R)],min(R)为最小的训练数据样本间的距离;
步骤7.5、生成解集Ωi,并计算能量值Ei,有:
步骤7.6、若最小能量值min(Ei)<ebest,0,则ebest,i=min(Ei),ebest,i为第i次迭代最小能量值,Ei所对应的ωi,n则为第i次迭代最优解ωbest,i,返回步骤7.3进入下一次迭代过程,若min(Ei)≥ebest,0,则下式决定是否将Ei所对应的ωi,n作为最优解:
式中,k为Boltzmann系数,p为随机数,0≤p≤1,若上式成立,Ei所对应的ωi,n则为第i次迭代最优解ωbest,i,返回步骤7.3进入下一次迭代过程,若不成立,则返回步骤7.4重新生成解集;
步骤7.7、当温度ti下降至0,或循环到达最大迭代次数时,网络优化中止,此时的ωbest,i为全局最优解,ebest,i为全局最优网络表现。
在设计支持大数据的负荷预测模型时,需考虑大量、高维数据在记录、存储时由于各种原因造成的数据奇异及数据丢失。本发明使用傅里叶系数分解方法对负荷进行奇异值的剥离及对丢失数据进行插值估算,降低误差样本对网络训练的干扰。输入因素的选择由于负荷预测的场合、类型、用途不同而差异很大,由于对待预测负荷的成因无法进行系统的定性、定量分析,为了避免重要输入因素的遗漏,对输入因素的选取往往宁滥勿缺,使得输入样本具有高维度的特征。本发明使用卡洛变换,在样本信息损失(信息熵比)可控的情况下,降低样本的维度,有效的减少在训练或测试阶段对运算能力的需求。将输入样本的取值范围归一化,避免不同的量纲影响网络学习;对输入样本的排列做随机化处理,避免神经网络将排列顺序作为潜在的因果关系进行学习。
在构建径向基网络隐含层时,使用分裂分类算法,将输入样本分类,将隐含层的大小从n×(n+1)的矩阵缩小为n×(k+1)的矩阵,n为样本数,k为集合数,k<<n。在求解隐含层与输出层的线性权重时提高了运算效率,提高了预测网络对于大数据训练样本的运算能力。
在网络训练时,通过改进模拟退火算法根据测试误差反馈寻找最优信息熵比对原始输入矩阵经行维度压缩及最小样本集合半径后作为构建径向基神经元内核函数的参数。改进型模拟退火算法在全局优化时不宜陷入局域最优的基础上,实现了优化初始阶段全局寻优,优化过程后期局域寻优的优点,缩短了了优化过程,提升了优化效率,增强了预测的准确度及泛化能力。
附图说明
图1为径向基网络训练流程;
图2为本发明的优化方案流程图;
图3为使用傅里叶系数分解法光滑后的原始负荷数据;
图4为使用傅里叶系数分解法光滑后分离出的随机负荷数据;
图5为预测模型预测数据与原始数据的对比表现(全局);
图6为预测模型预测数据与原始数据的对比表现(一天)。
具体实施方式
为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
结合图2,本发明提供了一种支持大数据的负荷预测方法,包括以下步骤:
步骤一:傅里叶系数分解方法对负荷进行奇异值的剥离及插值估算(本方法引用自发明人2008年12月发表的硕士论文,A hybrid neural network architecture forpower system load forecasting)
通过观察历史数据的趋势及峰谷特征并通过傅里叶系数分解原始数据再重组的方法来对热负荷建模。负荷曲线Load可分解为基值Loadbase、增量Loadgrowth及周期性分量LoadPeriodic,见式(8)。
Load=Loadbase+Loadgrowth+LoadPeriodic (8)
式(8)可改写如下的矩阵形式:
L=W*X (9)
其中
式(10)及式(11)中,ω0为基波角频率,b1为基荷,b2为线性增长率,b3…b2n+1为谐波分量的系数。所以系数矩阵W可由式(12)求得:
W=pinv(X)·L (12),在式(12)中,pinv(X)表示矩阵X的伪逆矩阵。
负荷模型可由式(13)所得
步骤二:卡洛变换(本方法引用自发明人2008年12月发表的硕士论文,A hybridneural network architecture for power system load forecasting)
卡洛变换如下:
U=X·WT (14)
式(14)中,X为输入数据样本集合,大小为n×m;W为投影向量;U为变换后的输入数据。在投射过程中U应保留原数据集中绝大部分的方差信息。计算X协方差矩阵Λ的特征向量[e1,e2,...,em],定义ρ为信息熵的比例值,一般取0.9-0.95。
式(15)中,d表示前d维因素所含的信息熵值占所有m维因素信息熵值的90%-95%。
将特征值有大到小排列后存入向量E,投影向量W由下式获得:
W=ET, (16)
步骤三:历史数据样本归一化、随机化(通用神经网络预测模型步骤)
Max-Min法:
Z-score法:
式(17)及式(18)中x为数据样本,xnorm为归一化后的数据样本,max(X)、min(X)为样本集中的最大、最小数据,μ为样本平均值,σ为样本标准差。
随机化:
假设训练样本数为n,随机生成一数列N,max(N)=n,min(N)=1,且N(i)≠N(j)。将X矩阵以新的随机序列N赋值于X,X=X[N,:]。
步骤四:运用层次分裂分析算法(Divisive Analysis,DIANA)对训练样本进行分类.(本方法引用自发明人2008年12月发表的硕士论文,A hybrid neural networkarchitecture for power system load forecasting)
首先定义最小集合半径r,并将所有样本视为一个集合。初始阶段,计算所有样本间的相对距离,并找出相对距离最远的两个样本。将这两个样本定义为新的集合中心,其他样本根据与新集合中心的相对距离进行分类。根据上述步骤对半径最大集合进行分裂,当下一次集合分裂半径小于预先定义的最小集合半径时,分裂停止。计算各集合中心Ci,及集合半径σi
步骤五:构建径向基网络隐含层(本方法引用自发明人2008年12月发表的硕士论文,A hybrid neural network architecture for power system load forecasting)内核方程修改为:
式(19)中,xi为输入样本,1×m,m为样本维度n为样本数;Cj为jth样本集合中心,j∈[1,k];σj为最jth样本集合扩散系数。经过映射后,输入空间从n×m变为一个n×(k+1)的矩阵,n+1>>k+1>>m。
G·W=Y (21)
W=(GTG)-1GTY (22)
预测值由下式求得:
步骤六:网络误差评估(现阶段国际常用神经网络预测评价函数)
选用平均绝对百分误差(Mean Absolute Percentage Error)来作为网络的评价函数,见式(24)。
其中n为样本数,yi为实际值,为预测值。
步骤七:误差反馈优化网络参数
建立目标方程:
min(e)=min(frbf(r′,ρ)) (25)
式(25)中,e为平均绝对百分误差,r′为分类时集合最小半径,ρ为卡洛变换信息量的比例。确定自变量变化空间0≤r′≤max(d),0≤ρ≤1。自变量的边界值为ωmax=[ρ=1,r′=max(R)],ωmin=[ρ=0,r′=min(R)]。解集中包含的解的个数N,max(R)为最大的训练样本间的距离,min(R)为最小的训练样本间的距离。
改进退火算法的优化流程如下:
步骤7.1、设定迭代数i=0、初始温度t0、温度下降系数α,并生成包含N个随机解ω0,1,ω0,2,…,ω0,N的初始解集合Ω0,则有:
步骤7.2、计算能量值E0,有:
(27),式(26)及式(27)中,ω0,1,ω0,2,…,ω0,N为e0,1,e0,2,…,e0,N对应的解,将初始最小能量值作为目前网络最优表现,记为ebest,0,ebest,0所对应的解作为目前最优解,记做ωbest,0;
步骤7.3、i=i+1,ti=α·ti-1,ti为第i次迭代的温度,ti-1为第i-1次迭代的温度,进入下一次迭代过程;
步骤7.4、运用改进的变异方程计算第i次迭代的集合Ωi,则集合Ωi中第i个元素ωi,n为:
(28),式(28)中:
n为该解在解集中的序号;b为不均匀随机系数;r是均匀分布随机数,r∈[0,1],η是一个均等概率的随机整数;
步骤7.5、生成解集Ωi,并计算能量值Ei,有:
步骤7.6、若最小能量值min(Ei)<ebest,0,则ebest,i=min(Ei),ebest,i为第i次迭代最小能量值,Ei所对应的ωi,n则为第i次迭代最优解ωbest,i,返回步骤7.3进入下一次迭代过程,若min(Ei)≥ebest,0,则式(33)决定是否将Ei所对应的ωi,n作为最优解:
式(33)中,k为Boltzmann系数,p为随机数,0≤p≤1,若式(33)成立,Ei所对应的ωi,n则为第i次迭代最优解ωbest,i,返回步骤7.3进入下一次迭代过程,若式(33)不成立,则返回步骤7.4重新生成解集;
步骤7.7、当温度ti下降至0,或循环到达最大迭代次数时,网络优化中止,此时的ωbest,i为全局最优解,ebest,i为全局最优网络表现。
下面结合具体数据对本发明作进一步介绍,负荷数据采集自New England ISO2000.1.1至2002.12.31,采样间隔为1小时。
在图3及图4中,经过傅里叶系数分解法滤去原数据中的高频谐波分量形成光滑后的负荷曲线模型。负荷光滑模型与原始模型的关联系数(R2)为0.9434。
在此案例中,选取待预测负荷前3小时的干球温度、露点温度及历史负荷,及待预测小时的干球温度与露点温度作为初始输入因素。初始输入矩阵【Dry Bulb-1 Dry Bulb-2Dry Bulb-3 Dry Bulb Dew Point-1 Dew Point-2 Dew Point-3 Dew Point Load-1 Load-2Load-3】为一个26208×11的矩阵。应用卡洛变换进行压缩降维后输入矩阵的大小为,所含信息熵之比为99.85%。
对输入及输出数据进行z-score归一化以后,应用分裂分析算法对输入样本聚类。设初始最小集合半径为1,经过改进退火算法优化后,最小半径修正为0.3375,集合数为892,故径向基隐含层矩阵1大小为,预测结果如图5及图6所示。预测模型的预测输出与原始模型的关联系数(R2)为0.9821,MAPE=1.98%。
Claims (2)
1.一种支持大数据的负荷预测方法,其特征在于,包括以下步骤:
步骤1、利用傅里叶系数分解方法对负荷进行奇异值的剥离及插值估算;
步骤2、卡洛变换:
U=X·WT,式中,X为输入数据样本集合,大小为n×m;W为投影向量,U为变换后的输入数据;
步骤3、对变换后的输入样本数据进行归一化、随机化,生成训练样本;
步骤4、运用层次分裂分析算法对训练样本进行分类,将隐含层的大小从n×(n+1)的矩阵缩小为n×(k+1)的矩阵,k为分类后得到的集合数,k<<n;
步骤5、构建径向基网络隐含层;
步骤6、网络误差评估;
步骤7、误差反馈优化网络参数,在网络训练时,通过改进模拟退火算法根据测试误差反馈寻找最优信息熵比对原始输入矩阵经行维度压缩及最小样本集合半径后作为构建径向基神经元内核函数的参数。
2.如权利要求1所述的一种支持大数据的负荷预测方法,其特征在于,在所述步骤7中,所述改进模拟退火算法包括以下步骤:
步骤7.1、设定迭代数i=0、初始温度t0、温度下降系数α,并生成包含N个随机解ω0,1,ω0,2,…,ω0,N的初始解集合Ω0,则有:
步骤7.2、计算能量值E0,有:
式中,ω0,1,ω0,2,…,ω0,N为e0,1,e0,2,…,e0,N对应的解,将初始最小能量值作为目前网络最优表现,记为ebest,0,ebest,0所对应的解作为目前最优解,记做ωbest,0;
步骤7.3、i=i+1,ti=α·ti-1,ti为第i次迭代的温度,ti-1为第i-1次迭代的温度,进入下一次迭代过程;
步骤7.4、运用改进的变异方程计算第i次迭代的集合Ωi,则集合Ωi中第i个元素ωi,n为:
式中:
n为该解在解集中的序号;b为不均匀随机系数;r是均匀分布随机数,r∈[0,1],η是一个均等概率的随机整数;ωmax=[ρ=1,r′=max(R)],ρ为卡洛变换信息量的比例,r′为分类时集合最小半径,max(R)为最大的训练数据样本间的距离;ωmin=[ρ=0,r′=min(R)],min(R)为最小的训练数据样本间的距离;
步骤7.5、生成解集Ωi,并计算能量值Ei,有:
步骤7.6、若最小能量值min(Ei)<ebest,0,则ebest,i=min(Ei),ebest,i为第i次迭代最小能量值,Ei所对应的ωi,n则为第i次迭代最优解ωbest,i,返回步骤7.3进入下一次迭代过程,若min(Ei)≥ebest,0,则下式决定是否将Ei所对应的ωi,n作为最优解:
式中,k为Boltzmann系数,p为随机数,0≤p≤1,若上式成立,Ei所对应的ωi,n则为第i次迭代最优解ωbest,i,返回步骤7.3进入下一次迭代过程,若不成立,则返回步骤7.4重新生成解集;
步骤7.7、当温度ti下降至0,或循环到达最大迭代次数时,网络优化中止,此时的ωbest,i为全局最优解,ebest,i为全局最优网络表现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610210313.9A CN105913141A (zh) | 2016-04-06 | 2016-04-06 | 一种支持大数据的负荷预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610210313.9A CN105913141A (zh) | 2016-04-06 | 2016-04-06 | 一种支持大数据的负荷预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105913141A true CN105913141A (zh) | 2016-08-31 |
Family
ID=56744748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610210313.9A Pending CN105913141A (zh) | 2016-04-06 | 2016-04-06 | 一种支持大数据的负荷预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105913141A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682773A (zh) * | 2016-12-15 | 2017-05-17 | 重庆川仪自动化股份有限公司 | 一种基于模拟退火算法的人机焊接工时预测方法 |
CN106713013A (zh) * | 2016-11-30 | 2017-05-24 | 广西大学 | 基于时齐模拟退火方法的能量收集场景规划方法及装置 |
CN106874693A (zh) * | 2017-03-15 | 2017-06-20 | 国信优易数据有限公司 | 一种医疗大数据分析处理系统及方法 |
CN107239859A (zh) * | 2017-06-05 | 2017-10-10 | 国网山东省电力公司电力科学研究院 | 基于串联长短期记忆循环神经网络的供热负荷预测方法 |
CN109297086A (zh) * | 2018-09-10 | 2019-02-01 | 常州英集动力科技有限公司 | 热力站负荷分时段滚动预测及自适应矫正方法及系统 |
CN110059893A (zh) * | 2019-04-30 | 2019-07-26 | 中国民航大学 | 一种含规划机场的大型繁忙机场终端区起降量预测方法 |
CN110501568A (zh) * | 2019-07-05 | 2019-11-26 | 同济大学 | 一种基于图信号处理的非侵入式设备负载监测方法 |
-
2016
- 2016-04-06 CN CN201610210313.9A patent/CN105913141A/zh active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106713013A (zh) * | 2016-11-30 | 2017-05-24 | 广西大学 | 基于时齐模拟退火方法的能量收集场景规划方法及装置 |
CN106713013B (zh) * | 2016-11-30 | 2020-03-27 | 广西大学 | 能量收集网络数据发送方法及系统 |
CN106682773A (zh) * | 2016-12-15 | 2017-05-17 | 重庆川仪自动化股份有限公司 | 一种基于模拟退火算法的人机焊接工时预测方法 |
CN106874693A (zh) * | 2017-03-15 | 2017-06-20 | 国信优易数据有限公司 | 一种医疗大数据分析处理系统及方法 |
CN107239859A (zh) * | 2017-06-05 | 2017-10-10 | 国网山东省电力公司电力科学研究院 | 基于串联长短期记忆循环神经网络的供热负荷预测方法 |
CN109297086A (zh) * | 2018-09-10 | 2019-02-01 | 常州英集动力科技有限公司 | 热力站负荷分时段滚动预测及自适应矫正方法及系统 |
CN109297086B (zh) * | 2018-09-10 | 2020-10-09 | 常州英集动力科技有限公司 | 热力站负荷分时段滚动预测及自适应矫正方法及系统 |
CN110059893A (zh) * | 2019-04-30 | 2019-07-26 | 中国民航大学 | 一种含规划机场的大型繁忙机场终端区起降量预测方法 |
CN110059893B (zh) * | 2019-04-30 | 2024-04-09 | 中国民航大学 | 一种含规划机场的大型繁忙机场终端区起降量预测方法 |
CN110501568A (zh) * | 2019-07-05 | 2019-11-26 | 同济大学 | 一种基于图信号处理的非侵入式设备负载监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105913141A (zh) | 一种支持大数据的负荷预测方法 | |
Jiao et al. | A model combining stacked auto encoder and back propagation algorithm for short-term wind power forecasting | |
Chang et al. | An improved neural network-based approach for short-term wind speed and power forecast | |
Hu et al. | Hybrid forecasting method for wind power integrating spatial correlation and corrected numerical weather prediction | |
Fan et al. | Development of prediction models for next-day building energy consumption and peak power demand using data mining techniques | |
Chang | An RBF Neural Network Combined with OLS Algorithm and Genetic Algorithm for Short‐Term Wind Power Forecasting | |
Huang et al. | A Bayesian Network model for predicting cooling load of commercial buildings | |
Hong et al. | Locational marginal price forecasting using deep learning network optimized by mapping-based genetic algorithm | |
CN103927460A (zh) | 一种基于rbf的风电场短期风速预测方法 | |
Sani Salisu et al. | Solar radiation forecasting in Nigeria based on hybrid PSO-ANFIS and WT-ANFIS approach | |
Tian et al. | An adaptive ensemble predictive strategy for multiple scale electrical energy usages forecasting | |
Hamzaçebi | Primary energy sources planning based on demand forecasting: The case of Turkey | |
Yao et al. | Electric supply and demand forecasting using seasonal grey model based on PSO-SVR | |
Karimtabar et al. | Analysis and predicting electricity energy consumption using data mining techniques—A case study IR Iran—Mazandaran province | |
CN108694475B (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 | |
CN113780679A (zh) | 一种基于泛在电力物联网的负荷预测方法及装置 | |
Jahan et al. | Intelligent system for power load forecasting in off-grid platform | |
CN115481788A (zh) | 相变储能系统负荷预测方法及系统 | |
Sarkar et al. | Bootstrap aggregating approach to short-term load forecasting using meteorological parameters for demand side management in the North-Eastern Region of India | |
Long et al. | Short-term solar power interval prediction with interval width initilization approach | |
Ye et al. | A comparative study of ensemble support vector regression methods for short-term load forecasting | |
Ur-Rehman et al. | Dcnn and lda-rf-rfe based short-term electricity load and price forecasting | |
Louzazni et al. | Dailly forecasting of photovoltaic power using non-linear auto-regressive exogenous method | |
Li et al. | Short-term Photovoltaic Power Forecasting Using SOM-based Regional Modelling Methods | |
Gong et al. | Integrated multi-horizon power and energy forecast for aggregated electric water heaters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160831 |