CN111079980B - 基于自适应分类策略和混合优化svr的光功率预测方法 - Google Patents
基于自适应分类策略和混合优化svr的光功率预测方法 Download PDFInfo
- Publication number
- CN111079980B CN111079980B CN201911157904.4A CN201911157904A CN111079980B CN 111079980 B CN111079980 B CN 111079980B CN 201911157904 A CN201911157904 A CN 201911157904A CN 111079980 B CN111079980 B CN 111079980B
- Authority
- CN
- China
- Prior art keywords
- data
- meteorological
- prediction
- samples
- svr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000005457 optimization Methods 0.000 title claims abstract description 51
- 230000003287 optical effect Effects 0.000 title claims abstract description 25
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 75
- 239000002245 particle Substances 0.000 claims abstract description 52
- 230000002159 abnormal effect Effects 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000012216 screening Methods 0.000 claims abstract description 19
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 230000000694 effects Effects 0.000 claims abstract description 9
- 238000003672 processing method Methods 0.000 claims abstract description 8
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 6
- 230000003044 adaptive effect Effects 0.000 claims description 28
- 239000013598 vector Substances 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 15
- 230000001419 dependent effect Effects 0.000 claims description 14
- 238000009826 distribution Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 6
- 230000036961 partial effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 claims description 2
- 230000003313 weakening effect Effects 0.000 claims description 2
- 230000002411 adverse Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 33
- 230000008859 change Effects 0.000 description 14
- 238000010248 power generation Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000003064 k means clustering Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000017525 heat dissipation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N10/00—Quantum computing, i.e. information processing based on quantum-mechanical phenomena
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Primary Health Care (AREA)
- Mathematical Analysis (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Computational Mathematics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
Abstract
本发明提供了一种基于自适应分类策略和混合优化SVR的光功率预测方法,包括以下步骤:S1.数据预处理,采用无量纲化处理方法和基于密度的离群点算法剔除历史样本中的异常样本,并采用插值算法对缺失数据进行重构或直接删除;S2.样本帅选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本;S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练预测模型,输入预测时刻气象数据,得到功率预测值。本发明能够降低错误数据和缺失数据对预测精度的不利影响,能根据预测时刻气象数据筛选出与预测时刻气象数据高度相似的历史样本,并采用量子粒子群与网格法混合优化SVR算法的超参数,提高模型的泛化能力。
Description
技术领域
本发明属于光伏功率预测技术领域,尤其是涉及一种基于自适应分类策略和混合优化SVR算法的光伏功率预测方法。
背景技术
光伏电站输出功率受太阳辐照度、温度、湿度、风速、风向、气压等气象特征的影响,这些气象特征的变化特性使光伏电站输出功率具有随机性、波动性和间歇性等特点,是导致光伏电站限电运行的主要因素。为了提高电网的光伏消纳能力,并网光伏电站必须配置高精度的光伏功率预测系统。
光伏功率预测大致包括数据预处理、样本筛选、模型训练、数值预测等几个步骤,为了提高光伏功率预测的准确率,本领域技术人员在影响光伏输出功率的主要气象特征的选取、样本筛选、模型选择、模型融合等方面进行了大量的研究。其中,常见的模型训练的算法有神经网络算法、分类回归算法、时间序列算法、随机森林算法、概率预测算法等。
例如,由贺文,齐爽,李国庆等撰写,2015年公开于可再生能源33卷第3期333-339页的文献[1]“基于小波神经网络的太阳辐照强度预测”采用相关系数分析法和曲线估计筛选出影响太阳辐照度的主要气象特征;由杨光撰写,2014年公开于华北电力大学的文献[2]“光伏发电功率与气象影响因子关联关系的分析研究”采用灰色关联度分析(GreyRelational Analysis,GRA)确定各个气象特征对光伏功率的影响程度;由程泽,李思宇,韩丽洁等撰写,2017年公开于太阳能学报38卷03期726-733页的文献[3]“基于数据挖掘的光伏阵列发电预测方法研究”通过前项选择法在尽量减小变量间耦合的情况下,逐步约减气象特征,剔除影响较小的气象特征;由李燕青,杜莹莹撰写2018年公开于华北电力大学报(自然科学版)45卷05期29-35+61页的文献[4]“基于最优相似度与IMEA-RBFNN的短期光伏发电功率预测”利用相关性分析与平均影响值算法选取出温度、湿度、太阳辐照度3个气象特征作为影响光伏功率的主要气象特征;2019年公开于中国电机工程学报39卷08期2221-2230页的文献[5]“频域分解和深度学习算法在短期负荷及光伏功率预测中的应用”和2018年公开中南大学学报(自然科学版)49卷09期2232-2239的文献[6]“基于日类型及融合理论的BP网络光伏功率预测”将光伏板(组件)温度作为影响光伏输出功率的特征因素之一。而光伏板(组件)温度受太阳辐照度、温度、风速等气象特征和光伏组件转换效率的综合影响,在预测光伏输出功率前还需训练光伏板(组件)温度的预测模型。
另外,从相似日样本中筛选出与预测时段气象特征高度相似的样本训练预测模型是光伏功率预测算法中较常见的方法。例如文献[7]“光伏发电功率的智能预测算法”(2014年电力建设35卷07期34-39页,作者:程泽,韩丽洁,李思宇,巩力)提出根据天气类型、平均太阳辐照度、最高温度、最低温度等组成的日气象特征向量筛选出与预测日日内气象变化特征相似的相似日;文献[8]“基于相似日和径向基函数神经网络的光伏阵列输出功率预测”(2013年电力自动化设备33卷01期100-103+109页,作者,王晓兰,葛鹏江)则选取日辐照时长、最大最小辐照度及其出现时刻、最大最小温度及其出现时刻作为日气象特征向量;文献[9]“基于改进深度受限玻尔兹曼机算法的光伏发电短期功率概率预测”(2018电力自动化设备38卷05期43-49页,作者,王继东,冉冉,宋智林)以最大最小辐照度、最大最小温度作为日气象特征向量;文献[10]“基于相似日和CAPSO-SNN的光伏发电功率预测”(2017电力自动化设备37卷03期66-71页,作者陈通,孙国强,卫志农)选取季节类型、天气类型、逐时温度和风速为日气象特征向量,通过气象特征向量的灰色相关度和余弦相似度组成的综合相似度指标确定相似日。
基于时刻聚类可以将各个时刻的历史样本精细化分类,文献[2]根据k-means聚类的手肘法将各时刻样本聚类成5类;文献[11](基于多尺度聚类分析的光伏功率特性建模及预测应用,2018电力系统自动化42卷151期24-30页,作者,管霖,赵琦,周保荣)在文献[2]的基础上,进一步与气象理论交互验证,通过k-means聚类算法将所选择的样本基于太阳辐照度聚类成3类,这3类样本集的中心点太阳辐照度刚好与晴天、阴天和雨天太阳辐照度一一对应。文献[12](基于模糊聚类和支持向量机的短期光伏功率预测,2016电力系统及其自动化学报,28卷12期115-118+129页,作者,于秋玲,许长清,李珊,刘洪,宋毅,刘晓鸥)通过气象信息建立模糊相似矩阵将光伏输出功率历史样本集划分为若干类,然后通过分类识别获得与预测日最相似一类历史日样本集。
通过总结分析可以得出,目前的光伏功率预测研究面临以下难点:
(1)采用相关系数和灰色关联度衡量气象特征对光伏输出功率的影响程度,没有考虑各气象特征的耦合作用;采用前项选择方法,若各气象特征之间存在多重共线性,则最后确定的主要气象特征中可能混有不太重要的气象特征。不同时空尺度下影响光伏输出功率的主要气象特征及其作用机理不同,考虑到日内气象特征的多变性,有必要根据预测时刻气象特征自适应筛选出与该时刻气象特征更相似的样本训练精确的预测模型。
(2)相似日的确定方法较为粗放,导致相似日样本中可能混杂较多与预测时刻气象特征有明显差异的样本,进一步影响预测模型精度。此外,为了提高预测方法的鲁棒性,基于时刻聚类的历史样本还需进一步筛选与校验,才能用于模型训练。
(3)神经网络算法可以拟合复杂的非线性关系,但易产生过拟合;时间序列算法在天气剧烈变化的场景预测精度不高。
(4)目前大多数模型融合方法还只停留在多种模型简单的线性加权叠加上。
发明内容
本发明的目的是针对上述问题,提供一种基于自适应分类策略和混合优化SVR的光功率预测方法。
为达到上述目的,本发明采用了下列技术方案:
一种基于自适应分类策略和混合优化SVR的光功率预测方法,包括以下步骤:
S1.数据预处理,采用无量纲化处理方法和基于密度的离群点算法剔除历史样本中的异常样本,并采用插值算法对缺失数据进行重构或直接删除;
S2.样本筛选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本;
S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练预测模型,输入预测时刻气象数据,得到功率预测值。
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S1中,对多种数据进行分别预处理:
S11.针对原始数据,进行无量纲化处理方法处理;
S12.针对异常数据,进行删除处理或插值算法重构处理。
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S12中,针对不同气象因素的变化特点及其对光伏功率的影响程度,采用不同的异常数据预处理策略:
A1.删除所有处于夜间时段的样本数据;
A2.对于太阳辐照度数据,若连续超过预设次数的采样数据没有变化,则认为该时段内太阳辐照度数据是死数,若连续缺失点/死数不超过规定个数,则采用插值算法重构,否则删除相应样本;
A3.对于温度、湿度、压强这三类气象数据,以时间为因变量采用插值算法重构;
A4.对于风资源,只对风速、风向数据做校验。
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,步骤S2中,自适应分类策略包括:
B1.结合PA和GRA算法自适应确定影响光伏输出功率的主要气象特征及其决定系数,进而筛选出与预测时刻气象特征高度相似的历史样本;
B2.基于分布因子和预测模型适应度函数值的负反馈策略自适应调整时间窗函数中心点和窗长,辅助筛选高度相似的历史样本。
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B1中,先排除日照时长和季节的影响,然后基于PA原理分析计算出各气象特征对光伏输出功率的决定系数,根据决定系数阈值确定主要气象特征;
以标准化后的自变量x1、x2、…、xn及因变量y为例阐述通径分析计算方法,其中,自变量x1、x2、…、xn两两之间相关。xi与y的相关系数用riy表示,将riy按式(7)分解
式中,piy表示xi对y的通径系数;pjy表示xj对y的通径系数;rij表示xi与xj的相关系数;rijpjy表示xi通过xj对y的间接作用分量,则自变量x1、x2、…、xn与y的相关系数可按式(8)分解
其中,rii=1。单自变量xi对y的决定系数di可以表示为
根据标准化的偏回归系数的特性可知,di反应了该自变量对因变量的解释能力,di越大,解释能力越强。
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B1中,将各个气象因素对光伏功率的决定系数作为权重,计算各个历史样本的气象数据与预测时刻气象数据的加权灰色关联度:
将预测时刻气象数据无量纲化后作为参考序列
X0=(x0(1),x0(2),…,x0(m)) (10)
将所有历史样本的气象数据无量纲化后作为比较序列
计算得到比较序列与参考序列的差值序列为
其中:差值序列的每一个元素xi′(j)=|xi(j)-x0(j)|,1≤i≤n,1≤j≤m,按式(13)确定差值序列的两级最大差Δ(max)和两级最小差Δ(min)
比较序列中每个元素的关联系数为
其中:ρ为分辨系数,用来削弱Δ(max)过大而使关联系数失真的影响,各个比较序列与参考序列的灰色关联度为
其中:ωj表示每一列元素的权重系数。
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B1中,根据以下方法自适应确定加权灰色关联度中各个气象因素的分辨系数:
根据比较序列矩阵中每一列元素的平均值与Δ(max)的比值自适应确定该列的分辨系数ρ的取值:
定义
ε(j)的大小反应了每一列元素中是否存在异常值,当时,认为序列中存在异常值,ρ(k)应取(0,0.5]的值来抑制Δ(max)对关联度的支配作用,可取ρ(k)=min(0.5,1.5ε(j));当时,认为序列平稳,ρ(k)可取(0.5,1)内的值来增强Δ(max)对关联度的支配作用:
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在B2中,自适应长度的滑动时间窗函数为:
kmid(n)=kmid(n-1)±Δk (18)
L(m)=L(m-1)+ΔL (19)
其中,k表示当前预测时刻点号,0≤k≤96;kmid(n)表示窗函数中心偏移n次后对应的点号,kmid(0)=k;Δk表示窗函数中心偏移步长;L(m)表示扩大m次半径后窗函数的搜索半径,L(0)=2,步长ΔL=1;
采用预测时刻辐照度数据在所选时间窗下所有历史样本的辐照度数据中的分布因子τ来调整时间窗的中心点位置:
式中,N表示所选时间窗下所有样本个数,n表示N个样本中辐照度小于预测时刻辐照度的样本个数;
采用拟合优度R2来量化预测模型的拟合度,R2越接近1,说明模型的拟合度越好,反之越差;
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S3中,采用支持向量回归机算法训练预测模型:
给定训练样本集:{(xi,yi)|i=1,2,…,l},其中,xi∈Rn表示输入向量,yi∈R表示输出结果,采用非线性映射将输入向量xi映射到更高维特征空间Rk(k>n),在该空间中构造一个最优超平面
使所有样本点离超平面的“总偏差”最小,其中,ω表示权系数向量;b为偏置常数;
采用ε-不敏感损失函数,样本点与最优超平面的偏差表示为c(x,y,f(x))=max(0,|y-f(x)|-ε) (23)
其中,C表示惩罚因子;
随后,采用Lagrange系数方法并根据最优化条件解决该约束最优问题:
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S3中,采用量子粒子群算法和网格法混合优化SVR的最优超参数,且量子粒子群算法包括以下步骤:
(1)设置包括种群规模m、粒子维度D、压缩-扩张因子α、最大迭代次数iter和粒子解空间范围的参数;
(2)初始化粒子当前位置xi、粒子历史最优位置pi、粒子历史适应度函数值fitpi、全局最优位置gbest;
(3)计算当前所有粒子适应度函数值fiti,搜索当前所有粒子最优适应度函数值fitbest及其对应的最优位置;
(4)更新全局历史最优位置gbest及其对应的历史最优种群适应度函数值fitgbest,更新所有粒子历史最优位置pi及其历史最优种群适应度fitpi;
(5)重复步骤(3-4)直至达到最大迭代次数iter,输出当前全局最优位置gbest。
本发明的优点在于:
(1)采用无量纲化处理方法、基于密度的离群点算法对光伏电站历史样本数据进行预处理,采用插值算法对缺失数据进行重构,可以剔除错误数据,删除/重构缺失数据,降低错误数据和缺失数据对预测精度的不利影响;
(2)采用通径分析自适应确定不同时空尺度下影响光伏输出功率的主要气象特征及各主要气象特征对光伏输出功率的决定系数,结合灰色关联度分析自适应筛选出与预测时刻气象数据高度相似的历史样本;并提出了基于分布因子和预测模型适应度函数值的负反馈策略,动态调整时间窗中心及窗长,能够进一步提高筛选样本气象数据与预测时刻气象数据的相似度;
(3)采用量子粒子群与网格法混合优化SVR算法的超参数,提高模型的泛化能力。
附图说明
图1是本发明的功率预测整体流程图;
图2是本发明自适应相似样本筛选流程图;
图3是本发明中的通径模型图;
图4是本发明中负反馈策略;
图5是本发明中量子粒子群算法流程图;
图6是本发明中数据预处理后的散点图;
图7是本发明中聚类分析散点图;
图8是本发明中12:30时聚类分析散点图;
图9是本发明中晴天功率曲线对比图;
图10是本发明中多云天功率曲线对比图;
图11是本发明中雨天功率曲线对比图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细的说明。
如图1所示,不同时空尺度下影响光伏功率的主要气象因素及其作用机理不同,因此,基于光伏电站历史数据和预测气象数据的建模方法应能适应天气类型的多变性。本实施例综合考虑数据预处理、样本筛选、模型优化等各个方面,提出了一种基于自适应分类策略和混合优化SVR算法的光伏功率预测方法,包括以下步骤:
S1.数据预处理,采用无量纲化处理方法和基于密度的离群点算法剔除历史样本中的异常样本,采用插值算法对缺失数据进行重构或将缺失数据直接删除;
S2.样本筛选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本以用于后续对预测模型的训练;
S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练预测模型,输入预测时刻气象数据,得到功率预测值。
进一步地,在步骤S1中,综合运用多种数据预处理方法,具体包括:
S11.历史样本数据的每一个维度具有不同的物理意义,单位不同,数据的量级各异,为了消除原始数据在量纲和数量级上的差异对最终分析结果造成的影响,首先对原始数据进行无量纲化处理,对原始数据无量纲化处理方法有区间化、均值化、初值化、倒数化等,根据各个因素的变化特点选择不同的归一化方法;
S12.基于密度的离群点算法筛选出历史样本中的异常数据,例如由于现场通讯的不稳定性以及天气的瞬时变化特性,导致光伏电站的历史实测气象数据和功率数据中存在死数、空值、脉冲值等异常数据,针对该类异常数据的样本点进行删除或采用插值算法重构。
进一步地,在步骤S12中,针对不同的异常数据采用不同的处理方法:
首先,考虑到夜间太阳辐照度为0,所有夜间采集的气象数据、太阳辐照度数据和功率数据均为无效数据,可以将所有处于夜间时段的样本数据删除。
其次,当采集到的数据与实际客观规律不符,例如太阳辐照度小于0、输出功率与光伏电站额定容量比值超过限值、温度超过上下限值等,认定这样的样本数据为异常数据。针对不同气象因素的变化特点及其对光伏功率的影响程度,采用不同的异常数据预处理策略:
太阳辐照度是影响光伏功率的最主要因素,与光伏功率近似成线性关系,且太阳辐照度在一定时段内可能受其他气象因素影响或者云遮挡而发生剧烈变化。针对太阳辐照度数据,若连续超过规定次数的采样数据没有变化,则认为该时段内太阳辐照度数据是死数。针对连续缺失点/死数不超过规定个数的情况,太阳辐照度和功率可以相互为自变量和因变量采用插值算法重构;超过规定个数,插值算法的计算结果误差较大,所以直接将该样本删除;
温度、湿度、气压等气象因素随时间稳定变化,可以以时间为因变量,直接采用插值算法重构;
风资源具有间歇性特点,且风速、风向不是影响光伏功率的主要因素,所以只对风速、风向数据只做简单的校验,比如风向角度变化范围为0°~359°,风速非负等。
进一步地,在步骤S2中,自适应分类策略由2部分组成:
B1结合PA和GRA算法自适应确定影响光伏输出功率的主要气象特征及其决定系数,进而筛选出与预测时刻气象特征高度相似的历史样本;
B2基于分布因子和预测模型适应度函数值的负反馈策略自适应调整时间窗函数中心点和窗长,辅助筛选相似样本。
进一步地,在B1中,地球自转及公转使太阳辐照度、温度、湿度等气象数据发生周期性变化,最终使光伏输出功率具有季节、月、日、小时的周期性变化规律;光伏输出功率的波动性和间歇性则源于气象数据的瞬时变化、云层运动等;此外,光电转换效率、电力电子器件的转换效率也会影响光伏输出功率。光伏组件的光电转换效率除受电池发电效率、封装方式、电路结构等自身因素影响外,还受气象因素等外在因素的影响。
各个气象因素不仅直接影响光伏组件输出功率,而且会通过相互作用影响光电转换效率等进而间接影响光伏组件输出功率。光伏组件最大输出功率Pmax及其发电效率η可用式(1)、(2)表示
Pmax=Voc·Isc (1)
式中,Isc表示光伏组件的短路电流,Voc表示光伏组件的开路电压,Pin表示光伏组件接收到的太阳辐照度,FF表示光伏组件的填充因子,光伏组件Isc和Voc这两个重要的参数会因气象因素的变化而变化。当太阳辐照度增加时,光伏组件的短路电流Isc会线性增加,开路电压Voc近似对数关系增加;当光伏组件的温度升高时,短路电流Isc会略有增加,但开路电压Voc会线性下降;风速和风向会共同影响光伏组件表面与大气的热交换系数,并最终影响到光伏组件的转换效率;湿度越大,大气中水汽含量越大,其对太阳辐照度的削弱则越大,从而导致光伏组件的输出功率降低。
针对不同预测时段的气候、气象周期性变化规律,并考虑日内气象突变因素,本发明构建了基于适应不同时空尺度的自适应相似样本筛选策略,如图2所示。首先,排除日照时长、季节的影响:
考虑到不同季节地表日照时长对光伏电站日发电功率平均水平的影响,将光伏电站历史气象特征数据和功率数据按季节进行初步分类。然后,选取样本特征量v0=[P,S,T],采用k-means聚类算法将各季节历史样本根据时刻聚类成3类,这3类样本的气象特征与晴天、阴天、雨天一一对应,其中,P表示功率,S表示太阳辐照度,T表示温度。
考虑到日内天气类型反复切换等极端天气现象,与该日内各预测时刻气象特征相似的样本对应的天气类型也应自适应切换,根据式(3)从这3类样本中选取判决函数L(i)最小的一类样本
L(i)=di-μdi-2δdi (3)
其中,di表示该时刻气象特征数据与第i类样本中心点气象特征数据的欧氏距离;δdi和μdi表示第i类样本中各样本气象特征数据到该类样本中心点气象数据欧氏距离的标准差和平均值。
排除日照时长、季节的影响后,基于通径分析(path analysis,PA)原理分析计算出各气象特征对光伏输出功率的决定系数,分析不同时空尺度下影响光伏输出功率的主要气象特征及其作用机理,根据决定系数阈值θd确定主要气象特征。例如PA可以将单个自变量对因变量的相关系数分解为直接作用(偏回归系数)和通过其它自变量的间接作用,进而可以判断单个自变量对因变量的作用方向、作用强度和解释能力。通径系数是用来表示相关变量因果关系的统计量,是标准化的偏回归系数,通径系数pxy的定义为
其中,bxy表示自变量x对因变量y的偏回归系数,δx表示自变量x的标准差,δy表示自变量y的标准差。
图3中通径模型包含结果变量x3、外生变量x1和内生变量x2,x1→x3、x1→x2、x2→x3的通径系数分别为p13、p12、p23,其结构方程组为
将方程组(5)化简
x3=(p13+p23p12)x1 (6)
其中,p13表示x1对x3的直接作用分量,p23p12表示x1对x3的间接作用分量,p13+p23p12表示x1对x3的相关系数。
以标准化后的自变量x1、x2、…、xn及因变量y为例阐述通径分析计算方法,其中,自变量x1、x2、…、xn两两之间相关。xi与y的相关系数用riy表示,将riy按式(7)分解
式中,piy表示xi对y的通径系数;pjy表示xj对y的通径系数;rij表示xi与xj的相关系数;rijpjy表示xi通过xj对y的间接作用分量,则自变量x1、x2、…、xn与y的相关系数可按式(8)分解
其中,rii=1。单自变量xi对y的决定系数di可以表示为
根据标准化的偏回归系数的特性可知,di反应了该自变量对因变量的解释能力,di越大,解释能力越强。
进一步地,在步骤B1中,将各个气象因素对光伏功率的决定系数作为权重,计算各个历史样本的气象数据与预测时刻气象数据的加权灰色关联度。
将预测时刻气象数据无量纲化后作为参考序列
X0=(x0(1),x0(2),…,x0(m)) (10)
将所有历史样本的气象数据无量纲化后作为比较序列
计算得到比较序列与参考序列的差值序列为
其中:差值序列的每一个元素x′i(j)=|xi(j)-x0(j)|,1≤i≤n,1≤j≤m。按式(13)确定差值序列的两级最大差Δ(max)和两级最小差Δ(min)
则比较序列中每个元素的关联系数为
其中:ρ为分辨系数,用来削弱Δ(max)过大而使关联系数失真的影响。各个比较序列与参考序列的灰色关联度为
其中:ωj表示每一列元素的权重系数。
进一步地,在B1中,根据如下方法自适应确定加权灰色关联度中各个气象因素的分辨系数。
一般情况下,ρ取0.5时,恒有γ0i≥0.333,且考虑到每个气象因素自身的极差与整个差值序列的Δ(max)比值有明显差异,本发明根据比较序列矩阵中每一列元素的平均值与Δ(max)的比值自适应确定该列的ρ的取值。
定义
ε(j)的大小反应了每一列元素中是否存在异常值,当时,认为序列中存在异常值,ρ(k)应取(0,0.5]的值来抑制Δ(max)对关联度的支配作用,可取ρ(k)=min(0.5,1.5ε(j));当时,认为序列平稳,ρ(k)可取(0.5,1)内的值来增强Δ(max)对关联度的支配作用:
进一步地,在B2中,当用于模型训练的样本数量较少,或其气象特征与预测时刻气象特征不一致都会导致预测精度不高。考虑到天气的复杂多变,以及光伏功率、辐照度数据的时空相依关系,为了提高功率预测方法的鲁棒性,本发明选用一个自适应长度的滑动时间窗函数,并基于分布因子和预测模型适应度函数值的负反馈策略,如图4所示,动态修改时间窗中心点及窗长,辅助筛选相似样本。
自适应长度的滑动时间窗函数为
kmid(n)=kmid(n-1)±Δk (18)
L(m)=L(m-1)+ΔL (19)
其中,k表示当前预测时刻点号,0≤k≤96;kmid(n)表示窗函数中心偏移n次后对应的点号,kmid(0)=k;Δk表示窗函数中心偏移步长;L(m)表示扩大m次半径后窗函数的搜索半径,L(0)=2,步长ΔL=1。
采用预测时刻辐照度数据在所选时间窗下所有历史样本的辐照度数据中的分布因子τ来调整时间窗的中心点位置
式中,N表示所选时间窗下所有样本个数,n表示N个样本中辐照度小于预测时刻辐照度的样本个数。
采用式(21)拟合优度R2来量化预测模型的拟合度,R2越接近1,说明模型的拟合度越好,反之越差。
如图4所示,当计算得到的τ小于设定的τmin,若预测时刻在上午(k<48),则应将时间窗中心朝前移动;若预测时刻在下午(k>48),则应将时间窗中心朝后移动;当时间窗中心移动步长超过最大限值时,则从初始时间窗中心开始,扩大时间窗半径,重新搜索直至τ∈(τmin,τmax),则认为所选时间窗合适。当计算得到的τ大于设定的τmax,时间窗中心的移动方向与小于τmin时相反。当训练得到的模型拟合优度R2小于0时,则扩大搜索半径重新筛选样本直至训练得到目标模型,即具有较好拟合度的模型。
进一步地,在步骤S3中,采用支持向量回归机算法训练预测模型。给定训练样本集为{(xi,yi)|i=1,2,…,l},其中,xi∈Rn表示输入向量,yi∈R表示输出结果,采用非线性映射将输入向量xi映射到更高维特征空间Rk(k>n),在该空间中构造一个最优超平面
使所有样本点离超平面的“总偏差”最小,其中,ω表示权系数向量;b为偏置常数。
采用ε-不敏感损失函数,样本点与最优超平面的偏差可以表示为c(x,y,f(x))=max(0,|y-f(x)|-ε) (23)
其中,C表示惩罚因子。该问题是一个凸二次优化问题,采用Lagrange(n次多项式插值)系数方法并根据最优化条件(Kuhn-Tucker conditions,KKT)解决该约束最优问题
进一步地,在步骤S3中,采用量子粒子群算法和网格法混合优化SVR的最优超参数;
网格法是比较常用的SVR参数优化方法,其理论实质是根据先验知识设置各个参数的取值范围和步长,然后穷举所有参数组合,其搜索精度取决于步长,当步长足够小,可保证在规定的取值范围内寻找到全局最优解,但是以时间和空间复杂度为代价。
模拟生物群体行为或生物进化规律的启发式智能优化算法,以随机或近似随机的方式搜索或逼近非线性复杂空间的全局最优解,能够有效提高搜索效率。以量子粒子群算法(Quantum Particle Swarm Optimization,QSPO)为例,其取消了粒子移动方向这个属性,增加了粒子位置的随机性,不仅所需设置的参数比粒子群算法更少,而且降低了粒子初始随机位置对搜索结果的影响。设粒子种群规模为m,粒子维度为D,每个粒子的位置代表了该粒子当前的解,对第i个粒子有以下属性:
当前位置:xi=(xi1,xi2,…,xiD);
历史最优位置:pi=(pi1,pi2,…piD);
所有粒子历史最优位置的平均值为
粒子的下一次位置按照式(28)(29)更新
(1)设置种群规模m、粒子维度D、压缩-扩张因子α、最大迭代次数iter、粒子解空间范围等参数;
(2)初始化粒子当前位置xi、粒子历史最优位置pi、粒子历史适应度函数值fitpi、全局最优位置gbest;
(3)计算当前所有粒子适应度函数值fiti,搜索当前所有粒子最优适应度函数值fitbest及其对应的最优位置;
(4)更新全局历史最优位置gbest及其对应的历史最优种群适应度函数值fitgbest,更新所有粒子历史最优位置pi及其历史最优种群适应度fitpi;
(5)重复步骤(3-4)直至达到最大迭代次数iter,输出当前全局最优位置gbest;
当QSPO迭代到一定次数时,粒子个体及种群的适应度函数值更新变缓,种群的最佳适应度函数值甚至不再更新,易陷入解空间的局部最优解。本实施例将网格法和QSPO算法相结合,提出了一种兼顾收敛速度和搜索精度的混合优化方法,通过混合优化方法得到的最优参数组合能有效提高SVR的泛化能力,其具体方法是:首先,通过QSPO算法初步搜索得到若干个全局最优解,根据全局最优解缩小解空间搜索范围;然后采用网格法进行高精度搜索,尽可能逼近真正的全局最优解。
本发明采用通径分析(path analysis,PA)原理,分析不同时空尺度下影响光伏输出功率的主要气象特征及其作用机理,提出了一种适应不同时空尺度的自适应分类策略,能够筛选出与预测时刻气象特征数据高度相似的历史样本,训练精确预测模型。
另外,支持向量回归机(Support Vector Regression,SVR)的复杂度和泛化能力取决于惩罚系数C、核宽度δ、不敏感损失系数ε等超参数。网格法可保证在规定的解空间范围内寻找到全局最优解,但是以时间和空间复杂度为代价;当量子粒子群算法(QuantumParticle Swarm Optimization,QSPO)迭代到一定次数时,粒子个体及种群的适应度函数值更新变缓,种群的最佳适应度函数值甚至不再更新,易陷入解空间的局部最优解。将网格法和QSPO算法相结合,提出了一种兼顾收敛速度和搜索精度的混合优化方法,通过混合优化方法得到的最优超参数组合能有效提高SVR的泛化能力。
下面给出具体算例对本实施例进行具体说明:
采用本发明所述数据预处理方法处理某光伏电站2018年1月-3月历史发电数据,其预处理后的散点图如图6所示,图6中黑色五角星的点为删除点,灰色圆圈的点为保留点。图6中仅展示了太阳辐照度与光伏输出功率两个维度,通过对比分析可知,将各局部离群点剔除后,太阳辐照度与光伏功率的线性相关度将变高。剔除离群点后将样本通过k-means聚类算法分成3类,对应天气类型分别为晴天、阴天、雨天,各时刻3类样本及各类中心点散点图如图7所示,图7中,横坐标为时刻(7:30~17:30),纵坐标为太阳辐照度(0~1200W/m2),由图7可知,在相同时刻,晴天、阴天、雨天的太阳辐照度中心依次降低,各时刻各类历史样本分布在该时刻中心点两侧,将12:30时的三类样本及其中心点的散点以太阳辐照度为横坐标,光伏输出功率为纵坐标展开,得到如图8所示的12:30时的聚类分析散点图。图8中,雨天样本太阳辐照度集中在0~500W/m2,对应的功率为0~6MW;阴天样本太阳辐照度集中在550~900W/m2,对应的功率为5~8MW;晴天样本太阳辐照度集中在900~1200W/m2,对应的功率为7~10MW,各天气样本中的菱形点为各天气样本的样本中心点。
以夏季和冬季为例,白天各个时段内各个气象因素对光伏功率的直接通径系数分析结果见表1~6可知,不同季节、不同天气类型下,太阳辐照度都是对光伏功率影响程度最大的气象因素,但不同季节、不同天气类型下,太阳辐照度对光伏功率的影响程度又存在差异。
由表1~3可知,在夏季,太阳辐照度对光伏功率影响程度由大到小依次对应的天气类型为雨天、阴天和晴天。晴天白天气温较高,随着白天气温先升高后降低,温度对光伏功率的影响也对应经历了“正-负-正”的过程;此外,气温较高导致水汽蒸发较快,湿度对光伏功率总体呈现负影响;而风速可以加速光伏板散热,对光伏功率总体呈现正影响。在阴、雨天,温度对光伏功率影响的“正/负”变化不太稳定,但湿度总体保持负影响,风速也以负影响为主。
由表4~6可知,在冬季,太阳辐照度对光伏功率的平均直接通径系数达到0.95,而其他气象因素对光伏功率的直接通径系数很小,几乎可以忽略,这与冬季大气温度较低,较少导致光伏板温度超过25℃而降低光伏组件出力,以及冬季气候干燥,太阳辐照度被水汽吸收较少等气候特征相吻合。
由表1~6对比可以得知:冬季和夏季的不同天气类型下,各个气象因素对光伏功率的影响程度差异很大,需针对不同季节、不同天气类型建立不同的光伏功率预测模型。
表1夏季晴天气象因素直接通径系数
表2夏季阴天气象因素直接通径系数
表3夏季雨天气象因素直接通径系数
表4冬季晴天气象因素直接通径系数
表5冬季阴天气象因素直接通径系数
表6冬季雨天气象因素直接通径系数
采用本发明所述方法,预测该光伏电站晴天(2018年4月16日)、多云天(2018年4月14日)、雨天(2018年4月13日)这3天的输出功率,预测功率与实测功率曲线如图9-11所示。采用华东电网“两个细则”中光伏功率预测准确率算法,晴天的预测准确率为94.702%,多云天的预测准确率为88.532%,雨天的预测准确率为88.467%,说明本发明所提的基于自适应分类策略和混合优化SVR算法具有很好的功率预测效果,具有现场应用价值。
本发明采用的无量纲化处理方法、基于密度的离群点算法、插值算法等数据预处理方法,可以剔除错误数据,删除/重构缺失数据,降低错误数据和缺失数据对预测精度的不利影响;采用通径分析(PA)自适应确定不同时空尺度下影响光伏输出功率的主要气象特征及各主要气象特征对光伏输出功率的决定系数,结合灰色关联度分析(GRA)自适应筛选出与预测时刻气象数据高度相似的历史样本,用于模型训练;并提出了基于分布因子和预测模型适应度函数值的负反馈策略,动态调整时间窗中心及窗长,能够进一步提高筛选样本气象数据与预测时刻气象数据的相似度;同时采用量子粒子群算法与网格法混合优化SVR算法的超参数,提高了预测模型的泛化能力。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围,本发明的连接指直接连接或间接连接。
尽管本文较多地使用了无量纲化处理、基于密度的离群点算法、通径分析原理、量子粒子群、网格法等术语,但并不排除使用其它术语的可能性。使用这些术语仅仅是为了更方便地描述和解释本发明的本质;把它们解释成任何一种附加的限制都是与本发明精神相违背的。
Claims (10)
1.一种基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,包括以下步骤:
S1.数据预处理,采用无量纲化处理方法和基于密度的离群点算法剔除历史样本中的异常样本,并采用插值算法对缺失数据进行重构或直接删除;
S2.样本筛选,通过自适应分类策略筛选出与预测时刻气象数据高度相似的历史样本;
S3.模型训练与数值预测,采用量子粒子群算法和网格法混合优化SVR算法训练预测模型,输入预测时刻气象数据,得到功率预测值;
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S1中,对多种数据进行分别预处理:
S11.针对原始数据,进行无量纲化处理方法处理;
S12.针对异常数据,进行删除处理或插值算法重构处理;
在上述基于自适应分类策略和混合优化SVR的光功率预测方法中,在步骤S12中,针对不同气象因素的变化特点及其对光伏功率的影响程度,采用不同的异常数据预处理策略:
A1.删除所有处于夜间时段的样本数据;
A2.对于太阳辐照度数据,若连续超过预设次数的采样数据没有变化,则认为该时段内太阳辐照度数据是死数,若连续缺失点/死数不超过规定个数,则采用插值算法重构,否则删除相应样本;
A3.对于温度、湿度、压强这三类气象数据,以时间为因变量采用插值算法重构;
A4.对于风资源,只对风速、风向数据做校验。
2.根据权利要求1所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S1中,对多种数据进行分别预处理:
S11.针对原始数据,进行无量纲化处理方法处理;
S12.针对异常数据,进行删除处理或插值算法重构处理。
3.根据权利要求2所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S12中,针对不同气象因素的变化特点及其对光伏功率的影响程度,采用不同的异常数据预处理策略:
A1.删除所有处于夜间时段的样本数据;
A2.对于太阳辐照度数据,若连续超过预设次数的采样数据没有变化,则认为该时段内太阳辐照度数据是死数,若连续缺失点/死数不超过规定个数,则采用插值算法重构,否则删除相应样本;
A3.对于温度、湿度、压强这三类气象数据,以时间为因变量采用插值算法重构;
A4.对于风资源,只对风速、风向数据做校验。
4.根据权利要求3所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,步骤S2中,自适应分类策略包括:
B1.结合PA和GRA算法自适应确定影响光伏输出功率的主要气象特征及其决定系数,进而筛选出与预测时刻气象特征高度相似的历史样本;
B2.基于分布因子和预测模型适应度函数值的负反馈策略自适应调整时间窗函数中心点和窗长,辅助筛选高度相似的历史样本。
5.根据权利要求4所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B1中,先排除日照时长和季节的影响,然后基于PA原理分析计算出各气象特征对光伏输出功率的决定系数,根据决定系数阈值确定主要气象特征;
以标准化后的自变量x1、x2、…、xn及因变量y为例阐述通径分析计算方法,其中,自变量x1、x2、…、xn两两之间相关,xi与y的相关系数用riy表示,将riy按式(7)分解
式中,piy表示xi对y的通径系数;pjy表示xj对y的通径系数;rij表示xi与xj的相关系数;rijpjy表示xi通过xj对y的间接作用分量,则自变量x1、x2、…、xn与y的相关系数可按式(8)分解
其中,rii=1,单自变量xi对y的决定系数di可以表示为
根据标准化的偏回归系数的特性可知,di反应了该自变量对因变量的解释能力,di越大,解释能力越强。
6.根据权利要求5所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B1中,将各个气象因素对光伏功率的决定系数作为权重,计算各个历史样本的气象数据与预测时刻气象数据的加权灰色关联度:
将预测时刻气象数据无量纲化后作为参考序列
X0=(x0(1),x0(2),L,x0(m)) (10)
将所有历史样本的气象数据无量纲化后作为比较序列
计算得到比较序列与参考序列的差值序列为
其中:差值序列的每一个元素x′i(j)=|xi(j)-x0(j)|,1≤i≤n,1≤j≤m,按式(13)确定差值序列的两级最大差Δ(max)和两级最小差Δ(min)
比较序列中每个元素的关联系数为
其中:ρ为分辨系数,用来削弱Δ(max)过大而使关联系数失真的影响,各个比较序列与参考序列的灰色关联度为
其中:ωj表示每一列元素的权重系数。
7.根据权利要求6所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B1中,根据以下方法自适应确定加权灰色关联度中各个气象因素的分辨系数:
根据比较序列矩阵中每一列元素的平均值与Δ(max)的比值自适应确定该列的分辨系数ρ的取值:
定义
ε(j)的大小反应了每一列元素中是否存在异常值,当时,认为序列中存在异常值,ρ(k)应取(0,0.5]的值来抑制Δ(max)对关联度的支配作用,可取ρ(k)=min(0.5,1.5ε(j));当时,认为序列平稳,ρ(k)可取(0.5,1)内的值来增强Δ(max)对关联度的支配作用:
8.根据权利要求4所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在B2中,自适应长度的滑动时间窗函数为:
kmid(n)=kmid(n-1)±Δk (18)
L(m)=L(m-1)+ΔL (19)
其中,k表示当前预测时刻点号,0≤k≤96;kmid(n)表示窗函数中心偏移n次后对应的点号,kmid(0)=k;Δk表示窗函数中心偏移步长;L(m)表示扩大m次半径后窗函数的搜索半径,L(0)=2,步长ΔL=1;
采用预测时刻辐照度数据在所选时间窗下所有历史样本的辐照度数据中的分布因子τ来调整时间窗的中心点位置:
式中,N表示所选时间窗下所有样本个数,n表示N个样本中辐照度小于预测时刻辐照度的样本个数;
采用拟合优度R2来量化预测模型的拟合度,R2越接近1,说明模型的拟合度越好,反之越差;
9.根据权利要求8所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S3中,采用支持向量回归机算法训练预测模型:
给定训练样本集:{(xi,yi)|i=1,2,L,l},其中,xi∈Rn表示输入向量,yi∈R表示输出结果,采用非线性映射将输入向量xi映射到更高维特征空间Rk(k>n),在该空间中构造一个最优超平面
使所有样本点离超平面的“总偏差”最小,其中,ω表示权系数向量;b为偏置常数;
采用ε-不敏感损失函数,样本点与最优超平面的偏差表示为
c(x,y,f(x))=max(0,|y-f(x)|-ε) (23)
其中,C表示惩罚因子;
随后,采用Lagrange系数方法并根据最优化条件解决该优化目标函数最小化问题:
10.根据权利要求9所述的基于自适应分类策略和混合优化SVR的光功率预测方法,其特征在于,在步骤S3中,采用量子粒子群算法和网格法混合优化SVR的最优超参数,且量子粒子群算法包括以下步骤:
(1)设置包括种群规模m、粒子维度D、压缩-扩张因子α、最大迭代次数iter和粒子解空间范围的参数;
(2)初始化粒子当前位置xi、粒子历史最优位置pi、粒子历史适应度函数值fitpi、全局最优位置gbest;
(3)计算当前所有粒子适应度函数值fiti,搜索当前所有粒子最优适应度函数值fitbest及其对应的最优位置;
(4)更新全局历史最优位置gbest及其对应的历史最优种群适应度函数值fitgbest,更新所有粒子历史最优位置pi及其历史最优种群适应度fitpi;
(5)重复步骤(3-4)直至达到最大迭代次数iter,输出当前全局最优位置gbest。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911157904.4A CN111079980B (zh) | 2019-11-22 | 2019-11-22 | 基于自适应分类策略和混合优化svr的光功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911157904.4A CN111079980B (zh) | 2019-11-22 | 2019-11-22 | 基于自适应分类策略和混合优化svr的光功率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111079980A CN111079980A (zh) | 2020-04-28 |
CN111079980B true CN111079980B (zh) | 2021-06-29 |
Family
ID=70311417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911157904.4A Active CN111079980B (zh) | 2019-11-22 | 2019-11-22 | 基于自适应分类策略和混合优化svr的光功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079980B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985678A (zh) * | 2020-07-06 | 2020-11-24 | 上海交通大学 | 一种光伏功率短期预测方法 |
CN113515844A (zh) * | 2021-04-22 | 2021-10-19 | 浙江大学 | 一种光源警觉性表征方法、装置及介质 |
CN113313298A (zh) * | 2021-05-21 | 2021-08-27 | 上海电力大学 | 一种基于特征选择的混合Kmeans-GRA-SVR光伏发电功率预测方法 |
CN113742326B (zh) * | 2021-09-01 | 2024-04-12 | 阳光电源股份有限公司 | 功率优化器及其功率缺失值填充方法、装置 |
CN113992525A (zh) * | 2021-10-12 | 2022-01-28 | 支付宝(杭州)信息技术有限公司 | 一种应用的容器数量调节方法及装置 |
CN114118862A (zh) * | 2021-12-07 | 2022-03-01 | 双良节能系统股份有限公司 | 一种换热站动态热负荷预测与调控方法及系统 |
CN116167508B (zh) * | 2023-01-16 | 2024-03-15 | 南通电力设计院有限公司 | 一种基于气象因素分解的短期光伏出力快速预测方法及系统 |
CN116628564B (zh) * | 2023-04-20 | 2024-03-12 | 上海宇佑船舶科技有限公司 | 用于检测发电机状态的模型训练方法和系统 |
CN116307291B (zh) * | 2023-05-22 | 2023-08-29 | 国网信息通信产业集团有限公司 | 一种基于小波分解的分布式光伏发电预测方法及预测终端 |
CN116776935B (zh) * | 2023-06-09 | 2024-02-23 | 淮阴工学院 | 一种基于改进micn的光伏功率预测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102170130A (zh) * | 2011-04-26 | 2011-08-31 | 华北电力大学 | 一种风电功率短期预测方法 |
CN105354620A (zh) * | 2014-08-19 | 2016-02-24 | 中国科学院上海高等研究院 | 一种风机发电功率的预测方法 |
CN105447509A (zh) * | 2015-11-10 | 2016-03-30 | 天津大学 | 一种光伏发电系统的短期功率预测方法 |
CN106251001A (zh) * | 2016-07-18 | 2016-12-21 | 南京工程学院 | 一种基于改进模糊聚类算法的光伏功率预测方法 |
CN107766990A (zh) * | 2017-11-10 | 2018-03-06 | 河海大学 | 一种光伏电站发电功率的预测方法 |
CN108053048A (zh) * | 2017-11-06 | 2018-05-18 | 中国电力科学研究院有限公司 | 一种单步渐进式光伏电站超短期功率预测方法及系统 |
US10041475B1 (en) * | 2017-02-07 | 2018-08-07 | International Business Machines Corporation | Reducing curtailment of wind power generation |
CN109685257A (zh) * | 2018-12-13 | 2019-04-26 | 国网青海省电力公司 | 一种基于支持向量机回归的光伏发电功率预测方法 |
CN110263971A (zh) * | 2019-05-14 | 2019-09-20 | 西安理工大学 | 基于支持向量机的超短期风电功率组合预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105305423A (zh) * | 2015-10-15 | 2016-02-03 | 南方电网科学研究院有限责任公司 | 一种考虑间歇性能源不确定性的最优误差边界的确定方法 |
CN108345996B (zh) * | 2018-02-06 | 2021-07-20 | 北京天润新能投资有限公司 | 一种降低风电功率考核电量的系统及方法 |
CN108388962B (zh) * | 2018-02-06 | 2021-01-26 | 北京天润新能投资有限公司 | 一种风电功率预测系统及方法 |
-
2019
- 2019-11-22 CN CN201911157904.4A patent/CN111079980B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102170130A (zh) * | 2011-04-26 | 2011-08-31 | 华北电力大学 | 一种风电功率短期预测方法 |
CN105354620A (zh) * | 2014-08-19 | 2016-02-24 | 中国科学院上海高等研究院 | 一种风机发电功率的预测方法 |
CN105447509A (zh) * | 2015-11-10 | 2016-03-30 | 天津大学 | 一种光伏发电系统的短期功率预测方法 |
CN106251001A (zh) * | 2016-07-18 | 2016-12-21 | 南京工程学院 | 一种基于改进模糊聚类算法的光伏功率预测方法 |
US10041475B1 (en) * | 2017-02-07 | 2018-08-07 | International Business Machines Corporation | Reducing curtailment of wind power generation |
CN108053048A (zh) * | 2017-11-06 | 2018-05-18 | 中国电力科学研究院有限公司 | 一种单步渐进式光伏电站超短期功率预测方法及系统 |
CN107766990A (zh) * | 2017-11-10 | 2018-03-06 | 河海大学 | 一种光伏电站发电功率的预测方法 |
CN109685257A (zh) * | 2018-12-13 | 2019-04-26 | 国网青海省电力公司 | 一种基于支持向量机回归的光伏发电功率预测方法 |
CN110263971A (zh) * | 2019-05-14 | 2019-09-20 | 西安理工大学 | 基于支持向量机的超短期风电功率组合预测方法 |
Non-Patent Citations (1)
Title |
---|
《基于灰色关联与量子粒子群寻优的光伏短期预测》;贾逸伦 等;《电网与清洁能源》;20160229;第32卷(第2期);第109-115页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111079980A (zh) | 2020-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111079980B (zh) | 基于自适应分类策略和混合优化svr的光功率预测方法 | |
Liu et al. | Random forest solar power forecast based on classification optimization | |
Kabilan et al. | Short-term power prediction of building integrated photovoltaic (BIPV) system based on machine learning algorithms | |
CN108388956B (zh) | 考虑辐射衰减的光伏功率预测方法 | |
CN113128793A (zh) | 一种基于多源数据融合的光伏功率组合预测方法及系统 | |
Wang et al. | Comparative study of machine learning approaches for predicting short-term photovoltaic power output based on weather type classification | |
CN110929953A (zh) | 基于聚类分析的光伏电站超短期出力预测方法 | |
Ma et al. | A short-term prediction model to forecast power of photovoltaic based on MFA-Elman | |
CN114048896B (zh) | 光伏发电数据的预测方法、系统、设备及介质 | |
Mehmood et al. | EGD-SNet: A computational search engine for predicting an end-to-end machine learning pipeline for Energy Generation & Demand Forecasting | |
Vakitbilir et al. | Hybrid deep learning models for multivariate forecasting of global horizontal irradiation | |
He et al. | A power forecasting approach for PV plant based on irradiance index and LSTM | |
Li et al. | Short-term Forecasting Approach Based on bidirectional long short-term memory and convolutional neural network for Regional Photovoltaic Power Plants | |
CN115796004A (zh) | 一种基于SLSTM和MLSTNet模型的光伏电站超短期功率智能预测方法 | |
Duan et al. | A multistep short-term solar radiation forecasting model using fully convolutional neural networks and chaotic aquila optimization combining WRF-Solar model results | |
Zhang et al. | Application of machine learning methods in photovoltaic output power prediction: A review | |
Meng et al. | A new PV generation power prediction model based on GA-BP neural network with artificial classification of history day | |
CN114611757A (zh) | 基于遗传算法与改进深度残差网络的电力系统短期负荷预测方法 | |
CN116167508B (zh) | 一种基于气象因素分解的短期光伏出力快速预测方法及系统 | |
CN116341728A (zh) | 一种基于数据驱动的超短期光伏输出功率预测方法 | |
Xun et al. | Photovoltaic power forecasting method based on adaptive classification strategy and HO-SVR algorithm | |
CN115481788B (zh) | 相变储能系统负荷预测方法及系统 | |
CN116128168A (zh) | 基于因果扩充卷积和Autoformer的气象预测法 | |
Zhu et al. | [Retracted] Photovoltaic Generation Prediction of CCIPCA Combined with LSTM | |
CN115271242A (zh) | 光伏发电功率预测模型的训练方法、预测方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230414 Address after: 213031 Tianhe PV Industrial Park No. 2, Xinbei District, Changzhou, Jiangsu Patentee after: Changzhou Trinasolar Intelligent Energy Engineering Co.,Ltd. Address before: Room 2206, building 1, 650 Bin'an Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province 310051 Patentee before: Tianheyun Energy Internet Technology (Hangzhou) Co.,Ltd. |
|
TR01 | Transfer of patent right |