CN111369045A - 一种短期光伏发电功率预测的方法 - Google Patents

一种短期光伏发电功率预测的方法 Download PDF

Info

Publication number
CN111369045A
CN111369045A CN202010127704.0A CN202010127704A CN111369045A CN 111369045 A CN111369045 A CN 111369045A CN 202010127704 A CN202010127704 A CN 202010127704A CN 111369045 A CN111369045 A CN 111369045A
Authority
CN
China
Prior art keywords
data
power generation
photovoltaic power
model
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202010127704.0A
Other languages
English (en)
Inventor
岳东
朱晓飞
窦春霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Posts and Telecommunications filed Critical Nanjing University of Posts and Telecommunications
Priority to CN202010127704.0A priority Critical patent/CN111369045A/zh
Publication of CN111369045A publication Critical patent/CN111369045A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种短期光伏发电功率预测方法,本发明主要针对由于太阳能光伏发电受很多随机因素的影响,这使得光伏系统输出功率具有不确定性的问题,提出一种基于PCA‑Stacking的综合发电功率预测方法,主要包含以下步骤:训练数据的获取,数据预处理,根据光伏发电的特点划分四种天气类型(晴天,多云,阴天,雨天),PCA降维处理,Stacking模型训练,Stacking模型预测,误差分析。

Description

一种短期光伏发电功率预测的方法
技术领域
本发明属于光伏发电技术领域,具体涉及一种短期光伏发电功率的预测方法。
背景技术
太阳能是未来最具竞争力的绿色能源之一,目前,世界各发达国家十分重视通过发展光伏发电产业进行太阳能资源的开发利用,光伏发电是利用半导体材料的光电效应,直接将太阳能转换为电能,光伏发电具有波动性和间歇性,大规模光伏电站并网运行会影响电力系统的安全稳定经济运行,对光伏电站的输出功率进行预测有助于电网调度部门统筹安排常规电源和光伏发电的协调配合,尤其是超短期光伏电站的输出功率,从而实现及时地调整调度计划,合理安排电网运行方式,提高电力系统运行的安全性和稳定性,获得更大的经济效益和社会效益。
近几年来,人们借助统计智能类预测方法、简单物理模型类预测方法及复杂物理模型类预测方法对光伏发电进行超短期预测进行了探索,取得了一定的成果。
例如,申请公布号为CN 110705760 A的公开专利文本“一种基于最小二乘法的光伏电站超短期功率预测方法”中公开了一种基于最小二乘法的光伏电站超短期功率预测方法,利用最小二乘法获取与预测时刻未来四小时对应的历时同期短期预测功率与实际功率的曲线关系,拟合出校正参数,再利用校正参数,对预测的时刻未来四小时的短期预测功率数据进行校正,从而得到超短期功率预测结果。但是这种基于最小二乘法的预测方法预测精度并不是很高,且在遇到极端和复杂天气时,这种单一的预测方法将会产生一定的误差。
另外,还有一些公开的文献中记载的采用其他算法进行相关短期光伏发电功率的预测方法虽然预测平均误差都比较低,但这些方法的预测精度还未达到令人满意的程度,对电力系统运行的安全性和稳定性仍存在一定的影响。
发明内容
本发明目的是为了克服现有的光伏电站输出功率的超短期预测精度还未达到令人满意的程度,在一定程度上仍会影响电力系统运行的安全性和稳定性的问题。
本发明提供一种短期光伏发电功率的预测方法,这种预测方法是基于pca-stacking的超短期光伏预测方法,由pca-stacking根据训练样本得到最佳的预测模型,从而保证所得到的超短期光伏电站发电功率预测误差达到最小,提高预测精度,保证电力系统运行的安全性和稳定性。
所述短期光伏发电功率的预测方法具体包含以下步骤:
步骤1:训练数据的获取:以某日某地区气象因素信息为测试和训练数据基础;
步骤2:对采集过的数据过滤,将异常数据删除,同时对数据归一化处理,得到预测样本;
步骤3:对特征数据与实际发电功率进行相关性分析,选取特征中相关性高的特征作为模型的输入变量;
步骤4:针对相关性高的数据少这一问题,对选取后的特征进行特征的填充,防止因特征过少而导致的模型准确度不高,相应的就伴随着另一个问题,特征之间的耦合度变高了,见步骤(5);
步骤5:PCA数据降维处理:采用pca(principal components analysis)来对处理过后的数据进行降维,分析从多个气象因素特征中提取较少的综合性特征,减少预测模型的输入量,保证不会因为数据的冗余来对预测精度产生影响;
步骤6:根据高斯混合聚类的不同发电功率的趋势将预测样本分成四种天气的发电类型:晴天,多云,阴天,雨天;
步骤7:由天气预报中得到要预测的天气类型,把对应的预测样本作为训练集训练;
步骤8:把步骤(5)中得到的训练集中的气象数据的特征用来当做模型的输入特征,输入到Stacking中的初级学习器支持向量机 (SVM)训练,利用训练好的支持向量机预测模型,选取测试集中气象数据的特征作输入,光伏电站输出功率作输出,预测出来的光伏功率作为初级训练集;
步骤9:把步骤(8)产生的初级训练集放入到Stacking中的次级训练集Xgboost中进行训练,之后再次用测试集中的气象数据特征作为输入,光伏发电功率作输出,实现对为未来一天中24h光伏电站输出功率预测;
步骤10:误差分析:把预测的结果与单一的模型进行比较,做误差分析。
进一步的,步骤1中,所述训练数据基础分辨率为15min,数据种类包含环境温度、环境湿度、辐照度、风速、风向、板温、温差、气压;
进一步的,步骤2中,所述归一化处理的公式是
Figure BDA0002394904650000041
其xmax和xmin分别为数据集特征中最大值和最小值,xi为当前要归一化的数据,最终要归一化的数据归一化到[0,1]区间;
进一步的,步骤3中,所述相关性分析具体为Pearson相关度相关性分析,选取特征中相关性高的特征作为模型的输入变量,相关性分析公式为:
Figure BDA0002394904650000042
其中,
Figure BDA0002394904650000043
Figure BDA0002394904650000044
是样本的平均值,r代表相关系数。
进一步的,步骤6中,所述高斯混合聚类是通过输入光伏电站的历史数据,根据天气类型选取每组对象特征的平均值和最大值来进行高斯混合聚类分析,通过设置聚类个数将天气类型大体上分为四类。
进一步的,步骤10中,所述误差分析采用MAE(平均绝对误差) 来估算该模型的准确度,表达式如下所示:
Figure BDA0002394904650000045
其中:ymodel,i为模型预测值,yactual,i为实测值。
技术原理:首先针对初始数据嘈杂,数据特征多但是重要性特征不多的情况。针对这一特点来对数据进行降噪,去杂。利用相关性进行特征筛选,筛选之后,可能面临着特征少的情况,那么进行数据特征的扩充保证模型有足够的输入量。其次,根据天气预报提供的气象数据往往比较粗略只能判断出大致的天气类型,比如晴天或多云,发电功率数据很相近,难以划分,因此需要进行相似日聚类处理采用高斯混合聚类(均值向量和方差矩阵),利用主成分分析方法 PCA(principal components analysis)分析从多个气象因素特征中提取较少的综合性特征,减少预测模型的输入量。针对现有的单一预测模型方法提升精度有限的问题,同时针对现有的神经网络以及小波分析方法等单一的预测模型预测精度提升有限的问题,引入了集成学习的思想和方法,提出一种基于Stacking方法来结合SVM和Xgboost的短期预测方法。
与现有技术相比,本发明的有益效果是:
1、本发明利用Stacking方法来通过对次级学习器和初级学习器的融合,通过融合可以有效地改善由于单个模型预测的局限性导致的预测精度不高的问题,在预测精度上,有着单一模型不可比拟的优势;
2.本发明为了解决光伏发电在极端和复杂天气下精度不高的情况,采用了高斯混合聚类来对不同的天气进行分类聚类,利用这种方法对数据集分为四种天气类型,对测试集的数据进行相似的聚类分析,有助于解决极端复杂天气精度不高的问题。另外针对不同天气类型的训练样本的选定,可以有效地提高模型在不同天气类型下的预测精度,保证在极端天气下预测的精准度;
3.本发明加入了大量的数据预处理方式,比如利用相关性进行特征筛选,进行特征扩充保证模型拥有足够的输入量、利用主成分分析法减少输入量提取综合特征,防止模型的过拟合等。
附图说明
图1为本发明具体实施方式中步骤2样本数据的预处理过程示意图;
图2为所述Stacking方法结合SVM和Xgboost模型融合原理图;
图3为本发明所述一种短期光伏发电功率的预测方法流程示意图;
图4为本发明具体实施方式中短期光伏预测中Stacking的结构示意图;
图5为本发明具体实施方式中高斯混合聚类的流程图。
具体实施方式
下面结合附图1-5,对本专利的技术方案进一步详细地说明。
一种短期光伏发电功率的预测方法,包含如下步骤:
步骤1:预测样本的获取:以某日某地区气象因素信息为测试和训练数据基础,数据分辨率为15min,数据种类包含环境温度、环境湿度、辐照度、风速、风向、板温、温差、气压;
步骤2:样本数据的预处理:得到数据后,由于数据不完整性和嘈杂性,需要对其进行数据的预处理,数据的预处理主要过程如图1 所示:
(1)根据对采集过的数据过滤,将异常数据删除,同时对数据归一化处理,得到预测样本。归一化处理的公式是
Figure BDA0002394904650000071
其中xmax和xmin分别为数据集特征中最大值和最小值,xi为当前要归一化的数据。最终要归一化的数据归一化到[0,1]区间;
(2)对特征数据与实际发电功率进行Pearson相关度相关性分析,选取特征中相关性高的特征作为模型的输入变量。相关性分析公式为:
Figure BDA0002394904650000072
其中,公式(1)中,
Figure BDA0002394904650000073
Figure BDA0002394904650000074
是样本的平均值,r代表相关系数。
(3)由于预测中,我们时常面临着气象因素特征多,但是重要性特征不多的情况,通过合理的特征扩展来增加重要的维度,提高预测精度,例如通过现场温度和天气温度这两个特征得到温差:温差=现场温度-天气温度;根据公式(1)计算:温差与实际发电功率的相关度有0.76,表明这个特征对发电功率的影响不可或缺。
步骤3:根据高斯混合聚类来划分数据集:主要步骤如图3所示,在前面输入数据集之后,首先输入光伏电站的历史数据,根据天气类型选取每组对象特征的平均值和最大值来进行高斯混合聚类分析,通过设置聚类个数将天气类型大体上分为四类,将各聚类结果所对应的历史数据分别作为对应类别的训练集。
高斯混合聚类的算法步骤是:
输入:样本集D={x1,x2,…xm};
高斯混合成分个数k.
过程:
(1)初始化高斯分布的模型参数{(αi,ui,∑i)|1≤i≤k}
(2)Repeat
(3)for j=1,2,…m do
(4)计算xj由各混合成分生成的后验概率,即
γji=pm(Zj=i|xj)(1≤i≤k)
(5)end for
(6)for i=1,2,…,k do
(7)计算新均值向量:
Figure BDA0002394904650000081
(8)计算新协方差矩阵:
Figure BDA0002394904650000082
(9)计算新混合系数:
Figure BDA0002394904650000083
(10)end for
(11)将模型参数{(αi,ui,∑i)|1≤i≤k}更新为{(α'i,u'i,∑′i)|1≤i≤k}
(12)Until满足停止条件
(13)Ci=Ф(1≤i≤k)
(14)for j=1,2,…m do
(15)根据式(3)确定xj的蔟标记λj
(16)将xj划入相应的蔟:
Figure BDA0002394904650000084
(17)end for
(18)输出:蔟划分C={C1,C2,…,Ck}
步骤4:对不同天气类型的训练集来进行主成分分析,主要步骤为:
(1)设影响光伏发电量有K个特征,共有N个样本,观测出的样本矩阵X为N×K维,对原始数据进行标准化处理,消除变量间不同数据级之间的影响;
(2)根据标准化矩阵x1,x2,…xk计算样本之间的相关系数矩阵 R=[r1,r2,…,rk];
(3)求相关系数矩阵的K个特征值λ1,λ2,…λk和相应的特征向量 e1,e2,....ek
(4)求出各个主成分的方差贡献率,计算累计方差贡献率,筛选主成分,当前m个主成分的累计方差贡献率达到指标信息的反映精度的要求,一般为85%,求得m个主成分y1,y2,…,ym代替原始变量,将m个主成分作为模型的输入,其中主成分表达式为:
Figure BDA0002394904650000091
式中:ei=[ei1 ei2 … eik],其中eik为原始变量的相关矩阵的第i 个特征值所对应的k维特征向量,X为k维的初始输入变量X= [x1 x2 … xk]T
步骤5:Stacking训练:根据天气预报得到的天气类型选择不同的训练集,对应的主成分成分中提取的变换数据组为输入,发电功率作为输出,训练Stacking预测模型,训练Stacking模型。
步骤6:Stacking预测:把测试集中的特征分别输入到已训练好的模型中,实现对未来24h不同天气类型下的光伏发电功率的预测, Stacking中初级学习器使用的初级学习器SVM,经过不断的误差测试最终确定的初级学习器数目为7个。
请参阅图2,所述模型是Stacking模型,包含输入层,次级学习器,初级学习器,输出层,主要的模型原理如图3所示。
假设我们有一个train数据集和test数据集,那么Stacking会进行下面几个操作:
(1)选择基模型,可以用xgboost、随机森林等等算法模型;
(2)把训练集分为不交叉的5份,标记为train1到train5;
(3)从train1开始作为预测集,使用train2到train5建模,然后预测train1,并保留结果;然后,以train2作为预测集,使用train1,train3 到train5建模,预测train2,并保留结果;如此进行下去,直到把 train1到train5各预测一遍;
(4)在上述建立的五个模型过程中,每个模型分别对test数据集进行预测,并最终保留这五列结果,然后对这五列取平均,作为第一个基模型对test数据的一个stacking转换;
(5)把预测的结果按照train1到trian5的位置对应填补上,得到对 train整个数据集在第一个基模型的一个stacking转换;
(6)选择第二个基模型,重复以上2-5操作,再次得到train整个数据集在第二个基模型的一个stacking转换;
(7)以此类推。有几个基模型,就会对整个train数据集生成几列新的特征表达。同样,也会对test有几列新的特征表达;
(8)生成的次级训练集在放入到所选择的次级学习器训练,得出结果。
综上所述,Stacking先从数据集训练出初级学习器,然后“生成”一个新数据集用于训练次级学习器。在这个新数据集中,初级学习器的输出被当作样例输出特征,而初始样本的标记仍被当作样例标记, Staking算法描述如下:
输入:训练集D={(x1,y1),(x2,y2),…,(xm,ym)};
初级学习算法£1,£2,…,£T
次级学习器算法£.
过程:
(1)for 1,2,…T do
(2)ht=£t(D);
(3)end for
(4)
Figure BDA0002394904650000111
(5)for i=1,2,…m do
(6)for t=1,2,…,T do
(7)zit=ht(xi)
(8)end for
(9)D′=D′∪((zi1,zi2,…ziT),yi);
(10)end for
(11)h′=£(D′);
(12)输出:H(x)=h′(h1(x),h2(x),…,hT(x))
当输入降维后的数据后,初级学习器SVM训练,它的具体实现步骤为:
(1)给定训练样本D={(x1,y1),(x2,y2),…,(xm,ym)},yi∈R,i= 1,2,…n通过线性回归函数:
f(x)=wTx+b (3)
式中wTx—原空间映射到高维特征空间的非线性映射函数
(2)来拟合样本(xi,yi),采用ε-不敏感损失函数:
Figure BDA0002394904650000121
式中,f(x)—回归函数返回的预测值,y—对应的真实值。对样本(x,y),传统回归模型通常直接基于模型输出f(x)与真实输出y之间的差别来计算损失。当且仅当f(x)与y完全相同时,损失才为零,与此不同,支持向量回归假设我们能容忍f(x)与y之间最多有ε的偏差,即仅当f(x)与y之间的差别绝对值大于ε时才计算损失。
(3)引入正则化常数和松弛变量ξi
Figure BDA0002394904650000122
则最优化问题为:
Figure BDA0002394904650000123
s.t.f(xi)-yi≤ε+ξi
Figure BDA0002394904650000124
Figure BDA0002394904650000125
式中C—惩罚因子;ε—回归函数的误差要求。
(4)将拉格朗日乘子αi
Figure BDA0002394904650000126
引入,并化为对偶形式,得到最优解,回归函数为:
Figure BDA0002394904650000127
其中
Figure BDA0002394904650000131
为核函数。
训练好的初级训练集作为次级学习器Xgboost进行训练,得到最后的预测结果,具体步骤如下:
(1)给定训练集T={(x1,y1),(x2,y2),...(xn,yn)},定义一个目标函数:
Figure BDA0002394904650000132
constant是一个常数,正则项Ω(ft)如下:
Figure BDA0002394904650000133
其中,T表示叶子节点数,wj表示第j个叶子节点的权重。
(2)利用泰勒展开式
Figure BDA0002394904650000134
对式 (6)进行展开:
Figure BDA0002394904650000135
其中,gi表示
Figure BDA0002394904650000136
Figure BDA0002394904650000137
的一阶导数,hi表示
Figure BDA0002394904650000138
Figure BDA0002394904650000139
的二阶导数。
Figure BDA00023949046500001310
为真实值与前一个函数计算所得残差是已知的,同时, 在同一个叶子节点上函数值是相同的,可以做合并。于是最后推导的结果为:
Figure BDA00023949046500001311
(3)通过求导等于0。可以得到:
Figure BDA0002394904650000141
(4)将wj带入得目标函数的简化公式如下:
Figure BDA0002394904650000142
(5)目标函数简化后,可以看到Xgboost的目标函数是可以自定义的,计算时只用到到它的一阶导和二阶导。得到简化公式后,下一步针对选择的特征其带来的增益,从而选取合适的分裂特征。
Figure BDA0002394904650000143
(6)误差分析:本发明采用MAE(平均绝对误差)来估算该模型的准确度,表达式如下:
Figure BDA0002394904650000144
其中:ymodel,i为模型预测值,yactual,i为实测值。

Claims (7)

1.一种短期光伏发电功率的预测方法,其特征在于,具体包含以下步骤:
步骤1:以某日某地区气象因素信息为测试和训练数据基础;
步骤2:对采集过的数据过滤,将异常数据删除,同时对数据归一化处理,得到预测样本;
步骤3:对特征数据与实际发电功率进行相关性分析,选取特征中相关性高的特征作为模型的输入变量;
步骤4:对选取后的特征进行特征的填充,特征之间的耦合度变高,见步骤(5);
步骤5:采用pca来对处理过后的数据进行降维,分析从多个气象因素特征中提取较少的综合性特征,减少预测模型的输入量,保证不会因为数据的冗余来对预测精度产生影响;
步骤6:根据高斯混合聚类的不同发电功率的趋势将预测样本分成四种天气的发电类型:晴天,多云,阴天,雨天;
步骤7:由天气预报中得到要预测的天气类型,把对应的预测样本作为训练集训练;
步骤8:把步骤(5)中得到的训练集中的气象数据的特征用来当做模型的输入特征,输入到Stacking中的初级学习器支持向量机(SVM)训练,利用训练好的支持向量机预测模型,选取测试集中气象数据的特征作输入,光伏电站输出功率作输出,预测出来的光伏功率作为初级训练集;
步骤9:把步骤(8)产生的初级训练集放入到Stacking中的次级训练集Xgboost中进行训练,之后再次用测试集中的气象数据特征作为输入,光伏发电功率作输出,实现对为未来一天中24h光伏电站输出功率预测;
步骤10:把预测的结果与单一的模型进行比较,做误差分析。
2.根据权利要求1所述的一种短期光伏发电功率的预测方法,其特征在于,步骤1中,所述训练数据基础分辨率为15min,数据种类包括环境温度、环境湿度、辐照度、风速、风向、板温、温差、气压。
3.根据权利要求1所述的一种短期光伏发电功率的预测方法,其特征在于,步骤2中,所述归一化处理的公式是
Figure FDA0002394904640000021
其xmax和xmin分别为数据集特征中最大值和最小值,xi为当前要归一化的数据,最终要归一化的数据归一化到[0,1]区间。
4.根据权利要求1所述的一种短期光伏发电功率的预测方法,其特征在于,步骤3中,所述相关性分析具体为Pearson相关度相关性分析,选取特征中相关性高的特征作为模型的输入变量。
5.根据权利要求1所述的一种短期光伏发电功率的预测方法,其特征在于,所述相关性分析公式为:
Figure FDA0002394904640000022
其中,
Figure FDA0002394904640000023
Figure FDA0002394904640000024
是样本的平均值,r代表相关系数。
6.根据权利要求1所述的一种短期光伏发电功率的预测方法,其特征在于,步骤6中,所述高斯混合聚类是通过输入光伏电站的历史数据,根据天气类型选取每组对象特征的平均值和最大值来进行高斯混合聚类分析,通过设置聚类个数将天气类型大体上分为四类。
7.根据权利要求1所述的一种短期光伏发电功率的预测方法,其特征在于,步骤10中,所述误差分析采用MAE(平均绝对误差)来估算该模型的准确度,表达式如下所示:
Figure FDA0002394904640000031
其中:ymodel,i为模型预测值,yactual,i为实测值。
CN202010127704.0A 2020-02-28 2020-02-28 一种短期光伏发电功率预测的方法 Withdrawn CN111369045A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010127704.0A CN111369045A (zh) 2020-02-28 2020-02-28 一种短期光伏发电功率预测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010127704.0A CN111369045A (zh) 2020-02-28 2020-02-28 一种短期光伏发电功率预测的方法

Publications (1)

Publication Number Publication Date
CN111369045A true CN111369045A (zh) 2020-07-03

Family

ID=71212634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010127704.0A Withdrawn CN111369045A (zh) 2020-02-28 2020-02-28 一种短期光伏发电功率预测的方法

Country Status (1)

Country Link
CN (1) CN111369045A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967187A (zh) * 2020-08-20 2020-11-20 新奥能源动力科技(上海)有限公司 一种预测燃气轮机启动过程输出数据的建模方法及设备
CN112257953A (zh) * 2020-11-03 2021-01-22 上海电力大学 一种基于极地新能源发电功率预测的数据处理方法
CN112801427A (zh) * 2021-04-08 2021-05-14 国能日新科技股份有限公司 基于XGBoost的光伏辐照度预报方法及系统
CN113496311A (zh) * 2021-06-25 2021-10-12 国网山东省电力公司济宁供电公司 光伏电站发电功率预测方法及系统
CN113627674A (zh) * 2021-08-12 2021-11-09 中国华能集团清洁能源技术研究院有限公司 一种分布式光伏电站出力预测方法、装置及存储介质
CN113705887A (zh) * 2021-08-27 2021-11-26 浙江工业大学 一种数据驱动的光伏发电功率预测方法和系统
CN114841457A (zh) * 2022-05-18 2022-08-02 上海玫克生储能科技有限公司 电力负荷估计方法及系统、电子设备及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967187A (zh) * 2020-08-20 2020-11-20 新奥能源动力科技(上海)有限公司 一种预测燃气轮机启动过程输出数据的建模方法及设备
CN111967187B (zh) * 2020-08-20 2023-10-17 新奥能源动力科技(上海)有限公司 一种预测燃气轮机启动过程输出数据的建模方法及设备
CN112257953A (zh) * 2020-11-03 2021-01-22 上海电力大学 一种基于极地新能源发电功率预测的数据处理方法
CN112257953B (zh) * 2020-11-03 2021-09-24 上海电力大学 一种基于极地新能源发电功率预测的数据处理方法
CN112801427A (zh) * 2021-04-08 2021-05-14 国能日新科技股份有限公司 基于XGBoost的光伏辐照度预报方法及系统
CN112801427B (zh) * 2021-04-08 2021-08-20 国能日新科技股份有限公司 基于XGBoost的光伏辐照度预报方法及系统
CN113496311A (zh) * 2021-06-25 2021-10-12 国网山东省电力公司济宁供电公司 光伏电站发电功率预测方法及系统
CN113627674A (zh) * 2021-08-12 2021-11-09 中国华能集团清洁能源技术研究院有限公司 一种分布式光伏电站出力预测方法、装置及存储介质
CN113705887A (zh) * 2021-08-27 2021-11-26 浙江工业大学 一种数据驱动的光伏发电功率预测方法和系统
CN114841457A (zh) * 2022-05-18 2022-08-02 上海玫克生储能科技有限公司 电力负荷估计方法及系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN111369045A (zh) 一种短期光伏发电功率预测的方法
CN107766990B (zh) 一种光伏电站发电功率的预测方法
CN109002915B (zh) 基于Kmeans-GRA-Elman模型的光伏电站短期功率预测方法
CN106779223B (zh) 一种光伏系统发电功率实时预测方法及装置
CN108376262B (zh) 一种风电出力典型特性的分析模型构建方法
Yang et al. Day-ahead forecasting of photovoltaic output power with similar cloud space fusion based on incomplete historical data mining
CN109840633B (zh) 光伏输出功率预测方法、系统和存储介质
CN111369070A (zh) 一种基于包络线聚类的多模融合光伏功率预测方法
CN109902340B (zh) 一种计及复杂气象耦合特性的多源-荷联合场景生成方法
CN113222289B (zh) 一种基于数据处理的能源功率的预测方法
CN112418476A (zh) 一种超短期电力负荷预测方法
CN114792156A (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
CN111680875A (zh) 基于概率基线模型的无人机状态风险模糊综合评价方法
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
Varanasi et al. K-means clustering based photo voltaic power forecasting using artificial neural network, particle swarm optimization and support vector regression
CN116316599A (zh) 一种智能用电负荷预测方法
CN111461921A (zh) 一种基于机器学习的负荷建模典型用户数据库更新方法
CN115829145A (zh) 一种光伏发电量预测系统及方法
CN115965135A (zh) 基于朴素贝叶斯分类的新能源预测误差建模方法及系统
CN114936694A (zh) 一种基于双集成模型的光伏功率预测方法
CN110991689A (zh) 基于LSTM-Morlet模型的分布式光伏发电系统短期预测方法
CN110956304A (zh) 一种基于ga-rbm的分布式光伏发电量短期预测方法
CN113627674A (zh) 一种分布式光伏电站出力预测方法、装置及存储介质
CN117113243B (zh) 一种光伏设备异常检测方法
CN110717623B (zh) 融合多种天气状况的光伏发电功率预测方法及装置、设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200703