CN115392387A - 一种低压分布式光伏发电出力预测方法 - Google Patents
一种低压分布式光伏发电出力预测方法 Download PDFInfo
- Publication number
- CN115392387A CN115392387A CN202211063549.6A CN202211063549A CN115392387A CN 115392387 A CN115392387 A CN 115392387A CN 202211063549 A CN202211063549 A CN 202211063549A CN 115392387 A CN115392387 A CN 115392387A
- Authority
- CN
- China
- Prior art keywords
- weather
- output power
- photovoltaic
- data
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/004—Generation forecast, e.g. methods or systems for forecasting future energy generation
Abstract
本发明提出的是一种低压分布式光伏发电出力预测方法,该方法包括以下步骤:(一)、采用基于改进K均值聚类算法进行聚类的方法,对单个日期的天气进行归类,得到不同天气种类;(二)、根据每个天气变量的皮尔逊相关系数确认每个天气变量与光伏出力功率之间是否存在相关性;(三)、将与光伏出力功率相关的天气变量的待预测日的变量数据代入多元线性回归模型,得到待预测日的第一光伏出力功率预测值Pf1;(四)、将待预测日前若干天的历史光伏出力功率数据代入改进的LSTM算法中进行计算,得到待预测日的第二光伏出力功率预测值Pf2。
Description
技术领域
本发明涉及一种低压分布式光伏发电出力预测方法,属于光伏发电出力预测技术领域。
背景技术
光伏系统输出功率大小与气象因素变化密切相关;然而,由于天气系统的混沌性和不稳定性,光伏能源系统的功率输出总是表现出间歇性、波动性和随机性;光伏发电量的不易预测性不仅影响电站的经济效益,而且对电力系统运行的稳定性、可靠性和调度也有不利影响;对光伏发电量进行准确的预测可以有效降低输入电网能量的不确定性,改善系统的稳定性,提高光伏系统的渗透水平;相较于中高压集中式光伏电站的出力预测,低压分布式光伏出力预测更为困难,考虑到光照强度作为光伏出力预测的核心变量在低压分布式条件下难以测量,光伏出力预测将更为困难。
在目前,国内外已有大量文献对光伏出力预测进行了针对性研究,常用的方法可以分为物理方法、统计方法;其中,物理方法主要有全天空图像预测方法、数值天气预报方法、卫星图像预测方法;统计方法主要有基于历史数据通过将待预测的功率输出与历史功率数据相关联来预测光伏出力,该模型比物理模型应用更加广泛,主要分为时间序列相关系数法、神经网络法等;对于低压分布式光伏发电而言,物理方法对硬件设备要求较高,在实际中难以实现,统计方法对于低压分布式光伏发电较为适用,易取得相关数据,但传统的统计方法上下文信息建模能力不足,导致在低压分布式光伏发电出力预测方面能力不足。
已有统计方法大多只考虑气象采集数据与最终光伏出力的关系,忽视了不同天气条件下光伏出力预测模型的区别,也忽视了连续多日光伏出力之间的可能隐含的关系;不同天气条件下光伏出力的特性是完全不同,如果不区分天气条件统一建模成一个模型误差会很大。
发明内容
本发明提出的是一种低压分布式光伏发电出力预测方法,其目的旨在解决现有统计方法在低压分布式光伏发电出力预测时预测能力不足的问题。
本发明的技术解决方案:一种低压分布式光伏发电出力预测方法,该方法包括以下步骤:
(一)、利用采集的历史气象数据,采用基于改进K均值聚类算法进行聚类的方法,对单个日期的天气进行归类,得到不同天气种类;
(二)、根据每个天气变量的皮尔逊相关系数确认每个天气变量与光伏出力功率之间是否存在相关性;
(三)、在步骤(一)得到的不同天气种类下,将与光伏出力功率相关的天气变量的待预测日的变量数据作为输入代入多元线性回归模型进行预测,待预测日的光伏出力功率预测值作为输出,得到待预测日的第一光伏出力功率预测值Pf1;
(四)、将待预测日前若干天的历史光伏出力功率数据代入改进的LSTM算法中进行计算,得到待预测日的第二光伏出力功率预测值Pf2。
进一步地,所述多元线性回归模型以气温、云量、湿度、降水量、太阳辐照度、风速作为输入的数据样本,每个输入的数据样本用下式表示:
xi=(dt,drh,dE,dN,dp,dv)
式中d为气温,drh为湿度,dE为太阳辐照度,dN为云量,dp为降水量,dv为风速;最终以光伏出力功率作为输出。
进一步地,所述每个天气变量的皮尔逊相关系数具体通过以下方式获得:在步骤(一)得到的不同天气种类下,将历史某段时间内某种天气种类下的每一日的各个天气变量的变量数据分别与对应日期的光伏出力功率进行计算分别得到每一日每个天气变量的皮尔逊相关系数,然后将某种天气种类下的每一日每个天气变量的皮尔逊相关系在相应历史时期内求平均值得到某种天气种类下每个天气变量的皮尔逊相关系数。
进一步地,所述根据每个天气变量的皮尔逊相关系数确认每个天气变量与光伏出力功率之间是否存在相关性;具体包括:若皮尔逊相关系数大于或等于阈值,则认为该天气变量对光伏出力功率的预测有价值并保留,若皮尔逊相关系数低于阈值,则认为该天气变量与光伏出力功率相关性小,予以舍弃。
进一步地,所述利用采集的历史气象数据,具体包括自天气预报系统采集历史气象数据;所述历史气象数据包括气温、湿度、太阳辐照度、云量、降水量、风速。
进一步地,所述改进K均值聚类算法,具体包括以下步骤:
(1)从输入的数据样本集合中随机选择一个数据样本作为已选择的聚类中心μ1;
(2)对于数据样本集中的每一个数据样本xi,计算它与已选择的聚类中心的距离D(x);
(3)分别计算数据样本集中某一个具体的数据样本xj与已选择的聚类中心的距离D(xj)2,以D(xj)2/∑D(x)2计算出的值作为该数据样本xj是否被选作为新聚类中心的概率;
(4)重复步骤(2)与步骤(3);此处在重复步骤(2)和步骤(3)时,步骤(2)和步骤(3)中所述的已选择的聚类中心均为步骤(3)中最近一次选择的聚类中心,直到所有聚类中心被选出;
(7)重复执行步骤(5)与步骤(6),直到所有簇的均值向量均不再更新。
进一步地,对保留后的各天气变量两两之间计算皮尔逊相关系数,若计算出的皮尔逊相关系数大于0.8,则两变量之间已经高度相关,输入模型后必定产生冗余变量,保留两变量数据中与历史光伏出力数据相关系数更高的变量。
进一步地,所述在步骤(一)得到的不同天气种类下,将与光伏出力功率相关的天气变量的待预测日的变量数据作为输入代入多元线性回归模型进行预测,待预测日的光伏出力功率预测值作为输出,得到待预测日的第一光伏出力功率预测值Pf1;具体包括:
1)建立多元线性回归模型,具体的多元线性回归模型关系式如下:
2)在不同天气条件下分别进行多元线性回归训练,得到若干组b0-b6的参数,若干组参数分别用于不同天气情况下的光伏出力功率预测;
进一步地,所述改进的LSTM算法为在普通的LSTM算法计算之前,将当前时刻输入xt与前置时刻输出ht-1交替地交互,具体过程如下所示:
式中,矩阵Q与矩阵R是随机初始化的;参数σ则由矩阵Q或R的初始化结果而定,目的是为了确保当前时刻输入xt与前置时刻输出ht-1交替地交互时能产生接近恒等式的变换;Qn,Rn为第n轮交互时的矩阵Q与矩阵R,对应的与分别为第n轮交互时的状态输入xt与前置时刻输出ht-1。
进一步地,所述的一种低压分布式光伏发电出力预测方法,该方法还包括以下步骤:
(五)、对第一光伏出力功率预测值Pf1与第二光伏出力功率预测值Pf2进行加权求和,得到待预测日的光伏出力功率最终预测值Pf。
本发明的有益效果:
1)本发明舍弃了基于云图与卫星图像等物理方法,采取了更切合低压分布式光伏场景的基于历史数据的统计方法,提高了可行性;
2)本发明相比于已有的基于历史数据的统计方法,对不同天气进行了改进K均值聚类并对不同天气类型采用不同模型进行学习;根据不同天气类型建模成不同的模型予以拟合,提高了预测精度;
3)本发明相比于已有的基于历史数据的统计方法,进一步采用了改进的LSTM算法,与传统的LSTM算法相比改进的LSTM算法新增了一个门机制,让当前输入与历史状态耦合,进一步加强了对历史数据的记忆能力,改进后的LSTM算法在实际的应用中具有更好的预测效果。
附图说明
附图1为基于改进K均值聚类算法+改进LSTM算法的光伏出力预测算法流程图。
附图2为传统LSTM算法示意图。
附图3为改进LSTM算法示意图。
附图4为多元线性回顾与LSTM算法训练与加权方法示意图。
具体实施方式
一种低压分布式光伏发电出力预测方法,该方法包括以下步骤:
(一)、利用采集的历史气象数据,采用基于改进K均值聚类算法进行聚类的方法,对单个日期的天气进行归类,得到不同天气种类;已有研究表明,不同天气种类情况下光伏出力特征差异较大,预测精度差异也较大;针对不同的天气情况,后续需进行不同的处理;
(二)、在步骤(一)得到的不同天气种类下,将历史某段时间内某种天气种类下的每一日的各个天气变量的变量数据分别与对应日期的光伏出力功率进行计算分别得到每一日每个天气变量的皮尔逊相关系数,然后将某种天气种类下的每一日每个天气变量的皮尔逊相关系在相应历史时期内求平均值得到某种天气种类下每个天气变量的皮尔逊相关系,根据每个天气变量的皮尔逊相关系数确认每个天气变量与光伏出力功率之间是否存在相关性;
(三)、在步骤(一)得到的不同天气种类下,将步骤(二)中被保留的所有与光伏出力功率相关的天气变量的待预测日的变量数据作为输入代入多元线性回归模型进行预测,待预测日的光伏出力功率预测值作为输出,通过训练得到待预测日的第一光伏出力功率预测值Pf1;
(四)、将待预测日前若干天的历史光伏出力功率数据序列代入改进的LSTM算法中进行计算,得到待预测日的第二光伏出力功率预测值Pf2;优选将待预测日前7天的历史光伏出力功率数据序列代入改进的LSTM算法模型中进行计算;
(五)、对第一光伏出力功率预测值Pf1与第二光伏出力功率预测值Pf2进行加权求和,得到待预测日的光伏出力功率最终预测值Pf。
所述多元线性回归模型以气温、云量、湿度、降水量、太阳辐照度、风速六项数据作为输入的数据样本,每个输入的数据样本可以用下式表示:
xi=(dt,drh,dE,dN,dp,dv)
式中dt为气温,drh为湿度,dE为太阳辐照度,dN为云量,dp为降水量,dv为风速;最终以光伏出力功率作为输出,以P表示。
所述天气种类是根据历史气象数据进行聚类得到的结果;比如,聚类算法将某个月共31天的天气数据聚类成3个簇,假如7月1号是晴天,被分到了簇1中,那就认为簇1中的所有日期都可归于后续计算中的晴天类型,以此类推。
所述根据每个天气变量的皮尔逊相关系数确认每个天气变量与光伏出力功率之间是否存在相关性;具体包括:若皮尔逊相关系数大于或等于阈值,则认为该天气变量对光伏出力功率的预测有价值并保留,若皮尔逊相关系数低于阈值,则认为该天气变量与光伏出力功率相关性小,予以舍弃;所述天气变量包括气温、湿度、太阳辐照度、云量、降水量、风速;所述阈值优选为0.2。
聚类算法的结果就是给1个月中每天的天气打上标签,且这个标签和天气预报提供的天气类型不一定相同。
所述利用采集的历史气象数据,具体包括自天气预报系统采集历史气象数据;所述历史气象数据包括气温、湿度、太阳辐照度、云量、降水量、风速等。
所述采用基于改进K均值聚类算法进行聚类的方法,具体包括在历史气象数据基础上对单个日期的天气通过改进K均值聚类算法进行聚类。
所述改进K均值聚类算法,具体包括以下步骤:
(1)从输入的数据样本集合中随机选择一个数据样本作为已选择的聚类中心μ1;
(2)对于数据样本集中的每一个数据样本xi,计算它与已选择的聚类中心的距离D(x);
(3)分别计算数据样本集中某一个具体的数据样本xj与已选择的聚类中心的距离D(xj)2,以D(xj)2/∑D(x)2计算出的值作为该数据样本xj是否被选作为新聚类中心的概率,可以看出,离原先已选择的聚类中心越远就越有可能被选择成为新的聚类中心;
(4)重复步骤(2)与步骤(3);此处在重复步骤(2)和步骤(3)时,步骤(2)和步骤(3)中所述的已选择的聚类中心均为步骤(3)中最近一次选择的聚类中心,直到所有聚类中心被选出;
(7)重复执行步骤(5)与步骤(6),直到所有簇的均值向量均不再更新;由上述步骤可以得到最后的天气聚类结果。
所述改进K均值聚类算法改进了传统的K均值聚类,优化了对初始聚类中心的选择。
通常,计算变量X与变量Y之间的皮尔逊相关系数计算公式如下:
具体到本发明,为了计算前文所述各个天气变量与光伏出力功率P之间的关系,需要计算两个变量间的皮尔逊相关系数,具体计算方式如下:
以计算气温数据dt与光伏出力功率P之间的相关性为例,计算皮尔逊相关系数计算公式如下:
式中r为皮尔逊相关系数,为某一时刻i的气温数据dt的值,为气温数据dt的均值,Pi为某一时刻i的光伏出力功率P的值,为光伏出力功率P的均值,q为气温数据dt与光伏出力功率P参与皮尔逊相关系数计算的数据数量;若要计算其它变量如太阳辐照度,风速等与光伏出力功率P的相关性,计算方式与上式原理相同。
所述皮尔逊相关系数大小与相关程度的数值关系如下表所示:
表1所示为r的绝对值与相关程度的关系:
表1:
r绝对值的取值范围 | r绝对值的意义 |
0.00-0.19 | 极低相关 |
0.20-0.39 | 低度相关 |
0.40-0.69 | 中度相关 |
0.70-0.89 | 高度相关 |
0.90-1.00 | 极高相关 |
若某个变量数据若与光伏出力功率计算出的皮尔逊相关系数大于0.2则认为存在一定的相关性,否则认为相关性极低;当被认为相关性极低时,相应的变量数据舍弃不作为后续模型输入;如本发明发现在某月的晴天情况下,风速dv与光伏出力功率P的相关性为0.187,低于0.2为极低相关,则抛弃该月中风速变量,风速变量不作为后续模型输入。
考虑到保留下来的各天气变量之间本身可能存在相关关系,为使后续神经网络机器学习中的输入变量尽可能的相互独立,需要对保留后的各天气变量两两之间计算皮尔逊相关系数,若计算出的皮尔逊相关系数大于0.8,则两变量之间已经高度相关,输入模型后必定产生冗余变量,保留两变量数据中与历史光伏出力数据相关系数更高的变量;如本发明发现在雨天情境下,湿度drh与降水量dp之间的皮尔逊相关系数极高,而降水量dp与光伏出力功率P的皮尔逊相关系数更高,则本发明在雨天情境下将湿度变量作为冗余变量予以舍弃,保留降水量用作后续计算。
由步骤(二)中得到可作为LSTM算法模型输入的天气变量的变量数据,为取得更好的训练结果,优选先将变量数据进行标准化处理,本发明中采用Z-Score法对变量数据进行数据标准化处理,然后分别采用多元线性回归模型与改进的LSTM算法进行学习。
所述在步骤(一)得到的不同天气种类下,将步骤(二)中被保留的所有与光伏出力功率相关的天气变量的待预测日的变量数据作为输入代入多元线性回归模型进行预测,待预测日的光伏出力功率预测值作为输出,具体包括:
所述多元线性回归方法适用于有多个自变量,预测单一因变量的场景,光伏出力功率预测即有气温、湿度、太阳辐照度等多个自变量、光伏出力功率单一因变量的场景;在本发明场景中,所述多元线性回归模型有如下关系:
式中为光伏出力功率预测值,多元线性回归试图让与光伏出力功率真实值P尽可能接近;通常采用最小二乘法进行计算得出上式中b0、b1、b2、b3、b4、b5、b6共7个参数,能够使得真实值与预测值尽可能接近;在不同天气条件下分别进行多元线性回归训练,得到三组b0-b6的参数,三组参数分别用于晴天、雨、多云天气情况下的光伏出力功率预测,最后用待预测日的预报气象数据带入之前得到的多元线性回归模型关系式中获得光伏出力功率预测值此处获得的光伏出力功率预测值作为第一光伏出力功率预测值Pf1;所述预报气象数据包括天气预报中待预测日的气温、湿度、太阳辐照度、云量、降水量、风速等。
LSTM算法又称长短期记忆网络,是RNN神经网络又称循环神经网络的改进算法主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题,LSTM算法相对于RNN算法对于长历史数据有更好的训练效果;附图2展示了传统LSTM算法的模型结构。
神经网络以神经元为基本单元,包括输入层神经元、隐藏层神经元和输出层神经元等;循环神经网络中在序列的演进方向进行递归,且所有神经元按链式连接;如附图2所示,从左侧为上一演进的结果序列神经元Ct-1,之后Ct-1乘以遗忘门系数ft,随后与当前时刻输入xt、前置时刻输出ht-1经过计算与线性叠加,最后输出当前神经元状态Ct;ft的计算公式如下所示:
ft=Sigmoid(Wf[ht-1,xt]+bf)
由于Sigmoid函数取值范围为[0,1],ft可实现遗忘门判断从当前神经元状态到下一个神经元状态的变换过程中是否将前置时刻输出ht-1与当前时刻输入xt予以考虑;当ft取值为0时认为ht-1与xt携带的信息被完全遗忘,ft取值为1时则认为这些信息被完全记忆,而取值在(0,1)时则认为部分被记忆;而Wf与bf是待定参数,可以在学习中获得具体值。
除Sigmoid函数外,还存在tanh函数用以将数据整定到[-1,1]的范围;附图2中的it与Ct′分别由下式所示:
it=Sigmoid(Wi[ht-1,xt]+bi);
C′t=tanh(WC[ht-1,xt]+bC);
由附图2可以看出,将上一时刻的状态与进行线性叠加,即可得到下一时刻的状态输出;可以发现的是,下一时刻的状态Ct既包含上一时刻的状态Ct-1中被记忆的部分,也包含当前时刻的输入xt与前置时刻输出ht-1的影响。
由以上阐述可以看出,在LSTM算法中xt与ht-1是相互独立不相互影响的,它们只在门中进行交互,在这之前缺乏交互,这可能会导致上下文信息的丢失;而对于光伏出力功率预测而言,上下文信息也就是前后时刻各项数据都可能会很大的影响最后的预测结果;因此本发明提出采用一种改进的LSTM算法应用于光伏出力功率预测中,改进方法中不改动LSTM算法中的遗忘门与记忆门的设计,而是将xt与ht-1在输入LSTM的门系统之前进行多步交互,以增强上下文信息建模能力,其示意图如附图3所示;附图3中附图3中的轮数R是一个超参数,如果R=0,可明显的看出此时已退化成原始的LSTM算法;轮数R的选择将影响到后续学习的效果;经过实验,结论是优先选择R=4或R=5具有更好的效果。
只需要在普通的LSTM算法计算前让当前输入和前一个状态充分交互,就能显著提高本发明中光伏出力功率预测上的效果;其原始动机是,让与上下文无关的输入和之前的状态即上文充分交互之后再输入到LSTM算法中可能会提高效果。
所述改进的LSTM算法为在普通的LSTM算法计算之前,将当前时刻输入xt与前置时刻输出ht-1交替地交互,具体过程如下所示:
式中,矩阵Q与矩阵R是随机初始化的;参数σ则由矩阵Q或R的初始化结果而定,目的是为了确保当前时刻输入xt与前置时刻输出ht-1交替地交互时能产生接近恒等式的变换;Qn,Rn为第n轮交互时的矩阵Q与矩阵R,对应的与分别为第n轮交互时的状态输入xt与前置时刻输出ht-1。
所述将待预测日前7天的历史光伏出力功率数据序列代入改进的LSTM算法模型中进行计算之前,优选先对改进的LSTM算法模型进行训练。
所述对改进的LSTM算法模型进行训练,具体包括:取需要光伏出力预测的日期前连续的若干个月的光伏出力实测值进行训练;如需要预测10月1日的光伏出力,则6月-9月的光伏出力实测值,令6月1号-7号光伏出力为模型输入,8号的光伏出力即可视为1号-7号样本的标签,进行一轮训练;再令2号-8号光伏出力为模型输入,9号的光伏出力为2号-8号的标签,进行一轮训练,以此类推;直到LSTM算法中Wf,bf等等模型参数迭代收敛。
经改进的LSTM算法模型训练后,选择改进轮数r=4,获得对应的Wf,bf等等模型参数;获得模型参数后,将前7天的光伏出力功率值作为改进的LSTM算法网络输入,并最终获得输出——即预测到的本日的第二光伏出力功率预测值Pf2;以上文所述为例,需预测10月1日的光伏出力,在6月-9月的样本数据上训练完毕后,取9月24日-9月30日的光伏出力实测值作为输入,10月1日的光伏出力即为输出。
所述将待预测日前7天的历史光伏出力功率数据序列代入改进的LSTM算法模型中进行计算,得到待预测日的第二光伏出力功率预测值Pf2,具体包括:将前7天的光伏出力功率值作为改进的LSTM算法网络输入,并最终获得输出——即本待预测日预测到的第二光伏出力功率预测值Pf2。
在分别得到了多元线性回归模型与LSTM两种方法预测到的光伏出力预测值之后,需要进行加权求和;权重的比例为两种方法预测值的误差大小比例的倒数,即在历史数据上预测误差越小权重就越大;如上文所属例子,假如在6月-9月的数据集上,迭代至9月LSTM算法已经迭代收敛;则采用9月1日-9月7日为LSTM算法输入,9月8日光伏出力为LSTM算法输出,在9月8日同时采用多元线性回归法进行预测,得到两个预测值,分别与9月8日的实测值计算误差,通过两个预测值的预测误差占实际值的百分比之间的比例的倒数决定加权比例;在整个9月重复上述权重的计算,得到在不同天气下权重取值的平均值;最终在预测10月1日的光伏出力值时,采用9月中10月1日对应天气的权重即可;多元线性回归与改进LSTM算法训练方法如图4所示。
表2展示了本文采用的方法与已有方法之间效果对比,表格中为镇江市扬中市2022年3月共31日在晴天、雨、多云三种天气情况下的光伏出力预测的准确度平均值。
表2为不同天气条件下不同方法的光伏出力预测准确度
表2:
本发明提出了基于改进K均值聚类与改进LSTM算法的光伏出力预测算法,采用K均值聚类算法进行天气类型分类,基于皮尔逊相关系数法,筛选可能影响光伏出力的天气变量,采用基于LSTM算法对光伏出力模型进行建模与训练,对LSTM算法进行改进,改进方法中不改动LSTM算法中的遗忘门与记忆门的设计,而是将与在输入LSTM算法的门系统之前进行多步交互,增强了上下文信息建模能力;本发明涉及领域,更具体地,涉及一适用于种在低压分布式光伏发电场景下、应用于光伏发电出力预测,是一种数据分析与算法设计应用相结合的高性能数据分析算法。
Claims (10)
1.一种低压分布式光伏发电出力预测方法,其特征是包括以下步骤:
(一)、利用采集的历史气象数据,采用基于改进K均值聚类算法进行聚类的方法,对单个日期的天气进行归类,得到不同天气种类;
(二)、根据每个天气变量的皮尔逊相关系数确认每个天气变量与光伏出力功率之间是否存在相关性;
(三)、在步骤(一)得到的不同天气种类下,将与光伏出力功率相关的天气变量的待预测日的变量数据作为输入代入多元线性回归模型进行预测,待预测日的光伏出力功率预测值作为输出,得到待预测日的第一光伏出力功率预测值Pf1;
(四)、将待预测日前若干天的历史光伏出力功率数据代入改进的LSTM算法中进行计算,得到待预测日的第二光伏出力功率预测值Pf2。
2.根据权利要求1所述的一种低压分布式光伏发电出力预测方法,其特征是所述多元线性回归模型以气温、云量、湿度、降水量、太阳辐照度、风速作为输入的数据样本,每个输入的数据样本用下式表示:
xi=(dt,drh,dE,dN,dp,dv)
式中dt为气温,drh为湿度,dE为太阳辐照度,dN为云量,dp为降水量,dv为风速;最终以光伏出力功率作为输出。
3.根据权利要求1所述的一种低压分布式光伏发电出力预测方法,其特征是所述每个天气变量的皮尔逊相关系数具体通过以下方式获得:在步骤(一)得到的不同天气种类下,将历史某段时间内某种天气种类下的每一日的各个天气变量的变量数据分别与对应日期的光伏出力功率进行计算分别得到每一日每个天气变量的皮尔逊相关系数,然后将某种天气种类下的每一日每个天气变量的皮尔逊相关系在相应历史时期内求平均值得到某种天气种类下每个天气变量的皮尔逊相关系数。
4.根据权利要求1所述的一种低压分布式光伏发电出力预测方法,其特征是所述根据每个天气变量的皮尔逊相关系数确认每个天气变量与光伏出力功率之间是否存在相关性;具体包括:若皮尔逊相关系数大于或等于阈值,则认为该天气变量对光伏出力功率的预测有价值并保留,若皮尔逊相关系数低于阈值,则认为该天气变量与光伏出力功率相关性小,予以舍弃。
5.根据权利要求1所述的一种低压分布式光伏发电出力预测方法,其特征是所述利用采集的历史气象数据,具体包括自天气预报系统采集历史气象数据;所述历史气象数据包括气温、湿度、太阳辐照度、云量、降水量、风速。
6.根据权利要求1所述的一种低压分布式光伏发电出力预测方法,其特征是所述改进K均值聚类算法,具体包括以下步骤:
(1)从输入的数据样本集合中随机选择一个数据样本作为已选择的聚类中心μ1;
(2)对于数据样本集中的每一个数据样本xi,计算它与已选择的聚类中心的距离D(x);
(3)分别计算数据样本集中某一个具体的数据样本xj与已选择的聚类中心的距离D(xj)2,以D(xj)2/∑D(x)2计算出的值作为该数据样本xj是否被选作为新聚类中心的概率;
(4)重复步骤(2)与步骤(3);此处在重复步骤(2)和步骤(3)时,步骤(2)和步骤(3)中所述的已选择的聚类中心均为步骤(3)中最近一次选择的聚类中心,直到所有聚类中心被选出;
(7)重复执行步骤(5)与步骤(6),直到所有簇的均值向量均不再更新。
7.根据权利要求4所述的一种低压分布式光伏发电出力预测方法,其特征是对保留后的各天气变量两两之间计算皮尔逊相关系数,若计算出的皮尔逊相关系数大于0.8,则两变量之间已经高度相关,输入模型后必定产生冗余变量,保留两变量数据中与历史光伏出力数据相关系数更高的变量。
8.根据权利要求1所述的一种低压分布式光伏发电出力预测方法,其特征是所述在步骤(一)得到的不同天气种类下,将与光伏出力功率相关的天气变量的待预测日的变量数据作为输入代入多元线性回归模型进行预测,待预测日的光伏出力功率预测值作为输出,得到待预测日的第一光伏出力功率预测值Pf1;具体包括:
1)建立多元线性回归模型,具体的多元线性回归模型关系式如下:
2)在不同天气条件下分别进行多元线性回归训练,得到若干组b0-b6的参数,若干组参数分别用于不同天气情况下的光伏出力功率预测;
10.根据权利要求1-9中任一项所述的一种低压分布式光伏发电出力预测方法,其特征是还包括以下步骤:
(五)、对第一光伏出力功率预测值Pf1与第二光伏出力功率预测值Pf2进行加权求和,得到待预测日的光伏出力功率最终预测值Pf。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211063549.6A CN115392387B (zh) | 2022-09-01 | 2022-09-01 | 一种低压分布式光伏发电出力预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211063549.6A CN115392387B (zh) | 2022-09-01 | 2022-09-01 | 一种低压分布式光伏发电出力预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115392387A true CN115392387A (zh) | 2022-11-25 |
CN115392387B CN115392387B (zh) | 2023-08-08 |
Family
ID=84124076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211063549.6A Active CN115392387B (zh) | 2022-09-01 | 2022-09-01 | 一种低压分布式光伏发电出力预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115392387B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116316617A (zh) * | 2023-05-26 | 2023-06-23 | 南方电网数字电网研究院有限公司 | 多场站智能融合的新能源发电功率区域预测方法和系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280551A (zh) * | 2018-02-02 | 2018-07-13 | 华北电力大学 | 一种利用长短期记忆网络的光伏发电功率预测方法 |
CN111091139A (zh) * | 2019-11-18 | 2020-05-01 | 特变电工西安电气科技有限公司 | 相似日聚类的光伏预测方法、装置、设备及可读存储介质 |
CN112686443A (zh) * | 2020-12-30 | 2021-04-20 | 南京工程学院 | 一种基于人工智能的光伏发电预测方法 |
US20210124089A1 (en) * | 2019-10-25 | 2021-04-29 | The Florida International University Board Of Trustees | System for forecasting renewable energy generation |
CN113052469A (zh) * | 2021-03-30 | 2021-06-29 | 贵州电网有限责任公司 | 一种缺乏量测径流小水电地区的风光水荷互补特性的计算方法 |
CN113988426A (zh) * | 2021-10-29 | 2022-01-28 | 国网江苏省电力有限公司苏州供电分公司 | 一种基于fcm聚类和lstm的电动汽车充电负荷预测方法及系统 |
CN114358185A (zh) * | 2022-01-04 | 2022-04-15 | 辽宁工程技术大学 | 一种基于改进K均值聚类CCA-BiLSTM多维度短期电力负荷预测方法 |
CN114792156A (zh) * | 2022-03-10 | 2022-07-26 | 国网甘肃省电力公司电力科学研究院 | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 |
-
2022
- 2022-09-01 CN CN202211063549.6A patent/CN115392387B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280551A (zh) * | 2018-02-02 | 2018-07-13 | 华北电力大学 | 一种利用长短期记忆网络的光伏发电功率预测方法 |
US20210124089A1 (en) * | 2019-10-25 | 2021-04-29 | The Florida International University Board Of Trustees | System for forecasting renewable energy generation |
CN111091139A (zh) * | 2019-11-18 | 2020-05-01 | 特变电工西安电气科技有限公司 | 相似日聚类的光伏预测方法、装置、设备及可读存储介质 |
CN112686443A (zh) * | 2020-12-30 | 2021-04-20 | 南京工程学院 | 一种基于人工智能的光伏发电预测方法 |
CN113052469A (zh) * | 2021-03-30 | 2021-06-29 | 贵州电网有限责任公司 | 一种缺乏量测径流小水电地区的风光水荷互补特性的计算方法 |
CN113988426A (zh) * | 2021-10-29 | 2022-01-28 | 国网江苏省电力有限公司苏州供电分公司 | 一种基于fcm聚类和lstm的电动汽车充电负荷预测方法及系统 |
CN114358185A (zh) * | 2022-01-04 | 2022-04-15 | 辽宁工程技术大学 | 一种基于改进K均值聚类CCA-BiLSTM多维度短期电力负荷预测方法 |
CN114792156A (zh) * | 2022-03-10 | 2022-07-26 | 国网甘肃省电力公司电力科学研究院 | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 |
Non-Patent Citations (5)
Title |
---|
吉锌格;李慧;刘思嘉;王丽婕;: "基于MIE-LSTM的短期光伏功率预测", 电力系统保护与控制, no. 07 * |
唐文虎;牛哲文;赵柏宁;季天瑶;李梦诗;吴青华;: "数据驱动的人工智能技术在电力设备状态分析中的研究与应用", 高电压技术, no. 09 * |
张雨金;杨凌帆;葛双冶;周杭霞;: "基于Kmeans-SVM的短期光伏发电功率预测", 电力系统保护与控制, no. 21 * |
朱?;顾洁;孟璐;: "基于EMD-LSTM的光伏发电预测模型", 电力工程技术, no. 02 * |
黄国伦;诸葛丽强;杨乐;磨唯;: "基于LSTM的电力通信流量预测", 中国科技信息, no. 1 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116316617A (zh) * | 2023-05-26 | 2023-06-23 | 南方电网数字电网研究院有限公司 | 多场站智能融合的新能源发电功率区域预测方法和系统 |
CN116316617B (zh) * | 2023-05-26 | 2023-09-15 | 南方电网数字电网研究院有限公司 | 多场站智能融合的新能源发电功率区域预测方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115392387B (zh) | 2023-08-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348624B (zh) | 一种基于Stacking集成策略的沙尘暴等级预测方法 | |
CN111260136A (zh) | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 | |
CN112116144B (zh) | 一种区域配电网短期负荷预测方法 | |
CN111667098B (zh) | 一种基于多模型组合优化的风力电站输出功率预测方法 | |
CN111260126B (zh) | 计及天气与气象因子关联度的短期光伏发电预测方法 | |
CN113205226B (zh) | 一种结合注意力机制以及误差修正的光伏功率预测方法 | |
CN109492748B (zh) | 一种基于卷积神经网络的电力系统的中长期负荷预测模型建立方法 | |
CN112215428B (zh) | 基于误差修正和模糊逻辑的光伏发电功率预测方法及系统 | |
CN111626473A (zh) | 一种考虑误差修正的两阶段光伏功率预测方法 | |
CN113762387B (zh) | 一种基于混合模型预测的数据中心站多元负荷预测方法 | |
CN113988426A (zh) | 一种基于fcm聚类和lstm的电动汽车充电负荷预测方法及系统 | |
CN114792156A (zh) | 基于曲线特征指标聚类的光伏输出功率预测方法和系统 | |
CN113255900A (zh) | 一种考虑改进谱聚类与Bi-LSTM神经网络的冲击性负荷预测方法 | |
CN116227716A (zh) | 一种基于Stacking的多因素能源需求预测方法及系统 | |
CN115392387B (zh) | 一种低压分布式光伏发电出力预测方法 | |
CN113344279B (zh) | 基于lstm-sam模型和池化的居民负荷预测方法 | |
CN114936694A (zh) | 一种基于双集成模型的光伏功率预测方法 | |
Khan et al. | Adaptive Error Curve Learning Ensemble Model for Improving Energy Consumption Forecasting. | |
CN115481788B (zh) | 相变储能系统负荷预测方法及系统 | |
CN114897229A (zh) | 一种基于AP聚类和Markov链的光伏电站辐照度超短期预测方法 | |
Wu et al. | Overview of day-ahead solar power forecasts based on weather classifications | |
Ma et al. | Short-Term PV Power Prediction Based on FCM-ISSA-LSTM | |
CN111797981B (zh) | 一种基于双向长短期记忆神经网络的单日光伏发电量预测方法 | |
Nayak et al. | Multi-level statistical model for forecasting solar radiation | |
CN114997475B (zh) | 一种基于Kmeans的融合模型光伏发电短期预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |