CN111815027A - 一种光伏场站发电功率预测方法及系统 - Google Patents

一种光伏场站发电功率预测方法及系统 Download PDF

Info

Publication number
CN111815027A
CN111815027A CN202010518479.3A CN202010518479A CN111815027A CN 111815027 A CN111815027 A CN 111815027A CN 202010518479 A CN202010518479 A CN 202010518479A CN 111815027 A CN111815027 A CN 111815027A
Authority
CN
China
Prior art keywords
random forest
training
training sample
photovoltaic
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010518479.3A
Other languages
English (en)
Inventor
杨明
王冠杰
于一潇
朱长胜
蒿峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia Power Group Co ltd
Shandong University
China Electric Power Research Institute Co Ltd CEPRI
Original Assignee
Inner Mongolia Power Group Co ltd
Shandong University
China Electric Power Research Institute Co Ltd CEPRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia Power Group Co ltd, Shandong University, China Electric Power Research Institute Co Ltd CEPRI filed Critical Inner Mongolia Power Group Co ltd
Priority to CN202010518479.3A priority Critical patent/CN111815027A/zh
Publication of CN111815027A publication Critical patent/CN111815027A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种光伏场站发电功率预测方法及系统,包括根据光伏场站历史功率数据和对应时间段的气象数据构建训练样本集,并对训练样本集中各个训练样本分配样本权重;采用对训练样本集通过自助抽样法生成的子训练样本集训练随机森林模型,并根据自适应增强算法计算当前样本权重下随机森林模型的误差率和权重系数;在预设迭代次数下,根据误差率和权重系数更新样本权重,依次训练随机森林模型,根据权重系数对其加权得到加权随机森林预测模型;采用加权随机森林预测模型对待预测时间段的气象数据进行预测,得到光伏场站发电功率。充分挖掘多维特征中的信息,解决光伏发电中存在的不确定性问题,提高光伏场站功率预测可靠性和准确性。

Description

一种光伏场站发电功率预测方法及系统
技术领域
本发明涉及光伏发电技术领域,特别是涉及一种光伏场站发电功率预测方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
目前光伏发电的预测方法可以分为三类:物理方法、统计方法和组合方法。对于物理方法,在模型建立时,除了考虑太阳辐射,通常还要综合考虑其他影响因素,例如太阳入射角、光伏板表面受污染程度、老化程度和电池温度等。利用物理方法进行预测不需要大量的历史数据,因此适合于新建的光伏场站;但是物理方法的局限性在于制造商所提供的信息通常是有限的并且仅在正常工作条件下才有效。统计方法旨在建立气象参数与历史光伏场站功率之间的映射关系,例如支持向量机、马尔可夫链、自回归差分移动平均模型等;尽管统计方法不需要系统的内部状态信息,但是其建模过程高度依赖历史数据,并且需要大量的历史数据进行训练。组合方法是指将适当的统计方法或物理方法相组合的方法,即混合方法或集成方法,任何单一模型都有其固有的局限性,通过组合不同的预测模型,可以补偿单个模型的缺陷。实践证明,组合方法的预测性能优于单一的预测模型。
光伏电站发电功率预测根据预测时间尺度不同,可分为超短期预测、短期预测、中长期预测等;其中,短期预测为对光伏电站未来0-4小时的发电功率的预测,短期预测为对光伏电站未来0-72小时的发电功率的预测,中长期预测为对光伏电站未来1周的发电功率的预测。超短期预测主要采用统计方法、混合方法,主要是根据地球同步卫星拍摄的卫星云图推测云层运动情况,预测到达地面的辐照强度,通过太阳辐照强度与功率转换效率模型,从而对功率进行预测。短期预测主要以数值天气预报信息系统的NWP数据为主,通过建立历史输入数据与历史输出功率的映射关系,数值天气预报系统主要提供当天或未来几天的NWP信息,如短波辐射、长波辐射、气温、湿度等。
发明人发现,光伏的发电功率取决于太阳光照射强度和角度,在太阳辐射强度较大时,光伏发电功率随机波动幅度较大,而太阳辐射强度较小时,随机波动幅度较小,所以光伏发电系统并非一种持续稳定的供电系统,其输出功率具有不连续性和不确定性,而现有对光伏发电功率的预测,并没有考虑到发电功率的随机波动对预测结果的影响。
发明内容
为了解决上述问题,本发明提出了一种光伏场站发电功率预测方法及系统,对由气象数据和历史功率数据构建的训练集设置权重,以自助抽样法得到的加权子训练集训练随机森林模型,通过计算误差率为随机森林模型分配权重,可应用于对光伏场站发电的短期预测,将集成学习用于光伏功率的短期预测,充分挖掘多维气象数据特征,解决光伏发电中存在的不确定性问题,提高光伏场站功率预测可靠性和准确性。
为了实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供一种光伏场站发电功率预测方法,包括:
根据获取的光伏场站历史功率数据和对应时间段的气象数据构建训练样本集,并对训练样本集中各个训练样本分配样本权重;
采用对训练样本集通过自助抽样法生成的子训练样本集训练随机森林模型,并根据自适应增强算法计算当前样本权重下随机森林模型的误差率和权重系数;
在预设迭代次数下,根据误差率和权重系数更新样本权重,依次训练随机森林模型,根据权重系数对其加权得到加权随机森林预测模型;
采用加权随机森林预测模型对待预测时间段的气象数据进行预测,得到待预测时间段的光伏场站发电功率。
第二方面,本发明提供一种光伏场站发电功率预测系统,包括:
权重分配模块,用于根据获取的光伏场站历史功率数据和对应时间段的气象数据构建训练样本集,并对训练样本集中各个训练样本分配样本权重;
训练模块,用于采用对训练样本集通过自助抽样法生成的子训练样本集训练随机森林模型,并根据自适应增强算法计算当前样本权重下随机森林模型的误差率和权重系数;
迭代模块,用于在预设迭代次数下,根据误差率和权重系数更新样本权重,依次训练随机森林模型,根据权重系数对其加权得到加权随机森林预测模型;
预测模块,用于采用加权随机森林预测模型对待预测时间段的气象数据进行预测,得到待预测时间段的光伏场站发电功率。
第三方面,本发明提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述的方法。
第四方面,本发明提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述的方法。
与现有技术相比,本发明的有益效果为:
本发明将随机森林和自适应增强算法结合的集成学习应用于光伏发电的短期预测,降低发生过拟合的风险,有效减小预测误差,解决光伏发电的不确定性问题,提高光伏场站发电功率预测的可靠性和准确性;
本发明将数值天气预报中多种类型数据和光伏场站历史功率作为训练数据,无需特征选择即可处理高维数据,充分挖掘多维气象数据特征信息,得到光伏功率与气象因素间的非线性关系;同时,采用自适应增强算法具有灵活性和通用性,将其与随机森林组合增强了预测模型的鲁棒性,使其更加适合于光伏场站功率预测。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例1提供的光伏场站发电功率预测方法流程图;
图2为本发明实施例1提供的实例验证中皮尔逊相关性分析结果图;
图3为本发明实施例1提供的实例验证中宁夏四座光伏场站空间相对位置图;
图4为本发明实施例1提供的实例验证中光伏场站A的预测结果图;
图5为本发明实施例1提供的实例验证中光伏场站B的预测结果图;
图6为本发明实施例1提供的以不同预测方法对光伏场站功率预测结果对比图。
具体实施方式:
下面结合附图与实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例1
本实施例将集成学习应用于光伏厂站发电功率预测,集成学习属于组合方法,通过将多种不同学习器组合获得比单一学习器更优的性能;利用集成学习算法,首先要创建一组独立的学习器,然后将其进行组合,再对集成后的模型进行训练,通常利用现有的学习算法,例如决策树、神经网络、支持向量机等,从训练数据中生成独立的学习器。集成学习相较单一模型,能够充分挖掘训练样本中的信息,从而获得更为准确可靠的预测结果。
如图1所示,本实施例提供一种光伏场站发电功率预测方法,包括:
S1:根据获取的光伏场站历史功率数据和对应时间段的气象数据构建训练样本集,并对训练样本集中各个训练样本分配样本权重;
S2:对训练样本集通过自助抽样法生成多个子训练样本集,在当前样本权重下,以子训练样本集训练构建的随机森林模型,并根据自适应增强算法计算当前样本权重下随机森林模型的训练误差率和权重系数;
S3:根据训练误差率和权重系数更新样本权重,根据更新后的样本权重在预设迭代次数下依次训练随机森林模型,并根据得到的权重系数对训练后的随机森林模型加权得到加权随机森林预测模型;
S4:采用加权随机森林预测模型对待预测时间段的气象数据进行预测,得到待预测时间段的光伏场站发电功率。
所述步骤S1中,所述气象数据包括但不限于短波辐射、长波辐射、气温、湿度、风向、风速、气压、云量、降水率等;以光伏场站历史功率数据和对应时间段的气象数据构建的训练样本集D为:
Figure BDA0002531052090000061
在所述步骤S1中,首先对训练样本集D初始化权重分布,根据训练样本集的大小m采用均匀分布方式作为训练样本集D的初始权重分布
Figure BDA0002531052090000064
即:
Figure BDA0002531052090000062
Figure BDA0002531052090000063
其中,xi表示第i个样本中多维数值天气预报数据,yi表示第i个样本中光伏场站历史功率数据,w1i是预测模型每个训练样本的样本权重,m代表训练样本集的大小;
在本实施例中,初始化权重分布即对每个训练样本平均分配,每个训练样本的权重均为
Figure BDA0002531052090000071
所述步骤S2中,自助抽样法为有放回的重采样方法,通过从原始样本中有放回地抽取一定数量的样本,作为子训练集,来训练不同的决策树;尽管每棵决策树对于特定训练集可能具有较高的方差,但有效的降低了整个随机森林的方差。
在本实施例中,对训练样本集采样得到多个子训练样本集,本实施例中优先选择重采样次数为140次,共生成140个子训练样本集;所述子训练样本集分别训练构建的决策树,多个决策树构建随机森林模型fn,故在当前样本权重下,以子训练样本集训练随机森林模型fn
在训练决策树时,需要确定切分变量、切分点以及对切分变量、切分点的优劣进行衡量;在本实施例中,使用穷举法寻找最佳的切分变量和切分点;然后通过计算切分后节点的不纯度衡量切分变量、切分点的优劣;
计算切分后节点的不纯度公式如下:
Figure BDA0002531052090000072
式中,xi是切分变量,vij是切分变量的一个切分值,nleft和nright分别是切分后左右子节点的训练样本数,Ns是该节点总训练样本数,Xleft和Xright分别是左右子节点的训练集,H(X)为节点的不纯度。
在本实施例中,H(X)选择均方误差(MSE):
Figure BDA0002531052090000073
因而该模型中某一节点的训练过程可以等价于下面的优化问题:
(x*,v*)=argminx,vG(xi,vij),
式中,x*是目标切分变量,v*是目标切分变量的一个切分值。
所述步骤S2中,首先在初始样本权重分布
Figure BDA0002531052090000081
下训练随机森林模型后,根据自适应增强算法,计算初始样本权重
Figure BDA0002531052090000082
下随机森林模型的训练误差率ε1和权重系数α1,根据预设迭代次数,不断更新样本权重,依次计算当前样本权重
Figure BDA0002531052090000083
下随机森林模型的训练误差率εn和权重系数αn,具体为:
Figure BDA0002531052090000084
Figure BDA0002531052090000085
其中,n为迭代次数,预设迭代次数总数为N;
根据训练误差率和权重系数更新样本权重分布为:
Figure BDA0002531052090000086
Figure BDA0002531052090000087
在本实施例中,优先选择迭代次数为7次,依次更新样本权重,对随机森林模型进行训练并得到相应的权重系数,并根据得到的权重系数对训练后的随机森林模型加权得到加权随机森林预测模型F(x),加权随机森林预测模型F(x)是将随机森林模型的线性组合作为光伏场站功率预测的最终模型,其式如下:
Figure BDA0002531052090000088
在本实施例中,预设的迭代次数通过网格搜索算法对迭代次数进行优化选择。
所述步骤S4中,采用加权随机森林预测模型F(x)对待预测时间段的气象数据进行预测,通过对内部多个决策树的预测结果取平均值,得到加权随机森林预测模型的预测结果,即待预测时间段的光伏场站发电功率预测值。
在本实施例中,采用相关性分析对历史数值天气预报数据和光伏场站历史功率数据进行相关性分析,如图2所示,计算皮尔逊相关系数初步判断变量间的相关性,可用于对得到的加权随机森林预测模型进行验证;
计算皮尔逊相关系数包括:
Figure BDA0002531052090000091
式中,Xi表示数值天气预报中某类天气因素数据集,Yi表示光伏场站历史功率数据集,
Figure BDA0002531052090000092
代表Xi的平均值,
Figure BDA0002531052090000093
代表Yi的平均值。
在本实施例中,选取四座宁夏光伏场站历史发电功率数据以及数值天气预报数据作为样本,如图3所示,每个光伏场站的装机容量为100MW,样本长度为28800个点,时间分辨率为15分钟;对于选定的数据集,随机抽取80%的数据作为训练数据,其余作为测试数据,对样本进行未来4天的预测;将均方根误差和平均绝对误差用作精度评价指标,计算公式如下:
Figure BDA0002531052090000094
Figure BDA0002531052090000095
式中,pi是光伏功率预测值,
Figure BDA0002531052090000101
是光伏功率观测值,N为预测点个数。
将本实施例方法(EABRF)与神经网络(ANN)和支持向量机(SVM)进行预测性能的比较;如图4-6所示为对光伏电站的测试结果,可以看出,本实施例方法均具有比神经网络和支持向量机更低的RMSE和MAE,与其他两种方法相比,本实施例方法的四个光伏电站的平均RMSE分别降低了0.56%和4.88%,平均MAE分别降低了1.27%和3.79%,表明本实施例方法具有比其它两种方法更好的光伏功率预测性能。
实施例2
本实施例提供一种光伏场站发电功率预测系统,包括:
权重分配模块,用于根据获取的光伏场站历史功率数据和对应时间段的气象数据构建训练样本集,并对训练样本集中各个训练样本分配样本权重;
训练模块,用于采用对训练样本集通过自助抽样法生成的子训练样本集训练随机森林模型,并根据自适应增强算法计算当前样本权重下随机森林模型的误差率和权重系数;
迭代模块,用于在预设迭代次数下,根据误差率和权重系数更新样本权重,依次训练随机森林模型,根据权重系数对其加权得到加权随机森林预测模型;
预测模块,用于采用加权随机森林预测模型对待预测时间段的气象数据进行预测,得到待预测时间段的光伏场站发电功率。
此处需要说明的是,上述模块对应于实施例1中的步骤S1至S4,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为系统的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1中所述的方法。
实施例1中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种光伏场站发电功率预测方法,其特征在于,包括:
根据获取的光伏场站历史功率数据和对应时间段的气象数据构建训练样本集,并对训练样本集中各个训练样本分配样本权重;
采用对训练样本集通过自助抽样法生成的子训练样本集训练随机森林模型,并根据自适应增强算法计算当前样本权重下随机森林模型的误差率和权重系数;
在预设迭代次数下,根据误差率和权重系数更新样本权重,依次训练随机森林模型,根据权重系数对其加权得到加权随机森林预测模型;
采用加权随机森林预测模型对待预测时间段的气象数据进行预测,得到待预测时间段的光伏场站发电功率。
2.如权利要求1所述的一种光伏场站发电功率预测方法,其特征在于,所述气象数据包括但不限于短波辐射、长波辐射、气温、湿度、风向、风速、气压、云量和降水率。
3.如权利要求1所述的一种光伏场站发电功率预测方法,其特征在于,对训练样本集中各个训练样本初始化样本权重,初始样本权重为根据训练样本集的大小m对每个训练样本平均分配,即
Figure FDA0002531052080000011
4.如权利要求1所述的一种光伏场站发电功率预测方法,其特征在于,所述随机森林模型包括多个决策树,以多个子训练集分别训练决策树,决策树的输出平均值即为随机森林模型的输出值。
5.如权利要求1所述的一种光伏场站发电功率预测方法,其特征在于,所述误差率εn和所述权重系数αn分别为:
Figure FDA0002531052080000021
Figure FDA0002531052080000022
其中,xi表示第i个样本中多维气象数据,yi表示第i个样本中光伏场站历史功率,m为训练样本集中训练样本个数,n为迭代次数。
6.如权利要求1所述的一种光伏场站发电功率预测方法,其特征在于,所述根据训练误差率和权重系数更新样本权重为:
Figure FDA0002531052080000023
Figure FDA0002531052080000024
其中,wn+1,i是第i个训练样本在第n+1次迭代下的样本权重;m为训练样本集中训练样本个数,αn为权重系数。
7.如权利要求1所述的一种光伏场站发电功率预测方法,其特征在于,所述加权随机森林预测模型F(x)为:
Figure FDA0002531052080000025
其中,n为迭代次数,N为迭代次数总数,αn为权重系数,fn(x)为随机森林模型。
8.一种光伏场站发电功率预测系统,其特征在于,包括:
权重分配模块,用于根据获取的光伏场站历史功率数据和对应时间段的气象数据构建训练样本集,并对训练样本集中各个训练样本分配样本权重;
训练模块,用于采用对训练样本集通过自助抽样法生成的子训练样本集训练随机森林模型,并根据自适应增强算法计算当前样本权重下随机森林模型的误差率和权重系数;
迭代模块,用于在预设迭代次数下,根据误差率和权重系数更新样本权重,依次训练随机森林模型,根据权重系数对其加权得到加权随机森林预测模型;
预测模块,用于采用加权随机森林预测模型对待预测时间段的气象数据进行预测,得到待预测时间段的光伏场站发电功率。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的方法。
CN202010518479.3A 2020-06-09 2020-06-09 一种光伏场站发电功率预测方法及系统 Pending CN111815027A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010518479.3A CN111815027A (zh) 2020-06-09 2020-06-09 一种光伏场站发电功率预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010518479.3A CN111815027A (zh) 2020-06-09 2020-06-09 一种光伏场站发电功率预测方法及系统

Publications (1)

Publication Number Publication Date
CN111815027A true CN111815027A (zh) 2020-10-23

Family

ID=72845642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010518479.3A Pending CN111815027A (zh) 2020-06-09 2020-06-09 一种光伏场站发电功率预测方法及系统

Country Status (1)

Country Link
CN (1) CN111815027A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418502A (zh) * 2020-11-13 2021-02-26 国网冀北电力有限公司计量中心 一种基于组合模型的光伏发电预测方法
CN112529262A (zh) * 2020-11-27 2021-03-19 北京京能高安屯燃气热电有限责任公司 短期功率预测方法、装置、计算机设备和存储介质
CN112668806A (zh) * 2021-01-17 2021-04-16 中国南方电网有限责任公司 一种基于改进随机森林的光伏功率超短期预测方法
CN114048896A (zh) * 2021-10-27 2022-02-15 国核自仪系统工程有限公司 光伏发电数据的预测方法、系统、设备及介质
CN114330935A (zh) * 2022-03-10 2022-04-12 南方电网数字电网研究院有限公司 基于多种结合策略集成学习的新能源功率预测方法和系统
CN114943371A (zh) * 2022-05-09 2022-08-26 北京市燃气集团有限责任公司 基于主成分分析-决策树的光伏电站发电预测方法及装置
CN116307269A (zh) * 2023-05-16 2023-06-23 华能山东发电有限公司众泰电厂 一种基于人工智能的光伏发电功率预测方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779087A (zh) * 2016-11-30 2017-05-31 福建亿榕信息技术有限公司 一种通用机器学习数据分析平台
CN109858665A (zh) * 2018-12-06 2019-06-07 国网河北省电力有限公司 基于特征筛选与anfis-pso的光伏短期功率预测方法
CN110108992A (zh) * 2019-05-24 2019-08-09 国网湖南省电力有限公司 基于改进随机森林算法的电缆局放故障识别方法、系统及介质
CN110717623A (zh) * 2019-09-20 2020-01-21 中国科学院自动化研究所 融合多种天气状况的光伏发电功率预测方法及装置、设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779087A (zh) * 2016-11-30 2017-05-31 福建亿榕信息技术有限公司 一种通用机器学习数据分析平台
CN109858665A (zh) * 2018-12-06 2019-06-07 国网河北省电力有限公司 基于特征筛选与anfis-pso的光伏短期功率预测方法
CN110108992A (zh) * 2019-05-24 2019-08-09 国网湖南省电力有限公司 基于改进随机森林算法的电缆局放故障识别方法、系统及介质
CN110717623A (zh) * 2019-09-20 2020-01-21 中国科学院自动化研究所 融合多种天气状况的光伏发电功率预测方法及装置、设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢晓龙等: ""梯度提升随机森林模型及其在日前出清电价预测中的应用"", 《计算机应用与软件》, pages 327 - 333 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418502A (zh) * 2020-11-13 2021-02-26 国网冀北电力有限公司计量中心 一种基于组合模型的光伏发电预测方法
CN112418502B (zh) * 2020-11-13 2024-04-30 国网冀北电力有限公司计量中心 一种基于组合模型的光伏发电预测方法
CN112529262A (zh) * 2020-11-27 2021-03-19 北京京能高安屯燃气热电有限责任公司 短期功率预测方法、装置、计算机设备和存储介质
CN112668806A (zh) * 2021-01-17 2021-04-16 中国南方电网有限责任公司 一种基于改进随机森林的光伏功率超短期预测方法
CN112668806B (zh) * 2021-01-17 2022-09-06 中国南方电网有限责任公司 一种基于改进随机森林的光伏功率超短期预测方法
CN114048896A (zh) * 2021-10-27 2022-02-15 国核自仪系统工程有限公司 光伏发电数据的预测方法、系统、设备及介质
CN114330935A (zh) * 2022-03-10 2022-04-12 南方电网数字电网研究院有限公司 基于多种结合策略集成学习的新能源功率预测方法和系统
CN114943371A (zh) * 2022-05-09 2022-08-26 北京市燃气集团有限责任公司 基于主成分分析-决策树的光伏电站发电预测方法及装置
CN116307269A (zh) * 2023-05-16 2023-06-23 华能山东发电有限公司众泰电厂 一种基于人工智能的光伏发电功率预测方法及装置
CN116307269B (zh) * 2023-05-16 2023-10-31 华能山东泰丰新能源有限公司 一种基于人工智能的光伏发电功率预测方法及装置

Similar Documents

Publication Publication Date Title
CN111815027A (zh) 一种光伏场站发电功率预测方法及系统
Li et al. Photovoltaic power forecasting with a hybrid deep learning approach
US11190131B2 (en) Method and system for power prediction of photovoltaic power station based on operating data of grid-connected inverters
Wang et al. Sequence transfer correction algorithm for numerical weather prediction wind speed and its application in a wind power forecasting system
CN108388956B (zh) 考虑辐射衰减的光伏功率预测方法
US20200057175A1 (en) Weather dependent energy output forecasting
CN113128793A (zh) 一种基于多源数据融合的光伏功率组合预测方法及系统
CN110909919A (zh) 融合注意力机制的深度神经网络模型的光伏功率预测方法
CN113919232A (zh) 一种基于循环神经网络的光伏电站功率预测方法及系统
CN115347571B (zh) 基于迁移学习的光伏发电功率短期预测方法及装置
CN110942205A (zh) 一种基于himvo-svm的短期光伏发电功率预测方法
CN112418346B (zh) 一种数值天气预报总辐射系统误差分类计算方法
CN112862274A (zh) 一种基于WRF-LES和DeepAR相结合的风功率预测方法
CN114330934A (zh) 一种模型参数自适应的gru新能源短期发电功率预测方法
Aliberti et al. Forecasting Short-term Solar Radiation for Photovoltaic Energy Predictions.
CN114330100A (zh) 一种短期光伏功率概率区间预测方法
CN117218425A (zh) 一种用于光伏电站的发电损失分析方法及系统
CN116029419A (zh) 基于深度学习的长期新能源日均发电功率预测方法及系统
CN113984198B (zh) 一种基于卷积神经网络的短波辐射预测方法及系统
Sulaiman et al. Long-term solar irradiance forecasting using multilinear predictors
Quang et al. Applying Artificial Intelligence in Forecasting the Output of Industrial Solar Power Plant in Vietnam
CN117293809A (zh) 一种基于大模型的多时空尺度新能源发电功率预测方法
CN116187540B (zh) 一种基于时空偏差修正的风电场站超短期功率预测方法
Cao et al. Development of short-term wind power forecasting methods
CN109447843B (zh) 一种光伏出力预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination