CN113283492B - 基于Catboost算法的光伏出力场景生成方法及场景生成装置 - Google Patents

基于Catboost算法的光伏出力场景生成方法及场景生成装置 Download PDF

Info

Publication number
CN113283492B
CN113283492B CN202110545401.5A CN202110545401A CN113283492B CN 113283492 B CN113283492 B CN 113283492B CN 202110545401 A CN202110545401 A CN 202110545401A CN 113283492 B CN113283492 B CN 113283492B
Authority
CN
China
Prior art keywords
photovoltaic
output
subsystem
data
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110545401.5A
Other languages
English (en)
Other versions
CN113283492A (zh
Inventor
程林
万宇翔
沈瑜
许鹤麟
齐宁
田立亭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202110545401.5A priority Critical patent/CN113283492B/zh
Publication of CN113283492A publication Critical patent/CN113283492A/zh
Application granted granted Critical
Publication of CN113283492B publication Critical patent/CN113283492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Photovoltaic Devices (AREA)

Abstract

本发明涉及一种基于Catboost算法的光伏出力场景生成方法及场景生成装置。本发明方法中,先结合历史光照强度及对应气象数据,建立不同典型天气下的光照强度出力的Catboost回归预测模型,并对预测误差进行概率分布建模;然后利用时序蒙特卡洛抽样法对分布式光伏系统各环节故障状态进行分层抽样,获取各子系统的运行状态序列,统计得到光伏降额出力状态概率分布;最后结合预测误差概率分布以及降额出力概率分布,分别对各时刻光伏出力进行抽样获取随机出力场景,采用聚类技术对出力场景进行聚合获得最终的典型场景簇。

Description

基于Catboost算法的光伏出力场景生成方法及场景生成装置
技术领域
一种基于Catboost算法的光伏出力场景生成方法及场景生成装置,属于电力系统新能源预测领域。
技术背景
随着可持续发展理念的推广和国家扶持政策的大力开展,可再生新能源在能源消费结构中的占比逐渐提升,分布式光伏作为最常见的一类可再生能源,在未来配电网中将发挥极其重要的作用。相较于集中式光伏电站,分布式光伏可以融入用户所在的建筑及周边,充分合理利用土地资源,并且更加接近于用户侧,传输能源是可以减少线路上的损失,因此在分布式光伏的建设更加贴合用户需求,具有良好的实施可行性。然而目前光伏发电存在波动性和间歇性的问题,有功功率输出具有一定不确定性,在并网时可能成为电网的电压稳定和运行安全的潜在风险,同时,光伏系统包括了光伏板、防反二极管、熔断器以及变流器等基本组件,不同元件发生故障也将影响光伏出力。在这种情况下,对光伏发电功率进行较为准确的预测评估,并提前设计应对光伏电站有功功率的波动的调度计划就显得尤为重要了。
目前光伏发电预测研究领域已取得一定的成果,许多成果基于回归分析和马尔科夫链等原理设计了光伏发电预测模型,可以在一定程度上对各时段光伏出力水平进行预测。但由于此类模型为了简化计算,各变量与输出结果的关系常为简单函数的关系,整体计算公式的规模相对较小,对主要影响因素依赖度过高的缺陷,难以全面地考虑到对光伏产生影响的多种因素,因此主要适合于天气状况变化不大的区域。
随着信息技术的发展,机器学习和人工智能算法初有成效,并逐渐从计算机科学领域应用到方方面面的实际工程领域中来。机器学习可以通过海量数据学习的方法,利用历史经验优化计算模型的性能,从而利用实际数据建立彼此间的相互关系,从而提升计算的准确性。机器学习具有处理大量数据和高效计算的能力,对于处理分布式光伏发电功率这类具有周期性和随天气条件波动特征的数据具有较强的适用性。然而,截止目前,对于采用机器学习来建立预测模型,以及结合分布式光伏的不同阶段来获得光伏出力数据,暂没有教好的解决方案。
发明内容
本发明的目的是提出基于Catboost机器学习算法的光伏出力预测与典型场景生成方法。利用Catboost机器学习算法构建不同场景下的光照强度预测模型,获取不同场景的预测概率误差分布,并利用时序蒙特卡洛抽样法获取光伏降额出力概率分布,结合两种分布抽样结果,描述分布式光伏输出功率与光照强度不确定性、元件随机故障之间的联系,通过随机生成典型光伏输出功率场景来体现分布式光伏的出力不确定性。
本发明所采用的技术方案如下:
一种基于Catboost算法的光伏出力场景生成方法,包括:
获取历史光照强度及其对应的历史气象数据作为Catboost算法的初始训练数据,获取光伏系统的各子系统可靠性参数,所述可靠性参数包括各子系统的故障率和故障持续时间;
采用Catboost算法利用所述初始训练数据获得根据气象数据输出对应光照强度的预测模型,并利用所述预测模型预测与气象数据对应的预测光照强度数据,并根据所述预测光照强度数据结合分布式光伏出力的变化阶段获得预测光伏出力数据;
采用拉普拉斯分布建立预测光伏出力误差的概率密度函数;
根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布;
利用所述概率密度函数以及降额状态概率分布对预测光伏出力数据进行抽样,生成预测光伏出力场景。
可选地,通过聚类方法将所述预测光伏出力数据进行聚类,形成典型光伏出力场景。
可选地,将所述初始训练数据依据夏令时和冬令时划分成两类,对于所述两类中的任一类,再根据每天的相对湿度以及云层类型采用聚类划分成晴天、阴天和雨天三类训练数据,将每个类别的训练数据分别采用Catboost算法获得所述预测模型。
可选地,Catboost算法采用M个弱学习器组合成一个强学习器来生成预测模型,假设x为气象数据向量,y为预测光照强度集合,对应每个弱学习器建立一个独立决策树f,wm和βm分别为第m个弱学习器权重及参数,所述预测模型F表示如下式1:
Figure BDA0003073327970000021
其中每个独立决策树的输入空间共有R1至RJ,所述输入空间是将气象数据根据取值范围划分的多个范围空间,计算函数I表示当x属于输入空间
Figure BDA0003073327970000022
时取1,否则取0,
Figure BDA0003073327970000023
为第m个决策树的第j个输入空间预测系数;
采用梯度下降法优化损失函数L,每个特征变量xi在第m个决策树中的梯度下降方向的向量gm(xi)如下式2、3:
Figure BDA0003073327970000031
Figure BDA0003073327970000032
特征变量xi是气象数据向量x中的一个特征变量;
ψ表示求取最小值的意思;
n表示n个特征变量。
可选地,所述初始训练数据中包含有多个训练样本,对于类特征变量,利用数值变量
Figure BDA0003073327970000033
来替代第i个训练样本的第k个类特征变量
Figure BDA0003073327970000034
Catboost算法随机打乱训练样本顺序,假设所有包含第k个类特征变量的训练样本顺序为
Figure BDA0003073327970000035
Figure BDA0003073327970000036
随机打乱顺序后为
Figure BDA0003073327970000037
Figure BDA0003073327970000038
在遍历到前p个训练样本后在目标变量统计中加入先验分布项,表达式如下式4:
Figure BDA0003073327970000039
式中[·]为指示函数,两元素相等时取1,
Figure BDA00030733279700000310
为类特征变量对应的标签数据,P为先验项,w为先验项的权重。
可选地,分布式光伏出力的变化阶段表达式如下式5:
Figure BDA00030733279700000311
式中Pbasic为分布式光伏的输出功率,It为光照强度,IEmax为光电转换效率最大时对应的光照强度,Irate为标准光照强度,Prate为光伏额定容量。
可选地,将光伏系统划分成三层,第一层包括k个光伏阵列板,每个光伏阵列板为m个并联的光伏板串组子系统,任一光伏板串组子系统都包含n个串联的光伏阵列、防反二极管和直流熔断器;
第二层为k个并联的直流配电子系统,任一直流配电子系统都与一个光伏阵列板串联,任一直流配电子系统都包含串联的直流断路器和防反二极管;
第三层为变流器子系统,用于对直流配电子系统合流后的干路进行电路升压后接入直流母线;
根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布的流程是:
先对变流器子系统的元件运行状态进行抽样,其故障态对应的降额出力系数为αdpv=100%;
而后在变流器子系统正常运行时间段内对k个直流配电子系统的元件状态进行抽样,k个全故障对应的降额出力系数为100%,若存在j个故障,则继续对k-j个直流配电子系统正常工作时间内,对其m*(k-j)个光伏板串组子系统进行状态抽样,如果存在i个光伏板串组子系统故障,则降额出力系数为αdpv=j/k+i/[m*(k-j)];
最后,将降额出力系数代入式9中,统计得到降额状态概率分布:
Psolar(It)=(1-αdpv)Pbasic(It) (9)。
可选地,各子系统故障率和故障持续时间如下式7所示:
Figure BDA0003073327970000041
Figure BDA0003073327970000042
式中,λ表示故障率,r表示故障持续时间,下标sub1、sub2、sub3分别表示光伏板串组子系统、直流配电子系统、变流器子系统;
下标b、f、d、dcb分别表示光伏电池板、直流熔断器、防反二极管和直流断路器;
变流器子系统为boost升压电路,下标cap、ind、pd、sw分别表示直流电容、电抗器、功率二极管以及功率开关器件。
可选地,采用拉普拉斯分布建立预测光伏出力误差的概率密度函数的表达式如下:
Figure BDA0003073327970000043
式中
Figure BDA0003073327970000044
是Laplace分布的尺度参数;
τ为分布中心值,决定了拉普拉斯分布的基本形状,
I为通过Catboost算法得到的光照强度预测值。
本发明还提供一种基于Catboost算法的光伏出力场景生成装置,包括:
数据获取模块,用于获取历史光照强度及其对应的历史气象数据作为Catboost算法的初始训练数据,获取光伏系统的各子系统可靠性参数,所述可靠性参数包括各子系统的故障率和故障持续时间;
预测模型生成模块,用于采用Catboost算法利用所述初始训练数据获得根据气象数据输出对应光照强度的预测模型,并利用所述预测模型预测与气象数据对应的预测光照强度数据,并根据所述预测光照强度数据结合分布式光伏出力的变化阶段获得预测光伏出力数据;
概率密度函数生成模块,用于采用拉普拉斯分布建立预测光伏出力误差的概率密度函数;
降额状态概率分布获取模块,用于根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布;
场景生成模块,用于利用所述预测光伏出力误差的概率密度函数以及降额状态概率分布对预测光伏出力数据进行抽样,生成预测光伏出力场景。
本发明具有以下有益效果:
(1)采用Catboost机器学习算法综合考虑环境不确定因素的影响可以有效提高光伏出力预测精度;
(2)综合考虑天气因素以及设备元件可靠性因素,所得典型光伏出力场景预测区间范围更广,能够进一步有效消除预测误差带来的影响。
附图说明
通过结合下面附图对其实施例进行描述,本发明的上述特征和技术优点将会变得更加清楚和容易理解。
图1是表示本发明实施例的光伏出力预测方法流程图;
图2是表示本发明实施例的梯度决策树基本原理流程图;
图3是表示本发明实施例的分布式光伏的典型结构示意图;
图4是表示本发明实施例的光伏系统降额出力计算流程示意图;
图5是表示本发明实施例的功能模块的构成图;
图6是表示本发明实施例的电子设备的构成示意图。
具体实施方式
下面将参考附图来描述本发明所述的实施例。本领域的普通技术人员可以认识到,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式或其组合对所描述的实施例进行修正。因此,附图和描述在本质上是说明性的,而不是用于限制权利要求的保护范围。此外,在本说明书中,附图未按比例画出,并且相同的附图标记表示相同的部分。
本发明提出的基于Catboost算法的光伏出力场景生成方法如图1所示,基本思路是采用Catboost算法分别建立不同典型气象下的光照强度出力的预测模型,并采用Laplace分布对各类气象的预测误差进行概率分布建模;同时,利用时序蒙特卡洛抽样法对分布式光伏系统各环节故障状态进行分层抽样,获取各子系统的运行状态序列,统计得到光伏降额出力状态概率分布;结合预测误差概率分布以及降额出力概率分布,分别对各时刻光伏出力进行抽样,预测误差概率需要每个时刻进行抽取,降额出力概率仅抽取一次,从而可以得到光伏的多个随机出力场景;最后,利用k-means聚类技术对出力场景进行聚合获得最终的典型场景簇。下面介绍具体步骤:
步骤1:获取历史光照强度及其对应的气象数据作为Catboost算法的初始训练数据,获取光伏系统的各子系统可靠性参数,所述可靠性参数包括各子系统的故障率和修复率;
具体的,获取历史光照强度及其对应的气象数据作为Catboost机器学习算法的初始训练数据,获取待预测的光照强度及其对应的气象数据作为机器学习算法的测试集(气象数据主要包括相对湿度、太阳天顶角、云层类型和温度,其中太阳天顶角和温度决定了当天光照强度的平均水平和基本变化趋势,相对湿度和云层类型会引起光照强度短时波动);获取光伏系统基本拓扑结构以及各子系统的可靠性参数(子系统的故障率和故障持续时间),作为降额出力概率分布求解的数据基础。
步骤2:采用Catboost算法利用所述初始训练数据获得根据气象数据输出对应光照强度的预测模型,并利用所述预测模型预测与气象数据对应的预测光照强度数据,并根据所述预测光照强度数据结合分布式光伏出力的变化阶段获得预测光伏出力数据。
(A)由于不同季节和不同天气下的训练样本数据差距较大,利用原始大样本直接对机器学习模型进行训练往往会造成维度过高,可以对原始数据进行预处理,将其划分成适当规模的多个样本簇分别进行训练,提高准确度和计算性能。为获得典型日天气场景,首先将每年的数据依据夏令时和冬令时划分成了两大类,再根据每天的相对湿度以及云层类型,采用现有的kmeans聚类技术将天气类型划分成晴天、阴天和雨天三类,共构建六类场景的训练集和测试集。
(B)采用分类梯度提升算法(Categorical Gradient Boosting Algorithm,Catboost)对上述训练集和测试集进行处理,其基本流程如图2所示,梯度提升决策树算法由若干个弱学习器构成,每一轮迭代都根据上一棵决策树产生的结果和残差来更新样本权重,并通过弱学习器开展训练学习,决策树根节点包含所有的训练样本,进一步采用基尼指数来划分样本属性,以基尼值来衡量样本纯度,分支节点通常选取基尼值最小的点。最终由多个弱学习器组合构成一个强学习器,如果假设x为气象数据向量,y为预测量集合,f为处理过程中每个独立决策树,wm和βm分别为第m分类器权重及参数,共有M个分类器,则总预测模型F表示如下:
Figure BDA0003073327970000061
其中每个决策树的输入空间共有R1至RJ,计算函数I表示当x属于空间
Figure BDA0003073327970000062
时取1,否则取0,
Figure BDA0003073327970000063
为第m个决策树分类器的第j个空间预测系数。
梯度提升决策树算法的本质即是使损失函数L最小(预测精度越高),求偏导即可获得每个特征量xi在第m个决策树模型中的梯度下降方向的向量gm(xi),共有n个特征变量。
Figure BDA0003073327970000064
Figure BDA0003073327970000065
特征变量xi是气象数据向量x中的一个特征变量,
ψ表示求取最小值的意思;
n表示n个特征变量。
传统决策树模型以特征量的数值标签平均值作为节点分裂标准,如果本身特征为数值型特征自变量,决策树分析能够进行很好地辨识。但对于一些类特征自变量,如云层类型(无云、少云、多云等),可以利用某些数值变量
Figure BDA0003073327970000071
来替代第i个训练样本的第k个类别特征变量
Figure BDA0003073327970000072
Catboost算法会随机打乱训练样本的顺序,假设所有包含第k个特征量的训练样本顺序为
Figure BDA0003073327970000073
Figure BDA0003073327970000074
随机打乱顺序后为
Figure BDA0003073327970000075
Figure BDA0003073327970000076
在遍历到前p个训练样本后在目标变量统计中加入了先验分布项,表达式如下:
Figure BDA0003073327970000077
式中[·]为指示函数,两元素相等时取1,
Figure BDA0003073327970000078
为特征量对应的标签数据,P为先验项,w为先验项的权重,添加先验项有助于减少一些低频特征的影响,通常会将先验概率设置为特征自变量的平均值。进一步,Catboost采用排序提升的算法来克服梯度偏差,主要就是对每个样本均会采用单独的训练模型,该训练模型由不包含该样本的训练集训练得到,调用已有的sklearn工具包即可实现上述预测模型的训练。
(C)利用所述预测模型预测与气象数据对应的预测光照强度数据,并根据所述预测光照强度数据结合分布式光伏出力的变化阶段获得预测光伏出力数据。
具体的,分布式光伏出力可以划分成三个阶段,第一阶段为与光照强度呈二次关系,第二阶段随着光照强度增加呈出力线性增长,第三阶段达到额定最大值,表达式如下:
Figure BDA0003073327970000079
式中Pbasic为分布式光伏的输出功率,It为光照强度,IEmax为光电转换效率最大时对应的光照强度,Irate为标准光照强度,Prate为光伏额定容量。
可以利用测试集来测试该预测模型,测试集包含待测的光照及气象数据,直到该预测模型达到所需的预测精度。
步骤3,采用拉普拉斯分布建立预测光伏出力误差的概率密度函数;
由于光照强度往往并不能被精准预测,对于一些云层类型变化复杂、温度波动较大的阴雨天,往往预测误差较大,目前常用来描述光伏预测误差概率分布的模型有区间统计分布、高斯分布或Beta分布。但实际应用中,对于光照强度变化较为规律的晴天,预测误差往往会在0附近出现尖峰,高斯分布或Beta分布受限于变量取值范围以及分布形状,并不能很好地表征这种特点,采用Laplace分布对光伏误差概率进行描述,其概率密度函数表达式如下:
Figure BDA0003073327970000081
式中
Figure BDA0003073327970000082
是Laplace分布的尺度参数;τ为分布中心值,决定了拉式分布的基本形状;I为通过Catboost算法得到的光照强度预测值。对光伏预测误差概率函数进行抽样,结合基本光伏出力预测情况,即可得到不同的光伏出力场景。
步骤4,根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布。
结合典型分布式光伏结构,如图3所示,根据功能结构将光伏系统划分成三层。
第一层包括k个光伏阵列板,每个光伏阵列板为m个并联的光伏板串组子系统,任一光伏板串组子系统都包含n个串联的光伏阵列、防反二极管和直流熔断器,光伏板串组子系统的任意元件失效均造成该光伏板串组失效;
第二层为k个并联的直流配电子系统,任一直流配电子系统都与一个光伏阵列板串联,任一直流配电子系统都包含串联的直流断路器和防反二极管,该直流配电子系统任意元件失效会造成对应的光伏阵列板的所有光伏板串组子系统失效;
第三层为变流器子系统,通常为三相逆变器或DC/DC变流器,该子系统失效造成k组光伏阵列板失效。用于对直流配电子系统合流后的干路进行电路升压后接入直流母线;
各个子系统的故障率和故障持续时间如下:
Figure BDA0003073327970000083
式中,λb、λf、λd、λdcb分别为光伏电池板、直流熔断器、防反二极管和直流断路器的故障率,r为平均修复时间。而分布式交流光伏结构一般较为简单,汇流后直接利用boost电路升压与直流母线相连,Boost电路包含直流电容、电抗器、功率二极管以及功率开关器件,故障率分别为λcap、λind、λpd、λsw,则变流器等效故障率λsub3、等效故障持续时间rsub3如下:
Figure BDA0003073327970000084
如图4所示,根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布的流程是:
先对变流器子系统的元件运行状态进行抽样,其故障态对应的降额出力系数为αdpv=100%;
而后在变流器子系统正常运行时间段内对k个直流配电子系统的元件状态进行抽样,k个全故障对应的降额出力系数为100%,若存在j个故障,则继续对k-j个直流配电子系统正常工作时间内,对其m*(k-j)个光伏板串组子系统进行状态抽样,如果存在i个光伏板串组子系统故障,则降额出力系数为αdpv=j/k+i/[m*(k-j)];
最后,将降额出力系数代入下式中,统计得到降额状态概率分布:
Psolar(It)=(1-αdpv)Pbasic(It) (9)。
步骤5,利用所述预测光伏出力误差的概率密度函数以及降额状态概率分布对预测光伏出力数据进行抽样,获得最终预测光伏出力数据。
进一步地,由于在系统层面进行新能源波动平抑时,需要生成尽可能多的光伏随机出力场景,但考虑到实际运行调度计划安排时,过多场景优化求解导致的计算负担较重,而生成的光伏随机出力场景中也存在大量相似,因此,本文利用聚类技术对出力场景进行聚合,获得最终的典型场景簇。
本发明还提供一种基于Catboost算法的光伏出力场景生成装置100,本发明的基于Catboost算法的光伏出力场景生成装置100可以安装于电子设备1中。所述电子设备1可以包括处理器10、存储器11,还可以包括存储在所述存储器中并可在所述处理器上运行的计算机程序,例如基于Catboost算法的光伏出力场景生成程序。其中,所述存储器至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述处理器是所述电子设备的控制核心,利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器内的程序或者模块,以及调用存储在所述存储器内的数据,以执行电子设备的各种功能和处理数据。
根据实现的功能,所述基于Catboost算法的光伏出力场景生成装置100可以包括数据获取模块101、预测模型生成模块102、概率密度函数生成模块103、降额状态概率分布获取模块104、场景生成模块105。本发明所述模块是指一种能够被电子设备的处理器10所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块的功能如下:
数据获取模块101,用于获取历史光照强度及其对应的历史气象数据作为Catboost算法的初始训练数据,获取光伏系统的各子系统可靠性参数,所述可靠性参数包括各子系统的故障率和故障持续时间;
预测模型生成模块102,用于采用Catboost算法利用所述初始训练数据获得根据气象数据输出对应光照强度的预测模型,并利用所述预测模型预测与气象数据对应的预测光照强度数据,并根据所述预测光照强度数据结合分布式光伏出力的变化阶段获得预测光伏出力数据;
概率密度函数生成模块103,用于采用拉普拉斯分布建立预测光伏出力误差的概率密度函数;
降额状态概率分布获取模块104,用于根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布;
场景生成模块105,用于利用所述预测光伏出力误差的概率密度函数以及降额状态概率分布对预测光伏出力数据进行抽样,生成预测光伏出力场景。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于Catboost算法的光伏出力场景生成方法,其特征在于,包括:
获取历史光照强度及其对应的历史气象数据作为Catboost算法的初始训练数据,获取光伏系统的各子系统可靠性参数,所述可靠性参数包括各子系统的故障率和故障持续时间;
采用Catboost算法利用所述初始训练数据获得根据气象数据输出对应光照强度的预测模型,并利用所述预测模型预测与气象数据对应的预测光照强度数据,并根据所述预测光照强度数据结合分布式光伏出力的变化阶段获得预测光伏出力数据;
采用拉普拉斯分布建立预测光伏出力误差的概率密度函数;
根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布;
利用所述概率密度函数以及降额状态概率分布对预测光伏出力数据进行抽样,生成预测光伏出力场景,
Catboost算法采用M个弱学习器组合成一个强学习器来生成预测模型,假设x为气象数据向量,y为预测光照强度集合,对应每个弱学习器建立一个独立决策树f,wm和βm分别为第m个弱学习器权重及参数,所述预测模型F表示如下式1:
Figure FDA0003720066360000011
其中每个独立决策树的输入空间共有R1至RJ,所述输入空间是将气象数据根据取值范围划分的多个范围空间,计算函数I表示当x属于输入空间
Figure FDA0003720066360000012
时取1,否则取0,
Figure FDA0003720066360000013
为第m个决策树的第j个输入空间预测系数;
采用梯度下降法优化损失函数L,每个特征变量xi在第m个决策树中的梯度下降方向的向量gm(xi)如下式2、3:
Figure FDA0003720066360000014
Figure FDA0003720066360000015
特征变量xi是气象数据向量x中的一个特征变量;
ψ表示求取最小值的意思;
n表示n个特征变量,
分布式光伏出力的变化阶段表达式如下式5:
Figure FDA0003720066360000021
式中Pbasic为分布式光伏的输出功率,It为光照强度,IEmax为光电转换效率最大时对应的光照强度,Irate为标准光照强度,Prate为光伏额定容量。
2.根据权利要求1所述的基于Catboost算法的光伏出力场景生成方法,其特征在于,通过聚类方法将所述预测光伏出力数据进行聚类,形成典型光伏出力场景。
3.根据权利要求2所述的基于Catboost算法的光伏出力场景生成方法,其特征在于,将所述初始训练数据依据夏令时和冬令时划分成两类,对于所述两类中的任一类,再根据每天的相对湿度以及云层类型采用聚类划分成晴天、阴天和雨天三类训练数据,将每个类别的训练数据分别采用Catboost算法获得所述预测模型。
4.根据权利要求1所述的基于Catboost算法的光伏出力场景生成方法,其特征在于,
所述初始训练数据中包含有多个训练样本,对于类特征变量,利用数值变量
Figure FDA0003720066360000022
来替代第i个训练样本的第k个类特征变量
Figure FDA0003720066360000023
Catboost算法随机打乱训练样本顺序,假设所有包含第k个类特征变量的训练样本顺序为
Figure FDA0003720066360000024
Figure FDA0003720066360000025
随机打乱顺序后为
Figure FDA0003720066360000026
Figure FDA0003720066360000027
在遍历到前p个训练样本后在目标变量统计中加入先验分布项,表达式如下式4:
Figure FDA0003720066360000028
式中[·]为指示函数,两元素相等时取1,
Figure FDA0003720066360000029
为类特征变量对应的标签数据,P为先验项,w为先验项的权重。
5.根据权利要求1所述的基于Catboost算法的光伏出力场景生成方法,其特征在于,
将光伏系统划分成三层,第一层包括k个光伏阵列板,每个光伏阵列板为m个并联的光伏板串组子系统,任一光伏板串组子系统都包含n个串联的光伏阵列、防反二极管和直流熔断器;
第二层为k个并联的直流配电子系统,任一直流配电子系统都与一个光伏阵列板串联,任一直流配电子系统都包含串联的直流断路器和防反二极管;
第三层为变流器子系统,用于对直流配电子系统合流后的干路进行电路升压后接入直流母线;
根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布的流程是:
先对变流器子系统的元件运行状态进行抽样,其故障态对应的降额出力系数为αdpv=100%;
而后在变流器子系统正常运行时间段内对k个直流配电子系统的元件状态进行抽样,k个全故障对应的降额出力系数为100%,若存在j个故障,则继续对k-j个直流配电子系统正常工作时间内,对其m*(k-j)个光伏板串组子系统进行状态抽样,如果存在i个光伏板串组子系统故障,则降额出力系数为αdpv=j/k+i/[m*(k-j)];
最后,将降额出力系数代入式9中,统计得到降额状态概率分布:
Psolar(It)=(1-αdpv)Pbasic(It) (9)。
6.根据权利要求5所述的基于Catboost算法的光伏出力场景生成方法,其特征在于,
各子系统故障率和故障持续时间如下式7所示:
Figure FDA0003720066360000031
Figure FDA0003720066360000032
式中,λ表示故障率,r表示故障持续时间,下标sub1、sub2、sub3分别表示光伏板串组子系统、直流配电子系统、变流器子系统;
下标b、f、d、dcb分别表示光伏电池板、直流熔断器、防反二极管和直流断路器;
变流器子系统为boost升压电路,下标cap、ind、pd、sw分别表示直流电容、电抗器、功率二极管以及功率开关器件。
7.根据权利要求1所述的基于Catboost算法的光伏出力场景生成方法,其特征在于,
采用拉普拉斯分布建立预测光伏出力误差的概率密度函数的表达式如下:
Figure FDA0003720066360000033
式中
Figure FDA0003720066360000034
是Laplace分布的尺度参数;
τ为分布中心值,决定了拉普拉斯分布的基本形状,
I为通过Catboost算法得到的光照强度预测值。
8.一种基于Catboost算法的光伏出力场景生成装置,其特征在于,包括:
数据获取模块,用于获取历史光照强度及其对应的历史气象数据作为Catboost算法的初始训练数据,获取光伏系统的各子系统可靠性参数,所述可靠性参数包括各子系统的故障率和故障持续时间;
预测模型生成模块,用于采用Catboost算法利用所述初始训练数据获得根据气象数据输出对应光照强度的预测模型,并利用所述预测模型预测与气象数据对应的预测光照强度数据,并根据所述预测光照强度数据结合分布式光伏出力的变化阶段获得预测光伏出力数据;
概率密度函数生成模块,用于采用拉普拉斯分布建立预测光伏出力误差的概率密度函数;
降额状态概率分布获取模块,用于根据光伏系统的各个子系统的故障率和故障持续时间进行时序蒙特卡洛抽样,获得降额状态概率分布;
场景生成模块,用于利用所述预测光伏出力误差的概率密度函数以及降额状态概率分布对预测光伏出力数据进行抽样,生成预测光伏出力场景,
Catboost算法采用M个弱学习器组合成一个强学习器来生成预测模型,假设x为气象数据向量,y为预测光照强度集合,对应每个弱学习器建立一个独立决策树f,wm和βm分别为第m个弱学习器权重及参数,所述预测模型F表示如下式1:
Figure FDA0003720066360000041
其中每个独立决策树的输入空间共有R1至RJ,所述输入空间是将气象数据根据取值范围划分的多个范围空间,计算函数I表示当x属于输入空间
Figure FDA0003720066360000042
时取1,否则取0,
Figure FDA0003720066360000043
为第m个决策树的第j个输入空间预测系数;
采用梯度下降法优化损失函数L,每个特征变量xi在第m个决策树中的梯度下降方向的向量gm(xi)如下式2、3:
Figure FDA0003720066360000044
Figure FDA0003720066360000045
特征变量xi是气象数据向量x中的一个特征变量;
ψ表示求取最小值的意思;
n表示n个特征变量,
分布式光伏出力的变化阶段表达式如下式5:
Figure FDA0003720066360000051
式中Pbasic为分布式光伏的输出功率,It为光照强度,IEmax为光电转换效率最大时对应的光照强度,Irate为标准光照强度,Prate为光伏额定容量。
CN202110545401.5A 2021-05-19 2021-05-19 基于Catboost算法的光伏出力场景生成方法及场景生成装置 Active CN113283492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110545401.5A CN113283492B (zh) 2021-05-19 2021-05-19 基于Catboost算法的光伏出力场景生成方法及场景生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110545401.5A CN113283492B (zh) 2021-05-19 2021-05-19 基于Catboost算法的光伏出力场景生成方法及场景生成装置

Publications (2)

Publication Number Publication Date
CN113283492A CN113283492A (zh) 2021-08-20
CN113283492B true CN113283492B (zh) 2022-09-23

Family

ID=77279897

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110545401.5A Active CN113283492B (zh) 2021-05-19 2021-05-19 基于Catboost算法的光伏出力场景生成方法及场景生成装置

Country Status (1)

Country Link
CN (1) CN113283492B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219216A (zh) * 2021-11-16 2022-03-22 华南理工大学 一种电力系统的运行调度方法、系统、装置及介质
CN115329899A (zh) * 2022-10-12 2022-11-11 广东电网有限责任公司中山供电局 一种聚类等效模型构建方法、系统、设备和存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102010036966B4 (de) * 2010-08-12 2013-02-28 Sma Solar Technology Ag Verfahren zum Betreiben eines Photovoltaikgenerators an einem Arbeitspunkt maximaler Leistung
CN110084412A (zh) * 2019-04-12 2019-08-02 重庆邮电大学 一种基于特征转换多标签学习的光伏发电大数据预测方法
CN110807554B (zh) * 2019-10-31 2022-11-04 合肥工业大学 基于风电/光伏经典场景集的生成方法及系统
CN111582555B (zh) * 2020-04-19 2023-04-18 天津大学 基于地基云图图像特征的光伏功率预测方法
CN111967675A (zh) * 2020-08-19 2020-11-20 京东方科技集团股份有限公司 光伏发电量的预测方法以及预测装置
CN112348271B (zh) * 2020-11-12 2024-01-30 华北电力大学 基于vmd-ipso-gru的短期光伏功率预测方法

Also Published As

Publication number Publication date
CN113283492A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
Huang et al. Multiple-input deep convolutional neural network model for short-term photovoltaic power forecasting
Theocharides et al. Machine learning algorithms for photovoltaic system power output prediction
CN107516170B (zh) 一种基于设备故障概率和电网运行风险的差异自愈控制方法
Ibrahim et al. An optimized offline random forests-based model for ultra-short-term prediction of PV characteristics
AU2016202556A1 (en) Model-based power estimation of photovoltaic power generation system
CN110570122B (zh) 一种计及风速季节特性及集电系统元件故障的海上风电场可靠性评估方法
CN113283492B (zh) 基于Catboost算法的光伏出力场景生成方法及场景生成装置
CN112785027B (zh) 风光储联合发电系统置信容量评估方法及系统
CN110929953A (zh) 基于聚类分析的光伏电站超短期出力预测方法
EP3576029A1 (en) Method and device for determining energy system operating scenarios
CN108364117B (zh) 一种考虑光伏电站元件可靠性的电网风险评估方法
US20220376499A1 (en) System and method for load and source forecasting for increasing electrical grid component longevity
Liu et al. Intelligent fault diagnosis of photovoltaic array based on variable predictive models and I–V curves
CN113408785B (zh) 光功率的预测方法、装置、设备及存储介质
Chen et al. Research on wind power prediction method based on convolutional neural network and genetic algorithm
Huang et al. Power prediction method of distributed photovoltaic digital twin system based on GA-BP
CN116502771A (zh) 一种基于电力物资预测的配电方法及系统
Wan et al. Photovoltaic generation scenario analysis considering irradiation uncertainty and output derating probability
CN115118015A (zh) 一种基于融合终端的台区供电稳定性监测系统
CN114329857A (zh) 一种基于改进鲸鱼算法的分布式电源规划方法
Alshareef Voltage Sag Assessment, Detection, and Classification in Distribution Systems Embedded With Fast Charging Stations
Huang et al. Forecast method of distributed photovoltaic power generation based on EM-WS-CNN neural networks
Xu et al. A Combined Model for Ultra-Short-Term PV Forecasting Based on SOM Clustering
Peng et al. A hybrid model for solar radiation forecasting towards energy efficient buildings
Baruah et al. Exploiting Context for Fault Detection in Solar Photovoltaic System using Context-Sensitive Recurrent Neural Network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant