CN117669391B - 一种基于深度学习的短期光伏功率预测方法 - Google Patents

一种基于深度学习的短期光伏功率预测方法 Download PDF

Info

Publication number
CN117669391B
CN117669391B CN202410141241.1A CN202410141241A CN117669391B CN 117669391 B CN117669391 B CN 117669391B CN 202410141241 A CN202410141241 A CN 202410141241A CN 117669391 B CN117669391 B CN 117669391B
Authority
CN
China
Prior art keywords
data
photovoltaic power
model
prediction
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410141241.1A
Other languages
English (en)
Other versions
CN117669391A (zh
Inventor
许晓敏
关泺允
王之怡
崔灏旭
姚润坤
张勇
周盈颖
路妍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Original Assignee
North China Electric Power University
Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University, Economic and Technological Research Institute of State Grid Hebei Electric Power Co Ltd filed Critical North China Electric Power University
Priority to CN202410141241.1A priority Critical patent/CN117669391B/zh
Publication of CN117669391A publication Critical patent/CN117669391A/zh
Application granted granted Critical
Publication of CN117669391B publication Critical patent/CN117669391B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于深度学习的短期光伏功率预测方法,包括步骤:S1、采集影响光伏发电功率的原始数据集;S2、对原始数据集进行数据预处理;S3、构建XGB‑GRU‑Informer集成预测模型,并将预处理后的原始数据集输入预测模型中,获取预测结果;S4、对预测结果进行对比分析与误差分析。本发明解决了现有光伏发电系统难以准确的预测其发电功率的问题。

Description

一种基于深度学习的短期光伏功率预测方法
技术领域
本发明属于能源预测技术领域,具体来说,涉及一种基于深度学习的短期光伏功率预测方法。
背景技术
在“双碳”背景下,传统电力系统将迎来全面的转型升级,新型电力系统在满足经济社会发展需求的前提下,承载了实现“双碳”目标以及最大化消纳新能源的任务。太阳能作为一种清洁、安全、无污染的可再生能源,具有资源丰富、分布广泛、零碳排放等优势,已被全球各国公认为最具潜力、对全球能源保障和降低温室气体排放极具优势的新型能源光伏发电技术。2021年,中国光伏市场已成为年装机容量最大的光伏市场并呈现出逐年递增的趋势,累计装机容量为308.5GW,约占全球光伏装机容量的1/3,位列全球第一。
随着电力市场的绿色化转型,可再生新能源的需求不断增加,光伏行业对电力市场的渗透率在逐步提升。而与传统化石能源相比,光伏能源的成本已经具有竞争力。然而,相比于火力发电连续可调可控并能够稳定供电,光伏发电具有间歇性、波动性和不连续等特点,为电力系统的实时调度和平稳运行带来不确定性。
发明内容
针对现有光伏发电系统难以准确的预测其发电功率的问题,本发明提供了一种基于深度学习的短期光伏功率预测方法。
为实现上述技术目的,本发明采用的技术方案如下:
一种基于深度学习的短期光伏功率预测方法,包括步骤:
S1、采集影响光伏发电功率的原始数据集;
S2、对原始数据集进行数据预处理;
S3、构建XGB-GRU-Informer集成预测模型,并将预处理后的原始数据集输入预测模型中,获取预测结果;
S4、对预测结果进行对比分析与误差分析。
数据预处理包括异常值检测与替换、天气特征重要度排序和K-Means聚类算法对天气数据进行划分。
步骤S2的详细步骤包括:
S201、通过温度与辐射强度计算理论光伏功率,对功率异常数据进行检测与替换;
S202、对数据集进行标准化处理;
S203、利用XGBoost算法计算气候影响因素对光伏功率变化的贡献度,通过天气特征重要度排序筛选出与光伏功率相关性较强的天气特征;
S204、利用K-Means聚类算法对天气数据进行划分,将每日数据划分为晴天、阴天与突变三种天气。
步骤S3的详细步骤包括:
S301、针对特征筛选后的天气数据,选取前60%的数据作为训练集,选取30%的数据作为验证集,余下10%的数据作为测试集;
S302、将GRU与Informer作为模型第一层的基学习器,输入测试集和验证集进行模型训练,输出第一层结果并作为第二层新的训练集;
S303、将SVR作为第二层的元学习器,输入新的训练集与测试集进行模型训练,得到最终的XGB-GRU-Informer集成模型;
S304、对预测结果进行反标准化处理并输出结果。
步骤S4的详细步骤包括:
S401、将预测结果反标准化处理后的输出集结果作为最终预测结果;
S402、引入误差指标MAE、RMSE、R2进行误差分析与结果可视化;
S403、设置不同预测场景模型,比较不同预测场景下模型的预测性能。
在步骤S201中,光伏电站,转换效率和面积是固定的,故太阳辐照强度和温度是直接影响功率的因子,因此,根据公式对功率数据进行异常值比对,利用光伏发电计算功率公式计算结果替换异常值与空白值光伏发电计算功率为,其中/>为转换效率;S为面积;I为太阳总辐照强度;/>为温度。
在步骤S202中,消除各指标数据之间的数量级与量纲差异,进行标准化处理,通过公式将原始各项指标数据标准化至区间[a,b]上,本次采取[-1,1]标准化;其中/>表示标准化处理后的各维数据,/>表示原始各维数据,/>和/>表示各维数据的均值与方差。
训练样本,其中/>为特征向量,/>与/>分别实际值与预测值,假设每一棵决策树模型为/>,XGBoost目标函数为:
(1)
其中,
(2)
(3)
式中:为损失函数,用来衡量预测值/>与真实值/>之间的误差;/>为回归树的数量;控制模型的复杂程度;/>为惩罚系数;/>为正则项系数;/>为所有叶子节点通过决策树模型输出的预测值组成的特征向量;Boosting算法使用的是加法模型,强分类器的预测值就等于当前树预测值与前一棵树的预测值的和,所以将目标函数转化为前/>次加上/>次的目标函数;对目标函数进行二阶泰勒展开,得到关于特征向量的一元二次函数并进行求导,得到目标函数极值点也就是最优解;通过最优解定义出分裂的增益;根据贪心准则遍历所有特征可能的分裂点计算出增益值,选取增益值最大的特征进行分裂;分裂完成则决策树模型构建完成;某一特征/>在第/>棵决策树中的重要度可以用式(4)计算:
(4)
式中:为特征/>在第/>棵决策树中的重要度;/>为与节点/>相关的特征;/>为节点/>分裂后损失值的平方;/>为sign函数,当/>时取1,当/>时取0;/>为非叶子节点数量。假设有/>棵决策树,则特征/>在XGBoost模型下的全局重要度通过特征/>在所有树中的重要度的平均值来衡量,其计算公式如下:
(5)。
在步骤S204中,将样本根据相似度聚集到个簇中,最终实现簇中相似度最高簇间相似度最低,具体步骤如下:
a、从数据样本中随机选取个样本数据,并作为原始聚类中心/>
b、计算剩余样本到每一个初始中心的欧氏距离,选择距离最近的初始聚类中心形成簇,距离公式为:
(6)
其中为样本空间中的样本,/>为簇/>的质心;
c、对每个簇进行重新计算聚类中心,计算聚类中心的公式为:
(7)
最后重复第2步和第3步直到相似度条件被满足或者到达最大迭代次数而终止,终止条件为:
(8)
其中为阈值条件。
在步骤S302中进行短期光伏功率预测参数设置,确定基学习器模型:
GRU神经网络超参数设置如下:输入层节点数为7,分别对应已筛选后的7个天气特征,预测步长为24,输出层节点数为1,隐藏层数为2,隐藏神经元数为128个,训练批次为48,GRU神经网络设置训练次数为200,学习率为0.0001,设置防止过拟合参数值为0.05;
Informer模型超参数设置如下:输入层节点数为7,分别对应已筛选后的7个天气特征,输出层节点数为1,编码器层数为2,编码器序列长度为96,解码器层数为1,解码器序列长度为48,预测步长为24,自注意力多头个数为8,损失函数为MSE,训练批次为48,隐藏神经元个数为512个,Informer模型设置训练次数为20,学习率为0.0001,设置防止过拟合参数值为0.05。
在步骤S303中,对元学习器支持向量机回归(SVR)进行参数设置;选用高斯核函数作为SVR核函数,惩罚系数设置为2。
本发明相比现有技术,具有如下有益效果:
提出了一种基于Blending集成算法的XGBoost-GRU-Informer短期光伏功率预测模型。首先通过数据处理与模型构建板块介绍预测模型的构建原理与预测过程,然后通过实证分析板块验证所构建模型的预测效果与精度,实现光伏功率短期精准预测。
在数据处理板块,针对光伏发电功率变的相关天气特征众多的问题,利用XGBoost计算特征重要度,剔除重要度较低的特征,降低数据冗余,提高模型效率;利用K-Means聚类将天气数据分为三类,减少由于天气波动造成的功率规律变化所造成的误差。
在模型构建板块,构建基于Blending算法的集成模型,综合GRU、Informer与SVR的模型特点,分别搭建基学习器与元学习器,对光伏发电功率进行两阶段预测,降低了模型计算量,避免过拟合风险,提高短期光伏发电功率预测的稳定性。
附图说明
图1为本发明实施例中一种基于深度学习的短期光伏功率预测方法的整体流程图;
图2为本发明实施例中基于XGBoost算法的重要度排序表示意图;
图3为本发明实施例中基于K-Means聚类算法的天气聚类图;
图4为本发明实施例中构建的XGBoost-GRU-Informer集成模型预测结果对比图。
具体实施方式
为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。
如图1所示1-4本实施例提供了一种基于深度学习的短期光伏功率预测方法,包括步骤:
S1、采集影响光伏发电功率的原始数据集;
S2、对原始数据集进行数据预处理;
S3、构建XGB-GRU-Informer集成预测模型,并将预处理后的原始数据集输入预测模型中,获取预测结果;
S4、对预测结果进行对比分析与误差分析。
数据预处理包括异常值检测与替换、天气特征重要度排序和K-Means聚类算法对天气数据进行划分。
步骤S2的详细步骤包括:
S201、通过温度与辐射强度计算理论光伏功率,对功率异常数据进行检测与替换;
S202、对数据集进行标准化处理;
S203、利用XGBoost算法计算气候影响因素对光伏功率变化的贡献度,通过天气特征重要度排序筛选出与光伏功率相关性较强的天气特征;
S204、利用K-Means聚类算法对天气数据进行划分,将每日数据划分为晴天、阴天与突变三种天气。
步骤S3的详细步骤包括:
S301、针对特征筛选后的天气数据,选取前60%的数据作为训练集,选取30%的数据作为验证集,余下10%的数据作为测试集;
S302、将GRU与Informer作为模型第一层的基学习器,输入测试集和验证集进行模型训练,输出第一层结果并作为第二层新的训练集;
S303、将SVR作为第二层的元学习器,输入新的训练集与测试集进行模型训练,得到最终的XGB-GRU-Informer集成模型;
S304、对预测结果进行反标准化处理并输出结果。
步骤S4的详细步骤包括:
S401、将预测结果反标准化处理后的输出集结果作为最终预测结果;
S402、引入误差指标MAE、RMSE、R2进行误差分析与结果可视化;
S403、设置不同预测场景模型,比较不同预测场景下模型的预测性能。
对于一个光伏电站,转换效率和面积是固定的,故太阳辐照强度和温度是直接影响功率的因子,因此,在步骤S201中,光伏电站,转换效率和面积是固定的,故太阳辐照强度和温度是直接影响功率的因子,因此,根据公式对功率数据进行异常值比对,利用光伏发电计算功率公式计算结果替换异常值与空白值光伏发电计算功率为,其中/>为转换效率;/>为面积;/>为太阳总辐照强度;/>为温度。
在步骤S202中,消除各指标数据之间的数量级与量纲差异,进行标准化处理,通过公式将原始各项指标数据标准化至区间[a,b]上,本次采取[-1,1]标准化;其中/>表示标准化处理后的各维数据,/>表示原始各维数据,/>和/>表示各维数据的均值与方差。
在步骤S203中,利用XGBoost算法计算气候影响因素对光伏功率变化的贡献度,通过天气特征重要度排序筛选出与光伏功率相关性较强的天气特征。设训练样本,其中/>为特征向量,/>与/>分别实际值与预测值,假设每一棵决策树模型为/>,XGBoost目标函数为:
(1)
其中,
(2)
(3)
式中:为损失函数,用来衡量预测值/>与真实值/>之间的误差;/>为回归树的数量;控制模型的复杂程度;/>为惩罚系数;/>为正则项系数;/>为所有叶子节点通过决策树模型输出的预测值组成的特征向量;Boosting算法使用的是加法模型,强分类器的预测值就等于当前树预测值与前一棵树的预测值的和,所以将目标函数转化为前/>次加上/>次的目标函数;对目标函数进行二阶泰勒展开,得到关于特征向量的一元二次函数并进行求导,得到目标函数极值点也就是最优解;通过最优解定义出分裂的增益;根据贪心准则遍历所有特征可能的分裂点计算出增益值,选取增益值最大的特征进行分裂;分裂完成则决策树模型构建完成;某一特征/>在第/>棵决策树中的重要度可以用式(4)计算:
(4)
式中:为特征/>在第/>棵决策树中的重要度;/>为与节点/>相关的特征;/>为节点/>分裂后损失值的平方;/>为sign函数,当/>时取1,当/>时取0;/>为非叶子节点数量。假设有/>棵决策树,则特征/>在XGBoost模型下的全局重要度通过特征/>在所有树中的重要度的平均值来衡量,其计算公式如下:
(5)。
如表1:
表1 天气特征筛选结果
在步骤S204中,将样本根据相似度聚集到个簇中,最终实现簇中相似度最高簇间相似度最低,具体步骤如下:
a、从数据样本中随机选取个样本数据,并作为原始聚类中心/>
b、计算剩余样本到每一个初始中心的欧氏距离,选择距离最近的初始聚类中心形成簇,距离公式为:
(6)
其中为样本空间中的样本,/>为簇/>的质心;
c、对每个簇进行重新计算聚类中心,计算聚类中心的公式为:
(7)
最后重复第2步和第3步直到相似度条件被满足或者到达最大迭代次数而终止,终止条件为:
(8)
其中为阈值条件。
在S301中,针对特征筛选后的天气数据,选取前60%的数据作为训练集,选取30%的数据作为验证集,余下10%的数据作为测试集。训练数据如表2所示。
表2 经筛选后的天气数据集
在步骤S302中进行短期光伏功率预测参数设置,确定基学习器模型:
GRU神经网络超参数设置如下:输入层节点数为7,分别对应已筛选后的7个天气特征,预测步长为24,输出层节点数为1,隐藏层数为2,隐藏神经元数为128个,训练批次为48,GRU神经网络设置训练次数为200,学习率为0.0001,设置防止过拟合参数值为0.05;
Informer模型超参数设置如下:输入层节点数为7,分别对应已筛选后的7个天气特征,输出层节点数为1,编码器层数为2,编码器序列长度为96,解码器层数为1,解码器序列长度为48,预测步长为24,自注意力多头个数为8,损失函数为MSE,训练批次为48,隐藏神经元个数为512个,Informer模型设置训练次数为20,学习率为0.0001,设置防止过拟合参数值为0.05。
在步骤S303中,将SVR作为第二层的元学习器,输入新的训练集与测试集进行模型训练,得到最终的XGB-GRU-Informer集成模型。选用高斯核函数作为SVR核函数,惩罚系数常设置为2。
本发明相比现有技术,具有如下有益效果:
提出了一种基于Blending集成算法的XGBoost-GRU-Informer短期光伏功率预测模型。首先通过数据处理与模型构建板块介绍预测模型的构建原理与预测过程,然后通过实证分析板块验证所构建模型的预测效果与精度,实现光伏功率短期精准预测。
在数据处理板块,针对光伏发电功率变的相关天气特征众多的问题,利用XGBoost计算特征重要度,剔除重要度较低的特征,降低数据冗余,提高模型效率;利用K-Means聚类将天气数据分为三类,减少由于天气波动造成的功率规律变化所造成的误差。
在模型构建板块,构建基于Blending算法的集成模型,综合GRU、Informer与SVR的模型特点,分别搭建基学习器与元学习器,对光伏发电功率进行两阶段预测,降低了模型计算量,避免过拟合风险,提高短期光伏发电功率预测的稳定性。
以上对本申请提供的一种基于深度学习的短期光伏功率预测方法进行了详细介绍。具体实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (7)

1.一种基于深度学习的短期光伏功率预测方法,其特征在于,包括步骤:
S1、采集影响光伏发电功率的原始数据集;
S2、对原始数据集进行数据预处理;
S3、构建XGB-GRU-Informer集成预测模型,并将预处理后的原始数据集输入预测模型中,获取预测结果;
S4、对预测结果进行对比分析与误差分析;
步骤S2的详细步骤包括:
S201、通过温度与辐射强度计算理论光伏功率,对功率异常数据进行检测与替换;
S202、对数据集进行标准化处理;
S203、利用XGBoost算法计算气候影响因素对光伏功率变化的贡献度,通过天气特征重要度排序筛选出与光伏功率相关性较强的天气特征;
S204、利用K-Means聚类算法对天气数据进行划分,将每日数据划分为晴天、阴天与突变三种天气;
步骤S3的详细步骤包括:
S301、针对特征筛选后的天气数据,选取前60%的数据作为训练集,选取30%的数据作为验证集,余下10%的数据作为测试集;
S302、将GRU与Informer作为模型第一层的基学习器,输入测试集和验证集进行模型训练,输出第一层结果并作为第二层新的训练集;
S303、将SVR作为第二层的元学习器,输入新的训练集与测试集进行模型训练,得到最终的XGB-GRU-Informer集成模型;
S304、对预测结果进行反标准化处理并输出结果。
2.根据权利要求1所述的一种基于深度学习的短期光伏功率预测方法,其特征在于,步骤S4的详细步骤包括:
S401、将预测结果反标准化处理后的输出集结果作为最终预测结果;
S402、引入误差指标MAE、RMSE、R2进行误差分析与结果可视化;
S403、设置不同预测场景模型,比较不同预测场景下模型的预测性能。
3.根据权利要求2所述的一种基于深度学习的短期光伏功率预测方法,其特征在于,在步骤S201中,光伏电站,转换效率和面积是固定的,故太阳辐照强度和温度是直接影响功率的因子,因此,根据公式对功率数据进行异常值比对,利用光伏发电计算功率公式计算结果替换异常值与空白值光伏发电计算功率,其中/>为转换效率;/>为面积;/>为太阳总辐照强度;/>为温度。
4.根据权利要求3所述的一种基于深度学习的短期光伏功率预测方法,其特征在于,在步骤S202中,消除各指标数据之间的数量级与量纲差异,进行标准化处理,通过公式将原始各项指标数据标准化至区间[a,b]上,本次采取[-1,1]标准化;其中/>表示标准化处理后的各维数据,/>表示原始各维数据,/>和/>表示各维数据的均值与方差。
5.根据权利要求4所述的一种基于深度学习的短期光伏功率预测方法,其特征在于,设训练样本,其中/>为特征向量,/>与/>分别实际值与预测值,假设每一棵决策树模型为/>,XGBoost目标函数为:
其中,
式中:为损失函数,用来衡量预测值/>与真实值/>之间的误差;/>为回归树的数量;/>控制模型的复杂程度;/>为惩罚系数;/>为正则项系数;/>为所有叶子节点通过决策树模型输出的预测值组成的特征向量;Boosting算法使用的是加法模型,强分类器的预测值就等于当前树预测值与前一棵树的预测值的和,所以将目标函数转化为前/>次加上/>次的目标函数;对目标函数进行二阶泰勒展开,得到关于特征向量的一元二次函数并进行求导,得到目标函数极值点也就是最优解;通过最优解定义出分裂的增益;根据贪心准则遍历所有特征可能的分裂点计算出增益值,选取增益值最大的特征进行分裂;分裂完成则决策树模型构建完成;某一特征/>在第/>棵决策树中的重要度计算公式如下:
式中:为特征/>在第/>棵决策树中的重要度;/>为与节点/>相关的特征;/>为节点分裂后损失值的平方;/>为sign函数,当/>时取1,当/>时取0;/>为非叶子节点数量;假设有/>棵决策树,则特征/>在XGBoost模型下的全局重要度通过特征/>在所有树中的重要度的平均值来衡量,其计算公式如下:
6.根据权利要求5所述的一种基于深度学习的短期光伏功率预测方法,其特征在于,在步骤S204中,将样本根据相似度聚集到个簇中,最终实现簇中相似度最高簇间相似度最低,具体步骤如下:
a、从数据样本中随机选取个样本数据,并作为原始聚类中心/>
b、计算剩余样本到每一个初始中心的欧氏距离,选择距离最近的初始聚类中心形成簇,距离公式为:
其中/>为样本空间中的样本,/>为簇/>的质心;
c、对每个簇进行重新计算聚类中心,计算聚类中心的公式为:
最后重复第2步和第3步直到相似度条件被满足或者到达最大迭代次数而终止,终止条件为:
其中为阈值条件。
7.根据权利要求6所述的一种基于深度学习的短期光伏功率预测方法,其特征在于,在步骤S302中进行短期光伏功率预测参数设置,确定基学习器模型:
GRU神经网络超参数设置如下:输入层节点数为7,分别对应已筛选后的7个天气特征,预测步长为24,输出层节点数为1,隐藏层数为2,隐藏神经元数为128个,训练批次为48,GRU神经网络设置训练次数为200,学习率为0.0001,设置防止过拟合参数值为0.05;
Informer模型超参数设置如下:输入层节点数为7,分别对应已筛选后的7个天气特征,输出层节点数为1,编码器层数为2,编码器序列长度为96,解码器层数为1,解码器序列长度为48,预测步长为24,自注意力多头个数为8,损失函数为MSE,训练批次为48,隐藏神经元个数为512个,Informer模型设置训练次数为20,学习率为0.0001,设置防止过拟合参数值为0.05。
CN202410141241.1A 2024-02-01 2024-02-01 一种基于深度学习的短期光伏功率预测方法 Active CN117669391B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410141241.1A CN117669391B (zh) 2024-02-01 2024-02-01 一种基于深度学习的短期光伏功率预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410141241.1A CN117669391B (zh) 2024-02-01 2024-02-01 一种基于深度学习的短期光伏功率预测方法

Publications (2)

Publication Number Publication Date
CN117669391A CN117669391A (zh) 2024-03-08
CN117669391B true CN117669391B (zh) 2024-04-16

Family

ID=90066457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410141241.1A Active CN117669391B (zh) 2024-02-01 2024-02-01 一种基于深度学习的短期光伏功率预测方法

Country Status (1)

Country Link
CN (1) CN117669391B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542385A (zh) * 2023-05-15 2023-08-04 华能东营河口风力发电有限公司 一种针对风、光功率预测的集成学习方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128793A (zh) * 2021-05-19 2021-07-16 中国南方电网有限责任公司 一种基于多源数据融合的光伏功率组合预测方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542385A (zh) * 2023-05-15 2023-08-04 华能东营河口风力发电有限公司 一种针对风、光功率预测的集成学习方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于特征工程优化集成学习的短期光伏功率预测研究;闫肃;《中国知网》;20231231;第1.3节 *

Also Published As

Publication number Publication date
CN117669391A (zh) 2024-03-08

Similar Documents

Publication Publication Date Title
CN107766990B (zh) 一种光伏电站发电功率的预测方法
CN109002915B (zh) 基于Kmeans-GRA-Elman模型的光伏电站短期功率预测方法
CN106447098B (zh) 一种光伏超短期功率预测方法及装置
CN111008728A (zh) 一种用于分布式光伏发电系统短期出力的预测方法
CN112186761B (zh) 一种基于概率分布的风电功率场景生成方法及系统
CN112508246B (zh) 一种基于相似日的光伏发电功率预测方法
CN111369045A (zh) 一种短期光伏发电功率预测的方法
CN115829105A (zh) 基于历史数据特征搜索的光伏功率预测方法
CN112418346B (zh) 一种数值天气预报总辐射系统误差分类计算方法
CN111832838B (zh) 一种短期风力发电输出功率的预测方法
CN115759389A (zh) 基于天气类型的相似日组合策略的日前光伏功率预测方法
CN113837426A (zh) 一种基于天气分型的光伏功率预测方法
CN115441447B (zh) 一种新能源发电功率预测方法
CN116629416A (zh) 光伏电站功率预测方法及装置
CN116826737A (zh) 一种光伏功率的预测方法、装置、存储介质及设备
CN111553434A (zh) 一种电力系统负荷分类方法及系统
CN113033136B (zh) 简化的光伏电池物理参数提取优化方法及系统
CN108694475B (zh) 基于混合模型的短时间尺度光伏电池发电量预测方法
CN110852492A (zh) 一种基于马氏距离找相似的光伏功率超短期预测方法
CN117669391B (zh) 一种基于深度学习的短期光伏功率预测方法
CN116070458A (zh) 基于rac-gan的新建风电场场景生成方法
CN117952240A (zh) 一种光伏发电量预测方法及装置
CN115900936A (zh) 基于天气分型的水平面总辐射和散射辐射预测方法
CN115764861A (zh) 一种基于机器学习的风光一体化功率预测方法
CN113780643A (zh) 一种基于事例推理的光伏电站短期出力预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant