CN115618734A - 一种基于集成学习的风机短期出力预测方法 - Google Patents

一种基于集成学习的风机短期出力预测方法 Download PDF

Info

Publication number
CN115618734A
CN115618734A CN202211319677.2A CN202211319677A CN115618734A CN 115618734 A CN115618734 A CN 115618734A CN 202211319677 A CN202211319677 A CN 202211319677A CN 115618734 A CN115618734 A CN 115618734A
Authority
CN
China
Prior art keywords
data
prediction
output
fan
steps
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211319677.2A
Other languages
English (en)
Inventor
在军
葛佳成
徐俊俊
徐东亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211319677.2A priority Critical patent/CN115618734A/zh
Publication of CN115618734A publication Critical patent/CN115618734A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Geometry (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Wind Motors (AREA)

Abstract

本发明属于公开了一种基于集成学习的风机短期出力预测方法,涉及风电功率预测技术领域,包括:获取风机出力历史数据,使用孤立森林算法对异常值进行检测,并根据风速与功率的区间关系对异常值进行修复;建立TCN‑GRU,LightGBM预测模型,划分数据分别对预测模型进行训练和验证,同时对预测值进行数据矫正;对数据矫正后的预测模型的预测值进行融合,得到最终的风机出力预测结果,不仅在预测精度上有优势,且能够有效抑制坏数据对预测的影响。

Description

一种基于集成学习的风机短期出力预测方法
技术领域
本发明属于风电功率预测技术领域,具体涉及一种基于集成学习的风机短期出力预测方法。
背景技术
近年来,随着风电技术的发展,越来越多的风电设备接入电网,为电网提供大量电能的同时,给电网带去了更多的不确定性,对电能质量也造成了一定的影响。因此需要对风电出力进行精准的预测以保障电网安全稳定运行。
但现有的风电功率预测方法所使用的模型比较陈旧,这些模型往往需要更长的训练时间、更多的训练样本,同时计算精度和工程落地难度都较大,同时,单个模型在预测算法中具有许多的限制和不足,为了突破这些限制,基于多种算法结合的集成学习算法提供了新的思路,集成学习拥有更高的准确率,引入了随机性使得模型不易过拟合,实现简单,训练速度快的同时更容易实现并行化。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于集成学习的风机短期出力预测方法,解决了现有技术中单个模型在预测算法中具有许多的限制与不足的技术问题。
本发明的目的可以通过以下技术方案实现:一种基于集成学习的风机短期出力预测方法,方法包括以下步骤:
获取风机出力历史数据;
使用孤立森林算法对高维度的风机出力历史数据多次使用随机的超平面进行切割,直到超平面构成的各子区域均只剩一个数据点,根据切割次数生成树结构,将多于指定切割次数的节点看做异常值,完成异常检测;并根据风速与功率的近似线性的区间关系对异常值进行修复,得到修复后的风机出力数据;
建立时间卷积网络-门控循环单元网络TCN-GRU,轻型梯度提升机 LightGBM预测模型,对修复后的风机出力数据划分为训练集和验证集,并分别对训练集中数据进行训练并得到训练好的预测模型,同时将验证集放入预测模型进行预测,并对预测结果进行数据矫正;
对数据矫正后的预测模型的预测值进行融合,得到最终的风机出力预测结果。
优选地,所述风机出力历史数据包括风机编号、日期、时间、风速、风向与风机角度差、环境温度、风机温度、风机角度、三片风机扇叶各自的倾角和输出的有功,这些数据共同构成风机出力历史数据的多维度特征。
优选地,所述使用孤立森林算法的过程包括以下步骤:
从修复后的风机出力历史数据划分得到的训练数据中随机选择m个点样本点作为样本子集,放入树的根节点,生成初始树模型,用于对异常值进行检测;
在多维度特征中随机指定一个维度,在当前训练数据对应的多维度节点数据中随机产生一个切割点p;
以切割点生成一个超平面,然后将当前节点数据空间划分为2个子空间,把指定维度里小于p的数据放在当前节点数据的左子节点,把大于等于p的数据放在当前节点数据的右子节点;
在生成的左、右子节点中递归以上步骤,不断构造新的孩子节点,直到子节点中只有一个数据或子节点已到达预设的限定高度,限定高度需要不断调整以改善异常检测结果;
循环以上步骤,直至生成t个孤立树iTree,其中t为超参数;
对每个数据点xi进行评估:遍历每一棵iTree,计算xi在森林中的平均高度 E(h(xi)),并对平均高度做归一化处理,节点的高度h(xi)为节点距离根节点的最短路径的大小,异常值分数计算方法如下:
Figure BDA0003909806350000031
式中,c(m)的表达式为:
Figure BDA0003909806350000032
式中,m为样本子集大小,H(i)=ln(i)+γ,γ为常数,且γ=0.5772156649;
当s≥0.8时,认为数据点为异常点;当s<0.8时,认为数据点为正常点;
提取数据特征中的风速与有功特征,将风速划分为100个区段,对每个异常值,找到异常值风速对应的区段,将风速区段内的平均出力作为异常值的出力大小。
优选地,所述切割点产生于当前节点数据中指定维度的最大值和最小值之间。
优选地,超参数t根据样本量进行调整。
优选地,所述建立时间卷积网络-门控循环单元网络TCN-GRU,轻型梯度提升机LightGBM预测模型,对修复后的风机出力数据划分为训练集和验证集,并分别对训练集中数据进行训练并得到训练好的预测模型,同时将验证集放入预测模型进行预测,并对预测结果进行数据矫正的过程包括以下步骤:
TCN为根据时间序列建模的时间卷积网络,TCN只按照时间序列顺序进行连接,之后进入GRU网络进行进一步学习其时序特性,根据数据特征维度、数据大小和不同的输出步长设置超参数,从而建立TCN-GRU模型,同时,根据数据特征维度、数据大小和不同的输出步长设置LightGBM超参数,从而建立LightGBM模型;
对历史数据进行划分,按照时间顺序,将历史数据中前百分之70的历史数据作为训练集,后百分之30的历史数据作为验证集;
利用混合步长预测方法对预测值进行修正,对TCN-GRU模型和LightGBM 模型分别使用步长从小到大依次进行预测,并依次使用短步长的预测来修正长步长的预测结果,需要对未来72小时的风机出力进行预测,将步长视为72,则在预测时,先使用36步长或更短步长的预测对前36步长的数据进行预测,然后再将前36步预测的输出结果加入历史数据并作为部分输入,对剩下36步长的数据进行预测;同时,根据历史数据使用72步长进行预测,将预测结果与多次短步长的预测数据结构取均值进行修正,得到最终的预测结果。
优选地,所述利用混合步长预测方法对预测值进行修正的计算方法为:
P1=P36-1+P36-2 (3)
P2=P72-1 (4)
Pm=P1+P2 (5)
式中,Pm表示该模型下的最终预测结果,Pi表示某一步长的预测结果,Pa-b表示第b次步长为a的预测结果,式(3)表示将72步长的前36步长以P36-1表示,后36步长以P36-2表示;式(4)表示用总的72步长的预测方法来预测总的结果;式(5)表示最终的预测结果为对P1和P2取均值。
优选地,所述对数据矫正后的预测模型的预测值进行融合,得到最终的风机出力预测结果的计算过程为:
Pz=αPTCN-GRU+βPLightGBM (6)
式中,α和β分别表示融合系数,均为大于等于0且小于等于1的常数,且α+β=1;PTCN-GRU和PLightGBM分别表示基于TCN-GRU模型和LightGBM模型的风机短期出力预测结果;Pz为最终的风机短期出力预测结果。
一种设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的一种基于集成学习的风机短期出力预测方法。
一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如上所述的一种基于集成学习的风机短期出力预测方法。
本发明的有益效果:
本发明聚焦于考虑风机出力历史数据特征维度高、坏数据占比高,且时间跨度长等因素,提出了一种基于集成学习的风机短期出力预测方法;首先根据风机物理信息、环境信息及由SCADA等设备收集到的有功量测信息得到风机历史出力数据;再利用孤立森林算法可以自适应识别坏数据,并使用风速-功率区间关系对坏数据进行修正;然后分别构建基于TCN-GRU和LightGBM的预测模型,并用混合步长方法进行预测量修正;最后对多模型的预测结果进行数据融合,本发明在坏数据占比较多且特征维度高、数据量大的情况下,进一步提高风机短期出力的预测准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明流程图;
图2为本发明实施例孤立森林算法示例图;
图3为本发明风机历史数据中风速与风机出力相关散点图;
图4为本发明TCN模型示意图;
图5为本发明GRU模型示意图;
图6为本发明LightGBM模型流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,一种基于集成学习的风机短期出力预测方法,方法包括以下步骤:
获取风机出力历史数据,其中风机出力历史数据包括风机编号、日期、时间、风速、风向与风机角度差、环境温度、风机温度、风机角度、三片风机扇叶各自的倾角和输出的有功,共有134个风机在245天内的数据。本发明将利用上述数据,按时间顺序将前百分之70数据作为测试集,后百分之30数据作为验证集,以验证未来48小时内间隔10分钟的风机出力。;
使用孤立森林算法对高维度的风机出力历史数据多次使用随机的超平面进行切割,直到超平面构成的各子区域均只剩一个数据点,根据切割次数生成树结构,将多于指定切割次数的节点看做异常值,完成异常检测;并根据风速与功率的近似线性的区间关系对异常值进行修复,得到修复后的风机出力数据,使得修复后的数据更接近真实值,具体包括:
从训练数据中随机选择m个点样本点作为样本子集,放入树的根节点;
在多特征维度中随机指定一个维度(特征),在当前节点数据中随机产生一个切割点p(切割点产生于当前节点数据中指定维度的最大值和最小值之间);
以此切割点生成了一个超平面,然后将当前节点数据空间划分为2个子空间:把指定维度里小于p的数据放在当前节点的左子节点,把大于等于p的数据放在当前节点的右子节点。
在子节点中递归步骤2-2和2-3,不断构造新的孩子节点,直到子节点中只有一个数据(无法再继续切割)或子节点已到达限定高度。
循环步骤2-1至步骤2-4,直至生成t个孤立树iTree,其中t为超参数,可根据样本量进行调整。
对每个数据点xi进行评估,具体方法为:遍历每一棵iTree,计算xi在森林中的平均高度E(h(xi)),并对平均高度做归一化处理。节点的高度h(xi)即为该节点距离根节点的最短路径的大小。异常值分数计算方法如下:
Figure BDA0003909806350000071
式中,c(m)的表达式为:
Figure BDA0003909806350000072
式中,m为样本子集大小,H(i)=ln(i)+γ,γ为常数,γ=0.5772156649。
一般的,s的值越接近1则说明该点很可能是异常值,而s的值小于0.5则说明该点很可能是正常值。一般设置s的阈值为0.8可以得到效果较好的异常值检测结果。即,当s≥0.8时,认为该点为异常点;当s<0.8时,认为该点为正常点。
提取特征中的风速与有功特征,将风速划分为100个区段,对每个异常值,找到其风速对应的区段,将该风速区段内的平均出力作为该异常值的出力大小。
需要进一步进行说明的是,在具体实施过程中,如图2所示,孤立森林算法通过不断划分区域并根据划分的步数来判断节点是否为异常值,显然划分步数越少的点越容易被认定为异常点。由此,使用孤立森林算法对风机3进行异常检测,风速与风机出力散点图如图3所示。然后,将风速总区间划分为100 个均等的子区间,计算区间内正常值的平均出力,并以此出力对异常值进行矫正。
建立多种基于人工智能算法的预测模型,如时间卷积网络-门控循环单元网络(TCN-GRU),轻型梯度提升机(LightGBM)预测模型,对修复后的风机出力历史数据划分为训练集和验证集,并分别对训练集中数据进行训练并得到训练好的预测模型,同时将验证集放入预测模型进行预测,并对预测结果进行数据矫正;
具体包括:首先建立了TCN-GRU和LightGBM两个模型,然后使用该模型对历史数据进行学习,输入为有功输出以外的特征值,输出为有功大小。
TCN是一种根据时间序列建模的时间卷积网络,其结构可划分为输入层,隐含层和输出层。相比于全连接的神经网络,TCN只按照时间序列顺序进行连接,之后进入GRU网络进行进一步学习其时序特性,根据数据特征维度、数据大小和不同的输出步长设置超参数,即组成了多个TCN-GRU模型。同时,根据数据特征维度、数据大小和不同的输出步长设置LightGBM超参数,即可得到多个LightGBM模型。
然后,对历史数据进行划分,按照时间顺序,将历史数据中前百分之70 的数据作为训练集,后百分之30的数据作为验证集。
最后,利用混合步长预测方法对预测值进行修正。具体的,对TCN-GRU 模型和LightGBM模型分别使用步长从小到大依次进行预测,并依次使用短步长的预测来修正长步长的预测结果。进一步的,如需要对未来72小时的风机出力进行预测,将其步长视为72,则在预测时,先使用36步长(或更短步长) 的预测对前36步长的数据进行预测,然后再将前36步预测的输出结果加入历史数据集并作为部分输入,对剩下36步长的数据进行预测;同时,根据历史数据使用72步长进行预测,将预测结果与多次短步长的预测数据结构取均值进行修正,得到最终的预测结果。具体计算方法为:
P1=P36-1+P36-2 (3)
P2=P72-1 (4)
Pm=P1+P2 (5)
式中,Pm表示该模型下的最终预测结果,Pi表示某一步长的预测结果,Pa-b表示第b次步长为a的预测结果。因此,式(3)表示将72步长的前36步长以 P36-1表示,后36步长以P36-2表示;式(4)表示用总的72步长的预测方法来预测总的结果;式(5)表示最终的预测结果为对P1和P2取均值。
需要进一步进行说明的是,在具体实施过程中,TCN和GRU模型如图4 和图5所示。图4表示的是一个kernel size=3,dilations=[1,2,4]的含有两个隐含层的TCN网络。本文将采用kernel size=11,dilations=[11,11,1]的含有两个隐含层的 TCN网络,其中11维特征作为输入。图5表示的是GRU网络的示意图,其中 ht函数代表隐状态,yt代表GRU的输入,对应于TCN的输出,zt则代表最终的功率预测输出。
LightGBM模型示意图如图6所示。将11维特征值作为输入,并将有功值作为输出对该模型进行训练。TCN-GRU网络和LightGBM模型均需要使用混合步长预测方法对未来48小时的结果进行预测。
对数据矫正后的预测模型的预测值进行融合,得到最终的风机出力预测结果,具体计算过程为:
Pz=αPTCN-GRU+βPLightGBM (6)
式中,α和β分别表示融合系数,均为大于等于0且小于等于1的常数,且α+β=1;PTCN-GRU和PLightGBM分别表示基于TCN-GRU模型和LightGBM模型的风机短期出力预测结果;Pz为最终的风机短期出力预测结果。
需要进一步进行说明的是,在具体实施过程中,对预测结果进行数据融合,根据式(6),选取α和β值均为0.5,并计算结果的均方根误差进行对比,得到表1。
表1.不同网络模型的风机出力预测与测试集结果的均方根误差
Figure BDA0003909806350000091
基于同一种发明构思,本发明还提供一种计算机设备,该计算机设备包括包括:一个或多个处理器,以及存储器,用于存储一个或多个计算机程序;程序包括程序指令,处理器用于执行存储器存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其用于实现一条或一条以上指令,具体用于加载并执行计算机存储介质内一条或一条以上指令从而实现上述方法。
需要进一步进行说明的是,基于同一种发明构思,本发明还提供一种计算机存储介质,该存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法。该存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电、磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内容。

Claims (10)

1.一种基于集成学习的风机短期出力预测方法,其特征在于,方法包括以下步骤:
获取风机出力历史数据;
使用孤立森林算法对高维度的风机出力历史数据多次使用随机的超平面进行切割,直到超平面构成的各子区域均只剩一个数据点,根据切割次数生成树结构,将多于指定切割次数的节点看做异常值,完成异常检测;并根据风速与功率的近似线性的区间关系对异常值进行修复,得到修复后的风机出力数据;
建立时间卷积网络-门控循环单元网络TCN-GRU,轻型梯度提升机LightGBM预测模型,对修复后的风机出力数据划分为训练集和验证集,并分别对训练集中数据进行训练并得到训练好的预测模型,同时将验证集放入预测模型进行预测,并对预测结果进行数据矫正;
对数据矫正后的预测模型的预测值进行融合,得到最终的风机出力预测结果。
2.根据权利要求1所述的一种基于集成学习的风机短期出力预测方法,其特征在于,所述风机出力历史数据包括风机编号、日期、时间、风速、风向与风机角度差、环境温度、风机温度、风机角度、三片风机扇叶各自的倾角和输出的有功,这些数据共同构成风机出力历史数据的多维度特征。
3.根据权利要求1所述的一种基于集成学习的风机短期出力预测方法,其特征在于,所述使用孤立森林算法的过程包括以下步骤:
从修复后的风机出力历史数据划分得到的训练数据中随机选择m个点样本点作为样本子集,放入树的根节点,生成初始树模型,用于对异常值进行检测;
在多维度特征中随机指定一个维度,在当前训练数据对应的多维度节点数据中随机产生一个切割点p;
以切割点生成一个超平面,然后将当前节点数据空间划分为2个子空间,把指定维度里小于p的数据放在当前节点数据的左子节点,把大于等于p的数据放在当前节点数据的右子节点;
在生成的左、右子节点中递归以上步骤,不断构造新的孩子节点,直到子节点中只有一个数据或子节点已到达预设的限定高度,限定高度需要不断调整以改善异常检测结果;
循环以上步骤,直至生成t个孤立树iTree,其中t为超参数;
对每个数据点xi进行评估:遍历每一棵iTree,计算xi在森林中的平均高度E(h(xi)),并对平均高度做归一化处理,节点的高度h(xi)为节点距离根节点的最短路径的大小,异常值分数计算方法如下:
Figure FDA0003909806340000021
式中,c(m)的表达式为:
Figure FDA0003909806340000022
式中,m为样本子集大小,H(i)=ln(i)+γ,γ为常数,且γ=0.5772156649;
当s≥0.8时,认为数据点为异常点;当s<0.8时,认为数据点为正常点;
提取数据特征中的风速与有功特征,将风速划分为100个区段,对每个异常值,找到异常值风速对应的区段,将风速区段内的平均出力作为异常值的出力大小。
4.根据权利要求3所述的一种基于集成学习的风机短期出力预测方法,其特征在于,所述切割点产生于当前节点数据中指定维度的最大值和最小值之间。
5.根据权利要求3所述的一种基于集成学习的风机短期出力预测方法,其特征在于,超参数t根据样本量进行调整。
6.根据权利要求1所述的一种基于集成学习的风机短期出力预测方法,其特征在于,所述建立时间卷积网络-门控循环单元网络TCN-GRU,轻型梯度提升机LightGBM预测模型,对修复后的风机出力数据划分为训练集和验证集,并分别对训练集中数据进行训练并得到训练好的预测模型,同时将验证集放入预测模型进行预测,并对预测结果进行数据矫正的过程包括以下步骤:
TCN为根据时间序列建模的时间卷积网络,TCN只按照时间序列顺序进行连接,之后进入GRU网络进行进一步学习其时序特性,根据数据特征维度、数据大小和不同的输出步长设置超参数,从而建立TCN-GRU模型,同时,根据数据特征维度、数据大小和不同的输出步长设置LightGBM超参数,从而建立LightGBM模型;
对历史数据进行划分,按照时间顺序,将历史数据中前百分之70的历史数据作为训练集,后百分之30的历史数据作为验证集;
利用混合步长预测方法对预测值进行修正,对TCN-GRU模型和LightGBM模型分别使用步长从小到大依次进行预测,并依次使用短步长的预测来修正长步长的预测结果,需要对未来72小时的风机出力进行预测,将步长视为72,则在预测时,先使用36步长或更短步长的预测对前36步长的数据进行预测,然后再将前36步预测的输出结果加入历史数据并作为部分输入,对剩下36步长的数据进行预测;同时,根据历史数据使用72步长进行预测,将预测结果与多次短步长的预测数据结构取均值进行修正,得到最终的预测结果。
7.根据权利要求6所述的一种基于集成学习的风机短期出力预测方法,其特征在于,所述利用混合步长预测方法对预测值进行修正的计算方法为:
P1=P36-1+P36-2 (3)
P2=P72-1 (4)
Pm=P1+P2 (5)
式中,Pm表示修正模型下的最终预测结果,Pi表示某一步长的预测结果,Pa-b表示第b次步长为a的预测结果,式(3)表示将72步长的前36步长以P36-1表示,后36步长以P36-2表示;式(4)表示用总的72步长的预测方法来预测总的结果;式(5)表示最终的预测结果为对P1和P2取均值。
8.根据权利要求1所述的一种基于集成学习的风机短期出力预测方法,其特征在于,所述对数据矫正后的预测模型的预测值进行融合,得到最终的风机出力预测结果的计算过程为:
Pz=αPTCN-GRU+βPLightGBM (6)
式中,α和β分别表示融合系数,均为大于等于0且小于等于1的常数,且α+β=1;PTCN-GRU和PLightGBM分别表示基于TCN-GRU模型和LightGBM模型的风机短期出力预测结果;Pz为最终的风机短期出力预测结果。
9.一种设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的一种基于集成学习的风机短期出力预测方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8中任一所述的一种基于集成学习的风机短期出力预测方法。
CN202211319677.2A 2022-10-26 2022-10-26 一种基于集成学习的风机短期出力预测方法 Pending CN115618734A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211319677.2A CN115618734A (zh) 2022-10-26 2022-10-26 一种基于集成学习的风机短期出力预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211319677.2A CN115618734A (zh) 2022-10-26 2022-10-26 一种基于集成学习的风机短期出力预测方法

Publications (1)

Publication Number Publication Date
CN115618734A true CN115618734A (zh) 2023-01-17

Family

ID=84865258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211319677.2A Pending CN115618734A (zh) 2022-10-26 2022-10-26 一种基于集成学习的风机短期出力预测方法

Country Status (1)

Country Link
CN (1) CN115618734A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117233869A (zh) * 2023-11-15 2023-12-15 南京信息工程大学 一种基于GRU-BiTCN的站点短期风速预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117233869A (zh) * 2023-11-15 2023-12-15 南京信息工程大学 一种基于GRU-BiTCN的站点短期风速预测方法
CN117233869B (zh) * 2023-11-15 2024-02-23 南京信息工程大学 一种基于GRU-BiTCN的站点短期风速预测方法

Similar Documents

Publication Publication Date Title
Xiaoyun et al. Short-term prediction of wind power based on deep long short-term memory
CN108551167B (zh) 一种基于XGBoost算法的电力系统暂态稳定判别方法
CN106897821B (zh) 一种暂态评估特征选择方法及装置
CN113051769B (zh) 基于非对称损失与混合智能优化算法的功率曲线建模方法
CN112270439B (zh) 超短期风电功率预测方法、装置、电子设备及存储介质
CN115618734A (zh) 一种基于集成学习的风机短期出力预测方法
CN112241836B (zh) 一种基于增量学习的虚拟负荷主导参数辨识方法
CN114911788B (zh) 一种数据插补方法、装置及存储介质
CN111915079B (zh) 一种混合knn风电功率预测方法及系统
CN115470995A (zh) 电池容量预测模型训练方法、电池分容方法及装置
CN114139783A (zh) 基于非线性加权组合的风电短期功率预测方法及装置
CN116131313A (zh) 特征量与暂态功角稳定性关联关系的可解释性分析方法
CN113328467B (zh) 一种概率电压稳定性评估方法、系统、终端设备及介质
CN110489852A (zh) 提高风电系统数据质量的方法及装置
CN111612648B (zh) 光伏发电预测模型的训练方法、装置和计算机设备
CN111525577A (zh) 一种基于神经网络的远景220kV电网组网方法及其系统
CN116316699A (zh) 一种大电网频率安全态势预测方法、装置及存储介质
CN116432023A (zh) 基于样本迁移学习的新型电力系统故障分类方法
CN113627655B (zh) 一种配电网灾前故障场景模拟预测方法及装置
Wu et al. Convolutional deep leaning-based distribution system topology identification with renewables
CN118410420A (zh) 一种开关柜温升预警方法、装置、存储介质及计算机程序产品
Devie et al. Transient stability prediction in multimachine system using data mining techniques
US20240213922A1 (en) Method of estimating photovoltaic model parameters and data-based photovoltaic fault detection and diagnosis method and apparatus using photovoltaic model
CN118446087A (zh) 一种基于自动编码器的电磁暂态模型参数辨识方法及系统
Tiako et al. A class of intelligent algorithms for on-line dynamic security assessment of power systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination