发明内容
基于此,有必要针对上述技术问题,提供一种能够解决上述问题的人工智能与时序分解组合的新能源中期功率预测方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种人工智能与时序分解组合的新能源中期功率预测方法,所述方法包括:
基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据;
根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果;
将所述第一新能源功率预测结果与所述历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解所述目标输入数据,得到目标时序分量;
根据所述目标时序分量构建第二预测模型,基于所述第二预测模型得到第二新能源功率预测结果;
将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果。
在其中一个实施例中,所述基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据,包括:
获取所述新能源场站对应的历史数值天气预报数据,对解析后的历史数值天气预报数据进行数据补齐和数据清洗,得到处理后历史气象数据;
获取所述新能源场站对应的历史功率数据,对所述历史功率数据进行数据清洗,得到处理后历史功率数据;
对齐所述处理后历史气象数据和所述处理后历史功率数据,并根据对齐结果得到所述第一预处理数据和所述第二预处理数据。
在其中一个实施例中,所述第一预测模型包括多个预设的候选预测模型,所述根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,包括:
获取所述第一预处理数据对应的特征筛选结果,作为模型训练输入数据;
根据所述模型训练输入数据和目标预测模型参数,对各所述候选预测模型进行模型训练,得到多个训练完成的候选预测模型;
从多个所述训练完成的候选预测模型中确定出目标预测模型,作为所述预训练预测模型。
在其中一个实施例中,在所述将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果的步骤之前,所述方法还包括:
获取预测模型配置信息;所述预测模型配置信息包括所述预训练预测模型的保存位置信息;
采用所述预测模型配置信息加载得到所述预训练预测模型。
在其中一个实施例中,所述目标输入数据包括多个时段对应的时间序列数据,所述基于时间序列分解所述目标输入数据,得到目标时序分量,包括:
从所述目标输入数据中去除指定时段对应的时间序列数据,得到去除后时间序列数据;
根据预设周期性分量信息和所述去除后时间序列数据进行分解处理,得到所述目标时序分量。
在其中一个实施例中,所述目标时序分量包括周期性分量、趋势分量、残差分量,所述根据所述目标时序分量构建第二预测模型,包括:
基于所述周期性分量构建多层感知机模型,并基于所述趋势分量构建循环神经网络模型;
确定所述残差分量对应的输出结果随机信息;
结合所述多层感知机模型、所述循环神经网络模型,以及所述输出结果随机信息,得到所述第二预测模型。
在其中一个实施例中,所述将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果,包括:
将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到拼接组合数据;
对所述拼接组合数据进行预测结果修正处理,得到所述新能源中期功率预测结果。
第二方面,本申请还提供了一种人工智能与时序分解组合的新能源中期功率预测装置,所述装置包括:
预处理数据获取模块,用于基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据;
第一功率预测结果得到模块,用于根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果;
时间序列分解模块,用于将所述第一新能源功率预测结果与所述历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解所述目标输入数据,得到目标时序分量;
第二功率预测结果得到模块,用于根据所述目标时序分量构建第二预测模型,基于所述第二预测模型得到第二新能源功率预测结果;
中期功率预测结果确定模块,用于将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述的人工智能与时序分解组合的新能源中期功率预测方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的人工智能与时序分解组合的新能源中期功率预测方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上所述的人工智能与时序分解组合的新能源中期功率预测方法的步骤。
上述一种人工智能与时序分解组合的新能源中期功率预测方法、装置、计算机设备、存储介质和计算机程序产品,通过基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据,根据第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将第二预处理数据输入至预训练预测模型,得到第一新能源功率预测结果,然后将第一新能源功率预测结果与历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解目标输入数据,得到目标时序分量,根据目标时序分量构建第二预测模型,基于第二预测模型得到第二新能源功率预测结果,进而将第一新能源功率预测结果和第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果,实现了对新能源功率预测的优化,能够精准预测新能源中期功率,提升了预测精度。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据;对应的,本申请还提供有相应的用户授权入口,供用户选择授权或者选择拒绝。
在一个实施例中,如图1所示,提供了一种人工智能与时序分解组合的新能源中期功率预测方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤101,基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据;
作为一示例,可以根据设置的起报时间、预测时间、气象要素(如风速、风向、辐照度等)等关键字段,从数值天气预报数据库中获取新能源场站对应的历史数值天气预报数据。
其中,可以将较长一段时间对应的预处理后历史数值天气预报数据和历史功率数据,作为第一预处理数据,以用于模型训练;可以将预测起始时间近期对应的预处理后历史数值天气预报数据和历史功率数据,作为第二预处理数据,以用于中期预测处理。
在实际应用中,如图2a所示的中期功率预测方法总体技术架构图,其可以包括前期数据处理阶段、预测模型训练阶段、中期预测阶段,通过获取新能源场站对应的历史数值天气预报数据和历史功率数据,可以对该历史数值天气预报数据和历史功率数据进行预处理,进而可以将预处理后的长期历史数据作为第一预处理数据,以用于进一步模型训练,并可以获取预处理后的短期历史数据和实时数据,作为第二预处理数据,以用于后续中期预测处理。
具体地,如图2b所示,针对模型训练和中期预测处理,可以采用相同的数据预处理流程和方法,但处理的内容存在差别:用于模型训练需要过去较长一段时间的历史数值天气预报数据和历史功率数据,用于中期预测需要距离预测起始时间附近一次的数值天气预报数据(若数据缺失可以进行补齐),以及预测起始时间的前一个时刻的真实功率(如实时功率)。
步骤102,根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果;
在具体实现中,在预测模型训练阶段,可以获取第一预处理数据对应的特征筛选结果,作为模型训练输入数据,然后可以根据模型训练输入数据和目标预测模型参数,对多个预设的候选预测模型进行模型训练,得到多个训练完成的候选预测模型,进而可以从多个训练完成的候选预测模型中确定出目标预测模型,作为预训练预测模型,并可以将第二预处理数据输入至该预训练预测模型,得到第一新能源功率预测结果。
例如,在模型训练时,如图2b所示,可以在高质量的数值天气预报和新能源功率数据的基础上,依次进行特征工程、模型参数寻优、集成学习、模型优选等处理,进而可以将优选出的模型保存至本地,以供后续中期预测处理过程调用。
在一示例中,中期预测可以指预测第二天0时起,未来10天的新能源功率数据(即240小时,由于时间分辨率是15min,则总共预测长度l=960个数据点),由于数值天气预报技术无法满足10天长度的预测需求,可以将中期预测分为两个阶段,如图2b所示,第一段预测可以基于人工智能(AI)模型(即预训练预测模型),通过加载预先训练完成的人工智能模型进行预测处理,从而可以最大程度利用数值天气预报数据实现第一段功率预测(即第一新能源功率预测结果),如预测数据点长度为l1。
步骤103,将所述第一新能源功率预测结果与所述历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解所述目标输入数据,得到目标时序分量;
在得到第一新能源功率预测结果后,如图2b所示,在第二段预测过程中,可以利用时间序列分解法(TSD),将实际的历史功率数据与第一段预测结果(即第一新能源功率预测结果)进行拼接,作为第二段预测的输入(即目标输入数据),例如,可以利用时间序列分解法进行第二段预测,预测数据点长度可以为l2=l-l1。
在一个可选实施例中,可以应用鲁棒加权回归的STL(Seasonal and Trenddecomposition using Loess)分解法进行分解,可以得到3组时序分量:周期性(Seasonal)分量、趋势(Trend)分量以及噪声分量(或残差分量,Residual),作为目标时序分量。
步骤104,根据所述目标时序分量构建第二预测模型,基于所述第二预测模型得到第二新能源功率预测结果;
在实际应用中,目标时序分量可以包括周期性分量、趋势分量、残差分量,可以基于周期性分量、趋势分量、残差分量构建第二预测模型,进而可以基于第二预测模型得到第二新能源功率预测结果,以实现第二段功率预测,如预测数据点长度为l2=l-l1。
步骤105,将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果。
在具体实现中,可以将第一新能源功率预测结果和第二新能源功率预测结果进行拼接组合,得到拼接组合数据,进而可以对拼接组合数据进行预测结果修正处理,得到新能源中期功率预测结果。
在一个可选实施例中,由于数值天气预报可以每天多次播报、每次预测自播报时刻起未来7天的气象数据,本实施例的技术方案,可以根据不同新能源场站或电网调度机构的实际要求,自适应不同的中期功率预测起始时刻,从而能够充分利用数值天气预报数据,进一步提升预测精度。
相较于传统方法中预测时长依赖于数值天气预报的时长,由于数值天气预报的精度随着时长的增加会逐渐衰减,导致了超过7天的数值天气预报结果可信度较差,而新能源中期功率预测的时长需要达到10天,采用传统方法预测精度低,本实施例的技术方案,通过将人工智能(AI)与时间序列分解法(TSD)相结合,充分利用了数值天气预报的可信范围,并在此基础上进行了延伸,可以适用于风电、光伏等新能源中期功率预测;通过采用分段组合的预测模式,可以在第一段预测采用基于人工智能(AI)的方法,利用人工智能技术实现数值天气预报数据与新能源功率数据的精准映射,在第二段预测可以利用时间序列分解法,将预测时长延长至10天并保证了预测精度,能够满足电网运行的需求。
上述人工智能与时序分解组合的新能源中期功率预测方法中,通过基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据,根据第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将第二预处理数据输入至预训练预测模型,得到第一新能源功率预测结果,然后将第一新能源功率预测结果与历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解目标输入数据,得到目标时序分量,根据目标时序分量构建第二预测模型,基于第二预测模型得到第二新能源功率预测结果,进而将第一新能源功率预测结果和第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果,实现了对新能源功率预测的优化,能够精准预测新能源中期功率,提升了预测精度。
在一个实施例中,所述基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据,可以包括如下步骤:
获取所述新能源场站对应的历史数值天气预报数据,对解析后的历史数值天气预报数据进行数据补齐和数据清洗,得到处理后历史气象数据;获取所述新能源场站对应的历史功率数据,对所述历史功率数据进行数据清洗,得到处理后历史功率数据;对齐所述处理后历史气象数据和所述处理后历史功率数据,并根据对齐结果得到所述第一预处理数据和所述第二预处理数据。
在一示例中,如图2b所示,在前期数据处理阶段,可以采用如下方式进行:
1、数值天气预报解析:可以从数值天气预报系统读取原始的气象预测数据文件,利用自编码的程序对数值天气预报文件进行解析,并加载至数据库,数值天气预报数据库的主要字段可以包括:起报时间、预测时间、气象要素(如风速、风向、辐照度等)。
2、气象数据补齐与清洗:获取的数值天气预报数据可以为每天播报四次、每次预测未来7天的高精度数据,由于存在因通信等问题造成的零星数据缺失情况,可以采用历次播报的数据对缺失数据进行补齐,若经补齐操作后仍有数据缺失,则可以进行插值补齐,进而可以根据预先设定的气象数据阈值(如风速正常范围在0~30m/s)对错误数据进行清洗,可以针对每一个预测时间,保留距离预测时间最近的预测结果,并删除其余重复的预报结果。
3、新能源功率数据清洗:新能源历史功率数据也可能存在缺失的情况,针对缺失的数据,可以采用经典的蒙特卡洛马尔科夫链(MCMC)方法拟合新能源历史功率曲线,并采用Gibbs采样来补全缺失的数据。其主要步骤为:获取新能源历史功率的起始时间和结束时间,生成以15min为间隔的连续时间序列,然后将已有的新能源历史功率数据按时间进行排列,并将实际功率除以当时的开机容量(不同时刻的新能源场站开机容量可以不同,但不会超过场站的总装机容量),数据缺失处用null填充,对于null的数据采用MCMC+Gibbs采样进行补齐,进而可以根据预设的功率上下限阈值(0~1)对错误数据进行处理,如具体处理方式可以为功率值小于0的置为0,大于1的置为1。
4、气象-功率数据对齐:基于上述步骤获取的气象预报数据(即处理后历史气象数据)和新能源功率数据(即处理后历史功率数据)可以具有不同的起始时间和结束时间,可以设置气象预报数据的起止时间(指预测时间,不是起报时间)分别为tNWP_start、tNWP_end,新能源历史功率数据的起止时间分别为tpower_start、tpower_end,则对齐后的起止时间分别为max(tNWP_start, tpower_start)和min(tNWP_end, tpower_end),其中,max(·)、min(·)分别为取最大值和最小值的函数,即起止时间取气象预报数据和新能源功率预测数据的时间交集。
5、判断数据是否满足业务需求:针对模型训练阶段的数据预处理,可以对数据的长度进行判断,如可以设置长度阈值(如1年),由于较长时间的数据可以保证模型的准确性,若数据长度不满足需要,则可以返回数值天气预报数据读取环节,读取更多的数据;针对中期预测处理阶段的数据预处理,可以判断读取的数值天气预报的真实预测时间是否与中期预测的起始时间相同,还可以判断历史功率中是否包含中期预测起始时间上一个时间点的功率值(如实时功率值),若未包含则可以仅为中期预测输入数值天气预报数据。
本实施例中,通过获取新能源场站对应的历史数值天气预报数据,对解析后的历史数值天气预报数据进行数据补齐和数据清洗,得到处理后历史气象数据,然后获取新能源场站对应的历史功率数据,对历史功率数据进行数据清洗,得到处理后历史功率数据,进而对齐处理后历史气象数据和处理后历史功率数据,并根据对齐结果得到第一预处理数据和第二预处理数据,为后续模型训练阶段和中期预测阶段提供了数据支持,有助于提升预测精度。
在一个实施例中,第一预测模型可以包括多个预设的候选预测模型,所述根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,可以包括如下步骤:
获取所述第一预处理数据对应的特征筛选结果,作为模型训练输入数据;根据所述模型训练输入数据和目标预测模型参数,对各所述候选预测模型进行模型训练,得到多个训练完成的候选预测模型;从多个所述训练完成的候选预测模型中确定出目标预测模型,作为所述预训练预测模型。
在实际应用中,如图2b所示,在模型训练阶段,可以采用如下方式进行:
1、特征工程:为了更好地反映气象参数对新能源功率的影响,可以从多个气象参数(如风速、风向等)中筛选出特定的特征集(即特征筛选结果),作为模型训练的输入,如可以采用相关系数法来描述多个变量之间的相关程度,以进行特征筛选,通过按照下式1计算每一个气象因素与新能源功率的相关系数,可以将相关系数绝对值按照从大到小的顺序排列,并可以根据设定的阈值选取出大于阈值的特征量,得到初步的特征选择结果。
(式1)
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。
针对初步的特征选择结果,可以计算初步特征结果中每一个气象因素的方差,并可以根据预先设定的方差阈值,筛选出方差大于阈值的特征,作为最终的特征选择结果。
2、模型参数优选:可以取小规模数据集(如10%的数据量)对模型库中每一个预测模型的指定参数进行网格寻优,例如,可以设置一个参数的变化范围和变化步长,依次计算不同组合下模型的预测精度,进而可以选择此规模下精度最高的预测模型参数(即目标预测模型参数),进入下一轮的集成学习环节。
3、集成学习:在上一步模型参数优选的基础上,已经将优选的参数(即目标预测模型参数)固定,然后可以用全量的数值天气预报数据和新能源功率数据,对每一个模型(即各候选预测模型)开展训练。在具体实施时,可以按照一定的比例(如3:1)将全量数据拆分为训练集和测试集,其中,训练集可以用于模型训练时的参数调优,测试集数据可以用于后续对模型进行优选。
4、模型优选:在采用训练集数据对模型进行训练后,可以利用训练完成的模型分别以测试集的数据为输入进行预测(如测试过程中的预测),并可以保存每一次预测结果,以与测试集中对应时刻的真实功率进行比较。可以按照下式2计算均方根误差:
(式2)
其中,n为测试结果的个数,PPi为第i次的实际功率,PMi为第i次的预测功率,Ci为i时刻的开机容量。
可以根据误差大小对模型进行标记,后续实际中期预测中可以选择误差最小的模型(即目标预测模型)进行预测处理。
在一示例中,针对新能源功率中期预测模型训练过程,通过构建从数据解析→数据清洗→特征工程→模型参数寻优→集成学习→模型优选→结果后处理的完整链条,可以实现对不同场站自适应进行最优预测模型选择,提升了预测精度。
本实施例中,通过获取第一预处理数据对应的特征筛选结果,作为模型训练输入数据,然后根据模型训练输入数据和目标预测模型参数,对各候选预测模型进行模型训练,得到多个训练完成的候选预测模型,进而从多个训练完成的候选预测模型中确定出目标预测模型,作为预训练预测模型,能够有助于对不同场站自适应进行最优预测模型选择,提升了预测精度。
在一个实施例中,在所述将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果的步骤之前,还可以包括如下步骤:
获取预测模型配置信息;所述预测模型配置信息包括所述预训练预测模型的保存位置信息;采用所述预测模型配置信息加载得到所述预训练预测模型。
在具体实现中,如图2b所示,在中期预测阶段,可以通过读取新能源功率预测配置(即预测模型配置信息),如读取存于数据库的新能源功率预测配置信息,其可以包含场站名称、所选特征量、预测模型保存位置等信息,其中,所选特征量可以用于后续读取数值天气预报数据,预测模型保存位置(即预训练预测模型的保存位置信息)可以用于加载预先训练完成的模型。
在一示例中,可以针对加载的预测模型进行判断,如通过读取新能源功率预测配置可以加载预先训练完成的人工智能预测模型,若加载成功,则可以按照配置信息中的所选特征量,从数据库中加载数值天气预报数据,若模型加载失败(如无模型或模型有误情况),则可以自动进入第二段预测,无需加载数值天气预报数据。
例如,加载的数值天气预报数据可以仅包含配置信息中所选特征量,可以不包含其它特征量或字段,可以根据预测起始时间(如执行中期预测任务的时间),自动选择最近一次播报的数值天气预报数据,并可以截取次日0时之后的气象预测数据。
又如,若存在模型加载失败的情况,可以自动进入第二段预测,不会影响本次中期预测任务进行,可以自动提示模型训练模块重新针对该场站进行模型训练任务。
在一个可选实施例中,第一段预测可以仅在成功加载训练完成的人工智能模型的前提下进行,在第一段预测时可以根据读取的数值天气预报数据,预测对应时刻的新能源功率(即第一新能源功率预测结果)。
本实施例中,通过获取预测模型配置信息,该预测模型配置信息包括预训练预测模型的保存位置信息,进而采用预测模型配置信息加载得到预训练预测模型,能够便于在第一段预测利用人工智能技术实现数值天气预报数据与新能源功率数据的精准映射。
在一个实施例中,目标输入数据可以包括多个时段对应的时间序列数据,所述基于时间序列分解所述目标输入数据,得到目标时序分量,可以包括如下步骤:
从所述目标输入数据中去除指定时段对应的时间序列数据,得到去除后时间序列数据;根据预设周期性分量信息和所述去除后时间序列数据进行分解处理,得到所述目标时序分量。
在实际应用中,可以基于时间序列分解法进行第二段预测,其输入可以为历史功率数据集和第一段预测结果的拼接(即第一新能源功率预测结果与历史功率数据的拼接结果),针对任一段时间序列数据均可以用时间序列分解法进行拆分,其可以包括如下步骤:
步骤1,可以从总时段(m个)中去除电网调度机构下达调度指令的时段(n个),以及风电场检修或扩容的时段(k个),进而可以得到下一步实际要使用的l=m-n-k个时段。
步骤2,可以取出上一步得到的l个时段对应的风电场历史功率数据集,每个时段的功率可以由该时段功率的均值表示,则可以总共有l个功率数据,即从目标输入数据中去除指定时段对应的时间序列数据,得到去除后时间序列数据。对以上数据可以应用鲁棒加权回归的STL分解法进行分解,得到3组时序分量(即目标时序分量):周期性分量、趋势分量,以及噪声分量(或残差分量),其原始功率与各分量的关系可以如下式3所示:
(式3)
其中,Y(t)表示原始的历史功率数据集;S(t)表示分解得到的周期性分量数据集;T(t)表示趋势分量数据集;R(t)表示噪声分量数据集。
在一示例中,如图3a所示,鲁棒加权回归的STL分解法可以包括以下具体步骤:
步骤1:将周期性分量的初值赋0,即;
步骤2:用原始序列减去周期性分量(即预设周期性分量信息),得到去趋势分量 ;
步骤3:将子序列进行平滑处理,如可以在选定平滑参数后,对每个分量进行局部多项式回归拟合(LOESS),前后各延展1个时间点,可以组合得到长度为N+2×np的时间序列;
步骤4:对上一步生成的时间序列进行低通滤波,分别开展3次长度为np、np、3滑动平均,进行1次LOESS过程,可以得到长度为N的时间序列,以去除周期性差异;
步骤5:对步骤3得到的序列进行趋势去除、周期项去除,并可以进行LOESS过程得到趋势项;
步骤6:可以判断趋势项是否收敛,如本次得到的趋势项与上一次相比的误差是否在事先设定的阈值范围内,若收敛,则可以输出对应的三个子序列,若未收敛,则返回第二步继续迭代,直至收敛为止。
在又一示例中,以某风电场历史功率数据为例(其共采用30天的数据,时间分辨率为15min,即30天有30*96个数据点,假设周期是1天)进行分解,其原始数据和各分量的曲线如图3b所示。
本实施例中,通过从目标输入数据中去除指定时段对应的时间序列数据,得到去除后时间序列数据,进而根据预设周期性分量信息和去除后时间序列数据进行分解处理,得到目标时序分量,能够利用时间序列分解法进行数据处理,为第二段预测进一步处理提供了数据支持。
在一个实施例中,目标时序分量可以包括周期性分量、趋势分量、残差分量,所述根据所述目标时序分量构建第二预测模型,可以包括如下步骤:
基于所述周期性分量构建多层感知机模型,并基于所述趋势分量构建循环神经网络模型;确定所述残差分量对应的输出结果随机信息;结合所述多层感知机模型、所述循环神经网络模型,以及所述输出结果随机信息,得到所述第二预测模型。
在一示例中,在第二段预测模型构建过程中,可以针对周期性分量构建具有单隐藏层的多层感知机(MLP)模型,如图3c所示,该模型可以包括1个输入层、1个隐藏层、1个输出层,其中,输入层、隐藏层、输出层可以两两形成全连接关系。输入层的输入变量可以为从NWP多个预报特征中筛选出的特征变量;隐藏层可以包含256个隐藏单元,并对应用非线性激活函数“relu”;输出层可以包含周期性分量数据集中的功率数据。
在又一示例中,可以针对趋势分量数据集构建循环神经网络(RNN)模型,如图3d所示,RNN的原理是将输入层与前一时间步的输出相联结,作为一个新的输入进入隐藏层;针对噪声分量,可以不进行训练,仅在结果输出时叠加一个符合原噪声分量分布的随机数,例如,原噪声分量服从均值为μ、标准差为σ的正态分布,可以在输出结果时从同样的正态分布中生成一个随机数,叠加到输出结果中。
在一个可选实施例中,通过采用时间序列分解法将风电功率时间序列集分解为多个可以独立训练的时序分量,并在不同时序分量上应用不同类型神经网络进行训练,每一种时序分量的具体训练模型可以替代,如还可以采用如下方式:
(1)周期分量(BPNN)+趋势分量(MLP)+噪声分量
(2)周期分量(决策树)+趋势分量(BPNN)+噪声分量
具体采用的人工智能(AI)模型在本实施例中不作具体限制。
本实施例中,通过基于周期性分量构建多层感知机模型,并基于趋势分量构建循环神经网络模型,然后确定残差分量对应的输出结果随机信息,进而结合多层感知机模型、循环神经网络模型,以及输出结果随机信息,得到第二预测模型,为第二段预测提供了数据支持。
在一个实施例中,所述将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果,可以包括如下步骤:
将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到拼接组合数据;对所述拼接组合数据进行预测结果修正处理,得到所述新能源中期功率预测结果。
在实际应用中,可以基于预测分量集合,如得到的周期性分量、趋势分量和噪声分量求和,得到第二段预测结果(即第二新能源功率预测结果),然后可以将第一段预测结果与第二段预测结果进行拼接组合,形成完整的960个预测数据点(即拼接组合数据),并可以对预测结果进行后处理,例如,可以根据预先设定的阈值对每个时刻的预测结果进行修正,可以针对每个时段设置不同的阈值,经过后处理的预测结果(即新能源中期功率预测结果)可以保存至数据库中。
在一个可选实施例中,根据某实际新能源场站的数据进行验证,以南方区域MT风电场的数据为例,按照本实施例技术方案进行模型训练和中期预测,测试环节中的部分预测结果如图4a、图4b所示。
本实施例中,通过将第一新能源功率预测结果和第二新能源功率预测结果进行拼接组合,得到拼接组合数据,进而可以对拼接组合数据进行预测结果修正处理,得到新能源中期功率预测结果,能够进一步提升预测精度。
在一个实施例中,如图5所示,提供了另一种人工智能与时序分解组合的新能源中期功率预测方法的流程示意图。本实施例中,该方法包括以下步骤:
在步骤501中,基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据。在步骤502中,根据第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型。在步骤503中,获取预测模型配置信息,采用预测模型配置信息加载得到预训练预测模型;预测模型配置信息包括预训练预测模型的保存位置信息。在步骤504中,将第二预处理数据输入至预训练预测模型,得到第一新能源功率预测结果。在步骤505中,将第一新能源功率预测结果与历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解目标输入数据,得到目标时序分量。在步骤506中,基于周期性分量构建多层感知机模型,并基于趋势分量构建循环神经网络模型,确定残差分量对应的输出结果随机信息。在步骤507中,结合多层感知机模型、循环神经网络模型,以及输出结果随机信息,得到第二预测模型,基于第二预测模型得到第二新能源功率预测结果。在步骤508中,将第一新能源功率预测结果和第二新能源功率预测结果进行拼接组合,得到拼接组合数据,对拼接组合数据进行预测结果修正处理,得到新能源中期功率预测结果。需要说明的是,上述步骤的具体限定可以参见上文对一种人工智能与时序分解组合的新能源中期功率预测方法的具体限定,在此不再赘述。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的人工智能与时序分解组合的新能源中期功率预测方法的人工智能与时序分解组合的新能源中期功率预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个人工智能与时序分解组合的新能源中期功率预测装置实施例中的具体限定可以参见上文中对于人工智能与时序分解组合的新能源中期功率预测方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种人工智能与时序分解组合的新能源中期功率预测装置,包括:
预处理数据获取模块601,用于基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据;
第一功率预测结果得到模块602,用于根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果;
时间序列分解模块603,用于将所述第一新能源功率预测结果与所述历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解所述目标输入数据,得到目标时序分量;
第二功率预测结果得到模块604,用于根据所述目标时序分量构建第二预测模型,基于所述第二预测模型得到第二新能源功率预测结果;
中期功率预测结果确定模块605,用于将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果。
在一个实施例中,所述预处理数据获取模块601包括:
第一预处理子模块,用于获取所述新能源场站对应的历史数值天气预报数据,对解析后的历史数值天气预报数据进行数据补齐和数据清洗,得到处理后历史气象数据;
第二预处理子模块,用于获取所述新能源场站对应的历史功率数据,对所述历史功率数据进行数据清洗,得到处理后历史功率数据;
预处理数据得到子模块,用于对齐所述处理后历史气象数据和所述处理后历史功率数据,并根据对齐结果得到所述第一预处理数据和所述第二预处理数据。
在一个实施例中,所述第一预测模型包括多个预设的候选预测模型,所述第一功率预测结果得到模块602包括:
特征筛选子模块,用于获取所述第一预处理数据对应的特征筛选结果,作为模型训练输入数据;
模型训练子模块,用于根据所述模型训练输入数据和目标预测模型参数,对各所述候选预测模型进行模型训练,得到多个训练完成的候选预测模型;
目标预测模型确定子模块,用于从多个所述训练完成的候选预测模型中确定出目标预测模型,作为所述预训练预测模型。
在一个实施例中,所述装置还包括:
配置信息获取模块,用于获取预测模型配置信息;所述预测模型配置信息包括所述预训练预测模型的保存位置信息;
模型加载模块,用于采用所述预测模型配置信息加载得到所述预训练预测模型。
在一个实施例中,所述目标输入数据包括多个时段对应的时间序列数据,所述时间序列分解模块603包括:
去除子模块,用于从所述目标输入数据中去除指定时段对应的时间序列数据,得到去除后时间序列数据;
目标时序分量得到子模块,用于根据预设周期性分量信息和所述去除后时间序列数据进行分解处理,得到所述目标时序分量。
在一个实施例中,所述目标时序分量包括周期性分量、趋势分量、残差分量,所述第二功率预测结果得到模块604包括:
模型构建子模块,用于基于所述周期性分量构建多层感知机模型,并基于所述趋势分量构建循环神经网络模型;
随机信息确定子模块,用于确定所述残差分量对应的输出结果随机信息;
第二预测模型得到子模块,用于结合所述多层感知机模型、所述循环神经网络模型,以及所述输出结果随机信息,得到所述第二预测模型。
在一个实施例中,所述中期功率预测结果确定模块605包括:
拼接组合子模块,用于将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到拼接组合数据;
修正子模块,用于对所述拼接组合数据进行预测结果修正处理,得到所述新能源中期功率预测结果。
上述人工智能与时序分解组合的新能源中期功率预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种人工智能与时序分解组合的新能源中期功率预测方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据;
根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果;
将所述第一新能源功率预测结果与所述历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解所述目标输入数据,得到目标时序分量;
根据所述目标时序分量构建第二预测模型,基于所述第二预测模型得到第二新能源功率预测结果;
将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果。
在一个实施例中,处理器执行计算机程序时还实现上述其他实施例中的人工智能与时序分解组合的新能源中期功率预测方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据;
根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果;
将所述第一新能源功率预测结果与所述历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解所述目标输入数据,得到目标时序分量;
根据所述目标时序分量构建第二预测模型,基于所述第二预测模型得到第二新能源功率预测结果;
将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的人工智能与时序分解组合的新能源中期功率预测方法的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
基于新能源场站对应的历史数值天气预报数据和历史功率数据,获取第一预处理数据和第二预处理数据;
根据所述第一预处理数据对第一预测模型进行模型训练,得到预训练预测模型,将所述第二预处理数据输入至所述预训练预测模型,得到第一新能源功率预测结果;
将所述第一新能源功率预测结果与所述历史功率数据的拼接结果,作为目标输入数据,并基于时间序列分解所述目标输入数据,得到目标时序分量;
根据所述目标时序分量构建第二预测模型,基于所述第二预测模型得到第二新能源功率预测结果;
将所述第一新能源功率预测结果和所述第二新能源功率预测结果进行拼接组合,得到新能源中期功率预测结果。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的人工智能与时序分解组合的新能源中期功率预测方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(DynamicRandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。