CN114118611A

CN114118611A - 基于预测算法池的风电功率预测方法和系统

Info

Publication number: CN114118611A
Application number: CN202111473226.XA
Authority: CN
Inventors: 王晓龙; 张晏玮; 幸健; 李进; 安国成
Original assignee: Eccom Network System Co ltd
Current assignee: Eccom Network System Co ltd
Priority date: 2021-12-02
Filing date: 2021-12-02
Publication date: 2022-03-01

Abstract

本发明提供了一种基于预测算法池的风电功率预测方法和系统，包括：步骤1：获取风电数据并进行预处理；步骤2：对预处理后的数据进行维度扩充、降维处理和特征标准化；步骤3：基于特征处理后的数据，采用多种不同的算法模型对风电功率进行预测，并剔除所有预测结果中预测偏差超出预设阈值的预测数据；步骤4：采用数据回归算法或深度学习算法，对风电功率预测结果进行优化，得到风电功率最终预测结果。本发明采用多种算法组成算法池，对风电场功率进行预测，将不同算法的预测结果作为输入，对其进行相应算法网络训练，实现功率的第二次预测，保证了输入数据的完整性、正确性。

Description

基于预测算法池的风电功率预测方法和系统

技术领域

本发明涉及风电场风力发电功率预测技术领域，具体地，涉及一种基于预测算法池的风电功率预测方法和系统。

背景技术

随着地球能源与环境问题的日益突出，尤其是不可再生资源的过度消耗，人们逐渐开始重视可再生资源的开发与利用。风能作为一种可再生资源，具备取之不竭，用之不尽的优势，而且没有污染物的排放，是一种清洁能源。

风力发电受风速、大气湿度、风向、地形等多种因素影响，而且风电场具备不均匀性、风电机组受到非线性的动力，因此风电输出功率并不稳定，给电网调度带来很大风险，因此需要对风力发电功率进行预测，以减少电力调度风险。

针对风电场风电功率预测，通常具备以下两个难点：第一，风电变化本身是非线性、非平稳的；这是因为风电场由多台风力发电机构成，不同风力发电机所处地理位置不同，每时每刻所受到的局部风力、风向不同，因此每台风机发电功率存在较大差异，从而影响整个风电场发电功率；第二，对风电功率预测，通常所选择的输入变量较为复杂，甚至说不能准确反映风电场整体情况，如风电场风速测量情况，往往是风电场某一位置风速，由于风本省具备很强的随机性，所以导致所测风速并不能反映整个风电场不同风机所受风力的大小。

风电场通常包含若干台风力发电机，但是由于地形限制和尾流效应，风电机组往往呈现高低错落，依地势风口而延展的排列。由于风向具有很强的随机性，原本依据主风向排列的风机并不能时刻达到与风力相匹配的发电功率。因此，风力场的发电预测不能只考虑单台风机的发电特性，更要考虑各个风机输出风电的关系以及整个风电场的风电特性。

风电功率预测一般来说包括四大类方法，具体为：基于物理模型的算法、基于统计的算法、基于风电空间相关性的算法以及深度学习算法。

基于物理模型的算法通常需要多种传感器，如风速风向传感器、转速传感器，以便对依据物理动力学对风机进行建模，虽然预测结果较为准确，但是预测成本高，不具备大范围推广性。

基于统计的算法，目前比较流行的算法包括自回归积分平均模型、指数平滑等模型，这些模型通常计算速度快，所需计算硬件少，但是由于是一种线性预测，因此对于非线性问题往往结果不好。

基于风电空间相关性的算法主要是利用风电场或者风电机周围地形地貌、历史天气来进行风电功率预测。

基于深度学习的风电功率预测算法目前研究较多，如卷积神经网络、长短期记忆网络等；基于深度学习的算法往往需要大量的数据进行算法训练，预测推理相对简单，容易大范围推广实施。

综上所述，基于不同原理的风电功率预测有些适合短时预测，有些适合中长期预测，然而由于风能具有随机性、间歇性，受天气影响较大，因此很难靠单一算法进行风电功率的准确预测。

专利文献CN113178880A(申请号：CN202110320427.X)公开了一种基于风电功率概率预测的混合储能优化定容与调控方法。该方法根据风电概率预测结果生成具有时间相关性的风电典型场景；然后提出一种自适应变分模态分解算法，从风电场景中提取满足风电并网要求的风电功率低频分量和符合电池储能和超级电容储能工作特性的风电功率中、高频分量；最后，建立包含风储混合系统有功功率平衡约束、储能功率约束、储能容量约束、电池储能循环寿命约束和超级电容荷电状态机会约束的混合储能优化定容与调控模型，求解出混合储能优化定容与调控结果。

目前关于风电预测方案主要是单一算法(如随机森林算法、短时预测算法、卷积神经网络等)，然而由于风电预测所受外界影响因素较多，所以单一算法往往只适用某些场景，普适性较差。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于预测算法池的风电功率预测方法和系统。

根据本发明提供的基于预测算法池的风电功率预测方法，包括：

步骤1：获取风电数据并进行预处理；

步骤2：对预处理后的数据进行维度扩充、降维处理和特征标准化；

步骤3：基于特征处理后的数据，采用多种不同的算法模型对风电功率进行预测，并剔除所有预测结果中预测偏差超出预设阈值的预测数据；

步骤4：采用数据回归算法或深度学习算法，对风电功率预测结果进行优化，得到风电功率最终预测结果。

优选的，所述步骤1包括：

数据清洗：将数据中的离群值、不符合预设条件的数值进行剔除，并按预设频率对数据进行采样；

数据补齐：采用临近值线性插值或者均值对数据空值进行补齐；

对于预设小范围连续时间段的数据缺失，采用三次样条时序插值；

对于预设大范围连续时间段数据缺失，将当日数据剔除，再进行时序插值操作。

优选的，所述步骤2包括：

根据时间戳数据、时序值和时序值的属性变量进行维度扩充；

采用主成分分析和线性判别分析，从多维数据中剔除与预测结果相关性不符合预设条件的数据；

采用标准差进行特征标准化。

优选的，所述步骤3包括：采用的风电功率预测算法模型包括XGBoost、随机森林、梯度下降树和长短期记忆模型，对每个算法模型采用k-折交叉验证算法，以选择每个算法的最优参数设置，包括：

步骤3.1：对同一种算法模型设置m组不同的参数组；

步骤3.2：将训练数据均分为5份，以其中4份为训练集，1份为验证集，进行k＝5折交叉验证；

步骤3.3：算法的m组参数分别使用训练集和验证集进行训练和验证，并且计算这m组参数的模型损失；

步骤3.4：循环5次，得到一个5×m的损失矩阵；

步骤3.5：求取m组模型参数的损失平均值，从中找出损失最小的一组参数，作为该算法模型的最优参数。

优选的，所述步骤4包括：采用支持向量机回归算法SVR或者长短期记忆人工神经网络算法LSTM进行二阶预测；

对不同的算法和算法组合，训练不同的回归模型训练。

根据本发明提供的基于预测算法池的风电功率预测系统，包括：

模块M1：获取风电数据并进行预处理；

模块M2：对预处理后的数据进行维度扩充、降维处理和特征标准化；

模块M3：基于特征处理后的数据，采用多种不同的算法模型对风电功率进行预测，并剔除所有预测结果中预测偏差超出预设阈值的预测数据；

模块M4：采用数据回归算法或深度学习算法，对风电功率预测结果进行优化，得到风电功率最终预测结果。

优选的，所述模块M1包括：

优选的，所述模块M2包括：

采用标准差进行特征标准化。

优选的，所述模块M3包括：采用的风电功率预测算法模型包括XGBoost、随机森林、梯度下降树和长短期记忆模型，对每个算法模型采用k-折交叉验证算法，以选择每个算法的最优参数设置，包括：

模块M3.1：对同一种算法模型设置m组不同的参数组；

模块M3.2：将训练数据均分为5份，以其中4份为训练集，1份为验证集，进行k＝5折交叉验证；

模块M3.3：算法的m组参数分别使用训练集和验证集进行训练和验证，并且计算这m组参数的模型损失；

模块M3.4：循环5次，得到一个5×m的损失矩阵；

模块M3.5：求取m组模型参数的损失平均值，从中找出损失最小的一组参数，作为该算法模型的最优参数。

优选的，所述模块M4包括：采用支持向量机回归算法SVR或者长短期记忆人工神经网络算法LSTM进行二阶预测；

对不同的算法和算法组合，训练不同的回归模型训练。

与现有技术相比，本发明具有如下的有益效果：

本发明采用了多种算法对输入数据进行了预处理，利用特征工程的多种机制，对整理后的数据进行处理，找出对预测结果影响较为明显的特征，采用多种算法组成算法池，对风电场功率进行预测，将不同算法的预测结果作为输入，对其进行相应算法网络训练，实现功率的第二次预测，保证了输入数据的完整性、正确性。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明算法流程图；

图2为三次样条时序插值示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

实施例：

本发明提供了一种基于预测算法池的风电功率预测方法，如图1，方案流程为：

(1)数据预处理

风电场实际所提供的数据(辐照度、风速、湿度、气压等)往往存在数据丢失、数据重复甚至是数据错误，因此需要对相关数据进行预处理，具体包括：

第一、某个数据在某点为空值的情况，处理办法为采用临近值线性插值，或者采用均值。

第二：小范围连续时间段的数据缺失，可采用三次样条时序插值，因为三次样条在局部会产生一定的“上延”和“下探”，相对于线性滑动方法而言，三次样条会增加数据的波动性，如图2。

第三、大范围连续时间段数据缺失，做时序插值操作将会引起数据失真，会影响最终功率预测，因此可以进行将当日数据剔除，以防引入错误数据。

(2)特征工程

第一，维度扩充，可以采用时间戳数据、时序值、时序值的属性变量等；

时间戳数据的衍生维度数据，即将时间戳数据做拆解为年、季度、月、日(一年中的第几日)、时、时段(昼夜)；

时序值的衍生维度，可采用STL时序分解和基于频域的分解方法，旨在获取该时序值的周期特征、趋势特征以及残差特征；

时序值的属性变量衍生维度，可引入日落日出时间等气象数据。

第二，降维处理，可采用主成分分析(PCA)和线性判别分析(LDA)，从多维数据中剔除与预测结果相关性较小的数据；

第三，特征标准化，数据标准化可采用标准差标准化方法，具体如下所示：

即每维数据的每一个特征值减去此维度特征的均值，除以此维度特征数据的标准差。

(3)预测算法池

本算法池可采用多种不同的算法对风电功率进行预测，选择的预测算法越多，预测结果越稳定，本专利以选择XGBoost、随机森林、梯度下降树、长短期记忆模型作为预测算法池。

由于算法XGBoost、随机森林、梯度下降树所求结果受其参数设置影响较大，因此此处对每个模型采用k-折交叉验证算法，以便选择每个算法的最优参数设置；具体为：

步骤一，对同一种算法模型设置不同的参数组(m)；

步骤二，进行k＝5折交叉验证，即将训练数据均分为5份，以其中4份为训练集，1份为验证集；

步骤三，算法的m组参数分别使用训练集和验证集进行训练和验证，并且计算这m组参数的模型损失；

步骤四，循环5次，得到一个5×m的损失矩阵；

步骤五，求取m组模型参数的损失平均值，从中找出损失最小的一组参数，作为该算法模型的最优参数。

(4)第一次预测结果处理

算法池包含了多种算法对风电功率进行预测，由于不同算法预测的准确性受外部因素影响较大，因此需要剔除所有预测结果中预测偏差较大的预测数据，可采用原则为剔除与所有预测结果均值较大的预测结果；

(5)预测结果寻优

二阶预测可以采用数据回归算法，或深度学习算法，如采用SVR或者LSTM算法，但是要注意：由于(4)中每次被剔除的算法不同，需要训练不同的回归模型，如预测算法池中包含4种算法，剔除其中1种算法预测结果，最终可能有4种不同算法组合，因此需要针对这四种不同的算法组合，进行回归训练。

根据本发明提供的基于预测算法池的风电功率预测系统，包括：模块M1：获取风电数据并进行预处理；模块M2：对预处理后的数据进行维度扩充、降维处理和特征标准化；模块M3：基于特征处理后的数据，采用多种不同的算法模型对风电功率进行预测，并剔除所有预测结果中预测偏差超出预设阈值的预测数据；模块M4：采用数据回归算法或深度学习算法，对风电功率预测结果进行优化，得到风电功率最终预测结果。

所述模块M1包括：数据清洗：将数据中的离群值、不符合预设条件的数值进行剔除，并按预设频率对数据进行采样；数据补齐：采用临近值线性插值或者均值对数据空值进行补齐；对于预设小范围连续时间段的数据缺失，采用三次样条时序插值；对于预设大范围连续时间段数据缺失，将当日数据剔除，再进行时序插值操作。所述模块M2包括：根据时间戳数据、时序值和时序值的属性变量进行维度扩充；采用主成分分析和线性判别分析，从多维数据中剔除与预测结果相关性不符合预设条件的数据；采用标准差进行特征标准化。所述模块M3包括：采用的风电功率预测算法模型包括XGBoost、随机森林、梯度下降树和长短期记忆模型，对每个算法模型采用k-折交叉验证算法，以选择每个算法的最优参数设置，包括：模块M3.1：对同一种算法模型设置m组不同的参数组；模块M3.2：将训练数据均分为5份，以其中4份为训练集，1份为验证集，进行k＝5折交叉验证；模块M3.3：算法的m组参数分别使用训练集和验证集进行训练和验证，并且计算这m组参数的模型损失；模块M3.4：循环5次，得到一个5×m的损失矩阵；模块M3.5：求取m组模型参数的损失平均值，从中找出损失最小的一组参数，作为该算法模型的最优参数。所述模块M4包括：采用支持向量机回归算法SVR或者长短期记忆人工神经网络算法LSTM进行二阶预测；对不同的算法和算法组合，训练不同的回归模型训练。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种基于预测算法池的风电功率预测方法，其特征在于，包括：

步骤1：获取风电数据并进行预处理；

2.根据权利要求1所述的基于预测算法池的风电功率预测方法，其特征在于，所述步骤1包括：

3.根据权利要求1所述的基于预测算法池的风电功率预测方法，其特征在于，所述步骤2包括：

采用标准差进行特征标准化。

4.根据权利要求1所述的基于预测算法池的风电功率预测方法，其特征在于，所述步骤3包括：采用的风电功率预测算法模型包括XGBoost、随机森林、梯度下降树和长短期记忆模型，对每个算法模型采用k-折交叉验证算法，以选择每个算法的最优参数设置，包括：

步骤3.1：对同一种算法模型设置m组不同的参数组；

步骤3.4：循环5次，得到一个5×m的损失矩阵；

5.根据权利要求1所述的基于预测算法池的风电功率预测方法，其特征在于，所述步骤4包括：采用支持向量机回归算法SVR或者长短期记忆人工神经网络算法LSTM进行二阶预测；

对不同的算法和算法组合，训练不同的回归模型训练。

6.一种基于预测算法池的风电功率预测系统，其特征在于，包括：

模块M1：获取风电数据并进行预处理；

7.根据权利要求6所述的基于预测算法池的风电功率预测系统，其特征在于，所述模块M1包括：

8.根据权利要求6所述的基于预测算法池的风电功率预测系统，其特征在于，所述模块M2包括：

采用标准差进行特征标准化。

9.根据权利要求6所述的基于预测算法池的风电功率预测系统，其特征在于，所述模块M3包括：采用的风电功率预测算法模型包括XGBoost、随机森林、梯度下降树和长短期记忆模型，对每个算法模型采用k-折交叉验证算法，以选择每个算法的最优参数设置，包括：

模块M3.1：对同一种算法模型设置m组不同的参数组；

模块M3.4：循环5次，得到一个5×m的损失矩阵；

10.根据权利要求6所述的基于预测算法池的风电功率预测系统，其特征在于，所述模块M4包括：采用支持向量机回归算法SVR或者长短期记忆人工神经网络算法LSTM进行二阶预测；

对不同的算法和算法组合，训练不同的回归模型训练。