CN108197753A - 基于随机森林的风电厂超短期风速预测方法 - Google Patents
基于随机森林的风电厂超短期风速预测方法 Download PDFInfo
- Publication number
- CN108197753A CN108197753A CN201810070511.9A CN201810070511A CN108197753A CN 108197753 A CN108197753 A CN 108197753A CN 201810070511 A CN201810070511 A CN 201810070511A CN 108197753 A CN108197753 A CN 108197753A
- Authority
- CN
- China
- Prior art keywords
- wind
- wind speed
- speed
- random forest
- ultra
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本发明涉及一种基于随机森林的风电厂超短期风速预测方法,该方法根据历史风速数据通过拉依达准则剔除不良数据后,基于随机森林训练预测模型,并将其应用于超短期风速预测中,能够根据若干历史风速数据对未来风速进行超短期预测。本发明较好的保留了原有风速数据的波动特性与统计特征,具有较好的拟合特性与较小的拟合误差,同时该预测方法能够识别异常数据,规避了采样误差,能够适应实际工程需要。
Description
技术领域
本发明属于电力系统领域,具体涉及到一种基于随机森林的风电厂超短期风速预测方法。
背景技术
我国风电近年来持续快速发展,风电的快速发展给中国经济的发展注入了新的活力。但由于风能自身固有的随机性、间歇性、波动性,风电的接入也给电力系统的安全稳定运行带来了很大的挑战,风电对电力系统规划、电力系统的可靠性及电力系统运行造成了很大影响如何评估风电容量可信度及系统的风电接纳能力的问题亟需解决。
为研究风电对的影响,就需要首先对风电进行建模,而风速时间序列的生成是建模的基础。现阶段风速预测方法的拟合效果普遍不够好,存在较大误差,且对于异常数据有较大的敏感度,更有些计算方法过于复杂而难以实现,难以满足实际工程需求。
发明内容
针对现有技术存在的不足,本发明提出一种基于随机森林的风电厂超短期风速预测方法,该算法根据历史风速数据训练预测模型,并将其应用于超短期风速预测中,能够根据若干历史风速数据对未来风速进行超短期预测。
本发明采用以下方案实现:一种基于随机森林的风电厂超短期风速预测方法,其特征在于,包括以下步骤:
步骤S1:根据风力发电机采集的包含多个时间节点对应风速值的历史风速数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个风速采样值,并根据时间顺序构建风速-时间序列;
步骤S2:利用拉依达准则对风速-时间序列中的不良数据进行判断,将不良数据剔除;
步骤S3:构建训练数据集合,其中每一组训练数据由1个作为结果变量的采样点及其之前n个作为相关变量的采样点构成;
步骤S4:采用随机森林策略处理训练数据集合,获得预测模型;
步骤S5:将最近连续n个风速采样值输入预测模型中,获得下一采样点对应时刻的风速预测结果。
优选地,步骤S2中利用拉依达准则对风速-时间序列中的不良数据进行判断采用以下公式:
式中为第b个采样点的风速采样值;
为全部风速采样值的平均值;
为第b个采样点风速采样值的剩余误差;
为全部风速采样值的标准差;
遍历全部风速采样值,如某一风速采样值满足此式,则判定为不良数据,并从风速-时间序列中剔除。
优选地,步骤S4中,采用随机森林策略处理训练数据集合的具体方法是:使用bootstrap方法等量有放回地随机抽取N组训练数据,构成N个子训练集,使用每个子训练集分别训练一棵CART决策回归树,从而构成基于随机森林的预测模型。
优选地,步骤S5中的风速预测结果为每棵决策回归树预测结果的平均值。
优选地,所述子训练集中训练数据的组数与训练数据集合中训练数据的组数相同。
优选地,所述CART决策回归树根据最小基尼系数作为特征值构建。
本发明提供的技术方案较好的保留了原有风速数据的波动特性与统计特征,具有较好的拟合特性与较小的拟合误差,同时该预测方法能够识别异常数据,规避了采样误差,能够适应实际工程需要。
与现有技术相比,本发明还具有以下2个突出优点。
1、本发明较好的保留了原有风速数据的波动特性与统计特征,具有较好的拟合特性与较小的拟合误差。
2、本发明能够识别异常数据,规避了采样误差。
附图说明
图1为本发明的算法流程图。
图2为本发明的预测效果示例。
具体实施方式
下面结合实例对本发明做进一步说明。
如图1所示,本实例提供了一种基于随机森林的风电厂超短期风速预测方法,具体包括以下步骤:
步骤S1:通过风力发电机获取历史风速数据,将采样频率设定为每10分钟采样一次,根据时间顺序构建风速-时间序列。
步骤S2:利用拉依达准则对风速-时间序列中的不良数据进行判断,若是不良数据,则直接将其剔除:
式中为第b个风速采样值;
为全体风速样本的均值;
为第b个风速值的剩余误差;
为全体风速样本的标准差;
若某风速采样值满足此式,则视为不良数据,并将其剔除。
步骤S3:构建训练数据集合,每组数据由每一风速采样点及其之前10个风速采样点构成。其中相关变量为前10个采样点,并将结果变量定为这一采样点。
步骤S4:对训练数据集进行处理,使用bootstrap方法等量有放回地抽取多组子训练集,每个子训练集分别训练一棵CART决策回归树,构建随机森林预测模型。
步骤S5:将时序上最临近的10个风速采样值输入到随机森林预测模型中,便可获得下一时刻风速预测结果。
其中,步骤S4中,子训练集中训练数据的组数与训练数据集合中训练数据的组数相同;CART决策回归树根据最小基尼系数作为特征值构建。
步骤S5中的风速预测结果为每棵决策回归树预测结果的平均值。
基于实际数据的预测结果如图2所示。
该实例的预测误差指标如表1所示:
表1
Claims (6)
1.一种基于随机森林的风电厂超短期风速预测方法,其特征在于,包括以下步骤:
步骤S1:根据风力发电机采集的包含多个时间节点对应风速值的历史风速数据,将采样频率设定为每m分钟采样一次,得到M个采样点对应的M个风速采样值,并根据时间顺序构建风速-时间序列;
步骤S2:利用拉依达准则对风速-时间序列中的不良数据进行判断,将不良数据剔除;
步骤S3:构建训练数据集合,其中每一组训练数据由1个作为结果变量的采样点及其之前n个作为相关变量的采样点构成;
步骤S4:采用随机森林策略处理训练数据集合,获得预测模型;
步骤S5:将最近连续n个风速采样值输入预测模型中,获得下一采样点对应时刻的风速预测结果。
2.根据权利要求1所述的基于随机森林的风电厂超短期风速预测方法,其特征在于,步骤S2中利用拉依达准则对风速-时间序列中的不良数据进行判断采用以下公式:
式中为第b个采样点的风速采样值;
为全部风速采样值的平均值;
为第b个采样点风速采样值的剩余误差;
为全部风速采样值的标准差;
遍历全部风速采样值,如某一风速采样值满足此式,则判定为不良数据,并从风速-时间序列中剔除。
3.根据权利要求1所述的基于随机森林的风电厂超短期风速预测方法,其特征在于:步骤S4中,采用随机森林策略处理训练数据集合的具体方法是:使用bootstrap方法等量有放回地随机抽取N组训练数据,构成N个子训练集,使用每个子训练集分别训练一棵CART决策回归树,从而构成基于随机森林的预测模型。
4.根据权利要求3所述的基于随机森林的风电厂超短期风速预测方法,其特征在于:步骤S5中的风速预测结果为每棵决策回归树预测结果的平均值。
5.根据权利要求3所述的基于随机森林的风电厂超短期风速预测方法,其特征在于:所述子训练集中训练数据的组数与训练数据集合中训练数据的组数相同。
6.根据权利要求3所述的基于随机森林的风电厂超短期风速预测方法,其特征在于:所述CART决策回归树根据最小基尼系数作为特征值构建。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810070511.9A CN108197753A (zh) | 2018-01-25 | 2018-01-25 | 基于随机森林的风电厂超短期风速预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810070511.9A CN108197753A (zh) | 2018-01-25 | 2018-01-25 | 基于随机森林的风电厂超短期风速预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108197753A true CN108197753A (zh) | 2018-06-22 |
Family
ID=62591100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810070511.9A Pending CN108197753A (zh) | 2018-01-25 | 2018-01-25 | 基于随机森林的风电厂超短期风速预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108197753A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034478A (zh) * | 2018-07-27 | 2018-12-18 | 中南大学 | 一种高速铁路沿线大风迭代竞争高精度预测方法 |
CN109242519A (zh) * | 2018-09-25 | 2019-01-18 | 阿里巴巴集团控股有限公司 | 一种异常行为识别方法、装置和设备 |
-
2018
- 2018-01-25 CN CN201810070511.9A patent/CN108197753A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109034478A (zh) * | 2018-07-27 | 2018-12-18 | 中南大学 | 一种高速铁路沿线大风迭代竞争高精度预测方法 |
CN109242519A (zh) * | 2018-09-25 | 2019-01-18 | 阿里巴巴集团控股有限公司 | 一种异常行为识别方法、装置和设备 |
CN109242519B (zh) * | 2018-09-25 | 2022-12-16 | 创新先进技术有限公司 | 一种异常行为识别方法、装置和设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107179503B (zh) | 基于随机森林的风电机组故障智能诊断预警的方法 | |
CN105354587B (zh) | 一种风力发电机组齿轮箱的故障诊断方法 | |
CN104200396B (zh) | 一种风力发电机部件故障预警方法 | |
CN107273920A (zh) | 一种基于随机森林的非侵入式家用电器识别方法 | |
CN111157899B (zh) | 一种基于模型融合思想对电池soc的估计方法 | |
CN106933778A (zh) | 一种基于爬坡事件特征识别的风电功率组合预测方法 | |
CN109978079A (zh) | 一种改进的堆栈降噪自编码器的数据清洗方法 | |
CN110994604B (zh) | 基于lstm-dnn模型的电力系统暂态稳定评估方法 | |
CN104182803B (zh) | 风电数据预处理方法及风电功率预测方法和系统 | |
CN109672221B (zh) | 一种用于次同步振荡分析的直驱风电场动态等值方法 | |
CN107944349A (zh) | 基于粒子群‑支持向量机的gis局部放电类型模式识别方法 | |
CN110244205A (zh) | 一种小数据量下基于卷积神经网络的电缆附件局部放电识别方法 | |
CN103440497B (zh) | 一种gis绝缘缺陷局部放电图谱模式识别方法 | |
CN110009141B (zh) | 基于sdae特征提取和svm分类模型的爬坡事件预测方法及系统 | |
CN109886464A (zh) | 基于优化奇异值分解生成特征集的低信息损失短期风速预测方法 | |
CN105354636A (zh) | 一种基于非参数核密度估计的风功率波动性概率密度建模方法 | |
CN104102951A (zh) | 一种基于emd历史数据预处理的短期风电功率预测方法 | |
CN106597154B (zh) | 基于dag-svm的变压器故障诊断提升方法 | |
CN107728028A (zh) | 基于单类支持向量机的gis局部放电故障判别方法 | |
CN107391385A (zh) | 一种软件测试用例生成技术的构建方法 | |
CN110287762A (zh) | 一种基于数据挖掘技术的非侵入式负荷辨识方法以及装置 | |
CN108197753A (zh) | 基于随机森林的风电厂超短期风速预测方法 | |
CN106768933A (zh) | 一种基于遗传算法的风电机组叶片故障诊断方法 | |
CN104978605A (zh) | 基于深度学习网络的大规模风电功率预测系统及方法 | |
CN108197752A (zh) | 基于随机森林的风机输出功率短期预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180622 |
|
RJ01 | Rejection of invention patent application after publication |