CN111582551A - 风电场短期风速预测方法、系统及电子设备 - Google Patents
风电场短期风速预测方法、系统及电子设备 Download PDFInfo
- Publication number
- CN111582551A CN111582551A CN202010295233.4A CN202010295233A CN111582551A CN 111582551 A CN111582551 A CN 111582551A CN 202010295233 A CN202010295233 A CN 202010295233A CN 111582551 A CN111582551 A CN 111582551A
- Authority
- CN
- China
- Prior art keywords
- wind speed
- predicted
- wind
- sequence
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 238000000354 decomposition reaction Methods 0.000 claims description 30
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 238000010801 machine learning Methods 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 15
- 238000004140 cleaning Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000001186 cumulative effect Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 5
- 238000009826 distribution Methods 0.000 claims description 4
- 230000004927 fusion Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 5
- 230000005611 electricity Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000053 physical method Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 description 2
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
Abstract
本发明公开了一种风电场短期风速预测方法、系统及电子设备,将风速序列分解为一系列具有不同中心频率的模态分量,可以降低风速序列的波动性与随机性,利用模态分量获取第一预测风速,利用风速序列构建特征集,特征集可以辅助预测模型分析风速序列,并根据这些特征避免模型陷入局部最优,提高其泛化性;训练集中加入了叠加后的第一预测风速,保留了第一预测风速的相关信息,充分利用了风速序列的特征信息。本发明最终的预测风速能够保留不同模型间的预测精度,使得预测准确的模型分配更大的权重,提高融合后的模型预测准确度。
Description
技术领域
本发明涉及机器学习领域,特别是一种风电场短期风速预测方法、系统及电子设备。
背景技术
在全球能源转型逐渐成为趋势,风电作为电力市场化改革的重要内容以及信息技术快速发展的背景下,短期风速预测的研究具有更重要的意义。准确的风速预测不仅有助于辅助风电场控制电能质量,优化调度运行管理,充分发挥系统接纳风电潜力,而且对于区域发电计划和统筹协调,配合蓄热式电锅炉等储能设备追踪风电发电情况,减少大规模“弃风”的产生,提升风电资源的实际利用率,从而提高电力系统运行的经济性具有重要战略意义。并且,对于一些危险气体引发的特殊安全事故的预警和应急防护具有重要的现实意义。
针对不同时空尺度的风速特征以及不同的应用需求,风速预测方法通常分为物理法、统计法和学习法三类。物理方法通过对风电场所处空间的地形、海拔、粗糙度等环境信息建立空气动力学模型,推理获得风电场风电机组的风速,但在实际应用中,物理法难以建立准确的数学模型描述风电场的地形和大气变化,过程中容易产生误差累积。统计法通过分析大量的历史数据,研究历史风速数据与未来短期风速之间的映射关系,以此为基础建立风速预测数学模型,统计法直接的问题是无法有效的反映风速的随机性,预测误差会随着预测时间的增加而增加。学习法利用智能学习算法通过历史数据以及影响因素拟合风速序列中存在的非线性关系,达到良好的预测效果,但随之而来的,是学习算法中对于大量样本数据普遍存在的训练速度慢、过欠拟合、陷入局部最优和泛化能力差等问题。
风速序列内在的随机性与波动性严重的影响了模型的准确性,难以通过原始数据集直接预测获得理想的预测效果。信号处理算法是一种将时序风速序列按不同的中心频率分解为具有规律性的子序列,通过提取子序列的显著特征进行预测重构能够有效降低风速数据的波动性,降低模型复杂度,改善预测精度。传统的经验模态分解(EMD)存在模态分量频率分布不均造成的模态混叠问题。
在风速预测现有的方法中,物理法、统计法、学习法都具有各自的优势和局限性,充分利用这些方法的特点构建组合预测模型,减小预测误差,扩展预测时间范围是风速预测的重要发展趋势。不同的模型利用的数据特征信息不尽相同,造成了风速预测模型之间具有不同的预测精度,但是预测精度往往有限。常用的平均加权法存在着预测性能优越的模型被掩盖的问题,无法有效利用其中的特征信息,造成数据信息无法充分利用,影响其预测能力。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种风电场短期风速预测方法、系统及电子设备,提高短期风速预测的准确度。
为解决上述技术问题,本发明所采用的技术方案是:一种风电场短期风速预测方法,包括以下步骤:
1)获取风场历史风速数据的风速序列;
2)分解所述风速序列,得到一系列具有不同中心频率的模态分量;;
3)将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速;
4)叠加所有第一预测风速;
5)提取所述风速序列的相关特征,根据这些相关特征构建特征集;将叠加后的第一预测风速作为新的特征加入所述特征集;
6)将所述特征集作为机器学习模型的输入,得到第二预测风速;
7)通过信息熵融合步骤4)得到的叠加的第一预测风速和步骤6)得到的第二预测风速。
本发明分解风速序列,可以降低风速序列的波动性与随机性,相比于直接对风速序列进行预测,分解后的模态分量使得预测模型能够更加准确地表达该风速序列,避免风速序列可能的剧烈变化造成的误差,特征集可以辅助预测模型分析风速序列,并根据这些特征避免模型陷入局部最优,提高其泛化性;训练集中加入了叠加后的第一预测风速,保留了第一预测风速的相关信息,充分利用了风速序列的特征信息,本发明最终的预测风速能够保留不同模型间的预测精度,使得预测准确的模型分配更大的权重,提高融合后的模型预测准确度。
步骤1)获取的风速序列可能包含空数据、错误数据等异常数据,需要对所述风场历史风速数据进行异常数据清洗,得到完整的风速序列,避免异常数据造成的不正常波动性影响预测准确度。
步骤2)中,利用变分模态分解法分解所述风速序列,变分模态分解法具有自适应迭代分解模态分量和中心频率的特性,相比传统的分解方法,不会造成模态混叠导致分解不完全,不会影响预测精度,同时可以减小风速序列波动性和随机性对预测精度的影响,其中第k个模态分量获取过程的具体实现步骤包括:
I)将所述风速序列按中心频率分解为K个模态分量,获取每个模态分量的单侧频谱,将模态分量变换至频域,获得频域下的K个模态分量:其中,dk(ω)为频域下的第k个模态分量,ωk为分解后的第k个模态分量的中心频率,dk(t)为分解后的第k个模态分量,为模态分量的单边频谱,δ(t)为狄拉克分布;
II)将频域下的第k个模态分量和其中心频率根据傅里叶等距变换转化为如下形式:
III)对步骤II)中的模态分量和中心频率在非负频域进行二次优化,得到对应模态分量的最优解,然后通过傅里叶逆变换得到中心频率的局部最优解:
步骤3)中,所述多个第一预测风速的具体获取过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行AIC准则计算。通过AIC准则选取模型参数,降低了人工测试模型参数带来的时间成本,避免了经验和直觉等主观因素对预测精度的影响,为参数选择提供更好的依据。获取最小AIC值对应的自回归项数p和滑动平均项数q,利用所述最小AIC值对应的自回归项数p和滑动平均项数q建立累积式自回归移动平均模型;将所述模态分量作为所述累积式自回归移动平均模型的输入,得到第一预测风速。
步骤5)中,提取所述风速序列的相关特征的具体实现过程包括:风速是一个连续变化的过程,可以通过一段时间的历史数据来预测下一时刻的风速,通过具有一定相关性特征的历史数据进行预测,相比直接风速预测拥有更好的预测效果,降低预测模型的输入复杂度。因此可以计算某一时间段的风速序列与该时间段的上一时间段的风速序列之间的相关性,当相关性大于设定阈值时,则这两段风速序列之间具有强相关性,输出该时间段的风速数据;重复该过程,直至输出所有符合相关性要求的风速数据,所有输出的风速数据构成所述特征集;其中自相关分析的表达式为:
其中,Xt-k、Xt为风速序列,Xt-k={x1,x2,...,xt-k};Xt={xt-k+1,xt-k+2,...,xt};Cov为协方差;D为方差。
步骤7)的具体实现过程包括:引入信息熵反映第一预测风速和第二预测风速的信息贡献度,并以所述信息贡献度确定第一预测风速的权重和第二预测风速的权重,并按第一预测风速的权重和第二预测风速的权重对所述第一预测风速和第二预测风速进行加权组合,得到最终的预测风速。相较于简单的等权平均,信息熵能够更好地反映不同模型的预测精度,为预测精度高的模型分配更大的权重,减小最终预测结果的误差。
一种风电场短期风速预测系统,其包括:
数据采集模块,用于获取风场历史风速数据的风速序列;
分解模块,用于分解所述数据采集模块输出的风速序列,得到一系列具有不同中心频率的模态分量;
第一预测模块,用于将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速,并叠加所有第一预测风速;
第二预测模块,用于提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建训练集,将所述训练集作为机器学习模型的输入,得到第二预测风速;
融合模块,用于融合叠加后的第一预测风速和第二预测风速,得到最终的预测风速;
第二预测模块中,可以将特征集拆分为训练集和测试集,利用训练集对预测模型进行训练,并通过测试集测试整个预测系统的合格性,当预测精度达到期望精度时,认为预测系统合格,进一步提高预测精度。
优选地,所述分解模块利用变分模态分解法分解所述数据采集模块输出的风速序列,降低风速序列的波动性与随机性,相比于直接对风速序列进行预测,分解后的模态分量使得预测模型能够更加准确地表达该风速序列,避免风速序列可能的剧烈变化造成的误差。
所述数据处理模块包括:
采集单元,用于采集风场历史风速数据;
数据预处理单元,用于对所述风场历史风速数据进行异常数据清洗,得到完整的风速序列;
输出单元,用于将所述风速序列输出至所述分解模块。
优选地,所述数据预处理单元利用线性插值法对所述异常数据进行清洗。
所述第一预测模块包括:
累积式自回归移动平均模型,用于对所述多个模态分量分别进行处理,得到多个第一预测风速;
叠加单元,用于叠加所有第一预测风速。
优选地,所述累积式自回归移动平均模型的建立过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行AIC准则计算,获取最小AIC值对应的自回归项数p和滑动平均项数q,利用所述最小AIC值对应的自回归项数p和滑动平均项数q建立所述累积式自回归移动平均模型。
所述第二预测模块包括:
提取单元,用于计算某一时间段的风速序列与该时间段的上一时间段的风速序列之间的相关性,当相关性大于设定阈值时,则这两段风速序列之间具有强相关性,输出该时间段的风速数据;重复该过程,直至输出所有符合相关性要求的风速数据,所有输出的风速数据构成所述特征集;
构建单元,用于将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建测试集;
XGBoost模型,以所述测试集为输入,输出第二预测风速。
本发明还提供了一种用于预测风电场短期风速的电子设备,其特征在于,包括:数据采集终端,用于获取风场历史风速数据的风速序列;
处理器,与所述数据采集终端连接,并执行包括如下步骤的方法:
1)分解所述风速序列,得到一系列具有不同中心频率的模态分量;
2)将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速;
3)叠加所有第一预测风速;
4)提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集;
5)基于步骤4)得到的特征集,构建训练集和测试集,将所述训练集和测试集作为机器学习模型的输入,得到第二预测风速;
6)融合步骤3)得到的叠加的第一预测风速和步骤5)得到的第二预测风速,得到最终的预测风速。
本发明中提到的“短期”,是指72小时内。
与现有技术相比,本发明所具有的有益效果为:
1)本发明将风速序列分解为一系列具有不同中心频率的模态分量,可以降低风速序列的波动性与随机性,相比于直接对风速序列进行预测,分解后的模态分量使得预测模型能够更加准确地表达该风速序列,避免风速序列可能的剧烈变化造成的误差,特征集可以辅助预测模型分析风速序列,并根据这些特征避免模型陷入局部最优,提高其泛化性;训练集中加入了叠加后的第一预测风速,保留了第一预测风速的相关信息,充分利用了风速序列的特征信息,本发明最终的预测风速能够保留不同模型间的预测精度,使得预测准确的模型分配更大的权重,提高融合后的模型预测准确度;
2)本发明训练速度快,计算量相对较小。附图说明
图1为本发明中VMD-ARIMA-XGBoost短期风速预测方法的流程图;
图2为本发明实例中对风速数据自相关分析结果图;
图3为本发明实例中4种模型在不同部分时段的风速预测结果图;
图4为本发明实例中4种模型在不同部分时段的风速预测结果图;
图5为本发明实例中4种模型在不同部分时段的风速预测结果图。
图6为本发明实例中预测系统的结构框图;
图7为本发明实例中数据处理模块结构框图;
图8为本发明实例中第一预测模块结构框图;
图9为本发明实例中第二预测模块结构框图;
图10为本发明实施例电子设备结构框图。
具体实施方式
本发明提出一种基于VMD-ARIMA-XGBoost的风电场短期风速预测方法,下面结合附图对本发明的具体实施方式作进一步说明。选取某风电场2016年1月1日至2016年6月30日的风速检测数据,原始数据时间分辨率为10分钟,其中1月1日至6月23日的25200个风速数据作为训练样本,将6月24日至6月30日的1008个实测数据作为测试样本。图1为基于VMD-ARIMA-XGBoost加权组合模型的风电场短期风速预测方法流程图,具体包括如下步骤:
步骤一:对风场历史风速数据进行清洗与自相关分析,数据清洗通过线性插值法去除异常数据(异常数据包括缺失的数据(空值)、超过采集设备上限值的数据以及负值数据)。其中,线性插值法表达式为:
其中,xt为t时刻的风速数据。当t时刻的数据异常时,用上式计算得到的t时刻数据替代异常数据即可。
步骤二:通过变分模态分解法将风速序列进行分解,变分模态分解法记为VMD,通过自适应迭代搜寻模态函数的中心频率,避免了模态重叠导致的风速序列分解不完全问题,得到12个具有不同中心频率的模态分量BIMF和一个残余分量RES(残余分量RES被舍去,不参与后续计算)。其中,变分模态分解法的具体过程如下:
(1)将所述风速序列按中心频率分解为12个模态分量(K=12),获取每个模态分量的单侧频谱,将模态分量变换至频域,获得频域下的12个模态分量:其中,dk(ω)为频域下的第k个模态分量,ωk为分解后的第k个模态分量的中心频率,dk(t)为分解后的第k个模态分量,为模态分量的单边频谱,δ(t)为狄拉克分布;
(2)引入增广拉格朗日方程,将频域下的第k个模态分量和其中心频率根据傅里叶等距变换转化为如下形式:
其中,为偏导数计算,d'k(ω)为傅里叶等距变换变换后的第k个模态分量;ω'k为傅里叶等距变换变换后的第k个模态分量d'k(ω)的中心频率;为α为平衡参数,用于保证重构信号精度,本发明实施例中α=5000;f(t)为风速序列;λ为拉格朗日乘子;
(3)对步骤(2)中的模态分量和中心频率在非负频域进行二次优化,得到对应模态分量的最优解,然后通过傅里叶逆变换得到中心频率的局部最优解:
步骤三:累积式自回归移动平均模型的参数包括自回归项数p、差分阶数d和滑动平均项数q,首先对步骤二得到的每个模态分量进行AIC准则计算,由于分解后的模态分量已经是平稳序列,因此d=0,而累积式自回归移动平均模型一般不超过8阶,因此从p=0,q=0至p=8,q=8的64个AIC值计算,其中以最小AIC值对应的p、q参数建立累积式自回归移动平均模型,并以此对各子序列(即模态分量)进行预测,得到相应预测结果(第一预测风速)。AIC准则的表达式为:
其中,σα为模态分量的极大似然估计,N为风速序列中数据个数(即风速序列长度)。
步骤四:对所有子序列(模态分量)的预测结果进行叠加,得到VMD-ARIMA模块的预测结果(第二预测风速);
步骤五:通过特征工程提取步骤一清洗后的风速序列的相关特征,选取1月1日的风速数据为例进行自相关分析,其中自相关系数大于0.6可以认定为具有强相关性,由图2可以确定当前风速数据与过去120分钟的风速数据之间存在的强相关性,可以通过这些历史的风速来预测当前时刻的风速,因此将这些数据作为当前风速数据的强相关性特征加入特征集合,同时本发明为了充分利用VMD-ARIMA模型提取的信息,将步骤四的预测序列作为新的特征序列加入特征集合,构建短期预测风速特征集。其中自相关分析的表达式为:
其中,Xt-k为风速序列{x1,x2,...,xt-k};Xt为风速序列{xt-k+1,xt-k+2,...,xt};Cov为协方差;D为方差。
步骤六:基于步骤五建立的特征集将其中1月1日至6月23日的25200个风速数据作为训练样本,将6月24日至6月30日的1008个实测数据作为测试样本,以预测输出和期望输出的损失函数最小化为目标,建立XGBoost模型,并通过贝叶斯优化模型参数,得到XGBoost短期风速预测模型的核心参数为,学习速率为0.1,决策树迭代次数为150,决策树的最大深度为6,叶子节点最小样本权重为7,gamma参数为0。根据步骤一的自相关分析,选择时间步长为12,即以时间分辨率为10分钟的历史120分钟特征数据为输入,得到XGBoost模块的预测结果;
步骤七:本发明为了更好的保留两种预测模型提取的风速特征,通过引入信息熵反映ARIMA模块和XGBoost模块对于组合模型的信息贡献度,并以此确定两种预测模型的权重,通过加权组合的方式得到最终的预测结果。为了证明本发明的有效性,将四种方法的在不同时间段内的误差指标记于表1,其中组合模型为本发明提出的预测方法。信息熵的表达式如下:
H=ωAHA+ωXHX
其中,Sc为第c个模型的信息熵,ect为第c个模型在t时刻的误差值,ωc为模型c的权重,H为最终的预测结果,ωA为ARIMA模型通过信息熵确定的权重,HA为VMD-ARIMA模块的预测结果,ωX为XGBoost模块通过信息熵确定的权重,HX为XGBoost模块的预测结果。
表1 4种模型短期风速预测结果对比
为了直观地展示不同模型之间的预测结果差异,将4种模型在6月25日,6月27日,6月29日的预测结果误差绘制于图3至图5。可以看出,本发明提出的基于VMD-ARIMA-XGBoost的风电场短期风速预测方法在风速平稳变化和风速剧烈变化的时段能够依然能有效准确地拟合真实的风速曲线变化,保留风速序列历史相关性和波动性的同时保持较好的预测精度。MAPE和RMSE分别为9.76%和0.57米/秒,在4种模型中均是最优值,相比ARIMA、VMD-ARIMA、XGBoost的MAPE分别降低了9.01%、1.62%、3.06%,RMSE分别降低了0.89米/秒、0.26米/秒、0.31米/秒,证明该模型在短期风速预测中,有效的融合了预测模型之间的优势并降低了预测误差,采用的组合方法的预测精度优于各个单一的预测模型。本发明在ARIMA模型的基础上引入VMD对原始风速序列进行分解处理,降低了风速序列的非线性,同时通过信息熵将ARIMA模块与XGBoost模块进行有效结合,将风速的影响因素也作为预测特征,能够有效提高短期风速预测精度。如图6,本发明的另一种实施例提供了一种风电场短期风速预测系统,其包括:数据采集模块,用于获取风场历史风速数据的风速序列;
数据处理模块,用于对风速序列进行清洗;
分解模块,用于分解所述数据采集模块输出的风速序列,得到一系列具有不同中心频率的模态分量;
第一预测模块,用于将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速,并叠加所有第一预测风速;
第二预测模块,用于提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建测试集,将所述测试集作为机器学习模型的输入,得到第二预测风速;
融合模块,用于融合叠加后的第一预测风速和第二预测风速,得到最终的预测风速(最终输出结果)。
本实施例的分解模块利用前述的变分模态分解法分解所述数据采集模块输出的风速序列,具体分解过程如前所述,此处不再赘述。
如图7,本实施例数据处理模块包括:
采集单元,用于采集风场历史风速数据;
数据预处理单元,用于对所述风场历史风速数据进行异常数据清洗,得到完整的风速序列;
输出单元,用于将所述风速序列输出至所述分解模块;
数据预处理单元利用线性插值法对所述异常数据进行清洗,其中,线性插值法表达式为:
其中,xt为t时刻的风速数据。当t时刻的数据异常时,用上式计算得到的t时刻数据替代异常数据即可。
如图8所示,本实施例的第一预测模块包括:
累积式自回归移动平均模型(ARIMA),用于对所述多个模态分量分别进行处理,得到多个第一预测风速;
叠加单元(图8中的数据叠加),用于叠加所有第一预测风速;
本实施例的累积式自回归移动平均模型的建立过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行AIC准则计算,获取最小AIC值对应的自回归项数p和滑动平均项数q,利用所述最小AIC值对应的自回归项数p和滑动平均项数q建立所述累积式自回归移动平均模型。
累积式自回归移动平均模型的参数包括自回归项数p、差分阶数d和滑动平均项数q,首先对步骤二得到的每个模态分量进行AIC准则计算,由于分解后的模态分量已经是平稳序列,因此d=0,而累积式自回归移动平均模型一般不超过8阶,因此从p=0,q=0至p=8,q=8的64个AIC值计算,其中以最小AIC值对应的p、q参数建立累积式自回归移动平均模型,并以此对各子序列(即模态分量)进行预测,得到相应预测结果。
如图9所示,本实施例的第二预测模块包括:
提取单元,用于计算某一时间段的风速序列与该时间段的上一时间段的风速序列之间的相关性,当相关性大于设定阈值时,则这两段风速序列之间具有强相关性,输出该时间段的风速数据;重复该过程,直至输出所有符合相关性要求的风速数据,所有输出的风速数据构成所述特征集;
构建单元,用于将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建测试集;
XGBoost模型,以所述测试集为输入,输出第二预测风速。
为了更好的保留两种预测模型提取的风速特征,本发明的融合模块通过引入信息熵反映ARIMA模块和XGBoost模块对于组合模型的信息贡献度,并以此确定两种预测模型的权重,通过加权组合的方式得到最终的预测结果。
如图10所示,本发明的另一实施例为用于预测风电场短期风速的电子设备,包括:
数据采集终端,用于获取风场历史风速数据的风速序列;
处理器,与所述数据采集终端连接,并执行本发明实施例的短期风速预测方法。本发明实施例的数据采集终端,可以是风电场测风塔或者是风速传感器。处理器可以是ARM等。
Claims (10)
1.一种风电场短期风速预测方法,其特征在于,包括以下步骤:
1)获取风场历史风速数据的风速序列;
2)分解所述风速序列,得到一系列具有不同中心频率的模态分量;
3)将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速;
4)叠加所有第一预测风速;
5)提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集;
6)将所述特征集作为机器学习模型的输入,得到第二预测风速;
7)融合步骤4)得到的叠加的第一预测风速和步骤6)得到的第二预测风速,得到最终的预测风速。
3.根据权利要求1或2所述的风电场短期风速预测方法,其特征在于,步骤2)中,利用变分模态分解法分解所述风速序列,第k个模态分量获取过程的具体实现步骤包括:
I)将所述风速序列按中心频率分解为K个模态分量,获取每个模态分量的单侧频谱,将模态分量变换至频域,获得频域下的K个模态分量:其中,dk(ω)为频域下的第k个模态分量,ωk为分解后的第k个模态分量的中心频率,dk(t)为分解后的第k个模态分量,为模态分量的单边频谱,δ(t)为狄拉克分布;
II)将频域下的第k个模态分量和其中心频率根据傅里叶等距变换转化为如下形式:
III)对步骤II)中的模态分量和中心频率在非负频域进行二次优化,通过傅里叶逆变换得到中心频率的局部最优解,然后通过该中心频率得到对应模态分量的最优解:
4.根据权利要求1或2所述的风电场短期风速预测方法,其特征在于,步骤3)中,所述多个第一预测风速的具体获取过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行AIC准则计算,获取最小AIC值对应的自回归项数p和滑动平均项数q,利用所述最小AIC值对应的自回归项数p和滑动平均项数q建立累积式自回归移动平均模型;将所述模态分量作为所述累积式自回归移动平均模型的输入,得到第一预测风速。
6.根据权利要求1或2所述的风电场短期风速预测方法,其特征在于,步骤7)的具体实现过程包括:引入信息熵反映第一预测风速和第二预测风速的信息贡献度,并以所述信息贡献度确定第一预测风速的权重和第二预测风速的权重,并按第一预测风速的权重和第二预测风速的权重对所述第一预测风速和第二预测风速进行加权组合,得到最终的预测风速。
7.一种风电场短期风速预测系统,其特征在于,包括:
数据采集模块,用于获取风场历史风速数据的风速序列;
分解模块,用于分解所述数据采集模块输出的风速序列,得到一系列具有不同中心频率的模态分量;
第一预测模块,用于将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速,并叠加所有第一预测风速;
第二预测模块,用于提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建训练集,将所述训练集作为机器学习模型的输入,得到第二预测风速;
融合模块,用于融合叠加后的第一预测风速和第二预测风速,得到最终的预测风速;
优选地,所述分解模块利用变分模态分解法分解所述数据采集模块输出的风速序列。
8.根据权利要求7所述的风电场短期风速预测系统,其特征在于,所述数据处理模块包括:
采集单元,用于采集风场历史风速数据;
数据预处理单元,用于对所述风场历史风速数据进行异常数据清洗,得到完整的风速序列;
输出单元,用于将所述风速序列输出至所述分解模块;
优选地,所述数据预处理单元利用线性插值法对所述异常数据进行清洗。
9.根据权利要求7所述的风电场短期风速预测系统,其特征在于,所述第一预测模块包括:
累积式自回归移动平均模型,用于对所述多个模态分量分别进行处理,得到多个第一预测风速;
叠加单元,用于叠加所有第一预测风速;
优选地,所述累积式自回归移动平均模型的建立过程包括:对每个所述模态分量针对不同的自回归项数p和滑动平均项数q进行AIC准则计算,获取最小AIC值对应的自回归项数p和滑动平均项数q,利用所述最小AIC值对应的自回归项数p和滑动平均项数q建立所述累积式自回归移动平均模型;
优选地,所述第二预测模块包括:
提取单元,用于计算某一时间段的风速序列与该时间段的上一时间段的风速序列之间的相关性,当相关性大于设定阈值时,则这两段风速序列之间具有强相关性,输出该时间段的风速数据;重复该过程,直至输出所有符合相关性要求的风速数据,所有输出的风速数据构成所述特征集;
构建单元,用于将叠加后的第一预测风速作为新的特征加入所述特征集,基于所述特征集构建测试集;
XGBoost模型,以所述测试集为输入,输出第二预测风速。
10.一种用于预测风电场短期风速的电子设备,其特征在于,包括:
数据采集终端,用于获取风场历史风速数据的风速序列;
处理器,与所述数据采集终端连接,并执行包括如下步骤的方法:
1)分解所述风速序列,得到一系列具有不同中心频率的模态分量;
2)将每个模态分量分别作为机器学习方法的输入,得到多个第一预测风速;
3)叠加所有第一预测风速;
4)提取所述风速序列的相关特征,构建特征集,并将叠加后的第一预测风速作为新的特征加入所述特征集;
5)将所述特征集作为机器学习模型的输入,得到第二预测风速;
6)融合步骤3)得到的叠加的第一预测风速和步骤5)得到的第二预测风速,得到最终的预测风速。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010295233.4A CN111582551B (zh) | 2020-04-15 | 2020-04-15 | 风电场短期风速预测方法、系统及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010295233.4A CN111582551B (zh) | 2020-04-15 | 2020-04-15 | 风电场短期风速预测方法、系统及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582551A true CN111582551A (zh) | 2020-08-25 |
CN111582551B CN111582551B (zh) | 2023-12-08 |
Family
ID=72112582
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010295233.4A Active CN111582551B (zh) | 2020-04-15 | 2020-04-15 | 风电场短期风速预测方法、系统及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582551B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112613636A (zh) * | 2020-11-25 | 2021-04-06 | 国网江苏省电力有限公司江阴市供电分公司 | 一种基于特征工程的XGboost风速短期预测方法 |
CN112651543A (zh) * | 2020-11-10 | 2021-04-13 | 沈阳工程学院 | 一种基于vmd分解与lstm网络的日用电量预测方法 |
CN112991088A (zh) * | 2021-02-04 | 2021-06-18 | 国网浙江省电力有限公司 | 一种基于vmd-anfis-arima的月度电力需求预测方法 |
CN113344279A (zh) * | 2021-06-21 | 2021-09-03 | 河海大学 | 基于lstm-sam模型和池化的居民负荷预测方法 |
CN113536686A (zh) * | 2021-07-23 | 2021-10-22 | 河北工业大学 | 一种风速的概率模型的建模方法 |
CN114252706A (zh) * | 2021-12-15 | 2022-03-29 | 华中科技大学 | 一种雷电预警方法和系统 |
CN117056735A (zh) * | 2023-10-13 | 2023-11-14 | 云南电投绿能科技有限公司 | 一种风电场的短期风速预测方法、装置、设备及存储介质 |
WO2023245701A1 (zh) * | 2022-06-23 | 2023-12-28 | 东南大学 | 一种基于状态空间法的热式风速传感器宏模型提取方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102682207A (zh) * | 2012-04-28 | 2012-09-19 | 中国科学院电工研究所 | 风电场风速超短期组合预测方法 |
US20140344209A1 (en) * | 2010-08-23 | 2014-11-20 | Institute Of Nuclear Energy Research, Atomic Energy Council, Executive Yuan | Wind energy forecasting method with extreme wind speed prediction function |
JPWO2016121202A1 (ja) * | 2015-01-30 | 2017-11-09 | 日本電気株式会社 | 予測装置、予測方法、及び、プログラム |
CN108846528A (zh) * | 2018-09-19 | 2018-11-20 | 云南电网有限责任公司信息中心 | 一种大工业电力用户长期负荷预测方法 |
CN109063939A (zh) * | 2018-11-01 | 2018-12-21 | 华中科技大学 | 一种基于邻域门长短期记忆网络的风速预测方法及系统 |
CN109214592A (zh) * | 2018-10-17 | 2019-01-15 | 北京工商大学 | 一种多模型融合的深度学习的空气质量预测方法 |
CN110378508A (zh) * | 2019-05-29 | 2019-10-25 | 广东工业大学 | 一种基于大数据的智能预测方法 |
CN110489719A (zh) * | 2019-07-31 | 2019-11-22 | 天津大学 | 基于集合预报数据的风速预测方法 |
-
2020
- 2020-04-15 CN CN202010295233.4A patent/CN111582551B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140344209A1 (en) * | 2010-08-23 | 2014-11-20 | Institute Of Nuclear Energy Research, Atomic Energy Council, Executive Yuan | Wind energy forecasting method with extreme wind speed prediction function |
CN102682207A (zh) * | 2012-04-28 | 2012-09-19 | 中国科学院电工研究所 | 风电场风速超短期组合预测方法 |
JPWO2016121202A1 (ja) * | 2015-01-30 | 2017-11-09 | 日本電気株式会社 | 予測装置、予測方法、及び、プログラム |
CN108846528A (zh) * | 2018-09-19 | 2018-11-20 | 云南电网有限责任公司信息中心 | 一种大工业电力用户长期负荷预测方法 |
CN109214592A (zh) * | 2018-10-17 | 2019-01-15 | 北京工商大学 | 一种多模型融合的深度学习的空气质量预测方法 |
CN109063939A (zh) * | 2018-11-01 | 2018-12-21 | 华中科技大学 | 一种基于邻域门长短期记忆网络的风速预测方法及系统 |
CN110378508A (zh) * | 2019-05-29 | 2019-10-25 | 广东工业大学 | 一种基于大数据的智能预测方法 |
CN110489719A (zh) * | 2019-07-31 | 2019-11-22 | 天津大学 | 基于集合预报数据的风速预测方法 |
Non-Patent Citations (1)
Title |
---|
WEI SUN: "Short-Term Wind Speed Prediction Based on Variational Mode Decomposition and Linear–Nonlinear Combination Optimization Model", pages 1 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112651543A (zh) * | 2020-11-10 | 2021-04-13 | 沈阳工程学院 | 一种基于vmd分解与lstm网络的日用电量预测方法 |
CN112613636A (zh) * | 2020-11-25 | 2021-04-06 | 国网江苏省电力有限公司江阴市供电分公司 | 一种基于特征工程的XGboost风速短期预测方法 |
CN112991088A (zh) * | 2021-02-04 | 2021-06-18 | 国网浙江省电力有限公司 | 一种基于vmd-anfis-arima的月度电力需求预测方法 |
CN113344279A (zh) * | 2021-06-21 | 2021-09-03 | 河海大学 | 基于lstm-sam模型和池化的居民负荷预测方法 |
CN113344279B (zh) * | 2021-06-21 | 2022-03-01 | 河海大学 | 基于lstm-sam模型和池化的居民负荷预测方法 |
CN113536686A (zh) * | 2021-07-23 | 2021-10-22 | 河北工业大学 | 一种风速的概率模型的建模方法 |
CN113536686B (zh) * | 2021-07-23 | 2022-11-01 | 河北工业大学 | 一种风速的概率模型的建模方法 |
CN114252706A (zh) * | 2021-12-15 | 2022-03-29 | 华中科技大学 | 一种雷电预警方法和系统 |
CN114252706B (zh) * | 2021-12-15 | 2023-03-14 | 华中科技大学 | 一种雷电预警方法和系统 |
WO2023245701A1 (zh) * | 2022-06-23 | 2023-12-28 | 东南大学 | 一种基于状态空间法的热式风速传感器宏模型提取方法 |
CN117056735A (zh) * | 2023-10-13 | 2023-11-14 | 云南电投绿能科技有限公司 | 一种风电场的短期风速预测方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111582551B (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111582551B (zh) | 风电场短期风速预测方法、系统及电子设备 | |
Papaefthymiou et al. | MCMC for wind power simulation | |
Bivona et al. | Stochastic models for wind speed forecasting | |
Zhang et al. | Short term wind energy prediction model based on data decomposition and optimized LSSVM | |
CN112115648B (zh) | 一种基于改进深度学习方法的变压器顶层油温预测方法 | |
CN112651290A (zh) | 一种水电机组振动趋势预测方法和系统 | |
CN108717579B (zh) | 一种短期风电功率区间预测方法 | |
CN113159102B (zh) | 一种多时间尺度的光伏功率预测方法及系统 | |
CN114201924B (zh) | 基于迁移学习的太阳辐照度预测方法及预测系统 | |
CN116307291B (zh) | 一种基于小波分解的分布式光伏发电预测方法及预测终端 | |
CN116451848A (zh) | 一种基于时空注意力机制的卫星遥测数据预测方法及装置 | |
CN113984198B (zh) | 一种基于卷积神经网络的短波辐射预测方法及系统 | |
Kennedy et al. | A probabilistic model for simulating long-term wind-power output | |
Reddy et al. | Hybrid approach for short term wind power forecasting | |
Fu et al. | Multi-step-ahead significant wave height prediction using a hybrid model based on an innovative two-layer decomposition framework and LSTM | |
CN114266416A (zh) | 基于相似日的光伏发电功率短期预测方法、装置及存储介质 | |
CN111798055A (zh) | 基于灰色关联度的变权重组合光伏出力预测方法 | |
Zhu et al. | Wind Speed Short-Term Prediction Based on Empirical Wavelet Transform, Recurrent Neural Network and Error Correction | |
CN115577854A (zh) | 一种基于eemd-rbf组合的分位数回归风速区间预测方法 | |
CN114492944A (zh) | 基于TLBO-Elman的光伏电站短期发电功率预测方法、装置及存储介质 | |
CN113962432A (zh) | 一种融合三维卷积与轻量卷积门限单元的风电预测方法及系统 | |
CN113537573A (zh) | 基于双重时空特征提取的风电功率运行趋势预测方法 | |
CN114547976B (zh) | 基于金字塔变分自编码器的多采样率数据软测量建模方法 | |
El Bakali et al. | Data-Based Solar Radiation Forecasting with Pre-Processing Using Variational Mode Decomposition | |
CN116739172B (zh) | 一种基于爬坡识别的海上风电功率超短期预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |