CN106779226B - 一种基于混核机器学习的风机批功率预测方法 - Google Patents
一种基于混核机器学习的风机批功率预测方法 Download PDFInfo
- Publication number
- CN106779226B CN106779226B CN201611206434.2A CN201611206434A CN106779226B CN 106779226 B CN106779226 B CN 106779226B CN 201611206434 A CN201611206434 A CN 201611206434A CN 106779226 B CN106779226 B CN 106779226B
- Authority
- CN
- China
- Prior art keywords
- batch
- wind power
- wind
- sample
- power prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000010801 machine learning Methods 0.000 title claims abstract description 10
- 230000006870 function Effects 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 13
- 238000012843 least square support vector machine Methods 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 238000010248 power generation Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Operations Research (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Wind Motors (AREA)
Abstract
本发明提供一种基于混核机器学习的风机批功率预测方法,包括:建立风场风机离线历史数据库;将风场风机离线历史数据库中的风场每台风机的历史数据都划分为12个历史数据集合;对风场中的风机进行批划分处理;将每个批内与该批内风功率平均值最接近的风机作为批样机;建立不同月份的各批样机风功率预测模型;根据风场未来的气象信息对各批样机的风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值。本发明通过对气象数据和风功率数据进行收集,对风场不同批样机风功率进行预测,将高斯核函数和多项式核函数相结合作为核函数,具有更好的适应性,达到预测整个风场风功率的目的,为风场的电力调度提供保障。
Description
技术领域
本发明属于风场风功率预测技术领域,具体涉及一种基于混核机器学习的风机批功率预测方法。
背景技术
近年来,随着全球化石油能源的日益匮乏,日本地震带来的核电警示,以及温室气体排放的增加,风能成为了满足全球日渐增长的能源需求。因此,加快包括风电在内的安全性清洁能源产业的发展已日渐趋势。为了提高我国电网接受风电的能力以及提高风电场利用效率,我国国家能源局2011年7月颁布的《风电场功率预测预报管理暂行办法》规定,从2012年1月1日开始,所有已并网运行的风电场必须建立起风电功率预测预报体系和发电计划申报工作机制并开始试运行,以提高风电场与电力系统协调运行的能力,保障电网运行安全,而未按要求报送风电功率预测结果的风电场不得并网运行。因此,做好风力发电的预测和调控是风电并网稳定运行的重要条件。
风功率预测按照物理量进行划分,可以分为两类,一类是先预测风速,然后再预测风功率;另一类是直接对风功率进行预测。
按照时间尺度进行划分,风功率预测可以分为三个阶段预测,分别是超短期预测、短期预测、以及中长期预测。超短期预测指的是对6小时以内的风功率进行预测,主要是为了电力系统的优化;短期预测是针对于6-48小时的预测,主要用于电力系统的调度;中长期预测主要针对的是72小时以后的预测,主要是为了提前做好风场的检修计划。由于风力发电的特点是波动性和间歇性比较强,并网后对电网的冲击巨大。因此,在风场的实际应用中,主要是对风功率的超短期和短期进行预测。
按照预测原理的不同进行划分,风功率预测方法主要分为基于数值气象预报方法和基于历史数据的方法。专利号ZL201310422579.6的中国专利发明了一种基于数据特征提取的风功率预测误差估计方法,目的是为了估计风功率预测误差,进而降低大规模风电并网后对电网安全运行的不利影响,保证了电力系统的可靠运行。专利号ZL201410026591.X的中国专利发明了一种基于风功率预测不确定度的风电系统运行的控制方法,利用卷积计算的方法,结合了风功率的不确定性,能够准确求出备用需求,该计算方法具有普遍适用性。专利号ZL201310295998.8的中国专利发明了一种风功率预测误差识别方法,通过蒙特卡洛仿真方法和BP人工神经网络方法,解析了风功率预测误差的统计特性,从而减小日前发电计划误差。专利号ZL201010044821.7的中国专利发明了一套基于短期风功率预测的风电并网在线安全预警系统,利用自回归滑动平均方法建立短期风功率预测模型,实现对风电并网在线安全预警。上述方法利用了风功率误差信息、风功率的概率模型分布、以及传统的数据解析方法对风场风功率进行预测,并对预测的误差进行识别,但并没有结合风场中风机所在位置的分布情况进行风功率预测。
发明内容
针对现有技术存在的不足,本发明提供一种基于混核机器学习的风机批功率预测方法。
本发明的技术方案如下:
一种基于混核机器学习的风机批功率预测方法,包括:
步骤1、建立风场风机离线历史数据库;
步骤2、以每个月份为节点,将风场风机离线历史数据库中的风场每台风机的历史数据都划分为12个历史数据集合;
步骤3、针对不同月份,依据风场每台风机的地形地貌信息对风场中的风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;
步骤4、将每个批内与该批内风功率平均值最接近的风机作为批样机;
步骤5、利用各批样机的历史数据集合与历史风功率,建立不同月份的各批样机风功率预测模型;
步骤6、根据风场未来的气象信息,利用各批样机风功率预测模型对各批样机风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值。
所述步骤1,包括:
步骤1.1、获取风场风机离线历史数据,包括风场每台风机的地形地貌信息、气象信息、风功率、风场测风塔测得的风场风速;
地形地貌信息,包括:经度、纬度、海拔高度;
气象信息,包括:空气湿度、温度、风向、风场风速、气压;
步骤1.2、对风场风机离线历史数据中的异常数据进行剔除;
步骤1.3、对风场风机离线历史数据的缺失数据进行插值补全;
步骤1.4、根据风场风机离线历史数据构建风场风机离线历史数据库并定期更新。
所述步骤1.3,包括:
步骤1.3.1、选取风场风机离线历史数据中缺失的气象信息以及风功率;
步骤1.3.2、按照平均插值的方法,结合风场测风塔测得的有效风场风速,对气象信息中缺失的数据和风功率中缺失的数据进行补全。
所述步骤4,包括:
步骤4.1、统计各批内所含有风机的个数;
步骤4.2、选取与批内各风机平均功率最接近的风机作为批样机;
步骤4.3、定期对划分各批后的风机重新划分。
所述步骤5,包括:
步骤5.1、将各批样机的历史数据集合进行归一化处理;
步骤5.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,训练得到不同月份的各批样机风功率预测模型;
步骤5.3、通过各批样机风功率预测值与各批样机的实际风功率进行比较,判断误差是否在偏差范围以内:是,则进行步骤6,否则执行步骤5.4;
步骤5.4:对误差进行校正,将实时的气象信息和风功率加入到各批样机的历史数据集合中,执行步骤5.1。
所述步骤5.2,包括:
步骤5.2.1、采用最小二乘支持向量机方法建立不同月份的各批样机风功率预测模型;
步骤5.2.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,构建训练数据集,对各批样机风功率预测模型进行训练;
步骤5.2.3、将批样机风功率预测模型转化为最小化目标函数且带有等式约束的方程;
步骤5.2.4、构造拉格朗日函数,并对批样机风功率预测模型的回归系数、偏差、松弛变量以及拉格朗日乘子分别进行求导;
步骤5.2.5:将多项式核函数、高斯核函数相结合,以混核函数作为批样机风功率预测模型中的映射核函数;
步骤5.2.6:将求导后的各个方程组合成线性方程组,利用高斯消元法对线性方程组进行求解,求出批样机风功率预测模型的回归系数和偏差,最终得到各批样机风功率预测模型;
步骤5.2.7:对批样机风功率预测模型的惩罚系数、多项式核函数维数、高斯核函数中的参数、以及混核函数的系数进行优化。
所述步骤5.2.7,包括:
步骤5.2.7.1:初始化批样机风功率预测模型的惩罚系数、多项式核函数维数、高斯核函数中的参数、以及混核函数的系数,产生批样机风功率预测模型参数群体,确定群体规模,设置最大迭代次数、批样机风功率预测模型参数变异率、参数交叉概率;
步骤5.2.7.2:计算批样机风功率预测模型参数群体中每个个体对应的批样机风功率预测值,以批样机风功率预测模型输出的批样机风功率预测值与批样机风功率实际值均方根误差最小作为参数优化的目标函数;
步骤5.2.7.3:对群体中的每个个体,依据交叉概率进行变异,得到变异后的个体;
步骤5.2.7.4:分别将变异后的批样机风功率预测模型参数个体与未变异参数个体的目标函数值进行比较,目标函数值小的个体将作为新的参数个体进入后续的迭代搜索过程;
步骤5.2.7.5:判断终止条件是否满足:当迭代次数达到最大迭代次数时,满足终止条件,停止迭代,输出最优解即最优的批样机风功率预测模型参数,进而确定最终的各批样机风功率预测模型;否则,转步骤5.2.7.3,继续进行迭代。
有益效果:
本发明根据风场每台风机的地形地貌信息、气象信息、风功率、风场风速,建立风场风机离线历史数据库;再以每个月份为节点,将风场风机离线历史数据库中的历史数据划分为12个历史数据集合;针对不同月份,依据风场每台风机的地形地貌信息,对风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;将与该风机批内风功率平均值最接近的风机作为批样机;结合各批样机历史数据集合和各批样机风功率历史实际值,通过训练得到不同月份的各批样机风功率预测模型;根据风场未来的气象信息,利用各批样机风功率预测模型进行各批样机风功率预测,进而对各批风功率进行预测,最后获得风场总风功率。本发明在保证满足风场风机正常运行的前提下,对风场中的发电总功率进行预测,可以对风场的发电状况进行监测,克服了现场延时滞后的缺陷,提高了风功率的预测准确度,同时也提高了设备的利用率,降低了运行成本,为工作人员的进一步电网调度提供了有价值的参考信息,提高了企业的经济效益和社会效益。
通过对风场风机的气象数据和风功率数据进行收集,根据风功率的变化情况,替代了广泛使用的场平均和单机求和预测方法,对风场不同批内的批样机风功率进行预测,同时采用改进的最小二乘支持向量机方法进行建模,将高斯核函数和多项式核函数相结合作为本发明方法的核函数,并通过改进的差分进化方法对模型参数进行优化,使得各批样机风功率预测模型更加准确,具有更好的适应性,达到预测整个风场风功率的目的,为风场的电力调度提供了保障。
附图说明
图1为本发明具体实施方式的基于混核机器学习的风机批功率预测原理图;
图2为本发明具体实施方式的基于混核机器学习的风机批功率预测方法流程图;
图3为本发明具体实施方式的建立风场风机离线历史数据库流程图;
图4为本发明具体实施方式的风场风机地形地貌分布图;
图5为本发明具体实施方式的步骤4具体流程图;
图6为本发明具体实施方式的步骤5的流程图;
图7为本发明具体实施方式的步骤5.2的流程图;
图8为本发明具体实施方式的步骤5.2.7的流程图;
图9为本发明具体实施方式的风场总风功率预测值与实际值比较的曲线图。
具体实施方式
下面结合附图对本发明的具体实施方式做详细说明。
本发明预测原理如图1所示:首先通过获取的风场历史数据建立风场风机离线历史数据库,数据来源于气象局的气象数据、风机的地形地貌位置数据、测风塔实时数据以及发电设备的实时功率数据,然后将获得的数据按照月份进行分类,分成12个类别历史数据集合。针对不同月份,依据风场每台风机的地形地貌信息对风场中的风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;将每个批内与该批内风功率平均值最接近的风机作为批样机;利用各批样机的历史数据集合与历史风功率,建立不同月份的各批样机风功率预测模型;根据风场未来的气象信息,利用各批样机风功率预测模型对各批样机风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值,将预测结果提供给工作人员进行参考。现场的操作人员会结合风机运行系统的实时状态,将最终的风功率预测信息上报给风机的调度系统,进而对风场内的所有风机进行有效控制。
一种基于混核机器学习的风机批功率预测方法,如图2所示,包括:
步骤1、建立风场风机离线历史数据库;
所述步骤1,如图3所示,包括:
步骤1.1、获取风场风机离线历史数据,包括风场每台风机的地形地貌信息、气象信息、风功率、风场测风塔测得的风场风速;
地形地貌信息,包括:经度、纬度、海拔高度;
每台风机间隔15分钟获取气象信息,包括:空气湿度、温度、风向、风场风速、气压;
每台风机间隔15分钟获取风功率;
风场测风塔每间隔10分钟测量风场风速;
步骤1.2、对风场风机离线历史数据中的异常数据进行剔除;
步骤1.3、对风场风机离线历史数据的缺失数据进行插值补全;
所述步骤1.3,包括:
步骤1.3.1、以15分钟为基准选取风场风机离线历史数据中缺失的气象信息以及风功率;
步骤1.3.2、按照平均插值的方法,结合风场测风塔测得的有效风场风速,对气象信息中缺失的数据和风功率中缺失的数据进行补全。
设X={x1,x2,…xn}为全部的历史数据集合,其中i时刻历史数据样本xi∈X都具备6种信息:间隔15分钟的空气湿度、温度、风向、气压、风场风速、风功率。
如有数据缺失,则通过平均插值方法进行补全,利用缺失的历史数据样本xi相邻时刻的历史数据样本进行插值:
其中,xi+1为i+1时刻历史数据样本,xi-1为i-1时刻历史数据样本。
步骤1.4、根据风场风机离线历史数据构建风场风机离线历史数据库并定期更新。
步骤2、以每个月份为节点,将风场风机离线历史数据库中的风场每台风机的离线历史数据划分为12个历史数据集合,设集合{Q1,Q2,...,Q11,Q12}为12个历史数据集合;
步骤3、由于12个月中不同时期的季节性变化情况,依据风场每台风机的地形地貌信息对风场中的风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;
统计每台风机的地形地貌信息,包括经度、维度、海拔高度,按照地理位置的特点,如图4所示,对整个风场66台风机中正常运行的60台风机进行批划分,划分为6个批;
由于在采集数据期间风场中有限电的情况发生,并且存在一些故障的风机,其中包括:23#、35#、36#、39#、41#、42#风机停止运行,因此在本实施方式中划分批时不考虑这些风机;
步骤4、将每个批内与该批内风功率平均值最接近的风机作为批样机;
如图5所示,具体步骤如下:
步骤4.1、统计各批内所含有风机的个数;
步骤4.2、选取与批内各风机平均功率最接近的风机作为批样机,如表1所示:
表1批划分结果
步骤4.3、考虑到风机限电和故障风机的因素,定期对划分各批后的风机重新划分。
步骤5、利用各批样机的历史数据集合与历史风功率,建立不同月份的各批样机风功率预测模型;
所述步骤5,如图6所示,包括:
步骤5.1、将各批样机的历史数据集合进行归一化处理;
各批样机的历史数据集合:
其中zi1∈{z11,…,zn1}表示下一时刻批样机空气湿度、zi2∈{z12,…,zn2}表示下一时刻批样机温度、zi3∈{z13,…,zn3}表示下一时刻批样机风向、zi4∈{z14,…,zn4}表示下一时刻批样机气压、zi5∈{z15,…,zn5}表示下一时刻批样机风速、zi6∈{z16,…,zn6}表示当前时刻批样机风功率,zi7∈{z17,…,zn7}表示下一时刻批样机风功率,且n为训练数据个数;
xik为zik归一化后的结果:
其中,z.k表示(.表示所有行的第k列数据)矩阵中第k列上的所有数据,z.k为矩阵中第k列数据均值,得到归一化后数据矩阵:
步骤5.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,训练得到不同月份的各批样机风功率预测模型;
如图7所示,具体步骤如下:
步骤5.2.1、采用最小二乘支持向量机方法建立不同月份的各批样机风功率预测模型:
P1(t+1)=PJH1{S(t),T(t),D(t),Y(t),F(t),P(t)} (5)
P2(t+1)=PJH2{S(t),T(t),D(t),Y(t),F(t),P(t)} (6)
P3(t+1)=PJH3{S(t),T(t),D(t),Y(t),F(t),P(t)} (7)
P4(t+1)=PJH4{S(t),T(t),D(t),Y(t),F(t),P(t)} (8)
P5(t+1)=PJH5{S(t),T(t),D(t),Y(t),F(t),P(t)} (9)
P6(t+1)=PJH6{S(t),T(t),D(t),Y(t),F(t),P(t)} (10)
其中,S(t)为下一时刻的批样机湿度、T(t)为下一时刻的批样机温度、D(t)为下一时刻的批样机风向、Y(t)为下一时刻批样机气压、F(t)为下一时刻的批样机风速、P(t)为当前时刻批样机风功率、Pi(t+1)为下一时刻各批样机风功率预测值、PJHi{}为各批样机风功率预测模型,其中i=1,...,6;
步骤5.2.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,构建训练数据集,对各批样机风功率预测模型进行训练;
构造批样机风功率预测模型:
其中,N为训练数据的个数,每个训练数据xi中包含批样机风功率预测模型下一时刻的历史数据信息,表示将批样机风功率预测模型的输入数据xi从低维映射到高维特征空间,f(xi)为下一时刻批样机风功率,w为批样机风功率预测模型的回归系数,b为批样机风功率预测模型的偏差;
步骤5.2.3、将批样机风功率预测模型转化为最小化目标函数且带有等式约束的方程,即:
步骤5.2.4:构造公式(12)的拉格朗日函数,即:
对批样机风功率预测模型的回归系数w、偏差b、松弛变量ξi以及拉格朗日乘子αi分别进行求导如公式(14)所示:
步骤5.2.5:由于特征空间的维数可能非常高,因此采用核函数其中xi和xi分别为批样机风功率预测模型的输入数据,将多项式核函数高斯核函数σ2>0相结合,以混核函数K(xi,xj)=a1K1(xi,xj)+b2K2(xi,xj)作为批样机风功率预测模型中的映射核函数,其中a1+b2=1,a1≥0,b2≥0;
步骤5.2.6:将求导后的各个方程组合成线性方程组,利用高斯消元法对线性方程组进行求解,求出批样机风功率预测模型的回归系数和偏差,最终得到各批样机风功率预测模型;
步骤5.2.7:利用改进的差分进化算法对批样机风功率预测模型的惩罚系数γ、多项式核函数维数d、高斯核函数中的参数σ、以及混核函数K(xi,xj)=a1K1(xi,xj)+b2K2(xi,xj)的系数a1或b2进行优化;由于a1+b2=1故只须求得其中一个参数就可推算出另一个参数的取值;
如图8所示,具体步骤如下:
步骤5.2.7.1:初始化批样机风功率预测模型的上述各参数γ、σ、d、a1(b2),产生有np个批样机风功率预测模型参数群体,确定群体规模np为100,每个参数群体中的个体为其中v=1,2,...np,z=1,2,...k,k为4(即需要对批样机风功率预测模型优化的参数个数:批样机风功率预测模型的惩罚系数γ、多项式核函数维数d、高斯核函数中的参数σ、以及混核函数K(xi,xj)=a1K1(xi,xj)+b2K2(xi,xj)的系数a1或b2),设置最大迭代次数为gmax为20,批样机风功率预测模型参数变异率F为0.5+0.5*rand(0,1),rand(0,1)为0-1的随机数,参数交叉概率CR为0.7,设当前代数为g为0代;
步骤5.2.7.2:计算批样机风功率预测模型参数群体中每个个体对应的风功率预测值,以批样机风功率预测模型输出的风功率预测值与批样机风功率实际值均方根误差最小作为参数优化的目标函数;
其中r1、r2、r3和r4是从参数群体中随机选择的互不相同的4个整数,Rv,z为0-1的随机数;
目标函数值小的个体将作为新的参数个体进入后续的迭代搜索过程;
步骤5.2.7.5:判断终止条件是否满足:当迭代次数达到最大迭代次数gmax时,满足终止条件,停止迭代,输出最优解即最优的批样机风功率预测模型参数,进而确定最终的各批样机风功率预测模型。否则,转步骤5.2.7.3,设置g=g+1,继续进行迭代;
步骤5.3、通过各批样机风功率预测值与各批样机的实际风功率进行比较,判断误差是否在偏差范围以内:是,则进行步骤6,否则执行步骤5.4;
步骤5.4:对误差进行校正,将实时的气象信息和风功率加入到各批样机的历史数据集合中,执行步骤5.1;
步骤6、根据风场未来的气象信息,利用各批样机风功率预测模型对各批样机风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值,达到预测整个风场风功率的目的;
步骤6.1、对各批样机与各批内的风机个数相乘得到历史各批风功率:
Pi=Pi′*wi,i∈{1,2,3,4,5,6} (17)
步骤6.2、将各批风功率预测值求和,得到风场总风功率预测值P总:
P总=P1+P2+P3+P4+P5+P6 (18)
其中Pi为批i的风功率预测值,Pi′为批i的批样机风功率,wi为批i的风机个数,P总为风场总风功率预测值。
图9为本发明具体实施方式针对于某风场3天的风场总风功率预测值与实际值的曲线图。表2显示了本发明具体实施方式计算得到批划分的风场总风功率预测值与实际值的比较结果。
表2 批划分的风场总风功率预测值与实际值的比较结果
时刻(15min) | 实际值(MW) | 预测值(MW) |
1 | 9.55 | 9.69 |
2 | 7.85 | 10.35 |
3 | 10.71 | 10.59 |
4 | 11.25 | 11.55 |
5 | 7.23 | 10.22 |
… | … | … |
101 | 38.66 | 34.58 |
102 | 35.18 | 33.73 |
103 | 38.66 | 33.41 |
… | … | … |
286 | 39.11 | 32.78 |
287 | 38.58 | 30.85 |
288 | 29.38 | 25.67 |
如表3所示,基于某风场的实际生产数据,通过与场平均方法(利用整个风场的测风塔数据、气象数据,以及风场整个风功率,与本发明方法区别是它不考虑每台风机,只根据整个风场的历史数据对风功率进行预测)、单机求和方法(考虑风场的每台风机的特性,对风场的每台风机进行预测,最后通过求和得到风场的总风功率)进行比较,批划分的方法对于风场风功率预测来说更有效。其中风功率的均方根误差为5.40,平均相对误差为0.18,最大误差为17.41MW,预测准确度(计算公式如下所示)为95%,运行时间为0.47s。
其中:pMk为k时段的实际平均功率,ppk为k时段预测平均功率,N为日预报总时段数,这里N为288(相当于3天内15分钟的总时刻),Cap为风电场运行装机容量,这里Cap为99MW。
综上所述风场风功率的均方根误差控制在6以内,平均相对误差控制在0.2范围以内,最大误差控制在20MW范围以内,预测准确度在94%以上,运行时间在1s以内,证明了该方法能够帮助风场提高风功率预测的命中率,进行科学合理的发电,避免造成成本增加,进而帮助风场减少能源消耗。因此该方法不仅使操作人员能够进行风场的风机管理与维护,还可为日后进行风场风机调度提供参考值,进一步提高风场的运行管理,使风场风机在安全稳定的环境下运行。
表3 本发明、场平均以及单机求和方法性能比较结果
Claims (1)
1.一种基于混核机器学习的风机批功率预测方法,其特征在于,包括:
步骤1、建立风场风机离线历史数据库;
步骤2、以每个月份为节点,将风场风机离线历史数据库中的风场每台风机的离线历史数据都划分为12个历史数据集合;
步骤3、针对不同月份,依据风场每台风机的地形地貌信息对风场中的风机进行批划分处理,将风场中地理位置相近的风机划分到同一个批;
步骤4、将每个批内与该批内风功率平均值最接近的风机作为批样机;
步骤5、利用各批样机的历史数据集合与历史风功率,建立不同月份的各批样机风功率预测模型;
步骤6、根据风场未来的气象信息,利用各批样机风功率预测模型对各批样机风功率预测,将各批样机风功率预测值与所在批内风机个数相乘并求和,得到风场总风功率预测值;
所述步骤1,包括:
步骤1.1、获取风场风机离线历史数据,包括风场每台风机的地形地貌信息、气象信息、风功率、风场测风塔测得的风场风速;
地形地貌信息,包括:经度、纬度、海拔高度;
气象信息,包括:空气湿度、温度、风向、风场风速、气压;
步骤1.2、对风场风机离线历史数据中的异常数据进行剔除;
步骤1.3、对风场风机离线历史数据的缺失数据进行插值补全;
步骤1.4、根据风场风机离线历史数据构建风场风机离线历史数据库并定期更新;
所述步骤1.3,包括:
步骤1.3.1、选取风场风机离线历史数据中缺失的气象信息以及风功率;
步骤1.3.2、按照平均插值的方法,结合风场测风塔测得的有效风场风速,对气象信息中缺失的数据和风功率中缺失的数据进行补全;
所述步骤4,包括:
步骤4.1、统计各批内所含有风机的个数;
步骤4.2、选取与批内各风机平均功率最接近的风机作为批样机;
步骤4.3、定期对划分各批后的风机重新划分;
所述步骤5,包括:
步骤5.1、将各批样机的历史数据集合进行归一化处理;
步骤5.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,训练得到不同月份的各批样机风功率预测模型;
步骤5.3、通过各批样机风功率预测值与各批样机的实际风功率进行比较,判断误差是否在偏差范围以内:是,则进行步骤6,否则执行步骤5.4;
步骤5.4:对误差进行校正,将实时的气象信息和风功率加入到各批样机的历史数据集合中,执行步骤5.1;
所述步骤5.2,包括:
步骤5.2.1、采用最小二乘支持向量机方法建立不同月份的各批样机风功率预测模型;
步骤5.2.2、将各批样机的历史数据集合作为输入,对应的历史各批样机风功率作为输出,构建训练数据集,对各批样机风功率预测模型进行训练;
步骤5.2.3、将批样机风功率预测模型转化为最小化目标函数且带有等式约束的方程;
步骤5.2.4、构造拉格朗日函数,并对批样机风功率预测模型的回归系数、偏差、松弛变量以及拉格朗日乘子分别进行求导;
步骤5.2.5:将多项式核函数、高斯核函数相结合,以混核函数作为批样机风功率预测模型中的映射核函数;
步骤5.2.6:将求导后的各个方程组合成线性方程组,利用高斯消元法对线性方程组进行求解,求出批样机风功率预测模型的回归系数和偏差,最终得到各批样机风功率预测模型;
步骤5.2.7:对批样机风功率预测模型的惩罚系数、多项式核函数维数、高斯核函数中的参数、以及混核函数的系数进行优化;
所述步骤5.2.7,包括:
步骤5.2.7.1:初始化批样机风功率预测模型的惩罚系数、多项式核函数维数、高斯核函数中的参数、以及混核函数的系数,产生批样机风功率预测模型参数群体,确定群体规模,设置最大迭代次数、批样机风功率预测模型参数变异率、参数交叉概率;
步骤5.2.7.2:计算批样机风功率预测模型参数群体中每个个体对应的批样机风功率预测值,以批样机风功率预测模型输出的批样机风功率预测值与批样机风功率实际值均方根误差最小作为参数优化的目标函数;
步骤5.2.7.3:对群体中的每个个体,依据交叉概率进行变异,得到变异后的个体;
步骤5.2.7.4:分别将变异后的批样机风功率预测模型参数个体与未变异参数个体的目标函数值进行比较,目标函数值小的个体将作为新的参数个体进入后续的迭代搜索过程;
步骤5.2.7.5:判断终止条件是否满足:当迭代次数达到最大迭代次数时,满足终止条件,停止迭代,输出最优解即最优的批样机风功率预测模型参数,进而确定最终的各批样机风功率预测模型;否则,转步骤5.2.7.3,继续进行迭代。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611206434.2A CN106779226B (zh) | 2016-12-23 | 2016-12-23 | 一种基于混核机器学习的风机批功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611206434.2A CN106779226B (zh) | 2016-12-23 | 2016-12-23 | 一种基于混核机器学习的风机批功率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106779226A CN106779226A (zh) | 2017-05-31 |
CN106779226B true CN106779226B (zh) | 2020-09-29 |
Family
ID=58919760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611206434.2A Active CN106779226B (zh) | 2016-12-23 | 2016-12-23 | 一种基于混核机器学习的风机批功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106779226B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107992970B (zh) * | 2017-12-06 | 2021-10-26 | 北京金风慧能技术有限公司 | 风力发电机组的输出功率预测方法和设备 |
CN108563739B (zh) * | 2018-04-11 | 2021-05-04 | 平安科技(深圳)有限公司 | 天气数据获取方法及装置、计算机装置及可读存储介质 |
CN108564386B (zh) * | 2018-04-28 | 2020-06-02 | 腾讯科技(深圳)有限公司 | 商户识别方法及装置、计算机设备及存储介质 |
CN108764534B (zh) * | 2018-05-07 | 2021-12-03 | 湖北工业大学 | 一种基于改进粒子群的风力发电功率预测方法 |
CN109376426B (zh) * | 2018-10-23 | 2023-04-07 | 株洲中车时代电气股份有限公司 | 一种风电并网功率调度方法及装置 |
CN111080009B (zh) * | 2019-12-13 | 2021-04-16 | 北京瑞莱智慧科技有限公司 | 基于时间序列的数据预测及补全方法、装置、介质和设备 |
CN111178601B (zh) * | 2019-12-18 | 2024-03-26 | 上海能源科技发展有限公司 | 一种基于气象数据后处理的风电机组功率预测方法 |
CN111667093B (zh) * | 2020-04-22 | 2023-10-24 | 华北电力科学研究院有限责任公司 | 中长期风电发电计算方法及装置 |
CN112018764A (zh) * | 2020-09-07 | 2020-12-01 | 华北电力大学(保定) | 定制化风功率预测方法、预测装置、测风装置和设备 |
CN112348292B (zh) * | 2021-01-07 | 2021-08-06 | 中国电力科学研究院有限公司 | 一种基于深度学习网络的短期风电功率预测方法和系统 |
CN112835951A (zh) * | 2021-01-12 | 2021-05-25 | 平安科技(深圳)有限公司 | 数据预测方法、装置、计算机设备及存储介质 |
CN113051845B (zh) * | 2021-03-15 | 2023-03-07 | 西安热工研究院有限公司 | 在役山地风电场实时风资源可视化评估方法、系统、设备及存储介质 |
CN113364056B (zh) * | 2021-06-17 | 2023-12-12 | 国网江苏电力设计咨询有限公司 | 一种海上风电场调频模式下的有功控制方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101789000A (zh) * | 2009-12-28 | 2010-07-28 | 青岛朗讯科技通讯设备有限公司 | 搜索引擎中的模式分类方法 |
CN101902523A (zh) * | 2010-07-09 | 2010-12-01 | 中兴通讯股份有限公司 | 一种移动终端及其短信的过滤方法 |
CN104899665A (zh) * | 2015-06-19 | 2015-09-09 | 国网四川省电力公司经济技术研究院 | 风电功率短期预测方法 |
-
2016
- 2016-12-23 CN CN201611206434.2A patent/CN106779226B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101789000A (zh) * | 2009-12-28 | 2010-07-28 | 青岛朗讯科技通讯设备有限公司 | 搜索引擎中的模式分类方法 |
CN101902523A (zh) * | 2010-07-09 | 2010-12-01 | 中兴通讯股份有限公司 | 一种移动终端及其短信的过滤方法 |
CN104899665A (zh) * | 2015-06-19 | 2015-09-09 | 国网四川省电力公司经济技术研究院 | 风电功率短期预测方法 |
Non-Patent Citations (1)
Title |
---|
考虑风力发电批特征的电力机组调度问题;郎劲等;《自动化学报》;20150715;第41卷(第7期);第1295-1305页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106779226A (zh) | 2017-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106779226B (zh) | 一种基于混核机器学习的风机批功率预测方法 | |
CN113937763B (zh) | 风电功率预测方法、装置、设备及存储介质 | |
CN102663513B (zh) | 利用灰色关联度分析的风电场功率组合预测建模方法 | |
CN106875033B (zh) | 一种基于动态自适应的风电集群功率预测方法 | |
CN109086928B (zh) | 基于saga-fcm-lssvm模型的光伏电站实时功率预测方法 | |
CN102496927A (zh) | 基于误差统计修正的风电场功率预测方法 | |
CN110766200A (zh) | 一种基于K-means均值聚类的风电机组发电功率预测方法 | |
CN110601250B (zh) | 一种基于新能源电站接入点静态电压稳定性评估方法 | |
CN109787295B (zh) | 一种计及风电场状态的风电功率超短期预测计算方法 | |
CN112580874A (zh) | 一种基于随机森林算法和tcn的短期风电功率预测方法 | |
CN113205210A (zh) | 复杂地形风电场风速与功率预测方法、系统、设备及存储介质 | |
CN110263998A (zh) | 多源数值天气预报集合双层修正方法 | |
CN112862274A (zh) | 一种基于WRF-LES和DeepAR相结合的风功率预测方法 | |
CN112884601A (zh) | 一种基于天气区划策略的电力系统运行风险评估方法 | |
CN114819374A (zh) | 区域新能源超短期功率预测方法及系统 | |
Buonanno et al. | Comprehensive method for modeling uncertainties of solar irradiance for PV power generation in smart grids | |
CN117060407B (zh) | 一种基于相似日划分的风电集群功率预测方法及系统 | |
CN113988421A (zh) | 基于深度学习的风电机组功率智能预测方法 | |
CN113991651A (zh) | 一种考虑新能源不确定性的电网静态电压稳定裕度概率预测方法 | |
CN111242371B (zh) | 一种基于非迭代多模型的光伏发电短期预测校正方法 | |
CN115081681B (zh) | 一种基于prophet算法的风电功率预测方法 | |
TW201740296A (zh) | 再生能源發電量預測方法與系統 | |
Jiangxia et al. | A combination prediction model for wind farm output power | |
CN115577854A (zh) | 一种基于eemd-rbf组合的分位数回归风速区间预测方法 | |
CN113554203B (zh) | 基于高维网格化和LightGBM的风电预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |