CN107944622A - 基于连续时段聚类的风电功率预测方法 - Google Patents
基于连续时段聚类的风电功率预测方法 Download PDFInfo
- Publication number
- CN107944622A CN107944622A CN201711167328.2A CN201711167328A CN107944622A CN 107944622 A CN107944622 A CN 107944622A CN 201711167328 A CN201711167328 A CN 201711167328A CN 107944622 A CN107944622 A CN 107944622A
- Authority
- CN
- China
- Prior art keywords
- power
- prediction
- wind
- ave
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013277 forecasting method Methods 0.000 title abstract 2
- 239000013598 vector Substances 0.000 claims abstract description 79
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 9
- 238000012706 support-vector machine Methods 0.000 claims abstract description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 13
- 238000005259 measurement Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 3
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 3
- 238000007635 classification algorithm Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 229910000831 Steel Inorganic materials 0.000 claims description 2
- 239000010959 steel Substances 0.000 claims description 2
- 238000010408 sweeping Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 claims 1
- 229910052731 fluorine Inorganic materials 0.000 claims 1
- 125000001153 fluoro group Chemical group F* 0.000 claims 1
- 229910052739 hydrogen Inorganic materials 0.000 claims 1
- 239000001257 hydrogen Substances 0.000 claims 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims 1
- 238000010248 power generation Methods 0.000 abstract description 3
- 238000010801 machine learning Methods 0.000 abstract description 2
- 230000007935 neutral effect Effects 0.000 abstract 2
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 238000000053 physical method Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Water Supply & Treatment (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明涉及机器学习和风力发电领域,特别涉及基于连续时段聚类的风电功率预测方法。包括,在基于相似日预测方法的基础上,分别采用Elman神经网络和支持向量机作为预测模型,进行迭代预测,确定相似时段长度:结合功率向量和气象信息,根据相似时段长度,通过两阶段搜索策略,确定相似度衡量标准,在历史数据中寻找最佳相似时段集合;基于Elman神经网络,创建风电功率预测模型,将所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。本发明在相似日预测方法的基础上引入气象因素,采用基于聚类‑分类的相似时段选取策略,可以快速地寻找最佳相似时段集合,提高预测精度和准确率。
Description
技术领域
本发明涉及机器学习和风力发电领域,特别涉及基于连续时段聚类的风电功率预测方法。
背景技术
随着世界能源的减少,可再生新能源的研发和利用成为当务之急。风能具有范围广、可再生和无污染等优点,逐步成为最具发展前景的能源。但自然风具有随机性和间歇性,大规模风电集中接入时会对电网的安全稳定运行带来威胁,风电功率预测是解决这一难题的有效途径。
常用的风电功率预测方法有物理法和统计法,物理法不依赖风电场的历史数据,只需要风电场详细的物理信息和数字天气预报数据对风电场所在地进行物理建模。但由于风电场输出功率受到当地环境因素的影响,且不同时刻的地理环境因素有较大的差异,导致物理法普适性较差,很难推广。统计法则利用学习模型,在历史数据中获取输入数据(风速、风向、天气类型等)与风功率之间的映射关系,比较常见的方法有人工神经网络和支持向量机等。但由于电力系统及风速均为复杂的非线性动态过程,很难准确地描述实际情况。
基于相似日的预测作为一种有效方法,已被广泛应用到负荷预测和光伏预测中,并取得了不错的效果,一些学者也尝试将其引入到风电功率预测中。通过对历史风速数据进行无监督聚类来选择相似日,解决了聚类中存在的硬划分的问题。但无监督聚类方法对样本的依赖性较大,容易产生过多的分类,预测的精度难以保障;通过将相似日细分为“相似时段”,先寻找预测时刻前12h变化相似的风电功率曲线作为“基准段”,再寻找与预测时刻后12h变化相似的日特征向量作为“预测段”,实现了层次预测,但在建立模型时,只考虑到了相似日功率之间的对应关系,并没有考虑到基准功率曲线和气象特征值的影响。
发明内容
针对上述问题,本发明提出了基于连续时段聚类的风电功率预测方法,包括:
步骤1:在相似日预测方法的基础上,选择过去一年的历史功率值集合为训练集,未来3个月的功率值集合为测试集,采用Elman神经网络和支持向量机作为预测模型,分别进行迭代预测,根据不同长度的相似时段预测误差,确定相似时段长度;
步骤2:结合历史功率和气象信息,根据步骤1所得的相似时段长度,采用两阶段搜索策略,在第一阶段搜索时,首先在历史功率和气象信息中提取功率向量、气象特征向量,其次,对所有功率向量进行特征提取,并采用K-means算法进行聚类,最后,通过对功率向量进行分类,确定其所属的类簇;在第二阶段搜索时,结合气象信息确定相似度衡量标准,在历史气象数据中寻找最佳相似时段集合;
步骤3:基于Elman神经网络,创建风电功率预测模型,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。
所述步骤1具体包括:将相似时段长度分别设置为6、12、18和24小时,每日的功率误差eMAPE为:
其中,pi为实际功率;为预测功率;pcap为风机开机容量;Np为每日预测数据个数,
预测模型的平均功率误差为:
其中,Mp为预测天数,是第j日的误差结果,
根据得到的不同长度的相似时段预测误差,选择相似时段长度为12h。
所述步骤2具体包括:结合功率向量与气象信息,构建特征向量Xi为:
其中,N=L×D,D是每小时功率数据个数,L为相似时段长度;xi1,...,xiN为功率向量的连续N个功率值;M为功率向量区间个数;为每个区间的平均值,M取4或者6;和分别为xi1,...,xiN中的最小、最大和平均功率值,
采用K-means方法对特征向量集合进行聚类,集合中元素Xi和Xj之间的距离d(Xi,Xj)为:
d(Xi,Xj)=1-rij (3a)
其中,rij是Xi和Xj的皮尔逊系数;和分别表示Xi和Xj的均值;和是Xi和Xj的第t个分量,T为Xi的模,T=N+M+3,类簇个数KM决定着聚类结果,KM取值范围为9至20;
采用自适应KNN算法进行分类,特征向量Xi作为分类算法的样本数据,将当前时刻前L小时功率数据定义为基准向量XB,作为分类的目标向量,应用公式(3),计算目标向量与所有类簇之间的距离,选取距离最小的类簇作为分类结果;
风力机捕获功率P为:
其中,Cp为风轮功率系数;ρair为空气密度;S为扫过风机叶片的面积;Vwind为风速,
选取预测时刻之后L小时内的气象数据,构造气象特征向量W为:
W={Vmax,Vmin,Vave,sinθave,cosθave,Pave,Have,Tave}
其中,Vmax为最大风速值;Vmin为最小风速值;Vave为平均风速值;sinθave为平均风向的正弦值;cosθave为平均风向的余弦值;Pave为平均压强值;Have为平均湿度,Tave为平均温度,
结合曲线趋势相似性和气象特征向量的物理相似性,确定相似度衡量标准SiB为:
SiB=1-[αd(XB,Xi)+(1-α)D(WB,Wi)] (5)
其中,α为权重系数;XB为基准特征向量;Xi为类簇Clusterf中的元素;WB为XB之后L小时的基准气象特征向量;Wi为Xi之后L小时的气象特征向量;d(·)为公式(3a)中的距离;D(·)为气象特征向量间的距离,选择欧式距离,并预先对其进行归一化处理,
采用公式(5),计算基准特征向量XB与类簇Clusterf中所有元素的相似程度,排序后选取其中数值最大的Nf个元素为最佳相似时段集合Sf。
所述步骤3具体包括:所述风电功率预测模型的输入向量包含两部分,一是预测时刻的气象信息,包括风速、风向正弦,风向余弦、气压、湿度和温度值,二是预测时刻之前L小时的功率向量,风电功率预测模型的输出值为预测时刻对应的功率值,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。
所述步骤2具体还包括:分类结果评价标准定义为目标样本与其所属类簇中所有样本的平均距离
其中,d(·)是公式(3)中距离公式,Xj是类簇中的元素,是其样本总数,KM取值为13。
有益效果
本发明针对风力发电不具有明显日周期性的特点,基于相似日的预测方法,提出了基于相似时段聚类的风电功率预测方法,与相似日相比,相似时段能够从历史数据中挖掘出更多有价值的信息;气象因素的引入有助于提高功率预测的准确性;基于聚类-分类的相似时段选取策略可以快速地寻找最优集合,提高了预测精度和准确率。
附图说明
图1为相似时段与相似日示意图;
图2为历史功率向量示意图;
图3为Elman神经网络结构图;
图4功率预测过程示意图;
图5类簇中的功率曲线示意图;
图6不同α取值时功率预测误差曲线示意图。
具体实施方式
下面结合附图,对实施例作详细说明。
实施例1
如图1所示,直接应用传统的基于相似日的方法进行风电功率预测,效果不甚理想。如果以日为单位分析数据,则上方的功率曲线由于与目标功率曲线相似程度较低会被忽略,造成信息丢失。但适当缩短时间周期后,则可挖掘历史数据中蕴含着有效信息。相似时段长度的选择非常关键,时间尺度过长,则会引入无关的数据,致使预测过程耗时且准确率降低。反之,则无法体现功率曲线的变化趋势及潜在的规律信息。
以贵州地区某风电场为研究对象,实验数据取自2015年9月至2016年12月期间贵州省某风电场的运行数据,天气预报数据来源于NWP。
结合功率向量与气象信息,构建新的特征向量为:
其中,N=L*D,D是每小时功率数据个数,xi1,...,xiN为功率向量Pi的连续N个功率值。M是将Pi细分的区间个数,用以表达功率的走向趋势,是每个区间的平均值,M可以取4或者6。和分别表示Pi的最小、最大和平均功率;H为功率的间隔
实验过程中,模型参数设置为:L=12,H=6,D=4,M=4。
分别采用Elman神经网络和支持向量机作为预测模型,对未来24小时的功率值,分辨率为15min,进行迭代预测。相似时段长度分别设置为6、12、18和24小时,预测模型参数如表1所示。
表1预测模型参数
选择2015年9月至2016年9月的数据作为训练集,10月至12月的数据作为测试集,
每日的功率误差eMAPE为:
其中,pi为实际功率;为预测功率;pcap为风机开机容量,Np为每日预测数据个数,预测模型的平均功率误差为:
其中,Mp为预测天数,是第j日的误差结果。
表2是上述两种模型的预测误差统计结果,
表2月平均误差率统计结果
根据表2数据显示,相似时段长度为12h时两种模型的预测效果均为最好,。从不同长度的相似时段预测误差上来看,Elman神经网络要低于SVM,说明Elman神经网络对于拟合波动性较强的风功率值具有更好的适应性。
在第一阶段搜索时,首先在历史功率和气象数据中以间隔H小时提取长度为L小时的功率向量、气象特征向量和长度为12小时的气象特征向量,如图2所示。其中L为相似时段长度,H<=L为提取间隔,当H=L时,提取的功率向量间没有重复,当H<L时,功率向量间有重复部分,且H越小重叠部分越多。其次,对所有功率向量进行特征提取,并采用K-means算法进行聚类。最后,将当前时刻前L小时功率数据定义为基准功率向量,通过对基准功率向量进行分类,确定其所属的类簇。
当进行第二阶段搜索时,结合气象因素特征确定的相似度衡量标准,针对类簇中若干功率向量,选择与预测日距离最近的功率向量作为最优相似时段集合。
集合中两个元素Xi和Xj之间的距离定义为:
d(Xi,Xj)=1-rij (3a)
其中,rij是Xi和Xj的皮尔逊系数,和分别表示Xi和Xj的均值,和是Xi和Xj的第t个分量,T为Xi的模,T=N+M+3。
采用K-means方法对上述特征向量集合进行聚类,对扩展向量聚类后,寻找相似时段转变为对基准向量PB进行分类的问题。选择自适应K-NN方法完成分类过程,具体步骤为:
(1)将历史特征向量Xi作为分类算法的样本数据,由PB构造新的基准向量XB,作为分类的目标向量;
(2)应用公式(3),计算目标向量与所有类簇之间的距离,选取距离最小的类簇作为分类结果。
由于受到地势和气候的影响,风电功率不仅仅受风速的影响,风力机捕获功率可用下式表示:
其中,P代表风力机捕获功率,Cp代表风轮功率系数,ρair代表空气密度,S代表扫过风机叶片的面积,Vwind代表风速。
由式(4)可知,除了风速外,风力机捕获功率还受风向、温度和气压等因素影响,其中风向决定着扫过风机叶片的面积的大小,而温度、湿度和气压会改变空气密度。选取预测时刻之后L小时内的气象数据,构造气象特征向量为:
W={Vmax,Vmin,Vave,sinθave,cosθave,Pave,Have,Tave}
其中,Vmax为最大风速值;Vmin为最小风速值;Vave为平均风速值;sinθave为平均风向的正弦值;cosθave为平均风向的余弦值;Pave为平均压强值;Have为平均湿度,Tave为平均温度。
结合曲线趋势相似性和气象特征向量的物理相似性,确定相似度衡量标准SiB为:
SiB=1-[αd(XB,Xi)+(1-α)D(WB,Wi)] (5)
其中,α为权重系数;XB为基准特征向量;Xi为类簇Clusterf中的元素;WB为XB之后L小时的基准气象特征向量;Wi为Xi之后L小时的气象特征向量;d(·)为公式(3a)中的距离;D(·)为气象特征向量间的距离,选择欧式距离,并预先对其进行归一化处理。
采用公式(5),计算基准特征向量XB与类簇Clusterf中所有元素的相似程度,排序后选取其中数值最大的Nf个元素为最佳相似时段集合Sf。
Elman神经网络是一种典型的动态神经网络,由输入层、隐含层、承接层和输出层组成,网络结构如图3所示。承接层通过记忆隐含层在前一时刻的输出值来进行信号的反馈,增加了网络处理动态信息的能力,对于处理波动性较大的风电功率数据具有很好的适应性。
基于Elman神经网络,建立风电功率预测模型,所述预测模型的输入向量包含两部分,一是预测时刻的气象预报信息,包括风速、风向正弦,风向余弦、气压、湿度和温度值,二是预测时刻之前L小时的功率向量,而模型的输出为预测时刻对应的功率值。
在进行风电功率短期预测时,采用迭代方式逐一时刻预测未来的功率值,预测过程如图4所示。每次迭代过程中,首先寻找最佳相似时段集合Sf,然后将其作为训练集完成预测模型的建立,再应用Elman神经网络得到下一时刻的功率值。
类簇个数KM决定着聚类结果,进而影响相似时段选取质量。为了设置最佳KM值,选取2015年9月至2016年9月的数据进行聚类实验,采用2016年10月至12月的数据作为分类测试样本。结合实际风电运行情况和专业人员经验,KM取值范围设定为9至20,分别独立完成实验过程,分类结果评价标准定义为目标样本与其所属类簇中所有样本的平均距离公式为:
其中d(·)是公式(3)中距离公式,Xj是类簇中的元素,是其样本总数。
结果如表3所示:
表3不同迭代间隔不同聚类数量下的平均分类距离
由表3可以看出,当KM取值较小时,彼此相似度较低的个体被归为同一个类簇,导致分类效果不够理想。随着KM值增加,结果逐渐改善,但KM增加到一定数值时,过多的类簇会干扰目标样本的分类效果,使其不能准确地归为所属类簇。实验数据表明,KM取13时,总体效果最理想,图5是其中两个类簇的样本曲线,两类曲线波动趋势差异较大,说明了聚类结果区分明显。
分析历史数据可知,相同的气象条件下功率曲线存在差异,而不同的气象条件也可能得到相似的功率曲线。仍然以2016年10月至12月作为测试阶段,分别为α设置不同的数值,重复执行相似时段选取过程,对应功率预测误差如图6所示。
从图6可以看出,仅考虑功率曲线的效果优于仅考虑气象因素,但两者都不够理想。主要原因是选取相似时段时功率曲线比气象因素具有更高的参考价值,统计结果表明功率曲线相似时气象因素也相似的概率大于气象因素相似时功率曲线也相似的概率。因此,功率曲线权重较大时,分类效果更好,尤其是α=0.7时达到最佳。
Elman神经网络模型的输入直接影响着功率预测效果,为了分析不同模型的预测性能,将模型输入只包含功率向量的算法称为Elman-P,只包含气象因素的算法称为Elman-W,同时包含功率向量和气象因素的算法称之为Elman-PW。独立地应用三种预测算法,对2016年10月至12月期间进行功率预测,预测误差如表4所示。
表4不同模型的预测结果
从平均误差来看,Elman-PW算法明显优于其他两种算法,体现了多元数据对预测准确性的贡献。但同时也会发现,最坏误差中Elman-P要好于另两种算法,通过查看数据得知Elman-W算法和Elman-PW算法的最坏误差均出现在同一时间段,而且该段时间内的气象数据有明显的异常。
与基于相似日的预测方法不同,本发明的研究对象是比相似日具有更灵活时间尺度的相似时段。为了说明本发明的有效性,针对相同的数据集,采用本发明和现有算法独立地完成预测工作,结果如表5所示。
表5不同模型的风功率预测效果
每次预测过程中,现有算法都会搜索相似日,而忽略很多有价值的信息,而本发明则能很好地保留并利用其包含的有效信息。进一步分析表5中的数据,实验共计预测92日数据(现有算法执行92次预测,本发明执行184次预测),本发明占优的有45日,结果相当的有34日,落后的有13日。本发明能够挖掘更多蕴含在历史数据中的规律信息,准确性整体上优于基于相似日的预测方法。
此实施例仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (5)
1.基于连续时段聚类的风电功率预测方法,其特征在于,包括步骤如下,
步骤1:在相似日预测方法的基础上,选择过去一年的历史功率值集合为训练集,未来3个月的功率值集合为测试集,采用Elman神经网络和支持向量机作为预测模型,分别进行迭代预测,根据不同长度的相似时段预测误差,确定相似时段长度;
步骤2:结合历史功率和气象信息,根据步骤1所得的相似时段长度,采用两阶段搜索策略,在第一阶段搜索时,首先在历史功率和气象信息中提取功率向量、气象特征向量,其次,对所有功率向量进行特征提取,并采用K-means算法进行聚类,最后,通过对功率向量进行分类,确定其所属的类簇;在第二阶段搜索时,结合气象信息确定相似度衡量标准,在历史气象数据中寻找最佳相似时段集合;
步骤3:基于Elman神经网络,创建风电功率预测模型,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。
2.根据权利要求1所述的基于连续时段聚类的风电功率预测方法,其特征在于,所述步骤1具体包括:将相似时段长度分别设置为6、12、18和24小时,每日的功率误差eMAPE为:
<mrow>
<msub>
<mi>e</mi>
<mrow>
<mi>M</mi>
<mi>A</mi>
<mi>P</mi>
<mi>E</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<msub>
<mi>N</mi>
<mi>p</mi>
</msub>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msub>
<mi>N</mi>
<mi>p</mi>
</msub>
</munderover>
<mfrac>
<mrow>
<mo>|</mo>
<msub>
<mover>
<mi>p</mi>
<mo>^</mo>
</mover>
<mi>i</mi>
</msub>
<mo>-</mo>
<msub>
<mi>p</mi>
<mi>i</mi>
</msub>
<mo>|</mo>
</mrow>
<msub>
<mi>p</mi>
<mrow>
<mi>c</mi>
<mi>a</mi>
<mi>p</mi>
</mrow>
</msub>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,pi为实际功率;为预测功率;pcap为风机开机容量;Np为每日预测数据个数,
预测模型的平均功率误差为:
<mrow>
<msub>
<mover>
<mi>e</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>M</mi>
<mi>A</mi>
<mi>P</mi>
<mi>E</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<msub>
<mi>M</mi>
<mi>p</mi>
</msub>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<msub>
<mi>M</mi>
<mi>p</mi>
</msub>
</munderover>
<msubsup>
<mi>e</mi>
<mrow>
<mi>M</mi>
<mi>A</mi>
<mi>P</mi>
<mi>E</mi>
</mrow>
<mi>j</mi>
</msubsup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Mp为预测天数,是第j日的误差结果,
根据得到的不同长度的相似时段预测误差,选择相似时段长度为12h。
3.根据权利要求1所述的基于连续时段聚类的风电功率预测方法,其特征在于,所述步骤2具体包括:结合功率向量与气象信息,构建特征向量Xi为:
<mrow>
<msup>
<mi>X</mi>
<mi>i</mi>
</msup>
<mo>=</mo>
<mo>{</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<msub>
<mi>x</mi>
<mrow>
<mi>i</mi>
<mi>N</mi>
</mrow>
</msub>
<mo>,</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>i</mi>
<mn>1</mn>
</mrow>
</msub>
<mo>,</mo>
<mo>...</mo>
<mo>,</mo>
<msub>
<mover>
<mi>x</mi>
<mo>&OverBar;</mo>
</mover>
<mrow>
<mi>i</mi>
<mi>M</mi>
</mrow>
</msub>
<mo>,</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mi>min</mi>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mi>max</mi>
</msubsup>
<mo>,</mo>
<msubsup>
<mi>x</mi>
<mi>i</mi>
<mrow>
<mi>a</mi>
<mi>v</mi>
<mi>e</mi>
</mrow>
</msubsup>
<mo>}</mo>
</mrow>
其中,N=L×D,D是每小时功率数据个数,L为相似时段长度;xi1,...,xiN为功率向量的连续N个功率值;M为功率向量区间个数,;为每个区间的平均值,M取4或者6;和分别为xi1,...,xiN中的最小、最大和平均功率值,
采用K-means方法对特征向量集合进行聚类,集合中元素Xi和Xj之间的距离d(Xi,Xj)为:
d(Xi,Xj)=1-rij (3a)
<mrow>
<msub>
<mi>r</mi>
<mrow>
<mi>i</mi>
<mi>j</mi>
</mrow>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<mrow>
<mo>(</mo>
<msubsup>
<mi>X</mi>
<mi>t</mi>
<mi>i</mi>
</msubsup>
<mo>-</mo>
<mover>
<msup>
<mi>X</mi>
<mi>i</mi>
</msup>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mrow>
<mo>(</mo>
<msubsup>
<mi>X</mi>
<mi>t</mi>
<mi>j</mi>
</msubsup>
<mo>-</mo>
<mover>
<msup>
<mi>X</mi>
<mi>j</mi>
</msup>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msqrt>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>X</mi>
<mi>t</mi>
<mi>i</mi>
</msubsup>
<mo>-</mo>
<mover>
<msup>
<mi>X</mi>
<mi>i</mi>
</msup>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
<msqrt>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>T</mi>
</munderover>
<msup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>X</mi>
<mi>t</mi>
<mi>j</mi>
</msubsup>
<mo>-</mo>
<mover>
<msup>
<mi>X</mi>
<mi>j</mi>
</msup>
<mo>&OverBar;</mo>
</mover>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mi>b</mi>
<mo>)</mo>
</mrow>
</mrow>
其中,rij是Xi和Xj的皮尔逊系数;和分别表示Xi和Xj的均值;和是Xi和Xj的第t个分量,T为Xi的模,T=N+M+3,类簇个数KM决定着聚类结果,KM取值范围为9至20;
采用自适应KNN算法进行分类,特征向量Xi作为分类算法的样本数据,将当前时刻前L小时功率数据定义为基准向量XB,作为分类的目标向量,应用公式(3),计算目标向量与所有类簇之间的距离,选取距离最小的类簇作为分类结果;
风力机捕获功率P为:
<mrow>
<mi>P</mi>
<mo>=</mo>
<mn>1</mn>
<mo>/</mo>
<mn>2</mn>
<msub>
<mi>C</mi>
<mi>p</mi>
</msub>
<msub>
<mi>&rho;</mi>
<mrow>
<mi>a</mi>
<mi>i</mi>
<mi>r</mi>
</mrow>
</msub>
<msubsup>
<mi>SV</mi>
<mrow>
<mi>w</mi>
<mi>i</mi>
<mi>n</mi>
<mi>d</mi>
</mrow>
<mn>3</mn>
</msubsup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,Cp为风轮功率系数;ρair为空气密度;S为扫过风机叶片的面积;Vwind为风速,
选取预测时刻之后L小时内的气象数据,构造气象特征向量W为:
W={Vmax,Vmin,Vave,sinθave,cosθave,Pave,Have,Tave}
其中,Vmax为最大风速值;Vmin为最小风速值;Vave为平均风速值;sinθave为平均风向的正弦值;cosθave为平均风向的余弦值;Pave为平均压强值;Have为平均湿度,Tave为平均温度,
结合曲线趋势相似性和气象特征向量的物理相似性,确定相似度衡量标准SiB为:
SiB=1-[αd(XB,Xi)+(1-α)D(WB,Wi)] (5)
其中,α为权重系数;XB为基准特征向量;Xi为类簇Clusterf中的元素;WB为XB之后L小时的基准气象特征向量;Wi为Xi之后L小时的气象特征向量;d(·)为公式(3a)中的距离;D(·)为气象特征向量间的距离,选择欧式距离,并预先对其进行归一化处理,
采用公式(5),计算基准特征向量XB与类簇Clusterf中所有元素的相似程度,排序后选取其中数值最大的Nf个元素为最佳相似时段集合Sf。
4.根据权利要求1所述的基于连续时段聚类的风电功率预测方法,其特征在于,所述步骤3具体包括:所述风电功率预测模型的输入向量包含两部分,一是预测时刻的气象信息,包括风速、风向正弦,风向余弦、气压、湿度和温度值,二是预测时刻之前L小时的功率向量,风电功率预测模型的输出值为预测时刻对应的功率值,将步骤2所得到的最佳相似时段集合作为训练数据,通过风电功率预测模型进行迭代计算,完成未来时段的风电功率预测。
5.根据权利要求3所述的基于连续时段聚类的风电功率预测方法,其特征在于,所述步骤2具体还包括:分类结果评价标准定义为目标样本与其所属类簇中所有样本的平均距离
<mrow>
<mover>
<mi>D</mi>
<mo>&OverBar;</mo>
</mover>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mover>
<mi>N</mi>
<mo>&OverBar;</mo>
</mover>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mover>
<mi>N</mi>
<mo>&OverBar;</mo>
</mover>
</munderover>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mover>
<mi>X</mi>
<mo>&OverBar;</mo>
</mover>
<mo>,</mo>
<msup>
<mi>X</mi>
<mi>j</mi>
</msup>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,d(·)是公式(3)中距离公式,Xj是类簇中的元素,是其样本总数,KM取值为13。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711167328.2A CN107944622B (zh) | 2017-11-21 | 2017-11-21 | 基于连续时段聚类的风电功率预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711167328.2A CN107944622B (zh) | 2017-11-21 | 2017-11-21 | 基于连续时段聚类的风电功率预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107944622A true CN107944622A (zh) | 2018-04-20 |
CN107944622B CN107944622B (zh) | 2021-10-26 |
Family
ID=61930509
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711167328.2A Active CN107944622B (zh) | 2017-11-21 | 2017-11-21 | 基于连续时段聚类的风电功率预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107944622B (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108898251A (zh) * | 2018-06-29 | 2018-11-27 | 上海电力学院 | 考虑气象相似性和功率波动的海上风电场功率预测方法 |
CN108960537A (zh) * | 2018-08-17 | 2018-12-07 | 安吉汽车物流股份有限公司 | 物流订单的预测方法及装置、可读介质 |
CN109272205A (zh) * | 2018-08-24 | 2019-01-25 | 国网河南省电力公司电力科学研究院 | 广义负荷特性分析方法及装置 |
CN110263846A (zh) * | 2019-06-18 | 2019-09-20 | 华北电力大学 | 基于故障数据深度挖掘及学习的故障诊断方法 |
CN110288136A (zh) * | 2019-06-11 | 2019-09-27 | 上海电力学院 | 风电功率多步预测模型建立方法 |
CN110298494A (zh) * | 2019-06-11 | 2019-10-01 | 东南大学 | 一种基于分段聚类及组合优化的风电功率预测方法 |
CN111144611A (zh) * | 2019-11-22 | 2020-05-12 | 国网辽宁省电力有限公司经济技术研究院 | 一种基于聚类和非线性自回归的空间负荷预测方法 |
CN111525552A (zh) * | 2020-04-22 | 2020-08-11 | 大连理工大学 | 一种基于特征信息的三阶段短期风电场群功率预测方法 |
CN111598612A (zh) * | 2020-04-28 | 2020-08-28 | 西安理工大学 | 一种分时电价制定方法 |
CN112070311A (zh) * | 2020-09-10 | 2020-12-11 | 天津大学 | 基于相似日聚类和气象因子赋权的日前光功率预测方法 |
CN112347655A (zh) * | 2020-11-17 | 2021-02-09 | 国网青海省电力公司 | 一种基于机组运行性能评估的风电场理论功率计算方法 |
CN113361556A (zh) * | 2020-03-06 | 2021-09-07 | 北京市环境保护监测中心 | 污染相似案例自动识别的方法和装置 |
CN113656752A (zh) * | 2021-08-11 | 2021-11-16 | 广东电网有限责任公司 | 一种气压的预测方法、装置、电子设备及存储介质 |
CN113935533A (zh) * | 2021-10-20 | 2022-01-14 | 山东省气象科学研究所(山东省海洋气象科学研究所、山东省气象局培训中心) | 一种黄渤海海区大风推算方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654207A (zh) * | 2016-01-07 | 2016-06-08 | 国网辽宁省电力有限公司锦州供电公司 | 基于风速、风向信息的风电功率预测方法 |
-
2017
- 2017-11-21 CN CN201711167328.2A patent/CN107944622B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654207A (zh) * | 2016-01-07 | 2016-06-08 | 国网辽宁省电力有限公司锦州供电公司 | 基于风速、风向信息的风电功率预测方法 |
Non-Patent Citations (2)
Title |
---|
RUI ZHAO: "The study of wind power predict model based on wavelet transform and Elman neural network", 《2016 CHINESE CONTROL AND DECISION CONFERENCE (CCDC)》 * |
张宜阳等: "基于分段分层相似日搜索和自适应脊波神经网络的风电功率多步预测", 《电网与清洁能源》 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108898251B (zh) * | 2018-06-29 | 2021-10-08 | 上海电力学院 | 考虑气象相似性和功率波动的海上风电场功率预测方法 |
CN108898251A (zh) * | 2018-06-29 | 2018-11-27 | 上海电力学院 | 考虑气象相似性和功率波动的海上风电场功率预测方法 |
CN108960537A (zh) * | 2018-08-17 | 2018-12-07 | 安吉汽车物流股份有限公司 | 物流订单的预测方法及装置、可读介质 |
CN108960537B (zh) * | 2018-08-17 | 2020-10-13 | 安吉汽车物流股份有限公司 | 物流订单的预测方法及装置、可读介质 |
CN109272205A (zh) * | 2018-08-24 | 2019-01-25 | 国网河南省电力公司电力科学研究院 | 广义负荷特性分析方法及装置 |
CN109272205B (zh) * | 2018-08-24 | 2022-03-29 | 国网河南省电力公司电力科学研究院 | 广义负荷特性分析方法及装置 |
CN110288136A (zh) * | 2019-06-11 | 2019-09-27 | 上海电力学院 | 风电功率多步预测模型建立方法 |
CN110298494A (zh) * | 2019-06-11 | 2019-10-01 | 东南大学 | 一种基于分段聚类及组合优化的风电功率预测方法 |
CN110288136B (zh) * | 2019-06-11 | 2023-04-25 | 上海电力学院 | 风电功率多步预测模型建立方法 |
CN110263846A (zh) * | 2019-06-18 | 2019-09-20 | 华北电力大学 | 基于故障数据深度挖掘及学习的故障诊断方法 |
CN111144611A (zh) * | 2019-11-22 | 2020-05-12 | 国网辽宁省电力有限公司经济技术研究院 | 一种基于聚类和非线性自回归的空间负荷预测方法 |
CN113361556A (zh) * | 2020-03-06 | 2021-09-07 | 北京市环境保护监测中心 | 污染相似案例自动识别的方法和装置 |
CN113361556B (zh) * | 2020-03-06 | 2023-12-26 | 北京市环境保护监测中心 | 污染相似案例自动识别的方法和装置 |
CN111525552B (zh) * | 2020-04-22 | 2023-06-09 | 大连理工大学 | 一种基于特征信息的三阶段短期风电场群功率预测方法 |
CN111525552A (zh) * | 2020-04-22 | 2020-08-11 | 大连理工大学 | 一种基于特征信息的三阶段短期风电场群功率预测方法 |
CN111598612B (zh) * | 2020-04-28 | 2023-04-18 | 西安理工大学 | 一种分时电价制定方法 |
CN111598612A (zh) * | 2020-04-28 | 2020-08-28 | 西安理工大学 | 一种分时电价制定方法 |
CN112070311A (zh) * | 2020-09-10 | 2020-12-11 | 天津大学 | 基于相似日聚类和气象因子赋权的日前光功率预测方法 |
CN112347655B (zh) * | 2020-11-17 | 2023-03-17 | 国网青海省电力公司 | 一种基于机组运行性能评估的风电场理论功率计算方法 |
CN112347655A (zh) * | 2020-11-17 | 2021-02-09 | 国网青海省电力公司 | 一种基于机组运行性能评估的风电场理论功率计算方法 |
CN113656752A (zh) * | 2021-08-11 | 2021-11-16 | 广东电网有限责任公司 | 一种气压的预测方法、装置、电子设备及存储介质 |
CN113935533A (zh) * | 2021-10-20 | 2022-01-14 | 山东省气象科学研究所(山东省海洋气象科学研究所、山东省气象局培训中心) | 一种黄渤海海区大风推算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107944622B (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107944622B (zh) | 基于连续时段聚类的风电功率预测方法 | |
CN107766990B (zh) | 一种光伏电站发电功率的预测方法 | |
CN110909919A (zh) | 融合注意力机制的深度神经网络模型的光伏功率预测方法 | |
CN111369070A (zh) | 一种基于包络线聚类的多模融合光伏功率预测方法 | |
CN110363354B (zh) | 风场风功率预测方法、电子装置及存储介质 | |
CN109146063B (zh) | 一种基于重要点分割的多分段短期负荷预测方法 | |
Shi et al. | Genetic algorithm-piecewise support vector machine model for short term wind power prediction | |
CN113822418A (zh) | 一种风电场功率预测方法、系统、设备和存储介质 | |
CN116050666B (zh) | 一种辐照特征聚类的光伏发电功率预测方法 | |
CN113193551A (zh) | 基于多因素和改进特征筛选策略的短期电力负荷预测方法 | |
CN115759389A (zh) | 基于天气类型的相似日组合策略的日前光伏功率预测方法 | |
CN115036922A (zh) | 一种分布式光伏发电电量预测方法及系统 | |
CN114707422A (zh) | 一种基于负荷预测的智能电力缉查方法 | |
CN118412848A (zh) | 一种多维度中长期发电量预测方法 | |
CN117893058A (zh) | 光伏场站性能综合评估的方法及系统 | |
CN117290673A (zh) | 一种基于多模型融合的船舶能耗高精度预测系统 | |
CN117332288A (zh) | 一种建筑节能技术评估系统及方法 | |
CN112580899A (zh) | 一种融合机器学习模型的中长期风力发电预测方法及系统 | |
CN112132344A (zh) | 一种基于相似日和frs-svm的短期风电功率预测方法 | |
CN117374917A (zh) | 一种超短期电力负荷的多元回归预测方法及装置 | |
CN110163437B (zh) | 基于DPK-means的日前光伏发电功率预测方法 | |
CN116561569A (zh) | 一种基于EO特征选择结合AdaBoost算法的工业电力负荷辨识方法 | |
CN111062509A (zh) | 一种基于改进神经网络的风功率中短期预测方法及系统 | |
CN115907228A (zh) | 一种基于pso-lssvm的短期电力负荷预测分析方法 | |
Chinforoush et al. | A novel method for forecasting surface wind speed using wind-direction based on hierarchical markov model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |