CN113487080B - 一种基于风速分类的风速动态场景生成方法、系统及终端 - Google Patents

一种基于风速分类的风速动态场景生成方法、系统及终端 Download PDF

Info

Publication number
CN113487080B
CN113487080B CN202110758297.8A CN202110758297A CN113487080B CN 113487080 B CN113487080 B CN 113487080B CN 202110758297 A CN202110758297 A CN 202110758297A CN 113487080 B CN113487080 B CN 113487080B
Authority
CN
China
Prior art keywords
wind speed
data
clustering
value
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110758297.8A
Other languages
English (en)
Other versions
CN113487080A (zh
Inventor
权轶
周星宇
阮丹灵
向姚海
付波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN202110758297.8A priority Critical patent/CN113487080B/zh
Publication of CN113487080A publication Critical patent/CN113487080A/zh
Application granted granted Critical
Publication of CN113487080B publication Critical patent/CN113487080B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于风速预测技术领域,公开了一种基于风速分类的风速动态场景生成方法、系统及终端,获取风速原始数据,提取可反映风速的随机性和波动性特征的两个指标;同时基于原始数据计算每日风速偏离度和变化率,并基于提取的指标进行k‑means聚类,得到四个聚类中心;建立历史数据和历史预报数据之间的模型关系,获取与预测风速配对的实际风速;在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布;对预测风速数据进行k‑means聚类;基于两次k‑means聚类的结果,对实际数据和预测数据通过k‑means聚类后的两组聚类中心进行分析,生成风速动态场景。本发明的风速动态场景生成方法能更加准确地反映实际情况。

Description

一种基于风速分类的风速动态场景生成方法、系统及终端
技术领域
本发明属于风速预测技术领域,尤其涉及一种基于风速分类的风速动态场景生成方法、系统及终端。
背景技术
目前,风力发电具有显著的随机性和波动性,且不受调度。随着我国风电并网比例逐渐增加,该问题日益严重,如何在电力系统规划与运行中充分考虑风电的随机性和波动性,以及多风电场间的相关性,并由风速的原始数据对风速进行合理的预报,是当今社会普遍关注的问题。
现有技术对风力发电进行研究时,往往考虑到风速的随机性和波动性,但是并没有对有不同特征的风速进行分类分析。现有技术1为解决风速间歇性、波动性等缺点对风力发电稳定性的影响,提出局域均值分解与时间序列相结合的方法,建立模型对风速进行预测;现有技术2针对风速的不确定性和波动性,提出了一种基于CSA算法、小波变换、基于熵和互信息(MI)的特征选择(FS)四个模块的混合风速预测模型,利用小波变换模块消除风速的波动行为;现有技术3提出一种基于变分模态分解(VMD)和长短期记忆网络(LSTM)的超短期风速预测新方法。
上述现有技术用建模的方法消除风速不确定性和波动性的影响,可以显著提高风速预测的精度,但是并没有提取出风速的特征,并对不同特征的风速进行分类分析。根据历史数据提取出可以良好反应风速的不确定性和波动性的指标,并对其进行聚类,可以得到合理的风速分类方法,对不同类型风速分别分析,可以使预测结果更加精准。
现有技术4针对相关性进行建模,对风速进行多元标准正态分布拟合,通过构建协方差参数来表征跨时间断面风电功率的相关性,从而生成了体现风电功率波动性的动态场景。现有技术5用t location-scale分布拟合风电功率波动量来进行参数辨识;现有技术6用MATLAB工具中ksdensity函数与协方差参数建模方法相结合来识别范围参数。上述方案均用抽样的方法来进行参数辨识,而抽样方法的局限性,可能会导致模拟抽样得到的模拟分布函数可能会出现部分区间的过拟合想象,影响整体的辨识结果,造成系统误差。而通过聚类的方法,把相似的数据放在一起比较,可以避免过拟合,对误差的容忍度较大,得到的预测结果更加精确。且在参数的辨识过程中,运用极坐标的方法来确定最优范围参数,可以对多向量的相似性进行比较,可以很好的解决聚类中心匹配的问题。
目前,解决风速随机性和波动性问题的方法,未曾考虑到对风速分类的问题,且在预测精度方面有所欠缺。
通过上述分析,现有技术存在的问题及缺陷为:现有技术没有对风速进行分类,预测精度低,生成的风速动态场景不能准确反映现实。
发明内容
针对现有技术存在的问题,本发明提供了一种基于风速分类的风速动态场景生成方法、系统及终端。
本发明是这样实现的,一种基于风速分类的风速动态场景生成方法,所述基于风速分类的风速动态场景生成方法包括:
步骤一,获取风速原始数据,并自原始数据中提取可反映风速的随机性和波动性特征的两个指标;同时基于原始数据计算每日风速偏离度和变化率,并基于提取的指标进行k-means聚类,得到四个聚类中心;
步骤二,利用季节性的ARIMA模型对历史数据进行预测,用分箱理论对预测数据进行分箱,建立历史数据和历史预报数据之间的模型关系,获取与预测风速配对的实际风速;
步骤三,在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布;对预测风速数据进行k-means聚类;
步骤四,基于两次k-means聚类的结果,对实际数据和预测数据通过k-means聚类后的两组聚类中心进行分析,将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数,得到唯一的协方差矩阵,生成风速动态场景。
进一步,所述可反映风速的随机性和波动性特征的两个指标分别为:风速的整体偏离度和整体风速变化率。
进一步,步骤一中,所述计算每日风速偏离度包括:
将原始数据以天为单位分段,将各样本中各时段的数据结合得到
Figure BDA0003148079340000031
并计算基于整个样本空间的该时段数据均值
Figure BDA0003148079340000032
对数据组合序列
Figure BDA0003148079340000033
用分布函数拟合得到相应的分布函数;通过样本数据中各样本每天各时段数据与均值
Figure BDA0003148079340000034
中对应时段数据做差,得到各样本偏差值序列
Figure BDA0003148079340000035
对偏差数据序列中所有样本的同时段数据组合,得到96个行向量,并对上述96个行向量做标准归一化处理,得到
Figure BDA0003148079340000036
通过对归一化后各样本各时段的归一化值
Figure BDA0003148079340000037
求和,得到样本中各时段风速偏离均值的整体偏离度
Figure BDA0003148079340000038
计算公式如下:
Figure BDA0003148079340000039
Figure BDA00031480793400000310
Figure BDA00031480793400000311
Figure BDA00031480793400000312
进一步,步骤一中,所述计算整体风速变化率包括:
以前一时段的风速值为基准求取变化率,重复操作得到所有样本各时段相对前一时刻的风速变化率
Figure BDA00031480793400000313
并对其进行标准化处理,得到归一化后的风速变化率
Figure BDA00031480793400000314
计算样本中各时段风速波动速率的整体风速变化率
Figure BDA00031480793400000315
计算公式如下:
Figure BDA00031480793400000316
Figure BDA0003148079340000041
Figure BDA0003148079340000042
进一步,步骤一中,所述基于提取的指标进行k-means聚类,得到四个聚类中心包括:
用手肘法确定聚类的数目,再基于风速的整体偏离度和风速的整体变化率两个指标,对每天的风速进行k-means聚类,得到风速的k种类型,以及每个日期对应的风速类型。
进一步,步骤二中,所述用分箱理论对预测数据进行分箱包括:
获取所有由预测风速
Figure BDA0003148079340000043
和实际风速
Figure BDA0003148079340000044
组成的风速对
Figure BDA0003148079340000045
使用分级算法,对得到的预测风速
Figure BDA0003148079340000046
进行离散化处理;并对构建的箱中的每个预测风速
Figure BDA0003148079340000047
确定所有实际风速并将其存储在列表
Figure BDA0003148079340000048
中;所述列表包含所有与
Figure BDA0003148079340000049
中的选定
Figure BDA00031480793400000410
配对的
Figure BDA00031480793400000411
进一步,步骤三中,所述在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布包括:
首先,确定经验分布的反函数:对每一个分箱里面的概率值和风速值进行线行回归的拟合,用最小二乘法确定每一个分箱所对应的系数k,b;
其次,进行经验分布拟合,公式如下:
Figure BDA00031480793400000412
其中,Fn(x)为总体X的经验分布函数;x1,x2,...,xn为总体X的一组容量为n的样本观测值,按从小到大的顺序排列;x为任意实数。
进一步,所述确定范围参数包括:
基于确定的日前风速预报点估计值及风速分箱关系,建立考虑风速相邻时段相关性的多维分布函数模型,并使用聚类的方法对该多维分布函数的相关参数进行参数辨识,确定最佳分布函数的范围参数;
所述确定范围参数包括以下步骤:
(1)任取ε,确定唯一的协方差矩阵;生成服从多元正态分布的随机数;对生成的随机数进行逆变换,得到风速值;
(2)对风速值进行k-means聚类,得到聚类中心点集A;计算A和原始聚类中心点的极坐标表达式;
(3)当d最小时的ε即为最优范围参数。
进一步,所述唯一的协方差矩阵如下:
风速为一个随机变量Z=(Z1,Z2,…,Zk)T,k表示预测时间长度;随机变量Z服从多元正态分布Z~N(μ,∑),协方差矩阵∑满足:
Figure BDA0003148079340000051
Figure BDA0003148079340000052
式中,σn,m=cov(Zn,Zm),n,m=1,2,…,k。σn,m表示随机变量Zn和Zm之间的协方差;
Figure BDA0003148079340000053
表示随机变量Zn和Zm之间的相关系数;
利用指数型协方差对数式的协方差σn,m进行建模:
Figure BDA0003148079340000054
式中,ε为范围参数,用于控制不同超前时间的随机变量Zt的相关性强度。
进一步,所述得到唯一的协方差矩阵还包括:进行多元正态分布随机数抽样及逆变换;
所述多元正态分布随机数抽样包括:
已知随机变量Zt的随机数,对随机变量Pt可以采取如下公式抽样:
Figure BDA0003148079340000055
Figure BDA0003148079340000056
进一步,所述将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数包括:
将聚类中心点看做向量,并将笛卡尔坐标系下的向量序列投影到极坐标系下,得到统一坐标系下的两组向量序列,对得到的两组向量组的比较、分析,确定范围参数的范围,并得到标幺值化后的坐标序列对应的极坐标,再将极坐标序列按照升序排列,得到ρ最小时的ε即为范围参数;
步骤如下:
1)原始数据的聚类中心点为p0,p1,p2,p3;模拟值的聚类中心点为q0,q1,q2,q3;将两组在笛卡尔坐标系下的聚类中心点看作向量P0,P1,P2,P3;Q0,Q1,Q2,Q3
2)向量a=P0+P1+P2+P3,向量b=Q0+Q1+Q2+Q3;确定范围参数的值为[1,300];每一个范围参数的值对应一个向量,分别为a0,a1,...,an
3)将向量的坐标序列进行标幺值化处理;将笛卡尔坐标系下的标幺值化后的序列(x1,y1)(x2,y2)(x3,y3)…(xn,yn)投影到极坐标中序列坐标为(ρ11)(ρ22)(ρ33)…(ρnn)
4)将极坐标序列按照升序排列,若ρ最小时,相角差异不大,则定ρ最小时对应的范围参数的最优范围参数。
进一步,所述标幺值化公式:
Figure BDA0003148079340000061
其中,ax,ay分别为向量a的横纵坐标;bx,by分别为向量b的横纵坐标。
进一步,所述生成风速动态场景包括:
确定预报日并基于ARIMA模型获取风速日前预报值的点估计,选取对应时段的分箱号,确定各时段的经验分布模型;基于辨识最优的范围参数ε,确定对应的协方差矩阵Σ及所述预报日的各时段相关性关系,确定多元正态分布;生成服从多元正态分布的随机数,并计算在标准正态分布对应的概率值;根据ECDF的反函数求其风速模拟值。
本发明另一目的在于提供一种基于风速分类的风速动态场景生成系统,所述基于风速分类的风速动态场景生成系统包括:
数据获取模块,用于获取风速原始数据,并自原始数据中提取可反映风速的随机性和波动性特征的两个指标;同时基于原始数据计算每日风速偏离度和变化率,并基于提取的指标进行k-means聚类,得到四个聚类中心;
实际风速获取模块,用于利用季节性的ARIMA模型对历史数据进行预测,用分箱理论对预测数据进行分箱,建立历史数据和历史预报数据之间的模型关系,获取与预测风速配对的实际风速;
聚类模块,用于在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布;对预测风速数据进行k-means聚类;
风速动态场景生成模块,用于基于两次k-means聚类的结果,对实际数据和预测数据通过k-means聚类后的两组聚类中心进行分析,将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数,得到唯一的协方差矩阵,生成风速动态场景。
本发明另一目的在于提供一种信息数据处理终端,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于风速分类的风速动态场景生成方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明以风速的两个特征对风速进行聚类,可以更好地反映不同类型风速数据的变化规律,从而能做出更加准确的预测。计算每天的风速特征指标,考虑到相邻时段风速的相关性,可以提高预测的准确性。结合范围参数对风速进行聚类的方法,把相似的数据放在一起比较,可以避免过拟合,对误差的容忍度较大,得到的预测结果更加精确。且在参数的辨识过程中,运用极坐标的方法来确定最优范围参数,可以对多向量的相似性进行比较,可以很好的解决聚类中心匹配的问题。同时还建立预测值和实际值的经验分布拟合模型,对两者之间的关系进行分析,基于以上创新点提出的风速动态场景生成模型能更加准确地反映实际情况。
本发明通过对原始风速数据的预处理,得到原始数据的特征,并根据数据特征提出风速的分类方法。再基于数据预报及数据分箱,通过建立历史数据与预报数据的经验分布关系,结合多为正态分布建立考虑96维相邻时段相关性的风电系统预报模型。最后根据k-means聚类确定范围参数,并生成风速动态场景。通过案例分析验证了模型的有效性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于风速分类的风速动态场景生成方法原理图。
图2是本发明实施例提供的基于风速分类的风速动态场景生成方法流程图。
图3是本发明实施例提供的原始数据聚类结果散点图。
图4是本发明实施例提供的第6、15、24、30个分箱的线性拟合示意图。
图5是本发明实施例提供的4月30日在ε=290的条件下对应的200个场景,并与用SARIMA模型的预报值和风速的原始值作比较图。
图6是本发明实施例提供的不同范围参数下得到误差、范围参数与极径的结果图。
图7是本发明实施例提供的各序列自相关系数的比较图。
图8是本发明实施例提供的原始值和模拟值的概率函数分布图。
图9是本发明实施例提供的原始值和模拟值的累计概率分布图。
图10是本发明实施例提供的动态场景的比较图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种基于风速分类的风速动态场景生成方法、系统及终端,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的基于风速分类的风速动态场景生成方法包括以下步骤:
S101,获取风速原始数据,并自原始数据中提取可反映风速的随机性和波动性特征的两个指标;同时基于原始数据计算每日风速偏离度和变化率,并基于提取的指标进行k-means聚类,得到四个聚类中心;
S102,利用季节性的ARIMA模型对历史数据进行预测,用分箱理论对预测数据进行分箱,建立历史数据和历史预报数据之间的模型关系,获取与预测风速配对的实际风速;
S103,在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布;对预测风速数据进行k-means聚类;
S104,基于两次k-means聚类的结果,对实际数据和预测数据通过k-means聚类后的两组聚类中心进行分析,将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数,得到唯一的协方差矩阵,生成风速动态场景。
本发明实施例提供的可反映风速的随机性和波动性特征的两个指标分别为:风速的整体偏离度和整体风速变化率。
步骤S101中,本发明实施例提供的计算每日风速偏离度包括:
将原始数据以天为单位分段,将各样本中各时段的数据结合得到
Figure BDA0003148079340000091
并计算基于整个样本空间的该时段数据均值
Figure BDA0003148079340000092
对数据组合序列
Figure BDA0003148079340000093
用分布函数拟合得到相应的分布函数;通过样本数据中各样本每天各时段数据与均值
Figure BDA0003148079340000094
中对应时段数据做差,得到各样本偏差值序列
Figure BDA0003148079340000095
对偏差数据序列中所有样本的同时段数据组合,得到96个行向量,并对上述96个行向量做标准归一化处理,得到
Figure BDA0003148079340000101
通过对归一化后各样本各时段的归一化值
Figure BDA0003148079340000102
求和,得到样本中各时段风速偏离均值的整体偏离度
Figure BDA0003148079340000103
计算公式如下:
Figure BDA0003148079340000104
Figure BDA0003148079340000105
Figure BDA0003148079340000106
Figure BDA0003148079340000107
步骤S101中,本发明实施例提供的计算整体风速变化率包括:
以前一时段的风速值为基准求取变化率,重复操作得到所有样本各时段相对前一时刻的风速变化率
Figure BDA0003148079340000108
并对其进行标准化处理,得到归一化后的风速变化率
Figure BDA0003148079340000109
计算样本中各时段风速波动速率的整体风速变化率
Figure BDA00031480793400001010
计算公式如下:
Figure BDA00031480793400001011
Figure BDA00031480793400001012
Figure BDA00031480793400001013
步骤S101中,本发明实施例提供的基于提取的指标进行k-means聚类,得到四个聚类中心包括:
用手肘法确定聚类的数目,再基于风速的整体偏离度和风速的整体变化率两个指标,对每天的风速进行k-means聚类,得到风速的k种类型,以及每个日期对应的风速类型。
步骤S102中,本发明实施例提供的用分箱理论对预测数据进行分箱包括:
获取所有由预测风速
Figure BDA00031480793400001014
和实际风速
Figure BDA00031480793400001015
组成的风速对
Figure BDA00031480793400001016
使用分级算法,对得到的预测风速
Figure BDA00031480793400001017
进行离散化处理;并对构建的箱中的每个预测风速
Figure BDA0003148079340000111
确定所有实际风速并将其存储在列表
Figure BDA0003148079340000112
中;所述列表包含所有与
Figure BDA0003148079340000113
中的选定
Figure BDA0003148079340000114
配对的
Figure BDA0003148079340000115
步骤S103中,本发明实施例提供的在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布包括:
首先,确定经验分布的反函数:对每一个分箱里面的概率值和风速值进行线行回归的拟合,用最小二乘法确定每一个分箱所对应的系数k,b;
其次,进行经验分布拟合,公式如下:
Figure BDA0003148079340000116
其中,Fn(x)为总体X的经验分布函数;x1,x2,...,xn为总体X的一组容量为n的样本观测值,按从小到大的顺序排列;x为任意实数。
本发明实施例提供的确定范围参数包括:
基于确定的日前风速预报点估计值及风速分箱关系,建立考虑风速相邻时段相关性的多维分布函数模型,并使用聚类的方法对该多维分布函数的相关参数进行参数辨识,确定最佳分布函数的范围参数;
所述确定范围参数包括以下步骤:
(1)任取ε,确定唯一的协方差矩阵;生成服从多元正态分布的随机数;对生成的随机数进行逆变换,得到风速值;
(2)对风速值进行k-means聚类,得到聚类中心点集A;计算A和原始聚类中心点的极坐标表达式;
(3)当d最小时的ε即为最优范围参数。
本发明实施例提供的唯一的协方差矩阵如下:
风速为一个随机变量Z=(Z1,Z2,…,Zk)T,k表示预测时间长度;随机变量Z服从多元正态分布Z~N(μ,∑),协方差矩阵∑满足:
Figure BDA0003148079340000121
Figure BDA0003148079340000122
式中,σn,m=cov(Zn,Zm),n,m=1,2,…,k。σn,m表示随机变量Zn和Zm之间的协方差;
Figure BDA0003148079340000123
表示随机变量Zn和Zm之间的相关系数;
利用指数型协方差对数式的协方差σn,m进行建模:
Figure BDA0003148079340000124
式中,ε为范围参数,用于控制不同超前时间的随机变量Zt的相关性强度。
本发明实施例提供的得到唯一的协方差矩阵还包括:进行多元正态分布随机数抽样及逆变换;
所述多元正态分布随机数抽样包括:
已知随机变量Zt的随机数,对随机变量Pt可以采取如下公式抽样:
Figure BDA0003148079340000125
Figure BDA0003148079340000126
本发明实施例提供的将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数包括:
将聚类中心点看做向量,并将笛卡尔坐标系下的向量序列投影到极坐标系下,得到统一坐标系下的两组向量序列,对得到的两组向量组的比较、分析,确定范围参数的范围,并得到标幺值化后的坐标序列对应的极坐标,再将极坐标序列按照升序排列,得到ρ最小时的ε即为范围参数;
步骤如下:
1)原始数据的聚类中心点为p0,p1,p2,p3;模拟值的聚类中心点为q0,q1,q2,q3;将两组在笛卡尔坐标系下的聚类中心点看作向量P0,P1,P2,P3;Q0,Q1,Q2,Q3
2)向量a=P0+P1+P2+P3,向量b=Q0+Q1+Q2+Q3;确定范围参数的值为[1,300];每一个范围参数的值对应一个向量,分别为a0,a1,...,an
3)将向量的坐标序列进行标幺值化处理;将笛卡尔坐标系下的标幺值化后的序列(x1,y1)(x2,y2)(x3,y3)…(xn,yn)投影到极坐标中序列坐标为(ρ11)(ρ22)(ρ33)…(ρnn)
4)将极坐标序列按照升序排列,若ρ最小时,相角差异不大,则定ρ最小时对应的范围参数的最优范围参数。
本发明实施例提供的标幺值化公式:
Figure BDA0003148079340000131
其中,ax,ay分别为向量a的横纵坐标;bx,by分别为向量b的横纵坐标。
本发明实施例提供的生成风速动态场景包括:
确定预报日并基于ARIMA模型获取风速日前预报值的点估计,选取对应时段的分箱号,确定各时段的经验分布模型;基于辨识最优的范围参数ε,确定对应的协方差矩阵Σ及所述预报日的各时段相关性关系,确定多元正态分布;生成服从多元正态分布的随机数,并计算在标准正态分布对应的概率值;根据ECDF的反函数求其风速模拟值。
下面结合具体实施例对本发明的技术效果作进一步描述。
实施例1:
1、基于风速特征的风速聚类
风速场景的模拟需要以历史数据为统计基础,对原始数据进行数据预处理,为了反映风速的随机性和波动性两个特征,提取出两个指标:风速的整体偏离度和整体风速变化率,且通过相关性分析,发现这两组指标不存在线性相关性,可以很好的反应一天中风速的随机性和波动性问题。
再根据上述两个指标基于k-means聚类方法对风速进行分类,针对风速的随机性和波动性两个特征对每天的风速进行分类,可以很好的反映相邻时段风速的相关性,也可以为2.2中的参数辨识服务,高效实施参数辨识。
1.1风速的整体偏离度
针对风速随机性中的平均风速与瞬时风速的关系,提出风速偏离度。
将原始数据以天为单位分段,将各样本中各时段的数据结合得到
Figure BDA0003148079340000141
并求取基于整个样本空间的该时段数据均值
Figure BDA0003148079340000142
对数据组合序列
Figure BDA0003148079340000143
用分布函数拟合得到相应的分布函数(默认使用威布尔分布);通过样本数据中各样本(每天)各时段数据与均值
Figure BDA00031480793400001416
中对应时段数据做差,得到各样本(每天)偏差值序列
Figure BDA0003148079340000144
对偏差数据序列中所有样本的同时段数据组合,得到96个行向量,并对上述96个行向量做标准归一化处理,得到
Figure BDA0003148079340000145
通过对归一化后各样本(每天)各时段的归一化值
Figure BDA0003148079340000146
求和,可以得到样本(每天)中各时段风速偏离均值的整体偏离度
Figure BDA0003148079340000147
对应计算公式:
Figure BDA0003148079340000148
Figure BDA0003148079340000149
Figure BDA00031480793400001410
Figure BDA00031480793400001411
1.2整体风速变化率
针对风速随机性中的风速在短时间内波动性强的问题,提出风速变化率。
以前一时段的风速值为基准求取变化率,重复操作得到所有样本各时段相对前一时刻的风速变化率
Figure BDA00031480793400001412
并对其进行标准化处理,得到归一化后的风速变化率
Figure BDA00031480793400001413
求得样本(每天)中各时段风速波动速率的整体风速变化率
Figure BDA00031480793400001414
对应计算公式:
Figure BDA00031480793400001415
Figure BDA0003148079340000151
Figure BDA0003148079340000152
1.3基于K-means聚类的风速聚类及风速动态特征分析
针对原始数据,本发明首先用手肘法确定聚类的数目,再基于风速的整体偏离度和风速的整体变化率两个指标,对每天的风速进行k-means聚类,得到风速的k种类型,以及每个日期对应的风速类型。
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。K-means聚类算法是一种迭代求解的聚类分析算法,其主要步骤包括:将原始数据分组,选取初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。
2、基于k-means分类进行参数辨识的风速动态场景生成
为建立考虑相邻时段风速的相关性的模型,使用聚类的方法辨识相关性参数,可以避免过拟合造成的误差,提高预测的精确度。
本节季节性ARIMA模型对历史数据进行预测,用分箱理论对预测数据进行分箱,从而建立历史数据和历史预报数据之间的模型关系。得到与预测风速配对的实际风速,并在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布。再基于上一节中得到的k-means聚类的结果,对预测数据进行分类,再基于k-means得到的结果,将两组聚类中心转换为向量,用极坐标变换的方法确定范围参数,进而得到唯一的协方差矩阵,从而生成风速动态场景。
2.1基于季节性ARIMA模型的风速预测与风速原始值的分箱
2.1.1季节性的ARIMA风速拟合预报模型
本发明的日前风速预报使用季节性ARIMA模型,该模型虽然要求时序数据是稳定的,或者通过差分化之后是稳定的,且本质上只能捕捉线性关系,不能捕捉非线性关系,但模型简单,只需要内生变量而不需要借助其他外生变量,故本发明选择改模型来得到日前风速的预报值。
ARMIA模型用于预测历史风速,以进一步整合数据。然后,本发明从风速的历史预测数据中获得条件概率密度函数。
2.1.2历史数据分箱
为了建立历史数据和历史预报数据之间的模型关系,本发明使用分箱理论对预测数据进行分箱。对于所有预测和历史数据,找到所有由预测风速
Figure BDA0003148079340000161
和实际风速
Figure BDA0003148079340000162
组成的风速对
Figure BDA0003148079340000163
使用分级算法,对上一步中获得的预测风速
Figure BDA0003148079340000164
进行离散化处理。然后,对于本发明构建的箱中的每个预测风速
Figure BDA0003148079340000165
找到所有实际风速并将其存储在列表
Figure BDA0003148079340000166
中。该列表包含所有与
Figure BDA0003148079340000167
中的选定
Figure BDA0003148079340000168
配对的
Figure BDA0003148079340000169
数据分箱是一种数据预处理技术,用于减少次要观察误差的影响,是一种将多个连续值分组为较少数量的分箱的方法。分箱的数据可以是任何类型的值,利用分箱可以减少数据量。
从最小值到最大值之间,均分为N等份。如果A,B为最小最大值则每个区间的长度为W=(B-A)/N,则区间边界值为A+W,A+2W,…,A+(N-1)W。这里只考虑边界,每个等份的实例数量可能不等。
2.1.3基于经验分布的分箱数据拟合
对每一个分箱进行经验分布的拟合,并求每一个风速值对应的概率值。
确定经验分布的反函数:对每一个分箱里面的概率值和风速值进行线行回归的拟合,用最小二乘法确定每一个分箱所对应的系数k,b。
经验分布拟合:设x1,x2,...,xn是总体X的一组容量为n的样本观测值,将它们按从小到大的顺序重新排列为对于任意实数x,定义函数:
Figure BDA00031480793400001610
则称Fn(x)为总体X的经验分布函数。
2.2k-means聚类范围参数辨识
基于2.1中获得的日前风速预报点估计值及风速分箱关系,可以建立考虑风速相邻时段相关性的多维分布函数模型,并使用聚类的方法对该多维分布函数的相关参数进行参数辨识,从而确定最佳分布函数的范围参数。
1、本发明任取ε,确定唯一的协方差矩阵;
2、生成服从多元正态分布的随机数;
3、对生成的随机数进行逆变换,得到风速值;
4、对风速值进行k-means聚类,得到聚类中心点集A;
5、求A和原始聚类中心点的极坐标表达式;
6、d最小时的ε即为最优范围参数;
2.2.1k时段风速协方差矩阵模型
把风速视为一个随机变量Z=(Z1,Z2,…,Zk)T,k是预测时间长度(本发明k=96)。设随机变量Z服从多元正态分布Z~N(μ,∑),协方差矩阵∑满足:
Figure BDA0003148079340000171
Figure BDA0003148079340000172
式中,σn,m=cov(Zn,Zm),n,m=1,2,…,k。σn,m表示随机变量Zn和Zm之间的协方差。
Figure BDA0003148079340000173
表示随机变量Zn和Zm之间的相关系数。
利用指数型协方差对数式的协方差σn,m进行建模:
Figure BDA0003148079340000174
式中,ε为范围参数,用于控制不同超前时间的随机变量Zt的相关性强度。
2.2.2多元正态分布随机数抽样及逆变换
逆变换抽样的方法已经广泛应用与风速的研究,为了模拟服从某种概率分布的风速或风功率的随机性,逆变换抽样方法用于随机抽样的风速或风功率样本。逆变换抽样的方法如下:
若对服从Pr(Pt≤p)=Fl(p)的某一随机变量Pt进行抽样,即从随机变量Pt的CDF进行随机抽样,逆变换抽样的方式如下:
Figure BDA0003148079340000181
式中,
Figure BDA0003148079340000182
是累计概率分布Fl的反函数;在本发明中,该累计概率分布Fl是经验分布;Unif[0,1]表示在[0,1]之间的均匀分布。
本发明引入2.2.1中服从多元正态分布的随机变量Z,大量生成服从标准正态分布的随机数,这些随机数的标准正态分布函数值集合是服从[0,1]之间的均匀分布,那么上式()中的均匀分布U可以用标准正态分布函数值
Figure BDA0003148079340000183
替代。已知随机变量Zt的随机数时,对随机变量Pt可以采取如下公式抽样:
Figure BDA0003148079340000184
Figure BDA0003148079340000185
用逆变换抽样的方法,可以不必直接对于风电可能出力的经验分布进行操作,而是通过先生成服从正态分布的随机数产生大量初始样本;且这样做更容易用多元正态分布的联合概率分布来表示风电的随机过程P={Pt,t∈T}T
2.2.3基于极坐标映射的最优范围参数的确定
由于本发明选取两个指标作为聚类的特征,对模拟风速的分类将产生四组聚类中心点,与由历史数据得到的四组聚类中心点进行相似性比较。而这两种聚类中心存在一下矛盾:顺序不同;缺乏合适的标准对向量组进行比较。因此,本发明提出将聚类中心点看做向量,并将笛卡尔坐标系下的向量序列投影到极坐标系下,该方法可以将两种聚类中心进行标幺值处理,得到统一坐标系下的两组向量序列,便于计算得到最优范围参数。
将原始数据的聚类中心点、模拟值的聚类中心点分别与零点连线,可以将聚类中心点看作向量,可得到两组各含四个向量的向量组,以下对这两组向量组的比较加以分析,确定范围参数的范围,并得到标幺值化后的坐标序列对应的极坐标,再将极坐标序列按照升序排列,得到ρ最小时的ε即为范围参数。
1.设原始数据的聚类中心点为p0,p1,p2,p3
2.模拟值的聚类中心点为q0,q1,q2,q3
3.将两组在笛卡尔坐标系下的聚类中心点看作向量P0,P1,P2,P3;Q0,Q1,Q2,Q3
4.设向量a=P0+P1+P2+P3,向量b=Q0+Q1+Q2+Q3
5.设定范围参数的值为[1,300]
6.每一个范围参数的值对应一个向量,分别为a0,a1,...,an
7.将向量的坐标序列进行标幺值化处理。
标幺值化公式:
Figure BDA0003148079340000191
ax,ay分别为向量a的横纵坐标;bx,by分别为向量b的横纵坐标
8.将笛卡尔坐标系下的标幺值化后的序列(x1,y1)(x2,y2)(x3,y3)…(xn,yn)投影到极坐标中序列坐标为(ρ11)(ρ22)(ρ33)…(ρnn)
9.将极坐标序列按照升序排列,若ρ最小时,相角差异不大,则定ρ最小时对应的范围参数的最优范围参数。
2.3风速动态场景模拟
确定预报日并基于ARIMA模型获取风速日前预报值的点估计,在2.2.1中选取对应时段的分箱号,从而确定各时段的经验分布模型。
辨识最优的范围参数ε(ε初始范围设置为[1,300]),确定对应的协方差矩阵Σ及该预报日的各时段相关性关系,进而确定了多元正态分布;
生成服从多元正态分布的随机数,并求其在标准正态分布对应的概率值;
根据ECDF的反函数求其风速模拟值。
3结果分析和验证
为了验证基于风速分类的风速动态场景生成的有效性,以及其应用于求解多维风速数据预测的可行性,仿真计算了96维风速数据的预测,生成了风速动态场景,并且将生成的动态场景与历史数据和预测数据比较,同时与Weibull分布生成的动态场景作比较。
3.1 96维风速数据的动态场景生成
为了验证基于风速分类的风速动态场景生成的可行性,本节将模型用于96维风速数据,对其进行动态场景生成。
3.1.1聚类结果
首先结合1.1-1.3中的聚类指标,在python下基于手肘法编写程序,对最佳聚类数进行了估计,结论显示聚类数为4时,聚类结果最优。
依据手肘法分析结论,可以得到如下聚类结果:
表1原始数据的聚类中心
Figure BDA0003148079340000201
3.1.2分箱线性回归的拟合
本发明分箱的宽度是0.5,通过对原始数据的处理,得到了37个箱子。其中选取比较典型的若干分箱,进行线性回归拟合ECDF,拟合效果如下:
表2均方根误差
分箱号 6 15 24 30
均方根误差 0.0016 0.0025 0.0070 0.0065
图4可以看到,经验分布曲线接近直线段,因此可以使用线性函数进行拟合。
3.1.3场景生成
为了进一步阐释本发明提出的动态场景的生成效果,图5显示了4月30日在ε=290的条件下对应的500个场景,并与用ARIMA模型的预报值和风速的原始值作比较。
3.2风速动态场景生成有效性的检验
3.2.1不同范围参数下的误差比较
由2.2.1分析可见,式中的范围参数ε将会影响多元正态随机数在不同时段的相关性,本发明于2.2.3分析了在极坐标下看误差。
可见,在不同的范围参数下,描述模拟场景集与原始场景集合差异的极径呈现较大的差异,即不同的范围参数可以很好的模拟不同的风速相关性。通过比较可以发现,最佳的范围参数为290,此时极径为0.2063,而此时的误差相角为15.84°,可以较好地模拟原始风速。
3.2.2动态场景生成方法与其他方法比较
将本发明提出的方法与常用的场景树方法生成动态场景作比较,两种方法各生成了200个场景。
以预报值为均值,标准差为均值的0.2倍用正态分布函数生成了200组风速的动态模拟场景,
本发明的方法基于相关性关系建模,很明显更好的模拟了未来可能的风速场景。不相关性的模拟完全没有实用价值,用这种场景做有关风电随机性分析,将产生较大偏差。
在本发明中,图4是第6、15、24、30个分箱的线性拟合示意图。图5历史值、预报值和场景的比较示意图。
4针对风速随机性强和高波动性给风速动态场景生成带来的问题,提出了一种基于风速分类的风速动态场景生成的方法。首先提取可以合理反映随机性和波动性特征的两个指标,并且基于这两个指标,将每天的风速进行聚类。再用季节性的ARIMA模型对日前风速进行预测,用分箱理论对预测数据进行分箱,建立历史数据和历史预报数据之间的模型关系。得到与预测数据配对的实际数据,并在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布。最后,对实际数据和预测数据通过k-means聚类后的两组聚类中心进行分析,将两组聚类中心转换为向量,用极坐标变换的方法确定范围参数,进而得到唯一的协方差矩阵,从而生成风速动态场景。
本发明以风速的两个特征对风速进行聚类,可以更好地反映不同类型风速数据的变化规律,从而能做出更加准确的预测。计算每天的风速特征指标,考虑到相邻时段风速的相关性,可以提高预测的准确性。结合范围参数对风速进行聚类的方法,把相似的数据放在一起比较,可以避免过拟合,对误差的容忍度较大,得到的预测结果更加精确。且在参数的辨识过程中,运用极坐标的方法来确定最优范围参数,可以对多向量的相似性进行比较,可以很好的解决聚类中心匹配的问题。同时还建立预测值和实际值的经验分布拟合模型,对两者之间的关系进行分析,基于以上创新点提出的风速动态场景生成模型能更加准确地反映实际情况。
3.1.3范围参数的辨识
由2.2.1小节分析可见,式中的范围参数ε将会影响多元正态随机数在不同时段的相关性,通过运用2.2.3中的方法,可以得到误差、范围参数与极径的结果如图6所示。
3.2场景生成
为了进一步阐述如何实现风速动态场景的生成,本节取ε=290按照2.3的步骤生成了200个场景。图7显示了4月30日在ε=290的条件下对应的200个场景,并与用SARIMA模型的预报值和风速的原始值作比较。
从图5上可以直观地看到,模拟生成的场景形成了一个宽度并不大的包络线区间,该区间将预报值与历史真值包络的同时很好的弥补了可能的波动性,整体模拟效果较好。
4风速动态场景生成有效性的检验
为了验证基于风速分类的风速动态场景生成的有效性,本发明从概率特性和自相关性两个方面进行比较,并用场景树法生成动态场景与之比较。
4.1场景树生成动态场景
以预报值为均值,标准差为均值的0.2倍用正态分布函数生成了200组风速的动态模拟场景。以下,从自相关性和概率特性两个角度,对不同方法下生成的场景树进行比较和评价。
4.2风速序列自相关性对比
本发明对风速场景模拟的最大贡献在于对风速进行模拟的同时,能对原有数据相关性最大程度的保留。为了更好地阐述这一问题,本发明对原始数据的自相关性和模拟数据的自相关性进行了分析和比较。相关结论可见图7。
从图7可以看到,常规场景树法产生了较大的偏差,不能很好地描述原始风速序列的自相关性,而本发明方法明显的更接近原始数据。并且通过计算可知,本发明方法的ACF绝对误差平均值仅为0.007,场景数的方法的ACF绝对误差平均值为0.039。可认为,本发明方法更好的保持了风速的时序特性。
4.3风速序列概率分布的对比
本发明将分析原始数据和模拟数据的概率特性,以验证本发明方法的精度。图8为原始数据和模拟数据的频数分布直方图。表1比较了原始风速序列和本发明方法的统计参数。
Figure BDA0003148079340000231
表1原始序列与模拟序列统计参数对比从表1可以看到,除模拟均值和模拟最小值本发明方法略逊于场景树法,其他指标均明显优于后者。而进一步的比较图8和图9(历史值和模拟值的累计概率分布图),可见,风速分布集中在均值附近。场景树方法且出现概率大的风速往低风速区间偏移,本发明方法的风速也集中在均值附近。因此,本发明方法可以很好的描述原始风速的概率特性,且对比场景树方法精度更高。对比图8的概率分布和图9的累计概率分布图可以明显的发现本发明方法更接近原始数据。
4.3动态场景的对比
本发明将它与本发明方法做了总体的比较如图10。通过计算可知,本发明方法模拟值的均方根误差为0.288,场景树方法的模拟值的均方根误差为1.710。因此,从整体效果上来看,本发明方法精度更高。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精
神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (9)

1.一种基于风速分类的风速动态场景生成方法,其特征在于,所述基于风速分类的风速动态场景生成方法包括:
获取风速原始数据,并自原始数据中提取可反映风速的随机性和波动性特征的两个指标;同时基于原始数据计算每日风速偏离度和变化率,并基于提取的指标进行k-means聚类,得到四个聚类中心;
利用季节性的ARIMA模型对历史数据进行预测,用分箱理论对预测风速进行分箱,建立历史数据和历史预报数据之间的模型关系,获取与预测风速配对的实际风速;
在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布;对预测风速数据进行k-means聚类;
基于两次k-means聚类的结果,对实际风速和预测风速通过k-means聚类后的两组聚类中心进行分析,将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数,得到唯一的协方差矩阵,生成风速动态场景;
所述可反映风速的随机性和波动性特征的两个指标分别为:风速的整体偏离度和整体风速变化率;
所述计算每日风速偏离度包括:
将原始数据以天为单位分段,将各样本中各时段的数据结合得到
Figure FDA0003689253320000011
并计算基于整个样本空间的该时段数据均值
Figure FDA0003689253320000012
对数据组合序列
Figure FDA0003689253320000013
用分布函数拟合得到相应的分布函数;通过样本数据中各样本每天各时段数据与均值
Figure FDA00036892533200000110
中对应时段数据做差,得到各样本偏差值序列
Figure FDA0003689253320000014
对偏差数据序列中所有样本的同时段数据组合,得到96个行向量,并对上述96个行向量做标准归一化处理,得到
Figure FDA0003689253320000015
通过对归一化后各样本各时段的归一化值
Figure FDA0003689253320000016
求和,得到样本中各时段风速偏离均值的整体偏离度
Figure FDA0003689253320000017
计算公式如下:
Figure FDA0003689253320000018
Figure FDA0003689253320000019
Figure FDA0003689253320000021
Figure FDA0003689253320000022
所述计算整体风速变化率包括:
以前一时段的风速值为基准求取变化率,重复操作得到所有样本各时段相对前一时刻的风速变化率
Figure FDA0003689253320000023
并对其进行标准化处理,得到归一化后的风速变化率
Figure FDA0003689253320000024
计算样本中各时段风速波动速率的整体风速变化率
Figure FDA0003689253320000025
计算公式如下:
Figure FDA0003689253320000026
Figure FDA0003689253320000027
Figure FDA0003689253320000028
2.如权利要求1所述基于风速分类的风速动态场景生成方法,其特征在于,所述基于提取的指标进行k-means聚类,得到四个聚类中心包括:
用手肘法确定聚类的数目,再基于风速的整体偏离度和整体风速变化率两个指标,对每天的风速进行k-means聚类,得到风速的k种类型,以及每个日期对应的风速类型;
所述用分箱理论对预测风速进行分箱包括:
获取所有由预测风速
Figure FDA0003689253320000029
和实际风速
Figure FDA00036892533200000210
组成的风速对
Figure FDA00036892533200000211
使用分级算法,对得到的预测风速
Figure FDA00036892533200000212
进行离散化处理;并对构建的箱中的每个预测风速
Figure FDA00036892533200000213
确定所有实际风速并将其存储在列表
Figure FDA00036892533200000214
中;所述列表包含所有与
Figure FDA00036892533200000215
中的选定
Figure FDA00036892533200000216
配对的
Figure FDA00036892533200000217
3.如权利要求1所述基于风速分类的风速动态场景生成方法,其特征在于,所述在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布包括:
首先,确定经验分布的反函数:对每一个分箱里面的概率值和风速值进行线行回归的拟合,用最小二乘法确定每一个分箱所对应的系数k,b;
其次,进行经验分布拟合,公式如下:
Figure FDA0003689253320000031
其中,Fn(x)为总体X的经验分布函数;x1,x2,...,xn为总体X的一组容量为n的样本观测值,按从小到大的顺序排列;x为任意实数。
4.如权利要求1所述基于风速分类的风速动态场景生成方法,其特征在于,所述确定范围参数包括:
基于确定的日前风速预报点估计值及风速分箱关系,建立考虑风速相邻时段相关性的多维分布函数模型,并使用聚类的方法对该多维分布函数的相关参数进行参数辨识,确定最佳分布函数的范围参数;
所述确定范围参数包括以下步骤:
(1)任取ε,确定唯一的协方差矩阵;生成服从多元正态分布的随机数;对生成的随机数进行逆变换,得到风速值;
(2)对风速值进行k-means聚类,得到聚类中心点集A;计算A和原始聚类中心点的极坐标表达式;
(3)当d最小时的ε即为最优范围参数。
5.如权利要求1所述基于风速分类的风速动态场景生成方法,其特征在于,所述唯一的协方差矩阵如下:
风速为一个随机变量Z=(Z1,Z2,…,Zk)T,k表示预测时间长度;随机变量Z服从多元正态分布Z~N(μ,∑),协方差矩阵∑满足:
Figure FDA0003689253320000032
Figure FDA0003689253320000033
式中,δn,m=cov(Zn,Zm),n,m=1,2,…,k,δn,m表示随机变量Zn和Zm之间的协方差;
Figure FDA0003689253320000044
表示随机变量Zn和Zm之间的相关系数;
利用指数型协方差对数式的协方差σn,m进行建模:
Figure FDA0003689253320000041
式中,ε为范围参数,用于控制不同超前时间的随机变量Zt的相关性强度。
6.如权利要求1所述基于风速分类的风速动态场景生成方法,其特征在于,所述得到唯一的协方差矩阵还包括:进行多元正态分布随机数抽样及逆变换;
所述多元正态分布随机数抽样包括:
已知随机变量Zt的随机数,对随机变量Pt可以采取如下公式抽样:
Figure FDA0003689253320000042
Figure FDA0003689253320000043
所述将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数包括:
将聚类中心点做为向量,并将笛卡尔坐标系下的向量序列投影到极坐标系下,得到统一坐标系下的两组向量序列,对得到的两组向量组的比较、分析,确定范围参数的范围,并得到标幺值化后的坐标序列对应的极坐标,再将极坐标序列按照升序排列,得到ρ最小时的ε即为范围参数;
步骤如下:
1)原始数据的聚类中心点为p0,p1,p2,p3;模拟值的聚类中心点为q0,q1,q2,q3;将两组在笛卡尔坐标系下的聚类中心点看作向量
P0,P1,P2,P3;Q0,Q1,Q2,Q3
2)向量a=P0+P1+P2+P3,向量b=Q0+Q1+Q2+Q3;确定范围参数的值为[1,300];每一个范围参数的值对应一个向量,分别为a0,a1,...,an
3)将向量的坐标序列进行标幺值化处理;将笛卡尔坐标系下的标幺值化后的序列(x1,y1)(x2,y2)(x3,y3)…(xn,yn)投影到极坐标中序列坐标为(ρ11)(ρ22)(ρ33)…(ρnn);
4)将极坐标序列按照升序排列,若ρ最小时,相角差异不大,则定ρ最小时对应的范围参数的最优范围参数;
所述标幺值化公式:
Figure FDA0003689253320000051
其中,ax,ay分别为向量a的横纵坐标;bx,by分别为向量b的横纵坐标。
7.如权利要求1所述基于风速分类的风速动态场景生成方法,其特征在于,所述生成风速动态场景包括:
确定预报日并基于ARIMA模型获取风速日前预报值的点估计,选取对应时段的分箱号,确定各时段的经验分布模型;基于辨识最优的范围参数ε,确定对应的协方差矩阵Σ及所述预报日的各时段相关性关系,确定多元正态分布;生成服从多元正态分布的随机数,并计算在标准正态分布对应的概率值;根据ECDF的反函数求其风速模拟值。
8.一种基于风速分类的风速动态场景生成系统,其特征在于,所述基于风速分类的风速动态场景生成系统包括:
数据获取模块,用于获取风速原始数据,并自原始数据中提取可反映风速的随机性和波动性特征的两个指标;同时基于原始数据计算每日风速偏离度和变化率,并基于提取的指标进行k-means聚类,得到四个聚类中心;
实际风速获取模块,用于利用季节性的ARIMA模型对历史数据进行预测,用分箱理论对预测风速进行分箱,建立历史数据和历史预报数据之间的模型关系,获取与预测风速配对的实际风速;
聚类模块,用于在给定的预测风速条件下,拟合每一个分箱中的预测风速的条件经验分布;对预测风速数据进行k-means聚类;
风速动态场景生成模块,用于基于两次k-means聚类的结果,对实际风速和预测风速通过k-means聚类后的两组聚类中心进行分析,将两组聚类中心转换为向量,利用极坐标变换的方法确定范围参数,得到唯一的协方差矩阵,生成风速动态场景;
所述可反映风速的随机性和波动性特征的两个指标分别为:风速的整体偏离度和整体风速变化率;
所述计算每日风速偏离度包括:
将原始数据以天为单位分段,将各样本中各时段的数据结合得到
Figure FDA0003689253320000061
并计算基于整个样本空间的该时段数据均值
Figure FDA0003689253320000062
对数据组合序列
Figure FDA0003689253320000063
用分布函数拟合得到相应的分布函数;通过样本数据中各样本每天各时段数据与均值
Figure FDA00036892533200000618
中对应时段数据做差,得到各样本偏差值序列
Figure FDA0003689253320000064
对偏差数据序列中所有样本的同时段数据组合,得到96个行向量,并对上述96个行向量做标准归一化处理,得到
Figure FDA0003689253320000065
通过对归一化后各样本各时段的归一化值
Figure FDA0003689253320000066
求和,得到样本中各时段风速偏离均值的整体偏离度
Figure FDA0003689253320000067
计算公式如下:
Figure FDA0003689253320000068
Figure FDA0003689253320000069
Figure FDA00036892533200000610
Figure FDA00036892533200000611
所述计算整体风速变化率包括:
以前一时段的风速值为基准求取变化率,重复操作得到所有样本各时段相对前一时刻的风速变化率
Figure FDA00036892533200000612
并对其进行标准化处理,得到归一化后的风速变化率
Figure FDA00036892533200000613
计算样本中各时段风速波动速率的整体风速变化率
Figure FDA00036892533200000614
计算公式如下:
Figure FDA00036892533200000615
Figure FDA00036892533200000616
Figure FDA00036892533200000617
9.一种信息数据处理终端,其特征在于,所述信息数据处理终端包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~7任意一项所述基于风速分类的风速动态场景生成方法。
CN202110758297.8A 2021-07-05 2021-07-05 一种基于风速分类的风速动态场景生成方法、系统及终端 Active CN113487080B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110758297.8A CN113487080B (zh) 2021-07-05 2021-07-05 一种基于风速分类的风速动态场景生成方法、系统及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110758297.8A CN113487080B (zh) 2021-07-05 2021-07-05 一种基于风速分类的风速动态场景生成方法、系统及终端

Publications (2)

Publication Number Publication Date
CN113487080A CN113487080A (zh) 2021-10-08
CN113487080B true CN113487080B (zh) 2022-07-22

Family

ID=77940353

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110758297.8A Active CN113487080B (zh) 2021-07-05 2021-07-05 一种基于风速分类的风速动态场景生成方法、系统及终端

Country Status (1)

Country Link
CN (1) CN113487080B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298707A (zh) * 2011-08-24 2011-12-28 辽宁力迅风电控制系统有限公司 基于连续时间段聚类与支持向量机建模的风电功率预测方法
CN104778506A (zh) * 2015-03-31 2015-07-15 天津大学 基于局部集成学习的短期风速预报方法
WO2018178809A1 (en) * 2017-03-28 2018-10-04 Bundesamt Für Zivilluftfahrt Noise level simulation method as well as computer readable medium and system therefore
CN112653198A (zh) * 2020-12-17 2021-04-13 山东大学 一种基于预测箱的风电出力场景生成方法及系统
CN112855458A (zh) * 2019-11-26 2021-05-28 中车株洲电力机车研究所有限公司 一种风力发电机组的风速仪故障诊断方法、系统及介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298707A (zh) * 2011-08-24 2011-12-28 辽宁力迅风电控制系统有限公司 基于连续时间段聚类与支持向量机建模的风电功率预测方法
CN104778506A (zh) * 2015-03-31 2015-07-15 天津大学 基于局部集成学习的短期风速预报方法
WO2018178809A1 (en) * 2017-03-28 2018-10-04 Bundesamt Für Zivilluftfahrt Noise level simulation method as well as computer readable medium and system therefore
CN112855458A (zh) * 2019-11-26 2021-05-28 中车株洲电力机车研究所有限公司 一种风力发电机组的风速仪故障诊断方法、系统及介质
CN112653198A (zh) * 2020-12-17 2021-04-13 山东大学 一种基于预测箱的风电出力场景生成方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Coordination Scheduling of Wind-Hydropower Generation and Profit Allocation Based on Shapley Value Method;Yi Quan.et.;《Mathematical Problems in Engineering》;20200530;第2020卷;第1-20页 *
基于模糊粗糙集与改进聚类的神经网络风速预测;刘兴杰等;《中国电机工程学报》;20140705;第34卷(第19期);第3162-3169页 *

Also Published As

Publication number Publication date
CN113487080A (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
Jiang et al. Scenario generation for wind power using improved generative adversarial networks
CN110991786B (zh) 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN111199016A (zh) 一种基于DTW的改进K-means的日负荷曲线聚类方法
CN110163429B (zh) 一种基于相似日优化筛选的短期负荷预测方法
CN112488395A (zh) 一种配电网线损预测方法及系统
CN110750524A (zh) 一种有源配电网故障特征的确定方法及系统
CN111723929A (zh) 一种基于神经网络的数值预报产品订正方法、装置和系统
CN111008726B (zh) 一种电力负荷预测中类图片转换方法
CN111027629A (zh) 基于改进随机森林的配电网故障停电率预测方法及系统
CN115293326A (zh) 电力负荷预测模型的训练方法、装置及电力负荷预测方法
CN111612275A (zh) 一种预测区域用户负荷量的方法及装置
CN112541546A (zh) 一种基于多场景模型的光伏电站典型场景生成方法
CN114021483A (zh) 基于时域特征与XGBoost的超短期风电功率预测方法
CN112418476A (zh) 一种超短期电力负荷预测方法
CN115358437A (zh) 基于卷积神经网络的供电负荷预测方法
CN113807568A (zh) 一种电力负荷预测方法、装置及终端设备
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN113468796A (zh) 一种基于改进随机森林算法的电压缺失数据辨识方法
CN116706992A (zh) 一种分布式光伏集群的自适应功率预测方法、装置和设备
CN117851908B (zh) 一种改进的在线低压台区电能表失准监测方法及装置
CN114626487A (zh) 基于随机森林分类算法的线变关系校核方法
CN111950752A (zh) 光伏电站发电量预测方法、装置、系统及其存储介质
CN113449920A (zh) 一种风电功率预测方法、系统及计算机可读介质
CN113379116A (zh) 基于聚类和卷积神经网络的台区线损预测方法
CN113487080B (zh) 一种基于风速分类的风速动态场景生成方法、系统及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant