CN116739104A - 一种新能源功率序列样本生成方法及系统 - Google Patents
一种新能源功率序列样本生成方法及系统 Download PDFInfo
- Publication number
- CN116739104A CN116739104A CN202310146840.8A CN202310146840A CN116739104A CN 116739104 A CN116739104 A CN 116739104A CN 202310146840 A CN202310146840 A CN 202310146840A CN 116739104 A CN116739104 A CN 116739104A
- Authority
- CN
- China
- Prior art keywords
- new energy
- energy station
- correlation coefficient
- station group
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000010248 power generation Methods 0.000 claims abstract description 72
- 239000011159 matrix material Substances 0.000 claims description 27
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000012423 maintenance Methods 0.000 claims description 15
- 230000009467 reduction Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000009827 uniform distribution Methods 0.000 claims description 4
- 238000005070 sampling Methods 0.000 abstract description 3
- 238000010219 correlation analysis Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/38—Arrangements for parallely feeding a single network by two or more generators, converters or transformers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
- H02J2300/22—The renewable source being solar energy
- H02J2300/24—The renewable source being solar energy of photovoltaic origin
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2300/00—Systems for supplying or distributing electric power characterised by decentralized, dispersed, or local generation
- H02J2300/20—The dispersed energy generation being of renewable origin
- H02J2300/28—The renewable source being wind energy
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Power Engineering (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明提供一种新能源功率序列样本生成方法及系统根据新能源场站群中新能源场站的发电功率数据计算场站之间的相关系数,并通过所述相关系数对新能源场站进行分组,并对其中的可降维新能源场站组中通过场站之间相关系数生成相关系数子矩阵,确定可降维新能源场站组发电功率序列,再与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。所述方法和系统通过先相关性分析,再分组聚类,最后随机生成新能源功率序列样本,既保持了新能源功率的随机性,又保证了新能源相互间的相关性不变,并且使得整个功能序列样本的维度大幅度降低,降低了空间采样和样本生成的难度,具有较高的生成效率。
Description
技术领域
本发明涉及机器学习领域,并且更具体地,涉及一种新能源功率序列样本生成方法及系统。
背景技术
作为实现能源转型的重要举措之一,新能源在能源供应结构中的比重愈来愈高,其出力波动性和随机性给传统电源规划带来了巨大挑战。新能源大规模接入挤占常规机组开机空间,或出现系统运转调频能力下降、无功支撑不足、电压稳定问题突出、越限风险增加等问题。由于新能源机组的数量众多,如果每个机组单独考虑,必定造成样本空间的维度过高,增加样本生成的难度;并且,新能源机组之间通常存在较强的相关性,例如同一时段、同一区域的风电机组可能处于相似的气象条件下,其功率曲线呈现相同的变化趋势,利用这种相关性所生成的样本数据也会更加贴近实际情况。因此,针对新能源机组数量多造成的生成样本难度大,如何利用新能源机组之间的相关性提高新能源机组功率数据生成效率,就成为一个亟需解决的技术问题。
发明内容
为了解决现有技术中新能源机组在电网中的比重大,单独考虑每个机组造成的样本生成难度大的问题,本发明提供一种新能源功率序列样本生成方法及系统。
根据本发明的一方面,本发明提供一种新能源功率序列样本生成方法,所述方法包括:
获取新能源场站群中多个新能源场站在同一历史周期的相同数量的发电功率历史数据;
根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数;
根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组;
根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组;
根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列;
将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。
可选地,根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数,其中,所述相关系数的计算公式为:
式中,xik和xjk分别表示新能源场站i和新能源场站j的第k个发电功率,和/>分别表示新能源场站i和新能源场站j的n个发电功率的平均值,ρij表示新能源场站i和新能源场站j的相关系数,1≤i,j≤m,m表示所述新能源场站群中新能源场站的总数量。
可选地,根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组,包括:
根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离dij,其中,1≤i,j≤m,m表示新能源场站群中新能源场站的总数量;
根据所述距离dij,采用聚类算法确定K个新能源场站组。
可选地,根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离di,j,其中,所述距离di,j的计算公式为:
式中,ρij表示场站i和场站j的相关系数。
可选地,根据所述距离dij,采用聚类算法确定K个新能源场站组,包括:
设置参数K,其中,K为大于1的自然数;
将所述距离dij作为样本点,生成样本集D={dij};
采用K-Means算法,按照簇内距离最小,簇间距离最大的原则,将样本集D划分为K个簇,其中,每个簇的质心为与簇内其他样本点的距离的平均值最小的样本点;
将每个簇中的样本点对应的全部新能源场站的集合作为1个新能源场站组。
可选地,根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组,包括:
对于K个新能源场站组中的任意一个新能源场站组,当该组中全部新能源场站之间的相关系数都大于设置的相关系数阈值时,确定该新能源场站组为可降维新能源场站组。
可选地,根据每个可降维新能源场站中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列,包括:
根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵Rl×l,其中,l为该可降维新能源场站组中新能源场站的总数;
采用Cholesky分解对所述相关系数子矩阵Rl×l进行分解,确定下三角矩阵L,其中,所述相关系数子矩阵Rl×l和下三角矩阵L的关系式为:
R=L·LT
式中,LT是下三角矩阵L的转置;
根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S。
可选地,根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S,包括:
将获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据输入符合均匀分布的随机序列发生器rand;
所述随机序列发生器rand基于所述下三角矩阵L和每个降维新能源场站组中新能源场站的总数l生成所述发电功率序列S,其中,所述发电功率序列S的表达式为:
S=rand(num,l)·L
式中,num为设置的拟生成发电功率序列样本中每个新能源场站的发电功率数据数量。
可选地,将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列,包括:
根据设置的拟生成发电功率序列样本中每个新能源场站的发电功率数据数量和时间周期,获取非可降维新能源场站组中每个新能源场站的发电功率数据,生成每个非可降维新能源场站组的发电功率序列;
将全部可降维新能源场站组的发电功率序列和全部非可降维新能源场站组的发电功率序列进行拼接,生成所述新能源场站群的发电功率序列样本Ynum×m,其中,m表示所述新能源场站群中新能源场站的总数量。
根据本发明的另一方面,本发明提供一种新能源功率序列样本生成系统,所述系统包括:
数据获取单元,用于获取新能源场站群中多个新能源场站在同一历史周期的相同数量的发电功率历史数据;
相关系数单元,用于根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数;
第一分组单元,用于根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组;
第二分组单元,用于根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组;
降维样本单元,用于根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列;
功率样本单元,用于将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。
本发明技术方案提供的新能源功率序列样本生成方法及系统根据新能源场站群中新能源场站的发电功率数据计算场站之间的相关系数,并通过所述相关系数对新能源场站进行分组,并对其中的可降维新能源场站组中通过场站之间相关系数生成相关系数子矩阵,确定可降维新能源场站组发电功率序列,再与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。所述方法和系统通过先相关性分析,再分组聚类,最后随机生成新能源功率序列样本,既保持了新能源功率的随机性,又保证了新能源相互间的相关性不变,并且使得整个功能序列样本的维度大幅度降低,降低了空间采样和样本生成的难度,具有较高的生成效率。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为根据本发明优选实施方式的新能源功率序列样本生成方法的流程图;
图2为根据本发明优选实施方式的风电场相关系数值与相关系数样本的分布直方图;
图3为根据本发明优选实施方式的风电场相关系数值与风电场数量的分布直方图;
图4为根据本发明优选实施实施方式对新能源场站群进行分组时确定质心的原理图;
图5为根据本发明优选实施实施方式的新能源功率序列样本生成系统的结构示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
示例性方法
图1为根据本发明优选实施方式的新能源功率序列样本生成方法的流程图。如图1所示,本优选实施方式所述的新能源功率序列样本生成方法从步骤101开始。
在步骤101,获取新能源场站群中多个新能源场站在同一历史周期的相同数量的发电功率历史数据。
在一个实施例中,由于新能源机组数据较多,并且不同地区建模水平可能各不相同,因此统一采用以厂站为单元的功率统计方式对东北电网2019年9-12月在线数据中的风电场功率进行统计,其中,共有138个风电场,每个风电场采集数量相等的发电功率历史数据。此处须知,由于新能源场站的不同特性,因此,进行发电功率历史数据采集以生成功率样本序列时,需将风电场和光伏电站分开统计。
在步骤102,根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数。
优选地,根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数,其中,所述相关系数的计算公式为:
式中,xik和xjk分别表示新能源场站i和新能源场站j的第k个发电功率,和/>分别表示新能源场站i和新能源场站j的n个发电功率的平均值,ρij表示新能源场站i和新能源场站j的相关系数,1≤i,j≤m,m表示所述新能源场站群中新能源场站的总数量。
本优选实施方式中采用皮尔逊相关系数作为依据计算场站之间的相关系数,但采用其他相关系数计算方式亦在本发明保护范围之内。采用皮尔逊相关系数法针对东北电网风电场的发电功率历史数据进行相关系数计算,得到138*138维度的相关系数矩阵,除去对角线上相关系数为1.0的部分以外,共计18906个相关系数结果,其中正相关结果有18140个,占比为95.95%,当设置相关系数阈值为0.5,相关系数大于0.5表示两个风电声强相关时,强相关结果有3010个,占比为15.92%。图2为根据本发明优选实施方式的风电场相关系数值与相关系数样本的分布直方图。如图2所示,在18906个相关系数样本中,除了极个别为负相关以外,1000个左右为不相关以外,绝大部分为正相关,其中,相关系数为0.2左右的样本数量最多,超过4000个,0.3左右的样本数量次之,近4000个。
进一步地,根据计算的相关系数值对风电场进行统计。图3为根据本发明优选实施方式的风电场相关系数值与风电场数量的分布直方图。如图3所示,相关系数值位于区间(0.8,0.9)的风电场站数量超过30个,相关系数值位于区间(0.7,0.8)的风电场站数量也超过30个。总体来看,至少存在1个强相关结果的风电场数量达到了137个,占比为99.28%;只有1个风电场不存在强相关结果,但该风场的最大相关系数结果也达到了0.46。从图3可以看出,风电场发电功率主要呈现强正相关(地理位置相近)或不相关(地理位置较远)的情况,这是由于局部气象条件通常比较相近,而呈现强负相关的例子几乎没有;依据相关系数是可以把新能源厂站进行分组的,从而对具有强相关的新能源场站组通过序列生成器统一生成功率序列,而不具有强相关的新能源场站组则独立采集组中新能源场站的发电功率数据生成功率序列,从而达到减小原始特征空间维度的目的。
在步骤103,根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组。
优选地,根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组,包括:
根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离dij,其中,1≤i,j≤m,m表示新能源场站群中新能源场站的总数量;
根据所述距离dij,采用聚类算法确定K个新能源场站组。
优选地,根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离di,j,其中,所述距离di,j的计算公式为:
式中,ρij表示场站i和场站j的相关系数。
优选地,根据所述距离dij,采用聚类算法确定K个新能源场站组,包括:
设置参数K,其中,K为大于1的自然数;
将所述距离dij作为样本点,生成样本集D={dij};
采用K-Means算法,按照簇内距离最小,簇间距离最大的原则,将样本集D划分为K个簇,其中,每个簇的质心为与簇内其他样本点的距离的平均值最小的样本点;
将每个簇中的样本点对应的全部新能源场站的集合作为1个新能源场站组。
通过风电场之间的相关系数分析可以得到不同风电场之间的相似程度,相似系数越大代表场站之间的相似程度越高。在一个实施例中,采用K-Mean算法,即K均值算法对138个风电场进行聚类,其中,K为超参数,代表分群数量,为事先指定。在对138个风电场进行聚类前,先将138个风电场的18906个相关系数转换为场站间的距离,距离越大,代表相似程度越低。依据场站间距离关系,采用K-Mean算法将138个风电场的18906个场站间的距离组成的样本集分为K个簇,使得簇内距离最小(相似度高),簇间距离最大(相似度低),从而把相似样本分为一组。其中,每个簇的簇内所有样本点的均值位置称为“质心”,质心为一个虚拟的样本点,代表一个簇的中心位置。但是,本实施例所述方法采用新能源场站间的相关系数来代表相似性,即只有场站间距离,而没有每个样本点的实际坐标,因此没法计算出质心的位置。基于此,本实施例对传统的K-Means算法进行了改进:选择与簇内其他样本点的距离的平均值最小的样本点作为该簇的质心位置。图4为根据本发明优选实施实施方式对新能源场站群进行分组时确定质心的原理图。如图4所示,假设对新能源场站群进行分组聚类时,其中1个簇内共有4个样本点(用实线空心圆形1至4表示),其质心如虚线圆形a所示,但由于虚线圆形a的坐标无法获取,只能用实际存在的实线空心圆形1代表质心,此时该簇覆盖范围从虚线圆b扩大至虚线圆c。这种改进会略微降低K-Means分群过程的稳定性,但通过实践发现改进后K-Means算法仍可以很好地完成新能源场站分组的任务。本实施例中,当K取20时,138个风电场划分为20个新能源场站组。
在步骤104,根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组。
优选地,根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组,包括:
对于K个新能源场站组中的任意一个新能源场站组,当该组中全部新能源场站之间的相关系数都大于设置的相关系数阈值时,确定该新能源场站组为可降维新能源场站组。
在本优选实施方式中,设置的相关系数阈值为0.5,当两个场站之间的相关系数大于0.5时,认为两个场站强相关。将138个风电场划分为20个新能源场站组后,有11个场站组内的全部场站的相关系数大于0.5,即群内场站间全部属于强相关关系,如表1所示,表中11个场站组,共包含了75个场站,场站间相关系数最小值大于0.5,为可降维新能源场站组。
表1东北电网可降维风电场分组列表
在步骤105,根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列。
优选地,根据每个可降维新能源场站中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列,包括:
根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵Rl×l,其中,l为该可降维新能源场站组中新能源场站的总数;
采用Cholesky分解对所述相关系数子矩阵Rl×l进行分解,确定下三角矩阵L,其中,所述相关系数子矩阵Rl×l和下三角矩阵L的关系式为:
R=L·LT
式中,LT是下三角矩阵L的转置;
根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S。
优选地,根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S,包括:
将获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据输入符合均匀分布的随机序列发生器rand;
所述随机序列发生器rand基于所述下三角矩阵L和每个降维新能源场站组中新能源场站的总数l生成所述发电功率序列S,其中,所述发电功率序列S的表达式为:
S=rand(num,l)·L
式中,num为设置的拟生成发电功率序列样本中每个新能源场站的发电功率数据数量。
在步骤106,将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。
在一个实施例中,将新能源场站群中的11个可降维新能源场站组筛选出来后,若需要生成所述新能源场站群在任意一个时间周期的发电功率序列样本,对11个可降维新能源场站组,只需要采集组中任意一个新能源场站的发电功率数据,采用随机序列发生器按照发电功率序列的表达式即可自动随机生成发电功率序列。由于在上述11个可降维新能源场站组中,只需要采集11个新能源场站的发电功率数据后,即可采用随机序列发生器生成11个可降维新能源场站组中全部75个新能源场站的发电功率样本,相当于将在获取新能源场站群的功率序列样本时,原来需要采集的75维数据被降维为11维,和现有的样本生成方法相比,降低了空间采样和样本生成的难度,提高了生成效率。而对其余9个非可降维新能源场站组,则按照拟生成功率序列样本设置的时间周期,功率样本数量,采集每个非可降维新能源场站组中全部新能源场站的发电功率数据样本,生成每个非可降维新能源场站组的发电功率序列,最后将20个新能源场站组的发电功率序列进行组合即可得到所述新能源场站组的发电功率序列样本。
示例性系统
图5为根据本发明优选实施方式的新能源功率序列样本生成系统的结构示意图。如图5所示,本优选实施方式所述的新能源功率序列样本生成系统包括:
数据获取单元501,用于获取新能源场站群中多个新能源场站在同一历史周期的相同数量的发电功率历史数据;
相关系数单元502,用于根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数;
第一分组单元503,用于根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组;
第二分组单元504,用于根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组;
降维样本单元505,用于根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列;
功率样本单元506,用于将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。
优选地,相关系数单元502根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数,其中,所述相关系数的计算公式为:
式中,xik和xjk分别表示新能源场站i和新能源场站j的第k个发电功率,和/>分别表示新能源场站i和新能源场站j的n个发电功率的平均值,ρij表示新能源场站i和新能源场站j的相关系数,1≤i,j≤m,m表示所述新能源场站群中新能源场站的总数量。
优选地,第一分组单元503根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组,包括:
根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离dij,其中,1≤i,j≤m,m表示新能源场站群中新能源场站的总数量;
根据所述距离dij,采用聚类算法确定K个新能源场站组。
优选地,第一分组单元503根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离di,j,其中,所述距离di,j的计算公式为:
式中,ρij表示场站i和场站j的相关系数。
优选地,第一分组单元503根据所述距离dij,采用聚类算法确定K个新能源场站组,包括:
设置参数K,其中,K为大于1的自然数;
将所述距离dij作为样本点,生成样本集D={dij};
采用K-Means算法,按照簇内距离最小,簇间距离最大的原则,将样本集D划分为K个簇,其中,每个簇的质心为与簇内其他样本点的距离的平均值最小的样本点;
将每个簇中的样本点对应的全部新能源场站的集合作为1个新能源场站组。
优选地,第二分组单元504根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组,包括:
对于K个新能源场站组中的任意一个新能源场站组,当该组中全部新能源场站之间的相关系数都大于设置的相关系数阈值时,确定该新能源场站组为可降维新能源场站组。
优选地,降维样本单元505根据每个可降维新能源场站中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列,包括:
根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵Rl×l,其中,l为该可降维新能源场站组中新能源场站的总数;
采用Cholesky分解对所述相关系数子矩阵Rl×l进行分解,确定下三角矩阵L,其中,所述相关系数子矩阵Rl×l和下三角矩阵L的关系式为:
R=L·LT
式中,LT是下三角矩阵L的转置;
根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S。
优选地,降维样本单元505根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S,包括:
将获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据输入符合均匀分布的随机序列发生器rand;
所述随机序列发生器rand基于所述下三角矩阵L和每个降维新能源场站组中新能源场站的总数l生成所述发电功率序列S,其中,所述发电功率序列S的表达式为:
S=rand(num,l)·L
式中,num为设置的拟生成发电功率序列样本中每个新能源场站的发电功率数据数量。
优选地,功率样本单元506将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列,包括:
根据设置的拟生成发电功率序列样本中每个新能源场站的发电功率数据数量和时间周期,获取非可降维新能源场站组中每个新能源场站的发电功率数据,生成每个非可降维新能源场站组的发电功率序列;
将全部可降维新能源场站组的发电功率序列和全部非可降维新能源场站组的发电功率序列进行拼接,生成所述新能源场站群的发电功率序列样本Ynum×m,其中,m表示所述新能源场站群中新能源场站的总数量。
本优选实施方式所述的新能源功率序列样本生成系统通过相关性分析,聚类分组后随机生成可降维新能源场站组的发电功率序列,现将其与非可降维新能源场站组的发电功率序列进行组合生成新能源场站群降维后的功率序列样本的步骤,与本优选实施方式所述的新能源功率序列样本生成方法采用的步骤相同,达到的技术效果也相同,在此不再赘述。
已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (10)
1.一种新能源功率序列样本生成方法,其特征在于,所述方法包括:
获取新能源场站群中多个新能源场站在同一历史周期的相同数量的发电功率历史数据;
根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数;
根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组;
根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组;
根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列;
将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。
2.根据权利要求1所述的方法,其特征在于,根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数,其中,所述相关系数的计算公式为:
式中,xik和xjk分别表示新能源场站i和新能源场站j的第k个发电功率,和/>分别表示新能源场站i和新能源场站j的n个发电功率的平均值,ρij表示新能源场站i和新能源场站j的相关系数,1≤i,j≤m,m表示所述新能源场站群中新能源场站的总数量。
3.根据权利要求1所述的方法,其特征在于,根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组,包括:
根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离dij,其中,1≤i,j≤m,m表示新能源场站群中新能源场站的总数量;
根据所述距离dij,采用聚类算法确定K个新能源场站组。
4.根据权利要求3所述的方法,其特征在于,根据所述新能源场站群中新能源场站i和新能源场站j之间的相关系数确定新能源场站i和新能源场站j的距离di,j,其中,所述距离di,j的计算公式为:
式中,ρij表示场站i和场站j的相关系数。
5.根据权利要求3所述的方法,其特征在于,根据所述距离dij,采用聚类算法确定K个新能源场站组,包括:
设置参数K,其中,K为大于1的自然数;
将所述距离dij作为样本点,生成样本集D={dij};
采用K-Means算法,按照簇内距离最小,簇间距离最大的原则,将样本集D划分为K个簇,其中,每个簇的质心为与簇内其他样本点的距离的平均值最小的样本点;
将每个簇中的样本点对应的全部新能源场站的集合作为1个新能源场站组。
6.根据权利要求1所述的方法,其特征在于,根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组,包括:
对于K个新能源场站组中的任意一个新能源场站组,当该组中全部新能源场站之间的相关系数都大于设置的相关系数阈值时,确定该新能源场站组为可降维新能源场站组。
7.根据权利要求1所述的方法,其特征在于,根据每个可降维新能源场站中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列,包括:
根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵Rl×l,其中,l为该可降维新能源场站组中新能源场站的总数;
采用Cholesky分解对所述相关系数子矩阵Rl×l进行分解,确定下三角矩阵L,其中,所述相关系数子矩阵Rl×l和下三角矩阵L的关系式为:
R=L·LT
式中,LT是下三角矩阵L的转置;
根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S。
8.根据权利要求7所述的方法,其特征在于,根据所述下三角矩阵L和获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据,生成每个可降维新能源场站组的发电功率序列S,包括:
将获取的每个可降维新能源场站组中任意一个新能源场站在所述新能源场站群拟生成发电功率序列样本的时间周期内的发电功率数据输入符合均匀分布的随机序列发生器rand;
所述随机序列发生器rand基于所述下三角矩阵L和每个降维新能源场站组中新能源场站的总数l生成所述发电功率序列S,其中,所述发电功率序列S的表达式为:
S=rand(num,l)·L
式中,num为设置的拟生成发电功率序列样本中每个新能源场站的发电功率数据数量。
9.根据权利要求8所述的方法,其特征在于,将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列,包括:
根据设置的拟生成发电功率序列样本中每个新能源场站的发电功率数据数量和时间周期,获取非可降维新能源场站组中每个新能源场站的发电功率数据,生成每个非可降维新能源场站组的发电功率序列;
将全部可降维新能源场站组的发电功率序列和全部非可降维新能源场站组的发电功率序列进行拼接,生成所述新能源场站群的发电功率序列样本Ynum×m,其中,m表示所述新能源场站群中新能源场站的总数量。
10.一种新能源功率序列样本生成系统,其特征在于,所述系统包括:
数据获取单元,用于获取新能源场站群中多个新能源场站在同一历史周期的相同数量的发电功率历史数据;
相关系数单元,用于根据所述发电功率历史数据,计算所述新能源场站群中任意两个新能源场站之间的相关系数;
第一分组单元,用于根据所述相关系数对所述新能源场站群中的新能源场站进行分组,确定K个新能源场站组;
第二分组单元,用于根据预先设置的相关系数阈值确定所述K个新能源场站组中的可降维新能源场站组;
降维样本单元,用于根据每个可降维新能源场站组中的任意两个新能源场站之间的相关系数生成相关系数子矩阵,并基于所述相关系数子矩阵随机生成每个可降维新能源场站组的发电功率序列;
功率样本单元,用于将每个可降维新能源场站组的发电功率序列与其他非可降维新能源场站组的发电功率序列进行组合,生成所述新能源场站群降维后的发电功率序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310146840.8A CN116739104A (zh) | 2023-02-15 | 2023-02-15 | 一种新能源功率序列样本生成方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310146840.8A CN116739104A (zh) | 2023-02-15 | 2023-02-15 | 一种新能源功率序列样本生成方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116739104A true CN116739104A (zh) | 2023-09-12 |
Family
ID=87903245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310146840.8A Pending CN116739104A (zh) | 2023-02-15 | 2023-02-15 | 一种新能源功率序列样本生成方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116739104A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117277355A (zh) * | 2023-11-09 | 2023-12-22 | 一能电气有限公司 | 一种智慧监测数据的输电方法及系统 |
-
2023
- 2023-02-15 CN CN202310146840.8A patent/CN116739104A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117277355A (zh) * | 2023-11-09 | 2023-12-22 | 一能电气有限公司 | 一种智慧监测数据的输电方法及系统 |
CN117277355B (zh) * | 2023-11-09 | 2024-03-22 | 一能电气有限公司 | 一种智慧监测数据的输电方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108306303B (zh) | 一种考虑负荷增长和新能源出力随机的电压稳定评估方法 | |
CN110555785A (zh) | 一种月度计划安全稳定校核方法及系统 | |
CN107317353B (zh) | 一种含分布式光伏发电配电网电压控制方法及系统 | |
Song et al. | Three-dimensional wind turbine positioning using Gaussian particle swarm optimization with differential evolution | |
CN109508823A (zh) | 一种基于场景分析法的配电网中分布式电源规划方法 | |
CN110445127A (zh) | 一种面向多重随机不确定性的配电网无功优化方法及系统 | |
CN116739104A (zh) | 一种新能源功率序列样本生成方法及系统 | |
CN105184683A (zh) | 一种基于风电场运行数据的概率聚类分群方法 | |
CN112132488A (zh) | 一种耦合建模-优化-优选的水库生态调度方法 | |
CN109409575A (zh) | 基于Gap Statistic的风电场机群划分方法 | |
CN113205210A (zh) | 复杂地形风电场风速与功率预测方法、系统、设备及存储介质 | |
Du et al. | Impact of wind power scenario reduction techniques on stochastic unit commitment | |
CN112186761A (zh) | 一种基于概率分布的风电功率场景生成方法及系统 | |
CN112651576A (zh) | 长期风电功率预测方法及装置 | |
CN117195449A (zh) | 一种风电场排布优化方法、装置、设备及介质 | |
CN110880754A (zh) | 一种全网受阻电量确定方法和系统 | |
CN118195219A (zh) | 多时间尺度多元柔性资源协调优化配置方法及相关装置 | |
CN110889244B (zh) | 一种基于质量矩极小化的大型高速回转装备叶片的排序方法 | |
CN117134318A (zh) | 光伏发电功率预测方法、装置、介质及设备 | |
CN109344875B (zh) | 基于聚类分析的日风电出力时序生成方法及装置 | |
CN114036845B (zh) | 一种风电场群模型构建方法 | |
CN116154865A (zh) | 一种风电制氢混合储能系统容量配置优化方法 | |
CN106897771B (zh) | 一种基于混沌遗传算法的新能源样板机选择方法及系统 | |
CN112984594B (zh) | 燃煤供热机组供热期最小出力确定方法及装置 | |
CN115344996A (zh) | 一种基于改进K-means算法的多特征量指标下风电典型场景构建方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |