CN111797564A - 一种高维分布式光伏出力的相关性样本获取方法及系统 - Google Patents

一种高维分布式光伏出力的相关性样本获取方法及系统 Download PDF

Info

Publication number
CN111797564A
CN111797564A CN202010439616.4A CN202010439616A CN111797564A CN 111797564 A CN111797564 A CN 111797564A CN 202010439616 A CN202010439616 A CN 202010439616A CN 111797564 A CN111797564 A CN 111797564A
Authority
CN
China
Prior art keywords
probability
photovoltaic output
network
time sequence
distributed photovoltaic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010439616.4A
Other languages
English (en)
Inventor
裴哲义
董存
梁志峰
雷震
马珂
孙檬檬
周昶
夏俊荣
黄煜
许彪
徐青山
栗峰
刘海璇
孔爱良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Southeast University
China Electric Power Research Institute Co Ltd CEPRI
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Southeast University
China Electric Power Research Institute Co Ltd CEPRI
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Southeast University, China Electric Power Research Institute Co Ltd CEPRI, State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202010439616.4A priority Critical patent/CN111797564A/zh
Publication of CN111797564A publication Critical patent/CN111797564A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种高维分布式光伏出力的相关性样本获取方法及系统,所述方法包括:基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。本发明以数据为驱动,通过确定贝叶斯网络的拓扑结构并进行参数学习,获得服从联合概率分布的分布式光伏相关性样本,能够较为全面、准确地描述多个分布式光伏电站出力的线性和非相关性特征。

Description

一种高维分布式光伏出力的相关性样本获取方法及系统
技术领域
本发明涉及新能源发电建模与仿真技术领域,具体涉及一种高维分布式光伏出力的相关性样本获取方法及系统。
背景技术
随着分布式光伏渗透率逐年增高,分布式光伏出力的随机性和不确定性对电网安全稳定运行的影响不容忽视,同时负荷的随机性进一步加剧了这种不确定性对电网的影响。相邻地区的分布式光伏共同受到气候、季节和环境等多种因素的影响,因此相互之间具有高维的相关性。
分布式光伏的随机模型主要有两大类,第一类是基于时间序列的模型。有文献采用基于均值和随机误差的模型,构建了光伏出力的时间序列模型。有文献利用建立的时序模型构建了含多个分布式光伏电站的序贯蒙特卡洛随机生产模拟。以实测的数据建立时序模型,由该模型产生分布式光伏随机数据,将其应用于序贯概率潮流计算则时间开销大,限制了其应用范围,但随机数据中蕴含了多个分布式光伏之间的相关性。第二类分布式光伏的随机模型是将概率分布表示为光伏出力的边缘概率,并通过随机变量的相关性描述随机变量之间的关系,这类描述方法目前被大量地应用到概率潮流计算中。目前考虑分布式光伏相关性的概率潮流计算方法主要有基于Nataf变换法和Copula函数法的概率潮流计算,其中Copula函数法的建模精度高,适用范围广,是相关性建模的典型方法。
事实上,不管是研究分布式光伏相关性的概率潮流计算,还是电源规划,亦或是研究多光伏电站相关性的系统可靠性,其共同的关键问题是如何通过表征分布式光伏高维相关性的概率模型获得相关性样本,进而为概率潮流计算、电源规划和系统可靠性问题的解决奠定坚实的基础。
发明内容
为了解决现有技术中所存在的上述不足,本发明提供一种高维分布式光伏出力的相关性样本获取方法,包括:
基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;
基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;
对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。
优选的,所述基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据,包括:
以同步采集到的多个分布式光伏电站的出力数据为基础,采用自回归求和滑动平均模型为每个分布式光伏电站建立时间序列模型;
基于各分布式光伏电站的时间序列模型得到多组光伏出力时序数据。
优选的,所述基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构,包括:
将所有的时序数据归一化并对各单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线;
基于所述概率分布曲线获得归一化处理后光伏出力时序数据对应的概率值;
基于所述概率值确定贝叶斯网络的初始网络结构;
基于所述概率值采用结构学习算法和最大似然估计法对初始网络结构中的网络结构和参数进行学习,构建基于贝叶斯网络的拓扑结构;
所述初始网络结构包括网络结点数和网络结点顺序。
优选的,所述将所有的时序数据归一化并对各单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线,包括:
运用最小-最大归一化方法,将光伏出力时序数据进行归一化处理;
将归一化处理后的单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线。
优选的,所述基于所述概率值确定贝叶斯网络的初始网络结构,包括:
将各概率值中时间序列的维数作为初始网络结构中的网络结点数;
计算各概率值之间的最大信息系数;
将所有的最大信息系数按降序排列,作为初始网络结构中的网络结点顺序。
优选的,所述基于所述概率值采用结构学习算法和最大似然估计法对初始网络结构中的网络结构和参数进行学习,构建基于贝叶斯网络的拓扑结构,包括:
采用等宽离散化法将所述概率值进行离散化得到离散值,将离散值作为初始网络结构的输入数据;
采用K2的结构学习算法和最大似然估计法完成初始网络结构的网络结构和参数学习,得到网络结点中父结点与子结点之间的条件概率表;
基于所述父结点与子结点之间的条件概率表,构建基于贝叶斯网络的拓扑结构。
优选的,所述对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本,包括:
从贝叶斯网络的父结点到子结点进行遍历采样,得到多维光伏出力概率的离散值矩阵;
将所述离散值矩阵中的概率离散值连续化,通过反归一化获得具有相关性的高维分布式光伏出力样本。
优选的,所述多维光伏出力概率的离散值矩阵,如下式所示:
Figure BDA0002501923320000031
式中:Di=1,2,…,m,表示采样次数;i=1,2,…,n,表示网络结点数;
Figure BDA0002501923320000032
表示n个结点经过Di次采样后的概率离散值矩阵;
Figure BDA0002501923320000033
为第i个结点经过Di次采样得到的离散值向量;
Figure BDA0002501923320000034
为第n个结点经过Di次采样得到的离散值向量。
优选的,所述将所述离散值矩阵中的概率离散值连续化,通过反归一化获得具有相关性的高维分布式光伏出力样本,包括:
将所述离散值矩阵中的概率离散值还原到等宽离散化区间,在对应的区间内取均匀分布的随机数,得到连续的概率值向量;
基于连续的概率值向量得到多维概率值矩阵;
将所述多维概率值矩阵中的所有概率值向量利用设定的公式进行处理,得到归一化的样本;
将得到的归一化样本再通过反归一化获得具有相关性的高维分布式光伏出力样本。
优选的,所述设定的公式,如下式所示:
Figure BDA0002501923320000041
式中:
Figure BDA0002501923320000042
表示归一化的样本;
Figure BDA0002501923320000043
为各累积分布函数的反函数;
Figure BDA0002501923320000044
表示概率值向量。
基于同一发明构思,本发明还提供了一种高维分布式光伏出力的相关性样本获取系统,包括:
获取模块,用于基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;
学习模块,用于基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;
采样模块,用于对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。
优选的,所述学习模块,包括:
估计单元,用于将所有的时序数据归一化并对各单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线;
映射关系单元,用于基于所述概率分布曲线获得归一化处理后光伏出力时序数据对应的概率值;
确定单元,用于基于所述概率值确定贝叶斯网络的初始网络结构;
学习单元,用于基于所述概率值采用结构学习算法和最大似然估计法对初始网络结构中的网络结构和参数进行学习,构建基于贝叶斯网络的拓扑结构;
所述初始网络结构包括网络结点数和网络结点顺序。
本发明的有益效果为:
本发明提供的技术方案,基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。本发明以多组光伏出力时序数据为驱动,通过进行网络结构和参数学习构建基于贝叶斯网络的拓扑结构,进而获得具有相关性的高维分布式光伏出力样本,能够较为全面、准确地描述多个分布式光伏电站出力的线性和非相关性特征,同时基于贝叶斯网络构建的拓扑结构不受分布式光伏出力的分布类型限制,充分利用了各网络结点之间的依赖关系,因此能够较为全面地描述多维随机变量之间相关性。
附图说明
图1为本发明中一种高维分布式光伏出力的相关性样本获取方法流程图;
图2为本发明实施例中相关性样本获取方法的详细流程图;
图3为本发明实施例中时序归一化数据转换为概率值示意图;
图4为本发明实施例中贝叶斯网络的建模流程图;
图5为本发明实施例中贝叶斯网络的结构图。
具体实施方式
为了更好地理解本发明,下面结合说明书附图和实例对本发明的内容做进一步的说明。
实施例1:如图1所示,本发明提供的一种高维分布式光伏出力的相关性样本获取方法,包括:
步骤一、基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;
步骤二、基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;
步骤三、对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。
如图2所示,对图1中本发明提供的一种高维分布式光伏出力的相关性样本获取方法,进行详细描述包括如下步骤:
S1:同步采集各分布式光伏电站出力数据,建立各自的时间序列模型,得到多组光伏出力时序数据;
S2:将时序数据归一化并对单时间序列进行核密度估计;
S3:获得光伏时序归一化数据对应的概率值,确定贝叶斯网络(BayesianNetworks,BN)的初始网络结构;
S4:将BN输入数据的离散化,采用K2算法进行BN结构学习;
S5:对BN网络进行遍历采样,得到多维光伏出力概率的离散值矩阵;
S6:将概率离散值连续化,通过反归一化获得高维分布式光伏出力的相关性样本。
实施例中,所述步骤S1中以同步采集到的多个光伏电站的出力数据为基础,采用自回归求和滑动平均模型(Autoregressive Integrated Moving Average Model,ARIMA),对每一时间序列各自建立时间序列模型,得到多组光伏出力时序数据。
实施例中,所述步骤S2中运用最小-最大归一化方法,将光伏时序数据归一化,变换到[0,1]区间内;再采用核密度估计法得到各光伏时间序列的概率分布曲线。
实施例中,所述步骤S3中根据步骤S2得到的概率分布曲线,将光伏出力时序归一化数据转换为概率值p(l),如图3所示v(l)为光伏时序数据;
计算各概率值pi(l)之间的最大信息系数,并按从大到小排列,确定BN的初始网络结构,pi(l)中的i=1,2,…,n代表时间序列的维数,也是BN的网络结点数,l为时序数据个数;初始网络结构包括网络结点数和结点初始顺序。
实施例中,所述步骤S4中采用等宽离散化方法(概率值[0,1]区间三等分),将步骤S3得到的各概率值pi(l)转换为离散值
Figure BDA0002501923320000061
以概率值的离散数据
Figure BDA0002501923320000062
为BN网络的输入数据,由K2的结构学习算法和最大似然估计法完成BN网络结构和参数学习,得到网络中父结点与子结点之间的条件概率表,从而建立BN模型。
实施例中,所述步骤S5中从BN网络的父结点到子结点遍历采样,得到多维随机变量概率的离散值矩阵
Figure BDA0002501923320000063
可表示为:
Figure BDA0002501923320000064
式中:Di=1,2,…,m,表示采样次数;i=1,2,…,n,表示网络结点数;
Figure BDA0002501923320000065
表示n个结点经过Di次采样后的概率离散值矩阵;
Figure BDA0002501923320000066
为第i个结点经过Di次采样得到的离散值向量;
Figure BDA0002501923320000067
为向量
Figure BDA0002501923320000068
中的第k个元素,即第k个概率离散值。
实施例中,所述步骤S6中将概率离散值
Figure BDA0002501923320000069
还原到步骤S5的等宽离散化区间,在对应的区间内取均匀分布的随机数,即可得到连续的概率值
Figure BDA00025019233200000610
向量,从而得到m×n维概率值矩阵
Figure BDA00025019233200000611
由概率值向量
Figure BDA00025019233200000612
利用式(2)得到归一化的样本
Figure BDA00025019233200000613
再经反归一化得到服从多维随机变量联合概率分布的相关性样本。
Figure BDA00025019233200000614
式中Fi -1(·)为各累积分布函数的反函数。
本实施例中以中国西北某地区一年实测到的17个分布式光伏电站的每小时出力数据为基础,其具体的步骤如图4所示,包括:
S1:采用自回归求和滑动平均模型(Autoregressive Integrated MovingAverage Model,ARIMA),对每一光伏时间序列各自建立时间序列模型,得到多组光伏出力时序数据。ARIMA模型如式(1):
Figure BDA0002501923320000071
式中,yt-i为yt的第i差分;ε为均值为零,方差为1的白噪声;
Figure BDA0002501923320000072
为自回归(AR)的阶次和系数;b,θj为滑动平均(MA)的阶次和系数。
S2:运用最小-最大归一化方法,将光伏时序数据归一化,变换到[0,1]区间内;再采用核密度估计法得到如图3所示的各光伏时间序列的概率分布曲线。
S3:根据步骤S2得到的概率分布曲线,将光伏出力时序归一化数据转换为概率值p(l),如图3所示(v(l)为光伏时序数据;
计算各概率值pi(l)之间的最大信息系数,并按从大到小排列,确定BN的初始网络结构;pi(l)中i=1,2,…,17代表时间序列的维数,也是BN的网络结点数,l为时序数据个数,本实施例中l=43800。
其中结点初始顺序order=[1 10 3 11 6 2 12 14 15 13 16 4 5 7 8 9 17]。
S4:采用等宽离散化方法(概率值[0,1]区间三等分),将步骤S3得到的各概率值pi(l)转换为离散值
Figure BDA0002501923320000073
以概率值的离散数据
Figure BDA0002501923320000074
为BN网络的输入数据,由K2的结构学习算法和最大似然估计法完成BN网络结构和参数学习,得到网络中父结点与子结点之间的条件概率表,从而建立如图5所示的BN模型。
S5:从BN网络的父结点到子结点遍历采样,得到多维随机变量概率的离散值矩阵
Figure BDA0002501923320000075
可表示为:
Figure BDA0002501923320000076
式中:Di=1,2,…,m,表示采样次数,这里取m=1000;i=1,2,…,n,表示网络结点数,这里n=17;
Figure BDA0002501923320000077
表示17个结点经过1000次采样后的概率离散值矩阵;
Figure BDA0002501923320000078
为第i个结点经过1000次采样得到的离散值向量;
Figure BDA0002501923320000079
为向量
Figure BDA00025019233200000710
中的第k个元素,即第k个概率离散值。
S6:将概率离散值
Figure BDA00025019233200000711
还原到步骤S5的等宽离散化区间,在对应的区间内取均匀分布的随机数,即可得到连续的概率值
Figure BDA00025019233200000712
向量,从而得到1000×17维概率值矩阵
Figure BDA0002501923320000081
由概率值向量
Figure BDA0002501923320000082
利用式(3)得到归一化的样本
Figure BDA0002501923320000083
再经反归一化得到服从多维随机变量联合概率分布的相关性样本。
Figure BDA0002501923320000084
式中Fi -1(·)为各累积分布函数的反函数。
本发明构建的BN网络不受随机变量(分布式光伏出力)的分布类型限制(适用于任意分布),充分利用了各结点之间的依赖关系,因此能够较为全面地描述多维随机变量之间相关性。
将本发明中通过BN相关性建模得到的分布式光伏合成样本与目前流行的C藤Copula合成样本进行比较,表1为两种样本数字特征的平均绝对误差比较表,表中以原样本的数字特征为参考标准。
表1两种样本数字特征的平均绝对误差
Figure BDA0002501923320000085
由表1可知,BN合成样本与C藤Copula合成样本的均值平均误差基本相同,但BN合成样本的标准差、偏斜度和峰度的平均绝对误差均小于C藤Copula合成样本。这说明就样本的分散程度、对称性和样本分布的形态而言,BN合成样本的数字特征更接近原样本的数字特征,BN合成分布式光伏样本的质量优于C藤Copula合成样本。
本发明提供的技术方案在同等条件下,BN概率模型比其它相关性模型的建模精度高、时间开销少,获得的相关性样本质量好,能够重构多维分布式光伏出力时间序列中蕴含的非线性相关性。
实施例2:基于同一发明构思,本发明还提供了一种高维分布式光伏出力的相关性样本获取系统,其特征在于,包括:
获取模块,用于基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;
学习模块,用于基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;
采样模块,用于对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。
实施例中,所述学习模块,包括:
估计单元,用于将所有的时序数据归一化并对各单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线;
映射关系单元,用于基于所述概率分布曲线获得归一化处理后光伏出力时序数据对应的概率值;
确定单元,用于基于所述概率值确定贝叶斯网络的初始网络结构;
学习单元,用于基于所述概率值采用结构学习算法和最大似然估计法对初始网络结构中的网络结构和参数进行学习,构建基于贝叶斯网络的拓扑结构;
所述初始网络结构包括网络结点数和网络结点顺序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。

Claims (12)

1.一种高维分布式光伏出力的相关性样本获取方法,其特征在于,包括:
基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;
基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;
对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。
2.如权利要求1所述的方法,其特征在于,所述基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据,包括:
以同步采集到的多个分布式光伏电站的出力数据为基础,采用自回归求和滑动平均模型为每个分布式光伏电站建立时间序列模型;
基于各分布式光伏电站的时间序列模型得到多组光伏出力时序数据。
3.如权利要求1所述的方法,其特征在于,所述基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构,包括:
将所有的时序数据归一化并对各单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线;
基于所述概率分布曲线获得归一化处理后光伏出力时序数据对应的概率值;
基于所述概率值确定贝叶斯网络的初始网络结构;
基于所述概率值采用结构学习算法和最大似然估计法对初始网络结构中的网络结构和参数进行学习,构建基于贝叶斯网络的拓扑结构;
所述初始网络结构包括网络结点数和网络结点顺序。
4.如权利要求3所述的方法,其特征在于,所述将所有的时序数据归一化并对各单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线,包括:
运用最小-最大归一化方法,将光伏出力时序数据进行归一化处理;
将归一化处理后的单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线。
5.如权利要求3所述的方法,其特征在于,所述基于所述概率值确定贝叶斯网络的初始网络结构,包括:
将各概率值中时间序列的维数作为初始网络结构中的网络结点数;
计算各概率值之间的最大信息系数;
将所有的最大信息系数按降序排列,作为初始网络结构中的网络结点顺序。
6.如权利要求3所述的方法,其特征在于,所述基于所述概率值采用结构学习算法和最大似然估计法对初始网络结构中的网络结构和参数进行学习,构建基于贝叶斯网络的拓扑结构,包括:
采用等宽离散化法将所述概率值进行离散化得到离散值,将离散值作为初始网络结构的输入数据;
采用K2的结构学习算法和最大似然估计法完成初始网络结构的网络结构和参数学习,得到网络结点中父结点与子结点之间的条件概率表;
基于所述父结点与子结点之间的条件概率表,构建基于贝叶斯网络的拓扑结构。
7.如权利要求6所述的方法,其特征在于,所述对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本,包括:
从贝叶斯网络的父结点到子结点进行遍历采样,得到多维光伏出力概率的离散值矩阵;
将所述离散值矩阵中的概率离散值连续化,通过反归一化获得具有相关性的高维分布式光伏出力样本。
8.如权利要求7所述的方法,其特征在于,所述多维光伏出力概率的离散值矩阵,如下式所示:
Figure FDA0002501923310000021
式中:Di=1,2,…,m,表示采样次数;i=1,2,…,n,表示网络结点数;
Figure FDA0002501923310000022
表示n个结点经过Di次采样后的概率离散值矩阵;
Figure FDA0002501923310000023
为第i个结点经过Di次采样得到的离散值向量;
Figure FDA0002501923310000024
为第n个结点经过Di次采样得到的离散值向量。
9.如权利要求7所述的方法,其特征在于,所述将所述离散值矩阵中的概率离散值连续化,通过反归一化获得具有相关性的高维分布式光伏出力样本,包括:
将所述离散值矩阵中的概率离散值还原到等宽离散化区间,在对应的区间内取均匀分布的随机数,得到连续的概率值向量;
基于连续的概率值向量得到多维概率值矩阵;
将所述多维概率值矩阵中的所有概率值向量利用设定的公式进行处理,得到归一化的样本;
将得到的归一化样本再通过反归一化获得具有相关性的高维分布式光伏出力样本。
10.如权利要求9所述的方法,其特征在于,所述设定的公式,如下式所示:
Figure FDA0002501923310000031
式中:
Figure FDA0002501923310000032
表示归一化的样本;
Figure FDA0002501923310000033
为各累积分布函数的反函数;
Figure FDA0002501923310000034
表示概率值向量。
11.一种高维分布式光伏出力的相关性样本获取系统,其特征在于,包括:
获取模块,用于基于同步采集的各分布式光伏电站的出力数据得到多组光伏出力时序数据;
学习模块,用于基于多组光伏出力时序数据,采用结构学习算法和最大似然估计法进行网络结构和参数学习,构建基于贝叶斯网络的拓扑结构;
采样模块,用于对所述贝叶斯网络的拓扑结构中各网络结点进行遍历采样,获得具有相关性的高维分布式光伏出力样本。
12.如权利要求11所述的系统,其特征在于,所述学习模块,包括:
估计单元,用于将所有的时序数据归一化并对各单光伏出力时序数据依次进行核密度估计,得到所有光伏出力时序的概率分布曲线;
映射关系单元,用于基于所述概率分布曲线获得归一化处理后光伏出力时序数据对应的概率值;
确定单元,用于基于所述概率值确定贝叶斯网络的初始网络结构;
学习单元,用于基于所述概率值采用结构学习算法和最大似然估计法对初始网络结构中的网络结构和参数进行学习,构建基于贝叶斯网络的拓扑结构;
所述初始网络结构包括网络结点数和网络结点顺序。
CN202010439616.4A 2020-05-21 2020-05-21 一种高维分布式光伏出力的相关性样本获取方法及系统 Pending CN111797564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010439616.4A CN111797564A (zh) 2020-05-21 2020-05-21 一种高维分布式光伏出力的相关性样本获取方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010439616.4A CN111797564A (zh) 2020-05-21 2020-05-21 一种高维分布式光伏出力的相关性样本获取方法及系统

Publications (1)

Publication Number Publication Date
CN111797564A true CN111797564A (zh) 2020-10-20

Family

ID=72806186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010439616.4A Pending CN111797564A (zh) 2020-05-21 2020-05-21 一种高维分布式光伏出力的相关性样本获取方法及系统

Country Status (1)

Country Link
CN (1) CN111797564A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807522A (zh) * 2021-03-03 2021-12-17 京东科技控股股份有限公司 贝叶斯网络结构的生成方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113807522A (zh) * 2021-03-03 2021-12-17 京东科技控股股份有限公司 贝叶斯网络结构的生成方法、装置、电子设备和存储介质
WO2022183889A1 (zh) * 2021-03-03 2022-09-09 京东科技控股股份有限公司 贝叶斯网络结构的生成方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
Liu et al. A data-driven approach to linearize power flow equations considering measurement noise
CN111027732B (zh) 一种多风电场出力场景的生成方法及系统
CN111815035B (zh) 一种融合形态聚类及TCN-Attention的短期负荷预测方法
JP6784780B2 (ja) 大規模再生可能エネルギーのデータについて確率モデルを構築する方法
CN106548418B (zh) 电力系统小干扰稳定评估方法
CN110889603A (zh) 一种基于PCA-Copula理论考虑风电相关性的电力系统经济调度方法
CN113505534B (zh) 一种考虑需求响应的负荷预测方法
CN112100911B (zh) 一种基于深度bilstm的太阳辐射预测方法
Sogabe et al. Optimization of decentralized renewable energy system by weather forecasting and deep machine learning techniques
CN112884236B (zh) 一种基于vdm分解与lstm改进的短期负荷预测方法及系统
CN110456188A (zh) 稀疏多项式混沌展开的电力系统稳定性检测系统及方法
CN110676852B (zh) 考虑潮流特征的改进极限学习机快速概率潮流计算方法
CN111900716A (zh) 一种基于稀疏混沌多项式逼近的随机潮流不确定性量化方法
CN112925824A (zh) 针对极端天气类型的光伏功率预测方法及系统
CN111242353A (zh) 风电功率组合预测建模和预测方法
Huang et al. Adaptive static equivalences for active distribution networks with massive renewable energy integration: a distributed deep reinforcement learning approach
CN111797564A (zh) 一种高维分布式光伏出力的相关性样本获取方法及系统
CN112736902B (zh) 一种基于stl分解的时间序列短期电力负荷预测方法
CN110707703B (zh) 基于改进Nataf变换的含高维相关不确定源的概率潮流高效计算方法
Abdelrahim et al. A new transformed input-domain ANFIS for highly nonlinear system modeling and prediction
CN115173421A (zh) 一种基于渐进拉丁超立方采样的概率最优潮流计算方法
CN109390946B (zh) 一种基于多参数规划理论的最优概率潮流快速计算方法
Ma et al. GAN based data analysis and mining for smart shop floor scheduling
CN112952843B (zh) 一种基于Copula理论的配电网分布式光伏概率潮流计算方法
Bubnicki Learning process in a class of computer integrated manufacturing systems with parametric uncertainties

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination