CN116166955A

CN116166955A - 基于主成分高斯混合聚类的新能源场景处理方法及装置

Info

Publication number: CN116166955A
Application number: CN202310316052.9A
Authority: CN
Inventors: 程苒; 高崇; 段瑶; 叶琳浩; 吴亚雄; 陈沛东; 张俊潇; 许志恒; 李�浩; 何璇; 黄烨; 罗强; 张黎明; 周姝灿; 刘志文
Original assignee: Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd
Priority date: 2023-03-28
Filing date: 2023-03-28
Publication date: 2023-05-26

Abstract

本发明公开了一种基于主成分高斯混合聚类的新能源场景处理方法及装置，改方法包括：获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据，根据第一历史数据和所述第二历史数据，生成若干个新能源场景；对若干个新能源场景的指标分配的权重系数后，根据若干个新能源场景和权重系数，采用主成分分析法进行降维处理，得到第一数据集；根据第一数据集，采用高斯混合聚类算法进行聚类，得到典型数据集。采用本发明实施例，能够使聚类结果更具有代表性，利用降为得到的第一数据集结合高斯混合模型，通过EM算法得到作为聚类结果的典型数据集，从而保证了证配电网规划运行结果的精度。

Description

基于主成分高斯混合聚类的新能源场景处理方法及装置

技术领域

本发明涉及配电网技术领域，尤其涉及一种基于主成分高斯混合聚类的新能源场景处理方法及装置。

背景技术

由于风速、光照强度具有随机性，分布式新能源出力具有极大的不确定性，这些不确定性因素可能引起电力电量不平衡等问题，不利于配电网安全运行。因此，在配电网规划运行中考虑风力发电和光伏发电的不确定性，具有重要的意义。配电网规划运行中考虑风力发电和光伏发电的不确定性需要对其海量场景进行聚类处理。现有处理海量场景的方法难以对场景进行合理地分类、组合，导致生成的场景不具有代表性，也无法保证配电网规划运行结果的精度。

发明内容

本发明提供了一种基于主成分高斯混合聚类的新能源场景处理方法及装置，以解决现有技术在处理海量场景时，生成的聚类结果或典型场景不具有代表性的技术问题。

为了解决上述技术问题，本发明实施例提供了一种基于主成分高斯混合聚类的新能源场景处理方法，包括：

获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据，根据所述第一历史数据和所述第二历史数据，生成若干个新能源场景；

对所述若干个新能源场景的指标分配的权重系数后，根据所述若干个新能源场景和所述权重系数，采用主成分分析法进行降维处理，得到第一数据集；

根据所述第一数据集，采用高斯混合聚类算法进行聚类，得到典型数据集；其中，所述典型数据集用于配电网规划运行。

本发明在利用新能源参数等建立新能源场景后，结合权重系数分配考虑到不同场景指标对配电网运行的影响，在降维的同时保留重要的特征，使后续的聚类结果更具有代表性；再利用降为得到的第一数据集结合高斯混合模型，通过EM算法得到作为聚类结果的典型数据集，从而保证了证配电网规划运行结果的精度。

进一步地，所述根据所述若干个新能源场景和所述权重，采用主成分分析法进行降维处理，得到第一数据集，具体为：

对所述若干个新能源场景进行归一化处理，得到第一数据矩阵；

根据第一数据矩阵，计算协方差系数并生成第一协方差矩阵；

根据权重矩阵和所述第一协方差矩阵，采用矩阵乘法计算得到第二协方差矩阵；其中，所述权重矩阵由所述权重系数生成；

求解所述第二协方差矩阵，并通过矩阵线性变化得到主成分分量，根据所述主成分分量，确定降维维度和保留的指标数目；

根据所述降维维度和所述保留的指标数目进行降维，得到所述第一数据集。

本发明在生成第一数据集时，通过新能源场景生成第一协方差矩阵后，在通过为每个指标匹配相应的权重以生成第二协方差矩阵，用于后续的聚类分析；避免了直接使用第一协方差矩阵进行后续的聚类，考虑到不同场景指标对配电网工况的重要性，使后续的聚类结果更具有代表性。

进一步地，所述第二协方差矩阵的表达式为：

R＝RW；

其中，R′为所述第二协方差矩阵，R为所述第一协方差矩阵，W为所述权重矩阵；所述第一协方差矩阵的表达式为：

其中，r_mn为所述协方差系数，1≤m≤N₁，1≤n≤N₁；

所述权重矩阵的表达式为：

其中，w_ii为权重系数，1≤i≤N₁。

进一步地，所述协方差系数的表达式为：

其中，

为所述第一数据矩阵，

和

为第一数据矩阵中的两个随机变量，T₁为所述第一数据矩阵的总量。

进一步地，所述求解所述第二协方差矩阵，并通过矩阵线性变化得到主成分分量，根据所述主成分分量，确定降维维度和保留的指标数目，具体为：

利用正交矩阵求解所述第二协方差矩阵，得到特征向量；其中，所述特征向量的特征值从大到小排列；

根据所述特征向量，计算所述特征向量中的每个特征值对应的主成分分量；

计算每个主成分分量对应的累计特征保留程度指标，选取大于预设值的累计特征保留程度指标所对应的特征值数目，将所述特征值数目设定为所述降维维度。

本发明在降维处理时，通过比较特征保留程度指标和预设值，实现降维的同时保留下较多的特征，从而提高聚类的效果。，使聚类结果更具有代表性。

进一步地，所述根据所述第一数据集，采用高斯混合聚类算法进行聚类，得到典型数据集，具体为：

根据所述第一数据集，建立高斯混合模型；使用贝叶斯信息准则对所述第一数据集的聚类组数进行概率估计，逐步确定最佳聚类数；

确定最佳聚类数后，采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数，直至所述对数似然函数收敛，获取所述典型数据集。

进一步地，所述贝叶斯信息准则具体为将BI C值的最大值作为最佳聚类数；其中，所述BI C值为：

BIC＝-2In(L_U)+η*In(m)；

其中，L_U为高斯混合模型的似然函数最大值，η为模型参数的个数，η为样本数量。

进一步地，所述采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数，直至所述对数似然函数收敛，具体为：

E步骤：计算所述第一数据集中场景指标的后验概率；

M步骤：根据所述后验概率，更新高斯混合模型中的参数；

重复E步骤和M步骤，直至计算得到的高斯混合模型的对数似然函数收敛；其中，所述后验概率的表达式为：

其中，N_w(x|μ_w,∑_w)为高斯概率分布，φ_w为高斯混合模型的权重，μ_w为高斯混合模型的均值，∑_w为高斯混合模型的协方差矩阵，x为随机变量，z_nw为随机变量观测值，w为高斯混合模型的序号。

本发明通过贝叶斯信息准则优化最大聚类数，使根据最大聚类数区分的典型场景更能体现配电网实际工况的情形。

进一步地，所述获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据，根据所述第一历史数据和所述第二历史数据，生成若干个新能源场景，具体为：

其中，所述第一历史数据包括：风速数据、光照强度数据；所述第二历史数据包括：电动汽车负荷数据和配电网负荷数据；

根据所述风速数据、所述光照强度数据、所述电动汽车负荷数据和所述配电网负荷数据，按时间序列生成所述若干个新能源场景；其中，所述若干个新能源场景的表达式为：

其中，S为所述若干个新能源场景，s_i为单一新能源场景，1≤i≤N₁；其中，所述单一新能源场景的表达式为：

为所述风速数据，

为所述光照强度数据，

为所述电动汽车负荷数据，

为所述配电网负荷数据。

另一方面，本发明实施例还提供了一种基于主成分高斯混合聚类的新能源场景处理方法，包括：场景建立模块、降维处理模块和聚类处理模块；

其中，所述场景建立模块用于获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据，根据所述第一历史数据和所述第二历史数据，生成若干个新能源场景；

所述降维处理模块用于对所述若干个新能源场景的指标分配的权重系数后，根据所述若干个新能源场景和所述权重系数，采用主成分分析法进行降维处理，得到第一数据集；

所述聚类处理模块用于根据所述第一数据集，采用高斯混合聚类算法进行聚类，得到典型数据集；其中，所述典型数据集用于配电网规划运行。

附图说明

图1为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的一种实施例的流程示意图；

图2为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的另一种实施例的流程示意图；

图3为本发明提供的基于主成分高斯混合聚类的新能源场景处理装置的一种实施例的结构示意图；

图4为本发明提供的特征维数与特征保留程度的关系示意图；

图5为本发明提供的聚类分类数与综合聚类指标的关系示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

请参照图1，为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的一种实施例的流程示意图，主要包括步骤101-103，具体如下：

步骤101：获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据，根据所述第一历史数据和所述第二历史数据，生成若干个新能源场景。

在本实施例中，所述第一历史数据包括：风速数据、光照强度数据；所述第二历史数据包括：电动汽车负荷数据和配电网负荷数据。

在本实施例中，所述获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据，根据所述第一历史数据和所述第二历史数据，生成若干个新能源场景，具体为：根据所述风速数据、所述光照强度数据、所述电动汽车负荷数据和所述配电网负荷数据，按时间序列生成所述若干个新能源场景；其中，所述若干个新能源场景的表达式为：

为所述风速数据，

为所述光照强度数据，

为所述电动汽车负荷数据，

为所述配电网负荷数据。

步骤102：对所述若干个新能源场景的指标分配的权重系数后，根据所述若干个新能源场景和所述权重系数，采用主成分分析法进行降维处理，得到第一数据集。

步骤103：根据所述第一数据集，采用高斯混合聚类算法进行聚类，得到典型数据集；其中，所述典型数据集用于配电网规划运行。

在本实施例中，所述根据所述第一数据集，采用高斯混合聚类算法进行聚类，得到典型数据集，具体为：根据所述第一数据集，建立高斯混合模型；使用贝叶斯信息准则对所述第一数据集的聚类组数进行概率估计，逐步确定最佳聚类数；确定最佳聚类数后，采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数，直至所述对数似然函数收敛，获取所述典型数据集。

在本实施例中，所述贝叶斯信息准则具体为将BIC值的最大值作为最佳聚类数；其中，所述BIC值为：

BIC＝-2In(L_U)+η*In(m)；

在本实施例中，所述采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数，直至所述对数似然函数收敛，具体为：E步骤：计算所述第一数据集中场景指标的后验概率；M步骤：根据所述后验概率，更新高斯混合模型中的参数；重复E步骤和M步骤，直至计算得到的高斯混合模型的对数似然函数收敛；其中，所述后验概率的表达式为：

在本实施例中，所述高斯混合模型的表达式为：

其中，Pr为高斯混合模型的概率分布函数，K为数据维度，W为高斯混合模型的总数。

在本实施例中，高斯混合模型中的参数包括：高斯混合模型的均值、高斯混合模型的协方差矩阵、高斯混合模型的权重和高斯概率分布；其中，高斯混合模型的均值为：

其中，N_w为后验概率的总和，x_n为第n个随机变量。

其中，高斯混合模型的协方差矩阵为：

其中，高斯混合模型的权重为：

其中，高斯概率分布为：

请参照图2，为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的另一种实施例的流程示意图，主要包括步骤201-205，具体如下：

在本实施例中，步骤102包括步骤201至步骤205。

步骤201：对所述若干个新能源场景进行归一化处理，得到第一数据矩阵。

在本实施例中，所述第一数据矩阵的表达式为：

其中，Var(S_n)为第n个新能源场景的方差，其表达式为：

其中，S_nt为某一新能源场景，

为若干个新能源场景的均值，

步骤202：根据第一数据矩阵，计算协方差系数并生成第一协方差矩阵。

在本实施例中，所述协方差系数的表达式为：

其中，

为所述第一数据矩阵，

和

步骤203：根据权重矩阵和所述第一协方差矩阵，采用矩阵乘法计算得到第二协方差矩阵；其中，所述权重矩阵由所述权重系数生成。

在本实施例中，所述第二协方差矩阵的表达式为：

R＝RW；

其中，r_mn为所述协方差系数，1≤m≤N₁，1≤n≤N₁；

所述权重矩阵的表达式为：

其中，w_ii为权重系数，1≤i≤N₁。

步骤204：求解所述第二协方差矩阵，并通过矩阵线性变化得到主成分分量，根据所述主成分分量，确定降维维度和保留的指标数目。

在本实施例中，所述求解所述第二协方差矩阵，并通过矩阵线性变化得到主成分分量，根据所述主成分分量，确定降维维度和保留的指标数目，具体为：利用正交矩阵求解所述第二协方差矩阵，得到特征向量；其中，所述特征向量的特征值从大到小排列；根据所述特征向量，计算所述特征向量中的每个特征值对应的主成分分量；计算每个主成分分量对应的累计特征保留程度指标，选取大于预设值的累计特征保留程度指标所对应的特征值数目，将所述特征值数目设定为所述降维维度。

在本实施例中，第二协方差矩阵的求解可表示为：

U为正交矩阵。

在本实施例中，所述特征向量为

特征值

其中，

在本实施例中，矩阵线性变化可表示为：Z＝U^TS；其中，Z为包含主成分分量的矩阵；S为特征向量矩阵。

在本实施例中，第t个主成分分量的单个特征保留程度指标ω_t和前t个主成分分量的特征保留程度指标

分别表示为：

和，

单个特征保留程度指标数值ω_t越大，则说明其对应的主成分分量包含越多的风电出力数据内部信息。相似地，特征保留程度指标数值越大，则说明前t个主成分分量

包含的风电出力数据内部信息越充足。因此，可以通过特征保留程度指标

选取合适的降维维度以权衡计算复杂度和原始数据信息保留程度的矛盾。

本发明在降维处理时，通过比较特征保留程度指标和预设值，实现降维的同时保留下较多的特征，从而提高聚类的效果。

步骤205：根据所述降维维度和所述保留的指标数目进行降维，得到所述第一数据集。

请参照图3，为本发明提供的基于主成分高斯混合聚类的新能源场景处理装置的一种实施例的结构示意图，包括：场景建立模块301、降维处理模块302和聚类处理模块303。

在本实施例中，场景建立模块301用于获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据，根据所述第一历史数据和所述第二历史数据，生成若干个新能源场景。

降维处理模块302用于对所述若干个新能源场景的指标分配的权重系数后，根据所述若干个新能源场景和所述权重系数，采用主成分分析法进行降维处理，得到第一数据集。

聚类处理模块303用于根据所述第一数据集，采用高斯混合聚类算法进行聚类，得到典型数据集；其中，所述典型数据集用于配电网规划运行。

在本实施例中，选择广东某地区风速、光照强度、电动汽车负荷以及常规负荷5年的历史数据组成1800*96的数据矩阵，其中包括1800个场景下24小时风速数据、24小时光照强度数据、24小时电动汽车负荷数据和24小时常规负荷数据。首先采用主成分分析法对海量场景进行降维处理，得到原始数据的特征保留程度与保留特征维数的关系，请参照图4，为本发明提供的特征维数与特征保留程度的关系示意图。由图4可知，当保留特征维数为4维时，可有效保留95％的数据信息。在得到降维的数据信息后，可基于高斯混合聚类算法对不确定性数据进行聚类。得到不同聚类分类数下的综合聚类指标，请参照图5，为本发明提供的聚类分类数与综合聚类指标的关系示意图。由图5可知当聚类分类数为4时，聚类算法的综合聚类指标取到最大值，此时聚类效果最优。

以上所述的具体实施例，对本发明的目的、技术方案和有益效果进行了进一步的详细说明，应当理解，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围。特别指出，对于本领域技术人员来说，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。