CN116166955A - 基于主成分高斯混合聚类的新能源场景处理方法及装置 - Google Patents

基于主成分高斯混合聚类的新能源场景处理方法及装置 Download PDF

Info

Publication number
CN116166955A
CN116166955A CN202310316052.9A CN202310316052A CN116166955A CN 116166955 A CN116166955 A CN 116166955A CN 202310316052 A CN202310316052 A CN 202310316052A CN 116166955 A CN116166955 A CN 116166955A
Authority
CN
China
Prior art keywords
new energy
gaussian mixture
data
clustering
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310316052.9A
Other languages
English (en)
Inventor
程苒
高崇
段瑶
叶琳浩
吴亚雄
陈沛东
张俊潇
许志恒
李�浩
何璇
黄烨
罗强
张黎明
周姝灿
刘志文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202310316052.9A priority Critical patent/CN116166955A/zh
Publication of CN116166955A publication Critical patent/CN116166955A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/38Arrangements for parallely feeding a single network by two or more generators, converters or transformers
    • H02J3/381Dispersed generators
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Power Engineering (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明公开了一种基于主成分高斯混合聚类的新能源场景处理方法及装置,改方法包括:获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据第一历史数据和所述第二历史数据,生成若干个新能源场景;对若干个新能源场景的指标分配的权重系数后,根据若干个新能源场景和权重系数,采用主成分分析法进行降维处理,得到第一数据集;根据第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集。采用本发明实施例,能够使聚类结果更具有代表性,利用降为得到的第一数据集结合高斯混合模型,通过EM算法得到作为聚类结果的典型数据集,从而保证了证配电网规划运行结果的精度。

Description

基于主成分高斯混合聚类的新能源场景处理方法及装置
技术领域
本发明涉及配电网技术领域,尤其涉及一种基于主成分高斯混合聚类的新能源场景处理方法及装置。
背景技术
由于风速、光照强度具有随机性,分布式新能源出力具有极大的不确定性,这些不确定性因素可能引起电力电量不平衡等问题,不利于配电网安全运行。因此,在配电网规划运行中考虑风力发电和光伏发电的不确定性,具有重要的意义。配电网规划运行中考虑风力发电和光伏发电的不确定性需要对其海量场景进行聚类处理。现有处理海量场景的方法难以对场景进行合理地分类、组合,导致生成的场景不具有代表性,也无法保证配电网规划运行结果的精度。
发明内容
本发明提供了一种基于主成分高斯混合聚类的新能源场景处理方法及装置,以解决现有技术在处理海量场景时,生成的聚类结果或典型场景不具有代表性的技术问题。
为了解决上述技术问题,本发明实施例提供了一种基于主成分高斯混合聚类的新能源场景处理方法,包括:
获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景;
对所述若干个新能源场景的指标分配的权重系数后,根据所述若干个新能源场景和所述权重系数,采用主成分分析法进行降维处理,得到第一数据集;
根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集;其中,所述典型数据集用于配电网规划运行。
本发明在利用新能源参数等建立新能源场景后,结合权重系数分配考虑到不同场景指标对配电网运行的影响,在降维的同时保留重要的特征,使后续的聚类结果更具有代表性;再利用降为得到的第一数据集结合高斯混合模型,通过EM算法得到作为聚类结果的典型数据集,从而保证了证配电网规划运行结果的精度。
进一步地,所述根据所述若干个新能源场景和所述权重,采用主成分分析法进行降维处理,得到第一数据集,具体为:
对所述若干个新能源场景进行归一化处理,得到第一数据矩阵;
根据第一数据矩阵,计算协方差系数并生成第一协方差矩阵;
根据权重矩阵和所述第一协方差矩阵,采用矩阵乘法计算得到第二协方差矩阵;其中,所述权重矩阵由所述权重系数生成;
求解所述第二协方差矩阵,并通过矩阵线性变化得到主成分分量,根据所述主成分分量,确定降维维度和保留的指标数目;
根据所述降维维度和所述保留的指标数目进行降维,得到所述第一数据集。
本发明在生成第一数据集时,通过新能源场景生成第一协方差矩阵后,在通过为每个指标匹配相应的权重以生成第二协方差矩阵,用于后续的聚类分析;避免了直接使用第一协方差矩阵进行后续的聚类,考虑到不同场景指标对配电网工况的重要性,使后续的聚类结果更具有代表性。
进一步地,所述第二协方差矩阵的表达式为:
R=RW;
其中,R′为所述第二协方差矩阵,R为所述第一协方差矩阵,W为所述权重矩阵;所述第一协方差矩阵的表达式为:
Figure BDA0004150222090000021
其中,rmn为所述协方差系数,1≤m≤N1,1≤n≤N1
所述权重矩阵的表达式为:
Figure BDA0004150222090000031
其中,wii为权重系数,1≤i≤N1
进一步地,所述协方差系数的表达式为:
Figure BDA0004150222090000032
其中,
Figure BDA0004150222090000033
为所述第一数据矩阵,
Figure BDA0004150222090000034
Figure BDA0004150222090000035
为第一数据矩阵中的两个随机变量,T1为所述第一数据矩阵的总量。
进一步地,所述求解所述第二协方差矩阵,并通过矩阵线性变化得到主成分分量,根据所述主成分分量,确定降维维度和保留的指标数目,具体为:
利用正交矩阵求解所述第二协方差矩阵,得到特征向量;其中,所述特征向量的特征值从大到小排列;
根据所述特征向量,计算所述特征向量中的每个特征值对应的主成分分量;
计算每个主成分分量对应的累计特征保留程度指标,选取大于预设值的累计特征保留程度指标所对应的特征值数目,将所述特征值数目设定为所述降维维度。
本发明在降维处理时,通过比较特征保留程度指标和预设值,实现降维的同时保留下较多的特征,从而提高聚类的效果。,使聚类结果更具有代表性。
进一步地,所述根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集,具体为:
根据所述第一数据集,建立高斯混合模型;使用贝叶斯信息准则对所述第一数据集的聚类组数进行概率估计,逐步确定最佳聚类数;
确定最佳聚类数后,采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数,直至所述对数似然函数收敛,获取所述典型数据集。
进一步地,所述贝叶斯信息准则具体为将BI C值的最大值作为最佳聚类数;其中,所述BI C值为:
BIC=-2In(LU)+η*In(m);
其中,LU为高斯混合模型的似然函数最大值,η为模型参数的个数,η为样本数量。
进一步地,所述采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数,直至所述对数似然函数收敛,具体为:
E步骤:计算所述第一数据集中场景指标的后验概率;
M步骤:根据所述后验概率,更新高斯混合模型中的参数;
重复E步骤和M步骤,直至计算得到的高斯混合模型的对数似然函数收敛;其中,所述后验概率的表达式为:
Figure BDA0004150222090000041
其中,Nw(x|μw,∑w)为高斯概率分布,φw为高斯混合模型的权重,μw为高斯混合模型的均值,∑w为高斯混合模型的协方差矩阵,x为随机变量,znw为随机变量观测值,w为高斯混合模型的序号。
本发明通过贝叶斯信息准则优化最大聚类数,使根据最大聚类数区分的典型场景更能体现配电网实际工况的情形。
进一步地,所述获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景,具体为:
其中,所述第一历史数据包括:风速数据、光照强度数据;所述第二历史数据包括:电动汽车负荷数据和配电网负荷数据;
根据所述风速数据、所述光照强度数据、所述电动汽车负荷数据和所述配电网负荷数据,按时间序列生成所述若干个新能源场景;其中,所述若干个新能源场景的表达式为:
Figure BDA0004150222090000042
其中,S为所述若干个新能源场景,si为单一新能源场景,1≤i≤N1;其中,所述单一新能源场景的表达式为:
Figure BDA0004150222090000051
Figure BDA0004150222090000052
为所述风速数据,
Figure BDA0004150222090000053
为所述光照强度数据,
Figure BDA0004150222090000054
为所述电动汽车负荷数据,
Figure BDA0004150222090000055
为所述配电网负荷数据。
另一方面,本发明实施例还提供了一种基于主成分高斯混合聚类的新能源场景处理方法,包括:场景建立模块、降维处理模块和聚类处理模块;
其中,所述场景建立模块用于获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景;
所述降维处理模块用于对所述若干个新能源场景的指标分配的权重系数后,根据所述若干个新能源场景和所述权重系数,采用主成分分析法进行降维处理,得到第一数据集;
所述聚类处理模块用于根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集;其中,所述典型数据集用于配电网规划运行。
本发明在利用新能源参数等建立新能源场景后,结合权重系数分配考虑到不同场景指标对配电网运行的影响,在降维的同时保留重要的特征,使后续的聚类结果更具有代表性;再利用降为得到的第一数据集结合高斯混合模型,通过EM算法得到作为聚类结果的典型数据集,从而保证了证配电网规划运行结果的精度。
附图说明
图1为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的一种实施例的流程示意图;
图2为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的另一种实施例的流程示意图;
图3为本发明提供的基于主成分高斯混合聚类的新能源场景处理装置的一种实施例的结构示意图;
图4为本发明提供的特征维数与特征保留程度的关系示意图;
图5为本发明提供的聚类分类数与综合聚类指标的关系示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参照图1,为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的一种实施例的流程示意图,主要包括步骤101-103,具体如下:
步骤101:获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景。
在本实施例中,所述第一历史数据包括:风速数据、光照强度数据;所述第二历史数据包括:电动汽车负荷数据和配电网负荷数据。
在本实施例中,所述获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景,具体为:根据所述风速数据、所述光照强度数据、所述电动汽车负荷数据和所述配电网负荷数据,按时间序列生成所述若干个新能源场景;其中,所述若干个新能源场景的表达式为:
Figure BDA0004150222090000061
其中,S为所述若干个新能源场景,si为单一新能源场景,1≤i≤N1;其中,所述单一新能源场景的表达式为:
Figure BDA0004150222090000071
Figure BDA0004150222090000072
为所述风速数据,
Figure BDA0004150222090000073
为所述光照强度数据,
Figure BDA0004150222090000074
为所述电动汽车负荷数据,
Figure BDA0004150222090000075
为所述配电网负荷数据。
步骤102:对所述若干个新能源场景的指标分配的权重系数后,根据所述若干个新能源场景和所述权重系数,采用主成分分析法进行降维处理,得到第一数据集。
步骤103:根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集;其中,所述典型数据集用于配电网规划运行。
在本实施例中,所述根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集,具体为:根据所述第一数据集,建立高斯混合模型;使用贝叶斯信息准则对所述第一数据集的聚类组数进行概率估计,逐步确定最佳聚类数;确定最佳聚类数后,采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数,直至所述对数似然函数收敛,获取所述典型数据集。
在本实施例中,所述贝叶斯信息准则具体为将BIC值的最大值作为最佳聚类数;其中,所述BIC值为:
BIC=-2In(LU)+η*In(m);
其中,LU为高斯混合模型的似然函数最大值,η为模型参数的个数,η为样本数量。
在本实施例中,所述采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数,直至所述对数似然函数收敛,具体为:E步骤:计算所述第一数据集中场景指标的后验概率;M步骤:根据所述后验概率,更新高斯混合模型中的参数;重复E步骤和M步骤,直至计算得到的高斯混合模型的对数似然函数收敛;其中,所述后验概率的表达式为:
Figure BDA0004150222090000076
其中,Nw(x|μw,∑w)为高斯概率分布,φw为高斯混合模型的权重,μw为高斯混合模型的均值,∑w为高斯混合模型的协方差矩阵,x为随机变量,znw为随机变量观测值,w为高斯混合模型的序号。
在本实施例中,所述高斯混合模型的表达式为:
Figure BDA0004150222090000081
Figure BDA0004150222090000082
Figure BDA0004150222090000083
其中,Pr为高斯混合模型的概率分布函数,K为数据维度,W为高斯混合模型的总数。
在本实施例中,高斯混合模型中的参数包括:高斯混合模型的均值、高斯混合模型的协方差矩阵、高斯混合模型的权重和高斯概率分布;其中,高斯混合模型的均值为:
Figure BDA0004150222090000084
其中,Nw为后验概率的总和,xn为第n个随机变量。
其中,高斯混合模型的协方差矩阵为:
Figure BDA0004150222090000085
其中,高斯混合模型的权重为:
Figure BDA0004150222090000086
其中,高斯概率分布为:
Figure BDA0004150222090000087
本发明通过贝叶斯信息准则优化最大聚类数,使根据最大聚类数区分的典型场景更能体现配电网实际工况的情形。
请参照图2,为本发明提供的基于主成分高斯混合聚类的新能源场景处理方法的另一种实施例的流程示意图,主要包括步骤201-205,具体如下:
在本实施例中,步骤102包括步骤201至步骤205。
步骤201:对所述若干个新能源场景进行归一化处理,得到第一数据矩阵。
在本实施例中,所述第一数据矩阵的表达式为:
Figure BDA0004150222090000091
其中,Var(Sn)为第n个新能源场景的方差,其表达式为:
Figure BDA0004150222090000092
其中,Snt为某一新能源场景,
Figure BDA0004150222090000093
为若干个新能源场景的均值,
Figure BDA0004150222090000094
Figure BDA0004150222090000095
步骤202:根据第一数据矩阵,计算协方差系数并生成第一协方差矩阵。
在本实施例中,所述协方差系数的表达式为:
Figure BDA0004150222090000096
其中,
Figure BDA0004150222090000097
为所述第一数据矩阵,
Figure BDA0004150222090000098
Figure BDA0004150222090000099
为第一数据矩阵中的两个随机变量,T1为所述第一数据矩阵的总量。
步骤203:根据权重矩阵和所述第一协方差矩阵,采用矩阵乘法计算得到第二协方差矩阵;其中,所述权重矩阵由所述权重系数生成。
在本实施例中,所述第二协方差矩阵的表达式为:
R=RW;
其中,R′为所述第二协方差矩阵,R为所述第一协方差矩阵,W为所述权重矩阵;所述第一协方差矩阵的表达式为:
Figure BDA00041502220900000910
其中,rmn为所述协方差系数,1≤m≤N1,1≤n≤N1
所述权重矩阵的表达式为:
Figure BDA00041502220900000911
其中,wii为权重系数,1≤i≤N1
步骤204:求解所述第二协方差矩阵,并通过矩阵线性变化得到主成分分量,根据所述主成分分量,确定降维维度和保留的指标数目。
在本实施例中,所述求解所述第二协方差矩阵,并通过矩阵线性变化得到主成分分量,根据所述主成分分量,确定降维维度和保留的指标数目,具体为:利用正交矩阵求解所述第二协方差矩阵,得到特征向量;其中,所述特征向量的特征值从大到小排列;根据所述特征向量,计算所述特征向量中的每个特征值对应的主成分分量;计算每个主成分分量对应的累计特征保留程度指标,选取大于预设值的累计特征保留程度指标所对应的特征值数目,将所述特征值数目设定为所述降维维度。
在本实施例中,第二协方差矩阵的求解可表示为:
Figure BDA0004150222090000101
U为正交矩阵。
在本实施例中,所述特征向量为
Figure BDA0004150222090000102
特征值
Figure BDA0004150222090000103
其中,
Figure BDA0004150222090000104
在本实施例中,矩阵线性变化可表示为:Z=UTS;其中,Z为包含主成分分量的矩阵;S为特征向量矩阵。
在本实施例中,第t个主成分分量的单个特征保留程度指标ωt和前t个主成分分量的特征保留程度指标
Figure BDA0004150222090000105
分别表示为:
Figure BDA0004150222090000106
和,
Figure BDA0004150222090000107
单个特征保留程度指标数值ωt越大,则说明其对应的主成分分量包含越多的风电出力数据内部信息。相似地,特征保留程度指标数值越大,则说明前t个主成分分量
Figure BDA0004150222090000108
包含的风电出力数据内部信息越充足。因此,可以通过特征保留程度指标
Figure BDA0004150222090000109
选取合适的降维维度以权衡计算复杂度和原始数据信息保留程度的矛盾。
本发明在降维处理时,通过比较特征保留程度指标和预设值,实现降维的同时保留下较多的特征,从而提高聚类的效果。
步骤205:根据所述降维维度和所述保留的指标数目进行降维,得到所述第一数据集。
本发明在生成第一数据集时,通过新能源场景生成第一协方差矩阵后,在通过为每个指标匹配相应的权重以生成第二协方差矩阵,用于后续的聚类分析;避免了直接使用第一协方差矩阵进行后续的聚类,考虑到不同场景指标对配电网工况的重要性,使后续的聚类结果更具有代表性。
请参照图3,为本发明提供的基于主成分高斯混合聚类的新能源场景处理装置的一种实施例的结构示意图,包括:场景建立模块301、降维处理模块302和聚类处理模块303。
在本实施例中,场景建立模块301用于获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景。
降维处理模块302用于对所述若干个新能源场景的指标分配的权重系数后,根据所述若干个新能源场景和所述权重系数,采用主成分分析法进行降维处理,得到第一数据集。
聚类处理模块303用于根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集;其中,所述典型数据集用于配电网规划运行。
在本实施例中,选择广东某地区风速、光照强度、电动汽车负荷以及常规负荷5年的历史数据组成1800*96的数据矩阵,其中包括1800个场景下24小时风速数据、24小时光照强度数据、24小时电动汽车负荷数据和24小时常规负荷数据。首先采用主成分分析法对海量场景进行降维处理,得到原始数据的特征保留程度与保留特征维数的关系,请参照图4,为本发明提供的特征维数与特征保留程度的关系示意图。由图4可知,当保留特征维数为4维时,可有效保留95%的数据信息。在得到降维的数据信息后,可基于高斯混合聚类算法对不确定性数据进行聚类。得到不同聚类分类数下的综合聚类指标,请参照图5,为本发明提供的聚类分类数与综合聚类指标的关系示意图。由图5可知当聚类分类数为4时,聚类算法的综合聚类指标取到最大值,此时聚类效果最优。
本发明在利用新能源参数等建立新能源场景后,结合权重系数分配考虑到不同场景指标对配电网运行的影响,在降维的同时保留重要的特征,使后续的聚类结果更具有代表性;再利用降为得到的第一数据集结合高斯混合模型,通过EM算法得到作为聚类结果的典型数据集,从而保证了证配电网规划运行结果的精度。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,包括:
获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景;
对所述若干个新能源场景的指标分配的权重系数后,根据所述若干个新能源场景和所述权重系数,采用主成分分析法进行降维处理,得到第一数据集;
根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集;其中,所述典型数据集用于配电网规划运行。
2.如权利要求1所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述根据所述若干个新能源场景和所述权重,采用主成分分析法进行降维处理,得到第一数据集,具体为:
对所述若干个新能源场景进行归一化处理,得到第一数据矩阵;
根据第一数据矩阵,计算协方差系数并生成第一协方差矩阵;
根据权重矩阵和所述第一协方差矩阵,采用矩阵乘法计算得到第二协方差矩阵;其中,所述权重矩阵由所述权重系数生成;
求解所述第二协方差矩阵,并通过矩阵线性变化得到主成分分量,根据所述主成分分量,确定降维维度和保留的指标数目;
根据所述降维维度和所述保留的指标数目进行降维,得到所述第一数据集。
3.如权利要求2所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述第二协方差矩阵的表达式为:
R=W;
其中,R′为所述第二协方差矩阵,R为所述第一协方差矩阵,W为所述权重矩阵;所述第一协方差矩阵的表达式为:
Figure FDA0004150222080000021
其中,rmn为所述协方差系数,1≤m≤N1,1≤n≤N1
所述权重矩阵的表达式为:
Figure FDA0004150222080000022
其中,wii为权重系数,1≤i≤N1
4.如权利要求3所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述协方差系数的表达式为:
Figure FDA0004150222080000023
其中,
Figure FDA0004150222080000024
为所述第一数据矩阵,
Figure FDA0004150222080000025
Figure FDA0004150222080000026
为第一数据矩阵中的两个随机变量,T1为所述第一数据矩阵的总量。
5.如权利要求2所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述求解所述第二协方差矩阵,并通过矩阵线性变化得到主成分分量,根据所述主成分分量,确定降维维度和保留的指标数目,具体为:
利用正交矩阵求解所述第二协方差矩阵,得到特征向量;其中,所述特征向量的特征值从大到小排列;
根据所述特征向量,计算所述特征向量中的每个特征值对应的主成分分量;
计算每个主成分分量对应的累计特征保留程度指标,选取大于预设值的累计特征保留程度指标所对应的特征值数目,将所述特征值数目设定为所述降维维度。
6.如权利要求1所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集,具体为:
根据所述第一数据集,建立高斯混合模型;使用贝叶斯信息准则对所述第一数据集的聚类组数进行概率估计,逐步确定最佳聚类数;
确定最佳聚类数后,采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数,直至所述对数似然函数收敛,获取所述典型数据集。
7.如权利要求6所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述贝叶斯信息准则具体为将BIC值的最大值作为最佳聚类数;其中,所述BIC值为:
BIC=-2In(LU)+η*In(m);
其中,LU为高斯混合模型的似然函数最大值,η为模型参数的个数,η为样本数量。
8.如权利要求6所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述采用EM算法更新所述高斯混合模型的参数并计算所述高斯混合模型的对数似然函数,直至所述对数似然函数收敛,具体为:
E步骤:计算所述第一数据集中场景指标的后验概率;
M步骤:根据所述后验概率,更新高斯混合模型中的参数;
重复E步骤和M步骤,直至计算得到的高斯混合模型的对数似然函数收敛;其中,所述后验概率的表达式为:
Figure FDA0004150222080000031
其中,Nw(x|μww)为高斯概率分布,φw为高斯混合模型的权重,μw为高斯混合模型的均值,∑w为高斯混合模型的协方差矩阵,x为随机变量,znw为随机变量观测值,w为高斯混合模型的序号。
9.如权利要求1-8任意一项所述的基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,所述获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景,具体为:
其中,所述第一历史数据包括:风速数据、光照强度数据;所述第二历史数据包括:电动汽车负荷数据和配电网负荷数据;
根据所述风速数据、所述光照强度数据、所述电动汽车负荷数据和所述配电网负荷数据,按时间序列生成所述若干个新能源场景;其中,所述若干个新能源场景的表达式为:
Figure FDA0004150222080000041
其中,S为所述若干个新能源场景,si为单一新能源场景,1≤i≤N1;其中,所述单一新能源场景的表达式为:
Figure FDA0004150222080000042
Figure FDA0004150222080000043
为所述风速数据,
Figure FDA0004150222080000044
为所述光照强度数据,
Figure FDA0004150222080000045
为所述电动汽车负荷数据,
Figure FDA0004150222080000046
为所述配电网负荷数据。
10.一种基于主成分高斯混合聚类的新能源场景处理方法,其特征在于,包括:场景建立模块、降维处理模块和聚类处理模块;
其中,所述场景建立模块用于获取包含新能源参数的第一历史数据和包含负荷参数的第二历史数据,根据所述第一历史数据和所述第二历史数据,生成若干个新能源场景;
所述降维处理模块用于对所述若干个新能源场景的指标分配的权重系数后,根据所述若干个新能源场景和所述权重系数,采用主成分分析法进行降维处理,得到第一数据集;
所述聚类处理模块用于根据所述第一数据集,采用高斯混合聚类算法进行聚类,得到典型数据集;其中,所述典型数据集用于配电网规划运行。
CN202310316052.9A 2023-03-28 2023-03-28 基于主成分高斯混合聚类的新能源场景处理方法及装置 Pending CN116166955A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310316052.9A CN116166955A (zh) 2023-03-28 2023-03-28 基于主成分高斯混合聚类的新能源场景处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310316052.9A CN116166955A (zh) 2023-03-28 2023-03-28 基于主成分高斯混合聚类的新能源场景处理方法及装置

Publications (1)

Publication Number Publication Date
CN116166955A true CN116166955A (zh) 2023-05-26

Family

ID=86414803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310316052.9A Pending CN116166955A (zh) 2023-03-28 2023-03-28 基于主成分高斯混合聚类的新能源场景处理方法及装置

Country Status (1)

Country Link
CN (1) CN116166955A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117175637A (zh) * 2023-08-25 2023-12-05 哈尔滨工业大学 一种基于混合密度网络未来态场景的源网荷储配置方法
CN117421708A (zh) * 2023-11-13 2024-01-19 安徽极果数融信息科技有限公司 基于改进混合高斯模型的碱性电解水还原氢状态监测方法
CN118114137A (zh) * 2024-04-30 2024-05-31 浙江大华技术股份有限公司 一种非侵入式负荷识别方法、装置以及计算机存储介质
CN118432194A (zh) * 2024-07-05 2024-08-02 华东交通大学 一种基于集成深度学习的微电网优化调度方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117175637A (zh) * 2023-08-25 2023-12-05 哈尔滨工业大学 一种基于混合密度网络未来态场景的源网荷储配置方法
CN117421708A (zh) * 2023-11-13 2024-01-19 安徽极果数融信息科技有限公司 基于改进混合高斯模型的碱性电解水还原氢状态监测方法
CN117421708B (zh) * 2023-11-13 2024-04-09 安徽极果数融信息科技有限公司 基于改进混合高斯模型的碱性电解水还原氢状态监测方法
CN118114137A (zh) * 2024-04-30 2024-05-31 浙江大华技术股份有限公司 一种非侵入式负荷识别方法、装置以及计算机存储介质
CN118432194A (zh) * 2024-07-05 2024-08-02 华东交通大学 一种基于集成深度学习的微电网优化调度方法
CN118432194B (zh) * 2024-07-05 2024-09-20 华东交通大学 一种基于集成深度学习的微电网优化调度方法

Similar Documents

Publication Publication Date Title
CN116166955A (zh) 基于主成分高斯混合聚类的新能源场景处理方法及装置
CN111314353B (zh) 一种基于混合采样的网络入侵检测方法及系统
CN110544177A (zh) 基于电力指纹的负荷识别方法及计算机可读存储介质
CN114114039A (zh) 一种电池系统的单体电芯一致性的评估方法和装置
CN109361007B (zh) 电池配组方法
Kuri-Morales et al. The best genetic algorithm II: A comparative study of structurally different genetic algorithms
CN116596095A (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
CN114419361B (zh) 基于门控局部通道注意力的神经网络图像分类方法
CN116226689A (zh) 一种基于高斯混合模型的配电网典型运行场景生成方法
CN114186518A (zh) 一种集成电路良率估算方法及存储器
CN111931990B (zh) 基于优化最小二乘支持向量机的电力负荷预测方法
CN111831955B (zh) 一种锂离子电池剩余寿命预测方法及系统
CN117828277A (zh) 电力系统数据全链路稳定性监测方法及系统
CN117768338A (zh) 一种基于梯度提升树的网络流量矩阵预测方法
WO2019134258A1 (zh) 一种大规模多状态串并联系统的可靠性近似计算方法
CN111797899B (zh) 一种低压台区kmeans聚类方法及系统
CN117454750A (zh) 温度预测方法、装置、设备以及存储介质
CN116796884A (zh) 基于多特征耦合的多类型低碳能源发电量预测方法及装置
CN115620038A (zh) 共性知识约束的遥感样本迁移方法
CN114511747A (zh) 一种基于vae预处理和rp-2dcnn的不平衡负荷数据类型辨识方法
CN112967154B (zh) 一种电力系统Well-being的评估方法及装置
CN112766356A (zh) 一种基于动态权重D-XGBoost模型的预测方法及系统
CN114238504A (zh) 面向电子政务的跨链数据查询及共识优化方法
Čížek Robust estimation with discrete explanatory variables
CN112766336A (zh) 一种最大化随机平滑下提高模型可验证防御性能的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination