CN111291326B - 一种结合类内相似度和类间差异度的聚类有效性指标建立方法 - Google Patents

一种结合类内相似度和类间差异度的聚类有效性指标建立方法 Download PDF

Info

Publication number
CN111291326B
CN111291326B CN202010081900.9A CN202010081900A CN111291326B CN 111291326 B CN111291326 B CN 111291326B CN 202010081900 A CN202010081900 A CN 202010081900A CN 111291326 B CN111291326 B CN 111291326B
Authority
CN
China
Prior art keywords
scene
scenes
class
probability
reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010081900.9A
Other languages
English (en)
Other versions
CN111291326A (zh
Inventor
余姚果
梅亚东
彭利鸿
张祥
肖小刚
张胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Central China Grid Co Ltd
Original Assignee
Wuhan University WHU
Central China Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU, Central China Grid Co Ltd filed Critical Wuhan University WHU
Priority to CN202010081900.9A priority Critical patent/CN111291326B/zh
Publication of CN111291326A publication Critical patent/CN111291326A/zh
Application granted granted Critical
Publication of CN111291326B publication Critical patent/CN111291326B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Pure & Applied Mathematics (AREA)
  • Educational Administration (AREA)
  • Mathematical Physics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Water Supply & Treatment (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)

Abstract

本发明公开了一种结合类内相似度和类间差异度的聚类有效性指标建立方法。首先计算初始场景集中每两个场景组合之间的相似性指标;采用改进SBR算法进行场景缩减得到目标场景数及其对应的概率;然后计算类内相似度和类间差异度从而得到有效性指标YM值;通过绘制提取场景数与YM指标值之间的关系曲线来确定合适的场景数。本发明首次在SBR算法中提出结合类内相似度和类间差异度指标YM作为判定提取场景数依据,有助于SBR方法推广和发展。

Description

一种结合类内相似度和类间差异度的聚类有效性指标建立 方法
技术领域
本发明属于电网规划领域,涉及一种聚类分析方法,特别涉及一种结合类内相似度和类间差异度的聚类有效性指标建立方法。
背景技术
电力系统中长期规划和运行调度均涉及对大量的场景和方案进行分析评价。风力和光伏电站的输出功率随风能和太阳辐射变化,受天气、季节、区域等变量影响具有较强的随机性、波动性和间歇性的特征。风电/光伏的大规模并网影响电力实时平衡威胁电网安全,对电力系统规划和运行提出更高的要求,对提高电力系统风电/光伏发电并网接纳能力提出严峻挑战。场景缩减的目的是通过合并相似场景尽可能利用少量具有代表性的场景描述庞大的数据集合,从而降低问题的复杂程度。聚类算法是一种较为常见的典型场景提取方法,常见的聚类算法有K-means、模糊C均值算法、分层聚类算法、同步回代缩减算法(Simultaneous Backward Reduction,SBR)。其中,但是,SBR法在应用时,其提取场景数的选择缺乏一定客观性。因此,K-means和模糊C均值算法易受初始聚类中心的影响、在迭代过程中易陷入局部最优解并且提取场景数难以确定,使得最终提取的结果缺乏足够代表性。分层聚类算法和同步回代算法在相似性度量往往采用欧氏距离、绝对距离等描述样本数量特征,无法准确反映时间序列形状特征,并且场景提取数往往由人为规定。由于医疗、海洋、电力等行业数据量大,往往需要通过对大量原始数据进行聚类分析从而提取典型场景,因此将一种结合类内相似度和类间差异度的聚类有效性指标引入SBR算法,对于完善和发展SBR法,具有比较重要的意义,并且可为电力部门各机组出力以及用户负荷过程典型场景提取提供技术支撑。
发明内容
本发明的目的在于解决同步回代缩减法场景数选择依据的不足,提供一种结合类内相似度和类间差异度的聚类有效性指标,以确定最终提取的场景数目,并用于研究电力系统出力以及负荷特征。
为实现上述目的,采用的技术方案如下:
一种结合类内相似度和类间差异度的聚类有效性指标建立方法,其特征在于:包括如下步骤:
步骤1,计算初始场景集中每两个场景组合之间的相似性距离;
步骤2、采用改进同步回代缩减算法进行第k次场景缩减;k=1,2,3…N-M,其中N为初始场景集中场景总数,M为缩减后的场景数量;
步骤3、重复步骤2直至经过N-M次场景缩减后,最终得到M个场景及其对应的概率;
假定删除的场景数N-M,根据需要删除的场景数N-M按照改进SBR算法计算场景缩减后包含M类场景的典型场景集合X(M),及每一类场景对应的概率PM,同时记录第m类场景集合
Figure BDA0002380600270000021
m=1,2,…,M,其中:
Figure BDA0002380600270000022
Figure BDA0002380600270000023
Figure BDA0002380600270000024
式中,
Figure BDA0002380600270000025
表示典型场景集合中第m类中心场景,
Figure BDA0002380600270000026
表示第m类中心场景第t个时间节点对应场景数值,
Figure BDA0002380600270000027
表示所得的M类场景集合中第m类场景出现概率
Figure BDA0002380600270000028
Nm表示第m类场景中所包含的场景个数,包含第m类中心场景(N1+N2+...Nm=N),
Figure BDA0002380600270000029
表示第(Nm-1)个被并入到场景
Figure BDA00023806002700000210
的场景,
Figure BDA00023806002700000211
表示场景
Figure BDA00023806002700000212
在第t个时间节点对应场景数值;
步骤4、计算类内相似度S(M),实现如下:
Figure BDA00023806002700000213
式中,
Figure BDA00023806002700000214
表示第m类场景集合中所有场景到第m类中心场景之间的相似性距离,由于第m类场景集合包含第m类中心场景,故除去类中心场景外剩余场景个数为Nm-1。
Figure BDA00023806002700000215
表示第m类场景集合中除中心场景外其余各场景到中心场景间的概率平均距离,S(M)表示M类场景的概率平均类内距离;
步骤5、计算M类场景之间的类间差异度D(M);
步骤6、计算YM有效性指标从而确定合适的场景数,实现如下,
YM场景缩减有效性指标由类内相似度和类间差异度组成,计算公式为:
Figure BDA0002380600270000031
完成聚类有效性指标建立。
进一步地,所述步骤1中具体计算方法如下:
记N天风电出力初始场景集为X=[X1,X2,...,XN]',其中第i个场景为Xi=[xi1,xi2,...,xiT],i=1,2,3…N,采样时间节点为t,t=1,2,3…T,xit表示第i个场景在第t个采样点对应场景数值,初始N个场景对应概率为P=[P1,P2,...,PN]',删除的场景集为Y,删除场景数为N-M,最终得到的包含M个场景的场景集为X-Y;
考虑风电出力过程线数量、形状以及峰谷差特性,提出如下任意两个场景Xi和Xj之间的相似性距离计算公式:
Figure BDA0002380600270000032
Figure BDA0002380600270000033
式中,max(xit)为场景Xi中风电出力最大值,min(xit)为场景Xi中风电出力最小值,max(xjt)为场景Xj中风电出力最大值,min(xjt)为场景Xj中风电出力最小值;θit表示风电出力第i个场景在t时刻的形维波动。
进一步地,所述形维波动采用风电出力过程线与水平线之间的夹角变化量表示,具体计算公式如下:
Figure BDA0002380600270000034
Figure BDA0002380600270000035
式中,ki,t为风电出力第i个场景的第t个折线段斜率,t表示时间节点,当t=1或T时,形维波动为首、尾风电出力折线段与水平线之间的夹角。
进一步地,所述步骤2中具体计算方法如下:
为了确定合适的场景集X-Y使原始场景集X删除场景集Y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离Dij最小,用公式表示如下:
Figure BDA0002380600270000041
式中,Pi表示初始场景Xi对应的概率;
为保证场景缩减前后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和,用公式表示如下:
Figure BDA0002380600270000042
式中,
Figure BDA0002380600270000043
表示第k次场景缩减后场景Xj更新后的概率,其中
Figure BDA0002380600270000044
第k(k=1,2,3…N-M)次缩减得到
Figure BDA0002380600270000045
将最小的
Figure BDA0002380600270000046
对应的场景
Figure BDA0002380600270000047
从场景集合X-Yk-1中删除,并入已删除的场景Yk-1中,得到
Figure BDA0002380600270000048
将场景
Figure BDA0002380600270000049
对应的概率加到场景集合X-Yk-1中与场景Xl k距离最近的场景
Figure BDA00023806002700000410
对应概率
Figure BDA00023806002700000411
上,再次计算更新后场景集X-Yk中每两个场景组合之间的距离。
进一步地,所述步骤5中计算M类场景之间的类间差异度具体方法如下:
从场景集X(M)中任选两个场景Xu (M)和Xv (M),u,v=1,2,3,…,M;共有
Figure BDA00023806002700000412
种组合方式,计算任意两个场景之间相似性距离计算公式如下:
Figure BDA00023806002700000413
计算M类场景间的类间差异度D(M)
Figure BDA0002380600270000051
本发明有益效果是:
本发明首次将基于类内相似度和类间差异度的YM指标应用到SBR场景数选择上,其意义在于:YM指标越小,说明经过场景缩减后得到的典型场景集合类内相似度越高,不同场景集合类间差异度越大,因而得到的结果更具有代表性。本方法将基于结合类内相似度和类间差异度的聚类有效性指标YM引入SBR算法,使得在实际场景缩减中场景缩减个数的确定更有依据,有助于SBR法的推广使用。
附图说明
图1是本发明实施例中以某电网的冬季三个月份共计90天风电出力数据经本发明提出的改进SBR法缩减后得到效果图。
图2是本发明实施例冬季风电出力提取场景数与YM指标之间的关系曲线。
图3是本发明实施例中风电出力过程线及形维波动示意图,其中横坐标为时间节点,纵坐标为风电相对出力。
具体实施方式
为了使本发明实施例的目的明确,技术方案及优点更加清晰,下面将结合本发明实施例来介绍本发明的技术方案。
本发明实施例一种结合类内相似度和类间差异度的聚类有效性指标建立方法,包括以下步骤:
步骤1,计算初始场景集中每两个场景组合之间的距离
本发明以某电网2017年冬季风电出力逐日96点资料为实例,事先对数据进行归一化处理,使得所有数据均在[0,1]区间内。记N天(N=90)风电出力初始场景集为X=[X1,X2,...,XN]',其中第i个场景为Xi=[xi1,xi2,...,xiT],i=1,2,3…N,采样时间节点为t,t=1,2,3…T,xit表示第i个场景在第t个采样点对应场景数值,初始N个场景对应概率为P=[P1,P2,...,PN]',删除的场景集为Y,删除场景数为N-M,最终得到的包含M个场景的场景集为X-Y;
考虑风电出力过程线数量、形状以及峰谷差特性,提出如下任意两个场景Xi和Xj之间的相似性指标(QC+指标):
Figure BDA0002380600270000061
式中,max(xit)为场景Xi中风电出力最大值,min(xit)为场景Xi中风电出力最小值,max(xjt)为场景Xj中风电出力最大值,min(xjt)为场景Xj中风电出力最小值;θit表示风电出力第i个场景在t时刻的形维波动。
所述形维波动风电出力过程线与水平线之间的夹角,具体计算公式如下:
Figure BDA0002380600270000062
Figure BDA0002380600270000063
式中,ki,t为风电出力第i个场景的第t个折线段斜率,形维波动及风电出力过程线如图3所示,其中t表示时间节点,i表示第i个风电出力场景。当t=1或T时,形维波动为首、尾风电出力折线段与水平线之间的夹角。
步骤2,采用改进同步回代缩减算法(ISBR算法)进行第k(k=1,2,3…N-M)次场景缩减,实现如下,
为了确定合适的场景集X-Y使场景集X删除场景集Y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离Dij最小,用公式表示如下:
Figure BDA0002380600270000064
式中,Pi表示初始场景Xi对应的概率;
为保证场景缩减前后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和。用公式表示如下:
Figure BDA0002380600270000065
式中,
Figure BDA0002380600270000066
表示第k次场景缩减后场景Xj更新后的概率,其中
Figure BDA0002380600270000071
第k(k=1,2,3…N-M)次缩减得到
Figure BDA0002380600270000072
将最小的
Figure BDA0002380600270000073
对应的场景
Figure BDA0002380600270000074
从场景集合X-Yk-1中删除,并入已删除的场景Yk-1中,得到
Figure BDA0002380600270000075
将场景
Figure BDA0002380600270000076
对应的概率加到场景集合X-Yk-1中与场景
Figure BDA0002380600270000077
距离最近的场景
Figure BDA0002380600270000078
对应概率
Figure BDA0002380600270000079
上。再次计算更新后场景集X-Yk中每两个场景组合之间的距离。
步骤3,重复步骤2直至经过N-M次场景缩减后,最终得到M个场景及其对应的概率,实现如下,
假定删除的场景数N-M,根据需要删除的场景数N-M按照改进SBR算法计算场景缩减后包含M类场景的典型场景集合X(M),及每一类场景对应的概率PM,同时记录第m(m=1,2,…,M)类场景集合
Figure BDA00023806002700000710
其中:
Figure BDA00023806002700000711
Figure BDA00023806002700000712
Figure BDA00023806002700000713
式中,
Figure BDA00023806002700000714
表示典型场景集合中第m类中心场景,
Figure BDA00023806002700000715
表示第m类中心场景第t个时间节点对应场景数值,
Figure BDA00023806002700000716
表示所得的M类场景集合中第m类场景出现概率
Figure BDA00023806002700000717
Nm表示第m类场景中所包含的场景个数,包含第m类中心场景(N1+N2+...Nm=N),
Figure BDA00023806002700000718
表示第(Nm-1)个被并入到场景
Figure BDA00023806002700000719
的场景,
Figure BDA00023806002700000720
表示场景
Figure BDA00023806002700000721
在第t个时间节点对应场景数值。
步骤4,计算类内相似度S(M),实现如下:
Figure BDA0002380600270000081
式中,
Figure BDA0002380600270000082
表示第m类场景集合中所有场景到第m类中心场景之间的相似性距离,由于第m类场景集合包含第m类中心场景,故除去类中心场景外剩余场景个数为Nm-1。
Figure BDA0002380600270000083
表示第m类场景集合中除中心场景外其余各场景到中心场景间的概率平均距离,S(M)表示M类场景的概率平均类内距离,综合反映了M类场景集合类内相似性,S(M)越小表明M类场景类内相似度越高,场景缩减效果越理想。
步骤5,计算M类场景之间的类间差异度D(M),实现如下,
从场景集X(M)中任选两个场景Xu (M)和Xv (M)(u,v=1,2,3,…,M),共有
Figure BDA0002380600270000084
种组合方式,计算任意两个场景之间相似性距离计算公式如下:
Figure BDA0002380600270000085
计算M类场景间的类间差异度D(M)
Figure BDA0002380600270000086
随着场景不断缩减,相似的场景不断被合并,剩下的场景之间的差异越来越大,故采用D(M)衡量剩余场景间的差异性,剩余场景之间的相似性距离越大表明缩减后得到的场景集合X(M)中各类场景间差异性越大。
步骤6,计算YM有效性指标从而确定合适的场景数,实现如下,
YM场景缩减有效性指标由类内相似度和类间差异度组成,计算公式为
Figure BDA0002380600270000087
显然,不同的场景数M对应不同的YM指标值,类内相似度S(M)越小,类间差异度D(M)越大,则YM指标值越小,表明得到的M个场景之间的差异度越大。但场景数越大,提取的各场景出现概率也会减小,因此场景数不宜取得过大,一般认为如果多个不同场景数对应YM指标都很小,且彼此相差较小时,优先选择较小的场景数为最终提取场景数。
采用上述方法提取冬季风电出力场景时,得到的提取过程如图1所示,根据步骤六得到冬季风电出力提取场景数与YM指标间的关系曲线,如图2所示,可以看出冬季风电出力场景数为2和4时对应YM指标值都比场景数为3时对应YM指标值大,虽然场景数为7时YM值最小,但是此时提取的场景中出现了极端场景(即出现概率小于5%的场景),故冬季风电出力场景数应选择3。基于图2,对冬季风电出力提取场景数为3比较合适,本实施例选择提取场景数为3,最终结果如图1所示。
本发明主要用于聚类分析领域,是对SBR方法的一种完善。本发明首次将基于类内相似度和类间差异度的YM指标应用到SBR场景数选择上,其意义在于:YM指标越小,说明经过场景缩减后得到的典型场景集合类内相似度越高,不同场景集合类间差异度越大,因而得到的结果更具有代表性。本方法将基于结合类内相似度和类间差异度的聚类有效性指标YM引入SBR算法,使得在实际场景缩减中场景缩减个数的确定更有依据,有助于SBR法的推广使用。
需要强调的是,本发明所述的实施例是说明性的,而不是限定性的,因此本发明并不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

Claims (1)

1.一种结合类内相似度和类间差异度的聚类有效性指标建立方法,其特征在于:包括如下步骤:
步骤1,计算初始场景集中每两个场景组合之间的相似性距离;
步骤2、采用改进同步回代缩减算法进行第k次场景缩减;k=1,2,3…N-M,其中N为初始场景集中场景总数,M为缩减后的场景数量;
步骤3、重复步骤2直至经过N-M次场景缩减后,最终得到M个场景及其对应的概率;
假定删除的场景数N-M,根据需要删除的场景数N-M按照改进SBR算法计算场景缩减后包含M类场景的典型场景集合X(M),及每一类场景对应的概率PM,同时记录第m类场景集合
Figure FDA0003564304060000011
m=1,2,…,M,其中:
Figure FDA0003564304060000012
Figure FDA0003564304060000013
Figure FDA0003564304060000014
式中,
Figure FDA0003564304060000015
表示典型场景集合中第m类中心场景,
Figure FDA0003564304060000016
表示第m类中心场景第t个时间节点对应场景数值,
Figure FDA0003564304060000017
表示所得的M类场景集合中第m类场景出现概率,
Figure FDA0003564304060000018
Nm表示第m类场景中所包含的场景个数,包含第m类中心场景,N1+N2+...Nm=N,
Figure FDA0003564304060000019
表示第Nm-1个被并入到场景
Figure FDA00035643040600000110
的场景,
Figure FDA00035643040600000111
表示场景
Figure FDA00035643040600000112
在第t个时间节点对应场景数值;
步骤4、计算类内相似度S(M),实现如下:
Figure FDA00035643040600000113
式中,
Figure FDA00035643040600000114
表示第m类场景集合中所有场景到第m类中心场景之间的相似性距离,由于第m类场景集合包含第m类中心场景,故除去类中心场景外剩余场景个数为Nm-1,
Figure FDA0003564304060000021
表示第m类场景集合中除中心场景外其余各场景到中心场景间的概率平均距离,S(M)表示M类场景的概率平均类内距离;
步骤5、计算M类场景之间的类间差异度D(M);
步骤6、计算YM有效性指标从而确定合适的场景数,实现如下,
YM场景缩减有效性指标由类内相似度和类间差异度组成,计算公式为:
Figure FDA0003564304060000022
完成聚类有效性指标建立;
所述步骤1中具体计算方法如下:
记N天风电出力初始场景集为X=[X1,X2,...,XN]',其中第i个场景为Xi=[xi1,xi2,...,xiT],i=1,2,3…N,采样时间节点为t,t=1,2,3…T,xit表示第i个场景在第t个采样点对应场景数值,初始N个场景对应概率为P=[P1,P2,...,PN]',删除的场景集为Y,删除场景数为N-M,最终得到的包含M个场景的场景集为X-Y;
考虑风电出力过程线数量、形状以及峰谷差特性,提出如下任意两个场景Xi和Xj之间的相似性距离计算公式:
Figure FDA0003564304060000023
式中,max(xit)为场景Xi中风电出力最大值,min(xit)为场景Xi中风电出力最小值,max(xjt)为场景Xj中风电出力最大值,min(xjt)为场景Xj中风电出力最小值;θit表示风电出力第i个场景在t时刻的形维波动;
所述形维波动采用风电出力过程线与水平线之间的夹角变化量表示,具体计算公式如下:
Figure FDA0003564304060000031
Figure FDA0003564304060000032
式中,ki,t为风电出力第i个场景的第t个折线段斜率,t表示时间节点,当t=1或T时,形维波动为首、尾风电出力折线段与水平线之间的夹角;
所述步骤2中具体计算方法如下:
为了确定合适的场景集X-Y使原始场景集X删除场景集Y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离Dij最小,用公式表示如下:
Figure FDA0003564304060000033
式中,Pi表示初始场景Xi对应的概率;
为保证场景缩减前后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和,用公式表示如下:
Figure FDA0003564304060000034
式中,
Figure FDA0003564304060000035
表示第k次场景缩减后场景Xj更新后的概率,其中
Figure FDA0003564304060000036
第k,k=1,2,3…N-M次缩减得到
Figure FDA0003564304060000037
将最小的
Figure FDA0003564304060000038
对应的场景
Figure FDA0003564304060000039
从场景集合X-Yk-1中删除,并入已删除的场景Yk-1中,得到
Figure FDA00035643040600000310
将场景
Figure FDA00035643040600000311
对应的概率加到场景集合X-Yk-1中与场景
Figure FDA00035643040600000312
距离最近的场景
Figure FDA00035643040600000313
对应概率
Figure FDA00035643040600000314
上,再次计算更新后场景集X-Yk中每两个场景组合之间的距离;
所述步骤5中计算M类场景之间的类间差异度具体方法如下:
从场景集X(M)中任选两个场景Xu (M)和Xv (M),u,v=1,2,3,…,M;共有
Figure FDA0003564304060000041
种组合方式,计算任意两个场景之间相似性距离计算公式如下:
Figure FDA0003564304060000042
计算M类场景间的类间差异度D(M)
Figure FDA0003564304060000043
CN202010081900.9A 2020-02-06 2020-02-06 一种结合类内相似度和类间差异度的聚类有效性指标建立方法 Active CN111291326B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010081900.9A CN111291326B (zh) 2020-02-06 2020-02-06 一种结合类内相似度和类间差异度的聚类有效性指标建立方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010081900.9A CN111291326B (zh) 2020-02-06 2020-02-06 一种结合类内相似度和类间差异度的聚类有效性指标建立方法

Publications (2)

Publication Number Publication Date
CN111291326A CN111291326A (zh) 2020-06-16
CN111291326B true CN111291326B (zh) 2022-05-17

Family

ID=71026757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010081900.9A Active CN111291326B (zh) 2020-02-06 2020-02-06 一种结合类内相似度和类间差异度的聚类有效性指标建立方法

Country Status (1)

Country Link
CN (1) CN111291326B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117408829A (zh) * 2023-10-27 2024-01-16 东北农业大学 耕地保护分区及特征自动归纳、障碍因子诊断方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583478A (zh) * 2018-11-06 2019-04-05 北京交通大学 一种智能蜂群聚类方法及车辆目标检测方法
CN110321799A (zh) * 2019-06-04 2019-10-11 武汉大学 一种基于sbr和平均类间距离的场景数选择方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006087854A1 (ja) * 2004-11-25 2006-08-24 Sharp Kabushiki Kaisha 情報分類装置、情報分類方法、情報分類プログラム、情報分類システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583478A (zh) * 2018-11-06 2019-04-05 北京交通大学 一种智能蜂群聚类方法及车辆目标检测方法
CN110321799A (zh) * 2019-06-04 2019-10-11 武汉大学 一种基于sbr和平均类间距离的场景数选择方法

Also Published As

Publication number Publication date
CN111291326A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
CN111275367B (zh) 一种区域综合能源系统能效状态评价方法
CN111079980B (zh) 基于自适应分类策略和混合优化svr的光功率预测方法
CN107194495B (zh) 一种基于历史数据挖掘的光伏功率纵向预测方法
CN111414717A (zh) 一种基于XGBoost-LightGBM的机组功率预测方法
CN106067034B (zh) 一种基于高维矩阵特征根的配电网负荷曲线聚类方法
CN112990558B (zh) 一种基于深度迁移学习的气象温度、光照的预测方法
CN111626473A (zh) 一种考虑误差修正的两阶段光伏功率预测方法
CN114511132A (zh) 一种光伏出力短期预测方法及预测系统
CN114897129A (zh) 一种基于日相似聚类与Kmeans-GRA-LSTM的光伏电站短期功率预测方法
CN111291326B (zh) 一种结合类内相似度和类间差异度的聚类有效性指标建立方法
CN110795841B (zh) 一种间歇性能源出力不确定性的数学建模方法
CN115908051A (zh) 一种电力系统储能容量确定方法
CN116502766A (zh) 考虑风速变化特征的短期风电功率区间预测方法
CN116702937A (zh) 一种基于K-means均值聚类及优化BP神经网络的光伏出力日前预测方法
CN115796004A (zh) 一种基于SLSTM和MLSTNet模型的光伏电站超短期功率智能预测方法
CN114882373A (zh) 基于深度神经网络的多特征融合沙尘暴预测方法
CN110852492A (zh) 一种基于马氏距离找相似的光伏功率超短期预测方法
CN112801350B (zh) 基于不确定度的深度学习超短时风电功率预测系统及方法
CN110321799B (zh) 一种基于sbr和平均类间距离的场景数选择方法
CN115660132B (zh) 一种光伏发电功率预测方法及系统
CN116579120A (zh) 一种基于综合法的日风电出力序列场景生成方法
CN111340330B (zh) 一种基于相关性-量-形三维距离的同步回代缩减方法
CN116029440A (zh) 光伏电站超短期功率预测方法和装置
CN113962432A (zh) 一种融合三维卷积与轻量卷积门限单元的风电预测方法及系统
CN112711913A (zh) 基于粒度支持向量机的冷热电短期负荷预测系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant