CN116451906A - 一种基于ISDPC-K-means聚类的典型场景构建方法 - Google Patents
一种基于ISDPC-K-means聚类的典型场景构建方法 Download PDFInfo
- Publication number
- CN116451906A CN116451906A CN202310426331.0A CN202310426331A CN116451906A CN 116451906 A CN116451906 A CN 116451906A CN 202310426331 A CN202310426331 A CN 202310426331A CN 116451906 A CN116451906 A CN 116451906A
- Authority
- CN
- China
- Prior art keywords
- output
- clustering
- curve
- isdpc
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Photovoltaic Devices (AREA)
Abstract
本发明涉及一种基于ISDPC‑K‑means聚类的典型场景构建方法。包括:步骤S1、获取光伏出力曲线和风电出力曲线并构造当日出力曲线;步骤S2、采用ISDPC算法确定初始的聚类中心;步骤S3、基于ISDPC算法确定的初始聚类中心,基于K‑means算法生成K个典型出力场景;步骤S4、构建聚类算法评价指标体系,以验证有效性。本发明能够实现极具代表性的风电、光伏出力典型场景的构建,对配电网大规模接入可再生能源情况下运行的安全性、可靠性以及经济性具有重要意义。
Description
技术领域
本发明涉及不确定性能源出力领域,具体涉及一种基于ISDPC-K-means聚类的典型场景构建方法。
背景技术
目前,我国风电、光伏装机容量比例不断上升,相比于常规的火力和水力发电可控的特点,风电、光伏的发电量不受人为控制,出力具有随机性、间歇性和波动性,大规模风电、光伏并网对配电网的系统规划、运行和调度优化带来挑战,如何考虑可再生能源出力的不确定性是目前研究电力系统运行优化的难点。
为解决上述不确定性,国内外学者针对可再生能源的出力预测开展了大量的工作。由于准确定量描述超前时间的风电或光伏出力曲线一般较难,而通过生成符合光伏、风电出力特征的时序场景来表征风电、光伏的超前出力,从而将风光出力不确定性模型转化为确定性模型,进行场景分析,为配电网优化运行提供便利。
发明内容
本发明的目的在于针对目前大多数场景分析方法无法同时保证准确性和高效性,对后续场景分析、配电网进行优化运行造成影响,因此提供一种基于ISDPC-K-means聚类的典型场景构建方法,能够有效处理密度不均匀的样本,通过ISDPC算法确定聚类个数以及初始聚类中心,结合K-means算法生成典型场景,对配电网大规模接入可再生能源情况下运行的安全性、可靠性、经济性的提升提供基础。
为实现上述目的,本发明的技术方案是:一种基于ISDPC-K-means聚类的典型场景构建方法,包括以下步骤:
步骤S1、获取光伏出力曲线和风电出力曲线并构造当日出力曲线;
步骤S2、采用ISDPC算法确定初始的聚类中心;
步骤S3、基于ISDPC算法确定的初始聚类中心,用K-means算法生成K个典型出力场景;
步骤S4、构建聚类算法评价指标体系,以评价构建的K个典型出力场景。
在本发明一实施例中,所述步骤S2具体实现如下:
每条出力曲线有n=48维数据,全年共有m=365条出力曲线;首先进行标准化处理,得到归一化后的出力数据:
式中xij表示第i条出力曲线的第j维的数据;
根据第i条出力曲线的第j维数据在该维数据的比重rij计算第j维数据的熵值hj和权值ωj,由各维数据的权重计算各出力曲线间的赋权欧氏距离;具体表述如下:
式中:d(xp,xq)为第p条出力曲线与第q条出力曲线之间的赋权欧式距离,xpj、xqj分别表示第p、q条曲线的第j维数据;
决策值γ由局部密度ρ和最小距离δ相乘得到;ISDPC借助3N算法改进局部密度,将样本在局部范围内与其k个近邻样本的相对密度作为其局部密度ρ′,将所有风光出力曲线的局部密度进行排序,计算第i条出力曲线的相对距离δi;若第i条出力曲线的局部密度最大,则δi设为该曲线与其他出力曲线距离的最大值;对于局部密度非最大的出力曲线,将与比其局部密度大的出力曲线的最小距离作为相对距离,相关计算公式如下:
γi=ρ′i·δi (7)
式中,γi为第i条出力曲线的决策值;将各出力曲线的决策值由大到小排列得到新的决策值序列γ′={γ1′,γ2′,…,γm′},在决策图中依次选取γi′,1<i<m,由其对应的决策值点分别向决策值最大和最小的点引两条线段,若当i=K时两条线段与决策图拟合误差最小,则选取序列γ′前K个决策值对应的样本作为初始的聚类中心。
在本发明一实施例中,所述步骤S4具体实现如下:
以以下三个指标评价聚类算法的聚类效果:
1)误差平方和SSE
式中:μk为第k个典型出力场景;mk为第k个典型场出力景对应的天数;SSE越小,说明类内出力曲线的相似度越高,聚类效果越好;
2)轮廓系数SC
式中:a(xi)为xi与同一类出力曲线间的平均距离,其值越低说明同类出力曲线相似度越高;b(xi)为xi与非同类出力曲线间的平均距离,其值越低说明不同类出力曲线差异性越大;故SC越大聚类效果越好;
3)CHI
式中:为出力数据的中心点;CHI通过计算类内紧密度与类间分离度的比值得到,其值越大意味类内紧密度越高,类间分离度越低,聚类效果越好。
相较于现有技术,本发明具有以下有益效果:本发明可以使各典型场景均具有代表性。该方法基于ISDPC-K-means聚类算法缩减产生典型场景。该方法的优点是充分考虑曲线间密度差异,准确判断聚类中心,使各典型场景与同一类处理曲线相似度高且类内差异小、类间差异大,产生的典型场景可以代表绝大多数场景;本发明对配电网大规模接入可再生能源情况下运行的安全性、可靠性、经济性的提升提供基础。
附图说明
图1为本发明中ISDPC-K-means算法的流程图。
图2为本发明聚类中心决策图。
图3为可再生能源典型场景;图3(a)为四个典型场景中光伏24小时的出力;图3(b)为四个典型场景中风电24小时的出力。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供了基于ISDPC-K-means聚类的典型场景构建方法,包括以下步骤:
步骤S1、获取光伏出力曲线和风电出力曲线并构造当日出力曲线;
步骤S2、采用ISDPC算法确定初始的聚类中心,该方法具有客观性可准确判断聚类中心;
步骤S3、基于ISDPC算法确定的初始聚类中心,用K-means算法生成K个典型出力场景。在确定初始聚类中心后,采用K-means算法对剩余出力曲线进行聚类,经过循环求解,当聚类中心不再发生变化后生成最终K个典型出力场景;
步骤S4、构建聚类算法评价指标体系,以说明该构建的典型场景的新方法具有有效性、优越性。
在本实施例中,所述步骤S2具体包括以下内容:
每条出力曲线有n=48维数据,全年共有m=365条出力曲线。首先将数据进行标准化处理,得到归一化后的出力数据:
式中xij表示第i条出力曲线的第j维的数据;
根据第i条出力曲线的第j维数据在该维数据的比重rij计算第j维数据的熵值hj和权值ωj,由各维数据的权重即可计算各出力曲线间的赋权欧氏距离。具体表述如下:
式中:d(xp,xq)为第p条出力曲线与第q条出力曲线之间的赋权欧式距离,xpj、xqj分别表示第p、q条曲线的第j维数据。
决策值γ由局部密度ρ和最小距离δ相乘得到。传统DPC通常通过选取截断距离从而计算样本的局部密度,若各样本的局部密度差异过大,则局部密度对决策值的影响会增大,在确定聚类中心时将产生较大误差。ISDPC借助3N算法改进局部密度,将样本在局部范围内与其k个近邻样本的相对密度作为其局部密度ρ′,将所有风光出力曲线的局部密度进行排序,计算第i条出力曲线的相对距离δi。若第i条出力曲线的局部密度最大,则δi设为该曲线与其他出力曲线距离的最大值;对于局部密度非最大的出力曲线,将与比其局部密度大的出力曲线的最小距离作为相对距离,相关计算公式如下:
γi=ρ′i·δi (7)
将各出力曲线的决策值由大到小排列得到新的决策值序列γ′={γ1′,γ2′,…,γm′},在决策图中依次选取γi′(1<i<m),由其对应的决策值点分别向决策值最大和最小的点引两条线段,若当i=K时两条线段与决策图拟合误差最小,则选取序列γ′前K个决策值对应的样本作为初始的聚类中心。
在本实施例中,所述步骤S4具体包括以下内容:
以以下三个指标评价所提聚类算法的聚类效果:
1)误差平方和SSE
式中:μk为第k个典型场景;mk为第k个典型场景对应的天数。SSE越小,说明类内出力曲线的相似度越高,聚类效果越好。
2)轮廓系数SC
式中:a(xi)为xi与同一类出力曲线间的平均距离,其值越低说明同类出力曲线相似度越高;b(xi)为xi与非同类出力曲线间的平均距离,其值越低说明不同类出力曲线差异性越大。故SC越大聚类效果越好。
3)CHI
式中:X为出力数据的中心点。CHI通过计算类内紧密度与类间分离度的比值得到,其值越大意味类内紧密度越高,类间分离度越低,聚类效果越好。
本实施例选择某地区风光出力数据集,进行典型场景构建,并采用SSE、SC和CHI作为评价指标,将其与传统K-means算法和改进K-means算法进行对比,以验证新方法有效性、优越性。
采用ISDPC聚类算法得到聚类中心决策图以及选取不同聚类中心数对应的拟合误差如图2所示。
由曲线可知,随着聚类中心个数的增大,拟合误差呈先下降后上升趋势。显然,当聚类中心个数取4时对应的拟合误差最小。说明在决策值为第4个大的样本之后,样本决策值的变化趋势变缓,由散点图也可验证此结论。样本的决策值越大表明其越可能被选为聚类中心,故选取前4个决策较大值作为初始聚类中心。此种选择聚类中心的方法可以有效避免肉眼观察的主观性以及不准确性。采用本文所提的ISDPC-K-means聚类算法生成的典型场景如图3所示。
以上4种典型场景出现的概率分别为30.14%,29.59%,14.79%和25.48%。各场景的差异较大且各有特点。场景1的风电出力整体较小;场景2的风电出力在一天内的变化较大;场景3的光伏出力整体较大,风电出力呈下降趋势;场景4的光伏出力整体较小,而风电出力整体较大。
为更直观的对比上述聚类方法的聚类效果,传统K-means算法和改进K-means算法的聚类个数同样取4,对比如表1所示。
表1聚类效果对比
方法 | SSE | SC | CHI |
传统K-means | 622.99 | 0.1093 | 58.07 |
改进K-means | 618.14 | 0.1240 | 59.47 |
DPC-K-means | 601.87 | 0.1092 | 58.92 |
ISDPC-K-means | 596.02 | 0.1254 | 60.68 |
改进K-means算法的评价指标均优于传统K-means算法。相较前两种算法,DPC-K-means算法各有优劣。而ISDPC-K-means聚类算法的三个评价指标均为最优,聚类效果最佳。DPC-K-means聚类算法和ISDPC-K-means聚类算法的SSE指标明显得到优化。SSE小说明各典型场景与同一类出力曲线的相似度高,则典型场景能准确描述此类场景的特征。SC和CHI大说明类内差异性小而类间差异性大,则各典型场景均具有代表性。因此,基于全年的出力场景,采用所提的ISDPC-K-means聚类算法缩减而成的典型场景可以代表绝大多数出力场景。
本实施例(1)融合ISDPC算法和K-means算法构造ISDPC-K-means算法。(2)运用ISDPC-K-means算法对风光出力生成典型场景,为配电网大规模接入可再生能源情况下运行的安全性、可靠性、经济性进一步提升提供技术支撑。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (3)
1.一种基于ISDPC-K-means聚类的典型场景构建方法,其特征在于,包括以下步骤:
步骤S1、获取光伏出力曲线和风电出力曲线并构造当日出力曲线;
步骤S2、采用ISDPC算法确定初始的聚类中心;
步骤S3、基于ISDPC算法确定的初始聚类中心,用K-means算法生成K个典型出力场景;
步骤S4、构建聚类算法评价指标体系,以评价构建的K个典型出力场景。
2.根据权利要求1所述的一种基于ISDPC-K-means聚类的典型场景构建方法,其特征在于,所述步骤S2具体实现如下:
每条出力曲线有n=48维数据,全年共有m=365条出力曲线;首先进行标准化处理,得到归一化后的出力数据:
式中xij表示第i条出力曲线的第j维的数据;
根据第i条出力曲线的第j维数据在该维数据的比重rij计算第j维数据的熵值hj和权值ωj,由各维数据的权重计算各出力曲线间的赋权欧氏距离;具体表述如下:
式中:d(xp,xq)为第p条出力曲线与第q条出力曲线之间的赋权欧式距离,xpj、xqj分别表示第p、q条曲线的第j维数据;
决策值γ由局部密度ρ和最小距离δ相乘得到;ISDPC借助3N算法改进局部密度,将样本在局部范围内与其k个近邻样本的相对密度作为其局部密度ρ′;将所有风光出力曲线的局部密度进行排序,计算第i条出力曲线的相对距离δi;若第i条出力曲线的局部密度最大,则δi设为该曲线与其他出力曲线距离的最大值;对于局部密度非最大的出力曲线,将与比其局部密度大的出力曲线的最小距离作为相对距离,相关计算公式如下:
γi=ρ′i·δi (7)
式中,γi为第i条出力曲线的决策值;将各出力曲线的决策值由大到小排列得到新的决策值序列γ′={γ1′,γ2′,…,γm′},在决策图中依次选取γi′,1<i<m,由其对应的决策值点分别向决策值最大和最小的点引两条线段,若当i=K时两条线段与决策图拟合误差最小,则选取序列γ′前K个决策值对应的样本作为初始的聚类中心。
3.根据权利要求2所述的一种基于ISDPC-K-means聚类的典型场景构建方法,其特征在于,所述步骤S4具体实现如下:
以以下三个指标评价聚类算法的聚类效果:
1)误差平方和SSE
式中:μk为第k个典型出力场景;mk为第k个典型场出力景对应的天数;SSE越小,说明类内出力曲线的相似度越高,聚类效果越好;
2)轮廓系数SC
式中:a(xi)为xi与同一类出力曲线间的平均距离,其值越低说明同类出力曲线相似度越高;b(xi)为xi与非同类出力曲线间的平均距离,其值越低说明不同类出力曲线差异性越大;故SC越大聚类效果越好;
3)CHI
式中:为出力数据的中心点;CHI通过计算类内紧密度与类间分离度的比值得到,其值越大意味类内紧密度越高,类间分离度越低,聚类效果越好。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310426331.0A CN116451906A (zh) | 2023-04-20 | 2023-04-20 | 一种基于ISDPC-K-means聚类的典型场景构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310426331.0A CN116451906A (zh) | 2023-04-20 | 2023-04-20 | 一种基于ISDPC-K-means聚类的典型场景构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116451906A true CN116451906A (zh) | 2023-07-18 |
Family
ID=87135369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310426331.0A Pending CN116451906A (zh) | 2023-04-20 | 2023-04-20 | 一种基于ISDPC-K-means聚类的典型场景构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116451906A (zh) |
-
2023
- 2023-04-20 CN CN202310426331.0A patent/CN116451906A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107730044A (zh) | 一种可再生能源发电和负荷的混合预测方法 | |
CN110111003A (zh) | 一种基于改进fcm聚类算法的新能源典型场景构建方法 | |
CN107528350B (zh) | 一种适应中长期电源规划的风电出力典型场景生成方法 | |
WO2023201552A1 (en) | County-wide photovoltaic prediction method based on cluster division and data enhancement | |
CN110046801B (zh) | 一种配电网电力系统的典型场景生成方法 | |
CN111062539B (zh) | 基于次级用电量特性聚类分析的总电量预测方法 | |
CN112149890A (zh) | 基于用户用能标签的综合能源负荷预测方法及系统 | |
CN115688982B (zh) | 基于wgan和鲸鱼优化算法的楼宇光伏数据补全方法 | |
CN117200181A (zh) | 一种基于DBSCAN-EM-GMM和Web技术的光伏发电量预测方法 | |
CN112633565A (zh) | 一种光伏功率集合区间预测方法 | |
CN116629428A (zh) | 一种基于特征选择和SSA-BiLSTM的建筑能耗预测方法 | |
CN111091301A (zh) | 一种省级电网可持续发展策略的优选方法 | |
CN117910668A (zh) | 一种考虑多不确定性因素的电力系统演化路径规划方法 | |
CN113780686A (zh) | 一种面向分布式电源的虚拟电厂运行方案优化方法 | |
CN108694475A (zh) | 基于混合模型的短时间尺度光伏电池发电量预测方法 | |
CN114004393B (zh) | 配电网-天然气联合系统双层多时间尺度运行优化方法 | |
CN116167465A (zh) | 基于多变量时间序列集成学习的太阳辐照度预测方法 | |
CN114944645B (zh) | 一种计及资源时空相关性的新能源发电集群划分方法 | |
CN116451906A (zh) | 一种基于ISDPC-K-means聚类的典型场景构建方法 | |
CN113852069B (zh) | 一种含源荷不确定性的地区电网经济调度优化方法及系统 | |
CN115660032A (zh) | 基于BI-LSTM神经网络融合attention机制的楼宇屋顶光伏功率预测方法 | |
CN112712213A (zh) | 一种集中空调住宅深度迁移学习能耗预测方法及系统 | |
CN113961614B (zh) | 基于相似日选取和分类分时误差修正的光伏功率预测方法 | |
CN113792778B (zh) | 一种风电场分区及其出力相关系数计算方法和系统 | |
Wang et al. | Application of a class of density peak clustering algorithm in short-term smart grid |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |