CN110321799A - 一种基于sbr和平均类间距离的场景数选择方法 - Google Patents
一种基于sbr和平均类间距离的场景数选择方法 Download PDFInfo
- Publication number
- CN110321799A CN110321799A CN201910482320.8A CN201910482320A CN110321799A CN 110321799 A CN110321799 A CN 110321799A CN 201910482320 A CN201910482320 A CN 201910482320A CN 110321799 A CN110321799 A CN 110321799A
- Authority
- CN
- China
- Prior art keywords
- scene
- probability
- average
- sbr
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/35—Categorising the entire scene, e.g. birthday party or wedding scene
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于SBR和平均类间距离的场景数选择方法,包括:步骤1、计算初始场景集中每两个场景组合之间的距离;步骤2、采用SBR算法进行多次场景缩减,进行场景缩减操作时满足以下条件:场景缩减前后场景集之间的概率距离最小;经场景缩减后得到的场景概率等于自身概率加上其他删除的场景对应概率之和;步骤3、得到目标场景数及其对应的概率;步骤4、根据场景概率矩阵进行场景初筛;步骤5、计算初筛后场景间的平均类间距离;步骤6、绘制提取场景数与平均类间距离之间的关系曲线,通过关系曲线来确定合适的场景数。本发明首次在SBR算法中提出平均类间距离的概念和计算方法,并基于场景出现概率辅助确定最终提取场景数。
Description
技术领域
本发明涉及聚类分析领域,尤其涉及一种基于SBR和平均类间距离的场景数选择方法。
背景技术
聚类分析法主要可分为传统聚类分析法和人工智能聚类分析法两大类。传统聚类分析法主要包括划分聚类和层次聚类,层次聚类弥补了划分聚类的部分缺点,能够识别不同形状的时间序列。人工智能聚类算法主要利用了机器模拟人脑学习功能,代表方法包括:智能搜索聚类、并行聚类、分布式聚类算法等方法。人工智能算法很大程度上提高了聚类速度以及灵活性,但容易产生聚类结果不稳定,过度学习等问题。随着大数据时代的到来,聚类分析法被广泛应用于医疗、海洋以及电力系统等方面。总体看来,大多数聚类分析法主要采用特征变换处理原始数据,但基于特征选择的聚类分析法并不多。其中,同步回代缩减(Simultaneous Backward Reduction,SBR)是一种可以从大量场景中提取典型场景的分析方法。
但是,SBR法在应用时,其提取场景数的选择缺乏一定客观性。因此,提出一种基于SBR和平均类间距离的场景数选择方法,对于完善和发展SBR 法,具有比较重要的意义,并且可为电力部门各机组出力以及用户负荷过程典型场景提取提供技术支撑。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于SBR 和平均类间距离的场景数选择方法。
本发明解决其技术问题所采用的技术方案是:
本发明提供一种基于SBR和平均类间距离的场景数选择方法,该方法包括以下步骤:
步骤1、获取初始场景集数据,计算初始场景集中每两个场景组合之间的距离;
步骤2、采用SBR算法进行多次场景缩减,进行场景缩减操作时满足以下条件:场景缩减前后场景集之间的概率距离最小;经场景缩减后得到的场景概率等于自身概率加上其他删除的场景对应概率之和;
步骤3、进行多次场景缩减后,得到目标场景数及其对应的概率;
步骤4、根据场景概率矩阵进行场景初筛;
步骤5、计算初筛后场景间的平均类间距离;
步骤6、绘制提取场景数与平均类间距离之间的关系曲线,通过关系曲线来确定合适的场景数。
进一步地,本发明的步骤1中的具体方法为:
记N天出力过程线初始场景集为X=[X1,X2,...,XN]',其中第i个场景为 Xi=[Xi1,Xi2,...,XiT],i=1,2,3…N;采样时间节点为t,t=1,2,3…T;初始场景对应概率为P=[P1,P2,...,PN]',删除的场景为Y,删除场景数为N-M,最终得到的场景为X-Y;
计算初始场景集中每两个场景组合之间的距离公式为:
进一步地,本发明的步骤2的具体方法为:
采用SBR算法进行第k次场景缩减,k=1,2,3…N-M;
为了确定合适的场景集X-Y使场景集X删除场景集Y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离Dl最小,其计算公式为:
其中,Pi表示初始场景Xi对应的概率;
为保证场景缩减后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和;其公式为:
其中,表示第k次场景缩减后场景Xj更新后的概率,其中:
第k次场景缩减得到:
将最小的对应的场景lk从场景集合X-Yk-1中删除,并入已删除的场景 Yk-1中,得到Yk=Yk-1∪{lk};根据场景缩减原则将场景lk对应的概率加到场景集合X-Yk-1中与场景lk距离最近的场景对应概率上;再次计算更新后场景集 X-Yk中每两个场景组合之间的距离。
进一步地,本发明的步骤3的具体方法为:
重复步骤2直至经过N-M次场景缩减后,最终得到M个场景及其对应的概率;
场景Z及其对应的概率P’为:
P'=[P1',P2',...,PM']'。
进一步地,本发明的步骤4的具体方法为:
根据步骤3得到的场景Z及其对应的概率P’,若M个场景概率中某一场景对应概率低于0.05,则忽略该场景,场景提取数变为M-1,依次类推直至剩下的场景概率均大于0.05,最终得到满足条件的场景Z’以及对应场景概率P”;
P″=[P1″,P2″,...,PM′″]'。
进一步地,本发明的步骤5中的具体方法为:
计算M’个场景间的平均类间距离W(M’),其公式为:
其中,
aef表示Z’中任意两个场景Z’e和Z’f之间的欧式距离,共有种组合方式。
进一步地,本发明的步骤6的具体方法为:
以M’为横坐标,W(M’)为纵坐标作出M’与W(M’)之间的关系图,选取最大的W(M’)对应的M’作为合适的场景数。
本发明产生的有益效果是:本发明的基于SBR和平均类间距离的场景数选择方法,首次将平均类间距离这一指标应用到SBR场景数选择上,其意义在于:平均类间距离W(M’)越大,说明经过场景缩减后得到的场景集合之间的平均距离越大,差异性就越大,因而得到的结果更具有代表性;同时,本方法还采用场景出现概率来辅助确定最终缩减的场景数,避免最终场景集中因出现较多小概率场景造成对应平均类间距离过大的情况。本方法从相对客观角度改进了SBR算法,使得在实际场景缩减中场景缩减个数的确定更有依据,有助于SBR法的推广使用。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的方法流程图;
图2是本发明实施例的以某电网的1月风电出力数据经SBR法缩减后得到效果图;
图3是本发明实施例的1月份提取场景数与平均类间距离间的关系曲线。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明实施例包括以下步骤:
步骤1,计算初始场景集中每两个场景组合之间的距离
本发明以某电网2018年风电出力逐日24点资料为实例,事先对数据进行归一化处理,使得所有数据均在[0,1]区间内,取1月份31天(即31个场景) 数据进行计算说明。记N天出力过程线初始场景集为X=[X1,X2,...,XN]',其中第i(i=1,2,3…N)个场景为Xi=[Xi1,Xi2,...,XiT],采样时间节点为t(t=1,2,3… T),初始场景对应概率为P=[P1,P2,...,PN]',删除的场景为Y,删除场景数为N-M,最终得到的场景为X-Y。
计算初始场景集中每两个场景组合之间的距离公式如下所示:
步骤2,采用SBR算法进行第k(k=1,2,3…N-M)次场景缩减,实现如下,
为了确定合适的场景集X-Y使场景集X删除场景集Y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离Dl最小,用公式表示如下:
式中,Pi表示初始场景Xi对应的概率;
为保证场景缩减前后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和。用公式表示如下:
式中,表示第k次场景缩减后场景Xj更新后的概率,其中
第k(k=1,2,3…N-M)次缩减得到:
将最小的对应的场景lk从场景集合X-Yk-1中删除,并入已删除的场景 Yk-1中,得到Yk=Yk-1∪{lk}。根据场景缩减原则将场景lk对应的概率加到场景集合X-Yk-1中与场景lk距离最近的场景对应概率上。再次计算更新后场景集 X-Yk中每两个场景组合之间的距离。
步骤3,重复步骤2直至经过N-M次场景缩减后,最终得到M个场景及其对应的概率,实现如下,
场景数可以人为假定,不失一般性,统一用M(M=1,2,3…)表示。得到 M个场景及其对应的概率如下:
P'=[P1',P2',...,PM']'
在本实施例计算时,已知矩阵X中N=31,采用步骤1计算31个场景中两两之间的距离,假定场景缩减后得到的场景数M(M=1,2,3,…,15),重复步骤2,得到矩阵Z,当M取不同值时,对应不同的矩阵Z。
步骤4,根据场景概率矩阵进行场景初筛,实现如下,
根据步骤3得到的场景Z及其对应的概率P’,若M个场景概率中某一场景对应概率低于0.05,则认为这样的小概率事件可以忽略,场景提取数变为 M-1,依次类推直至剩下的场景概率均大于0.05,最终得到满足条件的场景Z’以及对应场景概率P”。
P″=[P1″,P2″,...,PM′″]'
步骤5,计算M’个场景间的平均类间距离W(M’),实现如下,
其中,
式中,aef表示Z’中任意两个场景Z’e和Z’f(e,f=1,2,3,…,M’)之间的距离,共有种组合方式。
步骤6,确定提取场景数,实现如下,
以M’为横坐标,W(M’)为纵坐标作出M’与W(M’)之间的关系图,选取最大的W(M’)对应的M’作为合适的场景数。
采用SBR法提取1月份风电出力场景时,得到的提取过程如图2所示,根据步骤六得到1月份提取场景数与平均类间距离间的关系曲线,见图3所示,可以看出当提取场景数为2,3时,平均类间距离增加比较缓慢,而当提取场景数为4时,平均类间距离突然增加,随后突然降低,说明提取的四个场景之间差异最大。基于图3,对1月份提取场景数为4比较合适,本实施例选择提取场景数为4,最终结果如图2所示。
本发明主要用于聚类分析领域,是对SBR方法的一种完善。本发明首次将平均类间距离这一指标应用到SBR场景数选择上,其意义在于:平均类间距离W(M’)越大,说明经过场景缩减后得到的场景集合之间的平均距离越大,差异性就越大,因而得到的结果更具有代表性;同时,本方法还采用场景出现概率来辅助确定最终缩减的场景数,避免最终场景集中因出现较多小概率场景造成对应平均类间距离过大的情况。本方法从相对客观角度改进了SBR算法,使得在实际场景缩减中场景缩减个数的确定更有依据,有助于SBR法的推广使用。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (7)
1.一种基于SBR和平均类间距离的场景数选择方法,其特征在于,该方法包括以下步骤:
步骤1、获取初始场景集数据,计算初始场景集中每两个场景组合之间的距离;
步骤2、采用SBR算法进行多次场景缩减,进行场景缩减操作时满足以下条件:场景缩减前后场景集之间的概率距离最小;经场景缩减后得到的场景概率等于自身概率加上其他删除的场景对应概率之和;
步骤3、进行多次场景缩减后,得到目标场景数及其对应的概率;
步骤4、根据场景概率矩阵进行场景初筛;
步骤5、计算初筛后场景间的平均类间距离;
步骤6、绘制提取场景数与平均类间距离之间的关系曲线,通过关系曲线来确定合适的场景数。
2.根据权利要求1所述的基于SBR和平均类间距离的场景数选择方法,其特征在于,步骤1中的具体方法为:
记N天出力过程线初始场景集为X=[X1,X2,...,XN]',其中第i个场景为Xi=[Xi1,Xi2,...,XiT],i=1,2,3…N;采样时间节点为t,t=1,2,3…T;初始场景对应概率为P=[P1,P2,...,PN]',删除的场景为Y,删除场景数为N-M,最终得到的场景为X-Y;
计算初始场景集中每两个场景组合之间的距离公式为:
3.根据权利要求2所述的基于SBR和平均类间距离的场景数选择方法,其特征在于,步骤2的具体方法为:
采用SBR算法进行第k次场景缩减,k=1,2,3…N-M;
为了确定合适的场景集X-Y使场景集X删除场景集Y后缩减效果最佳,要求场景缩减前后场景集之间的概率距离Dl最小,其计算公式为:
其中,Pi表示初始场景Xi对应的概率;
为保证场景缩减后,所有场景的概率之和仍为1,要求经场景缩减后得到的场景概率等于自身概率加上其他因距离接近而删除的场景对应概率之和;其公式为:
其中,表示第k次场景缩减后场景Xj更新后的概率,其中:
第k次场景缩减得到:
将最小的对应的场景lk从场景集合X-Yk-1中删除,并入已删除的场景Yk-1中,得到Yk=Yk-1∪{lk};根据场景缩减原则将场景lk对应的概率加到场景集合X-Yk-1中与场景lk距离最近的场景对应概率上;再次计算更新后场景集X-Yk中每两个场景组合之间的距离。
4.根据权利要求3所述的基于SBR和平均类间距离的场景数选择方法,其特征在于,步骤3的具体方法为:
重复步骤2直至经过N-M次场景缩减后,最终得到M个场景及其对应的概率;
场景Z及其对应的概率P’为:
P'=[P1',P2',...,PM']'。
5.根据权利要求4所述的基于SBR和平均类间距离的场景数选择方法,其特征在于,步骤4的具体方法为:
根据步骤3得到的场景Z及其对应的概率P’,若M个场景概率中某一场景对应概率低于0.05,则忽略该场景,场景提取数变为M-1,依次类推直至剩下的场景概率均大于0.05,最终得到满足条件的场景Z’以及对应场景概率P”;
P”=[P1”,P2”,...,PM”']'。
6.根据权利要求5所述的基于SBR和平均类间距离的场景数选择方法,其特征在于,步骤5中的具体方法为:
计算M’个场景间的平均类间距离W(M’),其公式为:
其中,
aef表示Z’中任意两个场景Z’e和Z’f之间的欧式距离,共有种组合方式。
7.根据权利要求6所述的基于SBR和平均类间距离的场景数选择方法,其特征在于,步骤6的具体方法为:
以M’为横坐标,W(M’)为纵坐标作出M’与W(M’)之间的关系图,选取最大的W(M’)对应的M’作为合适的场景数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910482320.8A CN110321799B (zh) | 2019-06-04 | 2019-06-04 | 一种基于sbr和平均类间距离的场景数选择方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910482320.8A CN110321799B (zh) | 2019-06-04 | 2019-06-04 | 一种基于sbr和平均类间距离的场景数选择方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110321799A true CN110321799A (zh) | 2019-10-11 |
CN110321799B CN110321799B (zh) | 2022-11-18 |
Family
ID=68119419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910482320.8A Active CN110321799B (zh) | 2019-06-04 | 2019-06-04 | 一种基于sbr和平均类间距离的场景数选择方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110321799B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291326A (zh) * | 2020-02-06 | 2020-06-16 | 武汉大学 | 一种结合类内相似度和类间差异度的聚类有效性指标建立方法 |
CN111340330A (zh) * | 2020-02-06 | 2020-06-26 | 国家电网公司华中分部 | 一种基于相关性-量-形三维距离的同步回代缩减方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070245242A1 (en) * | 2006-04-12 | 2007-10-18 | Yagnik Jay N | Method and apparatus for automatically summarizing video |
CN106997407A (zh) * | 2016-12-29 | 2017-08-01 | 武汉大学 | 基于趋势拟合的风资源场景缩减方法 |
CN109558897A (zh) * | 2018-11-08 | 2019-04-02 | 华北电力大学 | 一种基于数据挖掘的电网规划多场景提取方法 |
-
2019
- 2019-06-04 CN CN201910482320.8A patent/CN110321799B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070245242A1 (en) * | 2006-04-12 | 2007-10-18 | Yagnik Jay N | Method and apparatus for automatically summarizing video |
CN106997407A (zh) * | 2016-12-29 | 2017-08-01 | 武汉大学 | 基于趋势拟合的风资源场景缩减方法 |
CN109558897A (zh) * | 2018-11-08 | 2019-04-02 | 华北电力大学 | 一种基于数据挖掘的电网规划多场景提取方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111291326A (zh) * | 2020-02-06 | 2020-06-16 | 武汉大学 | 一种结合类内相似度和类间差异度的聚类有效性指标建立方法 |
CN111340330A (zh) * | 2020-02-06 | 2020-06-26 | 国家电网公司华中分部 | 一种基于相关性-量-形三维距离的同步回代缩减方法 |
CN111291326B (zh) * | 2020-02-06 | 2022-05-17 | 武汉大学 | 一种结合类内相似度和类间差异度的聚类有效性指标建立方法 |
CN111340330B (zh) * | 2020-02-06 | 2022-07-19 | 国家电网公司华中分部 | 一种基于相关性-量-形三维距离的同步回代缩减方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110321799B (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108647577B (zh) | 一种自适应难例挖掘的行人重识别方法与系统 | |
CN110321813A (zh) | 基于行人分割的跨域行人重识别方法 | |
Sallam et al. | An improved gaining-sharing knowledge algorithm for parameter extraction of photovoltaic models | |
CN102364498B (zh) | 一种基于多标签的图像识别方法 | |
CN111062278B (zh) | 基于改进残差网络的异常行为识别方法 | |
CN114022432A (zh) | 基于改进的yolov5的绝缘子缺陷检测方法 | |
CN110321799A (zh) | 一种基于sbr和平均类间距离的场景数选择方法 | |
CN110992365B (zh) | 一种基于图像语义分割的损失函数及其设计方法 | |
CN111339847A (zh) | 一种基于图卷积神经网络的人脸情绪识别方法 | |
CN110188359A (zh) | 一种文本实体抽取方法 | |
CN111178261B (zh) | 一种基于视频编码技术的人脸检测加速方法 | |
CN104008177B (zh) | 面向图像语义标注的规则库结构优化与生成方法及系统 | |
CN113825012B (zh) | 视频数据处理方法和计算机设备 | |
Gao et al. | 3D skeleton-based video action recognition by graph convolution network | |
CN115186806A (zh) | 一种支持跨节点自动微分的分布式图神经网络训练方法 | |
CN107590225A (zh) | 一种基于分布式数据挖掘算法的可视化管理系统 | |
CN111126155A (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
US20060106816A1 (en) | Method of grouping images from a video sequence | |
CN114239237A (zh) | 一种支持数字孪生的配电网仿真场景生成系统与方法 | |
CN109492055A (zh) | 一种基于cim模型建立电网大数据仓库的方法 | |
CN110766072A (zh) | 一种基于结构相似性的计算图进化ai模型自动生成方法 | |
CN116433679A (zh) | 一种基于空间位置结构先验的内耳迷路多级标注伪标签生成与分割方法 | |
CN105447836A (zh) | 一种耦合聚类中心约束项的非局部稀疏表示图像去噪方法 | |
CN112508135B (zh) | 模型训练方法、行人属性预测方法、装置及设备 | |
CN111241054B (zh) | 基于虚拟数据库的电力通信网络异地异构数据源整合方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |