CN113656937A - 用于识别电力设备拓扑的方法、装置、存储介质及处理器 - Google Patents

用于识别电力设备拓扑的方法、装置、存储介质及处理器 Download PDF

Info

Publication number
CN113656937A
CN113656937A CN202110763568.9A CN202110763568A CN113656937A CN 113656937 A CN113656937 A CN 113656937A CN 202110763568 A CN202110763568 A CN 202110763568A CN 113656937 A CN113656937 A CN 113656937A
Authority
CN
China
Prior art keywords
clustering
electrical data
initial
center
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110763568.9A
Other languages
English (en)
Inventor
程显明
霍超
尹志斌
甄岩
陈文彬
郑利斌
于华东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Information and Telecommunication Co Ltd
Beijing Smartchip Microelectronics Technology Co Ltd
Original Assignee
State Grid Information and Telecommunication Co Ltd
Beijing Smartchip Microelectronics Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Information and Telecommunication Co Ltd, Beijing Smartchip Microelectronics Technology Co Ltd filed Critical State Grid Information and Telecommunication Co Ltd
Priority to CN202110763568.9A priority Critical patent/CN113656937A/zh
Publication of CN113656937A publication Critical patent/CN113656937A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2113/00Details relating to the application field
    • G06F2113/04Power grid distribution networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Algebra (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供一种用于识别电力设备拓扑的方法、装置、存储介质及处理器,属于配电网领域。上述方法包括:获取开关设备的电气数据;确定电气数据的密度,其中密度为电气数据在预设邻域半径内的电气数据的数量;根据密度确定高密度集,其中高密度集中的电气数据的密度达到预设阈值;从高密度集中选择初始聚类中心;根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量;以及根据最终的聚类数量得到开关设备连接的电力设备之间的拓扑关系。采用本发明的方案可以提高拓扑识别的效率。

Description

用于识别电力设备拓扑的方法、装置、存储介质及处理器
技术领域
本发明涉及配电网技术领域,具体地涉及一种用于识别电力设备拓扑的方法、装置、存储介质及处理器。
背景技术
配电网拓扑是对配电网设备、线路以及连接关系的完整描述,是实现配电网智能化应用的重要基础,完整、一致、准确、及时、可靠的配电网拓扑模型及相关数据能够为配电网调度运行、检修、供电服务提升提供关键支撑。在低压台区,用户拓扑网络规划没有统一的标准,许多台区缺乏管辖用户信息,更不清楚用户点之间的拓扑关系。台区用户数量众多、台区内通常拓扑结构、线路复杂,配变台区线路分支多,供电用户范围广,缺乏精确拓扑信息记录,电网拓扑结构的获取一直是供电服务中的难题。
现有的用于识别电力设备拓扑的方法包括:采用人工在地理信息系统或生产管理系统中进行维护配电网拓扑模型,维护人员拉闸观察和人工描绘的方式记录台区结构。然而,依靠人工手动维护配电网拓扑模型的工作量较大,存在拓扑识别效率低下的问题。
发明内容
本发明的目的是提供一种用于识别电力设备拓扑的方法、装置、存储介质及处理器,以解决现有的用于识别电力设备拓扑的方法存在拓扑识别效率低下的问题。
为了实现上述目的,本发明第一方面提供一种用于识别电力设备拓扑的方法,包括:
获取开关设备的电气数据;
确定电气数据的密度,其中密度为电气数据在预设邻域半径内的电气数据的数量;
根据密度确定高密度集,其中高密度集中的电气数据的密度达到预设阈值;
从高密度集中选择初始聚类中心;
根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量;以及
根据最终的聚类数量得到开关设备连接的电力设备之间的拓扑关系。
在本发明实施例中,根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量,包括:根据选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数;将当前聚类指数与上一次聚类指数进行比较;在当前聚类指数小于上一次聚类指数的情况下,将与上一次聚类指数对应的初始聚类中心的数量作为最终的聚类数量。
在本发明实施例中,选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量,还包括:在当前聚类指数不小于上一次聚类指数的情况下,从高密度集中选择下一个初始聚类中心;根据所有选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数。
在本发明实施例中,初始聚类中心包括第一初始聚类中心和第二初始聚类中心;从高密度集中选择初始聚类中心,包括:确定高密度集中密度最大的电气数据为第一初始聚类中心;确定高密度集中与第一初始聚类中心距离最远的电气数据为第二初始聚类中心。
在本发明实施例中,聚类指数包括第一聚类指数;根据选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数,包括:确定除第一初始聚类中心和第二初始聚类中心之外的电气数据分别与第一初始聚类中心和第二初始聚类中心的距离;根据距离对除第一初始聚类中心和第二初始聚类中心之外的电气数据进行分类,以得到第一簇类和第二簇类,其中,第一簇类包括第一初始聚类中心,第二簇类包括第二初始聚类中心;根据距离、第一初始聚类中心以及第二初始聚类中心确定第一聚类指数。
在本发明实施例中,初始聚类中心还包括第三初始聚类中心;从高密度集中选择初始聚类中心,还包括:确定高密度集中与第一初始聚类中心和第二初始聚类中心的距离之和最大的电气数据为第三初始聚类中心;聚类指数还包括第二聚类指数;根据选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数,包括:确定除第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之外的电气数据分别与第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之间的距离;根据距离对除第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之外的电气数据进行分类,以得到第一簇类、第二簇类以及第三簇类,其中,第一簇类包括第一初始聚类中心,第二簇类包括第二初始聚类中心,第三簇类包括第三初始聚类中心;根据距离、第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心确定第二聚类指数。
在本发明实施例中,从高密度集中选择下一个初始聚类中心包括:确定高密度集中与选择的各初始聚类中心的距离之和最大的电气数据为下一个初始聚类中心。
在本发明实施例中,根据密度确定高密度集包括:根据以下公式(1)确定高密度集:
D={z1,z2,…zm|zi∈X,Density(zi)≥M} (1)
其中,D为高密度集,M为预设阈值,X为开关设备的电气数据的集合,zi为X中达到预设阈值的电气数据,Density(zi)为电气数据zi的密度,z1,z2,…zm为高密度集D中的电气数据,m是高密度集的样本个数。
在本发明实施例中,根据距离、第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心确定第二聚类指数包括:根据以下公式(2)确定第二聚类指数:
Figure BDA0003150846280000041
其中,n表示初始聚类中心的个数,ci,cj为初始聚类中心,d(x,ci)表示簇类中每个对象对其所属簇类的初始聚类中心的距离,d(ci,cj)表示初始聚类中心之间的距离,K为此时簇类的个数(其中K≤n)。
在本发明实施例中,在确定电气数据的密度之前,还包括:对电气数据进行预处理,以得到预处理后的电气数据。
在本发明实施例中,对电气数据进行预处理,以得到预处理后的电气数据,包括:对电气数据进行数据筛选,以得到筛选后的电气数据。
在本发明实施例中,方法还包括:对筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据。
在本发明实施例中,对筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据,包括:确定筛选后的电气数据的平均值;将筛选后的电气数据减去平均值,以得到去中心化处理后的电气数据。
在本发明实施例中,确定筛选后的电气数据的平均值包括:根据以下公式(3)确定筛选后的电气数据的平均值:
Figure BDA0003150846280000042
其中,B为数据采集的总次数,yAav为第A个开关设备进行B次数据采集后得到的筛选后的电气数据的平均值,yA(tB)为第A个开关设备在第B次数据采集得到的筛选后的电气数据。
在本发明实施例中,将筛选后的电气数据减去平均值,以得到去中心化处理后的电气数据,包括:根据以下公式(4)计算得到去中心化处理后的电气数据:
Figure BDA0003150846280000051
其中,yA(t)为去中心化处理后的第A个开关设备的电气数据,yAav为第A个开关设备进行B次数据采集后得到的筛选后的电气数据的平均值,yA(tB)为第A个开关设备在第B次数据采集得到的筛选后的电气数据。
本发明第二方面提供一种处理器,被配置成执行根据上述的用于识别电力设备拓扑的方法。
本发明第三方面提供一种用于识别电力设备拓扑的装置,装置包括:数据采集设备,用于采集开关设备的电气数据;以及根据上述的处理器。
本发明第四方面提供一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得处理器执行根据上述的用于识别电力设备拓扑的方法。
上述技术方案,通过获取开关设备的电气数据,并确定电气数据的密度,从而根据密度确定高密度集,从高密度集中选择初始聚类中心,根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量,进而根据最终的聚类数量得到开关设备连接的电力设备之间的拓扑关系。上述方法减少了人工维护模型的工作量,不同于现有的聚类算法,根据电气数据的密度信息确定初始聚类中心,去除了现有的聚类算法选取初始聚类中心的随机性,使聚类结果更加稳定,且基于密度选择初始聚类中心能有效避免孤立点对聚类结果的影响,不会形成局部最优解的情况,提高了拓扑识别的效率。
本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明实施例,但并不构成对本发明实施例的限制。在附图中:
图1示意性示出了本发明一实施例中用于识别电力设备拓扑的方法的流程示意图;
图2示意性示出了本发明一实施例中根据选择的初始聚类中心对电气数据进行聚类的方法的流程示意图;
图3示意性示出了本发明一实施例中的改进型k-means算法步骤的流程示意图;
图4示意性示出了本发明一实施例中用于识别电力设备拓扑的装置的结构框图。
具体实施方式
以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明实施例,并不用于限制本发明实施例。
配电网拓扑是对配电网设备、线路以及连接关系的完整描述,是实现配电网智能化应用的重要基础,完整、一致、准确、及时、可靠的配电网拓扑模型及相关数据能够为配电网调度运行、检修、供电服务提升提供关键支撑。在低压台区,用户拓扑网络规划没有统一的标准,许多台区缺乏管辖用户信息,更不清楚用户点之间的拓扑关系。台区用户数量众多、台区内通常拓扑结构、线路复杂,配变台区线路分支多,供电用户范围广,缺乏精确拓扑信息记录,电网拓扑结构的获取一直是供电服务中的难题。
目前常见的实现低压配电网拓扑识别的方法有:(1)采用人工在地理信息系统或生产管理系统中进行维护配电网拓扑模型,维护人员拉闸观察和人工描绘的方式记录台区结构;(2)低压线路电力线载波通信技术,包括窄带电力线载波或宽带电力线载波,通过用电信息采集系统的集中器和采集器实现载波信号的发送和回传获得简单的拓扑关系。该方法的特点是简单易行,但是存在传送死区,受配电台区负载影响大;(3)在低压配电线路上,注入较大功率的工频畸变信号,用移动采集设备在用电设备或电能计量设备处测量注入的工频信号。该方法的优点是准确性较高,但是现场测试接线复杂,效率低,还存在一定的安全隐患;(4)将电阻、电感、电容等抽象化,建立线性方程组来描述电力网络中的支路电气量,运用只由点和线建立的若干复杂关联表来代替原电网。当电网拓扑发生变化时,通过修改关联表来跟踪拓扑结构。
由于配电网规模大、设备数量多、结构复杂,依靠人工手动维护配电网拓扑模型工作量巨大、模型信息直观性差,难以保证配电网拓扑模型的完整性及正确性。信道干扰噪声大、线路的长度及分支对通信信道的通信质量有较大影响,导致基于载波通信技术的识别方式准确率较低,存在配电网拓扑模型质量不高、拓扑模型不完整及连通混乱、模型变化无法感知、一致性无法保证等问题。
现有技术中,聚类算法(例如,k-means算法)属于聚类技术中的一种基本的划分方法。k-means算法首先任意从n个数据中选择k个作为初始的簇中心,分别计算剩余的n-k个数据到这些聚类中心点的距离,将其划分到最近的簇,然后对簇中距离平均值进行计算,作为新的簇中心,重新将n个数据按照欧式距离划分到最近的簇,直到簇的中心不再变化因此,传统的k-means算法的关键是簇初始中心的选择和k值的确定,初始聚类中心随机选取,容易选到噪声数据和孤立点,使算法的迭代次数增多,算法的时间性能变差,另外,受噪声数据和孤立点的影响算法还容易陷入局部极值。
因此,为了解决上述问题,图1示意性示出了本发明一实施例中用于识别电力设备拓扑的方法的流程示意图。如图1所示,在本发明实施例中,提供了一种用于识别电力设备拓扑的方法,以该方法应用于处理器为例进行说明,该方法可以包括以下步骤:
步骤S102,获取开关设备的电气数据。
可以理解,电气数据可以包括开关设备的电流、功率、电流谐波等电气数据中的至少一种数据,具体可以获取通过数据采集设备或者采集终端采集的电气数据。数据采集设备或者采集终端可以包括但不限于应用于低压采集设备,例如台区融合终端,模组化集中器等采集设备。开关设备与电力设备电连接,数据采集设备或者采集终端可以通过采集开关设备的电气数据从而获取到与开关设备连接的电力设备之间的拓扑关系,拓扑关系例如低压台区用户之间的从属关系及线路的分支情况。
具体地,处理器可以获取数据采集设备或者采集终端采集到的开关设备的电气数据,进一步地,数据采集的时间可以是基于预设的间隔时间进行采集,例如每隔15分钟或者30分钟采集一次开关设备的电气数据,从而获取到开关设备的电气数据序列。
在一些实施例中,数据采集设备或者采集终端进行数据采集的周期可以设置成一个月或者三个月,即数据采集设备或者采集终端可以采集开关设备一个月或者三个月的电气数据。
步骤S104,确定电气数据的密度,密度为电气数据在预设邻域半径内的电气数据的数量。
可以理解,密度的定义可以为:xi为样本集中的任何对象,将它作为中心,δ为预设邻域半径,在其δ内的对象个数则是对象xi的密度:
Density(xi)={xj∈X|d(xi,xj)≤δ} (1)
xj为样本集中与xi的距离小于或等于预设邻域半径的其他对象。
预设邻域半径的定义可以为:
Figure BDA0003150846280000091
n可以为集合X中的样本数,0<δ≤1。
具体地,处理器可以基于预先确定的预设邻域半径,通过以上公式确定各电气数据的密度信息。
步骤S106,根据密度确定高密度集,高密度集中的电气数据的密度达到预设阈值。
可以理解,在一个实施例中,高密度集的定义可以为:设定预设阈值为参数M,样本密度不少于预设阈值M的对象集合就是高密度集,m是高密度集的样本个数。
D={z1,z2,…zm|zi∈X,Density(zi)≥M} (3)
其中,D为高密度集,X为开关设备的电气数据的集合,zi为X中达到预设阈值的电气数据,Density(zi)为电气数据zi的密度,z1,z2,…zm为高密度集D中的电气数据。
具体地,处理器可以基于预设阈值,确定电气数据中的密度不小于预设阈值的电气数据的集合为高密度集,例如样本集中有100个电气数据,其中密度达到(即大于或者等于)预设阈值的电气数据有30个,则该30个电气数据可以组成高密度集。
步骤S108,从高密度集中选择初始聚类中心。
可以理解,初始聚类中心为每个聚类中数据对象的中心对象。
具体地,处理器在确定了高密度集之后,可以采用预先确定的规则或者算法从高密度集中选择并确定初始聚类中心。
步骤S110,根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量。
可以理解,最终的聚类数量为通过上述步骤确定的初始聚类中心对电气数据进行聚类后确定的最佳的聚类数。
具体地,处理器在确定了初始聚类中心后,可以根据其他电气数据与初始聚类中心的距离对电气数据进行分类,从而得到最终的聚类数量。
步骤S112,根据最终的聚类数量得到开关设备连接的电力设备之间的拓扑关系。
可以理解,拓扑关系是将各种物体的位置表示成抽象位置,可以指图形元素之间相互空间上的连接、邻接关系,并不考虑具体位置,在网络中,拓扑形象地描述了网络的安排和配置,包括各种结点和结点的相互关系,例如低压台区用户之间的从属关系及线路的分支情况。
具体地,在确定了最终的聚类数量之后,即对应确定了电气数据的类别数量,处理器根据该类别数量即可对应确定开关设备连接的电力设备之间的拓扑关系。
在一些实施例中,与开关设备连接的电力设备的数量可以是多个,相应地,开关设备连接的电力设备之间的拓扑关系可以是同一开关设备连接的多个电力设备之间的从属关系及线路的分支情况。
在一些实施例中,开关设备的数量也可以是多个,相应地,开关设备连接的电力设备之间的拓扑关系可以是不同开关设备连接的不同电力设备之间的从属关系及线路的分支情况。
上述用于识别电力设备拓扑的方法,通过获取开关设备的电气数据,并确定电气数据的密度,从而根据密度确定高密度集,从高密度集中选择初始聚类中心,根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量,进而根据最终的聚类数量得到开关设备连接的电力设备之间的拓扑关系。上述方法减少了人工维护模型的工作量,不同于现有的聚类算法,根据电气数据的密度信息确定初始聚类中心,去除了现有的聚类算法选取初始聚类中心的随机性,使聚类结果更加稳定,且基于密度选择初始聚类中心能有效避免孤立点对聚类结果的影响,不会形成局部最优解的情况,提高了拓扑识别的效率。
图2示意性示出了本发明一实施例中根据选择的初始聚类中心对电气数据进行聚类的方法的流程示意图。如图2所示,在本发明实施例中,根据选择的初始聚类中心对电气数据进行聚类的方法可以包括以下步骤:
步骤S202,根据选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数。
可以理解,在一个实施例中,随着聚类数的增大,簇内距离会相应减小,而簇间距离增大,即随着聚类数变化,二者朝着相反的方向改变。设原始样本对象集合为X={x1,x2,…,xm},初始聚类中心集为C={c1,c2,…,cn}。簇内距离是所有簇类中每个对象对其所属簇类中心的距离总和,如下式(4)所示:
Figure BDA0003150846280000111
聚类指数为聚类紧密度与聚类显著度之和,即可以按照以下公式(5)确定聚类指数:
Figure BDA0003150846280000112
n表示初始聚类中心的个数,ci,cj为初始聚类中心,d(x,ci)表示簇类中每个对象对其所属簇类的初始聚类中心的距离,d(ci,cj)表示初始聚类中心之间的距离,K为此时簇类的个数(其中K≤n)。
当聚类指数Index达到最大时所对应的K为最佳聚类数,这样就可以确定簇中心点数K值,也就是最终的聚类数量。
在一个实施例中,初始聚类中心包括第一初始聚类中心和第二初始聚类中心;从高密度集中选择初始聚类中心,包括:确定高密度集中密度最大的电气数据为第一初始聚类中心;确定高密度集中与第一初始聚类中心距离最远的电气数据为第二初始聚类中心。
具体地,处理器可以从高密度集中选择密度最大的电气数据对象作为第一初始聚类中心,将其加入到初始聚类中心集合中,进一步还可以从高密度集中删除该第一初始聚类中心,计算高密度集中所有电气数据对象与第一初始聚类中心的距离,确定与第一初始聚类中心距离最远的电气数据对象作为第二初始聚类中心,将第二初始聚类中心加入到初始聚类中心集合中,进一步还可以从高密度集中删除该第二初始聚类中心。
在一个实施例中,聚类指数包括第一聚类指数;根据选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数,包括:确定除第一初始聚类中心和第二初始聚类中心之外的电气数据分别与第一初始聚类中心和第二初始聚类中心的距离;根据距离对除第一初始聚类中心和第二初始聚类中心之外的电气数据进行分类,以得到第一簇类和第二簇类,其中,第一簇类包括第一初始聚类中心,第二簇类包括第二初始聚类中心;根据距离、第一初始聚类中心以及第二初始聚类中心确定第一聚类指数。
具体地,处理器在确定了第一初始聚类中心和第二初始聚类中心之后,可以确定其他电气数据分别与第一初始聚类中心和第二初始聚类中心的距离,可以基于预设的距离阈值,根据距离远近将所有的电气数据划分为两个类别,也就是第一簇类和第二簇类,其中,第一簇类和第二簇类内的数据对象的距离较近,相似度较高。进一步地,处理器可以获取预先计算并存储的第一初始聚类中心和第二初始聚类中心之间的距离(即簇间距离),根据簇间距离和簇内距离(即簇类中每个对象对其所属初始聚类中心的距离),具体可以基于上述确定聚类指数的公式(5)确定第一聚类指数。
步骤S204,将当前聚类指数与上一次聚类指数进行比较。
可以理解,当初始聚类中心的数量为两个的时候,可以确定第一聚类指数,对应地,当初始聚类中心的数量为三个或四个的时候,可以分别确定对应的第二聚类指数或者第三聚类指数。
具体地,处理器可以将当前聚类指数(例如,第三聚类指数)与上一次聚类指数(例如,第二聚类指数)进行大小比较,从而确定两者的数据大小。
步骤S206,在当前聚类指数小于上一次聚类指数的情况下,将与上一次聚类指数对应的初始聚类中心的数量作为最终的聚类数量。
具体地,若当前聚类指数(例如,第三聚类指数)小于上一次聚类指数(例如,第二聚类指数),处理器可以将与上一次聚类指数(例如,第二聚类指数)对应的初始聚类中心的数量(即数量3)作为最终的聚类数量。
步骤S208,在当前聚类指数不小于上一次聚类指数的情况下,从高密度集中选择下一个初始聚类中心。
具体地,若当前聚类指数(例如,第三聚类指数)大于或者等于上一次聚类指数(例如,第二聚类指数),处理器可以从高密度集中选择下一个初始聚类中心。
在一个实施例中,从高密度集中选择下一个初始聚类中心包括:确定高密度集中与选择的各初始聚类中心的距离之和最大的电气数据为下一个初始聚类中心。
可以理解,在一个示例中,当目前已经确定的初始聚类中心的数量为4个时,处理器可以继续从高密度集中选择与已选择的4个初始聚类中心的距离之和最大的电气数据作为下一个初始聚类中心,也就是第5个初始聚类中心(即第五初始聚类中心)。
在本申请的实施例中,采用最大距离法可以使得所选取的初始聚类中心足够稀疏,解决了聚类中心过度密集导致一个类被分成多个类的情况。
步骤S210,根据所有选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数。
具体地,处理器在确定了下一个初始聚类中心(例如,第五初始聚类中心)之后,可以根据已经选择的五个初始聚类中心对所有电气数据进行分类,并计算此时对应的聚类指数(例如,第四聚类指数),之后继续返回上述步骤S204,即判断当前聚类指数(例如,第四聚类指数)与上一次聚类指数(例如,第三聚类指数)的大小。若当前聚类指数(例如,第四聚类指数)小于上一次聚类指数(例如,第三聚类指数),将与上一次聚类指数(例如,第三聚类指数)对应的初始聚类中心的数量(例如,数量4)作为最终的聚类数量。
在本申请的实施例中,通过设置聚类指数,可以得到最佳聚类数k,解决了传统k值难以确定的问题,当聚类指数达到最大值之后,停止聚类算法的迭代过程,可以提高算法的收敛速度,提高迭代的效率,加快聚类的进程,以进一步提高聚类效率。
在一个实施例中,初始聚类中心还包括第三初始聚类中心;从高密度集中选择初始聚类中心,还包括:确定高密度集中与第一初始聚类中心和第二初始聚类中心的距离之和最大的电气数据为第三初始聚类中心。
具体地,处理器在确定了第一初始聚类中心和第二初始聚类中心之后,还可以继续从高密度集中选择与第一初始聚类中心和第二初始聚类中心的距离之和最大的电气数据,将其确定为第三初始聚类中心,将第三初始聚类中心加入到初始聚类中心集合中,进一步还可以从高密度集中删除该第三初始聚类中心。
聚类指数还包括第二聚类指数;根据选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数,包括:确定除第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之外的电气数据分别与第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之间的距离;根据距离对除第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之外的电气数据进行分类,以得到第一簇类、第二簇类以及第三簇类,其中,第一簇类包括第一初始聚类中心,第二簇类包括第二初始聚类中心,第三簇类包括第三初始聚类中心;根据距离、第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心确定第二聚类指数。
具体地,处理器在确定了第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之后,可以确定其他电气数据分别与第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心的距离,可以基于预设的距离阈值,根据距离远近将所有的电气数据划分为三个类别,也就是第一簇类、第二簇类以及第三簇类,其中,第一簇类、第二簇类以及第三簇类内的数据对象的距离较近,相似度较高。进一步地,处理器可以获取预先计算并存储的第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心彼此之间的距离(即簇间距离),根据簇间距离和簇内距离(即簇类中每个对象对其所属初始聚类中心的距离),具体可以基于上述确定聚类指数的公式(5)确定第二聚类指数。
在一个实施例中,在确定电气数据的密度之前,还包括:对电气数据进行预处理,以得到预处理后的电气数据。
在一个实施例中,对电气数据进行预处理,以得到预处理后的电气数据,包括:对电气数据进行数据筛选,以得到筛选后的电气数据。
可以理解,通过数据筛选可以构建一个数据集。具体地,在一个示例中,低压采集设备下发数据采集开始时间,各开关设备在开始时间点分别采集台区内开关电流、电压、功率、电流谐波等数据,开关设备之间时间同步偏差需要达到1ms以内,保证同时采集,然后由低压采集设备分别读取各开关设备采集的数据并进行数据分析。以每天96个时间点(24小时,每隔15分钟采集一个点,一共96个时间点)的数据为例,可以从开关设备所采集的电气数据中,例如可测量的开关电流、电压、功率、电流谐波等数据,选择来自某个台区下的A个开关设备所采集数据中每天B(例如,B=96)个时间点tB的电压/电流数据,并去除0值或者空值,形成一个A*B的矩阵,其中A行可以对应于样本总量(例如,A个开关设备)。其中A*B矩阵如下式(6)所示:
Figure BDA0003150846280000161
在本申请的实施例中,处理器通过对获取到的电气数据进行数据筛选处理,可以去除采集数为空或者采集时间点数据明显错误的电气数据,保证数据的真实性和准确性。
在一个实施例中,方法还包括:对筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据。
在一个实施例中,对筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据,包括:确定筛选后的电气数据的平均值;将筛选后的电气数据减去平均值,以得到去中心化处理后的电气数据。
具体地,在一个实施例中,可以通过以下公式(7)计算测量采集得到的筛选后的电气数据的平均值,然后可以通过以下公式(8)将筛选后的电气数据减去该平均值得到去中心化的测量数据,如下所示:
Figure BDA0003150846280000171
Figure BDA0003150846280000172
其中,B为数据采集的总次数,yAav为第A个开关设备进行B次数据采集后得到的筛选后的电气数据的平均值,yA(tB)为第A个开关设备在第B次数据采集得到的筛选后的电气数据,yA(t)为去中心化处理后的第A个开关设备的电气数据。
通过采集台区下所有开关设备每天、每周、每月或每年的测量数据,可以得到用于数据分析的元数据库。
图3示意性示出了本发明一实施例中的改进型k-means算法步骤的流程示意图。如图3所示,本发明实施例提供的改进型k-means算法具体可以包括以下步骤:
1)根据公式(1)计算所有数据对象的密度,获得高密度集D;
2)选取D中处于最高密度区域的数据对象k1,将k1加入到初始聚类中心集C中,并从D中删除该对象;
3)计算集合D中所有数据对象与k1的距离,找出离k1距离最远的数据对象k2,将k2加入到集合C中,并从D中删除该对象;
4)从集合D中找出离k1和k2最远的数据对象k3,即k3与k1、k2的距离之和最大,然后将k3加入到集合C中,并从集合D中删除该对象,按照上述方法依次选择后续各中心点,直到选择的中心点个数所对应的聚类指数达到最大。
在本发明实施例中,改进型k-means算法首先对第一个簇中心点选取进行改进,不随机选取一个点,而是从所有的数据点中选出密度最大的一个点作为第一个初始聚类中心点,某种程度上避免了选到离群点的可能;然后基于最大距离的聚类中心选择方法,选择距离该点最远的那个点作为第二个初始类簇中心点,接着再选择距离前两个点的最短距离最大的那个点作为第三个初始类簇的中心点,以此类推,直至选出聚类指数最大的初始类簇中心点。
在一个实施例中,上述方法还可以包括校验与纠错的步骤,具体可以如下:通过采集设备得到开关的用电信息,保证所有开关的采集同时进行,利用以下多个判据,来验证物理拓扑关系:1)采集电流和功率数据,按照上级开关电流和功率应为下级所有开关之和,通过不断组合判定从属关系;2)采集电流谐波数据,下级开关电流谐波特性在上级开关电流谐波中也会体现;3)采集电压数据和电压谐波数据,所有分支箱和同一分支箱下的表前开关属于并联关系,电压相同。
本发明实施例提出的用于识别电力设备拓扑的方法,首先通过从开关计量大数据中分别筛选每天、每周、每月或每年的采集数据,即通过长时间的多次采集,得到台区内各级开关电流、功率、电流谐波数据等信息,对开关的电气数据进行采集,有利于分析线路及用户之间的连接关系。利用时间序列计量大数据完成数据筛选和去中心化处理,建立电气参数识别元数据库即预处理后的电气数据,确保数据的准确性和完整性。基于改进型k-means算法,通过高密度原则确定第一个簇中心点,然后基于最大距离法依次确定其他的簇中心点,并通过聚类指数计算来确定最佳的聚类数量,完成元数据库也就是处理后的电气数据的聚类分析,解决传统k-means算法中K值需给定的问题。
上述用于识别电力设备拓扑的方法,去除了选取初始聚类中心的随机性,使聚类结果稳定,且基于密度选择初始聚类中心能有效避免孤立点对聚类结果的影响,不会形成局部最优解的情况;最大距离法则使得所选取的初始聚类中心足够稀疏,解决了聚类中心过度密集导致一个类被分成多个类的情况,通过聚类指数能得到最佳聚类数k,解决了传统k值难以确定的问题。结合低压配电网的连接结构特性,构建满足低压台区分线分相线路拓扑及电气参数识别需要的拓扑识别模型,最后对模型进行校验和纠错。
图4示意性示出了本发明一实施例中用于识别电力设备拓扑的装置的结构框图。如图4所示,在本发明实施例中,提供了一种用于识别电力设备拓扑的装置400,包括:数据采集设备410和处理器420,其中:
数据采集设备410,用于采集开关设备的电气数据。
处理器420,被配置成:获取开关设备的电气数据;确定电气数据的密度,其中密度为电气数据在预设邻域半径内的电气数据的数量;根据密度确定高密度集,其中高密度集中的电气数据的密度达到预设阈值;从高密度集中选择初始聚类中心;根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量;以及根据最终的聚类数量得到开关设备连接的电力设备之间的拓扑关系。
上述用于识别电力设备拓扑的装置400,通过获取开关设备的电气数据,并确定电气数据的密度,从而根据密度确定高密度集,从高密度集中选择初始聚类中心,根据选择的初始聚类中心对电气数据进行聚类,以得到最终的聚类数量,进而根据最终的聚类数量得到开关设备连接的电力设备之间的拓扑关系。上述装置减少了人工维护模型的工作量,不同于现有的聚类算法,根据电气数据的密度信息确定初始聚类中心,去除了现有的聚类算法选取初始聚类中心的随机性,使聚类结果更加稳定,且基于密度选择初始聚类中心能有效避免孤立点对聚类结果的影响,不会形成局部最优解的情况,提高了拓扑识别的效率。
在一个实施例中,处理器420进一步被配置成:根据选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数;将当前聚类指数与上一次聚类指数进行比较;在当前聚类指数小于上一次聚类指数的情况下,将与上一次聚类指数对应的初始聚类中心的数量作为最终的聚类数量。
在一个实施例中,处理器420进一步被配置成:在当前聚类指数不小于上一次聚类指数的情况下,从高密度集中选择下一个初始聚类中心;根据所有选择的初始聚类中心对电气数据进行聚类,并确定对应的聚类指数。
在一个实施例中,初始聚类中心包括第一初始聚类中心和第二初始聚类中心;处理器420进一步被配置成:确定高密度集中密度最大的电气数据为第一初始聚类中心;确定高密度集中与第一初始聚类中心距离最远的电气数据为第二初始聚类中心。
在一个实施例中,聚类指数包括第一聚类指数;处理器420进一步被配置成:确定除第一初始聚类中心和第二初始聚类中心之外的电气数据分别与第一初始聚类中心和第二初始聚类中心的距离;根据距离对除第一初始聚类中心和第二初始聚类中心之外的电气数据进行分类,以得到第一簇类和第二簇类,其中,第一簇类包括第一初始聚类中心,第二簇类包括第二初始聚类中心;根据距离、第一初始聚类中心以及第二初始聚类中心确定第一聚类指数。
在一个实施例中,初始聚类中心还包括第三初始聚类中心;处理器420进一步被配置成:确定高密度集中与第一初始聚类中心和第二初始聚类中心的距离之和最大的电气数据为第三初始聚类中心;
聚类指数还包括第二聚类指数;处理器420进一步被配置成:确定除第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之外的电气数据分别与第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之间的距离;根据距离对除第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心之外的电气数据进行分类,以得到第一簇类、第二簇类以及第三簇类,其中,第一簇类包括第一初始聚类中心,第二簇类包括第二初始聚类中心,第三簇类包括第三初始聚类中心;根据距离、第一初始聚类中心、第二初始聚类中心以及第三初始聚类中心确定第二聚类指数。
在一个实施例中,处理器420进一步被配置成:确定高密度集中与选择的各初始聚类中心的距离之和最大的电气数据为下一个初始聚类中心。
在一个实施例中,处理器420进一步被配置成:根据以下公式(1)确定高密度集:
D={z1,z2,…zm|zi∈X,Density(zi)≥M} (1)
其中,D为高密度集,M为预设阈值,X为开关设备的电气数据的集合,zi为X中达到预设阈值的电气数据,Density(zi)为电气数据zi的密度,z1,z2,…zm为高密度集D中的电气数据,m是高密度集的样本个数。
在一个实施例中,处理器420进一步被配置成:根据以下公式(2)确定第二聚类指数:
Figure BDA0003150846280000211
其中,n表示初始聚类中心的个数,ci,cj为初始聚类中心,d(x,ci)表示簇类中每个对象对其所属簇类的初始聚类中心的距离,d(ci,cj)表示初始聚类中心之间的距离,K为此时簇类的个数(其中K≤n)。
在一个实施例中,处理器420进一步被配置成:对电气数据进行预处理,以得到预处理后的电气数据。
在一个实施例中,处理器420进一步被配置成:对电气数据进行数据筛选,以得到筛选后的电气数据。
在一个实施例中,处理器420进一步被配置成:对筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据。
在一个实施例中,对筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据,包括:确定筛选后的电气数据的平均值;将筛选后的电气数据减去平均值,以得到去中心化处理后的电气数据。
在一个实施例中,处理器420进一步被配置成:根据以下公式(3)确定筛选后的电气数据的平均值:
Figure BDA0003150846280000221
其中,B为数据采集的总次数,yAav为第A个开关设备进行B次数据采集后得到的筛选后的电气数据的平均值,yA(tB)为第A个开关设备在第B次数据采集得到的筛选后的电气数据。
在一个实施例中,处理器420进一步被配置成:根据以下公式(4)计算得到去中心化处理后的电气数据:
Figure BDA0003150846280000222
其中,yA(t)为去中心化处理后的第A个开关设备的电气数据,yAav为第A个开关设备进行B次数据采集后得到的筛选后的电气数据的平均值,yA(tB)为第A个开关设备在第B次数据采集得到的筛选后的电气数据。
本发明实施例提供了一种处理器,被配置成执行根据上述实施例中的用于识别电力设备拓扑的方法。
本发明实施例提供了一种机器可读存储介质,该机器可读存储介质上存储有指令,该指令在被处理器执行时使得处理器执行根据上述实施例中的用于识别电力设备拓扑的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (18)

1.一种用于识别电力设备拓扑的方法,其特征在于,包括:
获取开关设备的电气数据;
确定所述电气数据的密度,其中所述密度为所述电气数据在预设邻域半径内的电气数据的数量;
根据所述密度确定高密度集,其中所述高密度集中的电气数据的密度达到预设阈值;
从所述高密度集中选择初始聚类中心;
根据选择的初始聚类中心对所述电气数据进行聚类,以得到最终的聚类数量;以及
根据所述最终的聚类数量得到所述开关设备连接的电力设备之间的拓扑关系。
2.根据权利要求1所述的方法,其特征在于,所述根据选择的初始聚类中心对所述电气数据进行聚类,以得到最终的聚类数量,包括:
根据选择的初始聚类中心对所述电气数据进行聚类,并确定对应的聚类指数;
将当前聚类指数与上一次聚类指数进行比较;
在所述当前聚类指数小于所述上一次聚类指数的情况下,将与所述上一次聚类指数对应的初始聚类中心的数量作为所述最终的聚类数量。
3.根据权利要求2所述的方法,其特征在于,所述选择的初始聚类中心对所述电气数据进行聚类,以得到最终的聚类数量,还包括:
在所述当前聚类指数不小于上一次聚类指数的情况下,从所述高密度集中选择下一个初始聚类中心;
根据所有选择的初始聚类中心对所述电气数据进行聚类,并确定对应的聚类指数。
4.根据权利要求2所述的方法,其特征在于,所述初始聚类中心包括第一初始聚类中心和第二初始聚类中心;所述从所述高密度集中选择初始聚类中心,包括:
确定所述高密度集中密度最大的电气数据为第一初始聚类中心;
确定所述高密度集中与所述第一初始聚类中心距离最远的电气数据为第二初始聚类中心。
5.根据权利要求4所述的方法,其特征在于,所述聚类指数包括第一聚类指数;所述根据选择的初始聚类中心对所述电气数据进行聚类,并确定对应的聚类指数,包括:
确定除所述第一初始聚类中心和所述第二初始聚类中心之外的电气数据分别与所述第一初始聚类中心和所述第二初始聚类中心的距离;
根据所述距离对除所述第一初始聚类中心和所述第二初始聚类中心之外的电气数据进行分类,以得到第一簇类和第二簇类,其中,所述第一簇类包括所述第一初始聚类中心,所述第二簇类包括所述第二初始聚类中心;
根据所述距离、所述第一初始聚类中心以及所述第二初始聚类中心确定所述第一聚类指数。
6.根据权利要求5所述的方法,其特征在于,所述初始聚类中心还包括第三初始聚类中心;所述从所述高密度集中选择初始聚类中心,还包括:确定所述高密度集中与所述第一初始聚类中心和所述第二初始聚类中心的距离之和最大的电气数据为第三初始聚类中心;
所述聚类指数还包括第二聚类指数;所述根据选择的初始聚类中心对所述电气数据进行聚类,并确定对应的聚类指数,包括:
确定除所述第一初始聚类中心、所述第二初始聚类中心以及所述第三初始聚类中心之外的电气数据分别与所述第一初始聚类中心、所述第二初始聚类中心以及所述第三初始聚类中心之间的距离;
根据所述距离对除所述第一初始聚类中心、所述第二初始聚类中心以及所述第三初始聚类中心之外的电气数据进行分类,以得到第一簇类、第二簇类以及第三簇类,其中,所述第一簇类包括所述第一初始聚类中心,所述第二簇类包括所述第二初始聚类中心,所述第三簇类包括所述第三初始聚类中心;
根据所述距离、所述第一初始聚类中心、所述第二初始聚类中心以及所述第三初始聚类中心确定所述第二聚类指数。
7.根据权利要求3所述的方法,其特征在于,所述从所述高密度集中选择下一个初始聚类中心包括:
确定所述高密度集中与选择的各初始聚类中心的距离之和最大的电气数据为下一个初始聚类中心。
8.根据权利要求1所述的方法,其特征在于,所述根据所述密度确定高密度集包括:根据以下公式(1)确定高密度集:
D={z1,z2,…zm|zi∈X,Density(zi)≥M} (1)
其中,D为所述高密度集,M为所述预设阈值,X为所述开关设备的电气数据的集合,zi为X中达到所述预设阈值的电气数据,Density(zi)为所述电气数据zi的密度,z1,z2,…zm为所述高密度集D中的电气数据,m是高密度集的样本个数。
9.根据权利要求6所述的方法,其特征在于,所述根据所述距离、所述第一初始聚类中心、所述第二初始聚类中心以及所述第三初始聚类中心确定所述第二聚类指数包括:根据以下公式(2)确定所述第二聚类指数:
Figure FDA0003150846270000041
其中,n表示初始聚类中心的个数,ci,cj为初始聚类中心,d(x,ci)表示簇类中每个对象对其所属簇类的初始聚类中心的距离,d(ci,cj)表示初始聚类中心之间的距离,K为此时簇类的个数(其中K≤n)。
10.根据权利要求1所述的方法,其特征在于,在所述确定所述电气数据的密度之前,还包括:
对所述电气数据进行预处理,以得到预处理后的电气数据。
11.根据权利要求10所述的方法,其特征在于,所述对所述电气数据进行预处理,以得到预处理后的电气数据,包括:
对所述电气数据进行数据筛选,以得到筛选后的电气数据。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
对所述筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据。
13.根据权利要求12所述的方法,其特征在于,所述对所述筛选后的电气数据进行去中心化处理,以得到去中心化处理后的电气数据,包括:
确定所述筛选后的电气数据的平均值;
将所述筛选后的电气数据减去所述平均值,以得到所述去中心化处理后的电气数据。
14.根据权利要求13所述的方法,其特征在于,所述确定所述筛选后的电气数据的平均值包括:根据以下公式(3)确定所述筛选后的电气数据的平均值:
Figure FDA0003150846270000051
其中,B为数据采集的总次数,yAav为第A个开关设备进行B次数据采集后得到的筛选后的电气数据的平均值,yA(tB)为第A个开关设备在第B次数据采集得到的筛选后的电气数据。
15.根据权利要求13所述的方法,其特征在于,将所述筛选后的电气数据减去所述平均值,以得到所述去中心化处理后的电气数据,包括:根据以下公式(4)计算得到所述去中心化处理后的电气数据:
Figure FDA0003150846270000052
其中,yA(t)为去中心化处理后的第A个开关设备的电气数据,yAav为第A个开关设备进行B次数据采集后得到的筛选后的电气数据的平均值,yA(tB)为第A个开关设备在第B次数据采集得到的筛选后的电气数据。
16.一种处理器,其特征在于,被配置成执行根据权利要求1至15中任意一项所述的用于识别电力设备拓扑的方法。
17.一种用于识别电力设备拓扑的装置,其特征在于,所述装置包括:
数据采集设备,用于采集开关设备的电气数据;以及
根据权利要求16所述的处理器。
18.一种机器可读存储介质,该机器可读存储介质上存储有指令,其特征在于,该指令在被处理器执行时使得所述处理器执行根据权利要求1至15中任意一项所述的用于识别电力设备拓扑的方法。
CN202110763568.9A 2021-07-06 2021-07-06 用于识别电力设备拓扑的方法、装置、存储介质及处理器 Pending CN113656937A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110763568.9A CN113656937A (zh) 2021-07-06 2021-07-06 用于识别电力设备拓扑的方法、装置、存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110763568.9A CN113656937A (zh) 2021-07-06 2021-07-06 用于识别电力设备拓扑的方法、装置、存储介质及处理器

Publications (1)

Publication Number Publication Date
CN113656937A true CN113656937A (zh) 2021-11-16

Family

ID=78477164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110763568.9A Pending CN113656937A (zh) 2021-07-06 2021-07-06 用于识别电力设备拓扑的方法、装置、存储介质及处理器

Country Status (1)

Country Link
CN (1) CN113656937A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115099164A (zh) * 2022-08-26 2022-09-23 中国科学技术大学 基于机器学习的锡基钙钛矿薄膜晶体管优化方法及其装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110492480A (zh) * 2019-08-28 2019-11-22 广州供电局有限公司 配电网拓扑识别方法、装置、计算机设备和可读存储介质
CN111061821A (zh) * 2019-11-12 2020-04-24 国网山东省电力公司聊城供电公司 基于改进k值聚类算法的低压配电网拓扑校验方法及系统
CN111223008A (zh) * 2020-01-13 2020-06-02 南京软核科技有限公司 一种低压配电台区拓扑自动识别系统
CN112562038A (zh) * 2020-12-22 2021-03-26 广东电网有限责任公司茂名供电局 一种基于聚类分析的低压配电网图形生成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110492480A (zh) * 2019-08-28 2019-11-22 广州供电局有限公司 配电网拓扑识别方法、装置、计算机设备和可读存储介质
CN111061821A (zh) * 2019-11-12 2020-04-24 国网山东省电力公司聊城供电公司 基于改进k值聚类算法的低压配电网拓扑校验方法及系统
CN111223008A (zh) * 2020-01-13 2020-06-02 南京软核科技有限公司 一种低压配电台区拓扑自动识别系统
CN112562038A (zh) * 2020-12-22 2021-03-26 广东电网有限责任公司茂名供电局 一种基于聚类分析的低压配电网图形生成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115099164A (zh) * 2022-08-26 2022-09-23 中国科学技术大学 基于机器学习的锡基钙钛矿薄膜晶体管优化方法及其装置
CN115099164B (zh) * 2022-08-26 2022-12-30 中国科学技术大学 基于机器学习的锡基钙钛矿薄膜晶体管优化方法及其装置

Similar Documents

Publication Publication Date Title
CN108376982B (zh) 负载相序的识别方法及装置
CN109873501B (zh) 一种低压配电网拓扑自动识别方法
CN105678398A (zh) 基于大数据技术的电力负荷预测方法及基于该方法的研究应用系统
CN106372747B (zh) 基于随机森林的台区合理线损率估计方法
CN114676883A (zh) 基于大数据的电网运行管理方法、装置、设备及存储介质
CN114519514B (zh) 一种低压台区合理线损值测算方法、系统及计算机设备
CN108090165A (zh) 一种基于嵌入式图数据库的图谱变化差异的获取方法
CN115563477B (zh) 谐波数据识别方法、装置、计算机设备和存储介质
CN113872204B (zh) 一种基于电网图拓扑计算的用电负荷性质确定方法及装置
CN112288303A (zh) 确定线损率的方式、装置
CN112366690B (zh) 一种基于强同步电压特征匹配的低压台区横向节点关系识别方法
CN107862459B (zh) 一种基于大数据的计量设备状态评估方法及系统
CN115618249A (zh) 一种基于LargeVis降维与DBSCAN聚类的低压配电台区相位识别方法
CN113033617A (zh) 一种基于大数据台区线损数据深度挖掘分析方法
CN116340437A (zh) 一种面向大规模多源异构数据的多聚类方法
CN113656937A (zh) 用于识别电力设备拓扑的方法、装置、存储介质及处理器
CN112116205B (zh) 针对台区用电特征的画像方法、装置和存储介质
CN115207909B (zh) 一种台区拓扑识别方法、装置、设备及存储介质
CN104299065A (zh) 一种调度自动化主备系统间模型正确性校验的方法
CN111178679A (zh) 一种基于聚类算法和网络搜索的相位识别方法
CN115309801A (zh) 配电网的异常线损数据双层定位方法、系统、设备及介质
CN114186420A (zh) 一种配电网台区拓扑校验方法、装置、设备和介质
CN109871998B (zh) 一种基于专家样本库的配电网线损率预测方法及装置
CN113570345B (zh) 一种基于施工项目电路图的停电范围自动识别系统
CN113258672B (zh) 一种配电台区智慧物联监测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211116