CN111061821A - 基于改进k值聚类算法的低压配电网拓扑校验方法及系统 - Google Patents
基于改进k值聚类算法的低压配电网拓扑校验方法及系统 Download PDFInfo
- Publication number
- CN111061821A CN111061821A CN201911100635.8A CN201911100635A CN111061821A CN 111061821 A CN111061821 A CN 111061821A CN 201911100635 A CN201911100635 A CN 201911100635A CN 111061821 A CN111061821 A CN 111061821A
- Authority
- CN
- China
- Prior art keywords
- clustering
- value
- data
- initial
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000012795 verification Methods 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 2
- 238000005259 measurement Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Remote Monitoring And Control Of Power-Distribution Networks (AREA)
Abstract
本公开公开了一种基于改进k值聚类算法的低压配电网拓扑校验方法及系统,采用k值选择算法,对高密度数据集自动选择k值和初始聚类中心,完成初始聚类;以高密度数据集中各数据点分量均值更新聚类中心,得到最终聚类集;采用相似度系数判断连接错误的数据点与相邻台区的相似性,确定其所属台区,更新GIS系统拓扑结构图。对于聚类后簇内曲线具有极高相似度,而簇间曲线具有明显区别的数据集具有较好的聚类效果,算法结构简单,易于实现,可用于快速处理大规模数据曲线。
Description
技术领域
本公开涉及配电自动化技术领域,特别是涉及基于改进k值聚类算法的低压配电网拓扑校验方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
低压配电网作为配电网的末端,其线路数量庞大,用户众多,电网改造频繁,拓扑结构极易发生变化。电力公司通常利用电网GIS系统来记录低压配电网中电气设备与用户之间的拓扑连接形式,其中主要包括配电变压器台区与用户的连接方式以及配变与馈线的连接形式。然而随着低压配电网的改造,用户连接发生变化,GIS系统中拓扑结构更新不及时,长期存在着错误拓扑连接形式的记录。电网调度人员不能及时、准确的获取低压配电网的拓扑结构,这对配电网的运行、控制、保护、维护等工作的进行产生影响。为了解决上述问题,需要制定一种合理的拓扑校验方法,快速准确校验GIS系统中记录的拓扑结构,获取正确的拓扑连接方式。
针对配电网拓扑结构校验,传统的配电网拓扑校验算法主要是基于输电网的拓扑校验方法,如:转移潮流法、信息图法等。然而,由于配电网中的量测数据相对于输电网来说较少,上述方法不适用于配电网。目前,随着智能电网的建设,高级量测设备(AdvancedMeter Infrastructure,AMI)以及同步相位测量装置(Phasor Measurement Unit,PMU)在配电网中的大量配置,使得实时的用户电压、支路电流、相位等数据的量测成为可能,为低压配电网的拓扑结构校验带来了大量的数据支持。
目前解决该问题的方法大多是利用AMI获取用户侧电压数据,通过线路阻抗值计算出耦合节点电压,采用相关系数分析线路耦合节点处电压相关性,按照相关系数大小分析变压器台区线路中连接错误的用户节点,并寻找正确的线路。在此基础上加入量测支路电流数据,同时分析电压、电流间的相关性,进而确定用户所属馈线或者台区。这种方法利用相关系数可以直接辨别用户电压之间的相关性,但其辨识过程需要人工操作,不适用于含有大量数据的情况下;或者根据电网GIS系统配变经纬度坐标数据计算待校验用户台区与该地区其他台区之间的距离,搜索校验用户的相邻台区。通过计算待校验用户与所在台区其它用户、相邻台区所有用户之间智能电表电压曲线离散Fréchet距离,运用剪辑近邻法校验低压配电网的拓扑结构。通过计算待校验用户与台区其他用户智能电表电压序列之间的相关系数;然后利用离群点检测(Local Outlier Factor,LOF)算法,统计数据点的密度,对离群因子大的数据即可视为连接错误数据。虽然该算法可以快速简单的识别错误用户,但其离群因子的值受参数K的影响较大,容易导致误判。
发明内容
为了解决上述问题,本公开提出了一种基于改进k值聚类算法的低压配电网拓扑校验方法及系统,获取初始电压数据,利用数据密度进行噪声处理,得到高密度数据集;利用自适应k值选择过程,自动识别聚类数,选择初始聚类中心;以相似度系数作为度量,自动聚类出错误连接的用户电压曲线;将聚类后的电压曲线与该台区相邻台区用户电压曲线做相似性分析,最终确定其所属台区。
为了实现上述目的,本公开采用如下技术方案:
第一方面,本公开提供一种基于改进k值聚类算法的低压配电网拓扑校验方法,包括:
对获取的初始电压数据集进行噪声处理,得到高密度数据集;
采用k值选择算法,对高密度数据集自动选择k值和初始聚类中心,完成初始聚类;
以高密度数据集中各数据点分量均值更新聚类中心,得到最终的聚类集合;
采用相似度系数判断聚类集合中连接错误的数据点与相邻台区的相似性,确定其所属台区,更新GIS系统拓扑结构图。
作为可能的一些实现方式,所述噪声处理为,在初始电压数据集中选取目标数据点,依次计算该目标数据点与其余数据点间的欧式距离,得到距离数集;
计算距离数集中的平均距离,以目标数据点为中心,平均距离为直径作邻域,得出初始电压数据集中在此邻域内的数据点的个数;
判断数据点个数是否大于设定的阈值,若是,则将该目标数据点加入到高密度数据集中,否则删除该目标数据点。
本公开提出一种基于高密度集合的初始数据集噪声处理方法,其能有效去除原始数据中的噪声数据,获取一个密度相对集中的高密度数据集。
作为可能的一些实现方式,所述初步聚类过程为,选定k值初始值,以及根据欧式距离最大的数据点作为初始聚类中心;
采用皮尔逊相似系数方法,计算其余数据点与初始聚类中心的相似系数,设置相似系数阈值,将满足相似系数阈值的数据点进行聚类。
作为可能的一些实现方式,选择其中一个初始聚类中心进行聚类,以相似系数阈值为聚类条件,得到第一聚类中心的第一聚类集合,并在高密度数据集中删除该集合,得到第一剩余数据集;
依次完成其余初始聚类中心的聚类,得到相应的聚类集合,并在相应的剩余数据集中删除聚类集合;
对最终剩余数据集进行判断,判断其是否为空集,若为空集完成初始聚类;否则以第一剩余数据集为新数据集,增加K值重新聚类,直到最终剩余数据集为空集。
本公开可以根据聚类过程自动获取K值数,不需要事先给定;同时以皮尔逊相似系数代替欧式距离作为数据间距离的度量,能很好的反映多维数据向量之间的相似关系。
作为可能的一些实现方式,所述更新聚类中心,重新聚类后,计算得到的各聚类集合的收敛精度,判断各聚类集合中各数据点相对于各聚类集合中聚类中心的距离之和是否变化,若不变表示聚类结束,聚类结果收敛;否则重新聚类。
本公开初始聚类的目的是为了获取准确的聚类数目K,即获取k个初始聚类中心以及初步聚类好的K个集合。K均值聚类算法为不断更新聚类中心不断迭代直至收敛的过程,因此需要更新聚类中心,以新的聚类中心重新聚类。
第二方面,本公开提供一种基于改进k值聚类算法的低压配电网拓扑校验系统,包括:
预处理模块,其用于对获取的初始电压数据集进行噪声处理,得到高密度数据集;
初始聚类模块,其用于采用k值选择算法,对高密度数据集自动选择k值和初始聚类中心,完成初始聚类;
聚类更新模块,其用于以高密度数据集中各数据点分量均值更新聚类中心,得到最终的聚类集合;
相似判断模块,其用于采用相似度系数判断聚类集合中连接错误的数据点与相邻台区的相似性,确定其所属台区,更新GIS系统拓扑结构图。
与现有技术相比,本公开的有益效果为:
本公开提出一种基于高密度集合的初始数据集噪声处理方法,数据集中噪声处理后,聚类结果可以满足预期要求,可用于快速处理大规模数据曲线;
本公开采用自适应k值选择算法,可以自动获取聚类数,并且可以获取恰当的初始聚类中心,完成初步聚类;同时皮尔逊相似系数进行度量的方法对于曲线聚类,利用距离能产生曲线距离较近且相似度较高的情况;
本公开可以通过聚类结果清楚的显示出拓扑连接错误的曲线,并根据相似性系数确定错误连接的用户所属的台区;
本公开对于聚类后簇内曲线具有极高相似度,而簇间曲线具有明显区别的数据集具有较好的聚类效果。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1为基于改进k值聚类算法的低压配电网拓扑校验过程的控制流程图;
图2为实施例台区A初始拓扑结构图;
图3为实施例线路1用户聚类结果;
图4为实施例线路2用户与M11-M13电压曲线;
图5为实施例线路3用户与M14-M16电压曲线;
图6为实施例校验后台区A拓扑结构;
图7为实施例变压器台区供电范围;
图8为实施例台区A用户聚类校验结果。
具体实施方式:
下面结合附图与实施例对本公开做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
电力GIS系统中常见的拓扑错误主要是由于电网改造引起的用户所在的台区或者变压器所在的馈线记录错误。因电网规划使得某个用户接入到相邻台区,而未及时更新GIS系统中的用户连接信息。随着智能电表的发展与应用,为配电网带来了大量的电压量测数据。而电压在配电网中呈现出如下特性:
(1)用户的电气距离越近,节点电压曲线相似性越高。因此在相同变压器或者在相同线路下的用户电压曲线的相似系数较高;
(2)在同一条变压器支路上,电压幅值沿着线路呈下降趋势。基于以上原理,可以根据由AMI量测体系获取的用户电压曲线的时序变化形式的相似性判断用户是否属于同一台区,而根据电压幅值的大小确定节点电压的上下游关系。针对上述问题,可以利用数据挖掘中基于相似性的聚类技术完成校验。
实施例1
如图1所示,本公开提供一种基于改进k值聚类算法的低压配电网拓扑校验方法,包括:
步骤(1):获取初始电压数据集,对初始电压数据集进行噪声处理,得到高密度数据集D;
步骤(2):采用自适应k值选择算法,对高密度数据集D自动选择k值和初始聚类中心,完成初始聚类;
步骤(3):以高密度数据集中各数据点分量均值更新聚类中心,重新聚类;
步骤(4):通过计算收敛精度,判断上述聚类是否迭代完成,输出最终聚类结果;
步骤(5):利用聚类结果,数据量较少的几类即为不属于该台区的用户,利用皮尔逊相似系数判断其与相邻台区的相似性,最终找到其所属的台区;
步骤(6):将不属于该台区的用户归入其所属的台区内,更新GIS系统拓扑结构图,最终完成校验。
所述步骤(1)为:
噪声处理过程为,在初始电压数据集中选取目标数据点,依次计算该目标数据点与其余数据点间的欧式距离,得到距离数集;
计算距离数集中的平均距离,以目标数据点为中心,平均距离为直径作邻域,得出初始电压数据集中在此邻域内的数据点的个数;
判断数据点个数是否大于设定的阈值,若是,则将该目标数据点加入到高密度数据集中,否则删除该目标数据点。
由于受AMI量测系统本身的功能和装置性能的影响,获取的电压量测数据中将会不可避免的存在一定的噪声数据。噪声数据不仅会增加算法的存储空间,还会影响初始聚类中心的选择,导致聚类错误,因此需要对获取的初始数据集进行噪声处理。通过初始聚类中心选择过程,利用数据点的密度进行噪声处理,提出一种基于高密度集合的初始数据集噪声处理方法。
基于数据点密度的噪声处理过程为:首先,获取初始电压数据曲线,针对任一数据对象p,依次计算其余数据点与数据对象p之间的欧式距离,如式(1)所示;
其次,计算到数据对象p的距离的平均值r,以数据对象p为中心,以r/2为半径作邻域,统计数据间距离在此邻域内的数据点的个数;若数据点的个数大于某一阈值W,则将该数据加入到高密度数据集D中,即该数据对象p为正常数据,否则为噪声数据,将其删除。通常选择阈值W为数据集中数据总数的50%。其能有效去除原始数据中的噪声数据,获取一个密度相对集中的高密度数据集。
式中:dij表示两条数据曲线间的欧式距离,n表示曲线的维数,xia、xja分别表示曲线的第a个分量坐标。
所述步骤(2)的步骤为:
步骤(2-1):自动选择自适应k值的初值,经过噪声处理后获得高密度数据集D,并设置初始k值为2。
步骤(2-2):初步聚类
1)利用式(1)计算高密度数据集D中曲线间的欧式距离,选择距离最大的两条作为初始聚类中心a和b;
2)先选取其中一条作为初始聚类中心a,以皮尔逊相似系数作为度量,计算其余数据点pi(i=1,2,......,n-2)与该聚类中心a的相似系数,设置相似系数阈值M,以相似系数大于阈值作为归类依据,将满足阈值条件的数据聚为此类,并在数据集D中删除该数据pi,记为数据集合D’(D’=D-A),完成此聚类中心的聚类,令该聚类集合为A。皮尔逊相似系数公式为:
3)选中另外一条聚类中心b,按照相同的聚类方式聚类,并且在D’中删除已聚类数据,成为剩余数据D”,并获得聚类集合B。
4)对D”中剩余数据集进行判断,若D”为空集,则完成聚类;若D”不为空集,则聚类数k选择不恰当,增加k值并以步骤(2-2)中第2步之后获得的数据集D’作为新数据集,重复步骤(2-2),直到数据集D为空集,完成初始聚类。
其改进了K均值聚类算法中聚类结果依靠事先选定K值的缺陷,不同的K值会产生不同的聚类结果。本公开可以根据聚类过程自动获取K值数,不需要事先给定。同时以皮尔逊相似系数代替欧式距离作为数据间距离的度量,能很好的反映多维数据向量之间的相似关系。
所述步骤(3)的步骤为:
1)以数据集合各分量均值。该算法针对的数据集中的数据为多维向量,维数为24,每个向量有24个元素,各分量的均值是指各个向量各对应的元素取均值。
2)更新聚类中心,重新聚类。初始聚类的目的是为了获取准确的聚类数目K,即获取k个初始聚类中心以及初步聚类好的K个集合。K均值聚类算法为不断更新聚类中心不断迭代直至收敛的过程,因此需要更新聚类中心,以新的聚类中心重新聚类。
所述步骤(4)的步骤为:
计算收敛精度,如式(3)所示,判断是否迭代完成,输出聚类结果。
该公式表示已聚类集合中各数据相对于各聚类集合中聚类中心的距离之和,若该值不再变化即表示聚类结束,结果收敛。
由于实际配电网中某一台区下的用户数巨多,且错误连接的用户数居少,错误连接聚类集合中的数据会远小于其他集合中的数据,可直观表现出此数据集的数量。
本实施例选取某地区GIS系统记录的实际变压器台区A下的38个用户节点电压测量数据以及其相邻两个台区下的用户电压采集数据进行验证,分两种可能产生的拓扑连接错误形式验证该算法的可行性。
本实施例的恢复方法具体操作步骤如下:
一、同一台区下不同线路用户校验
在同一变压器台区下,由于电网改造,会使得用户在电气距离较近的线路间转移,而GIS系统未及时更新这类拓扑结构变化。针对此类拓扑结构变化利用本文所提算法进行校验,更新GIS系统中用户所在线路。
GIS中初始拓扑结构如图2所示,以线路1作为校验对象,各线路上的用户配置AMI智能电表M1-M16。
(1)首先选择线路1上各用户智能电表量测数据,相似度阈值取0.9,初始聚类数k=2;
(2)经过噪声处理后准确获取线路1上记录的16个用户电压数据,开始聚类算法;
(3)由自适应k值选择算法可以得出该线路上可聚类数为3,即除本线路用户外还有两类错误连接用户数据;
(4)聚类结果如图3所示,由图3明显可知M1-M10为本线路用户,其曲线变化形式与聚类中心1具有较大的相似性,故可聚为一类;而M11-M13和M14-M16与该聚类中心曲线形式差异较大,与聚类中心2、3曲线形式相同,为连接错误用户;
(5)通过将其与线路2、线路3中的用户电压数据作相似性分析可得到该两类用户所属线路;相似度分析结果如表1所示,电压曲线如图4、图5所示;
(6)由表1可以得到,用户M11-M13与线路2下的用户M17-M23电压曲线相似度大于0.9,与线路3下用户M24-M31电压曲线相似度远小于0.9,且由图4可判断其电压曲线变化形式与线路2下用户相近,故用户M11-M13实际应属于线路2,且由电压幅值可知该类用户节点位于线路末端;
另由表1可得,用户M14-M16与线路3下的用户电压曲线相似度大于0.9,且与线路2下用户电压曲线相似度较小,由图5可判断其电压曲线变化形式与线路3下用户电压曲线变化形式相近,故用户M14-M16实际应属于线路3,再根据电压幅值确定用户所在线路上下游关系,最终得到校验后的拓扑结构如图6所示。
二、不同台区间用户校验
在多台变压器供电范围交界处,常常由于某一台区下用户容量大于该变压器容量而将用户连接至相邻台区下,针对此类问题进行,以台区A用户数据进行校验,变压器台区供电范围如图7所示。
(1)获取台区A下用户电压数据,经聚类后可自动获取聚类数为5类,聚类后结果如图8所示;
(2)将用户电压曲线按照相似度聚类为5类,其中聚类中心1-4下的曲线分别为线路1到线路4下用户电压曲线;而聚类中心5下电压曲线M37、M38为电网改造后连接在其他台区下的用户,即拓扑连接错误用户;
(3)将聚类出的拓扑连接错误数据与相邻台区B和台区C用户电压做相似性计算,经相似度分析后该类用户实际属于台区B。
表1M11-M13和M14-M16与线路2和线路3用户电压相似度
用户号 | M17 | M18 | M19 | M20 | M24 | M25 | M26 | M27 |
M11 | 0.9882 | 0.9845 | 0.9832 | 0.9843 | 0.7651 | 0.7542 | 0.7689 | 0.7643 |
M12 | 0.9983 | 0.9912 | 0.9923 | 0.9985 | 0.7517 | 0.7523 | 0.7656 | 0.7668 |
M13 | 0.9878 | 0.9876 | 0.9877 | 0.9872 | 0.7714 | 0.7775 | 0.7765 | 0.7761 |
M14 | 0.7531 | 0.7552 | 0.7589 | 0.7601 | 0.9772 | 0.9745 | 0.9743 | 0.9744 |
M15 | 0.7601 | 0.7612 | 0.7603 | 0.7615 | 0.9758 | 0.9736 | 0.9756 | 0.9734 |
M16 | 0.7589 | 0.7588 | 0.7593 | 0.7578 | 0.9845 | 0.9872 | 0.9816 | 0.9853 |
实施例2
本公开提供一种基于改进k值聚类算法的低压配电网拓扑校验系统,包括:
预处理模块,其用于对获取的初始电压数据集进行噪声处理,得到高密度数据集;
初始聚类模块,其用于采用k值选择算法,对高密度数据集自动选择k值和初始聚类中心,完成初始聚类;
聚类更新模块,其用于以高密度数据集中各数据点分量均值更新聚类中心,得到最终聚类集合;
相似判断模块,其用于采用相似度系数判断聚类集合中连接错误的数据点与相邻台区的相似性,确定其所属台区,更新GIS系统拓扑结构图。
所述预处理模块包括,在初始电压数据集中选取目标数据点,依次计算该目标数据点与其余数据点间的欧式距离,得到距离数集;
计算距离数集中的平均距离,以目标数据点为中心,平均距离为直径作邻域,得出初始电压数据集中在此邻域内的数据点的个数;
判断数据点个数是否大于设定的阈值,若是,则将该目标数据点加入到高密度数据集中,否则删除该目标数据点。
所述初始聚类模块包括,选定k值初始值,以及根据欧式距离最大的数据点作为初始聚类中心;
采用皮尔逊相似系数方法,计算其余数据点与初始聚类中心的相似系数,设置相似系数阈值,将满足相似系数阈值的数据点进行聚类。
所述聚类更新模块包括,更新聚类中心重新聚类后,计算得到的各聚类集合的收敛精度,判断各聚类集合中各数据点相对于各聚类集合中聚类中心的距离之和是否变化,若不变表示聚类结束,聚类结果收敛;否则重新聚类。
以上仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (10)
1.基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,包括:
对获取的初始电压数据集进行噪声处理,得到高密度数据集;
采用k值选择算法,对高密度数据集自动选择k值和初始聚类中心,完成初始聚类;
以高密度数据集中各数据点分量均值更新聚类中心,得到最终的聚类集合;
采用相似度系数判断聚类集合中连接错误的数据点与相邻台区的相似性,确定其所属台区,更新GIS系统拓扑结构图。
2.如权利要求1所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
所述噪声处理为,在初始电压数据集中选取目标数据点,依次计算该目标数据点与其余数据点间的欧式距离,得到距离数集;
计算距离数集中的平均距离,以目标数据点为中心,平均距离为直径作邻域,得出初始电压数据集中在此邻域内的数据点的个数;
判断数据点个数是否大于设定的阈值,若是,则将该目标数据点加入到高密度数据集中,否则删除该目标数据点。
3.如权利要求1所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
所述初步聚类过程为,选定k值初始值,以及根据欧式距离最大的数据点作为初始聚类中心;
采用皮尔逊相似系数方法,计算其余数据点与初始聚类中心的相似系数,设置相似系数阈值,将满足相似系数阈值的数据点进行聚类。
4.如权利要求3所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
选择其中一个初始聚类中心进行聚类,以相似系数阈值为聚类条件,得到第一聚类中心的第一聚类集合,并在高密度数据集中删除该集合,得到第一剩余数据集;
依次完成其余初始聚类中心的聚类,得到相应的聚类集合,并在相应的剩余数据集中删除聚类集合;
对最终剩余数据集进行判断,判断其是否为空集,若为空集完成初始聚类;否则以第一剩余数据集为新数据集,增加K值重新聚类,直到最终剩余数据集为空集。
5.如权利要求1所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
所述更新聚类中心,重新聚类后,计算得到的各聚类集合的收敛精度,判断各聚类集合中各数据点相对于各聚类集合中聚类中心的距离之和是否变化,若不变表示聚类结束,聚类结果收敛;否则重新聚类。
6.如权利要求1所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
根据聚类结果,确定错误连接的聚类集合,采用皮尔逊相似系数判断错误连接的聚类集合中数据点与相邻台区的相似性,将其归入所属台区,更新GIS系统拓扑结构图,最终完成校验。
7.基于改进k值聚类算法的低压配电网拓扑校验系统,其特征在于,包括:
预处理模块,其用于对获取的初始电压数据集进行噪声处理,得到高密度数据集;
初始聚类模块,其用于采用k值选择算法,对高密度数据集自动选择k值和初始聚类中心,完成初始聚类;
聚类更新模块,其用于以高密度数据集中各数据点分量均值更新聚类中心,得到最终的聚类集合;
相似判断模块,其用于采用相似度系数判断聚类集合中连接错误的数据点与相邻台区的相似性,确定其所属台区,更新GIS系统拓扑结构图。
8.如权利要求7所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
所述预处理模块包括,在初始电压数据集中选取目标数据点,依次计算该目标数据点与其余数据点间的欧式距离,得到距离数集;
计算距离数集中的平均距离,以目标数据点为中心,平均距离为直径作邻域,得出初始电压数据集中在此邻域内的数据点的个数;
判断数据点个数是否大于设定的阈值,若是,则将该目标数据点加入到高密度数据集中,否则删除该目标数据点。
9.如权利要求7所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
所述初始聚类模块包括,选定k值初始值,以及根据欧式距离最大的数据点作为初始聚类中心;
采用皮尔逊相似系数方法,计算其余数据点与初始聚类中心的相似系数,设置相似系数阈值,将满足相似系数阈值的数据点进行聚类。
10.如权利要求7所述的基于改进k值聚类算法的低压配电网拓扑校验方法,其特征在于,
所述聚类更新模块包括,更新聚类中心重新聚类后,计算得到的各聚类集合的收敛精度,判断各聚类集合中各数据点相对于各聚类集合中聚类中心的距离之和是否变化,若不变表示聚类结束,聚类结果收敛;否则重新聚类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911100635.8A CN111061821B (zh) | 2019-11-12 | 2019-11-12 | 基于改进k值聚类算法的低压配电网拓扑校验方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911100635.8A CN111061821B (zh) | 2019-11-12 | 2019-11-12 | 基于改进k值聚类算法的低压配电网拓扑校验方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111061821A true CN111061821A (zh) | 2020-04-24 |
CN111061821B CN111061821B (zh) | 2024-02-02 |
Family
ID=70297744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911100635.8A Active CN111061821B (zh) | 2019-11-12 | 2019-11-12 | 基于改进k值聚类算法的低压配电网拓扑校验方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111061821B (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651448A (zh) * | 2020-08-10 | 2020-09-11 | 广东电网有限责任公司惠州供电局 | 一种基于降噪差分进化的低压拓扑识别方法 |
CN111695600A (zh) * | 2020-05-13 | 2020-09-22 | 国网湖北省电力有限公司电力科学研究院 | 一种基于多阈值和knn的台区分类方法 |
CN112187518A (zh) * | 2020-09-07 | 2021-01-05 | 佳源科技有限公司 | 智能融合终端台区拓扑识别方法及系统 |
CN112258383A (zh) * | 2020-10-20 | 2021-01-22 | 杭州海康威视数字技术股份有限公司 | 一种鱼眼图像中有效区域的确定方法、装置及设备 |
CN112257803A (zh) * | 2020-10-30 | 2021-01-22 | 青岛东软载波科技股份有限公司 | 一种台区故障智能分析方法和系统 |
CN112329806A (zh) * | 2020-09-01 | 2021-02-05 | 华南理工大学 | 一种用于低压台区拓扑识别的电表聚类方法 |
CN112488478A (zh) * | 2020-11-24 | 2021-03-12 | 中能新电(浙江)电力发展有限公司 | 一种用于低压台区拓扑识别方法、装置及储存介质 |
CN112562038A (zh) * | 2020-12-22 | 2021-03-26 | 广东电网有限责任公司茂名供电局 | 一种基于聚类分析的低压配电网图形生成方法 |
CN112597634A (zh) * | 2020-12-06 | 2021-04-02 | 国网山东省电力公司电力科学研究院 | 一种配电网拓扑数据校验方法及系统 |
CN112598041A (zh) * | 2020-12-17 | 2021-04-02 | 武汉大学 | 一种基于k-means算法的配电网云平台数据校验方法 |
CN112615428A (zh) * | 2020-12-04 | 2021-04-06 | 国网辽宁省电力有限公司沈阳供电公司 | 一种线损分析治理系统及方法 |
CN112699913A (zh) * | 2020-11-25 | 2021-04-23 | 国网湖南省电力有限公司 | 一种台区户变关系异常诊断方法及装置 |
CN113114497A (zh) * | 2021-04-06 | 2021-07-13 | 广西电网有限责任公司电力科学研究院 | 一种低压台区拓扑自动识别方法 |
CN113656937A (zh) * | 2021-07-06 | 2021-11-16 | 北京智芯微电子科技有限公司 | 用于识别电力设备拓扑的方法、装置、存储介质及处理器 |
CN113659564A (zh) * | 2021-07-19 | 2021-11-16 | 云南电网有限责任公司昆明供电局 | 基于电压波动特征聚类的低压配电网拓扑识别方法及系统 |
CN113675953A (zh) * | 2021-09-15 | 2021-11-19 | 江苏方天电力技术有限公司 | 一种基于电压相似度聚类的低压台区拓扑识别方法 |
CN114881164A (zh) * | 2022-05-24 | 2022-08-09 | 国网江苏省电力有限公司电力科学研究院 | 一种基于图数据库的配电网拓扑自动校核方法及装置 |
CN115144780A (zh) * | 2022-06-16 | 2022-10-04 | 中国第一汽车股份有限公司 | 电池的健康检测方法及存储介质 |
CN116089849A (zh) * | 2023-04-10 | 2023-05-09 | 国网江西省电力有限公司电力科学研究院 | 一种基于大数据的配电网拓扑自动识别方法及系统 |
CN117556288A (zh) * | 2023-12-28 | 2024-02-13 | 深圳微盐红创设计院有限公司 | 一种基于物联网的物理空间管理系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016049975A1 (zh) * | 2014-09-29 | 2016-04-07 | 同济大学 | 一种基于集聚系数的自适应聚类方法及系统 |
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN108054755A (zh) * | 2017-12-26 | 2018-05-18 | 广州市捷信通科技发展有限公司 | 一种基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN109325545A (zh) * | 2018-10-16 | 2019-02-12 | 南方电网科学研究院有限责任公司 | 低压配电网拓扑结构校验方法、装置、设备及存储介质 |
CN109740641A (zh) * | 2018-12-18 | 2019-05-10 | 清华四川能源互联网研究院 | 一种基于主成分分析和k-means聚类的台区用户识别方法 |
-
2019
- 2019-11-12 CN CN201911100635.8A patent/CN111061821B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016049975A1 (zh) * | 2014-09-29 | 2016-04-07 | 同济大学 | 一种基于集聚系数的自适应聚类方法及系统 |
CN106250927A (zh) * | 2016-07-29 | 2016-12-21 | 国网河南省电力公司电力科学研究院 | 基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN108054755A (zh) * | 2017-12-26 | 2018-05-18 | 广州市捷信通科技发展有限公司 | 一种基于k最近邻分类算法的配电网拓扑结构校验方法 |
CN109325545A (zh) * | 2018-10-16 | 2019-02-12 | 南方电网科学研究院有限责任公司 | 低压配电网拓扑结构校验方法、装置、设备及存储介质 |
CN109740641A (zh) * | 2018-12-18 | 2019-05-10 | 清华四川能源互联网研究院 | 一种基于主成分分析和k-means聚类的台区用户识别方法 |
Non-Patent Citations (12)
Title |
---|
傅德胜;周辰;: "基于密度的改进K均值算法及实现", 计算机应用, no. 02, pages 1 * |
傅德胜等: "基于密度的改进K均值算法及实现", 《计算机应用》 * |
傅德胜等: "基于密度的改进K均值算法及实现", 《计算机应用》, no. 02, 1 February 2011 (2011-02-01), pages 1 * |
吉兴全等: "基于密度的改进K均值聚类算法在配网区块划分中的应用", 《山东大学学报(工学版)》 * |
吉兴全等: "基于密度的改进K均值聚类算法在配网区块划分中的应用", 《山东大学学报(工学版)》, no. 04, 30 August 2016 (2016-08-30) * |
杨莉;沈鑫;李英娜;李萌萌;: "基于电力数据聚类分析的算法改进", 云南电力技术, no. 06 * |
耿俊成等: "基于离群点检测的低压配电网拓扑结构校验", 《电力信息与通信技术》 * |
耿俊成等: "基于离群点检测的低压配电网拓扑结构校验", 《电力信息与通信技术》, no. 05, 15 May 2017 (2017-05-15) * |
肖勇等: "基于改进的皮尔逊相关系数的低压配电网拓扑结构校验方法", 《电力系统保护与控制》 * |
肖勇等: "基于改进的皮尔逊相关系数的低压配电网拓扑结构校验方法", 《电力系统保护与控制》, no. 11, 1 June 2019 (2019-06-01) * |
陈杰等: "基于簇间相似度判定的自适应K均值算法", 《计算机工程与设计》 * |
陈杰等: "基于簇间相似度判定的自适应K均值算法", 《计算机工程与设计》, no. 10, 28 May 2010 (2010-05-28) * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111695600A (zh) * | 2020-05-13 | 2020-09-22 | 国网湖北省电力有限公司电力科学研究院 | 一种基于多阈值和knn的台区分类方法 |
CN111695600B (zh) * | 2020-05-13 | 2023-08-18 | 国网湖北省电力有限公司电力科学研究院 | 一种基于多阈值和knn的台区分类方法 |
CN111651448B (zh) * | 2020-08-10 | 2021-01-15 | 广东电网有限责任公司惠州供电局 | 一种基于降噪差分进化的低压拓扑识别方法 |
CN111651448A (zh) * | 2020-08-10 | 2020-09-11 | 广东电网有限责任公司惠州供电局 | 一种基于降噪差分进化的低压拓扑识别方法 |
CN112329806A (zh) * | 2020-09-01 | 2021-02-05 | 华南理工大学 | 一种用于低压台区拓扑识别的电表聚类方法 |
CN112329806B (zh) * | 2020-09-01 | 2023-09-26 | 华南理工大学 | 一种用于低压台区拓扑识别的电表聚类方法 |
CN112187518A (zh) * | 2020-09-07 | 2021-01-05 | 佳源科技有限公司 | 智能融合终端台区拓扑识别方法及系统 |
CN112258383B (zh) * | 2020-10-20 | 2023-07-25 | 杭州海康威视数字技术股份有限公司 | 一种鱼眼图像中有效区域的确定方法、装置及设备 |
CN112258383A (zh) * | 2020-10-20 | 2021-01-22 | 杭州海康威视数字技术股份有限公司 | 一种鱼眼图像中有效区域的确定方法、装置及设备 |
CN112257803A (zh) * | 2020-10-30 | 2021-01-22 | 青岛东软载波科技股份有限公司 | 一种台区故障智能分析方法和系统 |
CN112488478A (zh) * | 2020-11-24 | 2021-03-12 | 中能新电(浙江)电力发展有限公司 | 一种用于低压台区拓扑识别方法、装置及储存介质 |
CN112699913A (zh) * | 2020-11-25 | 2021-04-23 | 国网湖南省电力有限公司 | 一种台区户变关系异常诊断方法及装置 |
CN112699913B (zh) * | 2020-11-25 | 2023-08-29 | 国网湖南省电力有限公司 | 一种台区户变关系异常诊断方法及装置 |
CN112615428A (zh) * | 2020-12-04 | 2021-04-06 | 国网辽宁省电力有限公司沈阳供电公司 | 一种线损分析治理系统及方法 |
CN112597634A (zh) * | 2020-12-06 | 2021-04-02 | 国网山东省电力公司电力科学研究院 | 一种配电网拓扑数据校验方法及系统 |
CN112598041A (zh) * | 2020-12-17 | 2021-04-02 | 武汉大学 | 一种基于k-means算法的配电网云平台数据校验方法 |
CN112562038A (zh) * | 2020-12-22 | 2021-03-26 | 广东电网有限责任公司茂名供电局 | 一种基于聚类分析的低压配电网图形生成方法 |
CN113114497A (zh) * | 2021-04-06 | 2021-07-13 | 广西电网有限责任公司电力科学研究院 | 一种低压台区拓扑自动识别方法 |
CN113656937A (zh) * | 2021-07-06 | 2021-11-16 | 北京智芯微电子科技有限公司 | 用于识别电力设备拓扑的方法、装置、存储介质及处理器 |
CN113659564A (zh) * | 2021-07-19 | 2021-11-16 | 云南电网有限责任公司昆明供电局 | 基于电压波动特征聚类的低压配电网拓扑识别方法及系统 |
CN113659564B (zh) * | 2021-07-19 | 2024-01-05 | 云南电网有限责任公司昆明供电局 | 基于电压波动特征聚类的低压配电网拓扑识别方法及系统 |
CN113675953A (zh) * | 2021-09-15 | 2021-11-19 | 江苏方天电力技术有限公司 | 一种基于电压相似度聚类的低压台区拓扑识别方法 |
CN114881164A (zh) * | 2022-05-24 | 2022-08-09 | 国网江苏省电力有限公司电力科学研究院 | 一种基于图数据库的配电网拓扑自动校核方法及装置 |
CN114881164B (zh) * | 2022-05-24 | 2024-05-31 | 国网江苏省电力有限公司电力科学研究院 | 一种基于图数据库的配电网拓扑自动校核方法及装置 |
CN115144780A (zh) * | 2022-06-16 | 2022-10-04 | 中国第一汽车股份有限公司 | 电池的健康检测方法及存储介质 |
CN116089849B (zh) * | 2023-04-10 | 2023-07-04 | 国网江西省电力有限公司电力科学研究院 | 一种基于大数据的配电网拓扑自动识别方法及系统 |
CN116089849A (zh) * | 2023-04-10 | 2023-05-09 | 国网江西省电力有限公司电力科学研究院 | 一种基于大数据的配电网拓扑自动识别方法及系统 |
CN117556288A (zh) * | 2023-12-28 | 2024-02-13 | 深圳微盐红创设计院有限公司 | 一种基于物联网的物理空间管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111061821B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111061821B (zh) | 基于改进k值聚类算法的低压配电网拓扑校验方法及系统 | |
CN111505433B (zh) | 一种低压台区户变关系纠错及相位识别方法 | |
CN112699913B (zh) | 一种台区户变关系异常诊断方法及装置 | |
CN110008254B (zh) | 一种变电设备台账核查处理方法 | |
CN109829497B (zh) | 一种基于监督学习的台区用户识别及判别方法 | |
CN109873501A (zh) | 一种低压配电网拓扑自动识别方法 | |
CN111625991A (zh) | 一种低压配电网拓扑校验方法 | |
CN110687361A (zh) | 一种用于识别低压配网台区相序的方法及系统 | |
CN111612056B (zh) | 一种基于模糊聚类和过零偏移的低压户变关系识别方法 | |
CN112117763A (zh) | 一种低压配电网拓扑识别与参数估计方法 | |
CN110601173B (zh) | 基于边缘计算的配网拓扑识别方法及装置 | |
CN113189418B (zh) | 一种基于电压数据的拓扑关系识别方法 | |
CN113176458B (zh) | 一种针对数据不完整的低压台区相户关系识别方法 | |
CN112948757A (zh) | 一种基于改进皮尔逊相关系数的低压台区拓扑校验方法 | |
CN111709668A (zh) | 基于数据挖掘技术的电网设备参数风险识别方法及装置 | |
CN112688428A (zh) | 一种基于物联网技术的10千伏电网同期线损治理方法 | |
CN115545280A (zh) | 一种低压配电网络拓扑生成方法及装置 | |
CN114519514A (zh) | 一种低压台区合理线损值测算方法、系统及计算机设备 | |
CN110544047A (zh) | 一种不良数据辨识方法 | |
CN115618249A (zh) | 一种基于LargeVis降维与DBSCAN聚类的低压配电台区相位识别方法 | |
CN107290714B (zh) | 一种基于多标识指纹定位的定位方法 | |
CN111835006A (zh) | 一种基于电压曲线和最小二乘的低压台区拓扑识别方法 | |
CN116845971A (zh) | 一种光伏并网低压台区拓扑结构自动识别方法 | |
CN110909786A (zh) | 一种基于特性指标与决策树模型的新装用户负荷辨识方法 | |
CN110222098A (zh) | 基于流数据聚类算法的电力大数据流异常检测 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |