CN112966970A - 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质 - Google Patents

一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质 Download PDF

Info

Publication number
CN112966970A
CN112966970A CN202110339621.2A CN202110339621A CN112966970A CN 112966970 A CN112966970 A CN 112966970A CN 202110339621 A CN202110339621 A CN 202110339621A CN 112966970 A CN112966970 A CN 112966970A
Authority
CN
China
Prior art keywords
area
clustering
line loss
distribution
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110339621.2A
Other languages
English (en)
Inventor
李佳新
朱正甲
皇甫成
陈建华
梁吉
汪鸿
赵丹阳
徐凌燕
陈广宇
孟菁
邱婷
拓广忠
李胜雨
陈亮
张宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING BRON S&T Ltd
State Grid Corp of China SGCC
State Grid Jibei Electric Power Co Ltd
Original Assignee
BEIJING BRON S&T Ltd
State Grid Corp of China SGCC
State Grid Jibei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING BRON S&T Ltd, State Grid Corp of China SGCC, State Grid Jibei Electric Power Co Ltd filed Critical BEIJING BRON S&T Ltd
Priority to CN202110339621.2A priority Critical patent/CN112966970A/zh
Publication of CN112966970A publication Critical patent/CN112966970A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于Canopy‑Kmedoids算法的台区线损数据处理方法、装置、介质,该方法包括:采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,采用Canpoy算法对数据集进行“粗”聚类,以Canopy子集的中心点作为K‑medoids算法的初始中心点进行“细聚类”,通过计算每种聚类方案的误差平方和SSE,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值作为最优结果,使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。本发明提高了聚类效果,使得线损计算准确、客观。

Description

一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装 置、介质
技术领域
本发明涉及智能电网数据处理技术领域,特别是一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质。
背景技术
现有技术中,目前电网企业台区线损管理普遍采用一刀切的方式,通过人工设置台区合理线损率开展日常管理工作,没有考虑各台区在导线选型、供电半径、负荷分布、用户类别、负载水平、用电季节、运行年限等方面的差异,缺乏科学依据,在指导具体节能降耗工作实施方面缺乏实际参考意义。鉴于电网企业对台区线损管理的要求逐年提高,更加合理、精确的理论线损率计算方法迫在眉睫。对台区进行精确划分,是实现台区精细化管理的重要途径。
但是,现有技术中对台区的聚类划分不够准确,有的时候是依据人的主观因素进行划分,划分结果不够客观,如何进行电网台区的精确地、客观的划分聚类是进行线损控制的一个难题,且聚类后存在多个聚类方案时,难以选择出最佳的聚类方案。
发明内容
本发明针对上述现有技术中的缺陷,提出了如下技术方案。
一种基于Canpoy-Kmedoids算法的台区线损数据处理方法,该方法包括以下步骤:
步骤S1,采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;
步骤S2,基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,通过Canpoy算法对所述台区样本集合进行“粗”聚类,得到Canpoy子集;
步骤S3,以Canopy子集的中心点作为K-medoids算法的初始中心点进行“细聚类”,采用K-medoids算法对所述台区样本集合再进行台区类别聚类;
步骤S4,通过计算每种聚类方案的误差平方和SSE,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值作为最优结果;
步骤S5,基于台区聚类划分的所述最优结果,根据选取的台区静态参数,分析判断台区类型划分是否合理,如果是,则使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。
更进一步地,所述步骤S1的操作为:采集配电网台区基础数据信息,所述基础数据信息包括:接入及校对设备台账数据、表计档案、计量点档案、用户信息和台区信息等;对所述基础数据信息进行处理,选取对影响线损率的台区运行年限、城农网标识、居民容量占比、居民户均容量和台区用户数量作为台区静态参数,基于所述台区静态参数筛选线损率稳定的台区样本集合。
更进一步地,基于所述台区静态参数筛选线损率稳定的台区样本集合时,删除以下几种不合格台区:采集的基础数据信息未全覆盖、台区下有特殊用电用户以及线损率为负值或超过10%,所述特殊用电用户为光伏发电用户或发生业务变更的用户。
更进一步地,步骤S2的操作过程为:通过Canpoy算法对所述台区样本集合进行“粗”聚类,得到Canpoy子集,包括:
①将所述台区样本集合构成List集合,然后指定两个距离阈值T1和T2(T1>T2);
②随机选取List中的一个台区对象P,构成一个新的Canpoy,并将台区对象P从集合List中移除;
③对于List中剩余的台区对象,计算与台区对象P之间的距离,如果间距小于T1,就把它分配到台区对象P所在的Canpoy中;如果与台区对象P的间距小于T2,则将它从List中删除,④重复步骤②和③,直到List为空。
所述步骤S3的操作为:将形成的Canpoy子集数目作为K值,Canpoy子集的中心点作为K-medoids算法的初始的聚类中心点进行聚类,其中K-medoids算法采用聚类质量评价函数对所述台区样本集合中的台区对象进行迭代划分,所述聚类质量评价函数定义如下:
Figure BDA0002998972490000031
其中,E是参加聚类的所有台区对象p与其所属簇的中心对象oi的绝对误差之和,k为簇数,所述K-medoids算法通过最小化E把所有台区对象分配至k个簇,Ci为第i个簇;
①在所述台区样本集合D中随机选择k个台区对象作为每个簇初始中心台区对象;
②将剩余台区对象分配至与其最近的中心台区对象所代表的簇中;
③选取一个未选取过的中心台区对象;
④选取一个未选取过的非中心台区对象;如果用oj替换oi聚类质量评价函数变小,则用oj替换oi并形成新k个中心台区对象的聚类集合;
⑤重复步骤④直至所有非中心台区对象都被选取过;
⑥重复步骤③直至所有中心台区对象都被选取过,最后将所述台区样本集合D中的台区对象分为k个簇。
更进一步地,所述步骤S4的操作为:通过计算每种聚类方案的误差平方和SSE,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值,其中手肘法的核心判断是随着聚类数K的增加,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和SSE会逐渐变小。并且,当K小于真实聚类数时,由于K的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当K到达真实聚类数时,再增加K所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,然后随着K值的继续增大而趋于平缓,也就是说SSE和K的关系图是一个手肘的形状,而这个肘部对应的K值就是数据的真实聚类数。
本发明还提出了一种基于Canopy-Kmedoids算法的台区线损数据处理装置,所述装置包括处理器、存储器及显示设备,所述处理器执行所述存储器上的程序以实现上述任一方法。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上的程序以实现上述任一方法。
本发明的一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质,该方法包括以下步骤:步骤S1,采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;步骤S2,基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,采用Canopy-Kmedoids算法对所述台区样本集合进行台区类别聚类;步骤S3,通过计算每种聚类方案的误差平方和,统计每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值;;步骤S4,基于台区聚类划分的所述最优结果,根据选取的台区静态参数,分析判断台区类型划分是否合理,如果是,则使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。本发明中,由于在数据整理时去掉了不合格台区,从而提高了台区聚类划分的准确性及客观性,本发明使用Canopy-Kmedoids算法对台区对象进行分类,提高了台区对象聚类划分的准确性及客观性,降低了噪声数据的影响,提高了聚类效果,本发明中,对聚类结果采用轮廓系数方法进行分析,选择出最优的台区聚类划分,作为台区类别划分的最终结果,同时确定各簇的中心台区对象,从而进行线损的计算,使得线损计算准确、客观,提高了线损评估的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。
图1是根据本发明的实施例的一种基于Canopy-Kmedoids算法的台区线损数据处理方法的流程图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了本发明的一种基于Canopy-Kmedoids算法的台区线损数据处理方法,该方法包括以下步骤:
步骤S1,采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;
步骤S2,基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,通过Canpoy算法对所述台区样本集合进行“粗”聚类,得到Canpoy子集;
步骤S3,以Canopy子集的中心点作为K-medoids算法的初始中心点进行“细聚类”,采用K-medoids算法对所述台区样本集合再进行台区类别聚类;
步骤S4,通过计算每种聚类方案的误差平方和SSE,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值作为最优结果;
步骤S5,基于台区聚类划分的所述最优结果,根据选取的台区静态参数,分析判断台区类型划分是否合理,如果是,则使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。
在一个实施例中,所述步骤S1的操作为:采集配电网台区基础数据信息,所述基础数据信息包括:接入及校对设备台账数据、表计档案、计量点档案、用户信息和台区信息等;对所述基础数据信息进行处理,选取对影响线损率的台区运行年限、城农网标识、居民容量占比、居民户均容量和台区用户数量作为台区静态参数,基于所述台区静态参数筛选线损率稳定的台区样本集合。在实际数据采集中,有的台区数据明显异常需要将其去掉,即基于所述台区静态参数筛选线损率稳定的台区样本集合时,删除以下几种不合格台区:采集的基础数据信息未全覆盖、台区下有特殊用电用户以及线损率为负值或超过10%,所述特殊用电用户为光伏发电用户或发生业务变更的用户。由于在数据整理时去掉了不合格台区,从而提高了台区聚类划分的准确性及客观性,对于这些不合格的台区,可以人工排查导致数据异常的原因。最后形成的台区样本集合为D,p为D中的一个台区对象,p为一个向量,其由该台区的基础数据信息构成,这是本发明的一个重要发明点。
在一个实施例中,通过Canpoy算法对所述台区样本集合进行“粗”聚类,得到Canpoy子集,包括:
①将所述台区样本集合构成List集合,然后指定两个距离阈值T1和T2(T1>T2);
②随机选取List中的一个台区对象P,构成一个新的Canpoy,并将台区对象P从集合List中移除;
③对于List中剩余的台区对象,计算与台区对象P之间的距离,如果间距小于T1,就把它分配到台区对象P所在的Canpoy中;如果与台区对象P的间距小于T2,则将它从List中删除,④重复步骤②和③,直到List为空。
更进一步地,步骤S3的操作过程为:
将形成的Canpoy子集数目作为K值,Canpoy子集的中心点作为K-medoids算法的初始的聚类中心点进行聚类,其中K-medoids算法采用聚类质量评价函数对所述台区样本集合中的台区对象进行迭代划分,所述聚类质量评价函数定义如下:
Figure BDA0002998972490000081
其中,E是参加聚类的所有台区对象p与其所属簇的中心对象oi的绝对误差之和,k为簇数,所述K-medoids算法通过最小化E把所有台区对象分配至k个簇,Ci为第i个簇;
①在所述台区样本集合D中随机选择k个台区对象作为每个簇初始中心台区对象;
②将剩余台区对象分配至与其最近的中心台区对象所代表的簇中;
③选取一个未选取过的中心台区对象;
④选取一个未选取过的非中心台区对象;如果用oj替换oi聚类质量评价函数变小,则用oj替换oi并形成新k个中心台区对象的聚类集合;
⑤重复步骤④直至所有非中心台区对象都被选取过;
⑥重复步骤③直至所有中心台区对象都被选取过,最后将所述台区样本集合D中的台区对象分为k个簇。
本发明使用K-medoids算法进行台区聚类,K-means算法和K-medoids算法是两种最常用基于划分的聚类方法。其中,K-means算法由于采用簇中对象的均值作为簇中心,当遇到离群点对象时会严重扭曲簇中心,影响了其它对象到簇的分配,因而K-means算法对噪声数据比较敏感。与K-means算法相比,K-medoids算法选取实际对象作为簇中心对象,剩余对象分配到与其最相似的中心对象所在的簇,从而降低了噪声数据影响。相比K-means,本发明使用K-medoids对台区对象进行聚类,提高了台区对象聚类划分的准确性及客观性,降低了噪声数据的影响,提高了聚类效果,这是本发明的另一个重要发明点。
在一个实施例中,所述步骤S4的操作为:
通过计算每种聚类方案的误差平方和SSE,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值,其中手肘法的核心判断是随着聚类数K的增加,样本划分会更加精细,每个簇的聚合程度会逐渐提高,那么误差平方和SSE会逐渐变小。并且,当K小于真实聚类数时,由于K的增大会大幅增加每个簇的聚合程度,故SSE的下降幅度会很大,而当K到达真实聚类数时,再增加K所得到的聚合程度回报会迅速变小,所以SSE的下降幅度会骤减,然后随着K值的继续增大而趋于平缓,也就是说SSE和K的关系图是一个手肘的形状,而这个肘部对应的K值就是数据的真实聚类数,从而求出最优的聚类结果,解决了现有技术中难以确定最优聚类结果的缺陷,这是本发明的重要发明点之一。
本发明中,通过Canpoy算法对数据集进行“粗”聚类,得到Canpoy子集,以Canopy子集的中心点作为Kmedoids算法的初始中心点进行“细聚类”,再通过手肘法计算出最佳K值作为台区类别划分的最终结果,同时确定各簇的中心台区对象,从而进行线损的计算,使得线损计算准确、客观,Canopy算法弥补了Kmedoids聚类中指定K值和初始中心点随机选取的不足的确定,使得算法结果更加精准,即本发明中使用Canpoy算法先进行初始聚类,以Canopy子集的中心点作为Kmedoids算法的初始中心点再进行“细聚类”,解决现有Kmedoids聚类算法中心点随机选择的聚类存在偶然性,提高了聚类效果,这是本发明的重要发明点之另一。
在一个实施例中,根据线损计算结果确定影响电网线损的主要指标,基于所述主要指标对电网运行系统进行控制,以降低所述地区的电网线损。
本发明还提出了一种基于Canopy-K-medoids算法的台区线损数据处理装置,所述装置包括处理器、存储器及显示设备,所述处理器执行所述存储器上的程序以实现上述任一方法。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上的程序以实现上述任一方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。

Claims (8)

1.一种基于Canopy-Kmedoids算法的台区线损数据处理方法,其特征在于:该方法包括以下步骤:
步骤S1,采集配电网台区的基础数据信息,所述基础数据信息包括所述台区的静态参数,基于所述静态参数筛选出线损率稳定的台区样本集合;
步骤S2,基于所述基础数据信息分析台区线损率影响因素,选择影响程度大的台区静态参数,通过Canpoy算法对所述台区样本集合进行“粗”聚类,得到Canpoy子集;
步骤S3,以Canopy子集的中心点作为K-medoids算法的初始中心点进行“细聚类”,采用K-medoids算法对所述台区样本集合再进行台区类别聚类;
步骤S4,通过计算每种聚类方案的误差平方和SSE,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值作为最优结果;
步骤S5,基于台区聚类划分的所述最优结果,根据选取的台区静态参数,分析判断台区类型划分是否合理,如果是,则使用所述最优结果进行该台区的线损计算,并根据线损计算结果对电网进行控制。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1的操作为:采集配电网台区基础数据信息,所述基础数据信息包括:接入及校对设备台账数据、表计档案、计量点档案、用户信息和台区信息等;对所述基础数据信息进行处理,选取对影响线损率的台区运行年限、城农网标识、居民容量占比、居民户均容量和台区用户数量作为台区静态参数,基于所述台区静态参数筛选线损率稳定的台区样本集合。
3.根据权利要求2所述的方法,其特征在于,基于所述台区静态参数筛选线损率稳定的台区样本集合时,删除以下几种不合格台区:采集的基础数据信息未全覆盖、台区下有特殊用电用户以及线损率为负值或超过10%,所述特殊用电用户为光伏发电用户或发生业务变更的用户。
4.根据权利要求3所述的方法,其特征在于,步骤S2的操作过程为:通过Canpoy算法对所述台区样本集合进行“粗”聚类,得到Canpoy子集,包括:
①将所述台区样本集合构成List集合,然后指定两个距离阈值T1和T2(T1>T2);
②随机选取List中的一个台区对象P,构成一个新的Canpoy,并将台区对象P从集合List中移除;
③对于List中剩余的台区对象,计算与台区对象P之间的距离,如果间距小于T1,就把它分配到台区对象P所在的Canpoy中;如果与台区对象P的间距小于T2,则将它从List中删除。
5.根据权利要求4所述的方法,其特征在于,所述步骤S3的操作为:
将形成的Canpoy子集数目作为K值,Canpoy子集的中心点作为K-medoids算法的初始的聚类中心点进行聚类,其中K-medoids算法采用聚类质量评价函数对所述台区样本集合中的台区对象进行迭代划分,所述聚类质量评价函数定义如下:
Figure FDA0002998972480000031
其中,E是参加聚类的所有台区对象p与其所属簇的中心对象oi的绝对误差之和,k为簇数,所述K-medoids算法通过最小化E把所有台区对象分配至k个簇,Ci为第i个簇;
①在所述台区样本集合D中随机选择k个台区对象作为每个簇初始中心台区对象;
②将剩余台区对象分配至与其最近的中心台区对象所代表的簇中;
③选取一个未选取过的中心台区对象;
④选取一个未选取过的非中心台区对象;如果用oj替换oi聚类质量评价函数变小,则用oj替换oi并形成新k个中心台区对象的聚类集合;
⑤重复步骤④直至所有非中心台区对象都被选取过;
⑥重复步骤③直至所有中心台区对象都被选取过,最后将所述台区样本集合D中的台区对象分为k个簇。
6.根据权利要求5所述的方法,其特征在于,通过计算K-medoids的每种聚类方案的误差平方和SSE,以每种聚类方案的误差平方和做出手肘图,选择手肘图拐点处的K值作为最优K值作为最优结果,同时确定各簇的中心台区对象。
7.一种基于Cancopy-Kmedoids算法的台区线损数据处理装置,其特征在于,所述装置包括处理器、存储器及显示设备,所述处理器执行所述存储器上的程序以实现权利要求1-6任一项的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述处理器执行所述存储介质上的程序以实现权利要求1-6任一项的方法。
CN202110339621.2A 2021-03-30 2021-03-30 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质 Pending CN112966970A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110339621.2A CN112966970A (zh) 2021-03-30 2021-03-30 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110339621.2A CN112966970A (zh) 2021-03-30 2021-03-30 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质

Publications (1)

Publication Number Publication Date
CN112966970A true CN112966970A (zh) 2021-06-15

Family

ID=76279551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110339621.2A Pending CN112966970A (zh) 2021-03-30 2021-03-30 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质

Country Status (1)

Country Link
CN (1) CN112966970A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116022196A (zh) * 2023-02-13 2023-04-28 山东大学 一种基于计算机视觉的轨道变形监测系统
CN116632842A (zh) * 2023-07-26 2023-08-22 国网山东省电力公司信息通信公司 基于聚类特性的台区分布式光伏负荷概率预测方法及系统
CN117787572A (zh) * 2024-02-27 2024-03-29 国网山西省电力公司临汾供电公司 一种异常用电用户识别方法、装置、存储介质及电子设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116022196A (zh) * 2023-02-13 2023-04-28 山东大学 一种基于计算机视觉的轨道变形监测系统
CN116022196B (zh) * 2023-02-13 2023-11-03 山东大学 一种基于计算机视觉的轨道变形监测系统
CN116632842A (zh) * 2023-07-26 2023-08-22 国网山东省电力公司信息通信公司 基于聚类特性的台区分布式光伏负荷概率预测方法及系统
CN116632842B (zh) * 2023-07-26 2023-11-10 国网山东省电力公司信息通信公司 基于聚类特性的台区分布式光伏负荷概率预测方法及系统
CN117787572A (zh) * 2024-02-27 2024-03-29 国网山西省电力公司临汾供电公司 一种异常用电用户识别方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN112966970A (zh) 一种基于Canopy-Kmedoids算法的台区线损数据处理方法、装置、介质
CN110991786B (zh) 基于相似日负荷曲线的10kV静态负荷模型参数辨识方法
CN106022509B (zh) 考虑地域和负荷性质双重差异的配电网空间负荷预测方法
CN111126429A (zh) 一种基于PCA降维和K-Means聚类的低压台区用户接入点识别方法
CN111476435B (zh) 基于密度峰值的充电桩负荷预测方法
CN111724278A (zh) 一种面向电力多元负荷用户的精细分类方法及系统
CN111680764B (zh) 一种行业复工复产程度监控方法
CN110119948B (zh) 基于时变权重动态组合的电力用户信用评价方法及系统
CN113837311B (zh) 一种基于需求响应数据的居民客户聚类方法及装置
CN108345908A (zh) 电网数据的分类方法、分类设备及存储介质
CN111680937A (zh) 基于电力数据分级赋权的小微企业复工率评估方法
CN112819299A (zh) 一种基于中心优化的差分K-means负荷聚类方法
CN112634078B (zh) 一种基于多维指标融合的大工业负荷中断优先级评估方法
WO2018006631A1 (zh) 一种用户等级自动划分方法及系统
CN111784204A (zh) 一种基于用户用电行为画像的优质用户挖掘方法及系统
CN115422788B (zh) 一种配电网线损分析管理方法、装置、存储介质及系统
CN111242430A (zh) 电力设备供应商评价方法和装置
CN106779272A (zh) 一种风险预测方法和设备
CN107273918A (zh) 一种样本数据类别确定方法和设备
CN113962477A (zh) 一种产业电量关联聚集预测方法、装置、设备及存储介质
CN109978023A (zh) 面向高维大数据分析的特征选择方法及计算机存储介质
CN109034241A (zh) 基于支持向量机的负荷集群控制方法和系统
CN106651630B (zh) 关键用电行业识别方法和系统
CN114926261A (zh) 汽车金融用户申请欺诈概率预测方法及介质
CN110555623B (zh) 一种配电设备日运行效率的主要影响因素筛选方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination