CN113744089A - 一种台区户变关系辨识方法及设备 - Google Patents

一种台区户变关系辨识方法及设备 Download PDF

Info

Publication number
CN113744089A
CN113744089A CN202111314195.3A CN202111314195A CN113744089A CN 113744089 A CN113744089 A CN 113744089A CN 202111314195 A CN202111314195 A CN 202111314195A CN 113744089 A CN113744089 A CN 113744089A
Authority
CN
China
Prior art keywords
user
users
natural
voltage
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111314195.3A
Other languages
English (en)
Other versions
CN113744089B (zh
Inventor
张殷
武利会
王俊波
李新
蒋维
罗容波
范心明
李国伟
唐琪
曾庆辉
陈贤熙
刘少辉
吴焯军
刘昊
欧晓妹
王云飞
梁年柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Power Supply Bureau of Guangdong Power Grid Corp
Original Assignee
Foshan Power Supply Bureau of Guangdong Power Grid Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Power Supply Bureau of Guangdong Power Grid Corp filed Critical Foshan Power Supply Bureau of Guangdong Power Grid Corp
Priority to CN202111314195.3A priority Critical patent/CN113744089B/zh
Publication of CN113744089A publication Critical patent/CN113744089A/zh
Application granted granted Critical
Publication of CN113744089B publication Critical patent/CN113744089B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Water Supply & Treatment (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请一种台区户变关系辨识方法及设备,属于户变关系辨识技术领域,所述方法包括:S1.利用自然离群因子算法计算各用户的自然离群因子,根据自然离群因子排除异常用户;S2.对于步骤S1排除异常用户后剩下的待分析用户,根据用户的电压数据对用户聚类,得到各待分析用户对应的用户聚类集合;S3.根据各用户聚类集合的用电量和台变的供电量计算各用户聚类集合的归属权重,根据归属权重完成户变关系辨识。利用自然离群因子算法排除户变关系异常的用户,并根据电压数据进行用户聚类,根据电量数据完成辨识,自然离群因子算法无需预设近邻数k,有效提升算法性能。

Description

一种台区户变关系辨识方法及设备
技术领域
本发明属于电力系统户变关系辨识技术领域,具体涉及一种台区户变关系辨识方法及设备。
背景技术
线损率是电力系统一个重要的考核指标,反映了电力企业的管理水平,目前在各电力企业开展线损治理后,线损异常得到一定改善,但影响线损异常的因素有很多,目前仍存在阻碍线损治理的难题,其中错误的户变关系记录信息是一大影响因素。
目前人工核查和停电核查是常用的户变关系核查方法,人工核查需要班组人员到台区现场校核用户的台区归属,难以大规模开展;停电核查影响用户的用电感受,同样难以大规模开展。
针对传统方法的弊端,现有学者提出基于量测电气数据的辨识方法,集合用户侧和台变侧的两侧信息,通过数据挖掘分析用户与台变的潜在关系,但是这种方法往往只考虑单一维度的数据,有其局限性。此外,分析时没有排除异常用户的数据,影响分析结果。
发明内容
基于此,本发明提出一种台区户变关系辨识方法及设备,以克服现有技术的缺陷。
本发明一种台区户变关系辨识方法,包括:
S1.利用自然离群因子算法计算各用户的自然离群因子,根据自然离群因子排除异常用户;
S2.对于步骤S1排除异常用户后剩下的待分析用户,根据用户的电压数据对用户聚类,得到各待分析用户对应的用户聚类集合;
S3.根据各用户聚类集合的用电量和台变的供电量计算各用户聚类集合的归属权重,根据归属权重完成户变关系辨识。
进一步地,步骤S1包括:
S101.获取各用户的电压数据构建数据集合
Figure 284919DEST_PATH_IMAGE001
S102.计算数据集合中各数据点的自然离群因子;
S103.排除满足设定值的自然离群因子所对应的异常用户。
进一步地,步骤S102包括:
S1021.利用自然最近邻搜索算法确定各数据点的近邻数
Figure 441093DEST_PATH_IMAGE002
S1022.计算各数据点的第
Figure 428028DEST_PATH_IMAGE002
距离和局域可达密度;
S1023.根据第
Figure 99181DEST_PATH_IMAGE002
距离和局域可达密度计算数据点的自然离群因子。
进一步地,自然离群因子的计算包括:
Figure 584258DEST_PATH_IMAGE003
Figure 657256DEST_PATH_IMAGE004
表示数据点
Figure 438262DEST_PATH_IMAGE005
的自然离群因子,
Figure 596711DEST_PATH_IMAGE006
Figure 357249DEST_PATH_IMAGE007
分别表示数据点
Figure 550333DEST_PATH_IMAGE005
Figure 689191DEST_PATH_IMAGE008
的局域可达密度,
Figure 85668DEST_PATH_IMAGE009
的局域可达密度,
Figure 397701DEST_PATH_IMAGE005
的自然影响空间。
进一步地,第
Figure 694559DEST_PATH_IMAGE002
距离的计算包括:
计算数据点
Figure 66634DEST_PATH_IMAGE005
与集合
Figure 137358DEST_PATH_IMAGE001
中其余数据点的距离,当存在一个数据点
Figure 3814DEST_PATH_IMAGE010
与数据点
Figure 905911DEST_PATH_IMAGE005
的距离
Figure 701085DEST_PATH_IMAGE011
满足以下条件时,
Figure 868893DEST_PATH_IMAGE011
表示为数据点的第
Figure 788307DEST_PATH_IMAGE002
距离;
所述条件为
Figure 794178DEST_PATH_IMAGE011
大于至少
Figure 508056DEST_PATH_IMAGE002
个除点
Figure 731534DEST_PATH_IMAGE010
Figure 64427DEST_PATH_IMAGE005
以外的数据点与点
Figure 239318DEST_PATH_IMAGE005
的距离,且小于至多k-1个除点
Figure 891142DEST_PATH_IMAGE010
Figure 846591DEST_PATH_IMAGE005
以外的数据点与点
Figure 592961DEST_PATH_IMAGE005
的距离。。
进一步地,步骤S2包括:
S201.计算任意两个待分析用户的电压相似性;
S202.根据电压相似性将每个待分析用户及其相似用户进行聚类,得到各待分析用户对应的用户聚类集合。
进一步地。步骤S202包括:
S2021.寻找与用户
Figure 324156DEST_PATH_IMAGE012
的电压相似性满足设定值的用户,构成用户
Figure 909332DEST_PATH_IMAGE012
的初始用户聚类集合
Figure 460399DEST_PATH_IMAGE013
S2022.令
Figure 276040DEST_PATH_IMAGE014
,排除集合
Figure 173326DEST_PATH_IMAGE015
中的重复元素,更新集合
Figure 275275DEST_PATH_IMAGE015
Figure 831414DEST_PATH_IMAGE016
表示集合
Figure 434434DEST_PATH_IMAGE015
中的用户元素
Figure 625375DEST_PATH_IMAGE017
对应的用户聚类集合,
Figure 226121DEST_PATH_IMAGE018
S2023.若更新后的集合
Figure 751780DEST_PATH_IMAGE015
有新增元素,重复步骤S2022,否则令
Figure 407758DEST_PATH_IMAGE019
,若
Figure 968052DEST_PATH_IMAGE020
则重复步骤S2021,否则进入步骤S2024,M表示待分析用户数量;
S2024.完成聚类,合并相同的集合得到至少一个用户聚类集合。。
进一步地,步骤S3包括:
以台区线损率波动最小建立目标函数如下式表达,求解目标函数得到用户聚类集合的归属权重,
Figure 287169DEST_PATH_IMAGE021
其中,
Figure 565704DEST_PATH_IMAGE022
表示统计天数,
Figure 762723DEST_PATH_IMAGE023
表示集合
Figure 177524DEST_PATH_IMAGE024
在第
Figure 667543DEST_PATH_IMAGE025
天的用电量,
Figure 167794DEST_PATH_IMAGE026
表示当前分析台变在第
Figure 165575DEST_PATH_IMAGE025
天的供电量,
Figure 434882DEST_PATH_IMAGE027
表示集合
Figure 548332DEST_PATH_IMAGE024
的归属权重,
Figure 286612DEST_PATH_IMAGE028
表示用户聚类集合数量;
目标函数的约束由下式表达,
Figure 573236DEST_PATH_IMAGE029
Figure 214827DEST_PATH_IMAGE030
Figure 499178DEST_PATH_IMAGE031
分别表示台区线损率的上、下限值;
归属权重
Figure 708442DEST_PATH_IMAGE027
满足设定条件时表示集合
Figure 549490DEST_PATH_IMAGE024
所包括的用户归属当前分析台变。
进一步地,步骤S2的电压相似性按以下表达式计算,
Figure 793390DEST_PATH_IMAGE032
Figure 560226DEST_PATH_IMAGE033
表示用户
Figure 522366DEST_PATH_IMAGE012
与用户
Figure 901526DEST_PATH_IMAGE034
的电压相似性,
Figure 999932DEST_PATH_IMAGE035
Figure 928881DEST_PATH_IMAGE036
分别表示用户
Figure 112737DEST_PATH_IMAGE012
Figure 295588DEST_PATH_IMAGE034
的电压数据,
Figure 514080DEST_PATH_IMAGE037
表示期望值。
本发明还提供一种户变关系辨识设备,包括处理器和存储器,其中存储器用于存储计算机程序,该计算机程序由处理器加载并执行时实现前述的台区户变关系辨识方法。
从以上技术方案可以看出,本发明具有如下有益效果:
本发明一种台区户变关系辨识方法及设备,利用自然离群因子算法,识别待分析台区下的户变关系异常用户,根据电压数据进行用户聚类分析,得到用户聚类类别集合;建立并求解基于电量数据的线损率目标函数,得到用户聚类集合归属权重,根据归属权重完成户变关系辨识;所使用的自然离群因子算法无需预设近邻数k,有效提升算法性能;综合电压和电量数据,多维度开展户变关系辨识,一定程度上克服了单一维度开展户变关系辨识的局限性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1 本发明一种实施例提供的户变关系辨识方法流程图;
图2 本发明另一实施例提供的户变关系示意图;
图3 本发明另一实施例提供的户变关系辨识方法流程图;
图4 本发明提供的一种台区户变关系辨识设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本实施例提供一种户变关系辨识方法,包括以下步骤:
S1.利用自然离群因子算法计算各用户的自然离群因子,根据自然离群因子排除异常用户。
相比较于其他的离群点检测算法,本实施例采用的自然离群因子算法(NaturalOutlier Factor algorithm,NOF)属于无尺度最近邻方法,无需预设近邻数k,k值由数据本身的特性自适应确定,利用数据本身特性搜索自然邻居,进而通过每个数据点的自然邻居个数来判断周围的数据分布,有着更佳的运算性能,k值合理设置的难题也得到解决。
S2.对于步骤S1排除异常用户后的待分析用户,根据用户的电压数据对用户聚类,得到各待分析用户对应的用户聚类集合。
对于某个待分析用户,本实施例采用“手拉手”式的聚类分析方法,首次确定当前分析用户的相似用户后,将相似用户的相似用户也作为元素合并至当前分析用户的用户聚类集合,直至所有的用户均完成聚类。例如用户A的相似用户为B、C,用户B的相似用户为A、C、D,用户C的相似用户为A、B、D,用户D的相似用户为B、C,则通过聚类,用户A的相似用户最终确定为B、C、D,如此便根据电压数据把用户分成多个聚类,便于之后的户变关系辨识。
具体实现要判断用户的相似性时,可以根据两个用户的电压相似性进行判断,可以借助皮尔逊相关系数、斯皮尔曼系数、夹角余弦等数值特性进行计算。
S3.根据各用户聚类集合的用电量和台变的供电量计算各用户聚类集合的归属权重,根据归属权重完成户变关系辨识。
考虑到用户的用电量与所属台变的供电量基本平衡,因此在步骤S2根据电压数据将用户聚类后,步骤S3通过电量对用户和台变建立关系,根据计算的归属权重完成户变关系的辨识。
在可能的一些实施例中,步骤S3可以包括以下步骤:
以台区线损率波动最小为目标建立目标函数,如下式表达,求解目标函数得到用户聚类集合的归属权重,
Figure 622719DEST_PATH_IMAGE038
其中,
Figure 293872DEST_PATH_IMAGE022
表示统计天数,
Figure 14834DEST_PATH_IMAGE023
表示集合
Figure 87833DEST_PATH_IMAGE024
在第
Figure 370303DEST_PATH_IMAGE025
天的用电量,
Figure 466435DEST_PATH_IMAGE026
表示当前分析台变在第
Figure 240356DEST_PATH_IMAGE025
天的供电量,
Figure 184172DEST_PATH_IMAGE027
表示集合
Figure 385346DEST_PATH_IMAGE024
的归属权重,
Figure 14780DEST_PATH_IMAGE028
表示用户聚类集合数量;
目标函数的约束由下式表达,
Figure 592391DEST_PATH_IMAGE039
Figure 390714DEST_PATH_IMAGE030
Figure 762790DEST_PATH_IMAGE031
分别表示台区线损率的上、下限值;
归属权重
Figure 567935DEST_PATH_IMAGE027
满足设定条件时表示集合
Figure 935856DEST_PATH_IMAGE024
所包括的用户归属当前分析台变。
从目标函数的数学表达可以看出,等式右边绝对式符号内的表达式实则为计算相邻两天的线损率之差,因此目标函数
Figure 837953DEST_PATH_IMAGE040
实际上反映了一个统计周期
Figure 505563DEST_PATH_IMAGE022
内整体线损率的变化。
在可能的一些实施例中,通过归属权重
Figure 63583DEST_PATH_IMAGE027
的阈值来判断用户与台变的归属关系,例如阈值设置为0.8、0.9等值时,达到了设定阈值即可视为当前用户聚类集合中的用户归属与当前分析台变;对于能够完全归一化的情况,也可以用二值表示归属权重,
Figure 717419DEST_PATH_IMAGE027
=1时表示归属当前台变,
Figure 490334DEST_PATH_IMAGE027
=0时表示不归属。
为了更详尽的说明本发明的技术方案,下面实施例结合图2给出的场景,提出一种台区户变关系辨识方法。
如图2所示,在营销系统的记录中,用户A-E的户变关系均归属变压器J,用户F归属变压器L,但实际通信中只有用户A-D、F抄表成功,用户E无法抄表成功,图2中的实线表示正确的户变关系,虚线表示记录错误的户变关系,现通过本实施例提出的户变关系辨识方法对用户A-F的户变关系进行确认,以核实实际户变关系与系统记录是否一致。
结合图3给出的执行流程,本实施例包括以下步骤:
S1.利用自然离群因子算法计算各用户的自然离群因子,根据自然离群因子排除异常用户。
步骤S1的自然离群因子算法针对某一待分析的台区,利用异常点检测算法对用户进行初步过滤,将明显异常的数据点进行排除,即初步排除户变关系明显异常的用户。本实施例的以下说明均以变压器J为算例,变压器L的异常点检测和户变关系辨识同理可得。
在运行自然离群因子算法时,步骤S1包括:
S101.获取各用户的电压数据构建数据集合
Figure 204212DEST_PATH_IMAGE001
在本实施例中检测的对象设定为用户的运行电压数据,容易理解的是,本领域技术人员可根据实际需要,采用电流数据等其他的电气量数据来构建数据集合。
S102.计算数据集合中各数据点的自然离群因子。
计算自然离群因子的过程本实施例采用了自然最近邻搜索算法来寻找近邻数k值的合理设置,具体可以包括:
S1021.利用自然最近邻搜索算法确定各数据点的近邻数
Figure 983949DEST_PATH_IMAGE002
近邻数
Figure 693672DEST_PATH_IMAGE002
的寻找过程包括:
a.统计数据集合
Figure 570362DEST_PATH_IMAGE001
的数据点数为
Figure 205873DEST_PATH_IMAGE041
,统一初始化所有数据点的以下参数:近邻点数
Figure 472907DEST_PATH_IMAGE042
,反向近邻数
Figure 734124DEST_PATH_IMAGE043
Figure 714587DEST_PATH_IMAGE044
邻域
Figure 411015DEST_PATH_IMAGE045
,反向邻域
Figure 539245DEST_PATH_IMAGE046
,重复分析次数
Figure 354886DEST_PATH_IMAGE047
,从第一个数据点
Figure 940588DEST_PATH_IMAGE048
开始搜索。
b.若
Figure 419367DEST_PATH_IMAGE049
,搜索数据点
Figure 723310DEST_PATH_IMAGE050
的第
Figure 77062DEST_PATH_IMAGE044
个近邻点
Figure 517270DEST_PATH_IMAGE051
,进入步骤c,否则进入步骤d。
c.令
Figure 429600DEST_PATH_IMAGE052
Figure 955260DEST_PATH_IMAGE053
Figure 112703DEST_PATH_IMAGE054
Figure 407418DEST_PATH_IMAGE055
,重复步骤b。
d.有数据点存在
Figure 493579DEST_PATH_IMAGE043
Figure 506534DEST_PATH_IMAGE056
时,令
Figure 202089DEST_PATH_IMAGE057
Figure 928474DEST_PATH_IMAGE058
,返回步骤b,否则进入步骤e。
e.将每个数据点与其
Figure 111501DEST_PATH_IMAGE002
个最近邻相连,构成最大邻域图,其中近邻数
Figure 611752DEST_PATH_IMAGE059
Figure 297949DEST_PATH_IMAGE005
表示数据点。
S1022.计算各数据点的第
Figure 317988DEST_PATH_IMAGE002
距离和局域可达密度
Figure 493755DEST_PATH_IMAGE060
自然离群因子算法中关于数据点的第
Figure 792887DEST_PATH_IMAGE002
距离的计算如下:
计算数据点
Figure 17195DEST_PATH_IMAGE005
与集合
Figure 157320DEST_PATH_IMAGE001
中其余数据点的距离,当存在一个数据点
Figure 238409DEST_PATH_IMAGE010
与数据点
Figure 965450DEST_PATH_IMAGE005
的距离
Figure 868815DEST_PATH_IMAGE011
满足以下条件时,
Figure 50397DEST_PATH_IMAGE011
记为数据点
Figure 879551DEST_PATH_IMAGE005
的第
Figure 576111DEST_PATH_IMAGE002
距离
Figure 955271DEST_PATH_IMAGE061
Figure 256940DEST_PATH_IMAGE011
满足:
Ⅰ.至少有
Figure 259924DEST_PATH_IMAGE002
个数据点满足
Figure 443781DEST_PATH_IMAGE062
Ⅱ.至多有
Figure 626631DEST_PATH_IMAGE063
个数据点满足
Figure 845123DEST_PATH_IMAGE064
数据点
Figure 953762DEST_PATH_IMAGE065
满足
Figure 624915DEST_PATH_IMAGE066
上述计算第
Figure 345878DEST_PATH_IMAGE002
距离的过程可以理解为:对于当前求解的数据点
Figure 733390DEST_PATH_IMAGE005
而言,在计算出点
Figure 763663DEST_PATH_IMAGE005
与集合内其余数据点的距离的情况下,如果存在一个除点
Figure 672844DEST_PATH_IMAGE005
以外的数据点,其与
Figure 446765DEST_PATH_IMAGE005
点的距离,能够大于至少
Figure 623537DEST_PATH_IMAGE002
个数据点与点
Figure 824712DEST_PATH_IMAGE005
的距离,且小于至多k-1个数据点与点
Figure 221189DEST_PATH_IMAGE005
的距离,那么这个数据点与点
Figure 798801DEST_PATH_IMAGE005
的距离就视为点
Figure 844728DEST_PATH_IMAGE005
的第
Figure 216804DEST_PATH_IMAGE002
距离。这里示出一个说明性示例进行说明,例如集合中有6个数据点,分别为a、b、c、d、e、f,现在计算点a的第k距离,则分别计算出点a与其余点的距离有d(a,b)、d(a,c)、d(a,d)、d(a,e)、d(a,f),若距离d(a,d)大于d(a,b)、d(a,c)、d(a,f),且小于d(a,e),则确定的k只能为2,即点d与点a的距离d(a,d)记为点a的第2距离。
实际上,数据点的第
Figure 100577DEST_PATH_IMAGE002
距离反映了数据点周围领域的密集程度,第
Figure 527885DEST_PATH_IMAGE002
距离越小,表示数据点周围越密集。
自然离群因子算法中关于数据点的局域可达密度
Figure 495229DEST_PATH_IMAGE060
的计算如下:
Figure 664304DEST_PATH_IMAGE067
Figure 409275DEST_PATH_IMAGE068
表示数据点
Figure 876160DEST_PATH_IMAGE005
到数据点
Figure 947277DEST_PATH_IMAGE010
的第
Figure 739784DEST_PATH_IMAGE002
可达距离,满足
Figure 581838DEST_PATH_IMAGE069
Figure 350949DEST_PATH_IMAGE070
表示数据点
Figure 978370DEST_PATH_IMAGE005
Figure 863150DEST_PATH_IMAGE002
近邻,满足
Figure 495295DEST_PATH_IMAGE071
S1023.根据第
Figure 507245DEST_PATH_IMAGE002
距离和局域可达密度
Figure 238440DEST_PATH_IMAGE060
计算数据点的自然离群因子
Figure 543388DEST_PATH_IMAGE072
对于数据点
Figure 360035DEST_PATH_IMAGE073
Figure 910096DEST_PATH_IMAGE072
的计算有
Figure 810312DEST_PATH_IMAGE003
自然影响空间满足
Figure 302473DEST_PATH_IMAGE074
Figure 357148DEST_PATH_IMAGE075
S103.排除满足设定值的自然离群因子所对应的异常用户。
本实施例把
Figure 632272DEST_PATH_IMAGE072
的阈值设为2,
Figure 338060DEST_PATH_IMAGE076
的数据点所对应的即为异常用户,予以排除,针对变压器J,根据各用户的NOF判断得E、F为异常用户,即从电压数据层面分析,E、F作为离群点明显不归属变压器J。
S2.对于步骤S1排除异常用户后的待分析用户A-D,根据用户的电压数据对用户聚类,得到各待分析用户对应的用户聚类集合。
本实施例对用户聚类时,采用“手拉手”式的聚类分析方法,寻找当前分析用户的相似用户,再寻找相似用户的相似用户,重复更新当前分析用户的聚类集合,如此把用户分为多个聚类。
本实施例采用电压相似性来描述两个用户的相似程度。
S201.计算任意两个待分析用户的电压相似性。
电压相似性按以下表达式计算,
Figure 984810DEST_PATH_IMAGE032
Figure 776049DEST_PATH_IMAGE033
表示用户
Figure 730230DEST_PATH_IMAGE012
与用户
Figure 605038DEST_PATH_IMAGE034
的电压相似性,
Figure 252051DEST_PATH_IMAGE035
Figure 576591DEST_PATH_IMAGE036
分别表示用户
Figure 648977DEST_PATH_IMAGE012
Figure 876827DEST_PATH_IMAGE034
的电压数据,
Figure 881692DEST_PATH_IMAGE037
表示期望值。
S202.根据电压相似性将每个待分析用户及其相似用户进行聚类,得到各待分析用户对应的用户聚类集合。
步骤S202实际要完成的便是寻找相似用户的过程,还包括:
S2021.寻找与用户
Figure 631211DEST_PATH_IMAGE012
的电压相似性满足设定值的用户,构成用户
Figure 114145DEST_PATH_IMAGE012
的初始用户聚类集合
Figure 399764DEST_PATH_IMAGE013
S2022.令
Figure 575530DEST_PATH_IMAGE077
,排除集合
Figure 826994DEST_PATH_IMAGE015
中的重复元素,更新集合
Figure 113619DEST_PATH_IMAGE015
Figure 50482DEST_PATH_IMAGE016
表示集合
Figure 646417DEST_PATH_IMAGE015
中的用户元素
Figure 121261DEST_PATH_IMAGE017
对应的用户聚类集合,
Figure 962309DEST_PATH_IMAGE018
S2023.若更新后的集合
Figure 769990DEST_PATH_IMAGE015
有新增元素,重复步骤S2022,否则令
Figure 398811DEST_PATH_IMAGE019
,若
Figure 737782DEST_PATH_IMAGE020
则重复步骤S2021,否则进入步骤S2024,M表示待分析用户数量。
S2024.完成聚类,合并相同的集合得到至少一个用户聚类集合。
以用户A-D为例,用户的相似性是相互的,即如果B是A的相似用户,A必然也是B的相似用户,在步骤S2021中共计算得到4个用户聚类集合,分别为
Figure 669005DEST_PATH_IMAGE078
Figure 846039DEST_PATH_IMAGE079
Figure 268931DEST_PATH_IMAGE080
Figure 967634DEST_PATH_IMAGE081
在步骤S2022中,循环寻找相似用户和更新聚类集合,这里以用户A为算例说明,B作为A的相似用户,其相似用户需要更新至A的聚类集合中,即令
Figure 399752DEST_PATH_IMAGE082
,排除重复元素后,A的聚类集合更新为
Figure 290348DEST_PATH_IMAGE083
,相较之前新增了C、D,则重复步骤S2022时需要增加C、D的相似用户来更新
Figure 900452DEST_PATH_IMAGE084
,令
Figure 571605DEST_PATH_IMAGE085
,此次更新后A的聚类集合为
Figure 59611DEST_PATH_IMAGE083
,相较之前不再新增元素,则可以输出A的聚类集合为
Figure 132610DEST_PATH_IMAGE086
。同理,对用户B、C、D进行同样的相似用户寻找和聚类,即可得到其最终的聚类集合分别为
Figure 913615DEST_PATH_IMAGE087
Figure 72064DEST_PATH_IMAGE088
Figure 95252DEST_PATH_IMAGE089
。通过合并相同集合,最终输出一个聚类集合为
Figure 835806DEST_PATH_IMAGE090
,用户A-D处于同一聚类下。对于有更多用户需要辨识的情况,通过实施本例中的相似用户聚类过程,可以将多个用户聚类为有限个集合,更方便后续的户变关系辨识。
而在实际处理中,为了数据更直观和便于处理,电压相似性还可以用矩阵表示,构建相似性矩阵
Figure 974664DEST_PATH_IMAGE091
,元素
Figure 620409DEST_PATH_IMAGE033
表示用户
Figure 184639DEST_PATH_IMAGE012
Figure 232229DEST_PATH_IMAGE034
的电压相似性,寻找满足电压相似性设定值的用户时,即针对矩阵
Figure 355037DEST_PATH_IMAGE091
中第
Figure 488078DEST_PATH_IMAGE092
行元素数值满足条件的用户,组成聚类集合。
本实施例中相似性阈值设为0.9,
Figure 853069DEST_PATH_IMAGE033
>0.9的用户
Figure 755166DEST_PATH_IMAGE034
视为
Figure 111192DEST_PATH_IMAGE012
的相似用户。
S3.根据各用户聚类集合的用电量和台变的供电量计算各用户聚类集合的归属权重,根据归属权重完成户变关系辨识。
以台区线损率波动最小建立目标函数如下式表达,求解目标函数得到用户聚类集合的归属权重,
Figure 718147DEST_PATH_IMAGE093
,
其中,
Figure 450611DEST_PATH_IMAGE022
表示统计天数,
Figure 207215DEST_PATH_IMAGE023
表示集合
Figure 858776DEST_PATH_IMAGE024
在第
Figure 277994DEST_PATH_IMAGE025
天的用电量,
Figure 548569DEST_PATH_IMAGE026
表示当前分析台变在第
Figure 485912DEST_PATH_IMAGE025
天的供电量,
Figure 387003DEST_PATH_IMAGE027
表示集合
Figure 27937DEST_PATH_IMAGE024
的归属权重,
Figure 102204DEST_PATH_IMAGE028
表示用户聚类集合数量;
目标函数的约束由下式表达,
Figure 505503DEST_PATH_IMAGE094
Figure 826763DEST_PATH_IMAGE030
Figure 957924DEST_PATH_IMAGE031
分别表示台区线损率的上、下限值;
归属权重
Figure 570302DEST_PATH_IMAGE027
满足设定条件时表示集合
Figure 342955DEST_PATH_IMAGE024
所包括的用户归属当前分析台变。
在本实施例中进行完全归一化,用二值描述归属权重
Figure 962679DEST_PATH_IMAGE027
Figure 627141DEST_PATH_IMAGE027
=1时表示归属当前台变,
Figure 980893DEST_PATH_IMAGE027
=0表示不归属。
针对用户A-D的聚类集合
Figure 686681DEST_PATH_IMAGE090
,求解得A、B、C、D归属于当前分析变压器J。
本申请的实施例还提供一种台区户变关系辨识设备,如图4所示,包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本申请实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器存储有计算机可执行指令,处理器可调用存储器存储的程序,所述程序用于:实现前述各个实施例提供的户变关系辨识流程。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (10)

1.一种台区户变关系辨识方法,包括:
S1.利用自然离群因子算法计算各用户的自然离群因子,根据所述自然离群因子排除异常用户;
S2.对于步骤S1排除异常用户后剩下的待分析用户,根据用户的电压数据对用户聚类,得到各待分析用户对应的用户聚类集合;
S3.根据所述用户聚类集合中各用户的用电量和台变的供电量计算各用户聚类集合的归属权重,根据所述归属权重完成户变关系辨识。
2.根据权利要求1所述的台区户变关系辨识方法,其特征在于,所述步骤S3包括:
以台区线损率波动最小建立目标函数如下式表达,求解所述目标函数得到用户聚类集合的归属权重,
Figure 368344DEST_PATH_IMAGE001
其中,
Figure 97266DEST_PATH_IMAGE002
表示统计天数,
Figure 238397DEST_PATH_IMAGE003
表示集合
Figure 549424DEST_PATH_IMAGE004
在第
Figure 117808DEST_PATH_IMAGE005
天的用电量,
Figure 645610DEST_PATH_IMAGE006
表示当前分析台变在第
Figure 590433DEST_PATH_IMAGE005
天的供电量,
Figure 755966DEST_PATH_IMAGE007
表示集合
Figure 760831DEST_PATH_IMAGE004
的归属权重,
Figure 513280DEST_PATH_IMAGE008
表示用户聚类集合数量;
所述目标函数的约束由下式表达,
Figure 933897DEST_PATH_IMAGE009
Figure 468783DEST_PATH_IMAGE010
Figure 129703DEST_PATH_IMAGE011
分别表示台区线损率的上、下限值;
归属权重
Figure 117251DEST_PATH_IMAGE007
满足设定条件时表示集合
Figure 341558DEST_PATH_IMAGE004
所包括的用户归属当前分析台变。
3.根据权利要求1所述的台区户变关系辨识方法,其特征在于,所述步骤S1包括:
S101.获取各用户的电压数据构建数据集合
Figure 980219DEST_PATH_IMAGE012
S102.计算所述集合
Figure 326887DEST_PATH_IMAGE012
中各数据点的自然离群因子;
S103.排除满足设定值的自然离群因子所对应的异常用户。
4.根据权利要求3所述的台区户变关系辨识方法,其特征在于,所述步骤S102包括:
S1021.利用自然最近邻搜索算法确定各数据点的近邻数
Figure 552463DEST_PATH_IMAGE013
S1022.计算各数据点的第
Figure 377199DEST_PATH_IMAGE013
距离和局域可达密度;
S1023.根据所述第
Figure 558782DEST_PATH_IMAGE013
距离和局域可达密度计算数据点的自然离群因子。
5.根据权利要求4所述的台区户变关系辨识方法,其特征在于,所述自然离群因子的计算包括:
Figure 328548DEST_PATH_IMAGE014
Figure 290688DEST_PATH_IMAGE015
表示数据点
Figure 856799DEST_PATH_IMAGE016
的自然离群因子,
Figure 705937DEST_PATH_IMAGE017
Figure 394407DEST_PATH_IMAGE018
分别表示数据点
Figure 93111DEST_PATH_IMAGE016
Figure 259650DEST_PATH_IMAGE019
的局域可达密度,
Figure 415825DEST_PATH_IMAGE020
表示数据点
Figure 25929DEST_PATH_IMAGE016
的自然影响空间。
6.根据权利要求4所述的台区户变关系辨识方法,其特征在于,所述第
Figure 697082DEST_PATH_IMAGE013
距离的计算包括:
计算数据点
Figure 243728DEST_PATH_IMAGE016
与集合
Figure 316726DEST_PATH_IMAGE012
中其余数据点的距离,当存在一个数据点
Figure 284682DEST_PATH_IMAGE021
与数据点
Figure 193863DEST_PATH_IMAGE016
的距离
Figure 702205DEST_PATH_IMAGE022
满足以下条件时,
Figure 144556DEST_PATH_IMAGE022
表示为数据点的第
Figure 283414DEST_PATH_IMAGE013
距离;
所述条件为
Figure 929159DEST_PATH_IMAGE022
大于至少
Figure 991924DEST_PATH_IMAGE013
个除点
Figure 39514DEST_PATH_IMAGE021
Figure 663787DEST_PATH_IMAGE016
以外的数据点与点
Figure 796828DEST_PATH_IMAGE016
的距离,且小于至多k-1个除点
Figure 850235DEST_PATH_IMAGE021
Figure 503064DEST_PATH_IMAGE016
以外的数据点与点
Figure 46041DEST_PATH_IMAGE016
的距离。
7.根据权利要求1所述的台区户变关系辨识方法,其特征在于,所述步骤S2包括:
S201.计算任意两个待分析用户的电压相似性;
S202.根据电压相似性将每个待分析用户及其相似用户进行聚类,得到各待分析用户对应的用户聚类集合。
8.根据权利要求7所述的台区户变关系辨识方法,其特征在于,所述步骤S202包括:
S2021.寻找与用户
Figure 650066DEST_PATH_IMAGE023
的电压相似性满足设定值的用户,构成用户
Figure 507164DEST_PATH_IMAGE023
的初始用户聚类集合
Figure 263767DEST_PATH_IMAGE024
S2022.令
Figure 728378DEST_PATH_IMAGE025
,排除集合
Figure 836011DEST_PATH_IMAGE026
中的重复元素,更新集合
Figure 545735DEST_PATH_IMAGE026
Figure 156845DEST_PATH_IMAGE027
表示集合
Figure 244886DEST_PATH_IMAGE026
中的用户元素
Figure 324969DEST_PATH_IMAGE028
对应的用户聚类集合,
Figure 320607DEST_PATH_IMAGE029
S2023.若更新后的集合
Figure 301070DEST_PATH_IMAGE026
有新增元素,重复步骤S2022,否则令
Figure 622330DEST_PATH_IMAGE030
,若
Figure 924129DEST_PATH_IMAGE031
则重复步骤S2021,否则进入步骤S2024,M表示待分析用户数量;
S2024.完成聚类,合并相同的集合得到至少一个用户聚类集合。
9.根据权利要求7所述的台区户变关系辨识方法,其特征在于,所述步骤S2的电压相似性按以下表达式计算,
Figure 989037DEST_PATH_IMAGE032
Figure 512423DEST_PATH_IMAGE033
表示用户
Figure 991202DEST_PATH_IMAGE023
与用户
Figure 295144DEST_PATH_IMAGE034
的电压相似性,
Figure 648896DEST_PATH_IMAGE035
Figure 89105DEST_PATH_IMAGE036
分别表示用户
Figure 689850DEST_PATH_IMAGE023
Figure 464777DEST_PATH_IMAGE034
的电压数据,
Figure 809171DEST_PATH_IMAGE037
表示期望值。
10.一种户变关系辨识设备,包括处理器和存储器,其中存储器用于存储计算机程序,其特征在于,所述计算机程序由处理器加载并执行时实现权利要求1-9任一项所述的台区户变关系辨识方法。
CN202111314195.3A 2021-11-08 2021-11-08 一种台区户变关系辨识方法及设备 Active CN113744089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111314195.3A CN113744089B (zh) 2021-11-08 2021-11-08 一种台区户变关系辨识方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111314195.3A CN113744089B (zh) 2021-11-08 2021-11-08 一种台区户变关系辨识方法及设备

Publications (2)

Publication Number Publication Date
CN113744089A true CN113744089A (zh) 2021-12-03
CN113744089B CN113744089B (zh) 2022-02-15

Family

ID=78727727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111314195.3A Active CN113744089B (zh) 2021-11-08 2021-11-08 一种台区户变关系辨识方法及设备

Country Status (1)

Country Link
CN (1) CN113744089B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115098745A (zh) * 2022-06-06 2022-09-23 浙大城市学院 基于贝叶斯推断的低压台区户变关系动态辨识系统与方法
CN115204319A (zh) * 2022-09-15 2022-10-18 广东电网有限责任公司中山供电局 一种低压配电网拓扑参数识别方法及系统
CN116185722A (zh) * 2023-04-28 2023-05-30 北京环球医疗救援有限责任公司 一种用于医疗保险主数据存储的数据安全管理系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321919A (zh) * 2019-04-30 2019-10-11 广东电网有限责任公司 一种用于低压单相用户户相关系辨识的聚类方法
CN110516912A (zh) * 2019-07-24 2019-11-29 长沙恒电聚能电子科技有限公司 一种配电台区户变关系的识别方法
CN110824270A (zh) * 2019-10-09 2020-02-21 中国电力科学研究院有限公司 结合台区线损和异常事件的窃电用户辨识方法及装置
CN111062590A (zh) * 2019-12-02 2020-04-24 深圳供电局有限公司 用电异常行为检测方法、装置、计算机设备和存储介质
CN111400371A (zh) * 2020-03-13 2020-07-10 上海电力大学 一种基于电压相关性校验的户变关系识别方法
CN111505434A (zh) * 2020-04-10 2020-08-07 国网浙江余姚市供电有限公司 一种低压配电表箱线路、表箱故障隐患识别方法
CN111505433A (zh) * 2020-04-10 2020-08-07 国网浙江余姚市供电有限公司 一种低压台区户变关系纠错及相位识别方法
CN112270510A (zh) * 2020-12-21 2021-01-26 广东电网有限责任公司佛山供电局 一种基于个体和群体电压相似性的户变关系辨识方法
CN112288339A (zh) * 2020-12-24 2021-01-29 广东电网有限责任公司佛山供电局 一种基于电量和电压数据分析的台区户变关系辨识方法
CN112699913A (zh) * 2020-11-25 2021-04-23 国网湖南省电力有限公司 一种台区户变关系异常诊断方法及装置
CN112712104A (zh) * 2020-12-01 2021-04-27 国网河南省电力公司电力科学研究院 一种基于离群点检测的用户与变压器拓扑连接关系校验方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321919A (zh) * 2019-04-30 2019-10-11 广东电网有限责任公司 一种用于低压单相用户户相关系辨识的聚类方法
CN110516912A (zh) * 2019-07-24 2019-11-29 长沙恒电聚能电子科技有限公司 一种配电台区户变关系的识别方法
CN110824270A (zh) * 2019-10-09 2020-02-21 中国电力科学研究院有限公司 结合台区线损和异常事件的窃电用户辨识方法及装置
CN111062590A (zh) * 2019-12-02 2020-04-24 深圳供电局有限公司 用电异常行为检测方法、装置、计算机设备和存储介质
CN111400371A (zh) * 2020-03-13 2020-07-10 上海电力大学 一种基于电压相关性校验的户变关系识别方法
CN111505434A (zh) * 2020-04-10 2020-08-07 国网浙江余姚市供电有限公司 一种低压配电表箱线路、表箱故障隐患识别方法
CN111505433A (zh) * 2020-04-10 2020-08-07 国网浙江余姚市供电有限公司 一种低压台区户变关系纠错及相位识别方法
CN112699913A (zh) * 2020-11-25 2021-04-23 国网湖南省电力有限公司 一种台区户变关系异常诊断方法及装置
CN112712104A (zh) * 2020-12-01 2021-04-27 国网河南省电力公司电力科学研究院 一种基于离群点检测的用户与变压器拓扑连接关系校验方法
CN112270510A (zh) * 2020-12-21 2021-01-26 广东电网有限责任公司佛山供电局 一种基于个体和群体电压相似性的户变关系辨识方法
CN112288339A (zh) * 2020-12-24 2021-01-29 广东电网有限责任公司佛山供电局 一种基于电量和电压数据分析的台区户变关系辨识方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115098745A (zh) * 2022-06-06 2022-09-23 浙大城市学院 基于贝叶斯推断的低压台区户变关系动态辨识系统与方法
CN115204319A (zh) * 2022-09-15 2022-10-18 广东电网有限责任公司中山供电局 一种低压配电网拓扑参数识别方法及系统
CN116185722A (zh) * 2023-04-28 2023-05-30 北京环球医疗救援有限责任公司 一种用于医疗保险主数据存储的数据安全管理系统

Also Published As

Publication number Publication date
CN113744089B (zh) 2022-02-15

Similar Documents

Publication Publication Date Title
CN113744089B (zh) 一种台区户变关系辨识方法及设备
CN112766550B (zh) 基于随机森林的停电敏感用户预测方法、系统、存储介质及计算机设备
CN110990461A (zh) 大数据分析模型算法选型方法、装置、电子设备及介质
CN107066616A (zh) 用于账号处理的方法、装置及电子设备
Cheng et al. OWA-weighted based clustering method for classification problem
CN112800231B (zh) 电力数据校验方法、装置、计算机设备和存储介质
CN105678414A (zh) 对资源消耗量进行预测的数据处理方法
Lv et al. A data fusion and data cleaning system for smart grids big data
CN112001441A (zh) 一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法
Zhao et al. Finding critical users in social communities via graph convolutions
Falahiazar et al. Determining the Parameters of DBSCAN Automatically Using the Multi-Objective Genetic Algorithm.
CN112614004A (zh) 用电信息的处理方法及装置
Tang et al. Reliable community search in dynamic networks
CN112508260B (zh) 基于对比学习的配电变压器中长期负荷预测方法及装置
CN107274025B (zh) 一种实现用电模式智能识别与管理的系统和方法
Liang et al. Optimization of basic clustering for ensemble clustering: an information-theoretic perspective
Jin et al. Power load curve clustering algorithm using fast dynamic time warping and affinity propagation
CN112348226A (zh) 预测数据生成方法、系统、计算机设备及存储介质
CN111008673A (zh) 配电网信息物理系统中恶性数据链采集提取方法
Chen et al. Solar power station site selection: A model based on data analysis and MCGDM considering expert consensus
Majidpour Time series prediction for electric vehicle charging load and solar power generation in the context of smart grid
Hu et al. ADGWN: adaptive dual-channel graph wavelet neural network for topology identification of low-voltage distribution grid
Yang et al. Automatic Feature Engineering‐Based Optimization Method for Car Loan Fraud Detection
Sadi-Nezhad et al. A new fuzzy clustering algorithm based on multi-objective mathematical programming
Davarzani et al. Study of missing meter data impact on domestic load profiles clustering and characterization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant