CN111444946A - 基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统 - Google Patents

基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统 Download PDF

Info

Publication number
CN111444946A
CN111444946A CN202010201124.1A CN202010201124A CN111444946A CN 111444946 A CN111444946 A CN 111444946A CN 202010201124 A CN202010201124 A CN 202010201124A CN 111444946 A CN111444946 A CN 111444946A
Authority
CN
China
Prior art keywords
signal strength
frequency
signal intensity
value
local outlier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010201124.1A
Other languages
English (en)
Other versions
CN111444946B (zh
Inventor
谈丛
周宇烨
解玉满
陈向群
李恺
黄红桥
王海元
谭海波
卜文彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Metering Center of State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Hunan Electric Power Co Ltd
Metering Center of State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Hunan Electric Power Co Ltd, Metering Center of State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202010201124.1A priority Critical patent/CN111444946B/zh
Publication of CN111444946A publication Critical patent/CN111444946A/zh
Application granted granted Critical
Publication of CN111444946B publication Critical patent/CN111444946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/08Locating faults in cables, transmission lines, or networks
    • G01R31/081Locating faults in cables, transmission lines, or networks according to type of conductors
    • G01R31/086Locating faults in cables, transmission lines, or networks according to type of conductors in power transmission or distribution networks, i.e. with interconnected conductors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/08Locating faults in cables, transmission lines, or networks
    • G01R31/088Aspects of digital computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Complex Calculations (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统,本发明基于广义Dice系数和局部离群因子的非入户式串户排查方法根据不同频率信号间的广义Dice系数初步确定出多个频率块,然后计算同一频块内信号的LOF值,并通过K‑means聚类方法剔除LOF值较大的信号,最后将筛选后获得的多块频率信号融合为一体作为判断是否串户的依据。本发明采用了多种信号处理方法,不影响原物理系统的拓扑结构,同时又能够在一定程度上解决普通的非入户串户排查方法存在的信号叠加污染的问题,能够有效提升串户检查结果的准确性。

Description

基于广义Dice系数和局部离群因子的非入户式串户排查方法 及系统
技术领域
本发明涉及配电网用电检测领域,具体涉及一种基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统。
背景技术
现场用电安装接线过程中,因住户空气开关与电能表安装地点不同,二者之间存在一定的距离,电能表出线端到空气开关进线端的电力线路会被遮蔽物挡住,线路接好后,往往会出现A户的电能表计量的是B户的用电量,这种现象称为串户,导致用户实际交费与实际用电量不符,从而导致用户投诉风险。
传统的入户式串户排查方法包括跳负荷开关或增加负荷、万用表对线法、电力载波信号检测法。这些方法都需要用户配合,效率低下,并且有可能会导致用户用电体验和满意度降低。近年来兴起的非入户式串户排查方法,其思路是在电表(主机)测注入多个不同频率点的载波信号,然后根据用户(从机)侧收集的所有的频率信号进行简单的平均处理进而进行联合判断。但是现有设备对于采集到的数据难以得到有效利用,造成信号的叠加污染,使得排查结果不准确。
发明内容
本发明要解决的技术问题:针对现有技术的上述问题,提供一种基于广义Dice系数和局部离群因子的非入户式串户排查方法,本发明采用了多种信号处理方法,不影响原物理系统的拓扑结构,同时又能够在一定程度上解决普通的非入户串户排查方法存在的信号叠加污染的问题,能够有效提升串户检查结果的准确性。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于广义Dice系数和局部离群因子的非入户式串户排查方法,实施步骤包括:
1)获取试验区域的n个表户的信号强度值,所述信号强度值为针对试验区域的n个表户,针对m个频率下的每一种频率依次施加每表户的电能表的出线、在每表户的门口接收该频率的信号强度得到,每一种频率对应得到n2个信号强度值,共得到m*n2个信号强度值;
2)针对所有的信号强度值,根据信号强度值之间的广义Dice系数将所有的信号强度值划分为k个频块;
3)针对k个频块中的每一个频块,计算每一个信号强度值的局部离群因子LOF的值;
4)针对k个频块中的每一个频块以局部离群因子LOF的值为特征,采用聚类算法进行聚类并筛选剔除出聚类后的离群点;
5)针对每一个包含h个频率、共h*n2个信号强度值的频块,将其中的h*n2个信号强度值展开得到h个n*n的信号强度矩阵,每一个信号强度矩阵中的任意第i行j列的元素代表该频率施加到j表户的电能表出线后在i表户处接收到的信号强度,将h个n*n的信号强度矩阵累加并取平均值得到该频块的信号强度值矩阵
Figure BDA0002419415740000021
并根据信号强度值矩阵
Figure BDA0002419415740000022
计算频块融合后新的信号强度矩阵;
6)判断新的信号强度矩阵的主对角线元素是否为各行列的最大元素,如果某行列的主对角线元素是最大元素则判定为不串户,否则判定发生了串户。
可选地,步骤2)的详细步骤包括:
2.1)将所有的信号强度值作为初始的信号强度值集合,初始化频块变量b为1;
2.2)从信号强度值集合中取出一个信号强度值作为第b个频块的节点;
2.3)计算信号强度值集合中剩余的各个信号强度值和第b个频块的节点之间的广义Dice系数,挑选出其中广义Dice系数的值大于预设阈值γ的信号强度值,将其加入第b个频块Xb
2.4)判断信号强度值集合是否为空,如果信号强度值集合非空,则将频块变量b加1,跳转执行步骤2.2);否则,判定频块划分结束,所有的信号强度值被划分为k个频块。
可选地,所述广义Dice系数的计算函数表达式如下式所示:
Figure BDA0002419415740000023
上式中,D(xi,xj)表示信号强度值xi和信号强度值xj间的广义Dice系数,信号强度值xi和信号强度值xj中一个为频块的节点、另一个为信号强度值集合中剩余的信号强度值。
可选地,步骤4)中采用聚类算法进行聚类并筛选剔除出聚类后的离群点的步骤包括:
4.1)从当前频块的N个信号强度值的局部离群因子LOF样本中随机选取C个局部离群因子LOF样本作为初始中心;
4.2)对剩余的每个局部离群因子LOF样本测量其到各个初始中心的距离,把该局部离群因子LOF样本归为与之距离最近的类;
4.3)通过聚类算法重新计算已经得到的各个聚类的新的中心;
4.4)判断新的中心与原中心相等或误差平方和小于预设阈值是否成立,如果成立则跳转执行步骤4.2)继续进行聚类,否则保留聚类结果中局部离群因子LOF占据主体地位的信号强度值,筛选剔除出聚类后的离群点,跳转执行步骤5)。
可选地,步骤4)中采用的聚类算法为K-means算法,且聚类数量为2。
可选地,步骤5)中将h个n*n的信号强度矩阵累加并取平均值得到的该频块的信号强度值矩阵
Figure BDA0002419415740000024
的函数表达式如下式所示:
Figure BDA0002419415740000031
上式中,采用通式
Figure BDA0002419415740000032
表示频块b内所有频率下的
Figure BDA0002419415740000033
的平均值,其中p和q取值范围为[1,n],
Figure BDA0002419415740000034
表示第i个频率施加到第p户的电能表出线之后在第q户门口收到的信号强度。
可选地,步骤5)中计算频块融合后新的信号强度矩阵的步骤包括:首先采用下式计算频块融合后新的信号强度矩阵中的每一个元素;
Figure BDA0002419415740000035
Figure BDA0002419415740000036
上式中,f_xpq表示频块融合后新的信号强度矩阵中第p行q列的元素值,k为频块数量,b为频块序号,
Figure BDA0002419415740000037
表示频块b内所有
Figure BDA0002419415740000038
的平均值,其中p和q取值范围为[1,n],
Figure BDA0002419415740000039
表示第i个频率施加到第p户的电能表出线之后在第q户门口收到的信号强度,
Figure BDA00024194157400000310
表示频块b的权重;然后根据下式构建频块融合后新的信号强度矩阵:
Figure BDA00024194157400000311
上式中,f_x11~f_x1n表示频块融合后新的信号强度矩阵中第1行第1~n列的元素值,f_x21~f_x2n表示频块融合后新的信号强度矩阵中第2行第1~n列的元素值,f_xn1~f_xnn表示频块融合后新的信号强度矩阵中第n行第1~n列的元素值。
本发明还提供一种基于广义Dice系数和局部离群因子的非入户式串户排查系统,包括计算机设备,该计算机设备被编程或配置以执行所述基于广义Dice系数和局部离群因子的非入户式串户排查方法的步骤。
本发明还提供一种基于广义Dice系数和局部离群因子的非入户式串户排查系统,包括计算机设备,该计算机设备的存储器上存储有被编程或配置以执行所述基于广义Dice系数和局部离群因子的非入户式串户排查方法的计算机程序。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行所述基于广义Dice系数和局部离群因子的非入户式串户排查方法的计算机程序。
和现有技术相比,本发明具有下述优点:
1、本发明通过获取试验区域的n个表户的信号强度值为针对试验区域的n个表户,针对m个频率下的每一种频率依次施加每表户的电能表的出线、在每表户的门口接收该频率的信号强度得到,每一种频率对应得到n2个信号强度值,共得到m*n2个信号强度值,利用上述施加频率、检测不同表户对频率的信号强度值,能够有效提取出是否串户的基础数据,从而为串户检测提供基础条件。
2、本发明获取试验区域的n个表户的信号强度值仅仅需要施加每表户的电能表的出线、在每表户的门口接收该频率的信号强度,不需要入户操作,而后续处理步骤均可以通过计算机程序来实现,因此检测非常快捷快捷,不需改变物理系统的拓扑,不影响物理运行。
3、本发明根据信号强度值之间的广义Dice系数将所有的信号强度值划分为k个频块,将携带相似表户信号强度的频率划分到一块;针对k个频块中的每一个频块以局部离群因子LOF的值为特征,采用聚类算法进行聚类并筛选剔除出聚类后的离群点,使得频块内的信号强度具有更高的一致紧凑型,在上述处理的基础上,再通过构建频块融合后新的信号强度矩阵来进行串户识别。由于不同频率的信号在空间中的传播很大程度上与该频率本身的特性以及空间的环境状况有关,带有很大的不确定性,很容易给检测结果带来误差。因此本发明采用了基于广义Dice系数和局部离群因子的方法,筛选出了在相同环境条件下传播特性相似的频率,并进行了“聚类”,类似于“控制变量法”,将频率本身的特性以及环境因素带来的影响进行了算法上的约束,使得表户关系成为了影响检测结果的最主要的变量,能够大大提高检测的准确度,能够准确发现出其中存在串户的表户,具有检测准确可靠的优点。
附图说明
图1为本发明实施例方法的基本流程示意图。
图2为本发明实施例中频块划分过程示意图。
图3为本发明实施例频块筛选过程中第1个频块的实例图。
图4为本发明实施例频块筛选过程中第2个频块的实例图。
图5为本发明实施例频块筛选过程中第3个频块的实例图。
具体实施方式
如图1所示,本实施例基于广义Dice系数和局部离群因子的非入户式串户排查方法的实施步骤包括:
1)获取试验区域的n个表户的信号强度值,所述信号强度值为针对试验区域的n个表户,针对m个频率下的每一种频率依次施加每表户的电能表的出线、在每表户的门口接收该频率的信号强度得到,每一种频率对应得到n2个信号强度值,共得到m*n2个信号强度值;
2)针对所有的信号强度值,根据信号强度值之间的广义Dice系数将所有的信号强度值划分为k个频块;
3)针对k个频块中的每一个频块,计算每一个信号强度值的局部离群因子LOF的值;
4)针对k个频块中的每一个频块以局部离群因子LOF的值为特征,采用聚类算法进行聚类并筛选剔除出聚类后的离群点;
5)针对每一个包含h个频率、共h*n2个信号强度值的频块,将其中的h*n2个信号强度值展开得到h个n*n的信号强度矩阵,每一个信号强度矩阵中的任意第i行j列的元素代表该频率施加到j表户的电能表出线后在i表户处接收到的信号强度,将h个n*n的信号强度矩阵累加并取平均值得到该频块的信号强度值矩阵
Figure BDA0002419415740000051
并根据信号强度值矩阵
Figure BDA0002419415740000052
计算频块融合后新的信号强度矩阵;
6)判断新的信号强度矩阵的主对角线元素是否为各行列的最大元素,如果某行列的主对角线元素是最大元素则判定为不串户,否则判定发生了串户。
本实施例步骤1)中获取试验区域的n个表户的信号强度值时,每个用户安装一块电能表即视为一个表户,如果用户安装多个电能表,则可视为多个表户。在测试时,选取m个频率(m≥n)进行试验,将m个频率依次加入每块电能表的出线,在每户的门口接收该频率的信号强度得到一个强度值,共得到m个频率下的m*n2个信号强度值中,第i个频率共得到n2个信号强度值,且以信号强度值
Figure BDA0002419415740000053
表示第i个频率施加到第p户的电能表出线之后在第q户门口收到的信号强度。本实施例中采集的数据来源于某小区(4层),表箱位于一楼,户型为一梯两户,共8个住户,真实的用电情况是没有串户。现场数据无需进入室内,只需在门口附近采集信号即可。
本实施例中,步骤2)的详细步骤包括:
2.1)将所有的信号强度值作为初始的信号强度值集合,初始化频块变量b为1;
2.2)从信号强度值集合中取出一个信号强度值作为第b个频块的节点;
2.3)计算信号强度值集合中剩余的各个信号强度值和第b个频块的节点之间的广义Dice系数,挑选出其中广义Dice系数的值大于预设阈值γ的信号强度值,将其加入第b个频块Xb;预设阈值γ一般要大于0.5,本实施例中预设阈值γ的设为0.7。
2.4)判断信号强度值集合是否为空,如果信号强度值集合非空,则将频块变量b加1,跳转执行步骤2.2);否则,判定频块划分结束,所有的信号强度值被划分为k个频块。最终得到的k个频块的集合X可表示为:X=[X1,X2,…,Xk],其中X1~Xk分别表示第1~k个频块。每一频块内的成员具有相似的表户信号强度,在串户判断过程中能够降低互相抵消干扰的风险,有利于输出一致的判断结果。
如图2所示,首先将所有的信号强度值作为初始的信号强度值集合X。生成第1个频块X1:将信号强度值集合X中的第一个信号强度值x1作为第1个频块X1的节点,分别计算信号强度值x1和剩余的信号强度值x1~xm广义Dice系数D,并挑选出(从信号强度值集合X中删除)其中广义Dice系数D的值大于预设阈值γ的信号强度值加入第1个频块X1,此时信号强度值集合X剩余的元素为信号强度值xu~xw,由于非空,因此需要继续进行频块划分;生成第2个频块X2:选择信号强度值xu作为第2个频块X2的节点,分别计算信号强度值xu和剩余的信号强度值xu+1~xw广义Dice系数D,并挑选出(从信号强度值集合X中删除)其中广义Dice系数D的值大于预设阈值γ的信号强度值加入第2个频块X2,此时信号强度值集合X剩余的元素非空,因此需要继续进行频块划分;生成第3个频块X3:以此类推,从信号强度值集合X中取出一个信号强度值作为第3个频块的节点;计算信号强度值集合中剩余的各个信号强度值和第3个频块的节点之间的广义Dice系数D,挑选出其中广义Dice系数D的值大于预设阈值γ的信号强度值,将其加入第3个频块X3;此时信号强度值集合X已经为空,因此频块划分结束。最终得到频块的数量为3个,即得到的k个频块的集合X可表示为:X=[X1,X2,X3]。
本实施例中,广义Dice系数的计算函数表达式如下式所示:
Figure BDA0002419415740000061
上式中,D(xi,xj)表示信号强度值xi和信号强度值xj间的广义Dice系数,信号强度值xi和信号强度值xj中一个为频块的节点、另一个为信号强度值集合中剩余的信号强度值。其中,第i个信号强度值xi满足
Figure BDA0002419415740000062
和第j个信号强度值xj满足
Figure BDA0002419415740000063
Figure BDA0002419415740000064
表示所有的m*n2个信号强度值的集合。
步骤3)中计算每一个信号强度值的局部离群因子LOF的值时,局部离群因子LOF的计算方法为本领域的成熟算法,本实施例中仅仅为涉及应用,故在此不再赘述。
本实施例步骤4)中采用聚类算法进行聚类并筛选剔除出聚类后的离群点的步骤包括:
4.1)从当前频块的N个信号强度值的局部离群因子LOF样本中随机选取C个局部离群因子LOF样本作为初始中心;
4.2)对剩余的每个局部离群因子LOF样本测量其到各个初始中心的距离,把该局部离群因子LOF样本归为与之距离最近的类;
4.3)通过聚类算法重新计算已经得到的各个聚类的新的中心;
4.4)判断新的中心与原中心相等或误差平方和小于预设阈值是否成立,如果成立则跳转执行步骤4.2)继续进行聚类,否则保留聚类结果中局部离群因子LOF占据主体地位的信号强度值,筛选剔除出聚类后的离群点,跳转执行步骤5)。
本实施例中,步骤4)中采用的聚类算法为K-means算法,且聚类数量为2。结合K-means算法,只需设定聚类个数,不必为每一个频块单独设定筛选阈值就能够实现离群点的筛选,使得频块内的信号强度具有更高的一致紧凑型。本实施例中最终得到第1个频块的聚类结果如图3所示,第2个频块的聚类结果如图4所示,第3个频块的聚类结果如图5所示。图中圆圈表示的是剔除的离群点,因为这些离群点的局部离群值总体要大于其他点,尤其对于第2和第3个频块尤为明显。
本实施例中,步骤5)中将h个n*n的信号强度矩阵累加并取平均值得到的该频块的信号强度值矩阵
Figure BDA0002419415740000071
的函数表达式如下式所示:
Figure BDA0002419415740000072
上式中,采用通式
Figure BDA0002419415740000073
表示频块b内所有频率下的
Figure BDA0002419415740000074
的平均值,其中p和q取值范围为[1,n],
Figure BDA0002419415740000075
表示第i个频率施加到第p户的电能表出线之后在第q户门口收到的信号强度。
本实施例中,步骤5)中计算频块融合后新的信号强度矩阵的步骤包括:首先采用下式计算频块融合后新的信号强度矩阵中的每一个元素;
Figure BDA0002419415740000076
Figure BDA0002419415740000077
上式中,f_xpq表示频块融合后新的信号强度矩阵中第p行q列的元素值,k为频块数量,b为频块序号,
Figure BDA0002419415740000078
表示频块b内所有
Figure BDA0002419415740000079
的平均值,其中p和q取值范围为[1,n],
Figure BDA00024194157400000710
表示第i个频率施加到第p户的电能表出线之后在第q户门口收到的信号强度,
Figure BDA00024194157400000711
表示频块b的权重(当某一频块的信号越强则在最终融合后的信号中比重越大,因此可以突出数值大的频块的作用);然后根据下式构建频块融合后新的信号强度矩阵:
Figure BDA00024194157400000712
上式中,f_x11~f_x1n表示频块融合后新的信号强度矩阵中第1行第1~n列的元素值,f_x21~f_x2n表示频块融合后新的信号强度矩阵中第2行第1~n列的元素值,f_xn1~f_xnn表示频块融合后新的信号强度矩阵中第n行第1~n列的元素值。通过比较每一户下所有表的强度大小,当对应的表具有最大数值时即为不串户,否则即为串户。
为了对本实施例基于广义Dice系数和局部离群因子的非入户式串户排查方法的结果准确性进行验证,下文将以与传统的简单平均处理方法进行串户排查结果对比。针对试验区域的8个表户,传统的简单平均处理方法进行串户排查结果如表1所示,其中户1~户8分别表示该检测区域内的8个不同的用户,表1~表8分别表示标注为户1~户8的电能表,表格中的第i行j列的数据表示,某频率的信号施加给标注为第j户的电能表(即表j)后,在户i处接收到的信号强度的平均值。
表1:传统的简单平均处理方法进行串户排查结果。
表1 表2 表3 表4 表5 表6 表7 表8
户1 1 0.45 0.55 0.69 0.49 0.57 0.37 0
户2 0.71 1 0.49 0.93 0.50 0.58 0.38 0
户3 0.37 0.29 1 0.59 0.71 0.52 0.45 0
户4 0.17 0.38 0.52 1 0.53 0.50 0.44 0
户5 0.25 0.08 0.27 0.61 1 0.63 0.42 0
户6 0.30 0.25 0.42 0.65 0.56 1 0.60 0
户7 0.13 0 0.18 0.59 0.60 0.47 1 0.01
户8 0.12 0.27 0.14 0.58 1 0.66 0.89 0
而本实施例方法中构建频块融合后新的信号强度矩阵如表2所示,户1~户8分别表示该检测区域内的8个不同的用户,表1~表8分别表示标注为户1~户8的电能表,表格中的第i行j列的数据表示多种频率的信号施加在第j户的电能表(即表j)后,在户i处收到的融合信号强度。第。
表2:本实施例方法中构建频块融合后新的信号强度矩阵数据。
表1 表2 表3 表4 表5 表6 表7 表8
户1 1 0.33 0.40 0.72 0.45 0.68 0.19 0
户2 0.77 1 0.43 0.98 0.44 0.61 0.56 0
户3 0.48 0.32 1 0.66 0.76 0.81 0.49 0
户4 0.01 0.34 0.73 1 0.68 0.61 0.61 0
户5 0.43 0 0.21 0.78 1 0.66 0.31 0
户6 0.27 0.11 0.39 0.84 0.58 1 0.73 0
户7 0.05 0 0.11 0.74 0.52 0.54 1 0.24
户8 0.75 0.24 0 0.50 0.74 0.83 0.87 1
观察表2可知,对于每一户采集的所有电表的数值中对应的电表显示最大,说明没有串户,与实际情况一致。而观察表1知,即传统方法的数据分析结果,户5和户8对应最大数值的均是电表5,说明户5和户8存在串户的可能,这就给测量人员造成了疑虑和不必要的入户核实麻烦。因此,本实施例基于广义Dice系数和局部离群因子的非入户式串户排查方法有助于提高串户检测的准确性。
此外,本实施例还提供一种基于广义Dice系数和局部离群因子的非入户式串户排查系统,包括计算机设备,该计算机设备被编程或配置以执行前述基于广义Dice系数和局部离群因子的非入户式串户排查方法的步骤。
此外,本实施例还提供一种基于广义Dice系数和局部离群因子的非入户式串户排查系统,包括计算机设备,该计算机设备的存储器上存储有被编程或配置以执行前述基于广义Dice系数和局部离群因子的非入户式串户排查方法的计算机程序。
此外,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有被编程或配置以执行前述基于广义Dice系数和局部离群因子的非入户式串户排查方法的计算机程序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于广义Dice系数和局部离群因子的非入户式串户排查方法,其特征在于实施步骤包括:
1)获取试验区域的n个表户的信号强度值,所述信号强度值为针对试验区域的n个表户,针对m个频率下的每一种频率依次施加每表户的电能表的出线、在每表户的门口接收该频率的信号强度得到,每一种频率对应得到n2个信号强度值,共得到m*n2个信号强度值;
2)针对所有的信号强度值,根据信号强度值之间的广义Dice系数将所有的信号强度值划分为k个频块;
3)针对k个频块中的每一个频块,计算每一个信号强度值的局部离群因子LOF的值;
4)针对k个频块中的每一个频块以局部离群因子LOF的值为特征,采用聚类算法进行聚类并筛选剔除出聚类后的离群点;
5)针对每一个包含h个频率、共h*n2个信号强度值的频块,将其中的h*n2个信号强度值展开得到h个n*n的信号强度矩阵,每一个信号强度矩阵中的任意第i行j列的元素代表该频率施加到j表户的电能表出线后在i表户处接收到的信号强度,将h个n*n的信号强度矩阵累加并取平均值得到该频块的信号强度值矩阵
Figure FDA0002419415730000011
并根据信号强度值矩阵
Figure FDA0002419415730000012
计算频块融合后新的信号强度矩阵;
6)判断新的信号强度矩阵的主对角线元素是否为各行列的最大元素,如果某行列的主对角线元素是最大元素则判定为不串户,否则判定发生了串户。
2.根据权利要求1所述的基于广义Dice系数和局部离群因子的非入户式串户排查方法,其特征在于,步骤2)的详细步骤包括:
2.1)将所有的信号强度值作为初始的信号强度值集合,初始化频块变量b为1;
2.2)从信号强度值集合中取出一个信号强度值作为第b个频块的节点;
2.3)计算信号强度值集合中剩余的各个信号强度值和第b个频块的节点之间的广义Dice系数,挑选出其中广义Dice系数的值大于预设阈值γ的信号强度值,将其加入第b个频块Xb
2.4)判断信号强度值集合是否为空,如果信号强度值集合非空,则将频块变量b加1,跳转执行步骤2.2);否则,判定频块划分结束,所有的信号强度值被划分为k个频块。
3.根据权利要求2所述的基于广义Dice系数和局部离群因子的非入户式串户排查方法,其特征在于,所述广义Dice系数的计算函数表达式如下式所示:
Figure FDA0002419415730000013
上式中,D(xi,xj)表示信号强度值xi和信号强度值xj间的广义Dice系数,信号强度值xi和信号强度值xj中一个为频块的节点、另一个为信号强度值集合中剩余的信号强度值。
4.根据权利要求1所述的基于广义Dice系数和局部离群因子的非入户式串户排查方法,其特征在于,步骤4)中采用聚类算法进行聚类并筛选剔除出聚类后的离群点的步骤包括:
4.1)从当前频块的N个信号强度值的局部离群因子LOF样本中随机选取C个局部离群因子LOF样本作为初始中心;
4.2)对剩余的每个局部离群因子LOF样本测量其到各个初始中心的距离,把该局部离群因子LOF样本归为与之距离最近的类;
4.3)通过聚类算法重新计算已经得到的各个聚类的新的中心;
4.4)判断新的中心与原中心相等或误差平方和小于预设阈值是否成立,如果成立则跳转执行步骤4.2)继续进行聚类,否则保留聚类结果中局部离群因子LOF占据主体地位的信号强度值,筛选剔除出聚类后的离群点,跳转执行步骤5)。
5.根据权利要求4所述的基于广义Dice系数和局部离群因子的非入户式串户排查方法,其特征在于,步骤4)中采用的聚类算法为K-means算法,且聚类数量为2。
6.根据权利要求1所述的基于广义Dice系数和局部离群因子的非入户式串户排查方法,其特征在于,步骤5)中将h个n*n的信号强度矩阵累加并取平均值得到的该频块的信号强度值矩阵
Figure FDA0002419415730000021
的函数表达式如下式所示:
Figure FDA0002419415730000022
上式中,采用通式
Figure FDA0002419415730000023
表示频块b内所有频率下的
Figure FDA0002419415730000024
的平均值,其中p和q取值范围为[1,n],
Figure FDA0002419415730000025
表示第i个频率施加到第p户的电能表出线之后在第q户门口收到的信号强度。
7.根据权利要求1所述的基于广义Dice系数和局部离群因子的非入户式串户排查方法,其特征在于,步骤5)中计算频块融合后新的信号强度矩阵的步骤包括:首先采用下式计算频块融合后新的信号强度矩阵中的每一个元素;
Figure FDA0002419415730000026
Figure FDA0002419415730000027
上式中,f_xpq表示频块融合后新的信号强度矩阵中第p行q列的元素值,k为频块数量,b为频块序号,
Figure FDA0002419415730000028
表示频块b内所有
Figure FDA0002419415730000029
的平均值,其中p和q取值范围为[1,n],
Figure FDA00024194157300000210
表示第i个频率施加到第p户的电能表出线之后在第q户门口收到的信号强度,
Figure FDA00024194157300000211
表示频块b的权重;然后根据下式构建频块融合后新的信号强度矩阵:
Figure FDA0002419415730000031
上式中,f_x11~f_x1n表示频块融合后新的信号强度矩阵中第1行第1~n列的元素值,f_x21~f_x2n表示频块融合后新的信号强度矩阵中第2行第1~n列的元素值,f_xn1~f_xnn表示频块融合后新的信号强度矩阵中第n行第1~n列的元素值。
8.一种基于广义Dice系数和局部离群因子的非入户式串户排查系统,包括计算机设备,其特征在于,该计算机设备被编程或配置以执行权利要求1~7中任意一项所述基于广义Dice系数和局部离群因子的非入户式串户排查方法的步骤。
9.一种基于广义Dice系数和局部离群因子的非入户式串户排查系统,包括计算机设备,其特征在于,该计算机设备的存储器上存储有被编程或配置以执行权利要求1~7中任意一项所述基于广义Dice系数和局部离群因子的非入户式串户排查方法的计算机程序。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有被编程或配置以执行权利要求1~7中任意一项所述基于广义Dice系数和局部离群因子的非入户式串户排查方法的计算机程序。
CN202010201124.1A 2020-03-20 2020-03-20 基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统 Active CN111444946B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010201124.1A CN111444946B (zh) 2020-03-20 2020-03-20 基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010201124.1A CN111444946B (zh) 2020-03-20 2020-03-20 基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统

Publications (2)

Publication Number Publication Date
CN111444946A true CN111444946A (zh) 2020-07-24
CN111444946B CN111444946B (zh) 2023-04-28

Family

ID=71650695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010201124.1A Active CN111444946B (zh) 2020-03-20 2020-03-20 基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统

Country Status (1)

Country Link
CN (1) CN111444946B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685463A (zh) * 2020-12-22 2021-04-20 深圳供电局有限公司 电能表串户辅助识别方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130346466A1 (en) * 2012-06-22 2013-12-26 Microsoft Corporation Identifying outliers in a large set of objects
US20170231713A1 (en) * 2016-02-16 2017-08-17 The Johns Hopkins University Mr-levelcheck-2: method for localization of structures in projection images
US20180203917A1 (en) * 2017-01-19 2018-07-19 Acquire Media Ventures Inc. Discovering data similarity groups in linear time for data science applications
CN109345409A (zh) * 2018-09-10 2019-02-15 国家电网有限公司 一种基于宽带载波的居民用户综合能效管理方法
CN110297207A (zh) * 2019-07-08 2019-10-01 国网上海市电力公司 智能电表的故障诊断方法、系统及电子装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130346466A1 (en) * 2012-06-22 2013-12-26 Microsoft Corporation Identifying outliers in a large set of objects
US20170231713A1 (en) * 2016-02-16 2017-08-17 The Johns Hopkins University Mr-levelcheck-2: method for localization of structures in projection images
US20180203917A1 (en) * 2017-01-19 2018-07-19 Acquire Media Ventures Inc. Discovering data similarity groups in linear time for data science applications
CN109345409A (zh) * 2018-09-10 2019-02-15 国家电网有限公司 一种基于宽带载波的居民用户综合能效管理方法
CN110297207A (zh) * 2019-07-08 2019-10-01 国网上海市电力公司 智能电表的故障诊断方法、系统及电子装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱婷;王瑜;肖洪兵;邢素霞;: "基于WRN-PPNet的多模态MRI脑肿瘤全自动分割" *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112685463A (zh) * 2020-12-22 2021-04-20 深圳供电局有限公司 电能表串户辅助识别方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111444946B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN107832973B (zh) 一种基于多态信息综合评判的设备质量管控的方法
EP2840406A1 (en) Fault location system and method for distribution network
CN107818232B (zh) 基于负载容量模型的集成电路关键部件确定方法
CN107622801A (zh) 疾病概率的检测方法和装置
CN113985339B (zh) 智能电表的误差诊断方法及系统、设备、存储介质
CN113805138B (zh) 一种基于参数有向遍历的智能电表误差估计方法及装置
CN110601173B (zh) 基于边缘计算的配网拓扑识别方法及装置
CN113344470B (zh) 一种基于区块链的供电系统智能管理方法
CN106843100A (zh) 变电站二次设备运行状态等级判断方法和装置
CN104899353A (zh) 一种基于证据理论的电能质量扰动源定位方法
CN115408949B (zh) 一种负荷模型参数辨识方法、系统、设备和介质
CN111444946A (zh) 基于广义Dice系数和局部离群因子的非入户式串户排查方法及系统
CN114186420A (zh) 一种配电网台区拓扑校验方法、装置、设备和介质
CN110673017A (zh) 基于遗传算法的模拟电路故障元件参数辨识方法
CN111999691A (zh) 一种计量传感器装置的误差校准方法和误差校准装置
CN113189513A (zh) 一种基于纹波的冗余电源均流状态识别方法
CN105977968B (zh) 一种环状多源配电网的电能质量监测器优化配置方法
CN109784777B (zh) 基于时序信息片段云相似度度量的电网设备状态评估方法
CN109522640B (zh) 基于电流再分配的电路系统级联失效传播路径确定方法
CN110209713A (zh) 异常网架结构识别方法及装置
CN110740097B (zh) 一种电力通信网路由方案评估方法及装置
CN111695501B (zh) 一种基于操作系统内核调用数据的设备软故障检测方法
CN114006373A (zh) 一种供电冗余的识别方法及装置
CN104170325B (zh) 用于确定家庭网络质量的方法和服务器
CN110518619A (zh) 一种特高压直流闭锁故障的特征确定方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant