CN111861786A - 一种基于特征选择和孤立随机森林的专变窃电识别方法 - Google Patents

一种基于特征选择和孤立随机森林的专变窃电识别方法 Download PDF

Info

Publication number
CN111861786A
CN111861786A CN202010539948.XA CN202010539948A CN111861786A CN 111861786 A CN111861786 A CN 111861786A CN 202010539948 A CN202010539948 A CN 202010539948A CN 111861786 A CN111861786 A CN 111861786A
Authority
CN
China
Prior art keywords
user
electricity
month
electricity stealing
industry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010539948.XA
Other languages
English (en)
Other versions
CN111861786B (zh
Inventor
黄荣国
林振智
袁健
周佑
杨思洁
包锦辉
潘柏良
金挺超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Zhejiang Huayun Information Technology Co Ltd
Taizhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Marketing Service Center of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Zhejiang University ZJU
Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd
Zhejiang Huayun Information Technology Co Ltd
Taizhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU, Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd, Zhejiang Huayun Information Technology Co Ltd, Taizhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd filed Critical Zhejiang University ZJU
Priority to CN202010539948.XA priority Critical patent/CN111861786B/zh
Priority claimed from CN202010539948.XA external-priority patent/CN111861786B/zh
Publication of CN111861786A publication Critical patent/CN111861786A/zh
Application granted granted Critical
Publication of CN111861786B publication Critical patent/CN111861786B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Evolutionary Biology (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于特征选择和孤立随机森林的专变窃电识别方法,涉及电力运维领域。目前窃电识别使用的信息中无专变行业,影响正确率。本发明首先采集了区域范围内一个行业的专变用户一年的日用电量数据;接着计算该行业用户集的用电特征,包括年/月用电方差,月用电增长率,月负载率,月峰谷差等,建立特征集矩阵;然后使用Relief过滤式特征选择方法,选择相关统计量较大的特征作为辨识窃电用户的关键特征;最后使用孤立随机森林检测算法,检测已知的窃电样本与疑似窃电用户。本发明可以快速、准确地根据不同行业正常用户和窃电用户的用电特征,完成一个行业窃电嫌疑户的快速排查。

Description

一种基于特征选择和孤立随机森林的专变窃电识别方法
技术领域
本发明涉及电力运维领域,尤其涉及一种基于特征选择和孤立随机森林的专变窃电识别方法。
背景技术
窃电问题的日益突出导致配电网线损率居高不下,使电力企业蒙受巨大的直接经济损失,加重了电力企业的经营负担,同时容易危害电网的安全运行,严重损害正常用户的利益。窃电问题不仅制约了供电企业的发展,也严重影响了国家的经济建设和社会的稳定。而长期以来,我国在反窃电方面以人工排查为主,有效的反窃电技术措施不足,防治手段落后。因此,现实生活中迫切需要研究更高效、系统、全面的反窃电技术措施。
部分电网企业升级改造负荷管理系统平台功能。针对部分特定的窃电嫌疑客户,在客户侧加装防窃电模块,增强监控时效性。防窃电模块主要是在客户现场采集客户一次负荷运行数据,用以对比计量装置二次数据,扩展后台监控与分析功能,实现窃电监控24小时不间断监控功能,系统异常自动报警为电网企业防窃电工作人员提供查窃电线索,减轻人力巡查。
目前电网企业普遍投入使用了远程负荷管理系统。电网企业的负荷管理系统24小时监测用户的用电和计量状态,通过系统不间断的挂机工作,采集用电情况,监测计量装置二次侧的电压、电流、功率、电量等参数的变化,进而提升了基于用电模式识别来检测窃电行为的潜力。在窃电检测领域里常用的分类器包括支持向量机、人工神经网络、决策树等。但是以上方法一般没有利用到专变行业的用电信息,因此正确率非常有限。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于特征选择和孤立随机森林的专变窃电识别方法,以提高对该行业的专变用户窃电行为的辨识效率及准确率的目的。为此,本发明采取以下技术方案。
一种基于特征选择和孤立随机森林的专变窃电识别方法,包括步骤:
1)提取某一行业专变用户一年的日用电量数据,并根据有无窃电记录将用户分成窃电用户集和正常用户集;
2)以用户的日用电量数据为输入,计算该行业用户集的用电特征,并进行规范化;
3)使用Relief过滤式特征选择方法,选择相关统计量较大的特征作为辨识该行业窃电用户的关键特征;
4)将窃电用户集和正常用户集作为训练集,构建孤立随机森林检测集;
5)将该行业待检测专变用户特征集输入孤立随机森林检测集;
6)选取检测深度最浅的m%作为待排查的窃电嫌疑用户,m为基于供电公司排查人力确定的设定值;
7)对得到待排查的窃电嫌疑用户信息进行确认。
作为优选技术手段:在步骤2)中,基于该行业专变用户年日用电量数据进行分析,计算该行业用户集的用电特征,基于日用电量的用户用电特征包括年/月用电方差,月用电增长率,月负载率,月峰谷差,本方法选取以上指标作为用户用电特征,对应的计算公式分别为:
201)月用电方差
Figure BDA0002537132300000031
式中:
Figure BDA0002537132300000032
表示专变用户i在第j个月的日用电量方差;N为第j个月的天数;wj,k为专变用户i在第j个月的第k天的用电量;
Figure BDA0002537132300000033
为专变用户i在第j个月的平均用电量;
202)年用电方差
Figure BDA0002537132300000034
式中:
Figure BDA0002537132300000035
表示专变用户i该年的月用电量方差;Wi,k为专变用户i在第k个月的总用电量;
Figure BDA0002537132300000036
为专变用户i在该年的月平均用电量;
203)月用电增长率
Figure BDA0002537132300000037
式中:
Figure BDA0002537132300000038
表示专变用户i在第j个月的用电增长率;Wi,j为专变用户i在第j个月的总用电量;Wi,j-1为专变用户i在第j-1个月的总用电量;
204)月负载率
Figure BDA0002537132300000039
式中:
Figure BDA00025371323000000310
表示专变用户i在第j个月的月负载率;
Figure BDA00025371323000000311
为专变用户i在第j个月的平均用电量;wj,max为专变用户i在第j个月的最大日用电量;
205)月峰谷差
Figure BDA00025371323000000312
式中:
Figure BDA00025371323000000313
表示专变用户i在第j个月的月峰谷差;wj,max为专变用户i在第j个月的最大日用电量;wj,min为专变用户i在第j个月的最小日用电量;在计算所得的该行业用户集的用电特征集为C=[C1,C2,…,CM]=[C 1,C2,C3,C4,C5]后,M为特征的维数,由于不同的特征值取值范围不同,故为了使各维特征之间具有可比较性,采用规范化的方法,其计算步骤为:
Figure BDA0002537132300000041
式中:
Figure BDA0002537132300000042
为规范化后的特征向量;Ci为原始特征向量;
Figure BDA0002537132300000043
为特征向量的平均值;σ(Ci)为特征向量Ci的标准差;
将该行业用户集的用电特征集C=[C1,C2,…,CM]中的每一列分别规范化,则可得规范化后的用电特征集
Figure BDA0002537132300000044
其中
Figure BDA0002537132300000045
为Ci规范化后的特征向量。
作为优选技术手段:在步骤3)中,考虑到窃电用户样本的年/月用电方差,月用电增长率,月负载率,月峰谷差等常见用电特征中,各特征的异常度不同,且异常程度随窃电方法与时段变化较大,因此需要采用特征选择的方法,对规范化后的特征集矩阵进行筛选,筛选表征该行业窃电用户窃电的关键特征集,排除与窃电关联较小的特征,从而提高窃电检测器的效率与准确性。采用Relief过滤式特征选择方法,计算各维特征向量的相关统计量,选取相关统计量较大的特征作为构建孤立随机森林的关键特征,其计算方法为:
301)给定该行业专变用户的样本数据
Figure BDA0002537132300000046
,Y为用户窃电标签向量,正常用户y=0,窃电用户y=1;
302)对第i个专变用户的用电特征向量xi=[xi,1,xi,2,…,xi,M],先在xi的同类样本中寻找其欧氏距离最近邻
Figure BDA0002537132300000047
称为“猜中近邻”,再从xi的异类样本中寻找其欧氏距离最近邻
Figure BDA0002537132300000051
称为“猜错近邻”,则第j维特征
Figure BDA0002537132300000052
的相关统计量分量
Figure BDA0002537132300000053
式中:N为专变样本数目;xi,j
Figure BDA0002537132300000054
Figure BDA0002537132300000055
分别为第i个专变用户样本及其猜中近邻与猜错近邻的第j维特征值;
303)根据相关统计量排序,其值较大的特征向量作为该行业专变用户窃电关键特征集。
作为优选技术手段:在步骤5)中,选取该专变窃电用户与待检测专变用户的关键特征集作为测试数据集,输入训练所得孤立随机森林检测集iForest中,计算每一个专变用户孤立随机森林的路径长度作为其平均深度。
作为优选技术手段:在步骤6)中,测试集中孤立随机森林检测平均深度代表该样本用户的窃电嫌疑度,其深度约浅,窃电嫌疑越大。可依据供电公司现场排查能力确定平均深度最浅的样本作为现场排查名单。
有益效果:本技术方案采用特征选择和孤立随机森林的机器学习方法,能够结合区域内行业专变用户的用电特征以及部分已经排查到的窃电用户样本,通过筛选窃电用户样本历史用电数据特征中与正常用户样本差异较大的特征集,选取该部分特征集构建所对应的随机森林检测集,通过异常用电检测实现对该行业的专变用户窃电行为的辨识;本发明可以快速、准确地根据不同行业正常用户和窃电用户的用电特征,完成一个行业窃电嫌疑户的快速排查。
附图说明
图1是本发明的流程图。
图2是本发明的各维特征的相关统计量值分布图。
具体实施方式
以下结合说明书附图对本发明的技术方案做进一步的详细说明。
如图1所示,本发明的步骤为:首先采集了区域范围内某一行业的专变用户(包括正常用户与窃电用户)一年的日用电量数据;接着计算该行业用户集的用电特征,包括年/月用电方差,月用电增长率,月负载率,月峰谷差等,建立特征集矩阵;然后使用Relief过滤式特征选择方法,选择相关统计量较大的特征作为辨识窃电用户的关键特征;最后使用孤立随机森林检测算法,检测已知的窃电样本与疑似窃电用户。具体步骤为:
步骤1.根据用电信息采集系统中的专变行业分类信息,将区域内某一行业的专变一年的日用电数据作为输入,并根据历史窃电记录将专变用户设置对应标签,窃电用户为正例,即设置标签y=1,未发现窃电的用户为负例,即设置标签y=0;
步骤2.基于该行业专变用户年日用电量数据进行分析,计算该行业用户集的用电特征,基于日用电量的用户特征常见包括但不限于年/月用电方差,月用电增长率,月负载率,月峰谷差,本方法选取以上指标作为用户用电特征,对应的计算公式分别为:
1)月用电方差
Figure BDA0002537132300000071
式中:
Figure BDA0002537132300000072
表示专变用户i在第j个月的日用电量方差;N为第j个月的天数;wj,k为专变用户i在第j个月的第k天的用电量;
Figure BDA0002537132300000073
为专变用户i在第j个月的平均用电量;
2)年用电方差
Figure BDA0002537132300000074
式中:
Figure BDA0002537132300000075
表示专变用户i该年的月用电量方差;Wi,k为专变用户i在第k个月的总用电量;
Figure BDA0002537132300000076
为专变用户i在该年的月平均用电量;
3)月用电增长率
Figure BDA0002537132300000077
式中:
Figure BDA0002537132300000078
表示专变用户i在第j个月的用电增长率;Wi,j为专变用户i在第j个月的总用电量;
4)月负载率
Figure BDA0002537132300000079
式中:
Figure BDA00025371323000000710
表示专变用户i在第j个月的月负载率;
Figure BDA00025371323000000711
为专变用户i在第j个月的平均用电量;wj,max为专变用户i在第j个月的最大日用电量;
5)月峰谷差
Figure BDA00025371323000000712
式中:
Figure BDA00025371323000000713
表示专变用户i在第j个月的月峰谷差;wj,max为专变用户i在第j个月的最大日用电量;wj,min为专变用户i在第j个月的最小日用电量;计算所得的该行业用户集的用电特征集为C=[C1,C2,C3,C4,C5]=[C1,C2,…,CM],M为特征的维数,在计算专变用户各项特征值后,由于不同的特征值取值范围不同,故为了使各维特征之间具有可比较性,采用规范化的方法,其计算步骤为:
Figure BDA0002537132300000081
式中:
Figure BDA0002537132300000082
为规范化后的特征向量;Ci为原始特征向量;
Figure BDA0002537132300000083
为特征向量的平均值;σ(Ci)为特征向量Ci的标准差;
计算所得的该行业用户集的用电特征集为X=[C1,C2,…,CM]=[C1,C2,C3,C4,C5],M为C1~C5特征维数之和,将该行业用户集的用电特征集C=[C1,C2,…,CM]中的每一列分别规范化,则可得规范化后的用电特征集
Figure BDA0002537132300000084
其中
Figure BDA0002537132300000085
为Ci规范化后的特征向量。
步骤3.对规范化后的特征集矩阵进行筛选,采用Relief过滤式特征选择方法,计算各维特征向量的相关统计量,选取相关统计量较大的特征作为构建孤立随机森林的关键特征,其计算方法为:
1)给定该行业专变用户的样本数据
Figure BDA0002537132300000086
Y为用户窃电标签向量,正常用户y=0,窃电用户y=1;
2)对第i个专变用户的用电特征向量xi=[xi,1,xi,2,…,xi,M],先在xi的同类样本中寻找其欧氏距离最近邻
Figure BDA0002537132300000087
称为“猜中近邻”,再从xi的异类样本中寻找其欧氏距离最近邻
Figure BDA0002537132300000088
称为“猜错近邻”,则第j维特征
Figure BDA0002537132300000089
的相关统计量分量
Figure BDA00025371323000000810
式中:N为专变样本数目;xi,j
Figure BDA0002537132300000091
Figure BDA0002537132300000092
分别为第i个专变用户样本及其猜中近邻与猜错近邻的第j维特征值;
3)根据相关统计量排序,其值较大的特征向量作为该行业专变用户窃电关键特征集;
步骤4.选取该专变窃电用户与部分正常用户的关键特征集作为训练数据集,调用孤立森林算法,构建孤立随机森林检测集,其伪代码为:
Figure BDA0002537132300000093
其中ceiling(x)为取整函数,构建单棵树的函数iTree(X’,e,l)的伪代码为:
Figure BDA0002537132300000094
Figure BDA0002537132300000101
步骤5.选取该专变窃电用户与待检测专变用户的关键特征集作为测试数据集,输入训练所得孤立随机森林检测集iForest中,计算每一个专变用户孤立随机森林的路径长度作为其平均深度;
步骤6.测试集中孤立随机森林检测平均深度代表该样本用户的窃电嫌疑度,其深度约浅,窃电嫌疑越大。可依据供电公司现场排查能力选取平均深度最浅的样本作为现场排查名单。在本技术方案中,选取测试集中孤立随机森林检测平均深度最浅的10%作为窃电嫌疑用户
以下通过具体数据对本发明效果进行进一步的说明:
1数据来源
数据主要来源于国家电网用电信息采集系统,具体包括某省纺织行业专变2018年的365天日用电量数据,选取2018年稽查的2个窃电纺织专变用户作为正例样本,200个正常纺织专变用户作为反例样本,该省某市100个纺织专变用户作为待测试样本,总共包含四万余条数据。
2特征选择
对全部样本用户的2018年日用电量数据进行分析,计算用户集的用电特征,包括年/月用电方差,月用电增长率,月负载率,月峰谷差等。采用Relief过滤式特征选择方法,计算正例样本和反例样本各维特征的相关统计量,其结果如图2所示,根据相关统计量大小进行特征选择,选取相关统计量较大的20%特征作为关键特征。
3孤立随机森林检测及结果分析
将正例样本和反例样本的关键特征作为训练集构建孤立随机森林检测集,将正例样本和测试样本作为测试集输入训练所得的孤立随机森林检测集,其辨识结果如表1所示。
表1纺织行业窃电用户和窃电嫌疑用户的辨识结果
Figure BDA0002537132300000111
Figure BDA0002537132300000121
由表1可得,采用特征选择的孤立随机森林检测模型可以较好的检出专变用户中的窃电用户,并且根据不同行业窃电特征与手法的相似性,可以将窃电嫌疑用户较好的辨识出来,缩小电网企业排查窃电用户的范围,从而提高对该行业的专变用户窃电行为的排查效率。
以上图1所示的一种基于特征选择和孤立随机森林的专变窃电识别方法是本发明的具体实施例,已经体现出本发明实质性特点和进步,可根据实际的使用需要,在本发明的启示下,对其进行形状、结构等方面的等同修改,均在本方案的保护范围之列。

Claims (5)

1.一种基于特征选择和孤立随机森林的专变窃电识别方法,其特征在于包括以下步骤:
1)提取某一行业专变用户一年的日用电量数据,并根据有无窃电记录将用户分成窃电用户集和正常用户集;
2)以用户的日用电量数据为输入,计算该行业用户集的用电特征,并进行规范化;
3)使用Relief过滤式特征选择方法,选择相关统计量较大的特征作为辨识该行业窃电用户的关键特征;
4)将窃电用户集和正常用户集作为训练集,构建孤立随机森林检测集;
5)将该行业待检测专变用户特征集输入孤立随机森林检测集;
6)选取检测深度最浅的m%作为待排查的窃电嫌疑用户,m为基于供电公司排查人力确定的设定值;
7)对得到待排查的窃电嫌疑用户信息进行确认。
2.根据权利要求1所述的一种基于特征选择和孤立随机森林的专变窃电识别方法,其特征在于:在步骤2)中,基于该行业专变用户年日用电量数据进行分析,计算该行业用户集的用电特征,基于日用电量的用户用电特征包括年/月用电方差,月用电增长率,月负载率,月峰谷差,对应的计算公式分别为:
201)月用电方差
Figure FDA0002537132290000011
式中:
Figure FDA0002537132290000021
表示专变用户i在第j个月的日用电量方差;N为第j个月的天数;wj,k为专变用户i在第j个月的第k天的用电量;
Figure FDA0002537132290000022
为专变用户i在第j个月的平均用电量;
202)年用电方差
Figure FDA0002537132290000023
式中:
Figure FDA0002537132290000024
表示专变用户i该年的月用电量方差;Wi,k为专变用户i在第k个月的总用电量;
Figure FDA0002537132290000025
为专变用户i在该年的月平均用电量;
203)月用电增长率
Figure FDA0002537132290000026
式中:
Figure FDA0002537132290000027
表示专变用户i在第j个月的用电增长率;Wi,j为专变用户i在第j个月的总用电量;Wi,j-1为专变用户i在第j-1个月的总用电量;
204)月负载率
Figure FDA0002537132290000028
式中:
Figure FDA0002537132290000029
表示专变用户i在第j个月的月负载率;wj,max为专变用户i在第j个月的最大日用电量;
205)月峰谷差
Figure FDA00025371322900000210
式中:
Figure FDA00025371322900000211
表示专变用户i在第j个月的月峰谷差;wj,min为专变用户i在第j个月的最小日用电量;在计算所得的该行业用户集的用电特征集为C=[C1,C2,…,CM]=[C1,C2,C3,C4,C5]后,由于不同的特征值取值范围不同,故为了使各维特征之间具有可比较性,采用规范化的方法,其计算步骤为:
Figure FDA0002537132290000031
式中:
Figure FDA0002537132290000032
为规范化后的特征向量;Ci为原始特征向量;
Figure FDA0002537132290000033
为特征向量的平均值;σ(Ci)为特征向量Ci的标准差;
将该行业用户集的用电特征集C=[C1,C2,…,CM]中的每一列分别规范化,则可得规范化后的用电特征集
Figure FDA0002537132290000034
其中
Figure FDA0002537132290000035
为Ci规范化后的特征向量。
3.根据权利要求2所述的一种基于特征选择和孤立随机森林的专变窃电识别方法,其特征在于:在步骤3)中,对规范化后的特征集矩阵进行筛选,采用Relief过滤式特征选择方法,计算各维特征向量的相关统计量,选取相关统计量较大的特征作为构建孤立随机森林的关键特征,其计算方法为:
301)给定该行业专变用户的样本数据
Figure FDA0002537132290000036
Figure FDA0002537132290000037
Y为用户窃电标签向量,正常用户y=0,窃电用户y=1;
302)对第i个专变用户的用电特征向量xi=[xi,1,xi,2,…,xi,M],先在xi的同类样本中寻找其欧氏距离最近邻
Figure FDA0002537132290000038
称为“猜中近邻”,再从xi的异类样本中寻找其欧氏距离最近邻
Figure FDA0002537132290000039
称为“猜错近邻”,则第j维特征
Figure FDA00025371322900000310
的相关统计量分量
Figure FDA00025371322900000311
式中:N为专变样本数目;xi,j
Figure FDA00025371322900000312
Figure FDA00025371322900000313
分别为第i个专变用户样本及其猜中近邻与猜错近邻的第j维特征值;
303)根据相关统计量排序,其值较大的特征向量作为该行业专变用户窃电关键特征集。
4.根据权利要求3所述的一种基于特征选择和孤立随机森林的专变窃电识别方法,其特征在于:在步骤5)中,选取该专变窃电用户与待检测专变用户的关键特征集作为测试数据集,输入训练所得孤立随机森林检测集iForest中,计算每一个专变用户孤立随机森林的路径长度作为其平均深度。
5.根据权利要求4所述的一种基于特征选择和孤立随机森林的专变窃电识别方法,其特征在于:在步骤6)中测试集中孤立随机森林检测平均深度代表该样本用户的窃电嫌疑度,其深度越浅,窃电嫌疑越大;依据现场排查能力确定平均深度最浅的样本作为现场排查名单。
CN202010539948.XA 2020-06-12 一种基于特征选择和孤立随机森林的专变窃电识别方法 Active CN111861786B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010539948.XA CN111861786B (zh) 2020-06-12 一种基于特征选择和孤立随机森林的专变窃电识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010539948.XA CN111861786B (zh) 2020-06-12 一种基于特征选择和孤立随机森林的专变窃电识别方法

Publications (2)

Publication Number Publication Date
CN111861786A true CN111861786A (zh) 2020-10-30
CN111861786B CN111861786B (zh) 2024-07-12

Family

ID=

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112991093A (zh) * 2021-02-22 2021-06-18 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法及系统
CN113222624A (zh) * 2021-05-31 2021-08-06 江苏新智合电力技术有限公司 一种反窃电智能分析方法及系统
CN113282613A (zh) * 2021-04-16 2021-08-20 广东电网有限责任公司计量中心 专变和低压用户用电分析方法、系统、设备及存储介质
CN113569920A (zh) * 2021-07-06 2021-10-29 上海顿飞信息科技有限公司 基于自动编码的第二近邻异常检测方法
CN114066876A (zh) * 2021-11-25 2022-02-18 北京建筑大学 一种基于分类结果及cva-sgd法的建筑垃圾变化检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862347A (zh) * 2017-12-04 2018-03-30 国网山东省电力公司济南供电公司 一种基于随机森林的窃电行为的发现方法
CN108765004A (zh) * 2018-05-28 2018-11-06 贵州黔驰信息股份有限公司 一种基于数据挖掘识别用户窃电行为的方法
CN110210723A (zh) * 2019-05-15 2019-09-06 电子科技大学 一种基于层次分析法和孤立森林的窃电辨识方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862347A (zh) * 2017-12-04 2018-03-30 国网山东省电力公司济南供电公司 一种基于随机森林的窃电行为的发现方法
CN108765004A (zh) * 2018-05-28 2018-11-06 贵州黔驰信息股份有限公司 一种基于数据挖掘识别用户窃电行为的方法
CN110210723A (zh) * 2019-05-15 2019-09-06 电子科技大学 一种基于层次分析法和孤立森林的窃电辨识方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
余以胜;: "基于随机森林的用户行为识别模型研究", 电脑知识与技术, no. 07, 5 March 2017 (2017-03-05), pages 158 - 160 *
冯歆尧;黄剑文;孟禹;: "基于半监督三训方法的窃电用户识别的研究及应用", 微型电脑应用, no. 01, 20 January 2020 (2020-01-20), pages 162 - 163 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112991093A (zh) * 2021-02-22 2021-06-18 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法及系统
CN112991093B (zh) * 2021-02-22 2024-02-02 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法及系统
CN113282613A (zh) * 2021-04-16 2021-08-20 广东电网有限责任公司计量中心 专变和低压用户用电分析方法、系统、设备及存储介质
CN113282613B (zh) * 2021-04-16 2023-05-26 广东电网有限责任公司计量中心 专变和低压用户用电分析方法、系统、设备及存储介质
CN113222624A (zh) * 2021-05-31 2021-08-06 江苏新智合电力技术有限公司 一种反窃电智能分析方法及系统
CN113569920A (zh) * 2021-07-06 2021-10-29 上海顿飞信息科技有限公司 基于自动编码的第二近邻异常检测方法
CN113569920B (zh) * 2021-07-06 2024-05-31 上海顿飞信息科技有限公司 基于自动编码的第二近邻异常检测方法
CN114066876A (zh) * 2021-11-25 2022-02-18 北京建筑大学 一种基于分类结果及cva-sgd法的建筑垃圾变化检测方法
CN114066876B (zh) * 2021-11-25 2022-07-08 北京建筑大学 一种基于分类结果及cva-sgd法的建筑垃圾变化检测方法

Similar Documents

Publication Publication Date Title
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN110223196B (zh) 基于典型行业特征库和反窃电样本库的反窃电分析方法
CN110634080B (zh) 异常用电检测方法、装置、设备及计算机可读存储介质
CN109583680B (zh) 一种基于支持向量机的窃电辨识方法
CN111507376B (zh) 一种基于多种无监督方法融合的单指标异常检测方法
CN112101635A (zh) 一种用电异常的监测方法和系统
CN111738462B (zh) 电力计量装置故障抢修主动服务预警方法
CN110458230A (zh) 一种基于多判据融合的配变用采数据异常甄别方法
Monedero et al. Midas: Detection of non-technical losses in electrical consumption using neural networks and statistical techniques
CN113111053A (zh) 一种基于大数据的线损诊断与反窃电系统、方法及模型
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN113189418B (zh) 一种基于电压数据的拓扑关系识别方法
CN109583679A (zh) 一种多算法融合的窃电疑似度分析方法
CN113239087A (zh) 一种反窃电稽查监控方法及系统
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN112418687B (zh) 基于用电特征的用户用电异常识别方法、装置和存储介质
CN113591393A (zh) 智能变电站的故障诊断方法、装置、设备和存储介质
CN111506635A (zh) 一种基于自回归和朴素贝叶斯算法的居民用电行为分析的系统及方法
CN112257784A (zh) 一种基于梯度提升决策树的窃电检测方法
CN115730962A (zh) 一种基于大数据的电力营销稽查分析系统及方法
CN113392910A (zh) 一种判断违约用电与窃电的多维度智能分析经验算法和分类算法
CN115719283A (zh) 一种智能化会计管理系统
CN115905319B (zh) 一种海量用户电费异常的自动识别方法及系统
CN111612054A (zh) 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法
CN111861786A (zh) 一种基于特征选择和孤立随机森林的专变窃电识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220506

Address after: 311100 Building 5, 138 Yunlian Road, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Marketing service center of State Grid Zhejiang Electric Power Co.,Ltd.

Applicant after: ZHEJIANG University

Applicant after: STATE GRID ZHEJIANG ELECTRIC POWER CO., LTD. TAIZHOU POWER SUPPLY Co.

Applicant after: ZHEJIANG HUAYUN INFORMATION TECHNOLOGY Co.,Ltd.

Address before: The eight district of Hangzhou city in Zhejiang province 310014 Huadian Zhaohui under No. 1 Lane

Applicant before: STATE GRID ZHEJIANG ELECTRIC POWER COMPANY LIMITED ELECTRIC POWER Research Institute

Applicant before: ZHEJIANG University

Applicant before: STATE GRID ZHEJIANG ELECTRIC POWER CO., LTD. TAIZHOU POWER SUPPLY Co.

Applicant before: ZHEJIANG HUAYUN INFORMATION TECHNOLOGY Co.,Ltd.

GR01 Patent grant