CN110288039A - 基于用户用电负荷特征窃电检测方法 - Google Patents

基于用户用电负荷特征窃电检测方法 Download PDF

Info

Publication number
CN110288039A
CN110288039A CN201910580908.7A CN201910580908A CN110288039A CN 110288039 A CN110288039 A CN 110288039A CN 201910580908 A CN201910580908 A CN 201910580908A CN 110288039 A CN110288039 A CN 110288039A
Authority
CN
China
Prior art keywords
user
stealing
data
suspected
daily load
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910580908.7A
Other languages
English (en)
Other versions
CN110288039B (zh
Inventor
陈红梅
李媛媛
刘楠嶓
徐赟
李涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University of Technology
Original Assignee
Henan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University of Technology filed Critical Henan University of Technology
Priority to CN201910580908.7A priority Critical patent/CN110288039B/zh
Publication of CN110288039A publication Critical patent/CN110288039A/zh
Application granted granted Critical
Publication of CN110288039B publication Critical patent/CN110288039B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明涉及一种基于模糊C均值聚类算法和时间相似度技术处理用户用电负荷特征数据信息,来找出窃电用户的方法。本发明包括四个步骤:步骤一,对智能电表采集到的数据进行预处理,得到多个用户的日负荷曲线;步骤二,利用模糊C均值聚类算法对单个用户的电力日负荷曲线进行聚类,得到该用户的日负荷曲线中心,并给出该用户疑为窃电的数据;步骤三,利用时间相似度技术对该用户疑为窃电的数据进行时间序列相似度分析,给出该用户是否窃电和窃电信息的预判;步骤四,循环步骤二和步骤三,完成所有用户基于模糊C均值聚类和时间序列相似度分析的窃电检测。优点在于可以给出疑为窃电的时间和窃电相序,缩小疑为窃电用户的范围和窃电的时间段。

Description

基于用户用电负荷特征窃电检测方法
技术领域
本发明涉及一种窃电检测领域,具体涉及一种基于模糊C均值聚类和时间相似度技术的窃电检测方法,属于配电网电参数测量应用领域。
背景技术
随着国民经济的发展,电力的清洁、便利也逐渐使电力成为人们生产、生活必不可少的能源,但与此同时,非法窃电问题也变得越来越突出。窃电行为会使电力部门的收入锐减,用户未经允许随意的私接电线,会给电网的稳定运行带来了严重的安全隐患,因此如何有效防止窃电、维护电网安全稳定是保证电力稳定发展的一个重要分支。用户的窃电检测显得特别重要。目前窃电检测有三种方法:可以通过人工到现场进行排查;硬件上通过防非法开启、防电磁干扰等来防止窃电;软件上通过实时监控系统、对智能电表进行软件加密等来进行窃电检测。目前的窃电检测方法有很多不足之处:人工排查的工作量大、硬件上非法开启窃电后不能实时计量电能损耗;软件检测方法存在误判、漏判等缺陷。
基于大数据分析的窃电检测方法显得格外重要。目前我国已经基本实现了智能电能表的全覆盖工作,基于大数据分析的窃电检测方法,不需要增加额外硬件开销,通过编写算法对采集到的用户负荷数据进行处理、分类,得到电力用户的电能使用情况,能大大降低一线运检人员的工作强度和提高电力公司的运营管理水平。
虽然在大数据分析的窃电检测方法领域可以通过实时监控来判断是否窃电,但其不能精确到某一位用户,无法有效减少人工排查的工作量;基于模糊C均值聚类和时间序列相似度分析的用户窃电检测方法是一种有效的大数据窃电检测方法,可以有效找出疑为窃电用户及其窃电时间。
发明内容
一种基于聚类的大数据窃电检测方法,由模糊C均值聚类算法处理用户的日负荷特征曲线,其特征在于:对智能电表采集到的数据进行预处理,得到多个用户的日负荷曲线;利用模糊C均值聚类算法对单个用户的电力日负荷曲线进行聚类,得到该用户的日负荷曲线中心,并找出疑为窃电的用户数据;利用时间相似度技术对疑为窃电的用户数据进行时间序列相似度分析,对用户疑为窃电的数据进行再次分析,给出是否窃电的预判;循环对单个用户进行检测,完成所有用户的窃电检测,给出是否窃电的预判。基于模糊C均值聚类的大数据窃电检测方法直接利用模糊C均值聚类方法对用户的用电信息聚类,可以准确判断用户的用电信息,分离出异常的日负荷曲线,挖掘出窃电用户,并给出疑为窃电的时间和相序;基于时间序列相似度分析的大数据窃电检测方法值可以进一步缩小疑为窃电数据的范围;不需要增加额外硬件开销,大大减少人工排查的工作量。
本发明的有效效果在于:1.基于聚类的大数据窃电检测方法直接利用模糊C均值聚类方法将用户的日负荷曲线进行聚类,可以准确分离出少数的用户异常的日负荷曲线,并给出疑为窃电的时间和相序,再通过时间序列相似度分析缩小范围,对窃电排查提供支持,减少人工工作量,来维持电力系统运行的稳定;2.不需要增加额外硬件开销,通过智能电能表测量到的电力数据进行聚类分析和时间序列相似度分析,可以查找出某个疑为窃电的用户,大大提高了窃电挖掘的准确性,减少误判、漏判,弥补了目前的窃电检测技术的弊端。
附图说明
图1为本发明的窃电检测模型总流程图;
图2为本发明的模糊C均值聚类算法子程序;
图3为本发明的时间相似度算法子程序;
图4基于模糊C均值聚类和时间序相似度分析的大数据窃电检测的实测实验验证1;
图5基于模糊C均值聚类和时间相似度分析的大数据窃电检测的实测实验验证2。
具体实施方式
下面结合具体实施方式对本发明作进一步详细说明;
电力用户安装有智能电表,可以将用户历史用电数据作为正常用电负荷参考值;
通过智能电能表测量用户用电负荷信息;
对系统收集到的用户数据进行处理,缺失的数据用相邻数据补齐,并计算每位用户每相的日负荷曲线;
设置聚类类别数为2,并设置阈值为0.000001;
对单个用户的非零日负荷曲线和人为加入的7条全零日负荷曲线进行模糊C均值聚类;
返回聚类结果,得到该用户疑为窃电的数据,给出该用户正常的日负荷曲线中心;
再计算该用户疑为窃电的数据进行与正常日负荷曲线中心的欧氏距离,当该欧氏距离大于50%正常日负荷曲线中心与正常日负荷曲线中心的欧氏距离时,则该条数据为窃电数据;
将窃电检测结果保存到CSV文件;
对所有用户的用电数据进行窃电检测,并将结果保存到CSV文件;
调用模糊C均值聚类算法对用户日负荷曲线信息进行聚类分组处理,具体步骤为:
(1)输入用户的非零日负荷曲线数据,并加入一组7条全零日负荷曲线;
(2)设置模糊C均值聚类的类别数为2,设置阈值为0.000001;
(3)初始化隶属度矩阵:采用随机生成n×c个0到1之间的随机数,并使其每一行的和为1,表示每条数据对不同聚类中心的隶属度和为1;其中n表示数据的个数;c表示聚类类别数;
(4)根据当前的隶属度矩阵给出初始聚类中心,见公式(1);
公式(1)中,b=1,表示初始化隶属度矩阵,表示第j条数据对第i簇的归属度;m表示模糊权重指数,通常取m∈[1.5,2.5];xj表示第j条数据,表示初始聚类中心;
(5)根据公式(1)和当前的聚类中心更新隶属度矩阵
公式(2)中,表示第b+1次更新后的隶属度矩阵,表示第j条数据对第i簇的归属度;c表示聚类类别数;表示第b次更新后的第j条数据与第i簇的中心的欧氏距离;表示第b次更新后的第j条数据与第l簇的中心的欧氏距离;
(6)根据当前的隶属度矩阵,更新聚类中心见公式(3);
其中,表示第b+1更新后,第i簇的聚类中心;表示第b+1次更新后的隶属度矩阵,表示第j条数据对第i簇的归属度;
(7)判断是否满足阈值条件:当Vb和Vb+1的欧氏距离差不小于设定的阈值条件时,跳到步骤(5),继续循环迭代更新隶属度矩阵和聚类中心,直到满足阈值条件;
(8)标准化隶属度矩阵U,当i一定时,uij(j=1,2,…,c)中最大的值为1,其它值为0,使第i条数据完全隶属于第j类;
(9)输出标准化后的隶属度矩阵和聚类中心;
本发明的窃电检测模型总流程图如附图1所示;
模糊C均值聚类算法程序编程框图如附图2所示;
时间相似度分析算法程序编程框图如附图3所示;
本发明提出的方案通过如下实测数据加以验证:
实测数据包含了10位用户(每位用户采集的数据包含A、B、C三相),每个用户采集7天的数据,将数据带入程序,窃电检测结果为10位用户中有7位窃电,与实际情况6位窃电用户略有出入,但当结合具体数据对疑为窃电用户进行排查时,可以找出误判用户,该次实测数据验证中,某窃电行为的用户的分析结果如附图4所示,某正常用户分析结果如附图5所示;图4和图5中,编号为120000的用户为每次对单个用户数据进行聚类时,人为加入7条全零日负荷曲线的表号;图4中可以清楚的观察到该用户的该时间段的用电情况除了全0数据外,分为2类,该用户的A相基本保持在0.37左右,C相保持在0.65左右,经窃电检测模型找出的数据为A相,据此A相疑为窃电相,但是也不排除该相所带的功率一直偏小,需要派人到现场进行勘察,再做出判断;图5中该用户的日负荷曲线均位于50%日负荷曲线中心之上,认为该用户没有窃电;用户实际窃电情况与实测实验结论较为一致。
本发明说明书中未作详细描述的内容属于本专业领域技术人员公知的现有技术。

Claims (6)

1.一种基于用户用电负荷特征窃电检测方法,由模糊C均值聚类算法和时间序列相似度技术处理电力用户的日负荷曲线,其特征在于,该窃电检测方法的步骤如下:
步骤1)对智能电表采集到的数据进行预处理,得到多个用户的日负荷曲线;
步骤2)利用模糊C均值聚类算法对单个用户的电力日负荷曲线进行聚类,得到该用户的日负荷曲线中心,并找出疑为窃电的用户数据;
步骤3)利用时间相似度技术对疑为窃电的用户数据进行时间序列相似度分析,对用户疑为窃电的数据进行再次分析,给出是否窃电的预判;
步骤4)循环步骤2)和步骤3),完成所有用户窃电检测,给出是否窃电的预判。
2.根据权利1所述基于用户用电负荷特征窃电检测方法,其技术特征在于,所述步骤1)对智能电表采集到的数据进行预处理,得到多个用户的日负荷曲线,具体为:
(1)将智能电表采集到的电压、电流、功率因数的空缺数据用相邻数据替代;
(2)将对应用户、日期、相序的电压、电流、功率因数相乘,得到该用户的每相日负荷特征曲线。
3.根据权利1所述基于用户用电负荷特征窃电检测方法,其技术特征在于,所述步骤2)利用模糊C均值聚类算法对单个用户的电力日负荷曲线进行聚类,得到该用户的日负荷曲线中心,并找出疑为窃电的用户数据,具体为:
(1)取出单个用户的非零日负荷曲线,并加入7条全零日负荷曲线,使之作为单个用户模糊C均值聚类的输入数据;
(2)输入选定的聚类类别数为2,并设置误差阈值;
(3)对单个用户的输入数据进行模糊C均值聚类,将用户的日负荷曲线分为2类,其中一类为该用户正常的用电数据,另一类为该用户疑为窃电的数据并得到该用户正常的日负荷曲线中心;
(4)聚类结果中,聚类中心较低的那一类的个数如果大于7,则认为该用户疑为窃电用户,聚类中心较低的那一类中,非零的日负荷曲线即为该用户疑为窃电的数据;
(5)输出疑为窃电的用户数据和该用户正常的日负荷曲线中心。
4.根据权利1所述基于用户用电负荷特征窃电检测方法,其技术特征在于,所述步骤3)利用时间相似度技术对疑为窃电的用户数据进行时间序列相似度分析,对用户疑为窃电的数据进行再次分析,给出是否窃电的预判,具体为:
(1)计算单个用户用电数据聚类得到的疑为窃电的数据与该用户正常的日负荷曲线中心的欧氏距离;
(2)当两条曲线的欧氏距离大于正常的日负荷曲线中心与50%日负荷曲线中心的欧氏距离时,认为该条日负荷曲线为窃电数据。
5.根据权利3或权利4所述基于用户用电负荷特征窃电检测方法,其技术特征在于,首先通过模糊C均值聚类,可以将疑为窃电的数据分离出来,并得到正常的日负荷曲线中心,然后通过时间相似度技术,对疑为窃电的数据进行二次排查,可进一步缩小疑为窃电用户的范围,大大减小人工排查量。
6.根据权利1所述基于用户用电负荷特征窃电检测方法,其技术特征在于,所述步骤4)需要循环步骤2)和步骤3),完成所有用户窃电检测,给出是否窃电的预判;具体为:一次窃电检测处理一个用户的数据,多次循环可处理多个用户的用电数据,并保存检测结果。
CN201910580908.7A 2019-06-29 2019-06-29 基于用户用电负荷特征窃电检测方法 Active CN110288039B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910580908.7A CN110288039B (zh) 2019-06-29 2019-06-29 基于用户用电负荷特征窃电检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910580908.7A CN110288039B (zh) 2019-06-29 2019-06-29 基于用户用电负荷特征窃电检测方法

Publications (2)

Publication Number Publication Date
CN110288039A true CN110288039A (zh) 2019-09-27
CN110288039B CN110288039B (zh) 2022-09-30

Family

ID=68020098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910580908.7A Active CN110288039B (zh) 2019-06-29 2019-06-29 基于用户用电负荷特征窃电检测方法

Country Status (1)

Country Link
CN (1) CN110288039B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110910028A (zh) * 2019-11-28 2020-03-24 温岭市非普电气有限公司 基于时间特征分析的光伏窃电发现方法和系统
CN110969539A (zh) * 2019-11-28 2020-04-07 温岭市非普电气有限公司 基于曲线形态分析的光伏窃电发现方法和系统
CN111340065A (zh) * 2020-02-08 2020-06-26 南京邮电大学 一种基于复杂用户行为分析的用户负荷窃电模型挖掘系统及方法
CN112991093A (zh) * 2021-02-22 2021-06-18 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法及系统
CN113933585A (zh) * 2021-11-26 2022-01-14 长沙理工大学 一种基于欧氏距离的漏电台区断零窃电用户检测方法
CN113933556A (zh) * 2021-12-17 2022-01-14 广东电网有限责任公司东莞供电局 一种窃电行为的检测方法、装置、计算机设备和存储介质
CN113985098A (zh) * 2021-10-29 2022-01-28 国网江苏省电力有限公司镇江供电分公司 一种基于实时计量的提高防窃电分析准确度的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145966A (zh) * 2017-04-12 2017-09-08 山大地纬软件股份有限公司 基于逻辑回归概率分析优化模型的反窃电分析预警方法
CN109190916A (zh) * 2018-08-09 2019-01-11 国网浙江桐庐县供电有限公司 基于大数据分析的反窃电方法
JP2019054715A (ja) * 2017-09-15 2019-04-04 東京電力ホールディングス株式会社 盗電監視システム、盗電監視装置、盗電監視方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107145966A (zh) * 2017-04-12 2017-09-08 山大地纬软件股份有限公司 基于逻辑回归概率分析优化模型的反窃电分析预警方法
JP2019054715A (ja) * 2017-09-15 2019-04-04 東京電力ホールディングス株式会社 盗電監視システム、盗電監視装置、盗電監視方法及びプログラム
CN109190916A (zh) * 2018-08-09 2019-01-11 国网浙江桐庐县供电有限公司 基于大数据分析的反窃电方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴迪: "基于曲线相似性分析的窃电用户判断", 《中国电力》 *
康宁宁等: "采用FCM聚类与改进SVR模型的窃电行为检测", 《电子测量与仪器学报》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110910028A (zh) * 2019-11-28 2020-03-24 温岭市非普电气有限公司 基于时间特征分析的光伏窃电发现方法和系统
CN110969539A (zh) * 2019-11-28 2020-04-07 温岭市非普电气有限公司 基于曲线形态分析的光伏窃电发现方法和系统
CN110969539B (zh) * 2019-11-28 2024-02-09 温岭市非普电气有限公司 基于曲线形态分析的光伏窃电发现方法和系统
CN111340065A (zh) * 2020-02-08 2020-06-26 南京邮电大学 一种基于复杂用户行为分析的用户负荷窃电模型挖掘系统及方法
CN111340065B (zh) * 2020-02-08 2022-08-09 南京邮电大学 一种基于复杂用户行为分析的用户负荷窃电模型挖掘系统及方法
CN112991093A (zh) * 2021-02-22 2021-06-18 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法及系统
CN112991093B (zh) * 2021-02-22 2024-02-02 国网四川省电力公司营销服务中心 一种基于边缘计算的窃电检测方法及系统
CN113985098A (zh) * 2021-10-29 2022-01-28 国网江苏省电力有限公司镇江供电分公司 一种基于实时计量的提高防窃电分析准确度的方法
CN113933585A (zh) * 2021-11-26 2022-01-14 长沙理工大学 一种基于欧氏距离的漏电台区断零窃电用户检测方法
CN113933556A (zh) * 2021-12-17 2022-01-14 广东电网有限责任公司东莞供电局 一种窃电行为的检测方法、装置、计算机设备和存储介质
CN113933556B (zh) * 2021-12-17 2022-04-08 广东电网有限责任公司东莞供电局 一种窃电行为的检测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110288039B (zh) 2022-09-30

Similar Documents

Publication Publication Date Title
CN110288039A (zh) 基于用户用电负荷特征窃电检测方法
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
CN107742127B (zh) 一种改进的防窃电智能预警系统及方法
CN109490679B (zh) 基于非侵入式负荷监测的智能窃电稽查系统及方法
CN106093707B (zh) 智能防窃电分析系统的数据处理方法
CN109636124A (zh) 基于大数据的电力行业低压台区线损分析方法及处理系统
CN109583680B (zh) 一种基于支持向量机的窃电辨识方法
Biswas et al. Electricity theft pinpointing through correlation analysis of master and individual meter readings
CN110223196A (zh) 基于典型行业特征库和反窃电样本库的反窃电分析方法
CN109977535B (zh) 一种线损异常诊断方法、装置、设备及可读存储介质
TWI440862B (zh) Electrical detection method and system based on user feedback information
CN105303469B (zh) 线损异常原因数据挖掘分析的方法与系统
CN110222991B (zh) 基于rf-gbdt的计量装置故障诊断方法
CN109543943A (zh) 一种基于大数据深度学习的电价稽查执行方法
CN110609200B (zh) 一种基于模糊度量融合判据的配电网接地故障保护方法
CN109615004A (zh) 一种多源数据融合的防窃电预警方法
CN109583679A (zh) 一种多算法融合的窃电疑似度分析方法
CN110322371A (zh) 基于多元线性回归分析的高损台区用电异常用户检测定位方法
CN106203832A (zh) 智能防窃电分析系统及分析方法
CN110276511A (zh) 一种基于电量与线损关联性的线变关系异常判别方法
CN109947815B (zh) 一种基于离群点算法的窃电辨识方法
CN110311709A (zh) 用电信息采集系统故障判别方法
CN109948877A (zh) 一种基于异常事件组合的用电行为精准分析方法
CN110210723A (zh) 一种基于层次分析法和孤立森林的窃电辨识方法
Wu et al. Analysis of electricity stealing based on user electricity characteristics of electricity information collection system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant