CN107169145B - 一种基于聚类算法的用户窃电严重等级检测的方法 - Google Patents

一种基于聚类算法的用户窃电严重等级检测的方法 Download PDF

Info

Publication number
CN107169145B
CN107169145B CN201710465289.8A CN201710465289A CN107169145B CN 107169145 B CN107169145 B CN 107169145B CN 201710465289 A CN201710465289 A CN 201710465289A CN 107169145 B CN107169145 B CN 107169145B
Authority
CN
China
Prior art keywords
user
stealing
line loss
rate
menace level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710465289.8A
Other languages
English (en)
Other versions
CN107169145A (zh
Inventor
刘金硕
刘必为
李瞧
房金城
陈凯
邓娟
章岚昕
杨广益
李晨曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201710465289.8A priority Critical patent/CN107169145B/zh
Publication of CN107169145A publication Critical patent/CN107169145A/zh
Application granted granted Critical
Publication of CN107169145B publication Critical patent/CN107169145B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明涉及计算机科学数据挖掘中的聚类和电气工程中的线损标杆值计算等技术领域,具体涉及一种基于聚类算法的用户窃电严重等级检测的方法,1.在电网平台内采集用户用电量异常率、线损率、三相电压/电流、功率因数。2.针对用户计算线损标杆值,比较实际线损率与线损标杆值,对超出值划分区间,得到线损异常等级0~5。3.利用三相电压/电流计算三相电压/电流不平衡率。4.以上述数据为输入样本,采用k‑means聚类算法对其聚类得到6种类别,即窃电严重等级。5.分别计算待检用户数据与6种类别的欧氏距离,距离最近者即为待检用户窃电严重等级。该检测方法利用聚类算法对大量样本进行聚类,可以有效划分出用户窃电严重等级。

Description

一种基于聚类算法的用户窃电严重等级检测的方法
技术领域
本发明属于计算机科学数据挖掘中的聚类和电气工程中的线损标杆值计算等技术领域,尤其涉及一种基于聚类算法的用户窃电严重等级检测的方法。
背景技术
我国电业每年都投入大量人力实施用电稽查。然而,窃电多发生在低压用户(尤其居民用户)中,具有分散隐蔽的特点。由于用户量巨大,不可能采取周期性巡查的方法,目前主要靠抄表员或用户举报,然后有针对性地实施现场检查。该方法渗透率低,对窃电高发区明显缺乏威慑力和打击力度。
数据挖掘又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。利用数据挖掘的知识解决用户窃电监测问题是一个新的解决思路。
发明内容
本发明的目的是提供一种利用聚类算法对大量样本进行聚类,有效划分出用户窃电严重等级的检测方法。
为实现上述目的,本发明采用的技术方案是:一种基于聚类算法的用户窃电严重等级检测的方法,包括以下步骤:
步骤1、划分用户窃电严重等级;具体步骤如下:
步骤1.1获取用户用电数据;包括采集电网平台内用户用电量异常率、线损率、三相电压/电流、功率因数的数据样本;
步骤1.2计算用户线损标杆值,确定用户线损异常等级;
步骤1.3、利用步骤1.1所采集三相电压/电流数据计算三相电压/电流不平衡率;
步骤1.4、将步骤1.1-1.3获取的用户用电量异常率、线损异常等级、三相电压/电流不平衡率、功率因数作为数据样本,采用k-means聚类算法进行聚类;设定k值为6,使聚类类别为6种类别,则用户窃电严重等级为0~5;其中,严重等级0代表该用户无窃电风险;观察聚类后6个类别中心点特征,若不具有明显差异或无法很好代表窃电严重等级,则重复聚类步骤直至中心点特征合适,实现划分6种用户窃电严重等级;
步骤:2、确定待检测用户窃电严重等级;具体步骤如下:
步骤2.1首先计算待检测用户的线损标杆值以及三相电压/电流不平衡率,确定用户线损异常率;
步骤2.2计算待检测用户与6个类别严重等级中心点的欧氏距离,取其中距离最近的一个严重等级作为待检测用户的窃电严重等级。
在上述的基于聚类算法的用户窃电严重等级检测的方法中,步骤1.2的实现包括以下步骤:
步骤1.2.1针对不同类型用户计算线损标杆值
其中A为台区供电量,为低压配电主干线损耗,为接户线损耗,为用户电表损耗;
步骤1.2.2比较实际线损率与线损标杆值,若实际线损率未超过理论线损标杆值,则线损异常等级为0;若实际线损率超过理论线损标杆值,则对超出值划分区间,得到线损异常等级1~5。
在上述的基于聚类算法的用户窃电严重等级检测的方法中,步骤1.3所述的三相电压/电流不平衡率计算公式具体为;
三相电压不平衡率:其中max{ua,ub,uc}和min{ua,ub,uc}分别为三相电压最大值和最小值;
三相电流不平衡率:其中max{ia,ib,ic}和min{ia,ib,ic}分别为三相电流最大值和最小值。
本发明的有益效果是:通过计算出特定用户的线损标杆值,可以量化得出用户线损异常等级;通过计算三相电压/电流不平衡率,可以更好的表达用户窃电的特点。自动划分窃电严重等级后,通过计算待检用户与类别中心点的距离确定该用户窃电严重等级。从而能够对数量庞大的低压用户窃电问题进行排查。
附图说明
图1为本发明一个实施例窃电严重等级划分流程图;
图2为本发明一个实施例判定用户窃电等级流程图;
图3为本发明一个实施例用户检测示例图。
具体实施方式
通过以下详细说明结合附图可以进一步理解本发明的特点和优点。所提供的实施例仅是对本发明方法的说明,而不以任何方式限制本发明揭示的其余内容。
本实施例的实现采用以下的技术方案,一种基于聚类算法的用户窃电严重等级检测的方法,包括以下步骤:
步骤1、划分用户窃电严重等级;具体步骤如下:
步骤1.1获取用户用电数据;包括采集电网平台内用户用电量异常率、线损率、三相电压/电流、功率因数的数据样本;
步骤1.2计算用户线损标杆值,确定用户线损异常等级;
步骤1.3、利用步骤1.1所采集三相电压/电流数据计算三相电压/电流不平衡率;
步骤1.4、将步骤1.1-1.3获取的用户用电量异常率、线损异常等级、三相电压/电流不平衡率、功率因数作为数据样本,采用k-means聚类算法进行聚类;设定k值为6,使聚类类别为6种类别,则用户窃电严重等级为0~5;其中,严重等级0代表该用户无窃电风险;观察聚类后6个类别中心点特征,若不具有明显差异或无法很好代表窃电严重等级,则重复聚类步骤直至中心点特征合适,实现划分6种用户窃电严重等级;
步骤:2、确定待检测用户窃电严重等级;具体步骤如下:
步骤2.1首先计算待检测用户的线损标杆值以及三相电压/电流不平衡率,确定用户线损异常率;
步骤2.2计算待检测用户与6个类别严重等级中心点的欧氏距离,取其中距离最近的一个严重等级作为待检测用户的窃电严重等级。
进一步,步骤1.2的实现包括以下具体步骤:
步骤1.2.1针对不同类型用户计算线损标杆值其中A为台区供电量,为低压配电主干线损耗,为接户线损耗,为用户电表损耗;
步骤1.2.2比较实际线损率与线损标杆值,若实际线损率未超过理论线损标杆值,则线损异常等级为0;若实际线损率超过理论线损标杆值,则对超出值划分区间,得到线损异常等级1~5。
更进一步,步骤1.3所述的三相电压/电流不平衡率计算公式具体为;
三相电压不平衡率:其中max{ua,ub,uc}和min{ua,ub,uc}分别为三相电压最大值和最小值;
三相电流不平衡率:其中max{ia,ib,ic}和min{ia,ib,ic}分别为三相电流最大值和最小值。
具体实施时,本实施例解决的问题是用户窃电严重等级难以划分与检测的问题。在实际工作中,电网用户尤其是低压用户中窃电问题屡见不鲜,但是由于低压用户数量庞大,难以排查,电网内部对于窃电问题也没有具体的技术指标,全靠工作人员凭经验判断处理。本实施例利用对与窃电有关的几种数据类型:用电量异常率、线损率、三相电压/电流、功率因数进行聚类分析,由于不同用户之间的线损率与三相电压/电流特点各不相同,因此,对于线损率,通过计算出特定用户的线损标杆值,可以量化得出用户线损异常等级;其次,对于三相电压/电流,通过计算三相电压/电流不平衡率,可以更好的表达用户窃电的特点。最后,通过无监督的聚类方法对上述样本进行处理,最终形成6类数据,即窃电严重等级0-5,其中严重等级0代表该用户无窃电风险。在自动划分窃电严重等级后,通过计算待检用户与类别中心点的距离即可确定该用户窃电严重等级。
本实施例的步骤如下:
1、在电网平台内采集大量用户数据样本:用电量异常率、线损率、三相电压/电流、功率因数。
2、对采集到的数据样本进行处理:针对不同类型,用户计算线损标杆值其中A为台区供电量,为低压配电主干线损耗,为接户线损耗,为用户电表损耗。比较实际线损率与线损标杆值,若实际线损率未超过理论线损标杆值,则线损异常等级为0;若实际线损率超过理论线损标杆值,则对超出值划分区间,得到线损异常等级1~5。
3、利用三相电压/电流计算三相电压/电流不平衡率,计算公式为三相电压不平衡率其中max{ua,ub,uc}和min{ua,ub,uc}分别为三相电压最大值和最小值;三相电流不平衡率其中max{ia,ib,ic}和min{ia,ib,ic}分别为三相电流最大值和最小值。
4、将用户用电量异常率、线损异常等级、三相电压/电流不平衡率、功率因数作为数据样本,采用k-means聚类算法对其聚类,其中,设定k值为6,使聚类类别为6,即用户窃电严重等级为0~5。观察聚类后的6个类别中心点,若其不具有明显差异或无法很好代表窃电严重等级,则重复4。
5、分别计算待检测用户数据与6种类别中心点的欧氏距离,比较后取距离最近的类别为待检用户窃电严重等级。
如图1所示,首先划分用户窃电严重等级,在获得大量电网用户在用电量异常率、线损率、三相电压/电流、功率因数方面的数据后,分别计算用户线损标杆值以及三相电压/电流不平衡率,确定用户线损异常率。然后把数据样本通过k-means聚类算法(其中k=6)进行聚类,使训练样本共聚为6类。最后对6类中心点进行检查,若不能很好代表窃电严重等级,则再重复聚类步骤直至满意。最终得出的6个类别即为6种窃电严重等级。
如图2所示,检测用户窃电严重等级的具体步骤,首先也需要计算出待检测用户的线损标杆值以及三相电压/电流不平衡率,确定用户线损异常率。然后计算该用户与6个严重等级中心点的欧氏距离,取其中距离最近的一个严重等级作为该用户的窃电严重等级。
如图3所示,检测用户窃电严重等级的示例图,可以看出图中已经划分了6种窃电严重等级,黑点代表待检测用户,点与等级中心点之间的线段代表了两者之间的欧氏距离。从图中可以看出距离当前用户最近的是等级2,由此可判定该用户具有窃电风险且严重等级为2。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
虽然以上结合附图描述了本发明的具体实施方式,但是本领域普通技术人员应当理解,这些仅是举例说明,可以对这些实施方式做出多种变形或修改,而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。

Claims (3)

1.一种基于聚类算法的用户窃电严重等级检测的方法,其特征是,包括以下步骤:
步骤1、划分用户窃电严重等级;具体步骤如下:
步骤1.1获取用户用电数据;包括采集电网平台内用户用电量异常率、线损率、三相电压和三相电流、功率因数的数据样本;
步骤1.2计算用户线损标杆值,确定用户线损异常等级;
步骤1.3利用步骤1.1所采集三相电压和三相电流数据计算三相电压不平衡率和三相电流不平衡率;
步骤1.4将步骤1.1~1.3获取的用户用电量异常率、线损异常等级、三相电压不平衡率和三相电流不平衡率、功率因数作为数据样本,采用k-means聚类算法进行聚类;设定k值为6,使聚类类别为6种类别,则用户窃电严重等级为0~5;其中,严重等级0代表该用户无窃电风险;观察聚类后6个类别中心点特征,若不具有明显差异或无法很好代表窃电严重等级,则重复聚类步骤直至中心点特征合适,实现划分6种用户窃电严重等级;
步骤:2、确定待检测用户窃电严重等级;具体步骤如下:
步骤2.1首先计算待检测用户的线损标杆值以及三相电压不平衡率和三相电流不平衡率,确定用户线损异常率;
步骤2.2计算待检测用户与6个类别严重等级中心点的欧氏距离,取其中距离最近的一个严重等级作为待检测用户的窃电严重等级。
2.如权利要求1所述的基于聚类算法的用户窃电严重等级检测的方法,其特征是,步骤1.2的实现包括以下具体步骤:
步骤1.2.1针对不同类型用户计算线损标杆值其中A为台区供电量,为低压配电主干线损耗,为接户线损耗,为用户电表损耗;
步骤1.2.2比较实际线损率与线损标杆值,若实际线损率未超过理论线损标杆值,则线损异常等级为0;若实际线损率超过理论线损标杆值,则对超出值划分区间,得到线损异常等级1~5。
3.如权利要求1所述的基于聚类算法的用户窃电严重等级检测的方法,其特征是,步骤1.3所述的三相电压不平衡率和三相电流不平衡率计算公式具体为;
三相电压不平衡率:其中max{ua,ub,uc}和min{ua,ub,uc}分别为三相电压最大值和最小值;
三相电流不平衡率:其中max{ia,ib,ic}和min{ia,ib,ic}分别为三相电流最大值和最小值。
CN201710465289.8A 2017-06-19 2017-06-19 一种基于聚类算法的用户窃电严重等级检测的方法 Expired - Fee Related CN107169145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710465289.8A CN107169145B (zh) 2017-06-19 2017-06-19 一种基于聚类算法的用户窃电严重等级检测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710465289.8A CN107169145B (zh) 2017-06-19 2017-06-19 一种基于聚类算法的用户窃电严重等级检测的方法

Publications (2)

Publication Number Publication Date
CN107169145A CN107169145A (zh) 2017-09-15
CN107169145B true CN107169145B (zh) 2019-11-26

Family

ID=59818834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710465289.8A Expired - Fee Related CN107169145B (zh) 2017-06-19 2017-06-19 一种基于聚类算法的用户窃电严重等级检测的方法

Country Status (1)

Country Link
CN (1) CN107169145B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108229087A (zh) * 2017-09-30 2018-06-29 国网上海市电力公司 一种低压台区典型场景的析构方法
CN108198408B (zh) * 2017-12-08 2020-06-26 囯网河北省电力有限公司电力科学研究院 一种基于用电信息采集系统的自适应反窃电监控方法及系统
CN108664990B (zh) * 2018-03-29 2020-09-18 清华大学 综合熵方法和密度聚类方法的窃电检测方法及装置
CN109190950B (zh) * 2018-08-21 2021-05-04 国网湖北省电力有限公司鄂州供电公司 一种电表和水表档案贯通的用能异常识别方法
CN109614997A (zh) * 2018-11-29 2019-04-12 武汉大学 一种基于深度学习的窃电风险预测方法及装置
CN110231528B (zh) * 2019-06-17 2021-05-28 国网重庆市电力公司电力科学研究院 基于负荷特征模型库的变压器户变异常识别方法及装置
CN110824270B (zh) * 2019-10-09 2022-04-26 中国电力科学研究院有限公司 结合台区线损和异常事件的窃电用户辨识方法及装置
CN113111893B (zh) * 2020-01-09 2022-12-16 中国移动通信集团四川有限公司 一种数据的处理方法、系统以及电子设备
CN111652761B (zh) * 2020-07-28 2020-12-01 国网江西省电力有限公司供电服务管理中心 一种基于证据理论的多源特征融合窃电行为检测方法
CN113343056A (zh) * 2021-05-21 2021-09-03 北京市燃气集团有限责任公司 一种用户用气量异常检测方法及装置
CN113283779A (zh) * 2021-06-08 2021-08-20 内蒙古电力(集团)有限责任公司内蒙古电力科学研究院分公司 一种窃电损耗定位的精准分析算法
CN113933556B (zh) * 2021-12-17 2022-04-08 广东电网有限责任公司东莞供电局 一种窃电行为的检测方法、装置、计算机设备和存储介质
CN116027254B (zh) * 2023-03-22 2023-06-13 国网江苏省电力有限公司常州供电分公司 三相电能表电流不平衡窃电分析方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016063639A (ja) * 2014-09-18 2016-04-25 株式会社Nttファシリティーズ 電源システム、給電管理装置、給電管理方法、及びプログラム
KR102367087B1 (ko) * 2015-04-22 2022-02-24 삼성전자 주식회사 콘텐츠를 추적하는 방법 및 이를 사용하는 전자 장치
CN106780140B (zh) * 2016-12-15 2021-07-09 国网浙江省电力公司 基于大数据的电力信用评价方法

Also Published As

Publication number Publication date
CN107169145A (zh) 2017-09-15

Similar Documents

Publication Publication Date Title
CN107169145B (zh) 一种基于聚类算法的用户窃电严重等级检测的方法
CN107423769B (zh) 基于形态特征的电力负荷曲线自适应聚类方法
CN107656154B (zh) 基于改进模糊c均值聚类算法的变压器故障诊断方法
CN103323749B (zh) 多分类器信息融合的局部放电诊断方法
CN106334679B (zh) 磷酸铁锂单体电池的筛选方法
CN112149873B (zh) 一种基于深度学习的低压台区线损合理区间预测方法
CN102903007B (zh) 一种采用遗传算法优化二分类模型参数的方法
CN103998942A (zh) 用于非侵入式负载监测的方法和系统
CN107909208A (zh) 一种台区配网降损方法
CN110210723B (zh) 一种基于层次分析法和孤立森林的窃电辨识方法
CN108256559A (zh) 一种基于局部离群点因子的低压窃电用户定位方法
CN108011367A (zh) 一种基于深度决策树算法的电力负荷特性挖掘方法
CN109507535A (zh) 变电站接地网运行阶段及运行寿命预测方法及装置
CN109165604A (zh) 基于协同训练的非侵入式负荷识别方法及其测试系统
CN110288039A (zh) 基于用户用电负荷特征窃电检测方法
CN108875783A (zh) 一种面向不平衡数据集的极限学习机变压器故障诊断方法
CN108053095A (zh) 一种电能质量扰动事件特征提取方法及系统
CN106484838A (zh) 基于数据挖掘的安全检查标准库动态更新方法
CN109376944A (zh) 智能电表预测模型的构建方法及装置
CN110378286A (zh) 一种基于dbn-elm的电能质量扰动信号分类方法
CN110766313A (zh) 一种基于运维检修制度的电缆隧道综合状态评价方法
CN109558467A (zh) 用电用户类别识别方法及系统
CN109921426A (zh) 基于cv-kde的风电并网系统概率潮流计算方法
CN110244099A (zh) 基于用户电压的窃电检测方法
CN109000733A (zh) 基于模拟退火优化神经网络的能见度传感器及其检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20191126

Termination date: 20200619

CF01 Termination of patent right due to non-payment of annual fee