CN107657542A - 公变台区用户防窃电的检测跟踪方法 - Google Patents
公变台区用户防窃电的检测跟踪方法 Download PDFInfo
- Publication number
- CN107657542A CN107657542A CN201610585785.2A CN201610585785A CN107657542A CN 107657542 A CN107657542 A CN 107657542A CN 201610585785 A CN201610585785 A CN 201610585785A CN 107657542 A CN107657542 A CN 107657542A
- Authority
- CN
- China
- Prior art keywords
- power consumption
- user
- data
- cluster
- accumulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 14
- 238000009825 accumulation Methods 0.000 claims abstract description 33
- 230000005611 electricity Effects 0.000 claims abstract description 14
- 238000001514 detection method Methods 0.000 claims abstract description 9
- 238000007621 cluster analysis Methods 0.000 claims abstract description 8
- 238000007418 data mining Methods 0.000 claims abstract description 6
- 238000007619 statistical method Methods 0.000 claims abstract description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- SBNFWQZLDJGRLK-UHFFFAOYSA-N phenothrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 SBNFWQZLDJGRLK-UHFFFAOYSA-N 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Alarm Systems (AREA)
- Burglar Alarm Systems (AREA)
Abstract
一种公变台区用户防窃电检测跟踪方法,通过获得目标用户用电量基础数据后,将符合上述要求的基础用电数据进行DBSCAN数据挖掘算法,形成类簇并发现噪点;再采用统计学方法,筛选出奇异聚点,并计算奇异聚点的防窃电检测嫌疑度;本发明在防窃电分析内加入了大数据处理相关思路,应用聚类嫌疑分析算法,并结合用户当日的用电量、用户当日标准化后的用电量、用户前n天用电量均值水平、用户前n天用电量标准方差等因素进行聚类分析,形成目标用户的嫌疑度排序清单,为后期人工排查重点、顺序提供依据。
Description
技术领域
本发明涉及的是一种电力检测领域的技术,具体是一种公变台区用户防窃电嫌疑度的聚类分析方法。
背景技术
为实现“一强三优”现代化公司的发展目标,国家电网公司在系统内广泛深入地开展同业对标工作,用指标评价企业,用业绩考核企业,增强公司可持续发展能力和综合竞争能力,实现一流的管理、技术、效益和服务。SG186营销业务系统应用实施以来,系统也已经积累了丰富的,完整的用户数据,包括业务办理,客户服务以及用电量电费等相关数据,为电力公司开展防窃电监控与分析提供了坚实的数据基础。
现在较为常见的窃电方式主要分以下三个大类:改变计量回路窃电、无表/越表窃电和攻击电能表窃电。
针对以上窃电手法,主要措施有:使用专用的计量装置和设备、使用封印线、采用双向计量或逆止式的电能计量装置以及对连接到计量装置的相关导线进行全面封闭等。
目前主要采用线损分析的方法对变压器进行损耗分析,然后定位高损耗台区公变,定期对其进行大面积的人工排查。采用这种监测方式进行排查,主要可以解决专变这一侧用户的窃电行为,但对于公变下多个用户的窃电只能花大量的时间及人力去解决。所以本发明加入了大数据处理相关思路,通过建立防窃电聚类分析模型进行防窃电检测,及时监控窃电行为发生,为现场用电检查、营销稽查排查重点、顺序等提供依据,为实现防违约用电、反窃电工作的全过程管理提供支撑,提高防违约用电、窃电防范的管理水平,避免给电网企业、国家造成重大经济损失。
发明内容
本发明针对现有技术存在的上述不足,提出一种公变台区用户防窃电检测跟踪方法。
本发明是通过以下技术方案实现的:
本发明包括以下步骤:
步骤1、获得目标用户用电量基础数据;
所述的基础数据是指:用户当日用电量、用户当日标准化用电量、用户近期平均用电量、用户近期用电量标准方差等;
所述的基础数据需经过过滤筛选,具体为:除了需要保证用电量信息来源可靠外,还要选择包含3个月及以上日用电量数据的客户,并且该客户用电量同比连续缺失不超过2周。
步骤2、将符合上述要求的基础用电数据进行DBSCAN数据挖掘算法,形成类簇并发现噪点,具体步骤包括:
2.1)获得目标用户用电量基础数据,基础数据特点应满足有关要求,对于不满足数据要求的用户进行过滤筛选,不参与聚类分析;
2.2)形成类簇并发现噪点。选择合适的聚点属性,采用DBSCAN数据挖掘算法,对聚点分类,找出噪点数据。
2.3)奇异聚点。采用统计学方法,筛选出奇异聚点,并计算奇异聚点的防窃电检测嫌疑度。
步骤3、采用统计学方法,筛选出奇异聚点,并计算奇异聚点的防窃电检测嫌疑度。
①同一个类簇下的聚点用户,各自的日用电量曲线虽然不相同,但其日用电量组成的样本基本满足正态分布规则,即满足x~N(μ,σ2),其中,x为用户日用电量,μ为簇内用户日用电量的均值,σ2为簇的日用电量标准方差。
②在样本估计中,样本点落在x≤μ-3σ的概率为小概率事件,即:认为窃电用户所占的比例是极小的。
技术效果
与现有技术相比,本发明在防窃电分析内加入了大数据处理相关思路,应用聚类嫌疑分析算法,并结合用户当日的用电量、用户当日标准化后的用电量、用户前n天用电量均值水平、用户前n天用电量标准方差等因素进行聚类分析,形成目标用户的嫌疑度排序清单,为后期人工排查重点、顺序提供依据。
附图说明
图1为本发明流程示意图;
图2为实施例中DBSCAN聚类分析图。
具体实施方式
如图1所示,本实施例的DBSCAN(基于密度连通)聚类分析方法,该算法利用聚点间的密度联通性可以快速发现任意形状的类簇,并且能够发现噪点数据。其基本思想是:对于某个聚类中的每个对象,在给定半径(ε)的领域内数据对象个数必须不小于一个给定值(MinPts)。
本实施例具体包括以下步骤:
步骤1)数据预处理阶段,主要针对目标台区下的用户基础用电量数据进行取样、筛选,形成原始数据分析库;
步骤2)数据挖掘阶段,利用DBSCAN数据聚类分析方法,找出数据噪点,具体步骤包括:
输入:数据集D,参数MinPts、ε,输出:簇集合
1)首先将数据集D中的所有对象标记unvisited;
2)do
3)从D中随机选取一个unvisited对象p,并将p标记为visited;
4)if p的ε邻域包含的对象数至少为MinPts个
5)创建新簇C,并把p添加到C中;
6)令N为p的ε邻域中的对象的集合;
7)for N中每个点pi
8)if pi是unvisited;
9)标记pi为visited;
10)if pi的ε邻域至少有MinPts个对象,则把这些对象添加到N;
11)if pi还不是任何簇的对象,将pi添加到簇C中;
12)endfor
13)输出C
14)Else标记为p为噪点
15)Untill没有标记为unvisited的对象
DBSAN算法通过检查数据集中每个对象的ε‐邻域来寻求聚类,如果一个点p的ε‐邻域包含多于MinPts个对象,则创建一个p作为作为核心对象的新簇C。然后,DBSCAN从C中寻找未被处理q的ε‐邻域,如果q的ε‐邻域包含多MinPts个对象,则还未包含在C中的q的邻点被加入到簇中,并且这些点的ε‐邻域将在下一步中进行检测。这个过程反复执行,直到没有新的点可以被添加到任何簇时,该过程结束。
聚类开始时,需要供电企业预置聚类密度参数(MinPts),可以得到由相似据点构成的多个类簇。每个类簇,由相似用电水平的用户聚点构成。在每个类簇中,总有一个处于核心位置的聚点,这个聚点称作核心聚点,它代表了该类簇一般的用电特征。另外还有一种聚点,它们在聚类分析的过程中由于太“稀疏”,无法聚集成簇,像这类聚点,称之为噪点。
除了噪点数据可以确定嫌疑与否之外,就剩下个类簇内的聚点了,但类簇内的聚点并不都是紧密聚集的,有些与核心聚点距离的相对较远,这类聚点称之为奇异聚点,它是由于聚类密度参数的设定所造成的。
步骤3)采用正态分布原理对奇异点进行评价,在概率统计学理论中,多个不同分布但相互独立的事物间是满足正态分布的,应用到该环境中,可以得出:
①同一个类簇下的聚点用户,各自的日用电量曲线虽然不相同,但其日用电量组成的样本基本满足正态分布规则,即满足x~N(μ,σ2),其中,x为用户日用电量,μ为簇内用户日用电量的均值,σ2为簇的日用电量标准方差。
②在样本估计中,样本点落在x≤μ-3σ的概率为小概率事件,即:认为窃电用户所占的比例是极小的。
综上所述,以满分100分计算,用户用电嫌疑度计分公式为线性公式,当用户当日的用电量x<μ-3σ时,嫌疑度为100,当用户当日的用电量x≥μ时,嫌疑度为0。
若按月计算低压台区用户防窃电检测嫌疑度,以“用户连续6个月平均用电量”、“用户当月用电量”为聚点的聚类属性,可以绘制出聚点的分布图,如图2所示。
图2中,“·”代表用户的聚点。红色虚线上方表示用户该月用电量低于近期平均用电量,斜线以下表示用户该月用电量高于近期平均用电量。根据DBSCAN聚类分析思想,聚类开始前设定领域半径(ε)为28,领域内最少对象数目(MinPts)为10。得到如图2中红色圆圈所示的三个簇。综合平均线趋势和DBSCAN聚类分析理论的主要思想,月平均用电量线以上,未包含在三个簇内的为噪点。
运用正态分布原理对图2所示簇内远离核心聚点的奇异点数据进行评价。并根据上述方式计算防窃电检测嫌疑度。
上述具体实施可由本领域技术人员在不背离本发明原理和宗旨的前提下以不同的方式对其进行局部调整,本发明的保护范围以权利要求书为准且不由上述具体实施所限,在其范围内的各个实现方案均受本发明之约束。
Claims (4)
1.一种公变台区用户防窃电检测跟踪方法,其特征在于,包括以下步骤:
步骤1、获得目标用户用电量基础数据;
步骤2、将符合上述要求的基础用电数据进行DBSCAN数据挖掘算法,形成类簇并发现噪点;
步骤3、采用统计学方法,筛选出奇异聚点,并计算奇异聚点的防窃电检测嫌疑度;
所述的基础数据是指:用户当日用电量、用户当日标准化用电量、用户近期平均用电量、用户近期用电量标准方差。
2.根据权利要求1所述的方法,其特征是,所述的基础数据经过过滤筛选,具体为:选择包含3个月及以上日用电量数据的客户,并且该客户用电量同比连续缺失不超过2周。
3.根据权利要求1所述的方法,其特征是,所述的步骤2具体包括:
2.1)获得目标用户用电量基础数据,基础数据特点应满足有关要求,对于不满足数据要求的用户进行过滤筛选,不参与聚类分析;
2.2)形成类簇并发现噪点:选择合适的聚点属性,采用DBSCAN数据挖掘算法,对聚点分类,找出噪点数据;
2.3)奇异聚点:采用统计学方法,筛选出奇异聚点,并计算奇异聚点的防窃电检测嫌疑度。
4.根据权利要求1所述的方法,其特征是,所述的步骤3具体包括:
①同一个类簇下的聚点用户,各自的日用电量曲线虽然不相同,但其日用电量组成的样本基本满足正态分布规则,即满足x~N(μ,σ2),其中,x为用户日用电量,μ为簇内用户日用电量的均值,σ2为簇的日用电量标准方差;
②在样本估计中,样本点落在x≤μ-3σ的概率为小概率事件,即:认为窃电用户所占的比例是极小的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610585785.2A CN107657542A (zh) | 2016-07-25 | 2016-07-25 | 公变台区用户防窃电的检测跟踪方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610585785.2A CN107657542A (zh) | 2016-07-25 | 2016-07-25 | 公变台区用户防窃电的检测跟踪方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107657542A true CN107657542A (zh) | 2018-02-02 |
Family
ID=61126821
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610585785.2A Pending CN107657542A (zh) | 2016-07-25 | 2016-07-25 | 公变台区用户防窃电的检测跟踪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107657542A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111260198A (zh) * | 2020-01-10 | 2020-06-09 | 广东电网有限责任公司 | 一种台区同期线损合理度评判方法、系统及终端设备 |
CN114091608A (zh) * | 2021-11-24 | 2022-02-25 | 国网河南省电力公司许昌供电公司 | 一种基于数据挖掘的户变关系辨识方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103063967A (zh) * | 2013-01-10 | 2013-04-24 | 余力鑫 | 台区用户识别方法及台区用户识别仪 |
CN103325071A (zh) * | 2013-06-09 | 2013-09-25 | 浙江大学 | 一种基于密度聚类的用户典型负荷曲线的构建方法 |
CN104850612A (zh) * | 2015-05-13 | 2015-08-19 | 中国电力科学研究院 | 一种基于增强凝聚层次聚类的配网用户负荷特征分类方法 |
CN104951989A (zh) * | 2014-03-26 | 2015-09-30 | 国家电网公司 | 一种窃电分析方法及系统 |
CN105488628A (zh) * | 2015-11-30 | 2016-04-13 | 国网天津市电力公司 | 一种面向电力大数据可视化的数据挖掘方法 |
-
2016
- 2016-07-25 CN CN201610585785.2A patent/CN107657542A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103063967A (zh) * | 2013-01-10 | 2013-04-24 | 余力鑫 | 台区用户识别方法及台区用户识别仪 |
CN103325071A (zh) * | 2013-06-09 | 2013-09-25 | 浙江大学 | 一种基于密度聚类的用户典型负荷曲线的构建方法 |
CN104951989A (zh) * | 2014-03-26 | 2015-09-30 | 国家电网公司 | 一种窃电分析方法及系统 |
CN104850612A (zh) * | 2015-05-13 | 2015-08-19 | 中国电力科学研究院 | 一种基于增强凝聚层次聚类的配网用户负荷特征分类方法 |
CN105488628A (zh) * | 2015-11-30 | 2016-04-13 | 国网天津市电力公司 | 一种面向电力大数据可视化的数据挖掘方法 |
Non-Patent Citations (4)
Title |
---|
夏春艳: "《数据挖掘技术与应用》", 31 August 2014, 冶金工业出版社 * |
张铁峰 等: ""电力用户负荷模式提取技术及应用综述"", 《电网技术》 * |
杨小铭 等: ""低压台区用户的防窃电的趋势嫌疑度分析方法研究"", 《电器与能效管理技术》 * |
陈腾飞: ""基于用电信息采集系统的窃电在线稽查装置的开发应用"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111260198A (zh) * | 2020-01-10 | 2020-06-09 | 广东电网有限责任公司 | 一种台区同期线损合理度评判方法、系统及终端设备 |
CN114091608A (zh) * | 2021-11-24 | 2022-02-25 | 国网河南省电力公司许昌供电公司 | 一种基于数据挖掘的户变关系辨识方法 |
CN114091608B (zh) * | 2021-11-24 | 2024-02-20 | 国网河南省电力公司许昌供电公司 | 一种基于数据挖掘的户变关系辨识方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110231528B (zh) | 基于负荷特征模型库的变压器户变异常识别方法及装置 | |
CN106250927A (zh) | 基于k最近邻分类算法的配电网拓扑结构校验方法 | |
WO2016008263A1 (zh) | 一种通过电压特征区分台区和相别的方法 | |
CN106291030B (zh) | 一种配电网计量防护系统 | |
CN107340492A (zh) | 基于大数据挖掘和场景预判的电能计量装置故障分析方法 | |
CN103455855A (zh) | 一种基于用电信息数据分析的反间歇性窃电检测方法 | |
CN107633050A (zh) | 一种基于大数据分析用电行为判定窃电概率的方法 | |
CN112730938B (zh) | 一种基于用电采集大数据的窃电用户判断方法 | |
CN107039970A (zh) | 公变台区线损率异常原因检测方法和系统 | |
CN106229969B (zh) | 基于累计统计线损率的电网元件损耗异常判断方法 | |
CN102123044A (zh) | 基于拓扑发现技术的网络拓扑一致性检测设备和检测方法 | |
CN110458444A (zh) | 一种低压台区运行状态多维影响因素综合评价方法及系统 | |
CN107870275A (zh) | 基于大数据的避雷器运行状态评价方法 | |
CN111177208A (zh) | 基于大数据分析的用电异常检测方法 | |
CN108764603A (zh) | 一种基于高维随机矩阵的用户窃电行为辨识方法 | |
CN109725219A (zh) | 一种电能表台区自动识别方法 | |
CN111461521A (zh) | 一种基于电力大数据的居民住房空置率分析方法 | |
CN107169640A (zh) | 一种基于大数据技术的配电网关键指标分析方法 | |
CN106019087A (zh) | 一种间歇性窃电监测系统 | |
CN110011423A (zh) | 基于大数据实现户变关系在线动态智能监管功能的系统及方法 | |
CN110489783A (zh) | 一种基于qrnn的低压台区线损率合理范围估计方法 | |
CN110047013B (zh) | 反专变用户间断型窃电方法 | |
CN108152665A (zh) | 用电异常确定方法及装置 | |
CN107657542A (zh) | 公变台区用户防窃电的检测跟踪方法 | |
CN114240041A (zh) | 配网台区精益化线损分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180202 |