CN106127602B - 一种基于约简离群点算法的窃电辨识方法及装置 - Google Patents

一种基于约简离群点算法的窃电辨识方法及装置 Download PDF

Info

Publication number
CN106127602B
CN106127602B CN201610425148.9A CN201610425148A CN106127602B CN 106127602 B CN106127602 B CN 106127602B CN 201610425148 A CN201610425148 A CN 201610425148A CN 106127602 B CN106127602 B CN 106127602B
Authority
CN
China
Prior art keywords
data
electricity
attribute
data set
outlier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610425148.9A
Other languages
English (en)
Other versions
CN106127602A (zh
Inventor
郑爱霞
范洁
沈秋英
周玉
陈霄
金萍
易永仙
郭兴昕
崔高颖
陈宇沁
李纬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201610425148.9A priority Critical patent/CN106127602B/zh
Publication of CN106127602A publication Critical patent/CN106127602A/zh
Application granted granted Critical
Publication of CN106127602B publication Critical patent/CN106127602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于约简离群点算法的窃电辨识方法,利用属性约简技术去除了冗余属性,在更小的属性子空间去获取相同或相近的离群数据集,通过计算基于近邻的离群权重来确定离群点集合,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。同时也公开了该方法的装置。本发明能快速、有效、准确地辨识出窃电用户,从而为电网工作人员利用用电信息采集系统的数据快速有效地进行反窃电分析提供了新的途径。

Description

一种基于约简离群点算法的窃电辨识方法及装置
技术领域
本发明涉及一种基于约简离群点算法的窃电辨识方法及装置,属于电力用电领域。
背景技术
当前,非法窃电的方式五花八门,长期困扰着发供电公司,非法窃电不仅造成了电量的大量流失,还扰乱了供电秩序,更是给电力企业带来了巨大的经济损失。为了更好地排查窃电问题,电力企业需要一种窃电辨识的方法。
虽然现有的反窃电方法能辨识出一些窃电现象,但是仍存在一定的局限性,不具有普遍适用性和网络全局性。而且随着智能电表和用电信息采集系统的全面推广,使得用户电表海量数据的远程集抄成为可能,如何利用这些海量数据进行更为全面、快速、准确、有效的窃电辨识,具有极大的现实意义。
发明内容
为了解决上述技术问题,本发明提供了一种基于约简离群点算法的窃电辨识方法及装置。
为了达到上述目的,本发明所采用的技术方案是:
一种基于约简离群点算法的窃电辨识方法,包括以下步骤,
步骤1,获取用电负荷管理系统数据库中的用户历史负荷数据并存储至历史数据集合中;以额定容量为基准值将获取的用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;
步骤2,根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
步骤3,利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
在约简后的用电数据集合中,权重等于一个数据点与其他数据点的距离之和;
步骤4,根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出;
其中,p为大于等于1的正整数。
变换后的标幺值以数据表的形式存储至用电数据集合,数据表中还记录有变换后的标幺值相应的属性信息。
属性信息包括时间属性和负荷属性。
约简后的用电数据集合U中,数据点x与数据点y在属性a上的距离等于,
其中,表示数据点x在属性a上的近邻,表示数据点y在属性a上的近邻,属性a为时间属性或负荷属性。
如果在属性a上的值是离散的,设置近邻参数qa(x)=0,否则设置qa(x)∈(0,∞)。
p的取值范围在10~25之间。
一种基于约简离群点算法的窃电辨识方法的装置,包括相连的用户历史负荷数据采集模块和数据服务器;
所述用户历史负荷数据采集模块,用以采集电负荷管理系统数据库中的用户历史负荷数据并传送至数据服务器中进行窃电辨识;
所述数据数据服务器包括依次连接的数据接收模块、关联模块、属性约简模块和窃电数据确定模块;
所述数据接收模块,用以接受用户历史负荷数据并存储至历史数据集合中,以额定容量为基准值将用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;
所述关联模块,用以根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
所述属性约简模块,用以利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
所述窃电数据确定模块,用以根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。
p的取值范围在10~25之间。
还包括与数据服务器连接的显示模块,用以显示窃电数据。
本发明所达到的有益效果:本发明能快速、有效、准确地辨识出窃电用户,从而为电网工作人员利用用电信息采集系统的数据快速有效地进行反窃电分析提供了新的途径。
附图说明
图1为本发明方法的流程图。
图2为本发明装置的框图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种基于约简离群点算法的窃电辨识方法,包括以下步骤:
步骤1,获取用电负荷管理系统数据库中的用户历史负荷数据并存储至历史数据集合中;以额定容量为基准值将获取的用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中。
变换后的标幺值以数据表的形式存储至用电数据集合,数据表中还记录有变换后的标幺值相应的属性信息,属性信息包括时间属性和负荷属性。
步骤2,根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合。
步骤3,利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;在约简后的用电数据集合中,权重等于一个数据点与其他数据点的距离之和。
对用电数据集合的属性进行约简的过程为:
1、构建决策表T=(U,A,V,f),计算决策表达的识别矩阵;
其中,U={x1,x2,…,xn}为论域,即为用电数据集合,x1,x2,…,xn分别为用电数据集合中的元素,A=C∨D是属性集合,C为条件属性集,D为决策属性集,V为属性的值域,f:U×A,f是一个映射函数;识别矩阵是一个对称的矩阵,其计算过程为现有技术。
2、将识别矩阵中属性组合数为1的属性加入到核属性集合中;识别矩阵中所有属性组合数为1的属性均为决策表的核属性。
3、令约简后的属性集合£为核属性集合,在识别矩阵中找出所有不包含核属性的属性组合Q,将属性组合Q表示为析取范式形式;核属性外的其余有用属性应该从属性组合数不为1的矩阵元素中分析获得。
4、假设某数据表除核属性外剩余两个属性组合,分别用t11,t12,…,t1c和t21,t22,…,t2k来表示,构造表达P=(t11∨t12∨…∨t1c)∧(t21∨t22∨…∨t2k),则该合取式代表的属性组合连同核属性即可将原数据表中的所有决策区分出来,如果信息表除了核属性集以外还剩余N个属性组合,则对这N个属性组合的处理方法依此类推;最终得到的属性组合与核属性一起构成最佳属性约简,并输出约简后的用电数据集合。
约简后的用电数据集合U中,数据点x与数据点y在属性a上的距离等于,
其中,表示数据点x在属性a上的近邻,表示数据点y在属性a上的近邻,属性a为时间属性或负荷属性。如果在属性a上的值是离散的,设置近邻参数qa(x)=0,否则设置qa(x)∈(0,∞)。
步骤4,根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出;其中,p为大于等于1的正整数。
p的范围至关重要,如果太小,会导致离群点不能完全被检测出来,反之,会增加算法的复杂度,通过反复计算验证,p的取值范围在10~25之间。其原理为:属性域子集空间内的所有点对离群点判断的贡献是不相同的,距离查询点距离越近的点,其贡献越大,因此,对所有近邻的贡献加权,根据它们相对查询点的距离,将较大的权值赋给较近的近邻,根据每个近邻与查询点的距离平方的倒数加权这个近邻的“选举权”,然后,将权值从大到小排列,选取权值最大的前p个对象,输出离群点集合。
如图2所示,一种基于约简离群点算法的窃电辨识方法的装置,包括用户历史负荷数据采集模块、数据服务器和显示模块,用户历史负荷数据采集模块和显示模块均与数据服务器连接。
用户历史负荷数据采集模块:用以采集电负荷管理系统数据库中的用户历史负荷数据并传送至数据服务器中进行窃电辨识。
数据数据服务器包括依次连接的数据接收模块、关联模块、属性约简模块和窃电数据确定模块。
数据接收模块:用以接受用户历史负荷数据并存储至历史数据集合中,以额定容量为基准值将用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中。
关联模块:用以根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合。
属性约简模块:用以利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重。
窃电数据确定模块:用以根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。
显示模块:用以显示窃电数据。
本发明首先利用属性约简技术去除了冗余属性,在更小的属性子空间去获取相同或相近的离群数据集,然后通过计算基于近邻的离群权重来确定离群点集合;应用属性约简后去除一些不会对数据离群有显著影响的非核心属性,这样计算时间大大缩短而且不会降低窃电辨识的全面性和有效性,在更小的属性子空间上进行计算还能提高准确性。
综上所述,本发明能快速、有效、准确地辨识出窃电用户,从而为电网工作人员利用用电信息采集系统的数据快速有效地进行反窃电分析提供了新的途径。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (7)

1.一种基于约简离群点算法的窃电辨识方法,其特征在于:包括以下步骤,
步骤1,获取用电负荷管理系统数据库中的用户历史负荷数据并存储至历史数据集合中;以额定容量为基准值将获取的用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;属性信息包括时间属性和负荷属性;
步骤2,根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
步骤3,利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
在约简后的用电数据集合中,权重等于一个数据点与其他数据点的距离之和;
约简后的用电数据集合U中,数据点x与数据点y在属性a上的距离等于,
其中,表示数据点x在属性a上的近邻,表示数据点y在属性a上的近邻,属性a为时间属性或负荷属性;
步骤4,根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出;
其中,p为大于等于1的正整数。
2.根据权利要求1所述的一种基于约简离群点算法的窃电辨识方法,其特征在于:变换后的标幺值以数据表的形式存储至用电数据集合,数据表中还记录有变换后的标幺值相应的属性信息。
3.根据权利要求1所述的一种基于约简离群点算法的窃电辨识方法,其特征在于:如果在属性a上的值是离散的,设置近邻参数qa(x)=0,否则设置qa(x)∈(0,∞)。
4.根据权利要求1所述的一种基于约简离群点算法的窃电辨识方法,其特征在于:p的取值范围在10~25之间。
5.基于权利要求1所述的一种基于约简离群点算法的窃电辨识方法的装置,其特征在于:包括相连的用户历史负荷数据采集模块和数据服务器;
所述用户历史负荷数据采集模块,用以采集电负荷管理系统数据库中的用户历史负荷数据并传送至数据服务器中进行窃电辨识;
所述数据数据服务器包括依次连接的数据接收模块、关联模块、属性约简模块和窃电数据确定模块;
所述数据接收模块,用以接受用户历史负荷数据并存储至历史数据集合中,以额定容量为基准值将用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;
所述关联模块,用以根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
所述属性约简模块,用以利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
所述窃电数据确定模块,用以根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。
6.基于权利要求5所述的一种基于约简离群点算法的窃电辨识方法的装置,其特征在于:p的取值范围在10~25之间。
7.基于权利要求5所述的一种基于约简离群点算法的窃电辨识方法的装置,其特征在于:还包括与数据服务器连接的显示模块,用以显示窃电数据。
CN201610425148.9A 2016-06-15 2016-06-15 一种基于约简离群点算法的窃电辨识方法及装置 Active CN106127602B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610425148.9A CN106127602B (zh) 2016-06-15 2016-06-15 一种基于约简离群点算法的窃电辨识方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610425148.9A CN106127602B (zh) 2016-06-15 2016-06-15 一种基于约简离群点算法的窃电辨识方法及装置

Publications (2)

Publication Number Publication Date
CN106127602A CN106127602A (zh) 2016-11-16
CN106127602B true CN106127602B (zh) 2019-12-24

Family

ID=57469570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610425148.9A Active CN106127602B (zh) 2016-06-15 2016-06-15 一种基于约简离群点算法的窃电辨识方法及装置

Country Status (1)

Country Link
CN (1) CN106127602B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682079B (zh) * 2016-11-21 2020-06-05 云南电网有限责任公司电力科学研究院 一种基于聚类分析的用户用电行为检测方法
CN107145966A (zh) * 2017-04-12 2017-09-08 山大地纬软件股份有限公司 基于逻辑回归概率分析优化模型的反窃电分析预警方法
CN111209595B (zh) * 2020-04-21 2020-08-11 国网四川省电力公司电力科学研究院 一种涉污企业用电信息匹配及数据处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866321A (zh) * 2012-08-13 2013-01-09 广东电网公司电力科学研究院 一种自适应的防窃漏电诊断方法
CN103208091A (zh) * 2013-04-25 2013-07-17 国家电网公司 一种基于用电负荷管理系统数据挖掘的反窃电方法
CN104036357A (zh) * 2014-06-12 2014-09-10 国家电网公司 用户用电窃电行为模式的分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866321A (zh) * 2012-08-13 2013-01-09 广东电网公司电力科学研究院 一种自适应的防窃漏电诊断方法
CN103208091A (zh) * 2013-04-25 2013-07-17 国家电网公司 一种基于用电负荷管理系统数据挖掘的反窃电方法
CN104036357A (zh) * 2014-06-12 2014-09-10 国家电网公司 用户用电窃电行为模式的分析方法

Also Published As

Publication number Publication date
CN106127602A (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
CN108376982B (zh) 负载相序的识别方法及装置
CN101459560B (zh) 长流的识别方法、数据流量的测量方法及其设备
CN103869192B (zh) 智能电网线损检测方法和系统
CN104408667A (zh) 一种电能质量综合评估的方法和系统
CN111160791A (zh) 一种基于gbdt算法及因素融合的异常用户识别方法
CN106127602B (zh) 一种基于约简离群点算法的窃电辨识方法及装置
CN108108517A (zh) 一种基于大数据的电网规划智能辅助分析方法
CN110309884A (zh) 基于泛在电力物联网体系的用电数据异常识别系统
CN113450031B (zh) 居民智慧用能服务潜在台区选取方法及装置
CN112307003A (zh) 电网数据多维辅助分析方法、系统、终端及可读存储介质
CN115600824A (zh) 一种碳排放的预警方法及装置、存储介质、电子设备
CN109449923B (zh) 一种有源配电系统运行灵活性的量化分析方法及相关产品
CN110287237B (zh) 一种基于社会网络结构分析社团数据挖掘方法
CN106022640B (zh) 电量指数核对系统及方法
CN114881508A (zh) 一种电网指标报表的数据处理方法、装置及设备
Grigoras et al. Processing of smart meters data for peak load estimation of consumers
CN113191656B (zh) 一种基于数据关联分析的低压配电网设备负荷与拓扑联动方法
CN112365164A (zh) 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法
CN107194529B (zh) 基于挖掘技术的配电网可靠性经济效益分析方法及装置
CN114676931B (zh) 一种基于数据中台技术的电量预测系统
CN113778681B (zh) 基于云计算的数据处理方法、装置及存储介质
CN113704407B (zh) 基于类别分析的投诉量分析方法、装置、设备及存储介质
CN115563507A (zh) 可再生能源发电场景的生成方法、装置及设备
CN105868435B (zh) 一种基于线性相关性分析实现光网络建设的高效控制方法
CN114123190A (zh) 确定电表所属目标台区的方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant