CN106127602B - 一种基于约简离群点算法的窃电辨识方法及装置 - Google Patents
一种基于约简离群点算法的窃电辨识方法及装置 Download PDFInfo
- Publication number
- CN106127602B CN106127602B CN201610425148.9A CN201610425148A CN106127602B CN 106127602 B CN106127602 B CN 106127602B CN 201610425148 A CN201610425148 A CN 201610425148A CN 106127602 B CN106127602 B CN 106127602B
- Authority
- CN
- China
- Prior art keywords
- data
- electricity
- attribute
- data set
- outlier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005611 electricity Effects 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 230000002265 prevention Effects 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000011159 matrix material Substances 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于约简离群点算法的窃电辨识方法,利用属性约简技术去除了冗余属性,在更小的属性子空间去获取相同或相近的离群数据集,通过计算基于近邻的离群权重来确定离群点集合,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。同时也公开了该方法的装置。本发明能快速、有效、准确地辨识出窃电用户,从而为电网工作人员利用用电信息采集系统的数据快速有效地进行反窃电分析提供了新的途径。
Description
技术领域
本发明涉及一种基于约简离群点算法的窃电辨识方法及装置,属于电力用电领域。
背景技术
当前,非法窃电的方式五花八门,长期困扰着发供电公司,非法窃电不仅造成了电量的大量流失,还扰乱了供电秩序,更是给电力企业带来了巨大的经济损失。为了更好地排查窃电问题,电力企业需要一种窃电辨识的方法。
虽然现有的反窃电方法能辨识出一些窃电现象,但是仍存在一定的局限性,不具有普遍适用性和网络全局性。而且随着智能电表和用电信息采集系统的全面推广,使得用户电表海量数据的远程集抄成为可能,如何利用这些海量数据进行更为全面、快速、准确、有效的窃电辨识,具有极大的现实意义。
发明内容
为了解决上述技术问题,本发明提供了一种基于约简离群点算法的窃电辨识方法及装置。
为了达到上述目的,本发明所采用的技术方案是:
一种基于约简离群点算法的窃电辨识方法,包括以下步骤,
步骤1,获取用电负荷管理系统数据库中的用户历史负荷数据并存储至历史数据集合中;以额定容量为基准值将获取的用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;
步骤2,根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
步骤3,利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
在约简后的用电数据集合中,权重等于一个数据点与其他数据点的距离之和;
步骤4,根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出;
其中,p为大于等于1的正整数。
变换后的标幺值以数据表的形式存储至用电数据集合,数据表中还记录有变换后的标幺值相应的属性信息。
属性信息包括时间属性和负荷属性。
约简后的用电数据集合U中,数据点x与数据点y在属性a上的距离等于,
其中,表示数据点x在属性a上的近邻,表示数据点y在属性a上的近邻,属性a为时间属性或负荷属性。
如果在属性a上的值是离散的,设置近邻参数qa(x)=0,否则设置qa(x)∈(0,∞)。
p的取值范围在10~25之间。
一种基于约简离群点算法的窃电辨识方法的装置,包括相连的用户历史负荷数据采集模块和数据服务器;
所述用户历史负荷数据采集模块,用以采集电负荷管理系统数据库中的用户历史负荷数据并传送至数据服务器中进行窃电辨识;
所述数据数据服务器包括依次连接的数据接收模块、关联模块、属性约简模块和窃电数据确定模块;
所述数据接收模块,用以接受用户历史负荷数据并存储至历史数据集合中,以额定容量为基准值将用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;
所述关联模块,用以根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
所述属性约简模块,用以利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
所述窃电数据确定模块,用以根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。
p的取值范围在10~25之间。
还包括与数据服务器连接的显示模块,用以显示窃电数据。
本发明所达到的有益效果:本发明能快速、有效、准确地辨识出窃电用户,从而为电网工作人员利用用电信息采集系统的数据快速有效地进行反窃电分析提供了新的途径。
附图说明
图1为本发明方法的流程图。
图2为本发明装置的框图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,一种基于约简离群点算法的窃电辨识方法,包括以下步骤:
步骤1,获取用电负荷管理系统数据库中的用户历史负荷数据并存储至历史数据集合中;以额定容量为基准值将获取的用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中。
变换后的标幺值以数据表的形式存储至用电数据集合,数据表中还记录有变换后的标幺值相应的属性信息,属性信息包括时间属性和负荷属性。
步骤2,根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合。
步骤3,利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;在约简后的用电数据集合中,权重等于一个数据点与其他数据点的距离之和。
对用电数据集合的属性进行约简的过程为:
1、构建决策表T=(U,A,V,f),计算决策表达的识别矩阵;
其中,U={x1,x2,…,xn}为论域,即为用电数据集合,x1,x2,…,xn分别为用电数据集合中的元素,A=C∨D是属性集合,C为条件属性集,D为决策属性集,V为属性的值域,f:U×A,f是一个映射函数;识别矩阵是一个对称的矩阵,其计算过程为现有技术。
2、将识别矩阵中属性组合数为1的属性加入到核属性集合中;识别矩阵中所有属性组合数为1的属性均为决策表的核属性。
3、令约简后的属性集合£为核属性集合,在识别矩阵中找出所有不包含核属性的属性组合Q,将属性组合Q表示为析取范式形式;核属性外的其余有用属性应该从属性组合数不为1的矩阵元素中分析获得。
4、假设某数据表除核属性外剩余两个属性组合,分别用t11,t12,…,t1c和t21,t22,…,t2k来表示,构造表达P=(t11∨t12∨…∨t1c)∧(t21∨t22∨…∨t2k),则该合取式代表的属性组合连同核属性即可将原数据表中的所有决策区分出来,如果信息表除了核属性集以外还剩余N个属性组合,则对这N个属性组合的处理方法依此类推;最终得到的属性组合与核属性一起构成最佳属性约简,并输出约简后的用电数据集合。
约简后的用电数据集合U中,数据点x与数据点y在属性a上的距离等于,
其中,表示数据点x在属性a上的近邻,表示数据点y在属性a上的近邻,属性a为时间属性或负荷属性。如果在属性a上的值是离散的,设置近邻参数qa(x)=0,否则设置qa(x)∈(0,∞)。
步骤4,根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出;其中,p为大于等于1的正整数。
p的范围至关重要,如果太小,会导致离群点不能完全被检测出来,反之,会增加算法的复杂度,通过反复计算验证,p的取值范围在10~25之间。其原理为:属性域子集空间内的所有点对离群点判断的贡献是不相同的,距离查询点距离越近的点,其贡献越大,因此,对所有近邻的贡献加权,根据它们相对查询点的距离,将较大的权值赋给较近的近邻,根据每个近邻与查询点的距离平方的倒数加权这个近邻的“选举权”,然后,将权值从大到小排列,选取权值最大的前p个对象,输出离群点集合。
如图2所示,一种基于约简离群点算法的窃电辨识方法的装置,包括用户历史负荷数据采集模块、数据服务器和显示模块,用户历史负荷数据采集模块和显示模块均与数据服务器连接。
用户历史负荷数据采集模块:用以采集电负荷管理系统数据库中的用户历史负荷数据并传送至数据服务器中进行窃电辨识。
数据数据服务器包括依次连接的数据接收模块、关联模块、属性约简模块和窃电数据确定模块。
数据接收模块:用以接受用户历史负荷数据并存储至历史数据集合中,以额定容量为基准值将用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中。
关联模块:用以根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合。
属性约简模块:用以利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重。
窃电数据确定模块:用以根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。
显示模块:用以显示窃电数据。
本发明首先利用属性约简技术去除了冗余属性,在更小的属性子空间去获取相同或相近的离群数据集,然后通过计算基于近邻的离群权重来确定离群点集合;应用属性约简后去除一些不会对数据离群有显著影响的非核心属性,这样计算时间大大缩短而且不会降低窃电辨识的全面性和有效性,在更小的属性子空间上进行计算还能提高准确性。
综上所述,本发明能快速、有效、准确地辨识出窃电用户,从而为电网工作人员利用用电信息采集系统的数据快速有效地进行反窃电分析提供了新的途径。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
Claims (7)
1.一种基于约简离群点算法的窃电辨识方法,其特征在于:包括以下步骤,
步骤1,获取用电负荷管理系统数据库中的用户历史负荷数据并存储至历史数据集合中;以额定容量为基准值将获取的用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;属性信息包括时间属性和负荷属性;
步骤2,根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
步骤3,利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
在约简后的用电数据集合中,权重等于一个数据点与其他数据点的距离之和;
约简后的用电数据集合U中,数据点x与数据点y在属性a上的距离等于,
其中,表示数据点x在属性a上的近邻,表示数据点y在属性a上的近邻,属性a为时间属性或负荷属性;
步骤4,根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出;
其中,p为大于等于1的正整数。
2.根据权利要求1所述的一种基于约简离群点算法的窃电辨识方法,其特征在于:变换后的标幺值以数据表的形式存储至用电数据集合,数据表中还记录有变换后的标幺值相应的属性信息。
3.根据权利要求1所述的一种基于约简离群点算法的窃电辨识方法,其特征在于:如果在属性a上的值是离散的,设置近邻参数qa(x)=0,否则设置qa(x)∈(0,∞)。
4.根据权利要求1所述的一种基于约简离群点算法的窃电辨识方法,其特征在于:p的取值范围在10~25之间。
5.基于权利要求1所述的一种基于约简离群点算法的窃电辨识方法的装置,其特征在于:包括相连的用户历史负荷数据采集模块和数据服务器;
所述用户历史负荷数据采集模块,用以采集电负荷管理系统数据库中的用户历史负荷数据并传送至数据服务器中进行窃电辨识;
所述数据数据服务器包括依次连接的数据接收模块、关联模块、属性约简模块和窃电数据确定模块;
所述数据接收模块,用以接受用户历史负荷数据并存储至历史数据集合中,以额定容量为基准值将用户历史负荷数据变换成标幺值,同时将变换后的标幺值及相应的属性信息存储至用电数据集合中;
所述关联模块,用以根据用户历史负荷数据与标幺值之间的一一对应转换关系,关联历史数据集合与用电数据集合;
所述属性约简模块,用以利用近邻粗糙集理论对用电数据集合的属性进行约简,计算约简后的用电数据集合中所有数据点的权重;
所述窃电数据确定模块,用以根据权重对约简后的用电数据集合中所有数据点进行排序,筛选权重大小排在前p位的数据点并存储至离群点集合内,根据历史数据集合与用电数据集合的关联,判断离群点集合的所有数据点对应的用户历史负荷数据为窃电数据并输出。
6.基于权利要求5所述的一种基于约简离群点算法的窃电辨识方法的装置,其特征在于:p的取值范围在10~25之间。
7.基于权利要求5所述的一种基于约简离群点算法的窃电辨识方法的装置,其特征在于:还包括与数据服务器连接的显示模块,用以显示窃电数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610425148.9A CN106127602B (zh) | 2016-06-15 | 2016-06-15 | 一种基于约简离群点算法的窃电辨识方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610425148.9A CN106127602B (zh) | 2016-06-15 | 2016-06-15 | 一种基于约简离群点算法的窃电辨识方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106127602A CN106127602A (zh) | 2016-11-16 |
CN106127602B true CN106127602B (zh) | 2019-12-24 |
Family
ID=57469570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610425148.9A Active CN106127602B (zh) | 2016-06-15 | 2016-06-15 | 一种基于约简离群点算法的窃电辨识方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106127602B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106682079B (zh) * | 2016-11-21 | 2020-06-05 | 云南电网有限责任公司电力科学研究院 | 一种基于聚类分析的用户用电行为检测方法 |
CN107145966A (zh) * | 2017-04-12 | 2017-09-08 | 山大地纬软件股份有限公司 | 基于逻辑回归概率分析优化模型的反窃电分析预警方法 |
CN111209595B (zh) * | 2020-04-21 | 2020-08-11 | 国网四川省电力公司电力科学研究院 | 一种涉污企业用电信息匹配及数据处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102866321A (zh) * | 2012-08-13 | 2013-01-09 | 广东电网公司电力科学研究院 | 一种自适应的防窃漏电诊断方法 |
CN103208091A (zh) * | 2013-04-25 | 2013-07-17 | 国家电网公司 | 一种基于用电负荷管理系统数据挖掘的反窃电方法 |
CN104036357A (zh) * | 2014-06-12 | 2014-09-10 | 国家电网公司 | 用户用电窃电行为模式的分析方法 |
-
2016
- 2016-06-15 CN CN201610425148.9A patent/CN106127602B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102866321A (zh) * | 2012-08-13 | 2013-01-09 | 广东电网公司电力科学研究院 | 一种自适应的防窃漏电诊断方法 |
CN103208091A (zh) * | 2013-04-25 | 2013-07-17 | 国家电网公司 | 一种基于用电负荷管理系统数据挖掘的反窃电方法 |
CN104036357A (zh) * | 2014-06-12 | 2014-09-10 | 国家电网公司 | 用户用电窃电行为模式的分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106127602A (zh) | 2016-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108376982B (zh) | 负载相序的识别方法及装置 | |
CN101459560B (zh) | 长流的识别方法、数据流量的测量方法及其设备 | |
CN103869192B (zh) | 智能电网线损检测方法和系统 | |
CN104408667A (zh) | 一种电能质量综合评估的方法和系统 | |
CN111160791A (zh) | 一种基于gbdt算法及因素融合的异常用户识别方法 | |
CN106127602B (zh) | 一种基于约简离群点算法的窃电辨识方法及装置 | |
CN108108517A (zh) | 一种基于大数据的电网规划智能辅助分析方法 | |
CN110309884A (zh) | 基于泛在电力物联网体系的用电数据异常识别系统 | |
CN113450031B (zh) | 居民智慧用能服务潜在台区选取方法及装置 | |
CN112307003A (zh) | 电网数据多维辅助分析方法、系统、终端及可读存储介质 | |
CN115600824A (zh) | 一种碳排放的预警方法及装置、存储介质、电子设备 | |
CN109449923B (zh) | 一种有源配电系统运行灵活性的量化分析方法及相关产品 | |
CN110287237B (zh) | 一种基于社会网络结构分析社团数据挖掘方法 | |
CN106022640B (zh) | 电量指数核对系统及方法 | |
CN114881508A (zh) | 一种电网指标报表的数据处理方法、装置及设备 | |
Grigoras et al. | Processing of smart meters data for peak load estimation of consumers | |
CN113191656B (zh) | 一种基于数据关联分析的低压配电网设备负荷与拓扑联动方法 | |
CN112365164A (zh) | 基于改进密度峰值快速搜索聚类算法的中大型能源用户用能特性画像方法 | |
CN107194529B (zh) | 基于挖掘技术的配电网可靠性经济效益分析方法及装置 | |
CN114676931B (zh) | 一种基于数据中台技术的电量预测系统 | |
CN113778681B (zh) | 基于云计算的数据处理方法、装置及存储介质 | |
CN113704407B (zh) | 基于类别分析的投诉量分析方法、装置、设备及存储介质 | |
CN115563507A (zh) | 可再生能源发电场景的生成方法、装置及设备 | |
CN105868435B (zh) | 一种基于线性相关性分析实现光网络建设的高效控制方法 | |
CN114123190A (zh) | 确定电表所属目标台区的方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |