CN106355209B - 基于决策树算法的窃电诊断系统及方法 - Google Patents
基于决策树算法的窃电诊断系统及方法 Download PDFInfo
- Publication number
- CN106355209B CN106355209B CN201610807427.1A CN201610807427A CN106355209B CN 106355209 B CN106355209 B CN 106355209B CN 201610807427 A CN201610807427 A CN 201610807427A CN 106355209 B CN106355209 B CN 106355209B
- Authority
- CN
- China
- Prior art keywords
- entropy
- stealing
- sample
- attribute
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003066 decision tree Methods 0.000 title claims abstract description 35
- 238000000034 method Methods 0.000 title claims abstract description 12
- 230000005611 electricity Effects 0.000 claims description 20
- 238000012549 training Methods 0.000 claims description 6
- 238000003745 diagnosis Methods 0.000 claims description 5
- 238000002405 diagnostic procedure Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于决策树算法的窃电诊断系统及方法,包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,其特征在于,从电网数据库提取用户的历史数据,用户的历史数据传输到所述数据接口模块后进入窃电诊断决策树模块并形成推理结果,所述诊断结果输出模块将推理结果保存至存储设备并输出至人机接口。本发明利用决策树算法,通过分析用户历史数据,检测出窃电用户。
Description
技术领域
本发明属于电网维护技术领域,更具体地说,涉及一种基于决策树算法的窃电诊断系统及方法。
背景技术
长期以来,窃电现象层出不穷,窃电手段形形色色,严重扰乱了正常的供用电秩序,给用电安全造成威胁,影响了电网的稳定、经济运行,困扰电力企业的发展,使电力企业及国家蒙受巨大的经济损失。
将决策树等数据挖掘技术应用到电力行业的窃电诊断中,就是利用该技术对电力信息流进行分析,挖掘数据规律,为判别用户窃电行为提供科学的依据,而且不受窃电方式的影响。本发明基于决策树算法的窃电诊断系统,可有力提高电力企业的经济效益,降低配电网的管理线损,为电网正常运营提供技术支持,增强电力企业竞争力。
发明内容
为克服现有技术存在的缺陷,本发明提供一种基于决策树算法的窃电诊断系统及方法。
本发明解决其技术问题所采用的技术方案是:
设计一种基于决策树算法的窃电诊断系统,包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,从电网数据库提取用户的历史数据,用户的历史数据传输到所述数据接口模块后进入窃电诊断决策树模块并形成推理结果,所述诊断结果输出模块将推理结果保存至存储设备并输出至人机接口。
本发明还提供一种基于决策树算法的窃电诊断方法,包括以下步骤,
1)提取电网数据库的特征属性数据集合,形成训练集;
2)基于训练集构建决策树;
3)由决策树生成分类规则集,利用分类规则形成窃电诊断数据库;
4)输入用户的历史数据,进行窃电诊断。
在上述步骤(1)中,所述特征属性数据集合是一个从用户统计线损数据库、电压实时统计数据库、电流实时统计数据库中获取包含N个样本的样本集。
在上述步骤(2)中,决策树的构建采用ID3算法,其过程包括:
2.1)选取用户最大线损值、三相电压不平衡率、合同容量比、同期用电量比作为非分类类别属性;
2.2)计算分类类别的熵E0及非分类类别属性用户最大线损值的熵E1、三相电压不平衡率的熵E2、合同容量比的熵E3、同期用电量比的熵E4;
2.3)从上述四个非分类类别属性中选择熵值最大且熵值大于E0的属性作为分类点,创建节点N1;
2.4)重复步骤2.1)至步骤2.3)寻找下一个分类点;
2.5)若样本都在同一非分类类别,则该节点成为树叶,并用该非分类类别标记,否则使用基于熵的度量信息增益作为启发信息,选择将样本分裂的最优属性作为该节点的分裂属性;
2.6)对分裂属性的每一个值创建一个分枝,并根据分枝来划分样本;
2.7)重复步骤2.5)至步骤2.6)对每个节点运行决策树算法。
实施本发明基于决策树算法的窃电诊断系统及方法,具有以下有益效果:
本发明利用决策树算法,通过分析用户历史数据,检测出窃电用户。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明一种基于决策树算法的窃电诊断系统的示意图;
图2为本发明窃电诊断系统中决策树建树的流程示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
如图1所示,本发明基于决策树算法的窃电诊断系统,包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,其特征在于,从电网数据库提取用户的历史数据,用户的历史数据传输到数据接口模块后进入窃电诊断决策树模块并形成推理结果,诊断结果输出模块将推理结果保存至存储设备并输出至人机接口。
如图2所示,本发明还提供一种基于决策树算法的窃电诊断方法,包括以下步骤,
1)提取电网数据库的特征属性数据集合,形成训练集,其中,特征属性数据集合是一个从用户统计线损数据库、电压实时统计数据库、电流实时统计数据库中获取包含N个样本的样本集。
2)基于训练集构建决策树,其中,决策树的构建采用ID3算法,其过程包括:
2.1)选取用户最大线损值、三相电压不平衡率、合同容量比、同期用电量比作为非分类类别属性,其中这4个非分类类别属性的取值参照下表:
非分类类别属性 | 取值 |
用户最大线损值(L) | 统计线损值W1<L<统计线损值W2 |
三相电压不平衡率(U) | 大(U1)、小(U2) |
合同容量比(C) | 大(C1)、小(C2) |
功率因数(P) | 稳定(P1)、突变(P2) |
同期用电量比(E) | 大(E1)、小(E2) |
分类类别 | 窃电(S)、未窃电(F) |
2.2)计算分类类别的熵E0及非分类类别属性用户最大线损值的熵E1、三相电压不平衡率的熵E2、合同容量比的熵E3、同期用电量比的熵E4:
分类类别的熵E0:
其中pS为窃电样本数量占总样本数量的比,pN为未窃电样本数量占总样本数量的比。
用户最大线损值的熵:设大于统计线损值的样本为W个,则小于统计线损值的样本为(N-W)个,取属性大于统计线损值的正例为A1个,反例为(W-A1)个,取属性小于统计线损值的正例为B1个,反例为(N-W-B1)个,用户最大线损值的熵E1为
三相电压不平衡率的熵:设三相电压不平衡率取大的样本为X个,则三相电压不平衡率取小的样本为(N-X)个,取属性为大的正例为A2个,反例为(X-A2)个,取属性为小的正例为B2个,反例为(N-X-B2)个,三相电压不平衡率的熵E2为
合同容量比的熵:设合同容量比取大的样本为Y个,则合同容量比取小的样本(N-Y)为个,取属性为大的正例为A3个,反例为(Y-A3)个,取属性为小的正例为B3个,反例为(N-Y-B3)个,合同容量比的熵E3为
同期用电量比的熵:设同期用电量比取大的样本为Z个,则同期用电量比取小的样本为(N-Z)个,取属性为大的正例为A4个,反例为(Z-A4)个,取属性为小的正例为B4个,反例为(N-Z-B4)个,同期用电量比的熵E4为
2.3)从上述四个非分类类别属性中选择熵值最大且熵值大于E0的属性作为分类点,创建节点N1;
2.4)重复步骤2.1)至步骤2.3)寻找下一个分类点;
2.5)若样本都在同一非分类类别,则该节点成为树叶,并用该非分类类别标记,否则使用基于熵的度量信息增益作为启发信息,选择将样本分裂的最优属性作为该节点的分裂属性;
2.6)对分裂属性的每一个值创建一个分枝,并根据分枝来划分样本;
2.7)重复步骤2.5)至步骤2.6)对每个节点运行决策树算法。
3)由决策树生成分类规则集,利用分类规则形成窃电诊断数据库;
4)输入用户的历史数据,进行窃电诊断。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。
Claims (1)
1.一种基于决策树算法的窃电诊断方法,其特征在于,该方法采用一种基于决策树算法的窃电诊断系统,该窃电诊断系统包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,从电网数据库提取用户的历史数据,用户的历史数据传输到所述数据接口模块后进入窃电诊断决策树模块并形成推理结果,所述诊断结果输出模块将推理结果保存至存储设备并输出至人机接口;
该窃电诊断方法包括以下步骤,
1)提取电网数据库的特征属性数据集合,形成训练集;
2)基于训练集构建决策树;
3)由决策树生成分类规则集,利用分类规则形成窃电诊断数据库;
4)输入用户的历史数据,进行窃电诊断;
其中,在所述步骤(1)中,所述特征属性数据集合是一个从用户统计线损数据库、电压实时统计数据库、电流实时统计数据库中获取包含N个样本的样本集;
在所述步骤(2)中,决策树的构建采用ID3算法,其过程包括:
2.1)选取用户最大线损值、三相电压不平衡率、合同容量比、同期用电量比作为非分类类别属性,其中这4个非分类类别属性的取值如下:统计线损值W1<用户最大线损值L<统计线损值W2;三相电压不平衡率U的取值为大U1、小U2,合同容量比C的取值为大C1、小C2,功率因数P的取值为稳定P1、突变P2,同期用电量比E的取值为大E1、小E2,分类类别的取值为窃电S、未窃电F;
2.2)计算分类类别的熵E0及非分类类别属性用户最大线损值的熵E1、三相电压不平衡率的熵E2、合同容量比的熵E3、同期用电量比的熵E4:
分类类别的熵E0:
其中pS为窃电样本数量占总样本数量的比,pN为未窃电样本数量占总样本数量的比;
用户最大线损值的熵:设大于统计线损值的样本为W个,则小于统计线损值的样本为(N-W)个,取属性大于统计线损值的正例为A1个,反例为(W-A1)个,取属性小于统计线损值的正例为B1个,反例为(N-W-B1)个,用户最大线损值的熵E1为
三相电压不平衡率的熵:设三相电压不平衡率取大的样本为X个,则三相电压不平衡率取小的样本为(N-X)个,取属性为大的正例为A2个,反例为(X-A2)个,取属性为小的正例为B2个,反例为(N-X-B2)个,三相电压不平衡率的熵E2为
合同容量比的熵:设合同容量比取大的样本为Y个,则合同容量比取小的样本(N-Y)为个,取属性为大的正例为A3个,反例为(Y-A3)个,取属性为小的正例为B3个,反例为(N-Y-B3)个,合同容量比的熵E3为
同期用电量比的熵:设同期用电量比取大的样本为Z个,则同期用电量比取小的样本为(N-Z)个,取属性为大的正例为A4个,反例为(Z-A4)个,取属性为小的正例为B4个,反例为(N-Z-B4)个,同期用电量比的熵E4为
2.3)从上述四个非分类类别属性中选择熵值最大且熵值大于E0的属性作为分类点,创建节点N1;
2.4)重复步骤2.1)至步骤2.3)寻找下一个分类点;
2.5)若样本都在同一非分类类别,则该节点成为树叶,并用该非分类类别标记,否则使用基于熵的度量信息增益作为启发信息,选择将样本分裂的最优属性作为该节点的分裂属性;
2.6)对分裂属性的每一个值创建一个分枝,并根据分枝来划分样本;
2.7)重复步骤2.5)至步骤2.6)对每个节点运行决策树算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610807427.1A CN106355209B (zh) | 2016-09-07 | 2016-09-07 | 基于决策树算法的窃电诊断系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610807427.1A CN106355209B (zh) | 2016-09-07 | 2016-09-07 | 基于决策树算法的窃电诊断系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106355209A CN106355209A (zh) | 2017-01-25 |
CN106355209B true CN106355209B (zh) | 2019-10-25 |
Family
ID=57858875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610807427.1A Active CN106355209B (zh) | 2016-09-07 | 2016-09-07 | 基于决策树算法的窃电诊断系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106355209B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108123920B (zh) * | 2016-11-30 | 2020-12-29 | 中国科学院沈阳自动化研究所 | 基于窃电嫌疑程度的智能电网邻域网络恶意用户检测方法 |
CN108733966A (zh) * | 2017-04-14 | 2018-11-02 | 国网重庆市电力公司 | 一种基于决策树群的多维电能表现场状态检验方法 |
CN111062620B (zh) * | 2019-12-19 | 2022-07-29 | 烟台海颐软件股份有限公司 | 基于混合计费数据的电力计费公平性智能分析系统及方法 |
CN111798107A (zh) * | 2020-06-18 | 2020-10-20 | 国网河北省电力有限公司石家庄市栾城区供电分公司 | 一种应用ai智能诊断分析的新型反窃电系统及方法 |
CN113361943A (zh) * | 2021-06-21 | 2021-09-07 | 广东电网有限责任公司 | 一种基于决策树规则生成的专变用户窃电检测方法及系统 |
CN114218522B (zh) * | 2021-12-02 | 2024-04-09 | 清华大学 | 基于信息传递熵的台区用户贡献度测算方法及窃电排查方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537010A (zh) * | 2014-12-17 | 2015-04-22 | 温州大学 | 基于决策树的网构软件中的构件分类方法 |
CN104951989A (zh) * | 2014-03-26 | 2015-09-30 | 国家电网公司 | 一种窃电分析方法及系统 |
CN105139289A (zh) * | 2015-09-06 | 2015-12-09 | 清华大学 | 一种基于错分代价分类学习的电网暂态电压稳定评估方法 |
CN105373877A (zh) * | 2015-09-14 | 2016-03-02 | 江苏南瑞通驰自动化系统有限公司 | 一种用电趋势异常嫌疑分析及反窃电监控系统 |
-
2016
- 2016-09-07 CN CN201610807427.1A patent/CN106355209B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951989A (zh) * | 2014-03-26 | 2015-09-30 | 国家电网公司 | 一种窃电分析方法及系统 |
CN104537010A (zh) * | 2014-12-17 | 2015-04-22 | 温州大学 | 基于决策树的网构软件中的构件分类方法 |
CN105139289A (zh) * | 2015-09-06 | 2015-12-09 | 清华大学 | 一种基于错分代价分类学习的电网暂态电压稳定评估方法 |
CN105373877A (zh) * | 2015-09-14 | 2016-03-02 | 江苏南瑞通驰自动化系统有限公司 | 一种用电趋势异常嫌疑分析及反窃电监控系统 |
Non-Patent Citations (1)
Title |
---|
数据挖掘技术在电量管理与反窃电系统中的应用与研究;胡琛;《中国优秀硕士学位论文全文数据库 社会科学辑(经济政治与法律)》;20041231;第28-38页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106355209A (zh) | 2017-01-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106355209B (zh) | 基于决策树算法的窃电诊断系统及方法 | |
Ganguly et al. | A novel multi-objective PSO for electrical distribution system planning incorporating distributed generation | |
CN111722046B (zh) | 一种基于深度森林模型的变压器故障诊断方法 | |
CN110674120B (zh) | 一种风电场数据清洗方法及装置 | |
CN110321919A (zh) | 一种用于低压单相用户户相关系辨识的聚类方法 | |
CN108875783A (zh) | 一种面向不平衡数据集的极限学习机变压器故障诊断方法 | |
CN106372747B (zh) | 基于随机森林的台区合理线损率估计方法 | |
CN109828184B (zh) | 一种基于互近似熵的电压暂降源识别方法 | |
CN111612053A (zh) | 一种线损率合理区间的计算方法 | |
CN113189418B (zh) | 一种基于电压数据的拓扑关系识别方法 | |
CN110210723A (zh) | 一种基于层次分析法和孤立森林的窃电辨识方法 | |
CN109800416A (zh) | 一种电力设备名称识别方法 | |
CN110348683A (zh) | 电能质量扰动事件主成因分析方法、装置设备及存储介质 | |
CN108038497A (zh) | 一种交流电设备的工作状态判定模型建立方法及设备 | |
CN109960833B (zh) | 一种直流配电电压等级配置方案优选方法及系统 | |
CN111612054B (zh) | 一种基于非负矩阵分解和密度聚类的用户窃电行为识别方法 | |
CN107330576B (zh) | 一种基于边界供电能力的配电网效率评价方法 | |
CN113112177A (zh) | 一种基于混合指标的台区线损处理方法及系统 | |
CN111898446A (zh) | 基于多算法归一化分析的单相接地故障研判方法 | |
CN116307844A (zh) | 一种低压台区线损评估分析方法 | |
CN108183481B (zh) | 一种基于深度学习电网快速判稳方法和系统 | |
CN111191946A (zh) | 故障线路识别方法及装置、电子设备 | |
CN112241812B (zh) | 基于单边优化与遗传算法协作的低压配电网拓扑识别方法 | |
Prasanna et al. | Genetic algorithm based optimal allocation of a distributed generator in a radial distribution feeder | |
Noroc et al. | Performance assessment of the hierarchical clustering methods in classification of electric distribution networks considering unbalance degree |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |