CN106355209A - 基于决策树算法的窃电诊断系统及方法 - Google Patents

基于决策树算法的窃电诊断系统及方法 Download PDF

Info

Publication number
CN106355209A
CN106355209A CN201610807427.1A CN201610807427A CN106355209A CN 106355209 A CN106355209 A CN 106355209A CN 201610807427 A CN201610807427 A CN 201610807427A CN 106355209 A CN106355209 A CN 106355209A
Authority
CN
China
Prior art keywords
decision tree
entropy
stealing
attribute
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610807427.1A
Other languages
English (en)
Other versions
CN106355209B (zh
Inventor
王圆圆
赵森
邵俊刚
廖源
姚昆
张晓璇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan NARI Ltd
Jincheng Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Original Assignee
Wuhan NARI Ltd
Jincheng Power Supply Co of State Grid Shanxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan NARI Ltd, Jincheng Power Supply Co of State Grid Shanxi Electric Power Co Ltd filed Critical Wuhan NARI Ltd
Priority to CN201610807427.1A priority Critical patent/CN106355209B/zh
Publication of CN106355209A publication Critical patent/CN106355209A/zh
Application granted granted Critical
Publication of CN106355209B publication Critical patent/CN106355209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于决策树算法的窃电诊断系统及方法,包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,其特征在于,从电网数据库提取用户的历史数据,用户的历史数据传输到所述数据接口模块后进入窃电诊断决策树模块并形成推理结果,所述诊断结果输出模块将推理结果保存至存储设备并输出至人机接口。本发明利用决策树算法,通过分析用户历史数据,检测出窃电用户。

Description

基于决策树算法的窃电诊断系统及方法
技术领域
本发明属于电网维护技术领域,更具体地说,涉及一种基于决策树算法的窃电诊断系统及方法。
背景技术
长期以来,窃电现象层出不穷,窃电手段形形色色,严重扰乱了正常的供用电秩序,给用电安全造成威胁,影响了电网的稳定、经济运行,困扰电力企业的发展,使电力企业及国家蒙受巨大的经济损失。
将决策树等数据挖掘技术应用到电力行业的窃电诊断中,就是利用该技术对电力信息流进行分析,挖掘数据规律,为判别用户窃电行为提供科学的依据,而且不受窃电方式的影响。本发明基于决策树算法的窃电诊断系统,可有力提高电力企业的经济效益,降低配电网的管理线损,为电网正常运营提供技术支持,增强电力企业竞争力。
发明内容
为克服现有技术存在的缺陷,本发明提供一种基于决策树算法的窃电诊断系统及方法。
本发明解决其技术问题所采用的技术方案是:
设计一种基于决策树算法的窃电诊断系统,包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,其特征在于,从电网数据库提取用户的历史数据,用户的历史数据传输到所述数据接口模块后进入窃电诊断决策树模块并形成推理结果,所述诊断结果输出模块将推理结果保存至存储设备并输出至人机接口。
本发明还提供一种基于决策树算法的窃电诊断方法,包括以下步骤,
1)提取电网数据库的特征属性数据集合,形成训练集;
2)基于训练集构建决策树;
3)由决策树生成分类规则集,利用分类规则形成窃电诊断数据库;
4)输入用户的历史数据,进行窃电诊断。
在上述步骤(1)中,所述特征属性数据集合是一个从用户统计线损数据库、电压实时统计数据库、电流实时统计数据库中获取包含N个样本的样本集。
在上述步骤(2)中,决策树的构建采用ID3算法,其过程包括:
2.1)选取用户最大线损值、三相电压不平衡率、合同容量比、同期用电量比作为非分类类别属性;
2.2)计算分类类别的熵E0及非分类类别属性用户最大线损值的熵E1、三相电压不平衡率的熵E2、合同容量比的熵E3、同期用电量比的熵E4
2.3)从上述四个非分类类别属性中选择熵值最大且熵值大于E0的属性作为分类点,创建节点N;
2.4)重复步骤2.1)至步骤2.3)寻找下一个分类点;
2.5)若样本都在同一非分类类别,则该节点成为树叶,并用该非分类类别标记,否则使用基于熵的度量信息增益作为启发信息,选择将样本分裂的最优属性作为该节点的分裂属性;
2.6)对分裂属性的每一个值创建一个分枝,并根据分枝来划分样本;
2.7)重复步骤2.5)至步骤2.6)对每个节点运行决策树算法。
实施本发明基于决策树算法的窃电诊断系统及方法,具有以下有益效果:
本发明利用决策树算法,通过分析用户历史数据,检测出窃电用户。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1为本发明一种基于决策树算法的窃电诊断系统的示意图;
图2为本发明窃电诊断系统中决策树建树的流程示意图。
具体实施方式
为了对本发明的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本发明的具体实施方式。
如图1所示,本发明基于决策树算法的窃电诊断系统,包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,其特征在于,从电网数据库提取用户的历史数据,用户的历史数据传输到数据接口模块后进入窃电诊断决策树模块并形成推理结果,诊断结果输出模块将推理结果保存至存储设备并输出至人机接口。
如图2所示,本发明还提供一种基于决策树算法的窃电诊断方法,包括以下步骤,
1)提取电网数据库的特征属性数据集合,形成训练集,其中,特征属性数据集合是一个从用户统计线损数据库、电压实时统计数据库、电流实时统计数据库中获取包含N个样本的样本集。
2)基于训练集构建决策树,其中,决策树的构建采用ID3算法,其过程包括:
2.1)选取用户最大线损值、三相电压不平衡率、合同容量比、同期用电量比作为非分类类别属性,其中这4个非分类类别属性的取值参照下表:
非分类类别属性 取值
用户最大线损值(L) 统计线损值W1<L<统计线损值W2
三相电压不平衡率(U) 大(U1)、小(U2)
合同容量比(C) 大(C1)、小(C2)
功率因数(P) 稳定(P1)、突变(P2)
同期用电量比(E) 大(E1)、小(E2)
分类类别 窃电(S)、未窃电(N)
2.2)计算分类类别的熵E0及非分类类别属性用户最大线损值的熵E1、三相电压不平衡率的熵E2、合同容量比的熵E3、同期用电量比的熵E4
分类类别的熵E0
E 0 = - p S log 2 p S - p N log 2 p N ,
其中pS为窃电样本数量占总样本数量的比,pN为未窃电样本数量占总样本数量的比。
用户最大线损值的熵:设大于统计线损值的样本为W个,则小于统计线损值的样本为(N-W)个,取属性大于统计线损值的正例为A1个,反例为(W-A1)个,取属性小于统计线损值的正例为B1个,反例为(N-W-B1)个,用户最大线损值的熵E1
E 1 = W N ( - A 1 W log 2 A 1 / W - W - A 1 W log 2 W - A 1 / W ) + N - W N ( - B 1 N - W log 2 B 1 / W - N - W - B 1 N - W log 2 W - B 1 / W )
三相电压不平衡率的熵:设三相电压不平衡率取大的样本为X个,则三相电压不平衡率取小的样本为(N-X)个,取属性为大的正例为A2个,反例为(X-A2)个,取属性为小的正例为B2个,反例为(N-X-B2)个,三相电压不平衡率的熵E2
E 2 = X N ( - A 2 X log 2 A 2 / X - X - A 2 X log 2 X - A 2 / X ) + N - X N ( - B 2 N - X log 2 B 2 / X - N - X - B 2 N - X log 2 X - B 2 / X )
合同容量比的熵:设合同容量比取大的样本为Y个,则合同容量比取小的样本(N-Y)为个,取属性为大的正例为A3个,反例为(Y-A3)个,取属性为小的正例为B3个,反例为(N-Y-B3)个,合同容量比的熵E3
E 3 = Y N ( - A 3 Y log 2 A 3 / Y - Y - A 3 Y log 2 Y - A 3 / Y ) + N - Y N ( - B 3 N - Y log 2 B 3 / Y - N - Y - B 3 N - Y log 2 Y - B 3 / Y )
同期用电量比的熵:设同期用电量比取大的样本为Z个,则同期用电量比取小的样本为(N-Z)个,取属性为大的正例为A4个,反例为(Z-A4)个,取属性为小的正例为B4个,反例为(N-Z-B4)个,同期用电量比的熵E4
E 4 = Z N ( - A 4 Z log 2 A 4 / Z - Z - A 4 Z log 2 Z - A 4 / Z ) + N - Z N ( - B 4 N - Z log 2 B 4 / Z - N - Z - B 4 N - Z log 2 Z - B 4 / Z )
2.3)从上述四个非分类类别属性中选择熵值最大且熵值大于E0的属性作为分类点,创建节点N;
2.4)重复步骤2.1)至步骤2.3)寻找下一个分类点;
2.5)若样本都在同一非分类类别,则该节点成为树叶,并用该非分类类别标记,否则使用基于熵的度量信息增益作为启发信息,选择将样本分裂的最优属性作为该节点的分裂属性;
2.6)对分裂属性的每一个值创建一个分枝,并根据分枝来划分样本;
2.7)重复步骤2.5)至步骤2.6)对每个节点运行决策树算法。
3)由决策树生成分类规则集,利用分类规则形成窃电诊断数据库;
4)输入用户的历史数据,进行窃电诊断。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (4)

1.一种基于决策树算法的窃电诊断系统,包括数据接口模块、窃电诊断决策树模块、诊断结果输出模块、存储设备、人机接口,其特征在于,从电网数据库提取用户的历史数据,用户的历史数据传输到所述数据接口模块后进入窃电诊断决策树模块并形成推理结果,所述诊断结果输出模块将推理结果保存至存储设备并输出至人机接口。
2.一种基于决策树算法的窃电诊断方法,其特征在于,包括以下步骤,
1)提取电网数据库的特征属性数据集合,形成训练集;
2)基于训练集构建决策树;
3)由决策树生成分类规则集,利用分类规则形成窃电诊断数据库;
4)输入用户的历史数据,进行窃电诊断。
3.根据权利要求2所述基于决策树算法的窃电诊断方法,其特征在于,在所述步骤(1)中,所述特征属性数据集合是一个从用户统计线损数据库、电压实时统计数据库、电流实时统计数据库中获取包含N个样本的样本集。
4.根据权利要求2所述基于决策树算法的窃电诊断方法,其特征在于,在所述步骤(2)中,决策树的构建采用ID3算法,其过程包括:
2.1)选取用户最大线损值、三相电压不平衡率、合同容量比、同期用电量比作为非分类类别属性;
2.2)计算分类类别的熵E0及非分类类别属性用户最大线损值的熵E1、三相电压不平衡率的熵E2、合同容量比的熵E3、同期用电量比的熵E4
2.3)从上述四个非分类类别属性中选择熵值最大且熵值大于E0的属性作为分类点,创建节点N;
2.4)重复步骤2.1)至步骤2.3)寻找下一个分类点;
2.5)若样本都在同一非分类类别,则该节点成为树叶,并用该非分类类别标记,否则使用基于熵的度量信息增益作为启发信息,选择将样本分裂的最优属性作为该节点的分裂属性;
2.6)对分裂属性的每一个值创建一个分枝,并根据分枝来划分样本;
2.7)重复步骤2.5)至步骤2.6)对每个节点运行决策树算法。
CN201610807427.1A 2016-09-07 2016-09-07 基于决策树算法的窃电诊断系统及方法 Active CN106355209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610807427.1A CN106355209B (zh) 2016-09-07 2016-09-07 基于决策树算法的窃电诊断系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610807427.1A CN106355209B (zh) 2016-09-07 2016-09-07 基于决策树算法的窃电诊断系统及方法

Publications (2)

Publication Number Publication Date
CN106355209A true CN106355209A (zh) 2017-01-25
CN106355209B CN106355209B (zh) 2019-10-25

Family

ID=57858875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610807427.1A Active CN106355209B (zh) 2016-09-07 2016-09-07 基于决策树算法的窃电诊断系统及方法

Country Status (1)

Country Link
CN (1) CN106355209B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108733966A (zh) * 2017-04-14 2018-11-02 国网重庆市电力公司 一种基于决策树群的多维电能表现场状态检验方法
CN111062620A (zh) * 2019-12-19 2020-04-24 烟台海颐软件股份有限公司 基于混合计费数据的电力计费公平性智能分析系统及方法
CN111798107A (zh) * 2020-06-18 2020-10-20 国网河北省电力有限公司石家庄市栾城区供电分公司 一种应用ai智能诊断分析的新型反窃电系统及方法
CN108123920B (zh) * 2016-11-30 2020-12-29 中国科学院沈阳自动化研究所 基于窃电嫌疑程度的智能电网邻域网络恶意用户检测方法
CN113361943A (zh) * 2021-06-21 2021-09-07 广东电网有限责任公司 一种基于决策树规则生成的专变用户窃电检测方法及系统
CN114218522A (zh) * 2021-12-02 2022-03-22 清华大学 基于信息传递熵的台区用户贡献度测算方法及窃电排查方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537010A (zh) * 2014-12-17 2015-04-22 温州大学 基于决策树的网构软件中的构件分类方法
CN104951989A (zh) * 2014-03-26 2015-09-30 国家电网公司 一种窃电分析方法及系统
CN105139289A (zh) * 2015-09-06 2015-12-09 清华大学 一种基于错分代价分类学习的电网暂态电压稳定评估方法
CN105373877A (zh) * 2015-09-14 2016-03-02 江苏南瑞通驰自动化系统有限公司 一种用电趋势异常嫌疑分析及反窃电监控系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951989A (zh) * 2014-03-26 2015-09-30 国家电网公司 一种窃电分析方法及系统
CN104537010A (zh) * 2014-12-17 2015-04-22 温州大学 基于决策树的网构软件中的构件分类方法
CN105139289A (zh) * 2015-09-06 2015-12-09 清华大学 一种基于错分代价分类学习的电网暂态电压稳定评估方法
CN105373877A (zh) * 2015-09-14 2016-03-02 江苏南瑞通驰自动化系统有限公司 一种用电趋势异常嫌疑分析及反窃电监控系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡琛: "数据挖掘技术在电量管理与反窃电系统中的应用与研究", 《中国优秀硕士学位论文全文数据库 社会科学辑(经济政治与法律)》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108123920B (zh) * 2016-11-30 2020-12-29 中国科学院沈阳自动化研究所 基于窃电嫌疑程度的智能电网邻域网络恶意用户检测方法
CN108733966A (zh) * 2017-04-14 2018-11-02 国网重庆市电力公司 一种基于决策树群的多维电能表现场状态检验方法
CN111062620A (zh) * 2019-12-19 2020-04-24 烟台海颐软件股份有限公司 基于混合计费数据的电力计费公平性智能分析系统及方法
CN111062620B (zh) * 2019-12-19 2022-07-29 烟台海颐软件股份有限公司 基于混合计费数据的电力计费公平性智能分析系统及方法
CN111798107A (zh) * 2020-06-18 2020-10-20 国网河北省电力有限公司石家庄市栾城区供电分公司 一种应用ai智能诊断分析的新型反窃电系统及方法
CN113361943A (zh) * 2021-06-21 2021-09-07 广东电网有限责任公司 一种基于决策树规则生成的专变用户窃电检测方法及系统
CN114218522A (zh) * 2021-12-02 2022-03-22 清华大学 基于信息传递熵的台区用户贡献度测算方法及窃电排查方法
CN114218522B (zh) * 2021-12-02 2024-04-09 清华大学 基于信息传递熵的台区用户贡献度测算方法及窃电排查方法

Also Published As

Publication number Publication date
CN106355209B (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN106355209A (zh) 基于决策树算法的窃电诊断系统及方法
CN109501834B (zh) 一种道岔转辙机故障预测方法及装置
CN104463706B (zh) 一种用于电网检测电压暂降事件原因的方法和系统
CN108985632A (zh) 一种基于孤立森林算法的用电数据异常检测模型
CN110598726A (zh) 一种基于随机森林的输电杆塔鸟害风险预测方法
CN113011481B (zh) 一种基于决策树算法的电能表功能异常评估方法及系统
CN104793067B (zh) 用于风电场功率调节和电能质量的评估系统及其评估方法
CN103902591A (zh) 构建决策树分类器的方法及装置
CN108445861A (zh) 一种基于卷积神经网络算法的转辙机故障检测方法及系统
CN103544652A (zh) 电网行业分类负荷自动统计方法及系统
CN109800416A (zh) 一种电力设备名称识别方法
CN104036434A (zh) 一种配电网负荷供应能力评价方法
CN108448721A (zh) 电力系统主站监控信号与标准信号自动匹配的方法
CN107301499B (zh) 一种基于ami数据的配电馈线统计线损率数据清洗方法
CN106651168A (zh) 一种评估电铁对电网影响的方法及装置
CN104598713A (zh) 一种电网理论线损计算需求数据合成方法
CN105354761B (zh) 一种风电接入电网的安全与效能评估方法及系统
CN111898446A (zh) 基于多算法归一化分析的单相接地故障研判方法
CN107330576A (zh) 一种基于边界供电能力的配电网效率评价方法
CN116522138A (zh) 一种基于弱监督集成的多元时间序列异常检测方法及系统
CN111178679A (zh) 一种基于聚类算法和网络搜索的相位识别方法
CN106055730B (zh) 一种适应于大规模电网的电力系统碳流仿真分析方法
CN105710050A (zh) 电池单体分选方法
CN109670526A (zh) 一种电网的干扰源类型辨识方法、装置、设备及存储介质
CN105186494B (zh) 电力网络分析系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant