CN112183606A - 基于c4.5算法的电力系统故障识别分类方法及系统 - Google Patents

基于c4.5算法的电力系统故障识别分类方法及系统 Download PDF

Info

Publication number
CN112183606A
CN112183606A CN202011006725.3A CN202011006725A CN112183606A CN 112183606 A CN112183606 A CN 112183606A CN 202011006725 A CN202011006725 A CN 202011006725A CN 112183606 A CN112183606 A CN 112183606A
Authority
CN
China
Prior art keywords
data set
power system
algorithm
decision tree
training data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011006725.3A
Other languages
English (en)
Inventor
王振国
连众
贾飞
李东
李亚鑫
许文秀
郝茂亭
赵梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhai Electric Power Bureau Inner Mongolia Power Group Co ltd
Original Assignee
Wuhai Electric Power Bureau Inner Mongolia Power Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhai Electric Power Bureau Inner Mongolia Power Group Co ltd filed Critical Wuhai Electric Power Bureau Inner Mongolia Power Group Co ltd
Priority to CN202011006725.3A priority Critical patent/CN112183606A/zh
Publication of CN112183606A publication Critical patent/CN112183606A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了基于C4.5算法的电力系统故障识别分类方法及系统,属于数据分析技术领域。本发明的方法包括:S100、获取数据集;S200、从数据集中提取子集,并将子集作为训练数据集;S300、根据训练数据集并利用C4.5算法建立决策树;S400、根据决策树对数据集的数据进行分类得到分类结果。本发明的系统包括建树模块和分类模块,建树模块与分类模块连接,其中,建树模块用于根据数据集构建决策树。本发明克服了现有技术中,电力系统故障诊断速度较慢且准确性较低的不足,提供了基于C4.5算法的电力系统故障识别分类方法及系统,可以生成决策树并通过决策树对故障数据进行识别分类,从而可以实现对电力系统故障的快速诊断,进一步提高了对电力系统故障诊断的准确性。

Description

基于C4.5算法的电力系统故障识别分类方法及系统
技术领域
本发明属于数据分析技术领域,更具体地说,涉及基于C4.5算法的电力系统故障识别分类方法及系统。
背景技术
电力系统故障是指设备不能按照预期的指标进行工作的一种状态,也就是说设备未达到其应该达到的功能,其故障有以下几种:发电机组故障、输电线路故障、变电所故障、母线故障等。电力系统故障诊断就是通过测量和分析故障后电网中电流、电压等电气量以及保护和断路器动作的开关量变化信息,识别故障元件。良好的诊断策略对于缩短故障时间,防止事故扩大具有重要意义。
电力系统故障发生时,监控系统采集到的大量故障信息涌入调度中心,现有技术一般采用数据模型进行分析,例如发明创造名称为:基于随机森林模型的电力变压器故障诊断方法(申请日:2011年6月16日;申请号:2011101624441),该方案公开了一种基于随机森林模型的电力变压器故障诊断方法,采集变压器状态检修数据,利用变压器状态检修数据训练随机森林模型,并校验随机森林模型的灵敏度,以经训练校验后的随机森林模型来诊断变压器故障。本发明提供的方法适应能力强,具有良好的可解释性,利用k-means聚类方法,分离出了介于正常和故障之间的临界类,使系统获得了故障的早期预警能力。
基于数学模型的诊断方法已很大程度上不能保证诊断的准确性和快速性等要求,而相比较来说,基于智能技术的诊断方法具有明显的优势。智能方法能够模拟、延伸和扩展人类的智能行为,弥补数学模型诊断方法的不足,为电网故障诊断领域开辟了新途径。
综上所述,如何快速准确对电力系统故障进行诊断分类,是现有技术亟需解决的问题。
发明内容
1.要解决的问题
本发明克服了现有技术中,电力系统故障诊断速度较慢且准确性较低的不足,提供了基于C4.5算法的电力系统故障识别分类方法及系统,可以生成决策树并通过决策树对故障数据进行识别分类,从而可以实现对电力系统故障的快速诊断,进一步提高了对电力系统故障诊断的准确性。
2.技术方案
为了解决上述问题,本发明所采用的技术方案如下:
本发明的基于C4.5算法的电力系统故障识别分类方法,其特征在于,包括以下步骤:S100、获取数据集;S200、从数据集中提取子集,并将子集作为训练数据集;S300、根据训练数据集并利用C4.5算法建立决策树;S400、根据决策树对数据集的数据进行分类得到分类结果。
更进一步地,步骤S300和步骤S400之间还包括步骤:利用数据集中的数据对决策树进行测试。
更进一步地,建立决策树的具体过程为:S310、若训练数据集S中的样本不属于同一类,则从训练数据集S中抽取指标集A,其中,指标集A包括n个指标;S320、从指标集A中任意选取一个指标,并根据该指标计算得到训练数据集S的信息熵;S330、从指标集A中依次选取指标作为根节点,根据训练数据集S的信息熵计算根节点的信息增益比;S340、根据信息增益比选取最优划分特征生成节点;S350、将未生成节点的特征组成训练数据集S;循环步骤S310~S350,直至所有特征生成节点,再根据节点生成决策树。
更进一步地,若测试过程中有错误分类,则执行步骤S300重新建立决策树。
更进一步地,步骤S310中若训练数据集S中的样本属于同一类,则根据训练数据集S中的样本生成节点。
更进一步地,步骤S320中计算得到训练数据集S的信息熵的具体过程为:从指标集A中任意选取一个指标C,C={C1,C2,…,Cm};设定Ci在训练数据集S的所有样本中出现的频率为pi(i=1,2,3,…m),则该训练数据集S的信息熵为:
Figure BDA0002696176420000021
更进一步地,步骤S330中计算根节点的信息增益比的具体过程为:令选取的指标为B,将指标B作为根节点,先根据指标B对训练数据集S进行划分得到样本子集,再利用下列公式计算根节点的信息增益比GainRatio(S,B):
Figure BDA0002696176420000022
Figure BDA0002696176420000023
其中,EntropyB(S)为样本子集的信息熵,|Si|为样本子集中包含的样本数,|S|为训练数据集S中包含的样本数。
更进一步地,将指标各自对应的信息增益比进行比较,选取最大信息增益比对应的指标作为最优划分特征。
本发明的基于C4.5算法的电力系故障识别分类系统,采用上述的基于C4.5算法的电力系统故障识别分类方法,包括建树模块,该建树模块用于根据数据集构建决策树;分类模块,该分类模块与建树模块连接,该分类模块利用决策树对数据集的数据进行分类得到分类结果。
更进一步地,建树模块包括数据模块和计算模块,数据模块与计算模块连接;其中,数据模块用于获取数据集,计算模块用于根据数据集构建决策树。
3.有益效果
相比于现有技术,本发明的有益效果为:
(1)本发明的基于C4.5算法的电力系统故障识别分类方法,通过采用决策树C4.5算法,对电力系统故障数据处理得到信息熵和信息增益比,基于信息增益比选取节点生成决策树,使得决策树的分类规则更易于理解,从而可以实现对电力系统故障的快速识别诊断,进一步提高了对电力系统故障识别分类的准确性。
(2)本发明的基于C4.5算法的电力系故障识别分类系统,通过设置建树模块和分类模块,从而可以基于决策树C4.5算法并根据电力系统故障数据构建决策树,从而可以实现对电力系统故障数据的快速、准确地分类;进一步通过设置交互模块,从而便于工作人员实时对故障数据进行分类并得到分类结果,大大提高了工作效率。
附图说明
图1为本发明方法的流程示意图;
图2为本发明系统的结构示意图。
标号说明:100、建树模块;110、数据模块;120、计算模块;200、分类模块;300、交互模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例;而且,各个实施例之间不是相对独立的,根据需要可以相互组合,从而达到更优的效果。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为进一步了解本发明的内容,结合附图和实施例对本发明作详细描述。
实施例1
如图1所示,本发明的基于C4.5算法的电力系统故障识别分类方法,包括以下步骤:
1)获取数据
步骤S100:获取数据集;具体地,该数据集为电力系统故障数据的集合。
2)提取子集
步骤S200:从数据集中提取子集,并将子集作为训练数据集;值得说明的是,提取子集作为训练数据集,从而可以避免数据量过大不容易收敛的问题。
3)建立决策树
步骤S300:根据训练数据集并利用C4.5算法建立决策树;具体过程如下:
S310、若训练数据集S中的样本不属于同一类,则从训练数据集S中抽取指标集A,其中,指标集A包括n个指标,A={A1,A2,…,An}。值得说明的是,若训练数据集S中的样本属于同一类,则根据训练数据集S中的样本生成节点,之后根据节点生成决策树。
S320、从指标集A中任意选取一个指标,并根据该指标计算得到训练数据集S的信息熵;具体地,从指标集A中任意选取一个指标C,C={C1,C2,…,Cm};设定Ci在训练数据集S的所有样本中出现的频率为pi(i=1,2,3,…m),则该训练数据集S的信息熵Entropy(S)为:
Figure BDA0002696176420000041
值得说明的是,通过计算信息熵可以反映数据分布的混乱度,从而可以适用于高维数据的分类。
S330、从指标集A中依次选取指标作为根节点,根据训练数据集S的信息熵计算根节点的信息增益比,即每个指标对应一个信息增益比,具体地,令选取的指标为B,将指标B作为根节点,先根据指标B对训练数据集S进行划分得到样本子集,再利用下列公式计算根节点的信息增益比GainRatio(S,B):
Figure BDA0002696176420000042
Figure BDA0002696176420000043
其中,EntropyB(S)为样本子集的信息熵,|Si|为样本子集中包含的样本数,|S|为训练数据集S中包含的样本数。值得说明的是,信息增益比越大说明样本子集的同类性更高,更有利于分类。
S340、根据信息增益比选取最优划分特征生成节点;具体地,将指标各自对应的信息增益比进行比较,选取最大信息增益比对应的指标作为最优划分特征。值得说明的是,通过信息增益比选取节点可以使得生成的决策树具有较好的分类效果。
S350、将未生成节点的特征组成训练数据集S;
循环步骤S310~S350,直至所有特征生成节点,再根据节点生成决策树。
4)数据测试
利用数据集中的数据对决策树进行测试;若测试过程中有错误分类,则执行步骤S300重新建立决策树。
5)数据分类
步骤S400:根据决策树对数据集的数据进行分类得到分类结果。
本发明的基于C4.5算法的电力系统故障识别分类方法,通过采用决策树C4.5算法,对电力系统故障数据处理得到信息熵和信息增益比,基于信息增益比选取节点生成决策树,使得决策树的分类规则更易于理解,从而可以实现对电力系统故障的快速识别诊断,进一步提高了对电力系统故障识别分类的准确性。
结合图2所示,本发明的基于C4.5算法的电力系故障识别分类系统,采用上述的基于C4.5算法的电力系统故障识别分类方法,包括建树模块100、分类模块200和交互模块300,建树模块100用于根据数据集构建决策树;具体地,建树模块100包括数据模块110和计算模块120,数据模块110与计算模块120连接;其中,数据模块110用于获取数据集,计算模块120用于根据数据集构建决策树,具体地,计算模块120根据数据集计算信息熵和信息增益比,再根据信息增益比选取节点生成决策树。
进一步地,分类模块200与建树模块100连接,该分类模块200利用决策树对数据集的数据进行分类得到分类结果。此外,建树模块100与分类模块200分别与交互模块300连接,该交互模块300用于数据可视化展示,包括web配置和应用程序配置,从而可以便于工作人员获取电力系统故障数据。
本发明的基于C4.5算法的电力系故障识别分类系统,通过设置建树模块100和分类模块200,从而可以基于决策树C4.5算法并根据电力系统故障数据构建决策树,从而可以实现对电力系统故障数据的快速、准确地分类;进一步通过设置交互模块300,从而便于工作人员实时对故障数据进行分类并得到分类结果,大大提高了工作效率。
在上文中结合具体的示例性实施例详细描述了本发明。但是,应当理解,可在不脱离由所附权利要求限定的本发明的范围的情况下进行各种修改和变型。详细的描述和附图应仅被认为是说明性的,而不是限制性的,如果存在任何这样的修改和变型,那么它们都将落入在此描述的本发明的范围内。此外,背景技术旨在为了说明本技术的研发现状和意义,并不旨在限制本发明或本申请和本发明的应用领域。

Claims (10)

1.基于C4.5算法的电力系统故障识别分类方法,其特征在于,包括以下步骤:
S100、获取数据集;
S200、从数据集中提取子集,并将子集作为训练数据集;
S300、根据训练数据集并利用C4.5算法建立决策树;
S400、根据决策树对数据集的数据进行分类得到分类结果。
2.根据权利要求1所述的基于C4.5算法的电力系统故障识别分类方法,其特征在于,步骤S300和步骤S400之间还包括步骤:利用数据集中的数据对决策树进行测试。
3.根据权利要求1所述的基于C4.5算法的电力系统故障识别分类方法,其特征在于,建立决策树的具体过程为:
S310、若训练数据集S中的样本不属于同一类,则从训练数据集S中抽取指标集A,其中,指标集A包括n个指标;
S320、从指标集A中任意选取一个指标,并根据该指标计算得到训练数据集S的信息熵;
S330、从指标集A中依次选取指标作为根节点,根据训练数据集S的信息熵计算根节点的信息增益比;
S340、根据信息增益比选取最优划分特征生成节点;
S350、将未生成节点的特征组成训练数据集S;
循环步骤S310~S350,直至所有特征生成节点,再根据节点生成决策树。
4.根据权利要求2所述的基于C4.5算法的电力系统故障识别分类方法,其特征在于,若测试过程中有错误分类,则执行步骤S300重新建立决策树。
5.根据权利要求3所述的基于C4.5算法的电力系统故障识别分类方法,其特征在于,步骤S310中若训练数据集S中的样本属于同一类,则根据训练数据集S中的样本生成节点。
6.根据权利要求3所述的基于C4.5算法的电力系统故障识别分类方法,其特征在于,步骤S320中计算得到训练数据集S的信息熵的具体过程为:
从指标集A中任意选取一个指标C,C={C1,C2,…,Cm};设定Ci在训练数据集S的所有样本中出现的频率为pi(i=1,2,3,…m),则该训练数据集S的信息熵为:
Figure FDA0002696176410000011
7.根据权利要求6所述的基于C4.5算法的电力系统故障识别分类方法,其特征在于,步骤S330中计算根节点的信息增益比的具体过程为:
令选取的指标为B,将指标B作为根节点,先根据指标B对训练数据集S进行划分得到样本子集,再利用下列公式计算根节点的信息增益比GainRatio(S,B):
Figure FDA0002696176410000021
Figure FDA0002696176410000022
其中,EntropyB(S)为样本子集的信息熵,|Si|为样本子集中包含的样本数,|S|为训练数据集S中包含的样本数。
8.根据权利要求6或7所述的基于C4.5算法的电力系统故障识别分类方法,其特征在于,将指标各自对应的信息增益比进行比较,选取信息最大增益比对应的指标作为最优划分特征。
9.基于C4.5算法的电力系故障识别分类系统,其特征在于,采用权利要求1~8任意一项所述的基于C4.5算法的电力系统故障识别分类方法,包括
建树模块,该建树模块用于根据数据集构建决策树;
分类模块,该分类模块与建树模块连接,该分类模块利用决策树对数据集的数据进行分类得到分类结果。
10.根据权利要求9所述的基于C4.5算法的电力系故障识别分类系统,其特征在于,所述建树模块包括数据模块和计算模块,所述数据模块与计算模块连接;其中,数据模块用于获取数据集,计算模块用于根据数据集构建决策树。
CN202011006725.3A 2020-09-23 2020-09-23 基于c4.5算法的电力系统故障识别分类方法及系统 Pending CN112183606A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011006725.3A CN112183606A (zh) 2020-09-23 2020-09-23 基于c4.5算法的电力系统故障识别分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011006725.3A CN112183606A (zh) 2020-09-23 2020-09-23 基于c4.5算法的电力系统故障识别分类方法及系统

Publications (1)

Publication Number Publication Date
CN112183606A true CN112183606A (zh) 2021-01-05

Family

ID=73956238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011006725.3A Pending CN112183606A (zh) 2020-09-23 2020-09-23 基于c4.5算法的电力系统故障识别分类方法及系统

Country Status (1)

Country Link
CN (1) CN112183606A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113011481A (zh) * 2021-03-10 2021-06-22 广东电网有限责任公司计量中心 一种基于决策树算法的电能表功能异常评估方法及系统
CN113029619A (zh) * 2021-02-24 2021-06-25 北京科技大学 基于c4.5决策树算法的地下铲运机故障诊断方法
CN117150393A (zh) * 2023-10-26 2023-12-01 国网经济技术研究院有限公司 一种基于决策树的电力系统薄弱支路辨识方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018014610A1 (zh) * 2016-07-20 2018-01-25 武汉斗鱼网络科技有限公司 基于c4.5决策树算法的特定用户挖掘系统及其方法
WO2018045689A1 (zh) * 2016-09-07 2018-03-15 江南大学 光伏二极管箝位型三电平逆变器的决策树svm故障诊断方法
CN110796331A (zh) * 2019-09-11 2020-02-14 国网浙江省电力有限公司杭州供电公司 基于c4.5决策树算法的电力业务协同分类方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018014610A1 (zh) * 2016-07-20 2018-01-25 武汉斗鱼网络科技有限公司 基于c4.5决策树算法的特定用户挖掘系统及其方法
WO2018045689A1 (zh) * 2016-09-07 2018-03-15 江南大学 光伏二极管箝位型三电平逆变器的决策树svm故障诊断方法
CN110796331A (zh) * 2019-09-11 2020-02-14 国网浙江省电力有限公司杭州供电公司 基于c4.5决策树算法的电力业务协同分类方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋玉琴 等: "基于优化随机森林算法的高压断路器故障诊断", 《电子测量技术》, vol. 41, no. 21, pages 95 - 98 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113029619A (zh) * 2021-02-24 2021-06-25 北京科技大学 基于c4.5决策树算法的地下铲运机故障诊断方法
CN113011481A (zh) * 2021-03-10 2021-06-22 广东电网有限责任公司计量中心 一种基于决策树算法的电能表功能异常评估方法及系统
CN113011481B (zh) * 2021-03-10 2024-04-30 广东电网有限责任公司计量中心 一种基于决策树算法的电能表功能异常评估方法及系统
CN117150393A (zh) * 2023-10-26 2023-12-01 国网经济技术研究院有限公司 一种基于决策树的电力系统薄弱支路辨识方法及系统
CN117150393B (zh) * 2023-10-26 2024-01-05 国网经济技术研究院有限公司 一种基于决策树的电力系统薄弱支路辨识方法及系统

Similar Documents

Publication Publication Date Title
CN112183606A (zh) 基于c4.5算法的电力系统故障识别分类方法及系统
CN112505549B (zh) 基于孤立森林算法的新能源汽车电池异常检测方法
CN108832619A (zh) 基于卷积神经网络的电力系统暂态稳定评估方法
CN108732528A (zh) 一种基于深度置信网络的数字化电能表故障诊断方法
CN108733966A (zh) 一种基于决策树群的多维电能表现场状态检验方法
CN107085164A (zh) 一种电网故障类型确定方法及装置
CN104617574A (zh) 一种电力系统负荷区域暂态电压稳定的评估方法
CN107422266A (zh) 一种大容量电池储能系统的故障诊断方法及装置
CN111553495A (zh) 一种基于概率神经网络的小型断路器故障分析方法
CN109858140A (zh) 一种基于信息熵离散型贝叶斯网络冷水机组故障诊断方法
CN111273125A (zh) 基于rst-cnn的电力电缆沟道故障诊断方法
CN106768933A (zh) 一种基于遗传算法的风电机组叶片故障诊断方法
CN115733730A (zh) 一种基于图神经网络的电网故障检测方法及装置
CN115187013A (zh) 一种锂电池性能评分计算方法及系统
CN111814284A (zh) 基于相关性检测与改进随机森林的在线电压稳定评估方法
CN116087647A (zh) 基于pca和麻雀算法优化随机森林的建筑电气故障诊断方法
CN112149731A (zh) 基于id3算法的电力系统故障分类方法及系统
CN104951654A (zh) 基于控制变量抽样的大规模风电场可靠性评估方法
CN111965442A (zh) 一种数字孪生环境下的能源互联网故障诊断方法及装置
CN111239484A (zh) 一种非居民用户非侵入式负荷用电信息采集方法
CN115660421A (zh) 一种新能源电力系统的风险早期预警分类方法
CN115586402A (zh) 配电网故障诊断与处理方法
CN110309492B (zh) 基于扩散图数据降维技术的风力发电机组健康度评估方法
CN114548209A (zh) 一种基于潮流指纹图谱的电网强关联故障分析系统及方法
Hassani et al. A comparative assessment of dimensionality reduction techniques for diagnosing faults in smart grids

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination