CN110569867A - 基于决策树算法的输电线路故障原因判别方法、介质及设备 - Google Patents
基于决策树算法的输电线路故障原因判别方法、介质及设备 Download PDFInfo
- Publication number
- CN110569867A CN110569867A CN201910636302.0A CN201910636302A CN110569867A CN 110569867 A CN110569867 A CN 110569867A CN 201910636302 A CN201910636302 A CN 201910636302A CN 110569867 A CN110569867 A CN 110569867A
- Authority
- CN
- China
- Prior art keywords
- decision tree
- transmission line
- node
- judging
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003066 decision tree Methods 0.000 title claims abstract description 77
- 230000005540 biological transmission Effects 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 32
- 238000013138 pruning Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 23
- 230000011218 segmentation Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 10
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 8
- 230000005611 electricity Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000012423 maintenance Methods 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000012937 correction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013024 troubleshooting Methods 0.000 description 2
- 208000025274 Lightning injury Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001808 coupling effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本公开提供了一种基于决策树算法的输电线路故障原因判别方法、介质及设备,本公开在自动诊断基础上引入专家支持和人工干预对诊断结论进行核实及确认,实现线路故障诊断自动化和故障诊断全过程的可视化,从而减少运维工作人员工作量,解决了输电线路故障时人工判别故障原因的局限性以及数据样本少导致的人工智能应用不充分的问题。
Description
技术领域
本公开属于电力系统故障诊断技术领域,涉及一种基于决策树算法的输电线路故障原因判别方法、介质及设备。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
输电线路故障类型识别对电力系统故障分析、故障定位以及继电保护有着重要的意义。目前,输电线路常见的故障类型主要包括雷击、覆冰、外力破坏、污闪等。电力物联网技术的发展提高了电网各个环节信息感知的深度和广度,数据多源且异构。传统的线路故障排查主要以人工巡视确定方式为主,跳闸发生时信息分散且无法及时汇总,大量的告警信息或异常信息难以确定是何种因素或多方面因素耦合效应引起的事故,仅凭运行人员的经验进行故障诊断,其快速性和正确性有所局限。
近年来,将人工智能算法应用于输电线路故障识别中成为了国内外研究人员的研究热点,通过机器学习可自主训练出故障识别的模型。但由于故障样本很少,反映故障发生过程数据变化的样本更少,很难利用少量样本训练深度学习模型,制约了人工智能技术在输电线路设备状态评价和故障诊断中的应用。
发明内容
本公开为了解决上述问题,提出了一种基于决策树算法的输电线路故障原因判别方法、介质及设备,本公开在自动诊断基础上引入专家支持和人工干预对诊断结论进行核实及确认,实现线路故障诊断自动化和故障诊断全过程的可视化,从而减少运维工作人员工作量,解决了输电线路故障时人工判别故障原因的局限性以及数据样本少导致的人工智能应用不充分的问题。
根据一些实施例,本公开采用如下技术方案:
一种基于决策树算法的输电线路故障原因判别方法,包括以下步骤:
(1)获取输电线路的用电数据,构建训练集和测试集,确定异常分析决策树的判定属性类别与特征属性,树以单个节点为根;
(2)对特征属性进行初步处理,使连续特征属性分段计算其信息增益,将连续特征属性离散化,在不同分类下,根据数量的聚集情况,取若干最佳分割点;
(3)以信息增益率的熵度量作为特征属性的启发信息,计算连续属性与离散属性的信息增益率;
(4)选择信息增益率最大的特征属性作为样本分类的特征属性,该特征属性成为节点的判定属性,对判定属性的每个已知的值创建一个分支,并据此将训练集进行分类;
(5)判断决策树是否满足停止生长条件,如果不满足则返回步骤(1),递归自上而下地形成每个归类上的样本决策树分枝,一旦一个属性出现在一个节点上,则该节点的子节点则消除这一特征属性,直至所有节点满足停止生长条件;
(6)对完全生长的决策树基于代价复杂性剪枝算法进行剪枝优化,依次剪去表面误差率增益值最低的子树;
(7)产生被剪枝的树后,使用测试集评估该决策树的准确率,若仍然有较多噪声数据存在,则返回步骤(6),最终获得到满足模型评估需求的一组剪枝决策树;
(8)利用该枝决策树对输电线路采集的用电数据进行处理,得到输电线路故障原因。
作为进一步的限定,输电线路的用电数据来自用电信息采集系统,包括历史运维数据、设备台账数据和告警信息。
作为进一步的限定,在训练集中的异常运行与正常运行电能表的数量分别为p和n,以线路不同电压等级分类A作为决策树的根,假设子集Hi中含有Pi个故障输电线路和Ni个无故障的输电线路,计算子集Hi的信息熵,以属性A为根分类的信息熵,得到以A为根的信息增益以及信息增益率,遍历所有特征属性的信息增益率,选择使信息增益率最大的特征属性作为根节点,对根节点的不同取值对应的子集递归调用上述过程,生成决策树的子节点。
作为进一步的限定,对于特征属性的处理过程包括分割,计算相应的息增益率,采取分段多分裂点进行分割,选取若干最佳分裂点。
作为进一步的限定,基于信息增益率检验所有的特征属性,选择信息增益率最大的特征属性产生决策树节点,由该树节点的不同取值建立树分枝,对各分枝的训练子集递归,建立决策树的各节点与分枝,直到满足决策树生成停止条件。
作为进一步的限定,采用复杂性剪枝算法,对完全生长的决策树进行剪枝处理,通过删除节点的分枝,逐步剪去不可靠分枝。
作为进一步的限定,对通过特征属性分割策略生成的完全生长的决策树,计算树中的每一个子树的表面误差率增益值,选取表面误差率增益值最小的子树,将其生成的分支进行剪枝优化,当多个子树的表面误差率增益值同时达到最小时,取子树生长的叶子节点数最大的进行剪枝,直到达到模型的评估需求为止。
作为进一步的限定,判断决策树的停止生长条件包括:
定节点的所有训练样本子集属于同一类;
没有剩余特征属性对训练样本子集进一步分类,则将该节点作为叶节点,并用训练样本子集中最多的类判为该叶节点的类。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种基于决策树算法的输电线路故障原因判别方法。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种基于决策树算法的输电线路故障原因判别方法。
与现有技术相比,本公开的有益效果为:
本公开利用决策树算法良好的分类效果,实现输电线路故障原因的识别,提高缺陷判别效率,降低了诊断算法的复杂性。
本公开基于决策树算法,建立输电线路缺陷原因判别知识库,修正由于样本信息不完全造成的知识偏差,在自动诊断基础上引入专家支持和人工干预对诊断结论进行核实及确认,实现线路故障诊断自动化和故障诊断全过程的可视化,从而减少运维工作人员工作量。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
图1是本公开的系统流程图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,一种基于决策树算法的输电线路故障原因判别方法,包括建立的决策树异常诊断模型的具体过程,在每次特征属性分割选择时,采取贪心算法,即每次选择分类时,只考虑当前利益最大化,并以递归法自顶而下的生成决策树,本实施例采取的决策树异常诊断模型主要针对输电线路故障类别进行诊断,具体步骤如下所示:
(1)确定异常分析决策树的判定属性类别与特征属性,树以单个节点为根开始;
(2)对特征属性进行初步处理,使连续特征属性分段计算其信息增益,取n处最大值作为其最佳分割点,从而将连续特征属性离散化,在不同分类下,根据数量的聚集情况,取若干处最佳分割点;
(3)以信息增益率的熵度量作为特征属性的启发信息,计算连续属性与离散属性的信息增益率;
(4)选择信息增益率最大的特征属性作为样本分类的特征属性,该特征属性成为节点的判定属性,对判定属性的每个已知的值创建一个分支,并据此将训练集进行分类;
(5)判断决策树是否满足以下停止生长条件
①判定节点的所有训练样本子集属于同一类;
②没有剩余特征属性对训练样本子集进一步分类,则将该节点作为叶节点,并用训练样本子集中最多的类判为该叶节点的类;
若判定节点不满足上述任意条件,则算法返回(1),递归自上而下地形成每个归类上的样本决策树分枝,一旦一个属性出现在一个节点上,则该节点的子节点则消除这一特征属性,直至所有节点满满足以上停止生长条件;
(6)对完全生长的决策树基于代价复杂性剪枝算法进行剪枝优化,依次剪去表面误差率增益值最低的子树;
(7)产生被剪枝的树后,使用一个独立的测试集评估该决策树的准确率,若仍然有较多噪声数据存在,则返回步骤(6),最终获得到满足模型评估需求的一组剪枝决策树。
具体的,决策树群异常诊断模型构建的关键是结点分裂问题,即选取合适的特征属性将数据集进行分类。针对用电信息采集系统所提供的用电数据,其涉及的特征属性中含有大量的连续特征,故采用信息增益率来选择分割特征。假设在训练集中的异常运行与正常运行电能表的数量分别为p和n,通常一棵决策树能对一类异常状况做出类别分类所需的信息量为:
如以线路不同电压等级分类A作为决策树的根,A具有V个值(v1,v2,…,vv),由此将训练集分为v个子集(H1,H2,…,Hv),假设子集Hi中含有Pi个故障输电线路和Ni个无故障的输电线路,子集Hi的信息熵E(Hi)为:
以属性A为根分类的信息熵为:
故以A为根的信息增益为:
Gain(A)=I(p,n)-E(A) (4)
信息增益率为:
其中,分割信息率Split(A)为:
决策树如上所述遍历所有特征属性的信息增益率,选择使Gain-Ratio(A)最大的特征属性作为根节点,对根节点的不同取值对应的子集递归调用上述过程,生成决策树的子节点。
以连续特征属性投运年数和离散特征属性天气为例,采取如下流程实现特征属性分割:
(1)计算连续特征投运年数的信息增益率,对于较大数值区间的连续特征属性,本实施例采取分段多分裂点计算其信息增益并作为其信息增益,同理分割信息率,进而获得其信息增益率,由于本例取部分较少数值,故仅取一个最佳分裂点。
①对投运年数的取值进行排序,如表1所示;
表1投运年数部分排序
②投运年数对应的正常与故障类型之间的中点作为可能的分裂点(即13和14.5),以此将数据集分成四部分,计算每个可能的分裂点的信息增益;
③如表1所示,本表所呈现的最佳分裂点为14.5,计算参见式(1)~式(5),以13为分裂点的信息增益为0.41,以14.5分裂点的信息增益为0.55;
④对每个分裂点的信息增益进行修正,即减去其中N为可能的分裂点个数即为2,|D|是数据集大小即为6,故修正值为-3.6,由于两个分裂点修正值相等,故以13为分裂点的修正信息增益为3.01,以14.5分裂点的修正信息增益为3.05;
⑤通过比较可得,投运年数的最佳分裂点为14.5,计算最佳分裂点的信息增益率作为投运年数的信息增益率,其中,按照公式(5)所示,分割信息率为0.89,故连续特征属性投运年数的信息增益率为3.4。
(2)计算离散特征天气
如上表所示,由式(1)~式(5)可得,天气分类信息量为0.89,信息熵为0,信息增益为0.89,分割信息率为0,故此时获得的信息增益率正无穷;
(3)将连续特征属性同离散特征计算所得的信息增益率相比较,选择信息增益率最大的特征作为分裂特征,由上述数值比较选择天气作为根节点。
构建决策树模型首先基于信息增益率检验所有的特征属性,选择信息增益率最大的特征属性产生决策树节点,由该树节点的不同取值建立树分枝,对各分枝的训练子集递归调用上述算法,用该方法建立决策树的各节点与分枝,直到满足决策树生成停止条件。
决策树生成后,由于采集数据中存在噪声以及输电线路运维的特殊情况,所建立的决策树的许多分枝反映的是训练集中的异常。采用复杂性剪枝算法,对完全生长的决策树进行剪枝处理,通过删除节点的分枝,逐步剪去不可靠分枝,由此可实现较快分类,提高决策树正确筛选的能力。
对通过特征属性分割策略生成的完全生长的决策树,计算树中的每一个子树Tt的表面误差率增益值α。
式中|NTt|是子树生长的叶子节点数,R(t)是叶子节点t的误差代价,其值如下:
R(t)=r(t)p(t) (8)
r(t)是叶子节点t的误差率,p(t)是叶子节点t归类的数据占所有数据的比例,R(Tt)是子树Tt的误差代价,其值为子树Tt所包含的所有叶子节点的误差代价之和。
选取α值最小的子树,将其生成的分支进行剪枝优化,当多个子树的α值同时达到最小时,取|NTt|最大的进行剪枝,直到达到模型的评估需求为止。
根据特征属性分割策略计算,将决策属性分类定义如下:
(1)决策c1为雷击故障;
(2)决策c2为正常。
按照式(7)~式(8)所示,计算各枝节点的表面误差率增益值,对本决策分支的a4枝节点的表面误差率增益值α最小,故剪枝优化时首先令a4左右孩子为0,根据实际样本数据,所建立的决策树相对于训练数据而言过渡拟合,不切合实际数据,故通过剪枝优化策略可减少过拟合现象。
相应的,提供一种存储介质或终端设备,以运行上述过程。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
Claims (10)
1.一种基于决策树算法的输电线路故障原因判别方法,其特征是:包括以下步骤:
(1)获取输电线路的用电数据,构建训练集和测试集,确定异常分析决策树的判定属性类别与特征属性,树以单个节点为根;
(2)对特征属性进行初步处理,使连续特征属性分段计算其信息增益,将连续特征属性离散化,在不同分类下,根据数量的聚集情况,取若干最佳分割点;
(3)以信息增益率的熵度量作为特征属性的启发信息,计算连续属性与离散属性的信息增益率;
(4)选择信息增益率最大的特征属性作为样本分类的特征属性,该特征属性成为节点的判定属性,对判定属性的每个已知的值创建一个分支,并据此将训练集进行分类;
(5)判断决策树是否满足停止生长条件,如果不满足则返回步骤(1),递归自上而下地形成每个归类上的样本决策树分枝,一旦一个属性出现在一个节点上,则该节点的子节点则消除这一特征属性,直至所有节点满足停止生长条件;
(6)对完全生长的决策树基于代价复杂性剪枝算法进行剪枝优化,依次剪去表面误差率增益值最低的子树;
(7)产生被剪枝的树后,使用测试集评估该决策树的准确率,若仍然有较多噪声数据存在,则返回步骤(6),最终获得到满足模型评估需求的一组剪枝决策树;
(8)利用该枝决策树对输电线路采集的用电数据进行处理,得到输电线路故障原因。
2.如权利要求1所述的一种基于决策树算法的输电线路故障原因判别方法,其特征是:输电线路的用电数据来自用电信息采集系统,包括历史运维数据、设备台账数据和告警信息。
3.如权利要求1所述的一种基于决策树算法的输电线路故障原因判别方法,其特征是:在训练集中的异常运行与正常运行电能表的数量分别为p和n,以线路不同电压等级分类A作为决策树的根,假设子集Hi中含有Pi个故障输电线路和Ni个无故障的输电线路,计算子集Hi的信息熵,以属性A为根分类的信息熵,得到以A为根的信息增益以及信息增益率,遍历所有特征属性的信息增益率,选择使信息增益率最大的特征属性作为根节点,对根节点的不同取值对应的子集递归调用上述过程,生成决策树的子节点。
4.如权利要求1所述的一种基于决策树算法的输电线路故障原因判别方法,其特征是:对于特征属性的处理过程包括分割,计算相应的息增益率,采取分段多分裂点进行分割,选取若干最佳分裂点。
5.如权利要求1所述的一种基于决策树算法的输电线路故障原因判别方法,其特征是:基于信息增益率检验所有的特征属性,选择信息增益率最大的特征属性产生决策树节点,由该树节点的不同取值建立树分枝,对各分枝的训练子集递归,建立决策树的各节点与分枝,直到满足决策树生成停止条件。
6.如权利要求1所述的一种基于决策树算法的输电线路故障原因判别方法,其特征是:采用复杂性剪枝算法,对完全生长的决策树进行剪枝处理,通过删除节点的分枝,逐步剪去不可靠分枝。
7.如权利要求1所述的一种基于决策树算法的输电线路故障原因判别方法,其特征是:对通过特征属性分割策略生成的完全生长的决策树,计算树中的每一个子树的表面误差率增益值,选取表面误差率增益值最小的子树,将其生成的分支进行剪枝优化,当多个子树的表面误差率增益值同时达到最小时,取子树生长的叶子节点数最大的进行剪枝,直到达到模型的评估需求为止。
8.如权利要求1所述的一种基于决策树算法的输电线路故障原因判别方法,其特征是:判断决策树的停止生长条件包括:
定节点的所有训练样本子集属于同一类;
没有剩余特征属性对训练样本子集进一步分类,则将该节点作为叶节点,并用训练样本子集中最多的类判为该叶节点的类。
9.一种计算机可读存储介质,其特征是:其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行权利要求1-8中任一项所述的一种基于决策树算法的输电线路故障原因判别方法。
10.一种终端设备,其特征是:包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行权利要求1-8中任一项所述的一种基于决策树算法的输电线路故障原因判别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910636302.0A CN110569867A (zh) | 2019-07-15 | 2019-07-15 | 基于决策树算法的输电线路故障原因判别方法、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910636302.0A CN110569867A (zh) | 2019-07-15 | 2019-07-15 | 基于决策树算法的输电线路故障原因判别方法、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110569867A true CN110569867A (zh) | 2019-12-13 |
Family
ID=68773059
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910636302.0A Pending CN110569867A (zh) | 2019-07-15 | 2019-07-15 | 基于决策树算法的输电线路故障原因判别方法、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110569867A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111191946A (zh) * | 2020-01-02 | 2020-05-22 | 国网北京市电力公司 | 故障线路识别方法及装置、电子设备 |
CN111476471A (zh) * | 2020-03-30 | 2020-07-31 | 北京四方继保工程技术有限公司 | 一种基于综合能源模型的综合能源故障诊断系统及方法 |
CN111562111A (zh) * | 2020-06-05 | 2020-08-21 | 上海交通大学 | 发动机冷态测试故障诊断方法 |
CN111612149A (zh) * | 2020-05-21 | 2020-09-01 | 国网湖南省电力有限公司 | 一种基于决策树的主网线路状态检测方法、系统及介质 |
CN111626418A (zh) * | 2020-05-27 | 2020-09-04 | 中南大学 | 基于平衡二叉树的集成剪枝策略 |
CN111783904A (zh) * | 2020-09-04 | 2020-10-16 | 平安国际智慧城市科技股份有限公司 | 基于环境数据的数据异常分析方法、装置、设备及介质 |
CN112132221A (zh) * | 2020-09-25 | 2020-12-25 | 海南电网有限责任公司 | 一种基于规则学习的电网事故智能识别的方法 |
CN112308436A (zh) * | 2020-11-04 | 2021-02-02 | 国网江苏省电力有限公司扬州市江都区供电分公司 | 一种配电网评估诊断分析方法、装置、设备及存储介质 |
CN112330095A (zh) * | 2020-10-09 | 2021-02-05 | 中车青岛四方机车车辆股份有限公司 | 一种基于决策树算法的质量管理方法 |
CN113011481A (zh) * | 2021-03-10 | 2021-06-22 | 广东电网有限责任公司计量中心 | 一种基于决策树算法的电能表功能异常评估方法及系统 |
CN113051553A (zh) * | 2019-12-27 | 2021-06-29 | 北京安控科技股份有限公司 | 一种事故规则的生成方法和系统 |
CN113657407A (zh) * | 2021-07-26 | 2021-11-16 | 扆亮海 | 高查全率的大幅图片文字精准定位方法 |
CN113689036A (zh) * | 2021-08-24 | 2021-11-23 | 成都电科智联科技有限公司 | 一种基于决策树c4.5算法的热像仪质量问题原因预测方法 |
CN113899982A (zh) * | 2021-09-22 | 2022-01-07 | 国网安徽省电力有限公司电力科学研究院 | 利用网络设备掉电复电数据研判低压电网停电复电的方法及系统 |
CN114095336A (zh) * | 2020-08-07 | 2022-02-25 | 中国移动通信集团海南有限公司 | 端到端问题诊断方法及系统 |
CN114996898A (zh) * | 2022-04-13 | 2022-09-02 | 上海核工程研究设计院有限公司 | 基于SysML活动图的核工程设计功能分配方法及系统 |
CN117408787A (zh) * | 2023-12-15 | 2024-01-16 | 江西求是高等研究院 | 一种基于决策树的根因挖掘分析方法及系统 |
CN118037266A (zh) * | 2024-01-31 | 2024-05-14 | 北京纪新泰富机电技术股份有限公司 | 制冷机保养方案生成方法、装置、设备和计算机可读介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108011367A (zh) * | 2017-12-04 | 2018-05-08 | 贵州电网有限责任公司电力科学研究院 | 一种基于深度决策树算法的电力负荷特性挖掘方法 |
CN108548988A (zh) * | 2018-03-27 | 2018-09-18 | 南瑞集团有限公司 | 基于互信息改进决策树的线路故障预测方法 |
CN108733966A (zh) * | 2017-04-14 | 2018-11-02 | 国网重庆市电力公司 | 一种基于决策树群的多维电能表现场状态检验方法 |
CN109217163A (zh) * | 2018-09-11 | 2019-01-15 | 贵州电网有限责任公司 | 基于地理位置的城市电力电缆综合监测及智能运维系统 |
-
2019
- 2019-07-15 CN CN201910636302.0A patent/CN110569867A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108733966A (zh) * | 2017-04-14 | 2018-11-02 | 国网重庆市电力公司 | 一种基于决策树群的多维电能表现场状态检验方法 |
CN108011367A (zh) * | 2017-12-04 | 2018-05-08 | 贵州电网有限责任公司电力科学研究院 | 一种基于深度决策树算法的电力负荷特性挖掘方法 |
CN108548988A (zh) * | 2018-03-27 | 2018-09-18 | 南瑞集团有限公司 | 基于互信息改进决策树的线路故障预测方法 |
CN109217163A (zh) * | 2018-09-11 | 2019-01-15 | 贵州电网有限责任公司 | 基于地理位置的城市电力电缆综合监测及智能运维系统 |
Non-Patent Citations (2)
Title |
---|
王志慧等: "《植被生物量与生产力遥感估算技术与应用》", 31 December 2016 * |
蒋卫祥: "《大数据时代计算机数据处理技术探究》", 31 March 2019 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113051553A (zh) * | 2019-12-27 | 2021-06-29 | 北京安控科技股份有限公司 | 一种事故规则的生成方法和系统 |
CN111191946A (zh) * | 2020-01-02 | 2020-05-22 | 国网北京市电力公司 | 故障线路识别方法及装置、电子设备 |
CN111476471A (zh) * | 2020-03-30 | 2020-07-31 | 北京四方继保工程技术有限公司 | 一种基于综合能源模型的综合能源故障诊断系统及方法 |
CN111476471B (zh) * | 2020-03-30 | 2023-10-27 | 北京四方继保工程技术有限公司 | 一种基于综合能源模型的综合能源故障诊断系统及方法 |
CN111612149A (zh) * | 2020-05-21 | 2020-09-01 | 国网湖南省电力有限公司 | 一种基于决策树的主网线路状态检测方法、系统及介质 |
CN111626418A (zh) * | 2020-05-27 | 2020-09-04 | 中南大学 | 基于平衡二叉树的集成剪枝策略 |
CN111626418B (zh) * | 2020-05-27 | 2022-04-22 | 中南大学 | 基于平衡二叉树集成剪枝策略的压缩机故障分类方法 |
CN111562111A (zh) * | 2020-06-05 | 2020-08-21 | 上海交通大学 | 发动机冷态测试故障诊断方法 |
CN114095336A (zh) * | 2020-08-07 | 2022-02-25 | 中国移动通信集团海南有限公司 | 端到端问题诊断方法及系统 |
CN111783904B (zh) * | 2020-09-04 | 2020-12-04 | 平安国际智慧城市科技股份有限公司 | 基于环境数据的数据异常分析方法、装置、设备及介质 |
CN111783904A (zh) * | 2020-09-04 | 2020-10-16 | 平安国际智慧城市科技股份有限公司 | 基于环境数据的数据异常分析方法、装置、设备及介质 |
CN112132221A (zh) * | 2020-09-25 | 2020-12-25 | 海南电网有限责任公司 | 一种基于规则学习的电网事故智能识别的方法 |
CN112330095A (zh) * | 2020-10-09 | 2021-02-05 | 中车青岛四方机车车辆股份有限公司 | 一种基于决策树算法的质量管理方法 |
CN112308436A (zh) * | 2020-11-04 | 2021-02-02 | 国网江苏省电力有限公司扬州市江都区供电分公司 | 一种配电网评估诊断分析方法、装置、设备及存储介质 |
CN113011481A (zh) * | 2021-03-10 | 2021-06-22 | 广东电网有限责任公司计量中心 | 一种基于决策树算法的电能表功能异常评估方法及系统 |
CN113011481B (zh) * | 2021-03-10 | 2024-04-30 | 广东电网有限责任公司计量中心 | 一种基于决策树算法的电能表功能异常评估方法及系统 |
CN113657407A (zh) * | 2021-07-26 | 2021-11-16 | 扆亮海 | 高查全率的大幅图片文字精准定位方法 |
CN113689036A (zh) * | 2021-08-24 | 2021-11-23 | 成都电科智联科技有限公司 | 一种基于决策树c4.5算法的热像仪质量问题原因预测方法 |
CN113899982A (zh) * | 2021-09-22 | 2022-01-07 | 国网安徽省电力有限公司电力科学研究院 | 利用网络设备掉电复电数据研判低压电网停电复电的方法及系统 |
CN113899982B (zh) * | 2021-09-22 | 2024-08-06 | 国网安徽省电力有限公司电力科学研究院 | 利用网络设备掉电复电数据研判低压电网停电复电的方法及系统 |
CN114996898A (zh) * | 2022-04-13 | 2022-09-02 | 上海核工程研究设计院有限公司 | 基于SysML活动图的核工程设计功能分配方法及系统 |
CN114996898B (zh) * | 2022-04-13 | 2024-06-11 | 上海核工程研究设计院股份有限公司 | 基于SysML活动图的核工程设计功能分配方法及系统 |
CN117408787A (zh) * | 2023-12-15 | 2024-01-16 | 江西求是高等研究院 | 一种基于决策树的根因挖掘分析方法及系统 |
CN117408787B (zh) * | 2023-12-15 | 2024-03-05 | 江西求是高等研究院 | 一种基于决策树的根因挖掘分析方法及系统 |
CN118037266A (zh) * | 2024-01-31 | 2024-05-14 | 北京纪新泰富机电技术股份有限公司 | 制冷机保养方案生成方法、装置、设备和计算机可读介质 |
CN118037266B (zh) * | 2024-01-31 | 2024-10-01 | 北京纪新泰富机电技术股份有限公司 | 制冷机保养方案生成方法、装置、设备和计算机可读介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569867A (zh) | 基于决策树算法的输电线路故障原因判别方法、介质及设备 | |
CN109145957B (zh) | 基于大数据的配电网异常指标的识别与处理方法及装置 | |
CN110659173A (zh) | 一种运维系统及方法 | |
CN111680820B (zh) | 分布式光伏电站故障诊断方法和装置 | |
CN107038167A (zh) | 基于模型评估的大数据挖掘分析系统及其分析方法 | |
CN110598726A (zh) | 一种基于随机森林的输电杆塔鸟害风险预测方法 | |
CN105471647B (zh) | 一种电力通信网故障定位方法 | |
CN110188834A (zh) | 一种电力通信网的故障诊断方法、装置及设备 | |
CN113011084B (zh) | 基于相关向量机的输电线路故障原因智能辨识方法 | |
CN110580492A (zh) | 一种基于小幅波动检测的轨道电路故障前兆发现方法 | |
CN107453354A (zh) | 一种配电网的薄弱环节识别方法 | |
CN103095598A (zh) | 一种大规模集群环境下的监控数据聚合方法 | |
CN108052559A (zh) | 基于大数据处理的配电终端缺陷挖掘分析方法 | |
CN112257784A (zh) | 一种基于梯度提升决策树的窃电检测方法 | |
CN114723204A (zh) | 一种基于监督学习的输电线路舞动分级预警方法 | |
CN105528296B (zh) | 一种面向对象软件的类簇测试方法 | |
CN116307844A (zh) | 一种低压台区线损评估分析方法 | |
CN103353895A (zh) | 一种配电网线损数据的预处理方法 | |
CN112329971A (zh) | 一种输变电工程投资决策模型的建模方法 | |
CN118283552A (zh) | 基于物联网分析的计划调度优化方法 | |
CN113505818A (zh) | 改进决策树算法的熔铝炉能耗异常诊断方法和系统及设备 | |
CN114167217A (zh) | 一种铁路配电网的多重故障诊断方法 | |
CN109902133A (zh) | 基于电网任意分割区域的多源数据纠错处理方法及系统 | |
CN107301499B (zh) | 一种基于ami数据的配电馈线统计线损率数据清洗方法 | |
CN111864728B (zh) | 一种可重构配电网重要设备识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191213 |
|
RJ01 | Rejection of invention patent application after publication |