CN114743118A - 基于创新型随机森林算法的输电线路劣化绝缘子识别方法 - Google Patents
基于创新型随机森林算法的输电线路劣化绝缘子识别方法 Download PDFInfo
- Publication number
- CN114743118A CN114743118A CN202210452369.0A CN202210452369A CN114743118A CN 114743118 A CN114743118 A CN 114743118A CN 202210452369 A CN202210452369 A CN 202210452369A CN 114743118 A CN114743118 A CN 114743118A
- Authority
- CN
- China
- Prior art keywords
- random forest
- training
- algorithm
- innovative
- decision tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 63
- 239000012212 insulator Substances 0.000 title claims abstract description 55
- 238000007637 random forest analysis Methods 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000005540 biological transmission Effects 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims description 55
- 238000003066 decision tree Methods 0.000 claims description 47
- 230000011218 segmentation Effects 0.000 claims description 22
- 230000005684 electric field Effects 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000007689 inspection Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 28
- 230000008569 process Effects 0.000 abstract description 7
- 238000005070 sampling Methods 0.000 abstract description 7
- 238000013138 pruning Methods 0.000 abstract description 5
- 230000007812 deficiency Effects 0.000 abstract 1
- 230000007547 defect Effects 0.000 description 6
- 238000000691 measurement method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000825 ultraviolet detection Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
- Y04S10/52—Outage or fault management, e.g. fault detection or location
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于创新型随机森林算法的输电线路劣化绝缘子的识别方法,该创新型随机森林算法同时利用基尼指数和信息增益率的倒数按一定的比例综合评判特征的重要性程度,取长补短,提高了模型的准确性;不会出现过拟合,因为该算法采用随机采样的过程中保证了随机性,所以就算不剪枝也不会出现过拟合;同时该算法结合梯度下降算法加入反向传播环节,通过对真实值与预测值的误差项进行反向求导,逐步调整模型参数,不同于其他的随机森林算法,该算法效率比较高,能提高劣化绝缘子检测精度与稳定性,减小因输电线路劣化绝缘子漏检,误检对系统造成的影响。
Description
技术领域
本发明涉及架空输电线路系统装置故障检测技术领域,具体涉及一种输电线路劣化绝缘子的识别方法。
背景技术
绝缘子是输电系统中的关键部件之一,起到对导体进行机械支撑及电气隔离的作用。绝缘子在长期的机械力、高电场强度及环境因素的共同作用下容易出现不同程度的劣化,在操作过电压及雷电过电压下可能导致绝缘子钢帽炸裂,进而可能导致断串、掉串等严重故障,严重影响电力系统运行的稳定性。因此必须对架空输电线路上的是否有劣化绝缘子不断的进行检测,以保证架空输电线路的安全运行。
现有的架空输电线路劣化绝缘子检测方法大致分为:1、红外检测法;2、紫外检测法;3、超声波检测法;4、空间电场测量法。上述检测方法中:红外检测法受环境影响较大,检测不够准确;紫外检测法检测设备昂贵,预见性不好,检测效率低下;超声波检测法不适用绝缘子劣化或者绝缘阻值下降等缺陷的早期预报。因此空间电场测量方法在输电线路劣化绝缘子的识别技术中占据越来越重要的地位。
空间电场测量方法的原理是:带电运行的绝缘子串周围分布有空间电场,当串中某一绝缘子劣化成低零值绝缘子后,绝缘子串周围的空间电场会发生畸变,因此只要检测绝缘子周围电场是否发生畸变,就可判断是否存在劣化绝缘子。为了快速准确的诊断出劣化绝缘子,不少学者提出了将数据挖掘的方法应用到故障诊断的领域:BP神经网络,灰色预测,模糊计算,遗传算法,Petri网络及决策树。决策树因为其具有直观、学习速度快及分类准确的优势,越来越多的引起人们的关注。但决策树算法受异常值的影响较大,且因为决策树是采用了所有的特征及样本,决策树算法容易出现过拟合(即对训练样本有很好的效果,对测试集的效果很差),导致了算法的低效,进而会造成对劣化绝缘子的误检、漏检因此有必要对现有的劣化绝缘子空间电场测量方法做进一步的改进,简化识别过程,提高劣化绝缘子检测精度与稳定性。
发明内容
为克服上述现有技术中的不足,本发明的目的在于开发一种基于创新型随机森林算法的输电线路劣化绝缘子识别方法。
一种基于创新型随机森林算法的输电线路劣化绝缘子的识别方法,包括以下步骤:
步骤1:通过无人机巡检获取目标绝缘子的电场大小,形成目标集数据;
步骤2:对之前测得的劣化绝缘子以及正常绝缘子的电场数据进行整理,形成训练集数据与测试集数据,并将其导入到随机森林算法模型中;
步骤3:对导入的训练集数据与测试集数据进行数据预处理,将目标特征类别分为
“劣化”、“未劣化”,并进行编号;
步骤4:确定该随机森林算法模型的特征向量为A;
步骤5:建立训练模型;
步骤6:设训练总样本的个数为N,则单棵决策树从N个训练集中有放回的随机抽取n个训练集作为此单颗树的训练样本,n小于N;
步骤7:设训练样例的输入特征的个数为M,则在每颗决策树的每个节点上进行分裂时,从M个输入特征里随机选择m个输入特征,m小于M;
步骤8:对于当前训练集数据,遍历所有特征m及其对应的所有可能切分点a后,寻找最佳切分特征及其最佳切分点,使得切分之后的基尼指数Gini和信息增益率的倒数乘以初始化权重参数ω1和ω2最大,利用该最佳特征及其最佳切分点将训练数据集切分成多个子集,分别对应判别结果为左子树和判别结果为右子树;
步骤9:对最优非叶子节点递归调用步骤7与步骤8,直到满足为每一个非叶子节点寻找最佳切分特征及其最佳切分点,将其划分为子集;
步骤10:在生成决策树的同时,采用梯度下降算法实时更新权重参数ω1和ω2,使误差最小;
步骤11:对每一颗决策树递归调用步骤6至步骤10,直到生成随机森林中每一颗最优决策树;
步骤12:将目标集数据导入到创新型随机森林算法模型中,得出预测值并画出随机森林。
优选的,步骤2中使用sklearn.preprocessing中的LabelEncoder对导入的训练集数据与测试集数据进行数据预处理。
优选的,步骤5中使用sklearn.ensemble中的RandomForestClassifier建立训练模型。
上述技术方案具有如下有益效果:1、因为普通的随机森林算法的节点分裂策略是根据基尼系数或信息增益进行节点分裂(即采用CART算法或ID3算法生成决策树,最后由众多决策树通过bagging集成为随机森林),基尼指数越小,重要程度越高,信息增益率越大,重要程度越高,但他们都有着自己的缺陷,而创新型随机森林算法同时利用基尼指数和信息增益率的倒数按一定的比例综合评判特征的重要性程度,取长补短,提高了模型的准确性;2、不会出现过拟合,因为该算法采用随机采样的过程中保证了随机性,所以就算不剪枝也不会出现过拟合;3、同时该算法结合梯度下降算法加入反向传播环节,通过对真实值与预测值的误差项进行反向求导,逐步调整模型参数,不同于其他的随机森林算法,该算法效率比较高,能提高劣化绝缘子检测精度与稳定性,减小因输电线路劣化绝缘子漏检,误检对系统造成的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的基于创新型随机森林算法的输电线路劣化绝缘子的识别方法的原理图;
图2是本发明实施例提供的基于创新型随机森林算法的输电线路劣化绝缘子的识别方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。应该强调的是,下述说明仅仅是用于帮助理解本发明,而不是为了限制本发明的范围及其应用。
本发明的目的是提供一种基于创新型随机森林算法的输电线路劣化绝缘子的识别方法,通过导入劣化绝缘子以及正常绝缘子的多维电场数据对模型进行训练并测试模型精度,将用于识别的绝缘子的电场强度数据导入训练好的模型中,准确得到目标绝缘子是否劣化,弥补了传统的随机森林算法在生成单枝决策树时,计算类别数较多的特征的信息增益时结果往往不准确,且不支持连续值处理以及剪枝操作以及算法的低效的缺点,实现对架空线路劣化绝缘子串高精度的检测。该测量方法的大概原理是用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类,然后看看哪一类被选择最多,就预测这个样本为那一类。该测量方法的具体原理是,训练每棵树时,从全部训练样本中选取一个子集进行训练(即bootstrap取样),在每个节点,随机选取所有特征的一个子集,通过将初始化的权重参数ω1和ω2分别赋给导入训练集数据特征的基尼系数和信息增益率的倒数,用来计算最佳分割方式,进而根据综合得分最高特征进行分割,将当前样本分成多个子样本集,使得生成的非叶子节点都有多个分支,这样就形成了一颗决策树模型,同时并通过计算误差值,根据梯度下降算法进行反向传播修改权重参数ω1和ω2,最终获得符合要求精度的一棵决策树模型,以此类推再次从全部训练样本中选取一个子集进行训练,生成一颗决策树模型……最后生成的所有的决策树共同组成随机森林模型,将模型应用于目标集数据,进而得到目标绝缘子是否劣化。
为了实现上述目的,本发明提出的技术方案是,一种基于创新型随机森林算法的输电线路劣化绝缘子的识别方法,包括以下步骤:
步骤1:通过无人机巡检获取目标绝缘子的电场大小,形成目标集数据;
步骤2:对之前测得的劣化绝缘子以及正常绝缘子的电场数据进行整理,形成训练集与测试集,并将其导入到创新型随机森林算法模型中;
步骤3:使用sklearn.preprocessing中的LabelEncoder对导入的训练集与测试集进行数据预处理,将目标特征类别“劣化”、“未劣化”分别编号为0和1;
步骤4:确定该随机森林算法模型的特征向量为A;
步骤5:使用sklearn.ensemble中的RandomForestClassifier建立训练模型;
步骤6:假设训练总样本的个数为N,则单棵决策树从N个训练集中有放回的随机抽取n个作为此单颗树的训练样本,n小于N;
步骤7:令训练样例的输入特征的个数为M,m远远小于M,则我们在每颗决策树的每个节点上进行分裂时,从M个输入特征里随机选择m个输入特征;
步骤8:对于当前训练数据集,遍历所有特征m及其对应的所有可能切分点a后,寻找最佳切分特征及其最佳切分点,使得切分之后的基尼指数Gini和信息增益率的倒数乘以初始化权重参数ω1和ω2最大,利用该最佳特征及其最佳切分点将训练数据集切分成多个子集,分别对应判别结果为左子树和判别结果为右子树;
步骤9:对最优非叶子节点递归调用步骤7与步骤8,直到满足为每一个非叶子节点寻找最佳切分特征及其最佳切分点,将其划分为子集;
步骤10:在生成决策树的同时,采用梯度下降算法实时更新权重参数ω1和ω2,使误差最小;
步骤11:对每一颗决策树递归调用步骤6至步骤10,直到生成随机森林中每一颗最优决策树;
步骤12:将目标集数据导入到创新型随机森林算法模型中,得出预测值并画出随机森林。
该创新型随机森林算法,使用sklearn.preprocessing中的LabelEncoder对导入的训练集与测试集进行数据预处理,采用机器学习sklearn.ensemble中的RandomForestClassifier构建模型,结合了高精度的测量信息与其他传感器的获得的测量数据,在模型训练中进行数据融合,将劣化绝缘子以及正常绝缘子的电场数据导入进行训练并测试,来提高模型预测的准确度,以此将模型广泛应用于输电线路劣化绝缘子的检测中,做到准确识别,实现自主检测。
如图1所示,创新型随机森林算法的实现原理主要如下:首先要生成单颗决策树,假设训练总样本的个数为N,则单棵决策树从N个训练集中有放回的随机抽取n个作为此单颗树的训练样本,同时我们在每颗决策树的每个节点上进行分裂时随机选择m个输入特征(令训练样例的输入特征的个数为M,m远远小于M),然后用基尼指数和信息增益率的倒数乘以初始化权重参数ω1和ω2,根据综合得分最大值选择最优特征,同时决定该特征的最优切分点。分类问题中,假设有K个类,样本点属于第K类的概率为pk,则概率分布的基尼指数定义为:
对于二分类问题来说,若样本点属于第一类的概率为p,则概率分布的基尼指数为:
Gini(p)=2p(1-p)
对于给定的样本集合D,其基尼指数为:
其中,Ck是D中属于第k类的样本子集,K是类的个数。|Ck|和D分别表示子集的个数和样本的个数。
如果样本集合D根据特征A是否取某一可能的值α被分割成D1和D2,即
D1={(x,y)∈D|A(x)=a}
D2=D-D1
所以在特征A的条件下集合D的基尼指数为:
其中基尼指数Gini(D)表示集合的不确定性,基尼指数G(D,A)表示A=a分解后集合的不决定性。基尼指数越大,样本集合的不确定性越大。
与此同时,在分类问题中,分类标签xi在样本集S中出现的频率记为p(xi),则xi的信息定义为:
-log2p(xi)
分裂之前样本集的熵:
其中N为分类标签的个数,通过属性A分裂之后样本集的熵:
其中m代表原始样本集通过属性A的属性值划分为m个子样本集,|Sj|表示第j个子样本集中样本数量,|S|表示分裂之前数据集中样本总数量。通过属性A分裂之后样本集的信息增益:
InfoGain(S,A)=E(S)-EA(S)
属性A的“分裂信息”(split information)定义为:
其中,训练数据集S通过属性A的属性值划分为m个子数据集,|Sj|表示第j个子数据集中样本数量,|S|表示划分之前数据集中样本总数量。通过属性A分裂之后样本集的信息增益:
InfoGain(S,A)=E(S)-EA(S)
通过属性A分裂之后样本集的信息增益率:
则信息增益率的倒数为:
当输入训练数据集以及停止计算的条件时,模型会根据训练数据集,从根结点开始,递归地对每个结点进行以下操作,构建决策树,最终形成随机森林,具体方法为:
(1)假设训练总样本的个数为N,每棵决策树从N个训练集中有放回的随机抽取n个作为此单颗树的训练样本;
(2)假设训练样例的输入特征的个数为M,则我们在每颗决策树的每个节点上进行分裂时,从M个输入特征里随机选择m个输入特征且m远远小于M;
(3)训练数据集为n,计算现有特征m对训练数据集的基尼指数和信息增益率的倒数,同时乘以权重系数,此时对于每一个特征A,对其可能取得每一个值a,根据此值将训练样本切分为D1和D2等部分。
(4)然后根据上式计算A=a,在所有可能的特征m以及所有可能的切分点a中,选择基尼指数和信息增益率倒数综合最大的特征及其对应的切分点作为最优的特征及切分点,从结点生成子结点,将训练数据集分配到子结点中去。
(5)递归的调用(1)至(4),直到满足停止的条件
(6)同时根据梯度下降算法实时更新权重参数ω1和ω2,直到满足停止的条件
(7)生成一颗决策树
(8)递归的调用(1)至(7),生成多颗决策树从而形成随机森林
(9)将目标集数据导入到创新型随机森林算法模型中,得出预测值并画出随机森林。
由于决策树算法很容易对训练集过拟合,而导致泛化能力差,为了解决这个问题,我们需要对决策树进行剪枝,即类似于线性回归的正则化,来增加决策树的泛化能力,一般采用的办法是后剪枝法,即先生成决策树,然后产生所有可能的剪枝后的决策树,然后使用交叉验证来检验各种剪枝的效果,选择泛化能力最好的剪枝策略。
该算法不需要进行剪枝,也不会出现过拟合,这是因为在建立每一棵决策树的过程中,有两个随机采样的过程,random forest对输入的数据要进行行、列的采样。对于行采样,采用有放回的方式,也就是在采样得到的样本集合中,可能有重复的样本。假设输入样本为N个,那么采样的样本也为N个。这样使得在训练的时候,每一棵树的输入样本都不是全部的样本,使得相对不容易出现over-fitting;然后进行列采样,从M个feature中,选择m个(m<<M)。之后就是对采样之后的数据使用完全分裂的方式建立出决策树,这样决策树的某一个叶子节点要么是无法继续分裂的,要么里面的所有样本的都是指向的同一个分类,由于之前的两个随机采样的过程保证了随机性,所以就算不剪枝,也不会出现over-fitting。
本发明主要创新点为:1、因为普通的随机森林算法的节点分裂策略是根据基尼系数或信息增益进行节点分裂(即采用CART算法或ID3算法生成决策树,最后由众多决策树通过bagging集成为随机森林),基尼指数越小,重要程度越高,信息增益率越大,重要程度越高,但他们都有着自己的缺陷,而创新型随机森林算法同时利用基尼指数和信息增益率的倒数按一定的比例综合评判特征的重要性程度,取长补短,提高了模型的准确性;2、不会出现过拟合,因为该算法采用随机采样的过程中保证了随机性,所以就算不剪枝也不会出现过拟合;3、同时该算法结合梯度下降算法加入反向传播环节,通过对真实值与预测值的误差项进行反向求导,逐步调整模型参数,不同于其他的随机森林算法,该算法效率比较高,能提高劣化绝缘子检测精度与稳定性,减小因输电线路劣化绝缘子漏检,误检对系统造成的影响。
本发明提出的方法运用在架空线路劣化绝缘子检测工作中,可使得输电线路相关运检人员利用非接触式检测装置获得的目标绝缘子串的空间电场分布准确识别绝缘子是否劣化,避免了传统算法导致的漏检或误检,影响后续检测结果,本发明操作简便,安全高效,提高了劣化绝缘子识别的准确度,可以有效保障电力系统的安全稳定运行。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (3)
1.一种基于创新型随机森林算法的输电线路劣化绝缘子的识别方法,包括以下步骤:
步骤1:通过无人机巡检获取目标绝缘子的电场大小,形成目标集数据;
步骤2:对之前测得的劣化绝缘子以及正常绝缘子的电场数据进行整理,形成训练集数据与测试集数据,并将其导入到随机森林算法模型中;
步骤3:对导入的训练集数据与测试集数据进行数据预处理,将目标特征类别分为“劣化”、“未劣化”,并进行编号;
步骤4:确定该随机森林算法模型的特征向量为A;
步骤5:建立训练模型;
步骤6:设训练总样本的个数为N,则单棵决策树从N个训练集中有放回的随机抽取n个训练集作为此单颗树的训练样本,n小于N;
步骤7:设训练样例的输入特征的个数为M,则在每颗决策树的每个节点上进行分裂时,从M个输入特征里随机选择m个输入特征,m小于M;
步骤8:对于当前训练集数据,遍历所有特征m及其对应的所有可能切分点a后,寻找最佳切分特征及其最佳切分点,使得切分之后的基尼指数Gini和信息增益率的倒数乘以初始化权重参数ω1和ω2最大,利用该最佳特征及其最佳切分点将训练数据集切分成多个子集,分别对应判别结果为左子树和判别结果为右子树;
步骤9:对最优非叶子节点递归调用步骤7与步骤8,直到满足为每一个非叶子节点寻找最佳切分特征及其最佳切分点,将其划分为子集;
步骤10:在生成决策树的同时,采用梯度下降算法实时更新权重参数ω1和ω2,使误差最小;
步骤11:对每一颗决策树递归调用步骤6至步骤10,直到生成随机森林中每一颗最优决策树;
步骤12:将目标集数据导入到创新型随机森林算法模型中,得出预测值并画出随机森林。
2.根据权利要求1所述的基于创新型随机森林算法的输电线路劣化绝缘子的识别方法,其特征在于,步骤2中使用sklearn.preprocessing中的LabelEncoder对导入的训练集数据与测试集数据进行数据预处理。
3.根据权利要求1所述的基于创新型随机森林算法的输电线路劣化绝缘子的识别方法,其特征在于,步骤5中使用sklearn.ensemble中的RandomForestClassifier建立训练模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210452369.0A CN114743118A (zh) | 2022-04-27 | 2022-04-27 | 基于创新型随机森林算法的输电线路劣化绝缘子识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210452369.0A CN114743118A (zh) | 2022-04-27 | 2022-04-27 | 基于创新型随机森林算法的输电线路劣化绝缘子识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114743118A true CN114743118A (zh) | 2022-07-12 |
Family
ID=82284425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210452369.0A Pending CN114743118A (zh) | 2022-04-27 | 2022-04-27 | 基于创新型随机森林算法的输电线路劣化绝缘子识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114743118A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116151388A (zh) * | 2022-12-01 | 2023-05-23 | 广州大学 | 一种基于本地化差分隐私的联邦随机森林方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717524A (zh) * | 2019-09-20 | 2020-01-21 | 浙江工业大学 | 一种老年人热舒适预测方法 |
CN113156274A (zh) * | 2021-01-27 | 2021-07-23 | 南京工程学院 | 基于无人机的劣化绝缘子非接触式检测系统及方法 |
-
2022
- 2022-04-27 CN CN202210452369.0A patent/CN114743118A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110717524A (zh) * | 2019-09-20 | 2020-01-21 | 浙江工业大学 | 一种老年人热舒适预测方法 |
CN113156274A (zh) * | 2021-01-27 | 2021-07-23 | 南京工程学院 | 基于无人机的劣化绝缘子非接触式检测系统及方法 |
Non-Patent Citations (2)
Title |
---|
丁国富 等: "《高速列车数字化设计、分析及集成技术》", 28 February 2016 * |
王仁杰: "智能飞控故障诊断系统的研究与实现", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116151388A (zh) * | 2022-12-01 | 2023-05-23 | 广州大学 | 一种基于本地化差分隐私的联邦随机森林方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhu et al. | Fault diagnosis approach for photovoltaic arrays based on unsupervised sample clustering and probabilistic neural network model | |
CN108062571B (zh) | 基于差分进化随机森林分类器的光伏阵列故障诊断方法 | |
Frizzo Stefenon et al. | Fault diagnosis of insulators from ultrasound detection using neural networks | |
Liao et al. | Study on power line insulator defect detection via improved faster region-based convolutional neural network | |
CN110210723B (zh) | 一种基于层次分析法和孤立森林的窃电辨识方法 | |
CN108470022A (zh) | 一种基于运维管理的智能工单质检方法 | |
CN110702966B (zh) | 一种基于概率神经网络的故障电弧检测方法、装置及系统 | |
CN111652835A (zh) | 基于深度学习与聚类的输电线路绝缘子缺失的检测方法 | |
CN114743118A (zh) | 基于创新型随机森林算法的输电线路劣化绝缘子识别方法 | |
Xu et al. | Detection method of insulator based on single shot multibox detector | |
CN115658940A (zh) | 异源检测特征数据库构建与更新方法、装置及存储介质 | |
CN116087647A (zh) | 基于pca和麻雀算法优化随机森林的建筑电气故障诊断方法 | |
CN111999591B (zh) | 一种配电网一次设备异常状态的识别方法 | |
CN116008731A (zh) | 配电网高阻故障辨识方法、装置和电子设备 | |
CN112882899B (zh) | 一种日志异常检测方法及装置 | |
CN114758257A (zh) | 基于cart算法的输电线路劣化绝缘子的识别方法 | |
CN111737993B (zh) | 一种配电网设备的故障缺陷文本提取设备健康状态方法 | |
Yi et al. | Intelligent aging diagnosis of conductor in smart grid using label-distribution deep convolutional neural networks | |
CN116756659A (zh) | 智能运维管理方法、装置、设备及存储介质 | |
CN116702132A (zh) | 网络入侵检测方法及系统 | |
CN115879048A (zh) | 一种基于wrfmda模型的串联电弧故障识别方法和系统 | |
CN115880472A (zh) | 一种电力红外图像数据智能诊断分析系统 | |
CN110188799A (zh) | 一种计量数据多维分析与智能运维方法 | |
Hsieh et al. | Identification of partial discharge location using probabilistic neural networks and the fuzzy c-means clustering approach | |
CN117764547A (zh) | 一种光伏组串故障诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220712 |