CN109507535B - 变电站接地网运行阶段及运行寿命预测方法及装置 - Google Patents
变电站接地网运行阶段及运行寿命预测方法及装置 Download PDFInfo
- Publication number
- CN109507535B CN109507535B CN201811506511.5A CN201811506511A CN109507535B CN 109507535 B CN109507535 B CN 109507535B CN 201811506511 A CN201811506511 A CN 201811506511A CN 109507535 B CN109507535 B CN 109507535B
- Authority
- CN
- China
- Prior art keywords
- grounding grid
- transformer substation
- data
- sample set
- original sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000007637 random forest analysis Methods 0.000 claims abstract description 65
- 230000007797 corrosion Effects 0.000 claims abstract description 64
- 238000005260 corrosion Methods 0.000 claims abstract description 64
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 32
- 238000012360 testing method Methods 0.000 claims description 31
- 238000005070 sampling Methods 0.000 claims description 21
- 238000012423 maintenance Methods 0.000 claims description 19
- 238000003066 decision tree Methods 0.000 claims description 18
- 239000002689 soil Substances 0.000 claims description 16
- 238000010276 construction Methods 0.000 claims description 12
- 239000000463 material Substances 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 7
- 238000013461 design Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 abstract description 31
- 239000013598 vector Substances 0.000 abstract description 19
- 238000001514 detection method Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 3
- 201000004569 Blindness Diseases 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/08—Locating faults in cables, transmission lines, or networks
- G01R31/088—Aspects of digital computing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N17/00—Investigating resistance of materials to the weather, to corrosion, or to light
- G01N17/006—Investigating resistance of materials to the weather, to corrosion, or to light of metals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/50—Testing of electric apparatus, lines, cables or components for short-circuits, continuity, leakage current or incorrect line connections
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental & Geological Engineering (AREA)
- Environmental Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing Resistance To Weather, Investigating Materials By Mechanical Methods (AREA)
Abstract
本发明公开了基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法及装置,获取初始数据,构建原始样本集;基于原始样本集特点,总结提取特征变量;采用K‑medoids法对原始样本集进行聚类;采用随机森林算法处理各类样本,形成随机森林模型;将待预测的变电站接地网特征变量载入随机森林模型,改变特征向量中的运行时间获得评分结果与运行时间的关系,推导出运行阶段与运行寿命的预测结果。本发明改进了随机森林算法中对原始样本集分类的随机性;预测模型基于随机森林算法生成,泛化误差可控,聚类准确度高;综合考虑影响变电站接地网状况的各种因素,划分不同的运行阶段以配合最合适的接地网故障检测方法来识别接地网对应阶段的腐蚀状况。
Description
技术领域
本发明涉及接地网性能评估的技术领域,尤其涉及基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法及装置。
背景技术
随着新世纪人民生活水平的迅速提高,对电力的需求越来越大,承载电力传输的变电站的重要性日益突出。其中,良好的变电站接地网是变电站安全可靠运行的重要支柱。
为了保障良好的泄流能力,变电站接地网一般深埋于地下,这就导致接地网容易发生腐蚀和断裂。受地区、气候、人为等因素的影响,各地区变电站接地网腐蚀以致影响变电站安全运行的时间跨度差别很大,其运行阶段和运行寿命也不相同,这给变电站接地网运行状态的评估带来了极大的困难。
一直以来对变电站接地网的检查只是依赖经验到了一定年限进行定期检查,其缺乏科学性,且盲目性很强。这在一定程度上浪费了人力物力,且不能准确把握不同年限变电站接地网的运行阶段以及在对应阶段选用最优的测量方法。因此采取一定方法对变电站接地网的运行阶段及运行寿命进行预测是十分有必要的。
发明内容
为了克服现有技术的不足,本发明的目的在于提供基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法及装置,旨在解决现有技术对变电站接地网进行运行状态评估时缺乏科学性,盲目性很强,浪费人力物力,不能准确把握不同年限变电站接地网的运行阶段以及在对应阶段选用最优的测量方法的问题。
本发明的目的采用以下技术方案实现:
一种基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法,包括:
构建步骤,获取各类初始数据,构建原始样本集;
提取步骤,基于原始样本集特点,总结提取特征变量;
聚类步骤,考虑现有数据特征,采用K-medoids法对原始样本集进行聚类;
预测步骤,采用随机森林算法处理各类样本,通过bootstrap抽样技术从各类样本集中抽取训练集,分别建立分类回归树并产生决策树,汇总形成随机森林模型;将待预测的变电站接地网特征变量载入随机森林模型,改变特征向量中的运行时间获得评分结果与运行时间的关系,推导出变电站接地网运行阶段与运行寿命的预测结果。
在上述实施例的基础上,优选的,所述构建步骤,具体为:
获取变电站的新建、投运、维护、停运各时间段内进行接地网检修时接地网的腐蚀状况数据,并进行整理;
将腐蚀状况数据与接地网检修时的腐蚀状况配对以组成样本,利用不同变电站、不同时间段的样本构成原始样本集。
在上述实施例的基础上,优选的,所述提取步骤,具体为:
基于腐蚀状况数据的特点和原始样本集的获取过程,总结提取影响变电站接地网运行阶段与运行寿命的若干个特征变量;所述特征变量包括变电站电压等级、变电站运行时间、接地网材质、变电站所属地区年均雷暴发生次数、土壤含水量、土壤pH值、接地网防腐措施、人为因素中的一种或多种;
以1~10为分值表示对变电站接地网进行检修时接地网腐蚀故障的严重程度;其中,分值越高,说明变电站接地网的腐蚀状况越严重;
分别以1~10为分值表示每个特征变量对接地网腐蚀的影响;其中,与某一特征向量相应的分值越高,说明该特征向量对变电站接地网的影响越大;
调整原始样本集的数据结构和数据格式。
在上述实施例的基础上,优选的,所述聚类步骤中,K-medoids法的聚类过程包括:
步骤S31,整理样本,对样本数据进行初步处理,选用合适的数据结构存储训练数据和测试元组,将初步处理好的样本作为对象集X,输入指定聚类类数k,并在X中随机选取k个点作为初始的medoid;
步骤S32,根据距离最近原则将剩余数据对象分配到最接近的medoid,从而形成一类;
步骤S33,在每一类中计算每个点与类中其他对象距离的和值,选出和值最小的点作为新的medoid;
步骤S34,反复执行步骤S32和步骤S33直至满足medoid不再发生变化为止。
在上述实施例的基础上,优选的,所述预测步骤,包括:
步骤S41,采用bootstrap抽样技术从已分类的各样本集中均匀抽取N个训练集,每个训练集的大小为单类数据集的2/3,每次抽样有1/3的数据未被抽中;未被抽中的袋外数据作为测试集,可进行内部误差估计,产生OOB误差;
步骤S42,为每个训练集分别建立分类回归树,产生由N棵CART决策树组成的森林;在每棵树生长过程中,从全部M个特征变量中随机抽选m个,在这m个属性中根据Gini系数最小原则选出最优属性进行内部节点分支,其中m≤M;汇总各类N棵决策树形成随机森林模型;利用测试集数据对随机森林模型进行测试;综合模型的测试结果,采用投票的方式得出最终的接地网腐蚀状态预测结果;其中,随机森林的规模和分裂时的特征维数m的设计需根据预测结果调整N的大小;
步骤S43,将待预测的变电站接地网特征变量载入随机森林模型,求取各棵树输出的平均值,得到接地网腐蚀状况的评分预测结果;
步骤S44,不断改变特征向量中的运行时间,获得评分结果与运行时间的关系;结合K-medoids法对原始样本集聚类的结果划分出预测结果的对应阶段,得出变电站接地网运行阶段与运行时间的关系作为运行阶段的预测结果;推导出运行寿命的预测结果。
一种基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测装置,包括:
构建模块,用于获取各类初始数据,构建原始样本集;
提取模块,用于基于原始样本集特点,总结提取特征变量;
聚类模块,用于考虑现有数据特征,采用K-medoids法对原始样本集进行聚类;
预测模块,用于采用随机森林算法处理各类样本,通过bootstrap抽样技术从各类样本集中抽取训练集,分别建立分类回归树并产生决策树,汇总形成随机森林模型;将待预测的变电站接地网特征变量载入随机森林模型,改变特征向量中的运行时间获得评分结果与运行时间的关系,推导出变电站接地网运行阶段与运行寿命的预测结果。
在上述实施例的基础上,优选的,所述构建模块用于:
获取变电站的新建、投运、维护、停运各时间段内进行接地网检修时接地网的腐蚀状况数据,并进行整理;
将腐蚀状况数据与接地网检修时的腐蚀状况配对以组成样本,利用不同变电站、不同时间段的样本构成原始样本集。
在上述实施例的基础上,优选的,所述提取模块用于:
基于腐蚀状况数据的特点和原始样本集的获取过程,总结提取影响变电站接地网运行阶段与运行寿命的若干个特征变量;所述特征变量包括变电站电压等级、变电站运行时间、接地网材质、变电站所属地区年均雷暴发生次数、土壤含水量、土壤pH值、接地网防腐措施、人为因素中的一种或多种;
以1~10为分值表示对变电站接地网进行检修时接地网腐蚀故障的严重程度;其中,分值越高,说明变电站接地网的腐蚀状况越严重;
分别以1~10为分值表示每个特征变量对接地网腐蚀的影响;其中,与某一特征向量相应的分值越高,说明该特征向量对变电站接地网的影响越大;
调整原始样本集的数据结构和数据格式。
在上述实施例的基础上,优选的,所述聚类模块包括:
第31模块,用于整理样本,对样本数据进行初步处理,选用合适的数据结构存储训练数据和测试元组,将初步处理好的样本作为对象集X,输入指定聚类类数k,并在X中随机选取k个点作为初始的medoid;
第32模块,用于根据距离最近原则将剩余数据对象分配到最接近的medoid,从而形成一类;
第33模块,用于在每一类中计算每个点与类中其他对象距离的和值,选出和值最小的点作为新的medoid;
第34模块,用于反复调用第32模块和第33模块直至满足medoid不再发生变化为止。
在上述实施例的基础上,优选的,所述预测模块包括:
第41模块,用于采用bootstrap抽样技术从已分类的各样本集中均匀抽取N个训练集,每个训练集的大小为单类数据集的2/3,每次抽样有1/3的数据未被抽中;未被抽中的袋外数据作为测试集,可进行内部误差估计,产生OOB误差;
第42模块,用于为每个训练集分别建立分类回归树,产生由N棵CART决策树组成的森林;在每棵树生长过程中,从全部M个特征变量中随机抽选m个,在这m个属性中根据Gini系数最小原则选出最优属性进行内部节点分支,其中m≤M;汇总各类N棵决策树形成随机森林模型;利用测试集数据对随机森林模型进行测试;综合模型的测试结果,采用投票的方式得出最终的接地网腐蚀状态预测结果;其中,随机森林的规模和分裂时的特征维数m的设计需根据预测结果调整N的大小;
第43模块,用于将待预测的变电站接地网特征变量载入随机森林模型,求取各棵树输出的平均值,得到接地网腐蚀状况的评分预测结果;
第44模块,用于不断改变特征向量中的运行时间,获得评分结果与运行时间的关系;结合K-medoids法对原始样本集聚类的结果划分出预测结果的对应阶段,得出变电站接地网运行阶段与运行时间的关系作为运行阶段的预测结果;推导出运行寿命的预测结果。
相比现有技术,本发明的有益效果在于:
本发明公开了基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法及装置,获取各类初始数据,构建原始样本集;基于原始样本集特点,总结提取特征变量;考虑现有数据特征,采用K-medoids法对原始样本集进行聚类;采用随机森林算法处理各类样本,通过bootstrap抽样技术从各类样本集中抽取训练集,分别建立分类回归树并产生决策树,汇总形成随机森林模型;将待预测的变电站接地网特征变量载入随机森林模型,改变特征向量中的运行时间获得评分结果与运行时间的关系,推导出变电站接地网运行阶段与运行寿命的预测结果。
本发明改进了随机森林算法中对原始样本集分类的随机性,保障了样本抽样的多样性,使之能更科学合理地进行变电站接地网各运行阶段的预测;预测模型基于随机森林算法生成,该算法泛化误差可控,采用无监督学习的K-medoids法对数据集合的聚类准确度很高,且伸缩性较好;综合考虑影响变电站接地网状况的各种因素,可以准确地对一个变电站接地网未来的变化进行预测,并划分出不同的运行阶段以配合最合适的接地网故障检测方法来识别接地网对应阶段的腐蚀状况,最大限度地保障变电站接地网的安全运行。
附图说明
图1示出了本发明实施例提供的一种基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法的流程示意图;
图2示出了本发明实施例提供的一种各特征变量重要性的示意图;
图3示出了本发明实施例提供的一种变电站接地网运行阶段的预测结果及对应阶段适用的接地网故障诊断方法的示意图;
图4示出了本发明实施例提供的一种基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法的流程示意图;
图5示出了本发明实施例提供的一种基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测装置的结构示意图。
具体实施方式
下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
具体实施例一
如图1和图4所示,本发明实施例提供了一种基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法,包括以下步骤。
构建步骤S1,获取各类初始数据,构建原始样本集。该步骤中,所述各类初始数据可以包括变电站接地网的检修结果、接地网材质、土壤状况数据,以及气候数据等。其中,变电站接地网的检修结果、接地网材质、土壤状况等是从变电站的记录中获取的,气候等数据是从地区气象部门所获取的,整理这些不同变电站接地网各时间点进行检测的相关数据,构成原始样本集。本发明实施例对样本总数不做限定,其可以为120个。变电站接地网的检修结果可以包括变电站的新建、投运、维护、停运各时间段内进行接地网检修时接地网的腐蚀状况数据。
提取步骤S2,基于原始样本集特点,总结提取特征变量。该步骤总结提取原始样本集中各种影响接地网腐蚀的特征变量,如变电站电压等级、变电站运行时间、接地网材质、变电站所属地区年均雷暴发生次数、土壤含水量、土壤pH值、接地网防腐措施以及人为因素等其他变量。把各特征变量变电站接地网腐蚀的影响程度进行评分,获得初值,形成特征向量。本发明实施例中,原始样本可以拥有8个输入特征维。
聚类步骤S3,考虑现有数据特征,采用K-medoids法对原始样本集进行聚类。
预测步骤S4,采用随机森林算法处理各类样本,通过bootstrap抽样技术从各类样本集中抽取训练集,分别建立分类回归树并产生决策树,汇总形成随机森林模型;将待预测的变电站接地网特征变量载入随机森林模型,改变特征向量中的运行时间获得评分结果与运行时间的关系,推导出变电站接地网运行阶段与运行寿命的预测结果。
优选的,所述构建步骤S1,可以具体为:
获取变电站的新建、投运、维护、停运各时间段内进行接地网检修时接地网的腐蚀状况数据,并进行整理;
将腐蚀状况数据与接地网检修时的腐蚀状况配对以组成样本,利用不同变电站、不同时间段的样本构成原始样本集。
优选的,所述提取步骤S2,可以具体为:
基于腐蚀状况数据的特点和原始样本集的获取过程,总结提取影响变电站接地网运行阶段与运行寿命的若干个特征变量;所述特征变量包括变电站电压等级、变电站运行时间、接地网材质、变电站所属地区年均雷暴发生次数、土壤含水量、土壤pH值、接地网防腐措施、人为因素中的一种或多种;
以1~10为分值表示对变电站接地网进行检修时接地网腐蚀故障的严重程度;其中,分值越高,说明变电站接地网的腐蚀状况越严重;
分别以1~10为分值表示每个特征变量对接地网腐蚀的影响;其中,与某一特征向量相应的分值越高,说明该特征向量对变电站接地网的影响越大;
调整原始样本集的数据结构和数据格式,调整数据数据结构和格式以便于K-medoids法进行计算,为下一步的计算做准备。
原始的样本集数据量很大,且因为样本多围绕不同变电站不同时间点的数据,导致数据之间的交叉和重叠很多,单纯的使用随机森林算法去分类样本无法准确预测变电站接地网的运行阶段,所以先用K-medoids法对临近样本进行分类。优选的,所述聚类步骤S3中,K-medoids法的聚类过程可以包括:
步骤S31,整理样本,对样本数据进行初步处理,选用合适的数据结构存储训练数据和测试元组,将初步处理好的样本作为对象集X,输入指定聚类类数k,并在X中随机选取k个点作为初始的medoid;k为正整数;
步骤S32,根据距离最近原则将剩余数据对象分配到最接近的medoid,从而形成一类;
步骤S33,在每一类中计算每个点与类中其他对象距离的和值,选出和值最小的点作为新的medoid;
步骤S34,反复执行步骤S32和步骤S33直至满足medoid不再发生变化为止。
该步骤经过一系列迭代运算后,得到K-medoids法对原始样本集的聚类结果。例如,可以选取5个初始的medoid点,即K-medoids法把变电站接地网原始样本集大致分为5类,收敛条件为medoid不再发生变化,所得结果基本满足后续运行阶段预测的要求。
优选的,所述预测步骤S4,可以包括:
步骤S41,采用bootstrap抽样技术从已分类的各样本集中均匀抽取约N个训练集,每个训练集的大小约为单类数据集的2/3,每次抽样约有1/3的数据未被抽中;未被抽中的袋外数据(Out-of-bag)作为测试集,可进行内部误差估计,产生OOB误差;
步骤S42,为每个训练集分别建立分类回归树,产生由N棵CART决策树组成的森林;在每棵树生长过程中,从全部M个特征变量中随机抽选m个,在这m个属性中根据Gini系数最小原则选出最优属性进行内部节点分支,其中m≤M,在此过程中,随机选取的特征数目可以取m=log2(M+1),M为输入特征变量的总数;汇总各类N棵决策树形成随机森林模型;利用测试集数据对随机森林模型进行测试;综合模型的测试结果,采用投票的方式得出最终的接地网腐蚀状态预测结果;其中,对于随机森林的规模和分裂时的特征维数m的设计,需根据预测结果调整N的大小;
步骤S43,将待预测的变电站接地网特征变量载入随机森林模型,求取各棵树输出的平均值,得到接地网腐蚀状况的评分预测结果;
步骤S44,不断改变特征向量中的运行时间,获得评分结果与运行时间的关系;结合K-medoids法对原始样本集聚类的结果划分出预测结果的对应阶段,得出变电站接地网运行阶段与运行时间的关系作为运行阶段的预测结果;推导出运行寿命的预测结果。
例如,取每个训练集的大小约为单类数据集的2/3,则采用bootstrap抽样技术从以每类样本集中均匀随机抽取16个训练集;为每个训练集分别建立分类回归树,在每棵树生长过程中,从8个特征变量中随机抽选m=log2(8+1)≈3个特征变量,在这3个属性中根据Gini系数最小原则选出最优属性进行内部节点分支;汇总各分类共16×5=80个决策树形成的森林,利用剩余的约40个袋外数据进行测试,投票得到最终的接地网腐蚀状况结果。发明人发现,设定随机森林规模Ntree为500时,模型的预测效果比较好。OBB样本计算的各变量重要性的结果如图2所示;变电站接地网运行阶段的预测结果及对应阶段适用的接地网故障检测方法如图3所示。
本发明实施例改进了随机森林算法中对原始样本集分类的随机性,保障了样本抽样的多样性,使之能更科学合理地进行变电站接地网各运行阶段的预测;预测模型基于随机森林算法生成,该算法泛化误差可控,采用无监督学习的K-medoids法对数据集合的聚类准确度很高,且伸缩性较好;综合考虑影响变电站接地网状况的各种因素,可以准确地对一个变电站接地网未来的变化进行预测,并划分出不同的运行阶段以配合最合适的接地网故障检测方法来识别接地网对应阶段的腐蚀状况,最大限度地保障变电站接地网的安全运行。
在上述的具体实施例一中,提供了基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测方法,与之相对应的,本申请还提供基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测装置。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
具体实施例二
如图5所示,本发明实施例提供了一种基于改进随机森林算法的变电站接地网运行阶段及运行寿命预测装置,包括:
构建模块201,用于获取各类初始数据,构建原始样本集;
提取模块202,用于基于原始样本集特点,总结提取特征变量;
聚类模块203,用于考虑现有数据特征,采用K-medoids法对原始样本集进行聚类;
预测模块204,用于采用随机森林算法处理各类样本,通过bootstrap抽样技术从各类样本集中抽取训练集,分别建立分类回归树并产生决策树,汇总形成随机森林模型;将待预测的变电站接地网特征变量载入随机森林模型,改变特征向量中的运行时间获得评分结果与运行时间的关系,推导出变电站接地网运行阶段与运行寿命的预测结果。
优选的,所述构建模块201可以用于:
获取变电站的新建、投运、维护、停运各时间段内进行接地网检修时接地网的腐蚀状况数据,并进行整理;
将腐蚀状况数据与接地网检修时的腐蚀状况配对以组成样本,利用不同变电站、不同时间段的样本构成原始样本集。
优选的,所述提取模块202可以用于:
基于腐蚀状况数据的特点和原始样本集的获取过程,总结提取影响变电站接地网运行阶段与运行寿命的若干个特征变量;所述特征变量包括变电站电压等级、变电站运行时间、接地网材质、变电站所属地区年均雷暴发生次数、土壤含水量、土壤pH值、接地网防腐措施、人为因素中的一种或多种;
以1~10为分值表示对变电站接地网进行检修时接地网腐蚀故障的严重程度;其中,分值越高,说明变电站接地网的腐蚀状况越严重;
分别以1~10为分值表示每个特征变量对接地网腐蚀的影响;其中,与某一特征向量相应的分值越高,说明该特征向量对变电站接地网的影响越大;
调整原始样本集的数据结构和数据格式。
优选的,所述聚类模块203可以包括:
第31模块,用于整理样本,对样本数据进行初步处理,选用合适的数据结构存储训练数据和测试元组,将初步处理好的样本作为对象集X,输入指定聚类类数k,并在X中随机选取k个点作为初始的medoid;
第32模块,用于根据距离最近原则将剩余数据对象分配到最接近的medoid,从而形成一类;
第33模块,用于在每一类中计算每个点与类中其他对象距离的和值,选出和值最小的点作为新的medoid;
第34模块,用于反复调用第32模块和第33模块直至满足medoid不再发生变化为止。
优选的,所述预测模块204可以包括:
第41模块,用于采用bootstrap抽样技术从已分类的各样本集中均匀抽取N个训练集,每个训练集的大小为单类数据集的2/3,每次抽样有1/3的数据未被抽中;未被抽中的袋外数据作为测试集,可进行内部误差估计,产生OOB误差;
第42模块,用于为每个训练集分别建立分类回归树,产生由N棵CART决策树组成的森林;在每棵树生长过程中,从全部M个特征变量中随机抽选m个,在这m个属性中根据Gini系数最小原则选出最优属性进行内部节点分支,其中m≤M;汇总各类N棵决策树形成随机森林模型;利用测试集数据对随机森林模型进行测试;综合模型的测试结果,采用投票的方式得出最终的接地网腐蚀状态预测结果;其中,随机森林的规模和分裂时的特征维数m的设计需根据预测结果调整N的大小;
第43模块,用于将待预测的变电站接地网特征变量载入随机森林模型,求取各棵树输出的平均值,得到接地网腐蚀状况的评分预测结果;
第44模块,用于不断改变特征向量中的运行时间,获得评分结果与运行时间的关系;结合K-medoids法对原始样本集聚类的结果划分出预测结果的对应阶段,得出变电站接地网运行阶段与运行时间的关系作为运行阶段的预测结果;推导出运行寿命的预测结果。
本发明实施例改进了随机森林算法中对原始样本集分类的随机性,保障了样本抽样的多样性,使之能更科学合理地进行变电站接地网各运行阶段的预测;预测模型基于随机森林算法生成,该算法泛化误差可控,采用无监督学习的K-medoids法对数据集合的聚类准确度很高,且伸缩性较好;综合考虑影响变电站接地网状况的各种因素,可以准确地对一个变电站接地网未来的变化进行预测,并划分出不同的运行阶段以配合最合适的接地网故障检测方法来识别接地网对应阶段的腐蚀状况,最大限度地保障变电站接地网的安全运行。
本发明从使用目的上,效能上,进步及新颖性等观点进行阐述,其具有的实用进步性,己符合专利法所强调的功能增进及使用要件,本发明以上的说明及附图,仅为本发明的较佳实施例而己,并非以此局限本发明,因此,凡一切与本发明构造,装置,待征等近似、雷同的,即凡依本发明专利申请范围所作的等同替换或修饰等,皆应属本发明的专利申请保护的范围之内。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
Claims (8)
1.一种变电站接地网运行阶段及运行寿命预测方法,其特征在于,包括:
构建步骤,获取各类初始数据,构建原始样本集;
提取步骤,基于原始样本集特点,总结提取特征变量;
聚类步骤,考虑现有数据特征,采用 K-medoids 法对原始样本集进行聚类;
预测步骤, 包括:
采用 bootstrap 抽样技术从已分类的各样本集中均匀抽取 N 个训练集,每个训练集的大小为单类数据集的 2/3,每次抽样有 1/3 的数据未被抽中;未被抽中的袋外数据作为测试集,可进行内部误差估计,产生 OOB 误差;
为每个训练集分别建立分类回归树,产生由 N 棵 CART 决策树组成的森林;在每棵树生长过程中,从全部 M 个特征变量中随机抽选 m 个,在这 m 个属性中根据 Gini 系数最小原则选出最优属性进行内部节点分支,其中 m≤M;汇总各类 N 棵决策树形成随机森林模型;利用测试集数据对随机森林模型进行测试;综合模型的测试结果,采用投票的方式得出最终的接地网腐蚀状态预测结果;其中,随机森林的规模和分裂时的特征维数 m 的设计需根据预测结果调整 N 的大小;
将待预测的变电站接地网特征变量载入随机森林模型,求取各棵树输出的平均值,得到接地网腐蚀状况的评分预测结果;
不断改变特征变量中的运行时间,获得评分结果与运行时间的关系;结合 K-medoids法对原始样本集聚类的结果划分出预测结果的对应阶段,得出变电站接地网运行阶段与运行时间的关系作为运行阶段的预测结果;推导出运行寿命的预测结果。
2.根据权利要求1所述的变电站接地网运行阶段及运行寿命预测方法,其特征在于,所述构建步骤,具体为:
获取变电站的新建、投运、维护、停运各时间段内进行接地网检修时接地网的腐蚀状况数据,并进行整理;
将腐蚀状况数据与接地网检修时的腐蚀状况配对以组成样本,利用不同变电站、不同时间段的样本构成原始样本集。
3.根据权利要求2所述的变电站接地网运行阶段及运行寿命预测方法,其特征在于,所述提取步骤,具体为:
基于腐蚀状况数据的特点和原始样本集的获取过程,总结提取影响变电站接地网运行阶段与运行寿命的若干个特征变量;所述特征变量包括变电站电压等级、变电站运行时间、接地网材质、变电站所属地区年均雷暴发生次数、土壤含水量、土壤 pH 值、接地网防腐措施、人为因素中的一种或多种;
以 1~10 为分值表示对变电站接地网进行检修时接地网腐蚀故障的严重程度;其中,分值越高,说明变电站接地网的腐蚀状况越严重;
分别以 1~10 为分值表示每个特征变量对接地网腐蚀的影响;其中,与某一特征变量相应的分值越高,说明该特征变量对变电站接地网的影响越大;
调整原始样本集的数据结构和数据格式。
4.根据权利要求3所述的变电站接地网运行阶段及运行寿命预测方法,其特征在于,所述聚类步骤中,K-medoids 法的聚类过程包括:
步骤 S31,整理样本,对样本数据进行初步处理,选用合适的数据结构存储训练数据和测试元组,将初步处理好的样本作为对象集X,输入指定聚类类数k,并在 X 中随机选取 k个点作为初始的 medoid;
步骤 S32,根据距离最近原则将剩余数据对象分配到最接近的 medoid,从而形成一类;
步骤 S33,在每一类中计算每个点与类中其他对象距离的和值,选出和值最小的点作为新的 medoid;
步骤 S34,反复执行步骤 S32 和步骤 S33 直至满足 medoid 不再发生变化为止。
5.一种变电站接地网运行阶段及运行寿命预测装置,其特征在于,包括:
构建模块,用于获取各类初始数据,构建原始样本集;
提取模块,用于基于原始样本集特点,总结提取特征变量;
聚类模块,用于考虑现有数据特征,采用 K-medoids 法对原始样本集进行聚类;
预测模块,包括:
第 41 模块,用于采用 bootstrap 抽样技术从已分类的各样本集中均匀抽取 N个训练集,每个训练集的大小为单类数据集的 2/3,每次抽样有 1/3 的数据未被抽中;未被抽中的袋外数据作为测试集,可进行内部误差估计,产生 OOB 误差;
第 42 模块,用于为每个训练集分别建立分类回归树,产生由 N 棵 CART 决策树组成的森林;在每棵树生长过程中,从全部 M 个特征变量中随机抽选 m 个,在这 m 个属性中根据 Gini 系数最小原则选出最优属性进行内部节点分支,其中m≤M;汇总各类 N 棵决策树形成随机森林模型;利用测试集数据对随机森林模型进行测试;综合模型的测试结果,采用投票的方式得出最终的接地网腐蚀状态预测结果;其中,随机森林的规模和分裂时的特征维数 m 的设计需根据预测结果调整 N 的大小;
第 43 模块,用于将待预测的变电站接地网特征变量载入随机森林模型,求取各棵树输出的平均值,得到接地网腐蚀状况的评分预测结果;
第 44 模块,用于不断改变特征变量中的运行时间,获得评分结果与运行时间的关系;结合 K-medoids 法对原始样本集聚类的结果划分出预测结果的对应阶段,得出变电站接地网运行阶段与运行时间的关系作为运行阶段的预测结果;推导出运行寿命的预测结果。
6.根据权利要求 5 所述的变电站接地网运行阶段及运行寿命预测装置,其特征在于,所述构建模块用于:
获取变电站的新建、投运、维护、停运各时间段内进行接地网检修时接地网的腐蚀状况数据,并进行整理;
将腐蚀状况数据与接地网检修时的腐蚀状况配对以组成样本,利用不同变电站、不同时间段的样本构成原始样本集。
7.根据权利要求6所述的变电站接地网运行阶段及运行寿命预测装置,其特征在于,所述提取模块用于:
基于腐蚀状况数据的特点和原始样本集的获取过程,总结提取影响变电站接地网运行阶段与运行寿命的若干个特征变量;所述特征变量包括变电站电压等级、变电站运行时间、接地网材质、变电站所属地区年均雷暴发生次数、土壤含水量、土壤 pH 值、接地网防腐措施、人为因素中的一种或多种;
以 1~10 为分值表示对变电站接地网进行检修时接地网腐蚀故障的严重程度;其中,分值越高,说明变电站接地网的腐蚀状况越严重;
分别以 1~10 为分值表示每个特征变量对接地网腐蚀的影响;其中,与某一特征变量相应的分值越高,说明该特征变量对变电站接地网的影响越大;
调整原始样本集的数据结构和数据格式。
8.根据权利要求7所述的变电站接地网运行阶段及运行寿命预测装置,其特征在于,所述聚类模块包括:
第 31 模块,用于整理样本,对样本数据进行初步处理,选用合适的数据结构存储训练数据和测试元组,将初步处理好的样本作为对象集 X,输入指定聚类类数 k,并在 X 中随机选取 k 个点作为初始的 medoid;
第 32 模块,用于根据距离最近原则将剩余数据对象分配到最接近的 medoid,从而形成一类;
第 33 模块,用于在每一类中计算每个点与类中其他对象距离的和值,选出和值最小的点作为新的 medoid;
第 34 模块,用于反复调用第 32 模块和第 33 模块直至满足 medoid 不再发生变化为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811506511.5A CN109507535B (zh) | 2018-12-10 | 2018-12-10 | 变电站接地网运行阶段及运行寿命预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811506511.5A CN109507535B (zh) | 2018-12-10 | 2018-12-10 | 变电站接地网运行阶段及运行寿命预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109507535A CN109507535A (zh) | 2019-03-22 |
CN109507535B true CN109507535B (zh) | 2021-02-05 |
Family
ID=65753082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811506511.5A Active CN109507535B (zh) | 2018-12-10 | 2018-12-10 | 变电站接地网运行阶段及运行寿命预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109507535B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110223193A (zh) * | 2019-03-27 | 2019-09-10 | 东北电力大学 | 基于模糊聚类和rs-knn模型用于电网运行状态的判别方法及系统 |
CN112084459A (zh) * | 2019-06-12 | 2020-12-15 | 电计贸易(上海)有限公司 | 电池充放电循环寿命的预测方法、装置、电子终端、及存储介质 |
CN110515931B (zh) * | 2019-07-02 | 2023-04-18 | 电子科技大学 | 一种基于随机森林算法的电容型设备缺陷预测方法 |
CN110766059A (zh) * | 2019-10-14 | 2020-02-07 | 四川西部能源股份有限公司郫县水电厂 | 一种变压器故障的预测方法、装置和设备 |
CN111610406A (zh) * | 2020-04-24 | 2020-09-01 | 国网河北省电力有限公司电力科学研究院 | 一种基于深度学习的接地网腐蚀预测方法 |
CN111983512A (zh) * | 2020-08-18 | 2020-11-24 | 广东电网有限责任公司梅州供电局 | 线路接地装置监测系统和方法 |
CN112348264A (zh) * | 2020-11-10 | 2021-02-09 | 南京钢铁股份有限公司 | 一种基于随机森林算法的碳钢腐蚀速率预测方法 |
CN112288191B (zh) * | 2020-11-19 | 2022-05-06 | 国家海洋信息中心 | 一种基于多类机器学习方法的海洋浮标寿命预测方法 |
CN114742569A (zh) * | 2021-01-08 | 2022-07-12 | 广州视源电子科技股份有限公司 | 用户生命阶段预测方法、装置、计算机设备及存储介质 |
CN113642599A (zh) * | 2021-06-28 | 2021-11-12 | 中国铁道科学研究院集团有限公司 | 收入预测方法、运输系统以及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136539A (zh) * | 2013-03-08 | 2013-06-05 | 西安科技大学 | 接地网腐蚀速率等级预测方法 |
CN103163064A (zh) * | 2013-03-14 | 2013-06-19 | 陕西电力科学研究院 | 一种变电站接地网腐蚀速率的模糊预测方法 |
CN104075985A (zh) * | 2014-07-02 | 2014-10-01 | 国家电网公司 | 一种电力接地网使用寿命的评估方法 |
CN104462718A (zh) * | 2014-12-25 | 2015-03-25 | 国家电网公司 | 一种变电站经济运行年限区间评估方法 |
CN105652155A (zh) * | 2016-03-03 | 2016-06-08 | 国网山东省电力公司章丘市供电公司 | 一种变电站接地网故障腐蚀监测方法及系统 |
CN107067036A (zh) * | 2017-04-20 | 2017-08-18 | 西安科技大学 | 一种接地网腐蚀速率预测方法 |
CN107146004A (zh) * | 2017-04-20 | 2017-09-08 | 浙江大学 | 一种基于数据挖掘的矿渣粉磨系统健康状态识别系统及方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9784836B2 (en) * | 2013-11-08 | 2017-10-10 | Sharper Shape Oy | System for monitoring power lines |
-
2018
- 2018-12-10 CN CN201811506511.5A patent/CN109507535B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103136539A (zh) * | 2013-03-08 | 2013-06-05 | 西安科技大学 | 接地网腐蚀速率等级预测方法 |
CN103163064A (zh) * | 2013-03-14 | 2013-06-19 | 陕西电力科学研究院 | 一种变电站接地网腐蚀速率的模糊预测方法 |
CN104075985A (zh) * | 2014-07-02 | 2014-10-01 | 国家电网公司 | 一种电力接地网使用寿命的评估方法 |
CN104462718A (zh) * | 2014-12-25 | 2015-03-25 | 国家电网公司 | 一种变电站经济运行年限区间评估方法 |
CN105652155A (zh) * | 2016-03-03 | 2016-06-08 | 国网山东省电力公司章丘市供电公司 | 一种变电站接地网故障腐蚀监测方法及系统 |
CN107067036A (zh) * | 2017-04-20 | 2017-08-18 | 西安科技大学 | 一种接地网腐蚀速率预测方法 |
CN107146004A (zh) * | 2017-04-20 | 2017-09-08 | 浙江大学 | 一种基于数据挖掘的矿渣粉磨系统健康状态识别系统及方法 |
Non-Patent Citations (3)
Title |
---|
Prediction of Remaining Useful Lifetime (RUL) of turbofan engine using machine learning;Vimala Mathe et al.;《2017 IEEE International Conference on Circuits and Systems》;20180329;第307-308页,第311页 * |
变电站接地网腐蚀规律的研究及预测模型;李娜;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20150315;第5页、第11-14页、第35-41页 * |
接地网腐蚀状态检测及其寿命预测;杨滔;《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》;20130315;第55页、第63页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109507535A (zh) | 2019-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109507535B (zh) | 变电站接地网运行阶段及运行寿命预测方法及装置 | |
CN104463706B (zh) | 一种用于电网检测电压暂降事件原因的方法和系统 | |
CN110703057B (zh) | 基于数据增强和神经网络的电力设备局部放电诊断方法 | |
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN110929847A (zh) | 一种基于深度卷积神经网络的换流变压器故障诊断方法 | |
CN110598726A (zh) | 一种基于随机森林的输电杆塔鸟害风险预测方法 | |
CN111008641B (zh) | 一种基于卷积神经网络的输电线路杆塔外力破坏检测方法 | |
CN108304567B (zh) | 高压变压器工况模式识别与数据分类方法及系统 | |
Gagne et al. | Classification of convective areas using decision trees | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN118378198B (zh) | 一种输电线路污闪故障预测方法及系统 | |
CN118100171B (zh) | 能源转换系统的功率预测方法、系统和电子设备 | |
CN106846170B (zh) | 一种发电机组跳闸监测方法及其监测装置 | |
CN116203351A (zh) | 线路阻抗异常的检测方法及系统 | |
CN111178690A (zh) | 基于风控评分卡模型的用电客户窃电风险评估方法 | |
Ullah et al. | Adaptive data balancing method using stacking ensemble model and its application to non-technical loss detection in smart grids | |
CN106655225A (zh) | 一种三相不平衡治理装置及实现方法 | |
CN114021425A (zh) | 电力系统运行数据建模与特征选择方法、装置、电子设备和存储介质 | |
Cheng et al. | Reactive Power Load Forecasting based on K-means Clustering and Random Forest Algorithm | |
CN116663393A (zh) | 一种基于随机森林的配电网持续高温下故障风险等级预测方法 | |
CN110543675A (zh) | 一种输电线路故障识别方法 | |
CN115902557A (zh) | 开关柜故障诊断处理方法、装置及非易失性存储介质 | |
CN115184734A (zh) | 一种电网线路故障检测方法和系统 | |
CN114819248A (zh) | 一种基于随机森林的风电发电量预测方法及设备 | |
CN113837486A (zh) | 一种基于rnn-rbm的配网馈线长期负荷预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |