CN110287980A - 基于随机森林的主变压器故障诊断方法 - Google Patents

基于随机森林的主变压器故障诊断方法 Download PDF

Info

Publication number
CN110287980A
CN110287980A CN201910243758.0A CN201910243758A CN110287980A CN 110287980 A CN110287980 A CN 110287980A CN 201910243758 A CN201910243758 A CN 201910243758A CN 110287980 A CN110287980 A CN 110287980A
Authority
CN
China
Prior art keywords
data
random forest
main transformer
test
oil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910243758.0A
Other languages
English (en)
Inventor
吴琼
李红云
张万才
朱庆超
王兴勋
胡军
赵根
吴阳
何金良
庄池杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Beijing Guowang Fuda Technology Development Co Ltd
Original Assignee
Tsinghua University
Beijing Guowang Fuda Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, Beijing Guowang Fuda Technology Development Co Ltd filed Critical Tsinghua University
Priority to CN201910243758.0A priority Critical patent/CN110287980A/zh
Publication of CN110287980A publication Critical patent/CN110287980A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection

Abstract

本发明为基于随机森林的主变压器故障诊断方法,包括模型参数确定部分,实施预测部分,其特征在于,通过在分类过程中对错误记录进行收集及重新分类的自适应学习,提高了该诊断方法的准确率,并消除了一般分类方法中出现的过拟合现象。其有益效果是:利用变压器台账数据、油色谱历史数据、故障分析报告等数据进行模型学习和训练,建立主变压器油色谱诊断机器学习模型;对当前设备数据进行相应的诊断分析,根据历史模型得到相应的设备当前状态指标及预计故障模式。

Description

基于随机森林的主变压器故障诊断方法
技术领域
本发明涉及变压器缺陷、故障分析领域,特别是一种基于随机森林的主变压器故障诊断方法。
背景技术
目前对于变压器故障的诊断除了常规的元器件诊断方式外,最主要的诊断方式为三比值判断方法,即C2H2/C2H4、CH4/H2、C2H4/C2H6 作为输入的特征。输出故障类型,分为正常(无故障),短路故障,局部放电故障,过热故障和其他,这种算法可以起到一定的诊断作用,但是由于参数较少,存在较大的误差和较多的错误诊断情况。
增加诊断参数可以提高诊断准确度,但是会增加诊断数据的数学维度,增加学习和计算的难度,采用计算能力较强的计算设备会产生较高的诊断费用,得不偿失,而对于一些非数学的参数,也不可能通过降维方式实现对数学维度的控制。
发明内容
本发明的目的是为了解决上述问题,设计了一种基于随机森林的主变压器故障诊断方法。具体设计方案为:
从初始训练集训练出一个基学习器,获得一次基础训练样本,
所述调整步骤中,根据基学习器的表现对一次基础训练样本分布进行调整,使得先前基学习器做错的训练样本在后续得到纠正,获得一次调整训练样本和对应的权重值,
交替进行的第二次学习步骤中,基于所述一次调整训练样本分布来训练下一个基学习器,获得二次基础样本,
交替进行的第二次调整步骤中,根据基学习器的表现对二基础训练样本分布进行调整,使得先前基学习器做错的训练样本在后续得到纠正,获得二次调整训练样本和对应的权重值,
依次交替进行学习步骤、调整步骤T次。
基于随机森林的主变压器故障诊断方法,其特征在于,所述设备台账数据的参数包括设备名称、电压等级、设备类型、设备型号、生产厂商、出厂日期、投运日期、设备型式。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述色谱在线监测数据的参数包括单位、变电站、设备名称、生产厂家、监测时间、一氧化碳、二氧化碳、氧气、氢气、甲烷、乙炔、乙烯、乙烷、总烃。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,绝缘油试验作业报告的参数包括作业任务、作业开始时间、作业结束时间、工作地点、气温、湿度、天气、地点、间隔、功能位置、设备名称、型号、厂家、出厂编号、出厂日期,氢气、甲烷、乙炔、乙烯、乙烷、总烃、一氧化碳、二氧化碳、脱气量,水分分析第一、二、三次记录,上层油温,介损测试第一、二、三次记录,闪点测定第一、二次记录、平均值、修正值、检测结果,水溶性酸测试油样体积、蒸馏水体积、指示剂选用、PH值(比色)数据,酸值测定记录油重、KOH-C2H5OH溶液浓度、空白试验Vs0、空白试验Ve0、空白试验V0、样品试验、Vs0、样品试验Ve0、样品试验V0、酸值X数据,界面张力测试水与空气表面张力、油-水界面张力、检测仪器数据,含气量测试第一、二次、平均值数据,油颗粒度测试第一、二、三次、平均值数据,作业结论。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述加权步骤中,将这T次基学习器进行加权结合,基于“加性模型”,即基学习器的线性组合来最小化指数损失函数的分析算法。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述分析步骤中,使用所述分析算法在变压器故障诊断实例中进行分析,并针对分析数据量的大小,通过不同的实施预测步骤得到预测结果。
通过本发明的上述技术方案得到的基于随机森林的主变压器故障诊断方法,其有益效果是:
利用变压器在线监测、离线试验记录以及缺陷、故障分析报告等历史数据进行模型学习和训练,建立主变压器评估诊断机器学习模型;对当前设备数据进行相应的诊断分析,得到相应的设备当前状态指标及预计故障模式。
具体实施方式
下面对本发明进行具体描述。
一种基于随机森林的主变压器故障诊断方法,从初始训练集训练出一个基学习器,获得一次基础训练样本,
所述调整步骤中,根据基学习器的表现对一次基础训练样本分布进行调整,使得先前基学习器做错的训练样本在后续得到纠正,获得一次调整训练样本和对应的权重值,
交替进行的第二次学习步骤中,基于所述一次调整训练样本分布来训练下一个基学习器,获得二次基础样本,
交替进行的第二次调整步骤中,根据基学习器的表现对二次基础训练样本分布进行调整,使得先前基学习器做错的训练样本在后续得到纠正,获得二次调整训练样本和对应的权重值,
依次交替进行学习步骤、调整步骤T次。
基于随机森林的主变压器故障诊断方法,其特征在于,所述设备台账数据的参数包括设备名称、电压等级、设备类型、设备型号、生产厂商、出厂日期、投运日期、设备型式。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述色谱在线监测数据的参数包括单位、变电站、设备名称、生产厂家、监测时间、一氧化碳、二氧化碳、氧气、氢气、甲烷、乙炔、乙烯、乙烷、总烃。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,绝缘油试验作业报告的参数包括作业任务、作业开始时间、作业结束时间、工作地点、气温、湿度、天气、地点、间隔、功能位置、设备名称、型号、厂家、出厂编号、出厂日期,氢气、甲烷、乙炔、乙烯、乙烷、总烃、一氧化碳、二氧化碳、脱气量,水分分析第一、二、三次记录,上层油温,介损测试第一、二、三次记录,闪点测定第一、二次记录、平均值、修正值、检测结果,水溶性酸测试油样体积、蒸馏水体积、指示剂选用、PH值(比色)数据,酸值测定记录油重、KOH-C2H5OH溶液浓度、空白试验Vs0、空白试验Ve0、空白试验V0、样品试验、Vs0、样品试验Ve0、样品试验V0、酸值X数据,界面张力测试水与空气表面张力、油-水界面张力、检测仪器数据,含气量测试第一、二次、平均值数据,油颗粒度测试第一、二、三次、平均值数据,作业结论。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述加权步骤中,将这T次基学习器进行加权结合,基于“加性模型”,即基学习器的线性组合来最小化指数损失函数的分析算法。
所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述分析步骤中,使用所述分析算法在变压器故障诊断实例中进行分析,并针对分析数据量的大小,通过不同的实施预测步骤得到预测结果。
通过本发明的上述技术方案得到的基于随机森林的主变压器故障诊断方法,其有益效果是:
利用变压器在线监测、离线试验记录以及缺陷、故障分析报告等历史数据进行模型学习和训练,建立主变压器评估诊断机器学习模型;对当前设备数据进行相应的诊断分析,得到相应的设备当前状态指标及预计故障模式。
实施例1
以主变压器油色谱数据为例,对变压器故障诊断问题使用随机森林算法,训练10棵决策树,之后进行加权判断。输入的特征包含油气谱中的气体即氢气(H2)、甲烷(CH4)、乙炔(C2H2)、乙烯(C2H4)、乙烷(C2H6),一氧化碳(CO)、二氧化碳(CO2),总烃的量,同时为了兼顾三比值判断方法的优点,引入三个比值即C2H2/C2H4,CH4/H2和C2H4/C2H6也作为输入的特征。输出故障类型共分为10类,故障类型及对应标记序号见下表。
分别对220kV,330kV和750kV等级变压器的油色谱数据进行分析,并按照7比3的比例分为训练集和测试集,三个电压等级的样本数如下表。
采用随机森林方法,使用训练集数据进行模型的训练,并在测试集上进行测试。测试集上所得到的220kV,330kV和750kV三个电压等级下,诊断结果的混淆矩阵如下:
220kV变压器诊断结果的混淆矩阵
330kV变压器诊断结果的混淆矩阵
750kV变压器诊断结果的混淆矩阵
三个电压等级下的混淆矩阵表明,对于各类故障,测试集数据的预测准确度分别为99.93%,99.93%和99.99%,算法具备较高的准确率。
具体而言,220kV、330kV及750kV电压等级下出现最多的故障分别为150-300°C低温过热故障,低能量局部放电和低能量局部放电。其中,750kV电压等级下约有91%的记录被确定为低能量局部放电。
在具体实例下分析算法效果如下,其中气体含量的单位均为mL/L。
对于一个正常运行的750kV变压器运行实例,CH4含量为6.37,C2H4含量为0.19,C2H6含量为0.88,C2H2含量为0,H2含量为4.69,CO含量为310.77,CO2含量为0,总烃量为7.44,按照三比值的方法,C2H2/C2H4为0,CH4/H2为1.35821,C2H4/C2H6为0.21591。将这些特征参数输入给随机森林算法,共设置500个决策树,之后给出预测为:150-300°C低温过热故障的概率为1,其它故障的概率均为0。最后预测该样例处于150-300°C低温过热故障。
对于一个低能量局部放电故障的实例,CH4含量为0.91,C2H4含量为0,C2H6含量为0.59,C2H2含量为0.34,H2含量为26.5,CO含量为40.55,CO2含量为0,总烃量为0,按照三比值的方法,C2H2/C2H4为0,CH4/H2为0.0343,C2H4/C2H6为0。将这些特征参数输入给随机森林算法,之后给出预测为:低能量局部放电故障的概率为1,其它故障类型的概率均为0。最后预测该样例处于低能量局部放电故障。
实施例2
对于数据量较小的变压器数据,如果对其本身进行训练,根据训练结果进行判断,将面临数据量过小使得训练模型不稳定的问题。为解决此问题,同时验证采用所述方法的通用性,采用实施例1中所得模型,对数据量较小,且与实施例1中样本安装位置不同的220kV变压器油色谱数据进行分析。
采用实施例1中随机森林方法所得模型,对95组变压器的油色谱数据,所得诊断结果的混淆矩阵如下:
根据混淆矩阵结果,除去正常无故障的情况,多数故障集中于低于150-300°C的低温过热故障,次集中于低能量局部放电,与前述实施例1中的分析类似。同时,预测值的准确率达到了96.8%,表明了实施例1中得到模型的通用性。
上述技术方案表明,应用该诊断方法得到的预测结果及预测模型具有较高的准确率。在样本数较多时,分别进行样本的学习及参数确定过程,生成独立的学习模型,并根据学习模型进行预测。在样本数较小时,可利用已有学习模型进行故障预测,同样可以得到较为准确的预测结果。
上述技术方案仅体现了本发明技术方案的优选技术方案,本技术领域的技术人员对其中某些部分所可能做出的一些变动均体现了本发明的原理,属于本发明的保护范围之内。

Claims (7)

1.一种基于随机森林的主变压器油色谱分析诊断方法,包括模型参数确定部分,实施预测部分,其特征在于,在参数确定部分中,获得初始训练集,所述训练集中包括变压器设备台账数据、油色谱历史数据、故障分析报告,基于初始训练集进行基于随机森林方法的参数确定,在所述参数确定部分中,包括输入特征数目,训练集随机抽样,确定测试特征过程。
2.根据权利要求1中所述的随机森林方法,在实施预测部分,对于少量分析数据,直接利用已有的随机森林模型进行学习及预测,快速得到分析结果,对于大量分析数据,按照标准的随机森林过程,经过参数确定部分进行学习及预测。
3.根据权利要求1中所述的基于随机森林的主变压器油色谱分析诊断方法,其特征在于,所述学习步骤中,先从训练样本集中随机选出样本,作为基决策树的结点,对基决策树的每个结点,从该结点的属性集合中随机选择一个包含若干属性的子集,
重复进行的第二次学习步骤中,再次从训练样本集中随机选出样本,作为第二次学习步骤中基决策树的结点,对基决策树的每个结点,从该结点的属性集合中再次随机选择一个包含若干属性的子集,
重复进行上述步骤T次,得到的多个包含若干属性的子集构成决策树,形成随机森林,选择一个最优属性用于划分。
4.根据权利要求1中所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述设备台账数据的参数包括设备名称、电压等级、设备类型、设备型号、生产厂商、出厂日期、投运日期、设备型式。
5.根据权利要求1中所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述色谱在线监测数据的参数包括单位、变电站、设备名称、生产厂家、监测时间、一氧化碳、二氧化碳、氧气、氢气、甲烷、乙炔、乙烯、乙烷、总烃。
6.根据权利要求1中所述的基于随机森林的主变压器故障诊断方法,其特征在于,绝缘油试验作业报告的参数包括作业任务、作业开始时间、作业结束时间、工作地点、气温、湿度、天气、地点、间隔、功能位置、设备名称、型号、厂家、出厂编号、出厂日期,氢气、甲烷、乙炔、乙烯、乙烷、总烃、一氧化碳、二氧化碳、脱气量,水分分析第一、二、三次记录,上层油温,介损测试第一、二、三次记录,闪点测定第一、二次记录、平均值、修正值、检测结果,水溶性酸测试油样体积、蒸馏水体积、指示剂选用、PH值(比色)数据,酸值测定记录油重、KOH-C2H5OH溶液浓度、空白试验Vs0、空白试验Ve0、空白试验V0、样品试验、Vs0、样品试验Ve0、样品试验V0、酸值X数据,界面张力测试水与空气表面张力、油-水界面张力、检测仪器数据,含气量测试第一、二次、平均值数据,油颗粒度测试第一、二、三次、平均值数据,作业结论。
7.根据权利要求2中所述的基于随机森林的主变压器故障诊断方法,其特征在于,所述分析步骤中,使用所述分析算法在变压器故障诊断实例中进行分析,并针对分析数据量的大小,通过不同的实施预测步骤得到预测结果。
CN201910243758.0A 2019-03-28 2019-03-28 基于随机森林的主变压器故障诊断方法 Pending CN110287980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910243758.0A CN110287980A (zh) 2019-03-28 2019-03-28 基于随机森林的主变压器故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910243758.0A CN110287980A (zh) 2019-03-28 2019-03-28 基于随机森林的主变压器故障诊断方法

Publications (1)

Publication Number Publication Date
CN110287980A true CN110287980A (zh) 2019-09-27

Family

ID=68001247

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910243758.0A Pending CN110287980A (zh) 2019-03-28 2019-03-28 基于随机森林的主变压器故障诊断方法

Country Status (1)

Country Link
CN (1) CN110287980A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021210353A1 (ja) * 2020-04-13 2021-10-21 Kyb株式会社 故障予兆システム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102221655A (zh) * 2011-06-16 2011-10-19 河南省电力公司济源供电公司 基于随机森林模型的电力变压器故障诊断方法
CN107192915A (zh) * 2017-05-02 2017-09-22 国家电网公司 一种基于图论法的变压器故障诊断方法
CN107688170A (zh) * 2017-08-21 2018-02-13 哈尔滨工业大学 一种基于随机森林的雷达目标航迹起始方法
CN108197639A (zh) * 2017-12-14 2018-06-22 佛山科学技术学院 一种基于随机森林的变压器故障诊断方法
CN108445385A (zh) * 2018-05-10 2018-08-24 中国南方电网有限责任公司超高压输电公司检修试验中心 一种基于局放监测和油色谱分析的有载分接开关分接选择器状态评估方法
CN109142946A (zh) * 2018-06-29 2019-01-04 东华大学 基于蚁群算法优化随机森林的变压器故障检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102221655A (zh) * 2011-06-16 2011-10-19 河南省电力公司济源供电公司 基于随机森林模型的电力变压器故障诊断方法
CN107192915A (zh) * 2017-05-02 2017-09-22 国家电网公司 一种基于图论法的变压器故障诊断方法
CN107688170A (zh) * 2017-08-21 2018-02-13 哈尔滨工业大学 一种基于随机森林的雷达目标航迹起始方法
CN108197639A (zh) * 2017-12-14 2018-06-22 佛山科学技术学院 一种基于随机森林的变压器故障诊断方法
CN108445385A (zh) * 2018-05-10 2018-08-24 中国南方电网有限责任公司超高压输电公司检修试验中心 一种基于局放监测和油色谱分析的有载分接开关分接选择器状态评估方法
CN109142946A (zh) * 2018-06-29 2019-01-04 东华大学 基于蚁群算法优化随机森林的变压器故障检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陶栋琦 等: "基于随机森林的变压器故障检测方法的研究", 《电子器件》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021210353A1 (ja) * 2020-04-13 2021-10-21 Kyb株式会社 故障予兆システム

Similar Documents

Publication Publication Date Title
CN110188309B (zh) 基于隐马尔科夫模型的油浸式电力变压器缺陷预警方法
CN104535865A (zh) 基于多参数的电力变压器运行故障综合诊断方法
CN108663582A (zh) 一种变压器的故障诊断方法及系统
CN111579731B (zh) 一种基于组合模型的变压器早期缺陷预警方法
CN110286161A (zh) 基于自适应增强学习的主变压器故障诊断方法
CN106680211A (zh) 一种变压器油中溶解气体在线监测装置在线同步比对准确度的评价方法
CN111460727A (zh) 一种利用多参量的变压器寿命预测方法
Farooque et al. Artificial neural network (ANN) based implementation of Duval pentagon
CN114814501B (zh) 一种电容式电压互感器电容击穿故障在线诊断方法
CN110287980A (zh) 基于随机森林的主变压器故障诊断方法
CN112465010A (zh) 基于dkpca和kfda的变压器故障检测及分类方法
CN106951687A (zh) 基于模糊逻辑和证据推理的变压器绝缘应力计算和评价方法
PATEKAR et al. DGA analysis of transformer using Artificial neutral network to improve reliability in Power Transformers
CN110110816A (zh) 一种电力变压器故障推演方法
Atanasova-Höhlein et al. Gas-in-oil analysis and evaluation criteria for synthetic esters in offshore and traction transformers
Furundzic et al. Neural network ensemble for power transformers fault detection
CN107843788A (zh) 一种利用特征气体进行油浸变压器的故障诊断方法
Rediansyah et al. Study on artificial intelligence approaches for power transformer health index assessment
CN111880957A (zh) 一种基于随机森林模型的程序错误定位方法
Febriyanto et al. Oil-immersed power transformers condition diagnosis with limited dissolved gas analysis (DGA) data
CN107817784A (zh) 一种基于并发偏最小二乘的过程故障检测方法
CN114492559A (zh) 一种基于数据时频域建模的电力设备故障诊断方法
Gumilang Typical Gas Concentration Values and Typical Rate of Gas Increase on DGA Test in PLN UIT-JBT
CN114019365A (zh) 一种基于油中气体检测技术的有载分接开关故障诊断方法
Senoussaoui et al. Comparative study of DGA interpretation methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190927