CN112116058A - 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 - Google Patents

一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 Download PDF

Info

Publication number
CN112116058A
CN112116058A CN202010972596.7A CN202010972596A CN112116058A CN 112116058 A CN112116058 A CN 112116058A CN 202010972596 A CN202010972596 A CN 202010972596A CN 112116058 A CN112116058 A CN 112116058A
Authority
CN
China
Prior art keywords
granularity
cascade
forest model
transformer
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010972596.7A
Other languages
English (en)
Other versions
CN112116058B (zh
Inventor
刘可真
吴世浙
苟家萁
和婧
王骞
刘通
陈镭丹
陈雪鸥
阮俊枭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202010972596.7A priority Critical patent/CN112116058B/zh
Publication of CN112116058A publication Critical patent/CN112116058A/zh
Application granted granted Critical
Publication of CN112116058B publication Critical patent/CN112116058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/26Oils; Viscous liquids; Paints; Inks
    • G01N33/28Oils, i.e. hydrocarbon liquids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法,首先以变压器油中溶解特征气体的无编码比值作为模型的特征参量,再对特征参量进行归一化,划分训练集和测试集;然后构建多粒度级联森林模型,并通过粒子群算法优化多粒度级联森林的两个关键参数,并获得两个最优参数;最后建立基于粒子群算法优化的多粒度级联森林模型用于识别变压器故障类别,该方法有效提升了变压器的故障诊断准确率,为运维人员正确判断变压器的运行状况提供可靠依据。

Description

一种基于粒子群算法优化多粒度级联森林模型的变压器故障 诊断方法
技术领域
本发明涉及电力设备监控技术领域,尤其涉及一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法。
背景技术
变压器发生故障将危及整个电力系统安全稳定运行,变压器故障诊断方法可以对设备状态信息进行分析,是保证设备可靠、高效运行的关键。因此,快速准确地识别变压器的故障类型,进行及时检修工作,可为电力系统的正常运行提供重要保障。
油中溶解气体分析(Dissolved Gas Analysis,DGA)主要应用在油浸式变压器的在线监测。基于DGA的特征气体进行数据关联分析,国内外研究者提出了IEC比值法,Rogers比值法,Dornenburg比值法,电协研法等,但传统的DGA方法只给出了故障诊断的阈值判别边界,不能表现特征气体与故障类型之间的联系,无法满足变压器实际运行的要求。随着人工智能技术的进步和发展,机器学习方法应用在变压器故障诊断领域取得了显著成就。目前常用的有专家系统,深度置信网络(DBN),随机森林(RF)、模糊理论等,虽然这些机器学习方法在变压器故障诊断方面应用较广泛,但也存在一定的弊端。比如专家系统不能自主学习,工作效率低,难以得到准确的诊断结果;DBN具有较强的自主学习能力,但需大量样本数据进行训练,超参数调整复杂、学习周期长并容易过拟合;SVM处理变压器故障诊断多分类问题精度低;模糊理论的模糊处理过程较为复杂,而且模糊诊断的编码对应故障类型多是基于传统的气体比值或特征浓度诊断方法。鉴于此,提出一种基于粒子群算法优化多粒度级联森林模型(PSO-gcForest)的变压器故障诊断方法。
发明内容
本发明要解决的技术问题是提供一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法,使用该故障诊断方法能够快速搜索确定多粒度级联森林模型的最优参数,训练效率高、且能可靠识别变压器的故障状态,提高故障诊断准确率,从而实现对变压器运行状况的评估。
为解决上述技术问题,本发明提供了一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法,包括如下步骤:
S01、数据处理
S011、特征参量选取
变压器油中溶解的气体包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2),以CH4/H2、C2H2/C2H4、C2H4/C2H6、C2H2/(C1+C2)、H2/(H2+C1+C2)、C2H4/(C1+C2)、CH4/(C1+C2)、C2H6/(C1+C2)、(CH4+C2H4)/(C1+C2)等无编码比值作为特征参量,其中C1表示CH4,C2表示C2H2、C2H4、C2H6之和;
S012、特征参量归一化
对步骤S011中选取的无编码比值特征参量进行归一化处理,将数据映射到[0,1]之间,归一化公式如式(1),再按比例8:2将归一化后的数据划分为训练集数据和测试集数据;
Figure BDA0002684628480000031
其中,x*为归一化后的数据,xmin、xmax分别为某一维特征量的最小值与最大值,x为原始数据;
S02、构建基于粒子群算法优化的多粒度级联森林模型
S021、随机初始化粒子种群
设置粒子最大迭代次数Tmax、种群数量pop、多粒度扫描窗口大小w和级联森林允许的最大级联数l的初值、多粒度扫描窗口大小w和级联森林允许的最大级联数l的取值范围、多粒度扫描窗口大小w和级联森林允许的最大级联数l的搜索速度范围、惯性权重初始值ωini、惯性权重最终值ωfin、加速因子c1初始值c1,ini、加速因子c1最终值c1,fin、加速因子c2初始值c2,ini、加速因子c2最终值c2,fin
S022、构建多粒度级联森林模型
以步骤S021中的初始化粒子种群建立多粒度级联森林模型,多粒度级联森林模型由级联森林和多粒度扫描构成,具体构建步骤如下:
A、级联森林包括多层级联层,每层级联层由包含多棵子树的随机森林和极限梯度提升树构成,其中随机森林和极限梯度提升树采用CART算法生成决策树构成,所述决策树的生成步骤如下:
使用CART算法的成本函数和基尼系数如式(2)、(3)所示,对步骤S012中划分的的训练集数据和测试集数据进行处理,生成二叉树结构的决策树;
Figure BDA0002684628480000041
Figure BDA0002684628480000042
式中,Pt,k表示节点t属于类别k的训练实例百分比,yleft/right是左右两边子样本集的实例数,Gleft/right是衡量左右两边子样本集的不纯度;
B、多粒度扫描分为特征扫描和特征转换两个步骤,输入一个m×m维的原始特征向量,滑动窗口大小为q×q维,滑动步长为k,扫描窗口通过扫描原始特征向量提取特征信息,生成N个q维特征实例,如式(4)所示:
N=[(m-q)/k+1]2 (4)
C、每层级联森林输出j维类概率向量,所述类概率向量和原始特征向量拼接一起作为下一层级联森林的输入,经过随机森林和梯度提升树训练后,所有类概率向量连接为L维转换特征向量,如式(5)所示:
L=2×[(m-q)/k+1]2×j
(5)
D、级联森林逐层训练,对最后级联层的所有类向量通过逻辑回归产生最终类向量,从中取最大值得到原始特征向量的最终分类;
S023:构建粒子群算法优化的多粒度级联森林模型
以步骤S022构建的多粒度级联森林模型的多粒度扫描窗口大小w和级联森林允许的最大级联数l两个参数作为粒子,以多粒度级联森林模型的诊断准确率为粒子适应度,采用粒子群优化算法迭代搜索更新两个粒子的速度和位置,获得多粒度级联森林模型两个参数的最优值,以此为基础重新建立优化的多粒度级联森林模型,迭代搜索公式如式(6)~(7)所示:
Figure BDA0002684628480000051
Figure BDA0002684628480000052
式中,
Figure BDA0002684628480000053
表示第i个粒子t次迭代的d维坐标分量;
Figure BDA0002684628480000054
表示第i个粒子t次迭代的d维速度分量;ωt表示第t次迭代时的惯性权重;
Figure BDA0002684628480000055
Figure BDA0002684628480000056
表示第t次迭代时的两个加速因子;r1和r2表示[0,1]之间的随机值;Pi,d表示第i个粒子d维分量的局部最优值;Gd表示d维分量的整体最优值;
其中,根据迭代过程以及粒子的跟新位置对惯性权重采用非线性微分变化方式,平衡粒子搜索的全局性和收敛速度,如式(8)~(9)所示:
Figure BDA0002684628480000057
Figure BDA0002684628480000058
同时,对加速因子采用余弦函数动态调整方式,促进粒子的整体寻优与局部寻优能力互相协调,提高算法寻优能力,如式(10)~(11)所示;
Figure BDA0002684628480000061
Figure BDA0002684628480000062
式中,ωini和ωfin分别表示迭代惯性权重初始值和最终值;t表示当前迭代次数;Tmax表示最大迭代数;s1,ini、s1,fin与s2,ini、s2,fin分别表示加速因子s1与s2的初始值及最终值;
S03、得出变压器故障诊断结果
使用步骤S012中的测试集数据来测试步骤S023构建的粒子群算法优化的多粒度级联森林模型的性能,采用诊断正确率、诊断精度、召回率对变压器故障识别结果进行评估,得出变压器故障诊断结果;
后续只要将未知状态的变压器油中溶解气体按步骤S01处理,然后输入步骤S02构建好的基于粒子群算法优化的多粒度级联森林模型,就能诊断出该变压器的状态。
所述步骤S022中,为避免级联森林产生过拟合现象,对每个随机森林和梯度提升树的训练都采用5折交叉验证后产生类向量。
本发明提供的故障诊断方法与现有技术相比具备如下优点:本发明首先以变压器油中溶解特征气体的无编码比值作为模型的特征参量,再对特征参量进行归一化,划分训练集和测试集;然后构建多粒度级联森林模型,并通过粒子群算法优化多粒度级联森林的两个关键参数,并获得两个最优参数;最后建立基于粒子群算法优化多粒度级联森林模型(PSO-gcForest)来诊断识别变压器故障类别;上述模型相对于传统的机器学习模型训练效率高且能可靠识别变压器的故障状态,提高故障诊断正确率,为电力变压器的运行状况判断提供依据,为运维人员检修提供借鉴。
附图说明
图1为本发明所述的基于粒子群优化多粒度级联森林模型的变压器故障诊断方法工作流程框图;
图2为本发明实施例中粒子群优化多粒度级联森林模型的故障诊断结果示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法,包括如下步骤:
S01、数据处理
S011、特征参量选取
变压器油中溶解的气体包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2),以CH4/H2、C2H2/C2H4、C2H4/C2H6、C2H2/(C1+C2)、H2/(H2+C1+C2)、C2H4/(C1+C2)、CH4/(C1+C2)、C2H6/(C1+C2)、(CH4+C2H4)/(C1+C2)等无编码比值作为特征参量,其中C1表示CH4,C2表示C2H2、C2H4、C2H6之和;
S012、特征参量归一化
由于变压器油中溶解气体含量受到监测装置、环境温度、人员操作等方面的干扰和影响,需要对原始数据进行归一化处理,特征参量归一化处理可以减少数据对模型性能的影响,提升模型的训练速度和诊断准确率。
依据DL/T 722-2014导则将输出变压器故障状态分为N-正常、D1-高能放电、D2-低能放电、D3-局部放电、T1-高温过热、T2-中温过热、T3-低温过热等7种状态;
对步骤S011中选取的无编码比值特征参量进行归一化处理,将数据映射到[0,1]之间,归一化公式如式(1),再按比例8:2将归一化后的数据划分为训练集数据和测试集数据;
Figure BDA0002684628480000081
其中,x*为归一化后的数据,xmin、xmax分别为某一维特征量的最小值与最大值,x为原始数据;
S02、构建基于粒子群算法优化的多粒度级联森林模型
S021、随机初始化粒子种群
设置粒子最大迭代次数Tmax、种群数量pop、多粒度扫描窗口大小w和级联森林允许的最大级联数l的初值、多粒度扫描窗口大小w和级联森林允许的最大级联数l的取值范围、多粒度扫描窗口大小w和级联森林允许的最大级联数l的搜索速度范围、惯性权重初始值ωini、惯性权重最终值ωfin、加速因子c1初始值c1,ini、加速因子c1最终值c1,fin、加速因子c2初始值c2,ini、加速因子c2最终值c2,fin
S022、构建多粒度级联森林模型
以步骤S021中的初始化粒子种群建立多粒度级联森林模型,多粒度级联森林模型由级联森林和多粒度扫描构成,具体构建步骤如下:
A、级联森林包括多层级联层,每层级联层由包含多棵子树的随机森林和极限梯度提升树构成,其中随机森林和极限梯度提升树采用CART算法生成决策树构成,所述决策树的生成步骤如下:
使用CART算法的成本函数和基尼系数如式(2)、(3)所示,对步骤S012中划分的的训练集数据和测试集数据进行处理,生成二叉树结构的决策树;
Figure BDA0002684628480000091
Figure BDA0002684628480000092
式中,Pt,k表示节点t属于类别k的训练实例百分比,yleft/right是左右两边子样本集的实例数,Gleft/right是衡量左右两边子样本集的不纯度;
B、多粒度扫描分为特征扫描和特征转换两个步骤,输入一个m×m维的原始特征向量,滑动窗口大小为q×q维,滑动步长为k,扫描窗口通过扫描原始特征向量提取特征信息,生成N个q维特征实例,如式(4)所示:
N=[(m-q)/k+1]2 (4)
C、每层级联森林输出j维类概率向量,所述类概率向量和原始特征向量拼接一起作为下一层级联森林的输入,经过随机森林和梯度提升树训练后,所有类概率向量连接为L维转换特征向量,如式(5)所示:
L=2×[(m-q)/k+1]2×j
(5)
D、级联森林逐层训练,对最后级联层的所有类向量通过逻辑回归产生最终类向量,从中取最大值得到原始特征向量的最终分类;
级联森林的输入特征向量是多粒度扫描最终产生的特征向量,然后在级联森林层间进行监督学习,级联森林层间输出的类向量在逻辑回归之前都没有合并,产生的类向量和原始特征向量拼接一起作为下一层级联森林的输入;为了避免级联森林训练产生过拟合现象,对每个随机森林和梯度提升树的训练都采用5折交叉验证后产生类向量。
S023:构建粒子群算法优化的多粒度级联森林模型
以步骤S022构建的多粒度级联森林模型的多粒度扫描窗口大小w和级联森林允许的最大级联数l两个参数作为粒子,以多粒度级联森林模型的诊断准确率为粒子适应度,采用粒子群优化算法迭代搜索更新两个粒子的速度和位置,获得多粒度级联森林模型两个参数的最优值,以此为基础重新建立优化的多粒度级联森林模型,迭代搜索公式如式(6)~(7)所示:
Figure BDA0002684628480000101
Figure BDA0002684628480000102
式中,
Figure BDA0002684628480000103
表示第i个粒子t次迭代的d维坐标分量;
Figure BDA0002684628480000104
表示第i个粒子t次迭代的d维速度分量;ωt表示第t次迭代时的惯性权重;
Figure BDA0002684628480000105
Figure BDA0002684628480000106
表示第t次迭代时的两个加速因子;r1和r2表示[0,1]之间的随机值;Pi,d表示第i个粒子d维分量的局部最优值;Gd表示d维分量的整体最优值;
其中,根据迭代过程以及粒子的跟新位置对惯性权重采用非线性微分变化方式,平衡粒子搜索的全局性和收敛速度,如式(8)~(9)所示:
Figure BDA0002684628480000111
Figure BDA0002684628480000112
同时,对加速因子采用余弦函数动态调整方式,促进粒子的整体寻优与局部寻优能力互相协调,提高算法寻优能力,如式(10)~(11)所示;
Figure BDA0002684628480000113
Figure BDA0002684628480000114
式中,ωini和ωfin分别表示迭代惯性权重初始值和最终值;t表示当前迭代次数;Tmax表示最大迭代数;s1,ini、s1,fin与s2,ini、s2,fin分别表示加速因子s1与s2的初始值及最终值;
S03、得出变压器故障诊断结果
使用步骤S012中的测试集数据来测试步骤S023构建的粒子群算法优化的多粒度级联森林模型的性能,采用诊断正确率、诊断精度、召回率对变压器故障识别结果进行评估,得出变压器故障诊断结果;
其中,诊断准确率表示判别正确故障样本数与总样本数的比例,可以直接评估模型的泛化能力。诊断精度是指正确识别A类故障样本与所有识别为A类故障样本的比例,表征是否查准A类故障样本。召回率是指正确识别为A类故障样本与实际A类故障样本的百分比,表征是否查全A类故障样本。
后续只要将未知状态的变压器油中溶解气体按步骤S01处理,然后输入步骤S02构建好的基于粒子群算法优化的多粒度级联森林模型,就能诊断出该变压器的状态。
实施例
收集已知故障变压器的油中溶解气体样本数据,采用收集到的所有数据样本构成变压器故障数据集共1601组,其中以8:2比例划分训练集数据和测试集数据,其中1280例训练集数据进行监督训练,对模型进行调参,提高模型的拟合程度;321例测试集数据对模型的性能和泛化能力进行评估,从而实现变压器故障诊断;各故障类型的样本数据分布如表1所示。
表1故障样本数据分布
故障类型 训练集数据 测试集数据
正常(N) 133 33
高能放电(D1) 336 84
低能放电(D2) 119 30
局部放电(D3) 74 19
高温过热(T1) 224 56
中温过热(T2) 303 76
低温过热(T3) 91 23
总计 1280 321
根据表1的数据划分将变压器油中溶解气体的无编码比值作为特征参量输入基于粒子群算法优化的多粒度级联森林模型(PSO-gcForest),用以优化两个关键参数多粒度扫描窗口大小w和级联森林允许的最大级联数l,粒子适应度取自测试集数据的诊断正确率,在优化过程中设置参数如表2所示。
表2粒子群优化随机森林模型的参数
参数 取值 参数 取值
迭代次数T<sub>max</sub> 100 惯性权重最大值ω<sub>max</sub> 0.9
种群数量pop 20 惯性权重最小值ω<sub>min</sub> 0.4
w取值范围 [100,1000] 加速因子初始值c<sub>1,ini</sub> 2
w搜索范围 [-100,100] 加速因子最终值c<sub>1,fin</sub> 0.5
l取值范围 [3,9] 加速因子初始值c<sub>2,ini</sub> 0.5
l搜索范围 [-2,2] 加速因子最终值c<sub>2,fin</sub> 2
图2为本发明提供的一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法优化过程中故障诊断正确率示意图。多粒度级联森林模型(gcForest)的多粒度扫描窗口大小w和级联森林允许的最大级联数l经历5轮各100次的迭代,变压器故障诊断准确率分别在第68、49、54、65、52次迭代达到最优。与此同时,粒子群算法优化过程都是经过3至4步提升至最优适应度值93.62%,表明多粒度级联森林模型(gcForest)具有比较稳定的分类性能。最终多粒度扫描窗口大小w为4和级联森林允许的最大级联数l为5时,粒子适应度最优,达到了93.62%。
在故障诊断领域中,常用的机器学习模型有SVM、DBN等。因此,根据表1的样本集划分,以无编码比值作为特征参量输入SVM、DBN、多粒度级联森林模型(gcForest)和基于粒子群算法优化的多粒度级联森林模型(PSO-gcForest),进行不同诊断模型的对比分析,SVM、DBN及优化前的多粒度级联森林模型(gcForest)参数设置如表3所示,不同模型的诊断结果如表4所示。
表3 SVM、BPNN及gcForest模型参数
Figure BDA0002684628480000141
表4不同模型的诊断结果对比
Figure BDA0002684628480000142
Figure BDA0002684628480000151
从表4中看出,对比SVM、DBN和优化前的多粒度级联森林模型(gcForest),基于粒子群算法优化的多粒度级联森林模型(PSO-gcForest)的诊断正确率分别提升了10.72%、6.66%和1.45%,诊断性能最优。基于粒子群算法优化的多粒度级联森林模型(PSO-gcForest)的诊断精度和召回率均优于其他模型。
上述结果表明,针对油浸式电力变压器故障诊断问题,基于粒子群优化随机森林模型的诊断模型具有优异且稳定的性能,可为诊断变压器的运行状态提供依据,为运维人员检修提供借鉴。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (2)

1.一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法,其特征在于,包括如下步骤:
S01、数据处理
S011、特征参量选取
变压器油中溶解的气体包括氢气(H2)、甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2),以CH4/H2、C2H2/C2H4、C2H4/C2H6、C2H2/(C1+C2)、H2/(H2+C1+C2)、C2H4/(C1+C2)、CH4/(C1+C2)、C2H6/(C1+C2)、(CH4+C2H4)/(C1+C2)等无编码比值作为特征参量,其中C1表示CH4,C2表示C2H2、C2H4、C2H6之和;
S012、特征参量归一化
对步骤S011中选取的无编码比值特征参量进行归一化处理,将数据映射到[0,1]之间,归一化公式如式(1),再按比例8:2将归一化后的数据划分为训练集数据和测试集数据;
Figure FDA0002684628470000011
其中,x*为归一化后的数据,xmin、xmax分别为某一维特征量的最小值与最大值,x为原始数据;
S02、构建基于粒子群算法优化的多粒度级联森林模型
S021、随机初始化粒子种群
设置粒子最大迭代次数Tmax、种群数量pop、多粒度扫描窗口大小w和级联森林允许的最大级联数l的初值、多粒度扫描窗口大小w和级联森林允许的最大级联数l的取值范围、多粒度扫描窗口大小w和级联森林允许的最大级联数l的搜索速度范围、惯性权重初始值ωini、惯性权重最终值ωfin、加速因子c1初始值c1,ini、加速因子c1最终值c1,fin、加速因子c2初始值c2,ini、加速因子c2最终值c2,fin
S022、构建多粒度级联森林模型
以步骤S021中的初始化粒子种群建立多粒度级联森林模型,多粒度级联森林模型由级联森林和多粒度扫描构成,具体构建步骤如下:
A、级联森林包括多层级联层,每层级联层由包含多棵子树的随机森林和极限梯度提升树构成,其中随机森林和极限梯度提升树采用CART算法生成决策树构成,所述决策树的生成步骤如下:
使用CART算法的成本函数和基尼系数如式(2)、(3)所示,对步骤S012中划分的的训练集数据和测试集数据进行处理,生成二叉树结构的决策树;
Figure FDA0002684628470000021
Figure FDA0002684628470000022
式中,Pt,k表示节点t属于类别k的训练实例百分比,yleft/right是左右两边子样本集的实例数,Gleft/right是衡量左右两边子样本集的不纯度;
B、多粒度扫描分为特征扫描和特征转换两个步骤,输入一个m×m维的原始特征向量,滑动窗口大小为q×q维,滑动步长为k,扫描窗口通过扫描原始特征向量提取特征信息,生成N个q维特征实例,如式(4)所示:
N=[(m-q)/k+1]2 (4)
C、每层级联森林输出j维类概率向量,所述类概率向量和原始特征向量拼接一起作为下一层级联森林的输入,经过随机森林和梯度提升树训练后,所有类概率向量连接为L维转换特征向量,如式(5)所示:
L=2×[(m-q)/k+1]2×j
(5)
D、级联森林逐层训练,对最后级联层的所有类向量通过逻辑回归产生最终类向量,从中取最大值得到原始特征向量的最终分类;
S023:构建粒子群算法优化的多粒度级联森林模型
以步骤S022构建的多粒度级联森林模型的多粒度扫描窗口大小w和级联森林允许的最大级联数l两个参数作为粒子,以多粒度级联森林模型的诊断准确率为粒子适应度,采用粒子群优化算法迭代搜索更新两个粒子的速度和位置,获得多粒度级联森林模型两个参数的最优值,以此为基础重新建立优化的多粒度级联森林模型,迭代搜索公式如式(6)~(7)所示:
Figure FDA0002684628470000031
Figure FDA0002684628470000032
式中,
Figure FDA0002684628470000033
表示第i个粒子t次迭代的d维坐标分量;
Figure FDA0002684628470000034
表示第i个粒子t次迭代的d维速度分量;ωt表示第t次迭代时的惯性权重;
Figure FDA0002684628470000035
Figure FDA0002684628470000036
表示第t次迭代时的两个加速因子;r1和r2表示[0,1]之间的随机值;Pi,d表示第i个粒子d维分量的局部最优值;Gd表示d维分量的整体最优值;
其中,根据迭代过程以及粒子的跟新位置对惯性权重采用非线性微分变化方式,平衡粒子搜索的全局性和收敛速度,如式(8)~(9)所示:
Figure FDA0002684628470000041
Figure FDA0002684628470000042
同时,对加速因子采用余弦函数动态调整方式,促进粒子的整体寻优与局部寻优能力互相协调,提高算法寻优能力,如式(10)~(11)所示;
Figure FDA0002684628470000043
Figure FDA0002684628470000044
式中,ωini和ωfin分别表示迭代惯性权重初始值和最终值;t表示当前迭代次数;Tmax表示最大迭代数;s1,ini、s1,fin与s2,ini、s2,fin分别表示加速因子s1与s2的初始值及最终值;
S03、得出变压器故障诊断结果
使用步骤S012中的测试集数据来测试步骤S023构建的粒子群算法优化的多粒度级联森林模型的性能,采用诊断正确率、诊断精度、召回率对变压器故障识别结果进行评估,得出变压器故障诊断结果;
后续只要将未知状态的变压器油中溶解气体按步骤S01处理,然后输入步骤S02构建好的基于粒子群算法优化的多粒度级联森林模型,就能诊断出该变压器的状态。
2.根据权利要求1所述的一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法,其特征在于,所述步骤S022中,为避免级联森林产生过拟合现象,对每个随机森林和梯度提升树的训练都采用5折交叉验证后产生类向量。
CN202010972596.7A 2020-09-16 2020-09-16 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法 Active CN112116058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010972596.7A CN112116058B (zh) 2020-09-16 2020-09-16 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010972596.7A CN112116058B (zh) 2020-09-16 2020-09-16 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法

Publications (2)

Publication Number Publication Date
CN112116058A true CN112116058A (zh) 2020-12-22
CN112116058B CN112116058B (zh) 2022-05-31

Family

ID=73802155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010972596.7A Active CN112116058B (zh) 2020-09-16 2020-09-16 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法

Country Status (1)

Country Link
CN (1) CN112116058B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686529A (zh) * 2020-12-28 2021-04-20 广西大学 一种高维量子行走深度森林的变压器寿命评估方法
CN113111574A (zh) * 2021-03-28 2021-07-13 西南大学 一种基于b-cmopso算法优化的电力变压器故障特征选择方法
CN113283479A (zh) * 2021-05-11 2021-08-20 西安交通大学 一种适用于电力变压器故障的特征提取与诊断方法
CN113569482A (zh) * 2021-07-29 2021-10-29 石家庄铁道大学 隧道服役性能的评估方法、装置、终端及存储介质
CN113702728A (zh) * 2021-07-12 2021-11-26 广东工业大学 一种基于组合采样和LightGBM的变压器故障诊断方法及系统
CN113917370A (zh) * 2021-09-29 2022-01-11 浙江工业大学 一种基于油中溶解气体小样本数据的变压器故障诊断方法
CN114172963A (zh) * 2021-10-15 2022-03-11 合肥工业大学 基于资源利用率的多粒度的任务与服务匹配方法和系统
CN114639441A (zh) * 2022-05-18 2022-06-17 山东建筑大学 一种基于带权多粒度扫描的转录因子结合位点预测方法
CN114925856A (zh) * 2022-05-27 2022-08-19 中国人民解放军国防科技大学 一种多粒度感知集成学习方法、装置、计算机设备和介质
CN116451812A (zh) * 2023-04-12 2023-07-18 北京科技大学 基于多粒度级联森林和超参优化的润湿性预测方法及装置
CN116702063A (zh) * 2023-05-06 2023-09-05 中国长江电力股份有限公司 一种基于EMD-gcForest模型的变压器油中溶解气体浓度预测方法
CN117708696A (zh) * 2023-11-29 2024-03-15 国网湖北省电力有限公司超高压公司 一种基于LGEO-gcForest的油浸式变压器故障诊断方法
CN117786560A (zh) * 2024-02-28 2024-03-29 通用电梯股份有限公司 一种基于多粒度级联森林的电梯故障分类方法及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108343599A (zh) * 2018-01-10 2018-07-31 中国水利水电科学研究院 一种基于多粒度级联森林的水泵机组智能故障诊断方法
CN109657945A (zh) * 2018-12-06 2019-04-19 华中科技大学 一种基于数据驱动的工业生产过程故障诊断方法
CN110596492A (zh) * 2019-09-17 2019-12-20 昆明理工大学 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法
CN110766222A (zh) * 2019-10-22 2020-02-07 太原科技大学 基于粒子群参数优化和随机森林的pm2.5浓度预测方法
US10586614B1 (en) * 2016-04-22 2020-03-10 Iqvia Inc. System and method for timely multi-channel notification of treatment
CN111245365A (zh) * 2020-01-09 2020-06-05 南京工业大学 基于动态加权深度森林的光伏组件故障诊断方法
CN111426816A (zh) * 2020-04-10 2020-07-17 昆明理工大学 一种基于pso-lstm的变压器油中溶解气体浓度预测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10586614B1 (en) * 2016-04-22 2020-03-10 Iqvia Inc. System and method for timely multi-channel notification of treatment
CN108343599A (zh) * 2018-01-10 2018-07-31 中国水利水电科学研究院 一种基于多粒度级联森林的水泵机组智能故障诊断方法
CN109657945A (zh) * 2018-12-06 2019-04-19 华中科技大学 一种基于数据驱动的工业生产过程故障诊断方法
CN110596492A (zh) * 2019-09-17 2019-12-20 昆明理工大学 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法
CN110766222A (zh) * 2019-10-22 2020-02-07 太原科技大学 基于粒子群参数优化和随机森林的pm2.5浓度预测方法
CN111245365A (zh) * 2020-01-09 2020-06-05 南京工业大学 基于动态加权深度森林的光伏组件故障诊断方法
CN111426816A (zh) * 2020-04-10 2020-07-17 昆明理工大学 一种基于pso-lstm的变压器油中溶解气体浓度预测方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JING XU 等: "A Novel Deep Flexible Neural Forest Model for Classification of Cancer Subtypes Based on Gene Expression Data", 《IEEE ACCESS》, 1 March 2019 (2019-03-01), pages 22086 - 22095 *
XIAOLIAN LIU 等: "Deep forest based intelligent fault diagnosis of hydraulic turbine", 《JOURNAL OF MECHANICAL SCIENCE AND TECHNOLOGY》, 8 May 2019 (2019-05-08), pages 2049 - 2058 *
徐英杰 等: "基于多粒度级联多层梯度提升树的选票手写字符识别算法", 《计算机应用》, 20 July 2019 (2019-07-20), pages 26 - 30 *
林睦纲 等: "一种动态调整加速因子的微粒群优化算法", 《电脑知识与技术》, vol. 5, no. 34, 31 December 2019 (2019-12-31), pages 9816 - 9818 *
肖根福 等: "一种求解大规模问题的自学习协同粒子群算法", 《井冈山大学学报(自然科学版)》, 31 May 2018 (2018-05-31), pages 32 - 37 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112686529A (zh) * 2020-12-28 2021-04-20 广西大学 一种高维量子行走深度森林的变压器寿命评估方法
CN112686529B (zh) * 2020-12-28 2023-03-24 广西大学 一种高维量子行走深度森林的变压器寿命评估方法
CN113111574A (zh) * 2021-03-28 2021-07-13 西南大学 一种基于b-cmopso算法优化的电力变压器故障特征选择方法
CN113283479A (zh) * 2021-05-11 2021-08-20 西安交通大学 一种适用于电力变压器故障的特征提取与诊断方法
CN113702728A (zh) * 2021-07-12 2021-11-26 广东工业大学 一种基于组合采样和LightGBM的变压器故障诊断方法及系统
CN113569482A (zh) * 2021-07-29 2021-10-29 石家庄铁道大学 隧道服役性能的评估方法、装置、终端及存储介质
CN113569482B (zh) * 2021-07-29 2024-02-06 石家庄铁道大学 隧道服役性能的评估方法、装置、终端及存储介质
CN113917370B (zh) * 2021-09-29 2023-12-29 浙江工业大学 一种基于油中溶解气体小样本数据的变压器故障诊断方法
CN113917370A (zh) * 2021-09-29 2022-01-11 浙江工业大学 一种基于油中溶解气体小样本数据的变压器故障诊断方法
CN114172963A (zh) * 2021-10-15 2022-03-11 合肥工业大学 基于资源利用率的多粒度的任务与服务匹配方法和系统
CN114639441A (zh) * 2022-05-18 2022-06-17 山东建筑大学 一种基于带权多粒度扫描的转录因子结合位点预测方法
CN114925856A (zh) * 2022-05-27 2022-08-19 中国人民解放军国防科技大学 一种多粒度感知集成学习方法、装置、计算机设备和介质
CN114925856B (zh) * 2022-05-27 2023-02-03 中国人民解放军国防科技大学 一种多粒度感知集成学习方法、装置、计算机设备和介质
CN116451812A (zh) * 2023-04-12 2023-07-18 北京科技大学 基于多粒度级联森林和超参优化的润湿性预测方法及装置
CN116451812B (zh) * 2023-04-12 2024-02-09 北京科技大学 基于多粒度级联森林和超参优化的润湿性预测方法及装置
CN116702063A (zh) * 2023-05-06 2023-09-05 中国长江电力股份有限公司 一种基于EMD-gcForest模型的变压器油中溶解气体浓度预测方法
CN117708696A (zh) * 2023-11-29 2024-03-15 国网湖北省电力有限公司超高压公司 一种基于LGEO-gcForest的油浸式变压器故障诊断方法
CN117786560A (zh) * 2024-02-28 2024-03-29 通用电梯股份有限公司 一种基于多粒度级联森林的电梯故障分类方法及电子设备
CN117786560B (zh) * 2024-02-28 2024-05-07 通用电梯股份有限公司 一种基于多粒度级联森林的电梯故障分类方法及电子设备

Also Published As

Publication number Publication date
CN112116058B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN112116058B (zh) 一种基于粒子群算法优化多粒度级联森林模型的变压器故障诊断方法
CN110596492B (zh) 一种基于粒子群算法优化随机森林模型的变压器故障诊断方法
Liao et al. Fault diagnosis of power transformers using graph convolutional network
CN111722046B (zh) 一种基于深度森林模型的变压器故障诊断方法
CN110929847A (zh) 一种基于深度卷积神经网络的换流变压器故障诊断方法
CN110879373B (zh) 一种神经网络和决策融合的油浸式变压器故障诊断方法
CN110705887A (zh) 一种基于神经网络模型的低压台区运行状态综合评价方法
CN111199252A (zh) 一种电力通信网络智能运维系统的故障诊断方法
CN112181706B (zh) 一种基于对数区间隔离的电力调度数据异常检测方法
CN114553671A (zh) 一种电力通信网故障告警的诊断方法
CN116562114A (zh) 一种基于图卷积神经网络的电力变压器故障诊断方法
CN114358116A (zh) 油浸式变压器故障诊断方法、系统及可读存储介质
CN112926895A (zh) 一种光伏电站系统综合能效评价方法
CN116842337A (zh) 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法
CN109740722A (zh) 一种基于Memetic算法的网络表示学习方法
CN117473424A (zh) 基于随机森林的变压器故障诊断方法、系统、设备及介质
CN118152945A (zh) 一种基于组件拓扑图的水电站辅助设备故障定位方法
Zhong et al. CAE‐WANN: A novel anomaly detection method for gas turbines via search space extension
CN108038518A (zh) 一种基于气象数据的光伏发电功率确定方法及系统
CN116663414A (zh) 一种用于电力变压器的故障诊断方法及系统
CN115734274A (zh) 一种基于深度学习和知识图谱的蜂窝网络故障诊断方法
CN115811478A (zh) 一种基于图神经网络的无人集群系统网络安全评估方法
CN114692729A (zh) 基于深度学习的新能源场站不良数据辨识与修正方法
CN117688504B (zh) 基于图结构学习的物联网异常检测方法及装置
Li et al. Hyperbolic Network Latent Space Model with Learnable Curvature

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant