CN116933162A - 一种变压器运行状态确定方法、装置及电子设备 - Google Patents

一种变压器运行状态确定方法、装置及电子设备 Download PDF

Info

Publication number
CN116933162A
CN116933162A CN202310717593.2A CN202310717593A CN116933162A CN 116933162 A CN116933162 A CN 116933162A CN 202310717593 A CN202310717593 A CN 202310717593A CN 116933162 A CN116933162 A CN 116933162A
Authority
CN
China
Prior art keywords
target
data
dissolved gas
transformer
gas data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310717593.2A
Other languages
English (en)
Inventor
袁胜聪
刘家俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Lichuan Intelligent Technology Co ltd
Original Assignee
Xi'an Lichuan Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xi'an Lichuan Intelligent Technology Co ltd filed Critical Xi'an Lichuan Intelligent Technology Co ltd
Priority to CN202310717593.2A priority Critical patent/CN116933162A/zh
Publication of CN116933162A publication Critical patent/CN116933162A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/26Oils; Viscous liquids; Paints; Inks
    • G01N33/28Oils, i.e. hydrocarbon liquids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2131Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on a transform domain processing, e.g. wavelet transform
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical & Material Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种变压器运行状态确定方法、装置及电子设备,其中,该方法通过获取目标变压器的变压器油中的溶解气体数据,确定不同目标溶解气体数据之间的关联特征,基于该不同目标溶解气体数据之间的关联特征,利用预设故障诊断模型,确定目标变压器的目标运行状态。由于不同目标溶解气体数据之间的关联特征是基于不同类型目目标溶解气体数据之间的支持度与置信度确定得到的,该关联特征能够更为精准地表征不同溶解气体之间的关联关系,能够更为综合地反映变压器油中的各气体成分之间的关系。因此,选用本申请实施例,可借助不同指标参数对变压器的状态进行综合诊断,进一步得到更为精准的电力变压器运行状态的预测结果。

Description

一种变压器运行状态确定方法、装置及电子设备
技术领域
本申请涉及故障检测技术领域,尤其涉及一种变压器运行状态确定方法、装置及电子设备。
背景技术
电力变压器作为一种常见的电气器设备,常用于将某一数值的电压变成另一种或者另外几种数值不同的电压,其能够安全、稳定地运行是保证电力系统稳定运行的重要基础。但是,电力变压器在运行过程中常受到众多外界因素的共同作用,突发性的故障是很难避免的。
为了提高电力变压器的运行稳定性,相关技术提出通过变压器油色谱含量分析,来对电力变压器的运行状态进行检测或者预测。然而,现有的通过变压器油色谱含量分析的方法通常只能预测单一的指标参数,由于单一的指标参数无法精准表征电力变压器的状态,因此,现有的电力变压器运行状态的预测方法很难得到精准的电力变压器运行状态的预测结果。
发明内容
有鉴于此,本申请实施例提供了一种变压器运行状态确定方法、装置及电子设备,以提高电力变压器运行状态的预测精度。
第一方面,本申请实施例提供了一种变压器运行状态确定方法,该方法包括:
获取目标变压器的变压器油中的溶解气体数据,其中,所述溶解气体数据包括不同类型的目标溶解气体数据;
基于所述不同类型的目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征,其中,所述关联特征是基于不同类型目标溶解气体数据之间的支持度与置信度确定得到的;
基于所述关联特征,利用预设故障诊断模型,确定所述目标变压器的目标运行状态。
结合第一方面,在第二种可能的实施例中,所述基于所述不同类型的目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征,包括:
针对所述不同类型的目标溶解气体数据,构建不同的候选数据项集;
利用预设关联规则挖掘算法,从所述不同的候选数据项集中确定出满足最小支持度要求的各目标频繁项集;
基于各所述目标频繁项集,确定所述不同类型的目标溶解气体数据之间的关联特征。
结合第一方面,在第三种可能的实施例中,所述方法还包括:
对所述目标变压器的变压器油中的溶解气体数据进行数据预处理,获取所述不同类型的目标溶解气体数据。
结合第一方面的第三种可能的实施例,在第四种可能的实施例中,所述对所述目标变压器的变压器油中的溶解气体数据进行数据预处理包括:
对所述目标变压器的变压器油中的溶解气体数据进行数据清洗,获取第一目标数据;
针对所述第一目标数据,基于k均值聚类进行离散化处理,得到第二目标数据;
基于所述第二目标数据进行数据符号化处理,以得到所述不同类型的目标溶解气体数据。
结合第一方面,在第五种可能的实施例中,所述方法还包括:
利用预设数据变换算法,对目标类型的溶解气体数据进行数据分解,获取所述目标类型的溶解气体数据序列的各个子序列,其中,所述目标类型的溶解气体数据为所述支持度与所述置信度满足预设筛选条件溶解气体数据;
基于各所述子序列,利用预先训练得到的长短期记忆网络模型,确定各所述子序列各自对应的目标类型的溶解气体数据的预测结果;
对各所述预测结果进行叠加重构处理,以得到所述目标类型的溶解气体数据的最终预测结果。
结合第一方面的第五种可能的实施例,在第六种可能的实施例中,基于所述关联特征,利用预设故障诊断模型,确定所述目标变压器的目标运行状态,包括:
基于所述目标类型的溶解气体数据的最终预测结果,利用所述预设故障诊断模型,确定所述目标变压器的目标运行状态。
第二方面,本申请实施例提供了一种变压器运行状态确定装置,其中,该装置包括:
获取模块,用于获取目标变压器的变压器油中的溶解气体数据,其中,所述溶解气体数据包括不同类型的目标溶解气体数据;
关联特征确定模块,用于基于所述不同类型的目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征,其中,所述关联特征是基于不同类型目标溶解气体数据之间的支持度与置信度确定得到的;
变压器运行状态确定模块,用于基于所述关联特征,利用预设故障诊断模型,确定所述目标变压器的目标运行状态。
结合第二方面,在第二种可能的实施例中,所述关联特征确定模块,具体用于针对所述不同类型的目标溶解气体数据,构建不同的候选数据项集;利用预设关联规则挖掘算法,从所述不同的候选数据项集中确定出满足最小支持度要求的各目标频繁项集;基于各所述目标频繁项集,确定所述不同类型的目标溶解气体数据之间的关联特征。
结合第二方面,在第三种可能的实施例中,所述装置还包括:
数据预处理模块,用于对所述目标变压器的变压器油中的溶解气体数据进行数据预处理,获取所述不同类型的目标溶解气体数据。
结合第二方面的第三种可能的实施例,在第四种可能的实施例中,所述数据预处理模块,具体用于对所述目标变压器的变压器油中的溶解气体数据进行数据清洗,获取第一目标数据;针对所述第一目标数据,基于k均值聚类进行离散化处理,得到第二目标数据;基于所述第二目标数据进行数据符号化处理,以得到所述不同类型的目标溶解气体数据。
结合第二方面,在第五种可能的实施例中,所述装置还包括:
数据变换模块,用于利用预设数据变换算法,对目标类型的溶解气体数据进行数据分解,获取所述目标类型的溶解气体数据序列的各个子序列,其中,所述目标类型的溶解气体数据为所述支持度与所述置信度满足预设筛选条件溶解气体数据;
初期预测结果确定模块,用于基于各所述子序列,利用预先训练得到的长短期记忆网络模型,确定各所述子序列各自对应的目标类型的溶解气体数据的预测结果;
最终预测结果确定模块,对各所述预测结果进行叠加重构处理,以得到所述目标类型的溶解气体数据的最终预测结果。
结合第二方面的第五种可能的实施例,在第六种可能的实施例中,所述运行状态确定模块,还用于基于所述目标类型的溶解气体数据的最终预测结果,利用所述预设故障诊断模型,确定所述目标变压器的目标运行状态。
第三方面,本申请实施例提供了一种电子设备,其中,该电子设备包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行第一方面所述的变压器运行状态确定方法。
第四方面,本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行第一方面所述的变压器运行状态确定方法。
本申请的有益效果:
本申请实施例提供了一种变压器运行状态确定方法、装置及电子设备,其中,该方法通过获取目标变压器的变压器油中的溶解气体数据,确定不同目标溶解气体数据之间的关联特征,基于该不同目标溶解气体数据之间的关联特征,利用预设故障诊断模型,确定目标变压器的目标运行状态。
由于不同目标溶解气体数据之间的关联特征是基于不同类型目目标溶解气体数据之间的支持度与置信度确定得到的,该关联特征能够更为精准地表征不同溶解气体之间的关联关系,能够更为综合地反映变压器油中的各气体成分之间的关系。因此,选用本申请实施例,可借助不同指标参数对变压器的状态进行综合诊断,进一步得到更为精准的电力变压器运行状态的预测结果。
本申请实施例中提供的一个或多个技术方案,可以实现提高变压器运行状态的预测精度的技术效果。
附图说明
在下面结合附图对于示例性实施例的描述中,本申请的更多细节、特征和优点被公开,在附图中:
图1为本申请实施例提供的变压器运行状态与对应产生气体类型之间的关系;
图2为本申请实施例提供的变压器的运行状态确定方法的一种可能的流程示意图;
图3为本申请实施例提供的获取频繁项集的一种可能的流程示意图;
图4为本申请实施例提供的获取频繁项集的另一种可能的流程示意图;
图5为本申请实施例提供的获取预测结果的一种可能的流程示意图;
图6为本申请实施例提供的目标溶解气体数据的原始序列示意图;
图7为本申请实施例提供的小波变换的一种可能的分解示意图;
图8为本申请实施例提供的小波变换的一种可能的分解示意图;
图9为本申请实施例提供的对CO气体的一种可能的预测结果示意图;
图10为本申请实施例提供的变压器的运行状态确定方法的一种可能的流程示意图;
图11为本申请实施例提供的一种可能的故障诊断结果示意示意图;
图12为本申请实施例提供的变压器的运行状态确定装置的一种可能的逻辑结构示意图;
图13为本申请实施例提供的电子设备的一种可能的逻辑结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。
应当理解,本申请的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本申请中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
电力变压器发生绝缘热解后,会产生一些可燃和非可燃性气体,主要有氧气(O2)、一氧化碳(CO)、二氧化碳(CO2)、氮(N2)、氢(H2)、甲烷(CH4)、乙炔(C2H2)、乙烯(C2H4)、乙烷(C2H6)和丙烯(C3H6)等。
通过大量实验从变压器油中溶解气体中筛查出七种最有研究价值的气体,它们是氢、甲烷、乙炔、乙烯、乙烷、一氧化碳和二氧化碳,也被称为特征气体,其中,甲烷、乙烷、乙炔和乙烯的总和称为总烃。
本领域人员在实验数据中发现,变压器油中的溶解气体与变压器的运行状态存在一定的相关性,具体可如图1所示。示例性的,如图1所示的第一行,若变压器油中的溶解气体主要是甲烷与乙烯,并伴随少量的氢气以及乙烷时,则可判定变压器运行过程中存在故障,故障类型为绝缘油过热。其中,图1中所展示的是变压器常见的六种故障类型,对于其他不常见的故障类型,可在本申请实施例的基础上自行扩展,本申请实施例不作具体的限定。
借助于变压器油中的溶解气体与变压器的运行状态之间存在的相关性,本领域常通过对电力变压器油中溶解气体含量趋势进行预测,来对变压器的运行状态进行诊断或者预测。但是,传统的借助电力变压器油中的溶解气体进行预测的方法存在如下的问题:
传统预测方法借助于传统的预测模型,仅针对单一气体进行预测。但是,如图1所示,变压器故障时,所释放的溶解气体为多种类型气体混合而成的,此种仅针对单一气体进行预测的手段,容易使得确定得到的变压器的运行状态不唯一,进而导致确定变压器运行状态的精度较差。
有鉴于此,第一方面,本申请实施例提供了一种变压器运行状态确定方法,该方法用于提高变压器运行状态的预测或者确定的精度。本申请实施例提供的变压器运行状态确定方法应用于任一具备数据处理、数据分析的电子设备中,该电子设备包括但不限于个人移动终端、计算机设备或服务器等等。
如图2所示,本申请实施例提供的变压器运行状态确定方法包括如下几个步骤:
S11、获取目标变压器的变压器油中的溶解气体数据;
其中,该溶解气体数据包括不同类型的目标溶解气体数据;
S12、基于不同类型目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征;
其中,该关联特征是基于不同类型的目标溶解气体数据之间的支持度与置信度确定得到的;
S13、基于该关联特征,利用预设故障诊断模型,确定该目标变压器的目标运行状态。
选用本申请实施例,可通过获取变压器油中的溶解气体数据,挖掘该溶解气体数据中不同类型的目标溶解气体数据之间的关联特征,即确定出不同类型的目标溶解气体数据之间的关联关系,进一步借助该关联特征,确定出变压器油中的溶解气体数据中支持度和置信度较高的强关联的两种或两种以上的溶解气体数据。进而,基于强关联的溶解气体数据,借助预设的故障诊断模型,确定出目标变压器的运行状态,从而判断出目标变压器可能存在的潜在的故障类型。
由于本申请实施例是通过数据挖掘的方式查找出溶解气体中存在强关联的各种溶解气体数据,能够更为精准地借助多种溶解气体综合对目标变压器的运行状态进行预测,有效提高了电力变压器运行状态的预测精度。
下文对上述步骤S11至步骤S13进行详细说明:
在步骤S11中,目标变压器为待确定运行状态的目标电力变压器,该电力变压器的种类、型号等等可根据实际应用场景的不同而不同。目标变压器的变压器油主要是通过天然石油蒸馏、精炼而得到的一种矿物质油,碳氢化合物是它的主要成分。也就是说,碳、氢元素在所有成分比例超出百分之九十五以上。随着变压器运行时间的增长,变压器油受到热、电场、水分等因素的影响而发生缓慢的老化与分解,伴随着一些氢、低分子烃类气体和碳氧化合物的产生,这些气体溶解于油中导致变压器油的闪点的减少,从而引起早期的变压器故障。
在本申请实施例中,执行步骤S11所获取的溶解气体数据为电力变压器发生绝缘热解后,溶解于变压器油中的气体数据。
在一种可能的实施例中,步骤S11中所提及的目标变压器的变压器油中的溶解气体数据为历史采集的溶解气体数据。在另一种可能的实施例中,步骤S11所提及的目标变压器的变压器油中的溶解气体数据为实时采集的溶解气体数据。
其中,在一种可能的实施例中,可通过油中溶解气体分析方法(DissolvedGasAnalysis,DGA)在无需暂停变压器工作的情况下,对变压器油进行采样检测。具体的,可通过脱气方法从变压器油中尽可能地取出其中的溶解气体,然后通过气相色谱法或者吸收光谱法的方式,检测目标类型溶解气体是否存在,并确定其浓度。示例性的,通过气相色谱法或者吸收光谱法,检测甲烷是否存在,并确定其浓度。
在一种可能的实施例中,历史采集的溶解气体数据按照指定路径存储在后端数据库中,在执行步骤S11时,按照该指定路径获取溶解气体数据。由于该溶解气体数据中包含多种类型的目标溶解气体数据,为了精准确定各类型的溶解气体数据的类型以及对应的浓度,在一种可能的实施例中,在执行步骤S11时,本申请实施例所提供的变压器运行状态确定方法还包括如下步骤:
S110、对目标变压器的变压器油中的溶解气体数据进行数据预处理,获取不同类型的目标溶解气体数据。
其中,在步骤S110中,数据预处理包括:溶解气体数据类型标识、数据离散化处理、数据标准化处理、数据归一化处理、非目标类型溶解气体筛除、数据符号化处理等等。
如前所述,溶解气体数据是基于变压器油确定得到的,该变压器油中包含多种类型的溶解气体数据,为了精准区分不同类型的溶解气体数据,选用本申请实施例,通过对数据进行预处理,筛除不属于目标类型的溶解气体数据,减少所需处理的数据量,有助于提高电力变压器的运行状态确定效率。
其中,在一种可能的实施例中,在执行步骤S110时,还可通过如下步骤实现:
S1101、对目标变压器的变压器油中的溶解气体数据进行数据清洗,获取第一目标数据;
S1102、针对该第一目标数据,基于k均值聚类进行离散化处理,得到第二目标数据;
S1103、基于该第二目标数据进行数据符号化处理,以得到不同类型的目标溶解气体数据。
在本申请实施例中,将目标变压器的变压器油中的溶解气体数据确定为原始溶解气体数据,该原始溶解气体数据中存在20余种数据属性,并非所有属性的数据均为有效的数据。示例性的,原始溶解气体数据中包括设备基本信息、变压器状态信息、相关时间信息以及非故障特征气体数据信息、故障特征气体数据信息等等属性的数据,其中设备基本信息、变压器状态信息、相关时间信息以及非故障特征气体数据信息等属性的信息为无关的数据信息。基于此,在一种可能的实施例中,在执行步骤S1101时,根据实际需求或者根据历史故障诊断分析经验,对原始溶解气体数据进行数据选择,筛选出故障特征气体。故障特征气体具体包括如下几类:
氢气、甲烷、乙烷、乙烯、乙炔、一氧化碳、二氧化碳、总烃
由于在线监测装置自身原因,采集数据的会有很多空值。通过执行步骤S1101,对数据选择后的各类型的溶解气体数据进行数据清洗,过滤掉其中的空值,以及算法无关的属性信息。进一步的,将数据按变压器标识进行分割,每台变压器的监测数据单独集成为一个表格,并将所有数据按监测时间的先后排序形成油色谱监测时间序列,从而保证数据的一致性。
示例性的,在一种可能的实施例中,将变压器油中的溶解气体数据进行数据清洗后,得到如下表1所示的数据:
表1.一种可能的第一目标数据集表(其中,各类型气体的单位为:μL/L)
日期 C2H6 H2 CH4 C2H4 CO CO2 TH(总烃)
2018/3/1 72.36 12.03 73.68 11.78 259.12 2219.34 154.62
2018/3/2 71.33 11.83 72.73 11.54 256.55 2212.32 149.36
2018/3/3 71.65 11.67 72.96 11.36 257.32 2189.68 153.52
2018/3/4 71.89 11.98 72.87 11.24 258.26 2198.32 154.21
... ... ... ... ... ... ... ...
2019/5/30 72.36 12.05 72.67 11.69 258.24 2210.45 152.54
由于数据清洗后得到的数据均为带小数的数值,所需占用的计算量较大,为了简化计算过程,本申请实施例通过执行步骤S1102,对第一目标数据进行离散化处理。其中,由于油色谱在线监测数据的数量级不同,所以需要对各类型的溶解气体数据进行标准化处理,使得不同的参量之间具备可比性。具体的,通过如下公式1对各类型的溶解气体数据进行标准化处理:
标准化值=(监测值-平均值)/该属性监测值的标准方差···(公式1)
以第一目标类型的溶解气体数据为CO的数据为例,计算出CO的平均值=(259.12+256.55+257.32+258.26+...+258.24)/380=257.36,CO的标准方差为s=3.26,借助公式1,计算出标准化的CO序列为:
CO(1)=(259.12-257.36)/3.26=0.540
CO(2)=(256.55-257.36)/3.26=-0.248
CO(3)=(257.32-257.36)/3.26=-0.012
CO(4)=(258.26-257.36)/3.26=0.276
······
CO(380)=(258.24-257.36)/3.26=0.270
同理,可计算出其他各类型的第一目标数据的标准化序列。
基于此,为了降低不同类型的溶解气体数据在运算过程中的时间复杂度,如图3所示,在执行步骤S1103时,针对各第一目标数据的标准化序列,基于k均值聚类进行离散化处理,得到第二目标数据。其中,执行步骤S1103进行k均值聚类划分法时,如通过如下几个步骤实现:
输入:数值属性A,划分区间数k;
输出:离散后的数值区间。
具体包括:
步骤(1)、初始化。从A中任意选择k个不同的值作为初始簇的中心。
步骤(2)、对样本进行聚类。针对初始化选择的聚类中心,计算所有样本到中心的距离(默认欧式距离),然后根据簇中A的平均值,将每个A值赋给最类似的簇。
步骤(3)、计算聚类后的类中心,即计算每个簇中A的平均值,作为新的类的中心。
步骤(4)、重复执行步骤(2)、步骤(3),直至聚类结果UNTIL不再发生变化。
其中,数值属性A为特征气体标准化处理后的数据序列,划分区间数k的数值可根据实际经验设置,也可根据历史数据结果设置,本申请不作具体限定。
其中,假设一组CO标准化序列为:CO=[0.540,-0.248,-0.012,0.276,...,0.270],以该组CO标准化后的序列进行k均值聚类处理包括如下流程:
第一步:选取初始簇中心。其中,根据业务经验或领域知识,选择合适的k值,选取k值过大或过小都会对聚类结果产生负面影响。当k值过大时,簇之间的差异度会降低,簇内变异度会增加,导致聚类效果变差。当k值过小时,簇内相似度会降低,簇间差异度会增加,导致聚类效果退化。因此,在选取k值时需要综合考虑多个因素,避免过拟合或欠拟合。本申请实施例中,这里设定k=4,是基于以往经验进行适配得到的,根据实验结果显示,k=4时无过拟合和欠拟合现象。
在k均值聚类中,首先需要选取k个初始簇中心。若设定k=4,则表明需要从数据集中选取4个不同的数值作为初始簇中心。即需要将上表1中的380组数据均分4份,选取了第95个0.420、第190个-0.128、第285个0.645和第380个0.270作为初始簇中心。
第二步:将数据点归为最相似的数据簇。将每个数据点计算到四个簇中心的距离,然后将其归为最相似的簇。在这个表格中,数据点0.540到四个簇中心的距离分别是0.12、0.668、-0.105和0.27,因为是距离看绝对值大小,故数据点0.540被归为第三个簇的一员。这个过程会对所有数据点进行操作,将它们划分到最相似的簇中,即可得到如下表2所示的相似簇计算结果表:
表2.一种可能的数据点最相似的簇的计算结果示意表
第三步:计算每个簇的平均值。对于每个簇,计算各簇包含的数据点的平均值,然后将此平均值作为该簇的新中心。第一个簇包含了0.385,0.379,...,0.436这四个数据点,因此它的平均值为0.386。其他三个簇的平均值分别为0.017、0.575和0.274。即可得到如下表3:
表3.一种可能的每个簇的平均值示意表
簇序号 数据点 平均值
1 [0.385,0.379,...,0.436] 0.386
2 [-0.248,-0.012,...,0.004] 0.017
3 [0.540,0.760,..,0.665] 0.575
4 [0.276,0.268,...,0.270] 0.274
第四步:检查各簇是否达到收敛。如果每个数据点归属的簇没有变化,那么就说明聚类已经达到了收敛状态。如果有数据点的归属簇发生变化,则需要重新计算每个簇的中心,并将数据点重新归类,直到达到收敛状态为止。
在第一轮聚类后,数据点的归属情况发生了变化,因此需要重新计算每个簇的平均值,并将数据点重新归类。在第N轮聚类中,数据点的归属没有发生变化,说明聚类已经达到了收敛状态。即可得到如下表4、表5所示的收敛状态示意表:
表4.一种可能的经过N轮聚类达到收敛状态示意表
表5.一种可能的经过N轮聚类数据簇达到收敛状态示意表
数据点 平均值
1 [0.540,0.379,...,0.436] 0.396
2 [-0.248,-0.012,...,0.004] -0.067
3 [0.640,0.760,..,0.665] 0.789
4 [0.276,0.268,...,0.270] 0.274
第五步:输出聚类结果。对于每个数据簇,输出该数据簇的中心值以及包含的比重,即输出该数据簇的数据点占总数据点数的比例。在k均值聚类结果表中,第一个簇的中心值为0.396,包含了4个数据点,占总数据点数的17.89%。其他三个簇的中心值和比重也可以类似地计算出来。即可得到如下表6所示的聚类结果表:
表6.一种可能的CO气体的k均值聚类结果示意表
簇k 聚类中心 比重
1 0.396 68/380=0.1789
2 -0.067 98/380=0.2579
3 0.789 125/380=0.3289
4 0.274 89/380=0.2342
在本申请实施例中,第二目标数据即为经过上述步骤(1)~步骤(4)所获取的聚类结果。选用本申请实施例,针对目标溶解气体数据,采用k均值聚类法进行离散化处理,得到第二目标数据,是基于数据距离和实际分布情况对目标溶解气体数据进行分割,所得到的聚类中心数据值能够较好地反映该簇内数据的相关性,以该聚类中心数据值进行进一步的数据处理,有助于减少所需计算的计算量,降低代码执行过程中的时间复杂度,进一步有利于提高变压器故障诊断的效率。
在执行步骤S1103时,对步骤S1102所获取的目标溶解气体数据的聚类结果的基础上,将聚类结果进行符号化处理,以得到不同类型的目标溶解气体数据。具体的,以前述CO为例,经过n轮聚类达到收敛状态后,判断所有的数据分别属于4个数据簇中的哪个数据簇,其中4个数据簇分别对应符号A,B,C,D。最后得到如下表7所示的数据符号表:
表7.一种可能的数据符号化处理结果示意表
日期 C2H6 H2 CH4 C2H4 CO CO2 TH(总烃)
1 A B B B A D B
2 A B B A B B A
3 A A B C B C B
4 D D D D D D D
... ... ... ... ... ... ... ...
如此,选用本申请实施例,在获取各类型目标溶解气体数据的基础上,对各目标溶解气体数据进行离散化处理、符号化处理,得到符号化的处理结果,能够进一步简化所需处理的数据量,有助于提高变压器故障诊断的效率。
在一种可能的实施例中,在执行步骤S12时,还可通过如下步骤实现:
S121、针对不同类型的目标溶解气体数据,构建不同的候选数据项集;
S122、利用预设关联规则挖掘算法,从该不同的候选数据项集中确定出满足最小支持度要求的各目标频繁项集;
S123、基于各目标频繁项集,确定不同类型的目标溶解气体数据之间的关联特征。
其中,能够理解的是,在一种可能的实施例中,步骤S121中的不同类型的目标溶解气体数据可以是未经过上述步骤S1101-S1103离散化、标准化处理后的各类型的溶解气体数据。在另一种可能的实施例中,步骤S121中的不同类型的目标溶解气体数据还可以是经过上述步骤S1101-S1103离散化、标准化处理后的各类型的溶解气体数据的聚类结果数据。不过在此实施例中,采用聚类结果数据进行后续处理,所需处理的数据量较少,处理效率更高。
在本申请实施例中,在步骤S121中,数据项集是指项的集合,其中,项是指各类型的目标溶解气体数据,候选项集是指根据实际需求,所构建的候选的项的集合,由候选项组合而成。示例性的,以上述表7中的7种溶解气体为例,数据项集是指7种溶解气体数据的集合,若需要关注两种溶解气体数据之间的关联关系,则各候选项集=[X气体,Y气体],其中,X、Y分别为上述7种溶解气体数据中的任一两种的组合。若所需关注的为3种溶解气体数据之间的关联关系,则项集=[X气体,Y气体,Z气体],其中X、Y、Z分别为上述7种溶解气体数据中的任一三种气体的组合。
在步骤S122中,预设关联规则挖掘算法可以为任一用于获取数据之间的关联关系的算法。关联规则挖掘算法可以包括:Apriori算法、FP-growth算法、ECLAT(EquivalenceClass Transformation)算法等等算法。本申请实施例通过使用Apriori算法执行步骤S122,在其他实施例中,也可以使用其他关联规则挖掘算法实现,本申请不作具体限定。
在本申请实施例中,对符号化后的数据序列,通过Apriori算法从候选项集中找出频繁项集。然后计算出序列之间的支持度和置信度,输出满支持度和置信度阈值要求的关联规则。其中,支持度的阈值为最小支持度阈值,置信度的阈值为最小置信度阈值,其中最小支持度阈值以及最小置信度阈值的设置基于实际经验设置得到,或者基于历史实验结果设置得到。本申请实施例不作具体限定。
在一种可能的实施例中,最小支持度阈值可设置为0.5,最小置信度阈值可设置为0.7。若两个序列之间的支持度和置信度同时满足所设置的阈值要求时,则可确定该两个序列之间属于强关联关系,否则,可认为两个序列之间无关联关系。
基于此,如图3所示,本申请实施例在执行步骤S122时,通过使用Apriori算法挖掘各溶解气体之间的关联关系,具体包含如下几个步骤:
步骤1)、输入事务数据库,最小支持度阈值。其中,事务数据库即为如表7所示的经符号化处理后得到的符号化结果。
步骤2)、扫描事务数据库,对每个项目进行计数,得到候选项集Ck。其中,候选项集即为根据实际需求构建的溶解气体项的集合。
步骤3)、对候选项集进行剪枝,舍弃支持度小于阈值的候选项集,得到频繁项集Lk。
步骤4)、对剪枝后的频繁项集进行组合连接,得到候选项集,扫描事务数据库,如果项目组合唯一,则进入步骤2),否则进入步骤3)。
为了更直观的展示该算法的执行过程,取15条离散化,其中TID表示每个事件的标识符,C1,C2等表示各个项,1表示该项在事件中出现,0表示不出现。设置最小支持度阈值为0.2,即最小计数为3。即可得到如下表8所示的扫描数据表
表8.一种可能的扫描数据表
如图4所示,通过扫描数据库,得到候选1-项集,通过剪枝删除计数值小于2的项集,得到频繁1-项集,再继续进行连接和剪枝,即可输出得到频繁项集。
在Apriori算法中,采用事件表(或称为事务数据库)来存储源数据,它由一系列项集和它们的支持度组成。对第5步数据符号化后的序列可以看作是一个事件表,其中每行表示一个序列,每个序列由多个项组成,每个项用符号A、B、C、D来表示。在Apriori算法的迭代过程中,根据上一次得到的频繁项集,生成新的候选项集,并计算其支持度。然后通过剪枝操作,将不满足最小支持度要求的候选项集去除,得到新的频繁项集。这个过程可以持续迭代,直到满足停止条件为止。
最终,Apriori算法可以得到满足最小支持度要求的所有频繁项集,这些项集可以用于计算关联规则的支持度和置信度,从而发现数据中的关联关系和规律。实际数据计算过程与上述类似,经计算满足阈值要求的关联规则结果如下表9所示(其中TH代表总烃)。
表9.一种可能的关联规则示意图
第一目标溶解气体数据 第二目标溶解气体数据 支持度 置信度
C2H6 TH 0.76 0.78
C2H6 C2H4 0.54 0.72
CO CO2 0.95 0.95
CO2 CO 0.96 0.96
TH C2H6 0.58 0.84
TH C2H4 0.52 0.78
通过关联规则确定输入特征参量的方法如下,以CO的预测为例。若不考虑关联规则,则预测CO时的输入仅为CO序列。当考虑满足关联规则的情况下,CO与CO2是有强关联性的,进而可基于CO与CO2关联特征输入矩阵,以便基于此关联特征输入矩阵执行步骤S13,借助故障诊断模型,确定目标变压器的运行状态。在本申请实施例中,计算项集的支持度、置信度的方式可参考相关的关联规则挖掘算法的技术文档,此处不再赘述。
在步骤S12中,不同类型的目标溶解气体数据之间的关联特征用于表征不同类型的目标溶解气体数据之间的关联关系,与不同类型的目标溶解气体数据之间的支持度、置信度呈正相关关系。具体的,在本申请实施例中,不同类型的目标溶解气体数据的关联特征是基于目标频繁项集确定得到的关联规则中,支持度满足预设支持度阈值,以及置信度满足预设置信度阈值的两种或者两种以上的目标溶解气体数据的历史监测记录确定得到的。具体的,可以是基于两种或两种以上的目标溶解气体数据的历史监测记录构建特征向量得到的,也可以是基于两种或两种以上的目标溶解气体数据的历史监测记录数据构建输入矩阵得到的。
示例性的,通过上述过程,确定得到表9所示的结果,其中,确定出CO与CO2是有强关联的,从数据库中获取CO与CO2两种溶解气体数据的历史监测记录,进一步基于该历史监测记录构建LSTM(Long Short Term Memory,长短记忆网络模型)网络模型的输入矩阵,以便执行步骤S13时,将该输入矩阵输入至故障诊断模型中。
选用本申请实施例,通过对不同类型的目标溶解气体数据,构建候选数据项集的方式,结合预设关联规则挖掘算法,挖掘出目标变压器的变压器油中的溶解气体数据中各类型的目标溶解气体数据之间存在的关联关系,确定出支持度与置信度满足阈值要求的强关联的两种或者两种以上的目标溶解气体数据,有助于后续构建故障诊断模型的输入数据,得到更为精准、综合的输入数据,有利于预设故障诊断模型输出更为精准的诊断结果。
在执行步骤S123,基于目标频繁项集,确定出不同类型的目标溶解气体数据之间的关联特征,相当于从众多历史监测数据中确定出了强关联的两种或者两种以上的目标溶解气体数据。进一步的,在一种可能的实施例中,在确定出强关联的两种或两种以上的目标溶解气体数据的基础上,本申请所提供的变压器运行状态确定方法还包括如下几个步骤:
S51、利用预设数据变换算法,对目标类型的溶解气体数据进行数据分解,获取该目标类型的溶解气体数据序列的各子序列;
其中,目标类型的溶解气体数据为支持度与置信度满足预设筛选条件的溶解气体数据。
S52、基于各子序列,利用预先训练得到的长短期记忆网络模型,确定各子序列各自对应的目标类型的溶解气体数据的预测结果;
S53、对各预测结果进行叠加重构处理,以得到目标类型的溶解气体数据的最终预测结果。
其中,在S51中,预设数据变换算法用于对非平稳的信号进行时频分析和处理,即预设数据变换算法可对原始数据序列,按照不同的频域或者时域进行分解变换,以得到该原始数据序列的不同频率的子序列。在本申请实施例中,预设数据变换算法为小波变换算法,小波变换算法具有局部化分析的能力,将信号分解为不同尺度和频率的子信号,该子信号能够更好地表征信号的特征。本申请实施例,通过分离油色谱检测序列中的低频趋势项和高频噪声项,可更为准确地获取目标类型的溶解气体数据的关键特征。
在此基础上,在本申请实施例中,在执行步骤S52、步骤S53时,对获取到的变压器油中的气体浓度数据,利用小波变换算法进行小波分解,分解得到不同的分量(对应图中的A3、D1、D2与D3,其中A3为高频分量,D1-D3为低频分量)。每一个分量对应目标类型的溶解气体数据序列一个子序列,将各子序列输入至预先训练得到的长短期记忆网络模型的各子模型中(即LSTM1、LSTM2、LSTM3、LSTM4),可得到各子序列各自对应的目标类型的溶解气体数据的预测结果。其中,该预先训练得到的长短期记忆网络模型是预先基于不同的历史监测数据的分量进行预先训练得到的,用于基于历史目标类型的溶解气体数据对未来可能的同类型的目标溶解气体数据的浓度进行预测。
具体的,本申请实施例中,以CO小波分解为例,选用Daubechies(dbN)多贝西小波变换方法对序列进行小波分解,当选取不同的阶数和分解层数时,信号重构误差见下表10:
表10.dbN不同阶数和分解层数对CO数据分解的重构误差(×10-10)
分解层数 db4小波 db5小波 db6小波
3层分解 4.3214 6.711 4.0326
4层分解 6.3826 11.0232 5.5213
5层分解 11.5345 22.602 12.3454
由表10可知,db6小波对信号进行3层分解时的重构误差最小。因此,选用db6小波对CO信号进行3层小波分解,原始序列和分解后得到的子序列分别见图6至图9。其中图7、图8中纵轴表征物理量浓度。其中,低频趋势项可以用于表征油中溶解气体的变化趋势,而高频噪声项可消除由扰动因素引起的信号干扰。
可见,随着分解层数增加,序列逐渐平缓。由于受多种因素影响,数据中会存在一些突变点,这些点会造成预测结果与真实值存在很大差异,而利用小波分解可以有效剔除这些突变点,减少预测模型中的干扰,提高预测精度。
在执行步骤S53时,对预测结果进行重构,可以视作小波分解过程的逆过程,具体的预测结果重构过程可参考相关的小波重构的技术文档,本申请不再赘述。
故选用本申请实施例,采用了小波分解和长短期记忆网络模型相结合的方法,在确定出强关联的目标类型的溶解气体的基础上,充分考虑了各状态参量之间的相关性,并利用小波分解技术将原始检测数据分解为趋势分量和细节分量,可以根据各分量的特点提高整体预测精度,有效提高预测效果并减少误差,有效处理数据中存在的非平稳性的信息,能够更为精准地给出目标类型的溶解气体数据的预测结果,有助于提高目标变压器的运行状态的预测准确性。
由于受油温、故障性质及其发展速度等因素的影响,变压器油中溶解气体的含量发展过程具有明显的波动性,因此其浓度监测序列具有非线性与非平稳性特征。考虑到小波变换可以有效处理数据的波动性以及长短期记忆神经网络在时序数据建模中的优异表现,本申请实施例中,以小波分解和长短期记忆网络为基础,构建变压器油中溶解气体WT-LSTM组合预测模型,即小波变换和长短期记忆网络预测模型。
其中,WT-LSTM是一种深度学习模型,用于针对输入的序列数据进行预测和分析。具体的网络模型结构可参考图5所示的流程图。其中,其中小波变换用于对原始序列进行特征提取,LSTM则用于对提取得到的特征进行建模和预测。具体来说,WT-LSTM模型的流程如下:
首先,将原始序列进行小波变换,得到不同尺度的小波系数。
其次,将小波系数输入到LSTM网络中进行训练,从而学习序列中的长期依赖关系和规律。
最后,利用经过训练的LSTM网络进行序列的预测或分类。
相对于传统的LSTM模型,本申请实施例所提供的WT-LSTM能够更好地处理序列中的局部特征和全局特征,并增强其对序列的适应性和预测效果。
具体步骤如下所示:
(1)通过小波变换将油色谱监测序列进行分解处理,得到4个子序列分别为高频分量A3,低频分量D1、D2、D3;
(2)将各子序列分量分别进行归一化处理,并按相同比例划分训练样本与测试样本;
(3)将分解得到的高频分量A3、与所要预测序列具有强关联关系的其他序列共同组成输入矩阵{x_i},输入至LSTM1模型,其余3个低频分量分别输入LSTM2、LSTM3、LSTM4模型,4个LSTM模型进行回归预测,得到4组预测分量;
(4)将4组预测结果进行叠加重构,得到最终预测结果;
(5)通过分析误差指标评价模型的预测性能。
为了便于理解上述步骤,特结合一种可能的应用场景数据进行说明,以CO的监测序列为例:
(1)取其前180组数据,记为X=(x1,x2,...,x180);采用小波变换将监测序列X进行4阶分解,得到4个子序列分别为高频分量A3、低频分量D1、D2、D3:
A3=(a1,a2,...,a60)
D1=(d1,d2,...,d60)
D2=(d61,d62,...,d120)
D3=(d121,d122,...,d180)
其中,A3对应着原序列的高频成分,而D1、D2、D3则分别对应着原序列的低频成分。
(2)将数据归一化处理,划分训练样本数据与测试样本数据。
对四个子序列分别进行归一化处理,将其值映射到[0,1]范围内,便于后续处理。然后按照7:3的比例划分训练集和测试集,其中训练集共有126个数据点,测试集共有54个数据点。
(3)构建LSTM神经网络模型。
将A3和与所要预测序列具有强关联关系的其他序列作为输入,共同组成4列输入矩阵:
{[a1,d1,d61,d121],
[a2,d2,d62,d122],
...,
[a126,d126,d186,d246]}
其中,每一行是一个时刻的输入数据,每一列是一个输入变量。将上述矩阵作为输入,分别输入至四个LSTM模型进行回归预测,得到四组预测结果:分别为A3的预测结果A3'、D1的预测结果D1'、D2的预测结果D2'、D3的预测结果D3'。
(4)叠加重构预测结果
将四组预测结果进行叠加重构,得到最终预测结果:
X'=(A3'+D1',D2',D3')
其中,X'是最终的预测结果序列,共有180个数据点。
采用均方误差(MSE)和均方根误差(RMSE)等指标对模型的预测性能进行评价,评估其相对误差和绝对误差大小。具体的:
如表11所示,WT-LSTM模型与未结合小波分解方法的LSTM模型在测试样本中的预测误差指标:
表11.LSTM与WT-LSTM预测性能差异对比表
预测模型 LSTM WT-LSTM
均方根误差(RMSE) 6.532 3.6325
平均绝对误差(MAE) 5.248 3.0012
可以看出,WT-LSTM组合预测模型在预测性能上有明显的提升,且具有较高的可靠性。
在上述得到目标类型的溶解气体数据的最终预测结果的基础上,上述在执行步骤S13时,可通过如下步骤实现:
S131、基于目标类型的溶解气体数据的最终预测结果,利用预设故障诊断模型,确定目标变压器的目标运行状态。
其中,预设故障诊断模型为可根据输入的特征向量或者输入矩阵,输出目标变压器的故障类型的神经网络模型,该预设故障诊断模型为预先利用训练样本数据与测试样本数据训练得到的神经网络模型。
在一种可能的实施例中,通过获取历史监测数据构建训练样本数据与测试样本数据,其中历史监测数据中包括变压器历史故障类型、历史故障时内部的变压器油中的气体含量数据。
然后,基于训练样本数据,对初始故障诊断模型进行训练,基于该故障诊断模型输出的结果与实际训练样本数据对应的故障类型结果之间的差异,对该故障诊断模型的权重、层数等等参数进行迭代训练调整,直至该故障诊断模型输出的结果与实际训练样本数据对应的故障类型之间的差异小于预设差异阈值,以得到步骤S13中所使用的预设故障诊断模型。
如图10所示,在一种可能的实施例中,预设故障诊断模型为预先训练得到的BFA-SVM(一种细菌觅食算法-支持向量机)网络模型。则本申请所提供的变压器运行状态确定方法可包括如下流程:
第一步:获取油中溶解气体数据;
第二步:基于小波分解和长短期记忆网络(WT-LSTM)模型对油中溶解气体组合进行预测,输出各溶解气体组合的最终预测结果;
第三步:基于BFA-SVM模型的变压器故障诊断,以基于预测值输入故障诊断模型,输出对应的故障类型。
其中,BFA算法是由K.M.Passino等人提出的一种新的仿生算法,广度优先搜索算法的一种。BFA算法采用宽度优先的策略搜索所有可能的路径,直到找到目标节点或者搜索完整个图。BFA算法的基本思想是从起点开始,每次扩展所有可以到达的节点,直到找到目标节点。
在本申请实施例中,通过将获取的历史监测数据进行分组,得到训练样本与测试样本。示例性的,将2018年3月-2019年5月采集到的原始数据共计540组,划分为训练样本共计420组,测试样本共计120组,利用训练样本训练得到诊断模型。整个过程中,通过将故障类型编码化:
变压器故障数据来源主要包括:a.变压器在线监测数据;b.变压器历史故障数据集。数据样本分布如下表12:
表12.一种样本分布示意表
根据收集到的数据,将变压器状态分为正常、中低温过热、高温过热、高能放电、低能放电、局部放电6种,各状态对应的输出编码,如下表13:
表13.变压器状态对应的输出编码
变压器状态编码 编码
正常 (1,0,0,0,0,0)
中低温过热 (0,1,0,0,0,0)
高温过热 (0,0,1,0,0,0)
高能放电 (0,0,0,1,0,0)
低能放电 (0,0,0,0,1,0)
局部放电 (0,0,0,0,0,1)
对输入的数据进行处理,内部故障与油中气体含量相关,以H2、CH4、C2H2、C2H4、C2H6、CO、CO2为特征量,作为输入,对输入数据进行处理,如下公式2所示:
其中,xi1...xi7为氢、甲烷、乙烯、乙烷、乙炔、一氧化碳、二氧化碳的气体含量;xi1 *为氢占总氢烃的百分比;xi2 *...xi5 *为甲烷、乙烯、乙烷、乙炔、一氧化碳和二氧化碳分别占总碳氢氧化合物的百分比。
使用WT-LSTM模型的输出结果作为BFA-SVM模型的输入,从故障统计数据库中收集了540组电力变压器故障数据。420组训练数据(每个类别30组)和120组测试数据(每个类别10组),分类标准就是(变压器状态对应的输出编码),将样本带入上述步骤中,即可得到目标变压器的运行状态的预测结果。可参考图11,可看出模型输出的准确率可达到96%,错误样本数与错误率都有所减少。
为了清楚说明本申请实施例所提供的变压器状态确定方法,下文结合一种可能的实际应用场景进行说明:
采用原始历史数据为某地750kv主变压器历史数据数据,其中数据为2018年3月-2019年5月,采集频率1次/天。将2018年3月-2019年5月采集到的原始数据共计540组,划分为训练样本共计420组,测试样本共计120组。将变压器状态分为正常、中低温过热、高温过热、高能放电、低能放电、局部放电6种。利用建立WT-LSTM预测模型得到预测结果,将变压器故障特征气体历史数据代入已经训练好的WT-LSTM预测模型,结果如下表14:
表14.一种预测结果示意表
分析可知,油中溶解气体WT-LSTM预测模型误差比较小,具有较好的预测性能,且具有可靠性和稳定性。
将WT-LSTM预测模型得到的预测数据代入BFA-SVM故障诊断模型,得到故障预测结果如下表15:
表15.故障预测准确率(%)
预测模型 正常 中低温过热 高温过热 高能放电 局部放电 低能放电 平均
WT-LSTM 89.56 91.32 92.35 90.54 90.36 47.87 83.80
分析可知,将WT-LSTM预测模型得到的预测值代入BFA-SVM故障诊断模型,变压器状态为正常时,WT-LSTM模型均达到了89.56%的预测准确率;变压器状态为中低温过热时,WT-LSTM模型均达到了91.32%的预测准确率;变压器状态为高温过热时,WT-LSTM模型均达到了92.35%的预测准确率;变压器状态为高能放电时,WT-LSTM模型均达到了90.54%的预测准确率;变压器状态为局部放电时,WT-LSTM模型均达到了90.36%的预测准确率;变压器状态为低能放电时较难预测,WT-LSTM模型均达到了47.87%的预测准确率。
通过实例分析证明WT-LSTM预测模型具备一定的预测准确率,结合BFA-SVM故障诊断模型,可进一步对变压器运行状态进行预测,可一定程度上为是否安排变压器检修提供参考价值。选用本申请实施例,通过两个已训练好的模型,接通实时的采集数据,就可以根据对变压器运行状态进行预测,在设备还没生故障前提前感知,对设备预检修有着重要意义。
第二方面,本申请实施例提供了一种变压器运行状态确定装置,其中,如图12所示,该装置1200包括:
获取模块1201,用于获取目标变压器的变压器油中的溶解气体数据,其中,溶解气体数据包括不同类型的目标溶解气体数据;
关联特征确定模块1202,用于基于不同类型的目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征,其中,关联特征是基于不同类型目标溶解气体数据之间的支持度与置信度确定得到的;
变压器运行状态确定模块1203,用于基于关联特征,利用预设故障诊断模型,确定目标变压器的目标运行状态。
结合第二方面,在第二种可能的实施例中,关联特征确定模块1202,具体用于针对不同类型的目标溶解气体数据,构建不同的候选数据项集;利用预设关联规则挖掘算法,从不同的候选数据项集中确定出满足最小支持度要求的各目标频繁项集;基于各目标频繁项集,确定不同类型的目标溶解气体数据之间的关联特征。
结合第二方面,在第三种可能的实施例中,装置还包括:
数据预处理模块1204,用于对目标变压器的变压器油中的溶解气体数据进行数据预处理,获取不同类型的目标溶解气体数据。
结合第二方面的第三种可能的实施例,在第四种可能的实施例中,数据预处理模块1204,具体用于对目标变压器的变压器油中的溶解气体数据进行数据清洗,获取第一目标数据;针对第一目标数据,基于k均值聚类进行离散化处理,得到第二目标数据;基于第二目标数据进行数据符号化处理,以得到不同类型的目标溶解气体数据。
结合第二方面,在第五种可能的实施例中,装置还包括:
数据变换模块1205,用于利用预设数据变换算法,对目标类型的溶解气体数据进行数据分解,获取目标类型的溶解气体数据序列的各个子序列,其中,目标类型的溶解气体数据为支持度与置信度满足预设筛选条件溶解气体数据;
初期预测结果确定模块1206,用于基于各子序列,利用预先训练得到的长短期记忆网络模型,确定各子序列各自对应的目标类型的溶解气体数据的预测结果;
最终预测结果确定模块1207,对各预测结果进行叠加重构处理,以得到目标类型的溶解气体数据的最终预测结果。
结合第二方面的第五种可能的实施例,在第六种可能的实施例中,运行状态确定模块1203,还用于基于目标类型的溶解气体数据的最终预测结果,利用预设故障诊断模型,确定目标变压器的目标运行状态。
本申请实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本申请示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本申请实施例的方法。
本申请示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本申请实施例的方法。
本申请示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本申请实施例的方法。
参考图13,现将描述可以作为本申请的服务器或客户端的电子设备1300的结构框图,其是可以应用于本申请的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图13所示,电子设备1300包括计算单元1301,其可以根据存储在只读存储器(ROM)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(RAM)1303中的计算机程序,来执行各种适当的动作和处理。在RAM 1303中,还可存储设备1300操作所需的各种程序和数据。计算单元1301、ROM 1302以及RAM 1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。
电子设备1300中的多个部件连接至I/O接口1305,包括:输入单元1306、输出单元1307、存储单元1308以及通信单元1309。输入单元1306可以是能向电子设备1300输入信息的任何类型的设备,输入单元1306可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元1307可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元1304可以包括但不限于磁盘、光盘。通信单元1309允许电子设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙TM设备、WiFi设备、WiMax设备、蜂窝通信设备和/或类似物。
计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理。例如,在一些实施例中,前述变压器运行状态确定方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1308。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1302和/或通信单元1309而被载入和/或安装到电子设备1300上。在一些实施例中,计算单元1301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行前述变压器运行状态确定方法。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
如本申请使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

Claims (10)

1.一种变压器运行状态确定方法,其特征在于,所述方法包括:
获取目标变压器的变压器油中的溶解气体数据,其中,所述溶解气体数据包括不同类型的目标溶解气体数据;
基于所述不同类型的目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征,其中,所述关联特征是基于不同类型的目标溶解气体数据之间的支持度与置信度确定得到的;
基于所述关联特征,利用预设故障诊断模型,确定所述目标变压器的目标运行状态。
2.根据权利要求1所述的方法,其特征在于,所述基于所述不同类型的目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征,包括:
针对所述不同类型的目标溶解气体数据,构建不同的候选数据项集;
利用预设关联规则挖掘算法,从所述不同的候选数据项集中确定出满足最小支持度要求的各目标频繁项集;
基于各所述目标频繁项集,确定所述不同类型的目标溶解气体数据之间的关联特征。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述目标变压器的变压器油中的溶解气体数据进行数据预处理,获取所述不同类型的目标溶解气体数据。
4.根据权利要求3所述的方法,其特征在于,所述对所述目标变压器的变压器油中的溶解气体数据进行数据预处理包括:
对所述目标变压器的变压器油中的溶解气体数据进行数据清洗,获取第一目标数据;
针对所述第一目标数据,基于k均值聚类进行离散化处理,得到第二目标数据;
基于所述第二目标数据进行数据符号化处理,以得到所述不同类型的目标溶解气体数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用预设数据变换算法,对目标类型的溶解气体数据进行数据分解,获取所述目标类型的溶解气体数据序列的各个子序列,其中,所述目标类型的溶解气体数据为所述支持度与所述置信度满足预设筛选条件的溶解气体数据;
基于各所述子序列,利用预先训练得到的长短期记忆网络模型,确定各所述子序列各自对应的目标类型的溶解气体数据的预测结果;
对各所述预测结果进行叠加重构处理,以得到所述目标类型的溶解气体数据的最终预测结果。
6.根据权利要求5所述的方法,其特征在于,基于所述关联特征,利用预设故障诊断模型,确定所述目标变压器的目标运行状态,包括:
基于所述目标类型的溶解气体数据的最终预测结果,利用所述预设故障诊断模型,确定所述目标变压器的目标运行状态。
7.一种变压器运行状态确定装置,其特征在于,所述装置包括:
获取模块,用于获取目标变压器的变压器油中的溶解气体数据,其中,所述溶解气体数据包括不同类型的目标溶解气体数据;
关联特征确定模块,用于基于所述不同类型的目标溶解气体数据,确定不同类型的目标溶解气体数据之间的关联特征,其中,所述关联特征是基于不同类型目标溶解气体数据之间的支持度与置信度确定得到的;
变压器运行状态确定模块,用于基于所述关联特征,利用预设故障诊断模型,确定所述目标变压器的目标运行状态。
8.根据权利要求7所述的装置,其特征在于,所述关联特征确定模块,具体用于针对所述不同类型的目标溶解气体数据,构建不同的候选数据项集;利用预设关联规则挖掘算法,从所述不同的候选数据项集中确定出满足最小支持度要求的各目标频繁项集;基于各所述目标频繁项集,确定所述不同类型的目标溶解气体数据之间的关联特征;
所述装置还包括:
数据预处理模块,用于对所述目标变压器的变压器油中的溶解气体数据进行数据预处理,获取所述不同类型的目标溶解气体数据;
所述数据预处理模块,具体用于对所述目标变压器的变压器油中的溶解气体数据进行数据清洗,获取第一目标数据;针对所述第一目标数据,基于k均值聚类进行离散化处理,得到第二目标数据;基于所述第二目标数据进行数据符号化处理,以得到所述不同类型的目标溶解气体数据;
所述装置还包括:
数据变换模块,用于利用预设数据变换算法,对目标类型的溶解气体数据进行数据分解,获取所述目标类型的溶解气体数据序列的各个子序列,其中,所述目标类型的溶解气体数据为所述支持度与所述置信度满足预设筛选条件溶解气体数据;
初期预测结果确定模块,用于基于各所述子序列,利用预先训练得到的长短期记忆网络模型,确定各所述子序列各自对应的目标类型的溶解气体数据的预测结果;
最终预测结果确定模块,对各所述预测结果进行叠加重构处理,以得到所述目标类型的溶解气体数据的最终预测结果;
所述运行状态确定模块,还用于基于所述目标类型的溶解气体数据的最终预测结果,利用所述预设故障诊断模型,确定所述目标变压器的目标运行状态。
9.一种电子设备,包括:
处理器;以及
存储程序的存储器,
其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-6中任一项所述的方法。
10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行根据权利要求1-6中任一项所述的方法。
CN202310717593.2A 2023-06-16 2023-06-16 一种变压器运行状态确定方法、装置及电子设备 Pending CN116933162A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310717593.2A CN116933162A (zh) 2023-06-16 2023-06-16 一种变压器运行状态确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310717593.2A CN116933162A (zh) 2023-06-16 2023-06-16 一种变压器运行状态确定方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116933162A true CN116933162A (zh) 2023-10-24

Family

ID=88379640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310717593.2A Pending CN116933162A (zh) 2023-06-16 2023-06-16 一种变压器运行状态确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116933162A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117232644A (zh) * 2023-11-13 2023-12-15 国网吉林省电力有限公司辽源供电公司 一种基于声学原理的变压器声音监测故障诊断方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117232644A (zh) * 2023-11-13 2023-12-15 国网吉林省电力有限公司辽源供电公司 一种基于声学原理的变压器声音监测故障诊断方法及系统
CN117232644B (zh) * 2023-11-13 2024-01-09 国网吉林省电力有限公司辽源供电公司 一种基于声学原理的变压器声音监测故障诊断方法及系统

Similar Documents

Publication Publication Date Title
Xu et al. MICHAC: Defect prediction via feature selection based on maximal information coefficient with hierarchical agglomerative clustering
Ma et al. Power transformer fault diagnosis under measurement originated uncertainties
CN112084237A (zh) 一种基于机器学习和大数据分析的电力系统异常预测方法
Zhang et al. Power transformer fault diagnosis considering data imbalance and data set fusion
CN111060652A (zh) 基于长短期记忆网络的变压器油中溶解气体浓度预测方法
Liu et al. Anomaly detection for condition monitoring data using auxiliary feature vector and density‐based clustering
US20220188665A1 (en) Gas-oil separation plant virtual water cut predictor based on supervised learning framework on time series data
CN116933162A (zh) 一种变压器运行状态确定方法、装置及电子设备
US20120226652A1 (en) Event prediction
CN115563563A (zh) 基于变压器油色谱分析的故障诊断方法及装置
Wang et al. Power system fault classification and prediction based on a three-layer data mining structure
Chen et al. Fault diagnosis method of rotating machinery based on stacked denoising autoencoder
WO2023064397A1 (en) Anomaly detection based on normal behavior modeling
Esmaeili Nezhad et al. A review of the applications of machine learning in the condition monitoring of transformers
WO2023158333A1 (en) Large-scale architecture search in graph neural networks via synthetic data
Tan et al. Multi-filter semi-supervised transformer model for fault diagnosis
Machado et al. Time series clustering to improve one-class classifier performance
Qaedi et al. Improvement in power transformer intelligent dissolved gas analysis method
CN116611003A (zh) 一种变压器故障诊断方法、装置、介质
Cheng et al. Logai: A library for log analytics and intelligence
Xiao et al. Self-optimizing feature transformation
Nguyen Feature Engineering and Health Indicator Construction for Fault Detection and Diagnostic
Liu et al. Transformer fault diagnosis model based on iterative nearest neighbor interpolation and ensemble learning
US20240362461A1 (en) Anomaly detection using a pre-trained global model
CN117829822B (zh) 一种电力变压器故障预警方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination