CN116821829A - 基于关联规则分析的变压器故障分析方法及装置 - Google Patents
基于关联规则分析的变压器故障分析方法及装置 Download PDFInfo
- Publication number
- CN116821829A CN116821829A CN202310771927.4A CN202310771927A CN116821829A CN 116821829 A CN116821829 A CN 116821829A CN 202310771927 A CN202310771927 A CN 202310771927A CN 116821829 A CN116821829 A CN 116821829A
- Authority
- CN
- China
- Prior art keywords
- data
- fault
- transformer
- generating
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 73
- 238000004140 cleaning Methods 0.000 claims abstract description 71
- 239000011159 matrix material Substances 0.000 claims abstract description 43
- 230000004069 differentiation Effects 0.000 claims abstract description 26
- 238000005065 mining Methods 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 36
- 238000007689 inspection Methods 0.000 claims description 30
- 238000004422 calculation algorithm Methods 0.000 claims description 26
- 230000009467 reduction Effects 0.000 claims description 18
- 238000012360 testing method Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000005192 partition Methods 0.000 claims description 11
- 238000012544 monitoring process Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 208000025174 PANDAS Diseases 0.000 description 1
- 208000021155 Paediatric autoimmune neuropsychiatric disorders associated with streptococcal infection Diseases 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R31/00—Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
- G01R31/50—Testing of electric apparatus, lines, cables or components for short-circuits, continuity, leakage current or incorrect line connections
- G01R31/62—Testing of transformers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/26—Discovering frequent patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Power Engineering (AREA)
- Testing Electric Properties And Detecting Electric Faults (AREA)
Abstract
本发明涉及人工智能技术领域,揭露了一种基于关联规则分析的变压器故障分析方法和装置,该方法包括:对获取的目标变压器的历史状态数据进行数据清洗后,再进行离散化处理所述历史状态数据的离散数据;根据离散数据生成目标变压器的特征矩阵,利用特征矩阵对目标变压器的状态参数进行关联挖掘,得到状态参数的关联规则;根据关联规则对状态参数进行故障值抽取,得到状态参数的故障参数;生成目标变压器的差异化报警值,根据差异化报警值生成目标变压器的故障差异化权重;根据故障参数和故障差异化权重生成变压器的故障发生率,根据故障发生率对目标变压器进行故障分析。本发明可以提高变压器故障分析的效率。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于关联规则分析的变压器故障分析方法及装置。
背景技术
随着国民经济的快速发展以及以特高压为骨干网架的坚强智能电网建设,对电网中的电力变压器的要求越来越高,因为电力变压器作为电网中最重要和最关键的变电设备,是电网中能量转换和传输的核心。大量的停电事故表明,输变电设备故障是导致电网停电的主要原因之一,开展输变电设备故障识别的研究工作势在必行。
由于变压器故障分析需要具备专业技能和多年经验的专业人才进行,而这些人才相对稀缺,导致变压器故障分析的效率较慢;同时,当使用红外热像仪进行故障分析时,由于设备的不完善,导致笑率较低,因此如何提升变压器故障分析时效率,成为了亟待解决的问题。
发明内容
本发明提供一种基于关联规则分析的变压器故障分析方法及装置,其主要目的在于解决变压器故障分析时效率较低的问题。
为实现上述目的,本发明提供的一种基于关联规则分析的变压器故障分析方法,包括:
获取目标变压器的历史状态数据,对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据;
利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,其中,所述预设的离散检验算法为:
其中,χ2是所述清洗数据的数据区间的统计量卡方值,j是所述清洗数据的类别标识,k是所述清洗数据的类别总数,Aij是第i个区间的第j类样本的数量,Eij是第i个数据区间的第j类样本的数量的期望频数,Ri是第i个数据区间的样本数,i是所述数据区间的区间标识,Cj是为相邻两个所述数据区间的第j类样本个数,N是所述期望频数的频数和,b是常量;
根据所述离散数据生成所述目标变压器的特征矩阵,利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则;
根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数;
生成所述目标变压器的差异化报警值,根据所述差异化报警值生成所述目标变压器的故障差异化权重;
根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,根据所述故障发生率对所述目标变压器进行故障分析。
可选地,所述对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据,包括:
对所述历史状态数据进行数据格式转化,得到所述历史状态数据的目标格式数据;
对所述目标格式数据进行空白值填充,得到所述目标格式数据的填充数据;
对所述填充数据进行异常值剔除,得到所述填充数据的异常值剔除数据,确定所述异常值剔除为所述历史状态数据的清洗数据。
可选地,所述利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,包括:
确定所述清洗数据的数据特征值,根据所述数据特征值对所述清洗数据进行数据排列,得到所述清洗数据的数据序列;
根据所述数据特征值确定所述数据序列的数据区间;
利用预设的离散检验算法逐个计算所述数据区间的区间卡方值,根据所述区间卡方值和预设的合并阈值对所述数据区间进行区间合并,得到所述数据区间的更新区间;
根据所述更新区间生成所述清洗数据的离散数据。
可选地,所述根据所述离散数据生成所述目标变压器的特征矩阵,包括:
对所述离散数据进行独热编码,得到所述离散数据的编码向量;
对所述编码向量进行降维处理,得到所述编码向量的降维向量;
对所述降维向量进行向量拼接,得到所述降维向量的拼接矩阵,确定所述降维向量的拼接矩阵为所述目标变压器的特征矩阵。
可选地,所述利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则,包括:
根据所述特征矩阵构建所述目标变压器的状态参数的频繁模式树,根据所述频繁模式树的树节点确定所述状态参数的条件模式基;
逐个构建所述条件模式基的生成条件树;
对所述生成条件树进行递归挖掘,得到所述状态参数的频繁项集;
根据所述预设的关联阈值生成所述频繁项集的对应规则,确定所述频繁项集的对应规则为所述状态参数的关联规则。
可选地,所述根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数,包括:
根据所述特征矩阵和所述关联规则计算所述状态参数的参数置信度;
根据所述参数置信度对所述关联规则进行规则筛选,得到所述关联规则的目标规则;
根据所述目标规则和预设的故障范围对所述状态参数进行故障值抽取,得到所述状态参数的故障参数。
可选地,所述生成所述目标变压器的差异化报警值,包括:
确定所述目标变压器的故障指标,根据所述故障指标对所述特征矩阵进行参数选取,得到所述特征矩阵的特征参数;
利用所述特征参数构建所述目标变压器的差异化报警模型;
获取所述目标变压器的实时监测数据,利用所述差异化报警模型生成所述实时监测数据的差异化报警值。
可选地,所述根据所述差异化报警值生成所述目标变压器的故障差异化权重,包括:
生成所述目标变压器的差异化报警级别,逐个对所述差异化报警级别进行权重分配,得到所述差异化报警级别的分配权重;
根据所述差异化报警级别对所述差异化报警值进行级别划分,得到所述差异化报警值的划分区间;
将所述划分区间与所述分配权重进行权重关联,得到所述划分区间的关联权重;
根据所述划分区间的关联权重生成所述目标变压器的故障差异化权重。
可选地,所述根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,包括:
利用如下权重算法、所述故障参数和所述故障差异化权重生成所述变压器的故障发生率:
其中,A是所述变压器的故障发生率,bp是第p个所述故障参数,cp是第p个所述故障参数对应的所述故障差异化权重,t是所述故障参数的总数,p是所述故障参数的参数标识。
为了解决上述问题,本发明还提供一种基于关联规则分析的变压器故障分析装置,所述装置包括:
数据清洗模块,用于获取目标变压器的历史状态数据,对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据;
数据离散化模块,用于利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,其中,所述预设的离散检验算法为:
其中,χ2是所述清洗数据的数据区间的统计量卡方值,j是所述清洗数据的类别标识,k是所述清洗数据的类别总数,Aij是第i个区间的第j类样本的数量,Eij是第i个数据区间的第j类样本的数量的期望频数,Ri是第i个数据区间的样本数,i是所述数据区间的区间标识,Cj是为相邻两个所述数据区间的第j类样本个数,N是所述期望频数的频数和,b是常量;
关联挖掘模块,用于根据所述离散数据生成所述目标变压器的特征矩阵,利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则;
故障值抽取模块,用于根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数;
差异化权重生成模块,用于生成所述目标变压器的差异化报警值,根据所述差异化报警值生成所述目标变压器的故障差异化权重;
故障分析模块,用于根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,根据所述故障发生率对所述目标变压器进行故障分析。
本发明实施例通过对获取的目标变压器的历史状态数据进行数据清洗,获得更干净、准确的数据,可以减少误判和漏判的情况,再对数据进行离散化处理,是为了将复杂的数据集转化为易于处理的离散数据,生成目标变压器的特征矩阵,利用特征矩阵对目标变压器的状态参数进行关联挖掘,有利于建立起变压器状态参数之间的联系,可以更加准确、全面的描述变压器特征,并能够更好的识别出潜在的故障原因,根据关联规则对状态参数进行故障值抽取可以快速准确地提取主要的故障参数,为后续故障分析提供有力支持,并且故障参数的提取过程是自动的,不需要人工去寻找,提高了效率并减少了错误,因此本发明提出基于关联规则分析的变压器故障分析方法及装置,可以解决变压器故障分析效率较低的问题。
附图说明
图1为本发明一实施例提供的基于关联规则分析的变压器故障分析方法的流程示意图;
图2为本发明一实施例提供的生成特征矩阵的流程示意图;
图3为本发明一实施例提供的状态参数的关联挖掘的流程示意图;
图4为本发明一实施例提供的基于关联规则分析的变压器故障分析装置的功能模块图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于关联规则分析的变压器故障分析方法。所述基于关联规则分析的变压器故障分析方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于关联规则分析的变压器故障分析方法可以由安装在终端设备或服务端设备的软件或硬件来执行。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于关联规则分析的变压器故障分析方法的流程示意图。在本实施例中,所述基于关联规则分析的变压器故障分析方法包括:
S1、获取目标变压器的历史状态数据,对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据。
在本发明实施例中,所述获取目标变压器的历史状态数据是指获取目标变压器过去一段时间内的状态数据,用于分析变压器的历史运行情况和性能参数。这些状态数据可以包括温度、电流、电压、振动、湿度等多种参数;获取这些数据可以通过变压器的监测设备或传感器进行实时采集,也可以通过历史记录和数据库进行查询获得。
在本发明实施例中,所述对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据,包括:
对所述历史状态数据进行数据格式转化,得到所述历史状态数据的目标格式数据;
对所述目标格式数据进行空白值填充,得到所述目标格式数据的填充数据;
对所述填充数据进行异常值剔除,得到所述填充数据的异常值剔除数据,确定所述异常值剔除为所述历史状态数据的清洗数据。
详细地,所述对所述历史状态数据进行数据格式转化可以是本领域习知的数据格式转化工具(例如,可以是Python中的pandas库或者其他数据处理工具),所述数据格式转化工具仅仅是为了说明方案的可实施性而进行的示例性举例,并不限定本方案必须采用所述数据格式转化工具。
详细地,所述对所述历史状态数据进行数据格式转化,得到所述历史状态数据的目标格式数据可以先确定目标格式数据的结构和类型要求,再根据目标格式数据的要求,对历史状态数据进行必要的转换,如重新组织数据结构、改变数据类型等,最后使用合适的工具或编程语言进行数据格式转换。
详细地,所述对所述目标格式数据进行空白值填充可以可以使用插值法、填充同一列的均值或中位数等方法进行填充。
详细地,所述对所述填充数据进行异常值剔除可以使用箱线图、z-score分数等方法进行异常值检测,对于检测到的异常值,可以采取删除、替换、插值等方法进行处理。
S2、利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据。
在本发明实施例中,所述利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据具体来说,就是通过预设的离散检验算法对清洗后的连续型数据进行离散化检验,判断其是否需进行离散化处理;如果需要,则将数据进行离散化处理并生成离散数据,如果无需离散化,则保持原始数据不变。
详细地,所述清洗数据的离散化是为了将连续型数据转化为离散型数据,将连续型数据分成有限的离散化区间,以便于对数据进行分析和建模。
在本发明实施例中,所述利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,包括:
确定所述清洗数据的数据特征值,根据所述数据特征值对所述清洗数据进行数据排列,得到所述清洗数据的数据序列;
根据所述数据特征值确定所述数据序列的数据区间;
利用预设的离散检验算法逐个计算所述数据区间的区间卡方值,根据所述区间卡方值和预设的合并阈值对所述数据区间进行区间合并,得到所述数据区间的更新区间;
根据所述更新区间生成所述清洗数据的离散数据。
详细地,需要利用预设的离散检验算法逐个计算每个数据区间的区间卡方值,以判断这些区间是否需要进行离散化处理。一般而言,如果数据区间内数据的分布比较均匀,且区间间的数据差异比较明显,那么这些区间可不进行离散化处理。
详细地,在计算完所有数据区间的区间卡方值后,需要根据预设的合并阈值,对数据区间进行区间合并;所述区间合并是指将相邻的数据区间合并为一个新的数据区间,以获得更新的区间,需要注意的是,在区间合并的过程中需要保证新的数据区间的数据分布比较均匀。
详细地,所述利用预设的离散检验算法逐个计算所述数据区间的区间卡方值是指利用预设的离散检验算法计算每相邻两个数据区间的卡方值。
详细地,所述根据所述区间卡方值和预设的合并阈值对所述数据区间进行区间合并是指将小于预设的合并阈值的数据区间合并,合并形成新的区间计算与其它相邻区间的卡方值,迭代直到所有相邻区间的卡方值都大于阀值为止。
详细地,所述预设的合并阈值是人为设定的,其中,所述预设的合并阈值过小会使最终得到的区间(即属性离散后的类)过多,不利于处理。
详细地,所述预设的离散检验算法为:
其中,χ2是所述清洗数据的数据区间的统计量卡方值,j是所述清洗数据的类别标识,k是所述清洗数据的类别总数,Aij是第i个区间的第j类样本的数量,Eij是第i个数据区间的第j类样本的数量的期望频数,Ri是第i个数据区间的样本数,i是所述数据区间的区间标识,Cj是为相邻两个所述数据区间的第j类样本个数,N是所述期望频数的频数和,b是常量。
详细地,所述清洗数据的数据区间的统计量卡方值能衡量离散区间和类属性之间的独立性,值越大独立性越大。
S3、根据所述离散数据生成所述目标变压器的特征矩阵,利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则。
在本发明实施例中,参图2所示,所述根据所述离散数据生成所述目标变压器的特征矩阵,包括:
S21、对所述离散数据进行独热编码,得到所述离散数据的编码向量;
S22、对所述编码向量进行降维处理,得到所述编码向量的降维向量;
S23、对所述降维向量进行向量拼接,得到所述降维向量的拼接矩阵,确定所述降维向量的拼接矩阵为所述目标变压器的特征矩阵。
详细地,所述对所述离散数据进行独热编码是指将离散数据转换为编码向量,其中每个离散值都被表示为一个独热向量,其中,所述独热向量是一个只有一个元素为1,其余元素都为0的向量。
详细地,假设所述离散数据是关于电流、电压、温度等的数据,亦即,将电流、电压和温度做为状态参数,各自对应不同的离散数据。
进一步地,可以将每个状态参数转化为一个编码向量,向量长度为3,每个向量中只有一个元素为1,其余元素均为0,例如:当电流为1时,它的编码向量为[1,0,0];当电流为2时,它的编码向量为[0,1,0],以此类推。
详细地,所述对所述编码向量进行降维处理可以通过各种降维技术(如主成分分析)来实现,目的是减少向量的维度。
详细地,所述拼接矩阵是由多个降维向量按照一定规则组合而成的矩阵;所述特征矩阵的每一列对应一个状态参数,每一行对应一个样本,其中每个样本都包含了变压器的所有状态参数信息。
在本发明实施例中,参图3所示,所述利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则,包括:
S31、根据所述特征矩阵构建所述目标变压器的状态参数的频繁模式树,根据所述频繁模式树的树节点确定所述状态参数的条件模式基;
S32、逐个构建所述条件模式基的生成条件树;
S33、对所述生成条件树进行递归挖掘,得到所述状态参数的频繁项集;
S34、根据所述预设的关联阈值生成所述频繁项集的对应规则,确定所述频繁项集的对应规则为所述状态参数的关联规则。
详细地,所述根据所述特征矩阵构建所述目标变压器的状态参数的频繁模式树时可以假设设定的支持度阈值为0.3,那么在所述特征矩阵中,出现频率大于0.3的状态参数将被认为是频繁的,例如:频繁模式为特征1、特征2、特征3和特征4,分别对应的支持度为0.5、0.6、0.4和0.3,频繁模式为特征1&特征2,对应的支持度为0.3,频繁模式为特征2&特征3,对应的支持度为0.3,频繁模式为特征3&特征4,对应的支持度为0.3,其中,特征1&特征2代表同时出现特征1和特征2的情况,再根据状态参数是否频繁的判断结果生成所述状态参数的频繁模式树。
详细地,所述条件模式基是一个包含所有以当前节点作为结尾的频繁项集的集合。例如,以节点“特征1&特征2”为例,它的条件模式基为{特征3&特征4},因为在所有同时出现特征1和特征2的情况中,特征3和特征4同时出现的频率不低于阈值0.3。
详细地,所述生成条件树是一个根据条件模式集生成的树形结构,以条件模式基{特征3&特征4}为例,我们可以将它看作一个新的变压器数据集,其中只包含特征3和特征4的取值,基于这个数据集,重复前面的步骤,构建出一颗子树。
详细地,所述对所述生成条件树进行递归挖掘可以得到了特征3和特征4的频繁项集{特征3}和{特征4}。
详细地,所述根据所述预设的关联阈值生成所述频繁项集的对应规则可以理解为假设关联规则的置信度阈值为0.7,那么有如下关联规则:如果特征4出现,则特征2很可能也会出现;如果特征2出现,则特征4很可能也会出现。
详细地,所述关联规则是指通过数据挖掘等方法在数据中挖掘出来的相关性规则,用于描述不同状态参数之间的依赖关系,例如:规则“当状态参数A取值为x,状态参数B取值为y的意思是,这两个状态参数之间存在一定的相关性,当A特定值时,B会相应取相应的值。
S4、根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数。
在本发明实施例中,所述根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数,包括:
根据所述特征矩阵和所述关联规则计算所述状态参数的参数置信度;
根据所述参数置信度对所述关联规则进行规则筛选,得到所述关联规则的目标规则;
根据所述目标规则和预设的故障范围对所述状态参数进行故障值抽取,得到所述状态参数的故障参数。
详细地,所述参数置信度用来评估每个状态参数的可靠性;所述根据所述参数置信度对所述关联规则进行规则筛选可以减少对状态参数进行故障值抽取的计算量,提高计算效率。
详细地,所述根据所述参数置信度对所述关联规则进行规则筛选,得到所述关联规则的目标规则是指通过设定一个阈值来划分规则的可靠性,如只选择参数置信度高于某一特定阈值的关联规则作为目标规则,可以提高分析结果的准确度,从备选规则中筛选掉共线性高或有重复信息的冗余规则,确定正交性较高、对故障值抽取具有更强解释能力的规则作为目标规则。
详细地,所述根据所述目标规则和预设的故障范围对所述状态参数进行故障值抽取可以先针对目标规则集合和预设的故障范围进行匹配和筛选,确定需要抽取的故障参数,再检查每个故障参数的当前值,并与目标规则进行匹配,确定故障值的抽取方法和故障范围,根据确定的抽取方法和故障范围,抽取出每个故障参数的故障值。
S5、生成所述目标变压器的差异化报警值,根据所述差异化报警值生成所述目标变压器的故障差异化权重。
在本发明实施例中,所述生成所述目标变压器的差异化报警值,包括:
确定所述目标变压器的故障指标,根据所述故障指标对所述特征矩阵进行参数选取,得到所述特征矩阵的特征参数;
利用所述特征参数构建所述目标变压器的差异化报警模型;
获取所述目标变压器的实时监测数据,利用所述差异化报警模型生成所述实时监测数据的差异化报警值。
详细地,所述确定所述目标变压器的故障指标是指明确哪些指标可以反映出目标变压器的故障情况以及哪些指标对于目标变压器的监测至关重要;所述特征参数具有区分目标变压器正常状态和异常状态的能力。
详细地,所述差异化报警模型可以是任何一种合适的模型,例如机器学习模型、神经网络模型等等,通过构建差异化报警模型,可以更准确地预测目标变压器是否处于异常状态。
详细地,所述差异化报警值可以用于反映目标变压器当前的健康状态,如果差异化报警值超过阈值,就说明目标变压器需要进行维护和修理。
详细地,所述差异化报警值通常是一个数字,它可以反映出当前变压器运行状态的偏离程度和故障的严重程度。基于这个报警值,可以快速判断变压器是否存在故障;所述差异化报警值可以考虑目标变压器的运行环境和负载情况等因素,生成的差异化报警值可以用于判断目标变压器是否存在故障。
在本发明实施例中,所述根据所述差异化报警值生成所述目标变压器的故障差异化权重,包括:
生成所述目标变压器的差异化报警级别,逐个对所述差异化报警级别进行权重分配,得到所述差异化报警级别的分配权重;
根据所述差异化报警级别对所述差异化报警值进行级别划分,得到所述差异化报警值的划分区间;
将所述划分区间与所述分配权重进行权重关联,得到所述划分区间的关联权重;
根据所述划分区间的关联权重生成所述目标变压器的故障差异化权重。
详细地,所述生成所述目标变压器的差异化报警级别是指根据故障的严重程度和影响程度,定义一组差异化报警级别,其中,每个级别可以对应不同的故障情况。
详细地,所述逐个对所述差异化报警级别进行权重分配是指根据定义的差异化报警级别,为每个级别分配一个权重,其中,权重所述分配权重可以表示该级别故障的重要程度,通常是一个非负实数。
详细地,所述根据所述差异化报警级别对所述差异化报警值进行级别划分是指将差异化报警值按照定义的差异化报警级别进行划分,形成不同的划分区间,每个所述划分区间对应一个差异化报警级别。
详细地,所述将所述划分区间与所述分配权重进行权重关联是指将划分的划分区间与对应的权重进行关联,形成目标变压器的故障差异化权重,每个划分区间对应一个权重,用于表示该区间内故障的重要程度。
例如,假设定义了三个差异化报警级别:高、中、低。对应的权重分别为0.8、0.5、0.3。根据差异化报警值的划分,区间[0,50)对应高级别,区间[50,80)对应中级别,区间[80,100]对应低级别。则可以生成如下的故障差异化权重:高级别:权重为0.8;中级别:权重为0.5;低级别:权重为0.3。通过这样的差异化权重设置,可以根据不同的差异化报警值评估故障的重要程度,并为后续的故障分析提供指导,其中,差异化报警级别和权重的设置可以根据实际需求和变压器的特性进行调整和优化
S6、根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,根据所述故障发生率对所述目标变压器进行故障分析。
在本发明实施例中,所述根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,包括:
利用如下权重算法、所述故障参数和所述故障差异化权重生成所述变压器的故障发生率:
其中,A是所述变压器的故障发生率,bp是第p个所述故障参数,cp是第p个所述故障参数对应的所述故障差异化权重,t是所述故障参数的总数,p是所述故障参数的参数标识。
详细地,所述故障发生率是指目标变压器在一段时间内出现故障的概率,当所述故障发生率较高时,可能意味着该故障类型的风险更大,需要重点关注和处理。
本发明实施例通过对获取的目标变压器的历史状态数据进行数据清洗,获得更干净、准确的数据,可以减少误判和漏判的情况,再对数据进行离散化处理,是为了将复杂的数据集转化为易于处理的离散数据,生成目标变压器的特征矩阵,利用特征矩阵对目标变压器的状态参数进行关联挖掘,有利于建立起变压器状态参数之间的联系,可以更加准确、全面的描述变压器特征,并能够更好的识别出潜在的故障原因,根据关联规则对状态参数进行故障值抽取可以快速准确地提取主要的故障参数,为后续故障分析提供有力支持,并且故障参数的提取过程是自动的,不需要人工去寻找,提高了效率并减少了错误,因此本发明提出基于关联规则分析的变压器故障分析方法,可以解决变压器故障分析效率较低的问题。
如图4所示,是本发明一实施例提供的基于关联规则分析的变压器故障分析装置的功能模块图。
本发明所述基于关联规则分析的变压器故障分析装置100可以安装于电子设备中。根据实现的功能,所述基于关联规则分析的变压器故障分析装置100可以包括数据清洗模块101、数据离散化模块102、关联挖掘模块103、故障值抽取模块104、差异化权重生成模块105及故障分析模块106。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述数据清洗模块101,用于获取目标变压器的历史状态数据,对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据;
所述数据离散化模块102,用于利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,其中,所述预设的离散检验算法为:
其中,χ2是所述清洗数据的数据区间的统计量卡方值,j是所述清洗数据的类别标识,k是所述清洗数据的类别总数,Aij是第i个区间的第j类样本的数量,Eij是第i个数据区间的第j类样本的数量的期望频数,Ri是第i个数据区间的样本数,i是所述数据区间的区间标识,Cj是为相邻两个所述数据区间的第j类样本个数,N是所述期望频数的频数和,b是常量;
所述关联挖掘模块103,用于根据所述离散数据生成所述目标变压器的特征矩阵,利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则;
所述故障值抽取模块104,用于根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数;
所述差异化权重生成模块105,用于生成所述目标变压器的差异化报警值,根据所述差异化报警值生成所述目标变压器的故障差异化权重;
所述故障分析模块106,用于根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,根据所述故障发生率对所述目标变压器进行故障分析。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用装置。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于关联规则分析的变压器故障分析方法,其特征在于,所述方法包括:
获取目标变压器的历史状态数据,对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据;
利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,其中,所述预设的离散检验算法为:
其中,χ2是所述清洗数据的数据区间的统计量卡方值,j是所述清洗数据的类别标识,k是所述清洗数据的类别总数,Aij是第i个区间的第j类样本的数量,Eij是第i个数据区间的第j类样本的数量的期望频数,Ri是第i个数据区间的样本数,i是所述数据区间的区间标识,Cj是为相邻两个所述数据区间的第j类样本个数,N是所述期望频数的频数和,b是常量;
根据所述离散数据生成所述目标变压器的特征矩阵,利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则;
根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数;
生成所述目标变压器的差异化报警值,根据所述差异化报警值生成所述目标变压器的故障差异化权重;
根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,根据所述故障发生率对所述目标变压器进行故障分析。
2.如权利要求1所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据,包括:
对所述历史状态数据进行数据格式转化,得到所述历史状态数据的目标格式数据;
对所述目标格式数据进行空白值填充,得到所述目标格式数据的填充数据;
对所述填充数据进行异常值剔除,得到所述填充数据的异常值剔除数据,确定所述异常值剔除为所述历史状态数据的清洗数据。
3.如权利要求1所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,包括:
确定所述清洗数据的数据特征值,根据所述数据特征值对所述清洗数据进行数据排列,得到所述清洗数据的数据序列;
根据所述数据特征值确定所述数据序列的数据区间;
利用预设的离散检验算法逐个计算所述数据区间的区间卡方值,根据所述区间卡方值和预设的合并阈值对所述数据区间进行区间合并,得到所述数据区间的更新区间;
根据所述更新区间生成所述清洗数据的离散数据。
4.如权利要求1所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述根据所述离散数据生成所述目标变压器的特征矩阵,包括:
对所述离散数据进行独热编码,得到所述离散数据的编码向量;
对所述编码向量进行降维处理,得到所述编码向量的降维向量;
对所述降维向量进行向量拼接,得到所述降维向量的拼接矩阵,确定所述降维向量的拼接矩阵为所述目标变压器的特征矩阵。
5.如权利要求1所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则,包括:
根据所述特征矩阵构建所述目标变压器的状态参数的频繁模式树,根据所述频繁模式树的树节点确定所述状态参数的条件模式基;
逐个构建所述条件模式基的生成条件树;
对所述生成条件树进行递归挖掘,得到所述状态参数的频繁项集;
根据所述预设的关联阈值生成所述频繁项集的对应规则,确定所述频繁项集的对应规则为所述状态参数的关联规则。
6.如权利要求1所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数,包括:
根据所述特征矩阵和所述关联规则计算所述状态参数的参数置信度;
根据所述参数置信度对所述关联规则进行规则筛选,得到所述关联规则的目标规则;
根据所述目标规则和预设的故障范围对所述状态参数进行故障值抽取,得到所述状态参数的故障参数。
7.如权利要求1所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述生成所述目标变压器的差异化报警值,包括:
确定所述目标变压器的故障指标,根据所述故障指标对所述特征矩阵进行参数选取,得到所述特征矩阵的特征参数;
利用所述特征参数构建所述目标变压器的差异化报警模型;
获取所述目标变压器的实时监测数据,利用所述差异化报警模型生成所述实时监测数据的差异化报警值。
8.如权利要求1所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述根据所述差异化报警值生成所述目标变压器的故障差异化权重,包括:
生成所述目标变压器的差异化报警级别,逐个对所述差异化报警级别进行权重分配,得到所述差异化报警级别的分配权重;
根据所述差异化报警级别对所述差异化报警值进行级别划分,得到所述差异化报警值的划分区间;
将所述划分区间与所述分配权重进行权重关联,得到所述划分区间的关联权重;
根据所述划分区间的关联权重生成所述目标变压器的故障差异化权重。
9.如权利要求1至8中任一项所述的基于关联规则分析的变压器故障分析方法,其特征在于,所述根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,包括:
利用如下权重算法、所述故障参数和所述故障差异化权重生成所述变压器的故障发生率:
其中,A是所述变压器的故障发生率,bp是第p个所述故障参数,cp是第p个所述故障参数对应的所述故障差异化权重,t是所述故障参数的总数,p是所述故障参数的参数标识。
10.一种基于关联规则分析的变压器故障分析装置,其特征在于,所述装置包括:
数据清洗模块,用于获取目标变压器的历史状态数据,对所述历史状态数据进行数据清洗,得到所述历史状态数据的清洗数据;
数据离散化模块,用于利用预设的离散检验算法对所述清洗数据进行离散化检验,根据所述离散化检验结果生成所述清洗数据的离散数据,其中,所述预设的离散检验算法为:
其中,χ2是所述清洗数据的数据区间的统计量卡方值,j是所述清洗数据的类别标识,k是所述清洗数据的类别总数,Aij是第i个区间的第j类样本的数量,Eij是第i个数据区间的第j类样本的数量的期望频数,Ri是第i个数据区间的样本数,i是所述数据区间的区间标识,Cj是为相邻两个所述数据区间的第j类样本个数,N是所述期望频数的频数和,b是常量;
关联挖掘模块,用于根据所述离散数据生成所述目标变压器的特征矩阵,利用所述特征矩阵对所述目标变压器的状态参数进行关联挖掘,得到所述状态参数的关联规则;
故障值抽取模块,用于根据所述关联规则对所述状态参数进行故障值抽取,得到所述状态参数的故障参数;
差异化权重生成模块,用于生成所述目标变压器的差异化报警值,根据所述差异化报警值生成所述目标变压器的故障差异化权重;
故障分析模块,用于根据所述故障参数和所述故障差异化权重生成所述变压器的故障发生率,根据所述故障发生率对所述目标变压器进行故障分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310771927.4A CN116821829A (zh) | 2023-06-28 | 2023-06-28 | 基于关联规则分析的变压器故障分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310771927.4A CN116821829A (zh) | 2023-06-28 | 2023-06-28 | 基于关联规则分析的变压器故障分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116821829A true CN116821829A (zh) | 2023-09-29 |
Family
ID=88140462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310771927.4A Pending CN116821829A (zh) | 2023-06-28 | 2023-06-28 | 基于关联规则分析的变压器故障分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116821829A (zh) |
-
2023
- 2023-06-28 CN CN202310771927.4A patent/CN116821829A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111210024B (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN110837866A (zh) | 基于XGBoost的电力二次设备缺陷程度评估方法 | |
JP2000512766A (ja) | 高電圧絶縁における部分放電測定の統計的パターン分析方法 | |
CN106446016A (zh) | 一种基于并行关联规则挖掘的配电网运行可靠性预测方法 | |
CN111900694B (zh) | 一种基于自动识别的继电保护设备信息采集方法及系统 | |
CN115204536A (zh) | 楼宇设备故障预测方法、装置、设备及存储介质 | |
CN113343581B (zh) | 基于图马尔可夫神经网络的变压器故障的诊断方法 | |
CN116737510B (zh) | 一种基于数据分析的键盘智能监测方法及系统 | |
CN116862081B (zh) | 一种污染治理设备运维方法及系统 | |
CN107784392A (zh) | 一种基于机器学习的输电线路的缺陷预测方法及装置 | |
JP2023504103A (ja) | モデル更新システム、モデル更新方法及び関連装置 | |
CN105471647A (zh) | 一种电力通信网故障定位方法 | |
CN116976318A (zh) | 基于深度学习和模型推理的电网倒闸操作票智能审核系统 | |
CN112949201B (zh) | 一种风速预测方法、装置、电子设备及存储介质 | |
CN114548493A (zh) | 一种电能表电流过载预测方法与系统 | |
CN113891342B (zh) | 基站巡检方法、装置、电子设备及存储介质 | |
CN117332330A (zh) | 基于多源数据图融合模型的变压器故障评估方法及系统 | |
CN116664098A (zh) | 一种光伏电站的异常检测方法及系统 | |
CN111209955A (zh) | 基于深度神经网络和随机森林的飞机电源系统故障识别方法 | |
CN116821829A (zh) | 基于关联规则分析的变压器故障分析方法及装置 | |
CN116245212A (zh) | 基于pca-lstm的电力数据异常检测与预测方法及系统 | |
CN112329432B (zh) | 一种基于改进Apriori的配电网电压越限问题关联分析方法 | |
CN114298188A (zh) | 一种电力设备故障智能分析方法及系统 | |
CN115689320A (zh) | 基站运行的健康管理方法、装置及计算机可读存储介质 | |
CN115209441A (zh) | 基站退服告警预测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |