CN111626153B - 一种基于集成学习的局放故障状态识别方法 - Google Patents

一种基于集成学习的局放故障状态识别方法 Download PDF

Info

Publication number
CN111626153B
CN111626153B CN202010404189.6A CN202010404189A CN111626153B CN 111626153 B CN111626153 B CN 111626153B CN 202010404189 A CN202010404189 A CN 202010404189A CN 111626153 B CN111626153 B CN 111626153B
Authority
CN
China
Prior art keywords
partial discharge
signal
stacking
signals
ultraviolet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010404189.6A
Other languages
English (en)
Other versions
CN111626153A (zh
Inventor
吴慧娟
唐波
邱浩宇
王宇丰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Eisens Intelligent Technology Co ltd
University of Electronic Science and Technology of China
Original Assignee
Nanjing Eisens Intelligent Technology Co ltd
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Eisens Intelligent Technology Co ltd, University of Electronic Science and Technology of China filed Critical Nanjing Eisens Intelligent Technology Co ltd
Priority to CN202010404189.6A priority Critical patent/CN111626153B/zh
Publication of CN111626153A publication Critical patent/CN111626153A/zh
Application granted granted Critical
Publication of CN111626153B publication Critical patent/CN111626153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/12Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing
    • G01R31/1209Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing using acoustic measurements
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/12Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing
    • G01R31/1218Testing dielectric strength or breakdown voltage ; Testing or monitoring effectiveness or level of insulation, e.g. of a cable or of an apparatus, for example using partial discharge measurements; Electrostatic testing using optical methods; using charged particle, e.g. electron, beams or X-rays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction

Abstract

本发明公开了一种基于集成学习的局放故障状态识别方法,涉及电力设备局部放电检测识别领域,首先通过局放声光联合检测系统采集局部放电信号,获取原始数据,经过数据预处理,包括异常值检测与清洗、数据去噪和数据标准化,再从多分析域提取信号特征,将得到的超声信号特征、紫外信号特征输入到本发明设计的两阶段Stacking‑Bagging集成学习模型中,最终通过相对多数投票判断出当前输入信号所处的局放故障状态。该识别方法对电力设备的局放故障状态识别率高,且识别稳定性高。

Description

一种基于集成学习的局放故障状态识别方法
技术领域
本发明涉及电力设备局部放电检测领域,具体涉及一种基于集成学习的局放故障状态识别方法。
背景技术
通过局部放电检测法实时检测电力设备故障状态,分析故障发展阶段,具有重大的意义。目前局部放电发生过程中常常伴随着多种物理、化学现象,例如电磁波、声波的发射、电荷的交换、产生分解物、发出光和热等。因此,根据局部放电的物理、化学和电气特征,一般把局部放电检测方法划分为非电气测量法和电气测量法。其中电气测量方法主要有:脉冲电流检测法、特高频检测法等。非电气测量方法常见的有:超声波检测法、红外热像法、紫外光检测法以及化学检测法等。单一的局部放电检测方法难以保障电力设备故障状态的准确、稳定识别。采用联合检测的方法可以从多信息融合角度,挖掘局部放电更丰富的信息,并可以优势互补,扩大检测方法的适用范围,实现多场景应用。目前国内外研究比较深入的是超声波法与特高频法的联合,但这种仍以电气检测法为主,检测结果受电磁环境干扰影响较大,不适用于强电磁干扰应用场景。超声-紫外脉冲联合检测方式,具有抗强电磁干扰、非接触式测量、成本低廉、可便携、检测优势互补等特点。目前基于局部放电声光联合检测系统,进行故障状态识别方法,有支持向量机、基于距离的KNN算法、神经网络算法等,近年来也有学者尝试了以卷积神经网络CNN为代表的深度学习算法的应用。支持向量机算法核函数受Mercer条件限制,规则化参数选择困难,并且对缺失数据敏感;KNN算法存在容错性较差、小样本预测准确性低和大样本量下预测速度慢等问题,而卷积神经网络需大量的训练样本,学习训练时间较长,计算资源要求高,且可解释性不强。由于电力设备局部放电影响因素较多,现场环境、电力设备自身缺陷和人为操作等均可能带来干扰,同时部分应用场景下存在因故障放电状态样本较少而引起的样本不均衡,因故障放电状态界限模糊而导致的样本误分类等问题,因此,对局部放电故障状态的高准确性、高稳定性识别是一个困难而复杂的问题。目前大部分局部放电故障状态识别算法采用单模型分类算法,虽然在特定场景中取得了不错的识别结果,但在实际应用中仍存在着以下难点:
1、在训练样本较少的条件下,可能单模型分类算法的准确性不高;
2、由于先验知识不确切,可能造成单模型分类算法泛化性能不强;
3、大部分单模型算法在各自擅长的领域识别效果不错,但不能解决多场景应用问题。
集成学习算法通过多个单模型分类算法优势互补,目前应用比较广泛的集成学习算法有Bagging、Boosting和Stacking等,但在局部放电故障状态识别的应用中还比较少,所以本发明结合应用场景提出一种基于集成学习的局放故障状态识别方法进行集成学习模型的选择和设计以识别局部放电故障状态。
发明内容
本发明的目的在于:提供了一种基于集成学习的局放故障状态识别方法,以解决局部放电故障状态的要求高准确性、高稳定性识别的问题。
本发明采用的技术方案如下:
本发明是一种基于集成学习的局放故障状态识别方法,该方法具体包括以下步骤:
步骤1:利用局放声光联合检测系统采集实际应用现场的局部放电信号,包含超声信号和紫外信号,并构建信号数据库;
步骤2:采用基于统计的箱型图理论对局部放电信号的异常值进行检测并清洗;
步骤3:采用经验模态分解法减弱局部放电信号的噪声干扰;
步骤4:对去噪后的局部放电信号采用最大-最小值标准化进行数据标准化处理;
步骤5:对经过步骤4标准化处理后局部放电信号进行多分析域特征提取,分别得到超声信号特征Fcs与紫外信号特征Fzy
步骤6:对于超声信号特征Fcs利用Stacking算法进一步挖掘局部放电信息,超声信号特征Fcs通过使用初级学习器和次级学习器进行训练和测试,将输出结果作为Stacking特征,记作Fstacking
步骤7:将超声信号特征Fcs、紫外信号特征Fzy和步骤6得到的Stacking特征Fstacking进行融合得到融合特征Fmerge,融合特征Fmerge划分为训练集和测试集,融合特征Fmerge的训练集数据用于训练LGB分类器,每次随机抽取Fmerge的一部分特征,通过Bagging算法得到多个LGB分类器;
步骤8:融合特征Fmerge的测试集数据依次输入步骤7训练好的多个LGB分类器,每个LGB分类器对其输出一个预测结果,对多个LGB分类器的预测结果采用相对多数投票的方式,选择得票最多的故障状态作为预测输出,即可得到集成学习模型最终预测的局部放电故障状态。
进一步的,所述信号数据库内局部放电信号按7∶3的比例划分为训练集和测试集。
进一步的,所述步骤7具体划分为Stacking第一阶段、Stacking第二阶段和Stacking输出,
Stacking第一阶段是使用初级学习器,结合5折交叉验证的方式,得到训练集和测试集的预测结果输入到Stacking第二阶段,其中,在每一个初级学习器内,训练集各折的预测结果采用按行堆叠合并的方式输入到Stacking第二阶段,测试集结果采用求平均的方式输入到Stacking第二阶段;
Stacking第二阶段是将Stacking第一阶段中多个初级学习器的训练集、测试集预测结果采取按列堆叠合并的方式,分别得到新训练集和新测试集,其中新训练集用于训练次级学习器(RF);
Stacking输出是将Stacking第二阶中的新测试集输入到次级学习器得到输出结果,即Stacking特征。
进一步的,所述初级学习器采用4个,分别为支持向量机SVM、K最近邻KNN、随机森林RF和极端梯度提升树XGB,所述次级学习器采用随机森林RF。
进一步的,所述步骤1中局放声光联合检测系统包括传感器模块、声光信号驱动模块、STM32主控模块和电源模块;所述传感器模块包括超声传感器和紫外传感器,用于搜集局部放电过程伴随的超声信号和紫外信号,超声信号和紫外信号通过声光信号驱动模块分别转换为电压信号和脉冲信号,电压信号经模数转换后通过SPI通信方式传输到STM32主控模块,脉冲信号由STM32主控模块通过脉冲捕获方式进行采集;STM32主控模块对超声信号和紫外信号进行融合处理得到局部放电信号,并完成实时数据存储、波形显示及预警提示。
进一步的,所述步骤2对局部放电信号的异常值进行检测并清洗的具体步骤为:
步骤21:步骤1中信号数据库内根据超声信号和紫外信号的幅值等级进行分离;
步骤22:基于箱型图理论分别确定超声信号和紫外信号的经验系数值k;
步骤23:根据步骤22得到的经验值系数k,确定超声信号的箱型图最大值Bmax1和最小值Bmin1,以及紫外信号的箱型图最大值Bmax2和最小值Bmin2
步骤24:根据步骤23中超声信号的箱型图最大值Bmax1和最小值Bmin1,以及紫外信号的箱型图最大值Bmax2和最小值Bmin2的数值范围对步骤1中局部放电信号进行异常值剔除,则完成局部放电信号异常值清洗。
进一步的,所述步骤3中对局部放电信号去噪方法具体为:将原始信号分解为多个不同的中心频率的固有模态函数(IMF)分量,然后对每个分量进行阈值处理,剔除其中干扰成分比较大的分量,接着重构局部放电信号,得到去噪后的信号。
进一步的,所述步骤5中紫外信号特征Fzy包括时域特征,所述超声信号特征Fcs包括时域、频域、小波分析、倒频域和自回归模型参数的特征。
进一步的,所述时域特征包括形状特征、能量特征、统计特征、短时最大主冲击和短时过零率;所述频域特征包括频率谱特征和功率谱特征,其中功率谱特征包括功率谱频带分布特征、功率谱频带信息熵和功率谱形状统计。
进一步的,所述步骤6具体划分为Stacking第一阶段、Stacking第二阶段和Stacking输出,
Stacking第一阶段是使用初级学习器,结合5折交叉验证的方式,得到训练集和测试集的预测结果输入到Stacking第二阶段,其中,在每一个初级学习器内,训练集各折的预测结果采用按行堆叠合并的方式输入到Stacking第二阶段,测试集结果采用求平均的方式输入到Stacking第二阶段;
Stacking第二阶段是将Stacking第一阶段中多个初级学习器的训练集、测试集预测结果采取按列堆叠合并的方式,分别得到新训练集和新测试集,其中新训练集用于训练次级学习器(RF);
Stacking输出是将Stacking第二阶中的新测试集输入到次级学习器得到输出结果,即Stacking特征。
进一步的,所所述Stacking部分的初级学习器采用4个,分别为支持向量机SVM、K最近邻KNN、随机森林RF和极端梯度提升树XGB,所述次级学习器采用随机森林RF。
综上所述,由于采用了本技术方案,本发明的有益效果是:
1、本发明是一种基于集成学习的局放故障状态识别方法,通过训练多个基模型,然后以某种集成规则将各个模型的输出结果进行整合处理,从而获得比单个模型性能更好的机器学习算法,融合了多个模型的分类特性,整体性能和泛化能力更加优越,也能适应更多的应用场景。
2、本发明是一种基于集成学习的局放故障状态识别方法,为了提高多场景下故障状态识别的准确性和稳定性,利用局部放电声光联合检测系统采集现场数据,经过数据预处理,包括异常值检测与清洗、数据去噪和数据标准化,再从多分析域提取局部放电信号特征,将得到的超声信号特征、紫外信号特征输入到本发明的两阶段Stacking-Bagging集成学习模型中,最终通过相对多数投票判断出当前输入信号所处的局放故障状态,该识别方法对变压器局放故障状态平均识别率和识别稳定性高。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,本说明书附图中的各个部件的比例关系不代表实际选材设计时的比例关系,其仅仅为结构或者位置的示意图,其中:
图1是本发明的局放故障状态识别流程图;
图2是本发明的局放声光联合检测系统总体方案图;
图3是本发明中箱型图理论原理图;
图4是本发明的集成学习模型Stacking阶段图;
图5是本发明的集成学习模型Bagging阶段图;
图6-11是本发明中Stacking-Bagging集成学习模型与传统的K最近邻(KNN)、支持向量机(SVM)、随机森林(RF)、极端梯度提升树(XGB)和轻量级梯度提升机(LGB)的混淆矩阵对比;
图12为本发明中Stacking-Bagging集成学习模型与传统的K最近邻(KNN)、支持向量机(SVM)、随机森林(RF)、极端梯度提升树(XGB)和轻量级梯度提升机(LGB)的平均识别准确性对比,每个传统模型的第一列为平均查准率,第二列为平均查全率,第三列为平均F1-score;
图13为本发明中Stacking-Bagging集成学习模型与传统的K最近邻(KNN)、支持向量机(SVM)、随机森林(RF)、极端梯度提升树(XGB)和轻量级梯度提升机(LGB)的十折交叉验证识别结果对比。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
下面结合附图对本发明作详细说明。
实施例一
如图1所示,本发明是一种基于集成学习的局放故障状态识别方法,该方法具体包括以下步骤:
步骤1:利用局放声光联合检测系统采集实际应用现场的局部放电信号,包含超声信号和紫外信号,并构建信号数据库;
步骤2:采用基于统计的箱型图理论对局部放电信号的异常值进行检测并清洗;
步骤3:采用经验模态分解法减弱局部放电信号的噪声干扰;
步骤4:对去噪后的局部放电信号采用最大-最小值标准化进行数据标准化处理;
步骤5:对经过步骤4标准化处理后局部放电信号进行多分析域特征提取,分别得到超声信号特征Fcs与紫外信号特征Fzy
步骤6:对于超声信号特征Fcs利用Stacking算法进一步挖掘局部放电信息,超声信号特征Fcs通过使用初级学习器和次级学习器进行训练和测试,将输出结果作为Stacking特征,记作Fstacking
步骤7:将超声信号特征Fcs、紫外信号特征Fzy和步骤6得到的Stacking特征Fstacking进行融合得到融合特征Fmerge,融合特征Fmerge划分为训练集和测试集,融合特征Fmerge的训练集数据用于训练LGB分类器,每次随机抽取Fmerge的一部分特征,通过Bagging算法得到多个LGB分类器;
步骤8:融合特征Fmerge的测试集数据依次输入步骤7训练好的多个LGB分类器,每个LGB分类器对其输出一个预测结果,对多个LGB分类器的预测结果采用相对多数投票的方式,选择得票最多的故障状态作为预测输出,即可得到集成学习模型最终预测的局部放电故障状态。
如图1所示,本发明的整个识别流程主要分为三个部分:数据预处理、传统特征提取和模型识别与分类。
数据预处理。包括上述步骤1-4,利用局放声光联合检测系统采集实际应用现场复杂强电磁干扰环境下的局部放电信号,局部放电信号包含超声信号和紫外信号,对各空间点采集的局部放电信号时间序列按时间段进行分割,构建典型故障状态信号数据库;为了提升原始数据的质量,以便于数据的进一步挖掘与分析,采用基于统计的箱型图理论对异常值进行检测并清洗;采用经验模态分解法减弱故障设备本身或现场环境带来的噪声干扰;为了应对特征量纲不统一导致的模型不准确等问题,对局部放电信号采用最大-最小值标准化进行数据标准处理。
第二部分,传统特征提取。包括上述步骤5,特征提取从多个维度和角度挖掘信号的特点,将原始特征转换为一些能够充分表达不同局部放电信号故障状态的特征。在交流电压下,传统的局部放电信号特征提取方法最常见有PRPD分析模式、TRPD分析模式。一般而言,为获取相位图谱,PRPD分析模式需要传感器长时间的定点观测,而TRPD分析模式由于可以对单次局部放电信号波形进行分析,更加适用于本发明的声光联合检测系统巡检式的数据采集方式,因此本发明对局部放电信号采取TRPD分析模式。
第三部分,模型识别与分类。包括上述步骤6-8,对局部放电故障状态的信号数据库划分训练集和测试集,在本实施中,训练集和测试集按照7∶3的比例划分,训练集用于训练本发明的两阶段Stacking-Bagging集成学习模型,其中Stacking部分通过组合精度较高、差异较大的分类器,挖掘局部放电信号更深层次的信息,主要提升集成学习模型整体准确性;Bagging部分通过BootStrap自助重采样训练多个分类器,即每次按行随机抽取训练集数据的80%,通过Bagging算法训练分类器,主要提升模型整体泛化性能和稳定性;而测试集数据输入Stacking-Bagging集成学习模型即可输出预测的局部放电故障状态,即正常放电、小故障放电或大故障放电。
在实际测试过程中,对于在线测试样本,将实时采集的局放声光信号,经过数据预处理、多分析域特征提取后,再按照图4原测试集的流程提取Stacking特征,最后将超声信号特征Fcs、紫外信号特征Fzy和Stacking特征Fstacking构成的融合特征Fmerge输入到之前训练好的多个分类器,采用相对多数投票得到最终的局部放电故障状态的识别结果。
实施例二
在实施例一的基础上,本实用新型一种优选实施例中,如图2所示,所述步骤1中局放声光联合检测系统包括传感器模块、声光信号驱动模块、STM32主控模块和电源模块;所述传感器模块包括超声传感器和紫外传感器,用于搜集局部放电过程伴随的超声信号和紫外信号,超声信号和紫外信号通过声光信号驱动模块分别转换为电压信号和脉冲信号,电压信号经模数转换后通过SPI通信方式传输到STM32主控模块,脉冲信号由STM32主控模块通过脉冲捕获方式进行采集;STM32主控模块对超声信号和紫外信号进行融合处理得到故障状态的局部放电信号,并完成实时数据存储、波形显示及预警提示。
在本发明中,局放声光联合检测系统融合了超声波和紫外脉冲两种非电气检测技术,包括上述传感器模块、声光信号驱动模块、STM32主控模块和电源模块,主要采集超声信号和紫外信号。
实施例三
在上述实施例的基础上,本实用新型一种优选实施例中,所述步骤2对局部放电信号的异常值进行检测并清洗的具体步骤为:
步骤21:步骤1中信号数据库内根据超声信号和紫外信号的幅值等级进行分离;
步骤22:基于箱型图理论分别确定超声信号和紫外信号的经验系数值k;
步骤23:根据步骤22得到的经验值系数k,确定超声信号的箱型图最大值Bmax1和最小值Bmin1,以及紫外信号的箱型图最大值Bmax2和最小值Bmin2
步骤24:根据步骤23中超声信号的箱型图最大值Bmax1和最小值Bmin1,以及紫外信号的箱型图最大值Bmax2和最小值Bmin2的数值范围对步骤1中局部放电信号进行异常值剔除,则完成局部放电信号异常值清洗。
如图3所示,本实施例通过实施例二中的局放声光联合检测系统采集局部放电伴随的超声信号、紫外信号后,对信号采用基于统计的箱型图理论来实现异常值的检测,在步骤21中,由于超声、紫外信号的异常值范围不一样,经验系数值k可能也不一样,因此需要根据信号特点进行分离,本发明中超声信号幅值比紫外信号大一个数量级,因此本发明从幅值等级上将二者分离开。在步骤22中,结合箱型图理论,从分位数统计角度上分别确定可以将异常值完全剔除的经验系数值,本发明中实验得到适合超声信号的经验系数值k1为5,适合紫外信号的经验系数值k2为3。在步骤22中,根据经验值系数,即可确定超声信号的箱型图最大值Bmax1、最小值Bmin1,和紫外信号的箱型图最大值Bmax2、最小值Bmin2,若信号数据小于MIN或大于MAX,则认为它是疑似异常极端值,由此可以对局部放电信号异常值清洗。
本发明中,箱型图理论的基本思想如图3所示,箱型图使用5个值描述数据的分布情况:下四分位Q1、上四分位数Q3、中位数M、最大值MAX、最小值MIN。其中,下四分位数Q1表示将数据从小到大排列后处在25%位置上的数;上四分位数Q3表示将数据从小到大排列后处在75%位置上的数。上四分位数和下四分位数之间的距离称为四分位距IQR,即IQR=Q3-Q1。最大值MAX和最小值MIN由Q1、Q3和IQR共同来确定,公式(1)如下:
MAX=Q3+k*IQR,MIN=Q1-k*IQR (1)
实施例四
在上述实施例的基础上,本实用新型一种优选实施例中,本发明的声光联合检测系统采集局部放电信号,在采集过程中,由于受故障设备本身和现场环境等影响,常常会存在噪声干扰,考虑到局部放电信号的非线性、非平稳性,以及算法的自适应性,采用上述经验模态分解法实现数据去噪,具体方法如下:
将原始信号分解为多个不同的中心频率的固有模态函数(IMF)分量,然后对每个分量进行阈值处理,剔除其中干扰成分比较大的分量,接着重构局部放电信号,得到去噪后的信号。
其中模态分解函数需要满足以下两个条件:
(1)每个固有模态函数极值点数量和过零点的数量相同,或者最多相差1;
(2)在任意时刻t,假设信号局部极小值确定的下包络线为fmin(t),局部极大值确定的上包络线为fmax(t),则fmin(t)与fmax(t)的均值为0。
其中条件(1)是要求信号的分布近似高斯分布;条件(2)则要求信号满足局部零均值,并用局部最小、最大值的包络作为近似,使得信号能够满足局部对称,避免了由于不对称导致的瞬时频率波动。假设输入局部放电信号时间序列x(t),其第i阶固有模态函数为ci(t),对应残差为ri(t),残差表示的是信号的平均趋势,则经验模态分解法的具体步骤如下:
(1)首先初始化,令i=1,r0(t)=x(t);
(2)得到第i个固有模态函数
①初始化:j=1,d0=ri-1(t);
②计算出dj-1(t)的全部局部极值点;
③使用三次样条插值法对dj-1(t)的极值点序列进行处理,得到序列dj-1(t)的上包络线fmax(t)、下包络线fmin(t);
④计算上、下包络线的均值mj-1(t)=[fmax(t)+fmin(t)]/2;
⑤提取得到细节dj(t)=dj-1(t)-mj-1(t);
⑥判断dj(t)是否满足上面提到的模态分解函数的两个条件,若满足,则
ci(t)=dj(t),否则令j=j+1,返回到步骤②中继续执行。
(3)计算残差ri(t)=ri-1(t)-ci(t);
(4)若ri(t)的极值点个数大于2个,则令i=i+1,返回步骤(2)继续执行,否则,结束分解。
通过步骤(1)-(4)就可以得到输入时间序列x(t)的全部固有模态函数ci(t),其中i=1,2,3...K,对于分解总阶数K的时间序列x(t),最终可分解表示为式(2),如下:
Figure GDA0003770021170000091
对于包含噪声的局部放电信号,不同固有模态分量(IMF)之间存在较大的差异,噪声主要集中在第一个模态分量,对公式2分解得到的模态分量利用硬阈值去噪方法实现白噪声抑制,然后将去噪后的模态分量进行重构即可得到去噪后的局部放电信号,其中去噪阈值λj的确定如公式3所示,σj表示第j个模态分量的标准差,公式(3)如下:
λj=3σj (3)
实施例五
在上述实施例的基础上,本实用新型一种优选实施例中,为了应对数据量纲不一的问题,提高模型的准确性和可靠性,需要对局部放电信号进行标准化处理。对于本发明中的局部放电信号,由于预先经过了基于箱型图统计的异常值处理,数据分布在一定范围内,因此数据标准化方式采用的是最大-最小值标准化,将局部放电信号的数据映射到[0,1]区间范围内,输入序列x1,x2,...,xn,其中该序列的最小值为xmin,最大值为xmax,标准化过程如公式(4)所示:
Figure GDA0003770021170000101
实施例六
在上述实施例的基础上,本实用新型一种优选实施例中,所述步骤5中紫外信号特征Fzy包括时域特征,所述超声信号特征Fcs包括时域、频域、小波分析、倒频域和自回归模型参数的特征。
对经过数据预处理的局部放点信号,为了挖掘反映不同故障发展阶段的故障状态信息,进一步进行多分析域特征提取。其中紫外信号提取的紫外信号特征Fzy主要是时域特征,具体包括脉冲个数、脉冲持续宽度、脉冲平均间隔等,超声信号提取了时域、频域、小波分析、倒频域和自回归模型参数等五个分析域的特征,记作超声信号特征Fcs,各个分析域的特征提取具体方法如下:
(1)时域特征
本发明从形状特征(峰峰值、短时平均幅度、方差、偏度、峰度)、能量特征(短时平均能量、均方根、幅值之和)、统计特征(脉冲个数、脉冲持续宽度、脉冲平均间隔)和一些其他特征(短时最大主冲击、短时过零率)对局部放电信号进行时域特征提取。本发明中局部放电信号的采样率为400kHz,以时间长度3s作为一个样本等长,从原始信号中提取样本序列,假设得到局部放电信号的样本序列为x1,x2,...,xn
①形状特征
峰峰值特征即信号最大值与最小值之差,记为Fpp,计算如公式(5)所示:
Fpp=max(xi)-min(xi) (5)
短时平均幅度特征记为Faa,其计算过程如式(6)所示:
Figure GDA0003770021170000111
方差特征可以描述信号幅值的波动,记为Fvar,计算如式(7)所示:
Figure GDA0003770021170000112
其中
Figure GDA0003770021170000113
表示信号幅值的均值。
偏度刻画信号形状相对于正态分布的偏移,记为Fsk,计算式如式(8)所示:
Figure GDA0003770021170000114
其中均值标准差
Figure GDA0003770021170000115
峰度刻画信号形状相对于正态分布的突起,记为Fku,计算过程如式(9)所示:
Figure GDA0003770021170000116
②能量特征
平均能量记为Fap,其计算公式如(10)所示:
Figure GDA0003770021170000117
均方根特征记为Frms,计算如式(11)所示:
Figure GDA0003770021170000118
幅值之和特征记为Fsa,计算过程如公式(12)所示:
Figure GDA0003770021170000119
③统计特征
基于本发明的声光联合检测系统,一次局部放电可能会捕捉到多个超声波信号或紫外脉冲信号,因此超声信号和紫外信号均可从统计角度进行特征提取,包括了脉冲个数、脉冲持续宽度以及脉冲平均间隔。
脉冲个数是指一次局部放电统计的脉冲信号个数,记为FpN,表示局部放电发生的频次。脉冲持续宽度是指一次局部放电捕获到的最后一个脉冲信号与第一个脉冲信号之间的间隔,记为FpW,其表示局放持续的时间。脉冲平均间隔是脉冲持续宽度与脉冲个数的比值,记为FpD,如式(13),表征局部放电信号的强度。
Figure GDA00037700211700001110
④短时最大主冲击
提取短时最大冲击强度特征来描述不同故障等级的冲击强度,具体如下:
假设局部放电短时信号xi的幅值区间范围是[L,H],L、H分别表示xi的最小幅值和最大幅值,即L=min(xi),H=max(xi)。先将其等长划分为10个连续子区间,其中任意一个子区间表示为fk(k=1,2…,10),如式(14)所示:
fk=[L+(k-1)*Δx,L+k*Δx](1≤k≤10) (14)
其中Δx=(H-L)/10,表示各个子区间的长度。
接着统计局部放电信号xi的幅值分布区间情况,计算得到各个子区间内的数量n,然后归一化处理,即用各子区间fk范围内的统计点数n除以样本总数据点数N,得到的频率值记为pk,即
Figure GDA0003770021170000121
这样十个子区间可以得到10个频率值,取这十个子区间幅值出现频率的最大值,即可得到短时最大冲击强度特征Fms,如式(16)所示:
Fms=max(pk) (16)
⑤短时过零率
短时过零率是计算每一帧信号内信号通过零值的次数,记为Fzcr,其反映了信号变化的快慢。计算公式如式(17)所示:
Figure GDA0003770021170000122
其中符号函数
Figure GDA0003770021170000123
窗函数
Figure GDA0003770021170000124
(2)频域特征
频域特征是对局部放电信号采用快速傅里叶变换(FFT)进行时域到频域的变换,进而提取频率谱、功率谱等特征。通过FFT可以直接获取频率谱信息,本发明提取了局部放电信号频率谱的峰值个数、频谱均值、频谱方差、频谱偏度、频谱峰度、第一谱峰幅值、第一谱峰中心频率、第二谱峰幅值、第二谱峰中心频率等信息。此外,对频率谱进行再变换后可以得到功率谱,其保留了频谱的幅值信息而舍弃了相位信息,表示的是信号能量在频域的分布情况,本发明从功率谱角度提取了局部放电信号的功率谱频带分布特征(均值、方差)、功率谱频带信息熵和功率谱幅度统计特征(均值、标准差、偏度、峰度)。
①频率谱特征
频率谱特征可以反映信号潜在的周期性。局部放电信号输入序列x(i),按照公式(18)对其做N点FFT变换得到频谱序列X(k),本发明中N取1024。
Figure GDA0003770021170000131
对于局部放电信号频谱分布X(k),其幅值最大的谱峰为第一谱峰,幅值第二大的谱峰为第二谱峰。若最大幅值为A1,峰值个数是幅值超过A1的50%谱峰个数。通过频谱分布,还可以得到谱峰幅值、中心频率以及均值、方差、偏度、峰度等信息,具体特征参量及其表示的意义如表1所示。
表1局部放电信号频率谱特征参量及意义
序列 特征参量 意义 符号表示
1 峰值个数 50%以上的谱峰个数 F<sub>fn</sub>
2 频谱信号均值 频域信号幅值的平均大小 F<sub>fμ</sub>
3 频谱信号方差 频域信号幅值的波动情况 F<sub>fv</sub>
4 频谱信号偏度 频域信号的偏移情况 F<sub>fsk</sub>
5 频谱信号峰度 频域信号的突起情况 F<sub>fku</sub>
6 第一谱峰幅值 频域信号谱峰的最大值 F<sub>fa1</sub>
7 第一谱峰中心频率 频域信号最大谱峰的频率 F<sub>ff1</sub>
8 第二谱峰幅值 频域信号谱峰的第二大值 F<sub>fa2</sub>
9 第二谱峰中心频率 频域信号第二大谱峰的频率 F<sub>ff2</sub>
②功率谱特征
功率谱即功率谱密度函数PSD,其表征了信号在各个频率的能量分布情况。根据维纳-辛钦定理,信号的功率谱密度等于该信号自相关函数的傅里叶变换。假设局部放电信号x(i)的自相关函数为Rx,功率谱密度为Pf,则计算公式分别如式(19)、(20)所示:
Figure GDA0003770021170000132
Figure GDA0003770021170000133
局放事件信号的频率主要分布在39kHz-41kHz频带范围内。为了突出事件信号在频率范围内的细节特征,对这两个频带进一步分段划分,再提取功率谱相关的局部特征,提取了功率谱频带分布特征(均值、方差)、功率谱频带信息熵和功率谱幅度统计特征(均值、标准差、偏度、峰度)。
a)功率谱频带分布
对于39kHz-41kHz频带,先选分段帧长100作为间隔,将频带区间分为连续的20个子频带,记为I(w1),I(w2),...,I(w20),再计算各个子频带内的功率值之和,得到第k个子频带功率谱的能量Ek,如公式(21)所示:
Figure GDA0003770021170000141
再计算所有子频带的归一化能量值均值和方差,如公式(22)、(23)所示,得到功率谱频带分布均值特征Fpeμ和方差特征Fpev
Figure GDA0003770021170000142
Figure GDA0003770021170000143
b)功率谱频带信息熵
从熵的角度提取功率谱频带的信息熵特征Fhp,计算公式如式(24)所示:
Figure GDA0003770021170000144
其中
Figure GDA0003770021170000145
表示第k个子频带能量在整个频带能量和的占比。
c)功率谱形状统计
局部放电信号还可以从描述功率幅值的形状变化情况出发,提取功率谱的形状统计特征,包括了均值、标准差、偏度和峰度。假设功率谱第i个频率分量fi的幅值为A(fi),总的频率点数为Np,记功率谱形状的均值特征为Fpaμ,标准差特征为Fpaσ,偏度特征为Fpask,峰度特征为Fpaku,计算公式分别如式(25)、(26)、(27)、(28)所示:
Figure GDA0003770021170000146
Figure GDA0003770021170000147
Figure GDA0003770021170000148
Figure GDA0003770021170000149
其中
Figure GDA00037700211700001410
表示所有频率分量的幅值和,也即功率和。
(3)小波分析特征
基于小波变换提取了局部放电信号的小波系数特征、小波包能量特征、小波包信息熵。
①小波系数特征
对局放序列f(t)作尺度为a、平移量为τ、小波基为ψ的连续小波变换,计算公式如式(29)所示:
Figure GDA0003770021170000151
再通过一组正交镜像低通滤波器h和高通滤波器g完成小波分解与重构的算法,正交小波分解和重构公式分别如式(30)和(31)所示:
Figure GDA0003770021170000152
Figure GDA0003770021170000153
其中j是小波分解层数,N是原始信号c0的信号长度,aj表示低频分量,称为近似系数,dj表示高频分量,称为细节系数。分解过程为:将第j-1层的近似系数aj-1,通过低通高通滤波器,然后两倍下采样,获得第j层的aj和dj
本发明将这些系数作为局部放电信号的特征参量,选用五层小波分解,可以得到10维的小波系数特征[a1,...,a5,d1,...,d5],即局部放电信号小波系数特征。
②小波包能量特征
小波包分解是在小波分解的基础上对高频部分进一步分解,可以得到更精细化的时频特征,本发明对原始局部放电信号进行了三层小波包分解。由帕塞瓦尔能量守恒定律,信号在时域的总能量等于该信号在频域的总能量,本发明对分解后的小波包系数,计算最后一层第k个小波包能量ek,见式(32)。
Figure GDA0003770021170000154
其中Ci,k(n)表示第i层第k个小波包分解系数值。由此得到8维特征参量[e0,e2,...,e7],即局部放电信号的小波包能量特征。
③小波包信息熵
为了表示不同故障状态下小波包能量谱信息的不确定性,从熵的角度计算局部放电信号的小波包信息熵特征Fpwpd,计算过程如式(33)所示。
Figure GDA0003770021170000155
(4)倒频域特征
本发明提取的局部放电信号倒频域特征主要是梅尔倒谱系数MFCC和线性预测倒谱系数LPC。
①梅尔倒谱系数特征
利用梅尔倒谱模型,对局部放电信号进行倒谱系数估计,第n阶梅尔倒谱系数计算过程如式(34)所示。
Figure GDA0003770021170000161
其中E(i)=log(Ef*Hn),Ef表示信号的能量谱,Hn为梅尔滤波器,得到的E(i)即表示对数能量谱。
取n=12,由此可得到12阶的梅尔倒谱系数[M1,M2,...,M12],即局部放电信号梅尔倒谱系数特征。
②线性预测倒谱系数
利用线性预测模型,对局部放电信号进行倒谱系数估计,如式(35)所示:
Figure GDA0003770021170000162
其中k为模型阶数,θi是第i个线性预测系数,y(n-i)表示已知的历史时刻的状态值,v(n)是激励序列,G为增益常量。
利用Levinson-Durbin算法来递归地计算线性预测方程的系数,由此可以得到一系列线性预测系数,即作为局部放电信号特征值。本发明中阶数k取12,因此可以得到一个12维特征向量[θ1,θ2,...,θ12],即局部放电信号线性预测倒谱系数特征。
(5)自回归模型参数特征
利用自回归模型,对局部放电信号进行参数估计,如式(36)所示:
Figure GDA0003770021170000163
其中k为自回归模型的阶数,ai是第i个自回归模型系数,y(n-i)表示已知的历史时刻的状态值,v(n)是模型的残差,通常为零均值的高斯白噪声序列。
阶数k的确定采用日本学者Akaike提出的AIC准则,并通过BRUG算法得到自回归模型系数ai,即局部放电信号的特征值。本发明中使用阶数值6,则以特征向量[a1,a2,a3,a4,a5,a6]作为局部放电信号的自回归模型参数特征。
基于以上五个分析域提取的局部放电信号特征构建特征向量,在本实施例中,基于超声信号提取的特征量构建的特征向量为78维;基于紫外信号提取的特征量构建的特征向量为3维;因此局部放电信号的特征向量为81维。
实施例七
在上述实施例的基础上,本实用新型一种优选实施例中,如图4所示,所述步骤6具体划分为Stacking第一阶段、Stacking第二阶段和Stacking输出,为集成学习的Stacking部分。
Stacking第一阶段是使用初级学习器,结合5折交叉验证的方式,具体地,将原始训练集分为5份,分别记作fold1~fold5。首先使用fold2~fold5的数据来训练初级学习器1,并对fold1进行预测,该预测值即作为初级学习器1对fold1生成的元特征Predict-1。接着,使用fold1、fold3~fold5的数据来训练初级学习器1,并对fold2进行预测,该预测值即作为初级学习器1对fold2生成的元特征Predict-2;以此类推,得到初级学习器1对整个原始训练集生成的元特征Predict-n。同样地,对其他基模型也采用相同的方法生成元特征。这样得到训练集和测试集的预测结果输入到Stacking第二阶段,其中,在每一个初级学习器内,训练集各折的预测结果采用按行堆叠合并的方式输入到Stacking第二阶段,测试集结果采用求平均的方式输入到Stacking第二阶段;
Stacking第二阶段是将Stacking第一阶段中多个初级学习器的训练集、测试集预测结果采取按列堆叠合并的方式,分别得到新训练集和新测试集,其中新训练集用于训练次级学习器(RF);
Stacking输出是将Stacking第二阶中的新测试集输入到次级学习器得到输出结果,即Stacking特征。
具体的,所述初级学习器采用4个,分别为支持向量机SVM、K最近邻KNN、随机森林RF和极端梯度提升树XGB,所述次级学习器采用随机森林RF。
如图5所示,集成学习模型Bagging部分分为Bagging训练阶段和Bagging集成阶段,Bagging训练阶段通过步骤7实现,Bagging集成阶段通过步骤8实现。
本发明中的局部放点信号的数据经过实施例三-实施例五的数据预处理,以及实施例六的多分析域特征提取,可以得到81维的特征向量,接下来需要完成模式识别与分类,即判断测集的局部放点信号数据样本属于哪一种故障状态,即正常放电、小故障放电或大故障放电。依据集成学习算法原理,同时结合本发明中声光联合检测系统采集到的局部放电信号的特点,设计一种两阶段的Stacking-Bagging集成学习模型,其中Stacking阶段通过组合精度较高、差异较大的分类器,包括4个初级学习器和1个次级学习器,挖掘局部放电信号更深层次的信息,主要提升模型整体准确性;Bagging阶段训练多个LGB分类器,主要提升模型整体泛化性能和稳定性。将测试的局部放电信号数据样本输入Stacking-Bagging集成学习模型即可得到故障状态的识别结果。
本发明结合实际现场应用测试本发明的集成学习模型,并与K最近邻KNN、支持向量机SVM、随机森林RF、极端梯度提升树XGB和轻量级梯度提升机LGB这五种传统模型的识别准确率和识别稳定性进行比较,分别对这六个模型进行性能评估,评估指标采用混淆矩阵及相关的查准率Precision、查全率Recall、综合指标F1-score等。
具体方法如下:
(1)基于实际现场环境构建数据库
利用局放声光联合检测系统,本发明在变压器场景下采集数据并构建数据库,其中正常放电状态记为标签0,小故障放电状态记为标签1,大故障放电状态记为标签2。得到变压器局放故障状态数据库,如表2所示。
表2变压器局放故障状态数据库
局部放电故障状态 样本数量 标签
正常放电 500 0
小故障放电 500 1
大故障放电 500 2
(2)确定模型评估指标
模型的好坏可以通过评价指标来衡量,在机器学习模型中,分类问题常用的评价指标是混淆矩阵,以二分类为例,混淆矩阵如表3所示。
表3二分类混淆矩阵
Figure GDA0003770021170000181
表中positive表示正类,negative表示负类。TP表示正类被正确识别为正类的样本个数,FP表示负类被错误识别为正类的样本个数,FN表示正类被错误识别为负类的样本个数,TN表示负类被正确识别为负类的样本个数。
基于混淆矩阵可计算查全率Precision、查准率Recall和综合评价指标F1-score等。其中,精确率也叫查准率,表示识别为正类的样本个数中,有多大比例是正确识别的,如式(37)所示:
Figure GDA0003770021170000182
召回率也叫查全率,表示的是在真正为正类的样本中,有多大比例被正确识别,如式(38)所示:
Figure GDA0003770021170000183
为了尽可能综合考虑查全率和查准率的值,还可使用评价指标F1-score,它实质表示的是查准率和查全率的加权调和平均,计算如公式(39):
Figure GDA0003770021170000191
为避免局部放电击穿导致电力设备停止工作,从而引发停电事故,本发明中局部放电故障状态识别需要较高的查全率。同时为提高巡检人员的检修效率,也需要保证较高的查准率。从经济损失角度上看,查全率的重要性相对查准率要高一些。若同时考虑查准率和查全率,还可以查看指标F1-score。
(3)模型识别准确性比较
评价模型性能的一个重要指标是准确性,表示对局放故障状态的识别准确效果。基于表2所示的变压器局放故障状态数据库,先经过实施例三-实施例五的数据预处理,再由实施例六,从五个分析域(时域、频域、小波分析、倒频域和自回归模型参数)提取超声信号78维特征,紫外信号3维特征。采用训练集:测试集=7:3的数据集划分方式,然后分别训练本发明设计的两阶段Stacking-Bagging集成学习模型与单模型(SVM、KNN、RF、XGB、LGB),再对测试集进行预测,得到六个模型的混淆矩阵分别如图6-11所示。为综合考虑识别效果,还计算了模型在各个故障状态下的平均指标,如图12所示。可以看出,集成方式模型(RF、XGB、LGB、Stacking-Bagging)整体识别效果优于传统的识别模型(KNN、SVM),并且本发明设计的两阶段Stacking-Bagging集成模型在识别查准率、查全率、F1-score三个指标上均达到了0.99以上,在六个模型中也是识别效果最优,说明了该模型的高准确性。对于需要重点识别出的大故障放电状态,Stacking-Bagging模型的查全率为100%,优于KNN模型的97.7%,SVM模型的81.6%,RF模型的92.3%,XGB模型的97.7%,LGB模型的98.9%。
(4)模型识别稳定性比较
评价模型性能的另一个重要指标是稳定性,表示同样大小的训练集,数据分布产生扰动变化时,导致模型识别性能的变化,其反映了模型的泛化性能。评估模型稳定性的最常用方法是交叉验证。为分析本发明所设计模型的稳定性,采用十折交叉验证的方式,也就是将原始数据集均分为10份,分别记为fold1,fold2,…,fold10。首先使用fold2-fold10的数据来训练模型,并对fold1进行预测。接着,同样地,使用fold1、fold3-fold10的数据来训练模型,并对fold2进行预测;以此类推,得到模型对整个原始数据集的预测结果。分析这10折预测准确性的波动情况,可以得到模型的稳定性能。本发明中评价指标采用的是同时考虑故障状态识别漏检和误检的平均F1-score,即每一个模型对三类故障状态的识别率F值均值。测试结果如图13所示。可以看出,集成方式模型(RF、XGB、LGB)的波动性相对传统模型(KNN、SVM)要小,说明了集成学习的稳定性优势。同时Stacking-Bagging模型预测结果波动最小,并且平均F1-score值可以达到0.99以上,说明了本发明的集成学习模型的高稳定性、高准确性。
以上所述,仅为本发明的优选实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的技术人员在本发明所揭露的技术范围内,可不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书所限定的保护范围为准。

Claims (7)

1.一种基于集成学习的局放故障状态识别方法,其特征在于,该方法具体包括以下步骤:
步骤1:利用局放声光联合检测系统采集实际应用现场的局部放电信号,包含超声信号和紫外信号,并构建信号数据库;
步骤2:采用基于统计的箱型图理论对局部放电信号的异常值进行检测并清洗;
步骤3:采用经验模态分解法减弱局部放电信号的噪声干扰;
步骤4:对去噪后的局部放电信号采用最大-最小值标准化进行数据标准化处理;
步骤5:对经过步骤4标准化处理后局部放电信号进行多分析域特征提取,分别得到超声信号特征Fcs与紫外信号特征Fzy
步骤6:对于超声信号特征Fcs利用Stacking算法进一步挖掘局部放电信息,超声信号特征Fcs通过使用初级学习器和次级学习器进行训练和测试,将输出结果作为Stacking特征,记作Fstacking;所述步骤6具体划分为Stacking第一阶段、Stacking第二阶段和Stacking输出,
Stacking第一阶段是使用初级学习器,结合5折交叉验证的方式,得到训练集和测试集的预测结果输入到Stacking第二阶段,其中,在每一个初级学习器内,训练集各折的预测结果采用按行堆叠合并的方式输入到Stacking第二阶段,测试集结果采用求平均的方式输入到Stacking第二阶段;
Stacking第二阶段是将Stacking第一阶段中多个初级学习器的训练集、测试集预测结果采取按列堆叠合并的方式,分别得到新训练集和新测试集,其中新训练集用于训练次级学习器(RF);
Stacking输出是将Stacking第二阶中的新测试集输入到次级学习器得到输出结果,即Stacking特征;
步骤7:将超声信号特征Fcs、紫外信号特征Fzy和步骤6得到的Stacking特征Fstacking进行融合得到融合特征Fmerge,融合特征Fmerge划分为训练集和测试集,融合特征Fmerge的训练集数据用于训练LGB分类器,每次随机抽取Fmerge的一部分特征,通过Bagging算法得到多个LGB分类器;
步骤8:融合特征Fmerge的测试集数据依次输入步骤7训练好的多个LGB分类器,每个LGB分类器对其输出一个预测结果,对多个LGB分类器的预测结果采用相对多数投票的方式,选择得票最多的故障状态作为预测输出,即可得到集成学习模型最终预测的局部放电故障状态。
2.根据权利要求1所述的一种基于集成学习的局放故障状态识别方法,其特征在于:所述步骤1中局放声光联合检测系统包括传感器模块、声光信号驱动模块、STM32主控模块和电源模块;所述传感器模块包括超声传感器和紫外传感器,用于搜集局部放电过程伴随的超声信号和紫外信号,超声信号和紫外信号通过声光信号驱动模块分别转换为电压信号和脉冲信号,电压信号经模数转换后通过SPI通信方式传输到STM32主控模块,脉冲信号由STM32主控模块通过脉冲捕获方式进行采集;STM32主控模块对超声信号和紫外信号进行融合处理得到局部放电信号,并完成实时数据存储、波形显示及预警提示。
3.根据权利要求1所述的一种基于集成学习的局放故障状态识别方法,其特征在于,所述步骤2对局部放电信号的异常值进行检测并清洗的具体步骤为:
步骤21:步骤1中信号数据库内根据超声信号和紫外信号的幅值等级进行分离;
步骤22:基于箱型图理论分别确定超声信号和紫外信号的经验系数值k;
步骤23:根据步骤22得到的经验值系数k,确定超声信号的箱型图最大值Bmax1和最小值Bmim1,以及紫外信号的箱型图最大值Bmax2和最小值Bmin2
步骤24:根据步骤23中超声信号的箱型图最大值Bmax1和最小值Bmin1,以及紫外信号的箱型图最大值Bmax2和最小值Bmin2的数值范围对步骤1中局部放电信号进行异常值剔除,则完成局部放电信号异常值清洗。
4.根据权利要求1所述的一种基于集成学习的局放故障状态识别方法,其特征在于:所述步骤3中对局部放电信号去噪方法具体为:将原始信号分解为多个不同的中心频率的固有模态函数(IMF)分量,然后对每个分量进行阈值处理,剔除其中干扰成分比较大的分量,接着重构局部放电信号,得到去噪后的信号。
5.根据权利要求1所述的一种基于集成学习的局放故障状态识别方法,其特征在于:所述步骤5中紫外信号特征Fzy包括时域特征,所述超声信号特征Fcs包括时域、频域、小波分析、倒频域和自回归模型参数的特征。
6.根据权利要求5所述的一种基于集成学习的局放故障状态识别方法,其特征在于:所述时域特征包括形状特征、能量特征、统计特征、短时最大主冲击和短时过零率;所述频域特征包括频率谱特征和功率谱特征,其中功率谱特征包括功率谱频带分布特征、功率谱频带信息熵和功率谱形状统计。
7.根据权利要求1所述的一种基于集成学习的局放故障状态识别方法,其特征在于:所述初级学习器采用4个,分别为支持向量机SVM、K最近邻KNN、随机森林RF和极端梯度提升树XGB,所述次级学习器采用随机森林RF。
CN202010404189.6A 2020-05-13 2020-05-13 一种基于集成学习的局放故障状态识别方法 Active CN111626153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010404189.6A CN111626153B (zh) 2020-05-13 2020-05-13 一种基于集成学习的局放故障状态识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010404189.6A CN111626153B (zh) 2020-05-13 2020-05-13 一种基于集成学习的局放故障状态识别方法

Publications (2)

Publication Number Publication Date
CN111626153A CN111626153A (zh) 2020-09-04
CN111626153B true CN111626153B (zh) 2022-10-18

Family

ID=72271859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010404189.6A Active CN111626153B (zh) 2020-05-13 2020-05-13 一种基于集成学习的局放故障状态识别方法

Country Status (1)

Country Link
CN (1) CN111626153B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112051493A (zh) * 2020-09-17 2020-12-08 海南电网有限责任公司琼海供电局 一种配电网设备的隐患类型识别方法及装置
CN112434558A (zh) * 2020-10-23 2021-03-02 北京航空航天大学 一种基于±xσ边界区间模型的自适应故障监测方法
CN112307990A (zh) * 2020-11-03 2021-02-02 中国兵器装备集团自动化研究所 基于ai技术分析振动信号监控机床加工中心健康状态方法
CN112364756B (zh) * 2020-11-09 2022-09-06 国网安徽省电力有限公司电力科学研究院 一种基于天牛须和随机森林的gis故障分类方法
CN112578794B (zh) * 2020-12-12 2023-09-01 云南昆船智能装备有限公司 基于机器学习的agv故障检测方法、存储介质及系统
US11493406B2 (en) * 2020-12-22 2022-11-08 Korea Manufacture Process Co., Ltd. Motor noise detecting device and detecting method using AE sensor
CN112749366B (zh) * 2020-12-22 2023-03-07 电子科技大学 一种基于相干噪声抑制的电机故障特征提取方法
CN112650200B (zh) * 2020-12-25 2022-08-30 中能融安(北京)科技有限公司 一种厂站设备故障的诊断方法及诊断装置
CN112904157A (zh) * 2021-01-19 2021-06-04 重庆邮电大学 一种基于集成机器学习的故障电弧检测方法
CN112985574B (zh) * 2021-02-26 2022-02-01 电子科技大学 基于模型融合的光纤分布式声波传感信号高精度分类识别方法
CN112748317B (zh) * 2021-03-23 2022-03-25 国网河南省电力公司电力科学研究院 基于多种监测数据的开关柜局部放电故障检测方法及系统
CN113378960A (zh) * 2021-06-25 2021-09-10 海南电网有限责任公司电力科学研究院 局部放电检测模型的训练方法、检测信息确定方法及装置
CN113702728A (zh) * 2021-07-12 2021-11-26 广东工业大学 一种基于组合采样和LightGBM的变压器故障诊断方法及系统
CN113917294B (zh) * 2021-09-25 2023-10-13 湖北创全电气有限公司 基于小波分解的智能自适应电弧检测方法及其应用装置
CN113837141B (zh) * 2021-10-12 2023-10-27 国网山东省电力公司电力科学研究院 一种抗驱鼠器干扰的信号提取方法及装置
CN114089050B (zh) * 2021-11-15 2022-09-09 清华大学 一种gis绝缘子表面电荷畸变电场在线测量方法及装置
CN114114383A (zh) * 2021-12-10 2022-03-01 北京大学深圳研究生院 一种基于多种特征的地震活动预测方法及系统
CN114004263B (zh) 2021-12-29 2022-05-03 四川大学 一种特征融合转换的大型设备工况诊断预测方法
CN114252749B (zh) * 2022-02-28 2022-06-17 国网湖北省电力有限公司检修公司 基于多传感器的变压器局部放电检测方法及装置
CN115512717A (zh) * 2022-11-21 2022-12-23 东北石油大学三亚海洋油气研究院 一种基于集成学习的二阶段单传感器管道泄漏定位方法
CN116616771B (zh) * 2023-05-23 2024-01-26 成都市第四人民医院 多通道简易精神状态检测方法、装置及系统
CN117031194B (zh) * 2023-07-27 2024-04-09 中电鼎润(广州)科技发展有限公司 用于配电网的超声波隐患检测方法及系统
CN117434407B (zh) * 2023-12-20 2024-02-20 南京中鑫智电科技有限公司 时频域特征融合的换流变阀侧套管绝缘分析方法及系统
CN117454121B (zh) * 2023-12-22 2024-04-05 华能济南黄台发电有限公司 一种基于电厂安全预警的数据分析处理方法及系统
CN117892067A (zh) * 2024-03-15 2024-04-16 国网上海市电力公司 一种低频电流局放监测抗干扰方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110338786A (zh) * 2019-06-28 2019-10-18 北京师范大学 一种癫痫样放电的识别与分类方法、系统、装置和介质
CN110927535A (zh) * 2019-11-12 2020-03-27 国网天津市电力公司电力科学研究院 基于极限学习机的电力设备局部放电严重程度评估方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102736000B (zh) * 2012-07-06 2014-10-08 桂林电子科技大学 电力电容器在线检测方法及装置
US20180310877A1 (en) * 2015-07-05 2018-11-01 Medasense Biometrics Ltd. Apparatus, system and method for pain monitoring
CN106597154B (zh) * 2016-12-08 2019-09-24 西安工程大学 基于dag-svm的变压器故障诊断提升方法
US20180232746A1 (en) * 2017-02-10 2018-08-16 Wal-Mart Stores, Inc. Static electricity sensing applications in retail environment
CN108896878B (zh) * 2018-05-10 2020-06-19 国家电网公司 一种基于超声波的局部放电检测方法
CN110175508B (zh) * 2019-04-09 2021-05-07 杭州电子科技大学 一种应用于超声波局放检测的特征值提取方法
CN110275094B (zh) * 2019-05-05 2021-06-08 电子科技大学 一种高压电缆局部放电声光联合检测方法及系统
CN110307983B (zh) * 2019-06-19 2021-01-26 电子科技大学 基于CNN-Bagging的无人机轴承故障诊断方法
CN110264462B (zh) * 2019-06-25 2022-06-28 电子科技大学 一种基于深度学习的乳腺超声肿瘤识别方法
CN110321847A (zh) * 2019-07-04 2019-10-11 电子科技大学 一种基于极端决策树的sar图像目标识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110338786A (zh) * 2019-06-28 2019-10-18 北京师范大学 一种癫痫样放电的识别与分类方法、系统、装置和介质
CN110927535A (zh) * 2019-11-12 2020-03-27 国网天津市电力公司电力科学研究院 基于极限学习机的电力设备局部放电严重程度评估方法

Also Published As

Publication number Publication date
CN111626153A (zh) 2020-09-04

Similar Documents

Publication Publication Date Title
CN111626153B (zh) 一种基于集成学习的局放故障状态识别方法
CN112201260B (zh) 一种基于声纹识别的变压器运行状态在线检测方法
US20230316051A1 (en) Pre-alarming method for rotary stall of compressors based on temporal dilated convolutional neural network
You et al. Novel feature extraction method for cough detection using NMF
Majidnezhad et al. An ANN-based method for detecting vocal fold pathology
CN111504635A (zh) 基于差分进化概率神经网络的行星齿轮故障诊断方法
US20190000336A1 (en) Detecting and predicting an epileptic seizure
CN112599134A (zh) 一种基于声纹识别的变压器声音事件检测方法
CN115457966B (zh) 基于改进ds证据理论多分类器融合的猪咳嗽声识别方法
CN114325256A (zh) 一种电力设备局部放电识别方法、系统、设备及存储介质
CN106250904A (zh) 基于改进s变换的电能扰动分析仪及分类方法
CN115758200A (zh) 一种基于相似度度量的振动信号故障识别方法及系统
Wiśniewski et al. Automatic detection of disorders in a continuous speech with the hidden Markov models approach
CN110458071A (zh) 一种基于dwt-dfpa-gbdt的光纤振动信号特征提取与分类方法
CN109840386B (zh) 基于因子分析的损伤识别方法
CN116524273A (zh) 一种发电站尾水管检测方法、装置、设备及存储介质
CN115410599A (zh) 一种基于声纹感知的变压器运行状态识别的方法及系统
Jamaludin et al. An improved time domain pitch detection algorithm for pathological voice
Yang et al. Transient fault diagnosis of track circuit based on MFCC-DTW
CN115577249A (zh) 多视角特征融合的变压器声信号识别方法、系统及介质
CN104102834A (zh) 录音地点的识别方法
CN114609483A (zh) 一种基于Hilbert变换的GIS局部放电信号特征提取方法
CN114492543A (zh) 一种基于时频域特征的局部放电分类识别方法
Majidnezhad et al. A novel method for feature extraction in vocal fold pathology diagnosis
Alsumaidaee et al. Fault Detection for Medium Voltage Switchgear using a Deep Learning Hybrid 1D-CNN-LSTM Model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant