发明内容
本发明提供了一种电抗器铁心松动故障诊断方法、装置和设备,解决高压并联电抗器在长期运行期间不可避免地产生紧固结构松动后,不易检测出异常技术问题。
为达到上述目的,本发明所述一种基于梯度提升决策树算法的电抗器铁心松动故障诊断方法,,包括以下步骤:
S1、采集高压并联电抗器工作状态下的振动源信号,提取振动源信号中关键的数据特征;用GBDT算法构建的初始预测模型;
S2、将提取的数据特征设置分类标签,作为训练集,对初始预测模型进行训练;在训练过程中,使预测模型不停地学习数据包含的特征,每次迭代在上一轮训练模型的残差值基础上训练,经过多次迭代进行的残差计算和权值加权后,使得强学习器学习到不同状态下电抗器振动信号所包含的特征,得到目标预测模型;
S3、采集待诊断的电抗器的振动信号,将采集到的振动信号输入目标预测模型,判断当前电抗器是否处于螺母松动故障下,并预测电抗器处于何种松动程度下。
进一步的,S1中,用GBDT算法构建的初始预测模型包括以下步骤:
S A1、初始化第一个弱学习器的阈值与权值;
S A2、建立M棵分类回归树;
SA3、计算回归树对应损失函数的负梯度,并将回归树按照负梯度从大到小的顺序排序,得到一个强学习器。
进一步的,SA2中,利用CART回归树进行数据拟合,对损失函数的负梯度rm,i拟合一棵回归树,得到其对应的叶子节点区域Rm,j,j=1,2,...,J,J为回归树的叶子节点的个数;再计算生成的决策树中各个叶子节点的叶子区域j,计算出最佳残差拟合值cm,j,用最佳残差拟合值cm,j得到强学习器;
其中,fm-1(xi)为第m-1次计算得到的模型。
进一步的,S1中,采用压电式加速振动传感器采集电抗器的振动源信号。
进一步的,S1中,将采集到的振动源信号进行快速傅里叶变换与小波去噪后再提取关键的数据特征。
进一步的,S1中,关键的数据特征为振动信号的基频。
进一步的,S2中,所以提取的数据特征采用交叉验证的方法按照1:4的比值分为测试集与训练集。
进一步的,S2中,标签包括正常状态、11N.m、7N.m和3N.m。
一种电抗器铁心松动故障诊断装置,包括依次连接的振动传感器、采集卡和终端,所述振动传感器用于测量电抗器的振动源信号,所述采集卡,采集卡用于采集振动源信号并传递至终端,所述终端用于根据振动源信号判断电抗器是否处于螺母松动故障下,并预测电抗器处于何种松动程度下。
一种计算机设备,包括电连接的存储器和处理器,所述存储器上存储有可在处理器上运行的计算程序,所述处理器执行所述计算程序时,实现上述的电抗器铁心松动故障诊断方法的步骤。
与现有技术相比,本发明至少具有以下有益的技术效果:
采用振动检测装置对高压并联电抗器进行振动信号采集,来判断当前电抗器处于何种工况下。预测模型的训练选用了梯度提升决策树(Gradient Boosting DecisionTree,GBDT),采用加法模型与前向分步算法实现学习的优化,使用多个弱分类器串行叠加,层层增加权重,并计算当前模型下的残差,GBDT每轮的训练是在上一轮训练模型的负梯度值基础之上训练的,最终各个分类器给过相加权给出预测值,达到分类的效果。多个弱学习器构成一个强学习器,通过分析分类结果来判断电抗器处于何种故障状态下,这对于高压并联电抗器故障诊断中具有重要意义。
采用GBDT算法将多个决策树作为弱学习器进行特征训练,得到的强学习器有效的将采集到的振动信号分类到适当的标签下,由于树与树之间可以并行化计算,并且具有较好的泛化能力与表达能力,所以进行分类的速度快、精度高;在进行信号采集时,对振动位置和负载大小的要求不高,使得具有初步判断对高压并联电抗器螺母松动故障发生,并预测松动程度成为可能。
进一步的,S2中,提取的数据特征采用交叉验证的方法按照1:4的比值分为测试集与训练集,在采集的数据量不太充足的情况下,保证训练的模型具有良好的准确率。
具体实施方式
为了使本发明的目的和技术方案更加清晰和便于理解。以下结合附图和实施例,对本发明进行进一步的详细说明,此处所描述的具体实施例仅用于解释本发明,并非用于限定本发明。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在实际应用中,由于振动造成的松动并不易检测,长时间松动状态下的运行可能造成更严重的故障。所以采用振动检测装置对高压并联电抗器进行振动信号采集,来判断当前电抗器处于何种工况下。GBDT是Boosting学习的一种方法,采用加法模型与前向分步算法实现学习的优化,基本分类思路是使用多个弱分类器串行叠加,层层增加权重,并计算当前模型下的残差(预测值与实际值之间的误差值),GBDT每轮的训练是在上一轮训练模型的负梯度值基础之上训练的,最终各个分类器给过相加权给出预测值,达到分类的效果。多个弱学习器构成一个强学习器,搭建一个软、硬件结合的在线检测装置对振动信号进行分类,通过分析分类结果来判断电抗器处于何种故障状态下,这
本发明利用振动测量装置对高压并联电抗器进行振动信号的采集,选取电抗器油箱表面作为测量位置,对采集到的信号进行预处理,将预处理后的振动信号进行分析,从而检测电抗器铁心是否发生松动故障。
实施例1
参照图1,一种基于梯度提升决策树算法的电抗器铁心松动故障诊断方法,包括以下步骤:
1、使用振动传感器对高压并联电抗器工作状态下进行源信号采集,将采集到的信号传输到终端后进行快速傅里叶变换(Fast Fourier Transform,FFT)与小波去噪,使振动信号达到平滑滤波与去噪的预处理,其主要是对不需要的成分进行抑制,根据频谱分析提取其中关键的数据特征,选出区别明显的特征进行分析。
2、将处理后的数据作为训练集对GBDT算法构建的预测模型进行训练,GBDT算法构建的模型是由多个弱学习器串行叠加与权重累加构成一个强学习器,步骤如下:
(a)初始化一个弱学习器的阈值与权值;
(b)建立M棵分类回归树m=1,2,...,M,M与迭代次数相关,而M也决定强学习的精度;
(c)计算每一棵分类回归树对应损失函数的负梯度(即残差),并找到合适的节点用于对采集的振动信号进行分类,遍历回归树上的特征的每个可取值,按照残差值由大到小的顺序排序,以更新强学习器;
即进行串行叠加,直到得到精度最高的强学习器fM(x),
其中,m>5。
构建的强学习器具有运算速率快、精度高与鲁棒性好的特点,以便于对数据快速分类。
3、将处理后电抗器的振动信号输入模型进行训练,设置分类的标签,经研究发现紧固件松动状态分为11N.m、7N.m和3N.m三种情况,所以标签设为正常状态、11N.m、7N.m和3N.m四种标签。在训练过程中,设置合适的迭代次数与学习率,使得模型不停地学习数据包含的特征,每次迭代是在上一轮训练模型的残差值基础之上训练,经过多次迭代进行的残差计算和权值加权后,使得强学习器学习到了不同状态下电抗器振动信号所包含的特征,模型达到合适的误差值,预测模型训练完成。
4、将软、硬件两部分结合构成完整的振动检测装置,设置振动传感器在电抗器表面,通过信号传输线连接终端设备,终端设备包含处理程序和训练完成的预测模型,对采集到的振动信号进行分类,判断当前高压并联电抗器是否处于螺母松动故障下,并可预测电抗器处于何种松动程度下,及时排查并处理以防日后造成更加严重的故障和经济损失。
实施例2
参照图4,一种电抗器铁心松动故障诊断装置,包括依次连接的振动传感器、采集卡和终端,所述振动传感器用于测量电抗器的振动源信号,所述采集卡,采集卡用于采集振动源信号并传递至终端,所述终端用于根据振动源信号判断电抗器是否处于螺母松动故障下,并预测电抗器处于何种松动程度下。
实施例3
本发明提供的一种计算机设备,如图5所示,包括电连接的存储器和处理器,其中,存储器上存储有可在处理器上运行的计算程序,所述处理器执行所述计算程序时,实现上述的故障诊断方法的步骤。
所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。
所述处理器可以是中央处理单元(CentralProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述终端设备的各种功能。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
具体实例
采用测振装置对一台BKS-76/10型号的三相油浸式并联电抗器进行源信号的采集,采集时主要采集的是正常情况下、11N.m、7N.m和3N.m螺母松动情况下的振动信号,并对采集到的源信号进行处理,最终进行故障分析与预测,具体实施例步骤如下:
S1:首先放置压电式加速振动传感器在三相油浸式并联电抗器油箱表面,然后通过信号传输线来传输采集到的振动信号,使用采集卡进行信号采集,最终传输到终端系统中。本次实验采用压电式加速振动传感器具有较合适的量程与灵敏度,并且重量较轻,可以减少误差带来的影响,对整个振动系统无附加影响。
测量位置选择了振动信号电抗器表面上9行8列的72个测点。每一个测点按照i行和j列记为wij。选择测点完成后,开始进行源信号的采集工作,采集到了正常情况下、11N.m、7N.m和3N.m螺母松动情况下具有时间序列的连续振动信号,采集到的源信号为S(k),
S(k)=f(k)+ε*e(k)k=0,1,...,n-1
其中,f(k)为振动信号,S(k)为含噪声信号,e(k)为噪声,ε为噪声系数的标准偏差。
对源信号S(k)使用FFT变换与小波包处理,滤出噪声信号,得到振动信号f(k),达到小波降噪与平滑滤波的目的,最后进行频谱分析,得到信号的多种特征。
在不同状态下,对比后可知同一测点测得的振动信号的基频比重出现了差别,如图2a至图2d所示,而且在相同状态下,不同测点测得的振动信号的基频比重也具有差别,如图3所示,所以选择选用基频比重这一特征对处理完成的数据进行分类与预测。
S2:由于采集的数据量不太充足,但为保证训练的模型具有良好的准确率,所以将处理完成的数据采用交叉验证的方法按照1:4的比值分为测试集与训练集。将训练集T输入GBDT算法构成的分类模型中进行训练,其中
T={(x1,y1),(x2,y2),...(xi,yi),...,(xN,yN)}
损失函数:
L(y,f(x))=ylog(1+exp(-f(x)))+(1-y)[f(x)+log(1+exp(-f(x)))]
其中,χ、y为训练样本,(xi,yi)为逻辑回归单个样本,R为实数集合,Rn为实数集合R的n次笛卡尔集合。
S3:模型主要构建步骤为:
(a)初始化第一个弱学习器,得到初始学习器:
注:估计使损失函数极小化的常数值,初始学习器f0(x)是只有一个根结点的分类回归树树。
其中,f0(x)为初始学习器,L(yi,c)为损失函数,c为使得损失函数最小的常数值;
(b)建立M棵分类回归树m=1,2,...,M:对于i=1,2,...,N,计算第m棵对应损失函数的负梯度r
m,i,即伪残差
注:伪残差是计算损失函数在当前模型下的值,用以估计残差。
其中,f(x)为当前学习器,L(yi,f(xi))为当前模型下的损失函数,fm-1(x)为第m-1个学习器;
为防止过拟合与欠拟合的发生,利用CART回归树进行数据的拟合,对rm,i拟合一棵回归树,得到其对应的叶子节点区域Rm,j,j=1,2,...,J,J为回归树的叶子节点的个数;再对生成的决策树,计算各个叶子节点的叶子区域j,计算出最佳残差拟合值cm,j:
注:最佳残差拟合值cm,j用于在损失函数极小化的条件下,估计出相应叶结点区域的值。
其中,fm-1(xi)为第m-1个学习器,C为每个叶子结点的参数即标签值的均值。
(c)最终更新得到一个强学习器:
其中,I(x∈Rm,j)为基函数集;
S4:使用预测模型中构建的强学习器进行数据特征的学习,并设置正常情况、11N.m、7N.m和3N.m螺母松动情况这四种标签,先输入训练集对预测模型进行训练,学习器学习数据包含的基频比重这一特征,再计算残差,将残差作为样本的标签来训练弱学习器f0(x),寻找回归树的最佳划分节点,遍历每个特征的每个可能的可取值。参数设置需要设置合适的学习率(learning_rate)、迭代次数(n_trees)、树的深度(max_depth),并设置合适的阈值和权值,使模型不停迭代,生成足够的树,以让强学习器具有更高的精度,而且每次迭代是在上一轮训练模型的负梯度值基础之上训练的,在一次次进行残差计算和权值加权后达到合适的误差值,以便提取不同标签中具有的特征。
S7:对训练完成的模型输入测试集进行测试,将测试集的数据分类到合适的特征标签下,目的是测试预测模型精度,最后进行误差分析,使学习器的预测精度达到了理想值,表明模型训练效果达到要求。
S8:使用GBDT算法构建的预测模型对比不同状态与不同测点的基频比重,将训练好的模型直接投入使用,未来可以对随时采集到的72个测点的振动信号进行标签分类,达到预测的效果。这对于油浸式高压并联电抗器而言,如果能及时发现当前电抗器处于正常工作状态下还是不同螺母松动程度的故障状态下,可及时引起运维人员的重视。
以上内容仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明权利要求书的保护范围之内。