CN116307014A

CN116307014A - 故障预测模型训练方法和装置、故障预测方法

Info

Publication number: CN116307014A
Application number: CN202211089053.6A
Authority: CN
Inventors: 蒋文辉; 梁博; 程凌森; 赵亮; 陈波; 周波; 蒋愈勇; 张家兴; 李凡; 陈煜敏; 陈光侵; 王玉龙
Original assignee: Southern Power Grid Digital Grid Research Institute Co Ltd
Current assignee: Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date: 2022-09-07
Filing date: 2022-09-07
Publication date: 2023-06-23

Abstract

本申请涉及一种故障预测模型训练方法和装置、故障预测方法。故障预测模型训练方法包括：获取变压器的运行特征数据；对运行特征数据进行特征选择处理，得到样本数据；对样本数据进行特征提取处理，得到特征数据；将特征数据输入待训练预测模型中，计算得到输出误差；若输出误差大于等于预设误差，则计算雅可比矩阵以得到权值调整数据，并根据权值调整数据更新待训练预测模型；若输出误差小于预设误差，则将当前的待训练预测模型作为故障预测模型。使用雅可比矩阵计算得到的权值调整数据在更新训练待训练预测模型时，不容易陷入局部最优解，且模型的收敛速度较快。

Description

故障预测模型训练方法和装置、故障预测方法

技术领域

本申请涉及变压器故障预测技术领域，特别是涉及一种故障预测模型训练方法和装置、故障预测方法、计算机设备和存储介质。

背景技术

电力设备作为能源从生产、输送到使用的承担者，一旦出现故障，将会严重影响人民群众的日常生活和社会经济生产。变压器作为重要的电力设备，其安全可靠的运行尤为重要。目前，出现了很多训练神经网络预测模型来对变压器的故障进行预测的方法。

在实现过程中，发明人发现传统技术中至少存在如下问题：传统技术在训练变压器故障预测模型时，容易陷入局部最优且收敛速度较慢。

发明内容

基于此，有必要针对上述技术问题，提供一种不易陷入局部最优解且收敛速度较快的故障预测模型训练方法和装置、故障预测方法、计算机设备和存储介质。

第一方面，本申请提供了一种故障预测模型训练方法。所述方法包括：

获取变压器的运行特征数据；其中，所述运行特征数据包括：溶解气体数据、局部放电数据、绕组变形数据、绕组热点温度数据以及绝缘水分数据中的至少一种；

对所述运行特征数据进行特征选择处理，得到样本数据；

对所述样本数据进行特征提取处理，得到特征数据；

将所述特征数据输入待训练预测模型中，计算得到输出误差；

若所述输出误差大于等于预设误差，则计算雅可比矩阵以得到权值调整数据，并根据所述权值调整数据更新所述待训练预测模型；

若所述输出误差小于所述预设误差，则将当前的所述待训练预测模型作为故障预测模型。

在其中一个实施例中，所述对所述运行特征数据进行特征选择处理，得到样本数据的步骤，包括：

对所述运行特征数据进行归一化处理，得到修正数据；其中，所述修正数据包括多个随机变量；

运用互信息算法对所述修正数据进行筛选处理，得到所述样本数据。

在其中一个实施例中，所述运用互信息算法对所述修正数据进行筛选处理，得到所述样本数据的步骤，包括：

计算任意两个所述随机变量之间的互信息值；

若所述互信息值大于预设阈值，则将对应的两个所述随机变量作为保留数据；

将全部所述保留数据作为所述样本数据。

在其中一个实施例中，所述对所述样本数据进行特征提取处理，得到特征数据的步骤，包括：

基于所述样本数据训练深度置信网络，得到训练好的特征提取模型；

将所述样本数据输入所述特征提取模型中，得到所述特征数据。

在其中一个实施例中，所述基于所述样本数据训练深度置信网络，得到训练好的特征提取模型的步骤，包括：

初始化所述深度置信网络；其中，所述深度置信网络包括多个受限玻尔兹曼机；

基于所述样本数据并采用对比散度算法训练每一所述受限玻尔兹曼机，直至全部受限玻尔兹曼机训练完成；

将全部训练好的受限玻尔兹曼机作为所述特征提取模型。

在其中一个实施例中，所述将所述特征数据输入待训练预测模型中，计算得到输出误差的步骤，包括：

将所述特征数据输入反向传播神经网络中，得到预测向量；

通过最小二乘法计算所述预测向量和真实向量之间的误差值，得到所述输出误差。

第二方面，本申请还提供了一种故障预测方法。所述方法包括：获取变压器的在线监测数据；

对所述在线监测数据进行特征选择处理，得到样本数据；

对所述样本数据进行特征提取处理，得到特征数据；

将所述特征数据输入训练好的故障预测模型中，得到当前故障状态；其中，所述故障预测模型由第一方面所述的故障预测模型训练方法训练得到。

第三方面，本申请还提供了一种故障预测模型训练装置。所述装置包括：

数据获取模块，用于获取变压器的运行特征数据；

特征选择模块，用于对所述运行特征数据进行特征选择处理，得到样本数据；

特征提取模块，用于对所述样本数据进行特征提取处理，得到特征数据；

训练模块，用于将所述特征数据输入待训练预测模型中，计算得到输出误差；若所述输出误差大于等于预设误差，则计算雅可比矩阵以得到权值调整数据，并根据所述权值调整数据更新所述待训练预测模型；若所述输出误差小于所述预设误差，则将当前的所述待训练预测模型作为故障预测模型。

第四方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述方法的步骤。

第五方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

上述故障预测模型训练方法和装置、故障预测方法、计算机设备和存储介质，在对待训练预测模型进行训练时，通过判断输出误差与预设误差的大小，并通过计算雅可比矩阵来得到权值调整数据，以对待训练预测模型进行更新。使用雅可比矩阵计算得到的权值调整数据在更新训练待训练预测模型时，不容易陷入局部最优解，且模型的收敛速度较快。

附图说明

图1为一个实施例中故障预测模型训练方法的流程示意图；

图2为一个实施例中步骤S200的流程示意图；

图3为一个实施例中步骤S220的流程示意图；

图4为一个实施例中步骤S300的流程示意图；

图5为一个实施例中步骤S310的流程示意图；

图6为一个实施例中步骤S400的流程示意图；

图7为一个实施例中故障预测方法的流程示意图；

图8为一个实施例中故障预测模型训练装置的结构框图；

图9为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

在影响较大的电网事故中，由变电设备发生故障所造成的事故占到事故总数的接近一半，因此变压器安全可靠的运行显得尤为重要。其中，变压器故障影响因素主要包括以下三个部分：

(1)自身影响：变压器由于制造质量、安装工艺等原因，螺栓连接部位、油箱本体焊缝、法兰连接处松动，变压器出现油迹浸渗现象，严重时汇聚成油珠下滴形成漏油，导致变压器运行异常；变压器引线包括套管内外端接头、绕组接头、分接开关接头等，由于接头连接螺栓紧固压力不足、接触面较小、接触面氧化等原因，导致出现接头发热变色、表面镀层破坏、烧毁损坏等现象。

(2)环境影响：环境影响主要是天气的影响。设备容易受到温度、风、降水等多种因素的影响。如设备周围环境温度偏高，使变压器温升超过允许程度，将导致耐压水平、绝缘特性下降，进而导致变压器故障概率增高；降水量较大直接导致了湿度大，湿度太大容易降低设备的绝缘性能，导致泄漏电流、污闪等情况发生，使得变压器故障概率增高；大风天气可能直接影响设备的机械强度，例如使变压器的某些零部件松动，从而引起振动、噪声，增大变压器故障概率。

(3)运行影响：变压器主要是通过变电站接入的负荷来决定变电站的输出能量。设备经受着电压、电流和负荷的作用，将影响设备的性能。在过负荷的情况下，将导致设备温度升高，其内部线圈的温度超过了线圈绝缘物的耐热强度，会使线圈绝缘物老化过快，从而使绝缘能力降低，导致变压器故障。

变压器故障预测承担着发现变压器故障的重任，是保证变电站正常运行的重要手段。随着变电站的不断建设和发展，大量的电力设备与传感器投入使用，导致了电力数据的激增。这些电力数据不仅体量异常巨大，而且种类繁多、结构复杂。如何有效处理这些庞大的电力数据是电力设备故障预测研究的重点与难点。针对变压器故障预测问题，相关技术中通过数据融合技术，利用误差平方最小方法计算BP(Back Propagation)神经网络、多变量灰色模型、多核支持向量回归机三种算法的最优组合权值，但是该算法计算量大，而且BP网络容易陷入局部最优。

基于此，本申请第一方面，提供了一种故障预测模型训练方法。在一个实施例中，参照图1所示，故障预测模型训练方法包括但不限于包括步骤S100至步骤S600。

步骤S100，获取变压器的运行特征数据。其中，运行特征数据包括：溶解气体数据、局部放电数据、绕组变形数据、绕组热点温度数据以及绝缘水分数据中的至少一种。

其中，运行特征数据为变压器在运行过程中，通过传感器对变压器的运行状态进行采样后并对采样结果进行标注后形成的数据。例如，可以为溶解气体、局部放电、绕组变形、绕组热点温度、绝缘水分等的监测数据。可以理解的是，在对得到的监测数据进行标注时，可以标注在当前状态下变压器是否故障，或者根据变压器不同的故障类型对监测数据进行标注，从而使训练好的故障预测模型可以通过预测得到不同的结果。

步骤S200，对运行特征数据进行特征选择处理，得到样本数据。

其中，运行特征数据中包含多种变压器的运行状态数据和对应的标签数据，数据量较大，因此需要对运行特征数据进行特征选择处理，从所有特征数据中选出相关特征，或在不引起重要信息丢失的前提下去除无关特征和冗余特征，从而降低在后续的模型训练过程中出现过拟合的风险，并且可以提高模型的训练速度，降低运算开销。例如，可以按照变压器的各种运行参数对变压器运行状态的影响程度来进行筛选，选出影响程度较高的数据作为样本数据；还可以采用如卡方检验、F检验和互信息等过滤式的算法，对运行特征数据进行筛选，得到样本数据。

步骤S300，对样本数据进行特征提取处理，得到特征数据。通过筛选得到的样本数据为高维数据，通过特征提取处理后，使得高维数据降维，得到低维的特征数据，便于后续的模型训练。特征提取可以采用卷积神经网络、深度置信网络等方式。

步骤S400，将特征数据输入待训练预测模型中，计算得到输出误差。具体的，将特征数据输入到待训练预测模型后，经过模型的参数运算，会输出一个预测值，通过与标注的真实值进行比较计算，即可得到输出误差，也即预测模型的训练误差。输出误差用于表征预测值与真实值之间的误差大小，用于评价模型泛化能力的强弱，模型的训练或优化即使用最小化输出误差的方式来完成。

步骤S500，若输出误差大于等于预设误差，则计算雅可比矩阵以得到权值调整数据，并根据权值调整数据更新待训练预测模型。其中，预设误差为人为设置的训练误差允许值，当输出误差大于等于预设误差时，说明模型输出的预测值与真实值差距过大，因此需要对模型继续进行训练，提高模型的泛化能力。本申请实施例中，通过计算雅可比矩阵的方式，来计算权值调整数据，并通过权值调整数据对待训练预测模型的模型权值进行调整更新。可以理解的是，经过更新后的待训练预测模型会继续根据特征数据进行模型训练，直至输出误差小于预设阈值。

步骤S600，若输出误差小于预设误差，则将当前的待训练预测模型作为故障预测模型。在训练过程中，当检测到输出误差小于预设误差后，即可停止模型训练，并将当前状态的待训练预测模型作为故障预测模型，此时的故障预测模型具有较好的泛化能力，可以根据输入数据对变压器的故障进行较为准确的预测。

上述故障预测模型训练方法中，通过判断输出误差与预设误差的大小，并通过计算雅可比矩阵来得到权值调整数据，以对待训练预测模型进行更新。使用雅可比矩阵计算得到的权值调整数据在更新训练待训练预测模型时，不容易陷入局部最优解，且模型的收敛速度较快。

在一个实施例中，如图2所示，步骤S200中，对运行特征数据进行特征选择处理，得到样本数据的步骤，包括：

步骤S210，对运行特征数据进行归一化处理，得到修正数据。其中，修正数据包括多个随机变量。具体的，将获取的变压器的运行特征数据进行归一化处理，使得全部随机变量都落在[0，1]的范围内。归一化公式如式(1)所示：

式(1)中，R^*为归一化处理后的随机变量，R为归一化处理前的运行特征数据，R_min为运行特征数据中的最小值，R_max为运行特征数据中的最大值。

步骤S220，运用互信息算法对修正数据进行筛选处理，得到样本数据。互信息通常用于度量两个随机变量的关联程度，不同于相关系数仅能对两个随机变量的线性相关性进行捕捉，互信息可以捕捉两个变量之间的任何统计依赖性，互信息值越大，则两者共享的信息就越多，关联程度就越高。

在一个实施例中，如图3所示，步骤S220中，运用互信息算法对修正数据进行筛选处理，得到样本数据的步骤，包括：

步骤S221，计算任意两个随机变量之间的互信息值。

具体的，当两个随机变量U、V为离散型随机变量时，通过式(2)计算互信息值：

式(2)中，互信息值I(U,V)的大小范围为[0，1]，p(u,v)为U、V的联合概率分布，p(u)和p(v)为U、V的边缘概率分布。

当两个随机变量U、V为连续性随机变量时，通过式(3)计算互信息值：

式(3)中，互信息值I(U,V)的大小范围为[0，1]，p(u,v)为U、V的联合概率分布，p(u)和p(v)为U、V的边缘概率分布。基于式(2)和式(3)，可以计算出两个随机变量之间的互信息值。

步骤S222，若互信息值大于预设阈值，则将对应的两个随机变量作为保留数据。

其中，预设阈值为根据变压器的数据特点以及故障特征设置的，以此选择需要保留的随机变量数据。例如，预设阈值设置为

当两个随机变量计算得到的互信息值大于/>

时，则说明此两个随机变量之间的关联程度较高，因此需要保留对应的两个随机变量。当两个随机变量计算得到的互信息值小于等于/>

时，则说明此两个随机变量之间的关联程度较低，因此需要去除对应的两个随机变量。在一些其他实施例中，也可以设置多个阈值进行关联程度的层次划分。例如，/>

时，为弱相关；/>

时，为中等相关；

时，为强相关。用户可以根据训练模型的需求，选择需要保留的随机变量。

步骤S223，将全部保留数据作为样本数据。通过上述步骤的筛选后，即可得到包括多个随机变量的保留数据，将保留数据作为筛选后的样本数据时，样本数据中随机变量关联程度较高，在进行模型训练时可以提高待训练预测模型的收敛速度。

在一个实施例中，如图4所示，步骤S300，对样本数据进行特征提取处理，得到特征数据的步骤，包括：

步骤S310，基于样本数据训练深度置信网络，得到训练好的特征提取模型。

步骤S320，将样本数据输入特征提取模型中，得到特征数据。

具体的，本申请实施例中的深度置信网络(Deep Belief Network，DBN)仅用于对样本数据中的高维数据进行特征提取，是一种无监督学习网络。首先通过样本数据来对深度置信网络进行训练，从而得到特征提取模型。在使用时，将样本数据输入特征提取模型中，即可得到经过特征提取后的特征数据。本申请实施例使用深度置信网络来进行特征提取，既可以满足对高维数据的降维，同时也保证了提取出来的特征数据在最大程度上保持了原有数据的信息。

在一个实施例中，如图5所示，步骤S310，基于样本数据训练深度置信网络，得到训练好的特征提取模型的步骤，包括：

步骤S311，初始化深度置信网络；其中，深度置信网络包括多个受限玻尔兹曼机。

具体的，深度置信网络由多个受限玻尔兹曼机(Restricted Boltzmann Machine，RBM)堆栈构成，上一层受限玻尔兹曼机的输出作为下一层受限玻尔兹曼机的输入。在训练深度置信网络时，首先初始化深度置信网络，并设置受限玻尔兹曼机的层数，和每层受限玻尔兹曼机的学习次数。

步骤S312，基于样本数据并采用对比散度算法训练每一受限玻尔兹曼机，直至全部受限玻尔兹曼机训练完成。

具体的，受限玻尔兹曼机的能量函数公式如式(4)所示：

式(4)中，v＝(v₁,v₂,…,v_m)^T为可视层的状态向量，h＝(h₁,h₂,…,h_n)^T为隐藏层的状态向量，a＝(a₁,a₂,…,a_m)^T为可视层的偏置向量，b＝(b₁,b₂,…,b_n)^T为隐藏层的偏置向量，m为可视层特征的个数，n为隐藏层特征的个数，θ＝{ω_ij,a_i,b_j}为受限玻尔兹曼机的训练参数，ω为连接v和h的权值，ω_ij∈R^m×n。

隐藏层状态为h的情况下，可视层第i个神经元被激活的概率公式如式(5)所示：

可视层状态为v的情况下，隐藏层第j个神经元被激活的概率公式如式(6)所示：

其中，

为sigmoid函数。

每次训练后，参数ω，a，b的更新公式分别如式(7)、式(8)和式(9)所示：

Δω_ij＝λ[P(h_j＝1丨v⁽⁰⁾)v⁽⁰⁾-P(h_j＝1丨v⁽⁰⁾)v_i ^(k)] (7)

Δb_j＝λ[P(h_j＝1丨v⁽⁰⁾)-P(h_j＝1丨v_i ^(k)] (9)

受限玻尔兹曼机共有5个参数：v、h、a、b、ω，其中a、b、ω为相应的权重和偏置值，是通过学习得到的，v是输入向量，h是输出向量。

对于一条样本X，采用对比散度算法对其进行训练。首先将X赋给可视层v₁，通过式(6)计算出隐藏层中每个神经元被激活的概率；然后从计算出来的概率分布中抽取一个样本，即第一个隐藏层h₁为抽取出来的概率分布，用P(v₁丨h₁)表示；用h₁重构可视层，即通过隐藏层状态h₁情况下，通过式(5)计算可视层每个神经元被激活的概率；同样的，从计算的概率分布中抽取一个样本，即第二个隐藏层v₂为抽取出来的概率分布，用P(v₂丨h₁)表示；通过v₂再次计算隐藏层中每个神经元被激活的概率，得到概率分布P(v₂丨h₂)；最后利用式(7)、式(8)和式(9)来更新权重，即可完成对一个受限玻尔兹曼机的训练。通过上述步骤将全部受限玻尔兹曼机进行训练。

步骤S313，将全部训练好的受限玻尔兹曼机作为特征提取模型。

具体的，当训练好第一个受限玻尔兹曼机后，固定第一个受限玻尔兹曼机的权重和偏移量，然后使用其隐藏层中神经元的状态，作为第二个受限玻尔兹曼机的输入向量；充分训练第二个受限玻尔兹曼机后，将第二个受限玻尔兹曼机堆叠在第一个受限玻尔兹曼机的上方；重复上述步骤直至全部受限玻尔兹曼机构建完成，也即深度置信网络构建完成，并将构建完成的深度置信网络作为特征提取模型。可以理解的是，特征提取模型的输出即为最后一个受限玻尔兹曼机隐藏层神经元的状态。

在一个实施例中，如图6所示，步骤S400，将特征数据输入待训练预测模型中，计算得到输出误差的步骤，包括：

步骤S410，将特征数据输入反向传播神经网络中，得到预测向量；

步骤S420，通过最小二乘法计算预测向量和真实向量之间的误差值，得到输出误差。

具体的，本申请实施例通过使用反向传播神经网络作为待训练预测模型。在反向传播神经网络中，设输入层共有n个神经元，输入层的输入向量为X＝{x₁,x₂,…,x_n}^T；隐藏层共有m个神经元，隐藏层的输出向量为Y＝{y₁,y₂,…,y_m}^T；神经网络的输出向量为O＝{o₁,o₂,…,o_l}^T；期望输出为D＝{d₁,d₂,…,d_l}^T。输入层到隐藏层的权值用矩阵V表示，V＝{v₁₁,v₁₂,…,v_ij,…,v_nm}^T，其中v_ij表示输入层的第i个神经元到隐藏层的第j个神经元的连接权值。隐藏层到输出层的权值矩阵为W＝{ω₁₁,ω₁₂,…,ω_jk,…,ω_ml}^T，其中ω_jk表示隐藏层的第j个神经元到输出层的第k个神经元的连接权值。

其中，对于隐藏层的输出向量由式(10)计算：

其中，

为sigmoid函数。

对于输出层的输出向量由式(11)计算：

其中，

为sigmoid函数。

反向传播神经网络的输出误差由式(12)计算：

权值调整由式(13)、式(14)和式(15)计算：

u_k+1＝u_k+Δu (13)

其中，μ为比例系数，I为单位矩阵，u_k为第k次迭代后的权重，A_k为雅可比矩阵。

训练反向传播神经网络的具体步骤为：首先设置训练误差允许值，即设置预设误差的大小，比例系数以及学习次数，并初始化权值和阈值；通过式(10)和式(11)分别计算隐藏层的输出向量和输出层的输出向量；通过式(12)计算反向传播神经网络的输出误差E(u_k)；判断E(u_k)是否小于预设误差，若是，则模型训练完成；若不是，则通过式(13)和式(14)分别计算u_k+1和Δu；通过计算好的u_k+1和Δu，计算当前反向传播神经网络的输出误差E(u_k+1)；再次判断E(u_k+1)是否小于预设误差，若是，则模型训练完成，若不是，则继续通过上述步骤对反向传播神经网络进行训练。可以理解的是，由于设置了学习次数，当训练次数达到学习次数后，仍不符合预设误差的要求，此时也会停止训练。通过上述步骤，即可对待训练预测模型进行训练，并得到训练好的故障预测模型。

本申请第二方面，提供了一种故障预测方法。在一个实施例中，参照图7所示，故障预测方法包括但不限于包括步骤S101至步骤S104。

步骤S101，获取变压器的在线监测数据。其中，在线监测数据为变压器在运行过程中，通过传感器对变压器的运行状态进行采样形成的数据。例如，可以为溶解气体、局部放电、绕组变形、绕组热点温度、绝缘水分等的监测数据。

步骤S102，对在线监测数据进行特征选择处理，得到样本数据。其中，由于通过实时监测所获取的数据量较大，因此需要对在线监测数据进行特征选择处理，从所有特征数据中选出相关特征，或在不引起重要信息丢失的前提下去除无关特征和冗余特征，从而在后续的模型预测过程中，减少故障预测模型的计算量。在进行特征选择时可以采用如下方式，例如，可以按照变压器的各种运行参数对变压器运行状态的影响程度来进行筛选，选出影响程度较高的数据作为样本数据；还可以采用如卡方检验、F检验和互信息等过滤式的算法，对运行特征数据进行筛选，得到样本数据。

步骤S103，对样本数据进行特征提取处理，得到特征数据。其中，通过特征提取处理，可以将样本数据处理为故障预测模型可以接收并处理的低维特征数据。

步骤S104，将特征数据输入训练好的故障预测模型中，得到当前故障状态。其中，故障预测模型由本申请第一方面提供的一种故障预测模型训练方法训练得到，具体限定可以参见上文中对于一种故障预测模型训练方法的限定，在此不再赘述。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的故障预测模型训练方法的故障预测模型训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个故障预测模型训练装置实施例中的具体限定可以参见上文中对于故障预测模型训练方法的限定，在此不再赘述。

在一个实施例中，如图8所示，提供了一种故障预测模型训练装置，装置包括：

数据获取模块，用于获取变压器的运行特征数据；

特征选择模块，用于对运行特征数据进行特征选择处理，得到样本数据；

特征提取模块，用于对样本数据进行特征提取处理，得到特征数据；

训练模块，用于将特征数据输入待训练预测模型中，计算得到输出误差；若输出误差大于等于预设误差，则计算雅可比矩阵以得到权值调整数据，并根据权值调整数据更新待训练预测模型；若输出误差小于预设误差，则将当前的待训练预测模型作为故障预测模型。

在其中一个实施例中，特征选择模块在对运行特征数据进行特征选择处理，得到样本数据的步骤中，包括：对运行特征数据进行归一化处理，得到修正数据；其中，修正数据包括多个随机变量；运用互信息算法对修正数据进行筛选处理，得到样本数据。

在其中一个实施例中，特征选择模块在运用互信息算法对修正数据进行筛选处理，得到样本数据的步骤，包括：计算任意两个随机变量之间的互信息值；若互信息值大于预设阈值，则将对应的两个随机变量作为保留数据；将全部保留数据作为样本数据。

在其中一个实施例中，特征提取模块在对样本数据进行特征提取处理，得到特征数据的步骤，包括：基于样本数据训练深度置信网络，得到训练好的特征提取模型；将样本数据输入特征提取模型中，得到特征数据。

在其中一个实施例中，特征提取模块在基于样本数据训练深度置信网络，得到训练好的特征提取模型的步骤，包括：初始化深度置信网络；其中，深度置信网络包括多个受限玻尔兹曼机；基于样本数据并采用对比散度算法训练每一受限玻尔兹曼机，直至全部受限玻尔兹曼机训练完成；将全部训练好的受限玻尔兹曼机作为特征提取模型。

在其中一个实施例中，训练模块在将特征数据输入待训练预测模型中，计算得到输出误差的步骤，包括：将特征数据输入反向传播神经网络中，得到预测向量；通过最小二乘法计算预测向量和真实向量之间的误差值，得到输出误差。

上述故障预测模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种故障预测模型训练方法或一种故障预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图9中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述故障预测模型训练方法的步骤或故障预测方法的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述故障预测模型训练方法的步骤或故障预测方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种故障预测模型训练方法，其特征在于，所述方法包括：

对所述运行特征数据进行特征选择处理，得到样本数据；

对所述样本数据进行特征提取处理，得到特征数据；

2.根据权利要求1所述的方法，其特征在于，所述对所述运行特征数据进行特征选择处理，得到样本数据的步骤，包括：

3.根据权利要求2所述的方法，其特征在于，所述运用互信息算法对所述修正数据进行筛选处理，得到所述样本数据的步骤，包括：

计算任意两个所述随机变量之间的互信息值；

将全部所述保留数据作为所述样本数据。

4.根据权利要求1所述的方法，其特征在于，所述对所述样本数据进行特征提取处理，得到特征数据的步骤，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于所述样本数据训练深度置信网络，得到训练好的特征提取模型的步骤，包括：

将全部训练好的受限玻尔兹曼机作为所述特征提取模型。

6.根据权利要求1所述的方法，其特征在于，所述将所述特征数据输入待训练预测模型中，计算得到输出误差的步骤，包括：

将所述特征数据输入反向传播神经网络中，得到预测向量；

7.一种故障预测方法，其特征在于，所述方法包括：

获取变压器的在线监测数据；

对所述在线监测数据进行特征选择处理，得到样本数据；

对所述样本数据进行特征提取处理，得到特征数据；

将所述特征数据输入训练好的故障预测模型中，得到当前故障状态；其中，所述故障预测模型由权利要求1至6任一项所述的故障预测模型训练方法训练得到。

8.一种故障预测模型训练装置，其特征在于，所述装置包括：

数据获取模块，用于获取变压器的运行特征数据；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的故障预测模型训练方法的步骤或权利要求7所述的故障预测方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的故障预测模型训练方法的步骤或权利要求7所述的故障预测方法的步骤。