CN111695631B

CN111695631B - 基于sae的检定故障特征提取方法、装置、设备以及介质

Info

Publication number: CN111695631B
Application number: CN202010534044.8A
Authority: CN
Inventors: 何春平
Original assignee: Zeen Technology Co ltd
Current assignee: Zeen Technology Co ltd
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2023-06-20
Anticipated expiration: 2040-06-12
Also published as: CN111695631A

Abstract

本发明涉及计量检定故障分析技术领域，尤其是涉及一种基于SAE的检定故障特征提取方法、装置、设备以及介质，该方法包括：获取用于检定故障的初始数据；对所述初始数据进行预处理，并将所述预处理后对应的数据分为样本集和测试集；构建堆叠自编码神经网络；根据所述样本集，对所述堆叠自编码神经网络进行预训练，得到待测试神经网络，然后根据测试集，对所述待测试神经网络并进行网络微调，得到故障特征提取网络；通过实时获取待检定对象的运行数据，将所述运行数据输入至所述故障特征提取网络，获取所述运行数据的故障特征。本发明具有无需先验知识并自动挖掘海量设备运行数据内在规律的效果。

Description

基于SAE的检定故障特征提取方法、装置、设备以及介质

技术领域

本发明涉及计量检定故障分析技术领域，尤其是涉及一种基于SAE的检定故障特征提取方法、装置、设备以及介质。

背景技术

目前，在流水线故障诊断方法上，通常对流水线主流的检定方式是使用各种传感器技术、视频技术、报文等方式采集各种系统运行数据，然后通过专家判断法和SDG模型等传统的数据挖掘方式进行故障的诊断。依据专家经验的故障诊断模型带有明显的主观，严重依赖检定系统运维专家的水平，故障诊断的准确率不高。

近年来，机器学习等人工智能算法开始应用于故障诊断，而大多的机器学习故障诊断模型都是运用有监督的学习策略，即根据由先验知识判断得到的故障类型，需选取合适的方法提取故障特征。然而，故障类型的标签数据需要由大量的实验和专业知识分析得到。其仍然不可避免存在主观判断的因素，从而降低模型的准确度，因此需要提出一种新的故障特征提取方法。

发明内容

本发明的目的是提供一种能够无需先验知识并自动挖掘海量设备运行数据内在规律的基于SAE的检定故障特征提取方法、装置、设备以及介质。

本发明的上述发明目的一是通过以下技术方案得以实现的：

一种故障特征提取方法，具体包括下述步骤：

S10：获取用于检定故障的初始数据；

S20：对所述初始数据进行预处理，并将所述预处理后对应的数据分为样本集和测试集；

S30：构建堆叠自编码神经网络；

S40：根据所述样本集，对所述堆叠自编码神经网络进行预训练，得到待测试神经网络，然后根据测试集，对所述待测试神经网络并进行网络微调，得到故障特征提取网络；

S50：通过实时获取待检定对象的运行数据，将所述运行数据输入至所述故障特征提取网络，获取所述运行数据的故障特征。

通过采用上述技术方案，获取用于检定故障的初始数据，对初始数据进行预处理，能够保证数据的完整和可使用性，提高后续网络训练或测试的准确度；将预处理后对应的数据分为样本集和测试集，方便后续的网络预训练和网络微调；构建堆叠自编码神经网络，无需先验知识，通过样本集对堆叠自编码神经网络进行无监督训练，得到待测试神经网络，然后将测试集输入至待测试神经网络中，对待测试神经网络进行网络微调，能够得到故障特征提取网络；通过将实时获取待检定对象的运行数据输入至所述故障特征提取网路中，能够得到该待鉴定对象的运行数据的故障特征；在无先验知识的条件下，基于堆叠自编码神经网络的故障提取方法可以挖掘计量检定自动化系统海量运行状态数据的内在规律并提取特征，从而减弱了先验知识对故障诊断准确率的影响。

本发明在一较佳示例中可以进一步配置为：步骤S10中，所述初始数据，包括历史运行数据和实时产生的设备运行数据。

通过采用上述技术方案，在获取初始数据时，同时历史运行数据和实时产生的设备运行数据，使数据量够丰富，在后续训练网络时有利于提高网络的准确性。

本发明在一较佳示例中可以进一步配置为：步骤S20中包括下述步骤：

S21：对所述历史运行数据和实时产生的所述设备运行数据进行数据融合和数据清洗，其中所述数据清洗包括：去重处理、缺失值处理以及异常值处理；

S22：将所述初始数据预处理后对应的数据按照预设的规则分为样本集和测试集。

通过采用上述技术方案，将多源的初始数据进行数据融合，然后进行数据清洗，将重复值或重复行的数据去除，将将缺失的值进行填补，将异常值进行排查，能够使训练数据或测试数据更加完整、连续；将预处理后对应的数据按照一定比例分为样本集和测试集，方便后续网络预训练和网络微调。

本发明在一较佳示例中可以进一步配置为：步骤S30具体包括下述步骤：

S31：设置U个自编码器进行堆叠，得到初级网络，其中U为正整数；

S32：在所述初级网络顶层加上softmax分类器，得到所述堆叠自编码神经网络。

通过采用上述技术方案，通过设置U个自编码器进行堆叠，并在堆叠的初级网络顶层上

加上softmax分类器，样本集经过U个自编码器实现U次特征变换，使得最终到达softmax分类器的特征更抽象却更为本质，同时自编码器有效增强了提取特征的稀疏性，使得提取的特征更加具有代表性，更有利于softmax分类器的识别与分类。

本发明在一较佳示例中可以进一步配置为：所述网络训练包括：预训练过程和微调过程，步骤S40包括下述步骤：

S41：所述预训练过程：将所述样本集中的数据输入至所述堆叠自编码神经网络中，通过所述自编码器进行无监督训练，然后利用梯度下降算法优化所述softmax分类器的代价函数，获得所述堆叠自编码神经网络的初始参数，并将预训练后对应的所述堆叠自编码神经网络作为待测试神经网络；

S42：所述微调过程：将所述测试集中的数据输入至所述待测试神经网络，根据所述初始参数，通过循环前向传播和反向传播，不断更新每层参数，直至达到最大迭代次数，然后保存更新后的各层参数，得到故障提取特征网络。

通过采用上述技术方案，通过每个自编码器进行无监督训练，能够获得每层的网络参数和每个隐藏层的激活值；利用梯度下降算法优化softmax分类器的代价函数，能够获得最佳分类器参数；根据待测试神经网络的初始参数，通过循环前向传播和反向传播，能够不断微调各层的网络参数，直至达到最大迭代次数，从而能够提高提取故障并将保存微调后的各层参数，得到故障特征提取网路。

本发明在一较佳示例中可以进一步配置为：步骤S41具体包括下述步骤：

S411：将所述样本集的数据输入至第一个自编码器进行无监督训练，获得自编码网络的最佳参数

和/>

，并通过激活函数计算隐藏层的激活值，将所述激活值作为第一特征；

S412：把所述第一特征输入至第二个自编码器并进行无监督训练，获得最佳参数

和/>

，同时计算第二特征；

S413：把所述第二特征输入至第三个自编码器，依次训练，直至第U个自编码器训练结束，获得最佳参数

和/>

，同时计算第U特征；

S414：把所述第U特征输入至softmax分类器，并利用梯度下降算法优化softmax函数的代价函数，获得最佳分类器参数θ，完成堆叠自编码神经网络的预训练，并将每层获得的参数作为所述堆叠神经网络的初始参数，然后将完成预训练对应的所述堆叠自编码神经网络作为待测试神经网络。

通过采用上述技术方案，通过U个自编码器的无监督训练，能够使获取的特征更为本质、抽象，然后通过softmax分类器进行识别分类，并利用梯度下降算法优化代价函数，能够获得最佳分类器参数。

S421：将所述测试集中的数据输入至所述待测试神经网络，对所述待测试神经网络进行前向传播，利用所述初始参数计算每层的激活值，并计算实际输出与理想输出间的误差；

S422：对所述堆叠自编码网络进行反向传播，将所述误差反向传播至输入层，并计算每层参数的梯度，利用梯度下降法更新每层参数；

S423：循环所述前向传播和所述反向传播，不断更新每层参数，直至达到最大迭代次数，则完成所述微调过程，保存更新后的各层参数，得到待测试神经网络。

通过采用上述技术方案，通过前向传播，并计算实际输出与理想输出间的误差，然后根据误差进行反向传播，不断更新每次参数，达到最大迭代次数，完成微调过程，能够使误差减小，提高网络参数准确性。

本发明的上述发明目的二是通过以下技术方案得以实现的：

一种基于SAE的检定故障特征提取装置，包括：数据获取模块、数据处理模块、网络构建模块、训练模块以及应用模块；

所述数据获取模块，用于获取用于检定故障的初始数据；

所述数据处理模块，用于对所述初始数据进行预处理，并将所述预处理后对应的数据分为样本集和测试集；

所述网络构建模块，用于构建堆叠自编码神经网络；

所述训练模块，根据所述样本集，对所述堆叠自编码神经网络进行预训练，得到待测试神经网络，然后根据测试集，对所述待测试神经网络并进行网络微调，得到故障特征提取网络；

所述应用模块，用于通过实时获取待检定对象的运行数据，将所述运行数据输入至所述故障特征提取网络，获取所述运行数据的故障特征。

本发明的上述发明目的三是通过以下技术方案得以实现的：

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于SAE的检定故障特征提取方法的步骤。

本发明的上述发明目的四是通过以下技术方案得以实现的：

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于SAE的检定故障特征提取方法的步骤。

综上所述，本发明包括以下至少一种有益技术效果：

1、通过对获取的历史运行数据和实时产生的设备运行数据进行预处理，能够使样本数据和测试数据更具完整性和可使用性，从而提高后续网络训练的准确度。

2、通过自编码神经网络进行无监督预训练，使网络获得初始参数，然后通过前向传播和后向传播，对网络的初始参数进行微调，从而使得到的故障特征提取网络更加精准的挖掘海量设备运行数据的内在规律。

3、通过自编码器的无监督训练，能够避免主观性因素，从而提高故障特征提取网络的准确度。

附图说明

图1是本发明一实施例中检定故障特征提方法的流程图；

图2是本发明一实施例中不同AE层数的堆叠自编码神经网络故障诊断研究结果示意图；

图3是本发明一实施例中不同网络结构的重构误差研究结果示意图；

图4是本发明一实施例中堆叠自编码神经网络的网络结构参数示意图；

图5是本发明一实施例中检定故障特征提方法步骤S20的实现流程图；

图6是本发明一实施例中检定故障特征提方法步骤S30的实现流程图；

图7是本发明一实施例中检定故障特征提方法步骤S40的实现流程图；

图8是本发明一实施例中自堆叠神经网络训练流程图；

图9是本发明一实施例中检定故障特征提方法步骤S41的实现流程图；

图10是本发明一实施例中检定故障特征提方法步骤S42的实现流程图；

图11是本发明一实施例中基于SAE的检定故障特征提取装置的一原理框图；

图12是本发明一实施例中计算机设备的一示意图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

实施例一：

在一实施例中，如图1所示，本发明公开了一种基于SAE的检定故障特征提取方法，具体包括如下步骤：

S10：获取用于检定故障的初始数据。

在本实施例中，初始数据是指多源数据，通过传感器或监测软件实时获取自动化系统运行过程中产生的设备运行数据，初始数据还包括历史运行数据。其中历史运行数据保存在后台数据库。

具体地，通过传感器或监测软件采集设备运行数据，然后将设备运行数据发送到后台并保存至数据库，作为历史运行数据。

进一步地，从数据库中获取历史运行数据，将获取得到的历史运行数据和检测得到的设备运行数据作为初始数据。

S20：对初始数据进行预处理，并将预处理后对应的数据分为样本集和测试集。

在本实施例中，预处理是指在数据使用前进行数据融合和清洗，在本实施例中，通过python提供的数据处理库Pandas进行操作。样本集是指用于后续网络预训练的数据。测试集是指用于后续网络微调的数据。

具体地，对获取的初始数据进行预处理，包括数据融合和数据清洗，然后将预处理后对应的数据按照预设的规则分为样本集和测试集，样本集用于网络训练，测试集用于网络微调。

S30：构建堆叠自编码神经网络；

在本实施例中，堆叠自编码神经网络（Stacked AutoEncoder，SAE）的输入维度与输出维度相同，训练目的是使数据的特征得到最大的保留，去除冗余信息。不同的堆叠自编码神经网络层数，其网络性质不同，应用本实施例的堆叠自编码神经网络提取的故障特征用于后续计量检定自动化系统的故障诊断，在不同AE（AutoEncoder）层数的堆叠自编码神经网络中，初始学习率均设定为0.1，统计10次试验的故障诊断结果，如图2所示，AE层数小于3层时，随着AE层数的提高，诊断准确率明显线性增长，到AE层数大于3层时，诊断准确率已达到较高水平，并且相对稳定，约为92.51%。因此，在本实施例中，AE层数采用3层，计量检定自动化系统的故障诊断效果最佳。

具体地，堆叠自编码神经网络中隐藏层节点数量对后续计量检定自动化系统的故障分析至关重要，在设定隐藏层节点数量时，需要大量实验测试，结合网络结构复杂程度和重构误差大小来设定合理的隐藏层节点数，根据图3所示的结果，网络结构采用递减型时并且当隐藏层的个数为输入层的一半时，与之相对应的重构误差达到最小值，因此在本实施例中，堆叠自编码神经网络采用递减型网络结构，具体为1000-500-250-125-7，计量检定自动化系统的故障诊断准确率更高，在本实施例中，堆叠自编码神经网络的各项参数如图4所示。

具体地，在构建自编码神经网络之后，待后续对该自编码神经网络训练后进行故障提取。

S40：根据样本集，对堆叠自编码神经网络进行预训练，得到待测试神经网络，然后根据测试集，对待测试神经网络并进行网络微调，得到故障特征提取网络；

在本实施例中，待测试神经网络是指堆叠自编码神经网络预训练完成，需要进一步网络微调。故障特征提取网络是指训练完成且可以实际应用的神经网络。

具体地，将样本集中的数据输入至构建的堆叠自编码神经网络中进行预训练，采用无监督训练方式，从而获取每层的网络参数，完成预训练，并将完成预训练对应的堆叠自编码神经网络作为待测试神经网络，将测试集中的数据输入至待测试神经网络中进行网络参数微调，并将微调完成的网络作为故障特征提取网络。

S50：通过实时获取待检定对象的运行数据，将运行数据输入至故障特征提取网络，获取运行数据的故障特征。

在本实施例中，故障特征是指运行数据的故障特征向量。

具体地，将待检定对象的运行数据输入故障特征提取网络中，故障特征提取网络对运行数据进行数据识别，提取运行数据的故障特征。

在一实施例中，在步骤S10中，初始数据，包括后台数据库中的历史运行数据和实时产

生的设备运行数据。

在本实施例中，后台数据库是指计量检定自动化系统线体FDB数据库，用于保存历史监测的设备运行数据。

具体地，设备运行数据是通过线体监测软件和传感器采集的监测数据，在本实施例中，监测数据包括：烟雾、电能表电压、正常电压、标准表电压、检测项目误差最大值、检测项目误差平均值、电能表电压差、表码、电能表电流、标准表电压差、环境温度、标准表电流、磁场、正常电流、标准表电流差、功率因数、电能表电流差、电机转速、气压、温度浮动、标准表电压起伏、时间间隔、电机转速差、磁场变化、电机转速浮动、电能表电压起伏、环境湿度以及检测项目误差历史对比。

在一实施例中，如图5所示，在步骤S20中，即对初始数据进行预处理，并将预处理后

对应的数据分为样本集和测试集，具体包括下述步骤：

S21：对历史运行数据和实时产生的设备运行数据进行数据融合和数据清洗，其中数据清洗包括：去重处理、缺失值处理以及异常值处理。

具体地，去重处理是指处理初始数据中相同时间节点的数据，在本实施例中，通过drop_duplicated函数可以方便去除重复行，保留第一次出现的重复行。在本实施例中，缺失值处理是采用Pandas中的fillna函数，通过fillna函数选择任一数值代替空值或缺失值，完成对空值或缺失值的填补。异常值是指初始数据中有一个或几个数值与其他数值相比差异较大，又称为离群值（outlier），本实施例中，采用盖帽法进行异常值排查，将一个连续变量均值上下三倍标准差范围外的数据记录替换为均值上下三倍标准差值。

S22：将初始数据预处理后对应的数据按照预设的规则分为样本集和测试集。

具体地，按照预设的规则，将初始数据预处理后对应的数据分为样本集和测试集，在本实施例中，预设的规则可以是按照经验值进行设置，在其他实施例中，也可以采用随机划分样本。

在一实施例中，如图6所示，在步骤S30中，即构建堆叠自编码神经网络，具体包括下述步骤：

具体地，将U个自编码器进行堆叠，得到一个初级网络，在本实施例中，U设置为3；在初级网络中，一个隐藏层与对应的上一层构成一个自编码网络，用于自动提取特征。

S32：在初级网络的顶层加上softmax分类器，得到堆叠自编码神经网络。

具体地，在初级网络的顶层加上softmax分类器，在经过U个自编码器实现U次特征变化，使得最终达到softmax分类器的特征更加本质、抽象。同时，自编码器有效增强了提取特征的稀疏性，使其更加具有代表性，更有利于softmax分类器的识别与分类。

在一实施例中，如图7所示，在步骤S40中，即根据样本集，对堆叠自编码神经网络进行预训练，得到待测试神经网络，然后根据测试集，对待测试神经网络并进行网络微调，得到故障特征提取网络，具体包括下述步骤：

S41：预训练过程：将样本集中的数据输入至堆叠自编码神经网络中，通过自编码器进行无监督训练，然后利用梯度下降算法优化softmax分类器的代价函数，获得堆叠自编码神经网络的初始参数，并将预训练后对应的堆叠自编码神经网络作为待测试神经网络；

在本实施例中，代价函数是指针对所有样本，损失函数的平均函数。

具体地，将样本集中的数据输入至堆叠自编码神经网络中，根据自编码器的无监督训练，提取特征，然后将最终提取的特征输入至softmax分类器中进行识别分类，在这个预训练过程中，通过将样本集中的数据在堆叠自编码神经网络中进行计算后，生成了初始的网络参数。

S42：微调过程：将测试集中的数据输入至待测试神经网络，根据初始参数，通过循环前向传播和反向传播，不断更新每层参数，直至达到最大迭代次数，然后保存更新后的各层参数，得到故障提取特征网络。

在本实施例中，前向传播是指将测试集中的数据信号从输入层正向传播至输出层，该过程产生重构误差。反向传播是指将重构误差从输出层反向传播至输入层，该过程更新各层参数。最大迭代次数的设置可以根据实际检测的情况，对重构误差设置对应的误差范围（即实际需要检测的精度）、获取进行微调过程之前的误差值，以及获取每一次前向传播和反向传播缩减的误差值，使得在达到最大迭代次数时，各层网络参数的误差值符合对应的误差范围。

具体地，利用循环前向传播和反向传播，不断更新每层网络参数，达到最大迭代次数，从而缩小网络实际输出与理想输出间的误差，在微调过程中，调整各层网络参数，得到该故障提取特征网络，即如图8所示的最佳深度SAE网络。

在一实施例中，如图9所示，在步骤S41中，即将样本集中的数据输入至堆叠自编码神经网络中，通过自编码器进行无监督训练，然后利用梯度下降算法优化softmax分类器的代价函数，获得堆叠自编码神经网络的初始参数，并将预训练后对应的堆叠自编码神经网络作为待测试神经网络，具体包括下述步骤：

S411：将样本集的数据输入至第一个自编码器进行无监督训练，获得自编码网络的最佳参数

和/>

，并通过激活函数计算隐藏层的激活值，将激活值作为第一特征；

S412：把第一特征输入至第二个自编码器并进行无监督训练，获得最佳参数

和/>

，同时计算第二特征；

S413：把第二特征输入至第三个自编码器，依次训练，直至第U个自编码器训练结束，获得最佳参数

和/>

，同时计算第U特征；

S414：把第U特征输入至softmax分类器，并利用梯度下降算法优化softmax函数的代价函数，获得最佳参数θ，完成堆叠自编码神经网络的预训练，并将每层获得的参数作为堆叠神经网络的初始参数。

在本实施例中，

和/>

分别表示第一个自编码器的权重。/>

和/>

分别表示第二个自编码器的权重。/>

和/>

分别表示第U个自编码器的权重。θ表示softmax分类器的参数矩阵。

具体地，通过每个自编码器的无监督训练，获得特征，并将特征输入下一个自编码器，直至获得第U特征，然后输入至softmax分类器进行识别分类，从而获得堆叠自编码网络的初始参数。

在一实施例中，如图10所示，在步骤S42中，即将测试集中的数据输入至待测试神经网络，根据初始参数，通过循环前向传播和反向传播，不断更新每层参数，直至达到最大迭代次数，然后保存更新后的各层参数，得到故障提取特征网络，具体包括下述步骤：

S421：将测试集中的数据输入至待测试神经网络，对待测试神经网络进行前向传播，利用初始参数计算每层的激活值，并计算实际输出与理想输出间的误差；

S422：对堆叠自编码网络进行反向传播，将误差反向传播至输入层，并计算每层参数的梯度，利用梯度下降法更新每层参数；

S423：循环前向传播和反向传播，不断更新每层参数，直至达到最大迭代次数，则完成待测试神经网络的微调，保存更新后的各层参数，得到故障特征提取网络。

具体地，前向传播是指将测试集中的数据信号从输入层正向传播至输出层，该过程产生重构误差。反向传播是指将重构误差从输出层反向传播至输入层，该过程更新各层权重参数。通过循环前向传播和反向传播，缩小实际输出与理想输出间的重构误差，并利用梯度下降算法更新各层网络参数，直至达到最大迭代次数，完成微调过程，得到故障特征提取网络。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

实施例二：

在一实施例中，提供一种基于SAE的检定故障特征提取装置，该基于SAE的检定故障特征提取装置与上述实施例中基于SAE的检定故障特征提取方法一一对应。如图11所示，该基于SAE的检定故障特征提取装置包括数据获取模块10、数据处理模块20、网络构建模块30、训练模块40和应用模块50。各功能模块详细说明如下：

数据获取模块10，用于获取用于检定故障的初始数据。

数据处理模块20，用于对初始数据进行预处理，并将预处理后对应的数据分为样本集和测试集。

网络构建模块30，用于构建堆叠自编码神经网络。

训练模块40，用于根据样本集，对堆叠自编码神经网络进行预训练，得到待测试神经网络，然后根据测试集，对待测试神经网络并进行网络微调，得到故障特征提取网络。

应用模块50，用于通过实时获取待检定对象的运行数据，将运行数据输入至故障特征提取网络，获取运行数据的故障特征。

优选地，数据处理模块20包括：

数据预处理子单元21，用于对历史运行数据和实时产生的设备运行数据进行数据融合和数据清洗，其中数据清洗包括：去重处理、缺失值处理以及异常值处理。

数据分类子单元22，用于将初始数据预处理后对应的数据按照预设的规则分为样本集和测试集。

优选地，网络构建模块30包括：

初级网络子单元31，用于设置U个自编码器进行堆叠，得到初级网络，其中U为正整数。

分类网络子单元32，用于在初级网络的顶层加上softmax分类器，得到堆叠自编码神经网络。

优选地，训练模块40包括：

预训练子模块41，用于将样本集中的数据输入至堆叠自编码神经网络中，通过自编码器进行无监督训练，然后利用梯度下降算法优化softmax分类器的代价函数，获得堆叠自编码神经网络的初始参数，并将预训练后对应的堆叠自编码神经网络作为待测试神经网络。

微调子模块42，用于将测试集中的数据输入至待测试神经网络，根据初始参数，通过循环前向传播和反向传播，不断更新每层参数，直至达到最大迭代次数，然后保存更新后的各层参数，得到故障提取特征网络。

优选地，预训练子模块41包括：

自编码器训练单元411，用于将样本集的数据输入至第一个自编码器进行无监督训练，获得自编码网络的最佳参数

和/>

，并通过激活函数计算隐藏层的激活值，将激活值作为第一特征；用于把第一特征输入至第二个自编码器并进行无监督训练，获得最佳参数/>

和/>

，同时计算第二特征；用于把第二特征输入至第三个自编码器，依次训练，直至第U个自编码器训练结束，获得最佳参数/>

和/>

，同时计算第U特征。

识别分类单元412，用于把第U特征输入至softmax分类器，并利用梯度下降算法优化softmax函数的代价函数，获得最佳分类器参数θ，完成堆叠自编码神经网络的预训练，并将每层获得的参数作为堆叠神经网络的初始参数，然后将完成预训练对应的堆叠自编码神经网络作为待测试神经网络。

优选地，微调子模块42包括：

前向传播子单元421，用于将测试集中的数据输入至待测试神经网络，对待测试神经网络进行前向传播，利用初始参数计算每层的激活值，并计算实际输出与理想输出间的误差；

反向传播子单元422，用于对堆叠自编码网络进行反向传播，将误差反向传播至输入层，并计算每层参数的梯度，利用梯度下降法更新每层参数。

迭代子单元423，用于循环前向传播和反向传播，不断更新每层参数，直至达到最大迭代次数，则完成待测试神经网络的微调，保存更新后的各层参数，得到故障特征提取网络。

关于基于SAE的检定故障特征提取装置的具体限定可以参见上文中对于基于SAE的检定故障特征提取方法的限定，在此不再赘述。上述基于SAE的检定故障特征提取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

实施例三：

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于历史运行数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于SAE的检定故障特征提取方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

S10：获取用于检定故障的初始数据；

S20：对初始数据进行预处理，并将预处理后对应的数据分为样本集和测试集；

S30：构建堆叠自编码神经网络；

实施例四：

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

S10：获取用于检定故障的初始数据；

S30：构建堆叠自编码神经网络；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。