CN116910493A

CN116910493A - 基于多源特征提取的设备故障诊断模型的构建方法及装置

Info

Publication number: CN116910493A
Application number: CN202311168065.2A
Authority: CN
Inventors: 尹旭; 马兵; 续敏; 王玉石; 包明明; 朱运恒; 苏子康
Original assignee: Shandong Energy Shuzhiyun Technology Co ltd
Current assignee: Shandong Energy Shuzhiyun Technology Co ltd
Priority date: 2023-09-12
Filing date: 2023-09-12
Publication date: 2023-10-20
Anticipated expiration: 2043-09-12
Also published as: CN116910493B

Abstract

本发明提供的一种基于多源特征提取的设备故障诊断模型的构建方法及装置，涉及设备故障诊断技术领域，包括：获取预先构建的样本集；样本集中包括初始样本和初始样本对应的生成样本；初始样本包括样本标签，样本标签用于表征设备的故障类型；对样本集进行特征提取，得到基于时序特征的目标特征；将基于时序特征的目标特征和目标特征对应的样本标签输入至预先设置的分类器中，通过分类器对样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型；故障诊断模型用于对设备的待测数据进行故障诊断。本发明在解决样本不平衡，并提高特征质量的前提下，可以使分类器精准训练，保证设备故障诊断的诊断效果。

Description

基于多源特征提取的设备故障诊断模型的构建方法及装置

技术领域

本发明涉及设备故障诊断技术领域，尤其涉及一种基于多源特征提取的设备故障诊断模型的构建方法及装置。

背景技术

随着科技的发展和制造工艺的进步，工业应用中的机械设备的复杂度不断增加，在使用过程中的任何异常或故障不仅直接影响产品的使用，而且还可能造成严重的安全事故。经过长期的实践和经验，要使工业应用中的机械设备或系统能够安全、可靠、有效地运行，必须要对其进行故障检测与诊断。智能故障诊断的核心在于生成一个能够以“专家”身份来对设备进行故障诊断的实体，可以给出与传统专家检测相同的诊断结果。目前，基于模型的故障诊断方法最先发展起来。随着技术的不断进步，待测对象不断复杂化、大型化、非线性化、系统化，建立精确的数学模型难度越来越大，各设备之间存在的耦合，使得模型难度也会成指数增加。

基于信号处理的方法不需要精确的数学模型，回避了基于模型的故障诊断方法的难点，而是基于待测对象的信号模型，分析测得的信号数据提取特征信号值，根据特征值是否异常来判断待测对象是否发生故障，该方法基本不依赖于待测对象的模型，既适用于线性系统又可适用非线性系统，但是它只是对待测对象的信号数据进行分析，对系统高维信号之间的耦合性和关联度挖掘不够，没有更加深入地利用待测对象的深层信息。传统的机器学习方法往往基于既得的监测数据，需要人工提取大量的特征，且模型的训练精度受训练样本的数量和质量的限制较大，对设备进行故障检测的精度难以进一步提高。

基于此，现有技术存在以下技术问题：（1）现有的许多方法难以对不平衡、小样本数据进行设备故障诊断与分类。（2）现有的许多方法难以对设备故障数据进行高效的特征选择与提取，导致算法难以进行精准识别与分类。（3）在实际设备故障识别应用现场中，故障数据采集困难，各故障类别数据通常不均衡，算法存在执行能力弱、适应性不强、稳定性差等问题。

发明内容

有鉴于此，本发明的目的在于提供一种基于多源特征提取的设备故障诊断模型的构建方法及装置，可以解决样本不平衡的问题，并可以提高特征质量，保证故障诊断的识别精度。

第一方面，本发明实施例提供了一种基于多源特征提取的设备故障诊断模型的构建方法，其中，该方法包括：获取预先构建的样本集；样本集中包括初始样本和初始样本对应的生成样本；初始样本包括样本标签，样本标签用于表征设备的故障类型；对所述样本集进行特征提取，得到基于时序特征的目标特征；将基于时序特征的目标特征和目标特征对应的样本标签输入至预先设置的分类器中，通过分类器对样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型；故障诊断模型用于对设备的待测数据进行故障诊断。

结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，上述方法还包括：获取预先采集的设备历史故障数据，并将设备历史故障数据确定为初始样本；根据初始样本对应的样本标签，确定目标样本标签对应的目标初始样本；基于目标初始样本对应的近邻样本，确定待生成样本，并按照预设的样本生成方式生成初始样本对应的初始生成样本；基于初始生成样本对应于目标初始样本的相似度，确定保留的初始生成样本，并将保留的初始生成样本确定为目标初始样本对应的生成样本。

结合第一方面，本发明实施例提供了第一方面的第二种可能的实施方式，其中，基于目标初始样本对应的近邻样本，确定待生成样本，并按照预设的样本生成方式生成初始样本对应的初始生成样本的步骤，包括：对初始样本和目标初始样本进行降维处理，在降维处理的低维空间中，计算初始样本相对于目标初始样本的欧几里得距离；根据欧几里得距离，以及预设的近邻控制因子，确定目标初始样本对应的多个近邻样本；从多个近邻样本中确定待生成样本；根据预设的样本生成参数和待生成样本，生成目标初始样本对应的初始生成样本。

结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，基于初始生成样本对应于目标初始样本的相似度，确定保留的初始生成样本的步骤，包括：根据预设的最优样本，对初始生成样本进行修正，确定修正样本；最优样本根据目标初始样本对应的相似度确定；根据预先确定的修正样本对应的样本类别，以及预设的惩罚项，对修正样本进行概率校验，确定后验概率结果；惩罚项根据修正样本和目标初始样本的距离确定；判断后验概率结果是否满足预先确定的概率阈值；如果是，保留初始生成样本。

结合第一方面，本发明实施例提供了第一方面的第四种可能的实施方式，其中，样本集中包括多个特征参数；对样本集进行特征提取，得到基于时序特征的目标特征的步骤，包括：将样本集的特征参数分为时序特征和非时序特征；针对时序特征的时间序列，确定时序特征对应的时域特征；将时间序列应用短时傅里叶变换，确定时序特征对应的频域特征；通过预设的神经网络对时域特征和频域特征进行特征选择和降维处理，得到时序特征对应的特征表示；将特征表示和非时序特征进行特征融合，得到基于时序特征的目标特征。

结合第一方面，本发明实施例提供了第一方面的第五种可能的实施方式，其中，通过预设的神经网络对时域特征和频域特征进行特征选择和降维处理，得到时序特征对应的特征表示的步骤，包括：将时域特征和频域特征确定为特征向量，通过神经网络对特征向量映射处理，得到映射特征；神经网络包括预先确定的神经网络参数，神经网络参数通过反向传播算法和梯度下降法优化得到；通过预设的得分函数，确定映射特征对应的注意力权重；根据注意力权重对映射特征进行加权，并通过神经网络对加权的映射特征进行特征提取，得到时序特征对应的特征表示。

结合第一方面，本发明实施例提供了第一方面的第六种可能的实施方式，其中，将基于时序特征的目标特征和目标特征对应的样本标签输入至预先设置的分类器中，通过分类器对样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型的步骤，包括：通过分类器的转换函数确定目标特征对应的隐藏层输出；基于隐藏层输出，以及预设的输出层权重和输出层偏置，计算隐藏层输出对应的神经元参数；基于神经元参数，确定分类器的目标函数对应的预测分类结果；判断预测分类结果是否满足预设的函数输出阈值，如果否，根据预设的学习率，对输出层权重和输出层偏置进行参数更新；直到预测分类结果满足预设的函数输出阈值时，将包含当前输出层权重和输出层偏置的分类器确定为故障诊断模型。

第二方面，本发明实施例还提供一种基于多源特征提取的设备故障诊断方法，其中，该方法包括：获取目标设备的待测数据；根据预先确定的目标特征，从待测数据中确定目标待测参数；将目标待测参数输入至预先构建的故障诊断模型中，确定目标待测参数对应的神经元参数；通过故障诊断模型基于该神经元参数，确定目标待测参数对应于多个故障类别的设备故障概率，并根据设备故障概率，确定待测数据的设备故障类别；基于设备故障类别对目标设备进行故障诊断；其中，故障诊断模型为基于上述基于多源特征提取的设备故障诊断模型的构建方法构建得到的。

第三方面，本发明实施例还提供一种基于多源特征提取的设备故障诊断模型的构建装置，该装置包括：样本获取模块，用于获取预先构建的样本集；样本集中包括初始样本和初始样本对应的生成样本；初始样本包括样本标签，样本标签用于表征设备的故障类型；样本处理模块，用于对样本集进行特征提取，得到基于时序特征的目标特征；执行模块，用于将基于时序特征的目标特征和目标特征对应的样本标签输入至预先设置的分类器中，通过分类器对样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型；故障诊断模型用于对设备的待测数据进行故障诊断。

第四方面，本发明实施例还提供一种基于多源特征提取的设备故障诊断装置，该装置包括：数据获取模块，用于获取目标设备的待测数据；参数确定模块，用于根据预先确定的目标特征，从待测数据中确定目标待测参数；数据处理模块，用于将目标待测参数输入至预先构建的故障诊断模型中，确定目标待测参数对应的神经元参数；输出模块，用于基于目标待测参数对应的神经元参数，确定目标待测参数对应于多个故障类别的设备故障概率，并根据设备故障概率，确定待测数据的设备故障类别；诊断模块，用于基于设备故障类别对目标设备进行故障诊断；其中，故障诊断模型为基于上述基于多源特征提取的设备故障诊断模型的构建方法构建得到的。

本发明实施例带来了以下有益效果：本发明提供的一种基于多源特征提取的设备故障诊断模型的构建方法及装置，利用预先构建的样本集进行分类器训练，样本集中包括初始样本和生成样本，可以解决样本不平衡问题。而且，还对样本集进行特征提取，利用深度神经网络进行特征选择和降维，自动学习到更高级别的特征表示，以得到基于时序特征的目标特征，该目标特征可以使分类器精确识别故障类型，从而在分类器训练结束，得到对应的故障诊断模型后，可以通过该故障诊断模型对目标设备进行精准分类，保证分类的稳定性及识别精度。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于多源特征提取的设备故障诊断模型的构建方法的流程图；

图2为本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建方法的流程图；

图3为本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建方法的流程图；

图4为本发明实施例提供的一种基于多源特征提取的设备故障诊断方法的流程图；

图5为本发明实施例提供的一种基于多源特征提取的设备故障诊断模型的构建装置的结构示意图；

图6为本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建装置的结构示意图；

图7为本发明实施例提供的一种基于多源特征提取的设备故障诊断装置的结构示意图；

图8为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，以下通过特定的具体实例说明本公开的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本公开的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是，以下实施例中所提供的图示仅以示意方式说明本公开的基本构想，图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。另外，在以下描述中，提供具体细节是为了便于透彻理解实例。然而，所属领域的技术人员将理解，可在没有这些特定细节的情况下实践所述方面。

其中，本发明实施例提供的一种基于多源特征提取的设备故障诊断模型的构建方法及装置，具体还包括基于多源特征提取的设备故障诊断方法及装置，其中，本发明实施例可以解决样本不平衡的问题，并可以提高特征质量，保证故障诊断的识别精度。

为便于对本实施例进行理解，首先对本发明的实施例所公开的一种基于多源特征提取的设备故障诊断模型的构建方法进行详细介绍，图1示出了本发明实施例提供的一种基于多源特征提取的设备故障诊断模型的构建方法的流程图，如图1所示，该方法包括如下步骤：

步骤S102，获取预先构建的样本集。

本发明实施例进行故障诊断模型训练时，需要选择所需的数据集，为解决初始样本的不平衡问题，本发明实施例的样本集中包括初始样本和初始样本对应的生成样本。其中，初始样本为预先采集的历史故障数据，如设备的历史数据。具体的，本发明实施例可以用于对煤矿机械设备采煤机进行故障诊断，对应的，选用的数据集可以由煤矿机械设备采煤机的历史故障数据组成，其中，本发明先获取预先采集的设备历史故障数据，并将这些设备历史故障数据作为初始样本使用。

例如，本发明实施例的初始样本涵盖了采煤机的22种运行状态，即1种正常状态和21种常见的故障状态，每一种运行状态由唯一的标签标定。此外，在该数据集中，采煤机的每一种运行状态均包括个特征参数进行表示，包括设备输出电压、输出电流、输入电流、设备型号、设备购买日期等参数。采集到设备数据后，采用人工标注的方式进行数据标注，以使本发明实施例的样本集的初始样本包括样本标签，该样本标签用于表征设备的故障类型，且用于后续数据处理和模型训练。

步骤S104，对样本集进行特征提取，得到基于时序特征的目标特征。

步骤S106，将基于时序特征的目标特征和目标特征对应的样本标签输入至预先设置的分类器中，通过分类器对样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型。

为保证分类器训练的质量，以及故障诊断的精度，本发明实施例对包含初始样本和生成样本的样本集进行特征提取，以确定有用的特征参数，也即上述目标特征，其中，本发明实施例在于利用深度神经网络进行特征选择和降维，以自动学习到更高级别的特征表示，快速得到所需的有用数据，故，本发明实施例提取基于时序特征的目标特征，从而利用该目标特征对分类器进行分类训练，基于分类器构建故障诊断模型，该故障诊断模型用于对设备的待测数据进行故障诊断。

本发明实施例提供的一种基于多源特征提取的设备故障诊断模型的构建方法，利用预先构建的样本集进行分类器训练，其中，样本集中包括初始样本和生成样本，可以解决样本不平衡问题。而且，本发明实施例还对样本集进行特征提取，利用深度神经网络进行特征选择和降维，自动学习到更高级别的特征表示，以得到基于时序特征的目标特征，该目标特征可以使分类器精确识别故障类型，从而在分类器训练结束，得到对应的故障诊断模型后，可以通过该故障诊断模型对目标设备进行精准分类，保证分类的稳定性及识别精度。

进一步的，本发明实施例还提供了另一种基于多源特征提取的设备故障诊断模型的构建方法，该方法在于介绍本发明实施例的样本集的构建过程。其中，图2示出了本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建方法的流程图，如图2所示，该方法包括如下步骤：

步骤S202，获取预先采集的设备历史故障数据，并将设备历史故障数据确定为初始样本。

基于上述实施例，本实施例所采用的数据集中的数据由传感器采集得到，包括多种数据。此外，由于本实施例所采用的数据存在非结构化数据，因此，本发明实施例还对初始样本中的部分数据进行向量化处理，其中，可以采用word2vector算法对数据进行向量化处理，以满足这些数据能用于后续模型的输入格式要求。

步骤S204，根据初始样本对应的样本标签，确定目标样本标签对应的目标初始样本。

步骤S206，基于目标初始样本对应的近邻样本，确定待生成样本，并按照预设的样本生成方式生成初始样本对应的初始生成样本。

为解决初始样本的不平衡问题，本发明实施例还使用样本生成的方式进行数据均衡。具体地，本发明实施例通过改进SMOTE插值法进行样本生成。

在具体实现时，本发明实施例使用SMOTE生成新样本，其中，本发明实施例根据初始样本对应的样本标签确定目标初始样本，如，选择一个少数类样本，该少数类样本为训练样本（也即初始样本）中样本数量相对较少的类别中的样本，也即，该少数类样本a则是上述目标初始样本。

之后，在少数类样本a（也即目标初始样本）的个最近邻样本中随机选择一个样本（也即待生成样本），然后生成新样本/>（也即初始生成样本）。其中，最近邻样本的判定方式为基于样本之间的欧几里得距离作为近邻评估指标，其中距离计算在利用主成分分析法降维后的低维空间中进行计算。

基于此，本发明实施例在生成初始生成样本时，先对初始样本和目标初始样本进行降维处理，在降维处理的低维空间中，计算初始样本相对于目标初始样本的欧几里得距离。

具体的，本发明实施例使用主成分分析法将原始数据（也即初始样本，以及目标初始样本）降维到一个较低的维度（如2维或3维)，然后在这个降维后的空间中进行距离计算。在距离计算完成后，使用主成分分析法的逆变换将新样本映射回原始的特征空间。

具体的，假设主成分分析法降维的变换矩阵为，少数类样本/>，那么降维后的数据可以使用以下公式表示：

计算完成欧几里得距离后，再使用的逆变换/>将/>映射回原始特征空间得到，可以使用以下公式表示：

之后，根据欧几里得距离，以及预设的近邻控制因子，确定目标初始样本对应的多个近邻样本。其中，近邻数为动态调整的参数，其确定方式可以使用以下公式表示：

其中，是样本/>到所有样本的平均距离，/>是最小的k近邻数，/>是控制因子，由人为设置。对于分布密集的区域，增加/>近邻数，使得生成的样本更多地聚集在该区域；对于分布稀疏的区域，减少k近邻数，使得生成的样本更加分散。/>是样本/>到所有样本的平均距离，反映了样本/>所在区域的分布密度。

是一个控制因子，也即近邻控制因子，用于调整k近邻数的调整幅度。/>是最小的k近邻数，保证了即使在分布极其稀疏的情况下，也能保证有一定数量的近邻样本。引入动态调整k近邻数的策略，使得生成的样本能更好地适应数据的分布情况，从而提高样本扩充的效果。

之后，从多个近邻样本中确定待生成样本，并根据预设的样本生成参数和待生成样本，生成目标初始样本对应的初始生成样本。在具体实现时，新样本（也即初始生成样本）的生成方式可以使用以下公式表示：

其中，是0到1之间的随机数，/>为上述预设的样本生成参数。

步骤S208，基于初始生成样本对应于目标初始样本的相似度，确定保留的初始生成样本，并将保留的初始生成样本确定为目标初始样本对应的生成样本。

其中，生成的初始生成样本并非全部保留，对此，本发明实施例还对新生成的初始生成样本进行修正，具体的，将新生成的样本（也即初始生成样本）通过调整得到修正样本，其中，本发明实施例根据预设的最优样本，对初始生成样本进行修正，确定修正样本；最优样本根据目标初始样本对应的相似度确定。调整的方式可以使用以下公式表示：

其中，为上述修正样本，/>是目前为止最优样本，最优的评价标准为新生成的样本与少数类样本的相似度最高，/>是引导样本向/>移动的速度因子，其确定方式可以使用以下公式表示：

其中，为迭代次数，/>为样本/>到目前为止最优样本/>的距离，/>是一个微小的常数，避免分母为0。速度因子/>的设置方式考虑在迭代过程的早期，当距离最优解较远时，速度因子较大，有更大的调整幅度；在迭代过程的后期，当接近最优解时，速度因子较小，调整幅度减小，从而实现更稳定的收敛。

之后，还对修正样本进行概率校验，从而按照概率校验对结果确定保留对修正样本。在具体实现时，对修正样本进行概率校验的方式为基于贝叶斯决策理论的概率校验，贝叶斯决策理论的定义如下：

其中，是在事件B发生的条件下事件/>发生的概率，称为后验概率；是在事件/>发生的条件下事件/>发生的概率，称为条件概率；/>和/>是事件和事件/>发生的概率，称为先验概率。

其中，本发明实施例根据预先确定的修正样本对应的样本类别，以及预设的惩罚项，对修正样本进行概率校验，确定后验概率结果。具体的，将事件/>看作修正样本/>，事件/>看作修正样本/>属于类别/>，修正样本/>属于类别/>的判定方式由预设的随机森林分类器进行分类得到，类别/>为预先确定的修正样本对应的样本类别，对修正样本/>进行概率校验可以使用以下公式表示：

其中，是在类别/>下修正样本/>的后验概率，/>是修正样本/>在类别/>下的条件概率，/>是修正样本/>的先验概率，/>是类别/>的先验概率，/>是惩罚项。后验概率、条件概率、先验概率均可以通过预设的随即森林分类时的预测概率向量得到。

其中，惩罚项的计算方式可以使用以下公式表示：

其中，惩罚项根据修正样本和目标初始样本的距离确定，是惩罚系数，用于调整惩罚项的权重；/>是修正样本/>到少数类样本集合/>的最远距离，当修正样本/>偏离少数类样本集合/>过远时，/>较大，进一步导致惩罚项/>较大，从而避免与少数类样本偏离较大的样本被生成。

之后，根据概率修正的结果，选择保留或者丢弃新生成的样本。其中，通过判断后验概率结果是否满足预先确定的概率阈值；如果是，保留初始生成样本。具体的，根据后验概率的大小决定是否保留修正样本/>。如果/>大于阈值/>，则保留修正样本/>作为新生成的样本加入少数类样本/>所在的类别，否则丢弃。

其中，阈值的设置为动态阈值调整策略方式。对于修正样本/>，其到少数类样本集合/>的平均距离记为/>，阈值/>调整的方式可以使用以下公式表示：

其中，是一个调整因子，/>是最小阈值，/>和/>均由人为设置。

动态阈值调整策略可以使得对新生成的样本的接受程度根据其与少数类样本的距离进行动态调整，从而更好地保留有用的样本，避免产生无效的样本。当新生成的样本离少数类样本集合/>近时，阈值较小，更可能接受/>；当/>离/>远时，阈值较大，更可能拒绝/>。/>是/>到/>的平均距离，反映了/>是否位于少数类样本的集中区域。/>是一个调整因子，用于调整阈值的调整幅度。/>是最小阈值，保证了阈值不会过小。

本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建方法，使用样本生成的方式对初始样本进行数据均衡，可以解决初始样本不平衡的问题。而且，基于k近邻样本生成初始生成样本，并通过概率校验确定保留的初始生成样本，能够更好的保留有用的样本，保证样本集的质量。

进一步地，在上述实施例的基础上，本发明实施例还提供了另一种基于多源特征提取的设备故障诊断模型的构建方法，图3示出了本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建方法的流程图，如图3所示，该方法包括以下步骤：

步骤S302，获取预先构建的样本集。

获取到预先构建的样本集后，可以理解的是，实际任务中的数据往往是残缺的、有噪声的、不一致的。针对这种情况，本实施例通过以下数据处理方式，对传感器采集得到的数据及生成后的数据进行清洗和纠正：

缺失值的处理。数据丢失是运行数据采集过程中最常见的问题。在设备数据采集过程中，会出现一些传感器测量点不能正常工作的情况，从而导致收集到的设备数据部分丢失。这时，需要根据数据的重要性采取不同的措施，如插值、删除等。

异常数据的处理。由于采集到的设备数据的传感器故障或其他原因，上传数据中可能存在一些不合理的数据。本发明中对异常数据进行删除操作。

数据的归一化。设备数据包括很多类型，由于收集的数据有不同的数值范围和取值范围，因此需要进行归一化操作，以更好地反映设备数据和故障诊断结果之间的关系，并减小不同的量级给设备故障诊断结果带来的影响。因此，本实施例采用极差标准化方法对数据进行归一化：

其中，、/>分别表示同一组数据样本中的最小值和最大值，/>表示输入的数据，/>表示归一化后的数据。

对样本集进行上述预处理后，本发明实施例中还将预处理后的样本集进行特征提取。其中，样本集中包括多个特征参数，如上述采煤机的每一种运行状态均包括的个特征参数，针对这些特征参数，本发明实施例首先将样本集的特征参数拆分为时序特征和非时序特征，然后针对时序特征在时域上提取其基本特征，然后针对时序特征应用短时傅里叶变换转换到频域进行特征提取，然后针对时序特征引入神经网络进行特征选择和降维，最后将特征选择和降维后的时序特征与非时序特征进行特征融合作为特征提取后的样本特征。在具体实现时，以上步骤作为特征提取模型构建方法使用，特征提取模型构建方法可分为以下子步骤：

步骤S304，将样本集的特征参数分为时序特征和非时序特征。

步骤S306，针对时序特征的时间序列，确定时序特征对应的时域特征。

时域特征提取，针对时序特征的时间序列，在时域上提取平均值/>、标准差/>、偏度/>和峭度/>这4个时域特征，方式可以分别使用以下公式表示：

其中，为序列长度，/>为第/>处时域特征值。

步骤S308，将时间序列应用短时傅里叶变换，确定时序特征对应的频域特征。

得到时序特征对应的时域特征后，还进行频域特征提取，其中，将时间序列应用短时傅里叶变换，得到频谱/>，在频域上提取谱质心/>、谱扩散/>、谱倾斜和谱峭度/>这4个频域特征，方式可以分别使用以下公式表示：/>

其中，为第/>处频域所对应的时域，/>为/>时域的特征值。

步骤S310，通过预设的神经网络对时域特征和频域特征进行特征选择和降维处理，得到时序特征对应的特征表示。

其中，针对提取的时频域特征（时域特征和频域特征），通过预设的神经网络进行特征选择和降维，具体的，利用深度神经网络进行特征选择和降维，该特征选择和降维方法能够自动学习到更高级别的特征表示。

在具体实现时，将时域特征和频域特征确定为特征向量，通过神经网络对特征向量映射处理，得到映射特征。其中，神经网络包括预先确定的神经网络参数，神经网络参数通过反向传播算法和梯度下降法优化得到。

假设经过时域和频域特征提取后得到的特征向量为，设计一个神经网络/>进行特征选择和降维，其中，/>表示神经网络的参数，为上述预先确定的神经网络参数。则神经网络的输出为/>，神经网络的输出为经过特征选择和降维后的新特征。

在具体实现时，神经网络进行特征选择和降维的过程看作是一个函数映射过程，给定一个维的特征向量/>，神经网络/>通过一系列的线性变换和非线性激活函数，将/>映射到一个新的特征空间，得到新的特征/>，也即上述映射特征：

其中，表示神经网络的参数，通过反向传播算法和梯度下降法进行优化。

进一步地，考虑到设备故障诊断数据中可能存在的关键局部特征对于整体故障诊断的重要性，本发明实施例还引入自注意力机制在特征提取阶段进行局部特征的提取和加权，帮助模型关注到数据中更有信息的部分，进一步提升特征提取的质量。

在具体实现时，通过预设的得分函数，确定映射特征对应的注意力权重。具体的，将特征（映射特征）表示为/>，其中/>代表第/>个隐藏单元的输出，通过自注意力机制，计算每个隐藏单元的注意力权重，计算方式可以使用以下公式表示：/>

其中是得分函数，表示为/>。/>计算第/>个隐藏单元的得分的指数，然后通过归一化，得到每个隐藏单元的注意力权重/>，这样得分较高的隐藏单元将会有较大的权重。

进一步地，根据注意力权重对映射特征进行加权，并通过神经网络对加权的映射特征进行特征提取，得到时序特征对应的特征表示。其中，通过注意力权重计算加权后的特征/>，计算方式可以使用以下公式表示：

通过注意力权重对隐藏单元的输出/>进行加权，得到加权后的特征/>，该方式使得权重较大的隐藏单元(即更有信息的部分)将会在/>中占据较大的比例。

在具体实现时，在神经网络的训练过程中，设定一个目标函数，具体的，目标函数为均方误差/>函数，通过优化/>，使得神经网络能够学习到更有效的特征表示。

步骤S312，将特征表示和非时序特征进行特征融合，得到基于时序特征的目标特征。

具体的，本发明实施例将特征选择和降维后的时序特征（也即上述特征表示）与非时序特征进行特征融合，作为特征提取后的样本特征，得到基于时序特征的目标特征。融合方式可以使用以下公式表示：

其中，为特征级联操作，/>为融合后特征，也即基于时序特征的目标特征，/>为非时序特征，其中，特征融合过程在于实现多源数据融合，提高数据质量。

步骤S314，将基于时序特征的目标特征和目标特征对应的样本标签输入至预先设置的分类器中，通过分类器的转换函数确定目标特征对应的隐藏层输出。

得到目标特征后，利用分类器根据目标特征及其样本标签进行样本分类训练，预测设备故障诊断类型，本发明实施例中将特征提取后的数据，也即包含提取的目标特征的样本集进行故障分类，所采用分类器为改进的极限学习机分类器。具体地，利用极限学习机分类器进行样本分类的方法可分为以下子步骤：

首先进行分类器模型初始化，定义特征提取后的数据以特征值和标签的形式进行表示，即/>，其中/>为分类器的输入向量，/>为/>对应的目标输出，/>为输入至分类器中的样本数量。

初始化极限学习机分类器隐藏层的权重和偏置/>，初始化方式为随机设置。

之后进行隐藏层转换，对于每个输入，通过隐藏层的转换函数计算得到隐藏层的输出/>,可以使用以下公式表示：

其中，是Sigmoid激活函数。

步骤S316，基于隐藏层输出，以及预设的输出层权重和输出层偏置，计算隐藏层输出对应的神经元参数。

得到隐藏层输出后，再进行输出层计算，其中，通过隐藏层的输出，计算每个输出神经元的参数。假设输出神经元的数量为/>个，对于每个输出神经元/>，计算其输出的均值/>、标准差/>和权重/>，也即神经元参数。可以使用以下公式表示：

其中，、/>、/>是输出层的权重，/>、/>、/>是输出层的偏置。

步骤S318，基于神经元参数，确定分类器的目标函数对应的预测分类结果。

步骤S320，判断预测分类结果是否满足预设的函数输出阈值，如果否，根据预设的学习率，对输出层权重和输出层偏置进行参数更新。

得到神经元参数后，本发明实施例利用该神经元参数确定分类器的目标函数，进而确定预测分类结果。其中，在求解目标函数的过程中，还需要进行目标函数和权重更新，以确定训练准确的预测分类结果。

在具体实现时，本发明实施例通过最小化负对数似然函数来学习模型的参数，可以使用以下公式表示：

其中，是输入为/>时输出神经元的权重，/>是输入为/>时输出神经元的标准差，/>是正则化系数，控制正则化的强度，/>是二范数，表示均值为/>、标准差为/>的正态分布。/>

步骤S322，直到预测分类结果满足预设的函数输出阈值时，将包含当前输出层权重和输出层偏置的分类器确定为故障诊断模型。

其中，在求解目标函数的过程中，本发明实施例使用梯度下降法进行参数的更新。分别求出目标函数关于输出层权重/>和偏置/>的梯度，更新方式可以使用以下公式表示：

其中，是学习率，学习率为自适应调整的方式进行改变，可以使用以下公式表示：

其中，是第/>次迭代的学习率，/>是第/>次迭代的学习率，/>是一个预设的衰减因子，/>是迭代次数。本发明实施例通过不断迭代，直到达到预定的迭代次数或目标函数的改变小于某个阈值时，迭代停止。迭代停止后，将包含当前输出层权重和输出层偏置的分类器确定为故障诊断模型，该故障诊断模型用于对设备的待测数据进行故障诊断。

本发明实施例中对极限学习机分类器的方法将输出的确定性变换为概率密度的表达，增强了模型的判断能力。同时，利用极限学习机的快速学习能力，减少了模型的训练时间。

本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建方法，利用深度神经网络对提取的是频域特征进行特征选择和降维，该特征选择和降维方法能够自动学习到更高级别的特征表示。此外，本发明实施例还考虑设备故障诊断数据中可能存在的关键局部特征对于整体故障诊断的重要性，本发明实施例还引入自注意力机制在特征提取阶段进行局部特征的提取和加权，帮助模型关注到数据中更有信息的部分，进一步提升特征提取的质量。而且，本发明实施例利用极限学习机分类器进行分类训练，将输出的确定性变换为概率密度的表达，增强了模型的判断能力。同时，利用极限学习机的快速学习能力，减少了模型的训练时间，基于此，本发明实施例可以提高设备故障诊断的分类精度。

进一步地，本发明实施例还提供了一种基于多源特征提取的设备故障诊断方法，图4示出了本发明实施例提供的一种基于多源特征提取的设备故障诊断方法的流程图，如图4所示，该方法包括以下步骤：

步骤S402，获取目标设备的待测数据。

步骤S404，根据预先确定的目标特征，从待测数据中确定目标待测参数。

当对设备进行故障诊断时，先获取目标设备的待测数据，之后根据预先确定的目标特征，如，根据步骤S304-步骤312提取的目标特征确定待测数据对应的目标待测参数，以使预先构建的故障诊断模型对目标待测参数进行故障诊断。该故障诊断模型为基于上述基于多源特征提取的设备故障诊断模型的构建方法构建得到的。其中，上述步骤S304-S312可以作为特征提取模型的构建，故，可以利用构建的特征提取模型对待测数据进行特征提取，确定目标待测参数。

步骤S406，将目标待测参数输入至预先构建的故障诊断模型中，确定目标待测参数对应的神经元参数。

步骤S408，基于目标待测参数对应的神经元参数，确定目标待测参数对应于多个故障类别的设备故障概率，并根据设备故障概率，确定待测数据的设备故障类别。

在设备故障诊断的过程中，输入目标设备的数据（如包含目标待测参数的待测数据），计算出每个组件的参数/>、/>和/>，也即对应的神经元参数，然后计算出对应的设备故障概率，计算方式可以使用以下公式表示：

其中，是输入为/>时的输出神经元权重，/>表示输入为/>时输出神经元的标准差，/>表示输入为/>时均值为/>、标准差为的正态分布。

然后，选择概率最大的故障类型作为预测结果，以确定待测数据的设备故障类别。

步骤S410，基于设备故障类别对目标设备进行故障诊断。

确定对应的预测结果后，根据该预测结果对该目标设备进行故障诊断，以确定目标设备的故障情况。

本发明实施例提供的一种基于多源特征提取的设备故障诊断方法，通过利用上述基于多源特征提取的设备故障诊断模型的构建方法构建的故障诊断模型对目标设备的待测数据进行故障诊断，其中，本发明实施例的一种基于多源特征提取的设备故障诊断方法，与上述实施例提供的一种基于多源特征提取的设备故障诊断模型的构建方法具有相同的技术特征，所以也能解决相同的技术问题，达到相同的技术效果。

进一步地，本发明实施例还提供一种基于多源特征提取的设备故障诊断模型的构建装置，图5示出了本发明实施例提供的一种基于多源特征提取的设备故障诊断模型的构建装置的结构示意图，如图5所示，该装置包括：

样本获取模块100，用于获取预先构建的样本集；样本集中包括初始样本和初始样本对应的生成样本；初始样本包括样本标签，样本标签用于表征设备的故障类型；

样本处理模块200，用于对样本集进行特征提取，得到基于时序特征的目标特征；

执行模块300，用于将基于时序特征的目标特征和目标特征对应的样本标签输入至预先设置的分类器中，通过分类器对样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型。故障诊断模型用于对设备的待测数据进行故障诊断。

本发明实施例的一种基于多源特征提取的设备故障诊断模型的构建装置，与上述实施例提供的一种基于多源特征提取的设备故障诊断模型的构建方法具有相同的技术特征，所以也能解决相同的技术问题，达到相同的技术效果。

进一步的，本发明实施例还提供了另一种基于多源特征提取的设备故障诊断模型的构建装置，图6示出了本发明实施例提供的另一种基于多源特征提取的设备故障诊断模型的构建装置的结构示意图，如图6所示，该装置还包括样本扩充模块400，用于获取预先采集的设备历史故障数据，并将设备历史故障数据确定为初始样本；根据初始样本对应的样本标签，确定目标样本标签对应的目标初始样本；基于目标初始样本对应的近邻样本，确定待生成样本，并按照预设的样本生成方式生成初始样本对应的初始生成样本；基于初始生成样本对应于目标初始样本的相似度，确定保留的初始生成样本，并将保留的初始生成样本确定为目标初始样本对应的生成样本。

上述样本扩充模块400，还用于对初始样本和目标初始样本进行降维处理，在降维处理的低维空间中，计算初始样本相对于目标初始样本的欧几里得距离；根据欧几里得距离，以及预设的近邻控制因子，确定目标初始样本对应的多个近邻样本；从多个近邻样本中确定待生成样本；根据预设的样本生成参数和待生成样本，生成目标初始样本对应的初始生成样本。

上述样本扩充模块400，用于根据预设的最优样本，对初始生成样本进行修正，确定修正样本；最优样本根据目标初始样本对应的相似度确定；根据预先确定的修正样本对应的样本类别，以及预设的惩罚项，对修正样本进行概率校验，确定后验概率结果；惩罚项根据修正样本和目标初始样本的距离确定；判断后验概率结果是否满足预先确定的概率阈值；如果是，保留初始生成样本。

上述样本处理模块200，还用于将样本集的特征参数分为时序特征和非时序特征；针对时序特征的时间序列，确定时序特征对应的时域特征；将时间序列应用短时傅里叶变换，确定时序特征对应的频域特征；通过预设的神经网络对时域特征和频域特征进行特征选择和降维处理，得到时序特征对应的特征表示；将特征表示和非时序特征进行特征融合，得到基于时序特征的目标特征。

上述样本处理模块200，还用于将时域特征和频域特征确定为特征向量，通过神经网络对特征向量映射处理，得到映射特征；神经网络包括预先确定的神经网络参数，神经网络参数通过反向传播算法和梯度下降法优化得到；通过预设的得分函数，确定映射特征对应的注意力权重；根据注意力权重对映射特征进行加权，并通过神经网络对加权的映射特征进行特征提取，得到时序特征对应的特征表示。

上述执行模块300，还用于将基于时序特征的目标特征和所述目标特征对应的样本标签输入至预先设置的分类器中，通过分类器的转换函数确定目标特征对应的隐藏层输出；基于隐藏层输出，以及预设的输出层权重和输出层偏置，计算隐藏层输出对应的神经元参数；基于神经元参数，确定分类器的目标函数对应的预测分类结果；判断预测分类结果是否满足预设的函数输出阈值，如果否，根据预设的学习率，对输出层权重和输出层偏置进行参数更新；直到预测分类结果满足预设的函数输出阈值时，将包含当前输出层权重和输出层偏置的分类器确定为故障诊断模型。

进一步的，本发明实施例还提供一种基于多源特征提取的设备故障诊断装置，图7示出了本发明实施例提供的一种基于多源特征提取的设备故障诊断装置的结构示意图，如图7所示，该装置包括：

数据获取模块10，用于获取目标设备的待测数据。

参数确定模块20，用于根据预先确定的目标特征，从待测数据中确定目标待测参数。

数据处理模块30，用于将目标待测参数输入至预先构建的故障诊断模型中，确定目标待测参数对应的神经元参数。

输出模块40，用于基于目标待测参数对应的神经元参数，确定目标待测参数对应于多个故障类别的设备故障概率，并根据设备故障概率，确定待测数据的设备故障类别。

诊断模块50，用于基于设备故障类别对目标设备进行故障诊断。其中，故障诊断模型为基于上述基于多源特征提取的设备故障诊断模型的构建方法构建得到的。

本发明实施例提供的一种基于多源特征提取的设备故障诊断装置，与上述实施例提供的一种基于多源特征提取的设备故障诊断模型的构建方法具有相同的技术特征，所以也能解决相同的技术问题，达到相同的技术效果。

本发明实施例还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述图1至图4所示的方法的步骤。

本发明实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，计算机程序被处理器运行时执行上述图1至图4所示的方法的步骤。

本发明实施例还提供了一种电子设备的结构示意图，如图8所示，为该电子设备的结构示意图，其中，该电子设备包括处理器81和存储器80，该存储器80存储有能够被该处理器81执行的计算机可执行指令，该处理器81执行该计算机可执行指令以实现上述图1至图4所示的方法。

在图8示出的实施方式中，该电子设备还包括总线82和通信接口83，其中，处理器81、通信接口83和存储器80通过总线82连接。

其中，存储器80可能包含高速随机存取存储器（RAM，Random Access Memory），也可能还包括非易失性存储器（non-volatile memory），例如至少一个磁盘存储器。通过至少一个通信接口83（可以是有线或者无线）实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线82可以是ISA（Industry StandardArchitecture，工业标准体系结构）总线、PCI（Peripheral Component Interconnect，外设部件互连标准）总线或EISA（Extended Industry Standard Architecture，扩展工业标准结构）总线等，还可以是AMBA（Advanced Microcontroller Bus Architecture，片上总线的标准）总线，其中，AMBA定义了三种总线，包括APB（Advanced Peripheral Bus）总线、AHB（Advanced High-performance Bus）总线和AXI（Advanced eXtensible Interface）总线。总线82可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器81可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器81中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器81可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital SignalProcessor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器81读取存储器中的信息，结合其硬件完成前述图1至图4任一所示的方法。

本发明实施例所提供的一种基于多源特征提取的设备故障诊断模型的构建方法及装置的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于多源特征提取的设备故障诊断模型的构建方法，其特征在于，所述方法包括：

获取预先构建的样本集；所述样本集中包括初始样本和所述初始样本对应的生成样本；所述初始样本包括样本标签，所述样本标签用于表征设备的故障类型；

对所述样本集进行特征提取，得到基于时序特征的目标特征；

将基于时序特征的目标特征和所述目标特征对应的样本标签输入至预先设置的分类器中，通过所述分类器对所述样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型；

所述故障诊断模型用于对设备的待测数据进行故障诊断。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取预先采集的设备历史故障数据，并将所述设备历史故障数据确定为初始样本；

根据所述初始样本对应的样本标签，确定目标样本标签对应的目标初始样本；

基于所述目标初始样本对应的近邻样本，确定待生成样本，并按照预设的样本生成方式生成所述初始样本对应的初始生成样本；

基于所述初始生成样本对应于所述目标初始样本的相似度，确定保留的初始生成样本，并将保留的所述初始生成样本确定为所述目标初始样本对应的生成样本。

3.根据权利要求2所述的方法，其特征在于，所述基于所述目标初始样本对应的近邻样本，确定待生成样本，并按照预设的样本生成方式生成所述初始样本对应的初始生成样本的步骤，包括：

对所述初始样本和所述目标初始样本进行降维处理，在所述降维处理的低维空间中，计算所述初始样本相对于所述目标初始样本的欧几里得距离；

根据所述欧几里得距离，以及预设的近邻控制因子，确定所述目标初始样本对应的多个近邻样本；

从多个所述近邻样本中确定待生成样本；

根据预设的样本生成参数和所述待生成样本，生成所述目标初始样本对应的初始生成样本。

4.根据权利要求2所述的方法，其特征在于，所述基于所述初始生成样本对应于所述目标初始样本的相似度，确定保留的初始生成样本的步骤，包括：

根据预设的最优样本，对所述初始生成样本进行修正，确定修正样本；所述最优样本根据所述目标初始样本对应的相似度确定；

根据预先确定的所述修正样本对应的样本类别，以及预设的惩罚项，对所述修正样本进行概率校验，确定后验概率结果；所述惩罚项根据所述修正样本和所述目标初始样本的距离确定；

判断所述后验概率结果是否满足预先确定的概率阈值；

如果是，保留所述初始生成样本。

5.根据权利要求1所述的方法，其特征在于，所述样本集中包括多个特征参数；所述对所述样本集进行特征提取，得到基于时序特征的目标特征的步骤，包括：

将所述样本集的特征参数分为时序特征和非时序特征；

针对所述时序特征的时间序列，确定所述时序特征对应的时域特征；

将所述时间序列应用短时傅里叶变换，确定所述时序特征对应的频域特征；

通过预设的神经网络对所述时域特征和所述频域特征进行特征选择和降维处理，得到所述时序特征对应的特征表示；

将所述特征表示和所述非时序特征进行特征融合，得到基于时序特征的目标特征。

6.根据权利要求5所述的方法，其特征在于，所述通过预设的神经网络对所述时域特征和所述频域特征进行特征选择和降维处理，得到所述时序特征对应的特征表示的步骤，包括：

将所述时域特征和所述频域特征确定为特征向量，通过所述神经网络对所述特征向量映射处理，得到映射特征；所述神经网络包括预先确定的神经网络参数，所述神经网络参数通过反向传播算法和梯度下降法优化得到；

通过预设的得分函数，确定所述映射特征对应的注意力权重；

根据所述注意力权重对所述映射特征进行加权，并通过所述神经网络对加权的所述映射特征进行特征提取，得到所述时序特征对应的特征表示。

7.根据权利要求1所述的方法，其特征在于，将基于时序特征的目标特征和所述目标特征对应的样本标签输入至预先设置的分类器中，通过所述分类器对所述样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型的步骤，包括：

将基于时序特征的目标特征和所述目标特征对应的样本标签输入至预先设置的分类器中，通过所述分类器的转换函数确定所述目标特征对应的隐藏层输出；

基于所述隐藏层输出，以及预设的输出层权重和输出层偏置，计算所述隐藏层输出对应的神经元参数；

基于所述神经元参数，确定所述分类器的目标函数对应的预测分类结果；

判断所述预测分类结果是否满足预设的函数输出阈值，如果否，根据预设的学习率，对所述输出层权重和所述输出层偏置进行参数更新；

直到所述预测分类结果满足预设的函数输出阈值时，将包含当前所述输出层权重和所述输出层偏置的分类器确定为故障诊断模型。

8.一种基于多源特征提取的设备故障诊断方法，其特征在于，所述方法包括：

获取目标设备的待测数据；

根据预先确定的目标特征，从所述待测数据中确定目标待测参数；

将所述目标待测参数输入至预先构建的故障诊断模型中，确定所述目标待测参数对应的神经元参数；

基于目标待测参数对应的神经元参数，确定所述目标待测参数对应于多个故障类别的设备故障概率，并根据所述设备故障概率，确定所述待测数据的设备故障类别；

基于所述设备故障类别对所述目标设备进行故障诊断；

其中，所述故障诊断模型为基于权利要求1~7任一项所述的基于多源特征提取的设备故障诊断模型的构建方法构建得到的。

9.一种基于多源特征提取的设备故障诊断模型的构建装置，其特征在于，所述装置包括：

样本获取模块，用于获取预先构建的样本集；所述样本集中包括初始样本和所述初始样本对应的生成样本；所述初始样本包括样本标签，所述样本标签用于表征设备的故障类型；

样本处理模块，用于对所述样本集进行特征提取，得到基于时序特征的目标特征；

执行模块，用于将基于时序特征的目标特征和所述目标特征对应的样本标签输入至预先设置的分类器中，通过所述分类器对所述样本标签进行分类学习，并将分类学习的结果满足预设条件时的分类器确定为故障诊断模型；所述故障诊断模型用于对设备的待测数据进行故障诊断。

10.一种基于多源特征提取的设备故障诊断装置，其特征在于，所述装置包括：

数据获取模块，用于获取目标设备的待测数据；

参数确定模块，用于根据预先确定的目标特征，从所述待测数据中确定目标待测参数；

数据处理模块，用于将所述目标待测参数输入至预先构建的故障诊断模型中，确定所述目标待测参数对应的神经元参数；

输出模块，用于基于目标待测参数对应的神经元参数，确定所述目标待测参数对应于多个故障类别的设备故障概率，并根据所述设备故障概率，确定所述待测数据的设备故障类别；

诊断模块，用于基于所述设备故障类别对所述目标设备进行故障诊断；