CN115062678B

CN115062678B - 设备故障检测模型的训练方法、故障检测方法及装置

Info

Publication number: CN115062678B
Application number: CN202210995801.0A
Authority: CN
Inventors: 尹旭; 朱运恒; 包明明
Original assignee: Shandong Energy Shuzhiyun Technology Co ltd
Current assignee: Shandong Energy Shuzhiyun Technology Co ltd
Priority date: 2022-08-19
Filing date: 2022-08-19
Publication date: 2022-11-04
Anticipated expiration: 2042-08-19
Also published as: CN115062678A

Abstract

本申请涉及音频处理领域，提供了一种设备故障检测模型的训练方法、故障检测方法及装置。该方法获取不同故障设备的音频样本后，采用预设的选择插值SMOTE算法，对音频样本中少数类音频样本进行插值，得到相应新音频样本；对音频样本和新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵；采用训练好的梯度提升树，对各音频样本特征的特征值进行计算，得到各音频样本特征的重要度；基于音频样本和新音频样本对应的满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型。该方法提高了设备故障检测的准确性和检测效率。

Description

设备故障检测模型的训练方法、故障检测方法及装置

技术领域

本申请涉及音频处理领域，具体而言，涉及一种设备故障检测模型的训练方法、故障检测方法及装置。

背景技术

矿山机电设备的检测和故障分类对于保证煤矿安全生产具有重要作用，通常的矿山机电设备自身体积较大，在矿井下的分布范围较广，且长期处于潮湿、电磁振动、粉尘等环境中，给矿山机电设备的故障准确检测带来了一定难度。对于单个设备而言，设备故障状态的数据集采集较为繁琐，且不同故障类型的数据集存在不同程度的差异，尤其是针对设备声音特征数据获取中部分故障类别存在样本数量少，正负样本数量不均衡等问题，即正常声信号和故障声信号样本量存在较大差异。

当某一类或者某几类中的样本数量与其他类别的样本数量存在较大差异时，样本数量相对较多的类别则被称为多数类，而样本数量相对较少的类别则被称为少数类。使用不平衡的数据进行模型训练，会影响算法在模型拟合过程中对决策规则的学习，进而可能会导致少数类样本被多数类样本吞噬。因为，机器学习算法通常是通过在模型训练过程中不断优化奖励函数和代价函数来学习样本数据所体现的可能的潜在规则，而这些函数的计算结果与模型训练过程中所遇到的训练样本数量强相关，这会导致从不平衡的数据中学习到的决策规则很可能偏向于多数类样本，降低了设备故障检测的准确性。

发明内容

本申请实施例的目的在于提供一种设备故障检测模型的训练方法、故障检测方法及装置，用以解决现有技术存在的上述问题，提高了设备故障检测的准确性。

第一方面，提供了一种设备故障检测模型的训练方法，该方法可以包括：

获取不同故障设备的音频样本，所述音频样本为对采集的已知故障类别的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的，所述音频样本包括样本数量大于预设数量的多数类音频样本和样本数量小于预设数量的少数类音频样本；

采用预设的选择插值SMOTE算法，根据所述少数类音频样本的近邻分布信息，对所述少数类音频样本进行样本分类，得到不同类别的目标样本；并对所述不同类别的目标样本进行插值，得到所述不同类别的目标样本对应的新音频样本；

对所述音频样本和所述新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵，所述音频样本特征矩阵包括各音频样本特征、相应特征值和相应位置索引；

利用所述各音频样本特征，对梯度提升树进行训练，得到所述各音频样本特征的重要度和满足预设重要度条件的音频样本特征；

基于所述音频样本和所述新音频样本对应的满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型；所述预训练的支持向量机是基于除所述不同故障设备外的其他故障设备的音频样本训练好的向量机。

在一个可能的实现中，所述预处理包括预加重处理、加窗分帧处理和端点检测处理。

在一个可能的实现中，采用预设的选择插值SMOTE算法，根据所述少数类音频样本的近邻分布信息，对所述少数类音频样本进行样本分类，得到不同类别的目标样本，包括：

计算所述少数类音频样本中目标少数类音频样本的k个近邻的少数类音频样本，得到第一近邻样本集合，所述k为大于0的整数；以及，计算所述音频样本中目标少数类音频样本的k个近邻的音频样本，得到第二近邻样本集合，所述k为大于0的整数；其中，所述目标少数类音频样本为所述少数类音频样本中的任一少数类音频样本；

若所述第一近邻样本集合与所述第二近邻样本集合存在相同的音频样本，则确定所述目标少数类音频样本为目标样本；

当所述相同的音频样本的数量在第一数量区间内时，确定所述目标样本的类别为第一类别；

当所述相同的音频样本的数量在第二数量区间内时，确定所述目标样本的类别为第二类别。

在一个可能的实现中，所述方法还包括：

若所述第一近邻样本集合与所述第二近邻样本集合不存在相同的音频样本，则确定所述目标少数类音频样本为噪声样本。

在一个可能的实现中，对所述不同类别的目标样本进行插值，得到所述不同类别的目标样本对应的新音频样本，包括：

针对所述第一类别的任一目标样本，对该目标样本和所述第一近邻样本集合中的任意两个音频样本进行三角插值，得到新音频样本；

针对所述第二类别的任一目标样本，对该目标样本和所述第一近邻样本集合中的任意一个音频样本进行线性插值，得到新音频样本。

在一个可能的实现中，所述三角插值的表达式表示为：

；

其中，音频样本X_i(nn1)与X_i(nn2)表示所述第一近邻样本集合中的任意两个音频样本；rand(0,1)表示在0和1间取随机数；x_i表示所述第一类别的第i个目标样本；x_ij表示所述新音频样本。

在一个可能的实现中，对所述音频样本和所述新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵，包括：

将所述音频样本和所述新音频样本中的任一音频样本作为待处理音频样本，对该待处理音频样本进行初级特征提取，得到各第一音频样本特征和相应特征值；

对所述第一音频样本特征进行微分平滑处理，得到所述各第二音频样本特征和相应特征值；

采用预设特征统计函数，对该待处理音频样本中各帧音频样本对应的音频特征向量进行特征标准差计算，得到该待处理音频样本对应的全局统计特征的特征值；

基于该待处理音频样本的各第一音频样本特征的特征值、所述各第二音频样本特征的特征值和全局统计特征的特征值，得到该待处理音频样本对应的音频样本特征矩阵。

在一个可能的实现中，采用训练好的梯度提升树，对所述各音频样本特征的特征值进行计算之前，所述方法还包括：

在所述音频样本和所述新音频样本中，获取每个故障设备在不同故障类别的多个待计算的音频样本；

采用预设特征方差算法，基于各待计算的音频样本对应的各音频样本特征的特征值，计算所述各音频样本特征在不同故障类别间的方差；

若任一的音频样本特征的方差大于预设方差阈值，则确定该音频样本特征为对所述不同故障类别相关的音频样本特征；

若任一的音频样本特征的方差不大于预设方差阈值，则确定该音频样本特征为对所述不同故障类别无关的音频样本特征；

利用所述各音频样本特征，对梯度提升树进行训练，包括：

利用与所述不同故障类别相关的音频样本特征的特征值，对梯度提升树进行训练。

第二方面，提供了一种故障检测方法，该装置可以包括：

获取当前设备的待检测音频数据，所述待检测音频数据为对采集的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的；

对所述待检测音频数据进行特征提取，得到音频特征矩阵，所述音频特征矩阵包括各音频特征、相应特征值和相应位置索引；

利用所述各音频特征，对梯度提升树进行训练，得到所述各音频特征的重要度和满足预设重要度条件的音频特征；

将满足预设重要度条件的音频特征和相应位置索引，输入根据第一方面所述的训练完成的设备故障检测模型中，得到所述设备故障检测模型输出的故障类别。

在一个可能的实现中，获取当前设备的待检测音频数据之后，所述方法还包括：

对所述待检测音频数据中各帧音频数据进行处理，得到所述各帧音频数据对应的离散音频数据；

基于所述各帧音频数据对应的离散音频数据，计算得到所述各帧音频数据的幅值；

若所述各帧音频数据的幅值位于预设幅值阈值范围内，则确定所述待检测音频数据为初步故障数据，所述预设幅值阈值范围为预先配置的设备故障对应的幅值范围。

第三方面，提供了一种设备故障检测模型的训练装置，该装置可以包括：

获取单元，用于获取不同故障设备的音频样本，所述音频样本为对采集的已知故障类别的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的，所述音频样本包括样本数量大于预设数量的多数类音频样本和样本数量小于预设数量的少数类音频样本；

分类单元，用于采用预设的选择插值SMOTE算法，根据所述少数类音频样本的近邻分布信息，对所述少数类音频样本进行样本分类，得到不同类别的目标样本；

插值单元，用于对所述不同类别的目标样本进行插值，得到所述不同类别的目标样本对应的新音频样本；

提取单元，用于对所述音频样本和所述新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵，所述音频样本特征矩阵包括各音频样本特征、相应特征值和相应位置索引；

所述获取单元，还用于利用所述各音频样本特征，对梯度提升树进行训练，得到所述各音频样本特征的重要度和满足预设重要度条件的音频样本特征；

训练单元，用于基于满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型；所述预训练的支持向量机是基于除所述不同故障设备外的其他故障设备的音频样本训练好的向量机。

第四方面，提供了一种故障检测装置，该装置可以包括：

获取单元，用于获取当前设备的待检测音频数据，所述待检测音频数据为对采集的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的；

提取单元，用于对所述待检测音频数据进行特征提取，得到音频特征矩阵，所述音频特征矩阵包括各音频特征、相应特征值和相应位置索引；

所述获取单元，还用于利用所述各音频特征，对梯度提升树进行训练，得到所述各音频特征的重要度和满足预设重要度条件的音频特征；以及，将满足预设重要度条件的音频特征和相应位置索引，输入根据第一方面所述的训练完成的设备故障检测模型中，得到所述设备故障检测模型输出的故障类别。

第五方面，提供了一种电子设备，该电子设备包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第一方面中任一所述的方法步骤，或上述第二方面中任一项上所述的方法步骤。

第六方面，提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤，或上述第二方面中任一项上所述的方法步骤。

本申请提供的设备故障检测模型的训练方法获取不同故障设备的音频样本，音频样本为对采集的已知故障类别的音频信号进行预处理后得到的，音频样本包括样本数量大于预设数量的多数类音频样本和样本数量小于预设数量的少数类音频样本；采用预设的选择插值SMOTE算法，根据少数类音频样本的近邻分布信息，对少数类音频样本进行样本分类，得到不同类别的目标样本；并对不同类别的目标样本进行插值，得到不同类别的目标样本对应的新音频样本；对音频样本和新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵，音频样本特征矩阵包括各音频样本特征、相应特征值和相应位置索引；利用各音频样本特征，对梯度提升树进行训练，得到各音频样本特征的重要度和满足预设重要度条件的音频样本特征；基于音频样本和新音频样本对应的满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型；预训练的支持向量机是基于除不同故障设备外的其他故障设备的音频样本训练好的向量机。该方法通过对SMOTE算法进行改进，有效的降低了设备故障类别样本的不平衡程度，提高了设备故障检测的准确性。通过对音频特征的方差分析和重要度评估解决了冗余特征的筛除困难的问题，提高了模型检测故障类别的效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种设备故障检测模型的训练方法的流程示意图；

图2为本申请实施例提供的一种二维特征空间下SMOTE算法的示意图；

图3为本申请实施例提供的另一种二维特征空间下SMOTE算法的示意图；

图4为本申请实施例提供的一种故障检测方法的流程示意图；

图5为本申请实施例提供的一种设备故障检测模型的训练装置的结构示意图；

图6为本申请实施例提供的一种故障检测装置的结构示意图；

图7为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，并不是全部的实施例。基于本申请实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

机电设备声信号通常存在数据不平衡的问题，声信号的数据集中数据具有偏斜的类别分布，即正常声信号的样本量和故障声信号的样本量存在较大差异。当某一类或者某几类中的样本量与其他类别的样本量存在较大差异时，样本量相对较多的类别被称为多数类音频信号样本，而样本量相对较少的类别被称为少数类音频信号样本。使用不平衡的样本进行模型训练，会影响算法在模型拟合过程中对决策规则的学习，进而可能会导致少数类音频信号样本被多数类音频信号样本吞噬。因为，机器学习算法通常是通过在模型训练过程中不断优化奖励函数和代价函数来学习样本所体现的可能的潜在规则，而这些函数的计算结果与模型训练过程中所遇到的训练样本量强相关，这会导致从不平衡的数据中学习到的决策规则很可能偏向于多数类音频信号样本。且设备信号样本特征的特征集存在数据维数过高，会使得模型预测结果的偏差增加，还会导致模型变得愈加难以解释，模型容易出现过拟合现象，并且会增加模型的计算成本。

为了解决上述问题本申请通过改进的SMOTE算法进行训练样本中少数类音频信号样本的扩充，不仅解决了音频信号样本不平衡的问题，也克服了生成的新音频信号样本影响到多数类音频信号样本的空间分布的问题，提高了模型识别与检测故障信号的效率。以及，通过梯度提升树的音频特征选择方法对音频信号样本的音频特征的重要度进行评估，并根据重要度排序筛选出具有稳定表征能力的音频特征，从而训练设备故障检测模型，以实现该设备故障检测模型对检测故障的准确性。

以下结合说明书附图对本申请的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本申请，并不用于限定本申请，并且在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

图1为本申请实施例提供的一种设备故障检测模型的训练方法的流程示意图。如图1所示，该方法可以包括：

步骤S110、获取不同故障设备的音频样本。

其中，音频样本为对采集的已知故障类别的音频信号进行预处理后得到的。音频样本可以包括样本数量大于预设数量的多数类音频样本和样本数量小于预设数量的少数类音频样本。

具体实施中，由传感器采集已知故障类别的不同故障设备的音频信号，该音频信号为一段连续的音频序列，获取的音频样本为音频帧级信号。对采集的音频信号进行预处理，包括：

（1）预加重处理：在设备故障检测任务中，采集的音频信号需要满足信号处理的相应标准才能进行有效的数据分析。根据奈奎斯特采样定律，采样频率应该不小于原始音频信号频率的两倍，以防止信号失真。同时，采集完成后的音频信号在幅度上还并没有离散化，完成采样过程后需要再进行量化处理，设备运行音频信号波形的动态范围约为55dB，因此量化字长要取到10bit以上。考虑到设备运行过程中，从机器内部发出来的音频信号会有一定的衰减，机器内部零件和外壳的共同作用会使声音信号的800Hz以上的高频部分以6dB/倍频程的速度衰减，音频信号将发生变化，高频部分幅度会减小。为了消除这种效应，需要将音频信号的高频部分进行预加重处理。常用的预加重方法是用一个高通数字滤波器进行处理，其传递函数为：

；其中，

预加重处理后的信号，z为信号复频域变量，

表示预加重的权值，其取值范围在0.9-1之间。

（2）分帧加窗处理：设备运行的音频信号是一个连续、时变的信号，但是设备发出声音的部件震动具有周期性，短时间内发声部件的震动变化是平稳的，因此音频信号可以认为是短时平稳的信号，即设备运行声音信号具有短时不变特性。分帧过程是将一段连续的声音信号分割为短时的音频信号。为了消除帧起始和连续端的不连续性，分帧后的音频信号需要进行加窗处理，分帧加窗过程的一般表达式为：

其中，x(m)是采样信号，y(n)是加窗后的信号，

是窗函数，n表示音频信号的起始帧，m表示音频信号的终止帧，其表达式为：

其中，N为窗长，即相应帧长。它与采样周期T，窗口频率分辨率△f的关系为：

。信号采样周期一定时，窗口长度N越大，窗口频率分辨率△f越高，但音频信号的时间分辨率降低。一般设备如电机运转声音的频率在1000Hz左右，为满足后序设备故障检测与分类的要求，具体实施方案中，可以将窗口宽度N设置为256微秒，使分帧后每帧音频信号时间范围在20ms-30ms之间，从而保证帧长在两到三个周期内。

（3）端点检测处理：音频信号既包含了无声部分（如停顿）又包含了有声部分，而有声部分又包含了背景噪音等非声音信号，如何在一段音频信号中检测出用于分析处理的有声信号部分。端点检测可检测出音频信号中有效声音起止点，可以此剔除音频信号中的无效静音和环境噪音，降低无关信息对后续声音特征提取及频谱分析视图绘制造成的负面影响。

需要说明的是，上述预加重处理、加窗分帧处理和端点检测处理的三个预处理的顺序可以根据实际情况进行调整，本申请实施例在此不做限定。

经过上述预加重处理、加窗分帧处理和端点检测处理的音频信号，可得到音频样本。将任一音频样本的样本数量与预设数量进行比较，若该音频样本的样本数量大于预设数量，则认为该音频样本属于多数类音频样本；若该音频样本的样本数量不大于预设数量，则认为该音频样本属于少数类音频样本。

步骤S120、采用预设的选择插值SMOTE算法，对少数类音频样本进行插值，得到不同类别的目标样本对应的新音频样本。

具体实施中，根据少数类音频样本的近邻分布信息，对少数类音频样本进行样本分类，得到不同类别的目标样本。具体的，计算少数类音频样本中目标少数类音频样本的k个近邻的少数类音频样本，得到第一近邻样本集合，k为大于0的整数；以及，计算音频样本中目标少数类音频样本的k个近邻的音频样本，得到第二近邻样本集合，k为大于0的整数；其中，目标少数类音频样本为少数类音频样本中的任一少数类音频样本；

若第一近邻样本集合与第二近邻样本集合不存在相同的音频样本，则确定目标少数类音频样本为噪声样本。

若第一近邻样本集合与第二近邻样本集合存在相同的音频样本，则确定目标少数类音频样本为目标样本。其中，当相同的音频样本的数量在第一数量区间内时，确定目标样本的类别为第一类别；当相同的音频样本的数量在第二数量区间内时，确定目标样本的类别为第二类别。

之后，对不同类别的目标样本进行插值，得到不同类别的目标样本对应的新音频样本。具体的，针对第一类别的任一目标样本，对该目标样本和第一近邻样本集合中的任意两个音频样本进行三角插值，得到新音频样本；

针对第二类别的任一目标样本，对该目标样本和第一近邻样本集合中的任意一个音频样本进行线性插值，得到新音频样本。

其中，三角插值的表达式可以表示为：

；

式中，音频样本X_i(nn1)与X_i(nn2)表示第一近邻样本集合中的任意两个音频样本；rand(0,1)表示在0和1间取随机数；x_i表示第一类别的第i个目标样本；x_ij表示新音频样本。

在数据不平衡处理方法中，SMOTE是基于随机过采样算法的一种改进方案，由于随机过采样采取简单复制音频样本的策略来增加少数类音频样本，这样容易产生模型过拟合的问题。传统SMOTE的基本思想是根据近邻信息人工合成少数类的新音频样本，以少数类音频样本作为少数类样本，多数类音频样本作为多数类样本，少数类的新音频样本作为少数类新样本为例，传统SMOTE算法流程如下：

输入：少数类样本{x₁,x₂,…,x_T}，多数类样本数量M，近邻数k

输出：合成的少数类新样本

1：计算采样率N=（M-T）/T

2：for i=1,…,T do

3：在少数类样本中计算x_i的k个近邻（欧氏距离），记为x_i(near),near∈{1,…,k }

4： for j=1,…,N do

5：从k个近邻点中随机选择一个近邻样本x_i（nn）

6：生成一个0到1之间的随机数ζ，即ζ_i=rand(0,1)

7：合成新样本

8： end for

9：end for

10：return

个少数类新样本

上述传统SMOTE算法是一个二分类算法。SMOTE合成少数类的新音频样本主要利用的音频样本分布的近邻信息，对少数类音频样本中的每一个音频样本x_i,以欧氏距离为标准寻找在少数类音频样本中的k近邻点（即k近邻的少数类音频样本），在近邻点集合中随机选择一个近邻点，进行线性插值。如图2所示的二维少数类音频样本特征空间下SMOTE算法的示意图中，音频样本的分布情况下，图中少数类音频样本a，在对包括少数类音频样本b、c、e等近邻点随机选择进行线性插值后完成新音频样本点的合成，图中显示的合成样本点均为可能合成的新音频样本。图2比较直观地显示了在不平衡音频样本中SMOTE合成少数类音频样本的插值过程。同时可以从图中看出传统SMOTE算法应用的一些不足：少数类音频样本a与少数类音频样本b之间插值合成的新音频样本对多数类音频样本的决策空间产生了干扰，甚至新音频样本可能会与多数类音频样本重合，同理少数类音频样本b作为少数类音频样本c的近邻点，在对少数类音频样本c进行插值操作时也会出现相同的问题；同时少数类音频样本a与少数类音频样本e之间进行插值时，合成的音频样本点只能在少数类音频样本a与少数类音频样本e之间的连线上。

传统SMOTE算法对所有的少数类音频样本进行了插值操作，而这样处理在一定程度上会影响多数类音频样本的决策空间和识别率；同时传统SMOTE算法对少数类音频样本决策空间的扩展区间较为局限，这样会增大学习器对局部少数类音频样本过学习的风险。

基于以上问题，本申请对传统SMOTE算法做出了改进，在减小少数类合成音频样本对多数类音频样本决策空间影响的同时，尽可能的扩展少数类音频样本的决策空间，以少数类音频样本作为少数类样本，多数类音频样本作为多数类样本，少数类的新音频样本作为少数类新样本为例，改进的SMOTE算法流程如下：

输出：合成的少数类新样本

1：for i=1,…,T do

2：在少数类样本中计算x_i的k个近邻（欧氏距离），记为x_i(near),near∈{1,…,k}，近邻点集合记为

3：计算x_i在全部样本中的k个近邻（欧氏距离），近邻点集合记为

4：

5： if num=0 do

x_i标记为噪声样本，不参与采样操作

6：end for

7：计算采样率N=(M-T)/(T-n)

8：for i=1,…,T do

if 0<num<=k/2 do

x_i标记为目标样本

else k/2<num<=k do

x_i 标记为目标样本,且x_i∈Q

9： for j=1,…,N do

8： if x_i ∉Q do

从

中随机选择近邻样本x_i(nn)，合成样本:

else do

从

中随机选择两个近邻样本X_i(nn1)与X_i(nn2)，合成样本:

10： end for

11：end for

12：return

个少数类新样本

本申请改进的SMOTE算法也是一个二分类算法。该算法主要从目标样本区分和插值方式两方面对传统SMOTE算法进行了改进，首先，根据少数类样本的近邻分布，将少数类样本分成了三类：噪声样本、第一类别的目标样本、第二类别的目标样本，只对目标样本进行插值，从而构造少数类新样本；同时对不同区域的目标样本采用不同的插值方式：对第一类别的目标样本进行三角插值，对第二类别的目标样本进行线性插值。其中，第一类别的目标样本设置为属于范围Q内的目标样本，其中，范围Q可称为安全域，故范围Q内的目标样本可称为目标样本，第二类别的目标样本设置为不属于范围Q内的目标样本，故可称为非安全域目标样本。

如图3所示的二维特征空间下SMOTE算法的示意图。图中是在与图2中相同的音频样本分布下，对图中少数类音频样本a选取近邻点进行插值构造少数类新音频样本，少数类音频样本b直接被判为噪声样本点，不再参与后序的任何插值操作，避免了对多数类音频样本的决策空间的影响，针对图中少数类音频样本a、c不同的近邻分布，在二维特征空间下少数类音频样本a与近邻点的插值空间不再局限在连线上，区域扩展为三角区域，而少数类音频样本c存在近邻较少的少数类音频样本，依然采取线性插值方式，即在少数类音频样本c与其近邻点的连线区域内进行插值。

步骤S130、对音频样本和新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵。

其中，音频样本特征矩阵可以包括各音频样本特征、相应特征值和相应位置索引。

首先，将音频样本和新音频样本中的任一音频样本作为待处理音频样本，对该待处理音频样本进行初级特征提取，得到各第一音频样本特征和相应特征值；

第一音频样本特征可以包括基频相关特征、Mel倒谱系数相关特征、共振峰相关特征和响度相关特征。其中，基频相关特征有3个，可以包括平滑的基频轮廓线（F0finEnv）、最终基频候选的发声概率、平滑基频频率（F0final）。Mel倒谱系数相关特征有23个，可以包括0-14级梅尔倒谱系数（mfcc）、0-7级梅尔频带的对数功率（logMelFreqBand）。共振峰相关特征有8个，可以包括8个LPC系数的线谱对频率（lspFreq）。响度相关特征有1个，为归一化处理的响度（pcm_loudness）。

其次，对第一音频样本特征进行微分平滑处理，得到各第二音频样本特征和相应特征值。

具体的，通过设置固定窗口长度的平滑滤波器，对上述的各第一音频样本特征进行微分平滑处理，得到相应的一阶微分系数，基于各第一音频样本特征和相应的一阶微分系数，得到与该第一音频样本特征对应的第二音频样本特征和相应特征值。例如，若第一音频样本特征有35种，那么第二音频样本特征也有35种。

然后，采用预设特征统计函数，对该待处理音频样本中各帧音频样本对应的音频特征向量进行特征标准差计算，得到该待处理音频样本对应的全局统计特征的特征值。其中，预设特征统计函数可以表示为：

式中，T_sd表示某个待处理音频样本的全局统计特征的特征值，T_avg表示该待处理音频样本的特征平均值，

表示该待处理音频样本的音频特征向量，n_t为该待处理音频样本的帧数，m_t为帧序。

最后，基于该待处理音频样本的各第一音频样本特征的特征值、各第二音频样本特征的特征值和全局统计特征的特征值，得到该待处理音频样本对应的音频样本特征矩阵，即音频样本特征矩阵为一个音频样本特征集合。例如，若第一音频样本特征有35种，那么第二音频样本特征也有35种，故音频样本特征矩阵中包含71中特征的特征值。

步骤S140、利用各音频样本特征，对梯度提升树进行训练，得到各音频样本特征的重要度和满足预设重要度条件的音频样本特征。

高维的音频样本特征集合会占用较多的计算资源，同时过多的冗余及无关音频样本特征会对音频样本特征集合整体的表征能力造成极大影响，即冗余及无关的音频样本特征会影响相关故障类别的识别，增加故障检测分类器（或称设备故障检测模型）学习任务的难度。其中，梯度提升树是采用带有已知故障类别的音频样本的各音频样本特征对多棵CART回归树进行训练得到的。梯度提升树作为特征学习器，梯度提升树是一种经典的Boosting集成算法，通过迭代计算，将训练得到的各个弱学习器联合起来形成强学习器。基于梯度提升树的音频样本特征选择方法主要是通过建立多个基于分类回归树的弱分类器，在所集成的强学习器完成训练后，计算每次选择某个音频样本特征分裂非叶子节点时的信息增益，节点分裂时信息增益越大，该节点对应的音频样本特征的重要度越高。

具体实施中，对梯度提升树进行训练过程中，计算各音频样本特征在各节点分裂后的信息增益I，即各分裂节点的信息增益I，基于该信息增益I，计算音频样本特征矩阵中各音频样本特征在梯度提升树中单颗树中的重要度

。在一个例子中，音频样本特征f在每颗树中的重要度

可以表示为：

；其中，L为树的叶子节点数量，L-1即为树的非叶子节点数量，I代表节点分裂后的信息增益。

之后，获取各音频样本特征在每颗树中重要度的平均值。

将任一音频样本特征在每颗树中重要度的平均值确定为该音频样本特征的重要度

。重要度

可以表示为：

，其中N是回归树的数量。

进一步的，基于音频样本特征的重要度可将音频样本特征矩阵中各音频样本特征进行分类，得到与设备故障相关特征和与设备故障无关特征。其中，设备故障无关特征是当前样本条件下无故障关联能力的特征；设备故障相关特征是与故障类别相关性强的特征。

获取满足预设重要度条件的音频样本特征，具体可以为：设置重要度阈值，将计算得到的音频样本特征的重要度与该重要度阈值比较，将大于该重要度阈值的重要度对应的音频样本特征确定为与设备故障相关特征，即满足预设重要度条件的音频样本特征；将不大于该重要度阈值的音频样本特征确定为与设备故障无关特征，即不满足预设重要度条件的音频样本特征。

在一些实施例中，为了进一步降低音频样本特征的数量，可以在执行本步骤之前可以针对各音频样本特征是否与设备故障相关进行初步筛选。

具体的，在获取的音频样本和插值得到的新音频样本中，获取每个故障设备在不同故障类别的多个音频样本，并将其确定为待计算的音频样本；

采用预设特征方差算法，基于各待计算的音频样本对应的各音频样本特征的特征值，计算各音频样本特征在不同故障类别间的方差；

在一个例子中，预设特征方差算法的计算公式为：

其中，

为音频样本和新音频样本的样本数量，

为故障类别的数量，

为待计算的音频样本的样本数量，

为不同待计算的音频样本下第i个音频样本特征的特征值，

为各待计算的音频样本下第i个音频样本特征的平均特征值。

若任一音频样本特征的方差大于预设方差阈值，则确定该音频样本特征为对不同故障类别相关的目标音频样本特征，即初步筛选出的设备故障相关特征；若任一音频样本特征的方差不大于预设方差阈值，则确定该音频样本特征为对不同故障类别无关的音频样本特征，即初步筛选出的设备故障无关特征。

步骤S150、基于音频样本和新音频样本对应的满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型。

其中，预训练的支持向量机是利用迁移学习，采用于除不同故障设备外的其他故障设备（如不同型号的故障设备）的音频样本作为源域样本对待训练的支持向量机模型进行训练好的向量机模型。由于L2支持向量机的目标函数可导,并且对非线性可分数据样本的惩罚更大，故预训练的支持向量机可以为预训练的L2支持向量机。

具体实施中，采用音频样本和新音频样本对应的满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型。

进一步的，将支持向量机拓展应用到多分类问题中的做法是采用一对其余的策略。假设有N_e种故障类别的训练数据需要分类，我们需要独立训练N_e个支持向量机，训练时需要依次将故障类别为s的训练数据归为正类，其余的训练数据则归为负类。

图4为本申请提供的一种故障检测方法的流程示意图。如图4所示，该方法可以包括：

步骤S410、获取当前设备的待检测音频数据。

由传感器采集前设备的音频信号，并对采集的音频信号进行预加重处理、分帧加窗处理和端点检测处理的预处理后，得到待检测音频数据。

步骤S420、对待检测音频数据进行特征提取，得到音频特征矩阵。

音频特征矩阵可以包括各音频特征、相应特征值和相应位置索引。该步骤的具体实施方式可参考步骤S130，本申请在此不做赘述。

步骤S430、利用各音频特征，对梯度提升树进行训练，得到各音频特征的重要度和满足预设重要度条件的音频特征。

该步骤的具体实施方式可参考步骤S140，本申请在此不做赘述。

步骤S440、将满足预设重要度条件的音频特征和相应位置索引，输入训练完成的设备故障检测模型中，得到设备故障检测模型输出的故障类别。

其中，训练完成的设备故障检测模型为步骤S150训练出的模型，具体训练方式可参考步骤S150，本申请在此不做赘述。

在一些实施方式中，可以在获取当前设备的待检测音频数据之后进行设备故障初级筛选，即检查下当前设备是否存在故障，若检查出的初步故障数据为存在故障，则可进一步进行故障类型的检测，若检查出的初步故障数据为不存在故障，则可退出本申请的故障检测流程。设备故障初级筛选方式可以包括：

方式一：对待检测音频数据中各帧音频数据进行处理，得到各帧音频数据对应的离散音频数据；具体的，可应用傅里叶变换对各帧音频数据进行处理，得到各帧音频数据的离散音频数据，可表示为：

其中，N_c表示待检测音频数据中各帧音频数据的总帧长，

表示待检测音频数据（即音频帧级信号），X_d(k_c)表示帧序号为k_c的音频数据的离散音频数据，n_c表示帧序号，i表示虚数单位。

基于各帧音频数据对应的离散音频数据，计算得到各帧音频数据的幅值。其中可以采用公式

对各离散音频数据进行计算，得到各帧音频数据的幅值。

若各帧音频数据的幅值位于预设幅值阈值范围内，则确定待检测音频数据为初步故障数据，该预设幅值阈值范围为预先配置的设备故障对应的幅值范围。

或者，将每帧音频数据的频谱进行拼接，绘制成频谱分析视图，计算得到的幅值在图中用颜色来进行表示，其中，不同大小的幅值用不同的颜色来表示，例如，若目标幅值在（-80，-60）区间内，则用蓝色来表示；若目标幅值在（-60，-40）则用绿色来表示；…；若目标幅值在（0，20）则用黄色来表示；若目标幅值在（20，40）则用红色来表示。可以理解的是，按照幅值从小到达的顺序也可以以渐变的颜色来表示不同的幅值，本申请在此不做限定。

通过频谱分析视图进行设备故障的初步筛查，红色表示的幅值表明设备声音较为强烈，蓝色部分表明设备声音较为缓和。以电机为例，正常的设备声音信号相对规律，红色蓝色平稳分布；若待检测的音频数据为故障音频信号，则红色区域会明显偏多，即通过红色区域的大小对该设备状态进行初步故障判别。

可以理解的是，为了便于统计，可以在得到幅值后，将幅值进行归一化处理，得到归一化处理后的各帧音频数据的幅值，然后，对归一化处理后的幅值与预设幅值阈值进行比较或绘制频谱分析视图。

进一步的，在实际工业应用场景中，由于设备的状态与故障信息对工业生产具有重要作用，以智能化、数字化的方式进行数据系统记录，不仅在数据输入方面比较便捷，而且在输出方面可以有效进行数据搜索与查找，也有利于后期进行数据的统计分析，以图表形式直观立体地看出数据结构。为保证设备故障信息的真实性，在采用设备故障检测模型检测出当前设备的故障类别后，利用区块链将设备故障信息进行存储，确保了数据的可靠性和防丢失性能。其中，设备故障信息可以包括设备的音频信号、震动频率、设备状态以及故障诊断结果等数据。

与上述方法对应的，本申请实施例还提供一种设备故障检测模型的训练装置，如图5所示，该装置包括：

获取单元510，用于获取不同故障设备的音频样本，所述音频样本为对采集的已知故障类别的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的，所述音频样本包括样本数量大于预设数量的多数类音频样本和样本数量小于预设数量的少数类音频样本；

分类单元520，用于采用预设的选择插值SMOTE算法，根据所述少数类音频样本的近邻分布信息，对所述少数类音频样本进行样本分类，得到不同类别的目标样本；

插值单元530，用于对所述不同类别的目标样本进行插值，得到所述不同类别的目标样本对应的新音频样本；

提取单元540，用于对所述音频样本和所述新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵，所述音频样本特征矩阵包括各音频样本特征、相应特征值和相应位置索引；

获取单元510，还用于利用所述各音频样本特征，对梯度提升树进行训练，得到所述各音频样本特征的重要度和满足预设重要度条件的音频样本特征；

训练单元550，用于基于满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型；所述预训练的支持向量机是基于除所述不同故障设备外的其他故障设备的音频样本训练好的向量机。

本申请上述实施例提供的设备故障检测模型的训练装置的各功能单元的功能，可以通过上述各方法步骤来实现，因此，本申请实施例提供的设备故障检测模型的训练装置中的各个单元的具体工作过程和有益效果，在此不复赘述。

与上述方法对应的，本申请实施例还提供一种故障检测装置，如图6所示，该装置包括：

获取单元610，用于获取当前设备的待检测音频数据，所述待检测音频数据为对采集的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的；

提取单元620，用于对所述待检测音频数据进行特征提取，得到音频特征矩阵，所述音频特征矩阵包括各音频特征、相应特征值和相应位置索引；

所述获取单元610，还用于利用所述各音频特征，对梯度提升树进行训练，得到所述各音频特征的重要度和满足预设重要度条件的音频特征；

以及，将满足预设重要度条件的音频特征和相应位置索引，输入根据图5所述的训练完成的设备故障检测模型中，得到所述设备故障检测模型输出的故障类别。

本申请上述实施例提供的故障检测装置的各功能单元的功能，可以通过上述各方法步骤来实现，因此，本申请实施例提供的故障检测装置中的各个单元的具体工作过程和有益效果，在此不复赘述。

本申请实施例还提供了一种电子设备，如图7所示，包括处理器710、通信接口720、存储器730和通信总线740，其中，处理器710，通信接口720，存储器730通过通信总线740完成相互间的通信。

存储器730，用于存放计算机程序；

处理器710，用于执行存储器730上所存放的程序时，实现如下步骤：

获取不同故障设备的音频样本，所述音频样本为对采集的已知故障类别的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的，所述音频样本包括样本数量大于预设数量的多数类音频样本和样本数量小于预设数量的少数类音频样本；采用预设的选择插值SMOTE算法，根据所述少数类音频样本的近邻分布信息，对所述少数类音频样本进行样本分类，得到不同类别的目标样本；并对所述不同类别的目标样本进行插值，得到所述不同类别的目标样本对应的新音频样本；对所述音频样本和所述新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵，所述音频样本特征矩阵包括各音频样本特征、相应特征值和相应位置索引；利用所述各音频样本特征，对梯度提升树进行训练，得到所述各音频样本特征的重要度和满足预设重要度条件的音频样本特征；基于所述音频样本和所述新音频样本对应的满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型；所述预训练的支持向量机是基于除所述不同故障设备外的其他故障设备的音频样本训练好的向量机。或者，实现如下步骤：获取当前设备的待检测音频数据，所述待检测音频数据为对采集的音频信号进行预加重处理、加窗分帧处理和端点检测处理后得到的；对所述待检测音频数据进行特征提取，得到音频特征矩阵，所述音频特征矩阵包括各音频特征、相应特征值和相应位置索引；利用所述各音频特征，对梯度提升树进行训练，得到所述各音频特征的重要度和满足预设重要度条件的音频特征；将满足预设重要度条件的音频特征和相应位置索引，输入根据上述所述的训练完成的设备故障检测模型中，得到所述设备故障检测模型输出的故障类别。

上述提到的通信总线可以是外设部件互连标准（Peripheral ComponentInterconnect，PCI）总线或扩展工业标准结构（Extended Industry StandardArchitecture，EISA）总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器（Random Access Memory，RAM），也可以包括非易失性存储器（Non-Volatile Memory，NVM），例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器（Central Processing Unit，CPU）、网络处理器（Network Processor，NP）等；还可以是数字信号处理器（Digital SignalProcessing，DSP）、专用集成电路（Application Specific Integrated Circuit，ASIC）、现场可编程门阵列（Field-Programmable Gate Array，FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

由于上述实施例中电子设备的各器件解决问题的实施方式以及有益效果可以参见图1和图4所示的实施例中的各步骤来实现，因此，本申请实施例提供的电子设备的具体工作过程和有益效果，在此不复赘述。

在本申请提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的设备故障检测模型的训练方法或故障检测方法。

在本申请提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的设备故障检测模型的训练方法或故障检测方法。

本领域内的技术人员应明白，本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此，本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

本申请实施例中是参照根据本申请实施例中实施例的方法、设备（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例中的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。

显然，本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样，倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内，则本申请实施例中也意图包含这些改动和变型在内。

Claims

1.一种设备故障检测模型的训练方法，其特征在于，所述方法包括：

基于所述音频样本和所述新音频样本对应的满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型；所述预训练的支持向量机是基于除所述不同故障设备外的其他故障设备的音频样本训练好的向量机；

其中，采用预设的选择插值SMOTE算法，根据所述少数类音频样本的近邻分布信息，对所述少数类音频样本进行样本分类，得到不同类别的目标样本，包括：

当所述相同的音频样本的数量在第二数量区间内时，确定所述目标样本的类别为第二类别；

其中，对所述不同类别的目标样本进行插值，得到所述不同类别的目标样本对应的新音频样本，包括：

2.如权利要求1所述的方法，其特征在于，对所述音频样本和所述新音频样本进行特征提取，得到各音频样本对应的音频样本特征矩阵，包括：

对所述第一音频样本特征进行微分平滑处理，得到各第二音频样本特征和相应特征值；

3.如权利要求1所述的方法，其特征在于，利用所述各音频样本特征，对梯度提升树进行训练之前，所述方法还包括：

利用所述各音频样本特征，对梯度提升树进行训练，包括：

4.一种故障检测方法，其特征在于，所述方法包括：

将满足预设重要度条件的音频特征和相应位置索引，输入根据权利要求1-3任一项所述的设备故障检测模型的训练方法训练完成的设备故障检测模型中，得到所述设备故障检测模型输出的故障类别。

5.一种设备故障检测模型的训练装置，其特征在于，所述装置包括：

获取单元，用于获取不同故障设备的音频样本，所述音频样本为对采集的已知故障类别的音频信号进行预处理后得到的，所述音频样本包括样本数量大于预设数量的多数类音频样本和样本数量小于预设数量的少数类音频样本；

训练单元，用于基于满足预设重要度条件的音频样本特征、相应位置索引和相应音频样本的故障类别，对预训练的支持向量机进行训练，得到训练完成的设备故障检测模型；所述预训练的支持向量机是基于除所述不同故障设备外的其他故障设备的音频样本训练好的向量机；

所述分类单元，具体用于：

所述插值单元，具体用于：

6.一种故障检测装置，其特征在于，所述装置包括：

获取单元，用于获取当前设备的待检测音频数据，所述待检测音频数据为对采集的音频信号进行预处理后得到的；

所述获取单元，还用于利用所述各音频特征，对梯度提升树进行训练，得到所述各音频特征的重要度和满足预设重要度条件的音频特征；

以及，将满足预设重要度条件的音频特征和相应位置索引，输入根据权利要求1-3任一项所述的设备故障检测模型的训练方法训练完成的设备故障检测模型中，得到所述设备故障检测模型输出的故障类别。

7.一种电子设备，其特征在于，所述电子设备包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存储的程序时，实现权利要求1-3任一所述的方法步骤，或实现权利要求4所述的方法步骤。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法步骤，或实现权利要求4所述的方法步骤。