CN115452378A

CN115452378A - 基于功率正则化倒谱系数的滚动轴承故障声纹识别方法

Info

Publication number: CN115452378A
Application number: CN202210984334.1A
Authority: CN
Inventors: 邓艾东; 王寅杰; 范永胜; 占可; 董路南
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2022-08-17
Filing date: 2022-08-17
Publication date: 2022-12-09

Abstract

本发明公开了一种基于功率正则化倒谱系数的滚动轴承故障声纹识别方法，涉及测量技术领域，解决了在噪声干扰下轴承故障识别准确率不高的技术问题，其技术方案要点是使用改进功率正则化倒谱系数特征对滚动轴承的故障声音信号进行识别，相比其他常用特征计算量仅有少量增加，但具有更高的识别准确率；同时，该改进措施能在噪声环境下依然保持较高的识别准确率，具有鲁棒性强的优点。且本申请不会影响滚动轴承的正常运行，能在不停机、不对原系统进行改造的前提下安装声音信号传感器，并在此基础上实现滚动轴承的故障识别，效率更高。

Description

基于功率正则化倒谱系数的滚动轴承故障声纹识别方法

技术领域

本申请涉及测量技术领域，尤其涉及一种基于功率正则化倒谱系数的滚动轴承故障声纹识别方法。

背景技术

由于长期运行在重负载、高转速的环境下，滚动轴承成为了旋转机械设备中最易发生故障的零件之一，因此对滚动轴承进行故障诊断具有重要意义。目前轴承故障诊断中常用的振动分析法存在传感器安装不便、无法在故障早期准确识别故障的不足。声音信号相比振动信号具有不停机安装、非接触式测量、信号采集方便、处理方法成熟等优势。近年来，随着声纹识别技术的不断发展，这种语音领域的技术也被广泛应用于故障诊断领域，通过分析轴承的声音信号对轴承进行故障诊断也有了一定的研究成果，但大部分研究都是在实验室中进行，没有考虑实际工程中的噪声干扰问题。轴承实际运行过程中其他零部件或者外界会存在噪声干扰现象，这对该情况下实现滚动轴承故障诊断提出了严峻的挑战。

发明内容

本申请提供了一种基于功率正则化倒谱系数的滚动轴承故障声纹识别方法，其技术目的是在噪声干扰下提高对轴承声音信号识别的准确率，从而提高对轴承故障的识别准确率。

本申请的上述技术目的是通过以下技术方案得以实现的：

一种基于功率正则化倒谱系数的滚动轴承故障声纹识别方法，包括：

对滚动轴承在故障状态下和正常状态下的声音信号进行采集，每个声音信号被赋予对应的标签，得到带有标签的声音信号，将带有标签的声音信号划分为训练集和测试集；

对训练集进行预处理，然后对预处理后的训练集进行特征提取，得到改进功率正则化倒谱系数特征；

构建声纹识别模型，将改进功率正则化倒谱系数特征输入到声纹识别模型进行参数更新，当声纹识别模型的目标函数满足迭代终止条件时停止更新，得到声纹模型；

对测试集进行预处理并提取其改进功率正则化倒谱系数特征后输入到声纹模型，将声纹模型识别得到的标签与真实标签进行对比，得到识别准确率；

当识别准确率达到预设阈值时，通过声纹模型对滚动轴承故障声纹进行识别，否则继续对声纹模型进行训练直至其识别准确率达到预设阈值。

本申请的有益效果在于：本申请使用改进功率正则化倒谱系数特征对滚动轴承的故障声音信号进行识别，相比其他常用特征计算量仅有少量增加，但具有更高的识别准确率；同时，该改进措施能在噪声环境下依然保持较高的识别准确率，具有鲁棒性强的优点。且本申请不会影响滚动轴承的正常运行，能在不停机、不对原系统进行改造的前提下安装声音信号传感器，并在此基础上实现滚动轴承的故障识别，效率更高。

附图说明

图1为本申请所述方法的流程图；

图2为声音预处理中的分帧示意图；

图3为本申请所述改进功率正则化倒谱系数特征的提取流程图；

图4为Gammatone滤波器的分量示意图。

具体实施方式

下面将结合附图对本申请技术方案进行详细说明。

如图1所示，本申请所述的基于功率正则化倒谱系数的滚动轴承故障声纹识别方法，其特征在于，包括：

S1：对滚动轴承在故障状态下和正常状态下的声音信号进行采集，每个声音信号被赋予对应的标签，得到带有标签的声音信号，将带有标签的声音信号划分为训练集和测试集。

一般地，采集滚动轴承在3种故障状态下和1种正常状态下的声音信号，故障状态包括滚动轴承的内圈故障、外圈故障和内外圈故障，为时间长度为2s的声音样本，且不同类型的轴承声音数据作为一个域被赋予不同的标签，例如内圈故障状态下的声音信号的标签即为内圈故障。

S2：对训练集进行预处理，然后对预处理后的训练集进行特征提取，得到改进功率正则化倒谱系数特征。

具体地，预处理包括预加重、分帧和加窗。预加重是因为一般的声音信号都会存在频率越高衰减越严重的现象，因此需要通过高通滤波器对高频分量进行弥补，表示为：

其中，α表示预加重系数；S(n)表示原始信号；

表示预加重后的声音信号。

声音信号是不平稳信号，但是在短时范围内(10-20ms)特征变化较小，可以看作一个局部平稳的随机信号。将声音信号按照时间分割成许多片段，称为分帧。分帧最重要的两个参数是帧长度与帧间隔。一帧的长度称为帧长度，本申请取25ms；两相邻帧之间的间隔称为帧间隔，本申请取帧长度的40％。一组采样频率为44.1kHz、时长2s的样本在预处理后可得到197帧，分帧示意图如图2所示。

分帧后的信号两端有着高度的不连续性，为了避免直接进行傅里叶变换时频谱出现局部峰值的吉布斯效应，需要对分帧后的信号采用加窗处理，将较大的权重赋予中心信号，接近0的权重赋予窗边缘信号。本申请使用汉明窗，对于长度为N的离散信号x[n]，窗函数对应的权重w[n]可以表示为：

声音信号采样率高，即使只有数秒也多达上万个点，为方便研究需要把庞杂的数据压缩为固定维度的向量作为特征。针对滚动轴承声音信号特点和人语音信号的差异，在原始PNCC(功率正则化倒谱系数特征)的基础上对Gammatone滤波器分量、中等时长功率计算模块进行改进，并对计算结果添加一阶差分和二阶差分增强动态连续性作为改进的PNCC特征。

改进PNCC提取流程如图3所示，依次为：FFT变换、Gamma滤波、中等时长处理、时频归一化、平均功率归一化、幂函数变换、DCT离散余弦变换、一阶差分和二阶差分。具体的计算流程包括：

(1)对预处理后的声音信号进行快速傅里叶变换(FFT)得到频谱，表示为：

(2)轴承声音信号频率相比人的语音信号频率在中高频分段也有明显的分布。因此，相比原始PNCC提取时归一化滤波器分量，使用Gammatone滤波器原始通道分量可以增大中高频分量的权重，更适合用于轴承声音信号的处理，Gammatone滤波器的原始通道分量如图4所示。通过一组原始分量Gammatone滤波器，得到短时谱功率P[m,l]，其中m与l分别表示帧数和通道数，具体表示为：

其中，k表示N的索引，m表示帧数，l表示通道数；H_l(k)表示Gammatone滤波器。

(3)中等时长处理：原始PNCC计算中时功率时，将一帧前后m帧共M帧的平均功率作为当前帧的短时功率。机械设备声音信号相比人的语音信号更加平稳，通过增加中时功率计算时的帧数，即增加m值来适配轴承的声音信号特性，例如m取3时，M＝2m+1＝7，则增加当前帧的前后3帧共7帧的平均功率作为当前帧的短时功率，接着再经过非对称噪声抑制及时间掩蔽、权重平滑，得到

(4)时频归一化得到T[m,l]，表示为：

(5)平均功率归一化得到U[m,l]，表示为：

(6)幂函数变换模拟人耳对于频率感知的非线性特点，得到V[m,l]，表示为：

V[m,l]＝U[m,l]^1/15； (7)

(7)最后进行离散余弦变换(DCT)后取前13个参数得到W[m,l]，并对其进行一阶差分和二阶差分后再与原值拼接得到最终的39维改进PNCC特征。一阶差分方式如式(8)所示，二阶差分在一阶差分的基础上进行。

S3：构建声纹识别模型，将改进功率正则化倒谱系数特征输入到声纹识别模型进行参数更新，当声纹识别模型的目标函数满足迭代终止条件时停止更新，得到声纹模型。

具体的，上述声纹识别模型的分类器为支持向量机(Support Vector Machine,SVM)算法。SVM的思想是在样本空间中建立一个划分超平面，将不同类别的样本分开，使得异类支持向量到超平面的距离之和最大化。本申请核函数采用rbf，惩罚系数C取1，核函数系数gamma取0.00039。

S4：对测试集进行预处理并提取其改进功率正则化倒谱系数特征后输入到声纹模型，将声纹模型识别得到的标签与真实标签进行对比，得到识别准确率。

S5：当识别准确率达到预设阈值时，通过声纹模型对滚动轴承故障声纹进行识别，否则继续对声纹模型进行训练直至其识别准确率达到预设阈值。

作为具体实施地，本申请将改进PNCC特征与其他几种不同特征进行对比分析。对比实验选取在声音信号领域应用较为广泛的三种特征：梅尔倒谱系数(Mel-FrequencyCepstral Coefficients,MFCC)、伽马通倒谱系数(Gammatone Cepstral Coefficients,GTCC)、原始功率正则化倒谱系数PNCC。其中三种特征预处理都采用25ms帧长度，10ms帧间隔；一组2s的声音样本可分为197帧，每帧共得到13维参数，各帧特征级联共得到2561维参数。

四种不同特征在纯净声音信号测试集上的识别准确率结果如表1所示。可以看出，在没有噪声干扰时，四种特征识别准确率都能达到100％或者接近100％，都能较好地识别出故障类型。本申请的改进PNCC相比原始PNCC有一定提高。

表1纯净声音信号识别准确率

特征	识别准确率/％
		MFCC	100.00
GTCC	99.00
		PNCC	98.00
改进PNCC	100.00

为了验证本申请在噪声干扰下的识别准确率，在纯净声音信号中叠加噪声模拟真实环境，表2给出了四种不同特征在四种不同信噪比下面临五种噪声时的平均识别率。由表2可知，改进PNCC特征相比其他特征，在信噪比为20dB时识别率相近，等于或接近100％；信噪比在20dB以下时改进PNCC识别准确率更高，具有更强的鲁棒性。改进PNCC各信噪比下的均值相比原始PNCC提高了13.35％。

为了探究所提改进PNCC特征中各改进方法的效果，表3给出了在仅保留原始Gammaone滤波器原始分量、仅调整中时功率计算的总帧数M、仅一阶二阶差分时不同信噪比下五种噪声的平均识别率。由表3可得，相比原始PNCC，保留滤波器原始分量在每种信噪比下都可以提高识别率；调整中时功率计算的帧数M在低信噪比下识别率有一定提高，且M为7时平均识别率最高；一阶二阶差分可以提高高信噪比下识别率。同时使用三种改进方法相比单独使用，在各信噪比下识别率均有明显提高。

表2不同信噪比下不同特征平均识别准确率

表3不同信噪比下不同改进方法平均识别准确率

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

以上述依据本发明的理想实施例为启示，通过上述的说明内容，相关工作人员完全可以在不偏离本项发明技术思想的范围内，进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容，必须要根据权利要求范围来确定其技术性范围。

Claims

1.一种基于功率正则化倒谱系数的滚动轴承故障声纹识别方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述改进功率正则化倒谱系数特征的提取包括：将预处理后的声音信号依次经过FFT变换、Gamma滤波、中等时长处理、时频归一化、平均功率归一化、幂函数变换、DCT、一阶差分和二阶差分，最后得到所述改进功率正则化倒谱系数特征。

3.如权利要求1所述的方法，其特征在于，所述故障状态包括滚动轴承的内圈故障、外圈故障和内外圈故障；所述声音信号为时间长度为2s的声音样本。

4.如权利要求1所述的方法，其特征在于，所述声纹识别模型的分类器为支持向量机。

5.如权利要求1所述的方法，其特征在于，所述预处理包括预加重、分帧和加窗；

所述预加重通过高通滤波器对高频分量进行弥补，表示为：

其中，α表示预加重系数；S(n)表示原始信号；

表示预加重后的声音信号；

分帧通过帧长度和帧间隔进行分帧；

加窗通过汉明窗实现，包括：对于长度为N的离散信号x[n]，窗函数对应的权重w[n]表示为：

6.如权利要求5所述的方法，其特征在于，所述Gamma滤波通过Gammatone滤波器实现，通过所述Gammatone滤波器的原始分量通道对中高频分量的权重进行增加，得到短时谱功率P[m,l]，则P[m,l]表示为：

其中，k表示N的索引，m表示帧数，l表示通道数；H_l(k)表示Gammatone滤波器；所述中等时长处理包括：通过增加中时功率计算时的帧数，再经过非对称噪声抑制、时间掩蔽和权重平滑，得到

其中，通过增加中时功率计算时的帧数包括：计算当前帧的功率时，取前后共M帧的功率平均数作为当前帧的功率，则当前帧的前帧和后帧的数量均为(M-1)/2。