CN111354366B

CN111354366B - 一种异常声音检测方法及异常声音检测装置

Info

Publication number: CN111354366B
Application number: CN201811561607.1A
Authority: CN
Inventors: 曲道奎; 杜威; 王海鹏; 王晓东; 沈露; 卢裕
Original assignee: Shenyang Siasun Robot and Automation Co Ltd
Current assignee: Shenyang Siasun Robot and Automation Co Ltd
Priority date: 2018-12-20
Filing date: 2018-12-20
Publication date: 2023-06-16
Anticipated expiration: 2038-12-20
Also published as: CN111354366A

Abstract

本发明提供了一种异常声音检测方法，包括将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比，判定是否需要进行异常声音准确判定；若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值，则输出待测音频信号为正常音频信号的结果；若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值，则进行异常声音准确判定。异常声音准确判定是一个基于双层结构的分类器，能够实现异常声音信号的类型判定。同时本发明还提供了一种异常声音检测装置。本发明提供的异常声音检测方法和异常声音检测装置，能够实时、快速的判断待测音频信号是正常音频信号还是异常音频信号。

Description

一种异常声音检测方法及异常声音检测装置

技术领域

本发明涉及音频信号处理领域，特别涉及一种异常声音检测方法和异常声音检测装置。

背景技术

随着生产制造领域技术的提升，越来越多的大型设备得以进入生产车间。但因其高精度、高复杂度、高昂的维护费用，及非常规性停机造成巨大的经济损失。因此，需要通过自动化方法进行实时监控当前设备的运行状态。传统的基于传感器和视频监控目前得到了广泛的应用，但通常情况下传感器由于种种故障而先于设备失效，而视频监控更大的意义在于对设备出现故障后进行回看检查。基于异常声音检测的方法能够实时地捕获设备由于非正常工作所产生的异常声音。基于异常声音的检测方法是通过分析设备运行时声音特征，跟设备正常运行时声音特征进行对比，如果两种声音信号区别较大，则表明当前设备处于异常状态；否则，当前设备处于正常状态。当系统判定出设备处于异常工作状态时，能够及时准确地给出报警提示。

目前主流的异常声音检测的技术方案是利用分类的方法对捕获的音频信号与正常工作状态下的信号进行对比分析。其中，在音频信号的特征抽取中，过零率，Mel倒谱系数(MFCC)及其导数，小波系数及其以均值、方差为代表的统计学参数，信号能量等属性应用广泛；在参数抽取中以Gaussian混合模型和隐马尔科夫模型应用最为广泛；在分类过程中，以人工神经网络和支持向量机最为应用广泛。

这些分类方法在固定数据集经过一定次数的训练后，基本上都能够取得较好的分类效果。但在实际应用中，分类方法存在一个典型的缺点，需要使用分类器结合训练数据集进行相关的训练，而在实际环节中，因设备的异常状态而产生的异常声音在获取时有一定的难度，且在训练前需要使用多个类型的异常数据，这在客观情况下增加了问题的难度。

发明内容

本发明旨在至少解决上述技术问题之一，提供一种能够实时、快速的判断待测音频信号是正常音频信号还是异常音频信号的异常声音检测方法和异常声音检测装置。

为实现上述目的，本发明采用以下技术方案：

本发明提供了一种异常声音检测方法，包括以下步骤：

步骤一，建立音频库；建立正常音频特征标准库和异常音频特征标准库；

步骤二，采集分析音频信号；采集待测音频信号，去除噪声，获取有效待测音频信号；抽取有效待测音频信号的待测音频特征参数；

步骤三，快速判定异常声音；将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比，判定是否需要进一步执行异常声音准确判定；

若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值，则输出待测音频信号为正常音频信号的结果；

若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值，则进行异常声音准确判定；

步骤四，进行异常声音准确判定；使用正常声音数据特征和异常声音数据特征训练一个基于分层结构的分类模型，如果分类模型准确率能够达到预先设定的指标，则认为分类模型训练完成；

将待测音频特征参数输入训练好的分类模型进行异常声音判定；

若判定结果为异常音频信号，则输出当前待测音频信号为异常信号；

若判定结果为正常音频信号，则输出当前待测音频信号为正常信号。

一些实施例中，采集待测音频信号后，去除噪声，通过待测音频信号的短时能量和平均过零率，判断待测音频信号是否为有效待测音频信号；然后获取有效待测音频信号。

一些实施例中，所述待测音频特征参数、标准音频特征参数和异常音频特征参数为：通过提取待测音频信号的梅尔倒谱系数、梅尔倒谱系数一阶导数、小波变换系数、能量值、过零率和傅里叶系数，并利用Gaussian进行参数拟合，获取的音频数据的均值和方差。

一些实施例中，所述待测音频特征参数的KL散度与标准音频特征参数的KL散度差值计算公式为：

KL(P,Q)＝1/2(KL(P,Q)+KL(Q,P))。

其中，KL散度的计算公式为KL(P,Q)＝∑[P(x)log(P(x)/Q(x))]。

一些实施例中，所述基于分层结构的分类模型为，特征信号输入至第一分类层，该层分类方法包括支持向量机、奇异值分解的组合，经第一层分类后的特征，结合原始特征，共同作为第二层分类器的输入特征值，第二层分类器使用支持向量机进行分类。

一些实施例中，采集待测音频信号后，将待测音频信号分为10ms为一帧的声音片段，计算每帧的短时能量和过零率，使用两级判别法进行有效声音的端点检测，进而获取有效待测音频信号。

一些实施例中，所述梅尔倒谱系数使用13维度作为特征参数，并使用15ms作为一帧数据，利用Gaussian进行参数拟合，获取音频数据的均值和方差。

本发明还提供了一种异常声音检测装置，包括：

音频特征标准库建立单元，用于建立正常音频特征标准库和异常声音特征标准库；

音频采集单元，用于采集待测音频信号；

有效音频检测单元，用于根据采集到的待测音频信号，获取有效待测音频信号；

音频特征提取单元，用于抽取有效待测音频信号的待测音频特征参数；

音频特征判定单元，用于将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比，判定是否需要进行异常声音准确判定；若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值，则输出待测音频信号为正常音频信号的结果；若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值，则给出需要进行异常声音准确判定的输出结果；

音频特征分类单元，用于当音频特征判定单元的输出结果为需要进行异常声音准确判定时，将待测音频特征参数输入异常音频判定模型进行判定，判定待测音频信号是否为正常音频信号；若判定结果认定待测音频信号为异常音频信号，则将待测音频特征参数与异常音频特征标准库中的异常音频特征参数进行对比，判定异常音频信号的类型。

一些实施例中，所述异常声音检测装置还包括异常报警单元，所述异常报警单元用于根据音频特征分类单元输出的异常音频信号的类型，给出与该类型对应的报警提示。

本发明的有益效果在于：本发明提供的异常声音检测方法，在异常声音检测过程中，先对待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比，以判定是否需要进行异常声音准确判定；通过该步骤的初步判定，若判定结果为正常音频信号，则不用再进行后续的判定过程；能够通过该步骤，实时、快速的进行异常声音检测。同时，本发明提供的异常声音检测装置中，加入了音频特征判定单元，进行KL散度的对比。

附图说明

图1是本发明一个实施例中，异常声音检测方法的检测流程示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“安装”、“设置”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

下面将结合附图1详细说明一下本发明提供的异常声音检测方法。

如图1所示，本发明提供的异常声音检测方法，包括以下步骤：

通过在异常声音检测过程中，先对待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比，以判定是否需要进行异常声音准确判定；通过该步骤的初步判定，若判定结果为正常音频信号，则不用再进行后续的判定过程；能够通过该步骤，实时、快速的进行异常声音检测。

在数据采集、特征抽取和数据分类的基础上，增加了一个数据预处理的阶段，通过计算数据之间的KL散度差值，快速比对并给出判定结果，能够有效提升处理的效率；尤其是针对实时数据处理时，对能够直接判定为正常声音的数据，降低了处理的复杂度，提高了工作效率。

本发明的一个实施例中，采集待测音频信号后，去除噪声，通过待测音频信号的短时能量和平均过零率，判断待测音频信号是否为有效待测音频信号；然后获取有效待测音频信号。通过待测音频信号的短时能量和平均过零率的计算，判断待测音频信号是否为有效待测音频信号，若判定结果为是，则获取有效待测音频信号。

更具体的，一个实施例中，采集待测音频信号后，将待测音频信号分为10ms为一帧的声音片段，计算每帧的短时能量和过零率，使用两级判别法进行有效声音的端点检测，进而获取有效待测音频信号。

在采集待测音频信号后，获取有效待测音频信号，可以去除噪声及无效音频信号，确保了异常声音检测的准确性。

本发明的一个实施例中，待测音频特征参数、标准音频特征参数和异常音频特征参数采用相同的方法获取，以保证各参数之间的一致性和可对比性。具体的，通过提取待测音频信号的梅尔倒谱系数、梅尔倒谱系数一阶导数、小波变换系数、能量值、过零率和傅里叶系数，并利用Gaussian进行参数拟合，获取的音频数据的均值和方差。在本发明中，均值和方差都是统计学特征，保证了特征参数的有效性和准确性；有效防止了个别特征不准确的问题。

本发明一个实施例中，所述待测音频特征参数的KL散度与标准音频特征参数的KL散度差值计算公式为：

KL(P,Q)＝1/2(KL(P,Q)+KL(Q,P))。

其中，KL散度的计算公式为KL(P,Q)＝∑[P(x)log(P(x)/Q(x))]。

本发明一个实施例中，所述基于分层结构的分类模型为，特征信号输入至第一分类层，该层分类方法包括支持向量机、奇异值分解的组合，经第一层分类后的特征，结合原始特征，共同作为第二层分类器的输入特征值，第二层分类器使用支持向量机进行分类。

一个具体实施例中，采集待测音频信号后，将待测音频信号分为10ms为一帧的声音片段，计算每帧的短时能量和过零率，使用两级判别法进行有效声音的端点检测，进而获取有效待测音频信号。

一个具体实施例中，所述梅尔倒谱系数使用13维度作为特征参数，并使用15ms作为一帧数据，利用Gaussian进行参数拟合，获取音频数据的均值和方差。此外，梅尔倒谱系数一阶导数也使用13维度作为特征参数。

在本发明中，异常音频特征标准库的建立，基于包括电机发生异常声音、设备不能自主行走等情况下，检测到的异常音频特征。并且，通过对全体数据进行训练，使得分层SVM模型具有较高的分类准确率，提高了相关特征参数的准确性和稳定性。其中，90％的数据用于训练，10％的数据用于测试和对比。并且通过多次重复，保证系统能够取得较好的准确性和效果。

为了便于实现本发明提供的异常声音检测方法，本发明还提供了一种异常声音检测装置，包括，

音频采集单元，用于采集待测音频信号；

同时，本发明提供的异常声音检测装置中还包括异常报警单元，用于根据音频特征分类单元输出的异常音频信号的类型，给出与该类型对应的报警提示。具体的，不同的异常声音类型，对应给出不同的报警提示，以方便操作人员获知异常声音的类型，更加方便检测和确认。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种异常声音检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的异常声音检测方法，其特征在于，采集待测音频信号后，去除噪声，通过待测音频信号的短时能量和平均过零率，判断待测音频信号是否为有效待测音频信号；然后获取有效待测音频信号。

3.根据权利要求1所述的异常声音检测方法，其特征在于，所述待测音频特征参数、标准音频特征参数和异常音频特征参数为：通过提取待测音频信号的梅尔倒谱系数、梅尔倒谱系数一阶导数、小波变换系数、能量值、过零率和傅里叶系数，并利用Gaussian进行参数拟合，获取的音频数据的均值和方差。

4.根据权利要求3所述的异常声音检测方法，其特征在于，所述待测音频特征参数的KL散度与标准音频特征参数的KL散度差值计算公式为：

KL(P,Q)＝1/2(KL(P,Q)+KL(Q,P))；

其中，KL散度的计算公式为KL(P,Q)＝∑[P(x)log(P(x)/Q(x))]。

5.根据权利要求1所述的异常声音检测方法，其特征在于，所述基于分层结构的分类模型为，特征信号输入至第一分类层，该层分类方法包括支持向量机、奇异值分解的组合，经第一层分类后的特征，结合原始特征，共同作为第二层分类器的输入特征值，第二层分类器使用支持向量机进行分类。

6.根据权利要求2所述的异常声音检测方法，其特征在于，采集待测音频信号后，将待测音频信号分为10ms为一帧的声音片段，计算每帧的短时能量和过零率，使用两级判别法进行有效声音的端点检测，进而获取有效待测音频信号。

7.根据权利要求3所述的异常声音检测方法，其特征在于，所述梅尔倒谱系数使用13维度作为特征参数，并使用15ms作为一帧数据，利用Gaussian进行参数拟合，获取音频数据的均值和方差。

8.一种异常声音检测装置，其特征在于，包括，

音频采集单元，用于采集待测音频信号；

9.根据权利要求8所述的异常声音检测装置，其特征在于，还包括异常报警单元，所述异常报警单元用于根据音频特征分类单元输出的异常音频信号的类型，给出与该类型对应的报警提示。