CN104409078A

CN104409078A - 异常声音检测和识别系统

Info

Publication number: CN104409078A
Application number: CN201410752399.9A
Authority: CN
Inventors: 冯秀霞
Original assignee: Heilongjiang Zhenmei Broadcasting Communications Equipment Co Ltd
Current assignee: Heilongjiang Zhenmei Broadcasting Communications Equipment Co Ltd
Priority date: 2014-12-11
Filing date: 2014-12-11
Publication date: 2015-03-11

Abstract

异常声音检测和识别系统，是一种基于短时处理异常声音检测和识别技术，通过对异常声音进行采集、预处理、然后进行整合形成样本库，然后对样本库进行预加重、加窗分帧，最后进行特征提取，识别出结果，在安全监控方面应用可以使得在的目标跟踪系统和安全监控系统更加的完善了，性能更好了，实现方法更加简单了，系统的智能型越来越高了，在工业领域应用可以降低人工排检效率，提高生产率，有利于工业生产向着小型化、网络化、自动化、智能化的方向发展。

Description

异常声音检测和识别系统

技术领域

本发明涉及的是一种声音检测识别技术，特别涉及的是一种基于短时处理异常声音检测和识别技术。

背景技术

声音，它没有质量，但是它能产生能量效果；声音，它是一种纵波，但是它又不同于光波，光有光子，它是有动量、有能量、有质量的，而在物理上只有压力的声音是没有质量。作为声音一种的异常声音，就完全具备声音如上述所说的这些特性。

目前，对于异常声音检测与识别技术的研究相对来说起步很晚、发展比较缓慢，而且这类系统仍旧是沿用的是语音处理的一些方法。那么，对于既包括语音信号，又包括非语音信号的异常声音的研究就会更加复杂、更加困难一些，但是呢，这方面的研究又有很好的前瞻性，所以说，异常声音检测识别系统将会受到越来越多的关注。

发明内容

本发明的目的是提供一种异常声音检测和识别系统，利用比较成熟的MFC（Mel频率倒谱系数）参数，来对异样声音进行检测和识别，从而促进声音检测和识别的方式更加简洁、高效。

本发明的目的是这样实现的，具体步骤如下：

（1）快速傅里叶变换FFT：是一种离散傅里叶变换，计算速度较快，可以将时域的异常声音信号转换成其相应的功率谱。

（2）三角窗滤波组：滤波器组一般是由若干个线性分布的基于梅尔频率的三角窗滤波器组，一般一组包含24个三角窗滤波器，对异常声音信号的功率谱进行滤波处理，尽可能减小无用信号对有用信号的干扰。

（3）求对数：即对滤波器组的输出取对数，可以使异常声音信号序列的变化在一定的范围内比较明显，而又不影响主要的变化趋势。

（4）离散余弦变换（Discrete Cosine Transformation, DCT）：可以压缩样本空间，减少各维异常声音信号之间的相关性，达到降低维数的效果，减少运算量，提高效率。

（5）谱加权：由于一些参数会受到一定条件的影响，而为提高低阶参数、高阶参数的分辨能力比较低，就进行了该操作。

（6）倒谱均值减（Cepstrum Mean Subtraction, CMS）：减小异常声音信号的输入信道对特征参数的影响。

差分参数：众多研究发现，在异常声音特征参数中结合表征动态特性的差分参数，这样就能够有效的改善系统的识别率、识别精度、识别范围。

本发明还可以包括：

（1）为了减少计算、方便运行、易于变换、优化系统，通常将短时能量函数简化为如下的形式：

，

（2）加窗后，对于短时分析时信号的平均过零率定义：

，

其中，是符号函数，其数学表达式如下：

。

本发明的优点：

（1）在安全监控方面应用可以使得在的目标跟踪系统和安全监控系统更加的完善了，性能更好了，实现方法更加简单了，系统的智能型越来越高了。

（2）在工业领域应用可以降低人工排检效率，提高生产率，有利于工业生产向着小型化、网络化、自动化、智能化的方向发展。

附图说明

图1为系统总体流程图；

图2为MFCC特征参数的提取计算流程图。

具体实施方式

下面结合附图举例对本发明做更详细地描述：

实施例1

结合图1，异常声音信号不像是语音信号那样，异常声音信号是一种在时间上非平稳的、非周期的随机信号，但是这种异常声音信号的功率谱在时间轴上是连续的，在足够短的时间内是变化较缓的，所以可以将这种信号看成是一种短时平稳的信号。基于信号的这一特点，在预处理部分选择的分析方法为短时处理方法。根据这种分析方法的特性，将信号分成有一系列的采样点组成的分析帧，这样就以一系列的分析帧进行信号的短时分析，而且每一帧的采样点数要与快速傅里叶变换的参数相一致，并且通过窗函数来接去异常声音信号的每一帧信号。但是窗函数的选择将影响分析的效果，为了保证分帧后信号的连续性，本设计中采用在相邻帧之间存在帧移的操作方法进行这部分的处理，通过窗口函数的窗口长度来设定一定的帧长，相邻两帧在时间轴上所重叠的长度就是一个帧移。短时信号分析方法既可以处理时域上的信号，也可以处理频域上的信号。时域分析主要包括对信号幅度、短时能量、平均幅度及短时平均过零率等参数的分析；频域分析包括对功率谱、频谱包络、频谱、倒谱系数等的分析。

实施例2

结合图2，MFCC特征参数的提取计算主要包括以下步骤：

Claims

1.异常声音检测和识别系统，其特征在于：通过以下步骤进行参数提取：

（1）快速傅里叶变换FFT：离散傅里叶变换，将时域的异常声音信号转换成其相应的功率谱；

（2）三角窗滤波组：滤波器组是线性分布的基于梅尔频率的三角窗滤波器组，一组24个三角窗滤波器，对异常声音信号的功率谱进行滤波处理，减小无用信号对有用信号的干扰；

（3）求对数：对滤波器组的输出取对数，使异常声音信号序列的变化在一定的范围内比较明显，而又不影响主要的变化趋势；

（4）离散余弦变换：压缩样本空间，减少各维异常声音信号之间的相关性，达到降低维数的效果，减少运算量，提高效率；

（5）谱加权：由于一些参数会受到一定条件的影响，而为提高低阶参数、高阶参数的分辨能力比较低，就进行了该操作；

（6）倒谱均值减：减小异常声音信号的输入信道对特征参数的影响；

（7）差分参数：异常声音特征参数中结合表征动态特性的差分参数，改善系统的识别率、识别精度、识别范围。

2.根据权利要求1所述的异常声音检测和识别系统，其特征在于：短时能量函数为如下的形式：

。

3.根据权利要求2所述的异常声音检测和识别系统，其特征在于：加窗后，对于短时分析时信号的平均过零率定义：

，

其中，是符号函数，其数学表达式如下：

。