CN104409078A - 异常声音检测和识别系统 - Google Patents
异常声音检测和识别系统 Download PDFInfo
- Publication number
- CN104409078A CN104409078A CN201410752399.9A CN201410752399A CN104409078A CN 104409078 A CN104409078 A CN 104409078A CN 201410752399 A CN201410752399 A CN 201410752399A CN 104409078 A CN104409078 A CN 104409078A
- Authority
- CN
- China
- Prior art keywords
- abnormal sound
- signal
- abnormal noise
- noise detection
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Complex Calculations (AREA)
Abstract
异常声音检测和识别系统,是一种基于短时处理异常声音检测和识别技术,通过对异常声音进行采集、预处理、然后进行整合形成样本库,然后对样本库进行预加重、加窗分帧,最后进行特征提取,识别出结果,在安全监控方面应用可以使得在的目标跟踪系统和安全监控系统更加的完善了,性能更好了,实现方法更加简单了,系统的智能型越来越高了,在工业领域应用可以降低人工排检效率,提高生产率,有利于工业生产向着小型化、网络化、自动化、智能化的方向发展。
Description
技术领域
本发明涉及的是一种声音检测识别技术,特别涉及的是一种基于短时处理异常声音检测和识别技术。
背景技术
声音,它没有质量,但是它能产生能量效果;声音,它是一种纵波,但是它又不同于光波,光有光子,它是有动量、有能量、有质量的,而在物理上只有压力的声音是没有质量。作为声音一种的异常声音,就完全具备声音如上述所说的这些特性。
目前,对于异常声音检测与识别技术的研究相对来说起步很晚、发展比较缓慢,而且这类系统仍旧是沿用的是语音处理的一些方法。那么,对于既包括语音信号,又包括非语音信号的异常声音的研究就会更加复杂、更加困难一些,但是呢,这方面的研究又有很好的前瞻性,所以说,异常声音检测识别系统将会受到越来越多的关注。
发明内容
本发明的目的是提供一种异常声音检测和识别系统,利用比较成熟的MFC(Mel频率倒谱系数)参数,来对异样声音进行检测和识别,从而促进声音检测和识别的方式更加简洁、高效。
本发明的目的是这样实现的,具体步骤如下:
(1)快速傅里叶变换FFT:是一种离散傅里叶变换,计算速度较快,可以将时域的异常声音信号转换成其相应的功率谱。
(2)三角窗滤波组:滤波器组一般是由若干个线性分布的基于梅尔频率的三角窗滤波器组,一般一组包含24个三角窗滤波器,对异常声音信号的功率谱进行滤波处理,尽可能减小无用信号对有用信号的干扰。
(3)求对数:即对滤波器组的输出取对数,可以使异常声音信号序列的变化在一定的范围内比较明显,而又不影响主要的变化趋势。
(4)离散余弦变换(Discrete Cosine Transformation, DCT):可以压缩样本空间,减少各维异常声音信号之间的相关性,达到降低维数的效果,减少运算量,提高效率。
(5)谱加权:由于一些参数会受到一定条件的影响,而为提高低阶参数、高阶参数的分辨能力比较低,就进行了该操作。
(6)倒谱均值减(Cepstrum Mean Subtraction, CMS):减小异常声音信号的输入信道对特征参数的影响。
差分参数:众多研究发现,在异常声音特征参数中结合表征动态特性的差分参数,这样就能够有效的改善系统的识别率、识别精度、识别范围。
本发明还可以包括:
(1)为了减少计算、方便运行、易于变换、优化系统,通常将短时能量函数简化为如下的形式:
,
(2)加窗后,对于短时分析时信号的平均过零率定义:
,
其中,是符号函数,其数学表达式如下:
。
本发明的优点:
(1) 在安全监控方面应用可以使得在的目标跟踪系统和安全监控系统更加的完善了,性能更好了,实现方法更加简单了,系统的智能型越来越高了。
(2) 在工业领域应用可以降低人工排检效率,提高生产率,有利于工业生产向着小型化、网络化、自动化、智能化的方向发展。
附图说明
图1为系统总体流程图;
图2为MFCC特征参数的提取计算流程图。
具体实施方式
下面结合附图举例对本发明做更详细地描述:
实施例1
结合图1,异常声音信号不像是语音信号那样,异常声音信号是一种在时间上非平稳的、非周期的随机信号,但是这种异常声音信号的功率谱在时间轴上是连续的,在足够短的时间内是变化较缓的,所以可以将这种信号看成是一种短时平稳的信号。基于信号的这一特点,在预处理部分选择的分析方法为短时处理方法。根据这种分析方法的特性,将信号分成有一系列的采样点组成的分析帧,这样就以一系列的分析帧进行信号的短时分析,而且每一帧的采样点数要与快速傅里叶变换的参数相一致,并且通过窗函数来接去异常声音信号的每一帧信号。但是窗函数的选择将影响分析的效果,为了保证分帧后信号的连续性,本设计中采用在相邻帧之间存在帧移的操作方法进行这部分的处理,通过窗口函数的窗口长度来设定一定的帧长,相邻两帧在时间轴上所重叠的长度就是一个帧移。短时信号分析方法既可以处理时域上的信号,也可以处理频域上的信号。时域分析主要包括对信号幅度、短时能量、平均幅度及短时平均过零率等参数的分析;频域分析包括对功率谱、频谱包络、频谱、倒谱系数等的分析。
实施例2
结合图2,MFCC特征参数的提取计算主要包括以下步骤:
(1)快速傅里叶变换FFT:是一种离散傅里叶变换,计算速度较快,可以将时域的异常声音信号转换成其相应的功率谱。
(2)三角窗滤波组:滤波器组一般是由若干个线性分布的基于梅尔频率的三角窗滤波器组,一般一组包含24个三角窗滤波器,对异常声音信号的功率谱进行滤波处理,尽可能减小无用信号对有用信号的干扰。
(3)求对数:即对滤波器组的输出取对数,可以使异常声音信号序列的变化在一定的范围内比较明显,而又不影响主要的变化趋势。
(4)离散余弦变换(Discrete Cosine Transformation, DCT):可以压缩样本空间,减少各维异常声音信号之间的相关性,达到降低维数的效果,减少运算量,提高效率。
(5)谱加权:由于一些参数会受到一定条件的影响,而为提高低阶参数、高阶参数的分辨能力比较低,就进行了该操作。
(6)倒谱均值减(Cepstrum Mean Subtraction, CMS):减小异常声音信号的输入信道对特征参数的影响。
差分参数:众多研究发现,在异常声音特征参数中结合表征动态特性的差分参数,这样就能够有效的改善系统的识别率、识别精度、识别范围。
Claims (3)
1.异常声音检测和识别系统,其特征在于:通过以下步骤进行参数提取:
(1)快速傅里叶变换FFT:离散傅里叶变换,将时域的异常声音信号转换成其相应的功率谱;
(2)三角窗滤波组:滤波器组是线性分布的基于梅尔频率的三角窗滤波器组,一组24个三角窗滤波器,对异常声音信号的功率谱进行滤波处理,减小无用信号对有用信号的干扰;
(3)求对数:对滤波器组的输出取对数,使异常声音信号序列的变化在一定的范围内比较明显,而又不影响主要的变化趋势;
(4)离散余弦变换:压缩样本空间,减少各维异常声音信号之间的相关性,达到降低维数的效果,减少运算量,提高效率;
(5)谱加权:由于一些参数会受到一定条件的影响,而为提高低阶参数、高阶参数的分辨能力比较低,就进行了该操作;
(6)倒谱均值减:减小异常声音信号的输入信道对特征参数的影响;
(7)差分参数:异常声音特征参数中结合表征动态特性的差分参数,改善系统的识别率、识别精度、识别范围。
2.根据权利要求1所述的异常声音检测和识别系统,其特征在于:短时能量函数为如下的形式:
。
3.根据权利要求2所述的异常声音检测和识别系统,其特征在于:加窗后,对于短时分析时信号的平均过零率定义:
,
其中,是符号函数,其数学表达式如下:
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410752399.9A CN104409078A (zh) | 2014-12-11 | 2014-12-11 | 异常声音检测和识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410752399.9A CN104409078A (zh) | 2014-12-11 | 2014-12-11 | 异常声音检测和识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104409078A true CN104409078A (zh) | 2015-03-11 |
Family
ID=52646701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410752399.9A Pending CN104409078A (zh) | 2014-12-11 | 2014-12-11 | 异常声音检测和识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104409078A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105244038A (zh) * | 2015-09-30 | 2016-01-13 | 金陵科技学院 | 一种基于hmm的选矿设备故障异常音频分析与识别方法 |
CN106448700A (zh) * | 2016-10-31 | 2017-02-22 | 济南中维世纪科技有限公司 | 一种尖锐声音检测方法和系统 |
CN106529433A (zh) * | 2016-10-25 | 2017-03-22 | 天津大学 | 基于声音信号的队列步伐整齐度评价方法 |
CN106910495A (zh) * | 2017-04-26 | 2017-06-30 | 中国科学院微电子研究所 | 一种应用于异常声音检测的音频分类系统和方法 |
TWI595791B (zh) * | 2016-03-29 | 2017-08-11 | 高瞻資訊股份有限公司 | 音訊檢測方法 |
CN107424626A (zh) * | 2017-08-04 | 2017-12-01 | 上海振华重工电气有限公司 | 一种岸桥小车轨道声音监测及故障识别系统 |
CN107799114A (zh) * | 2017-04-26 | 2018-03-13 | 珠海智牧互联科技有限公司 | 一种猪只咳嗽声音识别方法及系统 |
CN109060371A (zh) * | 2018-07-04 | 2018-12-21 | 深圳万发创新进出口贸易有限公司 | 一种汽车零部件异响检测装置 |
CN110807901A (zh) * | 2019-11-08 | 2020-02-18 | 西安联丰迅声信息科技有限责任公司 | 一种非接触式工业异常声音检测方法 |
CN111573197A (zh) * | 2020-04-22 | 2020-08-25 | 北京华能新锐控制技术有限公司 | 一种分布式皮带机异常声音检测方法 |
CN113353582A (zh) * | 2021-07-02 | 2021-09-07 | 东北大学 | 基于音频信息和pso-msvm的传送带托辊设备故障检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102664006A (zh) * | 2012-04-14 | 2012-09-12 | 中国人民解放军国防科学技术大学 | 基于时频域分析的异常人声检测方法 |
TW201350804A (zh) * | 2012-03-23 | 2013-12-16 | Mitsubishi Electric Corp | 異常音診斷裝置 |
CN103730109A (zh) * | 2014-01-14 | 2014-04-16 | 重庆大学 | 一种公共场所异常声音特征提取方法 |
-
2014
- 2014-12-11 CN CN201410752399.9A patent/CN104409078A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201350804A (zh) * | 2012-03-23 | 2013-12-16 | Mitsubishi Electric Corp | 異常音診斷裝置 |
CN102664006A (zh) * | 2012-04-14 | 2012-09-12 | 中国人民解放军国防科学技术大学 | 基于时频域分析的异常人声检测方法 |
CN103730109A (zh) * | 2014-01-14 | 2014-04-16 | 重庆大学 | 一种公共场所异常声音特征提取方法 |
Non-Patent Citations (5)
Title |
---|
吕霄云 等: "基于MFCC和短时能量混合的异常声音识别算法", 《计算机应用》 * |
吕霄云: "基于MFCC和GMM的异常声音识别算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
姚晓欣: "环境异常状况声音特征研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
徐丽敏: "《鲁棒性说话人识别技术》", 31 December 2011, 南京大学出版社 * |
陆建江 等: "《智能检索技术》", 31 August 2009, 科学出版社 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105244038A (zh) * | 2015-09-30 | 2016-01-13 | 金陵科技学院 | 一种基于hmm的选矿设备故障异常音频分析与识别方法 |
TWI595791B (zh) * | 2016-03-29 | 2017-08-11 | 高瞻資訊股份有限公司 | 音訊檢測方法 |
CN106529433B (zh) * | 2016-10-25 | 2019-07-16 | 天津大学 | 基于声音信号的队列步伐整齐度评价方法 |
CN106529433A (zh) * | 2016-10-25 | 2017-03-22 | 天津大学 | 基于声音信号的队列步伐整齐度评价方法 |
CN106448700A (zh) * | 2016-10-31 | 2017-02-22 | 济南中维世纪科技有限公司 | 一种尖锐声音检测方法和系统 |
CN106448700B (zh) * | 2016-10-31 | 2019-09-17 | 济南中维世纪科技有限公司 | 一种尖锐声音检测方法和系统 |
CN106910495A (zh) * | 2017-04-26 | 2017-06-30 | 中国科学院微电子研究所 | 一种应用于异常声音检测的音频分类系统和方法 |
CN107799114A (zh) * | 2017-04-26 | 2018-03-13 | 珠海智牧互联科技有限公司 | 一种猪只咳嗽声音识别方法及系统 |
CN107424626A (zh) * | 2017-08-04 | 2017-12-01 | 上海振华重工电气有限公司 | 一种岸桥小车轨道声音监测及故障识别系统 |
CN109060371A (zh) * | 2018-07-04 | 2018-12-21 | 深圳万发创新进出口贸易有限公司 | 一种汽车零部件异响检测装置 |
CN110807901A (zh) * | 2019-11-08 | 2020-02-18 | 西安联丰迅声信息科技有限责任公司 | 一种非接触式工业异常声音检测方法 |
CN110807901B (zh) * | 2019-11-08 | 2021-08-03 | 西安联丰迅声信息科技有限责任公司 | 一种非接触式工业异常声音检测方法 |
CN111573197A (zh) * | 2020-04-22 | 2020-08-25 | 北京华能新锐控制技术有限公司 | 一种分布式皮带机异常声音检测方法 |
CN111573197B (zh) * | 2020-04-22 | 2021-11-30 | 北京华能新锐控制技术有限公司 | 一种分布式皮带机异常声音检测方法 |
CN113353582A (zh) * | 2021-07-02 | 2021-09-07 | 东北大学 | 基于音频信息和pso-msvm的传送带托辊设备故障检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104409078A (zh) | 异常声音检测和识别系统 | |
CN108896878B (zh) | 一种基于超声波的局部放电检测方法 | |
CN103117067B (zh) | 一种低信噪比下语音端点检测方法 | |
CN109192200B (zh) | 一种语音识别方法 | |
Hui et al. | A pitch detection algorithm based on AMDF and ACF | |
US20150081287A1 (en) | Adaptive noise reduction for high noise environments | |
CN102543073B (zh) | 一种沪语语音识别信息处理方法 | |
WO2014153800A1 (zh) | 语音识别系统 | |
CN108305639B (zh) | 语音情感识别方法、计算机可读存储介质、终端 | |
CN103646649A (zh) | 一种高效的语音检测方法 | |
CN103594094A (zh) | 自适应谱减法实时语音增强 | |
CN103646648B (zh) | 一种噪声功率估计方法 | |
KR20110044990A (ko) | 특성 추출을 사용하여 음성 향상을 위한 오디오 신호를 프로세싱하기 위한 장치 및 방법 | |
CN104021789A (zh) | 一种利用短时时频值的自适应端点检测方法 | |
CN101271686A (zh) | 使用语音信号的谐波估计噪声的方法和设备 | |
CN108682432B (zh) | 语音情感识别装置 | |
CN111091833A (zh) | 一种降低噪声影响的端点检测方法 | |
CN110942766A (zh) | 音频事件检测方法、系统、移动终端及存储介质 | |
CN101625858B (zh) | 语音端点检测中短时能频值的提取方法 | |
CN105679312A (zh) | 一种噪声环境下声纹识别的语音特征处理方法 | |
CN108922514B (zh) | 一种基于低频对数谱的鲁棒特征提取方法 | |
CN105679321B (zh) | 语音识别方法、装置及终端 | |
CN107103913B (zh) | 一种基于功率谱Gabor特征序列递归模型的语音识别方法 | |
CN109102823B (zh) | 一种基于子带谱熵的语音增强方法 | |
Riazati Seresht et al. | Spectro-temporal power spectrum features for noise robust ASR |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150311 |
|
WD01 | Invention patent application deemed withdrawn after publication |