CN106992011A - 基于mf‑plpcc特征的工程机械声音识别方法 - Google Patents

基于mf‑plpcc特征的工程机械声音识别方法 Download PDF

Info

Publication number
CN106992011A
CN106992011A CN201710060595.3A CN201710060595A CN106992011A CN 106992011 A CN106992011 A CN 106992011A CN 201710060595 A CN201710060595 A CN 201710060595A CN 106992011 A CN106992011 A CN 106992011A
Authority
CN
China
Prior art keywords
sound
signal
short
plpcc
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710060595.3A
Other languages
English (en)
Inventor
曹九稳
曹敏
王建中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201710060595.3A priority Critical patent/CN106992011A/zh
Publication of CN106992011A publication Critical patent/CN106992011A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于MF‑PLPCC特征对工程机械声音识别方法。该方法实现过程如下:采集工程机械作业时候的声音和周围环境噪声,并将采集的声音信号建立声音样本库;对所有的声音信号进行预加重、分帧和加窗处理;求出每帧声音信号的短时能量谱;求出通过Mel三角滤波器组的短时能量;用立方根对短时能量进行强度‑响度转换;对转换后的信号采用傅里叶逆变换转换到时域中;求出时域中信号的线性预测系数;基于线性预测系数计算倒谱系数;对不同机械的声音特征进行标号,建立样本特征库;基于训练样本特征库,利用正则化极限学习机建立模型;对目标声音进行特征提取后匹配得出分类结果。本发明能够提高识别率。

Description

基于MF-PLPCC特征的工程机械声音识别方法
技术领域
本发明是属于声音识别技术领域,涉及到基于声音的梅尔感知线性预测倒谱系数(MF-PLPCC)对工程机械的识别方法。
背景技术
随着我国经济的快速发展,基础设施建设也在加快,而在基础设施建设的工程施工过程中工程机械早已取代了大部分的体力劳动。在高速公路、机场铁路建设、水利设施、城市改造等工地,我们都可以看到挖掘机、推土机等工程机械。然而在施工过程中,监管不到位,从而导致工程机械出现瞎施工、乱施工、重复施工等乱象,浪费国家资源的同时也增加了工程成本。由于监管不到位而出现的这些乱象,本发明提出了一种识别方法对工程机械的识别,从而实现了对工程机械的监控。
基于声音的工程机械的识别方法有多种,例如:线性预测倒谱系数 (LPCC)、感知线性预测倒谱系数(PLPCC)、梅尔倒谱系数(MFCC)结合分类器等识别方法。这些方法在近距离或者信噪比高的情况下能够反映声音的大部分信息,对工程机械的识别率可能很高,但是在远距离或者信噪比低的情况下提取工程机械声音的特征量较少,从而降低了识别率。
发明内容
针对目前存在如上所述的技术问题,本发明提供了一种基于 MF-PLPCC特征对工程机械声音识别方法。这种识别方法是基于Mel频率、听感强度和线性预测倒谱系数的混合特征,通过RELM实现对工程机械的识别分类。该方法能够更好地模拟人的听觉系统,在远距离或者信噪比低的情况下,能够提取工程机械声音的特征量比传统方法较多,使得识别率有所提高。
为了实现上述目的,本发明采取的技术方案包括以下步骤:
步骤1、采集工程机械作业时候的声音和周围环境噪声,并将采集的声音信号建立声音样本库;
步骤2、对声音样本库中所有的声音信号进行预加重、分帧和加窗处理;
步骤3、求出经过步骤2处理后的每帧声音信号的短时能量谱;
步骤4、基于短时能量谱求出通过Mel三角滤波器组的短时能量;
步骤5、用立方根对短时能量进行强度-响度转换;
步骤6、对转换后的信号采用傅里叶逆变换转换到时域中;
步骤7、求出时域中信号的线性预测系数;
步骤8、基于线性预测系数计算倒谱系数,即所求的声音特征;
步骤9、对不同机械的声音特征进行标号,建立样本特征库;
步骤10、基于训练样本特征库,利用正则化极限学习机建立模型;
步骤11、重复步骤1-步骤8,对目标声音进行MF-PLPCC特征提取;
步骤12、利用正则化极限学习机对提取的目标声音特征和步骤10 建立的模型进行匹配,然后得出分类结果;
步骤13、根据分类结果,判断目标声音是哪种机械在作业或者是周围噪。
所述的步骤2对采集的声音信号作预加重,具体的:设声音信号为 x(n),采样率为fs,预加重处理后的信号为x(n)=x(n)-k*x(n-1),其中k为预加重系数,kk介于0.9~1之间;然后对预加重后的信号做分帧和加窗处理。
所述的步骤3求出每帧声音信号的短时能量谱,具体如下:
将经过步骤2处理得到的声音信号做短时傅里叶变换,然后根据频谱求出短时能量谱,设第i帧信号为si(n),对该帧信号作短时傅里叶变换得到Xi(k),通过计算得到短时能量谱为Pi(k)
Pi(k)=Re[Xi(k)]2+IM[xi(K)]2
所述的步骤4基于短时能量谱求出通过Mel三角滤波器组的短时能量,具体的:
将短时能量谱通过一组Mel尺度的三角滤波器组,得到Mel频谱的短时能量Si(m)。定义三角滤波器组的中心频率为f(m),m=1,2,…M,其中M为滤波器的个数,各个中心频率f(m)之间的间隔随着mm值的增大而增宽。
所述的步骤5用立方根对短时能量进行强度-响度转换,具体如下:
为了更好的模拟声音的强度和人耳所感受到响度间的非线性关系,用立方根幅度压缩进行强度-响度转换。
θi(m)=Si(m)1/3
式中,θi(m)表示的是经过强度-响度转换后的第i帧信号。
所述的步骤6对转换后的信号采用傅里叶逆变换转换到时域中,具体的将步骤5得到的转换后的信号经过傅里叶逆变换转化到时域中
yi(n)=IFFT(θi(m))
式中,yi(n)是θi(m)经过傅里叶逆变换转到时域的第i帧信号。
所述的步骤7求出时域中信号的线性预测系数,具体的:
一个声音的采样能够用过去若干个声音采样的线性组合来逼近。通过使线性预测到的采样在最小均方误差意义上逼近实际声音采样,能够求取一组唯一的线性预测系数。所述的线性预测系数就是线性组合中所用的加权系数。如公式所示:
y(n)≈a1y(n-1)+a2y(n-2)+…+apy(n-p)
其中,a1,a2,…,ap是自回归模型的线性预测系数(LPC),p为LPC的阶数。采用Durbin算法求解线性预测系数,Durbin算法是根据信号的自相关函数通过递归的方法求出线性预测系数a1,a2,…,ap
所述的步骤8基于线性预测系数计算倒谱系数,即所求的声音特征,具体实现如下:
将得到的pp阶自回归模型中的线性预测系数a1,a2,…,ap转换到倒谱域中。首先把步骤6转换后的时域中信号经过求Z变换后再取对数,然后再反Z变换就能够转化为倒谱系数。通过线性预测分析能够得到声道模型为全极点模型,假设全极点模型的传递函数为:
其中,ak为线性预测系数,在倒谱域中全极点模型的冲击响应为c(n),则模型的传递函数为
由式(1)和式(2)可以得到cn与an之间的关系如下:
式中c(1),c(2),…,c(n)为线性预测在倒谱域中的系数,也就是求得声音的特征,n为阶数。
本发明的有益效果如下:
本发明是基于声音的MF-PLPCC对工程机械的识别方法,该识别方法结合了MFCC和PLPCC两种方法的优点,即采用了MFCC中模拟人耳的听觉特性和PLPCC中模拟人耳掩蔽效应两个部分,使得这种方法更好地模拟人耳的听觉系统,能够更多的提取工程机械声音中的有用信息。通过实验得出,在近距离下或者信噪比高的情况下对工程机械的识别, MF-PLPCC识别方法跟MFCC、PLPCC等传统方法都有很高的识别率,但是在远距离或者信噪比低的情况下,MF-PLPCC识别方法比这些传统方法在识别率上有所提升。
附图说明
图1为本发明的基于MF-PLPCC对工程机械声音特征提取的流程图;
图2为本发明的基于MF-PLPCC对工程机械识别方法的流程图;
具体实施方式
下面结合的具体实施方式对本发明作详细说明,以下描述仅作为示范和解释,并不对本发明作任何形式上的限制。
如图1和2所示,基于MF-PLPCC特征对工程机械声音识别方法,具体实施步骤如下:
1、采集不同工程机械作业时候的声音和周围的环境噪声,建立声音样本库。
2、对采集的声音信号作预加重处理,设声音信号为x(n),采样率为 fs,预处理后的信号为x(n)=x(n)-k(n-1),其中k为预加重系数,k 介于0.9~1之间,这里k取0.9375;由于声音信号是时变的,在短时间范围内特征变化较小可以作为稳态来处理,因此对预加重后的信号进行分帧处理,每帧信号选取1024个采样点,为了使帧与帧之间平滑过渡,采用帧移为512个采样点;对分帧后的信号加上Hamming窗从而减少频谱泄露的情况。
3、设第i帧信号为si(n),然后对这帧信号作短时傅里叶变换变换得到Xi(k),通过计算得到短时能量谱为Pi(k)
Pi(k)=Re[Xi(k)]2+Im[Xi(k)]2
4、在语音的频谱范围内设置若干带通滤波器Hm(k),0≤m<M,M 为滤波器的个数。每个滤波器具有三角形滤波特性,其中心频率f(m),在Mel频率范围内,这些滤波器是等带宽的。每个带通滤波器的传递函数为
式中其中fl为滤波器频率范围的最低频率;fh为滤波器频率范围的最高频率;N为SFFT时的长度;Fmel的逆函数
根据得到每帧信号的能量谱Pi(k)和Mel滤波器的频域响应 Hm(k),0≤m<M,求出每帧信号的能量谱通过Mel滤波器后得到的Mel 频谱
式中Si(m)为每帧能量谱通过滤波器组后的Mel频谱,这里选取M取 40。
5、为了更好的模拟声音的强度和人耳所感受到响度间的非线性关系,用立方根幅度压缩进行强度-响度转换
θi(m)=Si(m)1/3
其中θi(m)为经过强度-响度转换后的第i帧信号。
6、对θi(m)作傅里叶逆变换转化到时域中
yi(n)=IFFT(θi(m))
式中yi(n)是θi(m)经过傅里叶逆变换转到时域的第i帧信号。
7、一个声音的采样能够用过去若干个声音采样的线性组合来逼近,通过使线性预测到的采样在最小均方误差意义上逼近实际语音采样,可以求取一组唯一的预测系数。这里的预测系数就是线性组合中所用的加权系数。如公式所示
y(n)≈a1y(n-1)+a2y(n-2)+…+apy(n-p)
其中a1,a2,…,ap是自回归模型的线性预测系数(LPC),p为LPC的阶数,这里取的是15。
Durbin算法是根据信号的自相关函数通过递归的方法求出线性预测系数a1,a2,…,ap
8、将得到的p阶自回归模型中的线性预测系数a1,a2,…,ap转换到倒谱域中。首先把信号经过求Z变换后再取对数,然后再反Z变换就可以转化为倒谱系数。通过线性预测分析可以得到声道模型为全极点模型,假设模型的传递函数为:
在倒谱域中,系统模型的冲击响应为c(n),系统的传递函数为
由式(1)和式(2)可以得到cn与an之间的关系如下:
式中c(1),c(2),…,c(n)为线性预测在倒谱域中的系数,n为阶数;通常情况下线性预测倒谱系数的取值范围在8到32阶之间,系数越多,其所反映出的信息也越多,但是运算量也会相应地增大,因此这里n取16 时可以反映大部分的声音信息。这里得到的倒谱系数也就是声音的特征。
9、对不同工程机械的声音和噪声特征标号,建立声音特征样本库;
10、利用正则化极限学习机对声音特征样本库进行训练,得到训练模型;
11、使用与样本声音同样的声音采集装置采集目标声音,按照与声音样本同样的步骤提取声音的特征
12、利用正则化极限学习机对目标声音的特征与模型进行匹配,得出分类结果。
13、根据正则化极限学习机提供的分类记过可以判断目标声音是那种工程机械作业的声音。

Claims (8)

1.基于MF-PLPCC特征对工程机械声音识别方法,其特征在于包括以下步骤:
步骤1、采集工程机械作业时候的声音和周围环境噪声,并将采集的声音信号建立声音样本库;
步骤2、对声音样本库中所有的声音信号进行预加重、分帧和加窗处理;
步骤3、求出经过步骤2处理后的每帧声音信号的短时能量谱;
步骤4、基于短时能量谱求出通过Mel三角滤波器组的短时能量;
步骤5、用立方根对短时能量进行强度-响度转换;
步骤6、对转换后的信号采用傅里叶逆变换转换到时域中;
步骤7、求出时域中信号的线性预测系数;
步骤8、基于线性预测系数计算倒谱系数,即所求的声音特征;
步骤9、对不同机械的声音特征进行标号,建立样本特征库;
步骤10、基于训练样本特征库,利用正则化极限学习机建立模型;
步骤11、重复步骤1-步骤8,对目标声音进行MF-PLPCC特征提取;
步骤12、利用正则化极限学习机对提取的目标声音特征和步骤10建立的模型进行匹配,然后得出分类结果;
步骤13、根据分类结果,判断目标声音是哪种机械在作业或者是周围噪。
2.根据权利要求1所述的基于MF-PLPCC特征对工程机械声音识别方法,其特征在于所述的步骤2对采集的声音信号作预加重,具体的:设声音信号为x(n),采样率为fs,预加重处理后的信号为x(n)=x(n)-k*x(n-1),其中k为预加重系数,k介于0.9~1之间;然后对预加重后的信号做分帧和加窗处理。
3.根据权利要求1所述的基于MF-PLPCC特征对工程机械声音识别方法,其特征在于所述的步骤3求出每帧声音信号的短时能量谱,具体如下:
将经过步骤2处理得到的声音信号做短时傅里叶变换,然后根据频谱求出短时能量谱,设第ii帧信号为si(n),对该帧信号作短时傅里叶变换得到Xi(k),通过计算得到短时能量谱为Pi(k)
X i ( k ) = &Sigma; n = 0 N - 1 s i ( n ) e - j 2 n &pi; N k
Pi(k)=Re[Xi(k)]2+Im[Xi(k)]2
4.根据权利要求1所述的基于MF-PLPCC特征对工程机械声音识别方法,其特征在于所述的步骤4基于短时能量谱求出通过Mel三角滤波器组的短时能量,具体的:
将短时能量谱通过一组Mel尺度的三角滤波器组,得到Mel频谱的短时能量Si(m);定义三角滤波器组的中心频率为f(m),m=1,2,…M,其中M为滤波器的个数,各个中心频率f(m)之间的间隔随着m值的增大而增宽。
5.根据权利要求1所述的基于MF-PLPCC特征对工程机械声音识别方法,其特征在于所述的步骤5用立方根对短时能量进行强度-响度转换,具体如下:
为了更好的模拟声音的强度和人耳所感受到响度间的非线性关系,用立方根幅度压缩进行强度-响度转换;
θi(m)=Si(m)1/3
式中,θi(m)表示的是经过强度-响度转换后的第i帧信号。
6.根据权利要求1所述的基于MF-PLPCC特征对工程机械声音识别方法,其特征在于所述的步骤6对转换后的信号采用傅里叶逆变换转换到时域中,具体的将步骤5得到的转换后的信号经过傅里叶逆变换转化到时域中
yi(n)=IFFT(θi(m))
式中,yi(n)是θi(m)经过傅里叶逆变换转到时域的第i帧信号。
7.根据权利要求1所述的基于MF-PLPCC特征对工程机械声音识别方法,其特征在于所述的步骤7求出时域中信号的线性预测系数,具体的:
一个声音的采样能够用过去若干个声音采样的线性组合来逼近;通过使线性预测到的采样在最小均方误差意义上逼近实际声音采样,能够求取一组唯一的线性预测系数;所述的线性预测系数就是线性组合中所用的加权系数;如公式所示:
y(n)≈a1y(n-1)+a2y(n-2)+…+apy(n-p)
其中,a1,a2,…,ap是自回归模型的线性预测系数(LPC),pp为LPC的阶数;采用Durbin算法求解线性预测系数,Durbin算法是根据信号的自相关函数通过递归的方法求出线性预测系数a1,a2,…,ap
8.根据权利要求1所述的基于MF-PLPCC特征对工程机械声音识别方法,其特征在于所述的步骤8基于线性预测系数计算倒谱系数,即所求的声音特征,具体实现如下:
将得到的p阶自回归模型中的线性预测系数a1,a2,…,ap转换到倒谱域中;首先把步骤6转换后的时域中信号经过求Z变换后再取对数,然后再反Z变换就能够转化为倒谱系数;通过线性预测分析能够得到声道模型为全极点模型,假设全极点模型的传递函数为:
H ( z ) = 1 1 - &Sigma; k = 1 p &alpha; k z - k - - - ( 1 )
其中,ak为线性预测系数,在倒谱域中全极点模型的冲击响应为c(n),则模型的传递函数为
H ^ ( z ) = log H ( z ) = &Sigma; n = 0 &infin; c ( n ) z - n - - - ( 2 )
由式(1)和式(2)可以得到cn与an之间的关系如下:
c ( 1 ) = a 1 c ( n ) = a n + &Sigma; k = 1 n - 1 ( 1 - k n ) a k c ( n - k ) k < n &le; p c ( n ) = &Sigma; k = 1 p ( 1 - k n ) a k c ( n - k ) n &GreaterEqual; p
式中c(1),c(2),…,c(n)为线性预测在倒谱域中的系数,也就是求得声音的特征,n为阶数。
CN201710060595.3A 2017-01-25 2017-01-25 基于mf‑plpcc特征的工程机械声音识别方法 Pending CN106992011A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710060595.3A CN106992011A (zh) 2017-01-25 2017-01-25 基于mf‑plpcc特征的工程机械声音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710060595.3A CN106992011A (zh) 2017-01-25 2017-01-25 基于mf‑plpcc特征的工程机械声音识别方法

Publications (1)

Publication Number Publication Date
CN106992011A true CN106992011A (zh) 2017-07-28

Family

ID=59414161

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710060595.3A Pending CN106992011A (zh) 2017-01-25 2017-01-25 基于mf‑plpcc特征的工程机械声音识别方法

Country Status (1)

Country Link
CN (1) CN106992011A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108490349A (zh) * 2018-01-23 2018-09-04 浙江大学山东工业技术研究院 基于Mel频率倒谱系数的电机异音检测方法
CN108847252A (zh) * 2018-04-26 2018-11-20 杭州电子科技大学 基于声信号语谱图纹理分布的声特征提取方法
CN109243486A (zh) * 2018-09-13 2019-01-18 西安电子科技大学 一种基于机器学习的反黑飞声探测方法
CN109410542A (zh) * 2018-08-31 2019-03-01 南通大学 基于ZigBee无线通信的育婴箱自动巡查报警系统
CN110824006A (zh) * 2019-11-08 2020-02-21 南通大学 一种基于智能声信息识别的焊后焊缝冲击质量判别方法
CN111540373A (zh) * 2020-01-12 2020-08-14 杭州电子科技大学 基于超复数随机神经网络的城市噪声识别方法
CN111898508A (zh) * 2020-07-22 2020-11-06 桂林电子科技大学 一种基于听觉感知的电动冲击批零件缺损的检测方法
CN112364927A (zh) * 2020-11-17 2021-02-12 哈尔滨市科佳通用机电股份有限公司 基于滤波器组的异物检测方法
CN112967732A (zh) * 2021-02-25 2021-06-15 北京百度网讯科技有限公司 调整均衡器的方法、装置、设备和计算机可读存储介质
CN113345399A (zh) * 2021-04-30 2021-09-03 桂林理工大学 一种强噪声环境下的机器设备声音监测方法
CN113702513A (zh) * 2021-07-16 2021-11-26 陕西师范大学 一种基于预测函数模型识别金属材料的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844257A (zh) * 2016-04-11 2016-08-10 吉林大学 基于机器视觉雾天行车错失道路标志牌的预警系统及方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105844257A (zh) * 2016-04-11 2016-08-10 吉林大学 基于机器视觉雾天行车错失道路标志牌的预警系统及方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BABU KAJI BANIYA ET AL.: "Automatic Music Genre Classification Using Timbral Texture and Rhythmic Content Features", 《ICACT TRANSACTIONS ON ADVANCED COMMUNICATIONS TECHNOLOGY》 *
宋知用: "《MATLAB数字信号处理85个实用案例精讲 入门到进阶》", 30 November 2016, 北京航空航天大学出版社 *
朱杰: "面向短波通信的文本无关说话人辨识研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陈雪振: "基于极限学习机的变压器故障预测方法研究", 《中国优秀硕士学位论文全文数据库 工程科技II辑》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108490349A (zh) * 2018-01-23 2018-09-04 浙江大学山东工业技术研究院 基于Mel频率倒谱系数的电机异音检测方法
CN108847252A (zh) * 2018-04-26 2018-11-20 杭州电子科技大学 基于声信号语谱图纹理分布的声特征提取方法
CN109410542A (zh) * 2018-08-31 2019-03-01 南通大学 基于ZigBee无线通信的育婴箱自动巡查报警系统
CN109243486A (zh) * 2018-09-13 2019-01-18 西安电子科技大学 一种基于机器学习的反黑飞声探测方法
CN110824006B (zh) * 2019-11-08 2021-12-28 南通大学 一种基于智能声信息识别的焊后焊缝冲击质量判别方法
CN110824006A (zh) * 2019-11-08 2020-02-21 南通大学 一种基于智能声信息识别的焊后焊缝冲击质量判别方法
CN111540373A (zh) * 2020-01-12 2020-08-14 杭州电子科技大学 基于超复数随机神经网络的城市噪声识别方法
CN111540373B (zh) * 2020-01-12 2022-12-02 杭州电子科技大学 基于超复数随机神经网络的城市噪声识别方法
CN111898508A (zh) * 2020-07-22 2020-11-06 桂林电子科技大学 一种基于听觉感知的电动冲击批零件缺损的检测方法
CN111898508B (zh) * 2020-07-22 2022-06-10 桂林电子科技大学 一种基于听觉感知的电动冲击批零件缺损的检测方法
CN112364927A (zh) * 2020-11-17 2021-02-12 哈尔滨市科佳通用机电股份有限公司 基于滤波器组的异物检测方法
CN112967732A (zh) * 2021-02-25 2021-06-15 北京百度网讯科技有限公司 调整均衡器的方法、装置、设备和计算机可读存储介质
CN112967732B (zh) * 2021-02-25 2023-10-03 北京百度网讯科技有限公司 调整均衡器的方法、装置、设备和计算机可读存储介质
CN113345399A (zh) * 2021-04-30 2021-09-03 桂林理工大学 一种强噪声环境下的机器设备声音监测方法
CN113702513A (zh) * 2021-07-16 2021-11-26 陕西师范大学 一种基于预测函数模型识别金属材料的方法

Similar Documents

Publication Publication Date Title
CN106992011A (zh) 基于mf‑plpcc特征的工程机械声音识别方法
CN102163427B (zh) 一种基于环境模型的音频异常事件检测方法
Agrawal et al. Novel TEO-based Gammatone features for environmental sound classification
CN102664006B (zh) 基于时频域分析的异常人声检测方法
CN104157290A (zh) 一种基于深度学习的说话人识别方法
CN103310788A (zh) 一种语音信息识别方法及系统
CN104835498A (zh) 基于多类型组合特征参数的声纹识别方法
CN104200804A (zh) 一种面向人机交互的多类信息耦合的情感识别方法
CN111785285A (zh) 面向家居多特征参数融合的声纹识别方法
CN101226743A (zh) 基于中性和情感声纹模型转换的说话人识别方法
CN102655003B (zh) 基于声道调制信号mfcc的汉语语音情感点识别方法
CN104900229A (zh) 一种语音信号混合特征参数的提取方法
CN104916289A (zh) 行车噪声环境下快速声学事件的检测方法
CN105825852A (zh) 一种英语口语朗读考试评分方法
CN104078039A (zh) 基于隐马尔科夫模型的家用服务机器人语音识别系统
CN104167207A (zh) 一种基于变电站巡检机器人的设备声音识别方法
CN105448291A (zh) 基于语音的帕金森症检测方法及检测系统
CN113823293B (zh) 一种基于语音增强的说话人识别方法及系统
CN105825857A (zh) 基于声纹识别帮助失聪患者判断声音类别的方法
CN109036470A (zh) 语音区分方法、装置、计算机设备及存储介质
CN104778948A (zh) 一种基于弯折倒谱特征的抗噪语音识别方法
CN105916090A (zh) 一种基于智能化语音识别技术的助听器系统
CN114352486A (zh) 一种基于分类的风电机组叶片音频故障检测方法
CN101620852A (zh) 一种基于改进二次判别式的语音情感识别方法
Jadhav et al. Sound classification using python

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170728