CN111261189B - 一种车辆声音信号特征提取方法 - Google Patents
一种车辆声音信号特征提取方法 Download PDFInfo
- Publication number
- CN111261189B CN111261189B CN202010252702.4A CN202010252702A CN111261189B CN 111261189 B CN111261189 B CN 111261189B CN 202010252702 A CN202010252702 A CN 202010252702A CN 111261189 B CN111261189 B CN 111261189B
- Authority
- CN
- China
- Prior art keywords
- fundamental frequency
- sound signal
- adaptive
- mel
- filter bank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 68
- 238000000605 extraction Methods 0.000 title claims abstract description 15
- 238000001228 spectrum Methods 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 7
- 230000003044 adaptive effect Effects 0.000 claims description 26
- 238000005311 autocorrelation function Methods 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 4
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000004568 cement Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及一种车辆声音信号特征提取方法,包括:对车辆声音信号进行预处理,同时提取基频;作快速傅里叶变换,计算出信号能量谱;将声音信号基频与梅尔三角滤波器组的中心频率进行组合,得到基频自适应三角滤波器组;将信号能量谱通过基频自适应三角滤波器组,得到基频自适应梅尔能量谱;对基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应梅尔倒谱系数;对基频自适应梅尔倒谱系数的每一维分量进行加权,得到最终的车辆声音信号特征。本发明降低了同种车型声音信号特征间的区分度,增大了不同车型声音信号特征之间的差别,从而提高声音信号特征的抗噪能力以及在野外环境下的鲁棒性。
Description
技术领域
本发明涉及声音信号识别领域,更具体地涉及一种车辆声音信号特征提取方法。
背景技术
根据车辆行进过程中采集到的声音信号来对野外车辆目标进行识别,一般分为两个步骤:首先提取声音传感器采集到的声信号的特征;其次设计分类器以得到判别结果。目前常用的声信号特征有基于小波包变换提取的特征、线性预测倒谱系数、梅尔倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)、基于经验模态分解提取的特征等。其中,MFCC较常见,被广泛用于语种识别、说话人识别、声纹识别等领域,近年来被成功应用于车辆目标的分类识别。
由于人的听觉系统是一个非线性系统,人耳对声音信号原始频谱的感知是非线性的。随着声音信号的频率降低,人耳接收信号的能力愈发敏感。为了使人耳对声音信号的敏感程度与信号频率呈现线性关系,MFCC参数将信号频谱作映射处理,将原始频率转化为梅尔频率的公式为:
式中,M(f)为梅尔频率,f为声音信号原始频率。在梅尔频域内,人耳对声音信号的感知度是线性的。
传统的MFCC在识别纯净的声音信号时,可以得到很好的识别结果。但是MFCC对噪声的敏感度很高,当采集的实际声音信号包含噪声信息时,识别效果易受干扰,难以预测识别效果是否符合实际需求。而且,当风力等级变化时,很容易造成训练样本集与测试样本集的不匹配,所以车辆识别领域的应用场景受到限制。
发明内容
本发明提供一种车辆声音信号特征提取方法,降低噪声对识别效果的干扰,减少应用场景的限制。
本发明提供的一种车辆声音信号特征提取方法,包括:
步骤S1,对车辆声音信号进行预处理,同时提取车辆声音信号的基频;
步骤S2,对预处理之后的声音信号作快速傅里叶变换,并计算出信号的能量谱;
步骤S3,将所述声音信号的基频与梅尔三角滤波器组的中心频率进行组合,得到基频自适应的三角滤波器组;
步骤S4,将所述信号能量谱通过所述基频自适应的三角滤波器组,得到基频自适应梅尔能量谱;
步骤S5,对所述基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应梅尔倒谱系数;
步骤S6,对所述基频自适应梅尔倒谱系数的每一维分量进行加权,得到最终的车辆声音信号特征。
所述步骤S1中的预处理包括预加重、分帧以及加窗。
采用谱减-自相关函数法提取所述车辆声音信号的基频。
所述步骤S3中基频自适应三角滤波器组的设计方法为:将车辆声音信号的基频fb与梅尔三角滤波器组各滤波器的中心频率F=(f1,f2,…,fN)按升序排列,组合成新的向量Fb=(f1,f2,…,fb,…,fN+1),Fb向量的各个分量为基频自适应三角滤波器组各滤波器的中心频率;其中,N为梅尔三角滤波器组的滤波器个数。
所述基频自适应的三角滤波器组按如下公式描述:
式中,Hi(k)表示滤波器参数;i=1,2,K,N,N表示梅尔三角滤波器组的滤波器个数;f(i)表示第i个滤波器的中心频率;k是滤波器组的自变量,表示频率。
所述步骤S4中基频自适应梅尔能量谱的计算方法为:将信号的能量谱与所述基频自适应三角滤波器组中的滤波器参数相乘。
所述步骤S5中的倒谱分析包括:首先对所述基频自适应梅尔能量谱取对数,得到对数能量谱;然后对所述对数能量谱进行离散余弦变换。
所述步骤S6包括:
步骤S61,计算所述基频自适应梅尔倒谱系数第n维特征分量的F比;
步骤S62,以计算出的F比为权重,对基频自适应梅尔倒谱系数的每一维特征分量进行加权。
所述基频自适应梅尔倒谱系数第n维特征分量的F比按下式进行计算:
式中,M表示车辆类别数,其中第l个类别包含Nl条样本信号;n=1,2,K,N+1,N+1为基频自适应三角滤波器组的个数,即基频自适应梅尔倒谱系数的特征维数;为第l类车辆第j条样本的第n维特征分量的所有帧之和;ml(n)为第n维特征分量在第l类车辆中Nl条样本的所有帧之和;m(n)为第n维特征分量在整个数据集中的所有帧之和。
所述基频自适应梅尔倒谱系数的每一维特征分量进行加权的计算方法为:将F(n)和第n维的基频自适应梅尔倒谱系数相乘;其中,n=1,2,K,N+1,N+1为基频自适应三角滤波器组的个数,F(n)表示基频自适应梅尔倒谱系数第n维特征分量的F比。
本发明根据车辆目标信号的频谱特征,自适应地增加车辆基频信息在特征中的比重,然后进行F比加权,以降低同种车型声音信号特征间的区分度,增大不同车型声音信号特征之间的差别,从而提高了声音信号特征的抗噪能力以及在野外环境下的鲁棒性。
附图说明
图1(a)是轻型轮式车声音信号频谱图;图1(b)是轮式装甲车声音信号频谱图;图1(c)是履带车声音信号频谱图。
图2是按照本发明的车辆声音信号特征提取方法的流程图。
图3(a)是传统梅尔三角滤波器组的示意图,图3(b)是图2步骤S3中的基频自适应三角滤波器组的示意图。
图4为实验场景示意图。
具体实施方式
下面结合附图,给出本发明的较佳实施例,并予以详细描述。
本发明针对处于野外环境中的车辆,在传统的MFCC特征提取算法的基础上进行改进。从图1(a)-(c)中可以看出,不同车型的车辆声音信号的基频是不同的,因此将车辆声音信号的基频作为车辆目标识别的特征能够增大不同车型声音信号特征之间的差别。
基于上述原理,本发明的车辆声音信号特征提取方法,如图2所示,包括:
步骤S1,对车辆声音信号进行预处理,同时提取车辆声音信号的基频fb。
其中,预处理包括预加重、分帧以及加窗。预加重是指让声音信号通过一个高通滤波器;分帧是指对声音信号进行采样,取若干个采样点集合成一帧信号;加窗是将每一帧信号代入窗函数,以消除各个帧两端可能会造成的信号不连续性。
常用的基频提取算法包括自相关函数法、倒谱法、谱减-自相关函数法、平均幅度差函数法、简化逆滤波法等。考虑到野外环境噪声大的实际情况,本实施例采用谱减-自相关函数法提取车辆声音信号的基频fb。
步骤S2,对预处理之后的声音信号作快速傅里叶变换,并计算出每帧信号的能量谱,能量谱即为信号频谱的平方。
步骤S3,将车辆声音信号的基频fb与传统梅尔三角滤波器组的中心频率进行组合,得到基频自适应的三角滤波器组。基频自适应的三角滤波器组具体设计方法如下:
设传统梅尔三角滤波器组包含N个滤波器,其中心频率组成向量F=(f1,f2,…,fN)。在这N个滤波器中增加一个新滤波器,该新滤波器的中心频率为车辆声音信号的基频fb,将这N+1个滤波器的中心频率按升序重新排列,组合成新的向量Fb=(f1,f2,…,fb,…,fN+1),将Fb向量的各个分量作为各滤波器的中心频率,即得到基频自适应的三角滤波器组。基频自适应的三角滤波器组可用公式(2)来表示,如下所示:
式中,Hi(k)表示滤波器参数;i=1,2,K,N,N表示传统梅尔三角滤波器组的滤波器个数;f(i)表示第i个滤波器的中心频率;k是滤波器组的自变量,表示频率。
上述公式用于描述三角滤波器组,滤波器参数指的是每个三角形形状的数据分布。传统梅尔三角滤波器组如图3(a)所示,基频自适应的三角滤波器组如图3(b)所示,从图中可以看到,第i个三角形顶点为1,除此三角形数据分布之外的点都为0,且有值部分数据呈三角形分布。基频自适应的三角滤波器组比传统的梅尔三角滤波器组增加了一个三角滤波器,该增加的滤波器的中心频率是车辆声音信号的基频,能够保证基频的权重较高。三角滤波器组和信号能量谱的自变量都是频率,所以将信号能量谱通过滤波器组滤波,可以提取有效信息。
因而,步骤S4,将步骤S2中的信号能量谱通过基频自适应的三角滤波器组,得到基频自适应的梅尔能量谱。具体计算方法是:将每一帧信号的能量谱与基频自适应三角滤波器组的滤波器参数相乘,举例说明:设每条声音信号帧数为S,快速傅里叶变换的点数(即采样点数)为512,则该条信号的能量谱是S×512的矩阵,基频自适应滤波器组是512×(N+1)的矩阵,因此相乘之后的结果是S×(N+1)的矩阵,该S×(N+1)的矩阵即为基频自适应的梅尔能量谱。
步骤S5,对基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应的梅尔倒谱系数。倒谱分析包括:首先对基频自适应的梅尔能量谱取对数,得到对数能量谱;然后对对数能量谱进行离散余弦变换。
由于基频自适应梅尔倒谱系数的每一维分量对表征车辆声音信号特征的贡献率不同,因此为了增加不同车辆类别间的声音信号特征差距,使同一车辆类别的声音信号特征更为紧凑,本发明还包括步骤S6:对基频自适应梅尔倒谱系数的每一维分量进行F比加权。F比参数在Fisher准则基础上提出,由类间离散度与类内离散度之比得到,可定量分析特征向量每一维分量的有效性。将基频自适应梅尔倒谱系数视为特征向量,步骤S6具体包括:
步骤S61,设数据集包含M种车辆类别的车辆声音信号,其中第l个类型包含Nl条样本信号,则基频自适应梅尔倒谱系数第n维特征分量的F比具体计算公式如下:
式中,n=1,2,K,N+1,N+1为基频自适应梅尔倒谱系数特征维数,即基频自适应三角滤波器组的个数;为第l类车辆第j条样本的第n维特征分量的所有帧之和;ml(n)为第n维特征分量在第l类车辆中Nl条样本的所有帧之和;m(n)为第n维特征分量在整个数据集中的所有帧之和。
步骤S62,以公式(3)中计算出的F比为权重,对基频自适应梅尔倒谱系数的每一维特征分量进行加权,即将F(n)和第n维的基频自适应梅尔倒谱系数相乘,得到最终本发明的车辆声音信号特性。
通过上述F比加权计算,能够提高贡献率较高的特征分量的作用,削弱贡献率较低的特征分量的干扰,从而提取出更能体现不同车辆类别间差异的特征。
以下通过实验数据进一步说明本发明的优点。
实验采用MATLAB R2015b平台仿真,样本信号采用ICS40720传声器设备进行采集,外场实验场景如图4所示,目标车辆从起始位置行驶到终止位置,麦克风便采集到一条完整的样本。
为验证算法有效性,共采集硬土路、砂石路、水泥路及草地四种不同路面的车辆声音信号作为样本。车辆类型分为履带车、轮式装甲车和轻型轮式车三种类型,并将样本数按照70%和30%的比例随机分为训练集和测试集,用于仿真实验。
首先提取维度为23的传统MFCC特征,然后提取维度为24的基频自适应的梅尔倒谱特征,最后对其进行F比加权,提取特征按上述步骤进行,在此不再赘述。
识别效果采用识别准确率、漏警率和虚警率三个标准进行评判,实验结果如表1所示:表格中方法一表示用传统的MFCC作特征;方法二表示用谱减-自相关法提取基频,然后用基频自适应MFCC作特征;方法三在方法二的基础上进行F比加权。提取特征后,选择在声音识别领域效果好,且计算量较小的GMM分类器进行识别。
表1野外车辆识别结果
分析表中数据可得,F比加权的基频自适应梅尔倒谱参数与传统的MFCC相比,识别准确率提高,漏警率降和虚警率均降低,有更高的鲁棒性,更加适用于野外环境中车辆的识别。
以上所述的,仅为本发明的较佳实施例,并非用以限定本发明的范围,本发明的上述实施例还可以做出各种变化。即凡是依据本发明申请的权利要求书及说明书内容所作的简单、等效变化与修饰,皆落入本发明专利的权利要求保护范围。本发明未详尽描述的均为常规技术内容。
Claims (7)
1.一种车辆声音信号特征提取方法,其特征在于,包括:
步骤S1,对车辆声音信号进行预处理,同时提取车辆声音信号的基频;
步骤S2,对预处理之后的声音信号作快速傅里叶变换,并计算出信号的能量谱;
步骤S3,将所述声音信号的基频与梅尔三角滤波器组的中心频率进行组合,得到基频自适应的三角滤波器组;
步骤S4,将所述信号能量谱通过所述基频自适应的三角滤波器组,得到基频自适应梅尔能量谱;
步骤S5,对所述基频自适应的梅尔能量谱进行倒谱分析,得到基频自适应梅尔倒谱系数;
步骤S6,对所述基频自适应梅尔倒谱系数的每一维分量进行加权,得到最终的车辆声音信号特征,包括:
步骤S61,按照下式计算所述基频自适应梅尔倒谱系数第n维特征分量的F比:
式中,M表示车辆类别数,其中第l个类别包含Nl条样本信号;n=1,2,...,N+1,N+1为基频自适应梅尔倒谱系数的特征维数;为第l类车辆第j条样本的第n维特征分量的所有帧之和;ml(n)为第n维特征分量在第l类车辆中Nl条样本的所有帧之和;m(n)为第n维特征分量在整个数据集中的所有帧之和;
步骤S62,以计算出的F比为权重,将F(n)和第n维的基频自适应梅尔倒谱系数相乘,以对基频自适应梅尔倒谱系数的每一维特征分量进行加权。
2.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,所述步骤S1中的预处理包括预加重、分帧以及加窗。
3.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,采用谱减-自相关函数法提取所述车辆声音信号的基频。
4.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,所述步骤S3中基频自适应三角滤波器组的设计方法为:将车辆声音信号的基频fb与梅尔三角滤波器组各滤波器的中心频率F=(f1,f2,…,fN)按升序排列,组合成新的向量Fb=(f1,f2,…,fb,…,fN+1),Fb向量的各个分量为基频自适应三角滤波器组各滤波器的中心频率;其中,N为梅尔三角滤波器组的滤波器个数。
6.根据权利要求5所述的车辆声音信号特征提取方法,其特征在于,所述步骤S4中基频自适应梅尔能量谱的计算方法为:将信号的能量谱与所述基频自适应三角滤波器组中的滤波器参数相乘。
7.根据权利要求1所述的车辆声音信号特征提取方法,其特征在于,所述步骤S5中的倒谱分析包括:首先对所述基频自适应梅尔能量谱取对数,得到对数能量谱;然后对所述对数能量谱进行离散余弦变换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010252702.4A CN111261189B (zh) | 2020-04-02 | 2020-04-02 | 一种车辆声音信号特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010252702.4A CN111261189B (zh) | 2020-04-02 | 2020-04-02 | 一种车辆声音信号特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111261189A CN111261189A (zh) | 2020-06-09 |
CN111261189B true CN111261189B (zh) | 2023-01-31 |
Family
ID=70951751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010252702.4A Active CN111261189B (zh) | 2020-04-02 | 2020-04-02 | 一种车辆声音信号特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111261189B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113160797B (zh) * | 2021-04-25 | 2023-06-02 | 北京华捷艾米科技有限公司 | 音频特征处理方法及装置、存储介质及电子设备 |
CN113823089A (zh) * | 2021-09-19 | 2021-12-21 | 广州丹雅科技有限公司 | 交通量检测方法、装置、电子设备及可读存储介质 |
CN114199594B (zh) * | 2021-12-14 | 2022-10-21 | 奇瑞汽车股份有限公司 | 车辆转向异响识别方法及系统 |
CN114485878B (zh) * | 2022-01-26 | 2024-04-09 | 何剑虹 | 基于动态能谱分析进行车辆动态重量测量方法及其系统 |
CN114680861B (zh) * | 2022-04-21 | 2023-06-27 | 无锡康莱医疗科技有限公司 | 一种基于智能识别技术的气道最小密闭压监测方法及系统 |
CN115840877B (zh) * | 2022-12-06 | 2023-07-07 | 中国科学院空间应用工程与技术中心 | Mfcc提取的分布式流处理方法、系统、存储介质及计算机 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777347A (zh) * | 2009-12-07 | 2010-07-14 | 中国科学院自动化研究所 | 一种模型互补的汉语重音识别方法及系统 |
CN101930733A (zh) * | 2010-09-03 | 2010-12-29 | 中国科学院声学研究所 | 一种用于语音情感识别的语音情感特征提取方法 |
CN103994820A (zh) * | 2014-04-21 | 2014-08-20 | 中国科学院上海微系统与信息技术研究所 | 一种基于微孔径麦克风阵列的运动目标识别方法 |
JP2017102247A (ja) * | 2015-12-01 | 2017-06-08 | 国立研究開発法人産業技術総合研究所 | 音声対話システム、音声対話制御法およびプログラム |
CN108922514A (zh) * | 2018-09-19 | 2018-11-30 | 河海大学 | 一种基于低频对数谱的鲁棒特征提取方法 |
CN109920447A (zh) * | 2019-01-29 | 2019-06-21 | 天津大学 | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7243063B2 (en) * | 2002-07-17 | 2007-07-10 | Mitsubishi Electric Research Laboratories, Inc. | Classifier-based non-linear projection for continuous speech segmentation |
US8812310B2 (en) * | 2010-08-22 | 2014-08-19 | King Saud University | Environment recognition of audio input |
US9460720B2 (en) * | 2013-08-28 | 2016-10-04 | Texas Instruments Incorporated | Powering-up AFE and microcontroller after comparing analog and truncated sounds |
US20180005463A1 (en) * | 2016-06-30 | 2018-01-04 | Massachusetts lnstitute of Technology | System, Device, and Method for Feature Generation, Selection, and Classification for Audio Detection of Anomalous Engine Operation |
CN108847253B (zh) * | 2018-09-05 | 2023-06-13 | 平安科技(深圳)有限公司 | 车辆型号识别方法、装置、计算机设备及存储介质 |
CN114121025A (zh) * | 2021-11-24 | 2022-03-01 | 国网信息通信产业集团有限公司 | 一种面向变电站设备的声纹故障智能检测方法及装置 |
-
2020
- 2020-04-02 CN CN202010252702.4A patent/CN111261189B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101777347A (zh) * | 2009-12-07 | 2010-07-14 | 中国科学院自动化研究所 | 一种模型互补的汉语重音识别方法及系统 |
CN101930733A (zh) * | 2010-09-03 | 2010-12-29 | 中国科学院声学研究所 | 一种用于语音情感识别的语音情感特征提取方法 |
CN103994820A (zh) * | 2014-04-21 | 2014-08-20 | 中国科学院上海微系统与信息技术研究所 | 一种基于微孔径麦克风阵列的运动目标识别方法 |
JP2017102247A (ja) * | 2015-12-01 | 2017-06-08 | 国立研究開発法人産業技術総合研究所 | 音声対話システム、音声対話制御法およびプログラム |
CN108922514A (zh) * | 2018-09-19 | 2018-11-30 | 河海大学 | 一种基于低频对数谱的鲁棒特征提取方法 |
CN109920447A (zh) * | 2019-01-29 | 2019-06-21 | 天津大学 | 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法 |
Non-Patent Citations (5)
Title |
---|
A Novel Approach for MFCC Feature Extraction;Md. Afzal Hossan et al;《2010 4th International Conference on Signal Processing and Communication Systems》;20110204;全文 * |
A Robust Feature Extraction Algorithm for the Classification of Acoustic Targets in Wild Environments;Jingchang Huang et al;《Circuits Syst Signal Process》;20150108;全文 * |
AN INVESTIGATION INTO THE CORRELATION AND PREDICTION OF ACOUSTIC SPEECH FEATURES FROM MFCC VECTORS;Jonathan Darch et al;《2007 IEEE International Conference on Acoustics,Speech,and Signal Processing》;20070604;全文 * |
基于基频的梅尔倒谱系数在车辆识别中的应用;李成娟等;《重庆大学学报》;20211115;全文 * |
基于深度学习的语音情感识别研究;金碧程;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20181015;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111261189A (zh) | 2020-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111261189B (zh) | 一种车辆声音信号特征提取方法 | |
CN108711436B (zh) | 基于高频和瓶颈特征的说话人验证系统重放攻击检测方法 | |
Li et al. | An auditory-based feature extraction algorithm for robust speaker identification under mismatched conditions | |
CN112116920B (zh) | 一种说话人数未知的多通道语音分离方法 | |
KR20200115731A (ko) | 컨볼루션 뉴럴 네트워크에 기반한 음향 이벤트 인식 방법 및 장치 | |
CN102968990B (zh) | 说话人识别方法和系统 | |
CN104900229A (zh) | 一种语音信号混合特征参数的提取方法 | |
Wang et al. | ia-PNCC: Noise Processing Method for Underwater Target Recognition Convolutional Neural Network. | |
Wickramasinghe et al. | Frequency Domain Linear Prediction Features for Replay Spoofing Attack Detection. | |
Kamble et al. | Detection of replay spoof speech using teager energy feature cues | |
CN113823293B (zh) | 一种基于语音增强的说话人识别方法及系统 | |
CN109147798B (zh) | 语音识别方法、装置、电子设备及可读存储介质 | |
CN111508504A (zh) | 基于听觉中枢感知机理的说话人识别方法 | |
CN103557925B (zh) | 水下目标gammatone离散小波系数听觉特征提取方法 | |
CN105679321A (zh) | 语音识别方法、装置及终端 | |
Maganti et al. | Auditory processing-based features for improving speech recognition in adverse acoustic conditions | |
CN111261192A (zh) | 一种基于lstm网络的音频检测方法、电子设备及存储介质 | |
Kaminski et al. | Automatic speaker recognition using a unique personal feature vector and Gaussian Mixture Models | |
Guo et al. | Underwater target detection and localization with feature map and CNN-based classification | |
CN116597853A (zh) | 一种音频消噪方法 | |
CN116110417A (zh) | 一种面向超声波声纹防伪的数据增强方法及装置 | |
CN111968671B (zh) | 基于多维特征空间的低空声目标综合识别方法及装置 | |
Patil et al. | Significance of cmvn for replay spoof detection | |
Al-Ali et al. | Enhanced forensic speaker verification performance using the ICA-EBM algorithm under noisy and reverberant environments | |
Thiruvaran et al. | Group delay features for speaker recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |