CN103559893B - 一种水下目标gammachirp倒谱系数听觉特征提取方法 - Google Patents
一种水下目标gammachirp倒谱系数听觉特征提取方法 Download PDFInfo
- Publication number
- CN103559893B CN103559893B CN201310488534.9A CN201310488534A CN103559893B CN 103559893 B CN103559893 B CN 103559893B CN 201310488534 A CN201310488534 A CN 201310488534A CN 103559893 B CN103559893 B CN 103559893B
- Authority
- CN
- China
- Prior art keywords
- gammachirp
- target
- wave filter
- cepstrum coefficient
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Stereophonic System (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
本发明提出的一种水下目标gammachirp倒谱系数听觉特征提取方法,以傅里叶变换和对数压缩为基础,结合gammachirp听觉滤波器组,首先对实测的噪声数据进行预处理,以使目标信号在短时内表示为近似平稳,然后对预处理后的数据进行傅里叶变换,将时域信号处理转化为频域信号进行处理,接着让其通过gammachirp听觉滤波器组进行听觉滤波并使用对数压缩,最后对对数压缩后的数据进行离散余弦变换,使其维数降低。这种基于gammachirp频率听觉感知倒谱系数的特征提取方法,可以提取出水下目标辐射噪声有效的听觉特征,从而提高水下目标的正确识别率。
Description
技术领域
本发明涉及一种水下目标gammachirp倒谱系数听觉特征提取方法,可应用于水下目标辐射噪声的分类识别。
背景技术
水下目标特征提取是指从经过预处理的水下目标辐射噪声波形中提取反映其特点、类型的一组特征(时域特征提取),或者使用某种方法把目标辐射噪声波形进行变换,然后在变换域中提取反映其特点、目标类型的一组特征(变换域特征提取)。特征提取是目标识别中的关键环节之一,它直接影响到目标的最终识别结果。目前,主要使用的特征提取方法有:
1)功率谱估计及LOFAR谱分析
2)DEMON谱分析
3)小波变换及时频谱分析
虽然上述特征提取方法的研究取得了很多令人鼓舞的成果,但在实际应用中,由于海洋环境的复杂性、水声信道的特殊性及水下目标的多样性,上述特征提取方法提取出的特征无法达到满意的识别效果,目标的最终判定很大程度上仍然依赖于听音员的耳听判型。有经验的听音员能够在复杂的海况下,对水下目标做出正确的类型判别。为此,研究者从仿生学的角度来进行听觉感知特征提取技术的研究,特别是对人耳听觉系统模仿的研究。
人类的听觉系统是人类获取外界信息的主要器官。正常人的听觉系统是极为灵敏的,可听声音的频率范围为20Hz-20kHz,人类听觉器官对声波的音高、音强及动态频率具有良好的分析感知能力。听觉建模是研究人耳听觉系统的一个重要手段,因为听觉模型最接近人耳对声音信号的处理过程,提取的特征最能反映声音的本质,且具有很好的稳健性。
近年来,国内外研究者从人耳听觉感知机理出发,研究适用于水下目标辐射噪声的新的特征提取方法,寻找人耳主观听觉量中的有效感知量,从而提高水下目标的正确识别率。
目前,使用最为广泛的一种准听觉模型是MFCC(Mel-FrequencyCepstralCoefficients)算法模型,具有计算简单和目标特征有效表示的特性,其主要思想是用傅里叶变换模拟人耳听觉系统的基底膜频率分解功能,用对数变换模拟听觉系统的非线性特性。MFCC算法的主要过程是:首先对实测的噪声数据进行预处理,以使目标信号在短时内表示为近似平稳,然后对预处理后的数据进行傅里叶变换,将时域信号处理转化为频域信号处理,接着让其通过三角滤波器组进行听觉滤波,同时使用对数压缩,最后对对数压缩后的数据进行离散余弦变换,并取前N个系数。
MFCC算法易受噪声的影响,信号稍有干扰,频谱的幅值、相位和频率都有可能产生较大的误差。而Gammachirp滤波器组能精确模拟人耳滤波器的非线性特性及生理学特性,且具有简单的冲激响应函数,其输出特别适合于进行耳蜗内的谱分析。因此,使用gammachirp滤波器组对水下目标噪声进行滤波后获得倒谱系数,形成仿人耳的听觉特征矢量,是一种可行的特征提取方法。
发明内容
要解决的技术问题
为了避免现有技术的不足之处,本发明提出一种水下目标gammachirp倒谱系数听觉特征提取方法,使用gammachirp听觉滤波器组输出形成倒谱系数,给出水下目标的听觉特征矢量,可在复杂海洋环境干扰条件下,提高水下目标信号特征提取的稳健性,从而提高水下目标识别的正确率。
技术方案
一种水下目标gammachirp倒谱系数听觉特征提取方法,其特征在于步骤如下:
步骤1:将所要分析的目标数据进行分帧处理,分帧时一帧的长度包含2~5节奏周期,然后将每帧信号加Hamming窗,Hamming窗函数为:
式中N为每帧信号的采样点数;
步骤2:对步骤1得到的多帧信号进行快速傅里叶变换,经变换可得到信号的频谱;
步骤3:步骤2得到的频谱信号通过gammachirp听觉滤波器组,得到多组子带能量谱;Gammachirp滤波器的冲激响应为:
gc(t)=atn-1exp(-2πbERB(fr)t)exp(j2πfrt+jclnt+jφ)
式中:a表示gammachirp滤波器的幅度因子;n表示gammachirp滤波器的阶数;fr表示gammachirp滤波器的渐近频率;2πbERB(fr)表示阻尼因子;c表示chirp因子;lnt表示时间t的自然对数;φ表示gammatone滤波器的初始相位;ERB表示等矩形带宽,其表达式为:ERB(fr)=24.7+0.108fr;
步骤4:对步骤3得到的多组子带能量谱进行非线性变换,得到gammachirp听觉感知特征;非线性变换函数包括内毛细胞输出函数和响度函数,其内毛细胞输出函数为:
H(ω)=[GC(ω)]2
式中GC(ω)表示gammachirp滤波器的输出;
响度函数为:y(ω)=[H(ω)]0.33;
步骤5:对步骤4得到的gammachirp听觉感知特征进行对数压缩和离散余弦变换,得到gammachirp听觉感知倒谱系数,其具体表达式为:
式中Yn表示第n个频率子带的信号能量;N表示gammachirp滤波器的个数;M表示gammachirp听觉感知倒谱系数的个数。
所述步骤1中一帧的长度为100ms。
有益效果
本发明提出的一种水下目标gammachirp倒谱系数听觉特征提取方法,以傅里叶变换和对数压缩为基础,结合gammachirp听觉滤波器组,首先对实测的噪声数据进行预处理,以使目标信号在短时内表示为近似平稳,然后对预处理后的数据进行傅里叶变换,将时域信号处理转化为频域信号进行处理,接着让其通过gammachirp听觉滤波器组进行听觉滤波并使用对数压缩,最后对对数压缩后的数据进行离散余弦变换,使其维数降低。这种基于gammachirp频率听觉感知倒谱系数的特征提取方法,可以提取出水下目标辐射噪声有效的听觉特征,从而提高水下目标的正确识别率。
本发明将水下目标辐射噪声的特征表示成gammachirp听觉感知倒谱系数,有效地解决了传统特征提取方法的一系列问题,并得到海上实录数据的验证,结果表明:本发明相对于MFCC算法以及在其基础上产生的改进算法而言,更好地模拟了人耳的听觉系统,同时没有增加计算负担。本发明相对于MFCC算法以及在其基础上产生的改进算法得到的谱图,由本发明处理得到的谱图背景比前者更加“清晰”,提高了水下目标辐射噪声识别的正确率。
附图说明
图1:Gammachirp滤波器的冲激响应波形;
图2:Gammachirp滤波器的幅频响应;
图3:离散余弦变换基函数在时域和频域的形式;
图4:本发明方法的流程图。
具体实施方式
现结合实施例、附图对本发明作进一步描述:
本实施例为海上实录的水下目标辐射噪声,水中目标辐射噪声经22.05kHz采样率采样得到,信噪比大约大于6dB。
针对实录得到的水下目标辐射噪声数据,本发明实现的主要步骤如下:
步骤1:对实录的水下目标辐射噪声进行预处理,包括分帧和加窗处理,窗函数使用Hamming窗,其形式为
式中N为每帧信号的采样点数。
步骤2:对预处理后的信号进行快速傅里叶变换,得到频谱信号。
步骤3:利用gammachirp滤波器组对步骤2得到的频谱信号进行听觉滤波,gammachirp滤波器的冲激响应形式为:
gc(t)=atn-1exp(-2πbERB(fr)t)exp(j2πfrt+jclnt+jφ)(8)
其中a表示gammachirp滤波器的幅度因子;n表示gammachirp滤波器的阶数;fr表示gammachirp滤波器的渐近频率;2πbERB(fr)表示阻尼因子;c表示chirp因子;lnt表示时间t的自然对数;φ表示gammatone滤波器的初始相位。研究发现n=4和b=1.019的gammachirp滤波器较好地模拟了人耳的基底膜的滤波特性,其冲激响应和幅频响应如图1、2所示。Gammachirp滤波器的傅里叶变换如下:
式中 为常数,
Gammachirp滤波器的幅度谱可以表示为
步骤4:利用非线性变换对步骤3滤波后的结果进行变换,得到gammachirp听觉感知特征。非线性变换主要使用内毛细胞输出函数和响度函数,其内毛细胞输出函数为:
H(ω)=[GC(ω)]2(12)
式中GC(ω)表示gammachirp滤波的输出。响度函数为:
y(ω)=[H(ω)]0.33(13)
步骤5:利用对数压缩和离散余弦变换对步骤4得到的gammachirp听觉感知特征进行变换,得到gammachirp听觉感知倒谱系数,具体的表达式为:
式中Yn表示第n个频率子带的信号能量;N表示gammachirp滤波器的个数;M表示gammachirp听觉感知倒谱系数的个数。
离散余弦变换的表示形式:
其基函数在时域和频域的形式如图3所示。
在本实例中,计算的中心频率范围为50Hz到10500Hz,将提取的水下目标辐射噪声特征矢量送入训练好的BP神经网络进行分类识别,结果表明提取的特征表现出了较高的正确识别率,有效地证明了本发明提出的方法。
Claims (2)
1.一种水下目标gammachirp倒谱系数听觉特征提取方法,其特征在于步骤如下:
步骤1:将所要分析的目标数据进行分帧处理,分帧时一帧的长度包含2~5节奏周期,然后将每帧信号加Hamming窗,Hamming窗函数为:
式中N为每帧信号的采样点数;
步骤2:对步骤1得到的多帧信号进行快速傅里叶变换,经变换可得到信号的频谱;
步骤3:步骤2得到的频谱信号通过gammachirp听觉滤波器组,得到多组子带能量谱;Gammachirp滤波器的冲激响应为:
gc(t)=atn-1exp(-2πbERB(fr)t)exp(j2πfrt+jclnt+jφ)
式中:a表示gammachirp滤波器的幅度因子;n表示gammachirp滤波器的阶数;fr表示gammachirp滤波器的渐近频率;2πbERB(fr)表示阻尼因子;c表示chirp因子;lnt表示时间t的自然对数;φ表示gammatone滤波器的初始相位;ERB表示等矩形带宽,其表达式为:ERB(fr)=24.7+0.108fr;
步骤4:对步骤3得到的多组子带能量谱进行非线性变换,得到gammachirp听觉感知特征;非线性变换函数包括内毛细胞输出函数和响度函数,其内毛细胞输出函数为:
H(ω)=[GC(ω)]2
式中GC(ω)表示gammachirp滤波器的输出;
响度函数为:y(ω)=[H(ω)]0.33;
步骤5:对步骤4得到的gammachirp听觉感知特征进行对数压缩和离散余弦变换,得到gammachirp听觉感知倒谱系数,其具体表达式为:
式中Yn表示第n个频率子带的信号能量;N表示gammachirp滤波器的个数;M表示gammachirp听觉感知倒谱系数的个数。
2.根据权利要求1所述水下目标gammachirp倒谱系数听觉特征提取方法,其特征在于:所述步骤1中一帧的长度为100ms。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310488534.9A CN103559893B (zh) | 2013-10-17 | 2013-10-17 | 一种水下目标gammachirp倒谱系数听觉特征提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310488534.9A CN103559893B (zh) | 2013-10-17 | 2013-10-17 | 一种水下目标gammachirp倒谱系数听觉特征提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103559893A CN103559893A (zh) | 2014-02-05 |
CN103559893B true CN103559893B (zh) | 2016-06-08 |
Family
ID=50014120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310488534.9A Active CN103559893B (zh) | 2013-10-17 | 2013-10-17 | 一种水下目标gammachirp倒谱系数听觉特征提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103559893B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106772331B (zh) * | 2016-12-13 | 2019-04-09 | 中国电子科技集团公司第三研究所 | 目标识别方法和目标识别装置 |
CN107393553B (zh) * | 2017-07-14 | 2020-12-22 | 深圳永顺智信息科技有限公司 | 用于语音活动检测的听觉特征提取方法 |
CN107527625A (zh) * | 2017-09-06 | 2017-12-29 | 哈尔滨工程大学 | 基于仿生听觉系统中耳蜗模型的海豚哨声信号听觉特征提取方法 |
CN109256127B (zh) * | 2018-11-15 | 2021-02-19 | 江南大学 | 一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法 |
CN113049080A (zh) * | 2021-03-08 | 2021-06-29 | 中国电子科技集团公司第三十六研究所 | 一种舰船辐射噪声的gdwc听觉特征提取方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1968045A2 (en) * | 2007-03-09 | 2008-09-10 | Her Majesty the Queen in Right of Canada, as represented by the Minister of Industry, through The Communications Research Centre Canada | Low bit-rate universal audio coder |
-
2013
- 2013-10-17 CN CN201310488534.9A patent/CN103559893B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1968045A2 (en) * | 2007-03-09 | 2008-09-10 | Her Majesty the Queen in Right of Canada, as represented by the Minister of Industry, through The Communications Research Centre Canada | Low bit-rate universal audio coder |
Non-Patent Citations (4)
Title |
---|
Gammachirp滤波器组在语音特征提取中的应用;刘雪艳等;《新型工业化》;20111231;第1卷(第11期);全文 * |
听觉模型输出谱特征在声目标识别中的应用;马元锋等;《声学学报》;20090331;第34卷(第2期);全文 * |
基于听觉感知机理的水下目标识别研究进展;徐新洲等;《声学技术》;20130430;第32卷(第2期);全文 * |
基于鲁棒听觉特征的说话人识别;林琳等;《电子学报》;20130331;第41卷(第3期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103559893A (zh) | 2014-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103236260B (zh) | 语音识别系统 | |
Singh et al. | An approach to extract feature using MFCC | |
CN102881289B (zh) | 一种基于听觉感知特性的语音质量客观评价方法 | |
CN103559893B (zh) | 一种水下目标gammachirp倒谱系数听觉特征提取方法 | |
CN102664017B (zh) | 一种3d音频质量客观评价方法 | |
CN102968990B (zh) | 说话人识别方法和系统 | |
US20210193149A1 (en) | Method, apparatus and device for voiceprint recognition, and medium | |
CN106782565A (zh) | 一种声纹特征识别方法及系统 | |
Kim et al. | Nonlinear enhancement of onset for robust speech recognition. | |
CN104900229A (zh) | 一种语音信号混合特征参数的提取方法 | |
CN109256127B (zh) | 一种基于非线性幂变换Gammachirp滤波器的鲁棒语音特征提取方法 | |
CN108564965B (zh) | 一种抗噪语音识别系统 | |
CN111261189B (zh) | 一种车辆声音信号特征提取方法 | |
CN103557925B (zh) | 水下目标gammatone离散小波系数听觉特征提取方法 | |
Ganapathy et al. | Feature extraction using 2-d autoregressive models for speaker recognition. | |
CN104778948A (zh) | 一种基于弯折倒谱特征的抗噪语音识别方法 | |
CN112786059A (zh) | 一种基于人工智能的声纹特征提取方法及装置 | |
CN103892939B (zh) | 提高汉语声调识别率的人工耳蜗言语处理器和方法 | |
CN103475986A (zh) | 基于多分辨率小波的数字助听器语音增强方法 | |
Zouhir et al. | A bio-inspired feature extraction for robust speech recognition | |
Peng et al. | Effective Phase Encoding for End-To-End Speaker Verification. | |
CN102231279A (zh) | 基于听觉关注度的音频质量客观评价系统及方法 | |
Can et al. | Recognition of vessel acoustic signatures using non-linear teager energy based features | |
Prajapati et al. | Feature extraction of isolated gujarati digits with mel frequency cepstral coefficients (mfccs) | |
Wu et al. | Robust target feature extraction based on modified cochlear filter analysis model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |