CN112086105B - 一种基于Gammatone分频带连续谱特征的目标识别方法 - Google Patents

一种基于Gammatone分频带连续谱特征的目标识别方法 Download PDF

Info

Publication number
CN112086105B
CN112086105B CN202010896616.7A CN202010896616A CN112086105B CN 112086105 B CN112086105 B CN 112086105B CN 202010896616 A CN202010896616 A CN 202010896616A CN 112086105 B CN112086105 B CN 112086105B
Authority
CN
China
Prior art keywords
sub
continuous spectrum
band
target
gamma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010896616.7A
Other languages
English (en)
Other versions
CN112086105A (zh
Inventor
丁明惠
岳雷
李运周
纳杰斯
何其煜
郭春福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
No 750 Test Field of China Shipbuilding Industry Corp
Original Assignee
No 750 Test Field of China Shipbuilding Industry Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by No 750 Test Field of China Shipbuilding Industry Corp filed Critical No 750 Test Field of China Shipbuilding Industry Corp
Priority to CN202010896616.7A priority Critical patent/CN112086105B/zh
Publication of CN112086105A publication Critical patent/CN112086105A/zh
Application granted granted Critical
Publication of CN112086105B publication Critical patent/CN112086105B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于Gammatone分频带连续谱特征的目标识别方法,该目标识别方法包括以下步骤:首先,对原始目标辐射噪声数据进行加窗处理,选择Hanming窗,并建立对应的窗函数,然后对加窗处理的信号进行快速傅里叶变换;确定Gammatone滤波器组个数,对原始信号频带通过等间距确定各滤波器的中心频率,计算Gammatone滤波器组冲激响应,然后对冲激响应进行快速傅里叶变换,进行归一化处理,并建立对应的Gammatone滤波器组冲激响应函数。本发明与传统的连续谱特征提取及分类识别方法相比,首先进行了初步识别,连续谱也是在子带内进行的,可提取稳定的子带连续谱作为典型子带样本,比整个频带连续谱估计更精确,从而提高目标辐射噪声识别的正确识别率。

Description

一种基于Gammatone分频带连续谱特征的目标识别方法
技术领域
本发明涉及一种分频带连续谱特征的目标识别方法,具体的是涉及一种基于Gammatone分频带连续谱特征的目标识别方法,主要是应用于水面/水下目标辐射噪声的特征提取和分类识别,属于水下声信号处理技术领域。
背景技术
目前,通过被动声纳检测的目标辐射噪声数据进行目标特征提取及分类识别在军事领域得到了广泛的应用,由于目标辐射噪声和环境噪声均为随机信号,且环境噪声具有明显的时变特性,因此,特定的一种方法很难实现多类相似目标的分类识别。
通常来说,Gammatone滤波器是一个标准的耳蜗听觉滤波器,Gammatone特征提取方法是比较典型的听觉特征提取方法,该方法通过模拟人耳对目标辐射噪声划分子带,然后进行能量积累以及后续变换,实现目标辐射噪声的特征提取,对于在子带能量相似的目标,会导致目标听觉特征相似,目标识别准确率低等。
连续谱是通过对检测噪声的功率谱进行多项式拟合,等间距划分子带进行能量累积作为特征向量,而部分子带存在噪声能量高、信号能量低的情况,导致准确识别率下降。
因此,需研制一种目标识别准确率高以及具有较好精度的基于Gammatone分频带连续谱特征的目标识别方法是解决上述技术问题的关键所在。
发明内容
针对上述背景技术中存在的诸多缺陷与不足,本发明对此进行了改进和创新,目的在于提供一种方法简单可靠,通过Gammatone特征提取完成目标的初步分类,然后在Gammatone子带下估计目标辐射噪声连续谱,与样本库典型子带连续谱求解相关系数,实现目标的精确识别,同时,该方法可对Gammatone算法无法分类识别进行进一步识别,从而提高目标辐射噪声识别的正确识别率,从而形成一种更加符合客观实际的分析方法;
本发明的另一个发明目的是与传统的连续谱特征提取及分类识别方法相比,首先进行了初步识别,连续谱也是在子带内进行的,可提取稳定的子带连续谱作为典型子带样本,比整个频带连续谱估计更精确,从而提高目标辐射噪声识别的正确识别率。
本发明的再一个发明目的是识别方法简单可靠,较传统方法来说可视性更强;同时减少工程技术人员的工作量和试验成本;与典型Gammatone子带连续谱计算相关系数,实现目标的精确识别,提高目标辐射噪声识别的正确率。
本发明的还一个发明目的是可以解决传统目标识别方法特征提取单一,抗噪能力差的问题,并且能有效的提高水下目标识别的准确率,有一定的适应性,同时,与传统方法提取的特征参数相比,本发明有了显著的提高。
为解决上述问题并达到上述的发明目的,本发明一种基于Gammatone分频带连续谱特征的目标识别方法是通过采用下列的设计结构以及采用下列的技术方案来实现的:
一种基于Gammatone分频带连续谱特征的目标识别方法,该目标识别方法包括以下步骤:
步骤一,首先,对原始目标辐射噪声数据进行加窗处理,选择Hanming窗,并建立对应的窗函数,然后对加窗处理的信号进行快速傅里叶变换;
步骤二,确定Gammatone滤波器组个数,对原始信号频带通过等间距确定各滤波器的中心频率,计算Gammatone滤波器组冲激响应,然后对冲激响应进行快速傅里叶变换,进行归一化处理,并建立对应的Gammatone滤波器组冲激响应函数;
步骤三,步骤二得到的滤波器组幅频响应与步骤一得到的傅里叶变换结果进行矩阵乘运算,实现各子带的滤波和能量累积,得到子带能量矢量,然后取对数,作离散余弦变换,得到目标辐射噪声听觉特征矢量;
步骤四,将特征矢量送入BP神经网络进行分类识别,实现目标的初步分类,若识别结果是与两种或两种以上目标听觉特征样本库相似时,继续进行后续操作步骤;
步骤五,对步骤一加窗后得到信号计算其信号功率谱;
步骤六,对步骤二得到的归一化后的Gammatone滤波器组,各滤波器幅值大于0.1的部分确定子带的频率上下限,通过该子带上下限将步骤五得到的信号功率谱分段;
步骤七,对各段功率谱通过多项式拟合提取各子带的连续谱,通过最小二乘法进行多项式拟合;
步骤八,求解步骤七的连续谱与样本库中各目标的典型子带连续谱的相关系数,相关系数大于门限时,相关系数较大的作为目标的识别结果,完成Gammatone分频带连续谱特征的目标识别。
作为本发明上述的另一个优选的技术方案,所述步骤一中,窗函数的计算公式为:
Figure BDA0002658597410000031
式中,N为信号的点数。
作为本发明的上述优选技术方案,所述步骤二中,Gammatone滤波器组冲激响应函数的计算公式为:
Figure BDA0002658597410000032
式中,a为归一化因子;u(t)为单位阶跃函数;n为Gammatone滤波器的阶数,取n=4;
Figure BDA0002658597410000033
为滤波器的初始相位,取
Figure BDA0002658597410000034
fi为第i个滤波器的中心频率;bi为滤波器的衰减因子,bi=1.019ERB(fi),ERB(fi)为等效矩形带宽,表达式为ERB(fi)=24.7+0.108fi
作为本发明上述优选的技术方案,所述步骤三中,
Figure BDA0002658597410000041
Figure BDA0002658597410000042
为信号y(k)为离散余弦变换结果。
作为本发明上述的进一步优选的技术方案,所述步骤五中,所述信号功率谱是通过对信号进行快速傅里叶变换(FFT),对快速傅里叶变换结果取模后进行平方,最后得到信号的功率谱。
作为本发明上述的再一步优选的技术方案,所述步骤七中,拟合结果的计算公式为:
y=f(x,C)=c0+c1x+c2x2+…+cnxn
式中,x为离散频率值,C为多项式参数向量。
作为本发明上述的还进一步优选的技术方案,所述步骤七中,对于子带存在带宽较窄导致多项式拟合效果不好的情况时,在训练样本库时,将多个相邻子带合并作为1个子带,相应步骤七改为在对应联合的子带进行多项式拟合提取该子带的连续谱。
作为本发明上述的又再进一步优选的技术方案,所述步骤八中,所述典型子带是指在训练样本库时,连续谱较为稳定的子带作为典型子带,实现提高识别的准确率。
作为本发明上述的还又再更进一步优选的技术方案,所述步骤八中,相关系数的计算公式为:
Figure BDA0002658597410000043
式中,X和Y分别表示信号的连续谱和样本库中的连续谱,Cov(X,Y)表示X和Y的协方差,Var[]表示方差。
本发明与现有技术相比所产生的有益效果是:
1、本发明通过Gammatone特征提取完成目标的初步分类,然后在Gammatone子带下估计目标辐射噪声连续谱,与样本库典型子带连续谱求解相关系数,实现目标的精确识别,同时,该方法可对Gammatone算法无法分类识别进行进一步识别,从而提高目标辐射噪声识别的正确识别率,从而形成一种更加符合客观实际的分析方法;
2、本发明与传统的连续谱特征提取及分类识别方法相比,首先进行了初步识别,连续谱也是在子带内进行的,可提取稳定的子带连续谱作为典型子带样本,比整个频带连续谱估计更精确,从而提高目标辐射噪声识别的正确识别率;
3、本发明的识别方法简单可靠,较传统方法来说可视性更强;同时减少工程技术人员的工作量和试验成本;
4、本发明可以解决传统目标识别方法特征提取单一,抗噪能力差的问题,并且能有效的提高水下目标识别的准确率,有一定的适应性,同时,与传统方法提取的特征参数相比,本发明有了显著的提高;
5、本发明一种基于Gammatone分频带连续谱特征的目标识别方法,首先提取目标辐射噪声Gammatone特征值,进行目标的初步分类,对于存在Gammatone特征相似的目标,在Gammatone子带下进行连续谱特征提取,与典型Gammatone子带连续谱计算相关系数,实现目标的精确识别,提高目标辐射噪声识别的正确率;
6、本发明可提取目标稳定子带的连续谱特征,从而提高水面/水下目标辐射噪声的正确识别率。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明,其中:
图1是本发明的工作原理流程框图;
图2是本发明的Gammatone滤波器组幅频响应图;
图3是本发明的两目标辐射噪声Gammatone特征矢量直方图
图4是本发明的两目标四帧数据第15个子带连续谱图
其中,图中标号:A-初步分类识别,B-精确分类识别。
具体实施方式
为了使本发明实现的技术手段、创造特征、达成目的与功效易于明白了解,下面结合附图以及具体实施方式对本发明的技术方案作更进一步详细的说明,需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
如说明书附图所示的一种基于Gammatone分频带连续谱特征的目标识别方法,该目标识别方法包括以下步骤:
步骤一,首先,对原始目标辐射噪声数据进行加窗处理,选择Hanming窗,并建立对应的窗函数,然后对加窗处理的信号进行快速傅里叶变换;
步骤二,确定Gammatone滤波器组个数,对原始信号频带通过等间距确定各滤波器的中心频率,计算Gammatone滤波器组冲激响应,然后对冲激响应进行快速傅里叶变换,进行归一化处理,并建立对应的Gammatone滤波器组冲激响应函数;
步骤三,步骤二得到的滤波器组幅频响应与步骤一得到的傅里叶变换结果进行矩阵乘运算,实现各子带的滤波和能量累积,得到子带能量矢量,然后取对数,作离散余弦变换,得到目标辐射噪声听觉特征矢量;
步骤四,将特征矢量送入BP神经网络进行分类识别,实现目标的初步分类,若识别结果是与两种或两种以上目标听觉特征样本库相似时,继续进行后续操作步骤;
步骤五,对步骤一加窗后得到信号计算其信号功率谱;
步骤六,对步骤二得到的归一化后的Gammatone滤波器组,各滤波器幅值大于0.1的部分确定子带的频率上下限,通过该子带上下限将步骤五得到的信号功率谱分段;
步骤七,对各段功率谱通过多项式拟合提取各子带的连续谱,通过最小二乘法进行多项式拟合;
步骤八,求解步骤七的连续谱与样本库中各目标的典型子带连续谱的相关系数,相关系数大于门限时,相关系数较大的作为目标的识别结果,完成Gammatone分频带连续谱特征的目标识别。
进一步的,步骤一中,窗函数的计算公式为:
Figure BDA0002658597410000071
式中,N为信号的点数。
进一步的,步骤二中,Gammatone滤波器组冲激响应函数的计算公式为:
Figure BDA0002658597410000072
式中,a为归一化因子;u(t)为单位阶跃函数;n为Gammatone滤波器的阶数,取n=4;
Figure BDA0002658597410000073
为滤波器的初始相位,取
Figure BDA0002658597410000074
fi为第i个滤波器的中心频率;bi为滤波器的衰减因子,bi=1.019ERB(fi),ERB(fi)为等效矩形带宽,表达式为ERB(fi)=24.7+0.108fi
进一步的,步骤三中,
Figure BDA0002658597410000075
Figure BDA0002658597410000076
为信号y(k)为离散余弦变换结果。
进一步的,步骤五中,所述信号功率谱是通过对信号进行快速傅里叶变换(FFT),对快速傅里叶变换结果取模后进行平方,最后得到信号的功率谱。
进一步的,步骤七中,拟合结果的计算公式为:
y=f(x,C)=c0+c1x+c2x2+…+cnxn
式中,x为离散频率值,C为多项式参数向量。
进一步的,步骤七中,对于子带存在带宽较窄导致多项式拟合效果不好的情况时,在训练样本库时,将多个相邻子带合并作为1个子带,相应步骤七改为在对应联合的子带进行多项式拟合提取该子带的连续谱。
进一步的,步骤八中,所述典型子带是指在训练样本库时,连续谱较为稳定的子带作为典型子带,实现提高识别的准确率。
进一步的,步骤八中,相关系数的计算公式为:
Figure BDA0002658597410000081
式中,X和Y分别表示信号的连续谱和样本库中的连续谱,Cov(X,Y)表示X和Y的协方差,Var[]表示方差。
综上所述,本发明更为具体的实施方式是:
现结合实录的两类水面目标辐射噪声、附图对本发明作进一步描述:采样率为22.05kHz。
针对2类水面目标辐射噪声数据,本发明实现的主要步骤如下:
步骤一:对2类水面目标辐射噪声数据进行加窗处理,选择Hanming窗,窗函数为:
Figure BDA0002658597410000082
式中N为信号的点数,然后对加窗处理的信号进行快速傅里叶变换。
步骤二:确定Gammatone滤波器组为16个,对原始信号频带通过等间距确定各滤波器的中心频率,计算Gammatone滤波器组冲激响应,然后对冲激响应进行快速傅里叶变换,进行归一化处理,Gammatone滤波器组冲激响应函数为:
Figure BDA0002658597410000083
式中a为归一化因子;u(t)为单位阶跃函数;n为Gammatone滤波器的阶数,取n=4;
Figure BDA0002658597410000084
为滤波器的初始相位,取
Figure BDA0002658597410000085
fi为第i个滤波器的中心频率;bi为滤波器的衰减因子,bi=1.019ERB(fi),ERB(fi)为等效矩形带宽,表达式为ERB(fi)=24.7+0.108fi
傅里叶变换结果如图2所示。
步骤三:步骤二得到的滤波器组幅频响应与步骤一得到的傅里叶变换结果进行矩阵乘运算,实现各子带的滤波和能量累积,得到子带能量矢量,然后求对数,作离散余弦变换,得到目标辐射噪声听觉特征矢量如图3所示。
步骤四:将特征矢量送入BP神经网络进行分类识别,由于两目标Gammatone特征相似,无法进行分类,进行步骤五.
步骤五:对步骤一加窗后得到信号计算其功率谱。
步骤六:对步骤二得到的归一化后的Gammatone滤波器组,各滤波器幅值大于0.1的部分确定子带的频率上下限,通过该子带上下限将步骤五得到的信号功率谱分段;
步骤七:对各段功率谱通过多项式拟合提取各子带的连续谱;通过最小二乘法的方法进行多项式拟合,拟合结果为:
y=f(x,C)=c0+c1x+c2x2+…+cnxn
式中x为离散频率值,C为多项式参数向量,n取10。
对四组数据第15个子带拟合结果如图4所示,第一行为第一个目标4帧数据在第15个子带的功率谱,第二行为第一个目标在该子带拟合的连续谱;第三行为第二个目标4帧数据在第15个子带的功率谱,第四行为第二个目标在该子带拟合的连续谱。
步骤八:连续谱与样本库中各目标的典型子带连续谱的相关系数,此实施例以第15个子带作为典型子带,相关系数大于门限时,相关系数较大的作为目标的识别结果。相关系数通过下式求解,
Figure BDA0002658597410000091
式中X和Y分别表示信号的连续谱和样本库中的连续谱,Cov(X,Y)表示X和Y的协方差,Var[]表示方差;
经与样本库进行识别,完成对2个目标的准确分类。
在本实施例中,2个目标通过Gammatone特征提取方法很难完成准确的识别,通过提取子带连续谱特征,并与样本库数据求解相关系数,完成的准确识别,结果表明本发明提出的目标识别方法的有效性。
本方法主要先通过Gammatone方法进行初步分类,算法的结果主要和Gammatone方法进行对比,实现了对于Gammatone算法无法识别的目标,采用用此方法进可进行精确分类。
最后,需要说明的是,以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (9)

1.一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,该目标识别方法包括以下步骤:
步骤一,首先,对原始目标辐射噪声数据进行加窗处理,选择Hanming窗,并建立对应的窗函数,然后对加窗处理的信号进行快速傅里叶变换;
步骤二,确定Gammatone滤波器组个数,对原始信号频带通过等间距确定各滤波器的中心频率,计算Gammatone滤波器组冲激响应,然后对冲激响应进行快速傅里叶变换,进行归一化处理,并建立对应的Gammatone滤波器组冲激响应函数;
步骤三,步骤二得到的滤波器组幅频响应与步骤一得到的傅里叶变换结果进行矩阵乘运算,实现各子带的滤波和能量累积,得到子带能量矢量,然后取对数,作离散余弦变换,得到目标辐射噪声听觉特征矢量;
步骤四,将特征矢量送入BP神经网络进行分类识别,实现目标的初步分类,若识别结果是与两种或两种以上目标听觉特征样本库相似时,继续进行后续操作步骤;
步骤五,对步骤一加窗后得到信号计算其信号功率谱;
步骤六,对步骤二得到的归一化后的Gammatone滤波器组,各滤波器幅值大于0.1的部分确定子带的频率上下限,通过该子带上下限将步骤五得到的信号功率谱分段;
步骤七,对各段功率谱通过多项式拟合提取各子带的连续谱,通过最小二乘法进行多项式拟合;
步骤八,求解步骤七的连续谱与样本库中各目标的典型子带连续谱的相关系数,相关系数大于门限时,相关系数较大的作为目标的识别结果,完成Gammatone分频带连续谱特征的目标识别。
2.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,所述步骤一中,窗函数的计算公式为:
Figure FDA0003723129670000021
式中,N为信号的点数。
3.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,所述步骤二中,Gammatone滤波器组冲激响应函数的计算公式为:
Figure FDA0003723129670000022
式中,a为归一化因子;u(t)为单位阶跃函数;n为Gammatone滤波器的阶数,取n=4;
Figure FDA0003723129670000023
为滤波器的初始相位,取
Figure FDA0003723129670000026
fi为第i个滤波器的中心频率;bi为滤波器的衰减因子,bi=1.019ERB(fi),ERB(fi)为等效矩形带宽,表达式为ERB(fi)=24.7+0.108fi
4.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,所述步骤三中,
Figure FDA0003723129670000024
Figure FDA0003723129670000025
为信号,y(k)为离散余弦变换结果,其中,N为信号的点数。
5.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,所述步骤五中,所述信号功率谱是通过对信号进行快速傅里叶变换(FFT),对快速傅里叶变换结果取模后进行平方,最后得到信号的功率谱。
6.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,所述步骤七中,拟合结果的计算公式为:
y=f(x,C)=c0+c1x+c2x2+…+cnxn
式中,x为离散频率值,C为多项式参数向量。
7.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,所述步骤七中,对于子带存在带宽较窄导致多项式拟合效果不好的情况时,在训练样本库时,将多个相邻子带合并作为1个子带,相应步骤七改为在对应联合的子带进行多项式拟合提取该子带的连续谱。
8.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,所述步骤八中,所述典型子带是指在训练样本库时,连续谱较为稳定的子带作为典型子带,实现提高识别的准确率。
9.根据权利要求1所述的一种基于Gammatone分频带连续谱特征的目标识别方法,其特征在于,
所述步骤八中,相关系数的计算公式为:
Figure FDA0003723129670000031
式中,X和Y分别表示信号的连续谱和样本库中的连续谱,Cov(X,Y)表示X和Y的协方差,Var[]表示方差。
CN202010896616.7A 2020-08-31 2020-08-31 一种基于Gammatone分频带连续谱特征的目标识别方法 Active CN112086105B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010896616.7A CN112086105B (zh) 2020-08-31 2020-08-31 一种基于Gammatone分频带连续谱特征的目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010896616.7A CN112086105B (zh) 2020-08-31 2020-08-31 一种基于Gammatone分频带连续谱特征的目标识别方法

Publications (2)

Publication Number Publication Date
CN112086105A CN112086105A (zh) 2020-12-15
CN112086105B true CN112086105B (zh) 2022-08-19

Family

ID=73731834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010896616.7A Active CN112086105B (zh) 2020-08-31 2020-08-31 一种基于Gammatone分频带连续谱特征的目标识别方法

Country Status (1)

Country Link
CN (1) CN112086105B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113409819B (zh) * 2021-08-19 2022-01-25 中国空气动力研究与发展中心低速空气动力研究所 一种基于听觉谱特征提取的直升机声信号识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1995722A1 (en) * 2007-05-21 2008-11-26 Harman Becker Automotive Systems GmbH Method for processing an acoustic input signal to provide an output signal with reduced noise
CN103557925A (zh) * 2013-10-17 2014-02-05 西北工业大学 水下目标gammatone离散小波系数听觉特征提取方法
CN103714810A (zh) * 2013-12-09 2014-04-09 西北核技术研究所 基于Gammatone滤波器组的车型特征提取方法
CN103761969A (zh) * 2014-02-20 2014-04-30 武汉大学 基于高斯混合模型的感知域音频编码方法及系统
CN107545890A (zh) * 2017-08-31 2018-01-05 桂林电子科技大学 一种声音事件识别方法
CN108647556A (zh) * 2018-03-02 2018-10-12 重庆邮电大学 基于分频和深度神经网络的声源定位方法
CN109800700A (zh) * 2019-01-15 2019-05-24 哈尔滨工程大学 一种基于深度学习的水下声信号目标分类识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1995722A1 (en) * 2007-05-21 2008-11-26 Harman Becker Automotive Systems GmbH Method for processing an acoustic input signal to provide an output signal with reduced noise
CN103557925A (zh) * 2013-10-17 2014-02-05 西北工业大学 水下目标gammatone离散小波系数听觉特征提取方法
CN103714810A (zh) * 2013-12-09 2014-04-09 西北核技术研究所 基于Gammatone滤波器组的车型特征提取方法
CN103761969A (zh) * 2014-02-20 2014-04-30 武汉大学 基于高斯混合模型的感知域音频编码方法及系统
CN107545890A (zh) * 2017-08-31 2018-01-05 桂林电子科技大学 一种声音事件识别方法
CN108647556A (zh) * 2018-03-02 2018-10-12 重庆邮电大学 基于分频和深度神经网络的声源定位方法
CN109800700A (zh) * 2019-01-15 2019-05-24 哈尔滨工程大学 一种基于深度学习的水下声信号目标分类识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Feature Extraction Method Based on Continuous Spectrum in Gammatone Frequency Bands;Minghui Ding,等;《2021 IEEE International Conference on Power Electronics, Computer Applications (ICPECA)》;20210301;全文 *
Underwater acoustic target recognition based on Gammatone filterbank and instantaneous frequency;Zixu Lian,等;《2017 IEEE 9th International Conference on Communication Software and Networks (ICCSN)》;20171221;全文 *
基于小波子带模型匹配的同水域下目标探测;李鹏,等;《电子测量与仪器学报》;20171115;全文 *
基于连续谱特征提取的被动声纳目标识别技术;曾庆军,等;《上海交通大学学报》;20020330;全文 *
水声目标特征提取与分类识别技术研究;连梓旭;《中国优秀硕士学位论文全文数据库》;20200215;全文 *

Also Published As

Publication number Publication date
CN112086105A (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN109283492B (zh) 多目标方位估计方法及水声垂直矢量阵列系统
CN104076331B (zh) 一种七元麦克风阵列的声源定位方法
CN111261189B (zh) 一种车辆声音信号特征提取方法
CN108701469B (zh) 咳嗽声音识别方法、设备和存储介质
CN109658948B (zh) 一种面向候鸟迁徙活动的声学监测方法
CN108091345B (zh) 一种基于支持向量机的双耳语音分离方法
CN108768543B (zh) 多特征融合认知型水声通信空快时自适应处理算法
CN106019230B (zh) 一种基于i-vector说话人识别的声源定位方法
CN109741759B (zh) 一种面向特定鸟类物种的声学自动检测方法
CN103278810B (zh) 基于空间相似度的水下目标尺度特性提取方法
CN113314127B (zh) 基于空间方位的鸟鸣识别方法、系统、计算机设备与介质
CN109884591A (zh) 一种基于麦克风阵列的多旋翼无人机声信号增强方法
CN112086105B (zh) 一种基于Gammatone分频带连续谱特征的目标识别方法
CN114639387A (zh) 基于重构群延迟-常数q变换语谱图的声纹欺诈检测方法
CN109920447B (zh) 基于自适应滤波器振幅相位特征提取的录音欺诈检测方法
CN117153168A (zh) 鲸类回声定位信号的检测与提取方法、系统、设备及介质
CN108269566A (zh) 一种基于多尺度子带能量集特征的膛口波识别方法
CN115064182A (zh) 自适应梅尔滤波器在强噪声环境下风机故障特征识别方法
CN110275138A (zh) 一种利用优势声源成分移除的多声源定位方法
CN113109760B (zh) 一种基于组稀疏的多线谱联合doa估计和聚类方法及系统
CN116110417A (zh) 一种面向超声波声纹防伪的数据增强方法及装置
CN111968671B (zh) 基于多维特征空间的低空声目标综合识别方法及装置
Patil et al. Significance of cmvn for replay spoof detection
Sánchez-García et al. A novel image-processing based method for the automatic detection, extraction and characterization of marine mammal tonal calls
CN116230015B (zh) 一种基于音频时序信息加权的频域特征表示异音检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant