CN103714810A - 基于Gammatone滤波器组的车型特征提取方法 - Google Patents

基于Gammatone滤波器组的车型特征提取方法 Download PDF

Info

Publication number
CN103714810A
CN103714810A CN201310665449.5A CN201310665449A CN103714810A CN 103714810 A CN103714810 A CN 103714810A CN 201310665449 A CN201310665449 A CN 201310665449A CN 103714810 A CN103714810 A CN 103714810A
Authority
CN
China
Prior art keywords
filter
signal
wave filter
filters
subband signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310665449.5A
Other languages
English (en)
Other versions
CN103714810B (zh
Inventor
赵天青
梁旭斌
许学忠
张敏
蔡宗义
方厚林
程章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest Institute of Nuclear Technology
Original Assignee
Northwest Institute of Nuclear Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest Institute of Nuclear Technology filed Critical Northwest Institute of Nuclear Technology
Priority to CN201310665449.5A priority Critical patent/CN103714810B/zh
Publication of CN103714810A publication Critical patent/CN103714810A/zh
Application granted granted Critical
Publication of CN103714810B publication Critical patent/CN103714810B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了基于Gammatone滤波器组的车型特征提取方法,属于模式识别领域,涉及车辆辐射声信号的特征提取方法,具体来讲是一种通过计算车辆声信号在Gammatone滤波器组下的倒谱系数模拟人耳听觉特性的特征提取方法。该方法利用Gammatone滤波器组可模拟人耳非线性频率分解的特性,将车辆声信号滤波划分为不同子带信号并求取倒谱系数。本发明基于听觉特性中频率分解原理,对车辆声信号提取Gammatone倒谱系数,得到原始信号频带-能量特征,其中涉及计算均为常用信号处理技术,原理简单,步骤明了,便于编程实现,适用性广。

Description

基于Gammatone滤波器组的车型特征提取方法
技术领域
本发明属于模式识别领域,涉及车辆辐射声信号的特征提取方法,具体来讲是一种计算车辆声信号在Gammatone滤波器组下的倒谱系数的特征提取方法,所得特征可模拟人耳的听觉特性。
背景技术
车型识别的过程主要包括特征提取与分类器的训练识别两个部分。特征提取是模式识别的关键技术之一,利用车辆运动产生声信号对其进行分类识别是车型识别的一种重要方式。车型识别被广泛应用于交通管理、区域防护与要地警戒等领域。
目前,车辆声信号的特征提取主要基于信号的频率特征,AR参数模型是广泛采用的计算信号功率谱的频谱分析方法,有严格的理论支持与成熟的技术实现,但对于不同环境条件下的应用,提高特征分类精度的难度较大;此外还有基于小波及小波包的能量系数特征提取方法,进一步提高了特征的分类精度,但其原理深奥、实现复杂;近几年还出现了采用高阶谱分析、Mel倒谱系数、经验模式分解等新原理的基于频率的特征提取方法,可以得到相对精确的声信号特征,但整体而言,计算量大,实现复杂,且有的提取方法对背景噪声依赖较强,应用具有局限性。
发明内容
本发明目的是提供一种较为简单易行的基于Gammatone滤波器组的车型特征提取方法,该方法基于人耳非线性频率分解的听觉特性,利用听觉外周模型广泛采用的Gammatone滤波器组,过滤、划分车辆声信号并计算滤波得到子带信号的倒谱系数。
本发明的技术解决方案是:
一种基于Gammatone滤波器组的车型特征提取方法,其特殊之处在于:包括以下步骤:
1】采集原始车辆声信号s(n),n表示采样数据序列中数据点的编号,采样率fs满足奈奎斯特采样定理,即fs≥2fmax,fmax为信号的最高频率;对采样率为fs的原始车辆声信号s(n)进行预滤波、归一化、加窗分帧的预处理,得到时域的短时信号x(n);相应计算如下所示:
信号预滤波:y(n)=s(n)+0.9375·s(n-1)  (1)
信号归一化: y ‾ ( n ) = y ( n ) | y ( n ) max | - - - ( 2 )
加窗分帧: x ( n ) = y ‾ ( n ) · w ( n ) - - - ( 3 )
所述加窗分帧采用重叠分帧,w(n)为加窗函数,采用hamming窗,其函数表达式如下:
w ( n ) = h ( n ) = 0.54 - 0.46 cos [ 2 πn / ( N - 1 ) ] , 0 ≤ n ≤ N - 1 0 , else - - - ( 4 )
其中,N为窗函数数据序列长度,即序列包含数据点数;n为此数据序列中任一数据点编号;
2】确定滤波器组应用的频率范围[fL,fH](fL为滤波范围的频率下界,fH为滤波范围的频率上界)、滤波器个数M与滤波器的阶数r,实现M个一组的Gammatone滤波器组:
g m ( n ) = 1 2 πj ∫ G m ( z ) z n - 1 dz - - - ( 5 )
其中,Gm(z)为滤波器在离散系统中的对应函数,z为Z变换中的复变量,n为离散系统中数据序列的任一数据点编号(n为整数),j为虚数单位,m表示滤波器组中任一滤波器的编号,
3】短时信号x(n)通过Gammatone滤波器组,划分为M个子带信号(M为滤波器个数)xm(n):
xm(n)=x(n)*gm(n)  1≤m≤M  (6)
4】对子带信号xm(n)作N点的FFT计算,N为子带信号数据序列长度,得到子带信号的功率谱Xm(k),进一步对其取模平方,得到子带信号的能量谱Em(k);再除以子带信号帧长度N得到信号的功率谱Gm(k);对各子带信号平均功率谱Gm(k)加和并取对数,得到子带信号的对数功率值,相应计算如下所示:
子带信号能量谱:Em(k)=|Xm(k)|2  (7)
子带信号功率谱: G m ( k ) = E m ( k ) N - - - ( 8 )
子带信号对数功率值: e m = log ( Σ k = 1 N G m ( k ) ) , 1 ≤ m ≤ M - - - ( 9 )
其中,k代表子带信号数据序列中任一点编号,m代表子带信号编号,与各滤波器编号对应,
5】得到车型识别特征系数,实现车型识别:
5.1】对各子带信号的对数功率值组成的数据序列e(m)按照定义进行离散余弦变换,得到子带信号的原始p阶倒谱系数C(n),转换公式为:
C ( n ) = 2 M Σ m = 1 M e ( m ) cos [ πn M ( m - 0.5 ) ] , n = 1,2 , . . . , p - - - ( 10 )
式中:
e(m)={e1,…,em,…,eM};
n代表得到倒谱系数数据序列点的编号;
p为倒谱系数的阶数;
5.2】对得到的原始p阶倒谱系数C(n),根据半正弦窗函数表达式(11)进行升半正弦倒谱提升,得到提升后的车型识别特征系数,如式(12)所示:
w(i)=1+6×sin(πi/N),1≤i≤N  (11)
CG(n)=C(n)×w(i)  (12)
其中,N对应倒谱系数的阶数p,N=p,i代表1到N的正整数,式(12)中’×’表示C(n)与w(i)两数据序列作点乘运算,即对应位置数据点相乘。
上述步骤2实现M个一组的Gammatone滤波器组,具体如下:
2.1】根据式(13)、式(14)计算得到各滤波器的中心频率及带宽:
中心频率fm为:
f m = ( f H + 228.7 ) exp ( - v i 9.26 ) - 228.7 - - - ( 13 )
其中,fH为滤波器的截止频率上界,vi是滤波器重叠因子,用于指定相邻滤波器之间的重叠百分比,
再由中心频率fm计算带宽,表达式为
b m = ERB ( f m ) = 24.7 × ( 4.37 f m 1000 + 1 ) - - - ( 14 )
2.2】对各参数对应的Gammatone滤波器,其冲击响应的典型模式为:
其中,A为滤波器增益,r为滤波器阶数,bm为滤波器带宽,fm为滤波器的中心频率,
Figure BDA0000433307380000044
为相位,U(t)为阶跃函数,t为时域变量符号,M为滤波器个数,m表示滤波器组中任一滤波器的编号,简化模型中,取
Figure BDA0000433307380000045
对上式中gm(t)按照拉普拉斯变换定义,计算得到滤波器在复频域的对应函数Gm(s):
G m ( s ) = ∫ - ∞ ∞ g m ( t ) e - st dt
Figure BDA0000433307380000047
= A 2 ∫ 0 ∞ t r - 1 e ( - 2 πERB ( f m ) t ) ( e j 2 π f m t + e - j 2 π f m t ) e - st dt
= A 2 [ ( r - 1 ) ! ( s + b - jω ) n + ( r - 1 ) ! ( s + b + jω ) n ] - - - ( 16 )
其中,A为滤波器增益,r为滤波器阶数,fm是中心频率,
Figure BDA0000433307380000052
是相位,U(t)为阶跃函数,s为复频率,j为虚数单位,b=2πERB(fm),ω=2πfm,m表示滤波器组中任一滤波器的编号;
2.3】根据拉普拉斯变换中s平面与Z变换中z平面的映射关系,将Gm(s)转换为离散系统中Z变换的Gm(z),得到滤波器在离散系统中z变换域的表示形式,再由逆z变换得定义,计算得到离散系统中一组M个的Gammatone滤波器的单位冲击响应:
g m ( n ) = 1 2 πj ∫ G m ( z ) z n - 1 dz - - - ( 17 )
其中,Gm(z)为滤波器在离散系统中的对应函数,z为Z变换中的复变量,n为离散系统中数据序列的任一数据点编号,n为整数,j为虚数单位,m表示滤波器组中任一滤波器的编号。
本发明所述的车辆声信号特征方法,基于听觉特征原理,通过计算滤波后子带信号倒谱系数,得到原始信号频带-能量特征,其中所涉及计算均为常用的信号处理技术,原理简单,步骤明了,便于编程实现,适用性广。根据该方法得到的特征具有低维数、高可分性的优点
附图说明
图1是基于Gammatone滤波器组的车辆声信号特征提取方法计算流程图。
图2是一组17个的Gammatone滤波器幅频响应曲线图。
图3是两个不同类型的车辆声信号Gammatone特征向量示意图。
具体实施方式
本发明应用听觉特性中频率分解原理,对车辆声信号进行Gammatone倒谱系数提取的流程为:
参阅图1,基于Gammatone滤波器组提取车辆声信号特征的方法为:
1)对采样率为fs(满足奈奎斯特采样定理,即fs≥2fmax,fmax为信号的最高频率)的原始车辆声信号s(n)进行预滤波、归一化、加窗分帧的预处理,得到时域的短时信号帧x(n)。相应计算如下所示:
信号低频加强:y(n)=s(n)+0.9375·s(n-1)  (1)
信号归一化: y ‾ ( n ) = y ( n ) | y ( n ) max | - - - ( 2 )
加窗分帧: x ( n ) = y ‾ ( n ) · w ( n ) - - - ( 3 )
车辆声信号是非平稳随机信号,在基于信号短时平稳的基础上,再应用平稳信号处理方法分析。车辆信号在0.2s~1s时间段内可近似平稳,通过对信号加窗,将原始信号分割为帧片段。此处,采用“重叠分帧”的方法,即前一帧和后一帧包含重叠数据,更好的保证帧间的连续性。
上式中,w(n)为加窗函数,常采用hamming窗,它的函数表达式如下:
w ( n ) = h ( n ) = 0.54 - 0.46 cos [ 2 πn / ( N - 1 ) ] , 0 ≤ n ≤ N - 1 0 , else - - - ( 4 )
2)根据滤波器覆盖频率范围[fL,fH]、滤波器个数M及滤波器阶数r(r=4),实现M个一组的Gammatone滤波器组(在信号采集过程中,信号采样率是确定的,以上其余参数由信号处理者根据实际需求设定),具体步骤如下。
首先,根据式(5)、式(6)计算得到各滤波器的fm及带宽bm
f m = ( f H + 228.7 ) exp ( - v i 9.26 ) - 228.7 - - - ( 5 )
b m = ERB ( f m ) = 24.7 × ( 4.37 f m 1000 + 1 ) - - - ( 6 )
再根据Gammatone滤波器的典型冲击响应函数(式(7))做拉普拉斯变换,得到滤波器复频域的表达式Gm(s)。
Figure BDA0000433307380000071
G m ( s ) = ∫ - ∞ ∞ g m ( t ) e - st dt
Figure BDA0000433307380000073
= A 2 ∫ 0 ∞ t r - 1 e ( - 2 πERB ( f m ) t ) ( e j 2 π f m t + e - j 2 π f m t ) e - st dt
= A 2 [ ( r - 1 ) ! ( s + b - jω ) n + ( r - 1 ) ! ( s + b + jω ) n ] - - - ( 8 )
其中,A为滤波器增益,r为滤波器阶数,fm是中心频率,
Figure BDA0000433307380000076
是相位,U(t)为阶跃函数,s为复频率,j为虚数单位,b=2πERB(fm),ω=2πfm,m表示滤波器组中任一滤波器的编号。
最后,将Gm(s)转换为Z变换的Gm(z)形式,再按照逆Z变换定义计算得到离散系统下一组M个的Gammatone滤波器的单位冲击响应:
g m ( n ) = 1 2 πj ∫ G m ( z ) z n - 1 dz - - - ( 9 )
图2所示是10~2500Hz范围内的17通道4阶Gammatone滤波器组的对数幅频响应曲线。在线性频率上,随着滤波器编号的增大,相邻滤波器中心频率的带宽逐渐增大。
3)短时信号帧x(n)通过Gammatone滤波器组,划分为M个子带信号(M为滤波器个数)xm(n):
xm(n)=x(n)*gm(n)  1≤m≤M  (10)
4)求子带功率谱。对子带信号xm(n)进行快速傅里叶变换(Fast FourierTransform,FFT),得到子带信号的功率谱Xm(k),进一步取模平方,除以信号长度N得到信号的功率谱Gm(k)。取对数,得到子带信号的对数功率谱。相应计算如下所示:
子带信号能量谱:Em(k)=|Xm(k)|2  (11)
子带信号平均功率谱: G m ( k ) = E m ( k ) N - - - ( 12 )
子带信号对数功率值: e m = log ( Σ k = 1 N G m ( k ) ) , 1 ≤ m ≤ M - - - ( 13 )
5)求子带倒谱系数。将各子带信号的对数能量谱进行离散余弦变换(Discrete Cosine Transform,DCT)。转换公式为:
C ( n ) = 2 M Σ m = 1 M e ( m ) cos [ πn M ( m - 0.5 ) ] , n = 1,2 , . . . , p - - - ( 14 )
式中,e(m)为各子带信号对数功率值组成序列,即e(m)={e1,…,em,…,eM};p为倒谱特征系数的阶数。C(n)为得到的原始p阶倒谱系数。再对DCT得到的特征进行升半正弦倒谱提升,式(15)为半正弦窗函数,得到提升后的特征如式(16)所示:
w(i)=1+6×sin(πi/N),1≤i≤N  (15)
CG(n)=C(n)×w(i)  (16)
选取两类车辆目标水陆两用作战车(Assault AmphibianVehicle,AAV)、牵引式货车(Dragon Wagon,DW)运动辐射声信号作为样本库,信号采样率fs=4960Hz。基于Gammatone滤波器组提取两类车辆声信号特征的方法为:参阅图1:
1)声信号经预滤波、分帧、加窗等预处理后,得到时域的短时信号帧x(n)。相应计算如下所示:
信号预滤波:y(n)=s(t/fs)+0.9375·s(t/fs-1)  (17)
信号归一化: y ‾ ( n ) = y ( n ) | y ‾ ( n ) max | - - - ( 18 )
加窗分帧: x ( n ) = y ‾ ( n ) · w ( n ) - - - ( 3 )
本例中,Matlab计算如下:
预滤波:y(n)=filter([10.9375],1,s(n));
信号归一化:y(n)=y(n)/max(abs(y(n)));
分帧:xx=enframe(y(n),N1,N2);
其中s(n)为采集待处理的原始车辆声信号,y(n)为信号滤波处理中间结果,N1为信号帧长度,取α=0.2065,N1=FrameSize=α·fs=1024点;N2为帧重叠点数,取β=0.5,N2=β·N1=512点。
2)根据滤波器组应用的频率范围[fL,fH](fL为滤波范围的频率下界,fH为滤波范围的频率上界)、滤波器个数M与滤波器的阶数r(r=4),计算得到滤波器的中心频率fm及等效带宽bm,计算M个一组的Gammatone滤波器组滤波参数。本例中,取M=17,[fL,fH]=[10,2500]Hz,其他输入采用函数默认值,得到一组17个的Gammatone滤波器组的滤波系数、中心频率、等效带宽及群延时,调用Matlab中voicebox工具包中gammabank函数,计算如下:
[b,a,fx,bx,gd]=gammabank(17,4960,′′,[102500]);
gammabank函数原型为:
[b,a,fx,bx,gd]=gammabank(n,fs,w,fc,bw,ph,k)其中,输入参数n为滤波器个数,fs为信号采样率(单位:Hz),w为可选频率转化方式,fc为滤波器中心频率,bw为滤波器带宽,ph为滤波器冲击函数响应的相位,k为滤波器阶数。此处,需确定滤波器个数n,采样频率fs及中心频率覆盖范围[fL,fH],其他取函数默认参数值。函数输出包括系统模型中滤波器系数a,b,滤波器中心频率点fx,带宽值bx与各滤波器群延时gd。
gammabank函数采用传递函数模型描述Gammatone滤波器组,传递函数H(z)的一般表达式如下所示:
H ( z ) = Y ( z ) X ( z ) = b 0 + b 1 z - 1 + b 2 z - 2 + · · · + b N - 1 z - ( N - 1 ) 1 + a 1 z - 1 + a 2 z - 2 + · · · + a M - 1 z - ( M - 1 )
式中,X(z)表示输入x(n)的Z变换,Y(z)表示输出y(n)的Z变换,bi(i=1,…,m)和ai(i=1,…,n)是滤波器的分子分母系数。由Gammatone滤波器的时域冲击响应长度可知,Gammatone滤波器是无限长冲击响应(IIR)滤波器,其阶数为H(z)的极点个数。gammabank计算滤波器组系数的主要步骤如下:
(1)将线性Hz频率表示的频带范围转化为ERB频率刻度表示范围:
g=abs(frq);
erb=11.17268*sign(frq).*log(1+46.06538*g./(g+14678.49));
其中frq为待转换线性Hz频率,分别对滤波器组覆盖最小、最大频率变换得到ERB刻度下的频率分布范围[fx1,fx2];
(2)在ERB刻度下划分排列各滤波器中心频率:
fx=linspace(fx1,fx2,n);
上式表示取[fx1,fx2]范围的n等分点,其中n为滤波器个数,得到fx为n个滤波器的中心频率。
(3)计算各滤波器带宽:
bnd=6.23e-6*g.^2+93.39e-3*g+28.52;
bx=1.019bnd;
其中g为各中心频率在ERB刻度下表示频率,bnd为ERB刻度下各中心频率对应带宽,bx为转化到线性Hz频率下对应带宽。
(4)计算滤波器系数a,b:
ww=exp((1i*fx-bx)*2*pi/fs);%计算滤波器起始频率对应复变量
a=round([1cumprod((-k:-1)./(1:k))]);%构造k(k=4)阶的二项式系数
b=conv(a,(0:k-1).^(k-1));%通过卷积计算得到k阶二项式对应初始分子系数
b=exp(1i*ph)*b(1:k);%计算复数空间下滤波器相位对应各阶系数值
wwp=repmat(ww,1,k+1).^repmat(0:k,nf,1);%计算各通道中
滤波器起始频率对应各阶系数
denc=repmat(a,nf,1).*wwp;%计算各通道中滤波器系数a对应分式方程系数
numc=b.*wwp(:,1:k);%计算各通道中滤波器系数b对应分式方程系数
ww=exp(2i*fx*pi/fs);%计算各通道滤波器中心频率对应复变量
u=polyval(b(i,:),ww(i));%构造系数b下复数空间二项式
v=polyval(a(i,:),ww(i));%构造系数a下复数空间二项式
bi=real(conv(numci,conj(denci)))*abs(v-u)%计算各通道滤波器分子系数bi
ai=real(conv(denci,conj(denci)))%计算各通道滤波器分母系数ai
式中,i为虚数单位,ph为滤波器相位取为0,k为滤波器阶数取为4,ww表示传递函数中复变量z,fx为滤波器中心频率,fs为信号采样率。
3)短时信号经Gammatone滤波器组,划分为M个子信号(M为滤波器个数)。本例中,取两类车辆信号各一帧x1(n),x2(n),在Matlab平台下,调用filter函数计算信号帧经过Gammatone滤波器组输出。
y=filterbank(b,a,xx(i,:),gd);
4)求子带功率谱。本例中,对两类车辆信号帧经Gammatone滤波后的子带信号分别进行快速傅里叶变换,取模平方得到子信号的能量谱G1(k),G2(k)。将子信号能量谱在时间上平均后取对数,得到子带信号的对数功率谱。Matlab中计算如下:
r=abs(fft(y,1024));
e=log(sum(r.^2/1024));
5)求子带倒谱系数。将各子带信号的对数能量谱进行离散余弦变换(Discrete Cosine Transform,DCT)。转换公式为:
C ( n ) = 2 M Σ m = 1 M e ( m ) cos [ πn M ( m - 0.5 ) ] , n = 1,2 , . . . , p - - - ( 20 )
式中,e(m)为各子带信号对数功率值组成序列,即e(m)={e1,…,em,…,eM},p为倒谱特征系数的阶数。C(n)为得到的原始p阶倒谱系数。再对DCT得到的特征进行升半正弦倒谱提升,式(21)为半正弦窗函数,得到提升后的特征如式(22)所示:
w(i)=1+6×sin(πi/N),1≤i≤N  (21)
CG(n)=C(n)×w(i)  (22)
本例中,p=N=17,由于第一维数据主要代表信号能量值将其去除,余下的16维组成两类车辆信号的特征向量CG1(n),CG2(n)。Matlab中计算如下:
c=dct(log(sum(r.^2、1024)));
c1=c.*w;
图3中为AAV、DW两类车辆信号各一帧提取得到特征,其中,横轴为特征维数,纵轴为特征幅度。可见,两类特征各维取值间距大,明显可分,进一近实验结果证明,相比传统Mel倒谱系数特征提取方法,在特征维数相同时,本发明方法可提高识别正确率5%~10%。
两类车辆信号Gammatone特征提取完整Matlab程序:
Figure BDA0000433307380000131
本发明原理:
本发明提取车辆声信号特征的方法,模拟人耳对声信号的非线性频率分解特性,提取的特征参数CG(n)各维系数代表了车辆声信号按其组成频率的能量分布情况,有效地表征了车型特征,实现基于声信号的车型识别。
本发明基于人耳非线性频率分解的听觉特性,利用听觉外周模型广泛采用的Gammatone滤波器组,过滤、划分车辆声信号并计算滤波得到子带信号的倒谱系数,提供一种较为简单易行的车型特征提取方法,根据该方法得到的特征具有低维数、高可分性的优点。
Gammatone滤波器是一个标准的耳蜗听觉滤波器,该滤波器组冲击响应的典型模式为:
Figure BDA0000433307380000141
式中,A为滤波器增益,r为滤波器阶数,fm是中心频率,是相位,bm为等效带宽,M为滤波器个数,U(t)为阶跃函数。简化模型中,取A=1,r=4,
Figure BDA0000433307380000143
bm=ERB(fm)。
ERB(fm)为等效矩形带宽(Equivalent Rectangular Bandwidth,ERB),它决定了脉冲响应的衰减速度,与滤波器带宽有关,而每个滤波器带宽与人耳听觉临界频带(Critical Band,CB)有关,听觉心理学中,ERB(fm)可由式(24)计算得到:
ERB ( f m ) = 24.7 × ( 4.37 f m 1000 + 1 ) - - - ( 24 )
其中,中心频率fm为:
f m = ( f H + 228.7 ) exp ( - v i 9.26 ) - 228.7 - - - ( 25 )
式中,fH为滤波器的截止频率,vi是滤波器重叠因子,用来指定相邻滤波器之间重叠的百分比。每个滤波器的中心频率确定后,相应的带宽可由式(24)计算得出。
Gammatone滤波器组是应用最多的耳蜗基底膜模型,在语音信号的处理中,主要用于语音信号增强及特征提取。由各种机动车辆目标产生的声信号是一种多声源噪声,在应用Gammatone滤波器组提取特征时,主要存在以下难点:(1)车辆运动声源包括气动噪声和机械噪声,信号成分较语音更复杂;(2)车辆声信号对环境变化十分敏感,路况、车速、自然环境都会引起信号变化;(3)需根据目标车辆声信号的优势频带范围,动态调整Gammatone滤波器覆盖频带。目前,对Gammatone滤波器处理其他目标声信号的研究相对较少,曾有文献提出利用听觉模型(Gammatone滤波器及高/低通滤波器组成混合滤波器组)输出谱特征用于声目标识别,并对水下目标进行试验测试,得到优于传统方法的识别结果。

Claims (2)

1.一种基于Gammatone滤波器组的车型特征提取方法,其特征在于:
包括以下步骤:
1】采集原始车辆声信号s(n),n表示采样数据序列中数据点的编号,采样率fs满足奈奎斯特采样定理,即fs≥2fmax,fmax为信号的最高频率;对采样率为fs的原始车辆声信号s(n)进行预滤波、归一化、加窗分帧的预处理,得到时域的短时信号x(n);相应计算如下所示:
信号预滤波:y(n)=s(n)+0.9375·s(n-1)  (1)
信号归一化: y ‾ ( n ) = y ( n ) | y ( n ) max | - - - ( 2 )
加窗分帧: x ( n ) = y ‾ ( n ) · w ( n ) - - - ( 3 )
所述加窗分帧采用重叠分帧,w(n)为加窗函数,采用hamming窗,其函数表达式如下:
w ( n ) = h ( n ) = 0.54 - 0.46 cos [ 2 πn / ( N - 1 ) ] , 0 ≤ n ≤ N - 1 0 , else - - - ( 4 )
其中,N为窗函数数据序列长度,即序列包含数据点数;n为此数据序列中任一数据点编号;
2】确定滤波器组应用的频率范围[fL,fH](fL为滤波范围的频率下界,fH为滤波范围的频率上界)、滤波器个数M与滤波器的阶数r,实现M个一组的Gammatone滤波器组:
g m ( n ) = 1 2 πj ∫ G m ( z ) z n - 1 dz - - - ( 5 )
其中,Gm(z)为滤波器在离散系统中的对应函数,z为Z变换中的复变量,n为离散系统中数据序列的任一数据点编号(n为整数),j为虚数单位,m表示滤波器组中任一滤波器的编号,
3】短时信号x(n)通过Gammatone滤波器组,划分为M个子带信号(M为滤波器个数)xm(n):
xm(n)=x(n)*gm(n)1≤m≤M  (6)
4】对子带信号xm(n)作N点的FFT计算,N为子带信号数据序列长度,得到子带信号的功率谱Xm(k),进一步对其取模平方,得到子带信号的能量谱Em(k);再除以子带信号帧长度N得到信号的功率谱Gm(k);对各子带信号平均功率谱Gm(k)加和并取对数,得到子带信号的对数功率值,相应计算如下所示:
子带信号能量谱:Em(k)=|Xm(k)|2  (7)
子带信号功率谱: G m ( k ) = E m ( k ) N - - - ( 8 )
子带信号对数功率值: e m = log ( Σ k = 1 N G m ( k ) ) , 1 ≤ m ≤ M - - - ( 9 )
其中,k代表子带信号数据序列中任一点编号,m代表子带信号编号,与各滤波器编号对应,
5】得到车型识别特征系数,实现车型识别:
5.1】对各子带信号的对数功率值组成的数据序列e(m)按照定义进行离散余弦变换,得到子带信号的原始p阶倒谱系数C(n),转换公式为:
C ( n ) = 2 M Σ m = 1 M e ( m ) cos [ πn M ( m - 0.5 ) ] , n = 1,2 , . . . , p - - - ( 10 )
式中:
e(m)={e1,…,em,…,eM};
n代表得到倒谱系数数据序列点的编号;
p为倒谱系数的阶数;
5.2】对得到的原始p阶倒谱系数C(n),根据半正弦窗函数表达式(11)进行升半正弦倒谱提升,得到提升后的车型识别特征系数,如式(12)所示:
w(i)=1+6×sin(πi/N),1≤i≤N  (11)
CG(n)=C(n)×w(i)  (12)
其中,N对应倒谱系数的阶数p,N=p,i代表1到N的正整数,式(12)中’×’表示C(n)与w(i)两数据序列作点乘运算,即对应位置数据点相乘。
2.根据权利要求1所述基于Gammatone滤波器组的车型特征提取方法,其特征在于:所述步骤2实现M个一组的Gammatone滤波器组,具体如下:
2.1】根据式(13)、式(14)计算得到各滤波器的中心频率及带宽:
中心频率fm为:
f m = ( f H + 228.7 ) exp ( - v i 9.26 ) - 228.7 - - - ( 13 )
其中,fH为滤波器的截止频率上界,vi是滤波器重叠因子,用于指定相邻滤波器之间的重叠百分比,
再由中心频率fm计算带宽,表达式为
b m = ERB ( f m ) = 24.7 × ( 4.37 f m 1000 + 1 ) - - - ( 14 )
2.2】对各参数对应的Gammatone滤波器,其冲击响应的典型模式为:
Figure FDA0000433307370000033
其中,A为滤波器增益,r为滤波器阶数,bm为滤波器带宽,fm为滤波器的中心频率,
Figure FDA0000433307370000034
为相位,U(t)为阶跃函数,t为时域变量符号,M为滤波器个数,m表示滤波器组中任一滤波器的编号,简化模型中,取
Figure FDA0000433307370000035
对上式中gm(t)按照拉普拉斯变换定义,计算得到滤波器在复频域的对
应函数Gm(s):
G m ( s ) = ∫ - ∞ ∞ g m ( t ) e - st dt
Figure FDA0000433307370000042
= A 2 ∫ 0 ∞ t r - 1 e ( - 2 πERB ( f m ) t ) ( e j 2 π f m t + e - j 2 π f m t ) e - st dt
= A 2 [ ( r - 1 ) ! ( s + b - jω ) n + ( r - 1 ) ! ( s + b + jω ) n ] - - - ( 16 )
其中,A为滤波器增益,r为滤波器阶数,fm是中心频率,
Figure FDA0000433307370000045
是相位,U(t)为阶跃函数,s为复频率,j为虚数单位,b=2πERB(fm),ω=2πfm,m表示滤波器组中任一滤波器的编号;
2.3】根据拉普拉斯变换中s平面与Z变换中z平面的映射关系,将Gm(s)转换为离散系统中Z变换的Gm(z),得到滤波器在离散系统中z变换域的表示形式,再由逆z变换得定义,计算得到离散系统中一组M个的Gammatone滤波器的单位冲击响应:
g m ( n ) = 1 2 πj ∫ G m ( z ) z n - 1 dz - - - ( 17 )
其中,Gm(z)为滤波器在离散系统中的对应函数,z为Z变换中的复变量,n为离散系统中数据序列的任一数据点编号,n为整数,j为虚数单位,m表示滤波器组中任一滤波器的编号。
CN201310665449.5A 2013-12-09 2013-12-09 基于Gammatone滤波器组的车型特征提取方法 Active CN103714810B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310665449.5A CN103714810B (zh) 2013-12-09 2013-12-09 基于Gammatone滤波器组的车型特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310665449.5A CN103714810B (zh) 2013-12-09 2013-12-09 基于Gammatone滤波器组的车型特征提取方法

Publications (2)

Publication Number Publication Date
CN103714810A true CN103714810A (zh) 2014-04-09
CN103714810B CN103714810B (zh) 2016-05-25

Family

ID=50407718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310665449.5A Active CN103714810B (zh) 2013-12-09 2013-12-09 基于Gammatone滤波器组的车型特征提取方法

Country Status (1)

Country Link
CN (1) CN103714810B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985390A (zh) * 2014-05-20 2014-08-13 北京安慧音通科技有限责任公司 一种基于伽马通相关图语音特征参数提取方法
CN104751845A (zh) * 2015-03-31 2015-07-01 江苏久祥汽车电器集团有限公司 一种用于智能机器人的声音识别方法及系统
CN105469798A (zh) * 2015-11-17 2016-04-06 浙江图维电力科技有限公司 基于声信号统计特征的挖掘器械识别方法
CN106601249A (zh) * 2016-11-18 2017-04-26 清华大学 一种基于听觉感知特性的数字语音实时分解/合成方法
CN106653032A (zh) * 2016-11-23 2017-05-10 福州大学 低信噪比环境下基于多频带能量分布的动物声音检测方法
CN107464563A (zh) * 2017-08-11 2017-12-12 潘金文 一种语音交互玩具
CN107483029A (zh) * 2017-07-28 2017-12-15 广州多益网络股份有限公司 一种自适应滤波器的长度调节方法及装置
CN107832261A (zh) * 2017-11-02 2018-03-23 华东交通大学 一种基于小波变换的非平稳排气噪声信号阶次定量提取方法
CN112086105A (zh) * 2020-08-31 2020-12-15 中国船舶重工集团公司七五0试验场 一种基于Gammatone分频带连续谱特征的目标识别方法
CN113409819A (zh) * 2021-08-19 2021-09-17 中国空气动力研究与发展中心低速空气动力研究所 一种基于听觉谱特征提取的直升机声信号识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009046359A2 (en) * 2007-10-03 2009-04-09 University Of Southern California Detection and classification of running vehicles based on acoustic signatures
CN102982802A (zh) * 2012-12-06 2013-03-20 四川大学 一种基于实时编码的车辆特征识别算法
KR101330923B1 (ko) * 2012-09-28 2013-11-18 인하대학교 산학협력단 감마톤 필터를 이용한 차량 소음의 음질 평가 방법 및 그 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009046359A2 (en) * 2007-10-03 2009-04-09 University Of Southern California Detection and classification of running vehicles based on acoustic signatures
KR101330923B1 (ko) * 2012-09-28 2013-11-18 인하대학교 산학협력단 감마톤 필터를 이용한 차량 소음의 음질 평가 방법 및 그 장치
CN102982802A (zh) * 2012-12-06 2013-03-20 四川大学 一种基于实时编码的车辆特征识别算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
胡峰松等: "基于Gammatone滤波器组的听觉特征提取", 《计算机工程》, vol. 38, no. 21, 30 November 2012 (2012-11-30) *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985390A (zh) * 2014-05-20 2014-08-13 北京安慧音通科技有限责任公司 一种基于伽马通相关图语音特征参数提取方法
CN104751845A (zh) * 2015-03-31 2015-07-01 江苏久祥汽车电器集团有限公司 一种用于智能机器人的声音识别方法及系统
CN105469798B (zh) * 2015-11-17 2019-05-03 浙江图维科技股份有限公司 基于声信号统计特征的挖掘器械识别方法
CN105469798A (zh) * 2015-11-17 2016-04-06 浙江图维电力科技有限公司 基于声信号统计特征的挖掘器械识别方法
CN106601249A (zh) * 2016-11-18 2017-04-26 清华大学 一种基于听觉感知特性的数字语音实时分解/合成方法
CN106601249B (zh) * 2016-11-18 2020-06-05 清华大学 一种基于听觉感知特性的数字语音实时分解/合成方法
CN106653032A (zh) * 2016-11-23 2017-05-10 福州大学 低信噪比环境下基于多频带能量分布的动物声音检测方法
CN106653032B (zh) * 2016-11-23 2019-11-12 福州大学 低信噪比环境下基于多频带能量分布的动物声音检测方法
CN107483029A (zh) * 2017-07-28 2017-12-15 广州多益网络股份有限公司 一种自适应滤波器的长度调节方法及装置
CN107483029B (zh) * 2017-07-28 2021-12-07 广州多益网络股份有限公司 一种voip通讯中的自适应滤波器的长度调节方法及装置
CN107464563A (zh) * 2017-08-11 2017-12-12 潘金文 一种语音交互玩具
CN107832261A (zh) * 2017-11-02 2018-03-23 华东交通大学 一种基于小波变换的非平稳排气噪声信号阶次定量提取方法
CN107832261B (zh) * 2017-11-02 2020-09-29 华东交通大学 一种基于小波变换的非平稳排气噪声信号阶次定量提取方法
CN112086105A (zh) * 2020-08-31 2020-12-15 中国船舶重工集团公司七五0试验场 一种基于Gammatone分频带连续谱特征的目标识别方法
CN112086105B (zh) * 2020-08-31 2022-08-19 中国船舶重工集团公司七五0试验场 一种基于Gammatone分频带连续谱特征的目标识别方法
CN113409819A (zh) * 2021-08-19 2021-09-17 中国空气动力研究与发展中心低速空气动力研究所 一种基于听觉谱特征提取的直升机声信号识别方法

Also Published As

Publication number Publication date
CN103714810B (zh) 2016-05-25

Similar Documents

Publication Publication Date Title
CN103714810B (zh) 基于Gammatone滤波器组的车型特征提取方法
Necciari et al. The ERBlet transform: An auditory-based time-frequency representation with perfect reconstruction
CN107993648A (zh) 一种无人机识别方法、装置及电子设备
CN108198545B (zh) 一种基于小波变换的语音识别方法
Gopalan et al. A comparison of speaker identification results using features based on cepstrum and Fourier-Bessel expansion
Del Campo et al. A real-time driver identification system based on artificial neural networks and cepstral analysis
CN102750955A (zh) 基于残差信号频谱重构的声码器
CN103903632A (zh) 一种多声源环境下的基于听觉中枢系统的语音分离方法
Tan et al. An efficient dilated convolutional neural network for UAV noise reduction at low input SNR
CN103994820B (zh) 一种基于微孔径麦克风阵列的运动目标识别方法
CN112309411A (zh) 相位敏感的门控多尺度空洞卷积网络语音增强方法与系统
CN103557925B (zh) 水下目标gammatone离散小波系数听觉特征提取方法
Lim et al. Harmonic and percussive source separation using a convolutional auto encoder
CN112183582A (zh) 一种多特征融合的水下目标识别方法
CN115295011A (zh) 一种声音信号处理方法、装置、设备及存储介质
Thomas et al. Acoustic and data-driven features for robust speech activity detection
CN116543795B (zh) 一种基于多模态特征融合的声音场景分类方法
Ding et al. Acoustic scene classification based on ensemble system
CN106483555B (zh) Enpemf数据的格林函数-spwvd时频分析方法
WO2019062197A1 (zh) 一种新能源车电机噪声信号提取方法及系统
CN106297768A (zh) 一种语音识别方法
CN115938346B (zh) 音准评估方法、系统、设备及存储介质
Wang et al. Discrete wavelet transfom for nonstationary signal processing
Bhowmick et al. Speech enhancement using Teager energy operated ERB-like perceptual wavelet packet decomposition
CN113571074B (zh) 基于多波段结构时域音频分离网络的语音增强方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant