CN105044675A - 一种srp声源定位的快速实现方法 - Google Patents

一种srp声源定位的快速实现方法 Download PDF

Info

Publication number
CN105044675A
CN105044675A CN201510418561.8A CN201510418561A CN105044675A CN 105044675 A CN105044675 A CN 105044675A CN 201510418561 A CN201510418561 A CN 201510418561A CN 105044675 A CN105044675 A CN 105044675A
Authority
CN
China
Prior art keywords
phi
theta
former
srp
farrow structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510418561.8A
Other languages
English (en)
Other versions
CN105044675B (zh
Inventor
尹明婕
陈华伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Aeronautics and Astronautics
Original Assignee
Nanjing University of Aeronautics and Astronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Aeronautics and Astronautics filed Critical Nanjing University of Aeronautics and Astronautics
Priority to CN201510418561.8A priority Critical patent/CN105044675B/zh
Publication of CN105044675A publication Critical patent/CN105044675A/zh
Application granted granted Critical
Publication of CN105044675B publication Critical patent/CN105044675B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种SRP声源定位的快速实现方法,首先求得Farrow结构波束形成器的最优权值;然后计算属于Farrow结构波束形成器SRP-PHAT的相位加权函数;接着计算属于Farrow结构波束形成器SRP-PHAT所有麦克风两两麦克风的广义互相关函数之和并进行锁存;再次将锁存后的输出信号与Farrow结构波束形成器扫描角度唯一有关的调向参数D进行乘积相加运算,得到相应扫描点的瞬时功率,搜索最大峰值得到对应的定位角度θrˊ;最后进行消除Farrow结构波束形成器的系统误差的校准,得最终θr。本发明相比原SRP-PHAT运算量降低;且对混响和噪声具有更高的鲁棒性、方位角估计精度也较高。

Description

一种SRP声源定位的快速实现方法
技术领域
本发明涉及声源定位技术,特别是一种SRP声源定位的方法。
背景技术
声源定位技术主要分为3大类,即基于最大可控响应功率的波束形成方法、采用高分辨率谱估计的方法和基于时延估计的两步定位方法。2002年,J.H.DiBiase(见文献[1]J.H.DiBiase.Ahigh-accuracy,low-latencytechniquefortalkerlocalizationinreverberantenvironments[D].ProvidenceRI,USA:BrownUniversity,2000和文献[2]谭颖,殷福亮,李细林.改进的SRP-PHAT声源定位方法[J].电子与信息学报,2006,28(7):1223~1227.见文献[3]JacekP.Dmochowski.AGeneralizedSteeredResponsePowerMethodforComputationallyViableSourceLocalization.IEEEtransactionsonaudio,speech,andlanguageprocessing,VOL.15,NO.8,2007)提出了联合可控响应功率和相位变换(SRP-PHAT)的声源定位方法,该方法将可控响应功率方法固有的鲁棒性、短时分析特征与时延估计中相位变换方法对信号周围环境的不敏感性相结合,使声源定位系统具有一定的抗噪性、抗混响性。但是,SRP-PHAT方法运算量庞大,并且在恶劣环境下(噪声干扰大、混响影响严重)性能急剧下降,因此在实时处理和实际应用时变得困难。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供了一种SRP声源定位的快速实现方法,用于解决现有的SRP-PHAT方法运算量打且恶劣环境下性能差的技术问题。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种SRP声源定位的快速实现方法,包括如下步骤:
步骤1、利用基于凸优化的波束指向可调的宽带稳健远场频率不变波束形成器算法得到Farrow结构波束形成器的最优权值,从而设计完成Farrow结构波束形成器;
步骤2、利用Farrow结构波束形成器在调整波束指向时无需重新计算权值这个结构特征,将各麦克风阵列的输入信号进行FFT运算,根据不同麦克风以及输入信号的阶数将FFT运算后的输入信号进行两两相乘、求得相位加权函数;
步骤3、将各麦克风阵列的输入信号输入至Farrow结构波束形成器中进行空域滤波,空域滤波后的输出信号进行FFT运算,根据不同麦克风以及输出信号的阶数将FFT运算后的输出信号进行两两相乘求得相位加权函数对应量,;
步骤4、根据两个麦克风以及各自输入信号的阶数所确定的相位加权函数以及相位加权函数对应量为一组进行对应,将属于同一组的相位加权函数与相位加权函数对应量进行相乘,然后将相乘的结果进行IFFT运算之后并累加求和得到所有的麦克风中的两两麦克风的广义互相关函数之和并进行锁存;
步骤5、将两两麦克风的广义互相关函数之和与扫描角度唯一有关的调向参数D进行乘积相加运算,得到相应扫描点的瞬时功率,搜索瞬时功率的最大峰值得到对应的指向角度θr';
步骤6、对Farrow结构波束形成器的系统误差进行校准,并将步骤5中获得的指向角度θr'校准为最终的定位角度θr
进一步的,在本发明中,所述步骤1的具体步骤为:基于凸优化的思想设计稳健波束指向可调的频率不变波束形成器,稳健的最大误差最小化的优化设计的代价函数:
min w max ( Φ , θ , f ) ∈ Z max | | Δ g ‾ | | ≤ ϵ Σ Φ d i ∈ Ψ Σ f k ∈ Ω Σ θ n ∈ Θ p Φ d i F ( Φ , θ , f ) | w T [ g ( Φ d i , f k , θ n ) + Δ g ( Φ d i , f k , θ n ) ] - w T g ( Φ d i , f r , θ n ) |
s . t . { &Sigma; &Phi; d i &Element; &Psi; &Sigma; f k &Element; &Omega; &Sigma; &theta; n &Element; &Theta; s &Phi; d i F ( &Phi; , &theta; , f ) | w T &lsqb; g ( &Phi; d i , f k , &theta; n ) + &Delta; g ( &Phi; d i , f k , &theta; n ) &rsqb; | < &eta; w T g ( &Phi; d i , f r , &Phi; d i ) &GreaterEqual; 1 - - - ( 4 )
上面代价函数(4)式中包含从上往下的3个式子:第一个式子表示的物理含义是在主瓣范围内保证频率不变;第二个式子表示在旁瓣范围内需要对实际响应值小于一个上限值,达到使旁瓣范围内的能量谱尽量小的目的;第三个式子的目的在于保证在指定波束指向方向参考频率fr以及参考方向上的波束响应为1。
代价函数(4)式中:
g是导向量;Δg是导向矢量的误差;f是频率点;θ是波达方向;φ是波束指向角度;Ψ是预定义的可调方向范围;fk、θn分别表示离散的可调方向角度点、频率点以及波达方向角度点;fr是参考频率;Ω是感兴趣的频带范围;Ζ是预设的参数范围;Θp是主瓣角度范围;Θs是旁瓣角度范围;ε表示将导向矢量误差Δg的模值控制在ε值的界内;同理,η则表示其左侧的表达式的模值被认为控制在η值得界内;F是加权系数;wT是权值的转置;
利用SeDumi软件对上式进行求解得出Farrow结构波束形成器的最优权值w。
基于Farrow结构波束形成器始终只需一组固定的权值,通过调整调向参数D这一参数,即可实现波束指向实时调整,无需重新求解权值,这正是我们设计的Farrow结构波束形成器用于SRP声源定位法能够简化计算量的关键原因所在。
所述步骤3中编号为j的麦克风阵元的输入信号经过Farrow结构波束形成器的空域滤波作用后输出信号yj为:
y j = &Sigma; m = 0 M - 1 A m &CenterDot; D i M - 1 - m - - - ( 6 )
(6)式中:
M是Farrow结构波束形成器中的滤波器的阶数;
并且有:
A m = &Sigma; k = 0 K - 1 x k ( t ) * w k , m m = 0 , 1 , ... , M - 1 - - - ( 7 )
(7)式中:
xk(t)表示第k个麦克风阵元的输入信号,这里的n表示离散形式;wk,m表示最优权值w中的第k个麦克风阵元的第m阶滤波器的权值;K表示麦克风阵元的个数;
根据Farrow波束形成器的结构,在这里Am是只要通过一次计算之后就可以直接锁存起来的数据。即输出信号yj只取决于调向参数D,即Am可被直接锁存,从而达到实时调整波束指向的目的。
所述步骤2中,由Farrow结构波束形成器的SRP-PHAT方法的波束输出功率P(τ0,...,τK-1)定义为:
(8)式中:
这里P(τ0,...,τK-1)中的τk表示第k个阵元相对于参考阵元的时延差;为第k个麦克风接收到的输入信号xk(t)的傅里叶变换;
为第l个麦克风接收到的输入信号xl(t)的傅里叶变换;的共轭转置;
且有:
Di=(θi-90°)/90°(11)
这里i表示可调角度离散形式的每个离散点;
多通道形式的PHAT的相位加权函数为:
(12)式表述的含义:将每个麦克风阵元输入信号进行FFT运算之后再两两进行相乘、取模、求倒数一系列运算之后得相位加权函数。
所述步骤4运算量降低的具体表现原理:
令:
(13)式中:
A k , m 1 = &Sigma; n = 0 N - 1 x k , m 1 ( t ) * w k , m 1 , n - - - ( 14 )
A l , m 2 = &Sigma; n = 0 N - 1 x l , m 2 ( t ) * w l , m 2 , n - - - ( 15 )
(14)式子表示的含义是:第k个麦克风阵元、第m1阶FIR滤波器的输入信号经过空域滤波之后得到的输出信号将被锁存在的数据里。同理可解释(15)式中的
这样很容易理解(13)式所表达的含义是:将锁存起来的数据即输入信号与权值进行卷积再进行FFT后两两相乘,再与相应的加权函数进行相乘,IFFT运算之后累加求和,可得所有麦克风两两麦克风的广义互相关函数之和并进行锁存在H里。这一系列的过程随着权值的形成一步完成并锁存下来,无需重新计算。所述步骤4中利用Farrow结构波束形成器特殊的结构优势,降低计算量的原理过程。
所述步骤5中,按照Farrow结构波束形成器的结构图写出其瞬时功率:
P ( &tau; 0 , ... , &tau; K - 1 ) = H &CenterDot; &Sigma; m 1 = 0 M - 1 &Sigma; m 2 = 0 M - 1 D i 2 M - 2 - ( m 1 + m 2 ) - - - ( 16 )
所述步骤5中按照Farrow结构波束形成器的结构图将调向参数D与已经锁存的输出数据结合起来,达到调向的目的。
所述步骤5中,传统的SRP-PHAT与本发明的Farrow-SRP-PHAT运算量对比:
假设传统的SRP-PHAT中的常规波束形成器有K个阵元、每个阵元有N个抽头、扫描点数为n′、信号序列长度为L点。
复乘次数:n′*[N*K*L+K2*[(3/2)*L*log2L+3L]]次
复加次数:n′*[(N-1)*K*L+K2*[3*L*log2L]+(K2-1)*L]次
假设本发明中的Farrow结构波束形成器有K个阵元、每个阵元有M阶N个抽头FIR滤波器、扫描点数为n′、信号序列长度为L点。
复乘次数:
L*M*N*K+n′*[K2*(M-1)2*L]+K2*M2*[(3/2)*L*log2L+3*L]次
复加次数:
L*M*(N-1)*K+n′*[K2*(M-1)2*L]+K2*M2*(3*L*log2L)次
所述步骤6中,进行校准工作的原因在于Farrow结构波束形成器本身是存在系统误差的。为了消除系统误差,从而将定位的精度提高,我们在算法的最后添加了一个校准工作。
有益效果:
本发明的一种SRP声源定位的快速实现方法,相比现有技术,本发明大大降低了运算量,简化了SRP-PHAT方法的实现复杂度,并且对混响和噪声具有更高的鲁棒性,方位估计精度也较高。具体为:
(1)SRP-PHAT方法运算量庞大,因此在实时处理变得困难,本发明利用Farrow结构波束形成器在调整波束指向时无需重新计算权值的结构优势,从而使得整体运算量大大降低,大大提高了实时性。
(2)SRP-PHAT方法在恶劣环境下(噪声干扰大、混响影响严重)性能急剧下降,所以使得实际应用变得困难,本发明利用了Farrow结构波束形成器鲁棒性较好的特性,使得本发明设计具有较高的抗混响能力和空间噪声抑制能力。
(3)本发明算法在解决了Farrow结构波束形成器本身具有系统误差这个问题的前提下,相比现有的方法提高了SRP-PHAT在恶劣环境下的定位精度。
附图说明
图1为Farrow结构波束形成器的结构图:
图2为本发明方法原理流程图;
图3为本发明基于凸优化束指向可调频率不变(FIB)波束指向可调指向60°的波束图的三维图;
图4为本发明基于凸优化束指向可调频率不变(FIB)波束指向可调指向60°的波束图的正视图;
图5为基于凸优化束指向可调最小二乘(LS)波束指向可调指向60°的波束图的三维图;
图6为基于凸优化束指向可调最小二乘(LS)波束指向可调指向60°的波束图的正视图;
图7为基于凸优化波束指向可调频率不变(FIB)算法在上述条件下设计的波束形成器指向60°时方向图的三维图;
图8为基于凸优化波束指向可调频率不变(FIB)算法在上述条件下设计的波束形成器指向60°时方向图的正视图;
图9为信噪比分别为为10dB、5dB,混响分别300ms到800ms以50ms为间隔的混响噪声环境下仿真的性能对比图;
图10为混响时间分别为250ms、300ms,信噪比分别-20dB到20dB以5dB为间隔的混响噪声环境下仿真的性能对比图;
图11表示信噪比10dB、0dB,混响分别为300ms到650ms以50ms为间隔的混响噪声环境下仿真的性能对比图;
图12为混响时间分别是600ms和750ms,信噪比分别为3dB到21dB以3dB为间隔的混响噪声环境下仿真的性能对比图;
图13为阵元数对本发明方法与SRP-PHAT算法在运算量的影响的对比图;
图14为扫描点数对本发明方法与SRP-PHAT算法在运算量的影响的对比图;
图15为抽头数对本发明方法与SRP-PHAT算法在运算量的影响对比图;
图16为信号序列的点数对本发明方法与SRP-PHAT算法在运算量的影响的对比图。
具体实施方式
下面结合附图对本发明作更进一步的说明。
本发明方法是在如图1所示的麦克风阵列的基础上,按照图2所示的原理流程图进行研究的。
步骤1、对Farrow结构波束形成器进行设计。所用到的算法是基于凸优化的波束指向可调的宽带稳健远场频率不变波束形成器算法来得到波束形成器的最优权值。
这里采用稳健的最大误差最小化的优化设计的代价函数:
min w max ( &Phi; , &theta; , f ) &Element; Z max | | &Delta; g &OverBar; | | &le; &epsiv; &Sigma; &Phi; d i &Element; &Psi; &Sigma; f k &Element; &Omega; &Sigma; &theta; n &Element; &Theta; p &Phi; d i F ( &Phi; , &theta; , f ) | w T &lsqb; g ( &Phi; d i , f k , &theta; n ) + &Delta; g ( &Phi; d i , f k , &theta; n ) &rsqb; - w T g ( &Phi; d i , f r , &theta; n ) |
s . t . { &Sigma; &Phi; d i &Element; &Psi; &Sigma; f k &Element; &Omega; &Sigma; &theta; n &Element; &Theta; s &Phi; d i F ( &Phi; , &theta; , f ) | w T &lsqb; g ( &Phi; d i , f k , &theta; n ) + &Delta; g ( &Phi; d i , f k , &theta; n ) &rsqb; | < &eta; w T g ( &Phi; d i , f r , &Phi; d i ) &GreaterEqual; 1 - - - ( 17 )
上式中,Δg(Φ,θ,f)表示由幅度和相位、位置等误差都将引起阵列的导向矢量g(Φ,θ,f)的畸变,假设g(Φ,θ,f)的畸变是在一定范围内,即:
按照SeDumi软件的求解规律,将(18)式化简为对偶形式再解代价函数,求得最优权值。
步骤2、使用本发明的设计方法设计好Farrow结构波束形成器之后,接下来我们用Farrow结构波束形成器在调整波束指向时无需重新计算权值这个结构特征,将输入信号进行FFT运算在两两进行相乘、取模、求倒数一系列运算之后得相位加权函数并进行锁存。
编号为j的麦克风阵元的输入信号经过Farrow结构波束形成器的空域滤波作用后输出:
y j = &Sigma; m = 0 M - 1 A m &CenterDot; D i M - 1 - m - - - ( 19 )
(19)式中:
M是Farrow结构波束形成器中的滤波器的阶数;其中:
A m = &Sigma; k = 0 K - 1 x k ( t ) * w k , m m = 0 , 1 , ... , M - 1 - - - ( 20 )
其中xk(t)是第k个阵元的输入信号。Am是输入信号与权值卷积累加求和作用的结果。根据Farrow波束形成器的结构,在这里Am是只要通过一次计算之后就可以直接锁存起来的数据。
设扫描角度是θi,这里的i表示离散点,在这里我们假设可调范围是[40°,140°],扫描间隔为2°,共有离散点个数为(140-40)/2+1=51个;
Di=(θi-90°)/90°i=1,2,...,51(21)
已知Farrow-SRP-PHAT方法的波束输出功率定义为:
多通道形式的PHAT的相位加权函数为:
对输入每个麦克风的每一阶FIR滤波器的原输入信号分别做一次傅里叶变换,再将经过变换之后的两两信号经过相乘、取模、求倒数等一系列运算之后可得相位加权函数;
其中为第k个麦克风接收到的信号xk(t)的傅里叶变换;为第l个麦克风接收到的信号xl(t)的傅里叶变换;
步骤3、将各麦克风阵列的输入信号输入至Farrow结构波束形成器中进行空域滤波,空域滤波后的输出信号进行FFT运算后再两两相乘求得与式(23)中已获得的相位加权函数下标相对应的量;
它们分别为延时补偿后的信号做FFT变换之后的输出信号;
步骤4、将步骤2中获得的相位加权函数与步骤3中获得的与式(25)中已获得的相位加权函数下标相对应的量对应进行相乘,然后将相乘的结果进行IFFT运算之后并累加求和得到所有的麦克风中的两两麦克风的广义互相关函数之和并进行锁存;
结合(22),(23),(24),(25),(26),(27),整理(22)式,得:
步骤5、将两两麦克风的广义互相关函数之和与调向参数D做乘积并累加乘积相加运算,得到相应扫描点的瞬时功率,搜索瞬时功率的最大峰值得到对应的指向角度θr';
令xk,m(t)为输入第k个麦克风,第m阶FIR滤波器的的输入信号经过频率不变波束指向可调的波束形成器空域滤波作用之后的输出信号,xl,m(t)为输入第l个麦克风、第m阶FIR滤波器的的输入信号同样经过空域滤波之后的输出信号,则:
x &OverBar; k , m ( t ) = &Sigma; n = 0 N - 1 x k ( t ) * w k , m , n &CenterDot; D i M - 1 - m k = 0 , 1 , ... , K - 1 - - - ( 29 )
x &OverBar; l , m ( t ) = &Sigma; n = 0 N - 1 x l ( t ) * w 1 , m , n &CenterDot; D i M - 1 - m l = 0 , 1 , ... , K - 1 - - - ( 30 )
Di=(θi-90°)/90°(31)
结合(26)(27)和(29)(30)式可知:
我们知道,调向参数D其实是和指向角度有关的一个常数,根据FFT的性质,式(32)、(33)可以写成
令:
A k , m = &Sigma; n = 0 N - 1 x k , m ( t ) * w k , m , n - - - ( 36 )
A l , m = &Sigma; n = 0 N - 1 x l , m ( t ) * w l , m , n - - - ( 37 )
所以,(34)、(35)可以改写成:
(38)的式子表示的含义是即第k个麦克风,第m1阶输入信号经过空域滤波之后的输出信号经过FFT变换可以等价为输入信号与第k个麦克风第m1阶滤波器的N个抽头系数卷积之后做FFT变换再与调向参数D做乘积运算。这个过程只需要做一次运算即可锁存,可重复使用。同理解释(39)式。
整理(28),将(38)(39)带入(28)中:
式(28)可化简为:
P ( &tau; 0 , ... , &tau; K - 1 ) = H &CenterDot; &Sigma; m 1 = 0 M - 1 &Sigma; m 2 = 0 M - 1 D i 2 M - 2 - ( m 1 + m 2 ) - - - ( 42 )
H所表达的含义是将锁存起来的数据即输入信号与权值进行卷积再进行FFT后两两相乘,再与相应的加权函数进行相乘,IFFT运算之后累加求和可得所有麦克风两两麦克风的广义互相关函数之和并进行锁存在H里。这一系列的过程随着权值的形成一步完成并锁存下来,无需重新计算。P(τ0,...,τK-1)实际就是调向参数D根据扫描角度的不同,与H数据进行乘积累加求和运算。从而大大降低了运算量。
步骤6、对Farrow结构波束形成器的系统误差进行校准,并将步骤5中获得的指向角度θr'校准为最终的定位角度θr
下面结合一些具体实施例以及对比例对本发明做进一步说明。
实施例1
本发明方法波束形成器的设计方法是基于凸优化的波束指向可调的宽带稳健远场频率不变波束形成器算法。
现有的波束形成器设计技术其中包括基于凸优化的最小二乘波束指向可调的宽带稳健远场波束形成器算法,本发明的算法在处理语音信号的频段分布较宽时,性能优势较为明显。为此,举例说明相同环境下的两种算法的性能对比。考虑Farrow结构波束形成器的阵型为:阵元数为10、阶数为5、抽头数为20,信号频段分布在[800Hz,3600Hz],阵元间距为5cm,可调方向范围为40°到140°,参考频率为8000Hz,过渡带为40°。图3和图4为本发明基于凸优化束指向可调频率不变(FIB)波束指向可调指向60°的波束图的三维图和正视图;图5和图6为基于凸优化束指向可调最小二乘(LS)波束指向可调指向60°的波束图的三维图和正视图。通过以上仿真分析表明,本发明方法在信号频率分布在[800Hz,3600Hz]的环境要求下,指向性能优势明显。
实施例2
本发明方法说明了Farrow结构波束形成器本身是存在系统误差的。校准工作在本发明中起着很大的作用。这个步骤的根本原因在于Farrow结构波束形成器本身是具有系统误差的。我们通过具体实例证明这个理论。
假设存在均匀分布的麦克风线列,维度是10×5×20,即有10个麦克风,每个麦克风接5阶FIR滤波器,每个FIR的抽头为20。相邻的麦克风间隔5cm,并且采样频率为fs=8000Hz。波束可调方向范围Ψ设为感兴趣的频率范围Ω为[1000-3000]Hz,参考频率fr=2600。在每个波束指向中,通带带宽(PW)设为40°。在我们定义角度范围内,每个波束指向下的左右两个阻带分别[0°,φd-PW/2-20°],[φd+PW/2+20°,180°],其中φd是指向角度,白噪声增益为0.001。我们按照上述条件来设计我们的波束形成器。
图7和图8分别给出了基于凸优化波束指向可调频率不变(FIB)算法在上述条件下设计的波束形成器指向60°时方向图的三维图和正视图。由正视图可以看出,方向图的最高点并不是指向60°,实际指向为66.5306°,实际值与理论值相差了6.5306°。这就是我们所说的系统误差。
实施例3
本发明方法说明校准工作对Farrow-SRP-PHAT算法性能的影响。校准工作是为了消除Farrow结构波束形成器系统误差。这个步骤在本发明方法中的起着很大的作用。
说话人位于坐标(2.6,2.8)m位置,麦克风阵列中心点位于(3,0)m;
考虑波束可调方向范围从40°到140°,以2°为间隔,进行10次蒙特卡洛实验。对这10次结果求取均值和方差,利用均方根误差作为评价指标。
图9为信噪比分别为为10dB、5dB,混响分别300ms到800ms以50ms为间隔的混响噪声环境下仿真的性能对比图;图10为混响时间分别为250ms、300ms,信噪比分别-20dB到20dB以5dB为间隔的混响噪声环境下仿真的性能对比图。通过以上仿真分析表明,本发明方法校准之后,定位精度有显著提高;并且抗混响性能以及抗噪声性能也有明显的提升。
实施例4
SRP-PHAT算法以及本发明方法仿真以及性能比较。
说话人位于坐标(2.6,2.8)m位置,麦克风阵列中心点位于(3,0)m;
考虑波束可调方向范围从40°到140°,以2°为间隔,进行10次蒙特卡洛实验。对这10次结果求取均值和方差,利用均方根误差作为评价指标。
图11表示信噪比10dB、0dB,混响分别为300ms到650ms以50ms为间隔的混响噪声环境下仿真的性能对比图;图12为混响时间分别是600ms和750ms,信噪比分别为3dB到21dB以3dB为间隔的混响噪声环境下仿真的性能对比图。从仿真结果来看,本发明方法的定位精度要高于SRP-PHAT方法,且抗噪声以及抗混响性能也是优于SRP-PHAT方法的。
实施例5
通过对各参数分别对SRP-PHAT以及本发明算法运算量的影响,比较本发明算法和SRP-PHAT算法运算量的对比。图13为阵元数对二者运算量的影响,图14为扫描点数对二者运算量的影响,图15为抽头数对二者运算量的影响,图16为信号序列的点数对二者运算量的影响。通过各参数对二者运算量的影响可以看出:Farrow-SRP-PHAT算法的的运算量远远小于SRP-PHAT算法。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (3)

1.一种SRP声源定位的快速实现方法,其特征在于:包括如下步骤:
步骤1、利用基于凸优化的波束指向可调的宽带稳健远场频率不变波束形成器算法得到Farrow结构波束形成器的最优权值,从而完成Farrow结构波束形成器的设计;
步骤2、将各麦克风阵列的输入信号进行FFT运算,根据不同麦克风以及输入信号的阶数将FFT运算后的输入信号进行两两相乘,求得相位加权函数;
步骤3、将各麦克风阵列的输入信号输入至Farrow结构波束形成器中进行空域滤波,空域滤波后的输出信号进行FFT运算,根据不同麦克风以及输出信号的阶数将FFT运算后的输出信号进行两两相乘求得相位加权函数对应量;
步骤4、根据两个麦克风以及各自输入信号的阶数所确定的相位加权函数以及相位加权函数对应量为一组进行对应,将属于同一组的相位加权函数与相位加权函数对应量进行相乘,然后将相乘的结果进行IFFT运算之后并累加求和得到所有的麦克风中的两两麦克风的广义互相关函数之和并进行锁存;
步骤5、将两两麦克风的广义互相关函数之和与调向参数D做乘积并累加运算,得到相应扫描点的瞬时功率,搜索瞬时功率的最大峰值得到对应的指向角度θr';
步骤6、对Farrow结构波束形成器的系统误差进行校准,并将步骤5中获得的指向角度θr'校准为最终的定位角度θr
2.如权利要求1所述的SRP声源定位的快速实现方法,其特征在于:步骤1的设计过程中,采用如下稳健的最大误差最小化的优化设计的代价函数:
min w max ( &Phi; , &theta; , f ) &Element; Z max | | &Delta; g &OverBar; | | &le; &epsiv; &Sigma; &Phi; d i &Element; &Psi; &Sigma; f k &Element; &Omega; &Sigma; &theta; n &Element; &Theta; p &Phi; d i F ( &Phi; , &theta; , f ) | w T &lsqb; g ( &Phi; d i , f k , &theta; n ) + &Delta; g ( &Phi; d i , f k , &theta; n ) &rsqb; - w T g ( &Phi; d i , f k , &theta; n ) | s . t . &Sigma; &Phi; d i &Element; &Psi; &Sigma; f k &Element; &Omega; &Sigma; &theta; n &Element; &Theta; p &Phi; d i F ( &Phi; , f , &theta; ) | w T &lsqb; g ( &Phi; d i , f k , &theta; n ) + &Delta; g ( &Phi; d i , f k , &theta; n ) &rsqb; | < &eta; w T g ( &Phi; d i , f r , &Phi; d i ) &le; 1 - - - ( 1 )
(1)式中:
g是导向量;Δg是导向矢量的误差;f是频率点;θ是波达方向角度点;φ是波束指向角度;Ψ是预定义的可调方向范围;fk、θn分别表示离散的可调方向角度点、频率点以及波达方向角度点;fr是参考频率;Ω是感兴趣的频带范围;Ζ是预设的参数范围;Θp是主瓣角度范围;Θs是旁瓣角度范围;ε表示将导向矢量误差Δg的模值控制在ε值的界内;同理,η则表示其左侧的表达式的模值被认为控制在η值得界内;F是加权系数;wT是权值的转置;
利用SeDumi软件对上式进行求解得出Farrow结构波束形成器的最优权值w。
3.如权利要求1所述的SRP声源定位的快速实现方法,其特征在于:所述步骤3步骤中,编号为j的麦克风阵元的输入信号经过Farrow结构波束形成器进行空域滤波后输出信号为:
y j = &Sigma; m = 0 M - 1 A m &CenterDot; D i M - 1 - m - - - ( 2 )
(2)式中:
M是Farrow结构波束形成器中的滤波器的阶数;
并且有:
A m = &Sigma; k = 0 K - 1 x k ( t ) * w k , m , m = 0 , 1 , ... , M - 1 - - - ( 3 )
(3)式中:
xk(t)表示第k个麦克风阵元的输入信号;wk,m表示最优权值中的第k个麦克风阵元的第m阶滤波器的权值;K表示麦克风阵元的个数。
CN201510418561.8A 2015-07-16 2015-07-16 一种srp声源定位的快速实现方法 Expired - Fee Related CN105044675B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510418561.8A CN105044675B (zh) 2015-07-16 2015-07-16 一种srp声源定位的快速实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510418561.8A CN105044675B (zh) 2015-07-16 2015-07-16 一种srp声源定位的快速实现方法

Publications (2)

Publication Number Publication Date
CN105044675A true CN105044675A (zh) 2015-11-11
CN105044675B CN105044675B (zh) 2017-09-08

Family

ID=54451352

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510418561.8A Expired - Fee Related CN105044675B (zh) 2015-07-16 2015-07-16 一种srp声源定位的快速实现方法

Country Status (1)

Country Link
CN (1) CN105044675B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105467993A (zh) * 2015-11-17 2016-04-06 西安科技大学 声音导引系统
CN106707238A (zh) * 2016-12-27 2017-05-24 国网辽宁省电力有限公司电力科学研究院 一种输电导线风噪声源的观测系统及方法
CN108574459A (zh) * 2017-03-14 2018-09-25 南京理工大学 一种采用级联fir横向滤波结构的高效时域宽带波束形成电路及方法
CN109188362A (zh) * 2018-09-03 2019-01-11 中国科学院声学研究所 一种麦克风阵列声源定位信号处理方法
CN109410579A (zh) * 2018-11-12 2019-03-01 广西交通科学研究院有限公司 一种运动车辆音频检测系统及检测方法
CN109541548A (zh) * 2018-11-22 2019-03-29 西安联丰迅声信息科技有限责任公司 一种基于匹配场的空气声呐定位方法
CN111929645A (zh) * 2020-09-23 2020-11-13 深圳市友杰智新科技有限公司 特定人声的声源定位方法、装置和计算机设备
CN113138363A (zh) * 2021-04-22 2021-07-20 苏州臻迪智能科技有限公司 一种声源定位方法、装置、存储介质和电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8294615B2 (en) * 2005-11-28 2012-10-23 Thales Array antenna with irregular mesh and possible cold redundancy
CN103837858A (zh) * 2012-11-23 2014-06-04 中国科学院声学研究所 一种用于平面阵列的远场波达角估计方法及系统
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8294615B2 (en) * 2005-11-28 2012-10-23 Thales Array antenna with irregular mesh and possible cold redundancy
CN103837858A (zh) * 2012-11-23 2014-06-04 中国科学院声学研究所 一种用于平面阵列的远场波达角估计方法及系统
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谭颖等: "改进的SRP-PHAT声源定位方法", 《电子与信息学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105467993A (zh) * 2015-11-17 2016-04-06 西安科技大学 声音导引系统
CN106707238A (zh) * 2016-12-27 2017-05-24 国网辽宁省电力有限公司电力科学研究院 一种输电导线风噪声源的观测系统及方法
CN108574459A (zh) * 2017-03-14 2018-09-25 南京理工大学 一种采用级联fir横向滤波结构的高效时域宽带波束形成电路及方法
CN108574459B (zh) * 2017-03-14 2022-04-01 南京理工大学 一种高效时域宽带波束形成电路及方法
CN109188362A (zh) * 2018-09-03 2019-01-11 中国科学院声学研究所 一种麦克风阵列声源定位信号处理方法
CN109410579A (zh) * 2018-11-12 2019-03-01 广西交通科学研究院有限公司 一种运动车辆音频检测系统及检测方法
CN109541548A (zh) * 2018-11-22 2019-03-29 西安联丰迅声信息科技有限责任公司 一种基于匹配场的空气声呐定位方法
CN111929645A (zh) * 2020-09-23 2020-11-13 深圳市友杰智新科技有限公司 特定人声的声源定位方法、装置和计算机设备
CN113138363A (zh) * 2021-04-22 2021-07-20 苏州臻迪智能科技有限公司 一种声源定位方法、装置、存储介质和电子设备

Also Published As

Publication number Publication date
CN105044675B (zh) 2017-09-08

Similar Documents

Publication Publication Date Title
CN105044675A (zh) 一种srp声源定位的快速实现方法
CN104730491B (zh) 一种基于l型阵的虚拟阵列doa估计方法
CN110488223A (zh) 一种声源定位方法
CN108375763B (zh) 一种应用于多声源环境的分频定位方法
CN107450047B (zh) 嵌套阵下基于未知互耦信息的压缩感知doa估计方法
CN105445709B (zh) 一种稀布阵列近场无源定位幅相误差校正方法
CN104408278A (zh) 一种基于干扰噪声协方差矩阵估计的稳健波束形成方法
CN103091677B (zh) 一种基于时反的均匀线列阵波束形成方法
CN109541548B (zh) 一种基于匹配场的空气声呐定位方法
CN110007266A (zh) 一种冲击噪声下的任意阵列相干源测向方法
CN111123192A (zh) 一种基于圆形阵列和虚拟扩展的二维doa定位方法
CN106227701A (zh) 一种阵列信号的接收通道的幅相误差的自校正方法
CN101351058A (zh) 一种麦克风阵列及实现语音信号增强的方法
CN101383651B (zh) 一种适用于宽带信号的近场时域波束形成方法
CN106405487A (zh) 一种通用基于扩展esprit技术的空间谱估计方法
CN109143190A (zh) 一种零陷展宽的宽带稳健自适应波束形成方法
CN111580042B (zh) 一种基于相位优化的深度学习测向方法
CN102540153B (zh) 一种基于站间直达波干扰的阵列幅相误差校准方法
CN109557504A (zh) 一种近场窄带信号源的定位方法
CN104931937B (zh) 基于协方差矩阵归一化的子阵级正交投影波束形成方法
CN103837858A (zh) 一种用于平面阵列的远场波达角估计方法及系统
CN101149435A (zh) 一种u型阵波束形成加权方法
CN108416105A (zh) 脉冲和高斯噪声下稳健的自适应波束形成算法
CN109814065B (zh) 基于相位因子加权的波束形成方法
CN101825715A (zh) 一种卫星导航接收设备波束形成的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170908

Termination date: 20190716