CN106093866A - 一种适用于空心球阵列的声源定位方法 - Google Patents

一种适用于空心球阵列的声源定位方法 Download PDF

Info

Publication number
CN106093866A
CN106093866A CN201610367282.8A CN201610367282A CN106093866A CN 106093866 A CN106093866 A CN 106093866A CN 201610367282 A CN201610367282 A CN 201610367282A CN 106093866 A CN106093866 A CN 106093866A
Authority
CN
China
Prior art keywords
ball array
array
hollow ball
applicable
sound localization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610367282.8A
Other languages
English (en)
Inventor
胡玉祥
卢晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201610367282.8A priority Critical patent/CN106093866A/zh
Publication of CN106093866A publication Critical patent/CN106093866A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/20Position of source determined by a plurality of spaced direction-finders

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种适用于空心球阵列的声源定位方法。该方法结合空心球阵列和最大似然估计的优点,在不影响空间声场的情况下,使用最大似然估计策略,准确定位空间声源方向。本发明的显著优点在于:(1)将传声器接收到的信号变换到球谐域,可降低计算复杂度;(2)使用最大似然估计策略,能够获得较高的空间分辨率和定位准确度;(3)避免了球贝塞尔函数的除法,有效解决了空心球阵列在球贝塞尔函数零点对应频率处鲁棒性弱的问题;(4)可以直接扩展到宽带,降低了球阵列宽带定位算法扩展的复杂度,适用于混响声场;(5)除了适用于空心球阵列以外,该方法同样适用于刚性球阵列以及使用单指向传声器的球阵列。

Description

一种适用于空心球阵列的声源定位方法
一、技术领域
本发明提出了一种适用于空心球阵列的声源定位方法,结合空心球阵列和最大似然估计的优点,在不影响空间声场的情况下,使用最大似然估计策略,处理球谐域信号,避免球贝塞尔函数除法,准确定位空间声源方向,定位方法可有效扩展到宽带信号的处理场景。
二、背景技术
球形传声器阵列具有旋转对称结构,能够设计指向空间任意方向的波束,被广泛应用在波达方向估计、房间脉冲响应分析、声源定位以及房间结构预测中,为近年研究的热门话题。空心球阵列能够在不影响测量声场的情况下,获得空间信息,因而更适用于实际应用场景。
文献[I.Balmages&B.Rafaely,Open-sphere designs for sphericalmicrophone arrays]提出了一种使用双层空心球阵列的结构,在声源定位中,能够避免球贝塞尔函数零点处空心球阵列鲁棒性较弱的问题,但是需要两倍的传声器数目。文献[B.Rafaely,The spherical-shell microphone array]提出了一种球体阵列结构,能够避免球贝塞尔函数零点处空心球阵列鲁棒性较弱的问题,但是传声器单元的半径不固定,实现较为复杂。文献[B.Rafaely,Bessel nulls recovery in spherical microphonearrays for time-limited signals]在球阵列宽带声源定位时,跳过球贝塞尔函数零点对应的频率,鲁棒性较高,但是方法灵活度较低。专利CN 102866385A和专利CN 103592628A分别提出了一种基于球谐域子空间分解和一种基于球谐域实值权重波束形成的声源定位方法,可以应用于空心球阵列,并且获得较高的空间分辨率,但是上述两种方法并未扩展到宽带,不适用于混响声场。
本专利针对现有球阵列声源定位技术的弱点,提出一种适用于空心球阵列的声源定位方法。
三、发明内容
发明目的:本发明提出来一种适用于空心球阵列的声源定位方法,使用空心球阵列,在不改变测量声场的情况下,使用最大似然策略,准确定位声源位置。
技术方案:为达到上述发明的目的,本发明所提出的技术方案如下:将球形传声器阵列接收到的时域信号,经过快速傅里叶变换和球谐变换,将信号变换到球谐域,使用最大似然估计策略,避免球贝塞尔函数的除法,最终准确估计空间声源的方向。
本发明中信号在球谐域的表达式pnm(k)=[p0,0(k),p1,-1(k),p1,0(k),p1,1(k),...,pN,N(k)]T中每一项可以表示为:
p n , m ( k ) ≈ Σ q = 1 Q 4 π Q p ( k , Ω q ) Y n , m * ( Ω q ) , n ≤ N , | m | ≤ n - - - ( 1 )
其中,Ωq=(θq,φq)为第q个传声器的位置,θ和φ分别是空间仰角和方位角,p(k,Ωq)为频域信号,Yn,m为n阶m次球谐函数,k为波数,Q为传声器数目,N为球阵列阶数,(·)*表示共轭。
本发明使用最大似然估计策略,进行单频空间声源定位,计算方法如下:
其中,表示伪逆,dnm(k,Ψ)为方向Ψ处的球谐域导向向量,可以表示为:
dnm(k,Ψ)=B(k)y*(Ψ) (3)
B(k)=diag{b0(k),b1(k),b1(k),b1(k),...,bN(k)} (4)
y(Ψ)=[Y0,0(Ψ),Y1,-1(Ψ),Y1,0(Ψ),Y1,1(Ψ),...,YN,N(Ψ)]T (5)
对于空心球阵列bn(k)=4πinjn(ka),jn(ka)为n阶球贝塞尔函数,a为球阵列半径。公式(2)为单频声源定位方法,回避了球贝塞尔函数bn(k)的除法,解决的bn(k)零点对应频率处鲁棒性弱的问题。
在混响声场中,宽带空间声源定位往往会有更好的准确性,本发明的定位方法可以很容易地扩展到宽带场景,定位方法如下:
式中,kmin和kmax分别表示最低频率和最高频率对应的波数。
本发明提出的声源定位方法,适用于多种阵列形式,如空心球阵列、刚性球阵列和使用单指向传声器的球阵列。
四、附图说明
图1是本发明提出的声源定位方法的流程图
图2是本发明在消声室中声源定位实验结果(a)单频(b)宽带
图3是本发明在视听室中声源定位实验结果(a)单频(b)宽带
五、具体实施方式
附图1是使用本发明提出的声源定位方法的流程图,对传声器接收到的时域信号进行分帧,对每帧信号做快速傅里叶变换,获得频域信号p(k,Ωq),对频域信号进行球谐变换,获得球谐域信号pnm(k),球谐变换可以表示为:
p n , m ( k ) ≈ Σ q = 1 Q 4 π Q p ( k , Ω q ) Y n , m * ( Ω q ) , n ≤ N , | m | ≤ n - - - ( 7 )
其中,Ωq=(θq,φq)为第q个传声器的位置,θ和φ分别是空间仰角和方位角,p(k,Ωq)为频域信号,Yn,m为n阶m次球谐函数,k为波数,Q为传声器数目,N为球阵列阶数,(·)*表示共轭。
使用最大似然策略,进行单频空间声源定位,计算方法如下:
其中,表示伪逆,dnm(k,Ψ)为方向Ψ处的球谐域导向向量,可以表示为:
dnm(k,Ψ)=B(k)y*(Ψ) (9)
B(k)=diag{b0(k),b1(k),b1(k),b1(k),...,bN(k)} (10)
y(Ψ)=[Y0,0(Ψ),Y1,-1(Ψ),Y1,0(Ψ),Y1,1(Ψ),...,YN,N(Ψ)]T (11)
对于空心球阵列bn(k)=4πinjn(ka),jn(ka)为n阶球贝塞尔函数,a为球阵列半径。
对于混响声场,使用单频声源定位误差较大,本发明提出的声源定位方法可以直接扩展到宽带,使用最大似然估计策略,进行宽带空间声源定位,计算方法如下:
式中,kmin和kmax分别表示最低频率和最高频率对应的波数。
使用本发明提出的声源定位方法,分别在消声室和视听室中进行了实验,实验中使用一个8单元均匀分布空心球阵列,球阵列半径为13.9cm,球谐分解展开阶数N=1,每帧时域信号帧长K=1024,采样频率为fs=16kHz,单频信号频率满足ka=1,宽带信号为白噪声,宽带声源定位时使用的频率范围ka∈[0.5,1]。图2给出了消声室中声源定位实验结果,图中黑色圆圈表示实际声源位置,可以看出消声室中,使用单频和宽带定位方法,均可以获得较好的声源定位结果,对于一个10s的宽带信号,定位的均方根误差为0.58°。图3给出了试听室中声源定位实验结果,图中可以看出试听室中,由于混响的存在,使用单频定位方法无法准确定位声源的方向,而使用本发明提出的宽带声源定位方法,可以准确定位声源的方向。对于一个10s的宽带信号,定位的均方根误差为4.43°。
本实施例只给出了空心球阵列的相关结果,而本发明提出的声源定位方法同样适用于刚性球阵列和使用单指向传声器的球阵列。

Claims (6)

1.一种适用于空心球阵列的声源定位方法,其处理方法包含如下步骤:(1)根据空心球阵列中传声器的位置,以及传声器接收到的时域信号,通过快速傅里叶变换和球谐变换,获得信号在球谐域的表达式pnm(k);第二步、根据信号在球谐域的表达式pnm(k),以及空间任意一个方向Ψ处的球谐域导向向量dnm(k,Ψ),使用最大似然估计策略,获得波数k对应频率(k=2πf/c,c表示声速,f表示频率)下的定位结果;第三步、根据设定的波数上下限kmin和kmax,将算法扩展到宽带,获得宽带下的定位结果。
2.如权利要求1所述的一种适用于空心球阵列的最大似然声源定位方法,其特征在于:信号在球谐域的表达式pnm(k)=[p0,0(k),p1,-1(k),p1,0(k),p1,1(k),...,pN,N(k)]T中的每一项可以表示为:
p n , m ( k ) ≈ Σ q = 1 Q 4 π Q p ( k , Ω q ) Y n , m * ( Ω q ) , n ≤ N , | m | ≤ n - - - ( 1 )
其中,Ωq=(θq,φq)为第q个传声器的位置,θ和φ分别是空间仰角和方位角,p(k,Ωq)为频域信号,Yn,m为n阶m次球谐函数,k为波数,Q为传声器数目,N为球阵列阶数,(·)*表示共轭。
3.如权利要求1所述的一种适用于空心球阵列的声源定位方法,其特征在于:使用最大似然估计策略,避免球贝塞尔函数的除法。
4.如权利要求1所述的一种适用于空心球阵列的声源定位方法,其特征在于:单频信号声源定位计算方法如下:
其中,表示伪逆,dnm(k,Ψ)为方向Ψ处的球谐域导向向量,可以表示为:
dnm(k,Ψ)=B(k)y*(Ψ) (3)
B(k)=diag{b0(k),b1(k),b1(k),b1(k),...,bN(k)} (4)
y(Ψ)=[Y0,0(Ψ),Y1,-1(Ψ),Y1,0(Ψ),Y1,1(Ψ),...,YN,N(Ψ)]T (5)
对于空心球阵列bn(k)=4πinjn(ka),jn(ka)为n阶球贝塞尔函数,a为球阵列半径。
5.如权利要求1所述的一种适用于空心球阵列的声源定位方法,其特征在于:宽带信号声源定位计算方法如下:
式中,kmin和kmax分别表示最低频率和最高频率对应的波数。
6.如权利要求1所述的一种适用于空心球阵列的声源定位方法,其特征在于:该方法适用于多种阵列形式,如空心球阵列、刚性球阵列和使用单指向传声器的球阵列。
CN201610367282.8A 2016-05-27 2016-05-27 一种适用于空心球阵列的声源定位方法 Pending CN106093866A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610367282.8A CN106093866A (zh) 2016-05-27 2016-05-27 一种适用于空心球阵列的声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610367282.8A CN106093866A (zh) 2016-05-27 2016-05-27 一种适用于空心球阵列的声源定位方法

Publications (1)

Publication Number Publication Date
CN106093866A true CN106093866A (zh) 2016-11-09

Family

ID=57229433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610367282.8A Pending CN106093866A (zh) 2016-05-27 2016-05-27 一种适用于空心球阵列的声源定位方法

Country Status (1)

Country Link
CN (1) CN106093866A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109884592A (zh) * 2019-03-04 2019-06-14 浙江大学 一种面向低频高斯噪声源的声源定位仿真方法
CN110596644A (zh) * 2019-09-24 2019-12-20 中国科学院声学研究所 一种使用移动环形传声器阵列的声源定位方法及系统
CN112180707A (zh) * 2020-09-28 2021-01-05 四川大学 基于球面自衍射模型的球面纯相位全息图生成方法
CN112346012A (zh) * 2020-11-13 2021-02-09 南京地平线机器人技术有限公司 声源位置确定方法和装置、可读存储介质、电子设备
CN113050038A (zh) * 2021-03-23 2021-06-29 上海交通大学 一种基于虚拟阵列扩展的变电站声源定位方法及系统
CN113109763A (zh) * 2020-01-13 2021-07-13 北京地平线机器人技术研发有限公司 声源位置确定方法和装置、可读存储介质、电子设备
CN114127843A (zh) * 2019-07-02 2022-03-01 杜比国际公司 用于离散指向性数据的表示、编码和解码的方法、设备和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533090A (zh) * 2008-03-14 2009-09-16 深圳华为通信技术有限公司 一种阵列麦克的声音定位方法和装置
CN202362450U (zh) * 2011-12-04 2012-08-01 东华大学 一种基于麦克风阵列的声源定位及可视化系统
CN102866385A (zh) * 2012-09-10 2013-01-09 上海大学 一种基于球麦克风阵列的多声源定位方法
JP2014098568A (ja) * 2012-11-13 2014-05-29 Advanced Telecommunication Research Institute International 音源位置推定装置、音源位置推定方法および音源位置推定プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101533090A (zh) * 2008-03-14 2009-09-16 深圳华为通信技术有限公司 一种阵列麦克的声音定位方法和装置
CN202362450U (zh) * 2011-12-04 2012-08-01 东华大学 一种基于麦克风阵列的声源定位及可视化系统
CN102866385A (zh) * 2012-09-10 2013-01-09 上海大学 一种基于球麦克风阵列的多声源定位方法
JP2014098568A (ja) * 2012-11-13 2014-05-29 Advanced Telecommunication Research Institute International 音源位置推定装置、音源位置推定方法および音源位置推定プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUXIANG HU ETC.: ""A maximum likelihood direction of arrival estimation method for open-sphere microphone arrays in the spherical harmonic domain"", 《J. ACOUST. SOC. AM.》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109884592A (zh) * 2019-03-04 2019-06-14 浙江大学 一种面向低频高斯噪声源的声源定位仿真方法
CN114127843A (zh) * 2019-07-02 2022-03-01 杜比国际公司 用于离散指向性数据的表示、编码和解码的方法、设备和系统
CN114127843B (zh) * 2019-07-02 2023-08-11 杜比国际公司 用于离散指向性数据的表示、编码和解码的方法、设备和系统
US11902769B2 (en) 2019-07-02 2024-02-13 Dolby International Ab Methods, apparatus and systems for representation, encoding, and decoding of discrete directivity data
CN110596644A (zh) * 2019-09-24 2019-12-20 中国科学院声学研究所 一种使用移动环形传声器阵列的声源定位方法及系统
CN113109763A (zh) * 2020-01-13 2021-07-13 北京地平线机器人技术研发有限公司 声源位置确定方法和装置、可读存储介质、电子设备
CN113109763B (zh) * 2020-01-13 2023-08-25 北京地平线机器人技术研发有限公司 声源位置确定方法和装置、可读存储介质、电子设备
CN112180707A (zh) * 2020-09-28 2021-01-05 四川大学 基于球面自衍射模型的球面纯相位全息图生成方法
CN112180707B (zh) * 2020-09-28 2021-11-02 四川大学 基于球面自衍射模型的球面纯相位全息图生成方法
CN112346012A (zh) * 2020-11-13 2021-02-09 南京地平线机器人技术有限公司 声源位置确定方法和装置、可读存储介质、电子设备
CN113050038A (zh) * 2021-03-23 2021-06-29 上海交通大学 一种基于虚拟阵列扩展的变电站声源定位方法及系统

Similar Documents

Publication Publication Date Title
CN106093866A (zh) 一种适用于空心球阵列的声源定位方法
US10506337B2 (en) Frequency-invariant beamformer for compact multi-ringed circular differential microphone arrays
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
US20160173978A1 (en) Audio Signal Processing Method and Apparatus and Differential Beamforming Method and Apparatus
US9706298B2 (en) Method and apparatus for localization of an acoustic source and acoustic beamforming
CN104469154B (zh) 一种基于麦克风阵列的摄像头引导装置及引导方法
US8817578B2 (en) Sonic wave output device, voice communication device, sonic wave output method and program
CN105301563B (zh) 一种基于一致聚焦变换最小二乘法的双声源定位方法
CN109490822B (zh) 基于ResNet的语音DOA估计方法
CN102043145B (zh) 基于声矢量传感器均匀直线阵的快速宽带频域波束形成方法
CN110515038B (zh) 一种基于无人机-阵列的自适应无源定位装置及实现方法
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
CN109254266A (zh) 基于麦克风阵列的声源定位方法、装置及存储介质
CN113126028B (zh) 一种基于多个麦克风阵列的噪声源定位方法
CN101813772B (zh) 一种快速宽带频域扩展拖曳阵波束形成方法
CN104408278A (zh) 一种基于干扰噪声协方差矩阵估计的稳健波束形成方法
CN103760520B (zh) 一种基于avs和稀疏表示的单语者声源doa估计方法
CN205139359U (zh) 一种基于fpga麦克风阵列室内声源定位系统
CN110596644B (zh) 一种使用移动环形传声器阵列的声源定位方法及系统
CN108447499B (zh) 一种双层圆环麦克风阵列语音增强方法
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
CN109597021A (zh) 一种波达方向估计方法及装置
CN103837871B (zh) 一种逆波束形成方法及系统
CN102265642A (zh) 平面音频源跟踪的方法和装置
CN108614234B (zh) 基于多采样快拍互质阵列接收信号快速傅里叶逆变换的波达方向估计方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161109

RJ01 Rejection of invention patent application after publication