CN110907893A - 一种适用于球麦克风阵列的超分辨声源定位方法 - Google Patents
一种适用于球麦克风阵列的超分辨声源定位方法 Download PDFInfo
- Publication number
- CN110907893A CN110907893A CN201911231302.9A CN201911231302A CN110907893A CN 110907893 A CN110907893 A CN 110907893A CN 201911231302 A CN201911231302 A CN 201911231302A CN 110907893 A CN110907893 A CN 110907893A
- Authority
- CN
- China
- Prior art keywords
- time
- matrix
- frequency
- spherical harmonic
- spherical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种适用于球麦克风阵列的超分辨声源定位方法,首先将球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算局部时频块的频率平滑自相关矩阵;然后求解半正定规划问题获得恢复后的球谐波域协方差矩阵;利用求解得到的球谐波域协方差矩阵作直接路径检测,对通过检测的时频块计算空间谱,并进行融合计算获得声源位置。相对于已有的子空间类声源定位方法对噪声和混响具有更高鲁棒性,对邻近声源分辨力更好。
Description
技术领域
本发明涉及一种适用于球麦克风阵列的超分辨声源定位方法,属于声源定位技术领域。
背景技术
与自由空间中的信号源定位问题不同,房间混响环境下存在信号多径传播和系统欠定问题(散射体个数大于麦克风数目),因此经典环境下的DOA估计方法在高混响环境下存在性能下降。为了解决上述问题,Rafaely等人针对球麦克风阵列,提出基于直接路径检测的声源定位方法(见参考文献[1]O.Nadiri and B.Rafaely.Localization of MultipleSpeakers under High Reverberation using a Spherical Microphone Array and theDirect-Path Dominance Test[J].IEEE/ACM transactions on audio,speech,andlanguage processing,22(10),2014,见文献[2]Lior Madmoni and BoazRafaely.Direction of Arrival Estimation for Reverberant Speech Based onEnhanced Decomposition of the Direct Sound[J].IEEE Journal of Selected Topicsin Signal Processing,2018:1-1),引入频率平滑以缓解信号多径传播的影响,同时利用语音信号的时频稀疏特性,选择直接路径信号占主体的局部时频块,使用现有子空间类(MUSIC,ESPREIT等)方法估计声源位置,从而解决系统欠定问题。但是,频率平滑只能缓解信号多径传播导致的自相关矩阵秩损问题,并不能保证其主特征值仅对应直接路径分量(见文献[2]),可能存在信号强相关甚至相干的情况。而传统的子空间类方法在强相关、强噪声、短时信号等条件下性能迅速下降。因此,现有的直接路径检测声源定位方法对恶劣环境(强噪声,强混响)下的多声源定位问题性能有待进一步提升。
发明内容
本发明所解决的技术问题是,克服现有方法所遇到的局限,提出一种适用于球麦克风阵列的超分辨声源定位方法,用于解决现有直接路径检测声源定位方法在恶劣环境下性能差的问题。
为了实现上述目的,本发明采用的技术方案为:
一种适用于球麦克风阵列的超分辨声源定位方法,包括如下步骤:
步骤一、球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算局部时频块的自相关矩阵,并进行频率平滑;
步骤二、将步骤一获得的局部时频块自相关矩阵,代入半定规划问题求解,获得恢复后的球谐波域协方差矩阵;
步骤三、利用步骤二求解得到的球谐波域协方差矩阵作直接路径检测,即对求解得到的球谐波域协方差矩阵作奇异值分解,若最大奇异值与次大奇异值的比值大于阈值,则认为该时频块通过检测;
步骤四、对通过检测的时频块计算空间谱,即利用步骤三中球谐波域协方差矩阵大奇异值对应奇异值矢量作为信号子空间计算空间谱,并将各时频块空间谱叠加,搜索叠加后空间谱的谱峰,获得声源位置。
具体的,为介绍本发明中所述具体步骤,首先给出如下设定:
本发明中步骤一具体步骤为:对接收信号X(t)作短时傅里叶变换,得到接收信号的时频序列X(v,l),其中v,l分别为时间和频率点索引。再对X(v,l)作球谐波变换(见参考文献[3]B.Rafaely,“Analysis and design of spherical microphone arrays,”IEEETransactions on Speech and Audio Processing,,vol.13,no.1,pp.135-143,2005.):
为连带勒让德多项式,N为对球阵采集信号作球谐波分解的最高球谐波阶数。将时频序列P(v,l)划分为若干局部时频块。令第v个时间、第l个频率上的局部时频块的包含Qv和Ql个时间和频率点,计算该局部时频块上的信号自相关矩阵:
式(6)中Tr(·)表示矩阵的迹,(·)H表示矩阵的共轭转置,Re(·)表示取实部,对于矩阵M,M≥0表示矩阵M半正定,||·||2表示欧几里得范数,I为单位阵,表示第v个时间、第l个频率上的局部时频块自相关矩阵,令为Kronecker积,则Θk维第k个对角线为1其他元素为0的Toeplitz矩阵,G为固定系数矩阵,η为人工设定拟合误差,N为对球阵采集高阶声场进行球谐波分解的最高球谐波阶数。
通过CVX软件计算式(6),获得Ρ的对偶变量Rv,l作为恢复后的球谐波域协方差矩阵。
本发明中步骤四具体步骤为:将通过步骤三检测的局部时频块的时频点{v,l}集合记为A。对于时频点{v,l}上的球谐波域协方差矩阵Rv,l,将步骤三奇异值分解中得到的最大奇异值对应的奇异值向量记为US(v,l),计算融合空间谱步骤为:
本发明所公开的一种超分辨球阵声源定位方法,相对于已有的子空间类声源定位方法对噪声和混响具有更好鲁棒性,对邻近声源分辨力更好。具体为:
(1)本发明步骤二中公开一种新的球谐波域信号协方差矩阵恢复方法,与传统子空间类方法相比,对强相关、强噪声、短时信号等条件具有更好的鲁棒性。与球上超分辨方法(见参考文献[4]T.Bendory,S.Dekel,and A.Feuer,“Super-Resolution on the SphereUsing Convex Optimization,”IEEE Transactions on Signal Processing,,vol.63,no.9,pp.2253-2262,2015)相比具有更小的半正定约束维数,因而具有更小的计算量。
(2)基于本发明步骤二求解得到的球谐波域信号协方差矩阵,进行直接路径检测和空间谱计算,使声源定位结果对噪声和混响具有更好鲁棒性,对邻近声源分辨力更好。
附图说明
图1为本发明方法流程图。
图2为本发明方法房间混响环境下邻近声源空间谱对比图。
图3为本发明方法多固定声源定位结果对比图。
图4为本发明方法单运动声源定位结果对比图。
具体实施方式
下面结合附图对本发明作进一步说明。
一种适用于球麦克风阵列的超分辨声源定位方法,其特征在于,包括如下步骤:
步骤一、球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算局部时频块的自相关矩阵,并进行频率平滑;
步骤二、将步骤一获得的局部时频块的自相关矩阵代入半定规划问题求解,获得恢复后的球谐波域协方差矩阵;
步骤三、利用步骤二求解得到的球谐波域协方差矩阵作直接路径检测,即对求解得到的球谐波域协方差矩阵作奇异值分解,若最大奇异值与次大奇异值的比值大于设定的阈值,则认为该时频块通过检测;
步骤四、对通过检测的时频块计算空间谱,即利用步骤三中球谐波域协方差矩阵最大奇异值对应奇异值矢量作为信号子空间计算空间谱,并将各时频块空间谱叠加,搜索叠加后空间谱的谱峰,获得声源位置。
步骤一具体步骤为:对接收信号X(t)作短时傅里叶变换,得到接收信号的时频序列X(v,l),其中v,l分别为时间和频率点索引,再对X(v,l)作球谐波变换:
为连带勒让德多项式,N为对球阵采集信号作球谐波分解的最高球谐波阶数;将时频序列P(v,l)划分为若干局部时频块;令第v个时间、第l个频率上的局部时频块的包含Qv和Ql个时间和频率点,计算该局部时频块上的信号自相关矩阵:
所述步骤二中采用如下半定规划问题:
其中Tr(·)表示矩阵的迹,(·)H表示矩阵的共轭转置,Re(·)表示取实部,对于矩阵M,M≥0表示矩阵M半正定,||·||2表示欧几里得范数,I为单位阵,表示第v个时间、第l个频率上的局部时频块自相关矩阵,令为Kronecker积,则Θk维第k个对角线为1其他元素为0的Toeplitz矩阵,G为固定系数矩阵,η为人工设定拟合误差,N为对球阵采集高阶声场进行球谐波分解的最高球谐波阶数;
通过计算(13),获得Ρ的对偶变量Rv,l作为恢复后的球谐波域协方差矩阵。
所述步骤三中采用如下直接路径检测方法:
将通过步骤三检测的局部时频块的时频点{v,l}集合记为A;对于时频点{v,l}上的球谐波域协方差矩阵Rv,l,将步骤三奇异值分解中得到的最大奇异值对应的奇异值向量记为US(v,l),计算融合空间谱步骤为:
本发明方法是基于球麦克风阵列,按照图1所述流程图实现声源定位。
步骤一中,频率平滑和自相关矩阵计算应选择合适频带,频率太低则受噪声影响大,精度不足;频率太高会导致球谐波变换出现空间混叠,一般应使N>κR,且I>(N+1)2。
式(15)中{βn,k,l}为唯一确定系数。故
式(17)中
步骤二中,人工设定拟合误差η一般设定为(N+1)2σ2,σ为Rv,l最小奇异值开根号。实际中,可根据具体球阵结构、球谐波变换残余误差、麦克风幅相误差等情况适当调整。
步骤三中,给定阈值α一般选取2-6,根据语音信号、房间混响等条件适当调整。
步骤四中,一般假设通过直接路径检测的局部时频块中仅包含单一声源,即由Rv,l奇异值分解计算信号子空间US(v,l)时,仅选取最大奇异值对应的奇异值矢量。
下面结合一些具体实施实例,对本发明作具体说明:
实施实例1
考虑一个矩形房间,房间尺寸为4×6×3m,麦克风阵列位于[x,y,z]=[2.6,3.05,0.7],两个声源位于[x,y,z]=[1.69,4.05,1.57]和[x,y,z]=[1.2,3.5,1.7],相对俯仰方位角分别是和房间混响时间T60=0.2秒,信噪比30dB,对接收语音信号作短时傅里叶变换后选择单频点计算协方差矩阵,每帧快拍数Ql=5,分别计算DPD-MUSIC(见参考文献1)与本发明所公开方法的空间谱,如图2所示,其中图中□代表真实值:
可见,在上述房间混响环境下,DPD-MUSIC方法只能显示出一个谱峰,误差比较大,而本发明公开方法能够准确定位两个说话人位置,表现出更好的空间分辨率。
实施实例2
采用来自LOCATA竞赛(见参考文献5H.W.C.Evers,A.Schmidt,H.Mellmann,H.Barfuss,P.A.Naylor,and W.Kellermann.The LOCATA challenge datacorpus for acoustic source localization and tracking[C].IEEE 10th SensorArray and Multichannel Signal Processing Workshop(SAM):410-414,2018.)固定多声源场景中的Eigenmike(见参考文献6The mh acoustics.EM32 eigenmike microphonearray release notes[K].25Summit Ave,Summit,USA,2013.)麦克风阵列数据进行实验。
房间尺寸为7.1×9.8×3m,其大概混响时间是T60=0.55s。这里,将本文提出了球谐波原子范数方法与LOCATA竞赛所提供的的基准方法MUSIC(见参考文献[7]ChristineEvers,Heinrich W.Heinrich Mellmann,Alexander Schmidt,Hendrik Barfuss,Patrick A.Naylor and Walter Kellermann.Locata Challenge-Evaluation Tasks andMeasures[C].16th International Workshop on Acoustic Signal Enhancement(IWAENC),2018:565-569.)进行性能比较。本实例中短时傅里叶变换采用帧长为1440点的汉宁窗,采样频率为48kHz,FFT的点数为1024点,每帧帧长30ms,做频率平滑频点数15个,时间积累为15个快拍,主路径检测阈值α设置为4。图2和图3分别给出了多固定声源和单运动声源场景下的测试结果。
测试结果表明,本发明公开方法在多固定声源场景下优于参考文献[7]方法,在单运动声源场景下优于参考文献[1]方法。
Claims (5)
1.一种适用于球麦克风阵列的超分辨声源定位方法,其特征在于,包括如下步骤:
步骤一、球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算球阵采集高阶声场的局部时频块的自相关矩阵,并进行频率平滑;
步骤二、将步骤一获得的局部时频块的自相关矩阵代入半定规划问题求解,获得恢复后的球谐波域协方差矩阵;
步骤三、利用步骤二求解得到的球谐波域协方差矩阵作直接路径检测,即对求解得到的球谐波域协方差矩阵作奇异值分解,若最大奇异值与次大奇异值的比值大于设定的阈值,则认为该时频块通过检测;
步骤四、对通过检测的时频块计算空间谱,即利用步骤三中球谐波域协方差矩阵最大奇异值对应奇异值矢量作为信号子空间计算空间谱,并将各时频块空间谱叠加,搜索叠加后空间谱的谱峰,获得声源位置。
2.根据权利要求1所述的一种适用于球麦克风阵列的超分辨声源定位方法,其特征在于,考虑一个半径为R由I个全向阵元组成的球阵,球阵的第i个阵元位于ri=(R,Φi),其中其中θ和分别为仰角和方位角,接收信号表示为X(t)=[x1(t),…,xI(t)]T,[·]T表示矩阵转置,t表示时间;
步骤一具体步骤为:对接收信号X(t)作短时傅里叶变换,得到接收信号的时频序列X(v,l),其中v,l分别为时间和频率点索引,再对X(v,l)作球谐波变换:
为连带勒让德多项式,N为对球阵采集信号作球谐波分解的最高球谐波阶数;将时频序列P(v,l)划分为若干局部时频块;令第v个时间、第l个频率上的局部时频块的包含Qv和Ql个时间和频率点,计算该局部时频块上的信号自相关矩阵:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911231302.9A CN110907893B (zh) | 2019-12-05 | 2019-12-05 | 一种适用于球麦克风阵列的超分辨声源定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911231302.9A CN110907893B (zh) | 2019-12-05 | 2019-12-05 | 一种适用于球麦克风阵列的超分辨声源定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110907893A true CN110907893A (zh) | 2020-03-24 |
CN110907893B CN110907893B (zh) | 2023-06-02 |
Family
ID=69822487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911231302.9A Active CN110907893B (zh) | 2019-12-05 | 2019-12-05 | 一种适用于球麦克风阵列的超分辨声源定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110907893B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112034418A (zh) * | 2020-09-15 | 2020-12-04 | 北京中电慧声科技有限公司 | 基于频域Bark子带的波束扫描方法及声源定向装置 |
CN113687305A (zh) * | 2021-07-26 | 2021-11-23 | 浙江大华技术股份有限公司 | 声源方位的定位方法、装置、设备及计算机可读存储介质 |
CN114624652A (zh) * | 2022-03-16 | 2022-06-14 | 浙江浙能技术研究院有限公司 | 一种强多径干扰条件下的声源定位方法 |
CN116609844A (zh) * | 2023-03-13 | 2023-08-18 | 中国自然资源航空物探遥感中心 | 一种用于提取地球物理三维断裂信息的方法和计算设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102866385A (zh) * | 2012-09-10 | 2013-01-09 | 上海大学 | 一种基于球麦克风阵列的多声源定位方法 |
CN103259574A (zh) * | 2013-04-18 | 2013-08-21 | 东南大学 | 一种mimo信号的协方差矩阵估计方法 |
CN106501765A (zh) * | 2016-12-02 | 2017-03-15 | 南京邮电大学 | 一种基于平方和与半定规划的最大似然波达方向估计方法 |
CN107907852A (zh) * | 2017-10-27 | 2018-04-13 | 大连大学 | 基于空间平滑的协方差矩阵秩最小化doa估计方法 |
-
2019
- 2019-12-05 CN CN201911231302.9A patent/CN110907893B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102866385A (zh) * | 2012-09-10 | 2013-01-09 | 上海大学 | 一种基于球麦克风阵列的多声源定位方法 |
CN103259574A (zh) * | 2013-04-18 | 2013-08-21 | 东南大学 | 一种mimo信号的协方差矩阵估计方法 |
CN106501765A (zh) * | 2016-12-02 | 2017-03-15 | 南京邮电大学 | 一种基于平方和与半定规划的最大似然波达方向估计方法 |
CN107907852A (zh) * | 2017-10-27 | 2018-04-13 | 大连大学 | 基于空间平滑的协方差矩阵秩最小化doa估计方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112034418A (zh) * | 2020-09-15 | 2020-12-04 | 北京中电慧声科技有限公司 | 基于频域Bark子带的波束扫描方法及声源定向装置 |
CN113687305A (zh) * | 2021-07-26 | 2021-11-23 | 浙江大华技术股份有限公司 | 声源方位的定位方法、装置、设备及计算机可读存储介质 |
CN114624652A (zh) * | 2022-03-16 | 2022-06-14 | 浙江浙能技术研究院有限公司 | 一种强多径干扰条件下的声源定位方法 |
CN114624652B (zh) * | 2022-03-16 | 2022-09-30 | 浙江浙能技术研究院有限公司 | 一种强多径干扰条件下的声源定位方法 |
CN116609844A (zh) * | 2023-03-13 | 2023-08-18 | 中国自然资源航空物探遥感中心 | 一种用于提取地球物理三维断裂信息的方法和计算设备 |
CN116609844B (zh) * | 2023-03-13 | 2024-03-12 | 中国自然资源航空物探遥感中心 | 一种用于提取地球物理三维断裂信息的方法和计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN110907893B (zh) | 2023-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110907893A (zh) | 一种适用于球麦克风阵列的超分辨声源定位方法 | |
CN109087664B (zh) | 语音增强方法 | |
CN111049556B (zh) | 一种基于干扰协方差矩阵重构的互素阵稳健自适应波束形成方法 | |
CN111415676B (zh) | 一种基于分离矩阵初始化频点选择的盲源分离方法及系统 | |
EP2628316B1 (en) | Apparatus and method for deriving a directional information and computer program product | |
CN109616138B (zh) | 基于分段频点选择的语音信号盲分离方法和双耳助听系统 | |
CN108318862B (zh) | 一种基于神经网络的声源定位方法 | |
CN111239680B (zh) | 一种基于差分阵列的波达方向估计方法 | |
CN106501773B (zh) | 基于差分阵列的声源方向定位方法 | |
CN105230044A (zh) | 空间音频装置 | |
CN106646376A (zh) | 基于加权修正参数的p范数噪声源定位识别方法 | |
CN102411138A (zh) | 一种机器人声源定位方法 | |
CN109375152B (zh) | 电磁矢量嵌套l阵下低复杂度的doa与极化联合估计方法 | |
Teutsch et al. | Detection and localization of multiple wideband acoustic sources based on wavefield decomposition using spherical apertures | |
CN109581276A (zh) | 一种基于求和求差嵌套阵的doa估计方法 | |
CN102147458A (zh) | 一种针对宽带声源的波达方向估计方法及其装置 | |
CN113296049A (zh) | 互质阵列脉冲环境下非圆信号的共轭增广doa估计方法 | |
CN104777450A (zh) | 一种两级music麦克风阵列测向方法 | |
CN110907892B (zh) | 一种球麦克风阵列语音信号到达角估计方法 | |
CN112201276B (zh) | 基于TC-ResNet网络的麦克风阵列语音分离方法 | |
CN113267746A (zh) | 基于组稀疏的加权宽带波达方向估计方法 | |
CN115201753A (zh) | 一种低功耗多频谱分辨的语音定位方法 | |
CN112666520B (zh) | 一种可调响应时频谱声源定位方法及系统 | |
CN109239645A (zh) | 多径效应下的多组宽带相干信号波达方向估计方法 | |
Kheirollahpour et al. | DOA estimation in the autocorrelation domain for coprime array |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |