CN110907893B - 一种适用于球麦克风阵列的超分辨声源定位方法 - Google Patents

一种适用于球麦克风阵列的超分辨声源定位方法 Download PDF

Info

Publication number
CN110907893B
CN110907893B CN201911231302.9A CN201911231302A CN110907893B CN 110907893 B CN110907893 B CN 110907893B CN 201911231302 A CN201911231302 A CN 201911231302A CN 110907893 B CN110907893 B CN 110907893B
Authority
CN
China
Prior art keywords
time
matrix
frequency
spherical harmonic
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911231302.9A
Other languages
English (en)
Other versions
CN110907893A (zh
Inventor
潘捷
蒋府
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangzhou University
Original Assignee
Yangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangzhou University filed Critical Yangzhou University
Priority to CN201911231302.9A priority Critical patent/CN110907893B/zh
Publication of CN110907893A publication Critical patent/CN110907893A/zh
Application granted granted Critical
Publication of CN110907893B publication Critical patent/CN110907893B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种适用于球麦克风阵列的超分辨声源定位方法,首先将球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算局部时频块的频率平滑自相关矩阵;然后求解半正定规划问题获得恢复后的球谐波域协方差矩阵;利用求解得到的球谐波域协方差矩阵作直接路径检测,对通过检测的时频块计算空间谱,并进行融合计算获得声源位置。相对于已有的子空间类声源定位方法对噪声和混响具有更高鲁棒性,对邻近声源分辨力更好。

Description

一种适用于球麦克风阵列的超分辨声源定位方法
技术领域
本发明涉及一种适用于球麦克风阵列的超分辨声源定位方法,属于声源定位技术领域。
背景技术
与自由空间中的信号源定位问题不同,房间混响环境下存在信号多径传播和系统欠定问题(散射体个数大于麦克风数目),因此经典环境下的DOA估计方法在高混响环境下存在性能下降。为了解决上述问题,Rafaely等人针对球麦克风阵列,提出基于直接路径检测的声源定位方法(见参考文献[1]O.Nadiri and B.Rafaely.Localization of MultipleSpeakers under High Reverberation using a Spherical Microphone Array and theDirect-Path Dominance Test[J].IEEE/ACM transactions on audio,speech,andlanguage processing,22(10),2014,见文献[2]Lior Madmoni and BoazRafaely.Direction of Arrival Estimation for Reverberant Speech Based onEnhanced Decomposition of the Direct Sound[J].IEEE Journal of Selected Topicsin Signal Processing,2018:1-1),引入频率平滑以缓解信号多径传播的影响,同时利用语音信号的时频稀疏特性,选择直接路径信号占主体的局部时频块,使用现有子空间类(MUSIC,ESPREIT等)方法估计声源位置,从而解决系统欠定问题。但是,频率平滑只能缓解信号多径传播导致的自相关矩阵秩损问题,并不能保证其主特征值仅对应直接路径分量(见文献[2]),可能存在信号强相关甚至相干的情况。而传统的子空间类方法在强相关、强噪声、短时信号等条件下性能迅速下降。因此,现有的直接路径检测声源定位方法对恶劣环境(强噪声,强混响)下的多声源定位问题性能有待进一步提升。
发明内容
本发明所解决的技术问题是,克服现有方法所遇到的局限,提出一种适用于球麦克风阵列的超分辨声源定位方法,用于解决现有直接路径检测声源定位方法在恶劣环境下性能差的问题。
为了实现上述目的,本发明采用的技术方案为:
一种适用于球麦克风阵列的超分辨声源定位方法,包括如下步骤:
步骤一、球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算局部时频块的自相关矩阵,并进行频率平滑;
步骤二、将步骤一获得的局部时频块自相关矩阵,代入半定规划问题求解,获得恢复后的球谐波域协方差矩阵;
步骤三、利用步骤二求解得到的球谐波域协方差矩阵作直接路径检测,即对求解得到的球谐波域协方差矩阵作奇异值分解,若最大奇异值与次大奇异值的比值大于阈值,则认为该时频块通过检测;
步骤四、对通过检测的时频块计算空间谱,即利用步骤三中球谐波域协方差矩阵大奇异值对应奇异值矢量作为信号子空间计算空间谱,并将各时频块空间谱叠加,搜索叠加后空间谱的谱峰,获得声源位置。
具体的,为介绍本发明中所述具体步骤,首先给出如下设定:
考虑一个半径为R由I个全向阵元组成的球阵,球阵的第i个阵元位于ri=(R,Φi),其中
Figure BDA0002303613800000021
其中θ和/>
Figure BDA0002303613800000022
分别为仰角和方位角,接收信号表示为X(t)=[x1(t),…,xI(t)]T,t表示时间。
本发明中步骤一具体步骤为:对接收信号X(t)作短时傅里叶变换,得到接收信号的时频序列X(v,l),其中v,l分别为时间和频率点索引。再对X(v,l)作球谐波变换(见参考文献[3]B.Rafaely,“Analysis and design of spherical microphone arrays,”IEEETransactions on Speech and Audio Processing,,vol.13,no.1,pp.135-143,2005.):
Figure BDA0002303613800000023
式(1)中
Figure BDA0002303613800000024
diag[·]表示对角矩阵,κl=λ/2π,λl表示频点l对应的波长。
Figure BDA0002303613800000025
hn和jn分别是二类球汉克尔函数和一类球贝塞尔函数,h′n和j′n分别是hn和jn的导数。W为与球阵结构有关的固定加权系数矩阵(见参考文献[3]),
Figure BDA0002303613800000026
Figure BDA0002303613800000027
为(N+1)2×I维矩阵,其第i列表示为:
Figure BDA0002303613800000028
式(3)中[·]T表示矩阵转置,
Figure BDA0002303613800000029
为球谐波函数
Figure BDA00023036138000000210
Figure BDA00023036138000000211
为连带勒让德多项式,N为对球阵采集信号作球谐波分解的最高球谐波阶数。将时频序列P(v,l)划分为若干局部时频块。令第v个时间、第l个频率上的局部时频块的包含Qv和Ql个时间和频率点,计算该局部时频块上的信号自相关矩阵:
Figure BDA00023036138000000212
本发明中步骤二具体步骤为:步骤一中式(5)计算得到的
Figure BDA00023036138000000213
代入下列半正定规划问题求解,
Figure BDA00023036138000000214
式(6)中Tr(·)表示矩阵的迹,(·)H表示矩阵的共轭转置,Re(·)表示取实部,对于矩阵M,M≥0表示矩阵M半正定,||·||2表示欧几里得范数,I为单位阵,
Figure BDA0002303613800000031
表示第v个时间、第l个频率上的局部时频块自相关矩阵,令/>
Figure BDA0002303613800000032
为Kronecker积,则/>
Figure BDA0002303613800000033
Θk维第k个对角线为1其他元素为0的Toeplitz矩阵,G为固定系数矩阵,η为人工设定拟合误差,
Figure BDA0002303613800000034
N为对球阵采集高阶声场进行球谐波分解的最高球谐波阶数。
通过CVX软件计算式(6),获得Ρ的对偶变量Rv,l作为恢复后的球谐波域协方差矩阵。
本发明中步骤三具体步骤为:对第v个时间、第l个频率上的局部时频块,按照步骤二求解得到的球谐波域协方差矩阵Rv,l作奇异值分解,得到奇异值
Figure BDA0002303613800000038
若σ12大于给定阈值α,则认为该时频块通过检测。
本发明中步骤四具体步骤为:将通过步骤三检测的局部时频块的时频点{v,l}集合记为A。对于时频点{v,l}上的球谐波域协方差矩阵Rv,l,将步骤三奇异值分解中得到的最大奇异值对应的奇异值向量记为US(v,l),计算融合空间谱步骤为:
Figure BDA0002303613800000035
式(7)中
Figure BDA0002303613800000036
其中θ和/>
Figure BDA0002303613800000037
分别为仰角和方位角。搜索式(7)空间谱的谱峰,即得到该时间段内声源的位置。
本发明所公开的一种超分辨球阵声源定位方法,相对于已有的子空间类声源定位方法对噪声和混响具有更好鲁棒性,对邻近声源分辨力更好。具体为:
(1)本发明步骤二中公开一种新的球谐波域信号协方差矩阵恢复方法,与传统子空间类方法相比,对强相关、强噪声、短时信号等条件具有更好的鲁棒性。与球上超分辨方法(见参考文献[4]T.Bendory,S.Dekel,and A.Feuer,“Super-Resolution on the SphereUsing Convex Optimization,”IEEE Transactions on Signal Processing,,vol.63,no.9,pp.2253-2262,2015)相比具有更小的半正定约束维数,因而具有更小的计算量。
(2)基于本发明步骤二求解得到的球谐波域信号协方差矩阵,进行直接路径检测和空间谱计算,使声源定位结果对噪声和混响具有更好鲁棒性,对邻近声源分辨力更好。
附图说明
图1为本发明方法流程图。
图2为本发明方法房间混响环境下邻近声源空间谱对比图。
图3为本发明方法多固定声源定位结果对比图。
图4为本发明方法单运动声源定位结果对比图。
具体实施方式
下面结合附图对本发明作进一步说明。
一种适用于球麦克风阵列的超分辨声源定位方法,其特征在于,包括如下步骤:
步骤一、球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算局部时频块的自相关矩阵,并进行频率平滑;
步骤二、将步骤一获得的局部时频块的自相关矩阵代入半定规划问题求解,获得恢复后的球谐波域协方差矩阵;
步骤三、利用步骤二求解得到的球谐波域协方差矩阵作直接路径检测,即对求解得到的球谐波域协方差矩阵作奇异值分解,若最大奇异值与次大奇异值的比值大于设定的阈值,则认为该时频块通过检测;
步骤四、对通过检测的时频块计算空间谱,即利用步骤三中球谐波域协方差矩阵最大奇异值对应奇异值矢量作为信号子空间计算空间谱,并将各时频块空间谱叠加,搜索叠加后空间谱的谱峰,获得声源位置。
考虑一个半径为R由I个全向阵元组成的球阵,球阵的第i个阵元位于ri=(R,Φi),其中
Figure BDA0002303613800000041
其中θ和/>
Figure BDA0002303613800000042
分别为仰角和方位角,接收信号表示为X(t)=[x1(t),…,xI(t)]T,t表示时间;
步骤一具体步骤为:对接收信号X(t)作短时傅里叶变换,得到接收信号的时频序列X(v,l),其中v,l分别为时间和频率点索引,再对X(v,l)作球谐波变换:
Figure BDA0002303613800000043
式(8)中
Figure BDA0002303613800000044
diag[·]表示对角矩阵,κl=λ/2π,λl表示频点l对应的波长;
Figure BDA0002303613800000045
hn和jn分别是二类球汉克尔函数和一类球贝塞尔函数,h′n和j′n分别是hn和jn的导数;W为与球阵结构有关的固定加权系数矩阵,
Figure BDA0002303613800000046
维矩阵,其第i列表示为:
Figure BDA0002303613800000047
式(3)中[·]T表示矩阵转置,
Figure BDA0002303613800000048
为球谐波函数;
Figure BDA0002303613800000049
Figure BDA00023036138000000410
为连带勒让德多项式,N为对球阵采集信号作球谐波分解的最高球谐波阶数;将时频序列P(v,l)划分为若干局部时频块;令第v个时间、第l个频率上的局部时频块的包含Qv和Ql个时间和频率点,计算该局部时频块上的信号自相关矩阵:
Figure BDA00023036138000000411
所述步骤二中采用如下半定规划问题:
Figure BDA00023036138000000412
其中Tr(·)表示矩阵的迹,(·)H表示矩阵的共轭转置,Re(·)表示取实部,对于矩阵M,M≥0表示矩阵M半正定,||·||2表示欧几里得范数,I为单位阵,
Figure BDA0002303613800000051
表示第v个时间、第l个频率上的局部时频块自相关矩阵,令/>
Figure BDA0002303613800000052
为Kronecker积,则/>
Figure BDA0002303613800000053
Θk维第k个对角线为1其他元素为0的Toeplitz矩阵,G为固定系数矩阵,η为人工设定拟合误差,
Figure BDA0002303613800000054
N为对球阵采集高阶声场进行球谐波分解的最高球谐波阶数;
通过计算(13),获得Ρ的对偶变量Rv,l作为恢复后的球谐波域协方差矩阵。
所述步骤三中采用如下直接路径检测方法:
对给定时频块自相关矩阵
Figure BDA0002303613800000055
即,对第v个时间、第l个频率上的局部时频块,按照步骤二求解得到的球谐波域协方差矩阵Rv,l作奇异值分解,得到奇异值
Figure BDA00023036138000000515
若σ12大于给定阈值α,则认为该时频块通过检测。
将通过步骤三检测的局部时频块的时频点{v,l}集合记为A;对于时频点{v,l}上的球谐波域协方差矩阵Rv,l,将步骤三奇异值分解中得到的最大奇异值对应的奇异值向量记为US(v,l),计算融合空间谱步骤为:
Figure BDA0002303613800000056
式(14)中
Figure BDA0002303613800000057
其中θ和/>
Figure BDA0002303613800000058
分别为仰角和方位角;搜索式(14)空间谱的谱峰,即得到该时间段内声源的位置。
本发明方法是基于球麦克风阵列,按照图1所述流程图实现声源定位。
步骤一中,频率平滑和自相关矩阵计算应选择合适频带,频率太低则受噪声影响大,精度不足;频率太高会导致球谐波变换出现空间混叠,一般应使N>κR,且I>(N+1)2
步骤二中,固定系数矩阵G由如下方式计算:连带勒让德多项式
Figure BDA0002303613800000059
可表示为
Figure BDA00023036138000000510
式(15)中{βn,k,l}为唯一确定系数。故
Figure BDA00023036138000000511
式(16)中
Figure BDA00023036138000000512
令G=[g00,g1(-1),g10,…,gNN]T,利用式(16),则gm,n由如下公式确定
Figure BDA00023036138000000513
式(17)中
Figure BDA00023036138000000514
步骤二中,人工设定拟合误差η一般设定为(N+1)2σ2,σ为Rv,l最小奇异值开根号。实际中,可根据具体球阵结构、球谐波变换残余误差、麦克风幅相误差等情况适当调整。
步骤三中,给定阈值α一般选取2-6,根据语音信号、房间混响等条件适当调整。
步骤四中,一般假设通过直接路径检测的局部时频块中仅包含单一声源,即由Rv,l奇异值分解计算信号子空间US(v,l)时,仅选取最大奇异值对应的奇异值矢量。
下面结合一些具体实施实例,对本发明作具体说明:
实施实例1
考虑一个矩形房间,房间尺寸为4×6×3m,麦克风阵列位于[x,y,z]=[2.6,3.05,0.7],两个声源位于[x,y,z]=[1.69,4.05,1.57]和[x,y,z]=[1.2,3.5,1.7],相对俯仰方位角分别是
Figure BDA0002303613800000061
和/>
Figure BDA0002303613800000062
房间混响时间T60=0.2秒,信噪比30dB,对接收语音信号作短时傅里叶变换后选择单频点计算协方差矩阵,每帧快拍数Ql=5,分别计算DPD-MUSIC(见参考文献1)与本发明所公开方法的空间谱,如图2所示,其中图中□代表真实值:
可见,在上述房间混响环境下,DPD-MUSIC方法只能显示出一个谱峰,误差比较大,而本发明公开方法能够准确定位两个说话人位置,表现出更好的空间分辨率。
实施实例2
采用来自LOCATA竞赛(见参考文献5H.W.
Figure BDA0002303613800000063
C.Evers,A.Schmidt,H.Mellmann,H.Barfuss,P.A.Naylor,and W.Kellermann.The LOCATA challenge datacorpus for acoustic source localization and tracking[C].IEEE 10th SensorArray and Multichannel Signal Processing Workshop(SAM):410-414,2018.)固定多声源场景中的Eigenmike(见参考文献6The mh acoustics.EM32 eigenmike microphonearray release notes[K].25Summit Ave,Summit,USA,2013.)麦克风阵列数据进行实验。
房间尺寸为7.1×9.8×3m,其大概混响时间是T60=0.55s。这里,将本文提出了球谐波原子范数方法与LOCATA竞赛所提供的的基准方法MUSIC(见参考文献[7]ChristineEvers,Heinrich W.
Figure BDA0002303613800000064
Heinrich Mellmann,Alexander Schmidt,Hendrik Barfuss,Patrick A.Naylor and Walter Kellermann.Locata Challenge-Evaluation Tasks andMeasures[C].16th International Workshop on Acoustic Signal Enhancement(IWAENC),2018:565-569.)进行性能比较。本实例中短时傅里叶变换采用帧长为1440点的汉宁窗,采样频率为48kHz,FFT的点数为1024点,每帧帧长30ms,做频率平滑频点数15个,时间积累为15个快拍,主路径检测阈值α设置为4。图2和图3分别给出了多固定声源和单运动声源场景下的测试结果。
测试结果表明,本发明公开方法在多固定声源场景下优于参考文献[7]方法,在单运动声源场景下优于参考文献[1]方法。

Claims (3)

1.一种适用于球麦克风阵列的超分辨声源定位方法,其特征在于,包括如下步骤:
步骤一、球阵采集高阶声场进行球谐波分解和短时傅里叶变换,计算球阵采集高阶声场的局部时频块的自相关矩阵,并进行频率平滑;
步骤二、将步骤一获得的局部时频块的自相关矩阵代入半定规划问题求解,获得恢复后的球谐波域协方差矩阵;
步骤三、利用步骤二求解得到的球谐波域协方差矩阵作直接路径检测,即对求解得到的球谐波域协方差矩阵作奇异值分解,若最大奇异值与次大奇异值的比值大于设定的阈值,则认为该时频块通过检测;
步骤四、对通过检测的时频块计算空间谱,即利用步骤三中球谐波域协方差矩阵最大奇异值对应奇异值矢量作为信号子空间计算空间谱,并将各时频块空间谱叠加,搜索叠加后空间谱的谱峰,获得声源位置;
考虑一个半径为R由I个全向阵元组成的球阵,球阵的第i个阵元位于ri=(R,Φi),其中
Figure FDA0004149151630000011
其中θ和/>
Figure FDA0004149151630000012
分别为仰角和方位角,接收信号表示为X(t)=[x1(t),…,xI(t)]T,[·]T表示矩阵转置,t表示时间;
步骤一具体步骤为:对接收信号X(t)作短时傅里叶变换,得到接收信号的时频序列X(v,l),其中v,l分别为时间和频率点索引,再对X(v,l)作球谐波变换:
Figure FDA0004149151630000013
式(1)中
Figure FDA0004149151630000014
diag[·]表示对角矩阵,κl=λl/2π,λl表示频率点l对应的波长;
Figure FDA0004149151630000015
hn和jn分别是二类球汉克尔函数和一类球贝塞尔函数,h′n和j′n分别是hn和jn的导数;W为与球阵结构有关的固定加权系数矩阵,
Figure FDA0004149151630000016
为(N+1)2×I维矩阵,其第i列表示为:
Figure FDA0004149151630000017
式(3)中[·]T表示矩阵转置,
Figure FDA0004149151630000018
为球谐波函数;
Figure FDA0004149151630000019
Figure FDA00041491516300000110
为连带勒让德多项式,N为对球阵采集信号作球谐波分解的最高球谐波阶数;将时频序列P(v,l)划分为若干局部时频块;令第v个时间、第l个频率上的局部时频块的包含Qv和Ql个时间和频率点,计算该局部时频块上的信号自相关矩阵:
Figure FDA00041491516300000111
所述步骤二中采用如下半定规划问题:
Figure FDA0004149151630000021
其中Tr(·)表示矩阵的迹,(·)H表示矩阵的共轭转置,Re(·)表示取实部,对于矩阵M,M≥0表示矩阵M半正定,||·||2表示欧几里得范数,I为单位阵,
Figure FDA0004149151630000022
表示第v个时间、第l个频率上的局部时频块自相关矩阵,令/>
Figure FDA0004149151630000023
为Kronecker积,则/>
Figure FDA0004149151630000024
Θk维第k个对角线为1其他元素为0的Toeplitz矩阵,G为固定系数矩阵,η为人工设定拟合误差,/>
Figure FDA0004149151630000025
N为对球阵采集高阶声场进行球谐波分解的最高球谐波阶数;
通过计算(1),获得Ρ的对偶变量Rv,l作为恢复后的球谐波域协方差矩阵。
2.根据权利要求1所述的一种适用于球麦克风阵列的超分辨声源定位方法,其特征在于,所述步骤三中采用如下直接路径检测方法:
对给定时频块自相关矩阵
Figure FDA0004149151630000026
即,对第v个时间、第l个频率上的局部时频块,按照步骤二求解得到的球谐波域协方差矩阵Rv,l作奇异值分解,得到奇异值/>
Figure FDA00041491516300000210
若σ12大于给定阈值α,则认为该时频块通过检测。
3.根据权利要求2所述的一种适用于球麦克风阵列的超分辨声源定位方法,其特征在于,将通过步骤三检测的局部时频块的时频点{v,l}集合记为A;对于时频点{v,l}上的球谐波域协方差矩阵Rv,l,将步骤三奇异值分解中得到的最大奇异值对应的奇异值向量记为US(v,l),计算融合空间谱步骤为:
Figure FDA0004149151630000027
式(6)中y(·)由式(4)定义,
Figure FDA0004149151630000028
其中θ和/>
Figure FDA0004149151630000029
分别为仰角和方位角;搜索式(6)空间谱的谱峰,即得到该时间段内声源的位置。/>
CN201911231302.9A 2019-12-05 2019-12-05 一种适用于球麦克风阵列的超分辨声源定位方法 Active CN110907893B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911231302.9A CN110907893B (zh) 2019-12-05 2019-12-05 一种适用于球麦克风阵列的超分辨声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911231302.9A CN110907893B (zh) 2019-12-05 2019-12-05 一种适用于球麦克风阵列的超分辨声源定位方法

Publications (2)

Publication Number Publication Date
CN110907893A CN110907893A (zh) 2020-03-24
CN110907893B true CN110907893B (zh) 2023-06-02

Family

ID=69822487

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911231302.9A Active CN110907893B (zh) 2019-12-05 2019-12-05 一种适用于球麦克风阵列的超分辨声源定位方法

Country Status (1)

Country Link
CN (1) CN110907893B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112034418A (zh) * 2020-09-15 2020-12-04 北京中电慧声科技有限公司 基于频域Bark子带的波束扫描方法及声源定向装置
CN113687305A (zh) * 2021-07-26 2021-11-23 浙江大华技术股份有限公司 声源方位的定位方法、装置、设备及计算机可读存储介质
CN114624652B (zh) * 2022-03-16 2022-09-30 浙江浙能技术研究院有限公司 一种强多径干扰条件下的声源定位方法
CN116609844B (zh) * 2023-03-13 2024-03-12 中国自然资源航空物探遥感中心 一种用于提取地球物理三维断裂信息的方法和计算设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866385B (zh) * 2012-09-10 2014-06-11 上海大学 一种基于球麦克风阵列的多声源定位方法
CN103259574B (zh) * 2013-04-18 2016-08-31 东南大学 一种mimo信号的协方差矩阵估计方法
CN106501765B (zh) * 2016-12-02 2018-09-25 南京邮电大学 一种基于平方和与半定规划的最大似然波达方向估计方法
CN107907852B (zh) * 2017-10-27 2021-08-03 大连大学 基于空间平滑的协方差矩阵秩最小化doa估计方法

Also Published As

Publication number Publication date
CN110907893A (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
CN110907893B (zh) 一种适用于球麦克风阵列的超分辨声源定位方法
US8363850B2 (en) Audio signal processing method and apparatus for the same
CN109087664B (zh) 语音增强方法
Pedersen et al. Convolutive blind source separation methods
Nadiri et al. Localization of multiple speakers under high reverberation using a spherical microphone array and the direct-path dominance test
Kumatani et al. Microphone array processing for distant speech recognition: From close-talking microphones to far-field sensors
KR100493172B1 (ko) 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치
CN105981404B (zh) 使用麦克风阵列的混响声的提取
CN111239680B (zh) 一种基于差分阵列的波达方向估计方法
CN109490822B (zh) 基于ResNet的语音DOA估计方法
CN111415676A (zh) 一种基于分离矩阵初始化频点选择的盲源分离方法及系统
CN110931036A (zh) 一种麦克风阵列波束形成方法
Teutsch et al. Detection and localization of multiple wideband acoustic sources based on wavefield decomposition using spherical apertures
CN108447499B (zh) 一种双层圆环麦克风阵列语音增强方法
Schmalenstroeer et al. Multi-stage coherence drift based sampling rate synchronization for acoustic beamforming
Koldovský et al. Semi-blind noise extraction using partially known position of the target source
CN110907892B (zh) 一种球麦克风阵列语音信号到达角估计方法
Yin et al. Multi-talker Speech Separation Based on Permutation Invariant Training and Beamforming.
Yamaoka et al. CNN-based virtual microphone signal estimation for MPDR beamforming in underdetermined situations
Çöteli et al. Sparse representations with legendre kernels for doa estimation and acoustic source separation
US20240012093A1 (en) Improved location of an acoustic source
JP7182168B2 (ja) 音情報処理装置及びプログラム
JP2019054344A (ja) フィルタ係数算出装置、収音装置、その方法、及びプログラム
McCowan et al. Multi-channel sub-band speech recognition
Seltzer et al. Subband parameter optimization of microphone arrays for speech recognition in reverberant environments

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant