CN111798869A - 一种基于双麦克风阵列的声源定位方法 - Google Patents

一种基于双麦克风阵列的声源定位方法 Download PDF

Info

Publication number
CN111798869A
CN111798869A CN202010945178.9A CN202010945178A CN111798869A CN 111798869 A CN111798869 A CN 111798869A CN 202010945178 A CN202010945178 A CN 202010945178A CN 111798869 A CN111798869 A CN 111798869A
Authority
CN
China
Prior art keywords
sound source
variance
frame
kalman filtering
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010945178.9A
Other languages
English (en)
Other versions
CN111798869B (zh
Inventor
曾帆
何云鹏
许兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chipintelli Technology Co Ltd
Original Assignee
Chipintelli Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chipintelli Technology Co Ltd filed Critical Chipintelli Technology Co Ltd
Priority to CN202010945178.9A priority Critical patent/CN111798869B/zh
Publication of CN111798869A publication Critical patent/CN111798869A/zh
Application granted granted Critical
Publication of CN111798869B publication Critical patent/CN111798869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

一种基于双麦克风阵列的声源定位方法,包括如下步骤;步骤1.以双麦克风阵列的两个麦克风建立二维坐标系;步骤2.对时域信号进行分帧加窗及快速傅里叶变换,分别得到两个麦克风的频域信号;步骤3.将空间方位角区间均分为Q等份;步骤4.遍历全部Q个方位角,得到空间波束向量:步骤5.对空间波束向量进行归一化处理,计算归一化处理后的波束均值和方差;筛选出有效波束;最后对有效波束进行峰值搜索,峰值最大值所在的位置即为目标声源位置。本发明对每帧语音信号经过声源定位算法处理后形成的波束进行归一化处理筛选,不仅可以检测到语音信号起始点,而且能够剔除由于静音段、连续语音间歇停顿段以及噪声干扰过大导致的无效波束。

Description

一种基于双麦克风阵列的声源定位方法
技术领域
本发明属于声源定位技术领域,具体涉及一种基于双麦克风阵列的声源定位方法。
背景技术
近年来,随着人工智能领域智能语音技术的不断发展,基于麦克风阵列的声源定位技术也持续受到业内高度关注。麦克风阵列声源定位技术是指利用一定拓扑结构的多个麦克风及其相关算法,对麦克风阵列采集的多路语音信号进行分析和处理,获取一个或多个目标声源方位的过程。声源定位技术广泛应用于军事、民用等领域,如军事领域中的被动声探测系统、枪声定位系统,民用领域的智能机器人、智能家居、视频会议系统等。因此,准确实时获取目标声源方位十分重要。
目前,常用的声源定位技术可分为三大类:基于到达时间差的声源定位技术、基于高分辨率谱估计的声源定位技术以及基于最大输出功率的可控波束形成的声源定位技术。基于到达时间差的声源定位技术计算量小,实时性好,应用也比较广泛。但是该算法需分两步进行,且对第一步中的时延估计高度依赖。同时,该算法在低信噪比和混响环境中性能急剧降低。基于高分辨率谱估计的声源定位技术一般用于处理窄带信号,在处理宽带自然语音信号时应用受限。基于最大输出功率的可控波束形成的声源定位技术,由于算法本身特性,使其具有一定的抗噪抗混响能力。虽然需要添加可控功率的搜索算法增加了计算量,但对于双麦克风阵列,其计算量依然较小,可实时实现。
双麦克风阵列以小巧灵活的构型以及电路、算力、成本要求都比较低而广泛应用于智能家居、智能家电、智能玩具等领域。但同时由于其麦克风数量较少,空间信息获取不足等原因导致双麦克风阵列对目标声源的定位不准确以及定位精度较低。若增加繁琐的处理算法,虽然提升了定位精度,但同时也会增加计算量,影响定位实时性,无法满足市场需求。
发明内容
为克服现有技术存在的缺陷,本发明公开了一种基于双麦克风阵列的声源定位方法。
本发明所述基于双麦克风阵列的声源定位方法,包括如下步骤;
步骤1.以双麦克风阵列的两个麦克风所在直线为X轴,两个麦克风的中间点为原点,原点处垂直于X轴为Y轴,建立XOY二维坐标系;
设置两个麦克风接收到的时域信号分别为x1,x2,每帧信号采样点长度为K,采样率为Fs;
步骤2 .对时域信号x1,x2进行分帧加窗及快速傅里叶变换,分别得到两个麦克风的频域信号
Figure 688477DEST_PATH_IMAGE001
Figure 357706DEST_PATH_IMAGE002
。其中,
Figure 807142DEST_PATH_IMAGE003
表示第
Figure 255572DEST_PATH_IMAGE003
个时频点,
Figure 739643DEST_PATH_IMAGE004
表示第
Figure 582703DEST_PATH_IMAGE004
帧语音信号;k=1,2,…,K;
步骤3 .将空间方位角区间[0° 180°]均分为Q等份,定义每一个方位角索引q = 1,2,...,Q;根据基于相位变换加权的可控功率响应算法,获得第q个方位角的波束为:
Figure 253856DEST_PATH_IMAGE005
其中:
Figure 240397DEST_PATH_IMAGE006
Figure 313396DEST_PATH_IMAGE007
,θ为第q个方位角角度值,c为声音传播速度,*表示取复共轭, d为麦克风间距,j为复数虚部符号;
步骤4.遍历全部Q个方位角,得到空间波束向量:
Figure 392604DEST_PATH_IMAGE008
,下标
Figure 301785DEST_PATH_IMAGE004
表示第
Figure 810127DEST_PATH_IMAGE004
帧;
步骤5.对空间波束向量
Figure 986899DEST_PATH_IMAGE009
进行归一化处理,计算归一化处理后的波束均值和方差;筛选出有效波束;
最后对有效波束进行峰值搜索,峰值最大值所在的位置即为目标声源位置。
优选的:还包括对步骤5中筛选后的空间波束向量的卡尔曼滤波更新,更新后的有效波束进行峰值搜索。
优选的:所述卡尔曼滤波更新具体为:
步骤6.设置卡尔曼滤波初始状态参数,利用卡尔曼滤波预测方程和更新方程估计当前帧语音信号的波束;初始状态参数包括预测矩阵
Figure 984811DEST_PATH_IMAGE010
,语音信号波束方差
Figure 381288DEST_PATH_IMAGE011
,预测噪声方差
Figure 693321DEST_PATH_IMAGE012
,测量噪声方差
Figure 987249DEST_PATH_IMAGE013
,下标l表示帧数,初始状态参数中,l=1;
其中,当帧数l大于1时,卡尔曼滤波预测方程为:
Figure 359325DEST_PATH_IMAGE014
Figure 446360DEST_PATH_IMAGE015
Figure 358822DEST_PATH_IMAGE016
表示卡尔曼滤波预测的第
Figure 510186DEST_PATH_IMAGE004
帧语音信号波束,
Figure 53163DEST_PATH_IMAGE017
表示第
Figure 361916DEST_PATH_IMAGE018
帧卡尔曼滤波估计的语音信号波束,对于l=1的初始状态,
Figure 812489DEST_PATH_IMAGE019
Figure 821289DEST_PATH_IMAGE010
表示预测矩阵,
Figure 535167DEST_PATH_IMAGE011
表示第
Figure 393533DEST_PATH_IMAGE004
帧语音信号波束的方差,
Figure 851059DEST_PATH_IMAGE020
表示第
Figure 711437DEST_PATH_IMAGE018
帧语音信号波束的方差,
Figure 409265DEST_PATH_IMAGE012
表示预测噪声方差,T表示转置矩阵。
卡尔曼滤波更新方程为:
Figure 941878DEST_PATH_IMAGE021
Figure 203095DEST_PATH_IMAGE022
Figure 250987DEST_PATH_IMAGE023
其中:
Figure 837826DEST_PATH_IMAGE024
为卡尔曼增益因子,
Figure 405205DEST_PATH_IMAGE013
为测量噪声方差,
Figure 204533DEST_PATH_IMAGE025
为卡尔曼滤波更新后的波束,
Figure 39503DEST_PATH_IMAGE009
为第
Figure 531664DEST_PATH_IMAGE004
帧语音信号声源定位算法形成的波束,
Figure 320760DEST_PATH_IMAGE026
为卡尔曼滤波更新后的方差;
将筛选出的有效波束以上述卡尔曼滤波预测方程和卡尔曼滤波更新方程持续迭代,遍历所有帧;
步骤7.步骤5中未通过筛选的空间波束向量,代入卡尔曼滤波预测方程并以卡尔曼滤波预测波束
Figure 923779DEST_PATH_IMAGE016
作为输出波束;并作为步骤6的迭代输入变量。
优选的:所述步骤5的筛选方法为:设置波束均值的阈值和方差阈值,筛选出大于方差阈值且小于均值阈值的波束作为有效波束进行下一步操作。
优选的:所述步骤2中的加窗为利用汉宁窗函数加窗。
采用本发明所述的基于双麦克风阵列的声源定位方法,具备如下优越性:
一.对每帧语音信号经过声源定位算法处理后形成的波束进行归一化处理并做统计分析,筛选出包含目标声源的有效波束,不仅可以检测到语音信号起始点,而且能够剔除由于静音段、连续语音间歇停顿段以及噪声干扰过大导致的无效波束。
二.对筛选出的有效波束进行卡尔曼滤波和预测,可以防止波束峰值位置突变,抑制瞬时噪声干扰,并减小目标声源方位角度波动范围,提高目标声源定位准确度和精确度。
附图说明
图1为基于双麦克风阵列建立坐标系的一种具体实施方式示意图,m1和m2表示不同的麦克风,S为声源;
图2为本发明所述定位方法的一种具体实施方式流程示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步的详细说明。
本发明所述基于双麦克风阵列的声源定位方法,包括如下步骤:
步骤1.以双麦克风阵列的两个麦克风所在直线为X轴,两个麦克风的中间点为原点,原点处垂直于X轴为Y轴,建立XOY二维坐标系,如图1所示;
设置两个麦克风接收到的时域信号分别为x1,x2,每帧信号采样点长度为K,采样率为Fs;
步骤2 .对时域信号x1,x2进行分帧加窗及快速傅里叶变换,分别得到两个麦克风的频域信号:
Figure 225972DEST_PATH_IMAGE001
Figure 623456DEST_PATH_IMAGE002
。其中,
Figure 617956DEST_PATH_IMAGE003
表示第
Figure 70672DEST_PATH_IMAGE003
个时频点,
Figure 381699DEST_PATH_IMAGE004
表示第
Figure 950084DEST_PATH_IMAGE004
帧语音信号;k=1,2,…,K。
一个典型设置为,可设置帧长为512个采样点,选择帧移为K/2,加窗可选取汉宁窗或汉明窗,采样率为16KHz。。
从时域信号x1,x2到频域信号
Figure 474956DEST_PATH_IMAGE001
Figure 232828DEST_PATH_IMAGE002
转换为本领域通用技术手段,在此不再赘述。
步骤3 .将空间方位角区间[0° 180°]均分为Q等份,定义每一个方位角索引q =1,2,...,Q;根据基于相位变换加权的可控功率响应算法,获得第q个方位角的波束为:
Figure 647628DEST_PATH_IMAGE005
其中:
Figure 167340DEST_PATH_IMAGE006
Figure 667592DEST_PATH_IMAGE007
,θ为第q个方位角角度值,c为声音传播速度,*表示取复共轭;
步骤4.遍历全部Q个方位角,得到空间波束向量:
Figure 901258DEST_PATH_IMAGE008
,下标
Figure 436145DEST_PATH_IMAGE004
表示第
Figure 864108DEST_PATH_IMAGE004
帧;
步骤5.对空间波束向量
Figure 602388DEST_PATH_IMAGE009
进行归一化处理,计算归一化处理后的波束均值和方差;筛选出有效波束。
对每帧语音信号经过声源定位算法处理后形成的波束进行归一化处理并做统计分析,筛选出包含目标声源的有效波束,不仅可以检测到语音信号起始点,而且能够剔除由于静音段、连续语音间歇停顿段以及噪声干扰过大导致的无效波束。
对于有效波束的筛选,可以根据统计规律进行,经统计方法分析,可发现在语音静音段、目标语音段及噪声干扰段,波束的均值和方差呈现出一定的规律性。因此,可以通过设置波束均值的阈值和方差阈值,筛选出有效波束进行下一步操作。
例如,可以设置波束均值阈值m = 0.5,方差阈值 α = 0.1,筛选出大于方差阈值且小于均值阈值的波束作为有效波束进行下一步操作。
筛选后的波束可以进行卡尔曼滤波和预测,可以防止波束峰值位置突变,抑制瞬时噪声干扰,并减小目标声源方位角度波动范围,提高目标声源定位准确度和精确度。
具体的,卡尔曼预测和更新筛选后的有效波束进行后续操作如下:
步骤6.设置卡尔曼滤波初始状态参数,利用卡尔曼滤波预测方程和更新方程估计当前帧语音信号的波束;初始状态参数包括预测矩阵
Figure 889013DEST_PATH_IMAGE010
, 语音信号波束方差
Figure 527674DEST_PATH_IMAGE011
,预测噪声方差
Figure 671079DEST_PATH_IMAGE012
,测量噪声方差
Figure 896655DEST_PATH_IMAGE013
等,下标l表示帧数,初始状态参数中,l=1。
其中,当帧数l大于1时,卡尔曼滤波预测方程为:
Figure 721392DEST_PATH_IMAGE014
Figure 211629DEST_PATH_IMAGE015
其中:
Figure 463619DEST_PATH_IMAGE016
表示卡尔曼滤波预测的第
Figure 504387DEST_PATH_IMAGE004
帧语音信号波束,
Figure 382082DEST_PATH_IMAGE017
表示第
Figure 214909DEST_PATH_IMAGE018
帧卡尔曼滤波估计的语音信号波束,对于l=1的初始状态,
Figure 919691DEST_PATH_IMAGE019
Figure 369127DEST_PATH_IMAGE010
表示预测矩阵,
Figure 787863DEST_PATH_IMAGE011
表示第
Figure 288246DEST_PATH_IMAGE004
帧语音信号波束的方差,
Figure 147618DEST_PATH_IMAGE020
表示第
Figure 22033DEST_PATH_IMAGE018
帧语音信号波束的方差,
Figure 38268DEST_PATH_IMAGE012
表示预测噪声方差,T表示转置矩阵。
卡尔曼滤波更新方程为:
Figure 861999DEST_PATH_IMAGE021
Figure 157851DEST_PATH_IMAGE022
Figure 562638DEST_PATH_IMAGE023
其中:
Figure 70979DEST_PATH_IMAGE024
为卡尔曼增益因子,
Figure 467326DEST_PATH_IMAGE013
为测量噪声方差,
Figure 419232DEST_PATH_IMAGE025
为卡尔曼滤波更新后的波束,
Figure 110982DEST_PATH_IMAGE009
为第
Figure 423015DEST_PATH_IMAGE004
帧语音信号声源定位算法形成的波束,
Figure 221338DEST_PATH_IMAGE026
为卡尔曼滤波更新后的方差;
步骤7. 如果在步骤5中某一帧信号没有筛选出有效波束,说明该帧语音没有有效波束,则直接以卡尔曼滤波预测波束
Figure 235824DEST_PATH_IMAGE016
作为输出波束;
符合步骤5筛选标准的,对经过卡尔曼滤波更新后的波束
Figure 119597DEST_PATH_IMAGE025
进行峰值搜索,峰值最大值所在的位置即为目标声源位置。图2为本发明所述定位方法的一种具体实施方式流程示意图。
采用本发明所述的基于双麦克风阵列的声源定位方法,具备如下优越性:
一.对每帧语音信号经过声源定位算法处理后形成的波束进行归一化处理并做统计分析,筛选出包含目标声源的有效波束,不仅可以检测到语音信号起始点,而且能够剔除由于静音段、连续语音间歇停顿段以及噪声干扰过大导致的无效波束。
二.对筛选出的有效波束进行卡尔曼滤波和预测,可以防止波束峰值位置突变,抑制瞬时噪声干扰,并减小目标声源方位角度波动范围,提高目标声源定位准确度和精确度。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书及附图内容所作的等同结构变化,同理均应包含在本发明的保护范围内。

Claims (5)

1.一种基于双麦克风阵列的声源定位方法,其特征在于,包括如下步骤;
步骤1.以双麦克风阵列的两个麦克风所在直线为X轴,两个麦克风的中间点为原点,原点处垂直于X轴为Y轴,建立XOY二维坐标系;
设置两个麦克风接收到的时域信号分别为x1,x2,每帧信号采样点长度为K,采样率为Fs;
步骤2.对时域信号x1,x2进行分帧加窗及快速傅里叶变换,分别得到两个麦克风的频域信号
Figure 942944DEST_PATH_IMAGE001
Figure 469871DEST_PATH_IMAGE002
;其中,
Figure 95281DEST_PATH_IMAGE003
表示第
Figure 552807DEST_PATH_IMAGE003
个时频点,
Figure 180229DEST_PATH_IMAGE004
表示第
Figure 65008DEST_PATH_IMAGE004
帧语音信号;k=1,2,…,K;
步骤3.将空间方位角区间[0° 180°]均分为Q等份,定义每一个方位角索引q = 1,2,...,Q;根据基于相位变换加权的可控功率响应算法,获得第q个方位角的波束为:
Figure 643626DEST_PATH_IMAGE005
其中:
Figure 904843DEST_PATH_IMAGE006
Figure 590033DEST_PATH_IMAGE007
,θ为第q个方位角角度值,c为声音传播速度,*表示取复共轭,d为麦克风间距,j为复数虚部符号;
步骤4.遍历全部Q个方位角,得到空间波束向量:
Figure 645714DEST_PATH_IMAGE008
,下标
Figure 708698DEST_PATH_IMAGE004
表示第
Figure 773606DEST_PATH_IMAGE004
帧;
步骤5.对空间波束向量
Figure 110041DEST_PATH_IMAGE009
进行归一化处理,计算归一化处理后的波束均值和方差;筛选出有效波束;
最后对有效波束进行峰值搜索,峰值最大值所在的位置即为目标声源位置。
2.如权利要求1所述的基于双麦克风阵列的声源定位方法,其特征在于:还包括对步骤5中筛选后的空间波束向量的卡尔曼滤波更新,更新后的有效波束进行峰值搜索。
3.如权利要求2所述的基于双麦克风阵列的声源定位方法,其特征在于:所述卡尔曼滤波更新具体为:
步骤6.设置卡尔曼滤波初始状态参数,利用卡尔曼滤波预测方程和更新方程估计当前帧语音信号的波束;初始状态参数包括预测矩阵
Figure 602202DEST_PATH_IMAGE010
, 语音信号波束方差
Figure 109407DEST_PATH_IMAGE011
,预测噪声方差
Figure 696115DEST_PATH_IMAGE012
,测量噪声方差
Figure 401902DEST_PATH_IMAGE013
,下标l表示帧数,初始状态参数中,l=1;
其中,当帧数l大于1时,卡尔曼滤波预测方程为:
Figure 815697DEST_PATH_IMAGE014
Figure 341357DEST_PATH_IMAGE015
Figure 734685DEST_PATH_IMAGE016
表示卡尔曼滤波预测的第
Figure 560559DEST_PATH_IMAGE004
帧语音信号波束,
Figure 348517DEST_PATH_IMAGE017
表示第
Figure 361473DEST_PATH_IMAGE018
帧卡尔曼滤波估计的语音信号波束,对于l=1的初始状态,
Figure 555562DEST_PATH_IMAGE019
Figure 235943DEST_PATH_IMAGE010
表示预测矩阵,
Figure 991540DEST_PATH_IMAGE011
表示第
Figure 695054DEST_PATH_IMAGE004
帧语音信号波束的方差,
Figure 177988DEST_PATH_IMAGE020
表示第
Figure 60729DEST_PATH_IMAGE018
帧语音信号波束的方差,
Figure 518386DEST_PATH_IMAGE012
表示预测噪声方差,T表示转置矩阵;
卡尔曼滤波更新方程为:
Figure 505934DEST_PATH_IMAGE021
Figure 776247DEST_PATH_IMAGE022
Figure 165640DEST_PATH_IMAGE023
其中:
Figure 263040DEST_PATH_IMAGE024
为卡尔曼增益因子,
Figure 472305DEST_PATH_IMAGE013
为测量噪声方差,
Figure 814818DEST_PATH_IMAGE025
为卡尔曼滤波更新后的波束,
Figure 324296DEST_PATH_IMAGE009
为第
Figure 61439DEST_PATH_IMAGE004
帧语音信号声源定位算法形成的波束,
Figure 289158DEST_PATH_IMAGE026
为卡尔曼滤波更新后的方差;
将筛选出的有效波束以上述卡尔曼滤波预测方程和卡尔曼滤波更新方程持续迭代,遍历所有帧;
步骤7.步骤5中未通过筛选的空间波束向量,代入卡尔曼滤波预测方程并以卡尔曼滤波预测波束
Figure 166853DEST_PATH_IMAGE016
作为输出波束;并作为步骤6的迭代输入变量。
4.如权利要求1所述的基于双麦克风阵列的声源定位方法,其特征在于:所述步骤5的筛选方法为:设置波束均值的阈值和方差阈值,筛选出大于方差阈值且小于均值阈值的波束作为有效波束进行下一步操作。
5.如权利要求1所述的基于双麦克风阵列的声源定位方法,其特征在于:所述步骤2中的加窗为利用汉宁窗函数加窗。
CN202010945178.9A 2020-09-10 2020-09-10 一种基于双麦克风阵列的声源定位方法 Active CN111798869B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010945178.9A CN111798869B (zh) 2020-09-10 2020-09-10 一种基于双麦克风阵列的声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010945178.9A CN111798869B (zh) 2020-09-10 2020-09-10 一种基于双麦克风阵列的声源定位方法

Publications (2)

Publication Number Publication Date
CN111798869A true CN111798869A (zh) 2020-10-20
CN111798869B CN111798869B (zh) 2020-11-17

Family

ID=72834232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010945178.9A Active CN111798869B (zh) 2020-09-10 2020-09-10 一种基于双麦克风阵列的声源定位方法

Country Status (1)

Country Link
CN (1) CN111798869B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113203987A (zh) * 2021-07-05 2021-08-03 成都启英泰伦科技有限公司 一种基于k均值聚类的多声源方位估计方法
CN113514801A (zh) * 2021-04-28 2021-10-19 成都启英泰伦科技有限公司 基于深度学习的麦克风阵列声源定位方法及声源识别方法
CN113640744A (zh) * 2021-08-20 2021-11-12 歌尔科技有限公司 声源定位方法及音频设备
CN115201753A (zh) * 2022-09-19 2022-10-18 泉州市音符算子科技有限公司 一种低功耗多频谱分辨的语音定位方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050035900A1 (en) * 2003-08-14 2005-02-17 Zaugg David A. System and method for tracking beam-aspect targets with combined Kalman and particle filters
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法
CN104316045B (zh) * 2014-11-06 2017-06-16 东南大学 一种基于sins/lbl的auv水下交互辅助定位系统及定位方法
CN108226933A (zh) * 2017-12-28 2018-06-29 西北工业大学 一种基于条纹干涉结构的深海宽带目标深度估计方法
CN109120305A (zh) * 2018-07-04 2019-01-01 广州杰赛科技股份有限公司 一种宽带波束的数字跟踪方法、系统和设备
WO2019112468A1 (en) * 2017-12-08 2019-06-13 Huawei Technologies Co., Ltd. Multi-microphone noise reduction method, apparatus and terminal device
CN110111802A (zh) * 2018-02-01 2019-08-09 南京大学 基于卡尔曼滤波的自适应去混响方法
CN110221282A (zh) * 2019-05-10 2019-09-10 中国船舶重工集团公司第七一五研究所 一种基于自适应卡尔曼滤波的双基阵目标运动分析方法
WO2019169616A1 (zh) * 2018-03-09 2019-09-12 深圳市汇顶科技股份有限公司 语音信号处理方法及装置
CN110418974A (zh) * 2017-03-15 2019-11-05 赛普拉斯半导体公司 估计对于使用相控阵列系统的源跟踪的角度测量值
CN110716203A (zh) * 2019-10-31 2020-01-21 海鹰企业集团有限责任公司 一种被动声纳目标的时频分析与跟踪方法
CN111210836A (zh) * 2020-03-09 2020-05-29 成都启英泰伦科技有限公司 一种麦克风阵列波束形成动态调整方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050035900A1 (en) * 2003-08-14 2005-02-17 Zaugg David A. System and method for tracking beam-aspect targets with combined Kalman and particle filters
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法
CN104316045B (zh) * 2014-11-06 2017-06-16 东南大学 一种基于sins/lbl的auv水下交互辅助定位系统及定位方法
CN110418974A (zh) * 2017-03-15 2019-11-05 赛普拉斯半导体公司 估计对于使用相控阵列系统的源跟踪的角度测量值
WO2019112468A1 (en) * 2017-12-08 2019-06-13 Huawei Technologies Co., Ltd. Multi-microphone noise reduction method, apparatus and terminal device
CN108226933A (zh) * 2017-12-28 2018-06-29 西北工业大学 一种基于条纹干涉结构的深海宽带目标深度估计方法
CN110111802A (zh) * 2018-02-01 2019-08-09 南京大学 基于卡尔曼滤波的自适应去混响方法
WO2019169616A1 (zh) * 2018-03-09 2019-09-12 深圳市汇顶科技股份有限公司 语音信号处理方法及装置
CN109120305A (zh) * 2018-07-04 2019-01-01 广州杰赛科技股份有限公司 一种宽带波束的数字跟踪方法、系统和设备
CN110221282A (zh) * 2019-05-10 2019-09-10 中国船舶重工集团公司第七一五研究所 一种基于自适应卡尔曼滤波的双基阵目标运动分析方法
CN110716203A (zh) * 2019-10-31 2020-01-21 海鹰企业集团有限责任公司 一种被动声纳目标的时频分析与跟踪方法
CN111210836A (zh) * 2020-03-09 2020-05-29 成都启英泰伦科技有限公司 一种麦克风阵列波束形成动态调整方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KWOK N M: ""sound source localization:microphone array design and evolutionary estimation"", 《IEEE INTERNATIONAL CONFERENCE ON INDUSTRIAL TECHNOLOGY》 *
S.JULIER: ""unscented filtering and nonlinear estimation"", 《IEEE》 *
肖元弼: ""基于自适应卡尔曼滤波的多波束数据改正方法"", 《海洋测绘》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113514801A (zh) * 2021-04-28 2021-10-19 成都启英泰伦科技有限公司 基于深度学习的麦克风阵列声源定位方法及声源识别方法
CN113203987A (zh) * 2021-07-05 2021-08-03 成都启英泰伦科技有限公司 一种基于k均值聚类的多声源方位估计方法
CN113640744A (zh) * 2021-08-20 2021-11-12 歌尔科技有限公司 声源定位方法及音频设备
CN115201753A (zh) * 2022-09-19 2022-10-18 泉州市音符算子科技有限公司 一种低功耗多频谱分辨的语音定位方法

Also Published As

Publication number Publication date
CN111798869B (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN111798869B (zh) 一种基于双麦克风阵列的声源定位方法
CN104076331B (zh) 一种七元麦克风阵列的声源定位方法
CN111415676B (zh) 一种基于分离矩阵初始化频点选择的盲源分离方法及系统
CN108375763B (zh) 一种应用于多声源环境的分频定位方法
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
US7626889B2 (en) Sensor array post-filter for tracking spatial distributions of signals and noise
Salvati et al. Incoherent frequency fusion for broadband steered response power algorithms in noisy environments
CN102147458B (zh) 一种针对宽带声源的波达方向估计方法及其装置
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
CN108549052B (zh) 一种时频-空域联合加权的圆谐域伪声强声源定位方法
CN108447499B (zh) 一种双层圆环麦克风阵列语音增强方法
CN109188362A (zh) 一种麦克风阵列声源定位信号处理方法
CN114171041A (zh) 基于环境检测的语音降噪方法、装置、设备及存储介质
Dang et al. A feature-based data association method for multiple acoustic source localization in a distributed microphone array
CN112394324A (zh) 一种基于麦克风阵列的远距离声源定位的方法及系统
Zhu et al. Broadband direction of arrival estimation based on convolutional neural network
CN110838303B (zh) 一种利用传声器阵列的语音声源定位方法
KR101354960B1 (ko) 영역 개념을 이용한 음파 입사 방향 추정 방법
CN117169812A (zh) 一种基于深度学习和波束形成的声源定位方法
CN111273230A (zh) 一种声源定位方法
CN111060867A (zh) 一种指向性麦克风微阵列波达方向估计方法
CN112666521B (zh) 一种基于改进的自适应陷波器的室内声源定位方法
CN113721184B (zh) 基于改进music算法的近场信号源定位方法
CN111968671B (zh) 基于多维特征空间的低空声目标综合识别方法及装置
CN111323750B (zh) 一种基于声矢量阵列网络的直接定位方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant