CN109001682A - 一种基于麦克风阵列的机器人声源定位方法 - Google Patents

一种基于麦克风阵列的机器人声源定位方法 Download PDF

Info

Publication number
CN109001682A
CN109001682A CN201810540651.8A CN201810540651A CN109001682A CN 109001682 A CN109001682 A CN 109001682A CN 201810540651 A CN201810540651 A CN 201810540651A CN 109001682 A CN109001682 A CN 109001682A
Authority
CN
China
Prior art keywords
coordinate
sound source
microphone
sound
microphone array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810540651.8A
Other languages
English (en)
Inventor
刘冠群
张汝波
袁生荣
温乃峰
于海洋
吴俊伟
毛琳
唐莉莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Minzu University
Original Assignee
Dalian Nationalities University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Nationalities University filed Critical Dalian Nationalities University
Priority to CN201810540651.8A priority Critical patent/CN109001682A/zh
Publication of CN109001682A publication Critical patent/CN109001682A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种基于麦克风阵列的机器人声源定位方法,属于声源定位领域,用于降低计算复杂度的问题,要点是S1.构造麦克风阵列;S2.利用互相关算法计算声源信号到各麦克风对之间的时延差;S3.计算声源S到坐标原点O的距离R;S4.计算声源S的坐标;S5.求声源方位角θ和俯仰角效果是降低了计算复杂度。

Description

一种基于麦克风阵列的机器人声源定位方法
技术领域
本发明涉及声源定位技术,特别涉及一种基于麦克风阵列的移动机器人空间声源定位技术,即利用多个麦克风组成的拓扑结构计算空间中的声源位置及方向的一种方法。
背景技术
声源定位在音视频会议系统、语音识别系统、语音控制系统和机器人交互方面都有重要的应用。大多数的声源定位方法一般是基于麦克风阵列的方法。在机器人声源定位中,由于机器人的体积限制,要求麦克风阵列的尺寸较小,大多数情况下,与声源距麦克风阵列的距离相比较,麦克风阵列的大小是可以忽略的。又因为机器人的计算能力,一般要求麦克风阵列的阵元数目较少。
文献[1,2]通过建立一个三维坐标系,在x,y和z轴上分别放置两个麦克风,构成具有6个阵元的麦克风阵列用于声源定位。这也是声源定位中常用的拓扑结构。文献[3]则在坐标原点多加了一个麦克风,使计算过程稍显简便。文献[4]是另一种类型的声源定位方法,只使用了两个麦克风,但需要通过利用麦克风的运动才能定位声源。
本发明使用了文献[1,2]中的麦克风阵列拓扑结构,并在此基础上获得声源的距离。但在声源位置的计算过程中,对文献[4]的声源定位算法进行了改进,利用麦克风之间的相对位置,替代了文献[4]里声源定位过程中所需的旋转运动,从而获取了声源位置。
参考文献
[1]赵圣.基于麦克风阵列的仿人智能机器人声源定位技术的研究[D].哈尔滨:哈尔滨工业大学,2013.
[2]赵圣,崔牧凡,尤磊,王鸿鹏.基于小型麦克风阵列的声源定位技术[J].华中科技大学学报(自然科学版),2013,41(s1):188-191.
[3]Y.C.Guo,K.K.Song Gong,N.Zhang.Sound source localization algorithmbased on seven-microphone array and PHAT-GCC method[J].WIT Transactions onEngineering Sciences,2015,98:568-575
[4]Laurent Kneip,Claude Baumann.Binaural model for artificial spatialsound localization based on interaural time delays and movements of theinteraural axis.J.Acoust.Soc.Am.2008,124(5):3108-3119.
发明内容
本发明的目的在于提供一种基于麦克风阵列的机器人声源定位方法。
本发明的目的是这样实现的:
一种基于麦克风阵列的机器人声源定位方法,其特征在于,包括如下步骤:
(1)构造麦克风阵列,该阵列包含六个麦克风Mi(i=1,2,…,6),若以麦克风阵列的几何中心为声源定位空间的原点O,并以点O建立空间直角坐标系O-xyz,则O的坐标为(0,0,0),M1的坐标为(L,0,0),M2的坐标为(-L,0,0),M3的坐标为(0,L,0),M4的坐标为(0,-L,0),M5的坐标为(0,0,L),M6的坐标为(0,0,-L),L为大于0的实数;
(2)利用互相关算法计算声源信号到各麦克风对之间的时延差,设麦克风Mi接收到的连续信号经采样后的数字信号为xi(m),设采样周期为T,则nT时刻xi(m)与xj(m)之间的短时互相关函数为
其中w(n)为窗函数,窗长为N,求使值最大的索引值Iij,
那么xi(m)和xj(m)之间的时延差为
τij=Iij·T
(3)计算声源S到坐标原点O的距离R,设S到各麦克风Mi之间的距离为Di,当声源S到坐标原点O的距离R>4L时,可以用声源到O-xy平面上任一麦克风的距离Di作为其R的估计值,令τi为声源信号从S传播到Mi所需的时间,取声源S到麦克风M1的距离D1作为R的估计值,有
D1=c·τ1
R≈D1
其中c为声音在空气中的传播速度;
(4)计算声源S的坐标,由点O向点S作射线与x,y,z轴正方向形成的夹角分别为φx,φy和φz,则φx,φy,φz与τij,L,c之间存在如下近似关系,
则声源S的坐标(x,y,z)的值为
x=R·cosφx
y=R·cosφy
z=R·cosφz
(5)求声源方位角θ和俯仰角由θ与S的坐标(x,y,z)的几何关系
可得
与S的坐标(x,y,z)和R的几何关系
可得
或直接由和φz的关系得
(6)至此,求得声源S的坐标为(x,y,z),方位角θ,俯仰角
由于采用上述技术方案,本发明提供的一种基于麦克风阵列的机器人声源定位方法,与现有技术相比具有这样的有益效果:
第一,当声源距离麦克风阵列较远时,可认为声源到任一麦克风的距离作为声源到麦克风阵列几何中心的距离R的估计值。当R>4L时,则认为声源与麦克风阵列之间的距离较远。根据这一假设,在步骤(3)中,以声源S到某一麦克风的距离Di作为声源S到坐标原点O的距离R的估计值,这对于后面步骤中对坐标及声源角度的估计,降低了计算复杂度。这里D1的计算为例,说明R的计算过程。根据声源S的坐标(x,y,z)和各麦克风的坐标,可以得到S与Mi之间的距离Di
由上式可知如下关系,
由图3可知,
联立式(1)和(2)可得
D1=c·τ1 (3)
从而得到R的估计值D1,本步骤的部分推导借鉴了文献[1-3]中的推导方法。
第二,当麦克风阵列固定不动时,且麦克风Mi和Mj之间的时延值τij为一定值时,则声源S会位于三维空间中某一特定的双叶双曲面H上,该双曲面H以Mi和Mj的坐标为焦点,如图6所示,图中的点表示麦克风所在位置。双曲面有一个渐近锥,双曲面与其对应渐近锥的关系如图7所示,渐近锥位于双曲面外部,图中用网格线表示,且只表示了渐近锥的一部分。过声源S与双曲面焦点所在的轴作一平面,该平面与双曲面及其渐近锥相交,得到与双曲面对应的双曲线及其渐近线,如图8所示。设渐近线与坐标轴所成的夹角为α,设OS与坐标轴所成的夹角为β,设Mi与Mj之间的距离为Lij,则存在如下关系
当声源S距坐标原点的距离大于2Lij时,有
α≈β (5)
若麦克风阵列的拓扑结构如图2所示,声源S位于空间某一位置时,根据时延和麦克风对的位置的几何关系,由M1和M2可得双曲面H12,由M3和M4可得双曲面H34,由M5和M6可得双曲面H56,而声源S必位于H12、H34和H56的交点上。设H12、H34和H56对应的渐近锥分别C12、C34和C56,因为声源S离曲面C12、C34和C56的距离都很近,可以假定声源S位于C12、C34和C56上,则C12、C34和C56相应的渐近线与对应轴所构成的夹角分别为βx,βy和βz。由点O向点S作射线与x,y,z轴正方向形成的夹角分别为φx,φy和φz,如图7所示。当声源与坐标原点距离较远时,有
所以,根据式(4)和(5)可以获得φx,φy和φz的估计值。本发明通过以上步骤中的假设,避免了复杂计算,提高了声源定位效率。本步骤的部分推导借鉴了文献[4]中的推导方法。
综上,利用麦克风阵列阵元之间的时延估计值,通过较为简单的计算就可获得声源的空间位置,当应用于机器人声源定位时,对于提高机器人的环境感知能力和人机交互能力具有重要意义。
附图说明
图1是声源定位方法流程图。
图2是麦克风阵列拓扑结构图。
图3是声源位置与O-xy平面内四元麦克风的几何关系图。
图4是声源与三个坐标轴所成角度示意图
图5是声源方位角θ和俯仰角示意图。
图6是麦克风对之间特定声源时延差所对应的双曲面示意图。
图7是双曲面及其渐近锥对应位置关系示意图。
图8是双曲面及其渐近锥的剖面示意图。
具体实施方式
下面结合附图举例对本发明做详细的描述:
一种机器人三维空间声源定位方法,其具体实施方法如图1所示,现根据图1对本发明方法做详细说明如下:
(1)构造麦克风阵列,如图2所示,该阵列包含六个麦克风Mi(i=1,2,…,6),若以麦克风阵列的几何中心为声源定位空间的原点O,并以点O建立空间直角坐标系O-xyz,则O的坐标为(0,0,0),M1的坐标为(L,0,0),M2的坐标为(-L,0,0),M3的坐标为(0,L,0),M4的坐标为(0,-L,0),M5的坐标为(0,0,L),M6的坐标为(0,0,-L),L为大于0的实数;
(2)利用互相关算法计算声源信号到各麦克风对之间的时延差,设麦克风Mi接收到的连续信号经采样后的数字信号为xi(m),麦克风Mj接收到的连续信号经采样后的数字信号为xj(m),设采样周期为T,则nT时刻xi(m)与xj(m)之间的短时互相关函数为
其中w(n)为窗函数,窗长为N,m为求和范围,k表示两个信号之间的滞后关系
求使值最大的索引值Iij,
那么xi(m)和xj(m)之间的时延差为
τij=Iij·T
(3)计算声源S到坐标原点O的距离R,设S到各麦克风Mi之间的距离为Di,如图3所示,当声源S到坐标原点O的距离R>4L时,可以用声源到O-xy平面上任一麦克风的距离Di作为其R的估计值,令τi为声源信号从S传播到Mi所需的时间,取声源S到麦克风M1的距离D1作为R的估计值,有
D1 = c·τ1
R≈D1
其中c为声音在空气中的传播速度;
(4)计算声源S的坐标,由点O向点S作射线与x,y,z轴正方向形成的夹角分别为φx,φy和φz,如图4所示,则φx,φy,φz与τij,L,c之间存在如下近似关系,
则声源S的坐标(x,y,z)的值为
x=R·cosφx
y=R·cosφy
z=R·cosφz
(5)求声源方位角θ和俯仰角如图5所示,由θ与S的坐标(x,y,z)的几何关系
可得
与S的坐标(x,y,z)和R的几何关系
可得
或直接由和φz的关系得
(6)至此,求得声源S的坐标为(x,y,z),方位角θ,俯仰角
以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。

Claims (7)

1.一种基于麦克风阵列的机器人声源定位方法,其特征在于,包括如下步骤:
S1.构造麦克风阵列;
S2.利用互相关算法计算声源信号到各麦克风对之间的时延差;
S3.计算声源S到坐标原点O的距离R;
S4.计算声源S的坐标;
S5.求声源方位角θ和俯仰角
2.如权利要求1所述的基于麦克风阵列的机器人声源定位方法,其特征在于,所述的步骤S1具体如下:构造麦克风阵列,该阵列包含六个麦克风Mi,i=1,2,…,6,若以麦克风阵列的几何中心为声源定位空间的原点O,并以点O建立空间直角坐标系O-xyz,则O的坐标为(0,0,0),M1的坐标为(L,0,0),M2的坐标为(-L,0,0),M3的坐标为(0,L,0),M4的坐标为(0,-L,0),M5的坐标为(0,0,L),M6的坐标为(0,0,-L),L为大于0的实数。
3.如权利要求2所述的基于麦克风阵列的机器人声源定位方法,其特征在于,所述的步骤S2具体如下:利用互相关算法计算声源信号到各麦克风对之间的时延差,设麦克风Mi接收到的连续信号经采样后的数字信号为xi(m),麦克风Mj接收到的连续信号经采样后的数字信号为xj(m),设采样周期为T,则nT时刻xi(m)与xj(m)之间的短时互相关函数为
其中w(n)为窗函数,窗长为N,m为求和范围,k表示两个信号之间的滞后关系,求使值最大的索引值Iij,
那么xi(m)和xj(m)之间的时延差为
τij=Iij·T。
4.如权利要求3所述的基于麦克风阵列的机器人声源定位方法,其特征在于,所述的步骤S3具体如下:计算声源S到坐标原点O的距离R,设S到各麦克风Mi之间的距离为Di,当声源S到坐标原点O的距离R>4L时,用声源到O-xy平面上任一麦克风的距离Di作为其R的估计值,令τi为声源信号从S传播到Mi所需的时间,取声源S到麦克风M1的距离D1作为R的估计值,有
D1=c·τ1
R≈D1
其中c为声音在空气中的传播速度。
5.如权利要求4所述的基于麦克风阵列的机器人声源定位方法,其特征在于,所述的步骤S4具体如下:计算声源S的坐标,由点O向点S作射线与x,y,z轴正方向形成的夹角分别为φx,φy和φz,则φx,φy,φz与τij,L,c之间存在如下近似关系,
则声源S的坐标(x,y,z)的值为
x=R·cosφx
y=R·cosφy
z=R·cosφz
6.如权利要求5所述的基于麦克风阵列的机器人声源定位方法,其特征在于,所述的步骤S5具体如下:求声源方位角θ和俯仰角由θ与S的坐标(x,y,z)的几何关系
可得
与S的坐标(x,y,z)和R的几何关系
可得
7.如权利要求5所述的基于麦克风阵列的机器人声源定位方法,其特征在于,所述的步骤S5具体如下:求声源方位角θ和俯仰角由θ与S的坐标(x,y,z)的几何关系
可得
直接由和φz的关系得
CN201810540651.8A 2018-05-30 2018-05-30 一种基于麦克风阵列的机器人声源定位方法 Pending CN109001682A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810540651.8A CN109001682A (zh) 2018-05-30 2018-05-30 一种基于麦克风阵列的机器人声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810540651.8A CN109001682A (zh) 2018-05-30 2018-05-30 一种基于麦克风阵列的机器人声源定位方法

Publications (1)

Publication Number Publication Date
CN109001682A true CN109001682A (zh) 2018-12-14

Family

ID=64572927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810540651.8A Pending CN109001682A (zh) 2018-05-30 2018-05-30 一种基于麦克风阵列的机器人声源定位方法

Country Status (1)

Country Link
CN (1) CN109001682A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471145A (zh) * 2018-10-17 2019-03-15 中北大学 一种基于四元声阵列平台的双声定位定姿法
CN110082724A (zh) * 2019-05-31 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置及存储介质
CN111880148A (zh) * 2020-08-07 2020-11-03 北京字节跳动网络技术有限公司 声源定位方法、装置、设备和存储介质
CN112946578A (zh) * 2021-02-02 2021-06-11 上海头趣科技有限公司 新型双耳定位方法
CN114384472A (zh) * 2021-10-15 2022-04-22 北京能源集团有限责任公司 一种移动机器人声源定位方法、机器人及可读存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109471145A (zh) * 2018-10-17 2019-03-15 中北大学 一种基于四元声阵列平台的双声定位定姿法
CN109471145B (zh) * 2018-10-17 2022-12-06 中北大学 一种基于四元声阵列平台的双声定位定姿法
CN110082724A (zh) * 2019-05-31 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置及存储介质
CN110082724B (zh) * 2019-05-31 2021-09-21 浙江大华技术股份有限公司 一种声源定位方法、装置及存储介质
CN111880148A (zh) * 2020-08-07 2020-11-03 北京字节跳动网络技术有限公司 声源定位方法、装置、设备和存储介质
CN112946578A (zh) * 2021-02-02 2021-06-11 上海头趣科技有限公司 新型双耳定位方法
CN114384472A (zh) * 2021-10-15 2022-04-22 北京能源集团有限责任公司 一种移动机器人声源定位方法、机器人及可读存储介质
CN114384472B (zh) * 2021-10-15 2022-09-30 北京能源集团有限责任公司 一种移动机器人声源定位方法、机器人及可读存储介质

Similar Documents

Publication Publication Date Title
CN108802690A (zh) 一种基于麦克风阵列的机器人声源定位系统及装置
CN109001682A (zh) 一种基于麦克风阵列的机器人声源定位方法
CN105467364B (zh) 一种定位目标声源的方法和装置
US8155331B2 (en) Sound source tracking system, method and robot
TWI666629B (zh) 從三維度空間性高階保真立體音響聲頻訊號解碼立體聲擴音器訊號之方法及裝置,以及所用解碼矩陣之決定方法
CN205139359U (zh) 一种基于fpga麦克风阵列室内声源定位系统
WO2015039439A1 (zh) 音频信号处理方法及装置、差分波束形成方法及装置
CN109254266A (zh) 基于麦克风阵列的声源定位方法、装置及存储介质
CN109901112B (zh) 基于多通道声获取的声学同时定位与建图方法
WO2019080551A1 (zh) 目标语音检测方法及装置
CN107221336A (zh) 一种增强目标语音的装置及其方法
CN106863320B (zh) 一种用于智能机器人的语音交互数据获取方法及装置
Zhong et al. Active binaural localization of multiple sound sources
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
CN103901400A (zh) 一种基于时延补偿和双耳一致性的双耳声音源定位方法
CN205067729U (zh) 一种实现机器人听觉功能的声源定位处理模块
Cho et al. Sound source localization for robot auditory systems
Murase et al. Multiple moving speaker tracking by microphone array on mobile robot.
Liu et al. A sound source localization method based on microphone array for mobile robot
Lim et al. Probabilistic sound source localization
Diaz-Guerra et al. Direction of arrival estimation with microphone arrays using SRP-PHAT and neural networks
CN111933182B (zh) 声源跟踪方法、装置、设备和存储介质
Peremans et al. Acoustic flow for robot motion control
Ding et al. FRL: Fast and reconfigurable accelerator for distributed sound source localization
WO2020077389A1 (en) "a method and system for determining an orientation of a user"

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181214

RJ01 Rejection of invention patent application after publication