CN102707261A - 一种麦克风阵列声源定位系统 - Google Patents

一种麦克风阵列声源定位系统 Download PDF

Info

Publication number
CN102707261A
CN102707261A CN2012102046570A CN201210204657A CN102707261A CN 102707261 A CN102707261 A CN 102707261A CN 2012102046570 A CN2012102046570 A CN 2012102046570A CN 201210204657 A CN201210204657 A CN 201210204657A CN 102707261 A CN102707261 A CN 102707261A
Authority
CN
China
Prior art keywords
tde
microphone
track
microphone array
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102046570A
Other languages
English (en)
Inventor
苏淳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TAICANG BOTIAN NETWORK TECHNOLOGY CO LTD
Original Assignee
TAICANG BOTIAN NETWORK TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TAICANG BOTIAN NETWORK TECHNOLOGY CO LTD filed Critical TAICANG BOTIAN NETWORK TECHNOLOGY CO LTD
Priority to CN2012102046570A priority Critical patent/CN102707261A/zh
Publication of CN102707261A publication Critical patent/CN102707261A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种麦克风阵列声源定位系统,系统采用基于时延估计的方法来估计声源位置,这类方法分两步进行:第一步是获得麦克风对的TDE,第二步是根据TDE和麦克风的位置获得位置估计。在获取TDE时,提出了利用CZT变换得到低于采样间隔误差的TDE方法,并对TDE结果后处理;在计算位置时,本文提出了一个闭式表达式以减小计算量。

Description

一种麦克风阵列声源定位系统
技术领域
本发明涉及声源的定位,更具体地讲,涉及一种实用的麦克风阵列声源定位系统的具体实现。
背景技术
阵列信号处理已经广泛应用于通信、雷达、声纳、医学和航天航空等诸多领域。近年来,随着反恐战的开展,各国已经研制了各种探测爆炸点或枪炮射击点的位置的设备。在实际应用中,由于视觉定位往往不易实现,从而发展了一些声学定位的系统,例如,美国的回力棒系统、以色列拉斐尔公司的反狙击手声探侧系统,加拿大麦克唐纳·迪特维利公司和加拿大防务研究和发展委员会也共同开发了一种名为“雪貂”(Ferret)的小型武器探测和定位系统。基于麦克风阵列的声源定位广泛应用于具有嘈杂背景的语音通信环境,如,视频会议、多媒体教室、车载电话等,以提高通信质量; 在地震研究、降噪设计、压力容器的无损检测等诸多领域也有着广泛的应用。本专利提供一种实用的麦克风阵列声源定位系统的具体实现。
系统采用基于时延估计的方法来估计声源位置,这类方法分两步进行:第一步是获得麦克风对的TDE,第二步是根据TDE和麦克风的位置获得位置估计。在获取TDE时,提出了利用CZT变换得到低于采样间隔误差的TDE方法,并对TDE结果后处理;在计算位置时,本文提出了一个闭式表达式以减小计算量。
发明内容
本发明的目的在于提供一种使用麦克风阵列对声源定位的方法,该方法能够对声源定位。
为了解决上述技术问题,本发明提供一种实用的麦克风阵列声源定位系统的具体实现,包括如下步骤:
S1: 获得麦克风对的 TDE;
S2: 根据 TDE和麦克风的位置获得位置估计。
进一步,为了保证100%的TDE正确率,其步骤包括:
S201: 对当前帧做VAD判决,如果不是浊音段,计算下一帧;如果是浊音段,并且浊音段已经持续超过5 帧,则取这5帧的谱的平均估计广义互功率谱,作 IFFT(Inverse Fast Fourier Transform)得到广义自相关函数R(t)
S202: 根据麦克风间距计算TDE的取值范围,在取值范围内搜索R(t)的最大值M,并找出所有比M×                                               
Figure 2012102046570100002DEST_PATH_IMAGE002
/2大的极值点的位置;
S203:对当前得到的所有极值点位置作关联,如果某个TDE值不能关联上,则启动一条新的轨迹(每条轨迹是由各帧得到的TDE值连接起来得到的,一条轨迹中的TDE需满足如下条件:两个相邻帧的TDE值相差小于3个采样点)。
S204:整理当前轨迹,如果某条轨迹在连续1s内没有新的关联点,则删去此条轨迹
S205:读取下一帧,回到步骤1
此外,优选的,本发明所提供技术方案中的麦克风阵列全部由全指向麦克风组成或者由全指向麦克风和单指向麦克风组成或者全部由单指向麦克风组成。
具体地,本发明所述的麦克风阵列声源定位系统包括:
麦克风阵列:本发明采用MOLA阵列。
计算声源到一对麦克风之间的时间差:为了克服TDE的精度受音频信号采样间隔限制的特点,文中提出在对信号插值时采用CZT(Chirp Z Transform)变换以取代FFT,从而减小计算量。
获得位置估计:在研究根据TDE获得位置估计时,在分析了声源不同方向上的坐标值对TDE误差的敏感度不同的基础上,利用MOLA(Mutual Ortho-Linear Array)结构,该阵列结构下求解声源位置存在闭式表达式;
提高TDE的估计精度:由于语音信号大于8KHz 的信号可以忽略,因而可以对传感器接收信号先进行抗混叠滤波,然后对滤波后的信号进行插值,这就相当于提高接收信号的采样率,因而可以获得低于采样间隔的TDE精度。
TDE的正确率:目前的 TDE 算法都不能保证100%的正确率,针对这种情况,论文中考虑利用数据关联的办法平滑TDE值。
计算量:由于对信号本身插值会带来计算量增加,因而本发明采用基于CZT的插值算法。
其中,TDE的正确率,具体步骤如下:
1)对当前帧做 VAD 判决,如果不是浊音段,计算下一帧;如果是浊音段,并且浊音段已经持续超过5帧,则取这5帧的谱的平均估计广义互功率谱,作IFFT(Inverse Fast Fourier Transform)得到广义自相关函数R(t);
2)根据麦克风间距计算 TDE 的取值范围,在取值范围内搜索R(t)的最大值 M,并找出所有比M×/ 2大的极值点的位置;
3)对当前得到的所有极值点位置作关联,如果某个TDE值不能关联上,则启动一条新的轨迹(每条轨迹是由各帧得到的TDE值连接起来得到的,一条轨迹中的TDE需满足如下条件:两个相邻帧的TDE值相差小于 3 个采样点);
4)整理当前轨迹,如果某条轨迹在连续1s内没有新的关联点,则删去此条轨迹;
5)读取下一帧,回到步骤1)。
其中,硬件部分包括麦克风阵列、前端放大电路和 USB 数据采集卡。麦克风将声音信号转换为电信号,前端放大电路将微弱电信号放大,再通过数据采集卡采集到主机。
其中,系统的软件部分包括TDE估计和利用TDE估计声源位置两个部分,TDE估计采用第一部分所述的基于帧间平均和第二峰值判断的PHAT-GCC算法;
其中,对位置进行估计,具体内容如下:
假设共有M个麦克风对,则可以获得M个TDE估计值,理想的情况下各个 TDE 值确定的曲面应该相交于一点,然而由于误差的存在,只能够找出与观测数据(估计的M个TDE)最佳匹配(符合某一准则)的声源位置。令
Figure 2012102046570100002DEST_PATH_IMAGE004
那么一般采用如下的加权最下二乘方法(WLS:Weighted Linear Square)来估计声源位置:
Figure 2012102046570100002DEST_PATH_IMAGE006
通过分析TDE值与声源位置之间的关系,可以得到声源位置对于TDE的敏感性结论。本文提出如图 4 所示新的阵列结构。在本阵列中,利用mic0-1-2组成的x向线阵列估计x;利用mic0-3-4估计y;利用mic0-5-6估计z。由于三个线阵列互相正交,命名为MOLA。
为了避免上式中全局搜索带来的计算量,对上式中的进行一阶Taylor展开,最终可以得到如下形式的WLS算法:
Figure 2012102046570100002DEST_PATH_IMAGE010
对上式求导,可以得到关于位置x的闭式表达式:
本发明所述的方法,还包括:
声源位置估计:估计声源位置可以采用上式的闭式表达式,从而整个系统计算量较小,可以保证实时性。
附图说明
图1麦克风阵列系统总体框图。
图2是利用CZT实现TDE插值的框图。
图3 MOLA结构。
图4系统性能示意图。
具体实施方式  
图1是麦克风阵列系统总体框图。整个系统分软件和硬件两个部分,系统的硬件部分包括麦克风阵列、前端放大电路和USB数据采集卡。麦克风将声音信号转换为电信号,前端放大电路将微弱电信号放大,再通过数据采集卡采集到主机。统的软件部分包括TDE估计和利用TDE估计声源位置两个部分,TDE估计采用第一部分所述的基于帧间平均和第二峰值判断的PHAT-GCC算法;由于硬件部分的麦克风阵列采用的是第二部分所提出的MOLA结构,所以估计声源位置可以采用闭式表达式,从而整个系统计算量较小,可以保证实时性。
图2是利用CZT实现TDE插值的框图。由于对信号本身插值会带来计算量增加,因而本文又提出基于CZT的插值算法。
图3是MOLA结构。在本阵列中,利用mic0-1-2组成的x向线阵列估计x;利用mic0-3-4估计y;利用mic0-5-6估计z。
图4系统性能示意图。实验采用image model所产生数据,数据长度40s,加色噪声,SNR=10dB;房间反射系数为0.6,数据采样率为32KHz。阵列采用图3所示结构,线阵列的阵元间距是40cm,说话人位置为(40cm,40cm),该系统可以用于声源定位,并获得较好的定位结果。

Claims (3)

1. 一种麦克风阵列声源定位系统,包括如下模块:
S1: 获得麦克风对的 TDE;
S2: 根据 TDE和麦克风的位置获得位置估计。
2. 根据权利要求1所述的麦克风阵列声源定位系统,其特征在于所述的获得麦克风对的 TDE的步骤包括:
S201: 对当前帧做VAD判决,如果不是浊音段,计算下一帧;如果是浊音段,并且浊音段已经持续超过5 帧,则取这5帧的谱的平均估计广义互功率谱,作 IFFT得到广义自相关函数R(t);
S202: 根据麦克风间距计算TDE的取值范围,在取值范围内搜索R(t)的最大值M,并找出所有比M×                                               
Figure 2012102046570100001DEST_PATH_IMAGE002
/2大的极值点的位置;
S203:对当前得到的所有极值点位置作关联,如果某个TDE值不能关联上,则启动一条新的轨迹,每条轨迹是由各帧得到的TDE值连接起来得到的,一条轨迹中的TDE需满足如下条件:两个相邻帧的TDE值相差小于3个采样点;
S204:整理当前轨迹,如果某条轨迹在连续1s内没有新的关联点,则删去此条轨迹;
S205:读取下一帧,回到步骤S201。
3. 根据权利要求1所述的麦克风阵列声源定位系统,其特征在于麦克风阵列全部由全指向麦克风组成或者由全指向麦克风和单指向麦克风组成,或者全部由单指向麦克风组成。
CN2012102046570A 2012-06-20 2012-06-20 一种麦克风阵列声源定位系统 Pending CN102707261A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102046570A CN102707261A (zh) 2012-06-20 2012-06-20 一种麦克风阵列声源定位系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102046570A CN102707261A (zh) 2012-06-20 2012-06-20 一种麦克风阵列声源定位系统

Publications (1)

Publication Number Publication Date
CN102707261A true CN102707261A (zh) 2012-10-03

Family

ID=46900191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102046570A Pending CN102707261A (zh) 2012-06-20 2012-06-20 一种麦克风阵列声源定位系统

Country Status (1)

Country Link
CN (1) CN102707261A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9693164B1 (en) 2016-08-05 2017-06-27 Sonos, Inc. Determining direction of networked microphone device relative to audio playback device
CN107507625A (zh) * 2016-06-14 2017-12-22 讯飞智元信息科技有限公司 声源距离确定方法及装置
CN108073381A (zh) * 2016-11-15 2018-05-25 腾讯科技(深圳)有限公司 一种对象控制方法、装置及终端设备
CN115166632A (zh) * 2022-06-20 2022-10-11 青岛海尔科技有限公司 声源朝向的确定方法和装置、存储介质及电子装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050008169A1 (en) * 2003-05-08 2005-01-13 Tandberg Telecom As Arrangement and method for audio source tracking
CN1952684A (zh) * 2005-10-20 2007-04-25 松下电器产业株式会社 利用麦克风定位声源的方法和装置
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050008169A1 (en) * 2003-05-08 2005-01-13 Tandberg Telecom As Arrangement and method for audio source tracking
CN1952684A (zh) * 2005-10-20 2007-04-25 松下电器产业株式会社 利用麦克风定位声源的方法和装置
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张成锁 等: "一个实用的麦克风阵列声源定位系统", 《第九届全国人机语音通讯学术会议论文集,2007年》, 31 December 2007 (2007-12-31) *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107507625A (zh) * 2016-06-14 2017-12-22 讯飞智元信息科技有限公司 声源距离确定方法及装置
US9693164B1 (en) 2016-08-05 2017-06-27 Sonos, Inc. Determining direction of networked microphone device relative to audio playback device
CN108073381A (zh) * 2016-11-15 2018-05-25 腾讯科技(深圳)有限公司 一种对象控制方法、装置及终端设备
CN115166632A (zh) * 2022-06-20 2022-10-11 青岛海尔科技有限公司 声源朝向的确定方法和装置、存储介质及电子装置
WO2023246224A1 (zh) * 2022-06-20 2023-12-28 青岛海尔科技有限公司 声源朝向的确定方法和装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN102707262A (zh) 一种基于麦克风阵列的声源定位系统
JP4815661B2 (ja) 信号処理装置及び信号処理方法
CN109669159A (zh) 基于麦克风十字环阵列的声源定位跟踪装置及方法
CN103176166B (zh) 一种用于水声被动定位的信号到达时延差跟踪算法
CN104991573A (zh) 一种基于声源阵列的定位跟踪方法及其装置
KR100877914B1 (ko) 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법
CN103278801A (zh) 一种变电站噪声成像侦测装置及侦测计算方法
CN103308889A (zh) 复杂环境下被动声源二维doa估计方法
CN103165137B (zh) 一种非平稳噪声环境下传声器阵列的语音增强方法
Brutti et al. Comparison between different sound source localization techniques based on a real data collection
CN102147458B (zh) 一种针对宽带声源的波达方向估计方法及其装置
CN101893698B (zh) 噪声源测试分析方法及其装置
CN102707261A (zh) 一种麦克风阵列声源定位系统
Pertilä et al. Passive self-localization of microphones using ambient sounds
CN104898086A (zh) 适用于微型麦克风阵列的声强估计声源定向方法
CN109188362A (zh) 一种麦克风阵列声源定位信号处理方法
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
CN109212481A (zh) 一种利用麦克风阵列进行声源定位的方法
CN105158734A (zh) 一种基于阵不变量的单矢量水听器被动定位方法
JPWO2017216999A1 (ja) 波源方向推定装置、波源方向推定システム、波源方向推定方法および波源方向推定プログラム
Hayashida et al. Close/distant talker discrimination based on kurtosis of linear prediction residual signals
JPWO2018003158A1 (ja) 相関関数生成装置、相関関数生成方法、相関関数生成プログラムおよび波源方向推定装置
WO2013132216A1 (en) Method and apparatus for determining the number of sound sources in a targeted space
CN105676167B (zh) 一种基于声学矢量传感器和双谱变换的鲁棒单语者声源doa估计方法
CN204795569U (zh) 一种便携式双传声器声源识别与定位装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121003