CN103308889A - 复杂环境下被动声源二维doa估计方法 - Google Patents
复杂环境下被动声源二维doa估计方法 Download PDFInfo
- Publication number
- CN103308889A CN103308889A CN2013101740013A CN201310174001A CN103308889A CN 103308889 A CN103308889 A CN 103308889A CN 2013101740013 A CN2013101740013 A CN 2013101740013A CN 201310174001 A CN201310174001 A CN 201310174001A CN 103308889 A CN103308889 A CN 103308889A
- Authority
- CN
- China
- Prior art keywords
- microphone
- sound source
- voice signal
- vector
- uniform circular
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
一种复杂环境下被动声源二维DOA估计方法,其步骤是:(1)用均匀圆阵采集房间中的语音信号;(2)用谱减法对均匀圆阵麦克风阵列接收到的语音信号进行预处理;(3)采用M_AEDA算法估计每个麦克风的相对时延;(4)根据方向系数公式确定方向系数向量;(5)方向系数向量与第二步预处理后的语音信号对应相乘作为最小方差无失真响应的输入信号;(6)采用最小方差无失真响应算法对输入信号进行处理;(7)通过对输出平均功率进行谱峰搜索,得到声源二维DOA的估计值。优点是:在混响和低信噪比环境下能准确对声源进行定位;在做声源定位时,定位准确度和准确率高;要求的设备简单,可以应用于视频会议,机器人等现实生活中。
Description
技术领域
本发明涉及一种复杂环境下被动声源二维DOA估计方法。
背景技术
波达方向DOA(Direction-of-arrival)作为阵列处理技术研究的重要部分,在视频会议、机器人导航、声控等语音处理领域起着越来越重要的作用,其主要目的是利用麦克风阵列对空间信号源位置进行估计。如在多媒体会议系统中,需要根据估计出的声源空间信息调节摄像头的位置,实现自动录像功能;在语音通话系统还可根据声源方向去除其他方向的噪音,使得通话更清晰。
麦克风阵列声源定位技术大体可分为三类:波束形成类方法、子空间类方法(又称方向估计或空间超(高)分辨谱估计)和时延估计类方法。波束形成声源定位算法需要噪声和声源的先验知识,计算量较大;以MUSIC、ESPRIT的算法都属于基于子空间类方法,该类算法复杂度低,在混响较小(T60≤100ms)且存在噪声的情况下能完成声源定位且定位精度高,但不适合中度混响以上的情况;时延估计方法大都适合理想环境。
现有技术中,针对混响和有色噪声、混响和空间噪声能够得到较准确的时延估计,但若想得到声源空间信息,还需要在最小二乘法则等算法和麦克风阵列结构的条件下做较为复杂的运算;对于准确的声源空间信息还可以通过群延时MUSIC方法得到,但它只考虑了噪声没有考虑到混响的情况,而混响的存在又严重影响系统的定位性能,因此在混响和低信噪比环境下完成对声源的定位成为亟待解决的问题。
发明内容
本发明要解决的技术问题是提供一种复杂环境下被动声源二维DOA估计方法,通过使用该方法,在混响和低信噪比环境下仍能准确对声源进行定位。
本发明的技术解决方案是:
一种复杂环境下被动声源二维DOA估计方法,包括以下步骤:
(1)用均匀圆阵采集房间中的语音信号
建立均匀圆阵结构,使M个麦克风阵元均匀分布在一个圆周上,令麦克风阵元之间的距离为语音信号最小波长 的一半,则均匀圆阵的半径R为:
;
(2)用谱减法对均匀圆阵麦克风阵列接收到的语音信号进行预处理
(4)根据方向系数公式确定方向系数向量
则麦克风阵列的方向系数向量A0为:
(5)方向系数向量与第二步预处理后的语音信号对应相乘作为最小方差无失真响应的输入信号
(6)采用最小方差无失真响应算法对输入信号进行处理
最小方差无失真响应波束形成器的数学表达式为:
;
(7)通过对输出平均功率进行谱峰搜索,得到声源二维DOA的估计值
通过对输出平均功率谱峰进行搜索,谱峰所对应的角度值即为方位角和俯仰角:
本发明的有益效果
(1)算法中阵列接收语音信号及其方向向量均是基于均匀圆阵拓扑结构;选用均匀圆阵(UCA)建立声学模型,均匀圆阵能够同时确定方位角、俯仰角信息,且方位角信息具有360°全方位、无模糊、不易出现栅瓣,适合复杂环境,在混响和低信噪比环境下仍能准确对声源进行定位;
(2)在做声源定位时,定位准确度和准确率高,适合多个声源情况,也适合存在邻近声源的情况;
(3)要求的设备简单,只需少量的全向麦克风,实现方便价格低廉;可以应用于视频会议,机器人等现实生活中。
附图说明
图1是本发明的DOA估计算法原理图;
图2是本发明建立的均匀圆阵示意图;
图3是本发明在仿真环境中的估计结果。
具体实施方式
(1)用均匀圆阵采集房间中的语音信号
(2)用谱减法对均匀圆阵麦克风阵列接收到的语音信号进行预处理
对于一个分析帧内的短时平稳语音信号有:
(3)采用M_AEDA算法估计每个麦克风的相对时延
约束LMS算法求解为:
则
(4)根据方向系数公式确定方向系数向量
则麦克风阵列的方向系数向量A0为:
(5)方向系数向量与第二步预处理后的语音信号对应相乘作为最小方差无失真响应的输入信号
最小方差无失真响应(MVDR)的输入信号y(n)为:
y(n)=A0× x (n) (13)
其中, x (n)=[x 1(n), x 2(n), ...,x M (n)];
(6)采用最小方差无失真响应算法对输入信号进行处理
最小方差无失真响应波束形成器的数学表达式为:
(15)
构造代价函数:
应用Lagrange乘子法计算
最小方差无失真响应波束形成的权向量为:
(7)通过对输出平均功率进行谱峰搜索估计出声源的二维DOA信息
通过(20)式对进行谱峰搜索,谱峰所对应的角度值即为方位角和俯仰角,即
其中,为期望方向的DOA信息;
(8)复杂环境下被动声源二维DOA估计方法的仿真环境及运行仿真结果
Claims (1)
1.一种复杂环境下被动声源二维DOA估计方法,其特征在于:
包括以下步骤:
(1)用均匀圆阵采集房间中的语音信号
;
在封闭环境下第个麦克风接收到的语音信号的声学模型为:
;
;
(2)用谱减法对均匀圆阵麦克风阵列接收到的语音信号进行预处理
定义误差为:
(4)根据方向系数公式确定方向系数向量
则麦克风阵列的方向系数向量A0为:
(5)方向系数向量与第二步预处理后的语音信号对应相乘作为最小方差无失真响应的输入信号
(6)采用最小方差无失真响应算法对输入信号进行处理
最小方差无失真响应波束形成器的数学表达式为:
(7)通过对输出平均功率进行谱峰搜索,得到声源二维DOA的估计值
通过对输出平均功率谱峰进行搜索,谱峰所对应的角度值即为方位角和俯仰角:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310174001.3A CN103308889B (zh) | 2013-05-13 | 2013-05-13 | 复杂环境下被动声源二维doa估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310174001.3A CN103308889B (zh) | 2013-05-13 | 2013-05-13 | 复杂环境下被动声源二维doa估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103308889A true CN103308889A (zh) | 2013-09-18 |
CN103308889B CN103308889B (zh) | 2014-07-02 |
Family
ID=49134314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310174001.3A Expired - Fee Related CN103308889B (zh) | 2013-05-13 | 2013-05-13 | 复杂环境下被动声源二维doa估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103308889B (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103760520A (zh) * | 2013-12-25 | 2014-04-30 | 北京大学深圳研究生院 | 一种基于avs和稀疏表示的单语者声源doa估计方法 |
CN103792528A (zh) * | 2014-02-11 | 2014-05-14 | 哈尔滨工程大学 | 一种基于对角减载的水声阵列Bartlett波束形成的方法 |
CN105204001A (zh) * | 2015-10-12 | 2015-12-30 | Tcl集团股份有限公司 | 一种声源定位的方法及系统 |
CN105244036A (zh) * | 2014-06-27 | 2016-01-13 | 中兴通讯股份有限公司 | 一种麦克风语音增强方法及装置 |
WO2016074495A1 (zh) * | 2014-11-14 | 2016-05-19 | 中兴通讯股份有限公司 | 信号处理的方法及装置 |
WO2017000775A1 (zh) * | 2015-06-30 | 2017-01-05 | 芋头科技(杭州)有限公司 | 一种机器人语音寻向转动系统及方法 |
CN106405499A (zh) * | 2016-09-08 | 2017-02-15 | 南京阿凡达机器人科技有限公司 | 一种机器人定位声源的方法 |
CN106526563A (zh) * | 2016-10-28 | 2017-03-22 | 西北工业大学 | 一种基于互相关虚拟阵的五元体积阵多目标方位估计方法 |
CN106970356A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种复杂环境下声源定位跟踪方法 |
CN108320739A (zh) * | 2017-12-22 | 2018-07-24 | 景晖 | 根据位置信息辅助语音指令识别方法和装置 |
CN108540898A (zh) * | 2017-03-03 | 2018-09-14 | 松下电器(美国)知识产权公司 | 声源探测装置及方法、记录有声源探测程序的记录介质 |
CN109791193A (zh) * | 2016-09-29 | 2019-05-21 | 杜比实验室特许公司 | 环绕声系统中扬声器位置的自动发现和定位 |
US10343287B2 (en) | 2015-06-30 | 2019-07-09 | Yutou Technology (Hangzhou) Co., Ltd. | Robot voice direction-seeking turning system and method |
CN110082724A (zh) * | 2019-05-31 | 2019-08-02 | 浙江大华技术股份有限公司 | 一种声源定位方法、装置及存储介质 |
CN110261816A (zh) * | 2019-07-10 | 2019-09-20 | 苏州思必驰信息科技有限公司 | 语音波达方向估计方法及装置 |
CN110726972A (zh) * | 2019-10-21 | 2020-01-24 | 南京南大电子智慧型服务机器人研究院有限公司 | 干扰及高混响环境下使用传声器阵列的语音声源定位方法 |
CN111596262A (zh) * | 2020-05-07 | 2020-08-28 | 武汉大学 | 矢量水听器及基于该矢量水听器的多目标方位估计方法 |
CN111880146A (zh) * | 2020-06-30 | 2020-11-03 | 海尔优家智能科技(北京)有限公司 | 声源定向方法和装置及存储介质 |
CN112462323A (zh) * | 2020-11-24 | 2021-03-09 | 嘉楠明芯(北京)科技有限公司 | 一种信号定向方法、装置及计算机可读存储介质 |
CN113050035A (zh) * | 2021-03-12 | 2021-06-29 | 云知声智能科技股份有限公司 | 一种二维定向拾音方法及装置 |
CN113640805A (zh) * | 2021-07-16 | 2021-11-12 | 中国科学院声学研究所 | 一种用于野外鸟类声像全方位自动监测跟踪装置与跟踪方法 |
CN113782047A (zh) * | 2021-09-06 | 2021-12-10 | 云知声智能科技股份有限公司 | 语音分离方法、装置、设备和存储介质 |
CN114598983A (zh) * | 2022-01-24 | 2022-06-07 | 北京航空航天大学 | 一种民机增升装置噪声麦克风阵列测试方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003156552A (ja) * | 2001-08-31 | 2003-05-30 | Hitachi Hybrid Network Co Ltd | 音源・電磁波源方向探索方法,音源・電磁波源位置探索方法ならびに特定音源・電磁波源認識方法 |
JP2009216473A (ja) * | 2008-03-07 | 2009-09-24 | Univ Nihon | 音源距離計測装置及びそれを用いた音響情報分離装置 |
CN101351058B (zh) * | 2008-09-09 | 2012-01-04 | 西安交通大学 | 一种麦克风阵列及实现语音信号增强的方法 |
CN102831898A (zh) * | 2012-08-31 | 2012-12-19 | 厦门大学 | 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法 |
CN102855409A (zh) * | 2012-09-20 | 2013-01-02 | 辽宁工业大学 | 近场径向干扰源抑制算法及其球麦克风阵列语音采集装置 |
CN102866385A (zh) * | 2012-09-10 | 2013-01-09 | 上海大学 | 一种基于球麦克风阵列的多声源定位方法 |
EP2565667A1 (en) * | 2011-08-31 | 2013-03-06 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Direction of arrival estimation using watermarked audio signals and microphone arrays |
-
2013
- 2013-05-13 CN CN201310174001.3A patent/CN103308889B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003156552A (ja) * | 2001-08-31 | 2003-05-30 | Hitachi Hybrid Network Co Ltd | 音源・電磁波源方向探索方法,音源・電磁波源位置探索方法ならびに特定音源・電磁波源認識方法 |
JP2009216473A (ja) * | 2008-03-07 | 2009-09-24 | Univ Nihon | 音源距離計測装置及びそれを用いた音響情報分離装置 |
CN101351058B (zh) * | 2008-09-09 | 2012-01-04 | 西安交通大学 | 一种麦克风阵列及实现语音信号增强的方法 |
EP2565667A1 (en) * | 2011-08-31 | 2013-03-06 | Friedrich-Alexander-Universität Erlangen-Nürnberg | Direction of arrival estimation using watermarked audio signals and microphone arrays |
CN102831898A (zh) * | 2012-08-31 | 2012-12-19 | 厦门大学 | 带声源方向跟踪功能的麦克风阵列语音增强装置及其方法 |
CN102866385A (zh) * | 2012-09-10 | 2013-01-09 | 上海大学 | 一种基于球麦克风阵列的多声源定位方法 |
CN102855409A (zh) * | 2012-09-20 | 2013-01-02 | 辽宁工业大学 | 近场径向干扰源抑制算法及其球麦克风阵列语音采集装置 |
Non-Patent Citations (1)
Title |
---|
王冬霞: "《联合波束形成与谱减法的麦克风阵列语音增强算法》", 《大连理工大学学报》 * |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103760520B (zh) * | 2013-12-25 | 2016-05-18 | 北京大学深圳研究生院 | 一种基于avs和稀疏表示的单语者声源doa估计方法 |
CN103760520A (zh) * | 2013-12-25 | 2014-04-30 | 北京大学深圳研究生院 | 一种基于avs和稀疏表示的单语者声源doa估计方法 |
CN103792528A (zh) * | 2014-02-11 | 2014-05-14 | 哈尔滨工程大学 | 一种基于对角减载的水声阵列Bartlett波束形成的方法 |
CN103792528B (zh) * | 2014-02-11 | 2016-05-04 | 哈尔滨工程大学 | 一种基于对角减载的水声阵列Bartlett波束形成的方法 |
CN105244036A (zh) * | 2014-06-27 | 2016-01-13 | 中兴通讯股份有限公司 | 一种麦克风语音增强方法及装置 |
WO2016074495A1 (zh) * | 2014-11-14 | 2016-05-19 | 中兴通讯股份有限公司 | 信号处理的方法及装置 |
US10181330B2 (en) | 2014-11-14 | 2019-01-15 | Xi'an Zhongxing New Software Co., Ltd. | Signal processing method and device |
WO2017000775A1 (zh) * | 2015-06-30 | 2017-01-05 | 芋头科技(杭州)有限公司 | 一种机器人语音寻向转动系统及方法 |
US10343287B2 (en) | 2015-06-30 | 2019-07-09 | Yutou Technology (Hangzhou) Co., Ltd. | Robot voice direction-seeking turning system and method |
CN105204001A (zh) * | 2015-10-12 | 2015-12-30 | Tcl集团股份有限公司 | 一种声源定位的方法及系统 |
CN106970356A (zh) * | 2016-01-14 | 2017-07-21 | 芋头科技(杭州)有限公司 | 一种复杂环境下声源定位跟踪方法 |
CN106405499A (zh) * | 2016-09-08 | 2017-02-15 | 南京阿凡达机器人科技有限公司 | 一种机器人定位声源的方法 |
WO2018045973A1 (zh) * | 2016-09-08 | 2018-03-15 | 南京阿凡达机器人科技有限公司 | 一种机器人定位声源的方法及系统 |
CN109791193A (zh) * | 2016-09-29 | 2019-05-21 | 杜比实验室特许公司 | 环绕声系统中扬声器位置的自动发现和定位 |
CN109791193B (zh) * | 2016-09-29 | 2023-11-10 | 杜比实验室特许公司 | 环绕声系统中扬声器位置的自动发现和定位 |
CN106526563A (zh) * | 2016-10-28 | 2017-03-22 | 西北工业大学 | 一种基于互相关虚拟阵的五元体积阵多目标方位估计方法 |
CN106526563B (zh) * | 2016-10-28 | 2019-01-04 | 西北工业大学 | 一种基于互相关虚拟阵的五元体积阵多目标方位估计方法 |
CN108540898B (zh) * | 2017-03-03 | 2020-11-24 | 松下电器(美国)知识产权公司 | 声源探测装置及方法、记录有声源探测程序的记录介质 |
CN108540898A (zh) * | 2017-03-03 | 2018-09-14 | 松下电器(美国)知识产权公司 | 声源探测装置及方法、记录有声源探测程序的记录介质 |
CN108320739B (zh) * | 2017-12-22 | 2022-03-01 | 景晖 | 根据位置信息辅助语音指令识别方法和装置 |
CN108320739A (zh) * | 2017-12-22 | 2018-07-24 | 景晖 | 根据位置信息辅助语音指令识别方法和装置 |
CN110082724A (zh) * | 2019-05-31 | 2019-08-02 | 浙江大华技术股份有限公司 | 一种声源定位方法、装置及存储介质 |
CN110261816A (zh) * | 2019-07-10 | 2019-09-20 | 苏州思必驰信息科技有限公司 | 语音波达方向估计方法及装置 |
CN110726972A (zh) * | 2019-10-21 | 2020-01-24 | 南京南大电子智慧型服务机器人研究院有限公司 | 干扰及高混响环境下使用传声器阵列的语音声源定位方法 |
CN111596262A (zh) * | 2020-05-07 | 2020-08-28 | 武汉大学 | 矢量水听器及基于该矢量水听器的多目标方位估计方法 |
CN111596262B (zh) * | 2020-05-07 | 2023-03-10 | 武汉敏声新技术有限公司 | 矢量水听器及基于该矢量水听器的多目标方位估计方法 |
CN111880146A (zh) * | 2020-06-30 | 2020-11-03 | 海尔优家智能科技(北京)有限公司 | 声源定向方法和装置及存储介质 |
CN111880146B (zh) * | 2020-06-30 | 2023-08-18 | 海尔优家智能科技(北京)有限公司 | 声源定向方法和装置及存储介质 |
CN112462323A (zh) * | 2020-11-24 | 2021-03-09 | 嘉楠明芯(北京)科技有限公司 | 一种信号定向方法、装置及计算机可读存储介质 |
CN113050035B (zh) * | 2021-03-12 | 2022-11-25 | 云知声智能科技股份有限公司 | 一种二维定向拾音方法及装置 |
CN113050035A (zh) * | 2021-03-12 | 2021-06-29 | 云知声智能科技股份有限公司 | 一种二维定向拾音方法及装置 |
CN113640805A (zh) * | 2021-07-16 | 2021-11-12 | 中国科学院声学研究所 | 一种用于野外鸟类声像全方位自动监测跟踪装置与跟踪方法 |
CN113782047A (zh) * | 2021-09-06 | 2021-12-10 | 云知声智能科技股份有限公司 | 语音分离方法、装置、设备和存储介质 |
CN113782047B (zh) * | 2021-09-06 | 2024-03-08 | 云知声智能科技股份有限公司 | 语音分离方法、装置、设备和存储介质 |
CN114598983A (zh) * | 2022-01-24 | 2022-06-07 | 北京航空航天大学 | 一种民机增升装置噪声麦克风阵列测试方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103308889B (zh) | 2014-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103308889B (zh) | 复杂环境下被动声源二维doa估计方法 | |
CN104076331B (zh) | 一种七元麦克风阵列的声源定位方法 | |
CN111123192B (zh) | 一种基于圆形阵列和虚拟扩展的二维doa定位方法 | |
US9291697B2 (en) | Systems, methods, and apparatus for spatially directive filtering | |
CN102147458B (zh) | 一种针对宽带声源的波达方向估计方法及其装置 | |
CN105301563B (zh) | 一种基于一致聚焦变换最小二乘法的双声源定位方法 | |
CN110534126B (zh) | 一种基于固定波束形成的声源定位和语音增强方法及系统 | |
Salvati et al. | Acoustic source localization from multirotor UAVs | |
CN105204001A (zh) | 一种声源定位的方法及系统 | |
Sun et al. | Joint DOA and TDOA estimation for 3D localization of reflective surfaces using eigenbeam MVDR and spherical microphone arrays | |
CN109188362B (zh) | 一种麦克风阵列声源定位信号处理方法 | |
CN110931036A (zh) | 一种麦克风阵列波束形成方法 | |
CN103278801A (zh) | 一种变电站噪声成像侦测装置及侦测计算方法 | |
JP2018063200A (ja) | 音源位置推定装置、音源位置推定方法、及びプログラム | |
CN108549052A (zh) | 一种时频-空域联合加权的圆谐域伪声强声源定位方法 | |
CN105223551A (zh) | 一种可穿戴的声源定位跟踪系统及方法 | |
CN107167770A (zh) | 一种混响条件下的麦克风阵列声源定位装置 | |
CN111798869A (zh) | 一种基于双麦克风阵列的声源定位方法 | |
Imran et al. | A methodology for sound source localization and tracking: Development of 3D microphone array for near-field and far-field applications | |
Cobos et al. | Wireless acoustic sensor networks and applications | |
Hosseini et al. | Time difference of arrival estimation of sound source using cross correlation and modified maximum likelihood weighting function | |
Calmes et al. | Azimuthal sound localization using coincidence of timing across frequency on a robotic platform | |
Jing et al. | Acoustic source tracking based on adaptive distributed particle filter in distributed microphone networks | |
CN112666521B (zh) | 一种基于改进的自适应陷波器的室内声源定位方法 | |
Chen et al. | A sound source localization device based on rectangular pyramid structure for mobile robot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140702 Termination date: 20150513 |
|
EXPY | Termination of patent right or utility model |