CN101982793A - 一种基于立体声信号的移动音源定位方法 - Google Patents
一种基于立体声信号的移动音源定位方法 Download PDFInfo
- Publication number
- CN101982793A CN101982793A CN 201010514924 CN201010514924A CN101982793A CN 101982793 A CN101982793 A CN 101982793A CN 201010514924 CN201010514924 CN 201010514924 CN 201010514924 A CN201010514924 A CN 201010514924A CN 101982793 A CN101982793 A CN 101982793A
- Authority
- CN
- China
- Prior art keywords
- itd
- ild
- probability distribution
- sound source
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000011159 matrix material Substances 0.000 claims abstract description 52
- 238000005259 measurement Methods 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims abstract description 15
- 230000000694 effects Effects 0.000 claims abstract description 9
- 238000012937 correction Methods 0.000 claims description 9
- 230000004807 localization Effects 0.000 claims description 7
- 230000005012 migration Effects 0.000 claims description 5
- 238000013508 migration Methods 0.000 claims description 5
- 238000000605 extraction Methods 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 abstract 1
- 210000005069 ears Anatomy 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000005309 stochastic process Methods 0.000 description 2
- 240000006409 Acacia auriculiformis Species 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明为一种基于立体声信号的移动音源定位方法,包括对立体声检测器两路时域信号进行预处理得到两路频域信号;利用两路频域信号计算各个频带的ITD和ILD测量;在各个音源位置对ITD和ILD测量分别进行学习,得到ITD频率对位置学习矩阵和ILD频率对位置学习矩阵;将所测得的ITD和ILD测量与所学习的矩阵分别进行比较,将得到的ITD和ILD概率分布矩阵进行组合,获得用于音源定位的联合概率分布;基于多普勒效应对用于音源定位的联合概率分布进行修正;应用信息论过程来提取音源位置的最佳预测。本发明针对移动音源所独有的多普勒效应对基于ITD和ILD的音源方位联合估计方法做出改进,可有效提升音源定位准确率。
Description
技术领域
本发明属于声学技术领域,特别是涉及一种基于立体声信号的移动音源定位方法。
背景技术
听觉研究表明,在神经中枢对输入声信息进行整合时,对音源定位最重要的依据是两耳之间声音信号的差别,通常用空间线索ITD(耳间时间差)和ILD(耳间声级差)两个概念来描述这种差别。
从音源到达双耳的音源信号由于声波传输路程存在差异,从而产生到达双耳的时间偏移称为ITD(耳间时间差),其提供了有关音源方位角位置信息。此外,诸如人头、躯干和耳廓的衍射、折射及共振效应等使得到达两检测器接收信号强度存在差异,称为ILD(耳间声级差),ILD随着音源位置而系统变化,同样提供了音源方位角位置信息。
ITD和ILD以互补的方式工作,具体来说,对频率小于1.5kHz的低频信号ITD对定位起主要作用,而当频率大于1.5kHz时ILD对定位起主要作用。ILD对高频信号起主要作用是因为高频信号的衰减特性,在声源信号传至双耳的路径中,除了空气的吸收外,人的头部就相当于一个障碍物,高频信号将因此被衰减。当频率低于约1.5kHz时,声波波长大于人的头部宽度,声波将产生所谓的“头部衍射”而沿着头部表面弯曲,从而绕过了这一遮挡物,使得声音信号传到左耳的强度比右耳没有衰减或衰减很小,因此空间线索ILD的定位作用就很不明显了;ITD是基于频率特性而产生两耳信号时间上的差异,由于听觉系统所感知的其实是耳间的相位差IPD(Interaural Phase Differences),所以ITD实际上通过IPD起作用,当信号频率小于1.5kHz时,由于其半波长大于两耳间的距离,所以人耳很容易感知这种相位差并判别其相对关系,而当频率大于1.5kHz时,其波长小于两耳间距,此时将会产生IPD判决模糊,人耳无法辨别信号相位从而导致ITD没有明显定位作用。
基于ITD和ILD音源定位互补特性,目前国际上通常基于ITD和ILD对音源方位进行联合估计,即基于音源位置、ITD和ILD间的相关先验知识,通过联合学习方法以实现音源方位定位,但这种方法只适用于静止音源,对于移动音源,当其以较快速度移动时由于多普勒效应的存在会使音源的接受频率发生变化,而ILD与频率紧密相关,一旦音源频率发声变化,原先的先验知识便不再适用,从而使对音源方位的估计产生偏差。因此目前本领域一个比较重要的问题是:如何针对移动音源设计相应的ITD和ILD联合音源定位修正方法,消除由于多普勒效应所带来的定位偏差问题。
发明内容
考虑到上述现有技术的已知解决方案的缺陷,本发明的目的是提供一种根据立体声信号进行移动音源定位的改进技术。
为实现上述目的,本发明的技术方案为一种基于立体声信号的移动音源定位方法,基于ITD测量和ILD测量实现移动音源定位,所述ITD测量和ILD测量获取方式为,对立体声检测器所生成的两路时域信号进行预处理,分别得到两路频域信号,利用两路频域信号分别计算各个频带的ITD测量和ILD测量;预先在各个已知的音源位置对ITD测量和ILD测量分别进行学习,得到ITD频率对位置矩阵和ILD频率对位置矩阵;在对特定时间步中的移动音源进行音源位置定位时,进行以下步骤,
步骤1,获取某特定时间步的ITD测量和ILD测量;
步骤2,将步骤1所得特定时间步的ITD测量和ITD频率对位置矩阵进行比较,将步骤1所得特定时间步的ILD测量与ILD频率对位置矩阵分别进行比较,从而针对各个频带获得音源位置的概率分布,分别构成ITD概率分布矩阵和ILD概率分布矩阵;
步骤3,将步骤2所得ITD概率分布矩阵和ILD概率分布矩阵进行组合,获得用于在该特定时间步进行音源位置定位的联合概率分布;
步骤4,基于多普勒效应对步骤3所得的联合概率分布进行修正,获得修正结果;
步骤5,应用信息论过程,根据步骤4所得对联合概率分布的修正结果,在该特定时间步提取对于音源位置的最佳估计。
而且,步骤3中,对ITD概率分布矩阵和ILD概率分布进行组合取决于音源位置参数。
而且,步骤4中,对联合概率分布的修正实现方式为,通过音源移动速度计算频率迁移量来修正用于音源定位的联合概率分布。
本发明技术方案使用信息论过程来产生可以与后续测量进行组合的预测,以改善基于时间的移动音源定位,并追踪并跟随移动音源。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的学习步骤设置示意图。
具体实施方式
下面以实施例结合附图对本发明的技术方案作进一步说明。
本发明实施例提供的方位角移动音源定位方法,参见附图1,包括以下步骤:
S1.1:双耳检测;
S1.2:预处理;
S1.3:计算ITD和ILD测量;
S1.4:基于ITD测量对频率对位置矩阵进行学习;
S1.5:基于ILD测量对频率对位置矩阵进行学习;
S1.6:ITD矩阵比较;
S1.7:ILD矩阵比较;
S1.8:将ITD和ILD概率分布矩阵进行组合;
S1.9:联合概率分布修正;
S1.10:位置估计。
学习和定位都要获取ITD和ILD测量,实施例通过S1.1、S1.2和S1.3实现。S1.1具体实施时,参见附图2,根据立体声检测器L0(即具有至少两个独立的声音传感器L1和L2)检测立体声信号1,来对音源位置S进行定位,得到立体声检测器所生成的两路时域信号。S1.2具体实施时,对立体声信号1的两路时域信号分别进行时-频变换,得到两路频域信号2。S1.3具体实施时,利用相关算法基于两路频域信号2对每个时间步的ITD测量3和ILD测量4进行计算。对于ITD,可以通过SSD(方差和)或标准相关系数等方法来计算点态比较;对于ILD,可以通过对频域信号的对数预处理之后计算绝对值范数的差来进行该运算。区别在于,学习过程所用的是不同已知音源位置的ITD和ILD测量结果;定位过程只知道特定时间步的ITD和ILD测量结果,该特定时间步中的未知音源位置需通过比较学习结果得到。
实施例的学习过程包括S1.4和S1.5。S1.4和S1.5具体实施时,对于不同的音源位置S,对ITD频率对位置矩阵和ILD频率对位置矩阵进行学习,通过监控的方式来进行学习而获得先验知识,这表示在学习过程中音源位置S是已知的。对ITD和ILD测量分别进行该学习步骤,并且得到ITD和ILD基准频率对位置矩阵,这些矩阵代表用于所有可能频率的特定位置S。附图2给出了实际中是如何学习的,以特定方位位置(如图2所示,实施例取不同方位角)来布置音源S,然后从音源S播放声音信号,并且计算频率对位置矩阵。对相同位置的所有矩阵(每个位置包括ITD矩阵和ILD矩阵2个矩阵)取均值,以获得通用的ITD频率对位置矩阵5和ILD频率对位置矩阵6,这是一种贝叶斯处理过程。对于所有选中的位置S进行此过程,在学习步骤中只需处理少数用于学习的离散位置,例如平均分布在方位角面上的离散位置。
在预先进行学习后,需要对某特定时间步中的移动音源定位,以获取未知的音源位置时,实施例的定位过程进行以下步骤:
S1.6和S1.7具体实施时,针对各个频道,将所测得的位置未知的音源的ITD测量3和ILD测量4与所学习的频率对位置矩阵5、6分别进行比较,以获取音源位置的ITD概率分布矩阵7和ILD概率分布矩阵8;
S1.8具体实施时,将ITD概率分布矩阵7和ILD概率分布矩阵8进一步进行组合,以获得用于音源定位的联合概率分布9。可以根据音源位置参数来进行ITD概率分布矩阵7和ILD概率分布矩阵8的组合,为实现此目的,将矩阵中的每一个概率分布解释为用于测量的条件概率,该条件概率以频率,提示(ITD/ILD)和位置为条件,即概率分布中包含3个变量——频率,ITD/ILD和音源位置;基于频率和提示的边缘化导致仅以位置为条件的概率;
S1.9具体实施时,可以根据音源在各个时间步角度的变化估计音源的移动速度,进而基于多普勒效应公式计算音源的频率迁移量,从而在用于音源定位的联合概率分布9中减去这部分频率迁移量的影响,得到修正结果,即修正联合概率分布10;
S1.10具体实施时,将信息理论过程应用于修正联合概率分布10,以提取对于音源位置的最佳估计,即音源方位角估计11。例如,可以使用贝叶斯方法来获取方位估计。为此,必须利用先验(即学习所得ITD频率对位置矩阵5和ILD频率对位置矩阵6)和当前用作似然性的概率分布10来计算后验。然后可以利用诸如MAP(最大后验)或MMSE(最小均方误差)的方法,根据后验来计算音源方位角估计11。
具体实施时,可以采用计算机软件技术实现以上步骤的自动执行,也可以按照音频技术领域以硬件装置形式提供实施应用。凡符合本发明所提供技术方案精神的情况,包括等同替换方案,都应当在本发明所要求保护范围内。
为便于实施参考起见,本发明提供采用贝叶斯处理具体实现过程如下:
学习过程
则ITD频率对位置矩阵为:
PT,b(ΔT,b|λ)(1≤b≤B)(2)
其中,λ标识方向(如图2所示音源位置S分别到声音传感器L1和L2所构成的方向角),P用于标识概率,PT,b是表示在各个频带b上的ITD测量概率。公式(2)表达的就是在每个频带上都有一个ITD的概率,共同构成概率矩阵。
则ILD频率对位置矩阵为:
PL,b(ΔL,b|λ)(1≤b≤B)(4)
其中,PL,b是表示在各个频带b上的ILD测量概率。
定位过程
则联合概率密度为:
考虑到频度对于空间线索ITD和ILD影响程度的不同,针对移动音源,对联合概率密度计算方法进行如下修正,以去除频率对空间线索ILD的影响:
其中,ΔDoppler为多普勒效应带来的频率改变。
根据信息论观点,通过空间线索来获取方向信息可描述为贝叶斯最大后验概率似然估计,根据贝叶斯公式,在各个方向λ的条件概率密度为:
其中Nλ为最大方向数。根据前面的联合概率密度计算方法,并假设所有的方向λ都具有相同的可能性,则:
最终,方向的选择为条件后验概率最大的方向
条件后验概率最大的方向即最佳估计结果。
Claims (3)
1.一种基于立体声信号的移动音源定位方法,其特征在于:基于ITD测量和ILD测量实现移动音源定位,所述ITD测量和ILD测量获取方式为,对立体声检测器所生成的两路时域信号进行预处理,分别得到两路频域信号,利用两路频域信号分别计算各个频带的ITD测量和ILD测量;预先在各个已知的音源位置对ITD测量和ILD测量分别进行学习,得到ITD频率对位置矩阵和ILD频率对位置矩阵;在对特定时间步中的移动音源进行音源位置定位时,进行以下步骤,
步骤1,获取某特定时间步的ITD测量和ILD测量;
步骤2,将步骤1所得特定时间步的ITD测量和ITD频率对位置矩阵进行比较,将步骤1所得特定时间步的ILD测量与ILD频率对位置矩阵分别进行比较,从而针对各个频带获得音源位置的概率分布,分别构成ITD概率分布矩阵和ILD概率分布矩阵;
步骤3,将步骤2所得ITD概率分布矩阵和ILD概率分布矩阵进行组合,获得用于在该特定时间步进行音源位置定位的联合概率分布;
步骤4,基于多普勒效应对步骤3所得的联合概率分布进行修正,获得修正结果;
步骤5,应用信息论过程,根据步骤4所得对联合概率分布的修正结果,在该特定时间步提取对于音源位置的最佳估计。
2.根据权利要求1所述的移动音源定位方法,其特征在于:步骤3中,对ITD概率分布矩阵和ILD概率分布进行组合取决于音源位置参数。
3.根据权利要求1或2所述的移动音源定位方法,其特征在于:步骤4中,对联合概率分布的修正实现方式为,通过音源移动速度计算频率迁移量来修正用于音源定位的联合概率分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105149245A CN101982793B (zh) | 2010-10-20 | 2010-10-20 | 一种基于立体声信号的移动音源定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010105149245A CN101982793B (zh) | 2010-10-20 | 2010-10-20 | 一种基于立体声信号的移动音源定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101982793A true CN101982793A (zh) | 2011-03-02 |
CN101982793B CN101982793B (zh) | 2012-07-04 |
Family
ID=43619695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010105149245A Expired - Fee Related CN101982793B (zh) | 2010-10-20 | 2010-10-20 | 一种基于立体声信号的移动音源定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101982793B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102565759A (zh) * | 2011-12-29 | 2012-07-11 | 东南大学 | 一种基于子带信噪比估计的双耳声源定位方法 |
CN106501772A (zh) * | 2016-10-18 | 2017-03-15 | 武汉轻工大学 | 一种基于双耳线索的空间音源定位方法及系统 |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1703118A (zh) * | 2004-05-26 | 2005-11-30 | 本田研究所欧洲有限公司 | 基于立体声信号的声源定位 |
US20060062409A1 (en) * | 2004-09-17 | 2006-03-23 | Ben Sferrazza | Asymmetric HRTF/ITD storage for 3D sound positioning |
KR20060124443A (ko) * | 2005-05-31 | 2006-12-05 | 한국과학기술원 | 머리전달함수 데이터베이스를 이용한 음원 위치 추정 방법 |
CN101149925A (zh) * | 2007-11-06 | 2008-03-26 | 武汉大学 | 一种用于参数立体声编码的空间参数选取方法 |
US20090046864A1 (en) * | 2007-03-01 | 2009-02-19 | Genaudio, Inc. | Audio spatialization and environment simulation |
-
2010
- 2010-10-20 CN CN2010105149245A patent/CN101982793B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1703118A (zh) * | 2004-05-26 | 2005-11-30 | 本田研究所欧洲有限公司 | 基于立体声信号的声源定位 |
US20060062409A1 (en) * | 2004-09-17 | 2006-03-23 | Ben Sferrazza | Asymmetric HRTF/ITD storage for 3D sound positioning |
KR20060124443A (ko) * | 2005-05-31 | 2006-12-05 | 한국과학기술원 | 머리전달함수 데이터베이스를 이용한 음원 위치 추정 방법 |
US20090046864A1 (en) * | 2007-03-01 | 2009-02-19 | Genaudio, Inc. | Audio spatialization and environment simulation |
CN101149925A (zh) * | 2007-11-06 | 2008-03-26 | 武汉大学 | 一种用于参数立体声编码的空间参数选取方法 |
Non-Patent Citations (1)
Title |
---|
《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 20071115 谢富科 《基于近场声全息的运动车辆噪声源识别方法研究》 正文第27页第10行至第11行、第36页第6行至第7行、第37页第7行至第8行和第38页第2行至第4行 1-3 , 2 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102565759A (zh) * | 2011-12-29 | 2012-07-11 | 东南大学 | 一种基于子带信噪比估计的双耳声源定位方法 |
CN106501772A (zh) * | 2016-10-18 | 2017-03-15 | 武汉轻工大学 | 一种基于双耳线索的空间音源定位方法及系统 |
CN106501772B (zh) * | 2016-10-18 | 2018-12-14 | 武汉轻工大学 | 一种基于双耳线索的空间音源定位方法及系统 |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101982793B (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8947978B2 (en) | System and method for estimating the direction of arrival of a sound | |
CN1703118B (zh) | 基于立体声信号的声源定位方法和装置 | |
CN105388459B (zh) | 分布式麦克风阵列网络的鲁棒声源空间定位方法 | |
CN109188362B (zh) | 一种麦克风阵列声源定位信号处理方法 | |
CN103308889A (zh) | 复杂环境下被动声源二维doa估计方法 | |
CN104200813A (zh) | 基于声源方向实时预测跟踪的动态盲信号分离方法 | |
CN103995252A (zh) | 一种三维空间声源定位方法 | |
CN111798869B (zh) | 一种基于双麦克风阵列的声源定位方法 | |
CN104640204A (zh) | 一种非直达波环境下无线传感器网络节点定位方法 | |
CN104811886A (zh) | 基于相位差测量的麦克风阵列测向方法 | |
CN105353351A (zh) | 一种基于多信标到达时间差改进型定位方法 | |
CN101982793B (zh) | 一种基于立体声信号的移动音源定位方法 | |
CN104793177A (zh) | 基于最小二乘法的麦克风阵列测向方法 | |
CN103901400A (zh) | 一种基于时延补偿和双耳一致性的双耳声音源定位方法 | |
Chen et al. | A microphone position calibration method based on combination of acoustic energy decay model and TDOA for distributed microphone array | |
Suo et al. | Single acoustic vector sensor DOA enhanced by unsaturated bistable stochastic resonance with linear amplitude response constrained | |
Cevher et al. | Acoustic node calibration using a moving source | |
Liu et al. | A binaural sound source localization model based on time-delay compensation and interaural coherence | |
Ghamdan et al. | Position estimation of binaural sound source in reverberant environments | |
Jing et al. | Acoustic source tracking based on adaptive distributed particle filter in distributed microphone networks | |
CN110426711B (zh) | 一种基于极性零点检测的时延估计方法及系统 | |
Nonsakhoo et al. | Angle of arrival estimation by using stereo ultrasonic technique for local positioning system | |
Kim et al. | Improved adaptive smoothing filter for indoor localization using RSSI | |
Hosangadi | A proposed method for acoustic source localization in search and rescue robot | |
Canclini et al. | Distributed 3D source localization from 2D DOA measurements using multiple linear arrays |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120704 |