CN108132457A - 一种确定位置的语音来波方向估计方法和装置 - Google Patents
一种确定位置的语音来波方向估计方法和装置 Download PDFInfo
- Publication number
- CN108132457A CN108132457A CN201711401069.5A CN201711401069A CN108132457A CN 108132457 A CN108132457 A CN 108132457A CN 201711401069 A CN201711401069 A CN 201711401069A CN 108132457 A CN108132457 A CN 108132457A
- Authority
- CN
- China
- Prior art keywords
- arrival bearing
- voice arrival
- voice
- estimation
- microphone array
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
- G01S3/8027—By vectorial composition of signals received by plural, differently-oriented transducers
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种确定位置的语音来波方向估计方法,包括:麦克风阵列根据接收到的语音确定信号向量;将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配,得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定;根据匹配系数的值估计语音来波方向,确定位置。可以有效降低计算复杂度和时延,更快的确定发声的目标位置。
Description
技术领域
本发明属于声源定位技术领域,具体地涉及一种确定位置的语音来波方 向估计方法和装置,尤其适用于交通工具内的语音系统。
背景技术
1986年美国科学家Schmidt R O等人发现了多重信号分类(MUSIC) 算法,它是现代超分辨率侧向技术领域的一次重大的飞跃,子空间分解类算 法由此开始起步。子空间分解类算法的基本思路是把阵列所接收到的数据进 行各种数学分解,这样数据就会变成两个相互正交的子空间。其中一个是和 信号源阵列流型空间相对应的子空间,另外一个是和信号子空间相互正交的 噪声子空间。子空间分解类算法在实际计算中分为两个大类:一是以旋转不 变子空间(ESPRIT)算法为首的信号子空间类算法;一是以多重信号分类(MUSIC)算法为首的噪声子空间类算法。
无论是ESPRIT算法,还是MUSIC算计均需要计算接收信号的协方差 矩阵,计算复杂度均较高,不适合车载语音系统低计算复杂度的要求。
另外,中国专利文献CN 104244143公开了一种用于接收所需声音的适 应性波束形成方法,包括:确定正在进行说话的乘员在被限定空间内的乘员 位置;以多个麦克风接收来自所述被限定空间内的声音;生成与在所述多个 麦克风中的每个处的被接收声音相对应的多个音频信号;以及向音频信号应 用波束形成器,来引导麦克风波束朝向所确定的乘员位置,并生成波束形成 器输出信号。波束形成的定位方法和基于时延估计方法是传统的声源定位方 法,存在定位方法使用不灵活、估计结果不稳定且精度较低、实用性不够好等问题。
发明内容
针对现有技术中存在的上述技术问题,本发明提出了一种确定位置的语 音来波方向估计方法和装置,可以有效降低计算复杂度和时延,更快的确定 目标位置。
本发明的技术方案是:
一种确定位置的语音来波方向估计方法,包括以下步骤:
S01:麦克风阵列根据接收到的语音确定信号向量;
S02:将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配, 得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和被限定空 间内的确定位置的相对位置的几何角度进行确定;
S03:根据匹配系数的值估计语音来波方向,确定位置。
优选的,所述来波矢量为预先存储的。
优选的,所述麦克风阵列至少为两组且分别执行步骤S01与S02。
优选的,根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均 值估计语音来波方向,确定位置。
优选的,所述步骤S02中得到的匹配系数为:
其中,α(θp,i)为来波矢量,p为麦克风阵列数,N为位置数,yp(n)为信号 向量。
本发明还公开了一种确定位置的语音来波方向估计装置,包括:
信号向量确定模块,通过麦克风阵列根据接收到的语音确定信号向量;
匹配模块,将得到的信号向量与各语音来波方向角度对应的来波矢量进 行匹配,得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和 被限定空间内的确定位置的相对位置的几何角度进行确定;
位置确定模块,根据匹配系数的值估计语音来波方向,确定位置。
优选的,所述来波矢量为预先存储的。
优选的,所述麦克风阵列至少为两组,由匹配模块得到每组麦克风阵列 的匹配系数。
优选的,根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均 值估计语音来波方向,确定位置。
优选的,还包括:
指令输出模块,根据确定的位置,发出与该位置相关一个操作指令。
与现有技术相比,本发明的优点是:
本发明的语音来波方向估计方法计算复杂度低,语音来波方向估计精度 高,延时小。能很好的满足低计算的语音系统的要求,实用性强,具有很高 的应用前景。
附图说明
下面结合附图及实施例对本发明作进一步描述:
图1为本发明确定位置的语音来波方向估计方法的流程图;
图2为本发明一实施例的场景应用示意图;
图3为本发明另一实施例的场景应用示意图;
图4为本发明一实施例的麦克风布置示意图;
图5为本发明又一实施例的麦克风布置示意图;
图6为本发明确定位置的语音来波方向估计装置的原理框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施 方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例 性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结 构和技术的描述,以避免不必要地混淆本发明的概念。
实施例:
下面结合附图,对本发明的较佳实施例作进一步说明。
本发明以交通工具为例进行说明,当然也可以为其他的被限定空间内的 有确定位置的场景,例如会议室等。
实施例1:
如图1、2所示,以五座轿车为例,车内配置一个麦克风阵列,麦克风 阵列一般设置在车头位置处。根据麦克风阵列的位置,以及五个座位的位置, 在物理几何上计算相应的角度θ1,θ2,…,θ5。
根据记录的角度,计算相应的来波矢量。对于第i个角度θi,对应的来 波矢量为:
其中,K为麦克风数,d表示相邻麦克风之间的间距,λ表示声波的波 长。
在第n个时刻,第j个座位上的乘客发出语音信号,麦克风阵列接收到 的信号向量可以表示为:
y(n)=ηjα(θj)+w(n)
其中,ηj表示从第j个座位到麦克风阵列的路径损耗,w(n)为噪声向量。
将接收信号与可能的角度矢量进行匹配操作,得到的匹配系数如下:
那么j的估计可以表示:
得到了j的估计,也就确定了乘客的语音来波方向,换句话说就确定为 发出语音的乘客的位置。
实施例2:
因为精度问题,当一个麦克风阵列无法精确识别位置时,可增加一个或 者多个麦克风整列进行辅助识别位置,根据不同麦克风阵列的匹配系数最终 确定位置。比如图3所示是一个经典的2+2+3的商务车布局并且除了麦克风 阵列1还另外增加了麦克风阵列2,可能处于系统性能的限制,麦克风阵列 1识别出的向量和图中θ1和θ2的相关性可能无法精确对比,则可以辅助于麦 克风阵列2中识别出向量以及进行判断,从而精确定位语音声源是来自 右中位置还是右后位置。
具体执行步骤如下:
根据麦克风阵列和被限定空间内的确定位置的相对位置,几何上确定相 对于第p(P>=1)个麦克风阵列可能的语音来波方向角度θp,1,…,θp,N,N为位置 数,此处p=2,N=7;
计算第i个角度θi,对应的来波矢量为:
其中,K为麦克风数,d表示相邻麦克风之间的间距,λ表示声波的波长;
计算第p个麦克风阵列接收到的信号向量,为:
yp(n)=ηp,jα(φp,j)+wp(n);
其中,ηp,j表示语音从第j个位置到第p个麦克风阵列的路径损耗,φp,j表 示从第j个位置到第p个麦克风阵列可能的入射角(语音来波方向角度), wp(n)为噪声向量;
将接收信号与来波矢量进行匹配操作,得到匹配系数为:
第p个麦克风阵列估计的语音来波方向的计算公式为:
根据多个确定待定位目标的位置。具体准则如下:
其中表示四舍五入操作。
此外,麦克风阵列的布局将会是一个比较灵活的布局形式,将可能是同 一个阵列的麦克风分散在交通工具的相对较远的地方,比如图4是一个典型 的2+3轿车车内布局,一个麦克风阵列包括4个麦克风,其分布在车内四个 非一个相对声源一个方向的位置上。也可以是多个阵列的子麦克风相互穿插 分散分布,如图5所示。都可以适用于本发明的方法进行位置识别。
如图6所示,一种确定位置的语音来波方向估计装置,包括:
信号向量确定模块,通过麦克风阵列根据接收到的语音确定信号向量;
匹配模块,将得到的信号向量与各语音来波方向角度对应的来波矢量进 行匹配,得到相对应的匹配系数,语音来波方向角度根据麦克风阵列和被限 定空间内的确定位置的相对位置的几何角度进行确定;
位置确定模块,根据匹配系数的最大值估计语音来波方向,确定位置。
由于应用于特定的场景,针对不同的应用场景,可以将来波矢量为预先 存储在装置内的存储模块内,操作时直接调用即可。
当一个麦克风阵列无法精确识别位置时,可增加一个或者多个麦克风整 列进行辅助识别位置,由匹配模块得到每组麦克风阵列的匹配系数。然后根 据不同麦克风阵列的匹配系数最终确定位置。具体的可根据不同麦克风阵列 对同一位置的匹配系数的最大值的和的均值估计语音来波方向,确定位置。
该装置还可以连接外部系统的指令输出模块,该指令输出模块根据确定 的位置,发出与该位置相关的操作指令,比如打开右侧的车窗等等。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释 本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和 范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保 护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和 边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种确定位置的语音来波方向估计方法,其特征在于,包括以下步骤:
S01:麦克风阵列根据接收到的语音确定信号向量;
S02:将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配,得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定;
S03:根据匹配系数的值估计语音来波方向,确定位置。
2.根据权利要求1所述的确定位置的语音来波方向估计方法,其特征在于,所述来波矢量为预先存储的。
3.根据权利要求1所述的确定位置的语音来波方向估计方法,其特征在于,所述麦克风阵列至少为两组且各自独立执行步骤S01与S02。
4.根据权利要求3所述的确定位置的语音来波方向估计方法,其特征在于,根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均值估计语音来波方向,确定位置。
5.根据权利要求1所述的确定位置的语音来波方向估计方法,其特征在于,所述步骤S02中得到的匹配系数为:
其中,α(θp,i)为来波矢量,p为麦克风阵列数,N为位置数,yp(n)为信号向量。
6.一种确定位置的语音来波方向估计装置,其特征在于,包括:
信号向量确定模块,通过麦克风阵列根据接收到的语音确定信号向量;
匹配模块,将得到的信号向量与各语音来波方向角度对应的来波矢量进行匹配,得到相对应的匹配系数,所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定;
位置确定模块,根据匹配系数的值估计语音来波方向,确定位置。
7.根据权利要求6所述的确定位置的语音来波方向估计装置,其特征在于,所述来波矢量为预先存储的。
8.根据权利要求1所述的确定位置的语音来波方向估计装置,其特征在于,所述麦克风阵列至少为两组,由匹配模块得到每组麦克风阵列的匹配系数。
9.根据权利要求8所述的确定位置的语音来波方向估计装置,其特征在于,根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均值估计语音来波方向,确定位置。
10.根据权利要求6所述的确定位置的语音来波方向估计装置,其特征在于,还包括:
指令输出模块,根据确定的位置,发出与该位置相关的操作指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711401069.5A CN108132457A (zh) | 2017-12-22 | 2017-12-22 | 一种确定位置的语音来波方向估计方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711401069.5A CN108132457A (zh) | 2017-12-22 | 2017-12-22 | 一种确定位置的语音来波方向估计方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108132457A true CN108132457A (zh) | 2018-06-08 |
Family
ID=62392142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711401069.5A Pending CN108132457A (zh) | 2017-12-22 | 2017-12-22 | 一种确定位置的语音来波方向估计方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108132457A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109597021A (zh) * | 2018-11-05 | 2019-04-09 | 北京航天控制仪器研究所 | 一种波达方向估计方法及装置 |
CN110797042A (zh) * | 2018-08-03 | 2020-02-14 | 杭州海康威视数字技术股份有限公司 | 音频处理方法、装置及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1901282A2 (en) * | 2006-09-15 | 2008-03-19 | Volkswagen Aktiengesellschaft | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
JP2010161735A (ja) * | 2009-01-09 | 2010-07-22 | Xanavi Informatics Corp | 音再生装置および音再生方法 |
WO2012057589A2 (ko) * | 2010-10-29 | 2012-05-03 | 주식회사 마이티웍스 | 멀티 빔 음향시스템 |
CN102749612A (zh) * | 2012-07-25 | 2012-10-24 | 中国人民解放军信息工程大学 | 一种相关干涉仪的快速测向方法 |
CN104181499A (zh) * | 2014-08-23 | 2014-12-03 | 电子科技大学 | 方位角先验条件下基于稀布线阵的测距无源定位方法 |
US8983089B1 (en) * | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN104865555A (zh) * | 2015-05-19 | 2015-08-26 | 河北工业大学 | 一种基于声音位置指纹的室内声源定位方法 |
US9129223B1 (en) * | 2011-03-30 | 2015-09-08 | Amazon Technologies, Inc. | Sound localization with artificial neural network |
CN106199607A (zh) * | 2016-06-29 | 2016-12-07 | 北京捷通华声科技股份有限公司 | 一种麦克风阵列的声源方向定位方法及装置 |
CN106842131A (zh) * | 2017-03-17 | 2017-06-13 | 浙江宇视科技有限公司 | 麦克风阵列声源定位方法及装置 |
CN107102296A (zh) * | 2017-04-27 | 2017-08-29 | 大连理工大学 | 一种基于分布式麦克风阵列的声源定位系统 |
CN107202976A (zh) * | 2017-05-15 | 2017-09-26 | 大连理工大学 | 低复杂度的分布式麦克风阵列声源定位系统 |
-
2017
- 2017-12-22 CN CN201711401069.5A patent/CN108132457A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1901282A2 (en) * | 2006-09-15 | 2008-03-19 | Volkswagen Aktiengesellschaft | Speech communications system for a vehicle and method of operating a speech communications system for a vehicle |
JP2010161735A (ja) * | 2009-01-09 | 2010-07-22 | Xanavi Informatics Corp | 音再生装置および音再生方法 |
WO2012057589A2 (ko) * | 2010-10-29 | 2012-05-03 | 주식회사 마이티웍스 | 멀티 빔 음향시스템 |
US9129223B1 (en) * | 2011-03-30 | 2015-09-08 | Amazon Technologies, Inc. | Sound localization with artificial neural network |
US8983089B1 (en) * | 2011-11-28 | 2015-03-17 | Rawles Llc | Sound source localization using multiple microphone arrays |
CN102749612A (zh) * | 2012-07-25 | 2012-10-24 | 中国人民解放军信息工程大学 | 一种相关干涉仪的快速测向方法 |
CN104181499A (zh) * | 2014-08-23 | 2014-12-03 | 电子科技大学 | 方位角先验条件下基于稀布线阵的测距无源定位方法 |
CN104865555A (zh) * | 2015-05-19 | 2015-08-26 | 河北工业大学 | 一种基于声音位置指纹的室内声源定位方法 |
CN106199607A (zh) * | 2016-06-29 | 2016-12-07 | 北京捷通华声科技股份有限公司 | 一种麦克风阵列的声源方向定位方法及装置 |
CN106842131A (zh) * | 2017-03-17 | 2017-06-13 | 浙江宇视科技有限公司 | 麦克风阵列声源定位方法及装置 |
CN107102296A (zh) * | 2017-04-27 | 2017-08-29 | 大连理工大学 | 一种基于分布式麦克风阵列的声源定位系统 |
CN107202976A (zh) * | 2017-05-15 | 2017-09-26 | 大连理工大学 | 低复杂度的分布式麦克风阵列声源定位系统 |
Non-Patent Citations (4)
Title |
---|
姜锦云: "基于麦克风阵列的近场和远场混合声源定位", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 * |
林焕楠: "分布式麦克风阵列声源跟踪方法的研究", 《电子科技》 * |
王硕朋: "基于声音位置指纹的室内声源定位方法", 《北京工业大学学报》 * |
王舒文: "分布式麦克风阵列定位方法研究", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊)》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110797042A (zh) * | 2018-08-03 | 2020-02-14 | 杭州海康威视数字技术股份有限公司 | 音频处理方法、装置及存储介质 |
CN110797042B (zh) * | 2018-08-03 | 2022-04-15 | 杭州海康威视数字技术股份有限公司 | 音频处理方法、装置及存储介质 |
CN109597021A (zh) * | 2018-11-05 | 2019-04-09 | 北京航天控制仪器研究所 | 一种波达方向估计方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Grondin et al. | Lightweight and optimized sound source localization and tracking methods for open and closed microphone array configurations | |
JP3910898B2 (ja) | 指向性設定装置、指向性設定方法及び指向性設定プログラム | |
ES2525839T3 (es) | Adquisición de sonido mediante la extracción de información geométrica de estimativos de dirección de llegada | |
EP1643769B1 (en) | Apparatus and method performing audio-video sensor fusion for object localization, tracking and separation | |
JP2008079256A (ja) | 音響信号処理装置、音響信号処理方法及びプログラム | |
CN108320739A (zh) | 根据位置信息辅助语音指令识别方法和装置 | |
JP2010121975A (ja) | 音源定位装置 | |
Nakadai et al. | Robust tracking of multiple sound sources by spatial integration of room and robot microphone arrays | |
Di Carlo et al. | Mirage: 2d source localization using microphone pair augmentation with echoes | |
CN108132457A (zh) | 一种确定位置的语音来波方向估计方法和装置 | |
CN110021298A (zh) | 一种汽车语音控制系统 | |
US8369550B2 (en) | Artificial ear and method for detecting the direction of a sound source using the same | |
EP2362238B1 (en) | Estimating the distance from a sensor to a sound source | |
EP4017026A1 (en) | Sound source localization device, sound source localization method, and program | |
Abutalebi et al. | Performance improvement of TDOA-based speaker localization in joint noisy and reverberant conditions | |
Tourbabin et al. | Enhanced robot audition by dynamic acoustic sensing in moving humanoids | |
KR20200066891A (ko) | 2차원 마이크 어레이를 이용한 3차원 음원 위치 검출 장치 및 방법 | |
Togami et al. | Head orientation estimation of a speaker by utilizing kurtosis of a DOA histogram with restoration of distance effect | |
Nakamura et al. | Blind spatial sound source clustering and activity detection using uncalibrated microphone array | |
Carabias-Orti et al. | Multi-source localization using a DOA Kernel based spatial covariance model and complex nonnegative matrix factorization | |
Farmani et al. | On the influence of microphone array geometry on HRTF-based sound source localization | |
Bergh et al. | Multi-speaker voice activity detection using a camera-assisted microphone array | |
Zohourian et al. | New insights into the role of the head radius in model-based binaural speaker localization | |
CN113450769B (zh) | 语音提取方法、装置、设备和存储介质 | |
Ju et al. | Tracking the moving sound target based on distributed microphone pairs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180608 |