CN103760520A - 一种基于avs和稀疏表示的单语者声源doa估计方法 - Google Patents

一种基于avs和稀疏表示的单语者声源doa估计方法 Download PDF

Info

Publication number
CN103760520A
CN103760520A CN201310726022.1A CN201310726022A CN103760520A CN 103760520 A CN103760520 A CN 103760520A CN 201310726022 A CN201310726022 A CN 201310726022A CN 103760520 A CN103760520 A CN 103760520A
Authority
CN
China
Prior art keywords
sound source
avs
ratio
sparse
doa
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310726022.1A
Other languages
English (en)
Other versions
CN103760520B (zh
Inventor
邹月娴
郭轶凡
石伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen coast Speech Technology Co., Ltd.
Original Assignee
Peking University Shenzhen Graduate School
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Shenzhen Graduate School filed Critical Peking University Shenzhen Graduate School
Priority to CN201310726022.1A priority Critical patent/CN103760520B/zh
Publication of CN103760520A publication Critical patent/CN103760520A/zh
Application granted granted Critical
Publication of CN103760520B publication Critical patent/CN103760520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种基于AVS和稀疏表示的单语者声源DOA估计方法。所述方法采用声学矢量传感器(Acoustic Vector Sensor,AVS)实现音频信号采集,利用语音信号的时频稀疏特性和AVS接收分量之间的三角函数关系,采用正弦迹算法提取高信噪比时频点,计算压力梯度传感器与全向压力传感器间的数据比。在此基础上,利用声源的空间稀疏特性,获得传感器间数据比的过完备字典稀疏表示模型,将语者声源到达方向(Direction ofArrival,DOA)估计问题转化为稀疏矢量求解问题。采用l1-SVD方法求解稀疏矢量,计算其空间功率谱,计算得到语音声源的DOA。本发明所述方法在不同的噪声强度和房间混响条件下,能够准确地估计出语者声源的DOA。此外,该方法采用的麦克风阵列体积小(仅有1cm3),非常适用于便携设备上的语音技术。

Description

一种基于AVS和稀疏表示的单语者声源DOA估计方法
技术领域
本发明涉及一种基于AVS和稀疏表示的单语者声源DOA估计方法,属于人机语音交互技术领域。
背景技术
空间语者声源到达方向(Direction ofArrival,DOA)估计是智能机器人人机交互的关键技术,具有重大的应用价值,一直是阵列信号处理领域的研究热点。在实际复杂声学环境中,麦克风在采集语音信号时,不可避免地会受到来自周围环境噪声、传输媒介噪声、通信设备内部电噪声和房间混响等因素干扰,因此获取的语音质量下降。基于传统麦克风阵列的DOA技术存在麦克风阵列孔径大、有空域混叠以及运算复杂度高等局限,限制了该类技术在小型移动设备(机器人)上的应用。
本发明采用了一种新型麦克风——声学矢量传感器(Acoustic Vector Sensor,AVS)作为音频信号采集器。与常用的ECM麦克风相比,AVS在结构上具有其特殊性:一颗AVS由1个全向压力传感器和2到3个正交放置的压力梯度传感器构成。它的空间结构紧凑,仅有1cm3左右大小,理论上,AVS是同位阵列,各个传感器接收到的音频信号在时间上对齐,且各通道接收信号存在固定的三角函数关系。AVS小体积的特殊优点,有可能成为服务机器人听觉感知技术的有效解决方案。
本发明利用AVS采集的音频信号,提出了一种语者声源DOA估计算法。AVS输出的信号模型可表示为:
xu(t)=uss(t)+nu(t)     (1)
xv(t)=vss(t)+nv(t)     (2)
xw(t)=wss(t)+nw(t)     (3)
xo(t)=s(t)+no(t)     (4)
其中xu(t),xv(t),xw(t)和xo(t)分别是AVS的u-,v-,w-和o-通道的输出信号,nu(t),nv(t),nw(t)和no(t)分别是在u-,v-,w-和o-通道的零均值高斯加性噪声,s(t)是待定位的语者声源信号。us,vs和ws分别可表示为us=sinθscosφs,vs=sinθssinφs,以及ws=cosθs,被称为语者声源信号在x,y和z轴上的方向余弦。本发明基于上述定义,提出了一种基于语音时频稀疏性和声源空间稀疏性的DOA估计方法。实验结果表明,本发明可有效抑制背景噪声和空间混响对DOA估计的影响。
发明内容
本发明的目的是面向智能机器人人机语音交互技术,发明一种对声学环境变化不敏感、体积小的高精度空间语音声源DOA估计方法。
一种基于AVS和稀疏表示的单语者声源DOA估计方法,其核心思想是:采用正弦迹算法提取高信噪比时频点,计算压力梯度传感器与全向压力传感器间的数据比(Inter-Sensor DataRatio,ISDR)。在此基础上,利用声源的空间稀疏特性,推导传感器间数据比ISDR的过完备字典稀疏表示模型,将语者声源方向估计问题转化为稀疏矢量求解问题。采用l1-SVD方法求解稀疏矢量,计算其空间功率谱,获得语音声源的DOA估计。
一种基于AVS和稀疏表示的单语者声源DOA估计方法,其步骤是:
a)采用单个AVS,即声学矢量传感器,和模数转换器实现语音信号采集,获得四通道数字信号输出。
分别对各通道输出信号进行加窗分帧和短时傅里叶变换,获得四个通道的时频谱数据。
b)采用正弦迹算法对(a)所得时频谱数据提取高信噪比时频点,记为L个。
c)对由步骤(b)提取的L个高信噪比时频点分别求出AVS三个梯度传感器与全向传感器之间的频谱数据比,即ISDR值,Ivo(τ,ω),Ivo(τ,ω),Iwo(τ,ω)。用ISDR值构成3×1的ISDR数据矢量I(τ,ω)。
d)将整个空间角度均匀离散为M个网格,计算离散虚拟角度所对应的AVS阵列流形矩阵,构建过完备字典,并采用构建的过完备字典获取步骤(c)中的每一个时频点上的数据矢量I(τ,ω)的稀疏表示模型。
e)利用l1-SVD方法对(d)中的稀疏模型求解稀疏矢量,并计算平均空间功率谱以及峰值所对应的的声源DOA。
本发明的有益效果在于:1)本发明所述的方法能够实现单语者声源DOA估计。仿真实验和实测实验数据验证了本发明在不同的噪声强度和房间混响条件下,都能获得DOA的高精度估计。2)本发明所述的方法易于在移动或便携设备上应用。本发明采用AVS采集语音信号,该传感器仅有1cm3大小,易于在小型设备上集成系统;同时算法复杂度低,易于实时运行在运算能力有限的嵌入式平台上。
附图说明
图1.AVS结构图
图2.θs=60°,φs∈[0°,180°]的100次DOA估计实验结果
图3.不同信噪比下的DOA估计RMSE(θs=60°,φs=45°)
图4.不同混响条件下的DOA估计RMSE(θs=60°,φs=45°)
图5.实际环境中的实验设备
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细描述。
根据研究,语音信号在时频域具有较好的稀疏性。当一段语音有多个说话人出现时,不同说话人的语音信号能量在时频域具有离散分布特性,即在某个时频点(τ,ω),可以近似认为只有一个说话人语音信号占支配地位,其它声源的贡献可以忽略,此性质被称为语音的时频域稀疏性。
假设空间中只有一个语者声源,本发明采用32kHz采样率对AVS输出信号((1)-(4))进行模数变换,然后采用汉明窗加窗分帧,其中窗长30ms,帧移20ms,傅里叶变换点数为1024,得到四通道的时频谱数据,表示如下:
Xu(τ,ω)=usS(τ,ω)+Nu(τ,ω)     (5)
Xv(τ,ω)=vsS(τ,ω)+Nv(τ,ω)     (6)
Xw(τ,ω)=wsS(τ,ω)+Nw(τ,ω)     (7)
Xo(τ,ω)=S(τ,ω)+No(τ,ω)     (8)
其中τ是短时帧序号,ω为FFT变换的频率指数。定义ISDR值如下:
Iuo(τ,ω)=Xu(τ,ω)/Xo(τ,ω)     (9)
Ivo(τ,ω)=Xv(τ,ω)/Xo(τ,ω)     (10)
Iwo(τ,ω)=Xw(τ,ω)/Xo(τ,ω)     (11)
其中Iuo(τ,ω),Ivo(τ,ω)和Iwo(τ,ω)分别是u通道与o通道,v通道与o通道,w通道与o通道的ISDR值。以Iuo(τ,ω)为例,推导ISDR与语者声源DOA的关系如下。把(5)和(8)代入(9)中得到
I uo ( τ , ω ) = u s S ( τ , ω ) + N u ( τ , ω ) S ( τ , ω ) + N o ( τ , ω ) = u s + ϵ us ( τ , ω ) 1 + ϵ os ( τ , ω ) - - - ( 12 )
其中εus(τ,ω)=Nu(τ,ω)/S(τ,ω),εos(τ,ω)=No(τ,ω)/S(τ,ω)。在时频点(τ,ω)处,当o通道信噪比满足S(τ,ω,>>No(τ,ω)时,我们得到|εos(τ,ω)|<<1。在这个条件下,对(12)进行麦克劳林级数展开可得
I uo ( τ , ω ) = ( u s + ϵ us ( τ , ω ) ) [ 1 - ϵ os ( τ , ω ) + ϵ os 2 ( τ , ω ) - . . . ] - - - ( 13 )
由于|εos(τ,ω)|<<l,(13)中的高次项可以忽略,(13)近似为
Iuo(τ,ω)≈usu(τ,ω)     (14)
其中ηu(τ,ω)=εus(τ,ω)[1-εos(τ,ω)]。根据推导证明,ηu(τ,ω)是零均值随机变量。(14)为u通道与o通道的ISDR数据模型。同理可得
Ivo(τ,ω)≈vsv(τ,ω)     (15)
Iwo(τ,ω)≈wsw(τ,ω)     (16)
其中,ηv(τ,ω)=εvs(τ,ω)[1-εos(τ,ω)],ηw(τ,ω)=εws(τ,ω)[1-εos(τ,ω)]。ISDR的数据模型的矩阵形式如下
I(τ,ω)=b(θs,φs)+ε(τ,ω)     (17)
其中I(τ,ω)=[Iuo(τ,ω),Ivo(τ,ω),Iwo(τ,ω)]T   (18)
b(θs,φs)=[us,vs,ws]T     (19)
ε(τ,ω)=[ηu(τ,ω),ηv(τ,ω),ηw(τ,ω)]T     (20)
由(19)可知,b(θs,φs)是u-,v-和w-通道的流形矢量。
由于语者声源在空间中具有稀疏性,我们将在空间稀疏表示(Spatial Sparsity Representation,SSR)理论框架下实现语者声源的DOA估计,其主要思想是将空间声源的DOA估计问题转化为稀疏矢量的重构问题。
首先,将方位角和俯仰角分别均匀离散为N个网格,即整个空间采样为M(M=N×N)个网格,由此得到了一个预定义的虚拟角度集合i=1,...,N,j=1,...,N}。对应地,根据
Figure BSA0000099495900000034
构造u-,v-和w-通道的流形矩阵如下:
Ψ=[b(θ1,φ1),...,b(θi,φj),...,b(θN,φN)],Ψ∈R3×M       (21)
其中,b(θi,φj)是由(19)定义的流形矢量,Ψ矩阵被称为过完备字典。很明显,当M越大,网格间距就越小,估计出的空间语者声源DOA与真实的DOA就更接近。因此,假设网格间距足够的小,(17)中的ISDR数据模型可以重写如下:
I(τ,ω)=Ψz+ε(τ,ω)     (22)
其中,z是M×1维的稀疏矢量。本发明针对单语者声源定位,因此理论上z中只有一个非零元素(等于1),且对应的是语者的DOA(θs,φs)。(22)称为ISDR的稀疏表示模型(即SSR-ISDR模型)。因此,只要重构出z且找到z的非零元素,即可估计出语者声源的DOA(θs,θs)。
由于上述方法是在|εos(τ,ω)|<<1的条件下推导,因此,本发明采用正弦迹法选取高信噪比时频点,记为L个。因此,对每个提取的高信噪比时频点,|εos(τ,ω)|<<1的条件满足;且所有的高信噪比时频点的数据模型都满足(22)式,其对应的稀疏矢量z有着同样的稀疏结构。利用这个性质,我们形成了联合SSR-ISDR数据模型如下:
A=ΨZ+E       (23)
A=[I(τ1,ω1),...,I(τL,ωL)],A∈R3×L     (24)
E=[ε(τ1,ω1),...,ε(τL,ωL)],E∈R3×L     (25)
Z=[z1,...,zL],Z∈RM×L     (26)
其中(τi,ωi)(i=1,...,L)表示由正弦迹法提取到的第i个高信噪比时频点,zi是对应的稀疏矢量。针对单语者声源DOA估计问题,Z只有一行与DOA(θs,φs)对应的非零行。因此,基于(23)重构Z,找到Z的非零行,即可估计出DOA(θs,φs)。
稀疏矩阵Z可以通过如下的目标方程来重构
Z ^ = arg min z | | A - ΨZ | | 2 2 + λ | | Z | | 1 - - - ( 27 )
考虑到计算效率和对噪声的鲁棒性,本发明选用l1-SVD方法实现对Z的重构。根据计算获得的Z,计算其空间功率谱Pz,找到Pz的峰值,即找到语音声源所在的角度网格,最终估计出语者声源的DOA。

Claims (5)

1.一种基于AVS和稀疏表示的单语者声源DOA估计方法,包括如下步骤:
a)采用单个AVS(Acoustic Vector Sensor),即声学矢量传感器,和模数转换器实现语音信号采集,获得四通道数字信号输出。分别对各通道输出信号进行加窗分帧和短时傅里叶变换,获得四个通道的时频谱数据。
b)采用正弦迹算法对(a)所得时频谱数据提取高信噪比时频点,记为L个。
c)对由步骤(b)提取的L个高信噪比时频点分别求出AVS三个梯度传感器与全向传感器之间的频谱数据比(Inter-Sensor Data Ratio,ISDR),记为ISDR值,Iuo(τ,ω),Ivo(τ,ω),Iwo(τ,ω)。用ISDR值构成3×1的ISDR数据矢量I(τ,ω)。
d)将整个空间均匀离散为M个网格,用离散的虚拟角度集合将AVS阵列流形矩阵构建出过完备字典,并对步骤(c)中的每一个时频点上的数据矢量I(τ,ω)进行稀疏表示。
e)利用l1-SVD方法对(d)中的稀疏模型求解稀疏矢量,并计算平均空间功率谱以及峰值所对应声源的到达方向(Direction ofArrival,DOA)。
2.根据权利要求1所述的一种基于AVS和稀疏表示的单语者声源DOA估计方法,其特征在于,该方法使用的声学矢量传感器包含一个全向压力传感器和三个同位正交放置的压力梯度传感器;同位放置的传感器可保证整体结构紧凑、尺寸小。
3.根据权利要求1所述的一种基于AVS和稀疏表示的单语者声源DOA估计方法,其特征在于,所述步骤(b)采用正弦迹算法提取高信噪比时频点。研究表明,正弦迹只出现在语音信号的浊音区域,反映了一段语音信号的谐波结构,因此正弦迹上的数据点会具有较高的信噪比。
4.根据权利要求1所述的一种基于AVS和稀疏表示的单语者声源DOA估计方法,其特征在于,所述步骤(c)中对各传感器接收信号的短时傅里叶变换的幅度谱,在每个高信噪比时频点都求此数据比值(即ISDR值),这是基于语音的时频稀疏性假设,在高信噪比时频点下由单一声源主导。
5.根据权利要求1所述的一种基于AVS和稀疏表示的单语者声源DOA估计方法,其特征在于,所述步骤(d)是基于语者声源的空间稀疏性,构建稀疏模型,最终将DOA估计问题转化为重构稀疏矢量的问题。
CN201310726022.1A 2013-12-25 2013-12-25 一种基于avs和稀疏表示的单语者声源doa估计方法 Active CN103760520B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310726022.1A CN103760520B (zh) 2013-12-25 2013-12-25 一种基于avs和稀疏表示的单语者声源doa估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310726022.1A CN103760520B (zh) 2013-12-25 2013-12-25 一种基于avs和稀疏表示的单语者声源doa估计方法

Publications (2)

Publication Number Publication Date
CN103760520A true CN103760520A (zh) 2014-04-30
CN103760520B CN103760520B (zh) 2016-05-18

Family

ID=50527788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310726022.1A Active CN103760520B (zh) 2013-12-25 2013-12-25 一种基于avs和稀疏表示的单语者声源doa估计方法

Country Status (1)

Country Link
CN (1) CN103760520B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391268A (zh) * 2014-11-21 2015-03-04 哈尔滨工业大学深圳研究生院 一种波达方位角的检测方法
CN104407319A (zh) * 2014-12-01 2015-03-11 广东电网有限责任公司电力调度控制中心 阵列信号的目标源测向方法和系统
CN105676167A (zh) * 2016-01-13 2016-06-15 北京大学深圳研究生院 一种基于声学矢量传感器和双谱变换的鲁棒单语者声源doa估计方法
CN106407929A (zh) * 2016-09-14 2017-02-15 中山大学 一种应用于大区域交通噪声计算的优化方法
CN107221336A (zh) * 2017-05-13 2017-09-29 深圳海岸语音技术有限公司 一种增强目标语音的装置及其方法
CN108490384A (zh) * 2018-03-30 2018-09-04 深圳海岸语音技术有限公司 一种小型空间声源方位探测装置及其方法
CN108957390A (zh) * 2018-07-09 2018-12-07 东南大学 一种存在互耦时基于稀疏贝叶斯理论的到达角估计方法
CN111505567A (zh) * 2020-03-25 2020-08-07 山东省科学院海洋仪器仪表研究所 基于单矢量水听器波达方向估计的多目标跟踪方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430528B1 (en) * 1999-08-20 2002-08-06 Siemens Corporate Research, Inc. Method and apparatus for demixing of degenerate mixtures
CN101957443A (zh) * 2010-06-22 2011-01-26 嘉兴学院 声源定位方法
CN103308889A (zh) * 2013-05-13 2013-09-18 辽宁工业大学 复杂环境下被动声源二维doa估计方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6430528B1 (en) * 1999-08-20 2002-08-06 Siemens Corporate Research, Inc. Method and apparatus for demixing of degenerate mixtures
CN101957443A (zh) * 2010-06-22 2011-01-26 嘉兴学院 声源定位方法
CN103308889A (zh) * 2013-05-13 2013-09-18 辽宁工业大学 复杂环境下被动声源二维doa估计方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Y.X.ZOU ET AL.: "MULTISOURCE DOA ESTIMATION BASED ON TIME-FREQUENCY SPARSITY AND JOINT INTER-SENSOR DATA RATIO WITH SINGLE ACOUSTIC VECTOR SENSOR", 《ACOUSTICS, SPEECH AND SIGNAL PROCESSING(ICASSP), 2013 IEEE INTERNATIONAL CONFERENCE ON》, 31 May 2013 (2013-05-31), pages 4011 - 4015, XP032509200, DOI: doi:10.1109/ICASSP.2013.6638412 *
付金山 等: "声矢量阵DOA估计的稀疏分解理论研究", 《哈尔滨工程大学学报》, vol. 34, no. 3, 31 March 2013 (2013-03-31), pages 280 - 286 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104391268A (zh) * 2014-11-21 2015-03-04 哈尔滨工业大学深圳研究生院 一种波达方位角的检测方法
CN104391268B (zh) * 2014-11-21 2017-10-13 哈尔滨工业大学深圳研究生院 一种波达方位角的检测方法
CN104407319A (zh) * 2014-12-01 2015-03-11 广东电网有限责任公司电力调度控制中心 阵列信号的目标源测向方法和系统
CN105676167A (zh) * 2016-01-13 2016-06-15 北京大学深圳研究生院 一种基于声学矢量传感器和双谱变换的鲁棒单语者声源doa估计方法
CN105676167B (zh) * 2016-01-13 2018-04-20 北京大学深圳研究生院 一种基于声学矢量传感器和双谱变换的鲁棒单语者声源doa估计方法
CN106407929B (zh) * 2016-09-14 2019-09-20 中山大学 一种应用于大区域交通噪声计算的优化方法
CN106407929A (zh) * 2016-09-14 2017-02-15 中山大学 一种应用于大区域交通噪声计算的优化方法
CN107221336B (zh) * 2017-05-13 2020-08-21 深圳海岸语音技术有限公司 一种增强目标语音的装置及其方法
CN107221336A (zh) * 2017-05-13 2017-09-29 深圳海岸语音技术有限公司 一种增强目标语音的装置及其方法
CN108490384A (zh) * 2018-03-30 2018-09-04 深圳海岸语音技术有限公司 一种小型空间声源方位探测装置及其方法
WO2019184020A1 (zh) * 2018-03-30 2019-10-03 深圳海岸语音技术有限公司 一种小型空间声源方位探测装置及其方法
US11408962B2 (en) 2018-03-30 2022-08-09 Vecsense Technology Co., Ltd Small spatial sound source orientation detecting device and method thereof
CN108957390A (zh) * 2018-07-09 2018-12-07 东南大学 一种存在互耦时基于稀疏贝叶斯理论的到达角估计方法
CN108957390B (zh) * 2018-07-09 2022-03-18 东南大学 一种存在互耦时基于稀疏贝叶斯理论的到达角估计方法
CN111505567A (zh) * 2020-03-25 2020-08-07 山东省科学院海洋仪器仪表研究所 基于单矢量水听器波达方向估计的多目标跟踪方法
CN111505567B (zh) * 2020-03-25 2022-09-06 山东省科学院海洋仪器仪表研究所 基于单矢量水听器波达方向估计的多目标跟踪方法

Also Published As

Publication number Publication date
CN103760520B (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
CN103760520B (zh) 一种基于avs和稀疏表示的单语者声源doa估计方法
CN102103200B (zh) 一种分布式非同步声传感器的声源空间定位方法
CN105301563B (zh) 一种基于一致聚焦变换最小二乘法的双声源定位方法
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
Blandin et al. Multi-source TDOA estimation in reverberant audio using angular spectra and clustering
CN104076331B (zh) 一种七元麦克风阵列的声源定位方法
CN104053107B (zh) 一种用于噪声环境下声源分离和定位方法
CN103278801A (zh) 一种变电站噪声成像侦测装置及侦测计算方法
CN102147458B (zh) 一种针对宽带声源的波达方向估计方法及其装置
CN102305925A (zh) 一种机器人连续声源定位方法
CN102411138A (zh) 一种机器人声源定位方法
CN110534126B (zh) 一种基于固定波束形成的声源定位和语音增强方法及系统
CN111540347A (zh) 基于音频的电缆隧道监测方法及系统
CN103713276B (zh) 基于最小互熵谱分析的波达方向估计方法
CN109859749A (zh) 一种语音信号识别方法和装置
CN106093866A (zh) 一种适用于空心球阵列的声源定位方法
CN110515034A (zh) 一种声信号方位角测量系统及方法
CN103559893A (zh) 一种水下目标gammachirp倒谱系数听觉特征提取方法
CN102736064A (zh) 一种基于压缩传感器的助听器声源定位方法
CN101771923A (zh) 一种眼镜数字助听器声源定位方法
CN109001681A (zh) 多声源定位中构造压缩观测矩阵的方法
CN203148562U (zh) 一种变电站噪声成像侦测装置
CN105676167B (zh) 一种基于声学矢量传感器和双谱变换的鲁棒单语者声源doa估计方法
CN204795569U (zh) 一种便携式双传声器声源识别与定位装置
Kumar et al. Robust source localization and tracking using music-group delay spectrum over spherical arrays

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170522

Address after: 518052 Guangdong city of Shenzhen province Qianhai Shenzhen Hong Kong cooperation zone before Bay Road No. 1 building 201 room A

Patentee after: Shenzhen coast Speech Technology Co., Ltd.

Address before: 518055 Guangdong city in Shenzhen Province, Nanshan District City Xili North Park University

Patentee before: Shenzhen Graduate School of Peking University

TR01 Transfer of patent right