CN103076593B - 一种声源定位方法及装置 - Google Patents

一种声源定位方法及装置 Download PDF

Info

Publication number
CN103076593B
CN103076593B CN201210587043.5A CN201210587043A CN103076593B CN 103076593 B CN103076593 B CN 103076593B CN 201210587043 A CN201210587043 A CN 201210587043A CN 103076593 B CN103076593 B CN 103076593B
Authority
CN
China
Prior art keywords
sound source
microphone
source position
correlation function
worth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210587043.5A
Other languages
English (en)
Other versions
CN103076593A (zh
Inventor
应冬文
李军锋
冯永强
潘接林
颜永红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Acoustics CAS
Shanghai Advanced Research Institute of CAS
Beijing Kexin Technology Co Ltd
Original Assignee
Institute of Acoustics CAS
Shanghai Advanced Research Institute of CAS
Beijing Kexin Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS, Shanghai Advanced Research Institute of CAS, Beijing Kexin Technology Co Ltd filed Critical Institute of Acoustics CAS
Priority to CN201210587043.5A priority Critical patent/CN103076593B/zh
Publication of CN103076593A publication Critical patent/CN103076593A/zh
Application granted granted Critical
Publication of CN103076593B publication Critical patent/CN103076593B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种声源定位方法及装置,该方法包括:将通过麦克风阵列接收的声源信号转化成数字声音信号,所述麦克风阵列中包括多个麦克风;对所述数字声音信号进行频谱提取和白化处理,得到针对每个麦克风的数字声音信号的白化频谱;根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值;根据所述声源位置第一值为可控响应功率计算中的每一对交叉相关函数赋予权重系数,根据权重系数计算声源位置第二值;比较所述声源位置第一值与所述声源位置第二值,根据比较结果确定最终的声源位置。本发明通过为可控响应功率计算中的每一对交叉相关函数赋予权重系数,弱化不可靠的交叉相关函数对最终定位结果的影响,从而提高了声源定位的鲁棒性。

Description

一种声源定位方法及装置
技术领域
本发明涉及声源定位领域,尤其涉及一种基于加权的交叉相关函数的可控响应功率的声源定位方法及装置。
背景技术
声源定位在麦克风阵列的应用中占据重要位置,它可用于远程会议,为麦克风阵列指示波束聚焦的方向,为会议摄像头提供指向信息。声源定位技术可以指示声源目标所在的空间方位,为后续的信息采集与处理提供重要的空间信息。
可控响应功率的声源定位算法是声源定位领域应用最为广泛的算法,它以噪声和混响条件下的鲁棒性而著称。在这类声源定位方法中,其中一种流行的快速可控响应功率方法是采用广义交叉相关实现的。该方法采用麦克风对之间形成的交叉相关函数,计算声源在各个可能位置上的功率谱,寻求产生最大功率的方位。然而,该方法存在一个根本性的问题,即受到声源入射方向、环境噪声、以及混响的影响,各个交叉相关函数的可靠性并不相同。传统的实现方法对所有的交叉相关函数同等对待,但是一些可靠性较低的交叉相关函数对最终的定位结果产生了副作用。
发明内容
本发明的目的是提供一种能够克服上述缺陷的声源定位方法及装置。
在本发明的第一方面,提供了一种声源定位方法,包括:将通过麦克风阵列接收的声源信号转化成数字声音信号,所述麦克风阵列中包括多个麦克风;对所述数字声音信号进行频谱提取和白化处理,得到针对每个麦克风的数字声音信号的白化频谱;根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值;根据所述声源位置第一值计算声源位置第二值;以及比较所述声源位置第一值与所述声源位置第二值,根据比较结果确定所述声源的位置。
在本发明的第二方面,提供了一种声源定位装置,包括:麦克风阵列,用于接收声源信号并将其转化成数字声音信号,所述麦克风阵列中包括多个麦克风;频谱提取白化模块,用于对所述数字声音信号进行频谱提取和白化处理,得到针对每个麦克风的数字声音信号的白化频谱;第一计算模块,用于根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值;第二计算模块,用于根据所述声源位置第一值计算声源位置第二值;以及比较确定模块,用于比较所述声源位置第一值与所述声源位置第二值,根据比较结果确定所述声源的位置。
本发明通过根据可控响应功率计算中的交叉相关函数的可靠性为其赋予各自的权重系数,从而排除不可靠的交叉相关对最终定位结果的影响。提高了声源定位方法的鲁棒性。
附图说明
图1是根据本发明实施例的声源定位方法的流程图;以及
图2是根据本发明实施例的声源定位装置的示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
图1是根据本发明实施例的基于权重的声源定位方法的流程图。
在步骤101,将通过麦克风阵列接收的声源信号转换成数字声音信号。
在步骤102,提取该数字声音信号的频谱并对其进行白化处理,得到针对麦克风阵列中每个麦克风的数字声音信号的白化频谱。
首先,可以通过对数字声音信号进行快速傅利叶变换(FFT)的方式来提取频谱。在进行快速傅利叶变换之前,先要对接收到的数字声音信号进行缓存。对一帧的数字声音信号先补零到N点,N≥F,N=2j,j为整数,且j≥8;然后,进行N点的快速傅利叶变换,得到一帧的数字化声音信号的离散频谱Yl,k
其中,yl,n表示缓存中第l个麦克风采集信号的第n个采样点,Yl,k表示缓存中第l个麦克风采集信号的傅利叶变换系数(k=0,1,...,N-1)。
然后,对上面得到的傅利叶变换系数进行白化处理,得到白化后的傅利叶系数, Y ‾ l , l = Y l , k / | Y l , k | .
优选地,可以在频谱提取和白化处理之前,对每一帧的数字声音信号进行预处理,可以设每帧长度为F点,所述的预处理包括有加窗和/或预加重处理,加窗函数可以采用汉明窗(hamming)或哈宁窗(hanning)。然后,对预处理之后的数字声音信号进行频谱提取和白化处理。
在步骤103,根据该白化频谱得到针对交叉配对的每一对麦克风的数字声音信号的交叉相关函数。
首先,针对每个麦克风的数字化声音的白化后的傅利叶系数进行交叉相关处理。例如,可以对来自每对麦克风的数字化声音信号的白化傅利叶系数进行点乘。麦克风阵列中的麦克风两两交叉配对,例如,对于由第p个和第q个麦克风组成的第i个对的白化傅利叶系数,对其进行反傅利叶变换xi,r的实部real(xi,n)表示麦克风对的两个信号的交叉相关函数。
在步骤104,根据该交叉相关函数得到交叉匹配的每一对麦克风中两个麦克风接收声源信号的时间延迟。
对交叉相关函数real(xi,n)循环移动N/2个采样点,得到该相关函数的序列zi,k。根据麦克风对中两个麦克风的间距di计算最大时间延迟τmax=fix(fsdi/c),其中fs表示信号的采样率,c表示声速,fix表示取整数运算。在从k1=N/2-τmax到k2=N/2+τmax的范围内,在序列中搜索最大值,该最大值对应的时间索引即为第p个和第q个麦克风信号间的时间延迟。依此类推,可以求取所有麦克风对之间的时间延迟τi
在步骤105,根据交叉相关函数和时间延迟计算声源位置第一值。
假定针对每一麦克风对的交叉相关函数的权重系数相等,例如令每对交叉相关函数的权重wij=1/M,则可以根据可控响应功率算法求取声源位置x。可控响应功率的计算公式如下。
在所有交叉相关函数的可控响应功率中找出最大值,其对应的参数组即为声源位置第一值,即声源位置的一个初始计算值,其中,ρ为声源距离、为声源入射的方位角、为声源入射的仰角。
在步骤106,根据声源位置第一值、时间延迟τi和麦克风对的间距来计算针对每一麦克风对的交叉相关函数的权重。应当理解,每一对交叉相关函数的权重系数取决于与声源位置第一值对应的声波入射方向和麦克风对连线之间的夹角,即声源相对于这对麦克风的位置,这个位置可称为相对位置。
一方面,可以通过广义交叉相关得出该夹角的估计值也就是上面提到的相对位置:
θ ^ ij = arccos ( c τ ^ ij / d ij )
其中c表示空气在声波中的传播速度,dij表示麦克风对的间距,表示交叉相关得到的时间延迟估计。
另一方面,可以根据声波入射方向和麦克风对连线的几何关系,得到声波入射方向和麦克风对连线之间的夹角的值θij为:
θij=arccos(xTrij)
在理想条件下,θij应该相等。在实际情况中,由于外界的各种干扰因素,导致θij产生偏差。进一步,交叉相关函数的可靠性便由θij之差确定。偏差越大,该交叉相关函数的可靠性越低;偏差越小,则该交叉相关函数的可靠性越高。θij之间的角度差δij可以通过下面的公式来计算:
δij=arccos(xTrij)-arccos(cτij/dij)
接下来,假定角度差遵从零均值的高斯分布,则其方差σ2可以计算为:
σ 2 = Σ j Σ i δ ij 2 / M
其中,M表示麦克风阵列中麦克风的对数。
最后,根据下面公式计算每一对交叉相关函数的权重系数wij
w ij = exp ( δ ij 2 / σ 2 ) / Σ j Σ i exp ( δ ij 2 / σ 2 ) .
在步骤107,根据该交叉相关函数及其权重和该时间延迟来计算一个新的声源位置,可称为声源位置第二值。
通过计算所有可能声源位置的可控响应功率找出一个新的声源位置。每一对交叉相关函数的可控响应功率可以通过下面的公式来计算:
然后,在多个可控响应功率中找出最大的可控响应功率,根据该最大的可控响应功率找到一个新的声源位置其对应的是参数组即距离ρ、方位角、仰角组成的三元组表达。在远场的情况下,也可以只采用方位角和仰角描述。一般来说,可以采用三元组描述空间方位/声源位置。
在步骤108,判断声源位置第一值和声源位置第二值之差是否小于预定阈值。例如,可以通过判断是否无限接近于1来判断判断x和是否近似相等。如果无限接近于1,则表示算法收敛,声源位置第二值对应的即为最终所求的声源位置/空间方位;否则,令流程跳转到步骤106。
其实,本发明首先假设所有子阵列的权重系数相同,从而求取一个声源位置x的粗略估计值,用此估计值来求取交叉相关函数的权重系数,用加权的交叉相关函数来求取新的声源位置估计值此迭代不断循环,直至判断出声源位置估计收敛为止。
图2是根据本发明实施例的声源定位装置的示意图。
如图2所示,该声源定位装置包括麦克风阵列、频谱提取白化模块、第一计算模块、第二计算模块和比较确定模块。
数字化模块将通过麦克风阵列接收的声源信号转换成数字声音信号。
频谱提取白化模块提取该数字声音信号的频谱并对其进行白化处理,得到针对麦克风阵列中每个麦克风的数字声音信号的白化频谱。
首先,可以通过对数字声音信号进行快速傅利叶变换(FFT)的方式来提取频谱。在进行快速傅利叶变换之前,先要对接收到的数字声音信号进行缓存。对一帧的数字声音信号先补零到N点,N≥F,N=2j,j为整数,且j≥8;然后,进行N点的快速傅利叶变换,得到一帧的数字化声音信号的离散频谱Yl,k
其中,yl,n表示缓存中第l个麦克风采集信号的第n个采样点,Yl,k表示缓存中第l个麦克风采集信号的傅利叶变换系数(k=0,1,...,N-1)。
然后,对上面得到的傅利叶变换系数进行白化处理,得到白化后的傅利叶系数, Y ‾ l , l = Y l , k / | Y l , k | .
优选地,该声源定位装置还可以包括预处理模块(图中未示出),用于在频谱提取和白化处理之前,对每一帧的数字声音信号进行预处理,可以设每帧长度为F点,所述的预处理包括有加窗和/或预加重处理,加窗函数可以采用汉明窗(hamming)或哈宁窗(hanning)。然后,对预处理之后的数字声音信号进行频谱提取和白化处理。
第一计算模块根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值。
首先,第一计算模块根据该白化频谱得到针对交叉配对的每一对麦克风的数字声音信号的交叉相关函数。例如,可以对来自每对麦克风的数字化声音信号的白化傅利叶系数进行点乘。麦克风阵列中的麦克风两两交叉配对,例如,对于由第p个和第q个麦克风组成的第i个对的白化傅利叶系数,对其进行反傅利叶变换xi,r的实部real(xi,n)表示麦克风对的两个信号的交叉相关函数。
接下来,第一计算模块根据该交叉相关函数得到交叉匹配的每一对麦克风中两个麦克风接收声源信号的时间延迟。
对交叉相关函数real(xi,n)循环移动N/2个采样点,得到该相关函数的序列zi,k。根据麦克风对中两个麦克风的间距di计算最大时间延迟τmax=fix(fsdi/c),其中fs表示信号的采样率,c表示声速,fix表示取整数运算。在从k1=N/2-τmax到k2=N/2+τmax的范围内,在序列中搜索最大值,该最大值对应的时间索引即为第p个和第q个麦克风信号间的时间延迟。依此类推,可以求取所有麦克风对之间的时间延迟τi
然后,第一计算模块根据交叉相关函数和时间延迟计算声源位置第一值,具体执行流程如下。
假定针对每一麦克风对的交叉相关函数的权重系数相等,例如令每对交叉相关函数的权重wij=1/M,则可以根据可控响应功率算法求取声源位置x。可控响应功率的计算公式如下。
在所有交叉相关函数的可控响应功率中找出最大值,其对应的参数组即为声源位置第一值,即声源位置的一个初始计算值,其中,ρ为声源距离、为声源入射的方位角、为声源入射的仰角。
第二计算模块根据声源位置第一值来计算声源位置第二值,具体计算过程如下所述。
第二计算模块根据声源位置第一值、时间延迟τi和麦克风对的间距来计算针对每一麦克风对的交叉相关函数的权重。应当理解,每一对交叉相关函数的权重系数取决于与声源位置第一值对应的声波入射方向和麦克风对连线之间的夹角相关,即声源相对于这对麦克风的位置,这个位置可称为相对位置。
一方面,可以通过广义交叉相关得出该夹角的估计值也就是上面提到的相对位置:
θ ^ ij = arccos ( c τ ^ ij / d ij )
其中c表示空气在声波中的传播速度,dij表示麦克风对的间距,表示交叉相关得到的时间延迟估计。
另一方面,可以根据声波入射方向和麦克风对连线的几何关系,得到声波入射方向和麦克风对连线之间的夹角的值θij为:
θij=arccos(xTrij)
在理想条件下,θij应该相等。在实际情况中,由于外界的各种干扰因素,导致θij产生偏差。进一步,交叉相关函数的可靠性便由θij之差确定。偏差越大,该交叉相关函数的可靠性越低;偏差越小,则该交叉相关函数的可靠性越高。θij之间的角度差δij可以通过下面的公式来计算:
δij=arccos(xTrij)-arccos(cτij/dij)
接下来,计算该角度差的方差 σ 2 = Σ j Σ i δ ij 2 / M .
最后,根据下面公式计算每一对交叉相关函数的权重系数wij
w ij = exp ( δ ij 2 / σ 2 ) / Σ j Σ i exp ( δ ij 2 / σ 2 ) .
然后,根据该交叉相关函数及其权重和该时间延迟来计算一个新的声源位置,可称为声源位置第二值,其中,可以根据该交叉相关函数及其权重和该时间延迟计算所有可能声源位置的可控响应功率找出一个新的声源位置。每一对交叉相关函数的可控响应功率可以通过下面的公式来计算:
最后,在多个可控响应功率中找出最大的可控响应功率,根据该最大的可控响应功率找到一个新的声源位置其对应的是参数组即距离ρ、方位角、仰角组成的三元组表达。在远场的情况下,也可以只采用方位角和仰角描述。一般来说,可以采用三元组描述空间方位/声源位置。
判断确定模块判断声源位置第一值和声源位置第二值之差是否小于预定阈值。例如,可以通过判断是否无限接近于1来判断判断x和是否近似相等。如果无限接近于1,则表示算法收敛,声源位置第二值对应的即为最终所求的声源位置/空间方位;否则,令第二计算模块按照新的x来计算针对每一麦克风对的交叉相关函数的权重,进而计算出新的声源位置第二值,继续进行上述比较判断,直至最终符合判断条件为止。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种声源定位方法,包括:
将通过麦克风阵列接收的声源信号转化成数字声音信号,所述麦克风阵列中包括多个麦克风;
对所述数字声音信号进行频谱提取和白化处理,得到针对每个麦克风的数字声音信号的白化频谱;
根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值;
根据所述声源位置第一值计算声源位置第二值;以及
比较所述声源位置第一值与所述声源位置第二值,根据比较结果确定所述声源位置;
所述根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值的步骤包括:
对针对每个麦克风的数字声音信号的白化频谱进行交叉相关,得到针对交叉匹配的每一对麦克风的数字声音信号的交叉相关函数;
根据所述交叉相关函数得到交叉匹配的每一对麦克风中两个麦克风接收声源的声音信号的时间延迟;以及
根据所述交叉相关函数和所述时间延迟计算多个可控响应功率,并且根据其中的最大可控响应功率得到所述声源位置第一值;
所述根据所述声源位置第一值计算声源位置第二值的步骤包括:
根据所述声源位置第一值、所述时间延迟及其对应的交叉匹配的每一对麦克风的间距,计算每一交叉相关函数的权重;以及
根据所述每一交叉相关函数及其权重、以及所述时间延迟计算多个可控响应功率,并且根据其中的最大可控响应功率得到所述声源位置第二值;
所述根据所述交叉相关函数得到交叉匹配的每一对麦克风中两个麦克风接收声源的声音信号的时间延迟的步骤包括:
根据所述交叉相关函数得到交叉相关函数序列,并且根据交叉匹配的每一对麦克风的间距计算最大时间延迟;
根据所述最大时间延迟确定搜索范围;
根据所述搜索范围,在所述交叉相关函数序列中搜索最大值;以及
根据所述最大值得到交叉匹配的每一对麦克风中两个麦克风接收声源的声音信号的时间延迟;
根据所述声源位置第一值、所述时间延迟及其对应的交叉匹配的每一对麦克风的间距,计算每一交叉相关函数的权重的步骤包括:
根据声源位置第一值计算对应的声音信号入射方向与麦克风对连线之间的夹角;
根据所述时间延迟和麦克风对的间距估计所述夹角的估计值;
计算所述夹角和所述夹角的估计值的角度差的方差;以及
根据所述方差计算每一交叉相关函数的权重。
2.根据权利要求1所述的方法,还包括:
对所述数字声音信号进行加窗和/或加重处理之后再进行所述频谱提取和白化处理。
3.根据权利要求1所述的方法,其中,所述频谱提取是通过对所述数字声音信号进行快速傅利叶变换FFT得到的。
4.根据权利要求1所述的方法,其中,所述比较所述声源位置第一值与所述声源位置第二值,根据比较结果确定最终的声源位置的步骤包括:
比较所述声源位置第一值与所述声源位置第二值,如果所述声源位置第一值和所述声源位置第二值之差不大于预定阈值,则将所述声源位置第二值确定为所述声源的位置。
5.一种声源定位装置,包括:
麦克风阵列,用于接收声源信号并将其转化成数字声音信号,所述麦克风阵列中包括多个麦克风;
频谱提取白化模块,用于对所述数字声音信号进行频谱提取和白化处理,得到针对每个麦克风的数字声音信号的白化频谱;
第一计算模块,用于根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值;
所述用于根据针对每个麦克风的数字声音信号的白化频谱计算出声源位置第一值步骤包括:
对针对每个麦克风的数字声音信号的白化频谱进行交叉相关,得到针对交叉匹配的每一对麦克风的数字声音信号的交叉相关函数;
根据所述交叉相关函数得到交叉匹配的每一对麦克风中两个麦克风接收声源的声音信号的时间延迟;以及
根据所述交叉相关函数和所述时间延迟计算多个可控响应功率,并且根据其中的最大可控响应功率得到所述声源位置第一值;
所述根据所述交叉相关函数得到交叉匹配的每一对麦克风中两个麦克风接收声源的声音信号的时间延迟的步骤包括:
根据所述交叉相关函数得到交叉相关函数序列,并且根据交叉匹配的每一对麦克风的间距计算最大时间延迟;
根据所述最大时间延迟确定搜索范围;
根据所述搜索范围,在所述交叉相关函数序列中搜索最大值;以及
根据所述最大值得到交叉匹配的每一对麦克风中两个麦克风接收声源的声音信号的时间延迟;
第二计算模块,用于根据所述声源位置第一值计算声源位置第二值;
所述根据所述声源位置第一值计算声源位置第二值的步骤包括:
根据所述声源位置第一值、所述时间延迟及其对应的交叉匹配的每一对麦克风的间距,计算每一交叉相关函数的权重;以及
根据所述每一交叉相关函数及其权重、以及所述时间延迟计算多个可控响应功率,并且根据其中的最大可控响应功率得到所述声源位置第二值;
根据所述声源位置第一值、所述时间延迟及其对应的交叉匹配的每一对麦克风的间距,计算每一交叉相关函数的权重的步骤包括:
根据声源位置第一值计算对应的声音信号入射方向与麦克风对连线之间的夹角;
根据所述时间延迟和麦克风对的间距估计所述夹角的估计值;
计算所述夹角和所述夹角的估计值的角度差的方差;以及
根据所述方差计算每一交叉相关函数的权重;以及
比较确定模块,用于比较所述声源位置第一值与所述声源位置第二值,根据比较结果确定所述声源的位置。
6.根据权利要求5所述的声源定位装置,还包括:
预处理模块,用于对所述数字声音信号进行预加窗和/或加重之后再进行所述频谱提取和白化处理。
CN201210587043.5A 2012-12-28 2012-12-28 一种声源定位方法及装置 Expired - Fee Related CN103076593B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210587043.5A CN103076593B (zh) 2012-12-28 2012-12-28 一种声源定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210587043.5A CN103076593B (zh) 2012-12-28 2012-12-28 一种声源定位方法及装置

Publications (2)

Publication Number Publication Date
CN103076593A CN103076593A (zh) 2013-05-01
CN103076593B true CN103076593B (zh) 2014-09-10

Family

ID=48153180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210587043.5A Expired - Fee Related CN103076593B (zh) 2012-12-28 2012-12-28 一种声源定位方法及装置

Country Status (1)

Country Link
CN (1) CN103076593B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103995252B (zh) * 2014-05-13 2016-08-24 南京信息工程大学 一种三维空间声源定位方法
CN104284081B (zh) * 2014-05-14 2016-05-18 深圳警翼数码科技有限公司 一种执法记录仪及其控制方法
CA2970327C (en) * 2014-12-09 2023-10-10 Cmte Development Limited Method and system for the detection of conductive objects
CN106405501B (zh) * 2015-07-29 2019-05-17 中国科学院声学研究所 一种基于相位差回归的单声源定位方法
CN105491520A (zh) * 2015-11-24 2016-04-13 裴兆欣 一种电子设备定位连接方法及系统
CN108269581B (zh) * 2017-01-04 2021-06-08 中国科学院声学研究所 一种基于频域相干函数的双麦克风时延差估计方法
CN107333093B (zh) * 2017-05-24 2019-11-08 苏州科达科技股份有限公司 一种声音处理方法、装置、终端及计算机可读存储介质
CN107159435B (zh) * 2017-05-25 2019-07-09 洛阳语音云创新研究院 一种磨机工作状态调整方法及装置
CN107621625B (zh) * 2017-06-23 2020-07-17 桂林电子科技大学 基于双微麦克风阵的声源定位方法
CN110797045A (zh) * 2018-08-01 2020-02-14 北京京东尚科信息技术有限公司 声音处理方法、系统、电子设备和计算机可读介质
CN109270493B (zh) * 2018-10-16 2020-06-26 苏州思必驰信息科技有限公司 声源定位方法和装置
CN110716177B (zh) * 2019-10-22 2022-09-09 哈尔滨工程大学 分布式声学定位网络中多目标分类方法
CN111314839A (zh) * 2020-03-06 2020-06-19 湘潭大学 一种可辨别声源方向的挂件及其实现方法
CN111856402B (zh) * 2020-07-23 2023-08-18 海尔优家智能科技(北京)有限公司 信号处理方法及装置、存储介质、电子装置
CN112558004B (zh) * 2021-02-22 2021-05-28 北京远鉴信息技术有限公司 一种波束信息波达方向的确定方法、装置、及存储介质
CN113936651A (zh) * 2021-08-24 2022-01-14 中国科学院深圳先进技术研究院 机器人的定位系统及方法
CN115655594B (zh) * 2022-12-12 2023-03-10 杭州兆华电子股份有限公司 一种基于声云图管道节流和泄漏的区分识别方法及装置
CN116859339B (zh) * 2023-09-01 2023-11-17 北京圣传创世科技发展有限公司 一种多边形区域内声源分离和定位方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030046727A (ko) * 2001-12-06 2003-06-18 박규식 서브밴드 씨피에스피 알고리듬을 이용한 음원위치추정방법및 그 시스템
NO318096B1 (no) * 2003-05-08 2005-01-31 Tandberg Telecom As Arrangement og fremgangsmate for lokalisering av lydkilde
CN101762806B (zh) * 2010-01-27 2013-03-13 华为终端有限公司 声源定位方法和装置
CN102707262A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种基于麦克风阵列的声源定位系统

Also Published As

Publication number Publication date
CN103076593A (zh) 2013-05-01

Similar Documents

Publication Publication Date Title
CN103076593B (zh) 一种声源定位方法及装置
CN107102296B (zh) 一种基于分布式麦克风阵列的声源定位系统
CN109272989B (zh) 语音唤醒方法、装置和计算机可读存储介质
CN110554357B (zh) 声源定位方法和装置
CN111624553B (zh) 声源定位方法及系统、电子设备及存储介质
CN110610718B (zh) 一种提取期望声源语音信号的方法及装置
TW202008352A (zh) 方位角估計的方法、設備、語音交互系統及儲存介質
CN107219512B (zh) 一种基于声传递函数的声源定位方法
CN105467364A (zh) 一种定位目标声源的方法和装置
CN109188362B (zh) 一种麦克风阵列声源定位信号处理方法
CN103176166B (zh) 一种用于水声被动定位的信号到达时延差跟踪算法
KR20190108804A (ko) 주파수 변화에 강인한 음향 이벤트 검출 방법 및 그 장치
CN112363112B (zh) 一种基于线性麦克风阵列的声源定位方法及装置
CN104898086B (zh) 适用于微型麦克风阵列的声强估计声源定向方法
US10755727B1 (en) Directional speech separation
CN107393549A (zh) 时延估计方法及装置
CN102760461A (zh) 一种自适应调节音量大小的音频播放设备和方法
CN106019230B (zh) 一种基于i-vector说话人识别的声源定位方法
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
WO2016119388A1 (zh) 一种基于语音信号构造聚焦协方差矩阵的方法及装置
CN102655002A (zh) 音频处理方法和音频处理设备
CN103901400B (zh) 一种基于时延补偿和双耳一致性的双耳声音源定位方法
Marti et al. Real time speaker localization and detection system for camera steering in multiparticipant videoconferencing environments
Dorfan et al. Distributed expectation-maximization algorithm for speaker localization in reverberant environments
CN112558004B (zh) 一种波束信息波达方向的确定方法、装置、及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHANGHAI ADVANCED RESEARCH INSTITUTE, CHINESE ACAD

Free format text: FORMER OWNER: SHANGHAI ZHONGKE INSTITUTE FOR ADVANCED STUDY BEIJING KEXIN TECHNOLOGY CO., LTD.

Effective date: 20131101

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20131101

Address after: 100190 Beijing City, North Fourth Ring Road West, No. 21, No.

Applicant after: INSTITUTE OF ACOUSTICS, CHINESE ACADEMY OF SCIENCES

Applicant after: SHANGHAI ADVANCED Research Institute CHINESE ACADEMY OF SCIENCES

Applicant after: BEIJING KEXIN TECHNOLOGY Co.,Ltd.

Address before: 100190 Beijing City, North Fourth Ring Road West, No. 21, No.

Applicant before: Institute of acoustics, Chinese Academy of Sciences

Applicant before: SHANGHAI ADVANCED Research Institute CHINESE ACADEMY OF SCIENCES

Applicant before: BEIJING KEXIN TECHNOLOGY Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140910