CN106226739A - 融合子带分析的双声源定位方法 - Google Patents

融合子带分析的双声源定位方法 Download PDF

Info

Publication number
CN106226739A
CN106226739A CN201610614364.8A CN201610614364A CN106226739A CN 106226739 A CN106226739 A CN 106226739A CN 201610614364 A CN201610614364 A CN 201610614364A CN 106226739 A CN106226739 A CN 106226739A
Authority
CN
China
Prior art keywords
signal
sound source
subband
voice signal
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610614364.8A
Other languages
English (en)
Inventor
黄丽霞
张雪英
陈宏涛
胡杰
李刚
王亚楠
昝丹斐
张晓丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan University of Technology
Original Assignee
Taiyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan University of Technology filed Critical Taiyuan University of Technology
Priority to CN201610614364.8A priority Critical patent/CN106226739A/zh
Publication of CN106226739A publication Critical patent/CN106226739A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Abstract

针对现存的双声源定位算法无法克服声源间相互干扰,从而无法获得各个声源准确位置的问题。本发明提出一种融合子带分析的平滑广义互相关双声源定位方法,提高混响环境下双声源定位的性能。该方法利用语音信号在频域的稀疏性,首先将语音信号频域划分为8个不同的子带;然后对各个子带中的广义互相关函数进行多帧加权平滑,获得平滑广义互相关函数;最后融合各子带的平滑广义互相关函数获得时间延迟信息,并结合空间四元阵几何定位算法获得各个声源的三维位置估计。本发明充分利用了语音信号频域的稀疏性,克服了两声源信号间的干扰,提高了算法在混响情况下的定位精度。

Description

融合子带分析的双声源定位方法
技术领域
本发明涉及应用声波及麦克风阵列结构来确定声源位置的方法,属于语音信号处理领域,具体涉及一种融合子带分析的双声源定位方法。
背景技术
声源定位已经成为语音信号处理领域的一个研究热点,在视频会议、智能机器人以及智能视频监控系统等领域有广泛的应用。目前,单声源定位算法已经有了一定的发展,并与硬件系统相结合,构建了比较完整的小型单声源定位系统。但是现存的多声源定位算法,无法克服声源信号之间的相互干扰,以致无法准确获得各个声源的位置。
目前针对多声源定位的算法大致可分为两种,一种算法是在定位前先对声源进行分离,然后对单个目标声源进行定位。例如文献“基于声达时间差的多声源目标定位系统”(中南大学学报第42卷S1期)运用了两种不同的技术,误差的叠加导致定位准确率降低。而且声源分离的相关参数需要经常调整,以便适应不同的环境噪声,适应性较低。
另一种算法是基于子带分析的多声源定位。文献“基于子带可控响应功率的多声源定位方法”(计算机工程与应用第49卷24期)中提到的多声源定位算法利用语音信号的稀疏性,将信号划分为不同的子带信号,再进行定位。但是该算法需要大量的声源和环境噪声的频谱特性的先验知识,实际应用中很难获得,而且计算量较大,无法实现实时定位。文献“Localization of Multiple Simultaneous Speakers by Combining the Informationfrom Different Subbands”(2013 21st Iranian Conference on ElectricalEngineering)中提到的多声源定位算法,其子带中采用的时延估计算法为传统的广义互相关(Generalized Cross Correlation,GCC)算法,该算法在存在混响的情况下性能会下降。
发明内容
本发明主要研究如何在两个声源同时发声的情况下,准确估计出各个声源的位置。为了提高双声源定位算法在混响环境下的性能,提出融合子带分析的双声源定位方法。该方法首先利用语音信号在频域的稀疏性,将混合语音信号频域分解为8个不同的子带。然后对各个子带中的GCC进行多帧加权平滑,获得SGCC函数。再融合各子带中的SGCC函数,得到各声源对应的时延估计值。最后结合空间几何定位算法得到各声源的三维位置估计。
本发明的具体技术方案如下:
融合子带分析的双声源定位方法,利用语音信号频域的稀疏性和基于声达时间差的声源定位技术进行双声源三维空间定位,包括以下步骤:
(A)麦克风阵列采集双声源混合语音信号,并对其进行预处理;
(B)将经过预处理的信号划分为子带信号;
(C)对各个子带信号中的语音信号进行预白化处理;
(D)计算预白化处理后的各个子带中任两路麦克风信号的平滑广义互相关函数;即Smooth Generalized Cross Correlation函数,简称SGCC函数;
(E)融合各个子带的SGCC函数,获得两路信号最终的SGCC函数,并根据所述SGCC函数的最大值确定声源信号到达两路麦克风的时延;
(F)根据麦克风阵列的几何位置和所述双声源信号到达两个麦克风的时延值,确定声源位置;
步骤(A)包括:
(1)采用四元矩形阵麦克风采集双声源混合语音信号;
(2)采用基于能量和过零率的双门限端点检测法确定语音信号的起始点和终止点,具体如下:对四元麦克风阵列所有麦克风接收到的信号x(n)进行分帧,每一帧表示为xi(n),n=1,2,...,N,n表示采样点,N表示帧长,i表示帧数;
计算语音信号每一帧的短时帧能量:计算语音信号每一帧的过零率:其中
第一级判决:首先根据语音信号的平均能量值即所有Ei的平均值设定一个较高的阈值T1,用来寻找语音的起始点;然后再利用噪声的平均能量设定一个较低的阈值T2,用来判定第一级判决中语音信号的终止点,至此第一级判决结束;
第二级判决:利用噪声的平均过零率ZN即所有Zi的平均值,设定一个阈值T3,用来判定语音信号开始时的清音和结尾处的尾音;
(3)采用FIR带通滤波器去除声源信号低频段和高频段的噪声,得到带通滤波后的声源信号;
对带通滤波后的信号进行加窗分帧,窗函数为n表示采样点,N表示帧长;
步骤(B)包括:采用FIR滤波器组将步骤(A)预处理后的语音信号均匀划分为8个不同的子带,FIR滤波器用于划分子带的冲击函数h(n)的Z变换为
步骤(C)采用公式xm(n)=IFFT{FFT[xm(n)]/|FFT[xm(n)]|}对划分完子带的语音信号进行预白化处理,其中xm(n)为第m个麦克风接收到的语音信号;每个子带中都包含有所有麦克风接收到的信号,对各个子带中每个麦克风接收到的语音信号都要进行预白化处理;
步骤(D)如下:设四元麦克风阵列中第m(m=1,2,3,4)个阵元接收的信号为式中,st(n)表示第t个声源信号;hmt(n)表示第t个声源与第m个麦克风之间的房间脉冲响应,即房间混响;*表示卷积;bm(n)表示房间背景噪声;
每个子带中任两路麦克风信号xq(n)、xj(n)之间的广义互相关函数为式中,为麦克风q和麦克风j接收信号的互功率谱;Xq(k)为xq(n)的短时傅里叶变换;H表示共轭;N为信号的样点数即帧长;Φ(k)为加权函数;本步骤采用PHAT加权函数:式中表示麦克风q和麦克风j接收信号的加权互功率谱;
引入一阶平滑滤波器对GCC-PHAT的加权互功率谱进行平滑处理,获得:
S x q x j ′ ′ i ( k ) = S x q x j ′ i ( k ) i = 1 ( 1 - α ) S x q x j ′ ′ i - 1 ( k ) + αS x q x j ′ i ( k ) i ≥ 2
式中,α为平滑系数,取值范围为(0<α<0.5),为经过平滑后的第i(i≥1)帧信号的加权互功率谱,为平滑前的第i(i≥1)帧信号的加权互功率谱;各个子带中任两路麦克风信号的平滑广义互相关函数计算公式为:
ψ ^ S G C C ( n ) = 1 N Σ k = 0 N - 1 S x q x j ′ ′ i ( k ) e j 2 π n k / N ;
步骤(E)包括:
采用加权平均的方法融合各个子带中任两路麦克风信号的SGCC函数:
ψ ^ S G C C ′ ( n ) = Σ O = 1 L ψ ^ O _ S G C C ( n ) * g L , L = 8
其中,
式中,表示各个子带中任两路麦克风信号的SGCC函数,L表示子带数,本发明将信号划分为8个子带,g表示对每个子带SGCC函数加权的权值;
对所述函数进行峰值检测,其中两个最大峰值对应的时间点即为两个声源到达两路麦克风的时延值。
本发明的原理说明:语音信号在频域具有稀疏性,在两个声源同时发声时,发出的语音片段在时域中会有重叠部分。但是由于各声源信号能量的不同,一个时频点将主要对应其中一个发言者(主要发言者)的频谱内容。考虑到计算的复杂性,本发明没有处理每个时频点对应的信号,而是将语音信号划分为不同的子带,对子带中的信号进行处理。
考虑到在混响情况下,GCC算法的性能会急速下降,本发明引入一阶平滑滤波器对子带中的GCC函数进行平滑。保持了各个帧信号之间的连续性,消除GCC算法中仅由当前帧信号估计出的结果的波动,提高时延估计的准确性,进而提高声源定位算法的精度。
与传统的双声源定位方法相比,本发明克服了声源信号间的相互干扰,提高了算法的定位精度。而且本发明有较高的抗混响性,能在强混响情况下准确估计出各个声源的位置。
附图说明
图1为本发明融合子带分析的双声源定位方法的框图;
图2为本发明中融合子带分析的时延估计算法框图;
图3为8通道FIR滤波器的频率响应;
图4为经过8通道FIR滤波器划分后的部分子带语音信号;
图5为SGCC时延估计的基本原理框图;
图6为四元麦克风阵列双声源定位模型。
具体实施方式
下面结合附图对发明技术方案进行详细说明:
本方法的流程图参见图1,本发明的一种融合子带分析的双声源定位方法,利用语音信号的稀疏性,结合子带分析的时延估计技术和空间几何定位技术进行双声源定位,具体实施步骤如下:
1、采用麦克风阵列采集双声源混合语音信号,并对其进行预处理。本发明的预处理包括:端点检测、预滤波及加窗分帧,具体包括:
端点检测是为了准确地确定语音信号的起始点和终止点,减小待处理语音信号的数据量,大大提高算法的利用率。本方法采用基于能量和过零率的双门限端点检测法,对麦克风采集到的语音信号进行检测。
对麦克风阵列信号x(n)进行分帧,每一帧表示为xi(n),n=1,2,...,N,n表示采样点,N表示帧长,i表示帧数。
计算语音信号的短时帧能量:
计算语音信号每一帧的过零率:其中
首先根据语音信号的平均能量值设定一个较高的阈值T1,用来寻找语音的起始点。然后再利用噪声的平均能量设定一个较低的阈值T2,用来判定第一级判决中语音信号的终止点,至此第一级判决结束。第二级判决(在第一级判决的基础上再进行的判决)利用噪声的平均过零率ZN,设定一个阈值T3,用来判定语音信号开始时的清音和结尾处的尾音。三个阈值的确定:首先计算最初10帧信号每帧的短时能量Ei,最大值记为EMAX,最小值记为EMIN,然后令:
I1=0.03(EMAX-EMIN)+EMIN,I2=4EMIN,T1和T2按下式确定:T2=min(I1,I2)T1=5T2。过零率阈值T3:T3=min(IF,zc+2fzc),IF为25;zc、fzc分别为最初10帧过零率的“均值”和“标准差”。
预滤波的目的是抑制信号中的高频和直流噪声,提高信噪比。语音信号的频率范围为300~3400Hz,而在各个频段中都可能有噪声的存在。所以在对信号进行处理前,本发明采用FIR带通滤波器去除信号低频段和高频段的噪声。
加窗分帧可以确保信号的短时平稳性。本发明采用交叠分段的办法进行分帧,以确保帧与帧之间能够平滑过渡,保持信号的连续性。采用矩形窗进行分帧,窗函数为本发明中信号采样率为fs=8000Hz,帧长256采样点,帧移128采样点。
2、对任两路麦克风采集到的信号进行时延估计,本发明融合子带分析的平滑广义互相关时延估计算法框图参见图2,具体包括:
a.将经过预处理的信号划分为子带信号。
与IIR滤波器相比,FIR滤波器具有线性相位特性,使得信号在传输时不会发生明显的相位失真。所以本发明采用FIR滤波器将语音信号均匀划分为8个子带FIR,8通道FIR滤波器的频率响应如图3所示,图4所示为利用FIR滤波器进行均匀子带划分后部分子带中的信号。
b.对各个子带中的信号进行预白化处理:
xm(n)=IFFT{FFT[xm(n)]/|FFT[xm(n)]|}。
c.计算各个子带中任两路麦克风信号的SGCC函数。
本发明SGCC函数的计算原理框图参见图5,其基本步骤为:
先将两路麦克风接收到的时域信号变换为频域信号,求它们的互功率谱,公式为:
表示麦克风q和麦克风j接收信号的互功率谱。Xq(k)为xq(k)的短时傅里叶变换,H表示共轭。
然后通过加权来锐化函数峰值,以抑制环境噪声和房间混响的影响,获得加权互功率谱。本发明采用的加权函数为PHAT,加权互功率谱:
引入一阶平滑滤波器对信号的加权互功率谱进行平滑处理,保持各个帧信号之间的连续性,消除仅由当前帧信号估计出的结果的波动,提高时延估计的准确性,进而提高声源定位算法的精度。公式如下:
S x q x j ′ ′ i ( k ) = S x q x j ′ i ( k ) i = 1 ( 1 - α ) S x q x j ′ ′ i - 1 ( k ) + αS x q x j ′ i ( k ) i ≥ 2
式中,α为平滑系数,取值范围为(0<α<0.5),表示经过平滑后的第i(i≥1)帧信号的加权互功率谱,为平滑前的第i(i≥1)帧信号的加权互功率谱。
最后通过傅里叶逆变换获得两路麦克风信号间的平滑广义互相关函数:
ψ ^ S G C C ( n ) = 1 N Σ k = 0 N - 1 S x q x j ′ ′ i ( k ) e j 2 π n k / N .
d.融合各个子带的SGCC函数,获得两路信号最终的SGCC函数。
采用加权平均的方式融合各个子带中的SGCC函数,即先对每个子带的SGCC函数进行加权,然后再求平均值获得最终的SGCC函数。其中权值为各子带中SGCC函数最大峰值与次大峰值幅度的比值,如下式所示:
ψ ^ S G C C ′ ( n ) = Σ O = 1 L ψ ^ O _ S G C C ( n ) * g L , L = 8
其中,
式中,g表示对每个子带SGCC函数加权的权值。当某个子带中只有一个声源为主要声源,即一个声源的能量远远大于另一个声源的能量时,最大峰值的幅度会远远大于次大峰值的幅度,该子带的权值也就相应的比较大;当某个子带中两声源的能量相近时,最大峰值的幅度与次大峰值的幅度比较接近,则该子带的权值就比较小。所以,该加权平均的方式充分地利用了语音信号频域的稀疏性,使得某些主要对应于一个发言者频谱内容的子带SGCC函数在最终SGCC函数中的比重增大,提高时延估计精度。
该函数两个最大峰值对应的时间点即为两个声源的时延值。
3、根据麦克风阵列的几何位置和所述双声源信号到达两个麦克风的时延值,确定声源位置。
建立四元阵双声源空间几何定位模型,参见图6。四个麦克风的坐标位置分别为M1(a1,b1,0),M2(a1,b2,0),M3(a2,b1,0),M4(a2,b2,0)。两声源信号的位置分别为S1(x,y,z),S2(x′,y′,z′)。取M1作为参考麦克风,利用本发明融合子带分析的平滑广义互相关时延估计算法分别计算出两声源相对于M1到达其余麦克风的时延值。假定S1相对于M1到达麦克风M2、M3、M4的时延值分别为τ21、τ31、τ41,S1到坐标原点的距离为r,S1到M1、M2、M3、M4的距离分别为d1、d2、d3、d4,声音在空气中的传播速度为c。则d21=d2-d1=τ21c;d31=d3-d1=τ31c;d41=d4-d1=τ41c。根据麦克风阵列和声源S1的几何位置关系可得到方程组:
x 2 + y 2 + z 2 = r 2 ( x - a 1 ) 2 + ( y - b 1 ) 2 + z 2 = d 1 2 ( x - a 1 ) 2 + ( y - b 2 ) 2 + z 2 = ( d 1 + τ 21 c ) 2 ( x - a 2 ) 2 + ( y - b 1 ) 2 + z 2 = ( d 1 + τ 31 c ) 2 ( x - a 2 ) 2 + ( y - b 2 ) 2 + z 2 = ( d 1 + τ 41 c ) 2
式中(x,y,z,r,d1)为未知数,通过计算方程组即可得到S1的具体位置S1(x,y,z);同理可得到S2的具体位置坐标S2(x′,y′,z′)。

Claims (3)

1.融合子带分析的双声源定位方法,其特征在于,利用语音信号频域的稀疏性和基于声达时间差的声源定位技术进行双声源三维空间定位,包括以下步骤:
(A)麦克风阵列采集双声源混合语音信号,并对其进行预处理;
(B)将经过预处理的信号划分为子带信号;
(C)对各个子带信号中的语音信号进行预白化处理;
(D)计算预白化处理后的各个子带中任两路麦克风信号的平滑广义互相关函数;即Smooth Generalized Cross Correlation函数,简称SGCC函数;
(E)融合各个子带的SGCC函数,获得两路信号最终的SGCC函数,并根据所述SGCC函数的最大值确定声源信号到达两路麦克风的时延;
(F)根据麦克风阵列的几何位置和所述双声源信号到达两个麦克风的时延值,确定声源位置;
步骤(A)包括:
(1)采用四元矩形阵麦克风采集双声源混合语音信号;
(2)采用基于能量和过零率的双门限端点检测法确定语音信号的起始点和终止点,具体如下:对四元麦克风阵列所有麦克风接收到的信号x(n)进行分帧,每一帧表示为xi(n),n=1,2,...,N,n表示采样点,N表示帧长,i表示帧数;
计算语音信号每一帧的短时帧能量:计算语音信号每一帧的过零率:其中
第一级判决:首先根据语音信号的平均能量值即所有Ei的平均值设定一个较高的阈值T1,用来寻找语音的起始点;然后再利用噪声的平均能量设定一个较低的阈值T2,用来判定第一级判决中语音信号的终止点,至此第一级判决结束;
第二级判决:利用噪声的平均过零率ZN即所有Zi的平均值,设定一个阈值T3,用来判定语音信号开始时的清音和结尾处的尾音;
(3)采用FIR带通滤波器去除声源信号低频段和高频段的噪声,得到带通滤波后的声源信号;
对带通滤波后的信号进行加窗分帧,窗函数为n表示采样点,N表示帧长;
步骤(B)包括:采用FIR滤波器组将步骤(A)预处理后的语音信号均匀划分为8个不同的子带,FIR滤波器用于划分子带的冲击函数h(n)的Z变换为
步骤(C)采用公式xm(n)=IFFT{FFT[xm(n)]/|FFT[xm(n)]|}对划分完子带的语音信号进行预白化处理,其中xm(n)为第m个麦克风接收到的语音信号;每个子带中都包含有所有麦克风接收到的信号,对各个子带中每个麦克风接收到的语音信号都要进行预白化处理;
步骤(D)如下:设四元麦克风阵列中第m(m=1,2,3,4)个阵元接收的信号为式中,st(n)表示第t个声源信号;hmt(n)表示第t个声源与第m个麦克风之间的房间脉冲响应,即房间混响;*表示卷积;bm(n)表示房间背景噪声;
每个子带中任两路麦克风信号xq(n)、xj(n)之间的广义互相关函数为式中,为麦克风q和麦克风j接收信号的互功率谱;Xq(k)为xq(n)的短时傅里叶变换;H表示共轭;N为信号的样点数即帧长;Φ(k)为加权函数;本步骤采用PHAT加权函数:式中表示麦克风q和麦克风j接收信号的加权互功率谱;
引入一阶平滑滤波器对GCC-PHAT的加权互功率谱进行平滑处理,获得:
S x q x j ′ ′ i ( k ) = S x q x j ′ i ( k ) i = 1 ( 1 - α ) S x q x j ′ ′ i - 1 ( k ) + αS x q x j ′ i ( k ) i ≥ 2
式中,α为平滑系数,取值范围为(0<α<0.5),为经过平滑后的第i(i≥1)帧信号的加权互功率谱,为平滑前的第i(i≥1)帧信号的加权互功率谱;各个子带中任两路麦克风信号的平滑广义互相关函数计算公式为:
ψ ^ S G C C ( n ) = 1 N Σ k = 0 N - 1 S x q x j ′ ′ i ( k ) e j 2 π n k / N ;
步骤(E)包括:
采用加权平均的方法融合各个子带中任两路麦克风信号的SGCC函数:
ψ ^ S G C C ′ ( n ) = Σ O = 1 L ψ ^ O _ S G C C ( n ) * g L , L = 8
其中,
式中,表示各个子带中任两路麦克风信号的SGCC函数,L表示子带数,本发明将信号划分为8个子带,g表示对每个子带SGCC函数加权的权值;
对所述函数进行峰值检测,其中两个最大峰值对应的时间点即为两个声源到达两路麦克风的时延值。
2.根据权利要求1所述的融合子带分析的双声源定位方法,其特征在于,步骤(F)包括:
设S1(x,y,z),S2(x′,y′,z′)为两个声源的坐标,四元阵麦克风的坐标为M1(a1,b1,0),M2(a1,b2,0),M3(a2,b1,0),M4(a2,b2,0);根据步骤(E)所述方法得到声源S1相对于M1到达麦克风M2、M3、M4的时延值分别为τ21、τ31、τ41;S1到坐标原点的距离为r,S1到M1、M2、M3、M4的距离分别为d1、d2、d3、d4,声音在空气中的传播速度为c,则通过下式可得到声源S1(x,y,z)的三维位置,同理可获得声源S2(x′,y′,z′)的三维位置;
x 2 + y 2 + z 2 = r 2 ( x - a 1 ) 2 + ( y - b 1 ) 2 + z 2 = d 1 2 ( x - a 1 ) 2 + ( y - b 2 ) 2 + z 2 = ( d 1 + τ 21 c ) 2 ( x - a 2 ) 2 + ( y - b 1 ) 2 + z 2 = ( d 1 + τ 31 c ) 2 ( x - a 2 ) 2 + ( y - b 2 ) 2 + z 2 = ( d 1 + τ 41 c ) 2 .
3.根据权利要求1或2所述融合子带分析的双声源定位方法,其特征在于,步骤(A)中的(3)中信号采样率为fs=8000Hz,帧长256采样点,帧移128采样点。
CN201610614364.8A 2016-07-29 2016-07-29 融合子带分析的双声源定位方法 Pending CN106226739A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610614364.8A CN106226739A (zh) 2016-07-29 2016-07-29 融合子带分析的双声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610614364.8A CN106226739A (zh) 2016-07-29 2016-07-29 融合子带分析的双声源定位方法

Publications (1)

Publication Number Publication Date
CN106226739A true CN106226739A (zh) 2016-12-14

Family

ID=57536629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610614364.8A Pending CN106226739A (zh) 2016-07-29 2016-07-29 融合子带分析的双声源定位方法

Country Status (1)

Country Link
CN (1) CN106226739A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107199572A (zh) * 2017-06-16 2017-09-26 山东大学 一种基于智能声源定位与语音控制的机器人系统及方法
CN108198568A (zh) * 2017-12-26 2018-06-22 太原理工大学 一种多声源定位的方法及系统
CN110007276A (zh) * 2019-04-18 2019-07-12 太原理工大学 一种声源定位方法及系统
CN110133572A (zh) * 2019-05-21 2019-08-16 南京林业大学 一种基于Gammatone滤波器和直方图的多声源定位方法
CN110275138A (zh) * 2019-07-16 2019-09-24 北京工业大学 一种利用优势声源成分移除的多声源定位方法
CN110398716A (zh) * 2019-08-23 2019-11-01 北京工业大学 一种利用声源间稀疏成分均衡的多声源定位方法
CN110598520A (zh) * 2019-06-28 2019-12-20 沃森能源技术(廊坊)有限公司 一种防止信号中强共模噪声干扰的测速方法
CN110954866A (zh) * 2019-11-22 2020-04-03 达闼科技成都有限公司 声源定位方法、电子设备及存储介质
CN111429916A (zh) * 2020-02-20 2020-07-17 西安声联科技有限公司 一种声音信号记录系统
CN111429939A (zh) * 2020-02-20 2020-07-17 西安声联科技有限公司 一种双声源的声音信号分离方法和拾音器
CN111951829A (zh) * 2020-05-13 2020-11-17 慧言科技(天津)有限公司 基于时域单元的声源定位方法、装置及系统
CN112197964A (zh) * 2020-12-07 2021-01-08 领伟创新智能系统(浙江)有限公司 一种基于谱pq-mean的局部冲击信号定位方法
CN112904278A (zh) * 2021-01-19 2021-06-04 中国科学院上海微系统与信息技术研究所 一种基于声音信号起始点估计信号间时延的方法
CN113189542A (zh) * 2021-05-08 2021-07-30 上海特金信息科技有限公司 窄带跳频信号tdoa定位方法、装置、系统
CN113655440A (zh) * 2021-08-09 2021-11-16 西南科技大学 一种自适应折中预白化的声源定位方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737431A (en) * 1995-03-07 1998-04-07 Brown University Research Foundation Methods and apparatus for source location estimation from microphone-array time-delay estimates
CN102565759A (zh) * 2011-12-29 2012-07-11 东南大学 一种基于子带信噪比估计的双耳声源定位方法
KR20140108817A (ko) * 2013-02-28 2014-09-15 재단법인 포항산업과학연구원 음원위치추적장치 및 음원위치추적방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737431A (en) * 1995-03-07 1998-04-07 Brown University Research Foundation Methods and apparatus for source location estimation from microphone-array time-delay estimates
CN102565759A (zh) * 2011-12-29 2012-07-11 东南大学 一种基于子带信噪比估计的双耳声源定位方法
KR20140108817A (ko) * 2013-02-28 2014-09-15 재단법인 포항산업과학연구원 음원위치추적장치 및 음원위치추적방법

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AD FIROOZABADI等: ""Localization of multiple simultaneous speakers by combining the information from different subbands"", 《ELECTRONIC ENGINEERING》 *
JINGDONG CHEN等: ""Performance of GCC and ADMF based time-delay estimation in practical reverberant environments"", 《EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING》 *
鲁佳: ""基于传声器阵列的声源定位研究"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
黄海军: ""基于传声器阵列的声源定位系统的初步研究"", 《中国优秀硕士学位论文全文数据库工程科技||辑》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107199572B (zh) * 2017-06-16 2020-02-14 山东大学 一种基于智能声源定位与语音控制的机器人系统及方法
CN107199572A (zh) * 2017-06-16 2017-09-26 山东大学 一种基于智能声源定位与语音控制的机器人系统及方法
CN108198568B (zh) * 2017-12-26 2020-10-16 太原理工大学 一种多声源定位的方法及系统
CN108198568A (zh) * 2017-12-26 2018-06-22 太原理工大学 一种多声源定位的方法及系统
CN110007276A (zh) * 2019-04-18 2019-07-12 太原理工大学 一种声源定位方法及系统
CN110133572A (zh) * 2019-05-21 2019-08-16 南京林业大学 一种基于Gammatone滤波器和直方图的多声源定位方法
CN110598520A (zh) * 2019-06-28 2019-12-20 沃森能源技术(廊坊)有限公司 一种防止信号中强共模噪声干扰的测速方法
CN110598520B (zh) * 2019-06-28 2023-05-05 沃森能源技术(廊坊)有限公司 一种防止信号中强共模噪声干扰的测速方法
CN110275138A (zh) * 2019-07-16 2019-09-24 北京工业大学 一种利用优势声源成分移除的多声源定位方法
CN110275138B (zh) * 2019-07-16 2021-03-23 北京工业大学 一种利用优势声源成分移除的多声源定位方法
CN110398716A (zh) * 2019-08-23 2019-11-01 北京工业大学 一种利用声源间稀疏成分均衡的多声源定位方法
CN110954866B (zh) * 2019-11-22 2022-04-22 达闼机器人有限公司 声源定位方法、电子设备及存储介质
CN110954866A (zh) * 2019-11-22 2020-04-03 达闼科技成都有限公司 声源定位方法、电子设备及存储介质
CN111429939B (zh) * 2020-02-20 2023-06-09 西安声联科技有限公司 一种双声源的声音信号分离方法和拾音器
CN111429939A (zh) * 2020-02-20 2020-07-17 西安声联科技有限公司 一种双声源的声音信号分离方法和拾音器
CN111429916A (zh) * 2020-02-20 2020-07-17 西安声联科技有限公司 一种声音信号记录系统
CN111429916B (zh) * 2020-02-20 2023-06-09 西安声联科技有限公司 一种声音信号记录系统
CN111951829B (zh) * 2020-05-13 2023-05-19 慧言科技(天津)有限公司 基于时域单元的声源定位方法、装置及系统
CN111951829A (zh) * 2020-05-13 2020-11-17 慧言科技(天津)有限公司 基于时域单元的声源定位方法、装置及系统
CN112197964A (zh) * 2020-12-07 2021-01-08 领伟创新智能系统(浙江)有限公司 一种基于谱pq-mean的局部冲击信号定位方法
CN112904278A (zh) * 2021-01-19 2021-06-04 中国科学院上海微系统与信息技术研究所 一种基于声音信号起始点估计信号间时延的方法
CN112904278B (zh) * 2021-01-19 2024-02-20 中国科学院上海微系统与信息技术研究所 一种基于声音信号起始点估计信号间时延的方法
CN113189542A (zh) * 2021-05-08 2021-07-30 上海特金信息科技有限公司 窄带跳频信号tdoa定位方法、装置、系统
CN113189542B (zh) * 2021-05-08 2024-02-20 上海特金信息科技有限公司 窄带跳频信号tdoa定位方法、装置、系统
CN113655440A (zh) * 2021-08-09 2021-11-16 西南科技大学 一种自适应折中预白化的声源定位方法

Similar Documents

Publication Publication Date Title
CN106226739A (zh) 融合子带分析的双声源定位方法
WO2020042708A1 (zh) 基于时频掩蔽和深度神经网络的声源方向估计方法
CN102438189B (zh) 基于双通路声信号的声源定位方法
CN102565759B (zh) 一种基于子带信噪比估计的双耳声源定位方法
CN106373589B (zh) 一种基于迭代结构的双耳混合语音分离方法
CN102074236B (zh) 一种分布式麦克风的说话人聚类方法
WO2015196729A1 (zh) 一种麦克风阵列语音增强方法及装置
JP4521549B2 (ja) 上下、左右方向の複数の音源の分離方法、そのためのシステム
CN108198568B (zh) 一种多声源定位的方法及系统
CN111429939B (zh) 一种双声源的声音信号分离方法和拾音器
CN104464750A (zh) 一种基于双耳声源定位的语音分离方法
CN103278801A (zh) 一种变电站噪声成像侦测装置及侦测计算方法
CN103426440A (zh) 利用能量谱熵空间信息的语音端点检测装置及其检测方法
CN105590630A (zh) 基于指定带宽的定向噪音抑制方法
Velasco et al. Novel GCC-PHAT model in diffuse sound field for microphone array pairwise distance based calibration
CN103901400A (zh) 一种基于时延补偿和双耳一致性的双耳声音源定位方法
CN103268766A (zh) 双麦克风语音增强方法及装置
CN109901114B (zh) 一种适用于声源定位的时延估计方法
CN110838303B (zh) 一种利用传声器阵列的语音声源定位方法
Guo et al. Underwater target detection and localization with feature map and CNN-based classification
CN108269581B (zh) 一种基于频域相干函数的双麦克风时延差估计方法
Boyd et al. Improved estimation of direction of arrival of sound sources for hearing aids using gyroscopic information
KR20050110790A (ko) 영교차점을 이용한 신호대잡음비 추정방법 및 음원 방향탐지방법
Chisaki et al. Azimuthal and elevation localization of two sound sources using interaural phase and level differences
Shen et al. A modified cross power-spectrum phase method based on microphone array for acoustic source localization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161214

RJ01 Rejection of invention patent application after publication