CN104076331B - 一种七元麦克风阵列的声源定位方法 - Google Patents

一种七元麦克风阵列的声源定位方法 Download PDF

Info

Publication number
CN104076331B
CN104076331B CN201410273464.XA CN201410273464A CN104076331B CN 104076331 B CN104076331 B CN 104076331B CN 201410273464 A CN201410273464 A CN 201410273464A CN 104076331 B CN104076331 B CN 104076331B
Authority
CN
China
Prior art keywords
signal
microphone
tau
yuan
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410273464.XA
Other languages
English (en)
Other versions
CN104076331A (zh
Inventor
郭业才
宋宫琨琨
张宁
胡昭华
黄友锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changshu Zijin Intellectual Property Service Co.,Ltd.
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201410273464.XA priority Critical patent/CN104076331B/zh
Publication of CN104076331A publication Critical patent/CN104076331A/zh
Application granted granted Critical
Publication of CN104076331B publication Critical patent/CN104076331B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种七元麦克风阵列的声源定位方法,该方法建立了七元麦克风阵列模型与室内声场模型;利用该麦克风阵列接收室内声源语音信号,对接收的语音信号进行采集、滤波、加窗、谱减、倒谱处理;再利用相位变换加权广义互相关方法GCC-PHAT,得各麦克风之间的时间延迟;运用三维空间定位方法与坐标旋转数字式计算机方法,确定声源位置。本发明在混响、噪声等干扰信号存在的室内环境下,能准确确定声源位置,实时性强、准确性高,在语音信号处理领域有广泛的应用。

Description

一种七元麦克风阵列的声源定位方法
技术领域
本发明涉及声源定位领域,特别是一种七元麦克风阵列的声源定位方法。
背景技术
声源定位技术是阵列信号处理的重要技术之一。目前在声呐探测、视频电话会议、人工智能、语音追踪与识别、监控系统等多个领域有着广泛的应用。利用麦克风阵列对声源方位进行计算是声源定位的基本方法,它是将一组麦克风传感器按一定方式布置在空间不同位置上,形成麦克风阵列;利用麦克风阵列接收空间声源信号,再对阵列接收的信号进行处理,提取信号的有用特征,再通过一定计算方法得到声源的方位信息。
目前常用的声源定位方法主要有三类:基于可控波束形成器的声源定位法,主要是将各阵元采集到的信号加权求和,通过调控权值(权值取决于阵元信号的相位延迟,主要利用波达方向(DOA)(见文献:DespoinaPavlidi,AnthonyGriffin,MatthieuPuigt,AthanasiosMouchtaris.Real-timemultiplesoundsourcelocalizationandcountingusingacircularmicrophonearray[J].IEEETransactionsonAudio,Speech,andLanguageProcessing,2013,21(10):2193-2206.))等方法进行调控),使阵列输出信号功率最大,从而进行声源定位;基于高分辨率谱估计的声源定位法,主要利用最小方差估计法、子空间法(如MUSIC法(见文献:JunliLiang,DingLiu.Passivelocalizationofmixednear-fieldandfar-fieldsourcesusingtwo-stageMUSICalgorithm[J].IEEETransactionsonSignalProcessing,2010,58(1):108-120.)、ESPRIT法(见文献:HaohaiSun,HeinzTeutsch,EdwinMabande,WalterKellermann.RoubstlocalizationofmultiplesourcesinreverberantenvironmentsusingEB-ESPRITwithsphericalmicrophonearrays[C].IEEEInternationalConferenceonAcousticsSpeechandSignalProcessing(ICASSP),Prague,2011:117-120.))等进行声源定位;基于到达时间差(TDOA)的声源定位法,主要结合自适应、广义互相关(GCC)等进行声源定位。利用多个麦克风构成一定形状的阵列,可在二维平面、三维立体空间中获得更为准确的声源目标方位。
现有定位技术中,主要是利用一维线性阵列、二维十字四麦克风阵列进行声源定位,与三维的阵列相比,这些阵列不能同时采集多个方向上的声源信号,难以精确定位。另外,现有定位技术中,仅考虑了环境噪声对定位精度的影响,而没有考虑混响的影响。因此,在噪声与混响同时干扰下,现有的声源定位方法是不能准确地进行声源定位的。
如何解决现有技术的不足已成为声源定位领域亟待解决的一大难题。
发明内容
本发明所要解决的技术问题是为了克服现有技术的不足,而提供一种七元麦克风阵列的声源定位方法。本发明方法在三维空间中实时、有效地解决了声源定位问题,在一定程度上降低了噪声、混响等信号对语音信号的干扰,提高了定位的精度与稳定性。
本发明为解决上述技术问题采用以下技术方案:
根据本发明提出的一种七元麦克风阵列的声源定位方法,包括如下步骤:
步骤一、在三维坐标系中,建立麦克风阵列模型,确定各麦克风在三维空间的位置;
步骤二、对各麦克风接收到声源发出的语音信号s(t)进行采样,得到离散信号s(k),t表示时间,k表示时间序列;
步骤三、对步骤二所述的离散信号s(k)进行滤波、加窗、谱减、倒谱处理,得到纯语音时域信号x(k);具体如下:
(301)、将离散信号s(k)通过带通滤波器进行带通滤波后,得到带通信号;
(302)、对(301)中所得带通信号用窗函数进行加窗处理,得到加窗信号sw(k);
(303)、对(302)所得加窗信号sw(k)用谱减法进行去噪处理,得到谱减信号Xw(f),对Xw(f)作傅里叶反变换得到去噪时域信号xw(k);
(304)、对去噪时域信号xw(k)由倒谱法进行消除混响处理,得到纯语音时域信号x(k);
步骤四、对步骤三中的纯语音时域信号x(k),利用相位变换加权广义互相关方法GCC-PHAT计算第i个麦克风接收的经步骤三处理所得纯语音时域信号xi(k)与三维坐标原点处第0个麦克风接收的经步骤三处理所得纯语音时域信号x0(k)间的时延值τi,1≤i≤6且i为自然数,则互相关函数为
R x 0 x i ( g ) ( τ i ) = ∫ - ∞ + ∞ ψ PHAT ( f ) X 0 ( f ) X i * ( f ) e j 2 πfτ i df ;
式中,f表示频率,e表示自然指数,X0(f)表示纯语音时域信号x0(k)的傅里叶变换,Xi *(f)表示纯语音时域信号xi(k)傅里叶变换的共轭,j为虚数单位,ψPHAT(f)为加权函数,且
ψ PHAT ( f ) = 1 | G x 0 x i ( f ) | ;
式中,为相关函数的功率谱,且
G x 0 x i ( f ) = ∫ - ∞ + ∞ R x 0 x i ( τ i ) e j 2 πfτ i dτ i ;
式中, R x 0 x i ( τ i ) = E [ x 0 ( k ) x i ( k + τ i ) ] , 表示x0(k)与xi(k)的互相关函数,则其中argmax表示使取得最大值时为第0个麦克风与第i个麦克风所接收到信号的时延估计值;
步骤五、利用三维空间定位方法,结合步骤四中的得声源到三维坐标原点的距离r:
r = 6 L 2 - c 2 Σ i = 1 6 ( τ ^ i ) 2 2 c Σ i = 1 6 τ ^ i ;
式中,c表示声速,L表示第i个麦克风位置Mi与三维坐标原点处第0个麦克风位置M0间的距离;
步骤六、利用坐标旋转数字式计算机方法,结合步骤四得到的得声源位置的俯仰角θ、方位角
步骤七、根据直角坐标与球面坐标间的关系,得声源位置的直角坐标为
作为本发明的一种七元麦克风阵列的声源定位方法进一步的优化方案,所述(302)中窗函数采用汉明窗函数w(k),即
式中,N表示时间序列的取值范围,且N为大于零的正整数。
作为本发明的一种七元麦克风阵列的声源定位方法进一步的优化方案,所述(303)中谱减法的公式为
| X w ( f ) | = | S w ( f ) | 2 - | N w ( f ) | 2 ;
式中,Sw(f)为加窗信号sw(k)的傅里叶变换,Nw(f)为加窗信号sw(k)中噪声信号nw(k)的傅里叶变换。
作为本发明的一种七元麦克风阵列的声源定位方法进一步的优化方案,所述(304)中倒谱法处理过程为:
(a)、对去噪时域信号xw(k)进行分帧处理,得到分帧信号;
(b)、对分帧信号用窗函数进行预加窗处理,得到预加窗信号xww(k);
(c)、对预加窗信号xww(k)计算每帧的复倒谱信号xc(k),所述复倒谱计算公式为
xc(k)=IFFT{ln[FFT[xww(k)]]};
式中,FFT表示傅里叶变换,IFFT表示傅里叶反变换,ln表示自然对数;
(d)、对复倒谱信号xc(k),利用复倒谱域低通滤波器进行滤波,得到滤波信号;
(e)、对滤波信号,在时域条件下将每帧信号叠接相加,得到纯语音时域信号x(k)。
作为本发明的一种七元麦克风阵列的声源定位方法进一步的优化方案,所述(301)中带通滤波器的上截止频率为fH=3500Hz,下截止频率为fL=250Hz。
作为本发明的一种七元麦克风阵列的声源定位方法进一步的优化方案,所述(a)中分帧信号的帧长为512点,帧移为128点。
作为本发明的一种七元麦克风阵列的声源定位方法进一步的优化方案,所述(d)中复倒谱域低通滤波器由通带、过渡带、阻带三部分组成,其中通带的最高截止点P=4,过渡带的带宽h为64。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明建立了七元麦克风阵列模型与室内声场模型,在室内声场中采集声源发出的一段语音信号;对采集的语音信号进行滤波、加窗、谱减、倒谱处理,利用相位变换加权广义互相关方法GCC-PHAT计算各麦克风接收信号间的时间延迟;再由三维空间定位方法与坐标旋转数字式计算机方法,确定声源方位角,最终确定声源位置。本发明在混响与噪声干扰都存在的环境下,准确地确定了声源位置,定位精度高且稳定性强,在语音信号处理领域,具有较强的实用性。
附图说明
图1是本发明的流程图。
图2是本发明设计的七元麦克风阵列模型。
图3是本发明中倒谱法的步骤。
图4是本发明中复倒谱域低通滤波器原理图。
图5是本发明中麦克风阵列模型:(a)七元麦克风阵列,(b)四元麦克风阵列。
图6是本发明麦克风间距与方位角、俯仰角的关系图:(a)麦克风间距为0.1m时与方位角的关系图,(b)麦克风间距为0.1m时与俯仰角的关系图。
图7是本发明麦克风间距与方位角、俯仰角的关系图:(a)麦克风间距为0.2m时与方位角的关系图,(b)麦克风间距为0.2m时与俯仰角的关系图。
具体实施方式
下面结合附图对本发明的技术方案做进一步的详细说明:
一种七元麦克风阵列的声源定位方法,包括如下步骤:
步骤一、在三维坐标系中,建立麦克风阵列模型,确定各麦克风在三维空间的位置;
步骤二、对各麦克风接收到声源发出的语音信号s(t)进行采样,得到离散信号s(k),t表示时间,k表示时间序列;
步骤三、对步骤二所述的离散信号s(k)进行滤波、加窗、谱减、倒谱处理,得到纯语音时域信号x(k);具体如下:
(301)、将离散信号s(k)通过带通滤波器进行带通滤波后,得到带通信号;
(302)、对(301)中所得带通信号用窗函数进行加窗处理,得到加窗信号sw(k);
(303)、对(302)所得加窗信号sw(k)用谱减法进行去噪处理,得到谱减信号Xw(f),对Xw(f)作傅里叶反变换得到去噪时域信号xw(k);
(304)、对去噪时域信号xw(k)由倒谱法进行消除混响处理,得到纯语音时域信号x(k);
步骤四、对步骤三中的纯语音时域信号x(k),利用相位变换加权广义互相关方法GCC-PHAT计算第i个麦克风接收的经步骤三处理所得纯语音时域信号xi(k)与三维坐标原点处第0个麦克风接收的经步骤三处理所得纯语音时域信号x0(k)间的时延值τi,1≤i≤6且i为自然数,则互相关函数为
R x 0 x i ( g ) ( τ i ) = ∫ - ∞ + ∞ ψ PHAT ( f ) X 0 ( f ) X i * ( f ) e j 2 πfτ i df ;
式中,f表示频率,e表示自然指数,X0(f)表示纯语音时域信号x0(k)的傅里叶变换,Xi *(f)表示纯语音时域信号xi(k)傅里叶变换的共轭,j为虚数单位,ψPHAT(f)为加权函数,且
ψ PHAT ( f ) = 1 | G x 0 x i ( f ) | ;
式中,为相关函数的功率谱,且
G x 0 x i ( f ) = ∫ - ∞ + ∞ R x 0 x i ( τ i ) e j 2 πfτ i dτ i ;
式中, R x 0 x i ( τ i ) = E [ x 0 ( k ) x i ( k + τ i ) ] , 表示x0(k)与xi(k)的互相关函数,则其中argmax表示使取得最大值时为第0个麦克风与第i个麦克风所接收到信号的时延估计值;
步骤五、利用三维空间定位方法,结合步骤四中的得声源到三维坐标原点的距离r:
r = 6 L 2 - c 2 Σ i = 1 6 ( τ ^ i ) 2 2 c Σ i = 1 6 τ ^ i ;
式中,c表示声速,L表示第i个麦克风位置Mi与三维坐标原点处第0个麦克风位置M0间的距离;
步骤六、利用坐标旋转数字式计算机方法,结合步骤四得到的得声源的俯仰角θ、方位角
步骤七、根据直角坐标与球面坐标间的关系,得声源位置的直角坐标为
所述(302)中窗函数采用汉明窗函数w(k),即
式中,N表示时间序列的取值范围,且N为大于零的正整数。
所述(303)中谱减法的公式为
| X w ( f ) | = | S w ( f ) | 2 - | N w ( f ) | 2 ;
式中,Sw(f)为加窗信号sw(k)的傅里叶变换,Nw(f)为加窗信号sw(k)中噪声信号nw(k)的傅里叶变换。
所述(304)中倒谱法处理过程为:
(a)、对去噪时域信号xw(k)进行分帧处理,得到分帧信号;
(b)、对分帧信号用窗函数进行预加窗处理,得到预加窗信号xww(k);
(c)、对预加窗信号xww(k)计算每帧的复倒谱信号xc(k),所述复倒谱计算公式为
xc(k)=IFFT{ln[FFT[xww(k)]]};
式中,FFT表示傅里叶变换,IFFT表示傅里叶反变换,ln表示自然对数;
(d)、对复倒谱信号xc(k),利用复倒谱域低通滤波器进行滤波,得到滤波信号;
(e)、对滤波信号,在时域条件下将每帧信号叠接相加,得到纯语音时域信号x(k)。
所述(301)中带通滤波器的上截止频率为fH=3500Hz,下截止频率为fL=250Hz;所述(a)中分帧信号的帧长为512点,帧移为128点;所述(d)中复倒谱域低通滤波器由通带、过渡带、阻带三部分组成,其中通带的最高截止点P=4,过渡带的带宽h为64。
本方法的流程参见图1,本发明是的一种七元麦克风阵列的声源定位方法,利用三维七元麦克风阵列,结合空间定位方法进行声源定位,其具体实施步骤如下:
步骤一、在三维坐标系中,建立麦克风阵列模型,确定各麦克风在三维空间的位置;
建立麦克风阵列模型,如图2所示,坐标原点O(0,0,0),七个麦克风的位置坐标分别为M0(0,0,0)、M1(L,0,0),M2(0,L,0),M3(-L,0,0),M4(0,-L,0),M5(0,0,-L),M6(0,0,L);声源位置的直角坐标为S(x,y,z),方位角为俯仰角为θ(0°≤θ≤90°)。声源到坐标原点(就是第0个麦克风的位置M0)的距离为r,在远场条件下阵列接收的信号为平面波。di(1≤i≤6)为声源到第0个麦克风的位置M0与声源到第i个麦克风的位置Mi的距离差值。
步骤二、对各麦克风接收到声源语音信号s(t)进行采样,得离散信号s(k),t表示时间,k表示时间序列。为使仿真实验更加接近真实环境,所建立的房间模型中,房间的反射系数为0.5,声源为一段含噪声的语音信号,持续时间为8s,信号采样频率为16kHz,64kHz。
步骤三、对步骤二所述的离散信号s(k)进行:滤波、加窗、谱减、倒谱处理,处理过程为:
(301)、对步骤二中的离散信号s(k)通过带通滤波器进行带通滤波后,得到带通信号。滤波可以有效地抑制低频、高频信号对语音信号的污染。由于语音信号为有限带宽信号,一般情况下其频率主要集中在300Hz~3000Hz之间,因此我们选择带通滤波器,带通滤波器的上截止频率为fH=3500Hz,下截止频率为fL=250Hz。
(302)、对(301)所得带通信号用窗函数进行加窗处理,得到加窗信号sw(k)。因为语音信号一般在10ms到30ms之间,是平稳的。为了更好的处理语音信号,对语音信号进行加窗处理,所得加窗信号sw(k)有效地减少了频谱泄漏,保持语音信号的平稳性;所述窗函数w(k)采用汉明窗函数(在汉明窗函数中,其主瓣加宽并降低,使得信号的泄漏与波动都减小,汉明窗优于矩形窗;其加权系数不同,使得旁瓣达到更小,旁瓣衰减速度减慢,汉明窗优于汉宁窗;其在去除混响效果中,比矩形窗、汉宁窗、布莱克曼窗的效果更为稳定、均衡、优异。故选择汉明窗函数),即
式中,N表示时间序列的取值范围,且N为大于零的正整数。
(303)、对(302)所得加窗信号sw(k)用谱减法进行去噪处理,得到的谱减信号Xw(f)最大程度地消除现场噪音对语音信号的干扰,使得分离出来的语音信号纯净、稳定,减少了后续数据处理量,提高了定位精度。
所述谱减法原理为:在噪声信号与语音信号相互独立的前提下,通过快速傅里叶变换(FFT),从含噪语音信号中去除噪声功率谱,得到去除噪声的语音频谱。
所述谱减法处理过程为:
设xw(k)为去噪时域信号,nw(k)为噪声信号,k表示时间序列,则有
sw(k)=xw(k)+nw(k)(2)
对式(2)进行傅里叶变换,得
Sw(f)=Xw(f)+Nw(f)(3)
将式(3)取模的平方,由于xw(k)与nw(k)相互独立,有
|Sw(f)|2=|Xw(f)|2+|Nw(f)|2(4)
则谱减信号Xw(f)为
| X w ( f ) | = | S w ( f ) | 2 - | N w ( f ) | 2 - - - ( 5 )
对Xw(f)作傅里叶反变换IFFT,得去噪时域信号xw(k)。
(304)、对(303)所得去噪时域信号xw(k)由倒谱法进行消除混响处理,得到纯语音时域信号x(k)。由于语音信号的复倒谱通常集中在复倒谱域的原点附近,而混响则由复倒谱域扩展至远离原点的位置,故在复倒谱域中用低通滤波法去除尖峰的办法来削减混响,然后再通过逆向操作,获得混响受到削减的声源信号。图3为倒谱法处理流程图,其中xw(k)为(303)所得去噪时域信号,x(k)为纯语音时域信号;图4为复倒谱域低通滤波器原理图,其中P为通带的最高截止点,h为过渡带的带宽。
所述倒谱法处理过程为:
(a)、对去噪时域信号xw(k)进行分帧处理,得到分帧信号,这里选定帧长为512点,帧移为128点;
(b)、对分帧信号进行预加窗处理,得到预加窗信号xww(k),所述窗函数仍采用(302)中的汉明窗函数;
(c)、对预加窗信号xww(k)计算每帧的复倒谱xc(k),所述复倒谱计算公式为
xc(k)=IFFT{ln[FFT[xww(k)]]}(6)
式中,FFT表示傅里叶变换,IFFT表示傅里叶反变换,ln表示自然对数;
(d)、对复倒谱信号xc(k),利用复倒谱域低通滤波器进行滤波,得到滤波信号;所述复倒谱域低通滤波器由通带、过渡带、阻带三部分组成,其中通带的最高截止点P=4,过渡带的带宽h为64;
(e)、对滤波信号,在时域条件下将每帧信号叠接相加,得到纯语音时域信号x(k)。
步骤四、对步骤三中的纯语音时域信号x(k),利用相位变换加权广义互相关方法GCC-PHAT(GeneralizedCrossCorrelation-ThePhaseTransform,GCC-PHAT)计算时延值。
所述的GCC-PHAT计算时延的过程为:
τi表示第i个麦克风接收的经步骤三处理所得纯语音时域信号xi(k)与坐标原点处第0个麦克风接收的经步骤三处理所得纯语音时域信号x0(k)间的时延值,1≤i≤6且i为自然数。信号xi(k)与x0(k)的互相关函数为
R x 0 x i ( g ) ( τ i ) = ∫ - ∞ + ∞ ψ PHAT ( f ) X 0 ( f ) X i * ( f ) e j 2 πfτ i df - - - ( 7 )
式中,f表示频率,e表示自然指数,X0(f)表示时域信号x0(k)的傅里叶变换,Xi *(f)表示时域信号xi(k)傅里叶变换的共轭,为虚数单位,ψPHAT(f)为加权函数,且
ψ PHAT ( f ) = 1 | G x 0 x i ( f ) | - - - ( 8 )
式中,为相关函数的功率谱,且
G x 0 x i ( f ) = ∫ - ∞ + ∞ R x 0 x i ( τ i ) e j 2 πfτ i dτ i - - - ( 9 )
式中, R x 0 x i ( τ i ) = E [ x 0 ( k ) x i ( k + τ i ) ] , 表示x0(k)与xi(k)的互相关函数,则
τ ^ i = arg , max , R x 0 x i ( g ) ( τ i ) - - - ( 10 )
式中,argmax表示使取得最大值时为第0个麦克风与第i个麦克风所接收到信号的时延估计值。
步骤五、利用三维空间定位方法,求得声源到坐标原点(就是第0个麦克风的位置M0)的距离r。
空气中声速为
c = 20.05 273.15 + T - - - ( 11 )
式中,T代表室温,单位为℃。根据室温为14.5℃,取声速c为340.053m/s。
结合图2,得麦克风阵列与声源的几何位置的关系式为
OS : x 2 + y 2 + z 2 = r 2 SM 1 : ( x - L ) 2 + y 2 + z 2 = ( r + d 1 ) 2 SM 2 : x 2 + ( y - L ) 2 + z 2 = ( r + d 2 ) 2 SM 3 : ( x + L ) 2 + y 2 + z 2 = ( r + d 3 ) 2 SM 4 : x 2 + ( y + L ) 2 + z 2 = ( r + d 4 ) 2 SM 5 : x 2 + y 2 + ( z + L ) 2 = ( r + d 5 ) 2 SM 6 : x 2 + y 2 + ( z - L ) 2 = ( r + d 6 ) 2 - - - ( 12 )
式中,di(1≤i≤6)为声源到第0个麦克风的位置M0与声源到第i个麦克风的位置Mi的距离差值。
结合步骤四中求出的时延计算值,得声源与坐标原点的距离r为:
r = 6 L 2 - c 2 Σ i = 1 6 ( τ ^ i ) 2 2 c Σ i = 1 6 τ ^ i - - - ( 13 )
步骤六、利用坐标旋转数字式计算机方法,结合步骤四中求出的时延估计值,得声源的俯仰角θ、方位角
由于是远场条件下,式(14)可化简为
步骤七、根据直角坐标与球面坐标间的关系,得声源位置的直角坐标为
结合步骤五中的r,步骤六中的θ、即可确定声源位置的直角坐标S(x,y,z)。
图5是本发明中麦克风阵列模型,图5中的(a)为七元麦克风阵列,图5中的(b)为四元麦克风阵列。图5中的(a)所示阵列进行声源定位效果与图5中的(b)进行比较,以说明本发明定位效果;房间尺寸为6m×5m×3.5m。
七元麦克风阵列与四元麦克风阵列的声源定位比较:
麦克风间距为0.1m时,七元麦克风的位置依次为M0(0.05,0.05,0.05),M1(0.1,0.05,0.05),M2(0.05,0.1,0.05),M3(0,0.05,0.05),M4(0.05,0,0.05),M5(0.05,0.05,0),M6(0.05,0.05,0.1);四元麦克风的位置依次为:M1(0.1,0.05,0.05),M2(0.05,0.1,0.05),M3(0,0.05,0.05),M4(0.05,0,0.05)。
麦克风间距为0.2m时,七元麦克风的位置依次为M0(0.1,0.1,0.1),M1(0.2,0.1,0.1),M2(0.1,0.2,0.1),M3(0,0.1,0.1),M4(0.1,0,0.1),M5(0.1,0.1,0),M6(0.1,0.1,0.2),四元麦克风的位置依次为M1(0.2,0.1,0.1),M2(0.1,0.2,0.1),M3(0,0.1,0.1),M4(0.1,0,0.1)。
在声源的实际位置为S(3.25,2.15,1.55)时,表1给出了麦克风间距为0.1m、信号采样率为16kHz时的声源定位结果比较;表2给出了麦克风间距为0.2m、信号采样率为16kHz时的声源定位结果比较;表3给出了麦克风间距为0.1m、信号采样率为64kHz时的声源定位结果比较。表中ΔX,ΔY,ΔZ分别表示声源位置直角坐标X,Y,Z绝对误差。
表1
表2
表3
表1表明,在麦克风间距为0.1m、信号采样率为16kHz条件下,用七元麦克风阵列所得声源位置X、Y、Z的绝对误差分别比四元麦克风阵列减少0.2751m、0.0520m、0.1625m。
表2表明,在麦克风间距为0.2m、信号采样率为16kHz条件下,用七元麦克风阵列所得声源位置X、Y、Z的绝对误差分别比四元麦克风阵列减少0.0186m、0.1058m、0.2244m。
表3表明,在麦克风间距为0.1m、信号采样率为64kHz条件下,用七元麦克风阵列所得声源位置X、Y、Z的绝对误差分别比四元麦克风阵列减少0.2004m、0.1325m、0.3044m。
因此,在信号采样率为16kHz不变、麦克风间距增加的条件下,或在麦克风间距为0.1m不变、信号采样率增加的条件下,七元麦克风阵列声源定位的绝对误差比四元麦克风阵列声源定位的绝对误差都小,定位精度都高。
声源与坐标原点间的距离r变化时,七元麦克风阵列的定位结果比较:
为了用七元麦克风阵列对处于不同位置声源进行定位,图6、图7给出了声源与坐标原点间的距离r变化时的定位结果。
图6是本发明麦克风间距与方位角、俯仰角的关系图,麦克风间距为0.1m,采样率为16kHz条件下;图6中的(a)为麦克风间距为0.1m时与方位角的关系图,图6中的(b)为麦克风间距为0.1m时与俯仰角的关系图。
图7是本发明麦克风间距与方位角、俯仰角的关系图,麦克风间距为0.2m,采样率为16kHz条件下;图7中的(a)为麦克风间距为0.2m时与方位角的关系图,图7中的(b)为麦克风间距为0.2m时与俯仰角的关系图。真实值为空心原点,测量值为实心原点。
由图6与图7所示的声源位置球面坐标数据值,利用球面坐标与直角坐标的关系,得到声源位置的直角坐标测量值与绝对误差,如表4与表5所示。表4给出了麦克风间距为0.1m、信号采样率为16kHz条件下的声源定位结果,表5给出了麦克风间距为0.2m、信号采样率为16kHz下的声源定位结果。
表4
表5
表4与表5表明:在距离r由0.5m增到8.3m、信号采样率为16kHz不变时,随着麦克风间距增加,七元麦克风阵列的声源定位平均绝对误差逐渐减小、定位精度逐步提高。
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (7)

1.一种七元麦克风阵列的声源定位方法,其特征在于,包括如下步骤:
步骤一、在三维坐标系中,建立麦克风阵列模型,确定各麦克风在三维空间的位置;
步骤二、对各麦克风接收到声源发出的语音信号s(t)进行采样,得到离散信号s(k),t表示时间,k表示时间序列;
步骤三、对步骤二所述的离散信号s(k)进行滤波、加窗、谱减、倒谱处理,得到纯语音时域信号x(k);具体如下:
(301)、将离散信号s(k)通过带通滤波器进行带通滤波后,得到带通信号;
(302)、对(301)中所得带通信号用窗函数进行加窗处理,得到加窗信号sw(k);
(303)、对(302)所得加窗信号sw(k)用谱减法进行去噪处理,得到谱减信号Xw(f),对Xw(f)作反傅里叶变换得到去噪时域信号xw(k);
(304)、对去噪时域信号xw(k)由倒谱法进行消除混响处理,得到纯语音时域信号x(k);
步骤四、对步骤三中的纯语音时域信号x(k),利用相位变换加权广义互相关方法GCC-PHAT计算第i个麦克风接收的经步骤三处理所得纯语音时域信号xi(k)与三维坐标原点处第0个麦克风接收的经步骤三处理所得纯语音时域信号x0(k)间的时延值τi,1≤i≤6且i为自然数,则互相关函数为
R x 0 x i ( g ) ( τ i ) = ∫ - ∞ + ∞ ψ P H A T ( f ) X 0 ( f ) X i * ( f ) e j 2 πfτ i d f ;
式中,f表示频率,e表示自然指数,X0(f)表示纯语音时域信号x0(k)的傅里叶变换,Xi *(f)表示纯语音时域信号xi(k)傅里叶变换的共轭,j为虚数单位,ψPHAT(f)为加权函数,且
ψ P H A T ( f ) = 1 | G x 0 x i ( f ) | ;
式中,为相关函数的功率谱,且
G x 0 x i ( f ) = ∫ - ∞ + ∞ R x 0 x i ( τ i ) e j 2 πfτ i dτ i ;
式中, 表示x0(k)与xi(k)的互相关函数,则 τ ^ i = arg max R x 0 x i ( g ) ( τ i ) , 其中argmax表示使取得最大值时 τ i = τ ^ i , 为第0个麦克风与第i个麦克风所接收到信号的时延估计值;
步骤五、利用三维空间定位方法,结合步骤四中的得声源到三维坐标原点的距离r:
r = 6 L 2 - c 2 Σ i = 1 6 ( τ ^ i ) 2 2 c Σ i = 1 6 τ ^ i ;
式中,c表示声速,L表示第i个麦克风位置Mi与三维坐标原点处第0个麦克风位置M0间的距离;
步骤六、利用坐标旋转数字式计算机方法,结合步骤四得到的得声源的俯仰角θ、方位角
其中,表示位置坐标为M0(0,0,0)的第0个麦克风与位置坐标为M1(L,0,0)的第1个麦克风所接收到信号的时延估计值,表示位置坐标为M0(0,0,0)的第0个麦克风与位置坐标为M2(0,L,0)的第2个麦克风所接收到信号的时延估计值,表示位置坐标为M0(0,0,0)的第0个麦克风与位置坐标为M3(-L,0,0)的第3个麦克风所接收到信号的时延估计值,表示位置坐标为M0(0,0,0)的第0个麦克风与位置坐标为M4(0,-L,0)的第4个麦克风所接收到信号的时延估计值,表示位置坐标为M0(0,0,0)的第0个麦克风与位置坐标为M5(0,0,-L)的第5个麦克风所接收到信号的时延估计值,表示位置坐标为M0(0,0,0)的第0个麦克风与位置坐标为M6(0,0,L)的第6个麦克风所接收到信号的时延估计值;
步骤七、根据直角坐标与球面坐标间的关系,声源位置的直角坐标为
2.根据权利要求1所述的一种七元麦克风阵列的声源定位方法,其特征在于,所述(302)中窗函数采用汉明窗函数w(k),即
式中,N表示时间序列的取值范围,且N为大于零的正整数。
3.根据权利要求1所述的一种七元麦克风阵列的声源定位方法,其特征在于,所述(303)中谱减法的公式为
| X w ( f ) | = | S w ( f ) | 2 - | N w ( f ) | 2 ;
式中,Sw(f)为加窗信号sw(k)的傅里叶变换,Nw(f)为加窗信号sw(k)中噪声信号nw(k)的傅里叶变换。
4.根据权利要求1所述的一种七元麦克风阵列的声源定位方法,其特征在于,所述(304)中倒谱法处理过程为:
(a)、对去噪时域信号xw(k)进行分帧处理,得到分帧信号;
(b)、对分帧信号用窗函数进行预加窗处理,得到预加窗信号xww(k);
(c)、对预加窗信号xww(k)计算每帧的复倒谱信号xc(k),所述复倒谱计算公式为
xc(k)=IFFT{ln[FFT[xww(k)]]};
式中,FFT表示傅里叶变换,IFFT表示傅里叶反变换,ln表示自然对数;
(d)、对复倒谱信号xc(k),利用复倒谱域低通滤波器进行滤波,得到滤波信号;
(e)、对滤波信号,在时域条件下将每帧信号叠接相加,得到纯语音时域信号x(k)。
5.根据权利要求1所述的一种七元麦克风阵列的声源定位方法,其特征在于,所述(301)中带通滤波器的上截止频率为fH=3500Hz,下截止频率为fL=250Hz。
6.根据权利要求4所述的一种七元麦克风阵列的声源定位方法,其特征在于,所述(a)中分帧信号的帧长为512点,帧移为128点。
7.根据权利要求4所述的一种七元麦克风阵列的声源定位方法,其特征在于,所述(d)中复倒谱域低通滤波器由通带、过渡带、阻带三部分组成,其中通带的最高截止点P=4,过渡带的带宽h为64。
CN201410273464.XA 2014-06-18 2014-06-18 一种七元麦克风阵列的声源定位方法 Active CN104076331B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410273464.XA CN104076331B (zh) 2014-06-18 2014-06-18 一种七元麦克风阵列的声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410273464.XA CN104076331B (zh) 2014-06-18 2014-06-18 一种七元麦克风阵列的声源定位方法

Publications (2)

Publication Number Publication Date
CN104076331A CN104076331A (zh) 2014-10-01
CN104076331B true CN104076331B (zh) 2016-04-13

Family

ID=51597717

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410273464.XA Active CN104076331B (zh) 2014-06-18 2014-06-18 一种七元麦克风阵列的声源定位方法

Country Status (1)

Country Link
CN (1) CN104076331B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106872944A (zh) * 2017-02-27 2017-06-20 海尔优家智能科技(北京)有限公司 一种基于麦克风阵列的声源定位方法及装置

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104794894B (zh) * 2015-01-29 2018-02-27 青岛智能产业技术研究院 一种汽车鸣笛噪声监视装置、系统及方法
CN104811886B (zh) * 2015-04-10 2018-04-17 西安电子科技大学 基于相位差测量的麦克风阵列测向方法
CN104991573A (zh) * 2015-06-25 2015-10-21 北京品创汇通科技有限公司 一种基于声源阵列的定位跟踪方法及其装置
CN105223544B (zh) * 2015-08-26 2018-01-12 南京信息工程大学 近场线性约束最小方差自适应加权频率不变波束形成方法
CN105301563B (zh) * 2015-11-10 2017-09-22 南京信息工程大学 一种基于一致聚焦变换最小二乘法的双声源定位方法
CN105681972B (zh) * 2016-01-14 2018-05-01 南京信息工程大学 线性约束最小方差对角加载的稳健频率不变波束形成方法
US10379534B2 (en) * 2016-01-28 2019-08-13 Qualcomm Incorporated Drone flight control
CN105976827B (zh) * 2016-05-26 2019-09-13 南京邮电大学 一种基于集成学习的室内声源定位方法
CN105954710B (zh) * 2016-07-06 2018-11-13 南京理工大学 一种基于嵌入式阵列的误差分析装置及方法
CN106383333A (zh) * 2016-08-31 2017-02-08 北斗时空信息技术(北京)有限公司 一种基于互相关的改进时延估计方法
CN108089153A (zh) * 2016-11-23 2018-05-29 杭州海康威视数字技术股份有限公司 一种声源定位方法、装置及系统
CN106723736B (zh) * 2016-12-23 2018-07-24 南京医科大学 基于相位变换加权广义互相关算法的自主寻人智能拐杖
CN108398664B (zh) * 2017-02-07 2020-09-08 中国科学院声学研究所 一种用于麦克风阵列的解析式空间解混叠方法
CN108008355B (zh) * 2017-05-18 2021-06-15 南京航空航天大学 基于四元正交麦克风阵列的稳健声源定位方法
CN107390176A (zh) * 2017-06-15 2017-11-24 重庆锐纳达自动化技术有限公司 一种声源定位导航装置
CN107797096A (zh) * 2017-10-20 2018-03-13 电子科技大学 一种基于麦克风面阵的鸣笛检测定位方法
CN108122563B (zh) * 2017-12-19 2021-03-30 北京声智科技有限公司 提高语音唤醒率及修正doa的方法
CN108198568B (zh) * 2017-12-26 2020-10-16 太原理工大学 一种多声源定位的方法及系统
CN108375763B (zh) * 2018-01-03 2021-08-20 北京大学 一种应用于多声源环境的分频定位方法
CN108445450B (zh) * 2018-04-13 2024-03-12 上海其高电子科技有限公司 超大规模声源定位方法
CN108562870B (zh) * 2018-04-20 2022-03-11 南京信息工程大学 一种声源定位校准方法
CN108802690A (zh) * 2018-05-30 2018-11-13 大连民族大学 一种基于麦克风阵列的机器人声源定位系统及装置
CN108919188B (zh) * 2018-07-25 2022-04-08 南京信息工程大学 一种基于七元十字阵的空间声源定位反演方法
CN109063165B (zh) * 2018-08-15 2022-04-19 深圳市诺信连接科技有限责任公司 一种erp文件查询管理系统
CN109164416B (zh) * 2018-09-12 2022-10-14 南京信息工程大学 一种三平面五元传声器阵列的声源定位方法
CN108922514B (zh) * 2018-09-19 2023-03-21 河海大学 一种基于低频对数谱的鲁棒特征提取方法
CN109490822B (zh) * 2018-10-16 2022-12-20 南京信息工程大学 基于ResNet的语音DOA估计方法
CN109343001A (zh) * 2018-11-07 2019-02-15 江西理工大学 一种无人机声音识别定位装置及方法
CN109254266A (zh) * 2018-11-07 2019-01-22 苏州科达科技股份有限公司 基于麦克风阵列的声源定位方法、装置及存储介质
CN110068796A (zh) * 2019-03-31 2019-07-30 天津大学 一种用于声源定位的麦克风阵列方法
CN110095755B (zh) * 2019-04-01 2021-03-12 云知声智能科技股份有限公司 一种声源定位方法
CN110007276B (zh) * 2019-04-18 2021-01-12 太原理工大学 一种声源定位方法及系统
CN110361695B (zh) * 2019-06-06 2021-06-15 杭州未名信科科技有限公司 分置式声源定位系统和方法
CN110221250A (zh) * 2019-06-27 2019-09-10 中国科学院西安光学精密机械研究所 一种异常声音定位方法及定位装置
CN110392334B (zh) * 2019-07-03 2021-06-08 北京小米移动软件有限公司 一种麦克风阵列音频信号自适应处理方法、装置及介质
CN110488223A (zh) * 2019-07-05 2019-11-22 东北电力大学 一种声源定位方法
CN112684414A (zh) * 2020-12-21 2021-04-20 广西大学 无人机反制方法及装置
CN116543141A (zh) * 2022-12-16 2023-08-04 无锡恺韵来机器人有限公司 一种基于声信号与图像融合的无人机识别与定位方法
CN116047413B (zh) * 2023-03-31 2023-06-23 长沙东玛克信息科技有限公司 一种封闭混响环境下的音频精准定位方法
CN116299182A (zh) * 2023-05-11 2023-06-23 深圳市烽火宏声科技有限公司 一种声源三维定位的方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014098568A (ja) * 2012-11-13 2014-05-29 Advanced Telecommunication Research Institute International 音源位置推定装置、音源位置推定方法および音源位置推定プログラム
CN103995252B (zh) * 2014-05-13 2016-08-24 南京信息工程大学 一种三维空间声源定位方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106872944A (zh) * 2017-02-27 2017-06-20 海尔优家智能科技(北京)有限公司 一种基于麦克风阵列的声源定位方法及装置

Also Published As

Publication number Publication date
CN104076331A (zh) 2014-10-01

Similar Documents

Publication Publication Date Title
CN104076331B (zh) 一种七元麦克风阵列的声源定位方法
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
CN105301563B (zh) 一种基于一致聚焦变换最小二乘法的双声源定位方法
CN109188362B (zh) 一种麦克风阵列声源定位信号处理方法
CN111624553B (zh) 声源定位方法及系统、电子设备及存储介质
CN105589066B (zh) 一种利用垂直矢量阵估计水下匀速运动航行器参数的方法
CN102565759B (zh) 一种基于子带信噪比估计的双耳声源定位方法
CN102147458B (zh) 一种针对宽带声源的波达方向估计方法及其装置
CN103076593A (zh) 一种声源定位方法及装置
CN108549052A (zh) 一种时频-空域联合加权的圆谐域伪声强声源定位方法
CN111798869B (zh) 一种基于双麦克风阵列的声源定位方法
Ren et al. A novel multiple sparse source localization using triangular pyramid microphone array
CN105607042A (zh) 用麦克风阵列时延估计定位声源的方法
CN103176166A (zh) 一种用于水声被动定位的信号到达时延差跟踪算法
CN109212481A (zh) 一种利用麦克风阵列进行声源定位的方法
CN106371057B (zh) 语音声源测向方法及装置
CN107167770A (zh) 一种混响条件下的麦克风阵列声源定位装置
CN112034418A (zh) 基于频域Bark子带的波束扫描方法及声源定向装置
CN105158734A (zh) 一种基于阵不变量的单矢量水听器被动定位方法
CN110007276B (zh) 一种声源定位方法及系统
CN110838303A (zh) 一种利用传声器阵列的语音声源定位方法
CN111239691B (zh) 一种抑制主声源的多声源跟踪方法
CN112731292B (zh) 局部imf能量加权的低空飞行目标信号时延估计方法
CN101982793B (zh) 一种基于立体声信号的移动音源定位方法
CN101645701B (zh) 一种基于滤波器组的时延估计方法及其系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20161025

Address after: 215500, No. 8, Jin Du Road, Southeast Economic Development Zone, Suzhou, Jiangsu, Changshou City

Patentee after: Changshu Nanjing Normal University Development Research Academy Institute Co., Ltd.

Address before: Zhongshan road Wuzhong District Mudu town of Suzhou city in Jiangsu province 215101 No. 70 Wuzhong Science Park Building 2 room 2310

Patentee before: Nanjing University of Information Science and Technology

TR01 Transfer of patent right

Effective date of registration: 20201230

Address after: No.3 building, No.88 Xianshi Road, Changshu high tech Industrial Development Zone, Suzhou City, Jiangsu Province

Patentee after: Changshu Zijin Intellectual Property Service Co.,Ltd.

Address before: 215500 No.8, Jindu Road, Southeast Economic Development Zone, Changshu City, Suzhou City, Jiangsu Province

Patentee before: CHANGSHU NANJING NORMAL UNIVERSITY DEVELOPMENT RESEARCH INSTITUTE Co.,Ltd.

TR01 Transfer of patent right