CN104181506A - 一种基于改进phat加权时延估计的声源定位方法及其实现系统 - Google Patents

一种基于改进phat加权时延估计的声源定位方法及其实现系统 Download PDF

Info

Publication number
CN104181506A
CN104181506A CN201410424948.XA CN201410424948A CN104181506A CN 104181506 A CN104181506 A CN 104181506A CN 201410424948 A CN201410424948 A CN 201410424948A CN 104181506 A CN104181506 A CN 104181506A
Authority
CN
China
Prior art keywords
time delay
sound source
microphone
control module
system control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410424948.XA
Other languages
English (en)
Other versions
CN104181506B (zh
Inventor
王永
倪暹
王照君
王雪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201410424948.XA priority Critical patent/CN104181506B/zh
Publication of CN104181506A publication Critical patent/CN104181506A/zh
Application granted granted Critical
Publication of CN104181506B publication Critical patent/CN104181506B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明涉及一种基于改进PHAT加权时延估计的声源定位方法,由麦克风阵列采集4路声音信号,通过A/D采样电路转化为数字信号,并通过改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值,再结合放置的麦克风阵列空间位置,利用迭代法解非线性方程组,从而得到声源的相对位置。本发明的麦克风阵列安排类似于直角坐标系的原点和x、y、z轴上的定长点,该方法计算量小,设备要求不高,速度快,做到即时定位;该声源定位系统应用于社会生活,军事领域等方面,如视频会议,路径规划,狙击手定位等等。

Description

一种基于改进PHAT加权时延估计的声源定位方法及其实现系统
技术领域
本发明涉及一种基于改进PHAT加权时延估计的声源定位方法及其实现系统,属于声源定位技术领域。
背景技术
声音是获取外界事物信息的一个重要途径,声音不单单可以承载语音信息,基于声音传播的特性和它的路径本身,我们还能够通过声源定位技术,获取声音承载内容信息之外的位置信息,并可以运用到跟踪搜寻,路线规划等相关领域,以改善某些系统的工作效率。
早先的定位方法主要依靠无线电,激光,声纳等设备,通过主动发送信号并监听被测物体反射回来的波,对接收的反射波进行分析和计算得到被测物的位置信息。因为发送和接受都是使用预先制定的频率波,不易受自然环境干扰,因此有高精度和高抗干扰的特性。然而这种主动式的定位方式首先要求具有强大的发射功率,这使得在一些功率不足的平台或某些能源限制环境下无法得到应用。另外由于是主动发射,在战争中很容易暴露自身,这在先发现先打击的现代战场来说是非常不利的,于是无源定位研究被不断提出。这其中的声源定位技术由于采用被动式原理,便于隐藏,不干扰现有电磁环境,使用广泛存在的声波,再加上设备成本低廉,功耗低,得到广泛的关注和研究。
近年来声源定位技术因为小型化智能设备的出现而快速发展,并在多媒体系统、视频会议、机械伤痕探测、机器人移动路径规划、军事探测等方面广泛应用。它在许多小型场所和一些开阔地带都能够起到重要辅助作用。例如视频会议中,根据说话人的位置,镜头和麦克风由声源定位系统控制,始终面向说话人的方向,这样可以更好的获取图像和声音信息。又如在军事战场中,敌方的隐藏火力点或者狙击手的伪装十分高明,不易发现,面对突如其来的开火往往会导致部队被动,在此种因敌方处于雷达和红外监测盲区而不易察觉的情况下,就可以使用声音定位来补充。美军最近推出的步兵便携声音定位系统就是依据声学建模和声源定位技术实现快速捕获火力源的。
现阶段的声源定位方法根据不同的应用要求,主要分为三大类:
1、仿人双耳的声源定位。其主要方法是对人听力系统的生理和心理进行分析和建模,模仿人类听觉工作原理,以实现定位、跟踪、分辨多运动声源,其建模和算法复杂多样,多用于仿生机器人等领域。2、基于到达时延的声源定位。假定一个以定速在空气中传播的声波,它到达位于不同位置的一对接收端的相位不同,根据这对接收端对同一声音记录的相位差别,通过时延算法求得各个接收端的时间差。3、基于声压幅度比的定位。声音在空气中传播时会使空气产生一定的压强变化,通过放置具有声压检测的接收器检测声压幅度,对来自同一个声源的声音信号的声压幅度会有强弱差异。这里使用声压幅度比的概念,每一个接收到声源信息的接收端根据声压幅度比得到声源距离接收端的距离。
广义互相关函数法属于基于到达时延的声源定位方法,其基本原理是:接收到的两组数字信号经过傅立叶变换到频域,求出他们的互功率谱,然后通过某种加权运算,傅立叶反变换到时域,即得到两组信号的广义互相关函数。互相关函数的极值所对应的时间就是两组信号间的时间差。广义互相关函数方法建立在非混响模型基础上。由于基本模型带来的误差,它不能够精确辨识多个声源,也不能分辨带有方向性的噪声,只适用于对强信号的时延估计,所以广义互相关函数方法不适用于有较大混响和有相关噪声的场合。但在一般情况下,由于它的低复杂度和小计算量,易于实现,广义互相关函数方法还是得到了广泛的应用。
发明内容
为了克服广义互相关函数法的缺点和利用其低复杂度和小计算量的优点,本发明公开了一种基于改进PHAT加权时延估计的声源定位方法,该方法算法简单,易于实现,能够快速定位声源。
本发明还公开了一种上述方法的实现系统。
本发明的技术方案为:
一种基于改进PHAT加权时延估计的声源定位方法,具体包括以下步骤:
(1)在三维直角坐标系下选择(0,0,0),(a,0,0),(0,a,0),(0,0,a)4个位置摆放麦克风,得到麦克风阵列,所述a为固定参数,所述a表示分别位于坐标(a,0,0)、(0,a,0)、(0,0,a)位置的三个麦克风到位于原点坐标(0,0,0)位置的麦克风的距离;
(2)步骤(1)所述麦克风阵列采集4路声音信号,并对所述声音信号进行放大处理,并对放大处理后的声音信号实现直流垫高处理,输出模拟信号;
所述的直流垫高处理是利用现有MIC与电压放大抬高电路实现的,所述MIC与电压放大抬高电路包括4路麦克风和两级运算放大器,实现固定增益,并采用运算放大器反相相加电路,实现对所述声音信号的直流垫高处理;
(3)将步骤(2)输出的模拟信号分别传输到中断触发电路和A/D采样电路;
(4)所述中断触发电路检测到传输至所述中断触发电路的模拟信号时,向所述算法处理和系统控制模块发送中断信息;所述A/D采样电路检测到传输至所述A/D采样电路的模拟信号,将4路所述模拟信号转换为4路数字信号,并传送至所述算法处理和系统控制模块;
当步骤(2)所述模拟信号发送到所述中断触发电路,所述中断触发电路判断所述模拟信号的电压大小,超过阈值后产生中断信号并发送至所述算法处理和系统控制模块,所述阈值为0.3V。
(5)所述算法处理和系统控制模块默认休眠等待,所述算法处理和系统控制模块接收到所述中断信息,并获取到步骤(4)所述4路数字信号,所述算法处理和系统控制模块先对所述4路数字信号进行信号预处理,然后采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值;
步骤(5)所述的信号预处理的实现方法为:在算法处理和系统控制模块中,通过预加窗的方法,由A/D采样电路转换得到的4路数字信号通过带通滤波器滤波,选择需要接收的声源所在频域,所述声源所在频域依据声源性质通过现有技术查询得到,同时除去超出A/D采样电路频率1/2以上的频率分量,防止混叠干扰;
步骤(5)所述的采用改进的PHAT加权广义互相关函数法进行时延估计算法处理的实现方法为:采用改进的PHAT加权广义互相关函数法得到到达不同麦克风的时间差。
(6)通过时延估计值,采用迭代法求出声源位置。
所述步骤(6)所述的采用迭代法求出声源位置的实现方法为:由时间差和麦克风坐标位置,采用迭代法求解非线性方程组,从而得到声源位置。
根据本发明优选的,所述步骤(5)所述的采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,具体包括步骤如下:
a、步骤(4)所述的4路数字信号分别设定为x1(n)、x2(n)、x3(n)、x4(n),对步骤(4)所述的4路数字信号依次进行加窗滤波处理及傅立叶变换,依次得到频域信号X1(k),X2(k),X3(k),X4(k),所述n、k均为整数,代表所述数字信号中的点的序号;
b、通过式Ⅰ、式Ⅱ、式Ⅲ采用改进的PHAT加权广义互相关函数法分别计算步骤a得到的4路频域信号中X1(k)与X2(k)、X1(k)与X3(k)、X1(k)与X4(k)的加权互功率谱G12(k)、G13(k)、G14(k):
G 12 ( k ) = X 1 * ( k ) X 2 ( k ) | X 1 * ( k ) X 2 ( k ) | N + 0.1 - - - I
G 13 ( k ) = X 1 * ( k ) X 3 ( k ) | X 1 * ( k ) X 3 ( k ) | N + 0.1 - - - II
G 14 ( k ) = X 1 * ( k ) X 4 ( k ) | X 1 * ( k ) X 4 ( k ) | N + 0.1 - - - III
式Ⅰ、式Ⅱ、式Ⅲ中,为X1(k)的共轭;对于语音声源,N为常数,N的取值范围为0.7-0.8;
c、对步骤b所述G12(k)、G13(k)、G14(k)分别进行傅立叶逆变换运算,得到广义互相关函数R12(n)、R13(n)、R14(n);
d、分别取得所述R12(n)、R13(n)、R14(n)的最大值时对应的n值即n1、n2、n3,当n1﹥M/2时,取n1=M+1-n1,当n2﹥M/2时,取n2=M+1-n2,当n3﹥M/2,取n3=M+1-n3,所述M为傅立叶变换运算点数;
e、步骤d最终得到的所述n1、n2、n3分别与采样周期t相乘得到三路时延值t1、t2、t3
所述数字信号通过有限长度的窗口进行加窗预滤波处理,进行傅立叶变换,得到所述数字信号的互功率谱,通过加权函数对所述互功率谱进行加权运算,即将互功率谱乘以加权函数,然后,通过傅立叶逆变换得到互相关函数,最后,通过峰值检测找到极值点对应的互相关函数时间点,即接收器间的时延;
加权函数的使用是为了突出互相关函数的信号的峰值,抑制噪声的干扰,ψ12(ω)表示加权函数,G12(ω)为两路数字信号的互功率谱密度,ω为频率,PHAT加权的表达式本发明经修改后设计为其中N主要随声源性质而变,所述N的取值范围为0.7-0.8。
根据本发明优选的,所述采用迭代法求出声源位置,具体步骤包括:
设定声源坐标为(x,y,z),利用迭代公式,通过声源与所述麦克风之间的距离利用现有技术预设x、y、z的初始值x0,y0,z0,利用如下公式,进行迭代运算:
x n + 1 = alf n - ( vt 1 - beta n ) 2 2 a
y n + 1 = alf n - ( vt 2 - beta n ) 2 2 a - - - IV
z n + 1 = alf n - ( vt 3 - beta n ) 2 2 a
式Ⅳ中,其中t1,t2,t3为三路时延值t1、t2、t3,即t1为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(a,0,0)的位置的麦克风的时间差;t2为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,a,0)的位置的麦克风的时间差;t3为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,0,a)的位置的麦克风的时间差;sqrn=xn 2+yn 2+zn 2,alfn=sqrn+a2v为声音在空气中的速度;
当|xn+1-xn|≤0.001且|yn+1-yn|≤0.001且|zn+1-zn|≤0.001时,迭代停止,从而解出方程,得到的值xn+1、yn+1、zn+1即为声源坐标(x,y,z)中的x、y、z,即x=xn+1,y=yn+1,z=zn+1,得到声源坐标(xn+1,yn+1,zn+1),求出声源位置。
所述式Ⅳ的推导过程如下所示:
设定声源坐标为(x,y,z),d为声源到坐标(a,0,0)的麦克风的距离,作该点到x轴的垂线,交于(x,0,0),则满足式Ⅴ:
d2=(x-a)2+y2+z2          Ⅴ
到达原点的声波路径满足下式:
vt + d = x 2 + y 2 + z 2 - - - VI
所述v为声音在空气中的速度,t为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,0,a)的位置的麦克风的时间差;
化简可得下式:
x = x 2 + y 2 + z 2 + a 2 - ( vt 1 - x 2 + y 2 + z 2 ) 2 2 a - - - VII
同理可得
y = x 2 + y 2 + z 2 + a 2 - ( vt 2 - x 2 + y 2 + z 2 ) 2 2 a - - - VIII
z = x 2 + y 2 + z 2 + a 2 - ( vt 3 - x 2 + y 2 + z 2 ) 2 2 a - - - IX
其中t1,t2,t3为三路时延值t1、t2、t3,即t1为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(a,0,0)的位置的麦克风的时间差;即t2为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,a,0)的位置的麦克风的时间差;即t3为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,0,a)的位置的麦克风的时间差;
设定sqrn=xn 2+yn 2+zn 2,alfn=sqrn+a2代入到式Ⅶ、式Ⅷ、式Ⅸ中,由此化简,列出迭代方程:
x n + 1 = alf n - ( vt 1 - beta n ) 2 2 a
y n + 1 = alf n - ( vt 2 - beta n ) 2 2 a - - - X
z n + 1 = alf n - ( vt 3 - beta n ) 2 2 a
将x0,y0,z0赋予初始值,带入进行迭代运算,当|xn+1-xn|≤0.001且|yn+1-yn|≤0.001且|zn+1-zn|≤0.001时,迭代停止,从而解出方程,求出声源坐标,求出声源位置。
一种实现上述方法的系统,包括四路MIC与电压放大抬高电路、中断触发电路、A/D模数转换模块、算法处理和系统控制模块及显示模块,所述四路MIC与电压放大抬高电路分别与所述中断触发电路、所述A/D模数转换模块连接,所述中断触发电路、所述A/D模数转换模块分别连接所述算法处理和系统控制模块,所述算法处理和系统控制模块连接所述显示模块。
根据本发明优选的,所述MIC与电压放大抬高电路由4路麦克风和两级运算放大器组成,通过所述两级运算放大器放大和直流垫高,输出0-3.3V的模拟信号,并将所述模拟信号分别发送至中断触发电路和A/D模数转换模块;所述中断触发电路判断所述模拟信号的电压大小,超过阈值后将发送中断信号到所述算法处理和系统控制模块;所述A/D模数转换模块将所述模拟信号转换为数字信号,并传送至所述算法处理和系统控制模块;所述算法处理和系统控制模块先对所述数字信号进行信号预处理,然后采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值,通过时延估计值,采用迭代法求出声源位置;所述显示模块用于显示声源位置。
根据本发明优选的,所述算法处理和系统控制模块为STM32开发平台。
本发明的有益效果为:
1、本发明采用无源定位方法,被动探测式原理,功耗小,易隐藏;
2、本发明计算量小,设备要求不高,速度快,可做到即时定位,本发明所述系统应用于社会生活,军事领域等方面,如视频会议,路径规划,狙击手定位等等;
3、本发明可以方便的与其他需要定位数据的系统结合,实现智能化,简洁化等功能,如虚拟键盘等;
附图说明
图1为本发明实现基于改进PHAT加权时延估计的声源定位方法的系统示意图;
图2为本发明三维直角坐标系下麦克风阵列的安放和采用迭代法求出声源位置计算图;
具体实施方式
下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
实施例1
一种基于改进PHAT加权时延估计的声源定位方法,具体包括以下步骤:
(1)在三维直角坐标系下选择(0,0,0),(a,0,0),(0,a,0),(0,0,a)4个位置摆放麦克风,得到麦克风阵列,所述a为固定参数,所述a表示分别位于坐标(a,0,0)、(0,a,0)、(0,0,a)位置的三个麦克风到位于原点坐标(0,0,0)位置的麦克风的距离;
(2)步骤(1)所述麦克风阵列采集4路声音信号,并对所述声音信号进行放大处理,并对放大处理后的声音信号实现直流垫高处理,输出模拟信号;
所述的直流垫高处理是利用现有MIC与电压放大抬高电路实现的,所述MIC与电压放大抬高电路包括4路麦克风和两级运算放大器,实现固定增益,并采用运算放大器反相相加电路,实现对所述声音信号的直流垫高处理;
(3)将步骤(2)输出的模拟信号分别传输到中断触发电路和A/D采样电路;
(4)所述中断触发电路检测到传输至所述中断触发电路的模拟信号时,向所述算法处理和系统控制模块发送中断信息;所述A/D采样电路检测到传输至所述A/D采样电路的模拟信号,将4路所述模拟信号转换为4路数字信号,并传送至所述算法处理和系统控制模块;
当步骤(2)所述模拟信号发送到所述中断触发电路,所述中断触发电路判断所述模拟信号的电压大小,超过阈值后产生中断信号并发送至所述算法处理和系统控制模块,所述阈值为0.3V。
(5)所述算法处理和系统控制模块默认休眠等待,所述算法处理和系统控制模块接收到所述中断信息,并获取到步骤(4)所述4路数字信号,所述算法处理和系统控制模块先对所述4路数字信号进行信号预处理,然后采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值;
步骤(5)所述的信号预处理的实现方法为:在算法处理和系统控制模块中,通过预加窗的方法,由A/D采样电路转换得到的4路数字信号通过带通滤波器滤波,选择需要接收的声源所在频域,所述声源所在频域依据声源性质通过现有技术查询得到,同时除去超出A/D采样电路频率1/2以上的频率分量,防止混叠干扰;
步骤(5)所述的采用改进的PHAT加权广义互相关函数法进行时延估计算法处理的实现方法为:采用改进的PHAT加权广义互相关函数法得到到达不同麦克风的时间差。
(6)通过时延估计值,采用迭代法求出声源位置。
所述步骤(6)所述的采用迭代法求出声源位置的实现方法为:由时间差和麦克风坐标位置,采用迭代法求解非线性方程组,从而得到声源位置。
实施例2
根据实施例1所述的一种基于改进PHAT加权时延估计的声源定位方法,其区别在于,所述步骤(5)所述的采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,具体包括步骤如下:
a、步骤(4)所述的4路数字信号分别设定为x1(n)、x2(n)、x3(n)、x4(n),对步骤(4)所述的4路数字信号依次进行加窗滤波处理及傅立叶变换,依次得到频域信号X1(k),X2(k),X3(k),X4(k),所述n、k均为整数,代表所述数字信号中的点的序号;
b、通过式Ⅰ、式Ⅱ、式Ⅲ采用改进的PHAT加权广义互相关函数法分别计算步骤a得到的4路频域信号中X1(k)与X2(k)、X1(k)与X3(k)、X1(k)与X4(k)的加权互功率谱G12(k)、G13(k)、G14(k):
G 12 ( k ) = X 1 * ( k ) X 2 ( k ) | X 1 * ( k ) X 2 ( k ) | N + 0.1 - - - I
G 13 ( k ) = X 1 * ( k ) X 3 ( k ) | X 1 * ( k ) X 3 ( k ) | N + 0.1 - - - II
G 14 ( k ) = X 1 * ( k ) X 4 ( k ) | X 1 * ( k ) X 4 ( k ) | N + 0.1 - - - III
式Ⅰ、式Ⅱ、式Ⅲ中,为X1(k)的共轭;对于语音声源,N为常数,N的取值范围为0.7-0.8;
c、对步骤b所述G12(k)、G13(k)、G14(k)分别进行傅立叶逆变换运算,得到广义互相关函数R12(n)、R13(n)、R14(n);
d、分别取得所述R12(n)、R13(n)、R14(n)的最大值时对应的n值即n1、n2、n3,当n1﹥M/2时,取n1=M+1-n1,当n2﹥M/2时,取n2=M+1-n2,当n3﹥M/2,取n3=M+1-n3,所述M为傅立叶变换运算点数;
e、步骤d最终得到的所述n1、n2、n3分别与采样周期t相乘得到三路时延值t1、t2、t3
所述数字信号通过有限长度的窗口进行加窗预滤波处理,进行傅立叶变换,得到所述数字信号的互功率谱,通过加权函数对所述互功率谱进行加权运算,即将互功率谱乘以加权函数,然后,通过傅立叶逆变换得到互相关函数,最后,通过峰值检测找到极值点对应的互相关函数时间点,即接收器间的时延;
加权函数的使用是为了突出互相关函数的信号的峰值,抑制噪声的干扰,ψ12(ω)表示加权函数,G12(ω)为两路数字信号的互功率谱密度,ω为频率,PHAT加权的表达式本发明经修改后设计为其中N主要随声源性质而变,所述N的取值为0.7。
所述采用迭代法求出声源位置,具体步骤包括:
设定声源坐标为(x,y,z),利用迭代公式,通过声源与所述麦克风之间的距离利用现有技术预设x、y、z的初始值x0,y0,z0,利用如下公式,进行迭代运算:
x n + 1 = alf n - ( vt 1 - beta n ) 2 2 a
y n + 1 = alf n - ( vt 2 - beta n ) 2 2 a - - - IV
z n + 1 = alf n - ( vt 3 - beta n ) 2 2 a
式Ⅳ中,其中t1,t2,t3为三路时延值t1、t2、t3,即t1为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(a,0,0)的位置的麦克风的时间差;t2为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,a,0)的位置的麦克风的时间差;t3为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,0,a)的位置的麦克风的时间差;sqrn=xn 2+yn 2+zn 2,alfn=sqrn+a2v为声音在空气中的速度;
当|xn+1-xn|≤0.001且|yn+1-yn|≤0.001且|zn+1-zn|≤0.001时,迭代停止,从而解出方程,得到的值xn+1、yn+1、zn+1即为声源坐标(x,y,z)中的x、y、z,即x=xn+1,y=yn+1,z=zn+1,得到声源坐标(xn+1,yn+1,zn+1),求出声源位置。
所述式Ⅳ的推导过程如下所示:
设定声源坐标为(x,y,z),d为声源到坐标(a,0,0)的麦克风的距离,作该点到x轴的垂线,交于(x,0,0),则满足式Ⅴ:
d2=(x-a)2+y2+z2      Ⅴ
到达原点的声波路径满足下式:
vt + d = x 2 + y 2 + z 2 - - - VI
所述v为声音在空气中的速度,t为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,0,a)的位置的麦克风的时间差;
化简可得下式:
x = x 2 + y 2 + z 2 + a 2 - ( vt 1 - x 2 + y 2 + z 2 ) 2 2 a - - - VII
同理可得
y = x 2 + y 2 + z 2 + a 2 - ( vt 2 - x 2 + y 2 + z 2 ) 2 2 a - - - VIII
z = x 2 + y 2 + z 2 + a 2 - ( vt 3 - x 2 + y 2 + z 2 ) 2 2 a - - - IX
其中t1,t2,t3为三路时延值t1、t2、t3,即t1为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(a,0,0)的位置的麦克风的时间差;即t2为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,a,0)的位置的麦克风的时间差;即t3为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,0,a)的位置的麦克风的时间差;
设定sqrn=xn 2+yn 2+zn 2,alfn=sqrn+a2代入到式Ⅶ、式Ⅷ、式Ⅸ中,由此化简,列出迭代方程:
x n + 1 = alf n - ( vt 1 - beta n ) 2 2 a
y n + 1 = alf n - ( vt 2 - beta n ) 2 2 a - - - X
z n + 1 = alf n - ( vt 3 - beta n ) 2 2 a
将x0,y0,z0赋予初始值,带入进行迭代运算,当|xn+1-xn|≤0.001且|yn+1-yn|≤0.001且|zn+1-zn|≤0.001时,迭代停止,从而解出方程,求出声源坐标,求出声源位置。
实施例3
根据实施例2所述的一种基于改进PHAT加权时延估计的声源定位方法,其区别在于:所述N的取值为0.8。
实施例4
根据实施例2所述的一种基于改进PHAT加权时延估计的声源定位方法,其区别在于:所述N的取值为0.75。
实施例5
一种实现上述方法的系统,包括四路MIC与电压放大抬高电路、中断触发电路、A/D模数转换模块、算法处理和系统控制模块及显示模块,所述四路MIC与电压放大抬高电路分别与所述中断触发电路、所述A/D模数转换模块连接,所述中断触发电路、所述A/D模数转换模块分别连接所述算法处理和系统控制模块,所述算法处理和系统控制模块连接所述显示模块。
所述MIC与电压放大抬高电路由4路麦克风和两级运算放大器组成,通过所述两级运算放大器放大和直流垫高,输出0-3.3V的模拟信号,并将所述模拟信号分别发送至中断触发电路和A/D模数转换模块;所述中断触发电路判断所述模拟信号的电压大小,超过阈值后将发送中断信号到所述算法处理和系统控制模块;所述A/D模数转换模块将所述模拟信号转换为数字信号,并传送至所述算法处理和系统控制模块;所述算法处理和系统控制模块先对所述数字信号进行信号预处理,然后采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值,通过时延估计值,采用迭代法求出声源位置;所述显示模块用于显示声源位置。
所述算法处理和系统控制模块为STM32开发平台。

Claims (7)

1.一种基于改进PHAT加权时延估计的声源定位方法,其特征在于,具体包括以下步骤:
(1)在三维直角坐标系下选择(0,0,0),(a,0,0),(0,a,0),(0,0,a)4个位置摆放麦克风,得到麦克风阵列,所述a为固定参数,所述a表示分别位于坐标(a,0,0)、(0,a,0)、(0,0,a)位置的三个麦克风到位于原点坐标(0,0,0)位置的麦克风的距离;
(2)步骤(1)所述麦克风阵列采集4路声音信号,并对所述声音信号进行放大处理,并对放大处理后的声音信号实现直流垫高处理,输出模拟信号;
(3)将步骤(2)输出的模拟信号分别传输到中断触发电路和A/D采样电路;
(4)所述中断触发电路检测到传输至所述中断触发电路的模拟信号时,向所述算法处理和系统控制模块发送中断信息;所述A/D采样电路检测到传输至所述A/D采样电路的模拟信号,将4路所述模拟信号转换为4路数字信号,并传送至所述算法处理和系统控制模块;
(5)所述算法处理和系统控制模块默认休眠等待,所述算法处理和系统控制模块接收到所述中断信息,并获取到步骤(4)所述4路数字信号,所述算法处理和系统控制模块先对所述4路数字信号进行信号预处理,然后采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值;
(6)通过时延估计值,采用迭代法求出声源位置。
2.根据权利要求1所述的一种基于改进PHAT加权时延估计的声源定位方法,其特征在于,所述步骤(5)所述的采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,具体包括步骤如下:
a、步骤(4)所述的4路数字信号分别设定为x1(n)、x2(n)、x3(n)、x4(n),对步骤(4)所述的4路数字信号依次进行加窗滤波处理及傅立叶变换,依次得到频域信号X1(k),X2(k),X3(k),X4(k),所述n、k均为整数,代表所述数字信号中的点的序号;
b、通过式Ⅰ、式Ⅱ、式Ⅲ采用改进的PHAT加权广义互相关函数法分别计算步骤a得到的4路频域信号中X1(k)与X2(k)、X1(k)与X3(k)、X1(k)与X4(k)的加权互功率谱G12(k)、G13(k)、G14(k):
G 12 ( k ) = X 1 * ( k ) X 2 ( k ) | X 1 * ( k ) X 2 ( k ) | N + 0.1 - - - I
G 13 ( k ) = X 1 * ( k ) X 3 ( k ) | X 1 * ( k ) X 3 ( k ) | N + 0.1 - - - II
G 14 ( k ) = X 1 * ( k ) X 4 ( k ) | X 1 * ( k ) X 4 ( k ) | N + 0.1 - - - III
式Ⅰ、式Ⅱ、式Ⅲ中,为X1(k)的共轭;对于语音声源,N为常数,N的取值范围为0.7-0.8;
c、对步骤b所述G12(k)、G13(k)、G14(k)分别进行傅立叶逆变换运算,得到广义互相关函数R12(n)、R13(n)、R14(n);
d、分别取得所述R12(n)、R13(n)、R14(n)的最大值时对应的n值即n1、n2、n3,当n1﹥M/2时,取n1=M+1-n1,当n2﹥M/2时,取n2=M+1-n2,当n3﹥M/2,取n3=M+1-n3,所述M为傅立叶变换运算点数;
e、步骤d最终得到的所述n1、n2、n3分别与采样周期t相乘得到三路时延值t1、t2、t3
3.根据权利要求2所述的一种基于改进PHAT加权时延估计的声源定位方法,其特征在于,所述采用迭代法求出声源位置,具体步骤包括:
设定声源坐标为(x,y,z),利用迭代公式,通过声源与所述麦克风之间的距离利用现有技术预设x、y、z的初始值x0,y0,z0,利用如下公式,进行迭代运算:
x n + 1 = alf n - ( vt 1 - beta n ) 2 2 a
y n + 1 = alf n - ( vt 2 - beta n ) 2 2 a - - - IV
z n + 1 = alf n - ( vt 3 - beta n ) 2 2 a
式Ⅳ中,其中t1,t2,t3为三路时延值t1、t2、t3,即t1为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(a,0,0)的位置的麦克风的时间差;t2为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,a,0)的位置的麦克风的时间差;t3为声音传播到位于坐标原点(0,0,0)位置的麦克风与位于坐标(0,0,a)的位置的麦克风的时间差;sqrn=xn 2+yn 2+zn 2,alfn=sqrn+a2v为声音在空气中的速度;
当|xn+1-xn|≤0.001且|yn+1-yn|≤0.001且|zn+1-zn|≤0.001时,迭代停止,从而解出方程,得到的值xn+1、yn+1、zn+1即为声源坐标(x,y,z)中的x、y、z,即x=xn+1,y=yn+1,z=zn+1,得到声源坐标(xn+1,yn+1,zn+1),求出声源位置。
4.一种实现权利要求1-3任一所述的一种基于改进PHAT加权时延估计的声源定位方法的系统,其特征在于,包括四路MIC与电压放大抬高电路、中断触发电路、A/D模数转换模块、算法处理和系统控制模块及显示模块,所述四路MIC与电压放大抬高电路分别与所述中断触发电路、所述A/D模数转换模块连接,所述中断触发电路、所述A/D模数转换模块分别连接所述算法处理和系统控制模块,所述算法处理和系统控制模块连接所述显示模块。
5.根据权利要求4所述的系统,其特征在于,所述MIC与电压放大抬高电路由4路麦克风和两级运算放大器组成,通过所述两级运算放大器放大和直流垫高,输出0-3.3V的模拟信号,并将所述模拟信号分别发送至中断触发电路和A/D模数转换模块;所述中断触发电路判断所述模拟信号的电压大小,超过阈值后将发送中断信号到所述算法处理和系统控制模块;所述A/D模数转换模块将所述模拟信号转换为数字信号,并传送至所述算法处理和系统控制模块;所述算法处理和系统控制模块先对所述数字信号进行信号预处理,然后采用改进的PHAT加权广义互相关函数法进行时延估计算法处理,获得时延估计值,通过时延估计值,采用迭代法求出声源位置;所述显示模块用于显示声源位置。
6.根据权利要求4所述的系统,其特征在于,所述算法处理和系统控制模块为STM32开发平台。
7.根据权利要求5所述的系统,其特征在于,所述算法处理和系统控制模块为STM32开发平台。
CN201410424948.XA 2014-08-26 2014-08-26 一种基于改进phat加权时延估计的声源定位方法及其实现系统 Active CN104181506B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410424948.XA CN104181506B (zh) 2014-08-26 2014-08-26 一种基于改进phat加权时延估计的声源定位方法及其实现系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410424948.XA CN104181506B (zh) 2014-08-26 2014-08-26 一种基于改进phat加权时延估计的声源定位方法及其实现系统

Publications (2)

Publication Number Publication Date
CN104181506A true CN104181506A (zh) 2014-12-03
CN104181506B CN104181506B (zh) 2016-08-17

Family

ID=51962708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410424948.XA Active CN104181506B (zh) 2014-08-26 2014-08-26 一种基于改进phat加权时延估计的声源定位方法及其实现系统

Country Status (1)

Country Link
CN (1) CN104181506B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105445697A (zh) * 2016-01-05 2016-03-30 西安成峰科技有限公司 一种低成本低功耗的声源定向方法
CN106296854A (zh) * 2016-08-12 2017-01-04 上海电机学院 一种基于麦克风阵列的课堂点名系统
CN106843054A (zh) * 2017-02-23 2017-06-13 深圳市地铁集团有限公司 一种基于互联网的土木工程监测控制系统
CN106886010A (zh) * 2017-01-17 2017-06-23 南京航空航天大学 一种基于微型麦克风阵列的声源方位识别方法
CN107064878A (zh) * 2017-06-28 2017-08-18 山东大学 一种基于高精度gps的声源定位方法及其实现系统
CN107180642A (zh) * 2017-07-20 2017-09-19 北京华捷艾米科技有限公司 音频信号校正方法、装置及设备
CN107468232A (zh) * 2017-09-05 2017-12-15 苏州风尚智选医疗科技有限公司 胎心监护装置和方法
CN108089153A (zh) * 2016-11-23 2018-05-29 杭州海康威视数字技术股份有限公司 一种声源定位方法、装置及系统
CN108363041A (zh) * 2018-02-02 2018-08-03 浙江大学 基于k均值聚类迭代的无人机声源定位方法
CN108510987A (zh) * 2018-03-26 2018-09-07 北京小米移动软件有限公司 语音处理方法及装置
CN108802684A (zh) * 2018-03-29 2018-11-13 南京信息工程大学 基于反演算法的雷声三维定位方法
CN108870650A (zh) * 2018-07-12 2018-11-23 四川虹美智能科技有限公司 一种空调及一种空调的控制方法
CN109669158A (zh) * 2017-10-16 2019-04-23 杭州海康威视数字技术股份有限公司 一种声源定位方法、系统、计算机设备及存储介质
CN109741763A (zh) * 2019-02-25 2019-05-10 厦门盈趣汽车电子有限公司 一种具有分贝检测功能的可穿戴设备
CN110261819A (zh) * 2019-06-19 2019-09-20 南京航空航天大学 基于时延补偿的多无人机协同定位方法
CN111388003A (zh) * 2020-03-25 2020-07-10 清华大学 柔性电子听诊装置、体音确定装置及听诊系统
CN112328126A (zh) * 2020-10-16 2021-02-05 上海紫钥信息技术有限公司 一种弹射玩具射屏判定系统及方法
CN113466793A (zh) * 2021-06-11 2021-10-01 五邑大学 一种基于麦克风阵列的声源定位方法、装置及存储介质
CN113702909A (zh) * 2021-08-30 2021-11-26 浙江大学 一种基于声音信号到达时间差的声源定位解析解计算方法及装置
CN113820662A (zh) * 2021-08-02 2021-12-21 华南师范大学 一种声源方向定位检测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102305925A (zh) * 2011-07-22 2012-01-04 北京大学 一种机器人连续声源定位方法
US20130223188A1 (en) * 2010-11-12 2013-08-29 Nokia Corporation Proximity detecting apparatus and method based on audio signals
CN103364761A (zh) * 2013-07-12 2013-10-23 哈尔滨工业大学 一种室内声源定位系统及采用该系统定位室内声源的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130223188A1 (en) * 2010-11-12 2013-08-29 Nokia Corporation Proximity detecting apparatus and method based on audio signals
CN102305925A (zh) * 2011-07-22 2012-01-04 北京大学 一种机器人连续声源定位方法
CN103364761A (zh) * 2013-07-12 2013-10-23 哈尔滨工业大学 一种室内声源定位系统及采用该系统定位室内声源的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘真旭: "基于麦克风阵列的实时声源定位", 《计算机应用与软件》, vol. 27, no. 06, 30 June 2010 (2010-06-30), pages 43 - 45 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105445697B (zh) * 2016-01-05 2018-01-16 西安成峰科技有限公司 一种低成本低功耗的声源定向方法
CN105445697A (zh) * 2016-01-05 2016-03-30 西安成峰科技有限公司 一种低成本低功耗的声源定向方法
CN106296854A (zh) * 2016-08-12 2017-01-04 上海电机学院 一种基于麦克风阵列的课堂点名系统
CN108089153A (zh) * 2016-11-23 2018-05-29 杭州海康威视数字技术股份有限公司 一种声源定位方法、装置及系统
CN106886010A (zh) * 2017-01-17 2017-06-23 南京航空航天大学 一种基于微型麦克风阵列的声源方位识别方法
CN106886010B (zh) * 2017-01-17 2019-07-30 南京航空航天大学 一种基于微型麦克风阵列的声源方位识别方法
CN106843054A (zh) * 2017-02-23 2017-06-13 深圳市地铁集团有限公司 一种基于互联网的土木工程监测控制系统
WO2019000680A1 (zh) * 2017-06-28 2019-01-03 山东大学 一种基于高精度gps的声源定位方法及其实现系统
CN107064878A (zh) * 2017-06-28 2017-08-18 山东大学 一种基于高精度gps的声源定位方法及其实现系统
CN107180642A (zh) * 2017-07-20 2017-09-19 北京华捷艾米科技有限公司 音频信号校正方法、装置及设备
CN107468232A (zh) * 2017-09-05 2017-12-15 苏州风尚智选医疗科技有限公司 胎心监护装置和方法
CN109669158A (zh) * 2017-10-16 2019-04-23 杭州海康威视数字技术股份有限公司 一种声源定位方法、系统、计算机设备及存储介质
CN109669158B (zh) * 2017-10-16 2021-04-20 杭州海康威视数字技术股份有限公司 一种声源定位方法、系统、计算机设备及存储介质
CN108363041A (zh) * 2018-02-02 2018-08-03 浙江大学 基于k均值聚类迭代的无人机声源定位方法
CN108363041B (zh) * 2018-02-02 2020-04-10 浙江大学 基于k均值聚类迭代的无人机声源定位方法
US10930304B2 (en) 2018-03-26 2021-02-23 Beijing Xiaomi Mobile Software Co., Ltd. Processing voice
CN108510987A (zh) * 2018-03-26 2018-09-07 北京小米移动软件有限公司 语音处理方法及装置
CN108802684A (zh) * 2018-03-29 2018-11-13 南京信息工程大学 基于反演算法的雷声三维定位方法
CN108802684B (zh) * 2018-03-29 2022-02-22 南京信息工程大学 基于反演算法的雷声三维定位方法
CN108870650A (zh) * 2018-07-12 2018-11-23 四川虹美智能科技有限公司 一种空调及一种空调的控制方法
CN109741763A (zh) * 2019-02-25 2019-05-10 厦门盈趣汽车电子有限公司 一种具有分贝检测功能的可穿戴设备
CN110261819A (zh) * 2019-06-19 2019-09-20 南京航空航天大学 基于时延补偿的多无人机协同定位方法
CN111388003B (zh) * 2020-03-25 2021-01-29 清华大学 柔性电子听诊装置、体音确定装置及听诊系统
CN111388003A (zh) * 2020-03-25 2020-07-10 清华大学 柔性电子听诊装置、体音确定装置及听诊系统
CN112328126A (zh) * 2020-10-16 2021-02-05 上海紫钥信息技术有限公司 一种弹射玩具射屏判定系统及方法
CN113466793A (zh) * 2021-06-11 2021-10-01 五邑大学 一种基于麦克风阵列的声源定位方法、装置及存储介质
CN113466793B (zh) * 2021-06-11 2023-10-17 五邑大学 一种基于麦克风阵列的声源定位方法、装置及存储介质
CN113820662A (zh) * 2021-08-02 2021-12-21 华南师范大学 一种声源方向定位检测方法
CN113702909A (zh) * 2021-08-30 2021-11-26 浙江大学 一种基于声音信号到达时间差的声源定位解析解计算方法及装置
CN113702909B (zh) * 2021-08-30 2023-10-31 浙江大学 一种基于声音信号到达时间差的声源定位解析解计算方法及装置

Also Published As

Publication number Publication date
CN104181506B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN104181506A (zh) 一种基于改进phat加权时延估计的声源定位方法及其实现系统
US9488716B2 (en) Microphone autolocalization using moving acoustic source
CN103308889A (zh) 复杂环境下被动声源二维doa估计方法
KR101349268B1 (ko) 마이크로폰 어레이를 이용한 음원 거리 측정 장치
US20100157738A1 (en) Sonic Wave Output Device, Voice Communication Device, Sonic Wave Output Method and Program
Zhang et al. EarArray: Defending against DolphinAttack via Acoustic Attenuation.
CN108600894A (zh) 一种耳机自适应有源噪声控制系统及方法
CN113702909B (zh) 一种基于声音信号到达时间差的声源定位解析解计算方法及装置
CN105223551A (zh) 一种可穿戴的声源定位跟踪系统及方法
CN108279398A (zh) 传感器以及推定生物体的位置的方法
CN104459703A (zh) 一种声纳测距方法和移动设备
CN103856877A (zh) 一种声控信息检测方法及电子设备
CN106339081B (zh) 一种基于商用设备的免携带设备手掌定位人机交互方法
Kashimoto et al. Floor vibration type estimation with piezo sensor toward indoor positioning system
Kovandžić et al. Near field acoustic localization under unfavorable conditions using feedforward neural network for processing time difference of arrival
Wan et al. Time differences of arrival estimation of mixed interference signals using blind source separation based on wireless sensor networks
Jeong et al. Fundamental limits of TOA/DOA and inertial measurement unit-based wireless capsule endoscopy hybrid localization
Avazov et al. A trajectory-driven 3D non-stationary mm-wave MIMO channel model for a single moving point scatterer
Nishimura et al. A proposal on direction estimation between devices using acoustic waves
Bhardwaj et al. Wireless smart system for intruder detection at borders with far-field microphone and TDOA
Suo et al. Single acoustic vector sensor DOA enhanced by unsaturated bistable stochastic resonance with linear amplitude response constrained
Feferman et al. Indoor positioning with unsynchronized sound sources
Yan et al. Design of time difference of arrival estimation system based on fast cross correlation
Pertilä et al. Time-of-arrival estimation for blind beamforming
Nonsakhoo et al. Angle of arrival estimation by using stereo ultrasonic technique for local positioning system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant