CN105204001A - 一种声源定位的方法及系统 - Google Patents

一种声源定位的方法及系统 Download PDF

Info

Publication number
CN105204001A
CN105204001A CN201510661040.5A CN201510661040A CN105204001A CN 105204001 A CN105204001 A CN 105204001A CN 201510661040 A CN201510661040 A CN 201510661040A CN 105204001 A CN105204001 A CN 105204001A
Authority
CN
China
Prior art keywords
sound source
signal
time
microphone
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510661040.5A
Other languages
English (en)
Inventor
邓雪娟
刘卫兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TCL Corp
Original Assignee
TCL Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TCL Corp filed Critical TCL Corp
Priority to CN201510661040.5A priority Critical patent/CN105204001A/zh
Publication of CN105204001A publication Critical patent/CN105204001A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种声源定位方法及系统,所述方法包括:预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;麦克风阵列接收目标声源信号,输出时域信号;对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱;通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果;对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果。本发明可在没有准确声源数信息的前提下,得到准确的声源定位信息,提高了定位准确度,为用户定位声源提供了方便。

Description

一种声源定位的方法及系统
技术领域
本发明涉及声源定位技术领域,尤其涉及一种声源定位的方法及系统。
背景技术
声源定位系统早在20世纪七八十年代就已经开始被广泛研究。由于声源定位具有很强的空间选择性,不需要移动传感器就可以获得移动目标的声音信号,目前比较流行的是麦克风阵列,目前已经广泛用于音视频会议,说话人跟踪与识别等多种场合。
麦克风阵列的定位问题,是利用一组按一定位置摆放的麦克风来确定声源的空间位置。比较常见的方法是对通过此阵列所采集到的数据分帧进行短时傅里叶变换(short-timeFouriertransform,简称为STFT),把信号变换到频域,选取若干子带,分别计算了MUSIC谱,经各子带平均得到一帧信号的空间谱。然后对一段语音各帧的谱平均得到总体的空间谱,再根据声源数对空间谱进行了一次峰值搜索,得到最终的方位结果。但这种方法需要预先估计声源数。假设声源数已知,而当估计的声源数与真实声源数有差别时,则计算出来的MUSIC谱中的峰值个数就会与实际声源数不同,则会导致信号丢失,从而对定位结果有较大偏差。而语音信号是非平稳信号,各帧信号的声源数很有可能是不同的,隐藏大段语音进行声源定位时会存在较大误差。
因此,现有技术还有待于改进和发展。
发明内容
鉴于现有技术的不足,本发明目的在于提供一种声源定位的方法及系统,旨在解决现有技术中声源定位需要预先得知声源数,当估计声源数据与真实声源数有差别时,会出现信号丢失、定位结果差的缺陷。
本发明的技术方案如下:
一种声源定位的方法,其中,方法包括:
A、预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
B、麦克风阵列接收目标声源信号,输出时域信号;
C、对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱;
D、通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果;
E、对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果。
所述的声源定位的方法,其中,所述步骤A具体包括:
A1、预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
A2、预先设置麦克风之间的距离是相同的,且设置位于麦克风阵列的中心的麦克风为阵列中心。
所述的声源定位的方法,其中,所述步骤B具体包括:
B1、麦克风阵列中每一个麦克风接收目标声源信号,分别获取每个麦克风间的第一距离和麦克风与接收声源距离的延时以及声源与阵列中心的第二距离;
B2、根据所述第一距离、所述延时及所述第二距离,输出每个麦克风接收的目标声源信号的时域信号。
所述的声源定位的方法,其中,所述步骤C具体包括:
C1、对输出目标声源信号的时域信号在一预定时间内进行采样,对采样后时域信号的每一帧数据进行短时傅里叶变换,得到对应的每一帧数据的频谱;
C2、将每一帧数据的频谱进行叠加,得到麦克风阵列接收到的声源信号的空间谱。
所述的声源定位的方法,其中,所述步骤D具体包括:
D1、判断当空间谱中的噪声信号均值为零,且互不相关时,对空间谱进行特征分解排序计算,根据特征值分解结果,估算出目标声源数;
D2、根据估算出的目标声源数,对空间谱进行谱峰搜索,确定峰值点的位置,根据峰值点位置估计出声源位置。
一种声源定位的系统,其中,系统包括:
预先设置模块,用于预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
时域信号输出模块,用于麦克风阵列接收目标声源信号,输出时域信号;
傅里叶变换模块,用于对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱;
声源数及声源方位估计模块,用于通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果;
统计平均模块,用于对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果。
所述的声源定位的系统,其中,所述预先设置模块具体包括:
第一预先设置单元,用于预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
第二预先设置单元,用于预先设置麦克风之间的距离是相同的,且设置位于麦克风阵列的中心的麦克风为阵列中心。
所述的声源定位的系统,其中,所述时域信号输出模块具体包括:
获取单元,用于麦克风阵列中每一个麦克风接收目标声源信号,分别获取每个麦克风间的第一距离和麦克风与接收声源距离的延时以及声源与阵列中心的第二距离;
时域信号输出单元,用于根据所述第一距离、所述延时及所述第二距离,输出每个麦克风接收的目标声源信号的时域信号。
所述的声源定位的系统,其中,所述傅里叶变换模块具体包括:
傅里叶变换单元,用于对输出目标声源信号的时域信号在一预定时间内进行采样,对采样后时域信号的每一帧数据进行短时傅里叶变换,得到对应的每一帧数据的频谱;
叠加单元,用于将每一帧数据的频谱进行叠加,得到麦克风阵列接收到的声源信号的空间谱。
所述的声源定位的系统,其中,所述声源数及声源方位估计模块具体包括:
声源数估算单元,用于判断当空间谱中的噪声信号均值为零,且互不相关时,对空间谱进行特征分解排序计算,根据特征值分解结果,估算出目标声源数;
声源位置估算单元,用于根据估算出的目标声源数,对空间谱进行谱峰搜索,确定峰值点的位置,根据峰值点位置估计出声源位置。
有益效果:本发明中采用声源数估计与方位估计二维交叉进行的方法来确保声源定位的精确度,当得到一帧信号的空间谱之后,先估算出每帧的信源数,进行谱峰搜索,得到方位估计结果,然后对多帧信号的估计结果进行统计平均,得到较为准确的方位估计和声源数估计,在没有准确声源数信息的前提下,得到准确的声源定位信息,提高了定位准确度,为用户定位声源提供了方便。
附图说明
图1为本发明的一种声源定位的方法的较佳实施例的流程图。
图2为本发明的一种声源定位的方法的具体应用实施例的麦克风阵列的信号模型示意图。
图3为本发明的一种声源定位的系统的较佳实施例的功能原理框图。
具体实施方式
为使本发明的目的、技术方案及效果更加清楚、明确,以下对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供了一种声源定位的方法的较佳实施例的流程图,如图1所示,所述方法包括:
步骤S100、预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列。
具体地,所述步骤S100具体包括:
步骤S101、预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
步骤S102、预先设置麦克风之间的距离是相同的,且设置位于麦克风阵列的中心的麦克风为阵列中心。
具体实施时,如图2所示为本发明的一种声源定位的方法的具体应用实施例的麦克风阵列的信号模型示意图。麦克风阵列处理的主要对象是近场宽带语音信号,在室内环境中,声源一般位于近场,此时阵元接收到的信号不仅有相位的差异,幅度差异也十分显著,此时采用球面波模型,会比传统的平面波模型更加精确。所以我们采取了基于球面波模型来代替平面模型来描述声波的传播。该模型除了考虑了各个麦克风之间与声源距离所导致的接收信号的相位差,还考虑到了信号在空气中所造成的幅度衰减。
如图2所示,预先设置麦克风阵列中的麦克风有M个麦克风,也叫M个阵元,其中M个麦克风是独立且特性相同的。相邻麦克风的距离是相同的记为Δd。
步骤S200、麦克风阵列接收目标声源信号,输出时域信号。
具体实施时,所述步骤S200具体包括:
步骤S201、麦克风阵列中每一个麦克风接收目标声源信号,分别获取每个麦克风间的第一距离和麦克风与接收声源距离的延时以及声源与阵列中心的第二距离;
步骤S202、根据所述第一距离、所述延时及所述第二距离,输出每个麦克风接收的目标声源信号的时域信号。
具体实施时,如图2所示,可知声源有D个,声源距阵列中心距离为r。其中阵列中心为克风阵列的中心的麦克风。假设声源j的信号是fj(t),那么,第i个麦克风阵元所接收到的的第j个声源的声源信号则为:
fij(t)=αijfj(t-τij)。
其中,上述公式中αij指阵元i接收到的声源j的信号的幅度衰减因子,而τij表示的是相对延时。
由图2可得出:
α i j = r ( r s i n θ ) 2 + ( d i - r c o s θ ) 2 , i = 1 , 2 , ... , M
τ i j = ( r s i n θ ) 2 + ( d i - r c o s θ ) 2 - r c , i = 1 , 2 , ... , M
其中,以阵列中心为原点,第i个麦克风的横坐标为,c是声源的传播速度,θ是声源与阵列中心的夹角。因此,可知,第i个麦克风的接收信号为:
f i ( t ) = Σ j = 1 D α i j f j ( t - τ i j ) + n i ( t ) , i = 1 , ... , M ; j = 1 , ... , D , τ i j = 0 ,
其中ni表示每个阵元所接收到的噪声。
步骤S300、对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱。
进一步地,所述步骤S300具体包括:
步骤S301、对输出目标声源信号的时域信号在一预定时间内进行采样,对采样后时域信号的每一帧数据进行短时傅里叶变换,得到对应的每一帧数据的频谱;
步骤S302、将每一帧数据的频谱进行叠加,得到麦克风阵列接收到的声源信号的空间谱。
具体实施时,由于语音信号是短时平稳信号,所以我们可以选取一个时间段,如20~30ms中的数据作为一帧数据,在这个事件段内,信号可以认为是平稳的。
开始对fi(t)进行采样并选取它的每一帧数据进行短时傅里叶变换,得到下式:
f i ( ω , t ) = Σ j = 1 D α i j f j ( ω , t ) e - jωτ i j + n i ( ω , t ) , i = 1 , ... , M ; j = 1 , ... , D , τ i j = 0 ,
公式中的fi(ω,t)是第i个麦克风阵元所接收到的来自所有声源信号的短时傅里叶变换。ni(ω,t)为噪声的短时傅里叶变换。则整个阵列的接收信号为:
F ( ω , t ) 1 ... ... 1 α 21 e - jωτ 21 ... ... α 2 D e - jωτ 2 D ... ... ... ... α M 1 e - jωτ M 1 α M D e - jωτ M D f 1 ( ω , t ) f 2 ( ω , t ) ... f M ( ω , t ) + n 1 ( ω , t ) ... n M ( ω , t ) = A ( ω , r , θ ) S ( ω , t ) + N ( ω , t ) .
步骤S400、通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果。
具体地,所述步骤S400具体包括:
步骤S401、判断当空间谱中的噪声信号均值为零,且互不相关时,对空间谱进行特征分解排序计算,根据特征值分解结果,估算出目标声源数;
步骤S402、根据估算出的目标声源数,对空间谱进行谱峰搜索,确定峰值点的位置,根据峰值点位置估计出声源位置。
具体实施时,我们把麦克风阵元所采集到的数据分帧进行了短时傅里叶变换,而当我们把信号变换到了频域之后,每个频点都可以单独的估计出方位。当能量较大时频点估算所得到的结果也越准确。具体步骤如下:
若噪声信号的均值为零,且互不相关,将F(ω,t)中的(ω,t)简记为ωk,F(ωk)的相关矩阵为R(ωk),则R(ωk)可以写成如下形式:
R(ωk)=E{F(ωK)FHK)}=A(ωK,R,θ)
R S S ( ω K ) A H ( ω K , r , θ ) + σ k 2 I
其中RSSK)=E[S(ωk)SHk)],是该频点处的噪声功率。I是单位矩阵。FHK)、AH中的目标H表示一种特别的矩阵叫做埃尔米特矩阵,简称Hermite阵又称共轭矩阵。Hermite阵中每一个第i行第j列的元素都与第j行第i列的元素的共轭相等,埃尔米特矩阵(或自共轭矩阵)是相对其主对角线以复共轭方式对称。
对上个公式进行特征分解排序得:
R(ωK)=Udiag[λ1,...,λDD+1,...,λM]UH
其中U是由对应的特征向量组成的特征矢量矩阵,是一个协方差矩阵。λ1...λM是R(ωk)的特征值,并且我们根据信息论的准则中的MDL(minimumdescriptionlength)法则,通过R的特征值分解的结果,估算出声源数目D,确认信源的个数。所谓(MDL)算法,其基本思想是:对观测数据D=(x1,x2,...,xn)和一些用于描述这些数据内在规律的模型集M=(M1,...,Mj,...)找出其中一个模型,使得在该模型假设下,描述观测数据的长度尽量短。
当我们估计出信源个数D之后,可以根据MUSIC算法把U分解为信号子空间Us和噪声子空间Un。MUSIC算法的基本思想是对信号的协方差矩阵特征值分解,确定信号分量与噪声分量。由于信号分量与噪声分量具有正交性,根据这一性质可以构造空间谱函数P(θ,r),不同的θ和r组合对应唯一的谱值,通过对P(θ,r)进行谱峰搜索,确定峰值点的位置,从而估计出波达方向信息。其处理任务就是设法估计出空间信号源的强度及其来波方向。在阵列信号处理的许多应用中,需要准确估计空间信号源的方向及空间分布,通常称为“空间谱”。
由上述,则有:AHUn=0,其中0为零矢量。定义第k个频点的空间谱为
P ( ω k , r , θ ) = 1 | | a H U n | | 2
a = [ k 1 ( θ , r ) e - j ω ( n ) Δt 1 ( θ , r ) , ... , k M ( θ , r ) e - j ω ( n ) Δt 1 ( θ , r ) ] . k i ( θ , r ) ,
a为第i路信号的相对幅度,Δti(θ,r)为第i路信号的相对时延。使得P值最大的θ和r就是声源的方位。该式中,分母时信号向量和噪声矩阵的内积,当aHUn的各列正交时,该分母为零,但由于噪声的存在,它实际上为一最小值,因此P有一尖峰,通过寻找波峰来估计到达角θ和r的大小。
步骤S500、对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果。
具体地,当计算出每一个频点的方位估计结果,对多个频点的方位估计结果求平均,则即可得到信源的位置结果。采用声源数估计与方位估计二维交叉的方法,对每帧信号进行谱峰搜索,大大减少了运算量,而又由于是对每帧信号做了信源数估计,所以大大提高了方位估计的准确值,在声源定位的处理领域,具有较强的实用性。
由以上方法实施例可知,本发明提供了一种声源定位的方法,采用声源数估计与方位估计二维交叉进行的方法来确保声源定位的精确度,当得到一帧信号的空间谱之后,先估算出每帧的声源数,进行谱峰搜索,得到方位估计结果,然后对多帧信号的估计结果进行统计平均,得到较为准确的方位估计和声源数估计。这样通过声源数估计与方位估计二者结合的方法,在没有准确声源数信息的前提下,就可以得到较为准确的定位信息,为声源定位提供了方便。
在上述方法实施例的基础上,本发明还提供了一种声源定位的系统的较佳实施例的功能原理框图,如图3所示,所述系统包括:
预先设置模块100,用于预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;具体如上所述。
时域信号输出模块200,用于麦克风阵列接收目标声源信号,输出时域信号;具体如上所述。
傅里叶变换模块300,用于对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱;具体如上所述。
声源数及声源方位估计模块400,用于通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果;具体如上所述。
统计平均模块500,用于对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果;具体如上所述。
所述的声源定位的系统,其中,所述预先设置模块具体包括:
第一预先设置单元,用于预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;具体如上所述。
第二预先设置单元,用于预先设置麦克风之间的距离是相同的,且设置位于麦克风阵列的中心的麦克风为阵列中心;具体如上所述。
所述的声源定位的系统,其中,所述时域信号输出模块具体包括:
获取单元,用于麦克风阵列中每一个麦克风接收目标声源信号,分别获取每个麦克风间的第一距离和麦克风与接收声源距离的延时以及声源与阵列中心的第二距离;具体如上所述。
时域信号输出单元,用于根据所述第一距离、所述延时及所述第二距离,输出每个麦克风接收的目标声源信号的时域信号;具体如上所述。
所述的声源定位的系统,其中,所述傅里叶变换模块具体包括:
傅里叶变换单元,用于对输出目标声源信号的时域信号在一预定时间内进行采样,对采样后时域信号的每一帧数据进行短时傅里叶变换,得到对应的每一帧数据的频谱;具体如上所述。
叠加单元,用于将每一帧数据的频谱进行叠加,得到麦克风阵列接收到的声源信号的空间谱;具体如上所述。
所述的声源定位的系统,其中,所述声源数及声源方位估计模块具体包括:
声源数估算单元,用于判断当空间谱中的噪声信号均值为零,且互不相关时,对空间谱进行特征分解排序计算,根据特征值分解结果,估算出目标声源数;具体如上所述。
声源位置估算单元,用于根据估算出的目标声源数,对空间谱进行谱峰搜索,确定峰值点的位置,根据峰值点位置估计出声源位置;具体如上所述。
综上所述,本发明提供了一种声源定位方法及系统,所述方法包括:预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;麦克风阵列接收目标声源信号,输出时域信号;对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱;通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果;对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果。本发明可在没有准确声源数信息的前提下,得到准确的声源定位信息,提高了定位准确度,为用户定位声源提供了方便。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种声源定位的方法,其特征在于,方法包括:
A、预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
B、麦克风阵列接收目标声源信号,输出时域信号;
C、对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱;
D、通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果;
E、对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果。
2.根据权利要求1所述的声源定位的方法,其特征在于,所述步骤A具体包括:
A1、预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
A2、预先设置麦克风之间的距离是相同的,且设置位于麦克风阵列的中心的麦克风为阵列中心。
3.根据权利要求2所述的声源定位的方法,其特征在于,所述步骤B具体包括:
B1、麦克风阵列中每一个麦克风接收目标声源信号,分别获取每个麦克风间的第一距离和麦克风与接收声源距离的延时以及声源与阵列中心的第二距离;
B2、根据所述第一距离、所述延时及所述第二距离,输出每个麦克风接收的目标声源信号的时域信号。
4.根据权利要求3所述的声源定位的方法,其特征在于,所述步骤C具体包括:
C1、对输出目标声源信号的时域信号在一预定时间内进行采样,对采样后时域信号的每一帧数据进行短时傅里叶变换,得到对应的每一帧数据的频谱;
C2、将每一帧数据的频谱进行叠加,得到麦克风阵列接收到的声源信号的空间谱。
5.根据权利要求4所述的声源定位的方法,其特征在于,所述步骤D具体包括:
D1、判断当空间谱中的噪声信号均值为零,且互不相关时,对空间谱进行特征分解排序计算,根据特征值分解结果,估算出目标声源数;
D2、根据估算出的目标声源数,对空间谱进行谱峰搜索,确定峰值点的位置,根据峰值点位置估计出声源位置。
6.一种声源定位的系统,其特征在于,系统包括:
预先设置模块,用于预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
时域信号输出模块,用于麦克风阵列接收目标声源信号,输出时域信号;
傅里叶变换模块,用于对输出的时域信号的每一帧数据进行短时傅里叶变换,得到对应每一帧信号的空间谱;
声源数及声源方位估计模块,用于通过空间谱估算出每帧的声源数,通过对空间谱进行谱峰搜索,得到声源方位估计结果;
统计平均模块,用于对多帧信号的声源数和声源方位估计结果进行统计平均,得到最终的声源方位和声源数估计结果。
7.根据权利要求6所述的声源定位的系统,其特征在于,所述预先设置模块具体包括:
第一预先设置单元,用于预先设置若干个独立且特性相同的麦克风组成一个麦克风阵列;
第二预先设置单元,用于预先设置麦克风之间的距离是相同的,且设置位于麦克风阵列的中心的麦克风为阵列中心。
8.根据权利要求7所述的声源定位的系统,其特征在于,所述时域信号输出模块具体包括:
获取单元,用于麦克风阵列中每一个麦克风接收目标声源信号,分别获取每个麦克风间的第一距离和麦克风与接收声源距离的延时以及声源与阵列中心的第二距离;
时域信号输出单元,用于根据所述第一距离、所述延时及所述第二距离,输出每个麦克风接收的目标声源信号的时域信号。
9.根据权利要求8所述的声源定位的系统,其特征在于,所述傅里叶变换模块具体包括:
傅里叶变换单元,用于对输出目标声源信号的时域信号在一预定时间内进行采样,对采样后时域信号的每一帧数据进行短时傅里叶变换,得到对应的每一帧数据的频谱;
叠加单元,用于将每一帧数据的频谱进行叠加,得到麦克风阵列接收到的声源信号的空间谱。
10.根据权利要求9所述的声源定位的系统,其特征在于,所述声源数及声源方位估计模块具体包括:
声源数估算单元,用于判断当空间谱中的噪声信号均值为零,且互不相关时,对空间谱进行特征分解排序计算,根据特征值分解结果,估算出目标声源数;
声源位置估算单元,用于根据估算出的目标声源数,对空间谱进行谱峰搜索,确定峰值点的位置,根据峰值点位置估计出声源位置。
CN201510661040.5A 2015-10-12 2015-10-12 一种声源定位的方法及系统 Pending CN105204001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510661040.5A CN105204001A (zh) 2015-10-12 2015-10-12 一种声源定位的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510661040.5A CN105204001A (zh) 2015-10-12 2015-10-12 一种声源定位的方法及系统

Publications (1)

Publication Number Publication Date
CN105204001A true CN105204001A (zh) 2015-12-30

Family

ID=54951781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510661040.5A Pending CN105204001A (zh) 2015-10-12 2015-10-12 一种声源定位的方法及系统

Country Status (1)

Country Link
CN (1) CN105204001A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106201178A (zh) * 2016-06-29 2016-12-07 深圳市金立通信设备有限公司 一种调整屏幕显示方向控制方法及终端
CN106341665A (zh) * 2016-09-30 2017-01-18 浙江宇视科技有限公司 一种跟踪监控方法及装置
CN106970356A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种复杂环境下声源定位跟踪方法
CN107121669A (zh) * 2016-02-25 2017-09-01 松下电器(美国)知识产权公司 声源探测装置、声源探测方法及非瞬时性记录介质
CN107144819A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种声源定位方法、装置及电子设备
CN108922553A (zh) * 2018-07-19 2018-11-30 苏州思必驰信息科技有限公司 用于音箱设备的波达方向估计方法及系统
CN109597021A (zh) * 2018-11-05 2019-04-09 北京航天控制仪器研究所 一种波达方向估计方法及装置
CN109683134A (zh) * 2019-01-08 2019-04-26 浙江大学 一种面向旋转声源的高分辨率定位方法
CN109963249A (zh) * 2017-12-25 2019-07-02 北京京东尚科信息技术有限公司 数据处理方法及其系统、计算机系统和计算机可读介质
CN110554357A (zh) * 2019-09-12 2019-12-10 苏州思必驰信息科技有限公司 声源定位方法和装置
CN110716177A (zh) * 2019-10-22 2020-01-21 哈尔滨工程大学 分布式声学定位网络中多目标分类方法
CN112179656A (zh) * 2020-09-21 2021-01-05 西北工业大学 一种移动式线性传声器阵列声源指向性测量方法与装置
CN112257484A (zh) * 2019-07-22 2021-01-22 中国科学院声学研究所 一种基于深度学习的多声源测向方法及系统
CN112698265A (zh) * 2020-11-23 2021-04-23 中国人民解放军91776部队 一种低频辐射源目标的远距探测定位系统及方法
CN113138367A (zh) * 2020-01-20 2021-07-20 中国科学院上海微系统与信息技术研究所 一种目标定位方法、装置、电子设备及存储介质
CN113553022A (zh) * 2021-07-16 2021-10-26 Oppo广东移动通信有限公司 设备调整方法、装置、移动终端及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1473964A2 (en) * 2003-05-02 2004-11-03 Samsung Electronics Co., Ltd. Microphone array, method to process signals from this microphone array and speech recognition method and system using the same
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
CN103064061A (zh) * 2013-01-05 2013-04-24 河北工业大学 三维空间声源定位方法
CN103308889A (zh) * 2013-05-13 2013-09-18 辽宁工业大学 复杂环境下被动声源二维doa估计方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1473964A2 (en) * 2003-05-02 2004-11-03 Samsung Electronics Co., Ltd. Microphone array, method to process signals from this microphone array and speech recognition method and system using the same
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
CN103064061A (zh) * 2013-01-05 2013-04-24 河北工业大学 三维空间声源定位方法
CN103308889A (zh) * 2013-05-13 2013-09-18 辽宁工业大学 复杂环境下被动声源二维doa估计方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张佩等: "基于统计的近场声源定位方法", 《通信技术》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106970356A (zh) * 2016-01-14 2017-07-21 芋头科技(杭州)有限公司 一种复杂环境下声源定位跟踪方法
CN107121669B (zh) * 2016-02-25 2021-08-20 松下电器(美国)知识产权公司 声源探测装置、声源探测方法及非瞬时性记录介质
CN107121669A (zh) * 2016-02-25 2017-09-01 松下电器(美国)知识产权公司 声源探测装置、声源探测方法及非瞬时性记录介质
CN106201178A (zh) * 2016-06-29 2016-12-07 深圳市金立通信设备有限公司 一种调整屏幕显示方向控制方法及终端
CN106341665A (zh) * 2016-09-30 2017-01-18 浙江宇视科技有限公司 一种跟踪监控方法及装置
CN107144819B (zh) * 2017-04-10 2019-11-26 易视星空科技无锡有限公司 一种声源定位方法、装置及电子设备
CN107144819A (zh) * 2017-04-10 2017-09-08 北京猎户星空科技有限公司 一种声源定位方法、装置及电子设备
CN109963249A (zh) * 2017-12-25 2019-07-02 北京京东尚科信息技术有限公司 数据处理方法及其系统、计算机系统和计算机可读介质
CN108922553B (zh) * 2018-07-19 2020-10-09 苏州思必驰信息科技有限公司 用于音箱设备的波达方向估计方法及系统
CN108922553A (zh) * 2018-07-19 2018-11-30 苏州思必驰信息科技有限公司 用于音箱设备的波达方向估计方法及系统
CN109597021A (zh) * 2018-11-05 2019-04-09 北京航天控制仪器研究所 一种波达方向估计方法及装置
CN109683134A (zh) * 2019-01-08 2019-04-26 浙江大学 一种面向旋转声源的高分辨率定位方法
CN109683134B (zh) * 2019-01-08 2020-08-04 浙江大学 一种面向旋转声源的高分辨率定位方法
CN112257484A (zh) * 2019-07-22 2021-01-22 中国科学院声学研究所 一种基于深度学习的多声源测向方法及系统
CN112257484B (zh) * 2019-07-22 2024-03-15 中国科学院声学研究所 一种基于深度学习的多声源测向方法及系统
CN110554357A (zh) * 2019-09-12 2019-12-10 苏州思必驰信息科技有限公司 声源定位方法和装置
CN110554357B (zh) * 2019-09-12 2022-01-18 思必驰科技股份有限公司 声源定位方法和装置
CN110716177A (zh) * 2019-10-22 2020-01-21 哈尔滨工程大学 分布式声学定位网络中多目标分类方法
CN113138367A (zh) * 2020-01-20 2021-07-20 中国科学院上海微系统与信息技术研究所 一种目标定位方法、装置、电子设备及存储介质
CN112179656A (zh) * 2020-09-21 2021-01-05 西北工业大学 一种移动式线性传声器阵列声源指向性测量方法与装置
CN112698265A (zh) * 2020-11-23 2021-04-23 中国人民解放军91776部队 一种低频辐射源目标的远距探测定位系统及方法
CN113553022A (zh) * 2021-07-16 2021-10-26 Oppo广东移动通信有限公司 设备调整方法、装置、移动终端及存储介质

Similar Documents

Publication Publication Date Title
CN105204001A (zh) 一种声源定位的方法及系统
CN109830245B (zh) 一种基于波束成形的多说话者语音分离方法及系统
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
CN104142492B (zh) 一种srp‑phat多源空间定位方法
CN104076331B (zh) 一种七元麦克风阵列的声源定位方法
CN105301563B (zh) 一种基于一致聚焦变换最小二乘法的双声源定位方法
CN109490822B (zh) 基于ResNet的语音DOA估计方法
CN104464750B (zh) 一种基于双耳声源定位的语音分离方法
CN102565759B (zh) 一种基于子带信噪比估计的双耳声源定位方法
CN106373589B (zh) 一种基于迭代结构的双耳混合语音分离方法
CN104991573A (zh) 一种基于声源阵列的定位跟踪方法及其装置
CN111123192A (zh) 一种基于圆形阵列和虚拟扩展的二维doa定位方法
CN103854660B (zh) 一种基于独立成分分析的四麦克语音增强方法
CN102147458B (zh) 一种针对宽带声源的波达方向估计方法及其装置
Ying et al. Window-dominant signal subspace methods for multiple short-term speech source localization
Bai et al. Time difference of arrival (TDOA)-based acoustic source localization and signal extraction for intelligent audio classification
CN103901400A (zh) 一种基于时延补偿和双耳一致性的双耳声音源定位方法
CN106019230A (zh) 一种基于i-vector说话人识别的声源定位方法
CN110007276B (zh) 一种声源定位方法及系统
Hu et al. Decoupled direction-of-arrival estimations using relative harmonic coefficients
Lebarbenchon et al. Evaluation of an open-source implementation of the SRP-PHAT algorithm within the 2018 LOCATA challenge
CN116559778B (zh) 一种基于深度学习的车辆鸣笛定位方法及系统
Amar et al. Analysis of direct position determination approach in the presence of model errors
Tourbabin et al. Enhanced robot audition by dynamic acoustic sensing in moving humanoids
CN110838303A (zh) 一种利用传声器阵列的语音声源定位方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151230