CN110133572B - 一种基于Gammatone滤波器和直方图的多声源定位方法 - Google Patents

一种基于Gammatone滤波器和直方图的多声源定位方法 Download PDF

Info

Publication number
CN110133572B
CN110133572B CN201910421932.6A CN201910421932A CN110133572B CN 110133572 B CN110133572 B CN 110133572B CN 201910421932 A CN201910421932 A CN 201910421932A CN 110133572 B CN110133572 B CN 110133572B
Authority
CN
China
Prior art keywords
sound source
azimuth
signal
histogram
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910421932.6A
Other languages
English (en)
Other versions
CN110133572A (zh
Inventor
赵小燕
陈书文
刘鸿斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Second Normal University (jiangsu Institute Of Educational Science Research)
Nanjing Institute of Technology
Original Assignee
Jiangsu Second Normal University (jiangsu Institute Of Educational Science Research)
Nanjing Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Second Normal University (jiangsu Institute Of Educational Science Research), Nanjing Institute of Technology filed Critical Jiangsu Second Normal University (jiangsu Institute Of Educational Science Research)
Priority to CN201910421932.6A priority Critical patent/CN110133572B/zh
Publication of CN110133572A publication Critical patent/CN110133572A/zh
Application granted granted Critical
Publication of CN110133572B publication Critical patent/CN110133572B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S1/00Beacons or beacon systems transmitting signals having a characteristic or characteristics capable of being detected by non-directional receivers and defining directions, positions, or position lines fixed relatively to the beacon transmitters; Receivers co-operating therewith
    • G01S1/72Beacons or beacon systems transmitting signals having a characteristic or characteristics capable of being detected by non-directional receivers and defining directions, positions, or position lines fixed relatively to the beacon transmitters; Receivers co-operating therewith using ultrasonic, sonic or infrasonic waves
    • G01S1/76Systems for determining direction or position line
    • G01S1/80Systems for determining direction or position line using a comparison of transit time of synchronised signals transmitted from non-directional transducers or transducer systems spaced apart, i.e. path-difference systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于Gammatone滤波器和直方图的多声源定位方法,用传声器阵列采集声源信号,通过Gammatone滤波器组获得子带信号,做分帧和加窗处理,转换至频域,计算可控响应功率值,绘制直方图,统计主峰方位和次峰方位的数量,估计主次声源方位。本发明在频域相互交叠而不分隔,避免相位缠绕,多个频率分量的空间谱的平均效应抑制了旁瓣,使主瓣突出,阵元间距不严格限于半波长,无需多帧信息,也无需假定声源在连续多帧内静止不动,实现了实时多声源定位,用直方图融合同一帧内的所有子带信息,作为方位估计的判决量,简单易操作,计算量低,显著提高了主声源和次声源的定位成功率,尤其次声源的定位成功率提升更为明显。

Description

一种基于Gammatone滤波器和直方图的多声源定位方法
技术领域
本发明涉及信号处理技术领域,具体涉及一种多声源定位方法。
背景技术
小型传声器阵列通常适用于办公室、会议室、智能机器人等应用场所,相位变换加权的可控响应功率SRP-PHAT声源定位算法只需一帧信号即可实现定位,但在多声源情况下,传统SRP-PHAT算法难以克服声源之间的干扰,最强声源的谱峰常常掩盖其它较弱声源的谱峰,导致难以找到多个声源,定位成功率较低,而小型传声器阵列的空间分辨率较低,使得实现多声源定位更为困难,多帧统计的方法虽然可以实现多声源定位,但是这类方法必须假定声源在连续多帧时间内静止不动,实时性较差。
发明内容
本发明为了解决现有技术存在的问题,提出了一种基于Gammatone滤波器和直方图的多声源定位方法,为了实现上述目的,本发明采用了以下技术方案。
用传声器作为阵元,组成传声器阵列,采集声源信号,传声器的数量为U,序号为u,u=1...U,第u个传声器采集的的声源信号为su(t)。
用Gammatone滤波器产生脉冲响应,组成滤波器组,滤波器的数量为I,序号为i,i=1...I,第i个Gammatone滤波器产生的脉冲响应函数为gi(t),Gammatone滤波器的增益为A,阶数为m,衰减因子为bi,中心频率为fi,相位为
Figure GDA0003668243040000011
阶跃函数为u(t),产生的脉冲响应函数为
Figure GDA0003668243040000012
通过Gammatone滤波器组产生脉冲响应。
将第u个传声器采集的的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t),获得第i个子带的时域信号xu(i,t),子带信号为xu(i,t)=su(t)*gi(t),在时域将声源信号分割为子带信号。
在时域将子带信号xu(i,t)分割为单帧信号,单帧信号的数量为L,长度为N,序号为l,l=1...L,单帧内的采样序号为n,0≤n<N,第l个单帧第n个采样信号为xu(i,lN+n),将每个子带信号分帧。
将分帧信号作加窗处理,用窗信号
Figure GDA0003668243040000013
对xu(i,lN+n)进行加窗处理,得到xu(i,l,n)=wH(n)xu(i,lN+n),xu(i,l,n)为第u个传声器第i个子带第l个单帧第n个采样信号的加窗信号。
用离散傅里叶变换函数DFT对xu(i,l,n)作时频转换,变换的长度为K,K=2N,频点为k,0≤k<K,得到
Figure GDA0003668243040000021
Xu(i,l,k)为xu(i,l,n)的频域信号,将Xu(i,l,k)作为时频单元信号。
计算候选方位到第u个阵元的导引时延τu0(r),候选方位的声源位置为r,阵列中心的位置为r0,第u个阵元的位置为ru,空气中的声速为c,候选方位到阵列中心的声传播时延为τ0(r),候选方位到第u个阵元的声传播时延为τu(r),候选方位到第u个阵元的导引时延
Figure GDA0003668243040000022
计算阵列的PHAT可控响应输出YPHAT(i,l,k,r),信号采样率为fs,将τu0(r)和Xu(i,l,k)代入,得到
Figure GDA0003668243040000023
计算每个时频单元信号的可控响应功率值,由YPHAT(i,l,k,r)计算第i个子带第l个单帧的时频单元信号在候选方位的可控响应功率值
Figure GDA0003668243040000024
确认可控响应功率值的主峰方位和次峰方位,将P(i,l,r)的最大值确认为主峰,次最大值确认为次峰,主峰对应的rpeak1(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率最大值的方位,次峰对应的rpeak2(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率次最大值的方位。
用直方图统计主峰方位和次峰方位的数量,对第l个单帧所有子带的时频单元信号对应的方位rpeak1(i,l)作直方图,统计每个方位的数量,数量最多的方位为
Figure GDA0003668243040000025
若存在数量次多的方位,则数量次多的方位为
Figure GDA0003668243040000026
若rpeak1(i,l)中不存在数量次多的方位
Figure GDA0003668243040000027
则对第l个单帧所有子带的时频单元信号对应的方位rpeak2(i,l)作直方图,统计每个方位的数量,数量最多的方位为
Figure GDA0003668243040000028
Figure GDA0003668243040000029
估计为第l个单帧的主声源方位,将
Figure GDA00036682430400000210
估计为第l个单帧的次声源方位,所作直方图的组距为5°,组数为72。
本发明利用Gammatone滤波器组分解信号子带,在时频单元内计算可控响应功率,提取声源方位信息,用直方图融合同一帧内的所有子带信息,作为方位估计的判决量,实现多声源定位;分解的每个子带在频域相互交叠而不分隔,避免相位缠绕,多个频率分量的空间谱的平均效应抑制了旁瓣,使主瓣突出,阵元间距不严格限于半波长;直方图简单易操作,计算量低;无需多帧信息,也无需假定声源在连续多帧内静止不动,实现了实时多声源定位,应用场合更为广泛;显著提高了主声源和次声源的定位成功率,尤其次声源的定位成功率提升更为明显,算法对噪声和混响都具有更强的鲁棒性。
附图说明
图1是本方法的流程图,图2是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的主声源定位成功率比较图,图3是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的次声源定位成功率比较图,图4是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的主次声源定位平均成功率比较图,图5是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的主声源定位成功率比较图,图6是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的次声源定位成功率比较图,图7是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的主次声源定位平均成功率比较图。
图2至图7的横坐标为全局信噪比,纵坐标为定位成功率。
具体实施方式
以下结合附图对本发明的技术方案做具体的说明。
一种基于Gammatone滤波器和直方图的多声源定位方法,如图1所示,用麦克风作为阵元,组成传声器阵列,接收语音,采集声源信号;将声源信号通过Gammatone滤波器组,通过Gammatone滤波器产生的脉冲响应,将声源信号在时域分割为子带信号;将每个子带信号分帧和加窗,作时频转换处理,获得单帧信号的频域信号,作为时频单元信号;计算候选方位到阵元的导引时延,进而计算每个时频单元信号的可控响应功率值;获取声源方位信息,包括可控响应功率值的主峰方位和次峰方位;绘制直方图,统计主峰方位和次峰方位的数量;先从主峰方位的数量估计主声源方位和次声源方位,若无法估计次声源方位,再从次峰方位的数量估计次声源方位。
选用6个全向麦克风,组成均匀的圆形阵列,通过圆形麦克风阵列接收语音,采集声源信号,阵列半径设置为0.1m,每个麦克风作为一个阵元,阵元间距不必严格限于半波长,阵列采集声源信号的数量和阵元的数量U=6,序号u=1...U,第u个传声器采集的的声源信号为su(t)。
用Gammatone滤波器产生脉冲响应,组成滤波器组,滤波器的数量I=32,序号i=1...I,第i个Gammatone滤波器产生的脉冲响应函数为gi(t),Gammatone滤波器的增益为A,阶数m=6,衰减因子bi=1.109ERB(fi),中心频率fi的范围取[800Hz,8000Hz],相位
Figure GDA0003668243040000041
计算得到ERB(fi)=24.7(4.37fi/1000+1),阶跃函数为u(t),产生的的脉冲响应函数为
Figure GDA0003668243040000042
通过32个Gammatone滤波器组产生脉冲响应。
将第u个传声器采集的的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t),获得第i个子带的时域信号xu(i,t),子带信号为xu(i,t)=su(t)*gi(t),在时域将声源信号分割为子带信号,每个子带对应不同的频域范围,在频域相互交叠而不分隔,避免相位缠绕,多个频率分量的空间谱的平均效应抑制了旁瓣,使主瓣突出。
预设分帧长度和帧移,在时域将麦克风阵列第u个阵元的第i个子带的时域信号xu(i,t)分割为单帧信号,单帧信号的数量为L,长度N=512(32ms),序号为l,l=1...L,单帧内的采样序号为n,0≤n<N,帧移为0,语音信号的采样率fs=16kHz,第l个单帧第n个采样信号为xu(i,lN+n),将每个子带信号分帧。
将分帧信号作加窗处理,用窗信号
Figure GDA0003668243040000043
对xu(i,lN+n)进行加窗处理,得到xu(i,l,n)=wH(n)xu(i,lN+n),xu(i,l,n)为第u个传声器第i个子带第l个单帧第n个采样信号的加窗信号。
用离散傅里叶变换函数DFT对xu(i,l,n)作时频转换,变换的长度为K,K=2N=1024,频点为k,0≤k<K,得到
Figure GDA0003668243040000044
Xu(i,l,k)为xu(i,l,n)的频域信号,将Xu(i,l,k)作为时频单元信号。
计算候选方位到第u个麦克风的导引时延τu0(r),候选方位的声源位置为r,阵列中心的位置为r0,第u个麦克风的位置为ru,空气中的声速c=342m/s,候选方位到阵列中心的声传播时延为τ0(r),候选方位到第u个麦克风的声传播时延为τu(r),候选方位到第u个麦克风的导引时延
Figure GDA0003668243040000051
若声源与麦克风阵列处于同一水平面,声源位于阵列的远场,声源位置由方位角θ表示,定义水平面的正前方为0°,那么θ的范围为[-180°,180°],间隔为1°,负90°表示正左方,90°表示正右方,导引时延的计算公式修正为
Figure GDA0003668243040000052
其中ξ=[cosθ,sinθ]T,由于τv0(r)与接收信号无关,可以离线计算后保存于内存中。
若声源与麦克风阵列不处于同一水平面,方位角由水平角θ和俯仰角
Figure GDA0003668243040000053
决定,那么
Figure GDA0003668243040000054
对声源的立体位置并没有限制。
计算阵列的PHAT可控响应输出YPHAT(i,l,k,r),信号采样率为fs,将τu0(r)和Xu(i,l,k)代入,得到
Figure GDA0003668243040000055
计算每个时频单元信号的可控响应功率值,由YPHAT(i,l,k,r)计算第i个子带第l个单帧的时频单元信号在候选方位的可控响应功率值
Figure GDA0003668243040000056
确认可控响应功率值的主峰方位和次峰方位,将P(i,l,r)的最大值确认为主峰,次最大值确认为次峰,主峰对应的rpeak1(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率最大值的方位,次峰对应的rpeak2(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率次最大值的方位。
用直方图统计主峰方位和次峰方位的数量,对第l个单帧所有子带的时频单元信号对应的方位rpeak1(i,l)作直方图,组距为5°,组数为360/5=72,统计每个方位的数量,数量最多的方位为
Figure GDA0003668243040000057
若存在数量次多的方位,则数量次多的方位为
Figure GDA0003668243040000058
若rpeak1(i,l)中不存在数量次多的方位
Figure GDA0003668243040000059
则对第l个单帧所有子带的时频单元信号对应的方位rpeak2(i,l)作直方图,组距为5°,组数为360/5=72,统计每个方位的数量,数量最多的方位为
Figure GDA00036682430400000510
Figure GDA00036682430400000511
估计为第l个单帧的主声源方位,将
Figure GDA00036682430400000512
估计为第l个单帧的次声源方位。
分别设置混响时间T60=0.3s和T60=0.6s,测试不同信噪比和混响的环境中,本声源定位方法的性能,如图2至7所示,横坐标表示全局信噪比,纵坐标表示定位成功率,本方法比传统SRP-PHAT算法显著提升了主次声源的定位成功率,尤其是次声源的定位成功率,对噪声和混响都具有更强的鲁棒性。
上述作为本发明的实施例,并不限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均包含在本发明的保护范围之内。

Claims (10)

1.一种基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,包括:
用传声器阵列采集声源信号,通过Gammatone滤波器组产生脉冲响应,在时域将声源信号分割为子带信号;
将每个子带信号分帧和加窗作时频转换获得时频单元信号,计算每个时频单元信号的可控响应功率值,确认可控响应功率值的主峰方位和次峰方位;
用直方图统计主峰方位和次峰方位的数量,根据数量最多的主峰方位和次峰方位估计主次声源方位。
2.根据权利要求1所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的用传声器阵列采集声源信号,包括:
用传声器作为阵元,组成阵列采集声源信号,传声器的数量为U,序号为u,u=1...U,第u个传声器采集的声源信号为su(t)。
3.根据权利要求2所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的通过Gammatone滤波器组产生脉冲响应,包括:
用Gammatone滤波器产生脉冲响应,组成滤波器组,滤波器的数量为I,序号为i,i=1...I,第i个Gammatone滤波器产生的脉冲响应函数为gi(t);
Gammatone滤波器的增益为A,阶数为m,衰减因子为bi,中心频率为fi,相位为
Figure FDA0003668243030000011
阶跃函数为u(t),产生的脉冲响应函数为
Figure FDA0003668243030000012
4.根据权利要求3所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的在时域将声源信号分割为子带信号,包括:
将第u个传声器采集的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t),获得第i个子带的时域信号xu(i,t),子带信号为xu(i,t)=su(t)*gi(t)。
5.根据权利要求4所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的将每个子带信号分帧和加窗作时频转换获得时频单元信号,包括:
在时域将子带信号xu(i,t)分割为单帧信号,单帧信号的数量为L,长度为N,序号为l,l=1...L,单帧内的采样序号为n,0≤n<N,第l个单帧第n个采样信号为xu(i,lN+n);
用窗信号
Figure FDA0003668243030000013
对xu(i,lN+n)进行加窗处理,得到xu(i,l,n)=wH(n)xu(i,lN+n),xu(i,l,n)为第u个传声器第i个子带第l个单帧第n个采样信号的加窗信号;
用离散傅里叶变换函数DFT对xu(i,l,n)作时频转换,变换的长度为K,K=2N,频点为k,0≤k<K,得到
Figure FDA0003668243030000021
Xu(i,l,k)为xu(i,l,n)的频域信号,将Xu(i,l,k)作为时频单元信号。
6.根据权利要求5所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的计算每个时频单元信号的可控响应功率值,包括:
计算候选方位到第u个阵元的导引时延τu0(r),候选方位的声源位置为r,阵列中心的位置为r0,第u个阵元的位置为ru,空气中的声速为c,候选方位到阵列中心的声传播时延为τ0(r),候选方位到第u个阵元的声传播时延为τu(r),候选方位到第u个阵元的导引时延
Figure FDA0003668243030000022
计算阵列的PHAT可控响应输出YPHAT(i,l,k,r),信号采样率为fs,将τu0(r)和Xu(i,l,k)代入,得到
Figure FDA0003668243030000023
由YPHAT(i,l,k,r)计算第i个子带第l个单帧的时频单元信号在候选方位的可控响应功率值
Figure FDA0003668243030000024
7.根据权利要求6所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的确认可控响应功率值的主峰方位和次峰方位,包括:
将P(i,l,r)的最大值确认为主峰,次最大值确认为次峰;
主峰对应的rpeak1(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率最大值的方位,次峰对应的rpeak2(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率次最大值的方位。
8.根据权利要求7所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的用直方图统计主峰方位和次峰方位的数量,包括:
对第l个单帧所有子带的时频单元信号对应的方位rpeak1(i,l)作直方图,统计每个方位的数量,数量最多的方位为
Figure FDA0003668243030000031
若存在数量次多的方位,则数量次多的方位为
Figure FDA0003668243030000032
若rpeak1(i,l)中不存在数量次多的方位
Figure FDA0003668243030000033
则对第l个单帧所有子带的时频单元信号对应的方位rpeak2(i,l)作直方图,统计每个方位的数量,数量最多的方位为
Figure FDA0003668243030000034
9.根据权利要求8所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的rpeak1(i,l)作直方图和rpeak2(i,l)作直方图,包括:
组距为5°,组数为72。
10.根据权利要求8或9所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的根据数量最多的主峰方位和次峰方位估计主次声源方位,包括:
Figure FDA0003668243030000035
估计为第l个单帧的主声源方位,将
Figure FDA0003668243030000036
估计为第l个单帧的次声源方位。
CN201910421932.6A 2019-05-21 2019-05-21 一种基于Gammatone滤波器和直方图的多声源定位方法 Active CN110133572B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910421932.6A CN110133572B (zh) 2019-05-21 2019-05-21 一种基于Gammatone滤波器和直方图的多声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910421932.6A CN110133572B (zh) 2019-05-21 2019-05-21 一种基于Gammatone滤波器和直方图的多声源定位方法

Publications (2)

Publication Number Publication Date
CN110133572A CN110133572A (zh) 2019-08-16
CN110133572B true CN110133572B (zh) 2022-08-26

Family

ID=67571956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910421932.6A Active CN110133572B (zh) 2019-05-21 2019-05-21 一种基于Gammatone滤波器和直方图的多声源定位方法

Country Status (1)

Country Link
CN (1) CN110133572B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111929645B (zh) * 2020-09-23 2021-01-26 深圳市友杰智新科技有限公司 特定人声的声源定位方法、装置和计算机设备
CN112904279B (zh) * 2021-01-18 2024-01-26 南京工程学院 基于卷积神经网络和子带srp-phat空间谱的声源定位方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080219466A1 (en) * 2007-03-09 2008-09-11 Her Majesty the Queen in Right of Canada, as represented by the Minister of Industry, through Low bit-rate universal audio coder
US9100734B2 (en) * 2010-10-22 2015-08-04 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation
JP6012721B2 (ja) * 2011-06-14 2016-10-25 サザン イノヴェーション インターナショナル プロプライアトリー リミテッド 検出器出力データ中のパルスを特定するための方法および装置
CN106226739A (zh) * 2016-07-29 2016-12-14 太原理工大学 融合子带分析的双声源定位方法
CN106653032B (zh) * 2016-11-23 2019-11-12 福州大学 低信噪比环境下基于多频带能量分布的动物声音检测方法

Also Published As

Publication number Publication date
CN110133572A (zh) 2019-08-16

Similar Documents

Publication Publication Date Title
CN106782590B (zh) 基于混响环境下麦克风阵列波束形成方法
US5574824A (en) Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
Yan et al. Optimal modal beamforming for spherical microphone arrays
CA2499033C (en) A system and method for beamforming using a microphone array
Kjems et al. Maximum likelihood based noise covariance matrix estimation for multi-microphone speech enhancement
US7613309B2 (en) Interference suppression techniques
KR100493172B1 (ko) 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치
CN108731886B (zh) 一种基于迭代递推的供水管道多泄漏点声定位方法
CN111429939B (zh) 一种双声源的声音信号分离方法和拾音器
CN105301563B (zh) 一种基于一致聚焦变换最小二乘法的双声源定位方法
CN108921014B (zh) 一种基于改进噪声包络信号识别的螺旋桨轴频搜索方法
CN110133572B (zh) 一种基于Gammatone滤波器和直方图的多声源定位方法
CN106226739A (zh) 融合子带分析的双声源定位方法
GB2517690A (en) Method and device for localizing sound sources placed within a sound environment comprising ambient noise
JPH09512676A (ja) 適応性ビーム形成方法及び装置
MX2014006499A (es) Aparato y metodo para posicionar microfonos basado en la densidad de potencia espacial.
WO2016160821A1 (en) Adaptive mixing of sub-band signals
CN107167770B (zh) 一种混响条件下的麦克风阵列声源定位装置
Ren et al. A novel multiple sparse source localization using triangular pyramid microphone array
CN103907152A (zh) 用于音频信号噪声抑制的方法和系统
Koldovský et al. Semi-blind noise extraction using partially known position of the target source
CN112363112B (zh) 一种基于线性麦克风阵列的声源定位方法及装置
Lebarbenchon et al. Evaluation of an open-source implementation of the SRP-PHAT algorithm within the 2018 LOCATA challenge
KR20030046727A (ko) 서브밴드 씨피에스피 알고리듬을 이용한 음원위치추정방법및 그 시스템
CN114035157B (zh) 一种基于期望最大化算法的分频带时延估计方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200831

Address after: 1 No. 210000 Jiangsu city of Nanjing province Jiangning Science Park Hongjing Road

Applicant after: NANJING INSTITUTE OF TECHNOLOGY

Applicant after: JIANGSU SECOND NORMAL University (JIANGSU INSTITUTE OF EDUCATIONAL SCIENCE RESEARCH)

Address before: Longpan road Xuanwu District of Nanjing city of Jiangsu Province, No. 159 210000

Applicant before: NANJING FORESTRY University

Applicant before: JIANGSU SECOND NORMAL University (JIANGSU INSTITUTE OF EDUCATIONAL SCIENCE RESEARCH)

GR01 Patent grant
GR01 Patent grant