CN113655440B - 一种自适应折中预白化的声源定位方法 - Google Patents

一种自适应折中预白化的声源定位方法 Download PDF

Info

Publication number
CN113655440B
CN113655440B CN202110906625.4A CN202110906625A CN113655440B CN 113655440 B CN113655440 B CN 113655440B CN 202110906625 A CN202110906625 A CN 202110906625A CN 113655440 B CN113655440 B CN 113655440B
Authority
CN
China
Prior art keywords
sound source
signal
adaptive
prediction error
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110906625.4A
Other languages
English (en)
Other versions
CN113655440A (zh
Inventor
何宏森
陈景东
周颖玥
李小霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Southwest University of Science and Technology
Original Assignee
Northwestern Polytechnical University
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University, Southwest University of Science and Technology filed Critical Northwestern Polytechnical University
Priority to CN202110906625.4A priority Critical patent/CN113655440B/zh
Publication of CN113655440A publication Critical patent/CN113655440A/zh
Application granted granted Critical
Publication of CN113655440B publication Critical patent/CN113655440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种自适应折中预白化的声源定位方法,通过构建自适应参数因子δ1,并在此基础上,求解最优化模型,得到预测器系数向量a,再得到预测误差信号e(n),最后根据SRP算法,对预测误差信号时移,通过计算时移预测误差信号对间的互相关之和在空间搜索声源方位,峰值位置则为估计的声源方位。参数δ1是一个自适应因子,它根据不同信噪比的估计量
Figure DDA0003201916340000011
和房间混响时间的估计量
Figure DDA0003201916340000012
自适应变化,确保折中预白化声源定位方法在强噪声和强混响环境获得最优的性能。

Description

一种自适应折中预白化的声源定位方法
技术领域
本发明属于声源定位技术领域,更为具体地讲,涉及一种自适应折中预白化的声源定位方法。
背景技术
声源定位广泛应用于声学阵列定向拾音、免提话音通信、人机交互、声呐跟踪以及工业声学探测等技术领域。在基于麦克风阵列的声源定位技术中,转向响应功率(SRP)技术是一种重要的声源定位方法,它对噪声具有明显的鲁棒性;然而对混响敏感,其相位变换预滤波改进算法(SRP-PHAT)获得了对房间混响的鲁棒性,然而该方法在噪声环境性能严重下降。
最近,基于线性预测的预白化方法被提出用于白化麦克风信号,与转向响应功率方法相结合形成了一种折中预白化的转向响应功率算法。在噪声和混响环境,该算法的定位性能在SRP和其预滤波算法SRP-PHAT间获得了良好的折中。然而,该算法在强噪声或者强混响环境性能恶化。
发明内容
本发明的目的在于克服现有技术的不足,提供一种自适应折中预白化的声源定位方法,确保在强噪声和强混响环境下获得最优的性能。
为实现上述发明目的,本发明自适应折中预白化的声源定位方法,其特征在于,包括以下步骤:
(1)、采集麦克风信号,并对麦克风信号进行分帧
对声信号进行采集,得到麦克风信号x(n),并构建n时刻的输入信号向量x(n):
x(n)=[x(n)x(n+1) … x(n+K+L-1)]T
以及输入信号矩阵X(n):
Figure BDA0003201916320000011
其中,L是信号帧长,K是预测器阶数,(·)T表示向量或矩阵的转置;
(2)、对麦克风信号x(n)进行信噪比估计,得到估计量
Figure BDA0003201916320000021
(3)、对房间混响时间进行估计,得到估计量
Figure BDA0003201916320000022
(4)、构建自适应参数因子δ1
Figure BDA0003201916320000023
其中,acot是反余切函数,log是自然对数函数,γ、σ、κ以及τ是常数,根据具体实施情况确定;
(5)、设置常数因子δ2
(6)、求解最优化模型:
Figure BDA0003201916320000024
其中,‖·‖2和‖·‖1分别代表向量的2范数和1范数,a=[a1a2…aK]T,ak是线性预测器系数,k=1,2,…,K,K是预测器阶数,F是傅里叶矩阵,花括号中第一个加项是最小二乘函数,第二个加项是关于语音谱的稀疏约束,第三个加项是为了确保X(n)的相关矩阵可逆,λ1是语音谱稀疏正则化参数,λ2是一个正则化参数,分别设置如下:
λ1=δ1‖XT(n)x(n)‖
λ2=δ2‖XT(n)x(n)‖
其中,‖·‖表示向量的无穷范数;
得到线性预测器系数向量a;
(7)、计算预测误差向量e
e(n)=x(n)-X(n)a;
其中,预测误差向量e表示为:
e(n)=[e(n)e(n+1) … e(n+K+L-1)]T
(8)、根据SRP算法搜索声源方位
按照步骤(1)-(7)的方法,分别获得M只麦克风的预测误差信号e(n),根据SRP算法,对预测误差信号时移,通过计算时移预测误差信号对间的互相关之和,在空间搜索声源方位,峰值位置则为估计的声源方位。
本发明的发明目的是这样实现的:
本发明自适应折中预白化的声源定位方法,通过构建自适应参数因子δ1,并在此基础上,求解最优化模型,得到预测器系数向量a,再得到预测误差信号e(n),最后根据SRP算法,对预测误差信号时移,通过计算时移预测误差信号对间的互相关之和在空间搜索声源方位,峰值位置则为估计的声源方位。参数δ1是一个自适应因子,它根据不同信噪比的估计量
Figure BDA0003201916320000031
和房间混响时间的估计量/>
Figure BDA0003201916320000032
自适应变化,确保折中预白化声源定位方法在强噪声和强混响环境获得最优的性能。
附图说明
图1是本发明自适应折中预白化声源定位方法的一种具体实施方式流程图;
图2是在混响时间T60=200ms的声环境下,五种声源定位方法的根均方误差RMSE随信噪比SNR变化的对比曲线图;
图3是在混响时间T60=500ms的声环境下,五种声源定位方法的根均方误差RMSE随信噪比SNR变化的对比曲线图;
图4是在混响时间T60=800ms的声环境下,五种声源定位方法的根均方误差RMSE随信噪比SNR变化的对比曲线图;
图5是在SNR=0dB条件下,五种声源定位方法的RMSE随混响时间T60变化的对比曲线图;
图6是在SNR=10dB条件下,五种声源定位方法的RMSE随混响时间T60变化的对比曲线图;
图7是在SNR=20dB条件下,五种声源定位方法的RMSE随混响时间T60变化的对比曲线图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
本发明基于信噪比和房间混响时间的估计量开发了一种关于稀疏正则化参数的自适应估计方法,确保折中预白化声源定位方法在强噪声和强混响环境获得最优的性能,下面对本发明进行详细说明。
假设在远场有一个宽带声源辐射平面声波,利用具有M只麦克风的声阵列采集声信号,并对麦克风信号分帧处理。为了降低混响对声源定位性能的不利影响,利用线性预测器对麦克风信号预滤波。为此,利用第m(m=1,2,…,M)只麦克风近期采集的样本预测其当前样本
Figure BDA0003201916320000041
Figure BDA0003201916320000042
式中ak是线性预测器系数,k=1,2,…,K,K是预测器阶数,为了简化已忽略了下标m。由此,预测误差信号可表示为:
Figure BDA0003201916320000043
使用向量/矩阵形式,(2)式可表示如下:
e(n)=x(n)-X(n)a (3)
式中:
e(n)=[e(n) e(n+1) … e(n+K+L-1)]T (4)
x(n)=[x(n) x(n+1) … x(n+K+L-1)]T (5)
Figure BDA0003201916320000044
a=[a1 a2 … aK]T (7)
其中,L是信号帧长,(·)T表示向量或矩阵的转置。
预测误差向量e(n)可用于定义一种代价函数,通过对其最小化可获得预测器系数向量的最优估计量。近期的文献已提出一种优化模型对麦克风信号进行预白化处理(Hongsen He,Xueyuan Wang,Yingyue Zhou,and Tao Yang,“A steered response powerapproach with trade-off prewhitening for acoustic source localization,”Journal of the Acoustical Society of America,vol.143,no.2,pp.1003–1007,Feb.2018),其最优化模型如下:
Figure BDA0003201916320000045
式中‖·‖2和‖·‖1分别代表向量的2范数和1范数,F是傅里叶矩阵,花括号中第一个加项是最小二乘函数,第二个加项是关于语音谱的稀疏约束,引入第三个加项是为了确保X(n)的相关矩阵可逆。λ1是语音谱稀疏正则化参数,λ2是一个正则化参数,分别设置如下:
λ1=δ1‖XT(n)x(n)‖ (9)
λ2=δ2‖XT(n)x(n)‖ (10)
式中δ1和δ2是两个常数因子,‖·‖表示向量的无穷范数。
从(8)式和(9)式可以看出,确定语音谱稀疏程度的正则化参数δ1扮演着重要角色。如果δ1→0,则语音谱的稀疏性没有被使用,(8)式的优化模型退化成一个2范数正则化的最小二乘模型,意味着麦克风信号被完全预白化,在这种情况下,该模型对应的声源定位方法的性能和SRP-PHAT算法相当。当δ1→∞,麦克风信号几乎没有被预白化,(8)式的优化模型对应的定位器性能和SRP算法相当。如果选择一个合适的参数δ1,那么基于折中预白化的声源定位器可在噪声和混响间获得一个好的鲁棒性平衡。然而文献中并没有给出如何有效地确定稀疏正则化参数λ1中的参数因子δ1。为了让上述模型对应的声源定位算法在不同的噪声和混响环境均能获得最优的定位性能,本发明提出了如下的一种关于稀疏正则化参数λ1中参数因子δ1的鲁棒自适应估计方法:
Figure BDA0003201916320000051
式中acot是反余切函数,log是自然对数函数,γ、σ、κ以及τ是常数;δ1是一个自适应参数因子,它根据不同信噪比的估计量
Figure BDA0003201916320000052
和房间混响时间的估计量/>
Figure BDA0003201916320000053
自适应变化,确保定位算法在不同声学环境条件下获得最优的性能。
一旦根据自适应折中预白化模型求出预测器系数向量a后,则可根据(3)式分别获得M只麦克风的预测误差信号,对该信号时移,通过计算时移预测误差信号对间的互相关之和在空间搜索声源方位,峰值位置则为估计的声源方位。
图1是本发明自适应折中预白化声源定位方法的一种具体实施方式流程图。
在本实施例中,如图1所示,本发明自适应折中预白化的声源定位方法包括以下步骤:
步骤S1:采集麦克风信号,并对麦克风信号进行分帧
对声信号进行采集,得到麦克风信号x(n),并构建n时刻的输入信号向量x(n):
x(n)=[x(n)x(n+1) … x(n+K+L-1)]T
以及输入信号矩阵X(n):
Figure BDA0003201916320000061
其中,L是信号帧长,K是预测器阶数,(·)T表示向量或矩阵的转置;
步骤S2:信噪比估计
对麦克风信号x(n)进行信噪比估计,得到估计量
Figure BDA0003201916320000062
/>
步骤S3:房间混响时间估计
对房间混响时间进行估计,得到估计量
Figure BDA0003201916320000063
步骤S4:构建自适应参数因子δ1
Figure BDA0003201916320000064
其中,acot是反余切函数,log是自然对数函数,γ、σ、k以及τ是常数,根据具体实施情况确定;
步骤S5:设置常数因子δ2
步骤S6:求解最优化模型:
Figure BDA0003201916320000065
其中,‖·‖2和‖·‖1分别代表向量的2范数和1范数,a=[a1 a2 … aK]T,ak是线性预测器系数,k=1,2,…,K,K是预测器阶数,F是傅里叶矩阵,花括号中第一个加项是最小二乘函数,第二个加项是关于语音谱的稀疏约束,第三个加项是为了确保X(n)的相关矩阵可逆,λ1是语音谱稀疏正则化参数,λ2是一个正则化参数,分别设置如下:
λ1=δ1‖XT(n)x(n)‖
λ2=δ2‖XT(n)x(n)‖
其中,‖·‖表示向量的无穷范数;
得到线性预测器系数向量a;
步骤S7:计算预测误差向量e
e(n)=x(n)-X(n)a;
其中,预测误差向量e表示为:
e(n)=[e(n) e(n+1) … e(n+K+L-1)]T
步骤S8:根据SRP算法搜索声源方位
按照步骤S1-S7的方法,分别获得M只麦克风的预测误差信号e(n),根据SRP算法,对预测误差信号时移,通过计算时移预测误差信号对间的互相关之和在空间搜索声源方位,峰值位置则为估计的声源方位。
实验验证
为了测试本发明自适应折中预白化的声源定位方法即参数自适应-语音谱稀疏约束-线性预测(PA-SSSC-LP)方法的性能,本实验在噪声和混响声环境对本发明的性能进行验证。对于本发明所提的声源定位方法,本实验验证中,参数γ=0.2,σ=20,κ=100,τ=50,δ2=0.001,预测器阶数K=144。作为对比的相关方法包括SRP,SRP-PHAT,基于稀疏线性预测器系数约束的线性预测方法(SLPCC-LP)(Hongsen He,Tao Yang,and Jingdong Chen,“On time delay estimation from a sparse linear prediction perspective,”Journal of the Acoustical Society of America,vol.137,no.2,pp.1044–1047,Feb.2015),以及基于语音谱稀疏约束的线性预测方法(SSSC-LP)(Hongsen He,XueyuanWang,Yingyue Zhou,and Tao Yang,“A steered response power approach with trade-off prewhitening for acoustic source localization,”Journal of the AcousticalSociety of America,vol.143,no.2,pp.1003–1007,Feb.2018)。
用于声源定位实验的仿真房间大小为7m×6m×3m,声源和麦克风的坐标以房间地板西南角为参考点。使用八只全指向麦克风构成的均匀环形阵列采集声信号,阵列中心坐标为(3.50,3.00,1.40)m,阵列半径为0.05m,第一只麦克风位于(3.55,3.00,1.40)m。为了检验不同声源位置对定位性能的影响,一只扬声器先后随机地沿着半径为2m的圆环放置在4个位置作为声源,该圆环与麦克风阵列具有相同的中心。这四个声源位置的坐标分别为(4.50,4.73,1.40)m、(1.65,3.75,1.40)m、(1.70,2.13,1.40)m以及(5.31,2.15,1.40)m,对应的声波到达方位角分别为60°、158°、206°以及335°。声源到八只麦克风间的声脉冲响应由镜像源模型产生。麦克风输出信号由声源信号与对应的通道声脉冲响应相卷积,并加入零均值白高斯噪声控制信噪比(SNR)予以获得。为了检验房间混响对声源定位性能的影响,对房间墙面设置一组吸声系数,并利用赛宾公式T60=0.161V/(αS)仿真不同的混响时间,式中T60表示混响时间,V和S分别表示房间的体积和表面积,α是吸声系数,并假设该房间的六个墙面具有相同的吸声系数。
声源信号是一段英语语音信号,其采样率为48kHz,声源信号长度约为2分钟。将麦克风采集的含噪混响语音信号分成长度为128ms互不重叠的信号帧,帧长L=6144,一个信号帧进行一次定位实验,使用根均方误差(RMSE)对声源定位算法的性能进行评价。对于本发明所提的声源定位方法,为了方便在未知噪声和混响环境获得良好的定位性能,利用麦克风拾取的声信号估计信噪比和房间的混响时间,对稀疏正则化参数λ1中的参数因子δ1进行自适应估计。
图2~4描述了在不同混响时间的声学环境下,五种声源定位方法的根均方误差RMSE随信噪比SNR变化的情况。可以看出,在低信噪比环境,比如SNR<0dB,相对于SRP-PHAT算法,SRP算法获得了对噪声更好的鲁棒性;然而在高信噪比条件下,比如SNR>10dB,SRP-PHAT算法获得了更好的鲁棒性,这是由于SRP-PHAT算法对麦克风信号进行了白化,降低了混响对声源定位性能的不利影响。基于稀疏线性预测器系数约束的线性预测算法(SLPCC-LP)和基于稀疏语音谱约束的线性预测算法(SSSC-LP)在SRP和SRP-PHAT间获得了对噪声和混响的鲁棒性折中;在语音帧中,由于语音谱的稀疏特性较预测器系数的稀疏性更显著,因此基于稀疏语音谱约束的线性预测算法(SSSC-LP)在混响主导的声环境(SNR>10dB)获得了更好的定位性能。本发明所提的参数自适应算法(PA-SSSC-LP)在不同噪声和混响声环境获得了最优的性能,这是由于它可根据麦克风信号的先验信噪比和混响时间自适应地确定语音谱稀疏约束的正则化参数。
图5~7描述了在不同信噪比条件下,声源定位算法的根均方误差RMSE随混响时间T60变化的情况。图5反映出在低信噪比条件下,SRP算法获得了最强的抗噪性能,同时,由于本发明所提的参数自适应算法(PA-SSSC-LP)在低信噪比条件下估计出的稀疏正则化参数λ1较大,麦克风信号几乎没有被预白化,因此参数自适应算法的性能和SRP算法相当。从图6可以看出,当T60=0ms时,SRP算法获得了最好的性能,意味着它的确对噪声鲁棒,然而SRP-PHAT算法对噪声敏感。在噪声和强混响环境,由于PHAT的白化能力,SRP-PHAT算法对混响具有鲁棒性。相对于SRP-PHAT算法,引入预测器系数稀疏性的SRP算法获得了更好的白化性能,然而利用语音谱的稀疏性对麦克风信号进行白化在混响环境展示了最好的定位性能。从图6和图7也可以看出,本发明所提的参数自适应算法(PA-SSSC-LP)在噪声和不同混响声环境获得了最优的性能,验证了本发明所提定位算法对不同混响的自适应能力。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (1)

1.一种自适应折中预白化的声源定位方法,其特征在于,包括以下步骤:
(1)、采集麦克风信号,并对麦克风信号进行分帧
对声信号进行采集,得到麦克风信号x(n),并构建n时刻的输入信号向量x(n):
x(n)=[x(n)x(n+1)…x(n+K+L-1)]T
以及输入信号矩阵X(n):
Figure FDA0004146228070000011
其中,L是信号帧长,K是预测器阶数,(·)T表示向量或矩阵的转置;
(2)、对麦克风信号x(n)进行信噪比估计,得到估计量
Figure FDA0004146228070000012
(3)、对房间混响时间进行估计,得到估计量
Figure FDA0004146228070000013
(4)、构建自适应参数因子δ1
Figure FDA0004146228070000014
其中,acot是反余切函数,log是自然对数函数,γ、σ、κ以及τ是常数,根据具体实施情况确定;
(5)、设置常数因子δ2
(6)、求解最优化模型:
Figure FDA0004146228070000015
其中,‖·‖2和‖·‖1分别代表向量的2范数和1范数,a=[a1a2…aK]T,ak是线性预测器系数,k=1,2,…,K,K是预测器阶数,F是傅里叶矩阵,花括号中第一个加项是最小二乘函数,第二个加项是关于语音谱的稀疏约束,第三个加项是为了确保X(n)的相关矩阵可逆;λ1是语音谱稀疏正则化参数,λ2是一个正则化参数,分别设置如下:
λ1=δ1‖XT(n)x(n)‖
λ2=δ2‖XT(n)x(n)‖
其中,‖·‖表示向量的无穷范数;
得到线性预测器系数向量a;
(7)、计算预测误差向量e
e(n)=x(n)-X(n)a;
其中,预测误差向量e表示为:
e(n)=[e(n)e(n+1)…e(n+K+L-1)]T
(8)、根据SRP算法搜索声源方位
按照步骤(1)-(7)的方法,分别获得M只麦克风的预测误差信号e(n),根据SRP算法,对预测误差信号时移,通过计算时移预测误差信号对间的互相关之和在空间搜索声源方位,峰值位置则为估计的声源方位。
CN202110906625.4A 2021-08-09 2021-08-09 一种自适应折中预白化的声源定位方法 Active CN113655440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110906625.4A CN113655440B (zh) 2021-08-09 2021-08-09 一种自适应折中预白化的声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110906625.4A CN113655440B (zh) 2021-08-09 2021-08-09 一种自适应折中预白化的声源定位方法

Publications (2)

Publication Number Publication Date
CN113655440A CN113655440A (zh) 2021-11-16
CN113655440B true CN113655440B (zh) 2023-05-30

Family

ID=78490521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110906625.4A Active CN113655440B (zh) 2021-08-09 2021-08-09 一种自适应折中预白化的声源定位方法

Country Status (1)

Country Link
CN (1) CN113655440B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114205731B (zh) * 2021-12-08 2023-12-26 随锐科技集团股份有限公司 发言人区域检测方法、装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549052A (zh) * 2018-03-20 2018-09-18 南京航空航天大学 一种时频-空域联合加权的圆谐域伪声强声源定位方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE476826T1 (de) * 2004-12-22 2010-08-15 Televic Nv Verfahren und anordnung für das schätzen einer raumimpulsantwort
GB2517690B (en) * 2013-08-26 2017-02-08 Canon Kk Method and device for localizing sound sources placed within a sound environment comprising ambient noise
CN104142492B (zh) * 2014-07-29 2017-04-05 佛山科学技术学院 一种srp‑phat多源空间定位方法
CN105652243B (zh) * 2016-03-14 2017-12-05 西南科技大学 多通道群稀疏线性预测时延估计方法
CN106226739A (zh) * 2016-07-29 2016-12-14 太原理工大学 融合子带分析的双声源定位方法
CN107247251B (zh) * 2017-06-20 2020-04-03 西北工业大学 基于压缩感知的三维声源定位方法
KR102088222B1 (ko) * 2018-01-25 2020-03-16 서강대학교 산학협력단 분산도 마스크를 이용한 음원 국지화 방법 및 음원 국지화 장치
CN109541572B (zh) * 2018-11-19 2022-05-03 西北工业大学 一种基于线性环境噪声模型的子空间方位估计方法
CN110082725B (zh) * 2019-03-12 2023-02-28 西安电子科技大学 基于麦克风阵列的声源定位时延估计方法、声源定位系统
CN110133596B (zh) * 2019-05-13 2023-06-23 江苏第二师范学院(江苏省教育科学研究院) 一种基于频点信噪比和偏置软判决的阵列声源定位方法
CN110726972B (zh) * 2019-10-21 2022-09-16 南京南大电子智慧型服务机器人研究院有限公司 干扰及高混响环境下使用传声器阵列的语音声源定位方法
CN112904279B (zh) * 2021-01-18 2024-01-26 南京工程学院 基于卷积神经网络和子带srp-phat空间谱的声源定位方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549052A (zh) * 2018-03-20 2018-09-18 南京航空航天大学 一种时频-空域联合加权的圆谐域伪声强声源定位方法

Also Published As

Publication number Publication date
CN113655440A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
CN110100457B (zh) 基于噪声时变环境的加权预测误差的在线去混响算法
Gannot et al. Subspace methods for multimicrophone speech dereverberation
CN107039045B (zh) 用于语音增强的全局优化最小二乘后滤波
Benesty Adaptive eigenvalue decomposition algorithm for passive acoustic source localization
Kodrasi et al. Regularization for partial multichannel equalization for speech dereverberation
US20050249038A1 (en) System and process for time delay estimation in the presence of correlated noise and reverberation
CN108141691B (zh) 自适应混响消除系统
Peled et al. Method for dereverberation and noise reduction using spherical microphone arrays
EP1658751A2 (en) Audio input system
Niwa et al. Post-filter design for speech enhancement in various noisy environments
Peled et al. Linearly-constrained minimum-variance method for spherical microphone arrays based on plane-wave decomposition of the sound field
Ito et al. Designing the Wiener post-filter for diffuse noise suppression using imaginary parts of inter-channel cross-spectra
Daniel et al. Time domain velocity vector for retracing the multipath propagation
Chen et al. Time delay estimation
CN110111802B (zh) 基于卡尔曼滤波的自适应去混响方法
CN113655440B (zh) 一种自适应折中预白化的声源定位方法
Tung et al. Source localization and spatial filtering using wideband MUSIC and maximum power beamforming for multimedia applications
Wan et al. Improved steered response power method for sound source localization based on principal eigenvector
Moore et al. Linear prediction based dereverberation for spherical microphone arrays
CN113655441B (zh) 一种低复杂度折中预白化的鲁棒声源定位方法
Talmon et al. Multichannel speech enhancement using convolutive transfer function approximation in reverberant environments
Hioka et al. Estimating power spectral density for spatial audio signal separation: An effective approach for practical applications
Hu et al. A robust adaptive speech enhancement system for vehicular applications
Hossein et al. Performance analysis of acoustic microphone array beamformer in the presence of interfering signal
Li et al. Noise reduction method based on generalized subtractive beamformer

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant