CN108318862B - 一种基于神经网络的声源定位方法 - Google Patents

一种基于神经网络的声源定位方法 Download PDF

Info

Publication number
CN108318862B
CN108318862B CN201711428934.5A CN201711428934A CN108318862B CN 108318862 B CN108318862 B CN 108318862B CN 201711428934 A CN201711428934 A CN 201711428934A CN 108318862 B CN108318862 B CN 108318862B
Authority
CN
China
Prior art keywords
sound source
signal
sound
dnn
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711428934.5A
Other languages
English (en)
Other versions
CN108318862A (zh
Inventor
曲天书
吴玺宏
黄炎坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Original Assignee
Peking University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University filed Critical Peking University
Priority to CN201711428934.5A priority Critical patent/CN108318862B/zh
Publication of CN108318862A publication Critical patent/CN108318862A/zh
Application granted granted Critical
Publication of CN108318862B publication Critical patent/CN108318862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种基于神经网络的声源定位方法。本发明对所有传输路径的传递函数,即传递特性进行建模,通过深度学习的方式从大量数据中学习到声音信号在传播过程中由于散射体的存在或环境等原因造成的相位和幅度变化规律,通过神经网络可以恢复到原始的相位和幅度,最后结合时间差和幅度差两个定位线索进行声源定位。本发明利用了已知的时延信息,再利用深度神经网络恢复原始的相位和幅度,并有效地结合了时间信息和幅度信息进行定位,显著提高了抗噪性能。

Description

一种基于神经网络的声源定位方法
技术领域
本发明属于阵列信号处理技术领域,涉及麦克风阵列和声源定位方法,具体涉及一种基于神经网络的声源定位方法。
背景技术
语音是人类信息交流中最基本、最直接的工具。现代通信技术一般用麦克风进行语音信号的采集,然后根据不同应用的需求进行存储、处理和转发。将多个麦克风组成阵列,可以有效地利用接收信号间的冗余来实现声源定位、语音增强、语音分离等功能。基于麦克风阵列的声源定位是近年来语音信号处理领域的一大研究热点,声源定位技术在视频电话会议、机器人定位、语音增强等场景都扮演着非常重要的角色。
对于近年来的声源定位技术,按照定位的原理,声源定位技术一般可分成以下五类:基于可控波束形成、基于时延差估计、基于高分辨率谱估计、基于传递函数逆滤波和基于神经网络。
基于可控波束形成的定位算法是通过波束形成补偿阵列各通道间的时延并计算出可控响应功率,功率最大的位置即为声源位置,典型的算法有SRP-PHAT。基于时延差估计的定位算法是通过估计到达时间差,根据时延差和阵列的空间几何位置来推断出声源位置,典型的算法有GCC。基于高分辨率谱估计的定位算法是基于对阵列信号的协方差矩阵进行特征分解,从而得到与信号分量相对应的信号子空间及噪声子空间,利用两子空间估计目标方位,典型的算法有MUSIC。然而这些传统定位算法都只利用了通道间时间差的定位线索,没有利用到通道间强度差的定位线索,而且当存在散射体,存在衍射现象时,无法准确估计时延,定位误差非常大。
基于传递函数的定位算法是通过实测每个声源到每个麦克风的传输特性,即传递函数,通过逆滤波操作得到源信号进行定位。测量到准确的传递函数是一件非常困难的事,需要在无噪声的环境下播放指定信号才有可能通过计算得到传递函数,并且传递函数是不完全准确,但在现实情况是不满足的,当测量过程中有噪声时,测得的传递函数效果很差,甚至奔溃。
最近研究主要集中在基于神经网络的定位算法,这类研究基本需要预先提取特征,然后利用神经网络学习特征到方位角的映射。目前,基于神经网络的定位算法,大部分需要特征提取这一环节,而且只学习到方位角的一个映射,无法直接恢复源信号。
发明内容
针对现有技术存在的技术问题,本发明提出一种基于神经网络的声源定位方法,旨在通过学习的方式学习到声音信号在传播过程中由于散射体的存在或环境等原因造成的相位和幅度的变化,结合时间差和幅度差两个定位线索进行声源定位,并在实际充满噪声的环境下,该方法仍可进行推广应用。
本发明中所提出的基于神经网络的声源定位方法的基本思想是对所有传输路径的传递函数,即传递特性进行建模,通过深度学习的方式从大量数据中学习到声音信号在传播过程中由于散射体的存在或环境等原因造成的相位和幅度变化规律,通过神经网络可以恢复到原始的相位和幅度,最后结合时间差和幅度差两个定位线索进行声源定位。本发明的重要创新之处在于它利用了已知的时延信息,再利用深度神经网络恢复原始的相位和幅度,并有效地结合了时间信息和幅度信息进行定位,显著提高了抗噪性能。
声音信号从一个位置传输到另一个位置的过程中,由于受到外界的干扰,声音信号的相位和幅度会发生变化,其变化过程可以由传递函数刻画。本发明在对传递函数建模问题上,是利用多个深度神经网络模型(DNN模型)对所有传输路径的传递函数进行建模,具体为一个DNN模型对一个传输路径的传递函数进行建模。DNN模型的输入是麦克风接收到的声音信号时域表示,时域表示中的一个采样点对应DNN模型中的一个输入神经元,DNN的输出监督信息使用的是源信号时域表示,同样也是一个采样点对应一个神经元。DNN模型学习的是接收信号到源信号的一个映射,属于神经网络的回归问题。关于训练数据的获取,可仿真生成,也可实际采集,即利用在定点播放声源信号,麦克风阵列采集信号即可。为了使模型适用于宽带信号的声源定位问题上,可选择使用白噪声作为声源信号。
本发明的技术方案为:
一种基于神经网络的声源定位方法,其步骤包括:
1)根据各待扫描的声源位置信息和各声音信号采集单元的位置信息,计算各声源的声音信号传输到每一声音信号采集单元的时延;其中,τls表示声源s到第l个声音信号采集单元的时延;
2)扫描每一所述声源的位置,根据步骤1)得到的时延对声音信号采集单元信号进行相应的时延补偿;其中,时刻n扫描声源s的位置时,对第l个声音信号采集单元采集的信号xl进行时延补偿后的信号为
Figure BDA0001524514140000021
3)将步骤2)时延补偿后的时域信号输入到对应的DNN模型中,通过DNN模型进行相位和幅度的恢复,并输出估计的源信号;其中,将信号
Figure BDA0001524514140000022
输入DNNls)模型,DNNls模型表示声源s和第l个声音信号采集单元对应传输路径的DNN模型;训练得到DNNls模型的方法为:将第l个声音信号采集单元接收到的声音信号时域表示作为该深度神经网络模型的输入,将声源s的声音信号时域表示作为该深度神经网络模型的输出监督信息,训练得到该DNNls模型;时刻n扫描声源s的位置时DNNls模型输出的源信号
Figure BDA0001524514140000031
M为声音信号采集单元总数;
4)对于每一扫描位置,计算M个估计的源信号的互相关系数和;
5)重复步骤2)~4),当扫描完全部所述声源的位置后,分别计算出一互相关系数和;根据互相关系数和选取相关度最大值对应的声源位置作为估计的声源位置。
进一步的,根据时刻n扫描声源s的位置时输出的M个估计的源信号,计算得到的声源s的互相关系数和为
Figure BDA0001524514140000032
其中,Corr(x(n),y(n))是指信号x(n),y(n)的互相关系数。
进一步的,训练得到DNN模型的训练数据为实际采集的数据,即利用在设定位置播放声源信号,声音信号采集单元阵列采集所述声源信号。
进一步的,所述声源信号为白噪声。
进一步的,训练得到DNN模型的训练数据为仿真生成的数据。
进一步的,所述声音信号采集单元为麦克风。
本发明提出的基于神经网络的声源定位方法的基本框架如图1所示,该方法是一个扫描的方法,其中主要包括以下几个部分:
计算时延:对于待扫描的每个声源位置和每个麦克风,计算声音信号从声源位置传输到麦克风位置的时延。
补偿时延:在每次扫描过程中,对多通道麦克风信号分别进行相应时延的补偿。
通过DNN恢复相位和幅度:对于时延补偿后的信号,将其输入到对应的DNN中,使信号恢复到原始相位和幅度。
通道间一致性计算:对于某一个声源位置来说,麦克风阵列恢复出多通道信号,计算恢复出的多通道信号的互相关系数和,作为通道间一致性的指标。
估计目标声源位置:对位置空间所有的待扫描的声源位置,分别进行上述几个操作,计算得出声源位置对应的互相关系数和,取相关系数和最大对应的声源位置作为最终估计的声源位置。
与现有技术相比,本发明的积极效果为:
本发明利用了已知的时延信息,再利用深度神经网络恢复原始的相位和幅度,并有效地结合了时间信息和幅度信息进行定位,显著提高了抗噪性能。
本发明在噪声环境下仍能够进行训练和应用,具有较强的鲁棒性。
附图说明
图1为基于神经网络的声源定位方法的基本框图;
图2为本发明使用的DNN模型结构示意图;
图3为本发明所用球模型以及麦克风分布示意图;
图4为本发明所提方法与基线分别在白噪声和语音信号的定位指向图;
(a)声源信号为白噪声,方位角为0°,(b)声源信号为白噪声,方位角为15°,
(c)声源信号为语音信号,方位角为0°,(d)声源信号为语音信号,方位角为15°;
图5为本发明所提方法与基线在不同信噪比下不同信号类别的定位性能曲线;
(a)声源信号为白噪声,(b)声源信号为语音信号;
图6为本发明方法在不同信噪比数据下训练得到的模型的定位性能曲线。
具体实施方式
下面参照本发明的附图,更详细地描述本发明的最佳实施例。图1所示为本发明提出的基于神经网络的声源定位方法的基本框图,本发明方法的具体实现步骤包括计算时延、补偿时延、通过DNN恢复相位和幅度、通道间一致性计算和估计目标声源位置。各步骤的具体实现过程如下:
1.计算时延
待扫描的每个声源位置和每个麦克风位置都是已知的,则时延也是已知信息,可以直接使用,即可以根据位置计算两者距离,再结合声速计算声音信号从声源位置传输到麦克风位置的时延,即
Figure BDA0001524514140000041
其中,τls表示候选声源s与第l个麦克风的时延,dls为候选声源s与第l个麦克风的距离,ν为声速。
2.补偿时延
麦克风阵列位置保持不变,声源遍历空间每一方位的定位过程,称之为扫描。在每次扫描过程中,由步骤1可计算出声音信号在每个传输路径的时延,因此,就某个声源位置来说,需对多通道麦克风信号分别进行相应时延的补偿,即
Figure BDA0001524514140000051
其中,M表示麦克风数,n为时刻,xl为第l个麦克风采集的信号,
Figure BDA0001524514140000052
为在时刻n,声源位置为s时,对第l个麦克风采集的信号xl进行时延补偿,得到补偿后的信号。
3.通过DNN恢复相位和幅度
将时延补偿后的时域信号输入到对应的DNN中,通过DNN进行相位和幅度的恢复,并输出估计的源信号,即
Figure BDA0001524514140000053
其中,DNNls表示声源s和第l个麦克风对应传输路径的DNN模型,其模型结构可参见图2。
4.通道间一致性计算
对于某一个扫描位置来说,能恢复出多通道原始信号,计算恢复出的多通道信号的互相关系数和,作为通道间一致性的指标,即
Figure BDA0001524514140000054
其中,Corr(x(n),y(n))是指信号x(n)、y(n)的互相关系数,SCorr(s)表示对于候选声源s的互相关系数和。
5.估计目标声源位置
理论上若扫描到的候选声源位置与真实声源位置一致时,恢复出的多路源信号是一致的,即互相关系数和最大。通过对假定空间H中的所有声源位置进行扫描,分别计算出互相关系数和,最后,选取相关度最大的一个候选声源位置作为估计的声源位置,即
Figure BDA0001524514140000055
下面结合具体实施例说明本发明的优点。
本发明使用传递函数生成仿真信号,分别在安静和噪声条件下测试所提定位方法在仿真信号上的定位性能。定位性能的评价指标包括定位指向性以及抗噪性能。实验使用SRP-PHAT作为基线。声源信号分别选用高斯白噪声信号、TIMIT语音数据库中的语音信号。噪声情况下的信噪比变化范围为-40dB至25dB。
1.DNN结构
在本实例中,DNN模型使用四层的前馈全连接神经网络,如图2所示,每层的神经元数都为4096(由于帧长为4096个采样点),前三层的激活函数为tanh,最后一层为回归层,不设置激活函数,模型使用均方误差(MSE)作为代价函数,优化算法为Adam算法。
2.传递函数
实验使用刚性球作为散射体,其表面水平均匀分布有6个麦克风,如图3所示。球半径为8.75cm。声源与麦克风位于同一水平面内,与球中心的距离恒定为3m。麦克风的水平角在0度到360度内变化,变化步长为60度。传递函数由Duda等人给出的球模型计算得到。
3.信号仿真
实验使用声源卷积传递函数生成仿真信号,声源信号共有两种:高斯白噪声信号和TIMIT语音数据库中的语音信号。语音中的静音会干扰实验,因此在实验前手动切除其中的静音段。实验向仿真信号各通道中加入同等强度的高斯白噪声,各通道间高斯白噪声相互独立,信号的采样率为48kHz。每种条件(声源位置、声源类型)下,统计本发明所提方法与基线方法定位结果。
4.实验结果
在该实验中,选取了干净的高斯白噪声信号、语音信号分别用本发明提出的方法和基线方法进行定位,观察这两个方法在不同种类信号的定位指向性,如图4所示。从图上可看出,本发明提出的方法的指向性好于基线方法,当训练数据和测试数据分布越匹配时,定位性能越好。
为了验证该模型在充满噪声的实际环境下仍能工作,本实验使用不同信噪比(-40dB~25dB)的加噪信号进行定位实验,源信号有高斯白噪声、语音信号,分别用本发明提出的方法和基线方法进行定位测试,两者的定位平均角度误差如图5。从图上可以看出,使用本发明提出的方法进行定位时,当SNR降至-15dB开始出现误差。然而,使用基线方法进行定位时,会在-12dB处提早出现误差,总体抗噪性能提升了3dB。
在上述定位实验中,模型是通过干净的信号进行训练得来,得到了很好的定位效果。为了检验模型的鲁棒性,探究是否在实际充满噪声的情况还能训练和使用模型,故增加了鲁棒性评测实验。训练数据分别在干净高斯白噪声信号的基础上加入不同信噪比(-10dB~10dB,间隔为5dB)的噪声作为训练数据,其定位性能如图6。从图可看出,该方法在噪声环境下仍能够进行训练和应用,具有较强的鲁棒性。
尽管为说明目的公开了本发明的具体实施例和附图,其目的在于帮助理解本发明的内容并据以实施,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是可能的。因此,本发明不应局限于最佳实施例和附图所公开的内容。

Claims (6)

1.一种基于神经网络的声源定位方法,其步骤包括:
1)根据各待扫描的声源位置信息和各声音信号采集单元的位置信息,计算各声源的声音信号传输到每一声音信号采集单元的时延;其中,τls表示声源s到第l个声音信号采集单元的时延;
2)扫描每一所述声源的位置,根据步骤1)得到的时延对声音信号采集单元信号进行相应的时延补偿;其中,时刻n扫描声源s的位置时,对第l个声音信号采集单元采集的信号xl进行时延补偿后的信号为
Figure FDA0003053862690000011
3)将步骤2)时延补偿后的时域信号输入到对应的DNN模型中,通过DNN模型进行相位和幅度的恢复,并输出估计的源信号;其中,将信号
Figure FDA0003053862690000012
输入DNNls模型,DNNls模型表示声源s和第l个声音信号采集单元对应传输路径的DNN模型;训练得到DNNls模型的方法为:将第l个声音信号采集单元接收到的声音信号时域表示作为该DNN模型的输入,将声源s的声音信号时域表示作为该DNN模型的输出监督信息,训练得到该DNNls模型;时刻n扫描声源s的位置时DNNls模型输出的源信号
Figure FDA0003053862690000013
M为声音信号采集单元总数;
4)对于每一扫描位置,计算M个估计的源信号的互相关系数和;
5)重复步骤2)~4),当扫描完全部所述声源的位置后,分别计算出一互相关系数和;根据互相关系数和选取相关度最大值对应的声源位置作为估计的声源位置。
2.如权利要求1所述的方法,其特征在于,根据时刻n扫描声源s的位置时输出的M个估计的源信号,计算得到的声源s的互相关系数和为
Figure FDA0003053862690000014
其中,
Figure FDA0003053862690000015
是指信号
Figure FDA0003053862690000016
的互相关系数。
3.如权利要求1所述的方法,其特征在于,训练得到DNN模型的训练数据为实际采集的数据,即利用在设定位置播放声源信号,声音信号采集单元阵列采集所述声源信号。
4.如权利要求3所述的方法,其特征在于,所述声源信号为白噪声。
5.如权利要求1所述的方法,其特征在于,训练得到DNN模型的训练数据为仿真生成的数据。
6.如权利要求1~5任一所述的方法,其特征在于,所述声音信号采集单元为麦克风。
CN201711428934.5A 2017-12-26 2017-12-26 一种基于神经网络的声源定位方法 Active CN108318862B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711428934.5A CN108318862B (zh) 2017-12-26 2017-12-26 一种基于神经网络的声源定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711428934.5A CN108318862B (zh) 2017-12-26 2017-12-26 一种基于神经网络的声源定位方法

Publications (2)

Publication Number Publication Date
CN108318862A CN108318862A (zh) 2018-07-24
CN108318862B true CN108318862B (zh) 2021-08-20

Family

ID=62892558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711428934.5A Active CN108318862B (zh) 2017-12-26 2017-12-26 一种基于神经网络的声源定位方法

Country Status (1)

Country Link
CN (1) CN108318862B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109061567B (zh) * 2018-08-15 2022-08-09 广东海洋大学 多源环境下的语音精确定位方法
CN109839612B (zh) * 2018-08-31 2022-03-01 大象声科(深圳)科技有限公司 基于时频掩蔽和深度神经网络的声源方向估计方法及装置
CN109164415B (zh) * 2018-09-07 2022-09-16 东南大学 一种基于卷积神经网络的双耳声源定位方法
CN109782231B (zh) * 2019-01-17 2020-11-20 北京大学 一种基于多任务学习的端到端声源定位方法及系统
CN110068797B (zh) * 2019-04-23 2021-02-02 浙江大华技术股份有限公司 一种校准麦克风阵列的方法、声源定位方法及相关设备
CN110148419A (zh) * 2019-04-25 2019-08-20 南京邮电大学 基于深度学习的语音分离方法
CN110364161A (zh) 2019-08-22 2019-10-22 北京小米智能科技有限公司 响应语音信号的方法、电子设备、介质及系统
CN110515034B (zh) * 2019-08-26 2022-12-27 西安电子科技大学 一种声信号方位角测量系统及方法
CN110531313B (zh) * 2019-08-30 2021-05-28 西安交通大学 一种基于深度神经网络回归模型的近场信号源定位方法
CN111239687B (zh) * 2020-01-17 2021-12-14 浙江理工大学 一种基于深度神经网络的声源定位方法及系统
CN112731086A (zh) * 2021-01-19 2021-04-30 国网上海能源互联网研究院有限公司 一种用于对电力设备进行综合巡检的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008085472A (ja) * 2006-09-26 2008-04-10 Nagoya Institute Of Technology 音源定位・同定装置
CN103439688A (zh) * 2013-08-27 2013-12-11 大连理工大学 一种用于分布式麦克风阵列的声源定位系统及定位方法
CN103837859A (zh) * 2014-03-05 2014-06-04 湖州师范学院 一种采用混合蛙跳的小波神经网络来计算声发射源位置的方法
CN107219512A (zh) * 2017-03-29 2017-09-29 北京大学 一种基于声传递函数的声源定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008085472A (ja) * 2006-09-26 2008-04-10 Nagoya Institute Of Technology 音源定位・同定装置
CN103439688A (zh) * 2013-08-27 2013-12-11 大连理工大学 一种用于分布式麦克风阵列的声源定位系统及定位方法
CN103837859A (zh) * 2014-03-05 2014-06-04 湖州师范学院 一种采用混合蛙跳的小波神经网络来计算声发射源位置的方法
CN107219512A (zh) * 2017-03-29 2017-09-29 北京大学 一种基于声传递函数的声源定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Exploiting Deep Neural Networks and Head Movements for Robust Binaural Localization of Multiple Sources in Reverberant Environment";Ning Ma et al.;《IEEE/ACM Transactions on Audio,Speech and language Processing》;20171201;全文 *

Also Published As

Publication number Publication date
CN108318862A (zh) 2018-07-24

Similar Documents

Publication Publication Date Title
CN108318862B (zh) 一种基于神经网络的声源定位方法
CN109782231B (zh) 一种基于多任务学习的端到端声源定位方法及系统
CN110531313B (zh) 一种基于深度神经网络回归模型的近场信号源定位方法
CN106251877B (zh) 语音声源方向估计方法及装置
EP1600791B1 (en) Sound source localization based on binaural signals
CN100535992C (zh) 小尺度麦克风阵列语音增强系统和方法
He et al. Adaptation of multiple sound source localization neural networks with weak supervision and domain-adversarial training
CN111044973B (zh) 一种用于麦克风方阵的mvdr目标声源定向拾音方法
CN109490822B (zh) 基于ResNet的语音DOA估计方法
CN112712557B (zh) 一种基于卷积神经网络的超分辨率cir室内指纹定位方法
CN110444220B (zh) 一种多模态远程语音感知方法及装置
CN113314127B (zh) 基于空间方位的鸟鸣识别方法、系统、计算机设备与介质
CN107167770A (zh) 一种混响条件下的麦克风阵列声源定位装置
CN111693937A (zh) 一种基于稀疏重构的无需网格化的近场信号源定位方法
CN112394324A (zh) 一种基于麦克风阵列的远距离声源定位的方法及系统
CN116631438A (zh) 一种基于最小p范数的宽度学习及二次相关的声源定位方法
CN111859241B (zh) 一种基于声传递函数学习的非监督声源定向方法
Nie et al. Adaptive direction-of-arrival estimation using deep neural network in marine acoustic environment
Brendel et al. Distance estimation of acoustic sources using the coherent-to-diffuse power ratio based on distributed training
Talmon et al. Relative transfer function identification on manifolds for supervised GSC beamformers
CN111123202B (zh) 一种室内早期反射声定位方法及系统
CN115201753A (zh) 一种低功耗多频谱分辨的语音定位方法
CN113075645A (zh) 一种基于主成分分析-密度聚类的畸变阵形线谱增强方法
CN113030849A (zh) 一种基于自编码器与并行网络的近场源定位方法
Huang et al. A time-domain end-to-end method for sound source localization using multi-task learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant