CN108802687A - 混响房间内分布式麦克风阵列多声源定位方法 - Google Patents
混响房间内分布式麦克风阵列多声源定位方法 Download PDFInfo
- Publication number
- CN108802687A CN108802687A CN201810661741.2A CN201810661741A CN108802687A CN 108802687 A CN108802687 A CN 108802687A CN 201810661741 A CN201810661741 A CN 201810661741A CN 108802687 A CN108802687 A CN 108802687A
- Authority
- CN
- China
- Prior art keywords
- signal
- block
- sound source
- grid
- microphone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/22—Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种混响房间内分布式麦克风阵列多声源定位方法,主要解决混响房间内麦克风阵列声源数目总大于麦克风数目的问题,其主要实现步骤包括:(1)根据混响多声源信号传播及麦克风接收信号的特点构造压缩感知定位算法;(2)在已知房间尺寸和麦克风位置前提下,采用Image方法构造压缩观测矩阵;(3)使用块稀疏优化对本文提出的混响房间内欠定数量麦克风阵列多声源定位算法进行求解,得到空间中多个声源的位置及数目,本发明实现了混响房间内使用欠定数量的分布式麦克风阵列的多声源定位,不受阵型约束,相比目前具有实用价值的海量阵列,大大减小了阵列尺寸,从而减小硬件成本,同时也减小了计算负担。
Description
技术领域
本发明属于信号处理领域,更进一步涉及一种基于压缩感知的混响房间内分布式欠定数量麦克风阵列多声源定位方法及系统。
背景技术
随着通信行业的迅速发展,阵列信号处理成为一项研究热点。20世纪90年代以来,基于麦克风阵列的声源定位技术已在各个领域取得长足的进步与发展。比如在军事领域,声源定位技术可用于确定狙击手位置以及估计火炮发射位置等;在工业应用上,采用麦克风阵列声源定位技术对机械设备的故障进行定位;在安全监控方面,对于视频监控中存在的死角及视觉不佳的问题,声源定位技术可起到很好地补偿作用;在音/视频会议中,声源定位技术和语音增强技术的应用使与会者可在房间内自由走动而无需手动切换语音采集设备。然而,在像会议室这样的实际房间环境中,声源信号经房间墙壁、天花板、地面等的多次反射而形成房间混响。在混响条件下,常规的麦克风阵列声源定位算法,如基于高分辨率谱估计的定位算法或基于波达时延差的算法的定位性能显得颇为乏力,而基于最大输出功率的可控波束形成算法虽然抗混响能力较好,但在多声源情况下,这种算法须要克服初值敏感的问题,且为了提升定位精度,须以大量的麦克风阵列为代价。
一般多声源定位算法大致分两类:一是基于传统的多重信号分类的声源定位算法,二是基于盲源分离-声达时差方法的声源定位算法。如文献(宋宫琨琨.基于麦克风阵列的室内语音定位算法研究[D].南京信息工程大学,2016.)提出的一种基于一致聚焦变换最小二乘法的麦克风阵列双声源定位算法,运用基于一致聚焦变换最小二乘法的宽带信号MUSIC算法,对室内近场双声源进行定位。纵观整个麦克风阵列声源定位算法的特点,现有的麦克风阵列声源定位技术仍无法摆脱三角定位的限制,即使采用信道盲分离技术,可恢复的声源数目依然无法超过麦克风数量;欠定盲源分离方法虽然能解决声源数大于麦克风数量的问题,但目前只能处理相对线性瞬时混叠的情况,不能处理卷积混叠和非线性混叠的情况。所以目前具有实用价值的麦克风阵列系统大都是海量阵列,即麦克风数量至少超过声源数目。
压缩感知理论提出之后,被很多学者应用到阵列信号处理中,如文献(赵小燕,周琳,吴镇扬.基于压缩感知的麦克风阵列声源定位算法[J].东南大学学报 (自然科学版),2015,45(2):203-207.)提出了一种基于压缩感知的声源定位算法,实现了在混响环境下使用3个麦克风定位1个声源的定位算法。该算法假设3 个麦克风和说话人处于同一水平面,将声源可能存在的空间离散成36个位置 (0°,10°,…,350°),并以这36个位置的房间冲激响应来构建字典,再采用OMP 算法恢复出声源信号矢量,以矢量中最大元素对应空间位置作为实际声源的位置。文献(柯炜,张铭,张铁成.一种利用分布式传声器阵列的声源三维定位方法[J]. 声学学报,2017(3):361-369.)提出一种利用空间稀疏性和压缩感知原理的声源定位方法,该方法首先通过两次余弦变换提取声音信号特征,并用此特征构建稀疏定位模型,然后利用在线字典学习方法动态调整字典,克服稀疏模型与实际信号之间的失配问题,最后使用一种改进的平滑l0范数稀疏重构算法进行声源位置解算。
以上两种算法虽然都实现了混响环境下麦克风阵列的声源定位,但使用麦克风数量依然多于空间中的声源数量。在像会堂、礼堂这样的大型室内公共场所的混响环境中,要实现多声源定位和语音分离,就需要大量的麦克风阵列采集设备,这无疑增加了系统的计算负担和硬件成本。在类似手机、电脑这样的语音通信设备日益小型化的今天,大而笨重的硬件设施显然过时,在达到精确定位目标的前提下,我们更希望使用的硬件设备更小巧、便捷,在麦克风阵列声源定位系统中,减少阵列数量也是减小阵列尺寸的一条有效路径。
发明内容
为了解决现有多声源定位需要麦克风数量大于声源数目的问题,本发明提出如下技术方案:
一种混响房间内分布式麦克风阵列多声源定位方法,K个声源所在二维网格中的信号表示为S,其在空-频域的表达具有块稀疏性,S是块稀疏信号,该信号由M个麦克风接受到的观测信号X以及压缩观测矩阵恢复得到,S在空-频域的稀疏支撑集对应实际声源的数量和位置。
进一步的,使得二维网格中的信号S在空-频域的表达具有块稀疏性的方法是:假设K个声源同时分布于同一水平面,此水平面被划分成G个网格,声源数目远小于网格的数量,每个声源只占据一个网格,假设在时间观测窗内,声源位置不变,则每个网格信号的频域表示为Sg∈CF×1,g∈{1,...,G},将各网格的信号按列堆叠后,K个声源所在的整个二维网格信号的空-频域表达为其中CF×1表示F维度的尺度空间,CFG×1表示FG维度的尺度空间。
进一步的,块稀疏信号S在空-频域的稀疏支撑集对应着实际声源的数量与位置由下述实现:若二维网格中的某网格处不存在声源,则该网格处的信号在空 -频域的值为零,若某网格处存在声源,则该网格处的信号在空-频域会出现非零值,块稀疏信号S的稀疏支撑集对应实际声源的集合,即二维网格中,网格处的信号在空-频域出现非零值的块的数量与位置对应实际声源的数量与位置。
进一步的,所述由M个麦克风接收到的观测信号X及观测矩阵恢复得到块稀疏信号S的方法如下:由如下欠定线性方程组求解块稀疏信号S:
X=ΦS
其中:表示M个麦克风接收到的观测信号,Xm∈CF×1为第m个麦克风接收到的观测信号的频谱,Φ是压缩观测矩阵。
进一步的,所述的欠定线性方程组的具体公式表达为:
上式等号左侧第一项为M个麦克风接收到的观测信号在不同频点的值,是中每个麦克风接收到的信号取F个频点后的表示形式;等号右侧第一项为选取F个频点构造的压缩观测矩阵;等号右侧第二项为声源所在的二维网格中各个网格点信号在不同频点的频域表示,是块稀疏信号S在每个网格选取F个频点后按列堆叠而成的一维向量。
进一步的,对于个别麦克风坏掉的情况,则麦克风无法接收到观测信号,将所述的欠定线性方程组中的等式左侧第一项的对应项去掉,同时将观测矩阵中对应的行去掉。
进一步的,所述的压缩观测矩阵构造过程如下:
(1)生成全房间冲激响应:
假设房间为具有反射系数的多面墙构成的矩形封闭结构,且已知房间尺寸,构造房间中任意空间点声源到达某一位置麦克风的房间冲激响应,用Green函数表示为:
式中:f表示频率,τ为时延,μm和分别表示第m个麦克风的位置和第g个网格点的第r个虚声源的位置,ιr表示第r次反射的反射系数,R为总反射次数,S(f,τ)为频域的声源信号,α为衰减常数,在球面传播模型中α=1, c为声速;
(2)构造压缩观测矩阵:
根据任意空间点声源-麦克风的投影构造的F个频点的投影矩阵为:则所有网格点经由房间投影到第m个麦克风对应的压缩观测模板为:麦克风阵列对应的压缩观测模板为:Φ'=[Φ'1,…,Φ'M]T,将Φ'按列归一化后即得压缩观测矩阵Φ=[Φ1,...,ΦM]T。
进一步的,通过块稀疏优化算法求解欠定线性方程组得到信号S的估计块稀疏优化算法的具体步骤如下:
输入:压缩观测矩阵Φ;
麦克风观测信号X;
稀疏度k;
输出:重构信号是块稀疏信号S的估计;
以下步骤中:t为迭代次数,rt表示第t迭代的残差,j为压缩观测矩阵Φ的列序号的索引,Lt为第t迭代后的块索引集合,mean|·|表示元素绝对值的均值,为根据块索引集合Lt从Φ中挑选出的列构成的矩阵,为的伪逆矩阵;
step1:初始化:残差r0=X,迭代次数t=1,块索引集合
step2:求相关系数μ,μ(Lj)=ΦT[j]rt-1,选择与残差rt-1最匹配的k个块的索引集合:
step3:正则化:在上述索引集合Ljt对应的相关系数μ中,再次挑选出其能量介于最大能量与最大能量的一半之间的块的索引Li,即Li满足:
step4:更新块索引集合Lt=Lt-1∪Li;
step5:计算信号的估计:并更新残差
step6:当t≥k时,算法结束;反之,t=t+1,进入step2继续迭代;
则最后一次迭代得到即为块稀疏信号S的估计
进一步的,确定声源位置的方法如下:求解得块稀疏信号的估计后,先对维度为G×F的块稀疏信号的估计中的元素进行分块处理,每F个元素一组,当网格处存在声源时,其所对应的频点在块稀疏信号的估计的表达中出现非零值,则分散在网格中的各个声源的频点之于块稀疏信号的估计的表达呈现非零块结构,将非零块与网格对应,得声源的位置。
进一步的,确定声源数目的方法如下:求解得块稀疏信号的估计后,先对维度为G×F的块稀疏信号的估计中的元素进行分块处理,分别求解各组F个元素的l2范数,即有声源的网格对应的频点的非零值使得其l2范数也为非零值,计算分块后块稀疏信号的估计中非零l2范数的个数得声源的数目。
有益效果:
本发明提出一种混响房间内分布式麦克风阵列的多声源定位方法,该方法不受阵型约束,且能够克服三角定位的限制,使用欠定数量的麦克风阵列(麦克风数量少于声源数)就能对混响房间内的多个声源进行定位。
现有多声源定位算法中,麦克风数目不能少于声源数目;麦克风数量的增加不仅意味着算法的复杂度增加,硬件成本也将提高,本发明使用欠定数量的麦克风阵列实现对多个声源的同时定位,更符合语音通信设备小型化的趋势。
本发明的麦克风阵列不受阵型约束,可随意放置,适合分布式阵列;且麦克风数量增减不影响算法框架,只需简单增减压缩观测矩阵行数即可。
附图说明
图1为本发明实现的基本流程图。
图2为本发明模拟多个声源同时位于房间的不同位置时的定位仿真图;
其中:(a)4个声源位于房间右上角,(b)5个声源同时分布于房间左上角左下角和右上角,(c)5个声源同时分布在房间左上角、右上角、右下角(d)6个声源同时位于房间左上角,(e)7个麦克风同时分布在房间右上角和左下角,(f)8个麦克风同时分布在房间中间。
图3为本发明在不同混响时间下的定位成功率直方图。
图4为本发明在不同频点数时的定位成功率直方图。
图5为本发明在声源数目增加时的声源定位成功率折线图。
图6为本发明方法与其他传统方法的定位对比图。
具体实施方式
为了使本发明的技术内容、特征等更加明显易懂,下面结合图1对本发明的实现步骤做出说明,简要的说,本发明混响房间内分布式麦克风阵列多声源定位方法,可以由软件实现,主要涉及下述步骤:
(1)首先确定房间尺寸,即分别获取房间的长、宽、高数值,同时确定麦克风阵列的位置,均以米为单位。
(2)构造房间冲激响应,生成压缩观测矩阵。
(3)多声源信号、压缩观测矩阵以及麦克风观测数据三者之间的关系由欠定线性方程组所示,此为本发明提出的混响多声源定位算法模型。
(4)麦克风观测数据为已知量,计算压缩观测矩阵,采用块稀疏优化算法求得声源信号的估计,对该估计信号进行整合,将非零块的位置与空间网格对应,即可得出声源和数目。
对上述技术方案作出详细说明如下:
根据混响多声源信号传播及麦克风接收信号的特点构造压缩感知定位算法;在已知房间尺寸和麦克风位置前提下,采用Image方法构造压缩观测矩阵;使用块稀疏优化对本发明提出的混响房间内欠定数量麦克风阵列多声源定位算法进行求解,得到空间中各个声源的位置及数目。具体步骤如下:
1.构造压缩感知混响多声源定位算法
1a)混响多声源传播模型描述
室内混响环境下,声源数目未知的多声源多信道的时域传播模型为:
其中xm表示第m个麦克风接收的信号,sn(t)表示第n个声源信号,hmn(t)表示第 n个声源与第m个麦克风之间的信道,亦称为第n个声源与第m个麦克风之间的房间冲激响应,*为卷积符号,M为麦克风的数量。经短时傅里叶变换得:
1b)混响多声源空-频域块稀疏表达
考虑K个声源同时分布于同一水平面,即房间的俯视面,此平面被划分成G 个网格,声源数目远小于网格的数量,即K<<G(一般G与K的比值大于一个数量级即可),且网格足够密,以使每个声源只占据一个网格。假设在时间观测窗内,声源位置不变。为便于推导,框架构造时将该二维网格按列排列成一维向量(本框架同样适用于三维网格,只有计算量上的差别),在每个网格g处取F个频点,则每个网格信号的频域表示为Sg∈CF×1,g∈{1,...,G},多个声源所在的整个二维网格信号的空-频域表达为则分散在网格上的声源之于整个二维网格而言,其在S的表达中呈现块的结构特点,且K<<G,使S的表达也具有稀疏性,即信号S在空-频域的表达具有块稀疏性。若某网格处不存在声源,则该处的信号在空-频域的值为零,反之,该处的信号在空-频域会出现非零值。声源数目K远小于网格数量G,所以对于S而言,其在空-频域的表达具有块稀疏性,故也称S为块稀疏信号,其稀疏支撑集(非零块)对应实际声源,其中CF×1表示F维度的尺度空间,CFG×1表示FG维度的尺度空间。
1c)压缩感知多声源定位算法
假设房间内有M个麦克风,且M<K,将这M个麦克风接收到的观测信号表示为其中Xm∈CF×1为第m个麦克风接收信号的频谱,且M<<G,则X可看做块稀疏信号S在房间冲激响应的压缩作用下的压缩观测,即X=ΦS,Φ代表房间声源经由房间作用在麦克风上的投影,也称压缩观测矩阵。如上1b)所述,块稀疏信号S在空-频域的稀疏支撑集(非零块)对应着实际的声源,故从麦克风阵列的观测数据X中恢复此块稀疏信号S是本发明中对多声源进行定位的关键,从而将本发明的混响多声源定位问题描述为求解如下的欠定线性方程组问题:
上式欠定线性方程组等式左边的项表示M个麦克风接收的信号在不同频点的值。其等式右边第一项为从房间的每个网格点到各麦克风的投影(房间冲激响应)中,各选取F个频点构造的压缩观测矩阵,其具体构造过程参见下述2构造压缩观测矩阵部分,等式右边第二项为声源所在的整个平面网格中各个网格点信号的频域表示。理论上有声源的网格对应的频点有非零值,无声源的网格的所有频点对应的值为零,即声源和S中的非零块存在一一对应关系,如1b)所述,块稀疏信号S是由房间内的各网格处的频点值按列堆叠而成的一维向量,因此通过确定非零块在S中的位置和数目便可获得空间中声源的位置和数目估计。
另外,本发明的多声源定位系统同样适用于个别麦克风坏掉的情况,此时只需将上式中等式左边对应的项去掉,同时将观测矩阵中对应的行去掉,等式右边第二项不做改变。所以当有麦克风坏掉时,无需调整阵列结构,也无需改变定位模型,依然可以使用本发明实现多声源定位。
2.构造压缩观测矩阵
2a)生成全房间冲激响应
假设房间为具有反射系数的多面墙构成的矩形封闭结构,且已知房间尺寸,使用Image方法(镜像法)构造房间中任意空间点声源(位置Vg)到达某一位置麦克风(位置μm)的房间冲激响应,用Green函数表示为:
式中f表示频率,τ为时延,μm和分别表示第m个麦克风的位置和第g个网格点的第r个虚声源的位置,ιr表示第r次反射的反射系数,R为总反射次数,α为衰减常数,在球面传播模型中α=1,c为声速。
2b)构造压缩观测矩阵
采用2a)中的声源-麦克风投影构造F个频点的投影矩阵为:则所有网格点经由房间投影到第m个麦克风对应的压缩观测模板为:所以麦克风阵列对应的压缩观测模板为:Φ'=[Φ'1,…,Φ'M]T,将Φ'按列归一化后得压缩观测矩阵Φ=[Φ1,...,ΦM]T。
3.使用块稀疏优化算法求解声源位置和数目
3a)采用块稀疏优化算法恢复声源信号
如1c)所述,要确定声源的位置和数目,就得先通过求解1c)中的欠定线性方程组得到信号S的估计等式左边麦克风的观测数据X的维数M×F远小于信号的维数G×F,普通的稀疏求解方法对于求解这样的方程组无能为力。但如1b) 所述,信号S具有块稀疏性,所以,我们采用块稀疏优化算法中的正则化块正交匹配追踪(Regularized GroupOrthogonal Matching Pursuit,ReGOMP)算法来求解这样具有块稀疏的方程组,该算法的具体步骤如下:
输入:压缩观测矩阵Φ;
麦克风观测信号X;
稀疏度k;
输出:重构信号是块稀疏信号S的估计;
以下步骤中:t为迭代次数,rt表示第t迭代的残差,j为压缩观测矩阵Φ的列序号的索引,Lt为第t迭代后的块索引集合,mean|·|表示元素绝对值的均值,为根据块索引集合Lt从Φ中挑选出的列构成的矩阵,为的伪逆矩阵。
step1:初始化:残差r0=X,迭代次数t=1,块索引集合
step2:求相关系数μ,μ(Lj)=ΦT[j]rt-1,选择与残差rt-1最匹配的k个块的索引集合:
step3:正则化:在上述索引集合Ljt对应的相关系数μ中,再次挑选出其能量介于最大能量与最大能量的一半之间的块的索引Li,即Li满足:
step4:更新块索引集合Lt=Lt-1∪Li;
step5:计算信号的估计:并更新残差
step6:当t≥k时,算法结束;反之,t=t+1,进入step2继续迭代;
则最后一次迭代得到即为1c)中方程组右边第二项中的块稀疏信号S估计
3b)确定声源位置和数目
步骤3a)采用块稀疏优化算法求解出块稀疏信号的估计为了确定声源的位置和数目,须先对维度为G×F的信号中的元素进行分块处理。每F个元素一组,并分别求各组F个元素的l2范数,即如1b)所述,网格处如果存在声源,则此处的F个频点值会出现非零值,其l2范数自然也为非零值,反之,若网格处不存在声源,则这F个频点值的l2范数为零值,这样的分组使得呈现块结构;如1c)所述,的稀疏支撑集(非零块)与房间的实际声源之间存在一一对应的关系,且S是由房间网格按列堆叠而成的,则理论上,在中按照同样的顺序去对应网格,非零块的位置就会对应声源在网格中的位置。依据前面的方法分块后,非零块(非零的l2范数值,即的数目就是声源的数目。该方法可在混响房间内使用少于声源数目的麦克风阵列同时定位多个声源,通过减少麦克风数量减少计算量,也减小声源定位系统的硬件成本,对于体积受限和实时性要求较高的语音通信设备而言极具吸引力。
本发明的效果可通过以下仿真进一步说明:
仿真条件:本发明在一个长、宽、高分别为3.3m,4.4m,2.5m的矩形混响房间使用两个全向麦克风进行定位性能验证。分别以0.3m和0.4m为间隔将房间二维平面划分为10×10的网格,两个麦克风位置坐标分别为[1.6,1.6,1.7]和[1.4,1.9,1.7], 声源与麦克风阵列处于同一水平面,采样频率Fs=16kHZ,声速c=343m/s,墙壁反射系数均为0.7,采用Image方法产生的全房间冲激响应长度约为2500点左右,统一截取前1000个频点的值,在频域进行2048点的傅里叶变换,并等间隔选取 F个频点构造压缩观测矩阵。
仿真内容:
仿真1,对不同声源同时位于房间不同位置时本发明的定位情况进行模拟。混响时间0.3s,频点数F为60;图2(a-f)中*为声源所在位置,o则代表采用本发明估计的声源位置,Δ表示两个麦克风所在位置。
从图2(a-f)中可以看出,对于混响房间内不同位置的4~8个声源,仅使用两个麦克风就能对其进行定位,效果可观。
仿真2,混响时间RT60分别取0.2s,0.3s,0.4s,0.5s,0.6s,等间隔取F=40 个频点构造压缩观测矩阵,采用本发明进行多声源定位,测试混响时间对本发明的定位成功率的影响。图3的直方图验证了本发明的抗混响性能。
仿真4,混响时间RT60=0.3s,频点数F分别取20、40、60、80、100、120,测试频点数与本发明的定位成功率的关系,如图4,可见总体而言,定位成功率随频点数的增加而增加,但当超出一定范围时,这种增加的趋势渐渐缓和。
仿真5,混响时间RT60=0.3s,频点数为F=60,可定位的声源数目分别为3, 4,5,6,7时本发明的定位成功率如图5,可见对于声源数目为3和4的情况,本发明的定位结果是可以接受的,因为本发明仅使用2个麦克风进行多声源定位,所以对于更多声源的情况,本发明中未能取得很好的效果,但足以说明本发明使用欠定数量的麦克风进行多声源定位的潜力。
仿真6,混响时间RT60=0.3s,频点数为F=60,将本发明在混响条件下对多声源的定位情况分别与基于时延差的定位算法、基于高分辨率谱估计的定位算法以及基于最大输出功率的可控波束形成算法进行对比,结果如图6。可见对于混响房间中随机放置的3个声源,本发明的定位算法可精确定位出其位置,而其他三种算法受混响等影响较大或其他原因,不能精确定位出声源位置,甚至有漏定位的情况。
综上所述,本发明的声源定位系统使用少于声源数量的麦克风不仅能进行更精确的混响多声源定位;同时麦克风数量的减少降低了算法的计算量,在实际应用中硬件成本也随之减少;本发明具有分布式麦克风的特性,不受阵型约束,应用更灵活,且适用于个别麦克风坏掉的情况;与其他算法相比,抗混响能力更好。
以上所述,仅为本发明创造较佳的具体实施方式,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。
Claims (10)
1.一种混响房间内分布式麦克风阵列多声源定位方法,其特征在于:K个声源所在二维网格中的信号表示为S,其在空-频域的表达具有块稀疏性,S是块稀疏信号,该信号由M个麦克风接受到的观测信号X以及压缩观测矩阵恢复得到,S在空-频域的稀疏支撑集对应实际声源的数量和位置。
2.如权利要求1所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:使得二维网格中的信号S在空-频域的表达具有块稀疏性的方法是:假设K个声源同时分布于同一水平面,此水平面被划分成G个网格,声源数目远小于网格的数量,每个声源只占据一个网格,假设在时间观测窗内,声源位置不变,则每个网格信号的频域表示为Sg∈CF×1,g∈{1,...,G},将各网格的信号按列堆叠后,K个声源所在的整个二维网格信号的空-频域表达为其中CF×1表示F维度的尺度空间,CFG×1表示FG维度的尺度空间。
3.如权利要求1和2所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:块稀疏信号S在空-频域的稀疏支撑集对应着实际声源的数量与位置由下述实现:若二维网格中的某网格处不存在声源,则该网格处的信号在空-频域的值为零,若某网格处存在声源,则该网格处的信号在空-频域会出现非零值,块稀疏信号S的稀疏支撑集对应实际声源的集合,即二维网格中,网格处的信号在空-频域出现非零值的块的数量与位置对应实际声源的数量与位置。
4.如权利要1所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:所述由M个麦克风接收到的观测信号X及观测矩阵恢复得到块稀疏信号S的方法如下:由如下欠定线性方程组求解块稀疏信号S:
X=ΦS
其中:表示M个麦克风接收到的观测信号,Xm∈CF×1为第m个麦克风接收到的观测信号的频谱,Φ是压缩观测矩阵。
5.如权利要4所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:所述的欠定线性方程组的具体公式表达为:
上式等号左侧第一项为M个麦克风接收到的观测信号在不同频点的值,是中每个麦克风接收到的信号取F个频点后的表示形式;等号右侧第一项为选取F个频点构造的压缩观测矩阵;等号右侧第二项为声源所在的二维网格中各个网格点信号在不同频点的频域表示,是块稀疏信号S在每个网格选取F个频点后按列堆叠而成的一维向量。
6.如权利要5所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:对于个别麦克风坏掉的情况,则麦克风无法接收到观测信号,将所述的欠定线性方程组中的等式左侧第一项的对应项去掉,同时将观测矩阵中对应的行去掉。
7.如权利要1或5所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:所述的压缩观测矩阵构造过程如下:
(1)生成全房间冲激响应:
假设房间为具有反射系数的多面墙构成的矩形封闭结构,且已知房间尺寸,构造房间中任意空间点声源到达某一位置麦克风的房间冲激响应,用Green函数表示为:
式中:f表示频率,τ为时延,μm和分别表示第m个麦克风的位置和第g个网格点的第r个虚声源的位置,ιr表示第r次反射的反射系数,R为总反射次数,S(f,τ)为频域的声源信号,α为衰减常数,在球面传播模型中α=1,c为声速;
(2)构造压缩观测矩阵:
根据任意空间点声源-麦克风的投影构造的F个频点的投影矩阵为:则所有网格点经由房间投影到第m个麦克风对应的压缩观测模板为:麦克风阵列对应的压缩观测模板为:Φ'=[Φ'1,…,Φ'M]T,将Φ'按列归一化后即得压缩观测矩阵Φ=[Φ1,...,ΦM]T。
8.如权利要求5所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:通过块稀疏优化算法求解欠定线性方程组得到信号S的估计块稀疏优化算法的具体步骤如下:
输入:压缩观测矩阵Φ;
麦克风观测信号X;
稀疏度k;
输出:重构信号是块稀疏信号S的估计;
以下步骤中:t为迭代次数,rt表示第t迭代的残差,j为压缩观测矩阵Φ的列序号的索引,Lt为第t迭代后的块索引集合,mean|·|表示元素绝对值的均值,为根据块索引集合Lt从Φ中挑选出的列构成的矩阵,为的伪逆矩阵;
step1:初始化:残差r0=X,迭代次数t=1,块索引集合
step2:求相关系数μ,μ(Lj)=ΦT[j]rt-1,选择与残差rt-1最匹配的k个块的索引集合:
step3:正则化:在上述索引集合Ljt对应的相关系数μ中,再次挑选出其能量介于最大能量与最大能量的一半之间的块的索引Li,即Li满足:
step4:更新块索引集合Lt=Lt-1∪Li;
step5:计算信号的估计:并更新残差
step6:当t≥k时,算法结束;反之,t=t+1,进入step2继续迭代;
则最后一次迭代得到即为块稀疏信号S的估计
9.如权利要求8所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:
确定声源位置的方法如下:求解得块稀疏信号的估计后,先对维度为G×F的块稀疏信号的估计中的元素进行分块处理,每F个元素一组,当网格处存在声源时,其所对应的频点在块稀疏信号的估计的表达中出现非零值,则分散在网格中的各个声源的频点之于块稀疏信号的估计的表达呈现非零块结构,将非零块与网格对应,得声源的位置。
10.如权利要求8所述的混响房间内分布式麦克风阵列多声源定位方法,其特征在于:确定声源数目的方法如下:求解得块稀疏信号的估计后,先对维度为G×F的块稀疏信号的估计中的元素进行分块处理,分别求解各组F个元素的l2范数,即有声源的网格对应的频点的非零值使得其l2范数也为非零值,计算分块后块稀疏信号的估计中非零l2范数的个数得声源的数目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810661741.2A CN108802687A (zh) | 2018-06-25 | 2018-06-25 | 混响房间内分布式麦克风阵列多声源定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810661741.2A CN108802687A (zh) | 2018-06-25 | 2018-06-25 | 混响房间内分布式麦克风阵列多声源定位方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108802687A true CN108802687A (zh) | 2018-11-13 |
Family
ID=64071058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810661741.2A Pending CN108802687A (zh) | 2018-06-25 | 2018-06-25 | 混响房间内分布式麦克风阵列多声源定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108802687A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110068797A (zh) * | 2019-04-23 | 2019-07-30 | 浙江大华技术股份有限公司 | 一种校准麦克风阵列的方法、声源定位方法及相关设备 |
CN110992977A (zh) * | 2019-12-03 | 2020-04-10 | 北京声智科技有限公司 | 一种目标声源的提取方法及装置 |
CN111239690A (zh) * | 2020-03-02 | 2020-06-05 | 广东电网有限责任公司电力科学研究院 | 一种用于球面传声器阵列的噪声源识别方法及相关装置 |
CN112259117A (zh) * | 2020-09-28 | 2021-01-22 | 上海声瀚信息科技有限公司 | 一种目标声源锁定和提取的方法 |
CN115273795A (zh) * | 2022-06-22 | 2022-11-01 | 腾讯科技(深圳)有限公司 | 模拟冲激响应的生成方法、装置和计算机设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101644774A (zh) * | 2009-07-07 | 2010-02-10 | 中国科学院声学研究所 | 一种基于线性规划的近场目标定位方法及其系统 |
US20100082302A1 (en) * | 2008-09-26 | 2010-04-01 | Qualcomm Incorporated | Method and apparatus for under-sampled acquisition and transmission of photoplethysmograph (ppg) data and reconstruction of full band ppg data at the receiver |
CN102081928A (zh) * | 2010-11-24 | 2011-06-01 | 南京邮电大学 | 基于压缩感知和k-svd的单通道混合语音分离方法 |
CN102891684A (zh) * | 2012-10-10 | 2013-01-23 | 南京邮电大学 | 一种压缩感知含噪重构系统的构建方法 |
CN103093431A (zh) * | 2013-01-25 | 2013-05-08 | 西安电子科技大学 | 基于pca字典和结构先验信息的压缩感知重构方法 |
CN103476040A (zh) * | 2013-09-24 | 2013-12-25 | 重庆邮电大学 | 带有隐私保护的分布式压缩感知数据融合方法 |
CN105391879A (zh) * | 2015-12-09 | 2016-03-09 | 天津大学 | 一种无回声残留双端通话鲁棒的声学回声消除方法 |
CN105866740A (zh) * | 2016-05-23 | 2016-08-17 | 江苏科技大学 | 一种基于压缩感知的水声匹配场定位方法 |
CN106598052A (zh) * | 2016-12-14 | 2017-04-26 | 南京阿凡达机器人科技有限公司 | 一种基于环境地图的机器人安防巡检方法及其机器人 |
-
2018
- 2018-06-25 CN CN201810661741.2A patent/CN108802687A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100082302A1 (en) * | 2008-09-26 | 2010-04-01 | Qualcomm Incorporated | Method and apparatus for under-sampled acquisition and transmission of photoplethysmograph (ppg) data and reconstruction of full band ppg data at the receiver |
CN101644774A (zh) * | 2009-07-07 | 2010-02-10 | 中国科学院声学研究所 | 一种基于线性规划的近场目标定位方法及其系统 |
CN102081928A (zh) * | 2010-11-24 | 2011-06-01 | 南京邮电大学 | 基于压缩感知和k-svd的单通道混合语音分离方法 |
CN102891684A (zh) * | 2012-10-10 | 2013-01-23 | 南京邮电大学 | 一种压缩感知含噪重构系统的构建方法 |
CN103093431A (zh) * | 2013-01-25 | 2013-05-08 | 西安电子科技大学 | 基于pca字典和结构先验信息的压缩感知重构方法 |
CN103476040A (zh) * | 2013-09-24 | 2013-12-25 | 重庆邮电大学 | 带有隐私保护的分布式压缩感知数据融合方法 |
CN105391879A (zh) * | 2015-12-09 | 2016-03-09 | 天津大学 | 一种无回声残留双端通话鲁棒的声学回声消除方法 |
CN105866740A (zh) * | 2016-05-23 | 2016-08-17 | 江苏科技大学 | 一种基于压缩感知的水声匹配场定位方法 |
CN106598052A (zh) * | 2016-12-14 | 2017-04-26 | 南京阿凡达机器人科技有限公司 | 一种基于环境地图的机器人安防巡检方法及其机器人 |
Non-Patent Citations (9)
Title |
---|
A. MAJUMDAR: "FAST GROUP SPARSE CLASSIFICATION", 《2009 IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS AND SIGNAL PROCESSING》 * |
AFSANEH ASAEI: "MODEL-BASED COMPRESSIVE SENSING FOR MULTI-PARTY DISTANT SPEECH RECOGNITION", 《2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 * |
AFSANEH ASAEI: "MODEL-BASED SPARSE COMPONENT ANALYSIS FOR MULTIPARTY DISTANT SPEECH RECOGNITION", 《EPFL》 * |
宁方立 卫金刚 刘 勇 石旭东: "压缩感知声源定位方法研究", 《机械工程学报》 * |
庄燕滨: "分块正则化正交匹配追踪算法", 《信息技术》 * |
王刚 等: "《矿山物联网安全感知与预警技术》", 31 October 2017 * |
许华杰,何敬禄,胡小明: "基于块稀疏度估计的压缩感知自适应重构算法", 《计算机应用研究》 * |
赵小燕,周琳,吴镇扬: "基于压缩感知的麦克风阵列声源定位算法", 《东南大学学报》 * |
闫敬文 等: "《压缩感知及应用》", 31 October 2015 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110068797A (zh) * | 2019-04-23 | 2019-07-30 | 浙江大华技术股份有限公司 | 一种校准麦克风阵列的方法、声源定位方法及相关设备 |
CN110992977A (zh) * | 2019-12-03 | 2020-04-10 | 北京声智科技有限公司 | 一种目标声源的提取方法及装置 |
CN110992977B (zh) * | 2019-12-03 | 2021-06-22 | 北京声智科技有限公司 | 一种目标声源的提取方法及装置 |
CN111239690A (zh) * | 2020-03-02 | 2020-06-05 | 广东电网有限责任公司电力科学研究院 | 一种用于球面传声器阵列的噪声源识别方法及相关装置 |
CN112259117A (zh) * | 2020-09-28 | 2021-01-22 | 上海声瀚信息科技有限公司 | 一种目标声源锁定和提取的方法 |
CN112259117B (zh) * | 2020-09-28 | 2024-05-14 | 上海声瀚信息科技有限公司 | 一种目标声源锁定和提取的方法 |
CN115273795A (zh) * | 2022-06-22 | 2022-11-01 | 腾讯科技(深圳)有限公司 | 模拟冲激响应的生成方法、装置和计算机设备 |
CN115273795B (zh) * | 2022-06-22 | 2024-06-25 | 腾讯科技(深圳)有限公司 | 模拟冲激响应的生成方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108828525A (zh) | 混响房间内分布式麦克风阵列多声源定位系统 | |
CN108802687A (zh) | 混响房间内分布式麦克风阵列多声源定位方法 | |
CN105068048B (zh) | 基于空间稀疏性的分布式麦克风阵列声源定位方法 | |
TWI556654B (zh) | 用以推衍方向性資訊之裝置與方法和系統 | |
US20150057083A1 (en) | Methods, systems, and computer readable media for simulating sound propagation in large scenes using equivalent sources | |
US10932081B1 (en) | Bidirectional propagation of sound | |
CN107167770B (zh) | 一种混响条件下的麦克风阵列声源定位装置 | |
CN109001681A (zh) | 多声源定位中构造压缩观测矩阵的方法 | |
Simón-Gálvez et al. | The effect of reverberation on personal audio devices | |
Pezzoli et al. | Implicit neural representation with physics-informed neural networks for the reconstruction of the early part of room impulse responses | |
Foy et al. | Mean absorption estimation from room impulse responses using virtually supervised learning | |
Salvati et al. | Sound source and microphone localization from acoustic impulse responses | |
CN109001680A (zh) | 声源定位中的块稀疏优化算法 | |
CN108828526A (zh) | 多声源定位中二维网格中的信号s在空-频域的表达具有块稀疏性的方法 | |
Chen et al. | Sound field estimation around a rigid sphere with physics-informed neural network | |
Perez et al. | Machine-learning-based estimation of reverberation time using room geometry for room effect rendering | |
US20240244390A1 (en) | Audio signal processing method and apparatus, and computer device | |
Wan et al. | Improved steered response power method for sound source localization based on principal eigenvector | |
Zhong et al. | Spherical convolutional recurrent neural network for real-time sound source tracking | |
Georgiou et al. | Incorporating directivity in the Fourier pseudospectral time-domain method using spherical harmonics | |
Damiano et al. | A Compressive Sensing Approach for the Reconstruction of the Soundfield Produced by Directive Sources in Reverberant Rooms | |
CN109031203A (zh) | 混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法 | |
Pertilä | Acoustic source localization in a room environment and at moderate distances | |
Bianchi et al. | High resolution imaging of acoustic reflections with spherical microphone arrays | |
Gonzalez et al. | Spherical decomposition of arbitrary scattering geometries for virtual acoustic environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181113 |
|
RJ01 | Rejection of invention patent application after publication |