CN109490833B - 一种改进型传播矩阵的gcc逆模型快速声源识别方法 - Google Patents

一种改进型传播矩阵的gcc逆模型快速声源识别方法 Download PDF

Info

Publication number
CN109490833B
CN109490833B CN201811273431.XA CN201811273431A CN109490833B CN 109490833 B CN109490833 B CN 109490833B CN 201811273431 A CN201811273431 A CN 201811273431A CN 109490833 B CN109490833 B CN 109490833B
Authority
CN
China
Prior art keywords
sound source
gcc
matrix
inverse model
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811273431.XA
Other languages
English (en)
Other versions
CN109490833A (zh
Inventor
褚志刚
翁靖
杨洋
张永祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201811273431.XA priority Critical patent/CN109490833B/zh
Publication of CN109490833A publication Critical patent/CN109490833A/zh
Application granted granted Critical
Publication of CN109490833B publication Critical patent/CN109490833B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/22Position of source determined by co-ordinating a plurality of position lines defined by path-difference measurements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种改进型传播矩阵的GCC逆模型快速声源识别方法,它包括:骤1、建立GCC逆模型;步骤2、改进型传播矩阵求解:
Figure DDA0001846463680000011
M为麦克风总数,i代表第i号麦克风,k代表第k号麦克风,Δtki,n为声音从网格点n传播到麦克风对(i,k)的时间差,Δtki,l为声音从网格点l传播到麦克风对(i,k)的时间差,w是声源的圆频率,wmax为上限频率;步骤3、GCC逆模型求解,重构声源强度分布并成像。本发明解决了现有传播矩阵对时间阈值的依赖性和对实验配置的单一适应性,能自动随实验配置相应变化,表现出有很好的自适应性。

Description

一种改进型传播矩阵的GCC逆模型快速声源识别方法
技术领域
本发明属于声场识别技术领域,具体涉及一种GCC逆模型快速声源识别方法。
背景技术
基于麦克风阵列信号处理的时域波束形成在宽带声源识别领域占据不可缺少的地位,常用的方法之一是GCC逆模型算法。该算法在GCC成像结果和理论噪声图像之间建立线性逆模型,通过最小化两者之差获取高空间分辨率的声源识别结果,GCC逆模型算法的关键是求取用于建立逆模型的传播矩阵。现有方法中,该矩阵的求解过程中需要人为设定时间阈值。由于该时间阈值对声源识别结果相当敏感,且该阈值随不同的实验配置而变化,进而使得求解的传播矩阵不具有自适应性,因此实际应用中对最佳时间阈值的选择存在困难。
发明内容
针对现有技术存在的问题,本发明所要解决的技术问题就是提供一种改进型传播矩阵的GCC逆模型快速声源识别方法,它能避免矩阵求解过程中设置时间阈值,自适应不同实验配置,通过该矩阵建立GCC逆模型,在时域下快速获得高分辨率的宽带噪声图像。
本发明所要解决的技术问题是通过这样的技术方案实现的,它包括以下步骤:
步骤1、建立GCC逆模型
采用Combo阵列波束形成的坐标系,x中任意位置声源的相对能量辐射到b中的每一个位置,存在一个传播矩阵A∈RN×N,则:b=Ax
列向量b∈RN×1为N个网格点的计算得到的相对能量输出,x∈RN×1为点声源在N个网格点上的真实相对能量分布;A的矩阵形式为:
Figure BDA0001846463660000011
矩阵元素an,l中,n、l为网格上任意两个点,N为网格点总数;
在真实声源数量少于网格点数和存在噪声干扰的条件下,则该式的稀疏解为:
Figure BDA0001846463660000021
x是稀疏解,σ为干扰的二范数,||·||1、||·||2分别是矩阵或向量的一范数和二范数,s.t.代表约束条件;
步骤2、改进型传播矩阵求解
Figure BDA0001846463660000022
式中,M为麦克风总数,i代表第i号麦克风,k代表第k号麦克风,Δtki,n为声音从网格点n传播到麦克风对(i,k)的时间差,Δtki,l为声音从网格点l传播到麦克风对(i,k)的时间差,w是声源的圆频率,wmax为上限频率;
步骤3、GCC逆模型求解,重构声源强度分布并成像。
本发明的技术效果是:
本方法发明在等强度源、不等强度源、和相干源等条件下均可清晰化声源图像,准确定位声源位置,有效抑旁瓣鬼影的产生,改进型传播矩阵在GCC逆模型声源识别中性能优越;本发明的改进型传播矩阵解决了现有传播矩阵对时间阈值的依赖性和对实验配置的单一适应性,能自动随实验配置相应变化,表现出有很好的自适应性。
附图说明
本发明的附图说明如下:
图1为Combo阵列波束构成的坐标系;
图2为现有传播矩阵的时间阈值影响声源识别的测试图;
图3为现有传播矩阵时间阈值对不同实验配置适应性的测试图;
图4为仿真改进型传播矩阵对不同声源模式识别的效果图;
图5为验证试验的布局图;
图6为不同位置处扬声器声源的试验识别成像图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
本发明包括以下步骤:
步骤1、建立GCC逆模型
本实施例采用图1所示Combo阵列波束形成的坐标系,图1中,“*”所在的平面为网格平面,“+”是声源位置,声源处于网格点上,原点位于阵列中心,用实心·表示,空心o代表传声器位置,麦克风总数M为36,假设声源位于网格点上,N为网格点总数,n=1,2,,N为网格点索引,网格点l处有一单极子源,任意网格点n处得到GCC波束形成输出:
Figure BDA0001846463660000031
式(1)中,i代表第i号麦克风,k代表第k号麦克风,Δtki,n为声音从网格点n传播到麦克风对(i,k)的时间差,w是声源的圆频率,Cik(w)为麦克风对接收声压的互功率谱,j为虚数单位,W(w)是频率加权函数。本发明基于PHAT加权推导,故选用PHAT加权:
Figure BDA0001846463660000032
式(2)中,|·|表示取模。
将N个网格点的相对能量输出排列为一个列向量b∈RN×1,而点声源在N个网格点上的真实相对能量分布为x∈RN×1(这里是假设每个网格点是一个点声源,如果该点不存在声源,x中对应元素值为0,也就是稀疏约束),x中任一位置的相对能量可辐射到b中的每一个位置,可将该系统考虑成一个线性系统,则存在一个传播模型矩阵(简称传播矩阵)A∈RN×N,使下式成立:
b=Ax (3)
考虑到真实声源数量少于网格点数和存在噪声干扰,则(3)式的解x是稀疏的,即可变换到下式:
Figure BDA0001846463660000033
式(4)中,x是稀疏解,σ为干扰的二范数,||·||1、||·||2分别是矩阵或向量的一范数和二范数,s.t.代表约束条件。
式(3)和式(4)为GCC逆模型。
式(4)是一个L1范数最小化问题,可采用贪婪算法和迭代收缩算法求解,但其关键是传播矩阵A的求取。现有方法中,A只与声速、扫描网格点的位置和麦克风的位置有关,A的矩阵形式为:
Figure BDA0001846463660000041
式(5)中,an,l由下式求得:
Figure BDA0001846463660000042
式(6)中,ε为时间阈值,但现有方法未给出ε的选取方法。
通过大量仿真结果,总结出本实施例实验配置对应的最优εop,选取不同ε=βεop,β=0,0.5,1,1.5,2获取声源识别结果,如图2所示,采用不同阈值的识别结果表现出很大差异性,说明该值对声源识别结果相当敏感,严重时会造成识别混乱。
本实施例仿真了εop对不同实验配置的适用性,如图3所示:图3a显示了εop(识别距离1m)对于1m识别距离的识别结果,图3b展示了εop(识别距离1m)对于2m识别距离的识别结果,图3c展示了εop(识别距离2m)对于2m识别距离的识别结果,图3d展示了εop(识别距离2m)对于1m识别距离的识别结果。从图3看出:单个εop仅适应对应的实验配置,而对其他实验配置达不到最优效果,进而导致所求传播矩阵不具备自适应性。
为解决上述问题,本发明采用以下步骤。
步骤2、改进型传播矩阵求解
式(3)是一个线性系统,能量映射关系可以采用下式表示:
Figure BDA0001846463660000051
为了与现有的传播矩阵A区别,改进型传播矩阵用
Figure BDA0001846463660000052
表示。
本发明采用PHAT加权,消除互谱的幅值信息,仅保留相位信息。因此这里得到的波束形成输出b只能代表点声源的相对能量,由此反算出的真实点源分布x也只能代表源的相对能量。由于系统是线性的,b可以看成是每个声源通过
Figure BDA0001846463660000053
的映射关系到各个网格点的能量叠加。网格索引l处的声源相对能量xl通过
Figure BDA0001846463660000054
的第l列映射关系
Figure BDA0001846463660000055
辐射到网格点的相对能量为b的第l列[b1,l b2,l … bn,l…bN,l]T。因此,将
Figure BDA0001846463660000056
的每一列视为相应声源相对能量辐射到各个网格点的辐射系数。假设系统只有单独一个声源可算出
Figure BDA0001846463660000057
相应一列的辐射系数an,l,可用公式an,l=bn,l/xl计算。
考虑空间l处有一单极子声源,则第i、k麦克风对的互功率谱可表示为复指数形式:
Cik(w)=|Cik(w)|exp(-jwΔtki,l) (8)
Δtki,l为声音从网格点n传播到麦克风对(i,k)的时间差。
将式(8)带入式(1)得l处声源辐射到网格点n处的相对能量为:
Figure BDA0001846463660000058
在实际数据处理中,由于采样频率限制,存在一个上限频率wmax。通过欧拉变换,式(9)中被积函数的实部是一个关于w的偶函数,虚部是一个关于w的奇函数。根据奇函数、偶函数在对称区间的积分特性,式(9)可以写成:
Figure BDA0001846463660000059
当声源与网格点处于同一点位置时,辐射能量不会衰减,那么网格点bl,l上的相对能量可代表相同位置处声源相对能量xl,则可求得:
Figure BDA0001846463660000061
式(11)中,M为麦克风总数,i代表第i号麦克风,k代表第k号麦克风,Δtki,n为声音从网格点n传播到麦克风对(i,k)的时间差,Δtki,l为声音从网格点l传播到麦克风对(i,k)的时间差,w是声源的圆频率,wmax为上限频率。
步骤3、GCC逆模型求解
为了验证式(11)所表达的改进型传播矩阵的性能,通常采用贪婪算法和迭代收缩算法求解,贪婪算法代表OMP,迭代收缩算法代表LS1。本实施例采用贪婪算法的代表OMP对GCC逆模型进行求解,重构声源强度分布并成像。
该算法求解过程见“正交匹配追踪应用于反褶积方法的声源映射反问题”,Thomas,美国声学学会,第138卷第6期,第3678~3685页,2015年记录了OMP的求解步骤:
(The different steps of OMP can be summarized as follows:sss
(1)Initialize i=1 and the residual r(i-1)=Y;
(2)Set Q 1/4 0 and the initial set of source indices J(i-1)=Φ;
(3)Search the scan point index such that:j=arg max|AH|r(i-1)|;
(4)Update the index set:J(i)=J(i-1)U j;
(5)Compute:PJ(i)=AJ(i)A
Figure BDA0001846463660000062
J(i),where AJ(i)is the propagation matrixrestricted to sources defined by the index set J(i)
(6)Compute the residual:r(i)=r(i-1)-PJ(i)r(i-1);
(7)i=i+1.Go back to step(3)until a stop criterion is reached.
The final source vector is given by QJ=A
Figure BDA0001846463660000063
JY,where A
Figure BDA0001846463660000064
J(i)is the Moore-Penrose pseudo-inverse and J is the final index set.)。
在OMP中,迭代搜索波束形成输出b与传播矩阵
Figure BDA0001846463660000065
每一列元素的内积的最大值,本实施例设置迭代终止条件为残差的L2范数达到0.01。
仿真模拟试验
为验证本发明的改进型传播矩阵在声源识别中的可靠性能,进行仿真模拟,具体流程为:
1、按照图1进行仿真基础设置,在“+”位置假设具有特定强度辐射零均值标准差为1的高斯白噪声点声源,声源平面距离阵列平面1m;
2、根据式(1)和式(2)正向计算GCC波束形成输出;
3、根据式(3)和式(4)建立GCC逆模型;
4、根据式(11)求解传播矩阵;
5、基于OMP分别采用传播矩阵A和改进型传播矩阵
Figure BDA0001846463660000071
求解该逆模型重构声源强度分布并成像。
这里,采用几种不同声源模式(四个等强度声源(相干或不相干)和四个不等强度声源),采样频率为4.4kHz,采用16384个时域采样点来计算接收信号的互功率谱。
为便于对比,本专利申请中各图中均参考最大输出值进行dB缩放,显示动态范围均为0~-15dB。该仿真模拟的效果如图4所示:图4a列为传统GCC声源识别结果;图4b列为采用未改进A矩阵(时间阈值ε=εop)通过OMP求解逆模型的声源识别结果;图4c列为采用改进型
Figure BDA0001846463660000072
矩阵通过OMP求解逆模型的声源识别结果;图4d列为采用未改进A矩阵(时间阈值ε=0.5εop)通过OMP求解逆模型的声源识别结果。
从图4看出:本发明中的改进型传播矩阵适用于等强度声源(相干或不相干)和四个不等强度声源的识别,避免设置时间阈值,可准确定位声源位置,抑制旁瓣鬼影,其声源识别性能与采用最优时间阈值εop时相当。于综上所述,本发明的性能优越,避免设置时间阈值,自适应性好。
验证试验
验证试验的布局如图5所示,采用白噪声信号激励的扬声器作为声源,采用Brüel&Kjaer公司36通道combo阵列采样声压信号。各传声器接收的声压信号经PULSE 3560D型数据采集系统同时采集并传输到PULSE LABSHOP中进行频谱分析,得声压信号的互功率谱,采样频率为65536Hz,信号加汉宁窗,采用64段平均、66.7%的重叠率,频率分辨率为8Hz。进一步,采用MATLAB编制的程序计算各聚焦点的输出量并成像。
图6为试验扬声器声源的识别成像图:图6a为传统GCC声源识别试验结果;图6b为采用未改进A矩阵(时间阈值ε=εop)通过OMP求解逆模型的声源识别试验结果;图6c为采用改进型
Figure BDA0001846463660000081
矩阵通过OMP求解逆模型的声源识别试验结果;图6d为采用未改进A矩阵(时间阈值ε=0.5εop)通过OMP求解逆模型的声源识别试验结果。试验结果与图4保持了完全一致的结果,本发明方法是可靠的。

Claims (1)

1.一种改进型传播矩阵的GCC逆模型快速声源识别方法,其特征是,包括以下步骤:
步骤1、建立GCC逆模型
采用Combo阵列波束形成的坐标系,x中任一点的相对能量辐射到b中的每一个点,存在一个传播矩阵A∈RN×N,则:b=Ax
列向量b∈RN×1为N个网格点计算得到相对能量输出,x∈RN×1为点声源在N个网格点上的真实相对能量分布;A的矩阵形式为:
Figure FDA0001846463650000011
矩阵元素an,l中,n、l为网格上任意两个点,N为网格点总数;
在真实声源数量少于网格点数和存在噪声干扰的条件下,则该式的稀疏解为:
Figure FDA0001846463650000012
x是稀疏解,σ为干扰的二范数,||·||1、||·||2分别是矩阵或向量的一范数和二范数,s.t.代表约束条件;
步骤2、改进型传播矩阵求解
Figure FDA0001846463650000013
式中,M为麦克风总数,i代表第i号麦克风,k代表第k号麦克风,Δtki,n为声音从网格点n传播到麦克风对(i,k)的时间差,Δtki,l为声音从网格点l传播到麦克风对(i,k)的时间差,w是声源的圆频率,wmax为上限频率;
步骤3、GCC逆模型求解,重构声源强度分布并成像。
CN201811273431.XA 2018-10-30 2018-10-30 一种改进型传播矩阵的gcc逆模型快速声源识别方法 Active CN109490833B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811273431.XA CN109490833B (zh) 2018-10-30 2018-10-30 一种改进型传播矩阵的gcc逆模型快速声源识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811273431.XA CN109490833B (zh) 2018-10-30 2018-10-30 一种改进型传播矩阵的gcc逆模型快速声源识别方法

Publications (2)

Publication Number Publication Date
CN109490833A CN109490833A (zh) 2019-03-19
CN109490833B true CN109490833B (zh) 2022-11-15

Family

ID=65691763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811273431.XA Active CN109490833B (zh) 2018-10-30 2018-10-30 一种改进型传播矩阵的gcc逆模型快速声源识别方法

Country Status (1)

Country Link
CN (1) CN109490833B (zh)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6826284B1 (en) * 2000-02-04 2004-11-30 Agere Systems Inc. Method and apparatus for passive acoustic source localization for video camera steering applications
CN102522082B (zh) * 2011-12-27 2013-07-10 重庆大学 一种公共场所异常声音的识别与定位方法
CN102854494B (zh) * 2012-08-08 2015-09-09 Tcl集团股份有限公司 一种声源定位方法及装置
KR101529516B1 (ko) * 2014-10-27 2015-06-18 국방과학연구소 음원 위치 추정 장치 및 음원 위치 추정 방법
CN105068048B (zh) * 2015-08-14 2016-10-19 南京信息工程大学 基于空间稀疏性的分布式麦克风阵列声源定位方法
DK3157268T3 (da) * 2015-10-12 2021-08-16 Oticon As Høreanordning og høresystem, der er konfigureret til at lokalisere en lydkilde
CN107199572B (zh) * 2017-06-16 2020-02-14 山东大学 一种基于智能声源定位与语音控制的机器人系统及方法

Also Published As

Publication number Publication date
CN109490833A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
Bai et al. Acoustic array systems: theory, implementation, and application
CN110109058B (zh) 一种平面阵列反卷积声源识别方法
CN109407045B (zh) 一种非均匀传感器阵列宽带信号波达方向估计方法
Del Galdo et al. Generating virtual microphone signals using geometrical information gathered by distributed arrays
Bai et al. Application of convex optimization to acoustical array signal processing
CN109343003B (zh) 一种快速迭代收缩波束形成声源识别方法
Maeno et al. Spherical-harmonic-domain feedforward active noise control using sparse decomposition of reference signals from distributed sensor arrays
Xia et al. Noise reduction method for acoustic sensor arrays in underwater noise
Damiano et al. Soundfield reconstruction in reverberant rooms based on compressive sensing and image-source models of early reflections
Pezzoli et al. Implicit neural representation with physics-informed neural networks for the reconstruction of the early part of room impulse responses
CN109490833B (zh) 一种改进型传播矩阵的gcc逆模型快速声源识别方法
CN111830465B (zh) 二维牛顿正交匹配追踪压缩波束形成方法
Marković et al. Estimation of acoustic reflection coefficients through pseudospectrum matching
Dai et al. Multiple speech sources localization in room reverberant environment using spherical harmonic sparse Bayesian learning
Koyama et al. Sound field decomposition in reverberant environment using sparse and low-rank signal models
Tong et al. Supplementations to the higher order subspace algorithm for suppression of spatially colored noise
Bellows et al. Obtaining far-field spherical directivities of guitar amplifiers from arbitrarily shaped arrays using the Helmholtz equation least-squares method
Liu et al. Efficient localization of low-frequency sound source with non-synchronous measurement at coprime positions by alternating direction method of multipliers
Sarabia et al. Spatial LibriSpeech: An Augmented Dataset for Spatial Audio Learning
Nascimento et al. Acoustic imaging using the Kronecker array transform
Bianchi et al. High resolution imaging of acoustic reflections with spherical microphone arrays
Gonzalez et al. Spherical decomposition of arbitrary scattering geometries for virtual acoustic environments
Vinceslas et al. Evaluation of sparse sound field models for compressed sensing in multiple sound zones
Damiano et al. A Compressive Sensing Approach for the Reconstruction of the Soundfield Produced by Directive Sources in Reverberant Rooms
Schäfer et al. Numerical near field optimization of weighted delay-and-sum microphone arrays

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant