CN109997375A - 同心圆差分麦克风阵列及相关波束形成 - Google Patents

同心圆差分麦克风阵列及相关波束形成 Download PDF

Info

Publication number
CN109997375A
CN109997375A CN201780069353.9A CN201780069353A CN109997375A CN 109997375 A CN109997375 A CN 109997375A CN 201780069353 A CN201780069353 A CN 201780069353A CN 109997375 A CN109997375 A CN 109997375A
Authority
CN
China
Prior art keywords
microphone
multiple microphones
along
microphones
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780069353.9A
Other languages
English (en)
Other versions
CN109997375B (zh
Inventor
陈景东
黄公平
雅各布·贝内斯蒂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Publication of CN109997375A publication Critical patent/CN109997375A/zh
Application granted granted Critical
Publication of CN109997375B publication Critical patent/CN109997375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • H04R2430/21Direction finding using differential microphone array [DMA]

Abstract

一种差分麦克风阵列包括位于基本上为平面的平台上的多个麦克风,多个麦克风包括总数为M的麦克风和多个麦克风的至少两个子集沿着至少两个相对于一个中心基本上同心的椭圆布置,以及以通信方式耦合到多个麦克风的处理装置,以接收由多个麦克风响应于声源产生的多个电子信号,并执行最小范数波束形成器以基于多个电子信号计算声源的估计值,其中最小范数波束形成器具有N阶差分,并且其中M>N+1。

Description

同心圆差分麦克风阵列及相关波束形成
技术领域
本公开涉及麦克风阵列,并且具体地涉及与鲁棒波束形成器相关的同心圆差分麦克风阵列(CCDMA)。
背景技术
波束形成器(或空间滤波器)用于传感器阵列(例如,麦克风阵列)中的定向信号的传输或接收。传感器阵列可以是传感器大致上沿线性平台(例如直线)布置的线性阵列,或是传感器大致上沿圆形平台(例如圆形线)布置的圆形阵列。传感器阵列中的每个传感器都可以捕获始发自源的信号的一个版本。每个信号版本可以表示在特定时间相对于相应传感器以特定的入射角捕获的信号。该时间可以被记录为相对于一个参考点的时间延迟,例如,参考点可以为传感器阵列中的第一传感器。入射角和时间延迟可根据阵列传感器的几何形状确定。此外,捕获的信号版本还可以包括噪声分量。模数转换器(ADC)的阵列可以将捕获的信号转换为数字型式(也称为数字信号)。处理装置可以实现用于基于数字信号计算信号源的某些属性的波束形成器。
发明内容
传感器阵列中的每个传感器都可以以特定的入射角接收从源发射的信号,其具有相对于参考物(例如,参考传感器)的特定的时间延迟。传感器可以是合适类型的传感器,例如捕获声音信号的麦克风传感器等。麦克风传感器可包括传感元件(例如,膜),该传感元件响应于到达传感元件的声波产生的声压,以及将由传感元件接收到的声压转换成电子电流的电子电路。麦克风传感器可以将电子信号(或模拟信号)输出到下游处理装置以进行进一步的处理。麦克风阵列中的每个麦克风传感器可以接收从距离麦克风阵列一定距离的声源发出的声音信号的相应版本。麦克风阵列可包括多个麦克风传感器以捕获声音信号(例如,语音信号),并将声音信号转换为电子信号。电子信号可以由模数转换器(ADC)转换成数字信号,该数字信号可以由处理装置(例如,数字信号处理器(DSP))进一步处理。与单个麦克风相比,麦克风阵列接收的声音信号包括可以利用的冗余,以计算声源的估计值,从而达到降噪/语音增强、声源分离、去混响、空间录音以及源定位和跟踪等目标。经处理的数字信号可以被封装以通过通信信道传输或使用数模转换器(DAC)转换回模拟信号。
麦克风阵列可以通信方式耦合到处理装置(例如,数字信号处理器(DSP)或中央处理单元(CPU)),其包括被编程为实现用于计算声源的估计值的波束形成器的逻辑电路。在麦克风阵列中的任何麦克风传感器接收的声音信号可包括相对于参考麦克风传感器(例如,麦克风阵列中的第一麦克风传感器)接收的声音信号的噪声分量和延迟分量。波束形成器是一种空间滤波器,其使用麦克风阵列接收的声音信号的多个版本来根据某些优化规则识别声源。
从声源发出的声音信号可以是宽带信号,例如语音和音频信号,通常在20Hz到20KHz的频率范围内。由于与波束形成器相关联的波束宽度(即,频域中主瓣的宽度)与频率成反比,波束形成器的某些实施在处理低频噪声分量方面是无效的。为了抵消波束形成器的非均匀频率响应,使用差分麦克风阵列(DMA)来达到频率不变的波束图案和高方向性因子(DF),其中DF描述了相对于方向角度的声音强度。DMA可包含响应于声压场的空间导数的麦克风传感器阵列。例如,可以将多个地理上布置的全向传感器的输出组合在一起,以测量麦克风传感器之间的声压场的差异。与增加的麦克风阵列相比,DMA允许小的传感器间距离,并且可以以紧凑的方式制造。
DMA可测量由麦克风接收的声场的导数(以不同的阶导数)。例如,利用由一对相邻麦克风之间的差异形成的一阶DMA可以测量声压场的一阶导数,以及利用由一对相邻的一阶DMA之间的差异形成二阶DMA可以测量声压场的二阶导数,其中一阶DMA包括至少两个麦克风,二阶DMA包括至少三个麦克风。因此,N阶DMA可以测量声压场的N阶导数,其中N阶DMA包括至少N+1个麦克风。N阶称为DMA的差分阶。DMA的指向性因子可以随着DMA的阶而增加。
DMA中的麦克风传感器可以布置在线性平台上或布置在弯曲平台上(称为线性DMA)。弯曲平台可以是椭圆形平台,特别是圆形平台(称为圆形DMA)。与线性DMA(LDMA)相比,圆形DMA(CDMA)可更容易地控制,并且对于来自不同方向的声音信号具有基本相同的性能。这在声音来自除直线(或端射方向)之外的方向等的情况下是有用的。
CDMA可以包括基本上沿着圆形轨迹放置在平面上的全向麦克风。全向麦克风是一种可从相对于麦克风的所有侧面或方向拾取相同增益的声音的麦克风。但是,CDMA可以放大与捕获信号相关的白噪声。白噪声可能来自装置的噪音。最小范数滤波器已经被用于通过增加给定的DMA的阶的麦克风阵列中使用的麦克风的数量来改善白噪声增益(WNG)。尽管部署在麦克风阵列中的大量麦克风可以改善WNG,但是大量与最小范数滤波器相关联的麦克风可能导致更大的阵列孔径,从而在更低频带中产生更多的零点。来自不同频带的响应组合时相互抵消,从而形成了零点。零点可能会在与CDMA相关的最小范数波束形成器中产生不需要的死区。
本公开的实施方式提供了一种可以实质上增强波束形成器的鲁棒性并减少感兴趣的频带中的方向性因子的零点(深谷值)的技术方案。与使用单环麦克风来形成麦克风阵列的CDMA相比,本公开的实施方式采用同心圆麦克风阵列(CCDMA)来捕获声音信号并提供与CCDMA相关联的鲁棒波束形成器,其可改善WNG并消除零点。CCDMA是一种包括多个共用一个公共中心参考点并具有不同半径的CDMA的麦克风阵列。
附图说明
本公开通过示例而非限制性的方式在附图的图中加以说明。
图1示出了根据本公开的实施方式的同心圆差分麦克风阵列(CCDMA)系统。
图2示出了根据本公开的实施方式的均匀同心圆阵列(UCCA)的详细布置。
图3A示出了与圆形差分麦克风阵列(CDMA)相关联的波束图、方向性因子(DF)和白噪声增益(WGN)。
图3B示出了与鲁棒圆形差分麦克风阵列(CDMA)相关联的波束图308、方向性因子(DF)和白噪声增益(WGN)。
图3C示出了根据本公开的实施方式的与同心圆差分麦克风阵列(CCDMA)相关联的波束图、方向性因子(DF)和白噪声增益(WGN)。
图4为本公开的一些实施方式中通过与同心圆差分麦克风阵列(CCDMA)相关联的波束形成器估计声源的方法400的流程图。
图5为根据本公开的一些实施方式的计算机系统的示例性的框图。
具体实施方式
图1示出了根据本公开一种实施方式的同心圆差分麦克风阵列(CCDMA)系统100。如图1所示,系统100可包括CCDMA 102、模数转换器(ADC)104和处理装置106。CCDMA 102可包括布置在一个公共的全体平台上的多个同心CDMA。CDMA中的每一个都可包括基本上沿着圆线相对于一个公共中心点(O)放置的一个或多个麦克风。因此,CCDMA102可包括多个麦克风同心环。例如,如图1所示,CCDMA 102可包括P(P=3)个环,其中第p个(p=1,2,3)环可具有半径rp并且包括Mp个全向麦克风。
麦克风阵列102中的麦克风传感器可从特定距离接收源自声源的声信号。在一个实施例中,声学信号可包括来自声源的第一分量(s(t))和第二噪声分量(v(t))(例如,环境噪声),其中t为时间。由于麦克风传感器之间的空间距离,每个麦克风传感器除了接收噪声分量外,还可以接收不同版本的声音信号(例如,声音信号相对于参考点具有不同的延迟量,该参考点例如为CCDMA102中指定的麦克风传感器)。
图2示出了根据本公开一种实施方式的均匀同心圆阵列(UCCA)200的详细布置。UCCA200可包括放置在x-y平面上的P环麦克风,其中第p(p=1,2,…,P)个环的半径为rp,包括Mp个麦克风(例如,全向麦克风)。对于第p个环,Mp个麦克风沿着第p个环的圆圈均匀地布置,或者第p个环上的相邻麦克风之间以基本相等的角距离彼此分开。为了简单和方便地讨论,假设UCCA 200的中心与二维笛卡尔坐标系的原点重合,方位角从x轴的逆时针方向进行测量,并且阵列的第一个麦克风(#1)如图2所示放置在x轴上。图2用于说明目的。本公开的实施不限于图2中所示的布置。例如,UCCA200内的不同环的第一个麦克风可相对于x轴以不同的角度放置。
因此,第p个环上的第m个麦克风的坐标可以表示为
rp,m=(rpcosψp,m,rpsinψp,m),
其中p=1,2,...,P,m=1,2,...,Mp,并且
为第p个环上的第m个麦克风的角位置,其中第p个环上的Mp个麦克风沿着第p环的圆圈均匀放置。此外,假设位于远场中的源信号(平面波)以空气中的音速(C)从方向θ(方位角)撞击UCCA 200,例如,C=340m/s。
UCCA 200可以与表征UCCA 200的导向矢量相关联。导向矢量可以表示UCCA 200中的麦克风上的入射远场波形的相对相移。因此,导向矢量是UCCA 200对脉冲输入的响应。对于具有P环的UCCA 200,其中每个环具有数个(Mp)麦克风,导向矢量的长度为或者为UCCA 200中的麦克风的总数。导向矢量被定义为
其中
为第p个环的导向矢量,上标T为转置算符,j是虚数单位且j2=1,且其中ω=2πf为角频率,f>0为时间频率,rp为第r环的半径。
为方便起见,如图2所示,不同环中的麦克风可标记为mp,k,其中p=1,2,...,P表征麦克风所在位置的环,并且k=1,2,...,Mp表征第p个环上一个麦克风。因此,麦克风mp,k表示第p个环上的第k个麦克风。麦克风mp,k(k=1,2,...,Mp且p=1,2,...,P)可分别接收源自声源的声学信号ap,k(t),其中,t为时间,k=1,2,…,Mp,p=1,2,…,P。
如图1所示,每个麦克风可接收声学信号ap,k(t)的一个版本,其可包括表示为s(t+dp,k)的声源的延迟副本和表示为vp,k(t)的噪声分量,其中t为时间,k=1,2,…,Mp,p=1,2,…,P,dp,k是麦克风mp,k接收到的相对于参考麦克风(例如,m1,,1)的声学信号的时间延迟,vp,k(t)表示麦克风mp,k的噪声分量。CCDMA 102的麦克风mp,k的电子电路可将ap,k(t)转换成可以馈送到ADC 104的电子信号eap,k(t),其中k=1,2,…,Mp,p=1,2,…,P。在一种实施方式中,ADC 104还可以将电子信号eap,k(t)转换为数字信号yp,k(t)。模数转换可包括将输入的eap,k(t)量化为离散值yp,k(t)。
在一种实施方式中,处理装置106可包括输入接口(图中未示出)以接收数字信号yp,k(t),并且如图1所示,处理装置可被编程为通过执行CCDMA波束形成器110来识别声源。为了执行CCDMA波束形成器110,在一种实施方式中,处理装置106可实施预处理器108,预处理器108可进一步处理CCDMA波束形成器110的数字信号yp,k(t)。预处理器108可包括硬件电路和软件程序,以使用例如为短时傅立叶变换(STFT)或任何合适类型的频率变换将数字信号yp,k(t)转换成频域表示。STFT可在一系列时间帧上计算其输入信号的傅立叶变换。因此,可以在一系列时间帧上处理数字信号yp,k(t)。
在一种实施方式中,预处理器108可对与CCDMA102的麦克风mp,k相关联的输入yp,k(t)执行STFT,并计算相应的频域表示Yp,k(ω),其中ω(ω=2πf)表示角频率域,k=1,2,…,Mp,p=1,2,…,P。在一种实施方式中,CCDMA波束形成器110可接收输入信号yp,k(t)的频率表示Yp,k(ω),并计算声源(s(t))在频域中的估计值Z(ω)。在一种实施方式中,频域可被划分为多个(L)频率子带,并且CCDMA波束形成器110可计算每个频率子带的估计值Z(ω)。
处理装置106还可包括后处理器112,后处理器112可以将每个频率子带的估计值Z(ω)转换回时域,以提供表示为X1(t)的估计声源。估计声源X1(t)可通过关于CCDMA102中的参考麦克风(例如,麦克风m1,1)接收的源信号来确定。
本公开的实施方式可包括使用CCDMA 102捕获的声信号来计算估计声源X1(t)的不同类型的CCDMA波束形成器。不同类型的波束形成器的性能可根据信噪比(SNR)增益和方向性因子(DF)测量来进行测量。SNR增益被定义为CCDMA 102的输出(oSNR)处的信噪比与CCDMA 102的输入(iSNR)处的信噪比的比较。当每个麦克风mp,k与包括基本上相同的时间和空间统计特性(例如,基本上相同的方差)的白噪声相关联时,SNR增益被称为白噪声增益(WNG)。该白噪声模型可表示由麦克风自身的硬件元件产生的噪声。环境噪声(例如,背景噪声)可由扩射噪声模型来表示。在这种情况下,第一麦克风处的噪声与第二麦克风处的噪声之间的相干性为这两个麦克风之间的距离的函数。扩散噪声模型的SNR增益被称为与CCDMA102相关联的方向性因子(DF)。此外,CCDMA 102可与波束图(或方向性图)相关联,该波束图(或方向性图)将波束形成器的灵敏度反映到从某个角度方向θ照射在CCDMA 102上的平面波上。波束形成器的从角度θ入射的平面波的波束图由与CCDMA 102相关联的滤波器h(ω)表示可被定义为
其中是与CCDMA 102相关联的波束形成器的全局滤波器,并且上标H表示共轭转置算符,为第p环的长度为Mp的空间滤波器。
N阶CCDMA的波束图可进一步的简化和近似如下:
其中
其中指数函数近似为N阶的展开。
当环的数量P=1时,CCDMA 102退化为具有一个麦克风环的CDMA。该CDMA的波束图为
波束形成器的阶(N)与CDMA中使用的麦克风的数量(M)相关。在一些实施方式中,M=N+1。然而,满足M=N+1条件的波束形成器在某些频率子带上会出现白噪声放大和明显的SNR增益下降。在一些实施方式中,使用更多的麦克风来增加冗余以及抵消白噪声增益和恶化的SNR增益的问题。在这些实施方式中,麦克风的数量(M)大于波束形成器的阶加1,或M>N+1。当M>N+1时,得到的波束形成器可以是最小范数滤波器,与M=N+1的那些波束形成器相比,其可以具有改善的WNG。尽管将CDMA中使用的麦克风的数量增加到超过阶加1有助于改善WNG,但是更大数量的麦克风也可能增加CDMA的麦克风阵列孔径(即,半径)。较大的阵列孔径可能在某些频率子带处引入零点,并在这些频率子带处引起明显的SNR恶化。
本公开的实施方式采用同心圆差分麦克风阵列(CCDMA),并且相应地采用鲁棒波束形成器来改善WNG以及防止SNG的恶化。本公开的实施方式允许灵活地使用更多的麦克风来改善CCDMA的性能。当使用相同总数的麦克风时,本公开的CCDMA在WNG和SNR增益方面比CDMA表现得更好。由于麦克风阵列的成本和尺寸与所使用的麦克风的数量(以及相应地,ADC的数量)成比例的相关,因此本公开的CCDMA可以改善波束形成器性能而不会产生额外的成本或体积尺寸。
在本公开的一种实施方式中,CCDMA可包括多个(P>1)麦克风环,并且每个环(第p环)可包括基本上布置在一个半径为rp的圆中的多个(Mp)麦克风。麦克风的总数可计算为不同环中麦克风的总和,即不同环中的麦克风的数量可以变化,并且不同环中的麦克风可以均匀地或非均匀地布置,只要它们基本上沿着圆放置即可。
在一种实施方式中,CCDMA可以是麦克风的均匀同心圆阵列(UCCA)。UCCA包括一个以上的麦克风环,其中每个环包括相同数量的麦克风,并且每个环中的麦克风对齐并以均匀的角距离放置。例如,九个麦克风的UCCA可以具有三个环,每个环包括以60°角间隔布置的三个麦克风。UCCA可包括总数(M)比波束形成器的阶(N)加1大的麦克风。在一种实施方式中,最小范数波束形成器h(ω)可设计为:minh′(ω)h′H(ω)h′(ω),受Ψ(ω)h′(ω)=bN+1的约束,其中,bN+1为理想波束图,Ψ(ω)=[Ψ1(ω)Ψ2(ω)...ΨP1(ω)]是由M(其中)形成的(N+1)矩阵,
是由Mp形成的N+1矩阵,其中n=1,2,...,N,p=1,2,...,P,并且为长度M的向量,为长度Mp的向量。
最小范数滤波器可通过以下方式获得:
h′(ω)=Ψ H(ω)[Ψ(ω)Ψ H(ω)]-1bN+1
如上所述,CCDMA的全局滤波器或波束形成器可以表示为其中,
因此,当P>1且M>N+1时可得到鲁棒CCDMA滤波器。当P=1且M1>N+1时,可得到鲁棒CDMA波束形成器。当P=1且M1=N+1时,可得到常规CDMA波束形成器。
实验表明,鲁棒CCDMA波束形成器可具有比鲁棒CDMA波束形成器或常规CDMA波束形成器好得多的性能。图3A-3C示出了根据本公开的一个实施例的常规CDMA、鲁棒CDMA和CCDMA的波束图、方向性因子(DF)和WNG。图3A示出了与圆形差分麦克风阵列(CDMA)相关联的波束图302、方向性因子(DF)304和白噪声增益(WGN)306,该CDMA包括沿着半径r为2厘米的圆布置的4个麦克风。波束图302(a)-302(d)的频率分别为500Hz、1000Hz、2000Hz和6500Hz。CDMA的差分的阶(N)为3。波束形成器在频域中的大约6500Hz处具有零点。如图3A所示,CDMA在低频(f=500Hz、1000Hz和2000Hz)中具有几乎频率不变的波束图302(a)-302(c),但高频(302(d),f=6500Hz)除外。当f=6500Hz时,由于空间混叠,波束图会发生很大变化。图3A进一步示出了波束形成器在低频处具有非常低的WNG306,表明该波束形成器可以在低频处具有显著放大的白噪声。随着频率的增加,WNG得到改善。但是,DF和WNG都在大约f=6500H处的零点的位置附近性能明显恶化。
图3B示出了与鲁棒圆形差分麦克风阵列(CDMA)相关联的波束图308、方向性因子(DF)310和白噪声增益(WGN)314,该CDMA包括沿着半径r为3.7厘米的圆布置的8个麦克风。因为使用了更多的麦克风,该半径从2厘米增加到3.7。波束图308(a)-308(d)的频率分别为500Hz、1000Hz、2000Hz和3520Hz。CDMA的差分的阶(N)为3。波束形成器在频域中的大约3520Hz处具有零点。如图3B所示,与常规CDMA(图3A,306)相比,尽管鲁棒CDMA改善了WNG312(例如,在低频处),但是鲁棒CDMA的更大半径可能会导致在较低频带中产生更多的零点(例如,f=3520Hz和6500Hz对比),该频带为感兴趣的频带。
图3C示出了与同心圆差分麦克风阵列(CCDMA)相关联的波束图314、方向性因子(DF)316和白噪声增益(WGN)318,该CCDMA沿着两个圆布置了12个麦克风,其中8个麦克风沿着半径为3.7厘米的外圆布置,4个麦克风沿着半径为2厘米的内圆布置。波束图314(a)-314(d)的频率分别为500Hz、1000Hz、2000Hz和3520Hz。CCDMA的差分的阶(N)为3。如图3C所示,波束图314(a)-314(d)在不同的频率(f=500Hz、1000Hz、2000Hz或3520Hz)中基本上频率是不变的。而且,DF316和WNG318示出了在感兴趣的频带中的零点减少。
尽管本公开的实施方式通过使用了同心圆差分麦克风阵列(CCDMA)的实施方式进行了描述,但是本公开的实施方式还包括使用同心椭圆差分麦克风阵列(CEDMA)的实施方式,其中麦克风沿着具有相同的中心、主轴和第二轴的同心椭圆排列。
图4示出了本公开的一些实施方式中通过与同心圆差分麦克风阵列(CCDMA)相关联的波束形成器估计声源的方法400的流程图。方法400可由包括硬件(例如,电路、专用逻辑、可编程逻辑、微代码等)、软件(例如,在处理装置上运行以执行硬件模拟的指令)或其组合的处理逻辑来执行。
为了简化说明,方法被描绘和描述为一系列动作。但是,本公开的动作可以以各种顺序和/或同时发生,并且与本公开未呈现和描述的其他动作一起发生。此外,并非所有说明的动作都需要按照披露的主题来实施该方法。另外,这些方法可以替代地通过状态图或事件表示为一系列相互关联的状态。而且,可以理解的是,本说明书中公开的方法能够存储在制品上,以便将这些方法传送和转移到计算装置。这里使用的术语“制品”旨在涵盖可从任何计算机可读装置或存储介质访问的计算机程序。在一种实施方式中,该方法可以由图1所示的在处理装置106上执行的波束形成器110来实施。
参见图4,在402处,处理装置可以开始运行以计算诸如语音源之类的声源的估计值。声源可以发出可由麦克风阵列接收的声音,该麦克风阵列包括可以将声音转换为声音信号的多个同心麦克风环。声音信号可以是包括声音的第一分量和噪声的第二分量的电子信号。因为麦克风传感器通常位于平面平台上并且以空间距离分开,所以声音信号的第一分量可能由于到达麦克风传感器的声音的时间延迟而发生变化。
在404处,处理装置可从CCDMA接收电子信号以响应于声音。CCDMA中的麦克风可以位于基本平面上并且包括总数为(M)的麦克风。麦克风被分成至少两个沿着至少两个相对于一个中心基本同心的圆分布的子集。
在406处,处理装置可以执行最小范数波束形成器以基于多个电子信号计算声源的估计值,其中最小范数波束形成器具有差分阶数(N),且M>N+1。
图5示出了计算机系统500范例的结构示意图,其可以执行用于使机器执行本文所讨论的任何一种或多种方法的一组指令。在替代的实施方式中,机器可以连接(例如,联网)到LAN、内联网或因特网中的其他机器。机器可在客户端-服务器网络环境中以服务器或客户端机器的能力内运行,或者作为对等(或分布式)网络环境中的对等机器来运行。该机器可以是个人计算机(PC)、平板电脑、机顶盒(STB)、个人数字助理(PDA)、蜂窝电话、网络装置、服务器、网络路由器、交换机或网桥或任何能够执行一组指令(以顺序或其他方式)的机器,这些指令为该机器要执行的特定动作。此外,虽然仅示出了单个机器,但术语“机器”还应被视为包括单独或联合执行一组(或多组)指令以执行本文所讨论的任何一种或多种方法的任何机器集合。
示例性的计算机系统500包括处理装置(处理器)502、主存储器504(例如,只读存储器(ROM)、闪存、诸如同步DRAM(SDRAM)或Rambus DRAM(RDRAM)等的动态随机存取存储器(DRAM))、静态存储器506(例如,闪存、静态随机存取存储器(SRAM)等)和数据存储装置518,它们经由总线508彼此通信。
处理器502表示一个或多个通用处理装置,例如微处理器、中央处理单元等。更具体地,处理器502可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器,或是实现其他指令集或实现指令集组合的处理器。处理器502还可以是一个或多个专用处理装置,诸如专用集成电路(ASIC)、现场可编程门阵列(FPGA)、数字信号处理器(DSP)和网络处理器等。处理器502被配置为执行用于实施本文所讨论的操作和步骤的指令526。
计算机系统500还可包括网络接口装置522。计算机系统500还可包括视频显示单元510(例如,液晶显示器(LCD)、阴极射线管(CRT)或触摸屏)、字母数字输入装置512(例如,键盘)、光标控制装置514(例如,鼠标),以及信号生成装置520(例如,扬声器)。
数据存储装置518可包括计算机可读存储介质524,在该计算机可读存储介质524上存储体现本文描述的方法或功能(例如,处理装置102)中的任何一个或多个的一个或多个指令集526(例如,软件)。指令526还可在由计算机系统500执行期间完全或至少部分地驻留在主存储器504内和/或处理器502内,主存储器504和处理器502也构成计算机可读存储介质。指令526还可经由网络接口装置522在网络574上进一步地发送或接收。
虽然计算机可读存储介质524在示例性的实施方式中被示为单个介质,但术语“计算机可读存储介质”应被视为包括存储一组或多组指令的单个介质或多个介质(例如,集中或分布式数据库和/或相关的缓存和服务器)。术语“计算机可读存储介质”还应被视为包括能够存储、编码或携带一组指令以供机器执行并且使机器执行本公开的任何一种或多种方法的任何介质。因此,术语“计算机可读存储介质”应被视为包括但不限于固态存储器、光学介质和磁介质。
在前面的描述中,阐述了许多细节。然而,对于受益于本公开的本领域普通技术人员而言显而易见的是,可以在没有这些具体细节的情况下实施本公开。在一些情况下,众所周知的结构和装置以框图形式而不是详细地示出,以避免模糊本公开。
详细描述的某些部分已根据计算机内存中数据位上的运算算法和符号表示进行了介绍。这些算法描述和表示是数据处理领域的技术人员用来将他们工作的实质且最有效地传达给本领域其他技术人员的手段。这里的算法通常被认为是导致期望结果的自相一致的步骤序列。这些步骤是需要物理操纵物理量的步骤。通常,尽管不是必须的,这些量采用能够被存储、传输、组合、比较和以其他方式操纵的电信号或磁信号的形式。主要是由于常用的原因,已经证明将这些信号称为比特、值、元素、符号、字符、术语、数字等是很方便的。
然而,应该记住的是,所有这些和类似术语都与适当的物理量相关联,并且仅仅是方便这些量的应用。除非以下讨论中另有明确说明,否则在整个描述过程中,使用诸如“分段”、“分析”、“确定”、“启用”、“识别”、“修改”等术语的讨论均指计算机系统或类似电子通信的动作和过程,其操纵和转换表示为计算机系统内的物理(例如,电子)量的数据、寄存器和存储器,其他数据类似地表示为其中的物理量、计算机系统存储器或寄存器或其他此类信息的存储、传输或显示装置。
本公开还涉及用于运行本文操作的装置。该装置可以为所需目的而专门构造,或者它可以包括由存储在计算机中的计算机程序选择性地激活或重新配置的通用计算机。这样的计算机程序可以存储在计算机可读存储介质中,例如但不限于任何类型的盘,包括软盘、光盘、CD-ROM和磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁卡或光卡,或适用于存储电子指令的任何类型的介质。
本文使用词语“例如”或“示例性”来表示用作示例、实例或说明。本文描述为“例如”或“示例性”的任何方面或设计不必被解释为比其他方面或设计更优选或更具优势。相反,使用词语“例如”或“示例性”旨在以具体方式呈现概念。如在本申请中所使用的,术语“或”旨在表示包含性的“或”而不是排他性的“或”。也就是说,除非另有说明或从上下文中清楚得知,否则“X包括A或B”旨在表示任何自然的包含性排列。也就是说,X包括A,X包括B或者X包括A和B均满足“X包括A或B”。另外,本申请和所附权利要求中使用的冠词“一”和“一个”通常应理解为表示“一个或多个”,除非另有说明或从上下文清楚地指向单数形式。此外,除非如此描述,否则贯穿使用术语“一个实施例”或“一种实施例”或“一个实施方式”或“一种实施方式”并不旨在表示相同的实施例或实施方式。
本说明书中对“一种实施方式”或“一个实施例”的引用意味着结合该实施方式描述的特定特征、结构或特性包括在至少一种实施方式中。因此,贯穿本说明书在各个地方出现的短语“在一种实施方式中”或“在一个实施方式中”不一定都指代相同的实施方式。此外,术语“或”旨在表示包含性的“或”而不是排他性的“或”。
应理解的是,以上描述旨在是说明性的而非限制性的。在阅读和理解以上描述后,许多其他实施方式对于本领域技术人员而言将是显而易见的。因此,本公开的范围应该参考所附权利要求以及这些权利要求所赋予的等同物的全部范围来确定。

Claims (20)

1.一种差分麦克风阵列,包括:
位于基本上为平面的平台上的多个麦克风,多个麦克风包括:
总数为M的麦克风;以及
多个麦克风的至少两个子集沿着至少两个相对于一个中心基本上同心的椭圆布置;以及
处理装置,以通信方式耦合到多个麦克风,以:
接收由多个麦克风响应于声源产生的多个电子信号;和
执行最小范数波束形成器以基于多个电子信号计算声源的估计值,其中,最小范数波束形成器具有N阶差分,并且其中M>N+1。
2.根据权利要求1所述的差分麦克风阵列,其中,多个电子信号中的每一个均表示在多个麦克风中的相应的一个麦克风处接收的声源的对应版本。
3.根据权利要求1或2所述的差分麦克风阵列,还包括:
模数转换器,以通信方式耦合到多个麦克风和处理装置,以将多个电子信号转换成多个数字信号。
4.根据权利要求1至3任一项中所述的差分麦克风阵列,其中,多个麦克风沿着相对于中心的P个同心圆布置,其中,P大于1。
5.根据权利要求1至4任一项中所述的差分麦克风阵列,其中,相同数量的麦克风沿着多个圆中的每个圆以相等的角距离布置。
6.根据权利要求1至5任一项中所述的差分麦克风阵列,其中,沿着同心圆的第一个圆的多个麦克风与沿着同心圆的第二圆的多个麦克风不相同。
7.一种系统,包括:
数据存储器;以及
处理装置,以通信方式耦合到数据存储器,以:
接收由多个麦克风响应于声源产生的多个电子信号,其中,多个麦克风位于基本上为平面的平台上,多个麦克风包括总数为M的麦克风并且多个麦克风的至少两个子集沿着至少两个相对于一个中心基本上同心的椭圆布置;以及
执行最小范数波束形成器以基于多个电子信号计算声源的估计值,其中,最小范数波束形成器具有N阶差分,并且其中M>N+1。
8.如权利要求7所述的系统,其中,多个电子信号中的每一个均表示在多个麦克风中的相应的一个麦克风处接收的声源的对应版本。
9.根据权利要求7或8所述的系统,其中,多个麦克风沿着相对于中心的P个同心圆布置,其中,P大于1。
10.根据权利要求7至9任一项中所述的系统,其中,相同数量的麦克风沿着多个圆中的每个圆以相等的角距离布置。
11.根据权利要求7至10任一项中所述的系统,其中,沿着同心圆的第一圆的多个麦克风与沿着同心圆的第二圆的多个麦克风不相同。
12.一种方法,包括:
通过处理装置接收由多个麦克风响应于声源产生的多个电子信号,其中,多个麦克风位于基本上为平面的平台上,多个麦克风包括总数为M的麦克风并且多个麦克风中的至少两个子集沿着至少两个相对于一个中心基本上同心的椭圆布置;以及
执行最小范数波束形成器以基于多个电子信号计算声源的估计值,其中最小范数波束形成器具有N阶差分,并且其中M>N+1。
13.如权利要求12所述的方法,其中,多个电子信号中的每一个均表示在多个麦克风中的相应的一个麦克风处接收的声源的对应版本。
14.根据权利要求12或13所述的方法,其中,多个麦克风沿着相对于中心的P个同心圆布置,其中,P大于1。
15.根据权利要求12至14任一项中所述的方法,其中,沿着同心圆的第一圆的多个麦克风与沿着同心圆的第二圆的多个麦克风相同。
16.根据权利要求12至15任一项中所述的方法,其中,沿着同心圆的第一圆的多个麦克风不同于沿着同心圆的第二圆的多个麦克风。
17.一种用于存储指令的非暂时性机器可读存储介质,当指令在被执行时使处理装置:
通过处理装置接收由多个麦克风响应于声源产生的多个电子信号,其中,多个麦克风位于基本上为平面的平台上,多个麦克风包括总数为M的麦克风并且多个麦克风中的至少两个子集沿着至少两个相对于一个中心基本上同心的椭圆布置;以及
执行最小范数波束形成器以基于多个电子信号计算声源的估计值,其中,最小范数波束形成器具有N阶差分,并且其中M>N+1。
18.根据权利要求17所述的非暂时性机器可读存储介质,其中,多个电子信号中的每一个均表示在多个麦克风中的相应的一个麦克风处接收的声源的对应版本。
19.根据权利要求17或18所述的非暂时性机器可读存储介质,其中,多个麦克风沿着相对于中心的P个同心圆布置,其中,P大于1。
20.根据权利要求17至19任一项中所述的非暂时性机器可读存储介质,其中,相同数量的麦克风沿着多个圆中的每个圆以相等的角距离布置。
CN201780069353.9A 2016-11-09 2017-10-24 同心圆差分麦克风阵列及相关波束形成 Active CN109997375B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/347,482 US9930448B1 (en) 2016-11-09 2016-11-09 Concentric circular differential microphone arrays and associated beamforming
US15/347,482 2016-11-09
PCT/IB2017/001436 WO2018087590A2 (en) 2016-11-09 2017-10-24 Concentric circular differential microphone arrays and associated beamforming

Publications (2)

Publication Number Publication Date
CN109997375A true CN109997375A (zh) 2019-07-09
CN109997375B CN109997375B (zh) 2021-03-26

Family

ID=61629849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780069353.9A Active CN109997375B (zh) 2016-11-09 2017-10-24 同心圆差分麦克风阵列及相关波束形成

Country Status (3)

Country Link
US (2) US9930448B1 (zh)
CN (1) CN109997375B (zh)
WO (1) WO2018087590A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112995841A (zh) * 2019-12-17 2021-06-18 西北工业大学 基于几何形状优化的线性差分传声器阵列
CN113126028A (zh) * 2021-04-13 2021-07-16 上海盈蓓德智能科技有限公司 一种基于多个麦克风阵列的噪声源定位方法
CN114073106A (zh) * 2020-06-04 2022-02-18 西北工业大学 双耳波束形成麦克风阵列

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
CN107290711A (zh) * 2016-03-30 2017-10-24 芋头科技(杭州)有限公司 一种语音寻向系统及方法
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US20190324117A1 (en) * 2018-04-24 2019-10-24 Mediatek Inc. Content aware audio source localization
WO2019231632A1 (en) 2018-06-01 2019-12-05 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
CN110164446B (zh) * 2018-06-28 2023-06-30 腾讯科技(深圳)有限公司 语音信号识别方法和装置、计算机设备和电子设备
CN112385245B (zh) * 2018-07-16 2022-02-25 西北工业大学 灵活地理分布的差分麦克风阵列和相关波束形成器
EP3854108A1 (en) 2018-09-20 2021-07-28 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
CN113491137B (zh) * 2019-03-19 2023-07-07 西北工业大学 具有分数阶的灵活差分麦克风阵列
CN113841419A (zh) 2019-03-21 2021-12-24 舒尔获得控股公司 天花板阵列麦克风的外壳及相关联设计特征
JP2022526761A (ja) 2019-03-21 2022-05-26 シュアー アクイジッション ホールディングス インコーポレイテッド 阻止機能を伴うビーム形成マイクロフォンローブの自動集束、領域内自動集束、および自動配置
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
CN110211600B (zh) * 2019-05-17 2021-08-03 北京华控创为南京信息技术有限公司 用于定向监听通信的智能麦克风阵列模块
CN114051738A (zh) 2019-05-23 2022-02-15 舒尔获得控股公司 可操纵扬声器阵列、系统及其方法
EP3977449A1 (en) 2019-05-31 2022-04-06 Shure Acquisition Holdings, Inc. Low latency automixer integrated with voice and noise activity detection
JP7392969B2 (ja) * 2019-08-19 2023-12-06 株式会社オーディオテクニカ マイクロホン位置決定方法
JP2022545113A (ja) 2019-08-23 2022-10-25 シュアー アクイジッション ホールディングス インコーポレイテッド 指向性が改善された一次元アレイマイクロホン
WO2021087377A1 (en) * 2019-11-01 2021-05-06 Shure Acquisition Holdings, Inc. Proximity microphone
CN114586097A (zh) * 2019-11-05 2022-06-03 阿里巴巴集团控股有限公司 差分定向传感器系统
US11902755B2 (en) * 2019-11-12 2024-02-13 Alibaba Group Holding Limited Linear differential directional microphone array
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN111863012A (zh) * 2020-07-31 2020-10-30 北京小米松果电子有限公司 一种音频信号处理方法、装置、终端及存储介质
WO2022165007A1 (en) 2021-01-28 2022-08-04 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system
CN115150712A (zh) * 2022-06-07 2022-10-04 中国第一汽车股份有限公司 一种车载麦克风系统及汽车

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101351058A (zh) * 2008-09-09 2009-01-21 西安交通大学 一种麦克风阵列及实现语音信号增强的方法
US20110194719A1 (en) * 2009-11-12 2011-08-11 Robert Henry Frater Speakerphone and/or microphone arrays and methods and systems of using the same
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法
CN104464739A (zh) * 2013-09-18 2015-03-25 华为技术有限公司 音频信号处理方法及装置、差分波束形成方法及装置
US20150117672A1 (en) * 2013-10-25 2015-04-30 Harman Becker Automotive Systems Gmbh Microphone array
US20150163577A1 (en) * 2012-12-04 2015-06-11 Northwestern Polytechnical University Low noise differential microphone arrays
CN104936091A (zh) * 2015-05-14 2015-09-23 科大讯飞股份有限公司 基于圆形麦克风阵列的智能交互方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120059827A (ko) * 2010-12-01 2012-06-11 삼성전자주식회사 다중 음원 위치추적장치 및 그 위치추적방법
US9516412B2 (en) * 2014-03-28 2016-12-06 Panasonic Intellectual Property Management Co., Ltd. Directivity control apparatus, directivity control method, storage medium and directivity control system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101351058A (zh) * 2008-09-09 2009-01-21 西安交通大学 一种麦克风阵列及实现语音信号增强的方法
US20110194719A1 (en) * 2009-11-12 2011-08-11 Robert Henry Frater Speakerphone and/or microphone arrays and methods and systems of using the same
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
US20150163577A1 (en) * 2012-12-04 2015-06-11 Northwestern Polytechnical University Low noise differential microphone arrays
CN104464739A (zh) * 2013-09-18 2015-03-25 华为技术有限公司 音频信号处理方法及装置、差分波束形成方法及装置
US20150117672A1 (en) * 2013-10-25 2015-04-30 Harman Becker Automotive Systems Gmbh Microphone array
CN104142492A (zh) * 2014-07-29 2014-11-12 佛山科学技术学院 一种srp-phat多源空间定位方法
CN104936091A (zh) * 2015-05-14 2015-09-23 科大讯飞股份有限公司 基于圆形麦克风阵列的智能交互方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112995841A (zh) * 2019-12-17 2021-06-18 西北工业大学 基于几何形状优化的线性差分传声器阵列
CN114073106A (zh) * 2020-06-04 2022-02-18 西北工业大学 双耳波束形成麦克风阵列
CN114073106B (zh) * 2020-06-04 2023-08-04 西北工业大学 双耳波束形成麦克风阵列
CN113126028A (zh) * 2021-04-13 2021-07-16 上海盈蓓德智能科技有限公司 一种基于多个麦克风阵列的噪声源定位方法

Also Published As

Publication number Publication date
US9930448B1 (en) 2018-03-27
WO2018087590A2 (en) 2018-05-17
US20190069086A1 (en) 2019-02-28
CN109997375B (zh) 2021-03-26
US10506337B2 (en) 2019-12-10
WO2018087590A3 (en) 2018-06-28

Similar Documents

Publication Publication Date Title
CN109997375A (zh) 同心圆差分麦克风阵列及相关波束形成
Habets et al. Generating sensor signals in isotropic noise fields
TWI556654B (zh) 用以推衍方向性資訊之裝置與方法和系統
US9291697B2 (en) Systems, methods, and apparatus for spatially directive filtering
AU2015292238B2 (en) Planar sensor array
US9456276B1 (en) Parameter selection for audio beamforming
JP5746717B2 (ja) 音源位置決め
ES2779198T3 (es) Aparato y procedimiento para la adquisición espacialmente selectiva del sonido mediante triangulación acústica
EP2208359B1 (en) Position determination of sound sources
CN108447499B (zh) 一种双层圆环麦克风阵列语音增强方法
Chang et al. Experimental validation of sound field control with a circular double-layer array of loudspeakers
Jackson et al. Sound field planarity characterized by superdirective beamforming
Liu et al. Deep learning assisted sound source localization using two orthogonal first-order differential microphone arrays
Wajid et al. Design and analysis of air acoustic vector-sensor configurations for two-dimensional geometry
SongGong et al. Acoustic source localization in the circular harmonic domain using deep learning architecture
Gaubitch et al. On near-field beamforming with smartphone-based ad-hoc microphone arrays
CN112385245B (zh) 灵活地理分布的差分麦克风阵列和相关波束形成器
TWI429885B (zh) 迴響環境之聲源能量分佈可視化的方法
Ding et al. DOA estimation of multiple speech sources by selecting reliable local sound intensity estimates
CN113491137B (zh) 具有分数阶的灵活差分麦克风阵列
Gohil et al. Learning based doa estimation in adverse acoustic environment using co-prime circular microphone array
Atkins et al. Robust superdirective beamformer with optimal regularization
Dey et al. Microphone array principles
Berkun et al. A tunable beamformer for robust superdirective beamforming
Papež et al. Enhanced MVDR beamforming for mems microphone array

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant