CN101828407B - 基于空间分析的麦克风阵列处理器 - Google Patents

基于空间分析的麦克风阵列处理器 Download PDF

Info

Publication number
CN101828407B
CN101828407B CN200880112211.7A CN200880112211A CN101828407B CN 101828407 B CN101828407 B CN 101828407B CN 200880112211 A CN200880112211 A CN 200880112211A CN 101828407 B CN101828407 B CN 101828407B
Authority
CN
China
Prior art keywords
signal
reference signal
spatial
spatial analysis
controlling beam
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880112211.7A
Other languages
English (en)
Other versions
CN101828407A (zh
Inventor
迈克尔·M·古德温
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Creative Technology Ltd
Original Assignee
Creative Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Creative Technology Ltd filed Critical Creative Technology Ltd
Priority to CN201510815720.8A priority Critical patent/CN105376673B/zh
Publication of CN101828407A publication Critical patent/CN101828407A/zh
Application granted granted Critical
Publication of CN101828407B publication Critical patent/CN101828407B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Abstract

一种阵列处理系统通过形成多个被操纵波束并执行对声音场景的空间分析来提高空间选择性。该分析得到一时间-频率掩蔽,该时间-频率掩蔽在被应用到基准观看方向波束(或其他基准信号)时增强了目标源并极大地提高了对指定区域外部的干扰源的抵制。

Description

基于空间分析的麦克风阵列处理器
相关申请的交叉引用
本申请涉及并通过引用并入2007年5月17日递交的题为“SpatialAudioCodingBasedonUniversalSpatialCues”的美国专利申请No.11/750,300,该在先美国申请No.11/750,300通过引用并入2006年5月17日递交的美国临时申请No.60/747,532的公开内容,该在先美国临时申请No.60/747,532的公开内容也通过引用被整体上结合于此。此外,本申请以2007年10月19日递交的题为“EnhancedMicrophoneArrayBeamformerBasedonSpatialAnalysis”的美国临时专利申请No.60/981,458(CLIP231PRV)为优先权并要求其公开内容的权益,该在先美国临时申请的全部内容通过引用被整体上结合于此。
技术领域
本发明涉及麦克风阵列。更具体而言,本发明涉及应用到这些阵列的处理方法。
背景技术
对于电话会议、IP电话、汽车应用等,需要远程谈话自动通信。不幸的是,在这些应用中的通信通常受来自不想要的声源的回响和干扰所阻碍。麦克风阵列先前已被用来改善不利环境中的语音接收,但是基于线性处理(例如,延迟和波束成形(delay-sumbeamforming))的小型阵列由于低方向性和高电平旁瓣而只允许进行有限改善。
所需要的是一种改进的波束成形系统。
发明内容
本发明提供了一种波束成形和处理系统,该系统通过形成多个被操纵波束并对声音场景执行空间分析来提高麦克风阵列的空间选择性。该分析得到一时间-频率掩蔽,该时间-频率掩蔽在被应用到基准观看方向波束(或其他基准信号)时增强了目标源并极大地提高了对指定目标区域外部的干扰源的抵制。
在一个实施例中,提供了一种增强音频信号的方法。输入信号在具有多个换能器的麦克风阵列处被接收到。随后从该麦克风阵列生成多个音频信号。这多个音频信号在多波束成形器处被处理以形成用于采样音频场景的多个被操纵波束以及一基准信号,例如在目标源的方向上的基准波束(其中,该基准波束可以是前述多个被操纵波束之一)。对于多个被操纵波束中的每一个分配一空间方向向量。这些空间方向向量与由多波束成形器所生成的相应波束信号相关联。基于空间方向向量和波束信号的空间分析被执行。空间分析的结果被用来提高基准观看方向波束(或其他基准信号)的空间选择性。
在一个实施例中,多个被操纵波束是通过将输入麦克风信号与被应用到阵列中的换能器的元素滤波和进展延迟中的至少一者相关联来生成的。
在其他实施例中,基准信号被确定为多个波束信号之和、来自麦克风阵列的单个麦克风信号、观看方向波束、或者跟踪所选说话者的跟踪波束。
在又一实施例中,增强操作包括确定时间-频率掩蔽并将其应用到基准信号。在又一实施例中,时间-频率掩蔽被进一步适配以丢弃来自预定目标区域外部的干扰信号。
在另一实施例中,一种增强被配置用于接收来自环境的信号的阵列的空间选择性的方法包括:在多个元件处接收信号;以及生成用于采样声音环境的多个被操纵波束。基准信号被识别并且针对每个时间和频率估计到达方向。在某些实施例中,估计的到达方向包括指示在该时间和频率上声音环境的方向性程度的幅度参数。所作估计被用作基础来接受、衰减或丢弃基准信号的分量以创建输出信号。
下面将参考附图来描述本发明的这些和其他特征和优势。
附图说明
图1是示出用于标准5声道格式的方向向量的图。
图2是示出根据本发明一个实施例的增强波束成形器的框图。
具体实施方式
现在将详细参考本发明的优选实施例。优选实施例的示例在附图中示出。虽然将结合这些优选实施例来描述本发明,但是将会理解,不希望将本发明局限于这些优选实施例。相反,希望覆盖可以包括在由所附权利要求所限定的本发明的精神和范围内的替代方式、修改和等同物。在以下描述中,提出多个具体细节来提供对本发明的全面理解。本发明可以在无需这些具体细节中的某些或全部的情况下实施。在其他实例中,没有详细描述公知的机构,以免不必要地模糊本发明。
这里应该注意,遍及各个附图的类似标号指示类似部件。这里示出和描述的各个附图被用于图示说明本发明的各个特征。就在一张附图中示出而在其他附图中没有示出的一个特定特征而言,除非特别指示或者该结构本质上禁止并入该特征,否则将理解为这些特征可以被适应性修改以包括到在其他附图中表示的实施例中,就好像这些特征在这些附图中被完全示出一样。除非特别指示,否则附图不一定是按比例绘制的。在附图中提供的任何量纲都不认为是对本发明的范围的限制而仅仅是示例性的。
本发明的实施例通过形成多个被操纵波束(steeredbeam)并对声音场景进行空间分析来提供改善的波束成形。该分析得到一时间-频率掩蔽(mask),该时间-频率掩蔽在被应用到基准信号(例如观看方向波束)时增强目标源并充分提高对在所识别的目标区域外部的干扰源的抵制。观看方向波束是通过组合各个麦克风阵列信号以使得麦克风阵列在某一方向上(称之为“观看”方向)被最大接收来形成的。虽然观看方向波束由于来自除了观看方向之外的其他方向的源一般相对于观看方向源被衰减而具有空间选择性,但是这种相对衰减在不利环境中是不足够的。对于这些环境,诸如在本发明中所公开的额外处理是有益的。
在各个实施例中所描述的波束成形算法使得能够在可能受回响和不想要的源的存在所损害的环境中有效地利用小型阵列来接收语音(或其他目标源)。在优选实施例中,该算法可扩展到阵列中任意数目的麦克风,并且可应用到任意阵列几何学。
根据一个实施例,阵列被配置为在跨越声音环境的多个方向上形成接收波束。针对所需源确定一个已知的、被标识的或被跟踪的方向。
在各个实施例中,本发明基本涉及麦克风阵列方法,麦克风阵列方法相对单麦克风方法是有利的,因为它们提供了空间过滤机制,该机制可以基于一组先验条件来灵活地涉及并且容易随声音条件改变而被适配,例如,通过自动跟踪移动说话者或操纵零讯号(null)来抵御时间变化干扰源。虽然这些适配性对于响应变化的和/或挑战的声音环境是有用的,但是简单线性波束成形器的性能方面存在固有局限,因为不想要的源由于受限的方向性和旁瓣抑制而仍然得到承认;对于小型阵列(例如将适合于消费者应用的小型阵列),低方向性和高电平旁瓣确实是严重的问题。在各个实施例中,本发明提供了采用基于多个被操纵波束的空间分析的波束成形和后处理方案;该分析得到一时间-频率掩蔽,该时间-频率掩蔽提高了对在空间上与所需源有所不同的干扰声音的抵抗力。
作为背景目的,所描述的方法应用了先前应用到不同声道信号的空间分析方法。例如,空间分析方法先前已被应用到多声道系统,其中输入包括不同声道信号以及它们的空间位置(由格式角度确定)。在本发明的实施例中,使用多波束成形器将来自阵列中的换能器(transducer)的输入信号分解成多个单独的波束信号并对每个接收的波束信号分配一空间上下文(例如,方向向量)。
下面描述的空间分析-合成方案是针对空间音频编码(SAC)和增强而开发的。该分析得到所感觉到的声音事件的空间位置参数表示。在合成中,这些空间提示(spatialcue)被用于呈现输入场景的可信再现;或者可替换地,提示可以被修改来产生经过空间变化的呈现。以下论述集中在用于将空间分析-合成应用到本发明的波束成形系统的重要概念。
空间提示
在听觉定位的基本理论中,当同一信号从M个不同方向(带有不同的权重αm)到达听众时所感觉到的聚集方向由下式给出:
( 1 ) , g → = Σ m = 1 M β m p → m
其中,是指示M个信号方向的单位向量,下文称之为格式向量;对于各个方向的归一化权重βm由信号权重αm根据下式给出:
( 2 ) , β m = | α m | 2 Σ m = 1 M | α i | 2
该所谓的Gerzon向量可以被容易地应用到多声道音频信号(例如,标准的五声道音频格式)的定位,例如,当格式向量对应于角度{-30°,30°,0°,-110°,110°}时。
图1示出在收听环境中各个方向向量的应用。图1(a)示出用于标准的5声道音频格式的向量。在图1(b)中,针对5声道信号(实线)示出如等式(1)和(2)所指定的Gerzon向量(虚线);在图1(c)中,针对2个活动声道的Gerzon向量被示出;在图1(d)中,相应的增强后的方向向量被示出。图1(c)和1(d)的曲线还示出Gerzon向量的多边形编码轨迹(locus)。Gerzon方向向量、增强的方向向量以及用于空间分析的相关方法在题为“SpatialAudioCodingBasedonUniversalSpatialCues”的美国申请No.11/750,300中有更详细描述,该美国申请通过引用被结合于此。
在具有中心听众并且声音事件的位置通过极坐标(r,θ)被参数化的听圆周(listening-circle)情形中,(其中,角度θ是声音方向,半径r是其在圆周上的位置),r=1对应于一离散点源,r=0对应于一无方向源,并且中间r值对应于圆周内的位置,例如在越过(fly-over)或穿过(fly-through)声音事件中。给定一组信号(多声道音频信号)和各自的格式向量(声道角度),等式(1)的Gerzon向量提供了对在该听圆周情形中感觉到的声音事件的聚集角度θ的可靠估计。但是,Gerzon向量由于其低估了r而具有缺点,之所以低估r是因为其大小受由格式向量所限定的已记下的多边形所限制。以对具有两个活动相邻声道的信号的大小低估为例,该编码轨迹在图1(c)中示出。对于这种成对摆动的点源,所需结果(r=1)在图1(d)中示出。固有的Gerzon向量大小低估在2007年5月17日递交的题为“SpatialAudioCodingBasedonUniversalSpatialCues”的美国申请No.11/750,300中所描述的空间分析方法中本质上通过补偿性规模调整而得到解决,该美国申请通过引用被结合于此。在该方法中,向量被分解成成对的并且无方向的(或零)分量,并且增强的方向向量被表示如下:
( 3 ) d → = r g → | | g → | |
其中,半径r基于成对零分解。
具体讲,
( 4 ) , r = | | P ij - 1 g → | | 1
其中,矩阵Pij的列是两个包围的格式向量即,角度最靠近(在任一侧)由给出的角度提示θ的格式向量。半径r则是在由这对相邻的格式向量所限定的基础上的扩展的系数之和。
与本发明的各个波束成形系统实施例相关的关键思想在于:(1)方向向量(或)给出一大概的聚集信号方向θ;以及(2)半径r本质上捕获到接收的信号从多个方向发起的程度。本领域技术人员将理解,在二维情况下,方向向量(或)可以等同地使用坐标(r,θ)来表示。
本发明的实施例通过形成多个被操纵的波束来针对波束成形情形调整该方案,所述被操纵的波束本质上在由操纵角度φm所给出的各个方向上对该声音场景采样。在一个实施例中,多波束成形和操纵是通过线性组合输入的麦克风信号xn[t]与进展延迟nmτs和元素滤波an[t]来执行的:
( 5 ) , b m [ t ] = Σ n a n [ t ] * x n [ t - nmτ s ]
在其他实施例中,使用替代方法来形成不同方向上的多个波束。在优选实施例中,an[t]被设计为实现波束图样中的频率不变性。在另一实施例中,可以使用简单的统一加权an[t]=δ[t]来使得处理开销最小化。由处理采样率Fs确立的单位延迟τs导致波束成形器操纵角度的离散化。对于线性阵列几何学,操纵角度由下式给出:
( 6 ) , φ m = arcsin ( mτ s τ 0 ) = arcsin ( m τ 0 F s )
其中,τ0是针对阵列中的空间上最靠近的元素的元素间行进时间。在优选实施例中,使用线性阵列几何学,但是该方法也可以被应用到其他配置。
根据本发明的一个实施例的增强波束成形系统的框图如图2所示。最初,传入麦克风信号xn(202)被接收,该信号xn包含来自麦克风阵列的单独的换能器信号;这些传入麦克风信号是时域信号,但是图中没有标注时间索引。如前所述,传入信号202可以包括所需信号以及附加信号,例如来自不想要的源的干扰和回响,所有这些信号都被单独的换能器(麦克风)所拾取和传输。在块204中,接收的信号被处理,以生成与多个被操纵的波束相对应的波束信号。如图所示,M个波束信号bm[t](206)经由STFT(短时间傅立叶变换)208被转换成时间-频率表示Bm[k,l](209);这些波束信号209随后被与它们的空间上下文(操纵角度φm(210))一道提供到空间分析模块212。在替换实施例中,如本领域技术人员将理解的,多波束成形和空间后处理通过在频域上实现多波束成形器而被集成。
在空间分析模块212中,(r,θ)提示(214)被从波束信号209和波束操纵方向210导出。基准信号S[k,l](216)优选地对应于在观看方向上操纵的波束,例如,其操纵角度最靠近所需观看方向θ0的Bm[k,l](209)。但是,在不同实施例中,基准信号可以由在多波束成形器中生成的所有波束信号的和、单麦克风信号或由全通波束(具有统一的空间接收性的波束)生成的信号来表示。为了从基准信号216生成输出信号219,在块218中应用基于空间标准(提示)214的乘法性时间-频率掩蔽。一般而言,空间分析212被用来聚集多个接收的信号以产生主导方向。基准信号(例如,基准观看方向波束)的空间选择性随后通过在块218中应用时间-频率掩蔽所实现的过滤操作而得到增强,所述过滤是基于方向提示214的。合成信号219随后在反向短时间傅立叶变换模块220中被处理,以生成增强的时域输出信号222。
在本发明的实施例中,使用空间提示从基准信号生成合成信号可以被理解为时间-频率掩蔽的应用,该时间-频率掩蔽基于空间标准来提取分量。在一个实施例中,空间音频编码(SAC)应用,掩蔽的特定构造(即,摆动权重(panningweight))帮助实现在解码器处重建输入音频场景的目标。但是,在波束成形实施例中,掩蔽构造可以容易地概括如下:
(7)Y[k,l]=H(r[k,l],θ[k,l])S[k,l]
其中,H()是时间-频率掩蔽,该时间-频率掩蔽是(r[k,l],θ[k,l])的函数,即,通过空间分析确定的时间取决于时间和频率的空间信息。在一个实施例中,H()是通过建立“合成格式”来构造的,该“合成格式”由在所需观看方向上的输出声道角θ0、在观看方向任一侧的相邻声道附近(例如,θ0±5°)以及宽间隔的声道(例如,θ0±90°)构成。然后,在该本实施例的另一方面,H()将被建立作为声道0的摆动掩蔽,并且只有θ[k,l]处于相邻声道之间(即,在θ0±5°处的声道)的分量将被摆动到声道0输出信号中;在全合成实施例中,其他方向上的分量将在其他声道之间摆动。此外,掩蔽可以被调整以仅包括成对的分量,即由于r[k,l]对于当在除了θ[k,l]之外的方向上不存在明显干扰源时的值k和l将很大(接近于1)并且当存在这样的干扰源时将较小,因此与r[k,l]成比例的掩蔽将抑制基准信号的由于干扰源(其在空间上不同于观看方向)而被毁损的时间-频率区域。
虽然上述掩蔽已在试验中被证明是有效的,但是其用来将基准信号摆动到输出声道中所使用的成对摆动构造中包含某种不必要的复杂性。在另一实施例中,掩蔽是作为空间提示的函数来直接构造的,例如:
其中,θ0是所需观看方向,角度宽度Δ定义了围绕θ0的与三角空间窗口相对应的过渡区域。
因此,本发明实施例提供了若干对传统技术的改进。相对于传统波束成形器,对不想要的源的抵制得到极大改善。与其他增强方法相比,该算法比“源分离”波束成形器更高效,并且比基于源和干扰源特性的统计估计的增强“后滤波器”更有效。本发明可以被理解为改进的后滤波方法,其中后滤波器是基于空间分析来得出的。此外,该算法可以被容易地应用到宽带情况,这不同于其他增强的波束成形方法。
本发明实施例的范围可以被扩展到包括任意类型的麦克风阵列,例如范围从双麦克风系统到扩展的多麦克风系统。在替换实施例中,该技术还可以被应用在多麦克风助听器中。
虽然已经出于清楚理解的目的而较详细地描述了本发明,但是将会意识到,在所附权利要求的范围内可以进行某些改变和修改。因此,所述实施例将被认为是示例性的而非限制性的,并且本发明并不局限于这里给出的细节,而是可以在所附权利要求的范围和等同物之内进行修改。

Claims (14)

1.一种增强音频信号的方法,包括:
在具有多个换能器的麦克风阵列处接收输入信号;
从所述麦克风阵列生成多个音频信号;
处理所述多个音频信号以形成基准信号;
处理所述多个音频信号以形成多个被操纵波束;
根据所述多个被操纵波束和多个波束操纵方向导出多个方向提示;以及
将空间分析应用到所述多个被操纵波束以表征音频场景,其中所述空间分析包括针对每个时间和频率估计一主导方向,并使用该估计来确定基准信号分量在该时间和频率上被包括在输出信号中的程度,其中所述多个方向提示用于生成时间-频率掩蔽来增强所述输出信号。
2.如权利要求1所述的方法,其中,所述空间分析包括为所述多个被操纵波束中的每个被操纵波束分配一空间方向向量,并将该向量与从多波束成形器生成的波束信号相关联。
3.如权利要求1所述的方法,还包括:使用所述表征来构造一增强操作,所述增强操作在被应用到所述基准信号时提高了空间选择性并减小了所述基准信号中不想要的噪声。
4.如权利要求1所述的方法,其中,所述多个被操纵波束是通过将输入麦克风信号与应用到所述阵列中的换能器的元素滤波和进展延迟中的至少一者相结合来生成的。
5.如权利要求2所述的方法,其中,所述增强操作包括导出乘法性时间-频率掩蔽并将其应用到基准信号。
6.如权利要求5所述的方法,其中,所述基准信号是多个波束信号之和。
7.如权利要求5所述的方法,其中,所述基准信号是单个麦克风信号。
8.如权利要求5所述的方法,其中,所述基准信号对应于在一预定观看方向上被操纵的波束。
9.如权利要求5所述的方法,其中,所述基准信号是跟踪一所选说话者的跟踪波束。
10.如权利要求5所述的方法,其中,所述时间-频率掩蔽是使用(r,θ)空间信息得到的,其中r是测量接收到的信号从多个方向发起的程度的参数,θ是与主导声音方向相对应的方向向量的角度。
11.一种增强音频信号的方法,包括:
形成多个被操纵波束;
基于所述多个被操纵波束来执行音频场景的空间分析;
根据所述多个被操纵波束和多个波束操纵方向导出多个方向提示;以及
使用所述空间分析的结果和所述多个方向提示来得到一乘法性时间-频率掩蔽,该时间-频率掩蔽被应用到基准信号以增强目标源,所述空间分析包括针对每个时间和频率的主导方向估计,所述主导方向估计被用来确定基准信号分量在时间和频率上被包括在输出信号中的程度。
12.如权利要求11所述的方法,其中,所述基准信号是一观看方向波束。
13.如权利要求11所述的方法,其中,所述时间-频率掩蔽被进一步适配以丢弃来源于预定目标区域外部的干扰信号。
14.一种增强被配置用于接收来自环境的信号的阵列的空间选择性的方法,该方法包括:
在多个元件处接收信号;
生成用于采样声音环境的多个被操纵波束;
识别基准信号;
根据所述多个被操纵波束和多个波束操纵方向导出多个方向提示;
针对每个时间和频率估计到达方向;以及
使用所述估计作为基础来接受、衰减或丢弃所述基准信号的分量以创建输出信号,其中所述多个方向提示用来生成一乘法性时间-频率掩蔽,以增强所述输出信号。
CN200880112211.7A 2007-10-19 2008-10-17 基于空间分析的麦克风阵列处理器 Active CN101828407B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510815720.8A CN105376673B (zh) 2007-10-19 2008-10-17 一种电子设备

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US98145807P 2007-10-19 2007-10-19
US60/981,458 2007-10-19
US12/197,145 US8934640B2 (en) 2007-05-17 2008-08-22 Microphone array processor based on spatial analysis
US12/197,145 2008-08-22
PCT/US2008/080387 WO2009052444A2 (en) 2007-10-19 2008-10-17 Microphone array processor based on spatial analysis

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510815720.8A Division CN105376673B (zh) 2007-10-19 2008-10-17 一种电子设备

Publications (2)

Publication Number Publication Date
CN101828407A CN101828407A (zh) 2010-09-08
CN101828407B true CN101828407B (zh) 2015-12-16

Family

ID=40563517

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880112211.7A Active CN101828407B (zh) 2007-10-19 2008-10-17 基于空间分析的麦克风阵列处理器
CN201510815720.8A Active CN105376673B (zh) 2007-10-19 2008-10-17 一种电子设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201510815720.8A Active CN105376673B (zh) 2007-10-19 2008-10-17 一种电子设备

Country Status (5)

Country Link
US (1) US8934640B2 (zh)
CN (2) CN101828407B (zh)
GB (1) GB2466172B (zh)
SG (1) SG187503A1 (zh)
WO (1) WO2009052444A2 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009076523A1 (en) 2007-12-11 2009-06-18 Andrea Electronics Corporation Adaptive filtering in a sensor array system
US8150054B2 (en) * 2007-12-11 2012-04-03 Andrea Electronics Corporation Adaptive filter in a sensor array system
US9392360B2 (en) 2007-12-11 2016-07-12 Andrea Electronics Corporation Steerable sensor array system with video input
EP2457384B1 (en) * 2009-07-24 2020-09-09 MediaTek Inc. Audio beamforming
WO2011063857A1 (en) * 2009-11-30 2011-06-03 Nokia Corporation An apparatus
US9025415B2 (en) 2010-02-23 2015-05-05 Koninklijke Philips N.V. Audio source localization
KR101782050B1 (ko) * 2010-09-17 2017-09-28 삼성전자주식회사 비등간격으로 배치된 마이크로폰을 이용한 음질 향상 장치 및 방법
US9510121B2 (en) * 2012-12-06 2016-11-29 Agency For Science, Technology And Research Transducer and method of controlling the same
CN105144747B9 (zh) * 2013-03-14 2017-05-10 苹果公司 用于对设备的取向进行广播的声学信标
WO2014171920A1 (en) * 2013-04-15 2014-10-23 Nuance Communications, Inc. System and method for addressing acoustic signal reverberation
US9390713B2 (en) * 2013-09-10 2016-07-12 GM Global Technology Operations LLC Systems and methods for filtering sound in a defined space
JP6508539B2 (ja) * 2014-03-12 2019-05-08 ソニー株式会社 音場収音装置および方法、音場再生装置および方法、並びにプログラム
CN103873977B (zh) * 2014-03-19 2018-12-07 惠州Tcl移动通信有限公司 基于多麦克风阵列波束成形的录音系统及其实现方法
KR101645135B1 (ko) * 2015-05-20 2016-08-03 단국대학교 산학협력단 마이크로폰 어레이와 좌표변환 기법을 이용하는 음원 추적 방법 및 시스템
US10412490B2 (en) 2016-02-25 2019-09-10 Dolby Laboratories Licensing Corporation Multitalker optimised beamforming system and method
GB2559765A (en) * 2017-02-17 2018-08-22 Nokia Technologies Oy Two stage audio focus for spatial audio processing
EP3854108A1 (en) * 2018-09-20 2021-07-28 Shure Acquisition Holdings, Inc. Adjustable lobe shape for array microphones
CN109978034B (zh) * 2019-03-18 2020-12-22 华南理工大学 一种基于数据增强的声场景辨识方法
EP3843421A1 (en) * 2019-12-23 2021-06-30 Bombardier Transportation GmbH Vehicle onboard condition monitoring
KR20220099209A (ko) 2021-01-05 2022-07-13 삼성전자주식회사 음향 센서 어셈블리 및 이를 이용하여 음향을 센싱하는 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1515129A (zh) * 2001-03-16 2004-07-21 用于波束形成阵列的立体角串音对消
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7206421B1 (en) * 2000-07-14 2007-04-17 Gn Resound North America Corporation Hearing system beamformer
EP1184676B1 (en) * 2000-09-02 2004-05-06 Nokia Corporation System and method for processing a signal being emitted from a target signal source into a noisy environment
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
US7415117B2 (en) * 2004-03-02 2008-08-19 Microsoft Corporation System and method for beamforming using a microphone array
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
JP4096104B2 (ja) 2005-11-24 2008-06-04 国立大学法人北陸先端科学技術大学院大学 雑音低減システム及び雑音低減方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1515129A (zh) * 2001-03-16 2004-07-21 用于波束形成阵列的立体角串音对消
CN1967658A (zh) * 2005-11-14 2007-05-23 北京大学科技开发部 小尺度麦克风阵列语音增强系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Blind Extraction of Dominant Target Sources Using ICA and Time-Frequency Masking;Hiroshi Sawada etc.;《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》;20061130;第14卷(第6期);2165-2169 *

Also Published As

Publication number Publication date
US20090103749A1 (en) 2009-04-23
SG187503A1 (en) 2013-02-28
US8934640B2 (en) 2015-01-13
GB2466172A (en) 2010-06-16
CN105376673A (zh) 2016-03-02
WO2009052444A2 (en) 2009-04-23
GB201006663D0 (en) 2010-06-09
CN101828407A (zh) 2010-09-08
GB2466172B (en) 2013-03-06
CN105376673B (zh) 2020-08-11
WO2009052444A3 (en) 2009-06-25

Similar Documents

Publication Publication Date Title
CN101828407B (zh) 基于空间分析的麦克风阵列处理器
US20230124859A1 (en) Conferencing Device with Beamforming and Echo Cancellation
US9641929B2 (en) Audio signal processing method and apparatus and differential beamforming method and apparatus
US8098842B2 (en) Enhanced beamforming for arrays of directional microphones
CN102164328B (zh) 一种用于家庭环境的基于传声器阵列的音频输入系统
US9100735B1 (en) Vector noise cancellation
US8213623B2 (en) Method to generate an output audio signal from two or more input audio signals
US20110293108A1 (en) system and method for producing a directional output signal
US8615392B1 (en) Systems and methods for producing an acoustic field having a target spatial pattern
CN102447993A (zh) 声音场景操纵
KR20130116271A (ko) 다중 마이크에 의한 3차원 사운드 포착 및 재생
EP3165007B1 (en) Auxiliary augmentation of soundfields
Alexandridis et al. Capturing and reproducing spatial audio based on a circular microphone array
US9990939B2 (en) Methods and apparatus for broadened beamwidth beamforming and postfiltering
CN108597532A (zh) 基于mvdr的隐声方法
Niwa et al. Optimal microphone array observation for clear recording of distant sound sources
Pan et al. Microphone array beamforming with high flexible interference attenuation and noise reduction
Yamamoto et al. Spherical microphone array post-filtering for reverberation suppression using isotropic beamformings
US20200267490A1 (en) Sound wave field generation
Yang et al. A new class of differential beamformers
Goodwin Enhanced microphone-array beamforming based on frequency-domain spatial analysis-synthesis
Siegwart et al. Improving the separation of concurrent speech through residual echo suppression
Niwa et al. Sharp directive beamforming using microphone array and planar reflector
Sun et al. Optimal 3-D hoa encoding with applications in improving close-spaced source localization
Abad et al. Speech enhancement and recognition by integrating adaptive beamforming and wiener filtering.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant