CN102461203B - 用于对多信道信号进行基于相位的处理的系统、方法及设备 - Google Patents

用于对多信道信号进行基于相位的处理的系统、方法及设备 Download PDF

Info

Publication number
CN102461203B
CN102461203B CN201080025957.1A CN201080025957A CN102461203B CN 102461203 B CN102461203 B CN 102461203B CN 201080025957 A CN201080025957 A CN 201080025957A CN 102461203 B CN102461203 B CN 102461203B
Authority
CN
China
Prior art keywords
channel
institute
channel signal
level
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201080025957.1A
Other languages
English (en)
Other versions
CN102461203A (zh
Inventor
埃里克·维塞
尔南·刘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN102461203A publication Critical patent/CN102461203A/zh
Application granted granted Critical
Publication of CN102461203B publication Critical patent/CN102461203B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/022Plurality of transducers corresponding to a plurality of sound channels in each earpiece of headphones or in a single enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • H04R29/006Microphone matching

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

本发明揭示对多信道信号进行基于相位的处理及包括接近性检测的应用。

Description

用于对多信道信号进行基于相位的处理的系统、方法及设备
根据35 U.S.C.§119主张优先权
本专利申请案主张2009年6月9日申请且转让给本案受让人的标题为“用于一致性检测的系统、方法、设备及计算机可读媒体(Systems,methods,apparatus,and computer-readable media for coherence detection)”的第61/185,518号美国临时专利申请案的优先权。本专利申请案还主张2009年9月8日申请且转让给本案受让人的标题为“用于一致性检测的系统、方法、设备及计算机可读媒体(Systems,methods,apparatus,and computer-readable media for coherence detection)”的第61/240,318号美国临时专利申请案的优先权。 
本专利申请案还主张2009年7月20日申请且转让给本案受让人的标题为“用于对多信道信号进行基于相位的处理的系统、方法、设备及计算机可读媒体(Systems,methods,apparatus,and computer-readable media for phase-based processing of multichannel signal)”(代理人案号091561P1)的第61/227,037号美国临时专利申请案的优先权。本专利申请案还主张2009年9月8日申请且转让给本案受让人的标题为“用于对多信道信号进行基于相位的处理的系统、方法、设备及计算机可读媒体(Systems,methods,apparatus,and computer-readable media for phase-based processing of multichannel signal)”的第61/240,320号美国临时专利申请案的优先权。 
技术领域
本发明涉及信号处理。 
背景技术
先前在安静的办公室或家庭环境中执行的许多活动如今在声变情景(如汽车、街道或咖啡馆)中执行。举例来说,有人可能希望使用话音通信信道与另一人通信。所述信道可(例如)由移动无线手持机或头戴式耳机、对讲机、双向无线电、车载套件或另一通信装置来提供。因此,在用户由其它人包围的环境中使用移动装置(例如,智能电话、 手持机及/或头戴式耳机)来发生大量的话音通信,其中具有在人们趋向于聚集的地方通常遇到的噪声内容种类。此噪声趋向于使电话通话的远端处的用户分心或受到干扰。此外,许多标准自动化商业交易(例如,账户结余或股票报价查核)使用以话音辨识为基础的数据查询,且干扰性噪声可能显著地妨碍到这些系统的准确性。 
对于通信发生在有噪声环境中的应用来说,可希望将所要语音信号与背景噪声分离。噪声可被定义为干扰所要信号或以其它方式使所要信号降级的所有信号的组合。背景噪声可包括在有声环境内产生的众多噪声信号,例如其它人的背景谈话以及从所要信号及/或任何其它信号产生的反射及回响。除非所要语音信号与背景噪声分离,否则可能难以可靠且高效地利用所要语音信号。在一个特定实例中,在有噪声环境中产生语音信号,且使用语音处理方法来将所述语音信号与环境噪声分离。 
移动环境中所遇到的噪声可包括多种不同分量,例如竞争谈话者、音乐、嘈杂的说话声、街道噪声及/或机场噪声。由于此噪声的特征通常不稳定且接近于用户的自身频率特征,故可能难以使用传统的单麦克风或固定波束成形型方法来将噪声模型化。单麦克风噪声减少技术通常要求显著参数调谐以实现最佳性能。举例来说,合适的噪声参考在此些情况下可能非直接可用的,且可能必需间接地得出噪声参考。因此,可需要以多麦克风为基础的高级信号处理以支持移动装置用于有噪声环境中的话音通信。 
发明内容
根据一般配置,一种处理多信道信号的方法包括,针对所述多信道信号的多个不同频率分量中的每一者,计算所述频率分量在所述多信道信号的第一信道中的相位与所述频率分量在所述多信道信号的第二信道中的相位之间的差,以获得多个所计算相位差。此方法包括计算所述第一信道的电平及所述第二信道的对应电平。此方法包括:基于所述第一信道的所计算电平、所述第二信道的所计算电平及所述多个所计算相位差中的至少一者来计算增益因子的更新值;及通过根据所述更新值,相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生经处理的多信道信号。本文中还揭示一种设备,其包括用于执行这些动作中的每一者的装置。本文中还揭示一种计算机可读媒体,其具有存储用于执行此种方法的机器可执行指令的有形特征。 
根据一般配置,一种用于处理多信道信号的设备包括第一计算器,所述第一计算器经配置以通过针对所述多信道信号的多个不同频率分量中的每一者,计算所述频率分量在所述多信道信号的第一信道中的相位与所述频率分量在所述多信道信号的第二信道中的相位之间的差,以获得多个所计算相位差。此设备包括:第二计算器,其经配置以 计算所述第一信道的电平及所述第二信道的对应电平;及第三计算器,其经配置以基于所述第一信道的所计算电平、所述第二信道的所计算电平及所述多个所计算相位差中的至少一者来计算增益因子的更新值。此设备包括增益控制元件,所述增益控制元件经配置以通过根据所述更新值,相对于所述第一信道的对应振幅更改所述第二信道的振幅来产生经处理的多信道信号。 
附图说明
图1展示使用中的头戴式耳机D100的侧视图。 
图2展示戴在用户耳朵上的头戴式耳机D100的俯视图。 
图3A展示使用中的手持机D300的侧视图。 
图3B展示关于麦克风阵列的宽面及端射区的实例。 
图4A展示根据一般配置的处理多信道信号的方法M100的流程图。 
图4B展示任务T100的实施方案T102的流程图。 
图4C展示任务T110的实施方案T112的流程图。 
图5A展示任务T300的实施方案T302的流程图。 
图5B展示任务T300的替代实施方案T304的流程图。 
图5C展示方法M100的实施方案M200的流程图。 
图6A展示说明估计到达方向的方法的几何近似法的实例。 
图6B展示将图6A的近似法用于第二及第三象限值的实例。 
图7展示采取球形波前的模型的实例。 
图8A展示在通带与阻带之间具有相对突然的转变的遮蔽函数的实例。 
图8B展示遮蔽函数的线性滚降的实例。 
图8C展示遮蔽函数的非线性滚降的实例。 
图9A到图9C展示针对不同参数值的非线性函数的实例。 
图10展示遮蔽函数的方向图案的前向瓣及后向瓣。 
图11A展示方法M100的实施方案M110的流程图。 
图11B展示任务T360的实施方案T362的流程图。 
图11C展示任务T360的实施方案T364的流程图。 
图12A展示方法M100的实施方案M120的流程图。 
图12B展示方法M100的实施方案M130的流程图。 
图13A展示方法M100的实施方案M140的流程图。 
图13B展示方法M100的实施方案M150的流程图。 
图14A展示对应于三个不同阈值的接近性检测区的边界的实例。 
图14B展示容许方向范围与接近性泡状区的相交以获得说话者覆盖范围的锥形的实例。 
图15及图16展示如图14B中所展示的来源选择区边界的俯视图及侧视图。 
图17A展示方法M100的实施方案M160的流程图。 
图17B展示方法M100的实施方案M170的流程图。 
图18展示方法M170的实施方案M180的流程图。 
图19A展示根据一般配置的方法M300的流程图。 
图19B展示方法M300的实施方案M310的流程图。 
图20A展示方法M310的实施方案M320的流程图。 
图20B展示根据一般配置的设备G100的框图。 
图21A展示根据一般配置的设备A100的框图。 
图21B展示设备A110的框图。 
图22展示设备A120的框图。 
图23A展示阵列R100的实施方案R200的框图。 
图23B展示阵列R200的实施方案R210的框图。 
图24A展示根据一般配置的装置D10的框图。 
图24B展示装置D10的实施方案D20的框图。 
图25A到图25D展示多麦克风无线头戴式耳机D100的各种视图。 
图26A到图26D展示多麦克风无线头戴式耳机D200的各种视图。 
图27A展示多麦克风通信手持机D300的横截面图(沿中心轴线)。 
图27B展示装置D300的实施方案D310的横截面图。 
图28A展示多麦克风媒体播放器D400的图。 
图28B展示装置D400的另一实施方案D410,其中麦克风MC10和MC20安置在所述装置的相对面。 
图28C展示装置D400的另一实施方案D420,其中麦克风MC10和MC20安置在所述装置的邻近面。 
图29展示多麦克风免提车载套件D500的图。 
图30展示装置D10的多麦克风便携式音频感测实施方案D600的图。 
具体实施方式
真实世界充满着多种噪声源,包括单点噪声源,其通常侵入到多种声音中,从而导致回响。背景声噪声可包括由一般环境所产生的众多噪声信号及由其它人的背景谈话所产生的干扰信号,以及从所要声音信号及/或任何其它信号产生的反射及回响。 
环境噪声可影响所感测音频信号(例如,近端语音信号)的可懂度。可希望使用信号处理来区分所要音频信号与背景噪声。举例来说,对于通信可能发生在有噪声环境中的应用来说,可希望使用语音处理方法来区分语音信号与背景噪声且增强其可懂度。此处理在日常通信的许多方面中可为重要的,因为噪声几乎总是存在于真实世界情况中。 
可希望产生便携式音频感测装置,其具有经配置以接收声信号的两个或两个以上麦克风的阵列R100。可经实施以包括此阵列且可用于音频记录及/或话音通信应用的便携式音频感测装置的实例包括电话手持机(例如,蜂窝式电话手持机或智能电话);有线或无线头戴式耳机(例如,蓝牙头戴式耳机);手持型音频及/或视频记录器;经配置以记录音频及/或视频内容的个人媒体播放器;个人数字助理(PDA)或其它手持型计算装置;及笔记本型计算机、膝上型计算机、上网本型计算机或其它便携式计算装置。 
在正常使用期间,便携式音频感测装置可在相对于所要声音源的标准定向的范围中的任一定向下操作。举例来说,不同用户可以不同方式戴上或拿着装置,且同一用户可在不同时间甚至在同一使用周期内(例如,在单次电话呼叫期间)以不同方式戴上或拿着装置。图1展示使用中的头戴式耳机D100的侧视图,其包括在所述装置相对于用户嘴巴的标准定向的范围中的两个实例。头戴式耳机D100具有阵列R100的例子,其包括:主要麦克风MC10,其经定位以在所述装置的典型使用期间较直接地接收用户的话音;及次要麦克风MC20,其经定位以在所述装置的典型使用期间较不直接地接收用户的话音。图2展示在相对于用户嘴巴的标准定向中的戴在用户耳朵上的头戴式耳机D100的俯视图。图3A展示使用中的头戴式耳机D300的侧视图,其包括在所述装置相对于用户嘴巴的标准定向的范围中的两个实例。 
除非上下文明确限制,否则术语“信号”在本文中用以指示其普通意义中的任一者,包括如导线、总线或其它传输媒体上表达的存储器位置(或存储器位置的集合)的状态。除非上下文明确限制,否则术语“产生”在本文中用以指示其普通意义中的任一者,例如计算或以其它方式产生。除非上下文明确限制,否则术语“计算”在本文中用以指示其普通意义中的任一者,例如计算、评估、平滑化及/或从多个值进行选择。除非上下文明确限制,否则术语“获得”用以指示其普通意义中的任一者,例如计算、导出、接收(例如,从外部装置)及/或检索(例如,从存储元件阵列)。除非上下文明确限制,否则术语“选择”用以指示其普通意义中的任一者,例如识别、指示、应用及/或使用两个或两个以上者的集合中的至少一者及少于全部。在术语“包含”用在本描述及所附权利要求书中时,并不排除其它元件或操作。术语“基于”(如在“A基于B”中)用以指示其普通意义中的任一者,包括以下情况:(i)“从…导出”(例如,“B为A的前驱者”)、(ii) “至少基于”(例如,“A至少基于B”),及在特定上下文中适合时,(iii)“等于”(例如,“A等于B”)。类似地,术语“响应于”用以指示其普通意义中的任一者,包括“至少响应于”。 
除非上下文另有指示,否则对多麦克风音频感测装置的麦克风的“位置”的参考指示所述麦克风的声敏感面的中心的位置。术语“信道”有时用以指示信号路径且在其它时候用以指示此路径所运载的信号,根据特定上下文而定。除非另有指示,否则术语“一连串”用以指示两个或两个以上项目的序列。术语“对数”用以指示以十为底的对数,但此运算扩展到其它底数也在本发明的范围内。术语“频率分量”用以指示信号的频率或频带的集合中的一者,例如所述信号的频域表示的样本(或“频段”)(例如,由快速傅立叶变换产生)或所述信号的子带(例如,巴克(Bark)标度子带)。 
除非另有指示,否则具有特定特征的设备的操作的任何揭示内容还明确地既定揭示具有类似特征的方法(且反之亦然),且根据特定配置的设备的操作的任何揭示内容还明确地既定揭示根据类似配置的方法(且反之亦然)。术语“配置”可参考如由其特定上下文所指示的方法、设备及/或系统来使用。除非由特定上下文另外指示,否则术语“方法”、“进程”、“程序”及“技术”以一般意义来使用且可互换使用。除非由特定上下文另外指示,否则术语“设备”及“装置”还以一般意义来使用且可互换使用。术语“元件”及“模块”通常用以指示较大配置的一部分。除非上下文明确地限制,否则术语“系统”在本文中用以指示其一般意义中的任一者,包括“相互作用以用于实现共同目的的元件群组”。以引用方式对文献的一部分的任何并入也应被理解为并入有在所述部分内所引用的术语或变量的定义(其中此些定义出现在文献中的别处)以及在所并入部分中所引用的任何图。 
可将近场定义为与声音接收器(例如,麦克风阵列)相距小于一个波长的空间区。依据此定义,与所述区的边界相距的距离与频率成相反地变化。举例来说,在两百、七百及两千赫兹的频率下,与一波长边界相距的距离分别为约170、四十九及十七厘米。改为将近场/远场边界视为与麦克风阵列相距特定距离(例如,与阵列的麦克风或阵列的质心相距十五厘米,或与阵列的麦克风或阵列的质心相距1米或1.5米)可为有用的。 
麦克风阵列产生多信道信号,其中每一信道基于麦克风中的对应一者对声环境的响应。可希望对所述多信道信号执行空间选择性处理(SSP)操作,以辨别所述信号的从不同来源接收到的分量。举例来说,可希望辨别来自所要方向性声音源(例如,用户的嘴巴)的声音分量与来自扩散的背景噪声及/或一个或一个以上方向性干扰性噪声源(例如,竞争性说话者)的声音分量。SSP操作的实例包括波束成形方法(例如,广义旁瓣 消除(GSC)、最小方差无失真响应(MVDR)及/或线性约束最小方差(LCMV)波束成形器)、盲源分离(BSS)及其它自适应学习方法,及基于增益的接近性检测。SSP操作的典型应用包括用于便携式音频感测装置的多麦克风噪声减少方案。 
对阵列R100所产生的多信道信号的操作(例如,SSP操作)的性能可取决于阵列信道的响应特性彼此匹配的良好程度。举例来说,信道的电平有可能归因于以下各项而不同:相应麦克风的响应特性的差异、相应预处理级的增益电平的差异,及/或信道的电路噪声电平的差异。在此种情况下,除非可补偿信道响应特性之间的失配(也被称作“信道响应不平衡”),否则所得多信道信号不可提供声环境的准确表示。 
在无此补偿的情况下,基于此信号的SSP操作可提供有错误的结果。对于使用信道之间的增益差异来指示方向性声音源的相对接近性的操作来说,信道的响应之间的不平衡将趋向于降低所述接近性指示的准确性。在另一实例中,在低频率(即,约100Hz到1kHz)下信道之间小如一分贝或两分贝的振幅响应偏差可显著降低低频方向性。阵列R100的信道的响应间不平衡的效应可对以下应用尤为有害:处理来自具有两个以上麦克风的阵列R100的实施方案的多信道信号。 
准确的信道校准对头戴式耳机应用可尤为重要。举例来说,可希望配置便携式音频感测装置以辨别从近场源到达的声音分量与从远场源到达的声音分量。此辨别可基于所述多信道信号的两个信道的增益电平之间的差异(即,“信道间增益电平差异”)来执行,因为可预期此差异对于来自位于阵列的端射方向处的近场源(即,在穿过对应麦克风的中心的线附近)的声音分量来说较高。 
随着麦克风之间的距离减小,近场信号的信道间增益电平差异也减小。对于手持型应用来说,近场信号的信道间增益电平差异通常与远场信号的信道间增益电平差异相差约六分贝。然而,对于头戴式耳机应用来说,典型近场声音分量的信道间增益电平差异与典型远场声音分量的信道间增益电平差异的偏差可在三分贝内(或更小)。在此种情况下,仅几分贝的信道响应不平衡可严重妨碍辨别此些分量的能力,而三分贝或更大的不平衡可破坏所述能力。 
阵列信道的响应之间的不平衡可起因于麦克风自身的响应之间的差异。变化可出现在阵列R100的麦克风的制造期间,使得甚至在一批大量产生且外观相同的麦克风中,麦克风间的灵敏度也可彼此显著变化。举例来说,用于便携式大量销售的音频感测装置中的麦克风可以正负三分贝的灵敏度容差制造,使得在阵列R100的实施方案中两个此种麦克风的灵敏度可相差多达六分贝。 
可在便携式音频感测装置的制造期间通过使用响应已经匹配(例如,经由挑选或装 仓过程)的麦克风来解决信道响应不平衡的问题。另外或其它,可在实验室及/或在生产设施(例如,工厂)中对阵列R100的麦克风(或对包括所述阵列的装置)执行信道校准程序。此程序可通过计算一个或一个以上增益因子及将此些因子应用于对应信道来补偿所述不平衡以产生经平衡的多信道信号。可在服务之前执行的校准程序的实例描述于2009年5月28日申请的标题为“用于多信道信号平衡的系统、方法及设备(SYSTEMS,METHODS,AND APPARATUS FOR MULTICHANNEL SIGNAL BALANCING)”的第12/473,930号美国专利申请案及2008年12月12日申请的标题为“用于基于多麦克风的语音增强的系统、方法及设备(SYSTEMS,METHODS,AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECH ENHANCEMENT)”的第12/334,246美国专利申请案号中。然而,此些匹配或校准操作可增加生产所述装置的成本,且其还可对在装置的服务寿命期间出现的信道响应不平衡(例如,归因于老化)无效。 
另外或其它,可在服务期间执行信道校准(例如,如第12/473,930号美国专利申请案中所描述)。此程序可用以校正随时间而出现的响应不平衡及/或校正初始响应不平衡。举例来说,初始响应不平衡可能归因于麦克风失配,及/或归因于有错误的校准程序(例如,在所述程序期间触摸或覆盖麦克风)。为了避免用波动的信道电平令用户分心,可希望此程序应用随时间逐渐改变的补偿。然而,对于初始响应不平衡较大的情况来说,此逐渐式补偿可导致较长的收敛周期(例如,一分钟到十分钟或以上),在此时间期间,对所述多信道信号的SSP操作可能较差地执行,从而导致令人不满意的用户体验。 
可使用相位分析来对多信道信号的时频点进行分类。举例来说,可希望配置一系统、方法或设备以基于在多个不同频率中的每一者下多信道信号的信道的估计相位之间的差异来对所述信号的时频点进行分类。此些配置在本文中被称作“基于相位”。 
可希望使用基于相位的方案来识别展现特定相位差特性的时频点。举例来说,基于相位的方案可经配置以应用关于麦克风间距离及信道间相位差的信息来确定受感测的多信道信号的特定频率分量是源自相对于阵列轴线的容许角度范围内或是源自此范围外。可使用此确定来辨别从不同方向到达的声音分量(例如,使得源自所述容许范围内的声音被选择且源自所述范围外的声音被拒绝)及/或辨别从近场源与远场源到达的声音分量。 
在典型应用中,使用此系统、方法或设备来为在所述多信道信号的至少一部分内(例如,在特定范围频率内及/或在特定时间间隔内)的每一时频点计算相对于麦克风对的到达方向。可将方向遮蔽函数应用于这些结果以区分具有在所要范围内的到达方向的点与具有其它到达方向的点。可使用来自方向遮蔽操作的结果以通过丢弃或衰减具有在遮蔽 外的到达方向的时频点来使来自非所要方向的声音分量衰减。 
如上文所述,许多个多麦克风空间处理操作固有地视麦克风信道的相对增益响应而定,使得信道增益响应的校准可为启用此些空间处理操作所必需的。在制造期间执行此校准通常为费时及/或在其它方式昂贵。然而,基于相位的方案可经实施以相对不受输入信道间的增益不平衡所影响,使得对应信道的增益响应彼此匹配的程度并非经校准相位差的准确性及基于其的后续操作(例如,方向遮蔽)的限制因素。 
可希望通过使用此方案的分类结果支持如本文所描述的信道校准操作(也被称作“信道平衡”操作)来利用对基于相位的方案的在信道不平衡的稳健性。举例来说,可希望使用基于相位的方案来识别可用于信道平衡的所记录多信道信号的频率分量及/或时间间隔。此方案可经配置以选择以下时频点,所述时频点的到达方向指示其将预期在每一信道中产生相对相等的响应。 
关于如图3B中所展示的相对于双麦克风阵列的声音方向的范围,可希望仅使用从宽面方向(即,正交于阵列轴线的方向)到达的声音分量来进行信道校准。举例来说,在无近场源在作用中且声音源分散(例如,背景噪声)时,可找到此条件。使用来自远场端射源的声音分量进行校准也可为可接受的,因为此些分量可预期引致可忽略的信道间增益电平差异(例如,归因于分散)。然而,从阵列的端射方向(即,阵列轴线附近的方向)到达的近场声音分量将预期具有表示来源位置信息的信道之间的增益差异而非信道不平衡。因此,使用此些分量进行校准可产生不正确的结果,且可希望使用方向遮蔽操作来区分此些分量与从宽面方向到达的声音分量。 
可使用此基于相位的分类方案来在运行时(例如,在装置的使用期间,无论是连续或是间歇地)支持校准操作。以此方式,可实现自身不受信道增益响应不平衡影响的快速且准确的信道校准操作。或者,可在某一时间周期内积累来自选定时频点的信息以支持稍后进行的信道校准操作。 
图4A展示根据一般配置的处理多信道信号的方法M100的流程图,其包括任务T100、T200、T300及T400。任务T100针对多信道信号的多个不同频率分量中的每一者计算所述信号的信道(例如,麦克风信道)之间的相位差。任务T200计算所述多信道信号的第一信道的电平及所述多信道信号的第二信道的对应电平。任务T300基于计算出的电平及所述计算出的相位差中的至少一者,更新增益因子值。基于所更新的增益因子值,任务T400相对于所述第一信道的对应振幅更改所述第二信道的振幅,以产生经处理(例如,经平衡)的多信道信号。还可使用方法M100来支持对所述多信道信号的进一步操作(例如,如本文中更详细地描述),例如SSP操作。 
方法M100可经配置以将所述多信道信号处理成一连串区段。典型区段长度为约五或十毫秒至约四十或五十毫秒,且所述区段可为重叠(例如,与相邻区段重叠25%或50%)或不重叠。在一个特定实例中,将所述多信道信号划分成一连串非重叠区段或“帧”,其各自具有十毫秒的长度。任务T100可经配置以针对所述区段中的每一者计算一组相位差(例如,向量)。在方法M100的一些实施方案中,任务T200经配置以计算每一信道的区段中的每一者的电平,且任务T300经配置以更新所述区段中的至少一些区段的增益因子值。在方法M100的其它实施方案中,任务T200经配置以计算每一信道的区段中的每一者的一组子带电平,且任务T300经配置以更新一组子带增益因子值中的一者或一者以上。由方法M100处理的区段也可为由不同操作处理的较大区段的区段(即,“子帧”),或反之亦然。 
图4B展示任务T100的实施方案T102的流程图。对于每一麦克风信道来说,任务T102包括子任务T110的相应例子,其针对不同频率分量中的每一者来估计所述信道的相位。图4C展示任务T110的实施方案T112的流程图,实施方案T112包括子任务T1121及T1122。任务T1121计算所述信道的频率变换,例如快速傅立叶变换(FFT)或离散余弦变换(DCT)。任务T1121通常经配置以针对每一区段计算所述信道的频率变换。举例来说,可希望配置任务T1121以执行每一区段的128点或256点FFT。任务T1121的替代实施方案经配置以使用子带滤波器组来分离所述信道的各种频率分量。 
任务T1122针对不同频率分量(也称作“频段”)中的每一者来计算(例如,估计)麦克风信道的相位。举例来说,对于待检查的每一频率分量来说,任务T1122可经配置以将所述相位估计为对应FFT系数的虚数项与所述FFT系数的实数项的比率的逆正切(也称作反正切(arctangent))。 
任务T102还包括子任务T120,所述子任务T120基于每一信道的估计相位来针对不同频率分量中的每一者计算相位差 任务T120可经配置以通过从所述频率分量在一信道中的估计相位减去所述频率分量在另一信道中的估计相位来计算相位差。举例来说,任务T120可经配置以通过从所述频率分量在一(例如,次要)信道中的的估计相位减去所述频率分量在另一(主要)信道中的的估计相位来计算相位差。在此种情况下,所述主要信道可为预期具有最高信噪比的信道,例如对应于以下麦克风的信道:所述麦克风预期在装置的典型使用期间最直接地接收用户的话音。 
可希望配置方法M100(或经配置以执行此方法的系统或设备)以估计在频率的宽带范围内多信道信号的信道之间的相位差。举例来说,此宽带范围可从零Hz、五十Hz、一百Hz或两百Hz的低频界扩展到三kHz、3.5kHz或四kHz(或甚至更高,例如高达 七kHz或八kHz或以上)的高频界。然而,任务T100可不必计算所述信号的整个带宽上的相位差。举例来说,对于在此宽带范围中的许多频带来说,相位估计可为不切实际或不必要的。在极低频率下对所接收波形的相位关系所作的实际评价通常需要变换器之间的对应较大间距。因此,麦克风之间的最大可用间距可确定低频界。另一方面,麦克风之间的距离不应超过最小波长的一半以便避免空间混叠。举例来说,八千赫兹的取样速率给出从零千赫兹到四千赫兹的带宽。四kHz信号的波长为约8.5厘米,因此在此种情况下,邻近麦克风之间的间距不应超过约四厘米。麦克风信道可经低通滤波以便去除可能引致空间混叠的频率。 
因此,可希望配置任务T1122以计算针对少于由任务T1121产生的全部频率分量(例如,少于由任务T1121执行的FFT的全部频率样本)的相位估计。举例来说,任务T1122可经配置以计算约五十Hz、100Hz、200Hz或300Hz到约500Hz或1000Hz(明确地涵盖并揭示这八个组合中的每一者)的频率范围的相位估计。可预期,此范围将包括尤其可用于校准的分量且将排除较不可用于校准的分量。 
可希望还配置任务T100以计算将用于实现除信道校准外的目的的相位估计。举例来说,任务T100还可经配置以计算将用以跟踪及/或增强用户的话音(例如,如下文更详细地描述)的相位估计。在一个此种实例中,任务T1122还经配置以计算针对700Hz到2000Hz的频率范围的相位估计,所述范围可预期包括大多数用户话音的能量。对于四千赫兹带宽信号的128点FFT来说,700Hz到2000Hz的范围粗略地对应于从第十个样本到第三十二个样本的二十三个频率样本。在其它实例中,任务T1122经配置以计算从约五十Hz、100Hz、200Hz、300Hz或500Hz的下界扩展到约700Hz、1000Hz、1200Hz、1500Hz或2000Hz的上界(明确地涵盖并揭示这些下界及上界的二十五个组合中的每一者)的频率范围内的相位估计。 
电平计算任务T200经配置以计算多信道信号的对应区段中的第一信道及第二信道中的每一者的电平。或者,任务T200可经配置以计算所述多信道信号的对应区段的一组子带中的每一者中的第一及第二信道中的每一者的电平。在此种情况下,任务T200可经配置以计算具有同一宽度(例如,500Hz、1000Hz或1200Hz的均一宽度)的一组子带中的每一者的电平。或者,任务T200可经配置以计算一组子带中的每一者的电平,其中所述子带中的至少两者(可能所有)具有不同宽度(例如,具有非均一宽度的一组子带,例如根据信号频谱的巴克(Bark)或美尔(Mel)标度分格的宽度)。 
任务T200可经配置以将选定子带中的每一信道在时域中的电平L计算为所述信道中的所述子带在对应时间周期内(例如,在对应区段内)的振幅或量值(也称作“绝对 振幅”或“经矫正振幅”)的度量。振幅或量值的度量的实例包括总量值、平均量值、均方根(RMS)振幅、中值量值及峰值量值。在数字域中,可根据例如以下等式中的一者的表达式来在n个样本值xi,i=1,2,...,n的块(或“帧”)内计算此度量: 
mediani=1,2,...n|xi|(中值量值);(4) 
maxi=1,2,...n|xi|(峰值量值)。   (5) 
任务T200还可经配置以根据此表达式来计算选定子带的每一信道在频域(例如,傅立叶变换域)或另一变换域(例如,离散余弦变换(DCT)域)中的电平L。任务T200还可经配置以根据类似表达式(例如,使用积分代替求和)来计算在模拟域中的电平。 
或者,任务T200可经配置以将选定子带的每一信道在时域中的电平L计算为所述子带在对应时间周期内(例如,在对应区段内)的能量的度量。能量的度量的实例包括总能量及平均能量。在数字域中,可根据例如以下等式的表达式来在n个样本值xi,i=1,2,...,n的块内计算这些度量: 
任务T200还可经配置以根据此表达式来计算选定子带的每一信道在频域(例如,傅立叶变换域)或另一变换域(例如,离散余弦变换(DCT)域)中的电平L。任务T200还可经配置以根据类似表达式(例如,使用积分代替求和)来计算在模拟域中的电平。 在另一替代方案中,任务T200经配置以将选定子带的每一信道的电平计算为所述子带在对应时间周期内(例如,在对应区段内)的功率谱密度(PSD)。 
或者,任务T200可以类似方式配置以将多信道信号的选定区段的每一信道i在时域中、在频域中或在另一变换域中的电平Li计算为所述区段在所述信道中的振幅、量值或能量的度量。举例来说,任务T200可经配置以将区段的信道的电平L计算为所述区段在所述信道中的时域样本值的平方和,或计算为所述区段在所述信道中的频域样本值的平方和,或计算为所述区段在所述信道中的PSD。由任务T300处理的区段还可为由由不同操作处理的较大区段的区段(即,“子帧”),或反之亦然。 
可希望配置任务T200以在计算电平值之前对音频信号信道执行一个或一个以上频谱成形操作。此些操作可在模拟域及/或数字域中执行。举例来说,可希望配置任务T200以在计算对应的电平值之前将低通滤波器(具有(例如)200Hz、500Hz或1000Hz的截止频率)或带通滤波器(具有(例如)200Hz到1kHz的通带)应用于来自相应信道的信号。 
增益因子更新任务T300经配置以基于所计算出的电平来更新至少一个增益因子中的每一者的值。举例来说,可希望配置任务T300以基于如由任务T200所计算的每一信道在对应的选定频率分量中的电平之间的所观察到的不平衡来更新增益因子值中的每一者。 
任务T300的此实施方案可经配置以将所述所观察到的不平衡计算为线性电平值的函数(例如,根据例如L1/L2的表达式计算为比率,其中L1及L2分别表示第一信道及第二信道的电平)。或者,任务T300的此实施方案可经配置以将所述所观察到的不平衡计算为对数域中的电平值的函数(例如,根据例如L1-L2的表达式计算为差)。 
任务T300可经配置以使用所述所观察到的不平衡作为对应频率分量的经更新增益因子值。或者,任务T300可经配置以使用所述所观察到的不平衡来更新所述增益因子的对应先前值。在此种情况下,任务T300可经配置以根据例如下式的表达式来计算经更新的值: 
Gin=(μi)Gi(n-1)+(1-μi)Rin,(8) 
其中Gin表示频率分量i的对应于区段n的增益因子值,Gi(n-1)表示频率分量i的对应于前一区段(n-1)的增益因子值,Rin表示区段n中针对频率分量i所计算的所观察到的不平衡,且μi表示时间平滑因子,其具有在0.1(最大平滑)到1(无平滑)的范 围中的值,例如0.3、0.5或0.7。任务T300的此实施方案针对每一频率分量使用同一平滑因子值μi为典型但非必需的。还有可能配置任务T300以在计算所观察到的不平衡之前对所观察到的电平的值进行时间平滑,及/或在计算经更新增益因子值之前对所观察到的信道不平衡的值进行时间平滑。 
如下文更详细地描述,增益因子更新任务T300还经配置以基于来自在任务T100中计算的多个相位差的信息(例如,所述多信道信号的声平衡部分的识别)来更新至少一增益因子中的每一者的值。在所述多信道信号的任一特定区段处,任务T300可更新少于全部的所述组增益因子值。举例来说,致使频率分量在校准操作期间保持声不平衡的来源的存在可妨碍任务T300计算所述频率分量的所观察到的不平衡及新增益因子值。因此,可希望配置任务T300以在频率内平滑所观察到的电平、所观察到的不平衡及/或增益因子的值。举例来说,任务T300可经配置以计算选定频率分量的所观察到的电平(或所观察到的不平衡或增益因子)的平均值,且将此计算出的平均值指派给未选频率分量。在另一实例中,任务T300经配置以根据例如下式的表达式来更新对应于未选频率分量i的增益因子值: 
Gin=(β)Gi(n-1)+(1-β)G(i-1)n, (9) 
其中Gin表示频率分量i的对应于区段n的增益因子值,Gi(n-1)表示频率分量i的对应于前一区段(n-1)的增益因子值,G(i-1)n表示相邻频率分量(i-1)的对应于区段n的增益因子值,且β为频率平滑因子,其具有在零(无更新)到一(无平滑)的范围中的值。在另一实例中,改变表达式(9)以使用最接近的选定频率分量的增益因子值来代替G(i-1)n。任务T300可经配置以在时间平滑之前、之后或与之同时来执行频率上的平滑。 
任务T400通过基于在任务T300中更新的至少一个增益因子值来相对于所述多信道信号的另一信道的对应响应特性而更改所述多信道信号的一信道的响应特性(例如,增益响应)来产生经处理的多信道信号(也称作“经平衡”或“经校准”信号)。任务T400可经配置以通过使用一组子带增益因子值中的每一者相对于频率分量在第一信道中的振幅而改变对应频率分量在第二信道中的振幅来产生经处理的多信道信号。举例来说,任务T400可经配置以放大来自响应性较小的信道的信号。或者,任务T400可经配置以控制频率分量在对应于次要麦克风的信道中的振幅(例如,放大或衰减)。如上文所述,在所述多信道信号的任何特定区段处,有可能更新少于全部的所述组增益因子值。 
任务T400可经配置以通过将单个增益因子值应用于所述信号的每一区段或通过另 外将一增益因子值应用于一个以上频率分量来产生经处理的多信道信号。举例来说,任务T400可经配置以应用所述经更新的增益因子值以相对于主要麦克风信道的对应振幅更改次要麦克风信道的振幅(例如,相对于主要麦克风信道来放大或衰减次要麦克风信道)。 
任务T400可经配置以在线性域中执行信道响应平衡。举例来说,任务T400可经配置以通过将第二信道中的区段的时域样本的值中的每一者乘以对应于所述区段的增益因子的值来控制所述区段的所述第二信道的振幅。对于子带增益因子来说,任务T400可经配置以通过以下操作来控制对应频率分量在所述第二信道中的振幅:将所述振幅乘以所述增益因子的值,或在时域中使用子带滤波器来将所述增益因子应用于对应子带。 
或者,任务T400可经配置以在对数域中执行信道响应平衡。举例来说,任务T400可经配置以通过将所述增益因子的对应值与对数增益控制值相加来控制区段的第二信道的振幅,所述对数增益控制值在所述区段的持续时间内应用于所述信道。对于子带增益因子来说,任务T400可经配置以通过将对应增益因子的值与振幅相加来控制频率分量在第二信道中的振幅。在此些情况下,任务T400可经配置以接收为对数值的振幅及增益因子值(例如,以分贝为单位)及/或将线性振幅或增益因子值转换成对数值(例如,根据例如xlog=20log xlin的表达式,其中xlin为线性值,且xlog为对应的对数值)。 
任务T400可与信道的其它振幅控制(例如,自动增益控制(AGC)或自动音量控制(AVC)模块、用户操作的音量控制等)组合或在信道的其它振幅控制上游或下游执行。 
对于两个以上麦克风的阵列来说,可希望对两对或两对以上信道中的每一者执行方法M100的相应例子,使得每一信道的响应可用至少一个其它信道的响应来平衡。举例来说,可执行方法M100(例如,方法M110)的一个例子以基于一对信道(例如,第一信道与第二信道)来计算一致性度量,而执行方法M100的另一例子以基于另一对信道(例如,第一信道与第三信道,或第三信道与第四信道)来计算一致性度量。然而,对于不对一对信道执行共用操作的情况来说,可省略所述对信道的平衡。 
增益因子更新任务T300可包括使用来自计算出的相位差的信息来指示所述多信道信号的预期在每一信道中具有相同电平的频率分量及/或区段(例如,预期通过相应麦克风信道实现相等响应的频率分量及/或区段,在本文中也称作“声平衡部分”)及基于来自所述部分的信息来计算一个或一个以上增益因子值。可预期,从在阵列R100的宽面方向上的来源接收到的声音分量将通过麦克风MC10及MC20实现相等响应。相反,可预期,从在阵列R100的任一端射方向上的近场源接收到的声音分量将致使麦克风具有 比另一麦克风高的输出电平(即,将为“声不平衡”)。因此,可希望配置任务T300以使用在任务T100中计算出的相位差来确定所述多信道信号的对应频率分量是声平衡或是声不平衡的。 
任务T300可经配置以对由任务T100计算出的相位差执行方向遮蔽操作,以为对应频率分量中的每一者获得遮蔽分数。根据上文关于由任务T100在有限频率范围内进行的相位估计的论述,任务T300可经配置以为所述信号的少于全部的频率分量(例如,为由任务T1121执行的FFT的少于全部的频率样本)获得遮蔽分数。 
图5A展示任务T300的实施方案T302的流程图,实施方案T302包括子任务T310、T320及T340。对于来自任务T100的多个计算出的相位差中的每一者来说,任务T310计算对应的方向指示符。任务T320使用方向遮蔽函数来给所述方向指示符分等级(例如,将所述方向指示符的值转换或映射到振幅或量值标度上的值)。基于由任务T320产生的等级,任务T340计算经更新的增益因子值(例如,根据上述表达式(8)或(9))。举例来说,任务T340可经配置以:选择所述信号的频率分量,所述频率分量的等级指示其为声平衡的;及计算这些分量中的每一者的经更新增益因子值,其系基于所述分量的信道之间的所观察到的不平衡。 
任务T310可经配置以将所述方向指示符中的每一者计算为所述多信道信号的对应频率分量fi的到达方向θi。举例来说,任务T310可经配置以将到达方向θi估计为数量 的逆余弦(也称作反余弦(arccosine)),其中c表示音速(约340m/sec),d表示麦克风之间的距离, 表示两个麦克风的对应相位估计之间的弧度的差异,且fi为相位估计所对应于的频率分量(例如,对应FFT样本的频率,或对应子带的中心或边缘频率)。或者,任务T310可经配置以将到达方向θi估计为数量 的逆余弦,其中λi表示频率分量fi的波长。 
图6A展示几何近似法的实例,其说明用此方法来估计相对于双麦克风阵列MC10、MC20中的麦克风MC20的到达方向θ。在此实例中,值θi=0指示从参考端射方向(即,麦克风MC10的方向)到达麦克风MC20的信号,值θi=π指示从另一端射方向到达的信号,且值θi=π/2指示从宽面方向到达的信号。在另一实例中,任务T310可经配置以相对于不同参考位置(例如,麦克风MC10或某其它点,例如在麦克风中间的点)及/或不同参考方向(例如,另一端射方向、宽面方向等)来评估θi。 
图6A中所展示的几何近似法假定距离s等于距离L,其中s为麦克风MC20的位置 与麦克风MC10的位置到声音源与麦克风MC20之间的线上的正交投影之间的距离,且L为每一麦克风到声音源的距离之间的实际差异。随着相对于麦克风MC20的到达方向θ接近于零,误差(s-L)变小。随着声音源与麦克风阵列之间的相对距离增加,此误差也变小。 
图6A中所说明的方案可用于 的第一象限及第四象限值(即,从零到+π/2及从零到-π/2)。图6B展示针对 的第二象限值及第三象限值(即,从+π/2到-π/2)使用同一近似法的实例。在此种情况下,可如上文所述那样计算逆余弦以评估角度ζ,接着从π弧度减去所述角度ζ以产生到达方向θi。实践中的工程师还将理解,可以度或适合于特定应用的任何其它单位替代弧度来表达到达方向θi。 
可希望配置任务T300以选择具有接近于π/2弧度的到达方向(例如,在阵列的宽面方向上)的频率分量。因此,(一方面) 的第一象限值及第四象限值与(另一方面) 的第二象限值及第三象限值之间的区别对于实现校准目的来说可变得不重要。 
在替代实施方案中,任务T310经配置以将方向指示符中的每一者计算为所述多信道信号的对应频率分量fi的到达时间延迟τi(例如,以秒为单位)。任务T310可经配置以使用例如 或 的表达式来估计参考麦克风MC10的到达麦克风MC20的到达时间延迟τi。在这些实例中,值τi=0指示从宽面方向到达的信号,τi的大正值指示从参考端射方向到达的信号,且τi的大负值指示从另一端射方向到达的信号。在计算值τi的过程中,可希望使用被视为适合于特定应用的时间单位,例如取样周期(例如,对于8kHz的取样速率来说为125微秒的单位)或秒的分数(例如,10-3、10-4、10-5或10-6秒)。请注意,任务T310还可经配置以通过在时域中将每一信道的频率分量fi交叉相关来计算到达时间延迟τi。 
对于直接从同一点源到达的声音分量来说,值 理想地对于所有频率来说均等于常数k,其中值k与到达方向θ及到达时间延迟τ有关。在另一替代实施方案中,任务T310经配置以将方向指示符中的每一者计算为估计相位差 与频率fi之间的比率ri(例如, 或 )。 
请注意,虽然表达式 或 根据远场模型(即,采取 平面波前的模型)来计算方向指示符θi,但表达式  及 根据近场模型(即,采取球形波前的模型,如图7中所说明)来计算方向指示符τi及ri。虽然基于近场模型的方向指示符可提供较准确及/或较易于计算的结果,但基于远场模型的方向指示符提供相位差与方向指示符值之间的非线性映射,此可为方法M100的某些配置所要的。 
任务T302还包括子任务T320,其对由任务T310产生的方向指示符分等级。任务T320可经配置以通过针对待检查的每一频率分量将方向指示符的值转换或映射到以振幅、量值或通过/失败为标度的对应值(也称作“遮蔽分数”)来对方向指示符分等级。举例来说,任务T320可经配置以使用方向遮蔽函数来将每一方向指示符的值映射到一遮蔽分数,所述遮蔽分数指示所指示的方向是否落在遮蔽函数的通带内(及/或所落入的程度)。(在此上下文中,术语“通带”指代遮蔽函数所通过的到达方向的范围。)各个频率分量的遮蔽分数集合可被视为向量。任务T320可经配置以串行地及/或并行地对各个方向指示符分等级。 
可选择遮蔽函数的通带以包括所要信号方向。可通过改变通带的宽度来控制遮蔽函数的空间选择性。举例来说,可希望根据收敛速率与校准准确性之间的折衷来选择通带宽度。虽然较宽的通带可通过允许较多频率分量用于校准操作而允许较快速的收敛,但还将预期通过容许从与阵列的宽面轴线相距更远的方向到达(且因此可预期不同地影响到麦克风)的分量而导致较不准确。在一个实例中,任务T300(例如,任务T320,或任务T330,如下文所描述)经配置以选择从阵列的宽面轴线的十五度内的方向到达的分量(即,具有在七十五度到105度或等效地5π/12到7π/12弧度的范围中的到达方向的分量)。 
图8A展示遮蔽函数的实例,其具有在通带与阻带之间相对突然的转变(也称作“砖墙式(brickwall)”轮廓)及中心在到达方向θ=π/2处的通带。在一个此种情况下,任务T320经配置以:在方向指示符指示在所述函数的通带内的方向时指派具有第一值(例如,一)的二进制值遮蔽分数;及在方向指示符指示所述函数的通带外的方向时指派具有第二值(例如,零)的遮蔽分数。可希望改变阻带与通带之间的转变的位置,视一个或一个以上因素而定,例如信噪比(SNR)、噪声基准等(例如,以在SNR为高时(其指示可不利地影响校准准确性的所要方向性信号的存在)使用较窄的通带)。 
或者,可希望配置任务T320以使用通带与阻带之间具有较不陡峭的转变(例如, 较渐进的滚降,产生非二进制值的遮蔽分数)的遮蔽函数。图8B展示具有中心在到达方向θ=π/2处的通带的遮蔽函数的线性滚降的实例,且图8C展示具有中心在到达方向θ=π/2处的通带的遮蔽函数的非线性滚降的实例。可希望改变阻带与通带之间的转变的位置及/或陡度,视一个或一个以上因素而定,例如信噪比(SNR)、噪声基准等(例如,以在SNR为高时(其指示可不利地影响校准准确性的所要方向性信号的存在)使用较陡峭的滚降)。当然,还可按时间延迟τ或比率r而非方向θ来表达遮蔽函数(例如,如图8A到图8C中所展示)。举例来说,到达方向θ=π/2对应于为零的时间延迟τ或比率 
非线性遮蔽函数的一个实例可表达为 m = 1 1 + exp ( r [ | θ - θ T | - ( w 2 ) ] ) , 其中θT表示目标到达方向,w表示遮蔽的所要宽度(以弧度为单位),且γ表示陡度参数。图9A到图9C分别展示此函数在(γ,w,θT)等于  及 时的实例。当然,也可按时间延迟τ或比率r而非方向θ来表达此函数。可希望改变遮蔽的宽度及/或陡度,视一个或一个以上因素而定,例如SNR、噪声基准等(例如,以在SNR为高时使用较窄的遮蔽及/或较陡峭的滚降)。 
图5B展示任务T300的替代实施方案T304的流程图。替代使用同一遮蔽函数来对多个方向指示符中的每一者分等级,任务T304包括子任务T330,其使用计算出的相位差作为方向指示符,从而使用对应的方向遮蔽函数mi来对每一相位差 分等级。举例来说,对于希望选择从在θL到θH的范围中的方向到达的声音分量的情况来说,每一遮蔽函数mi可经配置以具有范围为 到 的通带,其中 (等效地, )且 (等效地, )。对于希望选择从对应于在τL到τH的到达时间延迟范围中的方向到达的声音分量的情况来说,每一遮蔽函数mi可经配置以具有范围为 到 的通带,其中 (等效地, )且 (等效地, )。对于希望选择从对应于在rL到rH的相位差与频率的比率的范围的方向到达的声音分量的情况来说,每一遮蔽函数mi可经配置以具有范围为 到 的通带,其中 且 如上文参考 任务T320所论述,可根据一个或一个以上因素(例如,SNR、噪声基准等)来选择每一遮蔽函数的轮廓。 
可希望配置任务T300以将频率分量中的一者或一者以上(可能所有)中的每一者的遮蔽分数产生为经时间平滑的值。任务T300的此实施方案可经配置以将此值计算为在最近m个帧内所述频率分量的遮蔽分数的平均值,其中m的可能值包括五、十、二十及五十。更一般地说,任务T300的此实施方案可经配置以使用时间平滑函数(例如,有限或无限脉冲响应(FIR或IIR)滤波器)来计算经平滑值。在一个此种实例中,任务T300经配置以根据例如vi(n)=αivi(n-1)+(1-αi)ci(n)的表达式来计算帧n的频率分量i的遮蔽分数的经平滑值vi(n),其中vi(n-1)表示前一帧的频率分量i的遮蔽分数的经平滑值,ci(n)表示频率分量i的遮蔽分数的当前值,且αi为平滑因子,其值可选自零(无平滑)到一(无更新)的范围。此一次IIR滤波器还可被称作“漏积分器(leaky integrator)”。 
平滑因子αi的典型值包括0.99、0.09、0.95、0.9及0.8。任务T300针对一帧的每一频率分量使用αi的同一值为典型但非必需的。在初始收敛周期(例如,紧跟在音频感测电路的通电或其它激活后)期间,可希望任务T300在较短间隔内计算经平滑值,或使用的平滑因子αi中的一者或一者以上(可能所有)的值比在随后定态操作期间所用的值小。 
任务T340可经配置以使用来自所述多个遮蔽分数的信息来选择所述信号的声平衡部分。任务T340可经配置以采取二进制值遮蔽分数作为声平衡的直接指示符。举例来说,对于通带处于阵列R100的宽面方向上的遮蔽来说,任务T340可经配置以选择遮蔽分数为一的频率分量,而对于通带处于阵列R100的端射方向上的遮蔽来说(例如,如图3B中所展示),任务T340可经配置以选择遮蔽分数为零的频率分量。 
对于非二进制值遮蔽分数的情况来说,任务T340可经配置以将所述遮蔽分数与阈值进行比较。举例来说,对于通带处于阵列R100的宽面方向上的遮蔽来说,可希望任务T340在频率分量的遮蔽分数大于(或者,不小于)所述阈值的情况下将所述频率分量识别为声平衡部分。类似地,对于通带处于阵列R100的端射方向上的遮蔽来说,可希望任务T340在频率分量的遮蔽分数小于(或者,不大于)所述阈值的情况下将所述频率分量识别为声平衡部分。 
任务T340的此实施方案可经配置以针对所有频率分量使用同一阈值。或者,任务T340可经配置以针对所述频率分量中的两个或两个以上(可能所有)中的每一者使用不同阈值。任务T340可经配置以使用固定阈值,或者任务T340可经配置以基于信号的特性(例如,帧能量)及/或遮蔽的特性(例如,通带宽度)而随时间逐区段地调适所述阈 值。 
图5C展示方法M100的实施方案M200的流程图,实施方案M200包括任务T200的实施方案T205;任务T300(例如,任务T302或T304)的实施方案T305;及任务T400的实施方案T405。任务T205经配置以计算每一信道在(至少)两个子带中的每一者中的电平。任务T305经配置以更新所述子带中的每一者的增益因子值,且任务T405经配置以应用每一经更新增益因子值以相对于第一信道在对应子带中的振幅而更改第二信道在所述子带中的振幅。 
当在无来自理想点源的回响的情况下接收到信号时,所有频率分量应具有同一到达方向(例如,比率 的值在所有频率内应恒定)。信号的不同频率分量具有同一到达方向的程度也称作“方向一致性”。相较于源自近场源(例如,用户的话音)的所接收声音,在麦克风阵列接收到源自远场源(例如,背景噪声源)的声音时,所得多信道信号通常将较不具有方向一致性。举例来说,在不同频率分量中的每一者处麦克风信道之间的相位差与源自远场源的所接收声音的频率的相关性通常比与源自近场源的所接收声音的频率的相关性少。 
可希望配置任务T300以使用方向一致性以及到达方向来指示所述多信道信号的一部分(例如,区段或子带)是声平衡或是声不平衡的。举例来说,可希望配置任务T300以基于所述多信道信号的声平衡部分中的频率分量方向一致的程度来选择所述声平衡部分。举例来说,使用方向一致性可通过启用对区段或子带的拒绝而支持信道校准操作的增加的准确性及/或可靠性,所述区段或子带包括由位于阵列的端射方向上的方向一致的来源(例如,近场源)所致的活动。 
图10展示遮蔽函数的方向图案的前向瓣及后向瓣,所述遮蔽函数可由任务T300的实施方案应用于来自双麦克风阵列R100的多信道信号。可预期,从位于此图案外的来源(例如,在阵列R100的宽面方向上的近场源或任何方向上的远场源)接收到的声音分量将为声平衡的(即,麦克风MC10及MC20将产生相等响应)。类似地,可预期,从在此图案的前向瓣或后向瓣内的来源(即,在阵列R100的任一端射方向上的近场源)接收到的声音分量将为声不平衡的(即,将致使一个麦克风具有比另一麦克风高的输出电平)。因此,可希望配置任务T300的对应实施方案以选择不具有在此遮蔽函数图案的任一瓣内的来源的区段或子带(例如,并非方向一致或仅在宽面方向上一致的区段或子带)。 
如上文所述,任务T300可经配置以使用来自由任务T100计算出的相位差的信息来 识别所述多信道信号的声平衡部分。任务T300可经实施以将声平衡部分识别为所述信号的子带或区段,所述子带或区段的遮蔽分数指示其在阵列的宽面方向上方向一致(或者,在端射方向上方向不一致),使得仅对此些经识别的子带或区段执行对应增益因子值的更新。 
图11A展示方法M100的实施方案M110的流程图,实施方案M110包括任务T300的实施方案T306。任务T306包括子任务T360,所述子任务T360基于来自由任务T100计算出的相位差的信息来计算致性度量的值。图11B展示任务T360的实施方案T362的流程图,实施方案T362包括如上文所述的子任务T312及T322的例子及子任务T350。图11C展示任务T360的实施方案T364的流程图,实施方案T364包括如上文所述的子任务T332的例子及子任务T350。 
任务T350可经配置以组合每一子带中的频率分量的遮蔽分数以获得所述子带的一致性度量。在一个此种实例中,任务T350经配置以基于具有特定状态的遮蔽分数的数目来计算一致性度量。在另一实例中,任务T350经配置以将所述一致性度量计算为所述遮蔽分数的总和。在另一实例中,任务T350经配置以将所述一致性度量计算为所述遮蔽分数的平均值。在这些情况中的任一者中,任务T350可经配置以对所述遮蔽分数中的每一者相等地加权(例如,对每一遮蔽分数加权一)或对一个或一个以上遮蔽分数彼此不同地加权(例如,对对应于低频或高频分量的遮蔽分数的加权不如对对应于中间范围频率分量的遮蔽分数的加权那样重)。 
对于通带处于阵列R100的宽面方向上的遮蔽来说(例如,如图8A到图8C及图9A到图9C中所展示),任务T350可经配置以产生一致性指示,所述一致性指示(例如)在遮蔽分数的总和或平均值不小于(或者,大于)阈值的情况下,或在所述子带中至少最少数目个(或者,多于最少数目个)频率分量具有遮蔽分数一的情况下具有第一状态(例如,高或“1”);否则具有第二状态(例如,低或“0”)。对于通带处于阵列R100的端射方向上的遮蔽来说,任务T350可经配置以产生一致性度量,所述一致性度量(例如)在遮蔽分数的总和或平均值不大于(或者,小于)阈值的情况下,或在所述子带中不多于(或者,少于)最大数目个频率分量具有遮蔽分数一的情况下具有第一状态;否则具有第二状态。 
任务T350可经配置以针对每一子带使用同一阈值或针对所述子带中的两个或两个以上(可能所有)中的每一者使用不同阈值。可试探性地确定每一阈值,且可希望随时间而改变阈值,这视一个或一个以上因素而定,例如通带宽度、信号的一个或一个以上特征(例如,SNR、噪声基准)等。(相同原理适用于前一段中所提到的最大及最小数 目。) 
或者,任务T350可经配置以产生所述多信道信号的一连串区段中的每一者的对应方向一致性度量。在此情况下,任务T350可经配置以组合每一区段中的频率分量中的两个或两个以上(可能所有)的遮蔽分数以获得所述区段的一致性度量(例如,如上文所述,基于具有特定状态的遮蔽分数的数目,或所述遮蔽分数的总和或平均值)。任务T350的此实施方案可经配置以针对每一区段使用同一阈值,或如上文所述视一个或一个以上因素而随时间改变所述阈值(例如,相同原理适用于遮蔽分数的最大数目或最小数目)。 
可希望配置任务T350以基于每一区段的所有频率分量的遮蔽分数来计算所述区段的一致性度量。或者,可希望配置任务T350以基于在有限频率范围内的频率分量的遮蔽分数来计算每一区段的一致性度量。举例来说,任务T350可经配置以基于在约五十Hz、100Hz、200Hz或300Hz到约500Hz或1000Hz(明确地涵盖并揭示这八个组合中的每一者)的频率范围内的频率分量的遮蔽分数来计算一致性度量。举例来说,可决定,信道的响应特性之间的差异通过在此频率范围内所述信道的增益响应的差异来充分地表征。 
任务T340可经配置以基于来自由任务T360识别的声平衡部分的信息来计算至少一个增益因子中的每一者的经更新值。举例来说,可希望配置任务T340以响应于多信道信号在对应区段或子带中方向一致的指示(例如,响应于如由对应的一致性指示的状态所指示的在任务T360中对所述子带或区段的选择)来计算经更新的增益因子值。 
任务T400可经配置以使用由任务T300产生的经更新增益因子值以相对于第一信道的振幅来控制第二信道的振幅。如本文中所描述,可希望配置任务T300以基于声平衡区段的所观察到的电平不平衡来更新增益因子值。对于并非声平衡的后续区段来说,可希望任务T300避免更新所述增益因子值,且可希望任务T400继续应用最近更新的增益因子值。图12A展示方法M100的实施方案M120的流程图,实施方案M120包括任务T400的此实施方案T420。任务T420经配置以使用经更新的增益因子值来在多信道信号的一连串连续区段中的每一者(例如,一连串声不平衡区段中的每一者)中,相对于第一信道的振幅更改第二信道的振幅。此一连串区段可连续,直到识别到另一声平衡区段为止,使得任务T300再次更新增益因子值。(如本文中所描述,此段中所描述的原理还可适用于子带增益因子值的更新及应用。) 
方法M100的实施方案还可经配置以支持对多信道信号及/或经处理的多信道信号的各种其它操作,例如空间选择性处理操作(例如,确定音频感测装置与特定声音源之 间的距离、减少噪声、增强从特定方向到达的信号分量,及/或将一个或一个以上声音分量与其它环境声音分离的一个或一个以上操作),其可为依赖校准的。举例来说,经平衡多信道信号(例如,经处理的多信道信号)的应用范围包括:减少不稳定扩散及/或方向性噪声;对由近场所要说话者产生的声音去回响;去除在麦克风信道之间不相关的噪声(例如,风声及/或传感器噪声);抑制来自非所要方向的声音;抑制来自任何方向的远场信号;估计直接路径回响信号强度(例如,为显著减少来自远场源的干扰);经由辨别近场源与远场源来减少不稳定噪声;及减少在近场所要来源活动期间以及在暂停期间来自前面干扰器的声音,这通常不可使用基于增益的方法来实现。 
图12B展示方法M100的实施方案M130的流程图,实施方案M130包括任务T500,任务T500对经处理的多信道信号执行话音活动检测(VAD)操作。图13A展示方法M100的实施方案M140的流程图,实施方案M140包括任务T600,任务T600基于来自经处理的多信道信号的信息来更新噪声估计,且可包括话音活动检测操作。 
可希望实施信号处理方案,所述信号处理方案辨别来自近场源与来自远场源的声音(例如,为进行较佳的噪声减少)。此方案的一个基于振幅或增益的实例使用两个麦克风之间的压力梯度场来确定来源是近场还是远场的。虽然此种技术可用于在近场静默期间减少来自远场源的噪声,然而,在近场源及远场源均在作用中时,此种技术可不支持近场信号与远场信号之间的辨别。 
可希望提供在特定角范围内的一致拾取。举例来说,可希望接受在特定范围(例如,相对于麦克风阵列的轴线的六十度范围)内的所有近场信号,且使其它信号(例如,来自在七十度或以上处的来源的信号)衰减。通过波束成形及BSS,角衰减通常防止跨此范围的一致拾取。在后处理操作已再收敛之前,此些方法还可导致在装置的定向改变(例如,旋转)后的话音拒绝。如本文中所描述,方法M100的实施方案可用以获得噪声减少方法,所述噪声减少方法只要到所要说话者的方向仍在容许方向范围内就具有对装置突然旋转的稳健性,因此避免因收敛延迟所致的话音波动及/或因过时的噪声参考所致的话音衰减。 
通过组合来自经平衡多信道信号的增益差异与基于相位的方向信息,可选择麦克风阵列周围的可监视到信号的存在的可调整空间区。基于增益的及/或方向性的边界可经设定以为不同子任务界定较窄或较宽的拾取区。举例来说,可设定较窄边界以检测所要话音活动,而在选定区域上的较宽边界可用以实现例如噪声减少的目的。相位相关的准确性及增益差异评估趋向于随SNR减小而减小,且可希望相应地调整阈值及/或决策以控制假警报率。 
对于经处理的多信道信号仅用以支持话音活动检测(VAD)操作的应用来说,可接受增益校准在降低的准确性等级下操作,使得可较快速地执行有效且准确的噪声减少操作,其中噪声减少收敛时间减少。 
随着声音源与麦克风对之间的相对距离增加,可预期不同频率分量的到达方向间的一致性减小(例如,归因于回响的增加)。因此,在任务T360中计算出的一致性度量还可在某种程度上用作接近性度量。不同于仅基于到达方向的处理操作,举例来说,如本文所描述的基于一致性度量的值的依赖于时间及/或频率的振幅控制可有效地用于区分用户或其它所要近场源的语音与来自同一方向上的远场源的干扰(例如,竞争性说话者的语音)。方向一致性随距离减低的速率可随环境而改变。举例来说,汽车内部通常产生极大回响,使得在较宽频率范围内的方向一致性在距来源仅约五十厘米的范围内才会随时间维持在可靠的合适等级处。在此种情况下,可能将来自后座乘客的声音当作不一致的声音而加以拒绝,即使所述说话者位于方向遮蔽函数的通带内。在此些环境中对于高个子说话者来说,可检测一致性的范围也可减小(例如,归因于来自附近顶板的反射)。 
所述经处理的多信道信号可用以支持其它空间选择性处理(SSP)操作,例如BSS、到达延迟,或其它方向性SSP,或距离SSP(例如,接近性检测)。接近性检测可基于信道之间的增益差异。可希望在时域中计算增益差异,或在频域中计算增益差异(例如,作为在有限频率范围内及/或在多倍音调频率(pitch frequency)下的一致性度量)。 
便携式音频感测装置的多麦克风噪声减少方案包括波束成形方法及盲源分离(BSS)方法。此些方法通常遭受不能抑制从与所要声音(例如,近场说话者的话音)相同的方向到达的噪声的问题。尤其在头戴式耳机及中场或远场手持型应用(例如,手持机或智能电话的浏览器谈话(browse-talk)模式及扬声器电话模式)中,由麦克风阵列记录的多信道信号可包括来自干扰噪声源的声音及/或所要近场谈话者的语音的显著回响。尤其对于头戴式耳机来说,与用户的嘴巴相距较大距离可允许麦克风阵列拾取来自前面方向的大量噪声,仅使用方向信息可能难以对此噪声加以显著抑制。 
典型BSS或广义旁瓣消除(GSC)型技术通过以下两步来执行噪声减少:首先将所要话音分离到一个麦克风信道中,且接着对经分离的话音执行后处理操作。在声场景改变的情况下,此程序可导致较长的收敛时间。举例来说,基于盲源分离、GSC或类似自适应学习规则的噪声减少方案可在装置-用户保持模式(例如,装置与用户的嘴巴之间的定向)改变及/或环境噪声(例如,通过的汽车、公共地址通告)的响度及/或频谱特征快速改变期间展现出较长的收敛时间。在回响环境(例如,车辆内部)中,自适应学习方案可能具有麻烦的收敛。此方案在收敛方面的失败可致使其拒绝所要信号分量。在话 音通信应用中,此拒绝可增加话音失真。 
为了增加此些方案对装置-用户保持模式的改变的稳健性及/或加快收敛时间,可能希望限制装置周围的空间拾取区以提供更快速的初始噪声减少响应。此方法可经配置以利用麦克风之间的相位与增益关系来通过参照某些角方向(例如,相对于装置的参考方向,例如麦克风阵列的轴线)进行辨别及/或辨别来自近场源的信号分量与来自远场源的信号分量来界定有限空间拾取区。通过使音频装置周围的选择区在所要说话者方向上总是展现出基线初始噪声减少,可实现对所要用户相对于音频装置的空间改变以及环境噪声的快速改变的高度稳健性。 
经平衡信道之间的增益差异可用于接近性检测,其可支持更积极的近场/远场辨别,例如较佳的前面噪声抑制(例如,对用户前面的干扰性说话者的抑制)。视麦克风之间的距离而定,经平衡的麦克风信道之间的增益差异通常仅在来源处于五十厘米或一米内的情况下才会发生。 
图13B展示方法M100的实施方案M150的流程图。方法M150包括任务T700,任务T700对经处理的多信道信号执行接近性检测操作。举例来说,任务T700可经配置以检测:在经处理的多信道信号的信道的电平之间的差异大于阈值时(或者,在(A)未经校准的信道的电平差异与(B)任务T300的增益因子值的总和大于阈值时),区段是来自所要来源(例如,以指示对话音活动的检测)。可试探性地确定所述阈值,且可希望使用不同阈值,这取决于一个或一个以上因素,例如信噪比(SNR)、噪声基准等(例如,以在SNR较低时使用较高的阈值)。图14A展示对应于三个不同阈值的接近性检测区的边界的实例,其中随着阈值增加,区变小。 
可希望将容许方向的范围(例如,正或负四十五度)与近场/远场接近性泡状区组合以获得说话者覆盖范围的锥形,及使来自此区域外的来源的不稳定噪声衰减。此方法可用以使来自远场源的声音衰减,即使在所述远场源处于容许方向范围内仍如此。举例来说,可希望提供良好的麦克风校准以支持近场/远场辨别器的积极调整。图14B展示容许方向范围(例如,如图10中所展示的前向瓣)与接近性泡状区(如图14A中所展示)的相交(以粗体展示)以获得说话者覆盖范围的锥形的实例。在此情况下,可使用在任务T100中计算出的多个相位差以通过使用遮蔽函数(例如,如上文参考任务T312、T322及T332所论述)及/或一致性度量(例如,如上文参考任务T360所论述)识别源自在所要范围内的来源的区段来加强容许方向范围。可根据所要应用来选择此遮蔽函数的方向及轮廓(例如,为话音活动检测选择较陡的轮廓,或为噪声分量的衰减选择较平滑的轮廓)。 
如上文所述,图2展示在相对于用户嘴巴的标准定向中的戴在用户耳朵上的头戴式耳机的俯视图。图15及图16展示如图14B中所展示的应用于此应用的来源选择区边界的俯视图及侧视图。 
可希望将接近性检测操作(例如,任务700)的结果用于话音活动检测(VAD)。在一个此实例中,将非二进制改进的VAD度量应用为对所述信道中的一者或一者以上的增益控制(例如,以使噪声频率分量及/或区段衰减)。图17A展示方法M100的实施方案M160的流程图,实施方案M160包括任务T800,任务T800对经平衡的多信道信号执行此增益控制操作。在另一此实例中,应用二进制改进的VAD来计算(例如,更新)用于噪声减少操作的噪声估计(例如,使用已由VAD操作分类为噪声的频率分量或区段)。图17B展示方法M100的实施方案M170的流程图,实施方案M170包括任务T810,任务T810基于所述接近性检测操作的结果来计算(例如,更新)噪声估计。图18展示方法M170的实施方案M180的流程图。方法M180包括任务T820,任务T820对所述多信道信号的至少一个信道执行噪声减少操作(例如,谱减操作或维纳滤波操作),所述噪声减少操作是基于所述经更新的噪声估计。 
可组合来自接近性检测操作与方向一致性检测操作(例如,界定如图14B及/或图15及图16中所展示的泡状区)的结果以获得经改进的多信道话音活动检测(VAD)操作。所述组合式VAD操作可用于快速地拒绝非话音帧及/或建立噪声减少方案以对主要麦克风信道进行操作。此种方法可包括校准、组合用于VAD的方向及接近性信息,及基于VAD操作的结果而执行噪声减少操作。举例来说,可希望在方法M160、M170或M180中使用此组合式VAD操作来代替接近性检测任务T700。 
典型环境中的声噪声可包括嘈杂说话声噪声、机场噪声、街道噪声、竞争性谈话者的话音,及/或来自干扰性来源(例如,电视机或收音机)的声音。因此,此噪声通常不稳定,且可能具有接近于用户自身话音的频谱的平均频谱。如从单个麦克风信号计算出的噪声功率参考信号通常仅为近似稳定噪声估计。此外,此计算通常必定造成噪声功率估计延迟,使得仅可在显著延迟后执行子带增益的对应调整。可希望获得对环境噪声的可靠且同时的估计。 
噪声估计的实例包括基于单信道VAD的单信道长期估计及如由多信道BSS滤波器产生的噪声参考。任务T810可经配置以通过使用来自接近性检测操作的(双信道)信息来计算单信道噪声参考,以对主要麦克风信道的分量及/或区段进行分类。此噪声估计与其它方法相比可更快地可用,因为其不需要长期估计。不同于基于长期估计的方法,此单信道噪声参考还可捕捉不稳定噪声,基于长期估计的方法通常不能支持对不稳定噪 声的去除。此种方法可提供快速、准确且不稳定的噪声参考。举例来说,此种方法可经配置以针对不处于如图14B中所展示的前向锥形内的任何帧来更新噪声参考。可对所述噪声参考进行平滑(例如,使用一级平滑器,可能对每一频率分量执行)。使用接近性检测可使得使用此种方法的装置能够拒绝附近的瞬时声音,例如进入方向遮蔽函数的前向瓣中的汽车噪声声音。 
可希望配置任务T810以从主信道直接取得噪声参考,而不是等待多信道BSS方案收敛。可使用组合式相位-增益VAD或仅使用相位VAD来构造此噪声参考。此种方法还可有助于避免BSS方案在收敛到说话者与电话之间的新空间配置时或在手持机正在未达最佳空间配置中使用时使话音衰减的问题。 
如上文所描述的VAD指示可用以支持对噪声参考信号的计算。举例来说,在所述VAD指示指示帧为噪声时,可使用所述帧来更新噪声参考信号(例如,主要麦克风信道的噪声分量的频谱轮廓)。举例来说,可通过对频率分量值进行时间平滑(例如,通过用当前噪声估计的对应分量的值来更新每一分量的先前值)来在频域中执行此更新。在一个实例中,维纳滤波器使用所述噪声参考信号来对主要麦克风信道执行噪声减少操作。在另一实例中,谱减操作使用所述噪声参考信号来对主要麦克风信道执行噪声减少操作(例如,通过从主要麦克风信道减去噪声频谱)。在所述VAD指示指示帧并非噪声时,可使用所述帧来更新主要麦克风信道的信号分量的频谱轮廓,所述轮廓还可由维纳滤波器用以执行噪声减少操作。所得操作可被视为利用双信道VAD操作的准单信道噪声减少算法。 
明确地指出,如本文中所描述的接近性检测操作还可应用于不需要信道校准的情形中(例如,麦克风信道已平衡的情形)。图19A展示根据一般配置的方法M300的流程图,其包括如本文中所描述的任务T100及T360以及如本文中所描述的基于一致性度量及接近性决策(例如,如图14B中所展示的泡状区)的VAD操作T900的例子。图19B展示方法M300的实施方案M310的流程图,实施方案M310包括噪声估计计算任务T910(例如,如参考任务T810所描述),且图20A展示方法M310的实施方案M320的流程图,实施方案M320包括噪声减少任务T920(例如,如参考任务T820所描述)。 
图20B展示根据一般配置的设备G100的框图。设备G100包括用于获得多个相位差的装置F100(例如,如本文中参考任务T100所描述)。设备G100还包括用于计算多信道信号的第一信道及第二信道的电平的装置F200(例如,如本文中参考任务T200所描述)。设备G100还包括用于更新增益因子值的装置F300(例如,如本文中参考任务T300所描述)。设备G100还包括用于基于所述经更新的增益因子值来相对于所述第一 信道更改所述第二信道的振幅的装置F400(例如,如本文中参考任务T400所描述)。 
图21A展示根据一般配置的设备A100的框图。设备A100包括相位差计算器100,其经配置以从多信道信号的信道S10-1及S10-2获得多个相位差(例如,如本文中参考任务T100所描述)。设备A100还包括电平计算器200,其经配置以计算所述多信道信号的第一信道及第二信道的电平(例如,如本文中参考任务T200所描述)。设备A100还包括增益因子计算器300,其经配置以更新增益因子值(例如,如本文中参考任务T300所描述)。设备A100还包括增益控制元件400,其经配置以通过基于所述经更新的增益因子值相对于所述第一信道更改所述第二信道的振幅来产生经处理的多信道信号(例如,如本文中参考任务T400所描述)。 
图21B展示设备A110的框图,设备A110包括:设备A100;FFT模块TM10a及TM10b,其经配置以分别在频域中产生信号S10-1及S10-2;及空间选择性处理模块SS100,其经配置以对所述经处理的多信道信号执行空间选择性处理操作(例如,如本文中所描述)。图22展示设备A120的框图,设备A120包括设备A100及FFT模块TM10a及TM10b。设备A120还包括:接近性检测模块700(例如,话音活动检测器),其经配置以对所述经处理的多信道信号执行接近性检测操作(例如,话音活动检测操作)(例如,如本文中参考任务T700所描述);噪声参考计算器810,其经配置以更新噪声估计(例如,如本文中参考任务T810所描述);噪声减少模块820,其经配置以对所述经处理的多信道信号的至少一个信道执行噪声减少操作(例如,如本文中参考任务T820所描述);及逆FFT模块IM10,其经配置以将所述经噪声减少的信号转换到时域。除了接近性检测模块700之外或在接近性检测模块700的替代方案中,设备A110可包括用于对所述经处理的多信道信号进行方向处理(例如,如图14B中所展示的基于前向瓣的话音活动检测)的模块。 
一些多信道信号处理操作使用来自多信道信号的一个以上信道的信息来产生多信道输出的每一信道。此些操作的实例可包括波束成形及盲源分离(BSS)操作。可难以将回波消除与此种技术整合,因为所述操作趋向于改变每一输出信道中的残余回波。如本文中所描述,方法M100可经实施以使用来自计算出的相位差的信息来对所述多信道信号的一个或一个以上信道中的每一者(例如,对主信道)执行单信道时间相关及/或频率相关振幅控制(例如,噪声减少操作)。此单信道操作可经实施,以使得残余回波实质上保持不变。因此,回波消除操作与包括此噪声减少操作的方法M100的实施方案的整合可比回波消除操作与对两个或两个以上麦克风信道操作的噪声减少操作的整合容易。 
可希望使残余背景噪声白化。举例来说,可希望使用VAD操作(例如,如本文所描述的方向性及/或基于接近性的VAD操作)以识别仅噪声间隔,且在此些间隔期间将信号频谱压扩或减少到噪声频谱轮廓(例如,准白或粉红频谱轮廓)。此噪声白化可营造残余稳定噪声基准的感觉,及/或可导致噪声被放入或收回到背景中的感知。可希望包括平滑方案(例如,时间平滑方案)以处理期间不应用白化的间隔(例如,语音间隔)与期间应用白化的间隔(例如,噪声间隔)之间的转变。此平滑可有助于支持间隔之间的平滑转变。 
明确地指出,麦克风(例如,MC10及MC20)更一般地可实施为除了声音外还对辐射或发射敏感的变换器。在一个此实例中,将所述麦克风对实施为一对超音波变换器(例如,对大于十五、二十、二十五、三十、四十或五十千赫兹或以上的声频敏感的变换器)。 
对于方向性信号处理应用(例如,如图14B中所展示,识别前向瓣)来说,可希望以特定频率分量或特定频率范围为目标,跨所述特定频率范围可预期语音信号(或其它所要信号)方向一致。可预期,背景噪声(例如,方向性噪声(例如,来自例如汽车等来源))及/或扩散噪声在同一范围内将方向不一致。语音趋向于在四千赫兹到八千赫兹的范围中具有低功率,因此可希望参考不大于四千赫兹的频率来确定方向一致性。举例来说,可希望在约七百赫兹到约两千赫兹的范围内确定方向一致性。 
如上文所述,可希望配置任务T360以基于有限频率范围内的频率分量的相位差来计算一致性度量。另外或其它,可希望配置任务T360及/或另一方向性处理任务(尤其对于语音应用来说,例如如图14B中所展示,界定前向瓣),以基于多倍音调频率下的频率分量来计算一致性度量。 
有声语音(例如,元音声音)的能谱趋向于在音调频率的谐波下具有局部峰值。另一方面,背景噪声的能谱趋向于为相对松散的。因此,输入信道在音调频率的谐波下的分量可预期具有比其它分量高的信噪比(SNR)。对于方法M100的语音处理应用(例如,话音活动检测应用)的方向性处理任务来说,可希望配置所述任务(例如,配置前向瓣识别任务)以仅考虑对应于多倍的估计音调频率的相位差。 
典型的音调频率范围为男性说话者的约70Hz到100Hz到女性说话者的约150Hz到200Hz。可通过将音调周期计算为邻近音调峰值之间的距离(例如,在主要麦克风信道中)来估计当前音调频率。可基于以下两者将输入信道的样本识别为音调峰值:其能量的度量(例如,基于样本能量与帧平均能量之间的比率)及/或所述样本的邻域与已知音调峰值的类似邻域的相关程度的度量。音调估计程序描述于(例如)EVRC(增强型 可变速率编解码器)文献C.S0014-C的第4.6.3章(第4-44页到第4-49页)中,所述文献可在www.3gpp.org在线可得。音调频率的当前估计(例如,呈音调周期或“音调滞后”的估计的形式)通常已可用于以下应用中,所述应用包括语音编码及/或解码(例如,使用以下编解码器的话音通信,所述编解码器包括音调估计,例如码激励线性预测(CELP)及原型波形内插(PWI))。 
通过仅考虑对应于多倍的音调频率的那些相位差,待考虑的相位差的数目可显著减少。此外,可预期,从中计算这些选定相位差的频率系数在正考虑的频率范围内相对于其它频率系数将具有高SNR。在更一般的情况下,还可考虑其它信号特性。举例来说,可希望配置方向性处理任务,使得所计算出的相位差的至少百分之二十五、百分之五十或百分之七十五对应于多倍的估计音调频率。相同原理还可适用于其它所要谐波信号。 
如上文所述,可希望产生便携式音频感测装置,其具有经配置以接收声信号的两个或两个以上麦克风的阵列R100。可经实施以包括此阵列且可用于音频记录及/或话音通信应用的便携式音频感测装置的实例包括电话手持机(例如,蜂窝式电话手持机);有线或无线头戴式耳机(例如,蓝牙头戴式耳机);手持型音频及/或视频记录器;经配置以记录音频及/或视频内容的个人媒体播放器;个人数字助理(PDA)或其它手持型计算装置;及笔记本型计算机、膝上型计算机、上网本型计算机或其它便携式计算装置。 
阵列R100的每一麦克风可具有为全向、双向或单向(例如,心形指向)的响应。可用于阵列R100中的各种类型的麦克风包括(但不限于)压电麦克风、动圈式麦克风及驻极体麦克风。在用于便携式话音通信的装置(例如,手持机或头戴式耳机)中,阵列R100的邻近麦克风之间的中心到中心间距通常在约1.5cm到约4.5cm的范围内,但较大间距(例如,至多达10cm或15cm)在例如手持机等装置中也是可能的。在助听器中,阵列R100的邻近麦克风之间的中心到中心间距可小至约4mm或约5mm。阵列R100的麦克风可沿线配置,或者经配置以使得其中心位于二维(例如,三角形)或三维形状的顶点处。 
在多麦克风音频感测装置(例如,如本文中所描述,装置D100、D200、D300、D400、D500或D600)的操作期间,阵列R100产生多信道信号,其中每一信道是基于所述麦克风中的对应者对声环境的响应。一个麦克风可比另一麦克风更直接地接收特定声音,使得对应信道彼此不同以共同提供比使用单个麦克风可捕捉到的声环境表示更完整的声环境表示。 
可希望阵列R100对由所述麦克风产生的信号执行一个或一个以上处理操作以产生多信道信号S10。图23A展示阵列R100的实施方案R200的框图,实施方案R200包括 经配置以执行一个或一个以上此些操作的音频预处理级AP10,所述操作可包括(但不限于)阻抗匹配、模/数转换、增益控制,及/或在模拟域及/或数字域中的滤波。 
图23B展示阵列R200的实施方案R210的框图。阵列R210包括音频预处理级AP10的实施方案AP20,实施方案AP20包括模拟预处理级P10a及P10b。在一个实例中,级P10a及P10b各自经配置以对对应的麦克风信号执行高通滤波操作(例如,截止频率为50Hz、100Hz或200Hz)。 
可希望阵列R100将所述多信道信号产生为数字信号,也就是说,产生为样本序列。举例来说,阵列R210包括模/数转换器(ADC)C10a及C10b,其各自经布置以对对应的模拟信道进行取样。声应用的典型取样速率包括8kHz、12kHz、16kHz及在约8kHz到约16kHz的范围内的其它频率,但还可使用高达约44kHz的取样速率。在此特定实例中,阵列R210还包括数字预处理级P20a及P20b,其各自经配置以对对应的数字化信道执行一个或一个以上预处理操作(例如,回波消除、噪声减少及/或频谱成形)。 
明确地指出,阵列R100的麦克风更一般地可实施为除了声音外还对辐射或发射敏感的变换器。在一个此实例中,将阵列R100的麦克风实施为超音波变换器(例如,对大于十五、二十、二十五、三十、四十或五十千赫兹或以上的声频敏感的变换器)。 
图24A展示根据一般配置的装置D10的框图。装置D10包括本文中所揭示的麦克风阵列R100的实施方案中的任一者的例子,且本文中所揭示的音频感测装置中的任一者可实施为装置D10的例子。装置D10还包括设备A10的实施方案的例子,其经配置以处理如由阵列R100产生的多信道信号以计算一致性度量的值。举例来说,设备A10可经配置以根据本文中所揭示的方法M100的实施方案中的任一者的例子来处理多信道音频信号。设备A10可以硬件及/或软件(例如,固件)来实施。举例来说,设备A10可实施于装置D10的处理器上,所述处理器还经配置以对经处理的多信道信号执行如上文所述的空间处理操作(例如,确定音频感测装置与特定声音源之间的距离、减少噪声、增强从特定方向到达的信号分量及/或将一个或一个以上声音分量从其它环境声音分离的一个或一个以上操作)。如上文所述的设备A100可实施为设备A10的例子。 
图24B展示通信装置D20的框图,通信装置D20为装置D10的实施方案。装置D20包括芯片或芯片组CS10(例如,移动台调制解调器(MSM)芯片组),其包括设备A10。芯片/芯片组CS10可包括一个或一个以上处理器,所述一个或一个以上处理器可经配置以执行设备A10的所有或一部分(例如,作为指令)。芯片/芯片组CS10还可包括阵列R100的处理元件(例如,音频预处理级AP10的元件)。芯片/芯片组CS10包括:接收器,其经配置以接收射频(RF)通信信号,且解码并再现编码于RF信号内的音频信号; 及发射器,其经配置以编码基于由设备A10产生的经处理信号的音频信号,且传输描述所述经编码音频信号的RF通信信号。举例来说,芯片/芯片组CS10的一个或一个以上处理器可经配置以对所述多信道信号的一个或一个以上信道执行如上所述的噪声减少操作,使得所述经编码的音频信号是基于噪声减少的信号。 
装置D20经配置以经由天线C30接收及发射RF通信信号。装置D20在到天线C30的路径中还可包括双工器及一个或一个以上功率放大器。芯片/芯片组CS10还经配置以经由小键盘C10接收用户输入,且经由显示器C20显示信息。在此实例中,装置D20还包括一个或一个以上天线C40以支持全球定位系统(GPS)位置服务及/或与例如无线(例如,BluetoothTM)头戴式耳机等外部装置的短程通信。在另一实例中,此通信装置自身为蓝牙头戴式耳机,且无小键盘C10、显示器C20及天线C30。 
如本文所述的设备A10的实施方案可以多种音频感测装置来体现,包括头戴式耳机及手持机。手持机实施方案的一个实例包括麦克风之间具有6.5厘米的间距的阵列R100的前置双麦克风实施方案。双麦克风遮蔽方法的实施方案可包括直接在频谱图中分析麦克风对的相位关系及遮蔽来自非所要方向的时频点。 
图25A到图25D展示装置D10的多麦克风便携式音频感测实施方案D100的各种视图。装置D100为无线头戴式耳机,其包括运载阵列R100的双麦克风实施方案的外壳Z10,及从所述外壳延伸的听筒Z20。此装置可经配置以经由与例如蜂窝式电话手持机等电话装置的通信(例如,使用如由华盛顿州贝尔维市的蓝牙兴趣小组公司(Bluetooth Special Interest Group,Inc.)发布的BluetoothTM协议的一版本)支持半双工或全双工电话。一般来说,头戴式耳机的外壳可如图25A、图25B及图25D中所展示那样为矩形的或以其它方式为细长的(例如,形似迷你吊杆)或可较圆或甚至为圆形的。所述外壳还可封入电池及处理器及/或其它处理电路(例如,印刷电路板及安装于其上的组件),且可包括电端口(例如,迷你通用串行总线(USB)或用于电池充电的其它端口)及用户接口特征,例如一个或一个以上按钮开关及/或LED。通常,外壳沿其主轴线的长度在一英寸到三英寸的范围内。 
通常,阵列R100的每一麦克风在装置内安装于在外壳中的充当声端口的一个或一个以上小孔后面。图25B到图25D展示用于装置D100的阵列的主要麦克风的声端口Z40及用于装置D100的阵列的次要麦克风的声端口Z50的位置。 
头戴式耳机还可包括紧固装置,例如耳钩Z30,其通常可从头戴式耳机拆卸。外部耳钩可为可反转的(例如)以允许用户配置头戴式耳机以便用于任一耳朵上。或者,可将头戴式耳机的听筒设计为内部紧固装置(例如,耳塞),其可包括可移除耳承以允许 不同用户使用不同大小(例如,直径)的耳承,以用于更好地配合于特定用户的耳道的外部部分。 
图26A到图26D展示装置D10的多麦克风便携式音频感测实施方案D200的各种视图,多麦克风便携式音频感测实施方案D200为无线头戴式耳机的另一实例。装置D200包括圆形、椭圆形外壳Z12及可配置为耳塞的听筒Z22。图26A到图26D还展示用于装置D200的阵列的主要麦克风的声端口Z42及用于次要麦克风的声端口Z52的位置。有可能次要麦克风端口Z52可至少部分地被堵塞(例如,被用户接口按钮)。 
图27A展示装置D10的多麦克风便携式音频感测实施方案D300的横截面图(沿中心轴线),所述多麦克风便携式音频感测实施方案D300为通信手持机。装置D300包括阵列R100的实施方案,所述实施方案具有主要麦克风MC10及次要麦克风MC20。在此实例中,装置D300还包括主要扬声器SP10及次要扬声器SP20。此装置可经配置以经由一个或一个以上编码及解码方案(也称为“编解码器”)无线地发射及接收话音通信数据。此些编解码器的实例包括:增强型可变速率编解码器,如描述于2007年2月的标题为“用于宽带频谱数字系统的增强型可变速率编解码器的语音服务选项3、68及70(Enhanced Variable Rate Codec,Speech Service Options 3,68,and 70 for Wideband Spread Spectrum Digital Systems)”的第三代合作伙伴计划2(3GPP2)文献C.S0014-C,v1.0(在www.3gpp.org在线可得)中;可选模式声码器语音编解码器,如描述于2004年1月的标题为“用于宽带频谱通信系统的可选模式声码器(SMV)服务选项(Selectable Mode Vocoder(SMV)Service Option for Wideband Spread Spectrum Communication Systems)”的3GPP2文献C.S0030-0,v3.0(在www.3gpp.org在线可得)中;自适应多速率(AMR)语音编解码器,如描述于文献ETSI TS 126 092 V6.0.0(欧洲电信标准协会(ETSI),苏菲亚—昂蒂波利斯特投(Sophia Antipolis Cedex),法国,2004年12月)中;及AMR宽带语音编解码器,如描述于文献ETSI TS 126 192 V6.0.0(ETSI,2004年12月)中。在图3A的实例中,手持机D300为掀盖型蜂窝式电话手持机(也称为“翻盖”手持机)。此多麦克风通信手持机的其它配置包括直板式及滑盖式电话手持机。图27B展示装置D300的实施方案D310的横截面图,实施方案D310包括阵列R100的三麦克风实施方案,所述实施方案包括第三麦克风MC30。 
图28A展示装置D10的多麦克风便携式音频感测实施方案D400的图,所述多麦克风便携式音频感测实施方案D400为媒体播放器。此装置可经配置以用于重放经压缩的音频或视听信息,例如根据标准压缩格式(例如,动画专家组(MPEG)-1音频层3(MP3)、MPEG-4第14部分(MP4)、窗口媒体音频/视频(WMA/WMV)的版本(华盛顿州雷德 蒙德市的微软公司(Microsoft Corp.))、高级音频译码(AAC)、国际电信联盟(ITU)-T H.264等)而编码的文件或流。装置D400包括安置在装置前面的显示屏幕SC10及扬声器SP10,且阵列R100的麦克风MC10与MC20安置于所述装置的同一面(例如,如在此实例中安置于顶面的相反侧上,或安置于前面的相反侧上)。图28B展示装置D400的另一实施方案D410,其中麦克风MC10与MC20安置于装置的相对面,且图28C展示装置D400的另一方案实施D420,其中麦克风MC10与MC20安置于装置的邻近面。媒体播放器还可经设计以使得较长的轴线在既定使用期间为水平的。 
图29展示装置D10的多麦克风便携式音频感测实施方案D500的图,所述多麦克风便携式音频感测实施方案D500为免提车载套件。此装置可经配置以待安装于以下各项中或以下各项上或可移除地固定到以下各项:仪表板、风挡、后视镜、遮阳板或车辆的另一内表面。装置D500包括扬声器85及阵列R100的实施方案。在此特定实例中,装置D500包括阵列R100的实施方案R102,其为布置成线性阵列的四个麦克风。此装置可经配置以经由一个或一个以上编解码器(例如,上文列出的实例)无线地发射及接收话音通信数据。另外或其它,此装置可经配置以经由与例如蜂窝式电话手持机等电话装置的通信(例如,如上文所述,使用BluetoothTM协议的版本)来支持半双工或全双工电话。 
图30展示装置D10的用于手持型应用的多麦克风便携式音频感测实施方案D600的图。装置D600包括触控屏显示器TS10、三个前置麦克风MC10到MC30、一后置麦克风MC40、两个扬声器SP10及SP20、一左侧用户接口控件(例如,用于选择)UI10,及一右侧用户接口控件(例如,用于导航)UI20。可使用以下各项中的一者或一者以上来实施所述用户接口控件中的每一者:按钮、轨迹球、点拨轮、触控板、操纵杆及/或其它指点装置等。装置D800的典型大小为约十五厘米乘二十厘米,装置D800可在浏览器谈话模式或玩游戏模式下使用。明确地揭示,本文中所揭示的系统、方法及设备的适用性不限于图25A到图30中所展示的特定实例。此些系统、方法及设备可应用于的便携式音频感测装置的其它实例包括助听器。 
本文中所揭示的方法及设备一般可应用于任何收发及/或音频感测应用中,尤其是此些应用的移动或其它方式的便携式例子。举例来说,本文中所揭示的配置的范围包括通信装置,所述通信装置驻留于经配置以使用码分多址(CDMA)空中接口的无线电话通信系统中。然而,所属领域的技术人员将理解,具有如本文中所描述的特征的方法及设备可驻留于使用所属领域的技术人员已知的较宽范围的技术的各种通信系统中的任一者中,例如经由有线及/或无线(例如,CDMA、TDMA、FDMA及/或TD-SCDMA)传 输信道使用IP话音(VoIP)的系统。 
明确地预期且特此揭示,本文所揭示的通信装置可经调适以用于包交换式网络(例如,根据例如VoIP等协议布置以运载音频发射的有线及/或无线网络)及/或电路交换式网络中。还明确地预期且特此揭示,本文所揭示的通信装置可经调适以用于窄带译码系统(例如,编码约四千赫兹或五千赫兹的音频频率范围的系统)中及/或用于宽带译码系统(例如,编码大于五千赫兹的音频频率的系统)中,包括全带宽带译码系统及分带宽带译码系统。 
提供本文中所述配置的呈现以使所属领域的技术人员能够制作或使用本文中所揭示的方法及其它结构。本文所展示且描述的流程图、框图及其它结构仅为实例,且这些结构的其它变体也在本发明的范围内。对这些配置的各种修改是可能的,且本文中所呈现的一般原理也可应用于其它配置。因此,本发明无意限于上文展示的配置,而是被赋予与本文中以任何方式揭示的原理及新颖特征一致的最宽范围,所述原理及新颖特征在申请时包括于所附权利要求书中,所附权利要求书形成原始揭示内容的一部分。 
所属领域的技术人员将理解,可使用多种不同技术及技法中的任一者来表示信息及信号。举例来说,可通过电压、电流、电磁波、磁场或磁性粒子、光场或光学粒子或其任何组合来表示贯穿以上描述可提到的数据、指令、命令、信息、信号、位及符号。 
对如本文中所揭示的配置的实施方案的重要设计要求可包括最小化处理延迟及/或计算复杂性(通常以每秒多少百万个指令或MIPS来测量),尤其是对于计算密集型应用,例如压缩音频或视听信息(例如,根据压缩格式编码的文件或流,所述压缩格式例如本文中所识别的实例中的一者)的重放,或用于宽带通信(例如,在高于八千赫兹(例如,12kHz、16kHz或44kHz)的取样速率下的话音通信)的应用。 
多麦克风处理系统的目标可包括:实现十到十二dB的总噪声减少、在所要说话者移动期间保持话音电平及音色、获得噪声已移动到背景中的感知而非语音的积极噪声移除、语音的去回响,及/或启用后处理的选项以获得更积极的噪声减少。 
如本文所揭示的ANC设备的实施方案的各种元件可以被视为适合既定应用的硬件、软件及/或固件的任何组合来体现。举例来说,此些元件可制造为驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片之中的电子装置及/或光学装置。此装置的一个实例为例如晶体管或逻辑门等固定或可编程逻辑元件阵列,且这些元件中的任一者可被实施为一个或一个以上此类阵列。这些元件中的任何两者或两者以上或甚至全部可实施于相同阵列内。此或此些阵列可实施于一个或一个以上芯片内(例如,实施于包括两个或两个以上芯片的芯片组内)。 
本文中所揭示的ANC设备的各种实施方案的一个或一个以上元件还可完全或部分地实施为一个或一个以上指令集,所述一个或一个以上指令集经配置以在一个或一个以上固定或可编程逻辑元件阵列上执行,所述逻辑元件例如为微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA(现场可编程门阵列)、ASSP(专用标准产品)及ASIC(专用集成电路)。如本文中所揭示的设备的实施方案的各种元件中的任一者还可体现为一个或一个以上计算机(例如,包括经编程以执行一个或一个以上指令集或指令序列的一个或一个以上阵列的机器,也称为“处理器”),且这些元件中的任何两者或两者以上或甚至全部可实施于相同的此或此些计算机内。 
如本文中所揭示的处理器或其它处理装置可制造为驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片之中的一个或一个以上电子装置及/或光学装置。此装置的一个实例为例如晶体管或逻辑门的固定或可编程逻辑元件阵列,且这些元件中的任一者可实施为一个或一个以上此类阵列。此或此些阵列可实施于一个或一个以上芯片内(例如,实施于包括两个或两个以上芯片的芯片组内)。此些阵列的实例包括固定或可编程逻辑元件阵列,例如微处理器、嵌入式处理器、IP核心、DSP、FPGA、ASSP及ASIC。如本文中所揭示的处理器或其它处理装置还可体现为一个或一个以上计算机(例如,包括经编程以执行一个或一个以上指令集或指令序列的一个或一个以上阵列的机器)或其它处理器。有可能如本文中所描述的处理器将用于执行与一致性检测程序非直接相关的任务或执行与一致性检测程序非直接相关的其它指令集,例如与其中嵌入有所述处理器的装置或系统(例如,音频感测装置)的另一操作有关的任务。还有可能如本文中所揭示的方法的一部分将由所述音频感测装置的处理器执行,且所述方法的另一部分将在一个或一个以上其它处理器的控制下执行。 
所属领域的技术人员将了解,结合本文中所揭示的配置而描述的各种说明性模块、逻辑块、电路及测试及其它操作可实施为电子硬件、计算机软件或两者的组合。此些模块、逻辑块、电路及操作可用经设计以产生如本文中所揭示的配置的通用处理器、数字信号处理器(DSP)、ASIC或ASSP、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合来实施或执行。举例来说,此配置可至少部分地实施为硬连线电路、实施为制造到专用集成电路中的电路配置,或实施为加载到非易失性存储装置中的固件程序,或作为机器可读代码从数据存储媒体加载或加载到数据存储媒体中的软件程序,此代码为可由逻辑元件(例如,通用处理器或其它数字信号处理单元)阵列执行的指令。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规的处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微 处理器的组合、多个微处理器的组合、结合DSP核心的一个或一个以上微处理器,或任一其它此类配置。软件模块可驻留于RAM(随机存取存储器)、ROM(只读存储器)、例如快闪RAM的非易失性RAM(NVRAM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到所述处理器,使得所述处理器可从所述存储媒体读取信息且将信息写入到所述存储媒体。在替代方案中,存储媒体可与处理器成一体式。处理器及存储媒体可驻留于ASIC中。ASIC可驻留于用户终端中。在替代方案中,处理器及存储媒体可作为离散组件而驻留于用户终端中。 
注意,本文中所揭示的各种方法可由逻辑元件(例如,处理器)阵列来执行,且如本文中所描述的设备的各种元件可实施为经设计以在此阵列上执行的模块。如本文中所使用,术语“模块”或“子模块”可指代呈软件、硬件或固件形式的包括计算机指令(例如,逻辑表达式)的任何方法、设备、装置、单元或计算机可读数据存储媒体。将理解,多个模块或系统可组合成一个模块或系统,且一个模块或系统可分成多个模块或系统以执行相同功能。当以软件或其它计算机可执行指令实施时,进程的要素基本上为用以例如以例程、程序、对象、组件、数据结构等执行相关任务的代码段。术语“软件”应被理解为包括源代码、汇编语言码、机器码、二进制码、固件、宏码、微码、可由逻辑元件阵列执行的任何一个或一个以上指令集或指令序列,及此些实例的任何组合。程序或代码段可存储在处理器可读媒体中或可经由传输媒体或通信链路由包含于载波中的计算机数据信号来传输。 
本文中所揭示的方法、方案及技术的实施方案还可有形地体现(例如,在如本文中列出的一个或一个以上计算机可读媒体中)为可由包括逻辑元件(例如,处理器、微处理器、微控制器或其它有限状态机)阵列的机器读取及/或执行的一个或一个以上指令集。术语“计算机可读媒体”可包括可存储或传送信息的任何媒体,包括易失性、非易失性、可装卸及不可装卸媒体。计算机可读媒体的实例包括电子电路、半导体存储器装置、ROM、快闪存储器、可擦除ROM(EROM)、软盘或其它磁性存储装置、CD-ROM/DVD或其它光学存储装置、硬盘、光纤媒体、射频(RF)链路或可用于存储所要信息且可被存取的任何其它媒体。计算机数据信号可包括可经由例如电子网络信道、光纤、空气、电磁、RF链路等传输媒体传播的任何信号。代码段可经由例如因特网或企业内部网络等计算机网络下载。在任何情况下,本发明的范围不应被解释为受此些实施例限制。 
本文中所描述的方法的任务中的每一者可直接包含于硬件中、由处理器执行的软件模块中或上述两者的组合中。在如本文中所揭示的方法的实施方案的典型应用中,逻辑 元件(例如,逻辑门)的阵列经配置以执行所述方法的各种任务中的一者、一者以上或甚至全部。任务中的一者或一者以上(可能为全部)还可实施为包含于计算机程序产品(例如,一个或一个以上数据存储媒体,例如,磁盘、快闪存储卡或其它非易失性记忆卡、半导体存储器芯片,等等)中的代码(例如,一个或一个以上指令集),所述代码可由包括逻辑元件(例如,处理器、微处理器、微控制器,或其它有限状态机)阵列的机器(例如,计算机)读取及/或执行。如本文中所揭示的方法的实施方案的任务还可由一个以上此类阵列或机器执行。在这些或其它实施方案中,任务可在用于无线通信的装置(例如,蜂窝式电话)或具有此通信能力的其它装置内执行。此装置可经配置以与电路交换式网络及/或包交换式网络通信(例如,使用例如VoIP等一个或一个以上协议)。举例来说,此装置可包括经配置以接收及/或发射经编码帧的RF电路。 
明确地揭示,本文中所揭示的各种方法可由例如手持机、头戴式耳机或便携式数字助理(PDA)等便携式通信装置执行,且本文中所描述的各种设备可包括于此装置内。典型的实时(例如,在线)应用为使用此移动装置进行的电话通话。 
在一个或一个以上示范性实施例中,本文中所描述的操作可以硬件、软件、固件或其任何组合实施。如果以软件实施,那么此些操作可作为一个或一个以上指令或代码而存储在计算机可读媒体上或经由计算机可读媒体而传输。术语“计算机可读媒体”包括计算机存储媒体及通信媒体(包括促进计算机程序从一处传送到另一处的任何媒体)两者。存储媒体可为可由计算机存取的任何可用媒体。作为实例且非限制,此计算机可读媒体可包含存储元件阵列,例如半导体存储器(其可包括(但不限于)动态或静态RAM、ROM、EEPROM及/或快闪RAM),或铁电、磁阻、双向、聚合或相变存储器;CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用以存储可由计算机存取的呈指令或数据结构、有形结构的形式的所要程序代码的任何其它媒体。并且,严格地说,任何连接均被称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL),或例如红外线、无线电及/或微波等无线技术从网站、服务器或其它远程源传输软件,那么同轴电缆、光纤缆线、双绞线、DSL,或例如红外线、无线电及/或微波等无线技术包括于媒体的定义中。如本文中所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及Blu-ray DiscTM(加利福尼亚州大学城的蓝光光盘协会(Blu-Ray Disc Association)),其中磁盘通常以磁性方式再现数据,而光盘通过激光以光学方式再现数据。上述各项的组合也应包括在计算机可读媒体的范围内。 
如本文中所描述的声信号处理设备可并入到电子装置(例如,通信装置)中,所述 电子装置接受语音输入以便控制某些操作或可以其它方式受益于所要噪声与背景噪声的分离。许多应用可受益于增强清楚的所要声音或分离清楚的所要声音与源自多个方向的背景声音。此些应用可包括并入有例如话音辨识及检测、语音增强及分离、话音激活控制等的能力的电子或计算装置中的人机接口。可希望实施此声信号处理设备以适合于仅提供有限处理能力的装置中。 
可将本文中所描述的模块、元件及装置的各种实施方案的元件制造为驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片之中的电子装置及/或光学装置。此装置的一个实例为固定或可编程逻辑元件阵列,例如晶体管或门。本文中所描述的设备的各种实施方案的一个或一个以上元件还可完全或部分地实施为一个或一个以上指令集,所述一个或一个以上指令集经布置以在一个或一个以上固定或可编程逻辑元件阵列上执行,所述逻辑元件例如为微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA、ASSP及ASIC。 
有可能如本文中所描述的设备的实施方案的一个或一个以上元件将用于执行与所述设备的操作非直接相关的任务或执行与所述设备的操作非直接相关的其它指令集,例如与嵌入有所述设备的装置或系统的另一操作有关的任务。还有可能此设备的实施方案的一个或一个以上元件具有共用结构(例如,用以执行在不同时间对应于不同元件的代码部分的处理器,经执行以执行在不同时间对应于不同元件的任务的指令集,或在不同时间执行用于不同元件的操作的电子装置及/或光学装置的布置)。 

Claims (30)

1.一种处理多信道信号的方法,所述方法包含:
针对所述多信道信号的多个区段中的每一者,且针对所述多信道信号的多个不同频率分量中的每一者,计算(A)所述频率分量在所述区段期间在所述多信道信号的第一信道中的相位与(B)所述频率分量在所述区段期间在所述多信道信号的第二信道中的相位之间的差,以获得针对所述区段的多个所计算相位差;
针对所述多个区段中的每一者,且基于所述对应多个所计算相位差,计算一致性度量的对应值,所述一致性度量指示所述区段期间至少所述多个不同频率分量的到达方向间的一致性程度;
针对所述多个区段中的每一者,将所述一致性度量的所述对应值与阈值进行比较;
针对所述多个区段中的每一者,通过针对至少所述多个不同频率分量中的每一者相对于在所述区段期间所述频率分量在所述第一信道中的对应振幅而更改在所述区段期间所述频率分量在所述第二信道中的振幅来产生经处理的多信道信号的对应区段,其中所述更改是基于对应于所述区段的增益因子的值;及
针对所述多个区段中的至少一者,且响应于所述比较的结果,更新所述增益因子的所述值,其中所述更新是基于所述第一信道的所计算电平与所述第二信道的所计算电平之间的关系,使得对应于所述区段的所述增益因子的所述值不同于对应于所述多个区段中的不同区段的所述增益因子的所述值。
2.根据权利要求1所述的处理多信道信号的方法,其中所述第一信道的所述所计算电平为所述多个不同频率分量中的一者在所述第一信道中的所计算电平,且所述第二信道的所述所计算电平为所述频率分量在所述第二信道中的所计算电平,且
其中针对所述多个不同频率分量中的每一者,所述更新是基于所述频率分量在所述第一信道中的所计算电平与所述频率分量在所述第二信道中的所计算电平之间的关系。
3.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中所述更新是基于对应于前一区段的所述增益因子的值。
4.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中所述方法包括基于所述多信道信号的所估计音调频率来选择所述多个不同频率分量。
5.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中所述第一信道的所计算电平与所述第二信道的所计算电平之间的所述关系是所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的比率。
6.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中所述产生所述经处理的多信道信号的对应区段包含减少所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的不平衡。
7.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中对于所述多个区段中的一些区段中的每一者,所述增益因子的所述对应值是相等的。
8.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中所述方法包含基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系来指示话音活动的存在。
9.根据权利要求8所述的处理多信道信号的方法,其中所述第一及第二信道中的每一者是基于由阵列的对应麦克风产生的信号,且
其中所述方法包括指示所述多信道信号在所述阵列的端射方向上方向一致,且
其中响应于所述指示所述多信道信号方向一致而执行所述指示话音活动。
10.根据权利要求1及2中任一权利要求所述的处理多信道信号的方法,其中所述方法包含基于在所述经处理的多信道信号的区段中第一信道的电平与第二信道的电平之间的关系,且响应于所述将所述一致性度量的所述对应值与阈值进行比较的结果,根据来自所述多信道信号的所述第一及第二信道中的至少一者的声音信息来更新噪声估计。
11.一种用于处理多信道信号的设备,所述设备包含:
第一计算器,其经配置以针对所述多信道信号的多个区段中的每一者,通过针对所述多信道信号的多个不同频率分量中的每一者计算(A)所述频率分量在所述区段期间在所述多信道信号的第一信道中的相位与(B)所述频率分量在所述区段期间在所述多信道信号的第二信道中的相位之间的差来获得多个所计算相位差;
第二计算器,其经配置以针对所述多个区段中的每一者,且基于所述对应多个所计算相位差来计算一致性度量的对应值,所述一致性度量指示所述区段期间至少所述多个不同频率分量的到达方向间的一致性程度;
用于针对所述多个区段中的每一者将所述一致性度量的所述对应值与阈值进行比较的装置;
增益控制元件,其经配置以针对所述多个区段中的每一者,通过针对至少所述多个不同频率分量中的每一者相对于在所述区段期间所述频率分量在所述第一信道中的对应振幅而更改在所述区段期间所述频率分量在所述第二信道中的振幅来产生经处理的多信道信号的对应区段,其中所述更改是基于对应于所述区段的增益因子的值;及
第三计算器,其经配置以针对所述多个区段中的至少一者,且响应于所述比较的结果来更新所述增益因子的所述值,其中所述更新是基于所述第一信道的所计算电平与所述第二信道的所计算电平之间的关系,使得对应于所述区段的所述增益因子的所述值不同于对应于所述多个区段中的不同区段的所述增益因子的所述值。
12.根据权利要求11所述的设备,其中所述第一信道的所述所计算电平为所述多个不同频率分量中的一者在所述第一信道中的所计算电平,且所述第二信道的所述所计算电平为所述频率分量在所述第二信道中的所计算电平,且
其中针对所述多个不同频率分量中的每一者,所述更新是基于所述频率分量在所述第一信道中的所计算电平与所述频率分量在所述第二信道中的所计算电平之间的关系。
13.根据权利要求11及12中任一权利要求所述的设备,其中所述更新是基于对应于前一区段的所述增益因子的值。
14.根据权利要求11及12中任一权利要求所述的设备,其中所述第一计算器经配置以基于所述多信道信号的估计音调频率来选择所述多个不同频率分量。
15.根据权利要求11及12中任一权利要求所述的设备,所述第一信道的所计算电平与所述第二信道的所计算电平之间的所述关系是所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的比率。
16.根据权利要求11及12中任一权利要求所述的设备,其中所述增益控制元件经配置以减少所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的不平衡。
17.根据权利要求11及12中任一权利要求所述的设备,其中对于所述多个区段中的一些区段中的每一者,所述增益因子的所述对应值是相等的。
18.根据权利要求11及12中任一权利要求所述的设备,其中所述设备包括话音活动检测器,所述话音活动检测器经配置以基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系来指示话音活动的存在。
19.根据权利要求18所述的设备,其中所述第一及第二信道中的每一者是基于由阵列的对应麦克风产生的信号,且
其中所述增益因子计算器经配置以指示所述多信道信号在所述阵列的端射方向上是否方向一致,且
其中所述话音活动检测器经配置以响应于所述增益因子计算器关于所述多信道信号方向一致的指示而指示话音活动的存在。
20.根据权利要求11及12中任一权利要求所述的设备,其中所述设备包含噪声参考计算器,其经配置以基于在所述经处理的多信道信号的区段中第一信道的电平与第二信道的电平之间的关系,且响应于所述将所述一致性度量的所述对应值与阈值进行比较的结果,根据来自所述多信道信号的所述第一及第二信道中的至少一者的声音信息来更新噪声估计。
21.一种用于处理多信道信号的设备,所述设备包含:
用于针对所述多信道信号的多个区段中的每一者且针对所述多信道信号的多个不同频率分量中的每一者计算(A)所述频率分量在所述区段期间在所述多信道信号的第一信道中的相位与(B)所述频率分量在所述区段期间在所述多信道信号的第二信道中的相位之间的差以获得针对所述区段的多个所计算相位差的装置;
用于针对所述多个区段中的每一者且基于所述对应多个所计算相位差计算一致性度量的对应值的装置,所述一致性度量指示所述区段期间至少所述多个不同频率分量的到达方向间的一致性程度;
用于针对所述多个区段中的每一者将所述一致性度量的所述对应值与阈值进行比较的装置;
用于针对所述多个区段中的每一者通过针对至少所述多个不同频率分量中的每一者相对于在所述区段期间所述频率分量在所述第一信道中的对应振幅而更改在所述区段期间所述频率分量在所述第二信道中的振幅来产生经处理的多信道信号的对应区段的装置,其中所述更改是基于对应于所述区段的增益因子的值;及
用于针对所述多个区段中的至少一者且响应于所述比较的结果更新所述增益因子的所述值的装置,其中所述更新是基于所述第一信道的所计算电平与所述第二信道的所计算电平之间的关系,使得对应于所述区段的所述增益因子的所述值不同于对应于所述多个区段中的不同区段的所述增益因子的所述值。
22.根据权利要求21所述的设备,其中所述第一信道的所述所计算电平为所述多个不同频率分量中的一者在所述第一信道中的所计算电平,且所述第二信道的所述所计算电平为所述频率分量在所述第二信道中的所计算电平,且
其中针对所述多个不同频率分量中的每一者,所述更新是基于所述频率分量在所述第一信道中的所计算电平与所述频率分量在所述第二信道中的所计算电平之间的关系。
23.根据权利要求21及22中任一权利要求所述的设备,其中所述更新是基于对应于前一区段的所述增益因子的值。
24.根据权利要求21及22中任一权利要求所述的设备,其中所述设备包括用于基于所述多信道信号的估计音调频率来选择所述多个不同频率分量的装置。
25.根据权利要求21及22中任一权利要求所述的设备,其中所述第一信道的所计算电平与所述第二信道的所计算电平之间的所述关系是所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的比率。
26.根据权利要求21及22中任一权利要求所述的设备,其中所述用于产生所述经处理的多信道信号的对应区段的装置经配置以减少所述第一信道的所述所计算电平与所述第二信道的所述所计算电平之间的不平衡。
27.根据权利要求21及22中任一权利要求所述的设备,其中对于所述多个区段中的一些区段中的每一者,所述增益因子的所述对应值是相等的。
28.根据权利要求21及22中任一权利要求所述的设备,其中所述设备包含用于基于所述经处理的多信道信号的第一信道的电平与所述经处理的多信道信号的第二信道的电平之间的关系来指示话音活动的存在的装置。
29.根据权利要求28所述的设备,其中所述第一及第二信道中的每一者是基于由阵列的对应麦克风产生的信号,且
其中所述设备包括用于指示所述多信道信号在所述阵列的端射方向上方向一致的装置,且
其中所述用于指示话音活动的存在的装置经配置以响应于所述用于指示所述多信道信号方向一致的装置的指示而指示话音活动的存在。
30.根据权利要求21及22中任一权利要求所述的设备,其中所述设备包含用于基于在所述经处理的多信道信号的区段中第一信道的电平与第二信道的电平之间的关系且响应于所述将所述一致性度量的所述对应值与阈值进行比较的结果根据来自所述多信道信号的所述第一及第二信道中的至少一者的声音信息来更新噪声估计的装置。
CN201080025957.1A 2009-06-09 2010-06-09 用于对多信道信号进行基于相位的处理的系统、方法及设备 Expired - Fee Related CN102461203B (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US18551809P 2009-06-09 2009-06-09
US61/185,518 2009-06-09
US22703709P 2009-07-20 2009-07-20
US61/227,037 2009-07-20
US24032009P 2009-09-08 2009-09-08
US24031809P 2009-09-08 2009-09-08
US61/240,318 2009-09-08
US61/240,320 2009-09-08
US12/796,566 2010-06-08
US12/796,566 US8620672B2 (en) 2009-06-09 2010-06-08 Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
PCT/US2010/037973 WO2010144577A1 (en) 2009-06-09 2010-06-09 Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal

Publications (2)

Publication Number Publication Date
CN102461203A CN102461203A (zh) 2012-05-16
CN102461203B true CN102461203B (zh) 2014-10-29

Family

ID=42342569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080025957.1A Expired - Fee Related CN102461203B (zh) 2009-06-09 2010-06-09 用于对多信道信号进行基于相位的处理的系统、方法及设备

Country Status (7)

Country Link
US (1) US8620672B2 (zh)
EP (1) EP2441273A1 (zh)
JP (1) JP5410603B2 (zh)
KR (1) KR101275442B1 (zh)
CN (1) CN102461203B (zh)
TW (1) TW201132138A (zh)
WO (1) WO2010144577A1 (zh)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090067661A1 (en) * 2007-07-19 2009-03-12 Personics Holdings Inc. Device and method for remote acoustic porting and magnetic acoustic connection
CN103137139B (zh) * 2008-06-30 2014-12-10 杜比实验室特许公司 多麦克风语音活动检测器
US8724829B2 (en) * 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
JP5493611B2 (ja) * 2009-09-09 2014-05-14 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
US8897455B2 (en) 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
WO2011133924A1 (en) 2010-04-22 2011-10-27 Qualcomm Incorporated Voice activity detection
US20110288860A1 (en) 2010-05-20 2011-11-24 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
DK2395506T3 (da) * 2010-06-09 2012-09-10 Siemens Medical Instr Pte Ltd Fremgangsmåde og system til behandling af akustisk signal til undertrykkelse af interferens og støj i binaurale mikrofonkonfigurationer
US9025782B2 (en) 2010-07-26 2015-05-05 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for multi-microphone location-selective processing
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US8898058B2 (en) 2010-10-25 2014-11-25 Qualcomm Incorporated Systems, methods, and apparatus for voice activity detection
US8525868B2 (en) 2011-01-13 2013-09-03 Qualcomm Incorporated Variable beamforming with a mobile platform
WO2012107561A1 (en) * 2011-02-10 2012-08-16 Dolby International Ab Spatial adaptation in multi-microphone sound capture
US8553817B1 (en) * 2011-03-01 2013-10-08 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for shipboard co-site in-band desired signal extraction
US9354310B2 (en) 2011-03-03 2016-05-31 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for source localization using audible sound and ultrasound
JP5668553B2 (ja) * 2011-03-18 2015-02-12 富士通株式会社 音声誤検出判別装置、音声誤検出判別方法、およびプログラム
GB2491173A (en) * 2011-05-26 2012-11-28 Skype Setting gain applied to an audio signal based on direction of arrival (DOA) information
US8817917B2 (en) * 2011-06-21 2014-08-26 Ibiquity Digital Corporation Method and apparatus for implementing signal quality metrics and antenna diversity switching control
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
US9031259B2 (en) * 2011-09-15 2015-05-12 JVC Kenwood Corporation Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
US9648421B2 (en) * 2011-12-14 2017-05-09 Harris Corporation Systems and methods for matching gain levels of transducers
EP3301677B1 (en) 2011-12-21 2019-08-28 Huawei Technologies Co., Ltd. Very short pitch detection and coding
CN102404273B (zh) * 2011-12-29 2015-04-15 电子科技大学 一种基于新的压扩变换的ofdm信号传输方法
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9857451B2 (en) 2012-04-13 2018-01-02 Qualcomm Incorporated Systems and methods for mapping a source location
US20130282372A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
WO2013163629A1 (en) * 2012-04-26 2013-10-31 Propagation Research Associates, Inc. Method and system for using orthogonal space projections to mitigate interference
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
KR101434026B1 (ko) * 2012-09-11 2014-08-26 제주대학교 산학협력단 3차원 측정 장치 및 방법
JP6028502B2 (ja) 2012-10-03 2016-11-16 沖電気工業株式会社 音声信号処理装置、方法及びプログラム
US9412375B2 (en) 2012-11-14 2016-08-09 Qualcomm Incorporated Methods and apparatuses for representing a sound field in a physical space
JP6107151B2 (ja) * 2013-01-15 2017-04-05 富士通株式会社 雑音抑圧装置、方法、及びプログラム
JP6020258B2 (ja) * 2013-02-28 2016-11-02 富士通株式会社 マイク感度差補正装置、方法、プログラム、及び雑音抑圧装置
US9984675B2 (en) 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming
US9269350B2 (en) 2013-05-24 2016-02-23 Google Technology Holdings LLC Voice controlled audio recording or transmission apparatus with keyword filtering
JP6314475B2 (ja) * 2013-12-25 2018-04-25 沖電気工業株式会社 音声信号処理装置及びプログラム
EP2933935A1 (en) * 2014-04-14 2015-10-21 Alcatel Lucent A method of modulating light in a telecommunication network
US10540979B2 (en) 2014-04-17 2020-01-21 Qualcomm Incorporated User interface for secure access to a device using speaker verification
JP6547451B2 (ja) * 2015-06-26 2019-07-24 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
US10242689B2 (en) * 2015-09-17 2019-03-26 Intel IP Corporation Position-robust multiple microphone noise estimation techniques
EP3157268B1 (en) * 2015-10-12 2021-06-30 Oticon A/s A hearing device and a hearing system configured to localize a sound source
JPWO2017090311A1 (ja) * 2015-11-25 2018-09-06 ソニー株式会社 集音装置
CN105578350A (zh) * 2015-12-29 2016-05-11 太仓美宅姬娱乐传媒有限公司 一种处理图像声音的方法
US9747887B2 (en) * 2016-01-12 2017-08-29 Bose Corporation Systems and methods of active noise reduction in headphones
CN105590630B (zh) * 2016-02-18 2019-06-07 深圳永顺智信息科技有限公司 基于指定带宽的定向噪音抑制方法
WO2017202680A1 (en) * 2016-05-26 2017-11-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for voice or sound activity detection for spatial audio
US10217467B2 (en) 2016-06-20 2019-02-26 Qualcomm Incorporated Encoding and decoding of interchannel phase differences between audio signals
TWI608365B (zh) * 2016-09-23 2017-12-11 財團法人工業技術研究院 擾動源追溯方法
FR3056813B1 (fr) * 2016-09-29 2019-11-08 Dolphin Integration Circuit audio et procede de detection d'activite
CN108022595A (zh) * 2016-10-28 2018-05-11 电信科学技术研究院 一种语音信号降噪方法和用户终端
US20180160226A1 (en) * 2016-12-05 2018-06-07 Semiconductor Components Industries, Llc Reducing or eliminating transducer reverberation
US10389885B2 (en) * 2017-02-01 2019-08-20 Cisco Technology, Inc. Full-duplex adaptive echo cancellation in a conference endpoint
CN107301869B (zh) * 2017-08-17 2021-01-29 珠海全志科技股份有限公司 麦克风阵列拾音方法、处理器及其存储介质
US10339949B1 (en) 2017-12-19 2019-07-02 Apple Inc. Multi-channel speech enhancement
US10657981B1 (en) * 2018-01-19 2020-05-19 Amazon Technologies, Inc. Acoustic echo cancellation with loudspeaker canceling beamformer
JP7342859B2 (ja) * 2018-04-09 2023-09-12 ソニーグループ株式会社 信号処理装置、信号処理方法および信号処理プログラム
EP3811360A4 (en) 2018-06-21 2021-11-24 Magic Leap, Inc. PORTABLE SYSTEM VOICE PROCESSING
CN109313909B (zh) * 2018-08-22 2023-05-12 深圳市汇顶科技股份有限公司 评估麦克风阵列一致性的方法、设备、装置和系统
FR3088730B1 (fr) * 2018-11-15 2022-03-11 Thales Sa Procédé de création d'au moins une voie de réception virtuelle par l'utilisation d'une antenne radar et système radar
JP2022051974A (ja) * 2019-02-12 2022-04-04 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム
EP3931827A4 (en) 2019-03-01 2022-11-02 Magic Leap, Inc. INPUT DETERMINATION FOR A VOICE PROCESSING ENGINE
US11070907B2 (en) * 2019-04-25 2021-07-20 Khaled Shami Signal matching method and device
US11328740B2 (en) 2019-08-07 2022-05-10 Magic Leap, Inc. Voice onset detection
CN111174899B (zh) * 2019-11-27 2022-06-07 中国船舶重工集团有限公司第七一0研究所 水雷自导头声学接收系统在空气中的测试装置及测试方法
US11503563B2 (en) 2020-02-04 2022-11-15 Alibaba Group Holding Limited Distance estimation using signals of different frequencies
WO2021173667A1 (en) * 2020-02-28 2021-09-02 Bose Corporation Asymmetric microphone position for beamforming on wearables
US11917384B2 (en) 2020-03-27 2024-02-27 Magic Leap, Inc. Method of waking a device using spoken voice commands
US11138990B1 (en) * 2020-04-29 2021-10-05 Bose Corporation Voice activity detection
US11287506B2 (en) * 2020-06-05 2022-03-29 National Technology & Engineering Solutions Of Sandia, Llc Directional infrasound sensing
CN115412406B (zh) * 2021-05-27 2023-08-01 大唐移动通信设备有限公司 通道校准方法、装置及处理器可读存储介质
US11689836B2 (en) * 2021-05-28 2023-06-27 Plantronics, Inc. Earloop microphone

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1640973A2 (en) * 2004-09-28 2006-03-29 Sony Corporation Audio signal processing apparatus and method

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT8453463V0 (it) * 1984-06-06 1984-06-06 Carrozzerie Patavium A Zanin S Attrezzo fluidodinamico portatile per l intestatura a smusso di tubi di grande diametro particolarmente tubi per oleodotti gasdotti e simili
KR100230231B1 (ko) 1994-05-31 1999-11-15 윤종용 다채널 오디오 마스킹처리장치
JP3797751B2 (ja) * 1996-11-27 2006-07-19 富士通株式会社 マイクロホンシステム
US6654468B1 (en) * 1998-08-25 2003-11-25 Knowles Electronics, Llc Apparatus and method for matching the response of microphones in magnitude and phase
WO2000057671A2 (de) * 1999-03-19 2000-09-28 Siemens Aktiengesellschaft Verfahren und einrichtung zum aufnehmen und bearbeiten von audiosignalen in einer störschallerfüllten umgebung
DK1198974T3 (da) * 1999-08-03 2003-06-23 Widex As Høreapparat med adaptiv tilpasning af mikrofonerne
JP3599653B2 (ja) 2000-09-06 2004-12-08 日本電信電話株式会社 収音装置、収音・音源分離装置及び収音方法、収音・音源分離方法並びに収音プログラム、収音・音源分離プログラムを記録した記録媒体
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
JP3716918B2 (ja) 2001-09-06 2005-11-16 日本電信電話株式会社 収音装置、方法及びプログラム、記録媒体
US7171008B2 (en) * 2002-02-05 2007-01-30 Mh Acoustics, Llc Reducing noise in audio systems
US7203323B2 (en) * 2003-07-25 2007-04-10 Microsoft Corporation System and process for calibrating a microphone array
JP3949150B2 (ja) * 2003-09-02 2007-07-25 日本電信電話株式会社 信号分離方法、信号分離装置、信号分離プログラム及び記録媒体
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
JP4247195B2 (ja) * 2005-03-23 2009-04-02 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録した記録媒体
JP4896449B2 (ja) 2005-06-29 2012-03-14 株式会社東芝 音響信号処理方法、装置及びプログラム
JP4701931B2 (ja) 2005-09-02 2011-06-15 日本電気株式会社 信号処理の方法及び装置並びにコンピュータプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
JP5098176B2 (ja) 2006-01-10 2012-12-12 カシオ計算機株式会社 音源方向判定方法及び装置
JP2008079256A (ja) 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
US8041043B2 (en) * 2007-01-12 2011-10-18 Fraunhofer-Gessellschaft Zur Foerderung Angewandten Forschung E.V. Processing microphone generated signals to generate surround sound
US8005238B2 (en) * 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
GB2453118B (en) 2007-09-25 2011-09-21 Motorola Inc Method and apparatus for generating and audio signal from multiple microphones
US8954324B2 (en) * 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
US8724829B2 (en) * 2008-10-24 2014-05-13 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1640973A2 (en) * 2004-09-28 2006-03-29 Sony Corporation Audio signal processing apparatus and method

Also Published As

Publication number Publication date
US8620672B2 (en) 2013-12-31
KR101275442B1 (ko) 2013-06-17
WO2010144577A1 (en) 2010-12-16
KR20120027510A (ko) 2012-03-21
US20100323652A1 (en) 2010-12-23
CN102461203A (zh) 2012-05-16
JP5410603B2 (ja) 2014-02-05
JP2012529868A (ja) 2012-11-22
TW201132138A (en) 2011-09-16
EP2441273A1 (en) 2012-04-18

Similar Documents

Publication Publication Date Title
CN102461203B (zh) 用于对多信道信号进行基于相位的处理的系统、方法及设备
CN102047688B (zh) 用于多通道信号平衡的系统、方法和设备
CN103026733B (zh) 用于多麦克风位置选择性处理的系统、方法、设备和计算机可读媒体
CN102763160B (zh) 用于稳健噪声降低的麦克风阵列子组选择
JP5307248B2 (ja) コヒーレンス検出のためのシステム、方法、装置、およびコンピュータ可読媒体
CN102625946B (zh) 用于多信道信号的去除回响的系统、方法、设备和计算机可读媒体
CN102947878B (zh) 用于音频均衡的系统、方法、装置和设备
US8229126B2 (en) Noise error amplitude reduction
CN102047326A (zh) 用于频谱对比加强的系统、方法、设备及计算机程序产品
Qi et al. A hybrid noise canceller with a real‐time adaptive Wiener filter and a geometric‐based voice–activity detector for an automotive application

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20141029

Termination date: 20190609