CN101682809B

CN101682809B - 声音辨别方法和装置

Info

Publication number: CN101682809B
Application number: CN2008800209202A
Authority: CN
Inventors: W·R·肖特
Original assignee: Bose Corp
Current assignee: Bose Corp
Priority date: 2007-06-21
Filing date: 2008-05-19
Publication date: 2013-07-17
Anticipated expiration: 2028-05-19
Also published as: EP2158788A1; JP5654513B2; US20080317260A1; CN101682809A; JP4965707B2; JP2010530718A; US8767975B2; JP2012147475A; US20140294197A1; WO2008156941A1

Abstract

一种区别声源的方法包括以下步骤：将由各自对声波的特性作出反应的至少两个变换器收集的数据转换为用于每个变换器定位的信号。变换器分离距离小于约70mm或大于约90mm。信号经分离为用于每个变换器定位的多个频带。对于每一频带，将用于变换器定位的信号的量值的关系与阈值相比较。在量值关系落在阈值一侧上的那些频带与量值关系落在阈值另一侧上的那些频带之间产生相对增益变化。因而，基于声源距变换器的距离来将其彼此辨别。

Description

声音辨别方法和装置

技术领域

本发明通常涉及声学领域，且具体涉及声音拾取和再生。更明确地，本发明涉及声音辨别方法和装置。

背景技术

在典型现场音乐会上，将多个麦克风(拾音器设备)放置在靠近乐器和声乐家的每一者。来自麦克风的电信号由扩音器混合、放大和再生，以使得大的表演空间中的听众能清楚地听到音乐家。

常规麦克风具有的问题在于，其不仅响应所期望的乐器或嗓音，而且响应其他附近的乐器和/或嗓音。例如，如果全套鼓的声音散入领唱的麦克风中，那么再生的声音受到不利影响。此问题同样发生在音乐家在录音室中记录其音乐时。

常规麦克风还响应音乐家在舞台上使用的监控扩音器，且响应将放大声音分布给听众的剧场扩音器。因此，必须仔细监控增益以避免反馈，其中音乐放大系统爆发颤噪，这损害性能。这在现场放大表演方面尤其有问题，因为由麦克风拾音的、来自扩音器的信号量可取决于音乐家在舞台上如何来回移动或其在表演时如何移动麦克风来剧烈改变。已在预演期间经仔细调整成无反馈的放大系统可能在表演期间仅因为音乐家在舞台上移动而突然爆发颤噪。

一种类型的拾音器设备为全向麦克风。全向麦克风很少用于现场音乐，因为其易于更倾向于反馈。更典型地，具有方向接受图的常规麦克风(例如，心形麦克风)用以拒绝从其他乐器或嗓音或从说话者输出的离轴声音，从而减少系统颤噪的可能性。然而，这些麦克风的拒绝不足以全部解决问题。

方向性麦克风通常具有随着与源的距离而发生改变的频率响应。这典型为压力梯度响应麦克风。此效应称为“邻近效应”，且其在麦克风靠近源时导致低音增强，且在麦克风远离源时导致低音损耗。喜欢邻近效应的表演者通常在表演期间改变麦克风与乐器(或嗓音)之间的距离以产生效应并改变放大声音的程度。此过程称为“运转话筒”。

虽然一些表演者喜欢邻近效应，但是其他表演者更喜欢在麦克风接受声音的角度和距离的范围内，改进的声音再生系统的频率响应应保持尽可能一致。对于这些表演者而言，乐器的音质不应随音乐家移动靠近或远离麦克风而变化。

当存在大量背景噪音时，蜂窝电话、正常电话和扬声器电话可能具有性能问题。在此情况下，降级或由此噪音淹没了所期望的说话者嗓音的清晰度。这些电话将需要能够在所期望的说话者与背景噪音之间进行辨别。电话随后将提供说话者嗓音对噪音的相对强调。

发明内容

本发明旨在克服上述一个或多个问题。简要地概括，根据本发明的一个方面，区别声源的方法包括：将由各自对声波特性作出反应的至少两个变换器所收集的数据转换为用于每个变换器定位的信号。变换器分离距离小于约70mm或大于约90mm。信号经分离为用于每个变换器定位的多个频带。对于每一频带，将用于变换器定位的信号的量值的关系与第一阈值相比较。在量值关系落在阈值一侧上的那些频带与量值关系落在阈值另一侧上的那些频带之间产生相对增益变化。同样，基于声源距变换器的距离来将其彼此辨别。

本发明的其他特征包括：(a)使用快速傅里叶变换将来自时域的信号转换为频域，(b)比较信号的比率的量值，(c)产生量值比较落在阈值一侧上的那些频带以接收约为1的增益，(d)产生量值比较落在阈值另一侧上的那些频带以接收约为0的增益，(e)每个变换器是全向麦克风，(f)将频带转换为输出信号，(g)使用输出信号驱动一个或多个声学驱动器以产生声音，(h)提供用户可变阈值以使得用户可以调整与变换器的距离敏感度，或(i)该特性为局部声压、其一阶梯度、高阶梯度和/或其组合。

另一特征涉及提供与第一阈值不同的第二阈值。产生步骤导致量值比较落在阈值之间的第一范围中的那些频带与量值比较落在阈值外的那些频带之间的相对增益变化。

又一特征涉及提供限定与第一范围不同且不覆盖第一范围的第二范围的第三和第四阈值。产生步骤导致量值比较落在第一或第二范围中的那些频带与量值比较落在第一和第二范围外的那些频带之间的相对增益变化。

另外特征要求(a)变换器分离距离不少于约250微米，(b)变换器分离距离在约20mm至约50mm之间，(c)变换器分离距离在约25mm至约45mm之间，(d)变换器分离距离约35mm，和/或(e)从每一变换器的振膜中心测量变换器之间的距离。

其他特征包括(a)产生步骤使低增益与高增益之间的相对增益变化衰落，(b)跨越第一阈值进行相对增益变化的衰落，(c)跨越一个或多个变换器的输出信号的某一量值等级进行相对增益变化的衰落，和/或(d)相对增益变化的产生由(1)基于量值关系的增益项和(2)基于来自一个或多个变换器的输出信号的量值的增益项实现。

又一特征包括(a)为第一组频带推导出的一组增益项也被应用于第二组频带，(b)第一组的频带比第二组的频带低，(c)为第一组频带推导出的该组增益项也被应用于第三组频带，和/或(d)第一组的频带比第三组的频带低。

另外特征要求(a)声波在可压缩流体中行进，(b)可压缩流体为空气，(c)声波在基本上不可压缩流体中行进，(d)基本上不可压缩流体为水，(e)产生步骤导致相对增益变化为来自两个变换器中仅一个的信号，(f)特定频带在可如何快速地改变该频带的增益方面有限制，和/或(g)存在可如何快速地增加增益的第一限制和可如何快速地减少增益的第二限制，第一限制与第二限制不同。

根据另一个方面，区别声源的方法包括将由对声波特性作出反应的变换器收集的数据转换为用于每一变换器定位的信号。信号经分离为用于每一定位的多个频带。对于每一频带，确定用于定位的信号的量值的关系。对于每一频带，从当声波由第一变换器检测时与当此波由第二变换器检测时之间的信号确定时间延迟。在量值关系和时间延迟落在量值关系和时间延迟的各阈值的一侧上与(a)量值关系落在其阈值的另一侧上、(b)时间延迟落在其阈值的另一侧上或(c)量值关系和时间延迟两者都落在其各阈值的另一侧上的那些频带之间产生相对增益变化。

另外特征包括(a)提供用于量值关系的可调整阈值，(b)提供用于时间延迟的可调整阈值，(c)跨越该量值关系阈值衰落相对增益变化，(d)跨越该时间延迟阈值衰落相对增益变化，(e)相对增益变化的产生由(1)基于量值关系的增益项和(2)基于时间延迟的增益项实现，(f)相对增益变化的产生进一步由基于来自一个或多个变换器的输出信号量值的增益项实现，和/或(g)对于每一频带，存在用于量值关系的指定阈值和用于时间延迟的指定阈值。

另一方面涉及辨别声源的方法。捕获由各自对声波特性作出反应的至少三个全向麦克风收集的数据。数据经处理以确定(1)哪个数据表示小于距麦克风的某一距离定位的一个或多个声源，和(2)哪个数据表示大于距麦克风的某一距离定位的一个或多个声源。处理步骤的结果经利用以提供表示上述(1)或(2)中一个中的声源的数据对表示上述(1)或(2)中另一个中的声源的数据的加大强调。同样，基于声源距麦克风的距离来将声源彼此辨别。

另外特征包括：(a)利用步骤提供表示(1)中的声源的数据对表示(2)中的声源的数据的加大强调，(b)在利用步骤之后，将数据转换为输出信号，(c)第一麦克风为距第二麦克风的第一距离且距第三麦克风的第二距离，第一距离比第二距离小，(d)处理步骤从第二麦克风选择高频率且从第三麦克风选择低频率(其比高频率低)，(e)在处理步骤中组合低频率与高频率，和/或(f)处理步骤(1)从来自麦克风一和二的数据确定相位关系，和(2)从来自麦克风一和三的数据来确定量值关系。

根据另一个方面，个人通信设备包括对声波特性作出反应以捕获表示特性的数据的两个变换器。变换器分离距离约70mm或更小。用于处理数据的信号处理器确定(1)哪个数据表示小于距变换器的某一距离定位的一个或多个声源，和(2)哪个数据表示大于距麦克风的某一距离定位的一个或多个声源。信号处理器提供表示上述(1)或(2)中一个中的声源的数据对表示上述(1)或(2)中另一个中的声源的数据的加大强调。同样，基于声源距变换器的距离来将声源彼此辨别。

另外特征要求(a)信号处理器将数据转换为输出信号，(b)使用输出信号驱动远离设备的第二声学驱动器以产生远离设备的声音，(c)变换器分离距离不小于约250微米，(d)设备为蜂窝电话，和/或(e)设备为扬声器电话。

另一方面要求麦克风系统具有硅芯片和对声波特性作出反应以捕获表示特性的数据的固定至芯片的两个变换器。变换器分离距离约70mm或更小。信号处理器固定至芯片以用于处理数据以确定(1)哪个数据表示小于距变换器的某一距离定位的一个或多个声源，和(2)哪个数据表示大于距麦克风的某一距离定位的一个或多个声源。信号处理器提供表示上述(1)或(2)中一个中的声源的数据对表示上述(1)或(2)中另一个中的声源的数据的加大强调，从而使得基于声源距变换器的距离来将声源彼此辨别。

另一方面要求区别声源的方法。将由对声波特性作出反应的变换器收集的数据转换为用于每一变换器定位的信号。信号经分离为用于每一定位的多个频带。为用于定位的每一频带确定信号量值关系。对于每一频带，从指示声波何时由第一变换器检测以及此声波何时由第二变换器检测的信号确定相移。在量值关系和相移落在量值关系和相移的各阈值的一侧上的那些频带与(1)量值关系落在其阈值的另一侧上、(2)相移落在其阈值的另一侧上或(3)量值关系和相移两者都落在其各阈值的另一侧上的那些频带之间产生相对增益变化。

另外特征要求提供用于相移的可调整阈值。

根据另一方面，区别声源的方法包括将由对声波特性作出反应的变换器收集的数据转换为用于每一变换器定位的信号。信号经分离为用于每一定位的多个频带。对于每一频带，确定用于定位的信号量值关系。在量值关系落在阈值的一侧上的那些频带与量值关系落在阈值的另一侧上的那些频带之间产生相对增益变化。增益变化跨越阈值衰落以避免在阈值处或附近的突然增益变化。

另一特征要求从信号确定在声波由第一变换器检测时与在此波由第二变换器检测时之间的每一频带的时间延迟。在量值关系和时间延迟落在量值关系和时间延迟的各阈值的一侧上的那些频带与(1)量值关系落在其阈值的另一侧上、(2)时间延迟落在其阈值的另一侧上或(3)量值关系和时间延迟两者都落在其各阈值的另一侧上的那些频带之间产生相对增益变化。增益变化跨越阈值衰落以避免在阈值处或附近的突然增益变化。

其他特征包括(a)为第一倍频程(octave)推导出的一组增益项也被应用于第二倍频程，(b)第一倍频程比第二倍频程低，(c)为第一倍频程推导出的该组增益项也被应用于第三倍频程，(d)第一倍频程的频带比第三倍频程低，和/或(e)第一组的频带比第二组的频带低。

另一方面涉及区别声源的方法。将由对声波特性作出反应的变换器收集的数据转换为用于每一变换器定位的信号。信号经分离为用于每一定位的多个频带。为每一频带确定信号特性，其指示与对特定带提供能量的声源的变换器的距离和角度。在信号特性指示对特定带提供能量的声源符合距离和角度要求的那些频带与信号特性指示对特定带提供能量的声源(a)不符合距离要求、(b)不符合角度要求或(c)不符合距离和角度要求的那些频带之间产生相对增益变化。

另外特征包括以下特性，包括(a)指示声波何时由第一变换器检测到以及此波何时由第二变换器检测到的相移，和/或(b)在声波由第一变换器检测到时与此波由第二变换器检测到时之间的时间延迟，藉此指示与对特定带提供能量的声源的变换器的角度。

另外特征要求输出信号(a)记录在存储媒体上、(b)由发射机通信和/或(c)经进一步处理和使用以呈现关于声源定位的信息。

本发明的另一方面要求区别声源的方法。将由各自对声波特性作出反应的四个变换器收集的数据转换为用于每一变换器定位的信号。信号经分离为用于每一变换器定位的多个频带。对于每一频带，将用于至少两个不同对的变换器的信号的量值的关系与阈值相比较。对每一变换器对进行确定量值关系落在阈值一侧还是另一侧上。利用每一确定的结果决定总量值关系落在阈值一侧还是另一侧上。在总量值关系落在阈值的一侧上的那些频带与总量值关系落在阈值的另一侧上的那些频带之间产生相对增益变化，从而使得基于声源距变换器的距离来将其彼此区别。

其他特征要求(a)四个变换器排列成线性阵列，(b)每个相邻对的变换器之间的距离基本上相同，(c)四个变换器中的每一个定位于假想多边形的各顶点处，和/或(d)对每个变换器对的确定的结果赋予权重。

另一方面要求区别声源的方法。将声音辨别系统切换为训练模式。声源经移动至声源接受区域内的多个定位，从而使得声音辨别系统可确定用于多个频率仓(frequency bin)的多个阈值。将声源辨别系统切换为操作模式。声音辨别系统使用阈值以提供定位于声源接受区域中的声源对定位于声源接受区域外的声源的相对强调。

另一特征要求麦克风中的两个由沿任一方向无限延伸的假想直线连接。第三麦克风远离此线定位。

又一个特征要求将用于六个独特对的变换器的信号的量值的关系与阈值相比较。

本发明的这些和其他方面、目标、特征和优点将从下文详细描述和随附权利要求的审阅且通过参考附图而更清楚理解和了解。

附图说明

图1为相对于拾音器设备的第一位置中的声源的示意图；

图2为相对于拾音器设备的第二位置中的声源的示意图；

图3为相对于拾音器设备的第三位置中的声源的示意图；

图4为相对于拾音器设备的第四位置中的声源的示意图；

图5为具有麦克风阵列的硅芯片的横截面；

图6A-图6C示出作为角度和距离的函数的恒定dB差和时间差的线的示图；

图7为麦克风系统的第一实施例的示意图；

图8为常规麦克风和图7的麦克风系统的输出对距离的示图；

图9为心形麦克风和图7的麦克风系统的输出对角度的极坐标图；

图10a和图10b为从不同方向暴露于声波的变换器的示意图；

图11为相对宽间距变换器对的恒定量值差(以dB为单位)的线的示图；

图12为相对窄间距变换器对的恒定量值差(以dB为单位)的线的示图；

图13为麦克风系统的第二实施例的示意图；

图14为麦克风系统的第三实施例的示意图；

图15a和图15b为增益对频率的示图；

图16A为麦克风系统的第四实施例的示意图；

图16B为第四实施例的另一部分的示意图；

图16C-图16E为第四实施例中所用的增益项的曲线图；

图17A为具有集成麦克风的耳机的透视图；

图17B为具有集成麦克风的蜂窝电话的正视图；

图18A和图18B为频率对量值和时间延迟的阈值的示图；

图19为证明转换速率限制的曲线图；

图20为麦克风系统的第五实施例的侧面示意图；以及

图21为麦克风系统的第六实施例的顶部示意图。

具体实施方式

对于一些声音应用(例如，现场音乐的放大、声音记录、蜂窝电话和扬声器电话)而言，需要具有特殊组的方向性的麦克风系统。揭露具有这些性质的新麦克风系统，其避免方向性麦克风的许多典型问题，同时提供改进的性能。此新麦克风系统使用两个或更多间隔麦克风元件(变换器)测量的压力，以产生来自落入相对于麦克风系统的距离和角度的某一接受窗口内的声源的信号与来自所有其他声源的信号的增益相比较的相对正增益。

这些目标由具有与常规麦克风非常不同方向性图的麦克风系统实现。具有此图的新麦克风系统接受仅在“接受窗口”内的声音。接受与麦克风系统的某一距离和角度内发起的声音。拒绝此距离和/或角度外发起的声音。

在新麦克风系统的一个应用(现场音乐表演)中，想拒绝的源(诸如，在歌手麦克风处的全套鼓或在任何麦克风处的扩音器)可能太远和/或在错误角度而不能由新麦克风系统接受。因此，避免了上述问题。

从图1开始，拾音器设备10包括前变换器12和后变换器14。变换器通过对声波的特性(诸如，局部声压、一阶声压梯度、高阶声压梯度或其组合)作出反应从而在其各定位收集数据。此实施例中的每一变换器可为常规全向声压响应麦克风，且变换器排列成线性阵列。变换器将存在于其各定位处的瞬时声压各自转换为表示在那些定位处随时间的声压的电信号。

认为声音的点源15的理想状况在自由空间中，如图1中的扬声器所示。声源15也可以为例如歌手或音乐乐器的输出。从声源15到前变换器12的距离为R，且拾音器设备10与源之间的角度为θ。变换器12、14分离距离r_t。从上述电信号，知道r_t，且将信号的方面与阈值相比较，可以确定是否从声源15接受声音。当声压波到达变换器12时与当该波到达变换器14时之间的时间差为τ。符号c为声音的速度。因此，包括未知θ的第一方程式如下：

θ = a \cos [\frac{1}{2} \cdot \frac{[- {(r_{t})}^{2}] + τ^{2} \cdot c^{2} - 2 \cdot τ \cdot c \cdot R}{r_{t} \cdot R}]

而且，可以测量在变换器12和14的各定位处的声压量值M1和M2，且知道r_t。因而，可以建立包括未知R的第二方程式：

R = \frac{1}{2} \cdot \frac{\frac{M 1}{M 2}}{{(\frac{M 1}{M 2})}^{2} - 1} \cdot [(- 2) \cdot \frac{M 1}{M 2} \cdot \cos (θ) + 2 \cdot {[{(\frac{M 1}{M 2})}^{2} \cdot \cos {(θ)}^{2} - {(\frac{M 1}{M 2})}^{2} + 1]}^{\frac{1}{2}}] \cdot r_{t}

因此，具有两个方程式和两个未知R和θ(给定r_t、τ、c和M1/M2)。使用计算机同时用数字解决两个方程式。

图2中提供一个实例。在此实例中，假定声源15发出球面波。当R与变换器12、14之间的距离r_t相比而言较少且θ＝0°时，在两个变换器信号之间将存在大的声压量值差。这是因为在从声源15到变换器12的距离R与从源15到变换器14的距离R+r_t之间存在大的相对差而发生。对于声音的点源而言，声压量值作为从源15到变换器12的1/R和从源15到变换器14的1/(R+r_t)的函数下降。

优选从变换器12和14的每一者的振膜中心测量距离r_t。距离r_t优选小于所关心的最高频率的波长。然而，r_t不应太小，因为作为距离的函数的量值比率将小且因此更难以测量。当声波在气体中行进时，其中c大约＝343m/s(例如，空气)，在一个实例中距离r_t优选约为70毫米(mm)或更小。在约70mm，系统最佳适于主要由人讲演和类似信号构成的声学环境。优选距离r_t在约20mm至约50mm之间。更优选距离r_t在约25mm至约45mm之间。最优选距离r_t约为35mm。

鉴于此点，已经固有地在可压缩流体(例如，空气)的环境中进行了描述。应注意，本发明将在不可压缩流体(例如，水或盐水)环境中同样有效。在水的状况下，变换器间距可约为90mm或更大。如果仅需要测量低或极低频率，那么变换器间距可变得相当大。例如，假定水中声音速度为1500米/秒且所关心的最高频率为100hz，那么变换器可间隔15米。

转至图3，当R相对大且θ＝0°时，相对时间差(延迟)保持相同，但是变换器12、14的信号之间的量值差显著减少。随着R变得非常大，量值差接近零。

参考图4，对于任何R，但θ＝90°时，由于从声源15到每个变换器12、14的路径长度相同，所以变换器12、14之间的时间延迟消失。在0°与90°之间的角度，时间延迟从r_t/c减少为零。一般而言，当θ＝90°时，变换器12、14的信号量值将相等。可以看出，在作为声源15的定位相对于音频设备10的定位的函数的从图2-4的变换器对输出的信号中存在相对量值、相对相位(或时间延迟)或两者的变化。这在下文更详细描述的示图6a-6c中更完整地示出。可在任何角度计算声源角度。然而，在此实例中，由于θ接近±90°而使得声源距离R变得逐渐更难以估计。这是因为在±90°，无论距离如何，M1与M2之间不再存在任何量值差。

参考图5，硅芯片35的横截面揭露微机电系统(MEMS)麦克风阵列37。阵列37包括一对声学变换器34、41，其彼此间隔距离r_t至少约250微米。选择端口43、45增加变换器34、41“听到”其环境的有效距离d_t。可以将距离d_t设置在高达约70mm的任何需要长度。芯片35还包括连接至变换器34、41的相关信号处理装置(图5中未示出)。MEMS麦克风阵列的优点在于，可在相同芯片上放置所要信号处理(下文讨论)中的一些或全部，例如：信号调节、A/D转换、开窗口、变换和D/A转换等。这提供非常紧密、单一的麦克风系统。MEMS麦克风阵列的实例为可购自Akustica，Inc.2835East Carson Street，Suite 301，Pittsburgh，PA 15203的AKU2001Tri-State Digital Output CMOS MEMS Microphone(http://www.akustica.com/documents/AKU2001ProductBrief.pdf)。

转至图6a，提供归因于声音15的声音输出的存在于变换器12、14的定位处的信号的量值差和时间延迟差(相位)的理论图，其为源15的定位(角度和距离)相对于音频设备10(由变换器12和14构成)的定位的函数。图6a-6c的示图是假定变换器12、14之间的距离r_t为35mm来计算。上文段39中的方程式用以计算地产生此图。然而，在此，将R和θ设置为已知值且计算τ和M1/M2。理论声源角度θ和距离R广泛改变以确定τ和M1/M2的范围。Y轴提供声源角度θ(以度为单位)且X轴提供声源距离(以米为单位)。绘出恒定量值差(以dB为单位)的线17。同样绘出在变换器12、14定位处的信号的恒定时间差(微秒)的线19。如果需要，那么可以提供更多阶。

例如，如果需要仅接受位于距变换器12小于0.13米且在小于25度的角度θ的声源，那么发现这些值在点23相交。在点23，看见量值差必须大于2dB且时间延迟必需大于100微秒。阴影面积27指示用于此设置的接受窗口。如果声源产生大于或等于2dB的量值差和大于或等于100微秒的时间延迟，那么接受该声源。如果声源产生小于2dB的量值差和/或小于100微秒的时间延迟，那么拒绝该声源。

上文基于声源与变换器的距离和角度的类型的处理以及所得接受或拒绝声源是以逐频带为基础完成的。需要相对窄频带以避免阻碍所要声音或传递非所要声音。优选地，使用窄频带和短时间块，尽管这两个特性彼此冲突。较窄频带增强非想要的声源的拒绝，但是要求较长时间块。然而，较长时间块产生麦克风用户可能不可接受的系统等待时间。一旦确定了最大可接受系统等待时间，则可以选择频带宽。随后选定块时间。下文提供进一步详情。

因为系统在许多频带上独立工作，所以接受位于距麦克风0.13米的轴上的唱C调的所要歌手，同时拒绝位于距麦克风0.25米的离轴的演奏E调的吉他。因此，如果距麦克风少于0.13米且在轴上的所要歌手唱C调，但是吉他在从任何角度距麦克风0.25米播放E调，那么麦克风系统传递声乐家的C调和其谐音，而同时拒绝乐器家的E调和其谐音。

图6B示出其中将两个阈值用于量值差和时间差中每一个的实施例。接受产生2≤dB差≤3的量值差和80≤微秒≤100的时间差的声源。接受窗口由阴影面积29指示。拒绝产生接受窗口29外的量值差和/或时间差的声源。

图6C示出其中使用两个接受窗口31和33的实施例。接受产生≥3dB的量值差和80≤微秒≤100的时间差的声源。同样接受产生2≤dB差≤3的量值差和≥100微秒的时间差的声源。拒绝产生接受窗口31和33外的量值差和/或时间差的声源。可以通过将适当阈值用于量值差和时间差来产生任何数目的接受窗口。

现在转至图7，将描述麦克风系统11。来自声源15的声波导致变换器12、14产生表示声波特性的电信号作为时间的函数。变换器12、14各自优选地为全向麦克风元件，其可以通过有线或无线地连接至系统的其他部分。此实施例中的变换器具有分离距离约35mm的其各振膜的中心。图7中其余元件的一些或全部可经集成为麦克风，或其可以在一个或多个独立组件中。用于每个变换器的信号通过各常规前置放大器16和18以及常规模拟数字(A/D)转换器20。在一些实施例中，独立A/D转换器20用以转换由每个变换器输出的信号。可选地，多路复用器可以由单个A/D转换器使用。如果需要，那么放大器16和18也可以对各变换器12和14提供DC功率(即，幻象功率)。

使用本技术领域人员已知的块处理技术，在块22将覆盖数据的块开窗口(对用于每一变换器的信号进行独立开窗口)。在块24使用快速傅里叶变换(FFT)将有窗口数据从时域转换为频域(对用于每一变换器的信号进行独立FFT)。这将信号分为用于每个变换器定位的多个线性间隔频带(即，仓)。其他类型的转换可以用以将有窗口数据从时域转换为频域。例如，可以使用小波变换替代FFT以获得对数间隔频率仓。在此实施例中，使用32000样本/秒的取样频率，其中每个块含有512样本。

离散傅里叶变换(DFT)的反函数的定义如下：

函数X＝fft(x)和x＝ifft(X)实施转换，且针对长度N的向量给出逆变换对，通过：

X (k) = Σ_{j = 1}^{N} x (j) ω_{N}^{(j - 1) (k - 1)}

x (j) = (1 / N) Σ_{k = 1}^{N} X (k) ω_{N}^{- (j - 1) (k - 1)}

其中ω_N＝e^(-2πi)/N为第N个单位根。

FFT为用于加速计算的DFT的算法。实信号(诸如，音频)的傅里叶变换得到复数结果。复数X的量值经定义为：

sqrt(real(X)·^2+imag(X)·^2)

复数X的角度被定义为

\arctan (\frac{Im (X)}{Re (X)})

其中观察实部和虚部的符号以将角度放置在单位圆的适当象限中，从而允许以下范围中的结果：

-π≤angle(X)＜π

同等时间延迟经定义为：

\frac{angle (X)}{2 \cdot π \cdot f}

可以用若干方法中的任何方法来计算两个复数值X1和X2的量值比率。一种方法可以获得X1和X2的比率，且随后找到该结果的量值。可选地，一种方法可以分别找到X1和X2的量值，且获得其比率。可选地，一种方法可以进入对数空间，且获得比率的量值的对数，或者可选地，获得log(X1)和log(X2)的差(减法)。

类似地，可以用多种方法来计算两个复数值之间的时间延迟。一种方法可以获得X1和X2的比率、找到该结果的角度且除以角频率。一种方法可以分别找到X1和X2的角度、将其相减且将结果除以角频率。

如上所述，建立信号之间的关系。在一些实施例中，该关系为来自前变换器12的信号与来自后变换器14的信号的比率，可以在除法器块26以逐块为基础为每个频率仓计算该比率。在块28计算此比率(关系)的量值(以dB为单位)。通过首先在块30计算相位且随后在除法器32将该相位除以每个频率仓的中心频率，来以逐块为基础为每个频率仓计算时间差(延迟)T(Tau)。时间延迟表示在当声波由变换器12检测到时与当此波由变换器14检测到时之间的流逝时间。

可以使用用于估计两个变换器信号之间的量值和时间延迟差的其他熟知数字信号处理(DSP)技术。例如，计算时间延迟差的替代方法是使用两个信号X1和X2之间的每个频带中的互相关。

在块34将每个频率仓(带)的计算出的量值关系和时间差(延迟)与阈值相比较。例如，如以上在图6A中所描述，如果量值差大于或等于2dB且时间延迟大于或等于100微秒，那么接受(强调)该频率仓。如果量值差小于2dB和/或时间延迟小于100微秒，那么拒绝(不予强调)该频率仓。

按照用户要求，可以操纵用户输入36以改变接受角度阈值，且可以操纵用户输入38以改变距离阈值。在一实施例中，为用户可以根据需要选择的不同接受图案提供少量用户预置。例如，用户将在诸如关于角度设置的窄或宽和关于距离设置的近或远的一般种类之间进行选择。

对用户提供视觉或其他指示以使其知道关于角度和距离的阈值设置。因此，可提供用户可变阈值以使得用户可调整与变换器的距离选择性和/或角度选择性。用户界面可以在改变距离和/或角度阈值时表示此，但是实际上用户正在调整量值差和/或时间差阈值。

当量值差和时间延迟两者都落在特定频带的接受窗口之内时，在块40计算出相对高增益，且当参数中的一个或两个在窗口外时，计算出相对低增益。高增益经设置约为1而低增益约为0。可选地，高增益可以高于1而低增益在高增益之下。通常，在参数(量值和时间延迟)比较两者都落在其各阈值的一侧上的那些频带与一个或两个参数比较落在其各阈值的另一侧上的那些频带之间产生相对增益变化。

为每个数据块中的每个频率仓计算增益。可以用本领域技术人员已知的其他方法来进一步操纵计算出的增益，以最小化此增益变化产生的非自然信号。例如，最小增益可以限于稍低的值而不是零。另外，通过使用快速冲击缓慢衰退过滤器可以允许任何频率仓中的增益快速增加但是较慢下降。在另一方法中，对在任何给定时间允许从一个频率仓到下一频率仓多少增益变化设置限制。

以逐频率仓为基础，在多路复用器42将计算出的增益应用于来自单一变换器(例如，变换器12，尽管也可使用变换器14)的频域信号。因此，接受窗口中的声源相对于窗口外的源得以强调。

使用常规块处理技术，在块44将修改的信号进行逆FFT以将来自频域的信号转换回时域。随后在块46对信号进行开窗口、覆盖和与先前块相加。在块48，将信号从数字信号转换回模拟(输出)信号。随后将块48的输出发送至声音加强系统的常规放大器(未图示)和声学驱动器(即，扬声器)(未图示)以产生声音。可选地，可以将输入至块48的信号(数字)或自块48输出的信号(模拟)(a)记录在存储媒体(例如，电子的或磁的)上、(b)通过发射机(有线或无线)通信或(c)进一步处理或用以呈现关于声源定位的信息。

将参考图8和图9来描述此麦克风系统的一些优点。关于距离选择性，常规麦克风的响应随距离平稳减少。例如，对于具有恒定强度的声源而言，典型地全向麦克风的输出电平随距离R下降为1/R。这在图8中示出为线段49和50，图8描绘作为R(从麦克风到声源的距离)的对数的函数的相对麦克风输出(以dB为单位)。

图7中所示的麦克风系统具有与R相同的下降(线段49)，但是仅至指定距离R0。麦克风输出在R0的下降由线段52表示。对于将由歌手握住的声乐家的麦克风而言，通常将R0设置约为30cm。对于固定在台上的声乐家麦克风而言，该距离可以小得多。新麦克风响应位于较R0更靠近的歌手，但是拒绝远离的一切，诸如来自其他乐器或扩音器的声音。

转至图9，将讨论角度选择性。常规麦克风可以具有各种方向性图案中的任何图案。心形响应(其为用于麦克风的普通方向性图案)在极坐标图线54中示出(曲线的半径指示对到达所指示角度的声音的相对麦克风量值响应)。心形麦克风对到达前端的声音具有最强量值响应，随着声源移动到后端具有越来越少响应。从后端到达的声音显著被削减。

图7的麦克风系统的方向性图案由饼形线56示出。对于到达接受角度(在此实例中，±30°)内的声音而言，麦克风具有高响应。到达此角度外的声音显著被削减。

量值差是距离和角度的函数。由于距离的量值的最大变化出现在与变换器一致的线中。由于距离的量值的最小变化出现在与变换器的轴垂直的线中。对于离轴90度的源而言，不存在量值差，这与源距离无关。然而，角度仅为时间差独自的函数。对于距离选择性重要的应用而言，变换器阵列应朝向希望选择的一个或多个声源的定位而定向。

由于两个原因，与常规麦克风相比，具有此类极端方向性的麦克风将对反馈较不敏感。首先，在现场表演应用中，新麦克风大量拒绝主要或监控扩音器(其可能存在)的声音，因为其太远且在接受窗口之外。减少的敏感度降低系统的回路增益，从而减少反馈的可能性。此外，在常规系统中，反馈由于在舞台上具有若干“开放的”麦克风和扬声器而加重。然而，任何一个麦克风和扬声器可能是稳定的且不产生反馈，多个交叉耦接系统的组合可能较易于为不稳定，从而导致反馈。本文描述的新麦克风系统仅对于接受窗口内的声源而言为“开放的”，从而使得较不可能通过耦接至舞台上的另一麦克风和声音放大系统而有助于反馈，即使那些其他麦克风和系统完全常规。

新麦克风系统也大大降低来自表演或记录应用中的其他表演者或其他乐器的声音渗透(bleed through)。接受窗口(距离和角度两者)可由表演者或空中呼叫的声音调整以符合表演需要。

新麦克风系统可以模拟麦克风的许多不同风格的声音以用于想要该效应作为其声音的一部分的表演者。例如，在本发明的一实施例中，此系统可以通过针对指示小R值的量值差在低频比高频增加更多增益来模拟常规麦克风的邻近效应。在图7的实施例中，以频率仓为基础单独处理变换器12的输出以形成输出信号。变换器12通常为全向压力响应变换器，且其将不呈现与典型压力梯度响应麦克风中存在的近似的响应。增益块40将距离相关增益功能强加于变换器12的输出，但是迄今为止所描述的功能根据与麦克风系统的距离/角度来传递或阻碍频率仓。在增益处理块40中可以应用更复杂功能，以模拟压力梯度麦克风的邻近效应，同时保持所描述系统的距离/角度选择性。可以使用可变系数而不是使用一或零的系数，其中系数值作为频率和距离的函数改变。此函数具有一阶高通滤波器波形，其中转角频率随距离减小而减小。

邻近效应也可以通过将变换器12、14组合为单一单向或双向麦克风来产生，从而产生固定的方向阵列。在此状况下，将计算出的增益应用于来自变换器12、14的组合信号，从而除了图7的处理的增强的选择性之外，提供压力梯度类型方向行为(不可由用户调整)。在本发明的另一实施例中，新麦克风系统不在指示小R值的量值差的低频率比高频率增加更多增益，且因此不显示邻近效应。

新麦克风可以产生新麦克风效应。一个实例为对于接受窗口内的所有声源距离而言具有相同输出的麦克风。使用变换器12和14之间的量值差和时间延迟，调整增益以补偿从变换器12的1/R下降。此麦克风可能对不“运转话筒”的音乐家有吸引力。恒定水平的声源将对于距接受窗口内变换器的任何距离产生相同输出量值。此特征可能在扩音(PA)系统中有用。无经验的演播员通常不注意保持与麦克风的恒定距离。使用常规PA系统，其再生的嗓音可能在太高声与太轻声之间变化。本文所述的改进的麦克风保持嗓音水平恒定，与扬声器和麦克风之间的距离无关。因此，减少了无经验发言者的再生嗓音水平的变化。

新麦克风可以用以替换用于通信目的的麦克风(诸如，用于消费者的蜂窝电话的麦克风(头戴式耳机或其他))或用于飞行员的自由移动麦克风。这些个人通信设备通常具有预期位于距用户嘴唇约1英尺或更小的麦克风。并不使用话筒吊杆替代靠近用户嘴唇的常规噪音消除麦克风，安装在头戴式耳机上的一对小麦克风可以使用角度和/或距离阈值以仅接受具有正确距离和/或角度(例如，用户嘴唇)的那些声音。其他声音将被拒绝。接受窗口以用户嘴的预期定位为中心。

此麦克风也可以用于其他嗓音输入系统，其中已知谈话者的定位(例如，车中)。一些实例包括无需手的电话应用(诸如交通工具中无需手的操作)和无需手的嗓音命令(诸如，交通工具系统使用语音识别能力以接受从用户输入的嗓音以控制交通工具功能)。另一个实例在可被使用的扬声器电话中(例如，在电视会议中)使用麦克风。这些类型的个人通信设备通常具有预期位于距用户嘴唇1英尺以上的麦克风。本申请的新麦克风技术也可以与语音识别软件组合使用。来自麦克风的信号经传递至频域中的语音识别算法。对在声源的接受区域外的频率仓提供比在接受区域中的频率仓低的加权。此布置可以帮助语音识别软件处理噪音环境中的所要说话者嗓音。

现在转至图10A和图10B，将描述另一实施例。在图7中所描述的实施例中，使用两个变换器12、14，其之间具有与在变换器最大操作频率的声音波长相比而言相对宽的间距。下文将描述关于此的原因。然而，随着频率变高，变得难以使用计算上简单的方法来可靠估计两个变换器之间的时间延迟。通常，对于每个频率仓计算麦克风之间的相差，且将该相差除以仓的中心频率以估计时间延迟。可以使用其他技术，但是其更加强计算。

然而，当声音的波长接近麦克风之间的距离时，此简单方法出问题。相位测量产生范围在-π与π之间的结果。然而，在具有2π的整倍数的值的测量中存在不确定性。相差的0弧度的测量可以仅简单表示2π或-2π的相差。

在图10a和图10b中用图说明此不确定性。平行线58表示进入声压波的波长间距。在图10a和图10b中，声压波中的峰值同时达到变换器12、14，且因此测量出0相移。然而，在图10a中，波沿垂直于连接变换器12、14的假想直线的箭头60的方向到来。在此状况下，在两个变换器之间时间延迟实际上为零。相反，在图10b中，波沿箭头62的方向平行于连接变换器12、14的假想线到来。在此实例中，两个波长适应两个变换器之间的间隔。到达时间差无疑非零，但测量出的相位延迟保持为零，而不是4π的校正值。

此问题可以通过减少变换器12、14之间的距离从而使得即使对于希望感测到的最高频率(最短波长)其间距也小于波长来避免。此方法消除2π不确定性。然而，变换器之间的窄间距减少变换器12、14之间的量值差，从而使得更难以测量量值差(且因此提供距离选择性)。

图11示出当变换器12、14在其之间具有相对宽间距(约35mm)时，对于声源与变换器12之间的各种距离和角度而言变换器12、14之间的恒定量值差(以dB为单位)的线。图12示出以窄得多的变换器间距(约7mm)对于声源的各种距离和角度而言变换器12、14之间的恒定量值差(以dB为单位)的线。具有较窄变换器间距，大大减少量值差，且更难以获得精确距离估计。

此问题可以通过使用两对变换器元件来避免：用于源距离和角度的低频估计的宽间隔对和用于距离和角度的高频估计的窄间隔对。在一实施例中，仅使用三个变换器元件：用于低频的宽间隔T1和T2以及用于高频的窄间隔T1和T3。

现在将转至图13。图13中许多块与图7中所示出的块类似。来自变换器64、66和68中每一个的信号通过常规麦克风前置放大器70、72和74。每一变换器优选地为全向麦克风元件。请注意，变换器64与66之间的间距小于变换器64与68之间的间距。随后通过模拟数字转换器76将三个信号流各自从模拟形式转换为数字形式。

三个信号流中的每一个在块78接收标准块处理开窗口，且在FFT块80将其从时域转换为频域。在块82选出来自变换器66的信号的在预定频率以上的高频仓。在此实施例中，预定频率为4Khz。在块84选出来自变换器68的信号的在4Khz或其以下的低频仓。在块86将来自块82的高频仓与来自块84的低频仓组合以产生频率仓的全部补集。应注意，可以在模拟域而不是数字域中交替进行此带分裂。

信号处理的其余物与图7中的实施例的基本上相同，且因此将不进行详细描述。计算来自变换器64的信号与离开块86的组合低频和高频信号的比率。如参考图7描述处理商。将计算出的增益应用于来自变换器64的信号，且将所得信号应用于在由数字模拟转换器转换回模拟信号之前的标准逆FFT、开窗口以及重叠和相加块。在一实施例中，随后将模拟信号发送给信号增强系统的常规放大器88和扬声器90。此方法避免2π不确定性的问题。

转至图14，将描述避免2π不确定性的问题的另一实施例。此实施例的前端基本上与图13中相同地通过FFT块80。在这一点上，在除法器92计算来自变换器(麦克风)64和68(宽间隔)的信号的比率，且在块94确定量值差(以dB为单位)。在除法器96计算来自变换器64和66(窄间隔)的信号的比率，且在块98确定相差。在除法器100将相位除以每个频率仓的中心频率以确定时间延迟。信号处理的其余物基本上与图13中相同。

在基于图14的又一实施例中，用与该图相同的方式确定量值差(以dB为单位)。然而，在除法器对低频仓(例如，在4khz或其以下)计算来自变换器64和66(窄间隔)的信号的比率且确定相差。将该相位除以每个低频仓的中心频率以确定时间延迟。另外，在除法器对高频仓(例如，在4khz以上)计算来自变换器64和68(宽间隔)的信号的比率且确定相差。将该相位除以每个高频仓的中心频率以确定时间延迟。

参考图15a和图15b，存在避免需要第三变换器的另一实施例。对于约30-35mm的变换器分离而言，能够估计高达约5kHz的源定位。虽然5kHz以上的频率对于音乐和语音的高质量再生而言重要且因此不能丢弃，但是极少声源产生仅5kHz以上的能量。通常，声源也产生5kHz以下的能量。

可以通过不打扰估计5kHz以上的源位置来利用此事实。相反，如果在麦克风的接受窗口内感测到5kHz以下的声能，那么也允许5kHz以上的能量通过，从而假定其来自相同源。

实现此目标的一种方法是，使用预期用于定位于例如2.5kHz与5kHz之间的倍频程中的频率仓的瞬时增益，以及将那些相同增益应用于高一个和两个倍频程的频率仓，即，对于5kHz和10kHz之间的仓以及10kHz和20kHz之间的仓。此方法保持可能存在于音频信号中的任何谐波结构。可以使用其他初始倍频程(诸如2-4kHz)，只要其与变换器间距相当即可。

如图15a和图15b中所示。除“比较阈值”块34和其输入之外，信号处理基本上与图7中相同。下文描述此差异。在图15a中，基于估计的源位置来计算出高达5kHz的增益。在5kHz以上，因为上述相位的2π不确定性，而难以获得可靠源定位估计。相反，如图15b中所示，对跨越倍频程5kHz至10kHz的频率仓且再次对跨越倍频程10kHz至20kHz的频率仓重复从2.5kHz至5kHz的倍频程中的增益。

将参考图16A描述此实施例的实施，图16A替换图7中标记为“比较阈值”的块34。离开块28和除法器32(图7)的量值和时间延迟比率通过各非线性块108和110(下文进一步详细讨论)。块108和110为每一频率仓且为音频数据的每一块单独工作，且产生用于麦克风系统的接受窗口。在此实例中，仅一个阈值用于时间延迟且仅一个阈值用于量值差。

在加法器116将基于量值和时间延迟的离开块108和110的两个计算出的增益相加。下文将描述将增益相加的原因。在块118通过对于5kHz以下的频率相加的增益。在块120选出在2.5kHz和5kHz之间的频率仓的增益，且在块122将其重新绘制(应用)为5kHz至10kHz的频率仓且在块124重新绘制为10kHz至20kHz的频率仓(如上文参考图15a和图15b所讨论)。在块126组合用于这三个范围的每一个的频率仓以产生频率仓的单一全部带宽补集。块126的输出“A”经传递以用于图16B中所描述的进一步信号处理。以两个相对宽间隔变换器元件提供良好高频性能。

现在转至图16B，将描述此实例的另一重要特征。以逐块为基础的每个频率仓中T1信号100的量值和T2信号102的量值(以dB为单位)各通过各同样非线性块128和130(以下进一步详细描述)。这些块对于其中麦克风具有低信号电平的频率仓创建低增益项。当频率仓中的信号电平对于每个麦克风而言低时，减少增益。

在加法器134将两个变换器电平增益项彼此相加。在加法器136将加法器134的输出与从量值增益项与时间增益项的相加得出的增益项“A”(来自图16A的块126)相加。在加法器134和136将这些项相加而不是相乘，以减少估计源定位时误差的效应。如果在特定频率仓中所有四个增益项都为高(即，1)，那么该频率以一(1)增益通过。如果增益项中任一个下降(即，小于1)，那么仅减少增益，而不是完全关闭该频率仓的增益。该增益被充分减少，以使得麦克风执行其拒绝接受窗口外的源的预期功能，以减少反馈和渗透。然而，增益减少并非如此大以至于产生可听见的非自然信号，假设参数之一的估计为错误。部分而不是全部减小该频率仓中的增益，使得估计错误的可听见效应显著较不可听见。

在块138将由加法器136输出的增益项(已经以dB为单位计算)转换为线性增益，且将其应用于来自变换器12的信号，如图7中所示。在本申请中所讨论的此实施例和其他实施例中，减少了归因于源定位的较差估计的可听见非自然信号。

现在将参考图16C-16E来讨论非线性块108、110、128和130的详情。此实例假定变换器12与14之间的间距约为35mm。如果变换器间距变为不同于35mm，那么下文提供的值将变化。块108、110、128和130中的每一者(而不是仅全部开或全部关(例如，1或0的增益))具有短过渡区域，这使声源随着其进入和离开接受窗口而跨越阈值衰落。图16E示出关于块110，对于28-41微秒之间的时间延迟而言，输出增益从0升高至1。对于少于28微秒的时间延迟而言增益为0，且对于大于41微秒的时间延迟而言增益为1。图16D示出关于块108，对于2-3dB之间的量值差而言，输出增益从0升高至1。2dB以下增益为0且3dB以上增益为1。图16C示出由块128和130应用的增益项。在此实例中，对于-60dB以下的信号电平而言，应用0增益。对于从-60dB至-50dB的信号电平而言，增益从0增加至1。对于-50dB以上的变换器信号电平而言，增益为1。

可以在蜂窝电话或扬声器电话中使用上述麦克风系统。此蜂窝电话或扬声器电话将也包括用于将声音传至用户耳朵的声学驱动器。信号处理器的输出将用以驱动在远端定位的第二声学驱动器以产生声音(例如，第二声学驱动器可位于500英里以外的另一蜂窝电话或扬声器电话中)。

现在将描述本发明的又一实施例。此实施例涉及现有技术话筒麦克风，其用以由位于戴在用户头上的话筒的末端上的麦克风获取人嗓音。典型应用为通信麦克风(诸如由飞行员使用的那些)或由一些著名歌手在音乐会中使用的声音增强麦克风。通常在一个人要求位于靠近嘴的无需手的麦克风以减少来自其他源的声音获取时使用这些麦克风。然而，跨越脸的话筒可能难看且难用。话筒麦克风的另一应用是用于蜂窝电话头戴式耳机。这些头戴式耳机具有戴在用户耳朵上或耳朵中的听筒，其中麦克风话筒从听筒悬挂下来。此麦克风可以位于用户嘴前面或从绳悬下，任一种都可能是恼人的。

参考图17描述使用本申请的新方向性技术的听筒。耳机150包括插入耳朵中的听筒152。可选地，可以将听筒放在耳朵上或耳朵周围。耳机包括用于产生通过听筒的声音的内部扬声器(未图示)。电线束153将DC功率从例如夹在用户腰带上的蜂窝电话传递至耳机150。电线束也将音频信息传递至耳机150中以由内部扬声器再生。作为一个选择，消除电线束153，听筒152包括电池以供应电力，且将信息无线地传递至听筒152或从听筒152传出。耳机中另外包括麦克风154，其包括上述两个或三个变换器(未图示)。可选地，麦克风154可以位于与听筒分离的邻近头的任何地方(例如，在头戴式耳机的头带上)。两个变换器沿方向X对准以瞄准用户嘴的大体方向。变换器可以为MEMS技术的一部分。MEMS技术可以用以提供紧密、轻型麦克风154。电线束153将信号从变换器传回至蜂窝电话，其中上述信号处理被应用于这些信号。此布置消除话筒的需要。因此，耳机单元较小，重量较轻且较不难看。使用上述信号处理(例如，图7中)，可以使麦克风优先响应来自用户嘴的声音，同时拒绝来自其他源(例如，耳机150中的扬声器)的声音。以此方式，用户获得具有话筒麦克风而无需实体话筒的优点。

对于上述先前实施例而言，一般假定为基本上自由场声学环境。然而，靠近头，来自源的声场由头修正，且不再保持自由场条件。因此，接受阈值优选地从自由场条件变化。

在声音波长比头长得多的低频率，声场不会大大变化，且可以使用与自由场类似的接受阈值。在声音波长比头小的高频率，声场由头显著改变，且必须相应改变接受阈值。

在此种应用中，需要阈值为频率的函数。在一实施例中，不同阈值用于为其计算增益的每个频率仓。在另一实施例中，少量阈值被应用于频率仓组。这些阈值由经验确定。在校准过程期间，连续记录每个频率仓中的量值和时间延迟差，同时围绕麦克风移动在所关心的所有频率放射能量的声源。当源位于所要接受区中时对量值和时间差对指定高得分，且当源位于接受区之外时指定低得分。可选地，在多种定位的多个声源可以由进行计分和列表的控制器打开和关闭。

使用熟知统计方法以最小化误差，使用db差和时间(或相位)差作为自变量且使用得分作为应变量来计算每个频率仓的阈值。此方法补偿可存在于构成任何给定单元的两个麦克风元件之间的频率响应的任何差。

考虑的问题在于，麦克风元件和模拟电子装置具有公差，因此构成一对的两个麦克风的量值和相位响应可能不充分匹配。此外，其中放置麦克风的声学环境改变所要接受窗口中声源的量值和时间延迟关系。

为了处理这些问题，提供一个实施例，其中在给定麦克风的预期使用和声学环境的情况下麦克风学习什么是适当阈值。在具有相对低水平的背景噪音的预期声学环境中，用户将系统切换至学习模式且将小声源在麦克风应在声源工作时接受该声源的区域中来回移动。麦克风系统计算在训练期间所有频带中的量值和时间延迟差。当数据收集完成时，系统使用熟知统计方法来计算数据的最佳适配，且计算一组用于每个频率仓或频率仓群的阈值。此方法参与达到针对位于所要接受区中的声源进行的关于声源定位的增加数目的正确决定。

用于训练的声源可以为在训练周期期间同时或顺序地播放含有所关心的所有频带中的能量的测试信号的小扩音器。如果麦克风为现场音乐系统的一部分，那么声源可以为用作现场音乐增强系统的扬声器中的一个。声源也可以为产生噪音的机械设备。

可选地，音乐家可以使用其自己的嗓音或乐器作为训练源。在训练周期期间，音乐家唱歌或演奏其乐器、将嘴或乐器放在接受区内的多个定位中。再次，麦克风系统计算所有频带中的量值和时间延迟差，但是拒绝存在极少能量的任何带。如上所述使用最佳适配方法计算阈值，且由来自附近频带的插值来填充具有不足信息的带。

一旦系统得以训练，那么用户将麦克风切换回正常操作模式，且其使用新计算出的阈值来操作。另外，一旦麦克风系统经训练为大约正确，那么在表演(或其他使用)的整个过程使用表演音乐作为测试信号周期性地进行麦克风训练的检查。

图17B揭示并入如本文所描述的两个麦克风元件的蜂窝电话174。这两个元件位于朝向麦克风174的底端176且沿垂直于图17B所在的纸表面延伸的方向Y对准。因此，麦克风元件瞄准蜂窝电话用户嘴的大体方向。

参考图18A和图18B，示出两个曲线图，其描绘“无话筒”话筒麦克风的频率对量值阈值(图18A)和时间延迟阈值(图18B)。在此实施例中，麦克风具有两个变换器至头戴式耳机(诸如，可购自Bose

的

头戴式耳机)的耳机中的一个。将此头戴式耳机放置在模拟人类头、躯干和嗓音的人体模型的头上。通过人体模型的嘴播放测试信号，且获取两个麦克风元件之间的量值和时间差，且由于这些信号表示通信麦克风中的所要信号而给定高得分。此外，通过移动至人体模型的头周围的若干定位的另一源播放测试信号。获取量值和时间差，且由于这些表示非所要的干扰而给定低得分。最佳适配算法被应用于每个频率仓中的数据。在图18A和图18B的曲线图中示出每个仓的计算出的量值和时间延迟阈值。在特定应用中，这些阈值在计算时可以被应用于每个仓。为了节约存储器，可能使这些图平滑，且对频率仓群使用少量阈值。可选地，一个功能适配于平滑的曲线且用以计算阈值。这些阈值应用于例如图7的块34中。

在本发明的另一实施例中，在信号处理中使用转换速率限制。除了在块40中使用转换速率限制之外，此实施例与图7的实施例类似。转换速率限制是用于使噪声信号平滑的非线性方法。当应用于上述实施例时，该方法防止增益控制信号(例如，从图7中的块40出来的)变得太快，这会导致可听见的非自然信号。对于每个频率仓而言，不允许增益控制信号从一个块到下一块改变大于预定值。该值可以对于增加增益与对于减少增益不同。因此，实际应用于来自转换速率限制器(图7中的块40中)的输出的音频信号(例如，来自图7中的变换器12)的增益可以滞后于计算出的增益。

参考图19，虚线170示出绘出的特定频率仓的计算出的增益对时间。实线172示出在应用转换速率限制之后产生的转换速率受限增益。在此实例中，不允许增益以快于100db/秒升高，且不允许以快于200dB/秒下降。转换速率的选择由竞争因素确定。转换速率应尽可能快以最大化非所要声源的拒绝。然而，为了最小化可听见的非自然信号，转换速率应尽可能慢。基于没问题的音质因素，可以比对增益进行增加转换更慢地进行减少转换。

因此在t＝0.1秒与0.3秒之间，因为计算出的增益比阈值更快升高，所以所应用的增益(转换速率已受限)滞后于计算出的增益。在t＝0.5与0.6之间，由于计算出的增益与阈值相比以较慢速率下降，所以计算出的增益与所应用的增益相同。在t＝0.6之后，计算出的增益比阈值更快下降，且所应用的增益再次滞后直至其可以追上。

使用两个以上变换器的另一个实例是创建可以比较声源距离和角度估计的多个变换器对。在混响声场中，归因于源的在任何两个点测量到的声压之间的量值和相位关系可以基本上与在自由场中测量到的相同两个点不同。因此，对于房间中一个特定定位中的源和房间中另一个特定定位中的一对变换器，即使声源的实体位置在接受窗口之外，在一个频率的量值和相位关系也可以落在接受窗口内。在此状况下，距离和角度估计有误。然而，在典型房间中，对于分开仅短距离的相同频率的距离和角度估计可能正确。使用多对麦克风元件的麦克风系统可以对每个频率仓进行声源距离和角度的多个同时估计，且拒绝那些与来自其他对中大多数的估计不符合的估计。

将参考图20来讨论先前段中描述的系统的实例。麦克风系统180包括排列成线性阵列的四个变换器182、184、186和188。每个相邻变换器对之间的距离基本上相同。此阵列具有三对紧密间隔变换器182-184/184-186/186-188、两对适度间隔变换器182-186/184-188和一对远离间隔变换器182-188。在信号处理器190中例如如以上参考图7(直至块34)所描述处理这六对变换器的每个的输出信号。对于每个频率为每一对作出接受或拒绝决定。换言之，为每个变换器对确定量值关系(例如，比率)落在阈值一侧还是另一侧上。可以在块194中基于本领域技术人员已知的多种标准来每对的接受或拒绝决定进行加权。例如，可以对宽间隔变换器对182-188给予高频的小权。在块196中将经加权的接受组合且将其与组合的经加权的拒绝比较，以作出关于该频率仓的最终接受或拒绝决定。换言之，决定总量值关系落在阈值一侧还是另一侧上。基于此决定，在块198决定增益且将此增益应用于如图7中的变换器中一个的输出信号。此系统在混响室中接受声源时作出较少错误正误差。

在参考图21描述的另一个实例中，麦克风系统20包括排列在假想四边形的顶点上的四个变换器202、204、206和208。在此实例中，多边形为正方形形状，但是该多边形可以为除正方形之外的形状(例如，矩形、平行四边形等)。此外，可在五边或更多边的多边形的顶点上使用四个以上变换器。此系统具有面向正向“A”的两个前向对202-206/204-208、面向侧面B和C的两个侧向对202-204/206-208以及两个对角对204-206/202-208。如先前段中所描述，在块210中处理每对变换器的输出信号且在块212中对其进行加权。在块214中如以上所描述，作出最终接受或拒绝决定，且在块216为所关心的频率选择相应增益。此实例允许麦克风系统200确定甚至用于离轴90°定位(例如在定位B和/或C)的声源的声源距离。当然，可以使用四个以上变换器。例如，可以使用形成十对变换器的五个变换器。通常，使用多个变换器导致声源距离和角度的更精确确定。

在另一实施例中，消除四个变换器(例如，全向麦克风)202、204、206和208中的一个。例如，如果消除变换器202，那么将具有可以由沿任一方向无限延伸的假想直线连接的变换器204和208以及远离此线定位的变换器206。此布置导致可以用以确定声源距离和角度的三对变换器204-208、206-208和204-206。

已经参考上述实施例描述了本发明。然而，将了解，在不偏离本发明的范围的情况下可以由本领域技术人员实现变化和修改。

Claims

1.一种区别声源的方法，包括以下步骤：

将由对声波的特性作出反应的变换器所收集的数据转换为用于每个变换器定位的信号；

将所述信号分为用于每个定位的多个频带；

对于每个频带，确定用于所述变换器定位的所述信号的量值的关系；

为每个频带从所述信号确定在当声波由第一变换器检测到时与当此波由第二变换器检测到时之间的时间延迟；以及

在量值关系和时间延迟落在量值关系的阈值和时间延迟的阈值的一侧上的那些频带与(a)量值关系落在其阈值的另一侧上、(b)时间延迟落在其阈值的另一侧上或(c)量值关系和时间延迟两者都落在其各阈值的另一侧上的那些频带之间产生相对增益变化。

2.根据权利要求1所述的方法，进一步包括以下步骤：

提供用于所述量值关系的可调整阈值。

3.根据权利要求1或2所述的方法，进一步包括以下步骤：

提供用于所述时间延迟的可调整阈值。

4.根据权利要求1所述的方法，其中，所述产生步骤使在低增益与高增益之间的相对增益变化衰落。

5.根据权利要求1所述的方法，其中，相对增益变化的所述产生由(a)基于所述量值关系的增益项和(b)基于所述时间延迟的增益项来实现。

6.根据权利要求5所述的方法，其中，相对增益变化的所述产生进一步由基于来自所述变换器中一个或多个的输出信号的量值的增益项实现。

7.根据权利要求1所述的方法，其中，为第一群频带推导出的增益项群也被应用于第二群频带。

8.一种个人通信设备，包括：

至少两个变换器(12、14)，其对声波的特性作出反应且输出表示所述特性的信号；

至少一个A/D转换器(20)，用于将由所述至少两个变换器输出的信号转换成相应数字数据；

信号处理器，用于处理所述数字数据，其中所述处理器包括：

用于将数字数据转变成包括频率仓的频域表示的块(22、24)；

用于从每个变换器确定转变后的数字数据中相应频率仓之间的量值差和时间延迟差的块(26、28、30)；

用于将各相应组频率仓的量值差和时间延迟差与各量值和时间延迟阈值进行比较的块(34)；

增益处理块(40、42)，用于通过改变与至少一个转变后的变换器信号相关联的数字数据的频率仓的增益来形成输出数据，其中：

所述增益处理块(40、42)相对于(a)量值关系落在其阈值的另一侧上、(b)时间延迟落在其阈值的另一侧上或(c)量值关系和时间延迟两者都落在其各阈值的另一侧上的那些频率仓，为相应量值差和时间延迟差落在量值的阈值和时间延迟的阈值的一侧上的那些频率仓产生输出数据中的频率仓的相对增益变化。

9.根据权利要求8所述的设备，还包括用于将输出数据转变成输出时间数据的块(44)。

10.根据权利要求9所述的设备，还包括至少一个D/A转换器(48)，用于将所述输出时间数据转换成连续时间信号以形成音频输出信号。

11.根据权利要求8所述的设备，其中所述声波的特性是局部声压、其一阶梯度、高阶梯度或其组合。

12.根据权利要求8所述的设备，其中所述变换器分离距离小于70mm。

13.根据权利要求8所述的设备，其中所述设备是蜂窝电话、耳机或扬声器电话。

14.根据权利要求8-13中任一项所述的设备，其中所述至少两个变换器沿指向期望所述设备从其接收声波的声波源的线定向。

15.根据权利要求8所述的设备，其中所述至少两个变换器的第一组两个变换器分离第一距离，所述至少两个变换器的第二组两个变换器包括未包含在所述第一组中的至少一个变换器，所述第二组两个变换器分离第二距离，所述第二距离不同于所述第一距离。

16.根据权利要求8所述的设备，还包括多个量值阈值，其中所述增益处理块(40、42)相对于量值关系落在量值阈值范围外的那些频率仓，为量值差落在一对量值阈值之间的范围内的那些相应频率仓产生输出频率数据中的频率仓的相对增益变化。

17.根据权利要求8或16所述的设备，还包括多个时间延迟阈值，其中所述增益处理块(40、42)相对于时间延迟关系落在时间延迟阈值范围外的那些频率仓，为时间延迟差落在一对时间延迟阈值之间的范围内的那些相应频率仓产生输出频率数据中的频率仓的相对增益变化。

18.根据权利要求8所述的设备，还包括用户输入(36、38)，用于量值和时间延迟阈值的至少一个的用户调节。

19.根据权利要求8所述的设备，其中通过调节通过以实现压力梯度方向行为的方式组合所述至少两个变换器的输出而形成的信号的频率仓的增益来形成输出数据。

20.根据权利要求8所述的设备，其中在校准过程期间由经验确定所述阈值。