CN103065639B

CN103065639B - 处理信号

Info

Publication number: CN103065639B
Application number: CN201210368224.9A
Authority: CN
Inventors: K.索伦森; P.阿格伦
Original assignee: Skype Ltd Ireland
Current assignee: Microsoft Technology Licensing LLC
Priority date: 2011-09-30
Filing date: 2012-09-28
Publication date: 2015-04-22
Anticipated expiration: 2032-09-28
Also published as: GB2495129B; US20130083943A1; CN103065639A; WO2013049738A3; EP2749042A2; US9031257B2; EP2749042B1; GB2495129A; WO2013049738A2; GB201116846D0

Abstract

一种用于在设备中处理信号的方法、设备和计算机程序产品。在设备的多个传感器中接收一个角度范围的信号，接收到的信号包括从干扰源位置接收到的干扰信号。确定与从干扰源位置进行的信号接收相对应的传感器中的信号接收之间的干扰延迟图案。生成具有匹配所确定的干扰延迟图案的延迟图案的多个规则化信号。使用所生成的规则化信号来确定波束成型器所要应用的波束成型器系数，并且波束成型器向由多个传感器接收到的信号应用所确定的波束成型器系数，从而生成波束成型器输出。

Description

处理信号

技术领域

本发明涉及处理在设备中接收到的信号。

背景技术

设备可具有用来从周围环境接收传输信号的输入装置。例如，设备可具有诸如麦克风的音频输入装置，其可被用来从周围环境接收音频信号。例如，用户设备的麦克风可接收主要音频信号（诸如来自用户的语音）和其他音频信号。其他音频信号可以是在设备的麦克风接收到的干扰音频信号，可以是从干扰源接收到的或者可以是环境背景噪声或麦克风的自身噪声。干扰音频信号可扰乱在设备中接收到的主要音频信号。设备可出于许多不同的目的而使用接收到的音频信号。例如，在接收到的音频信号是从用户处接收到的语音信号的情形下，设备可处理语音信号以将其用于通信事件，例如，通过网络传输语音信号到可以与通信事件的另一个用户相关联的另一个设备。可替换地，或附加地，接收到的音频信号可被用于本领域公知的其他目的。

在其他例子中，设备可具有用于接收其他类型的传输信号（诸如雷达信号、声纳信号、天线信号、无线电波、微波和一般宽带信号或窄带信号）的接收装置。对于这些其他类型的传输信号也会发生同样的情况，其中在接收装置中接收主要信号和干扰信号。以下所提供的描述主要涉及设备中对音频信号的接收，但是相同的原理将适用于设备中对其他类型的传输信号（诸如以上所述的一般宽带信号、一般窄带信号、雷达信号、声纳信号、天线信号、无线电波和微波）的接收。

为了提高接收到的音频信号（例如从用户处接收到的用于在呼叫中使用的语音信号）的质量，希望抑制在用户设备的麦克风中接收到的干扰音频信号（例如背景噪声和从干扰音频源接收到的干扰音频信号）。

其中多个麦克风操作为单个音频输入装置的立体声麦克风和其他麦克风阵列的使用已经变得越来越普遍。在设备上使用多个麦克风使得能够除了使用从由单个麦克风接收到的音频信号提取出的信息之外，还能够使用从接收到的音频信号中提取出的空间信息。当使用这样的设备时，一种用于抑制干扰音频信号的方法是向由多个麦克风接收到的音频信号应用波束成型器（beamformer）。波束成型是通过应用信号处理来聚焦由麦克风阵列接收到的音频信号的一种处理，从而相比较于麦克风阵列中接收到的其他音频信号增强麦克风阵列中从一个或多个期望位置（也就是方向和距离）接收到的特定音频信号。出于简明的目的，此处我们将描述仅有单个期望方向的情况，但是相同的方法也可应用到具有多个感兴趣方向的情况。在波束成型处理之前可以确定或设置被称为到达方向（Direction of Arrival（DOA））信息的在麦克风阵列中接收期望的音频信号的角度（和/或距离）。将期望的到达方向设置为固定的是有益的，这是因为到达方向的估计可能很复杂。然而，在可替换的情况中，使期望的到达方向适应变化的条件是有益的，所以在使用波束成型器时实时估计期望的到达方向也是有益的。自适应波束成型器对接收到的音频信号应用多个加权（或波束成型器系数）。这些加权可考虑DOA信息来适配以处理由多个麦克风接收到的音频信号从而形成“波束”，从而高增益被应用到麦克风从期望位置（也就是期望的方向和距离）接收到的期望的音频信号，而低增益被应用到任何其他（例如干扰）信号源的方向。

可在设备中通过与处理来自单个麦克风的接收到的音频信号的相同方式进一步处理波束成型器的输出，例如用于作为通信事件的一部分传输到另一个设备。例如，波束成型器的输出可被作为输入信号提供到设备中的自动增益控制（AGC）处理阶段和单通道噪声降低阶段中的至少一个。

最小方差无失真响应（MVDR）波束成型器（也被称为Capon波束成型器）是适配应用到音频信号的波束成型器系数，在不失真在到达设备的主到达方向接收到的主要音频信号（也就是从波束成型器的聚焦方向接收到的音频信号）的约束下，基于输入信号而最小化输出信号的能量的一类波束成型器的一部分。可使用麦克风阵列中接收到的音频信号的协方差矩阵的逆来计算波束成型器加权。当向接收到的音频信号应用不同的延迟时（相应于音频信号到达麦克风阵列的不同的到达方向），协方差矩阵提供麦克风阵列的不同麦克风中接收到的音频信号的相关性的指示。特别地，互协方差指示多个麦克风中接收到音频信号的到达方向相关度最高，并且这可以被当做主要音频信号的主到达方向。尽管基于输入信号的波束成型器适配有益于最小化输出信号的能量，但是通过这样的方式适配波束成型器趋向于在随时间变化时会导致输出信号的失真。特别是，波束成型器的任何不规则性或突然变化可导致波束成型器的输出的可听失真（当波束成型器的波束图案突然变化时）。

在计算协方差矩阵之前可向接收到的音频信号应用频谱规则化（regularization）。例如，可通过增加缩放的单位矩阵到协方差矩阵来增加白噪声到音频信号，从而在求逆之前降低矩阵的条件数以用于避免对潜在的病态矩阵求逆的问题。

此外，在协方差矩阵中注入白噪声可被用来保证波束成型器不会放大能量，并且保证实现环境噪声抑制，其代价是更强干扰源的衰减。这个方法提供一种方式来规则化波束成型器的适配以获得稍好的波束成型器性能，但它没有提供充分的手段来防止波束成型器输出中的失真。

发明内容

然而，发明人认识到波束成型器的进一步规则化是有益的。具体而言，其认识到，当干扰源在空间中移动时，以及当干扰源随时间改变信号频谱时，以上所描述的MVDR和LCMV波束成型器趋向于导致从主到达方向之外的其他方向到达的信号失真。此外，以上所描述的MVDR和LCMV波束成型器可导致与接收到的信号的主频率内容分离的频率失真。

波束成型器的波束图案可作为角度、距离和频率的函数而变化，并且可以自适应地优化波束成型器以降低当前输入信号的能量（例如，在不导致聚焦方向的信号失真的给定约束下）。然而，作为波束图案在主到达方向之外的其他方向上随时间波动的结果，设备中从这些其他方向接收到的信号可能发生失真。此外，因为可以执行无期望约束的波束成型器优化，该优化可能导致从特定方向到达设备的低功率输入信号分量的不希望的放大。有利的是，根据本发明的实施方式，识别干扰信号的方向，对接收到的信号应用被用来适配波束成型器滤波器系数（可据此计算波束成型器的波束图案）的定向规则化，从而保证在仍然将衰减应用到干扰信号的同时极少或不会出现干扰信号的失真。

根据本发明的第一个方面，提供了一种处理设备中的信号的方法，该方法包括：在设备的多个传感器中接收一个角度范围上的信号，接收到的信号包括从干扰源位置接收到的干扰信号；确定与从干扰源位置进行的信号接收相对应的传感器中的信号接收之间的干扰延迟图案；生成具有匹配所确定的干扰延迟图案的延迟图案的多个规则化信号；使用所生成的规则化信号来确定波束成型器所要应用的波束成型器系数，并且波束成型器向由多个传感器接收到的信号应用所确定的波束成型器系数，从而生成波束成型器输出。

在一些实施方式中，所生成的规则化信号和接收到的信号的组合被用来确定要由波束成型器应用的波束成型器系数。例如，该方法可以进一步包括确定接收到的信号的修改版本，其中多个规则化信号包括在由多个传感器接收到的相应信号中，其中基于接收到的信号的修改版本确定波束成型器系数。

有利的是，基于具有相应于在传感器中从干扰源位置接收到的信号的干扰延迟图案的延迟图案的规则化信号（例如人工信号的特定混合）来适配波束成型器。当向输入信号增加规则化信号时，结果信号（也就是接收到的信号的修改版本）可被称为“规则化信号” （regularized signals）。还可以基于这样的规则化信号来适配波束成型器。通过这样的方式，当波束成型器处理接收到的信号时，它将应用更大等级的衰减到传感器中从干扰源位置（也就是从干扰源的位置和距离）接收到的信号。这也意味着干扰信号中的变化不会影响波束成型器很大，这是因为即使干扰信号暂时具有低功率，但由于正规化信号的存在，应用到从干扰源位置接收到的信号的衰减等级仍然保持较高。换句话说，波束成型器的波束图案在干扰音频信号的方向更加稳定。在干扰音频信号的方向中的这样的稳定性，也就是波束图案变化的速度的降低，减少了波束成型器输出中干扰音频信号的失真。在优选实施方式中，完全基于人工生成的规则化噪声信号来适配波束成型器，该规则化噪声信号类似于接收信号中的失真，但其变化更加平滑，并处于更加可控的方式。在这样的情况中，仅在规则化信号发生变化时才需要更新波束成型器滤波器系数，有利地，其以平滑的方式发生。

实际上，在优选实施方式中，该方法包括选择多个规则化信号以使得波束成型器系数的变化足够缓慢，例如从而防止波束成型器系数的变化引发波束成型器输出的可察觉的不希望的失真。

本发明的实施方式允许对于确定的任何角度控制波束成型器的行为，其将受益于更少的随时间的波动和/或随频率的变化。受益于本发明的实施方式的干扰源示例是不位于波束图案的主波瓣的中央的扬声器。根据优选实施方式，可通过在每个角度注入可变数量的噪声来控制波束成型器，从而保证波束图案较慢演化，以使得波束成型器提供令人满意的声音输出。

信号可以是音频信号，传感器可以是用于接收音频信号的麦克风。可替换地，信号可以是其他类型的传输信号（诸如一般宽带信号、一般窄带信号、雷达信号、声纳信号、天线信号、无线电波或微波）。

由多个传感器接收到的音频信号可包括从主要源位置接收到的主要信号。在优选实施方式中，适配波束成型器以最小化被用来在特定约束下确定波束成型器系数的信号中的功率。这些约束例如可以包括波束成型器不会导致主要信号失真的约束。

规则化信号可以是彼此不相关的噪声信号。在一个实施方式中，噪声信号具有预先确定的频谱形状。这意味着在接收到的音频信号中包括噪声信号的效果对频域中的波束图案具有可预测影响。例如，噪声信号可以是具有平坦频谱的统计独立采样，也就是白色谱。通过这种方式，在接收到的音频信号中包括噪声信号对于所有频率的波束图案具有类似的效果。此外，在噪声信号优选地包括统计独立的采样从而保证仅在完美对齐（也就是说，在干扰方向上）时噪声信号才相关的情况下，在不同角度的定向规则化变得统计独立。规则化噪声信号的频谱形状可以是白噪声和接收到的信号中的实际背景噪声的任意频谱形状之间的一些频谱形状。在完全基于人工生成的规则化信号适配波束成型器的情况下，这特别有益于保证对干扰的更强抑制。

根据本发明的第二个方面，提供了一种用于处理信号的设备，该设备包括：波束成型器；用于接收一个角度范围上的信号的多个传感器，接收到的信号包括从干扰源位置接收到的干扰信号；用于确定与从干扰源位置进行的信号接收相对应的传感器中的信号接收之间的干扰延迟图案的装置；用于生成具有匹配所确定的干扰延迟图案的延迟图案的多个规则化信号的装置；用于使用所生成的规则化信号来确定波束成型器所要应用的波束成型器系数的装置，其中波束成型器被配置为向由多个传感器接收到的信号应用所确定的波束成型器系数，从而生成波束成型器输出。波束成型器例如可以是最小方差无失真响应波束成型器。

根据本发明的第三个方面，提供了一种用于处理在设备的多个传感器中在一个角度范围上接收到的信号的计算机程序产品，接收到的信号包括从干扰源位置接收到的干扰信号，该计算机程序产品包含在非瞬态计算机可读媒介上，并且被配置为当在设备的处理器上执行时，执行以下步骤：确定与从干扰源位置进行的信号接收相对应的传感器中的信号接收之间的干扰延迟图案；生成具有匹配所确定的干扰延迟图案的延迟图案的多个规则化信号；使用所生成的规则化信号来确定波束成型器所要应用的波束成型器系数；并且实现波束成型器以便向由多个传感器接收到的信号应用所确定的波束成型器系数，从而生成波束成型器输出。

附图说明

为了更好地理解本发明以及为了显示本发明如何实施，现在将通过示例的方式参考以下附图，其中：

图1显示了根据优选实施方式的设备的示意图；

图2显示了根据优选实施方式的系统；

图3显示了根据优选实施方式的设备的元件的功能框图；

图4显示了如图3所示的设备的一部分的功能框图；

图5是根据优选实施方式的用于处理音频信号的过程的流程图；

图6a是显示了在没有应用定向规则化时作为时间和角度的函数的MVDR波束成型器的波束图案的图示；

图6b是显示了在应用了定向规则化时作为时间和角度的函数的MVDR波束成型器的波束图案的图示；

图7显示了表示在一个实施方式中如何估计到达方向信息的图。

具体实施方式

以下将仅以示例的方式描述本发明的优选实施方式。

在本发明的以下实施方式中，描述了一些技术，其中在波束成型器滤波器系数的适配期间定向地规则化到自适应波束成型器的输入。以下所描述的实施方式涉及信号是音频信号的情况。然而，其他实施方式涉及信号是其他类型的传输信号（诸如一般宽带信号、一般窄带信号、雷达信号、声纳信号、天线信号、无线电波或微波）的情况。任意特定的频谱形状的噪声的相同实现方式（也就是规则化信号）（在一个优选实施方式中可以例如是白噪声）被注入到麦克风输入信号的拷贝中，麦克风输入信号之间的信号延迟差（或延迟图案）与为来自干扰源的干扰音频信号所识别的信号延迟差是相同的。这保证了规则化噪声信号在延迟方面的相应于干扰方向的高相关性，进而保证基于具有注入的噪声的拷贝而适配的波束成型器被训练为最小化来自干扰方向的信号。注入的噪声减少波束成型器输出中干扰音频信号的失真。这还有助于防止对从干扰音频信号的方向到达的低功率输入信号分量的不期望放大。有利的是，在本发明优选实施方式中应用的定向规则化为波束成型器提供随时间缓慢演化的平滑的波束图案，从而提供令人满意的声音波束成型器输出。

首先参见图1，其示出了设备102的示意图。设备102可以是固定或移动设备。设备102包括CPU 104、连接到CPU 104的有用于接收音频信号的麦克风阵列106、用于输出音频信号的扬声器110、用于向设备102的用户输出可视数据的诸如屏幕的显示器112和用于存储数据的存储器114。

现在参见图2，其示出了设备102在其中操作的示例环境200。

设备102的麦克风阵列106从环境200接收音频信号。例如，如图2所示，麦克风阵列106接收来自用户202的音频信号（图2中标示为d₁）、来自另一个用户204的音频信号（图2中标示为d₂）、来自风扇206的音频信号（图2中标示为d₃）和来自墙208反射的用户202的音频信号（图2中标示为d₄）。本领域技术人员清楚麦克风阵列106还可接收除了图2所示的音频信号之外的其他音频信号。在如图2所示的场景中，来自用户202的音频信号是期望的音频信号，麦克风阵列106中接收到的所有其他音频信号都是干扰音频信号。在其他实施方式中，麦克风阵列106中接收到的超过一个的音频信号可以被认为是“期望的”音频信号，但是出于简明的目的，在此处描述的实施方式中，仅有一个期望的音频信号（也就是来自用户202的音频信号），其他音频信号都被认为是干扰。图2显示了作为干扰源的另一个用户204、风扇206或来自墙208的反射。其他不希望的噪声信号源可包括例如空调系统和播放音乐的设备。

当在麦克风阵列106接收到音频信号后对其进行处理时识别期望的音频信号。在处理期间，基于语音类特征的检测识别期望的音频信号，并且确定主扬声器的主方向。图2显示了从主方向d₁到达麦克风阵列106的作为期望的音频信号源的主扬声器（用户202）。

现在参见图3，其示出了设备102的元件的功能表示。麦克风阵列106包括多个麦克风302₁、302₂和302₃。设备102进一步包括包含波束成型器304和处理装置306的波束成型模块303。可以在CPU 104上执行的软件方式或在设备102内的硬件方式来实现波束成型器304和处理装置306。麦克风阵列106中的每个麦克风的输出耦合到波束成型模块303的相应输入。具体而言，麦克风阵列106的每个麦克风的输出耦合到波束成型器304的相应输入，并且也耦合到处理装置306的相应输入。本领域技术人员将明了需要多个输入以实现波束成型。图3中所示的麦克风阵列106具有三个麦克风（302₁、302₂和302₃），但是将理解的是这些数量的麦克风仅是示例，并不以任何方式作为限制。

波束成型模块303包括用于从麦克风阵列106的麦克风302₁、302₂和302₃接收并处理音频信号x₁、x₂和x₃的装置。例如，波束成型模块303可包括语音活动检测器（VAD）和DOA估计块（未在图3中示出）。在操作中，波束成型模块303确定由麦克风阵列106接收到的音频信号的特性，并且基于由VAD和DOA估计块检测的语音类质量检测，可以确定主扬声器的一个或多个主方向。在其他实施方式中，在波束成型模块303中可预先设置主扬声器的主方向，以使得波束成型器304聚焦到固定方向。在图2所示的例子中，从用户202接收到的音频信号的方向（d₁）被确定为主方向。波束成型器304使用DOA信息以便通过形成在麦克风阵列106接收到期望信号的主方向（d₁）上具有较高增益，而在任何其他信号源的方向上（例如d₂、d₃和d₄）具有较低增益的波束而处理音频信号。

波束成型模块303还能确定干扰到达方向（d₂、d₃和d₄），有利的是，可适配波束成型器304以使得对从那些干扰到达方向接收到的音频信号应用特别低的增益，从而抑制干扰音频信号。波束成型模块303区别音频信号到达麦克风阵列106的到达方向，还可以区别音频信号到达麦克风阵列106的到达距离。从中接收到音频信号的方向和距离确定从中接收到音频信号的位置。在麦克风阵列106的多个麦克风（302₁、302₂和302₃）中，从不同的源位置接收到的音频信号将具有不同的延迟图案。虽然以上已经描述了波束成型模块303可以确定任意数量的主方向，但是确定的主方向数量影响波束成型器的性能，例如，对于大数量的主方向，波束成型器304将应用比仅仅确定单个主方向的情况更少的衰减到在麦克风阵列从其他（不希望的）方向接收到的信号上。波束成型器304的输出以将被处理的单通道的形式提供给设备102的进一步处理装置。本领域技术人员清楚的是，可在设备102中以多种不同方式使用波束成型器304的输出。例如，波束成型器304的输出可被用作通信事件的一部分，其中用户202使用设备102参与该通信事件。

波束成型器304的输出可遭受到进一步的信号处理（诸如自动增益控制和噪声抑制）。这些进一步的信号处理的细节超出了本发明的范围，因此在此处没有给出进一步的信号处理的详情，但是本领域技术人员可意识到可以在设备102中处理波束成型器304的输出的多种方式。

在操作中，处理装置306被设置为接收来自麦克风阵列106的麦克风302₁、302₂和302₃的音频信号x₁、x₂和x₃，并且适配将要应用到音频信号x₁、x₂和x₃的波束成型器304。处理装置306修改音频信号，从而在基于修改后的音频信号更新波束成型器之前，在音频信号中包括噪声信号。在音频信号中包括具有匹配干扰音频信号的源位置（也就是到达方向和距离）的延迟图案的噪声信号（也就是规则化信号）。通过这样的方式，在干扰音频信号的方向上，噪声信号高度相关，从而使得在更新波束成型器304时，其将对来自干扰音频信号的位置（也就是方向和距离）的音频信号应用高等级的衰减。如图4所示，处理装置306包括三个混合块402₁、402₂和402₃以及一个处理块404。每个混合块402₁、402₂和402₃被设置为分别接收来自麦克风302₁、302₂和302₃的音频信号x₁、x₂和x₃中相应的一个。每个混合块402₁、402₂和402₃还被设置为分别接收多个噪声信号n₁、n₂和n₃中相应的一个。混合块402₁、402₂和402₃使相应的音频信号x₁、x₂和x₃分别与相应的噪声信号n₁、n₂和n₃相加。在其他实施方式中，混合块可对音频信号和噪声信号执行其他操作，例如，混合块可以使音频信号和噪声信号相乘。在一些实施方式中，在将音频信号x₁、x₂和x₃和噪声信号n₁、n₂和n₃输入到相应的混合块402₁、402₂和402₃之前缩放音频信号x₁、x₂和x₃和噪声信号n₁、n₂和n₃。在缩放中应用的加权是可变的（例如在0和1之间），从而调整混合块402₁、402₂和402₃的输出中来自接收到的音频信号x₁、x₂和x₃的比例和来自噪声信号n₁、n₂和n₃的相对应比例。在一些实施方式中，缩放中应用的加权可使得混合块402₁、402₂和402₃的输出完全基于噪声信号n₁、n₂和n₃（因此并不基于音频信号x₁、x₂和x₃）。通过这样的方式，混合块402₁、402₂和402₃的输出可完全基于人工生成的规则化信号，也就是噪声信号n₁、n₂和n₃。这有益于以可控的方式控制混合块402₁、402₂和402₃的输出的变化。混合块402₁、402₂和402₃的输出耦合到处理块404的输入。处理快404被配置为基于从混合块402₁、402₂和402₃接收到的信号计算用于波束成型器304的滤波器系数。处理块404的输出滤波器系数耦合到波束成型器304作为输入，以用于提供在处理块404中的适配期间得到的波束成型器304的特性。

参见图5，其描述了根据优选实施方式的处理音频信号的方法。在步骤S502，在麦克风阵列106的麦克风（302₁、302₂和302₃）中接收音频信号。例如可从如图2所示的用户202、用户204、风扇206和墙208接收音频信号。在麦克风阵列106的麦克风（302₁、302₂和302₃）中还可接收诸如背景噪声的其他干扰音频信号。由麦克风阵列106的每个麦克风（302₁、302₂和302₃）接收到的音频信号被传递到波束成型模块303。

当以增强一个或多个音频信号（例如来自用户202的语音信号）为目的而分析多麦克风输入信号时，识别音频信号从空间中的哪里到达。正如以下将联系图7更详细地描述的，可从具有最高相关性的麦克风阵列106的每个麦克风302₁、302₂和302₃的信号之间的延迟来确定到达方向。即使例如麦克风阵列106的麦克风302₁、302₂和302₃之间的距离对于要清楚确定的到达方向来说太远，也可应用本发明的实施方式。实际上，任何（即使它是含糊不清的）源位置（也就是到达方向和距离）都可被用来生成用于注入到音频信号中的噪声信号。

波束成型模块303确定在麦克风阵列106的麦克风302₁、302₂和302₃接收到的音频信号的到达方向。具体而言，在步骤S504，确定干扰音频信号（例如来自用户204）的干扰到达方向。可通过分析音频信号而实现步骤S504的操作。本领域技术人员可意识到用于确定干扰音频信号的干扰到达方向的多种方法。例如，可基于麦克风302₁、302₂和302₃接收到的音频信号具有最高的相关性的方向的确定（例如，如以下联系图7对更详细地描述的）而确定音频信号的到达方向。

一旦确定了干扰到达方向，接着在步骤S506中选择噪声信号n₁、n₂和n₃，并且在步骤S508中，将选择的噪声信号包括到相应混合块402₁、402₂和402₃的相应音频信号x₁、x₂和x₃中。噪声信号被选择为具有特定频谱形状。例如，噪声信号可代表白噪声。可选择噪声信号以使得这些噪声信号包括仅在完全对齐时才相关的统计独立采样。选择噪声信号以使得这些噪声信号具有匹配麦克风阵列106中从步骤S504所确定的干扰到达方向接收到的音频信号的延迟图案的延迟图案。在音频信号x₁、x₂和x₃中的值之间的延迟图案相应于麦克风阵列106的相应麦克风302₁、302₂和302₃接收音频信号的特定方向（可选的还有距离）。因此通过包括具有特定延迟图案的噪声信号n₁、n₂和n₃，这相应于向音频信号增加噪声，就如同噪声是在麦克风阵列106的麦克风302₁、302₂和302₃处从干扰到达方向接收的。因此从混合块402₁、402₂和402₃输出的音频信号x₁、x₂和x₃的修改版本包括在干扰到达方向上相关的噪声信号。音频信号的这些修改版本可被认为是在麦克风阵列106的麦克风302₁、302₂和302₃处接收到的音频信号的定向规则化版本。如上所述，在一些实施方式中，来自混合块402₁、402₂和402₃的输出可以只包括噪声信号n₁、n₂和n₃。

在步骤S510，处理块404处理从混合块402₁、402₂和402₃输出的修改后的音频信号以更新波束成型器304滤波器系数。可在多种约束下更新波束成型器。例如，当波束成型器是MVDR波束成型器时，其被适配为在不导致麦克风阵列106中从主到达方向（例如0度）接收到的期望的音频信号失真的约束下最小化波束成型器输出的能量。其他类型的波束成型器可具有更新波束成型器的其他波束成型约束。

包括在混合块402₁、402₂和402₃中的音频信号x₁、x₂和x₃中的噪声信号n₁、n₂和n₃在步骤S504所确定的干扰到达方向上高度相关，使得在已经更新波束成型器304时，其将处理接收到的音频信号x₁、x₂和x₃，并生成的输出，其中高等级的衰减被应用到具有到达麦克风阵列106的干扰到达方向的音频信号。波束成型器滤波器系数向波束成型器304描述了如何处理音频信号x₁、x₂和x₃以生成波束成型器输出。

在步骤S512，波束成型器304向音频信号x₁、x₂和x₃应用在步骤S510确定的波束成型器滤波器系数，从而生成波束成型器输出。在步骤S514，波束成型器输出从波束成型模块303输出，以用于在设备102中做进一步处理。在更新波束成型器滤波器系数之前的音频信号x₁、x₂和x₃的定向规则化通过降低从干扰方向接收到的干扰音频信号的振幅以及通过减少那些干扰音频信号的失真而提高了波束成型器输出的质量。

因此，根据以上所述的方法，基于定向规则化后的输入信号（例如从混合块402₁、402₂和402₃输出的修改后的音频信号）来适配波束成型器的系数。波束成型器304使用这些系数（在步骤S510中确定的）对原始麦克风输入信号（未经定向规则化），也就是信号x₁、x₂和x₃进行滤波以生成最终波束成型器输出。

在以上所述的优选实施方式中，该方法使用白噪声的统计独立采样注入规则化噪声到音频信号x₁、x₂和x₃中，从而保证噪声信号仅在完全对齐时才相关。在其他实施方式中，规则化噪声可能不是白噪声，但是作为代替可以具有彩色频谱。在一些场景中，将彩色频谱用于规则化噪声可能是有利的，并且可以具体选择规则化噪声的特定频谱以提供波束成型器304的最佳性能。例如，干扰音频信号的干扰源可具有这样的到麦克风阵列106的干扰到达方向，使得音频信号在两个相邻麦克风（例如麦克风302₁和302₂）之间具有δ个音频信号采样的延迟。在优选实施方式中，δ是分数，但在一些其他实施方式中，δ可以是整数。也就是说，可能有我们从中得到或者已经得到高相关性的延迟δ，例如由协方差矩阵中的高相关性系数所指示的那样。通过向x1(t)和向x2(t+δ)增加统计独立白噪声的相同实现而在干扰源方向规则化音频信号x₁、x₂和x₃。当δ是分数时，可以应用麦克风信号的再采样，尤其是上采样从而以整数索引结束。

图6a是显示了在没有应用定向规则化时作为时间和角度的函数的MVDR波束成型器的波束图案的图示。图6b是显示了在应用了定向规则化时作为时间和角度的函数的MVDR波束成型器的波束图案的图示。在图6a和图6b的两种情况下麦克风阵列106都接收相同的音频信号。在这两种情况下，都有多个干扰音频信号源从多个不同方向到达麦克风阵列106。通过对比图6a和图6b，当如图6b所示那样进行定向规则化时，可清楚的看到波束图案的平滑特性。

如图6a所示的波束图案（当没有应用定向规则化时）在远离主到达方向（这个例子中是0度）的角度处快速变化。此外，对于远离主到达方向的角度，波束图案的振幅提升到较大值。这可能是有害的，因为作为波束成型处理和对来自远离主到达方向的方向的音频信号的不期望放大的结果，从远离主到达方向的角度接收到的音频信号可能遭受失真。自适应波束成型器的特性总是稍微落后于当前条件，极端波动可导致波束成型器输出中干扰源的可听失真。

这与图6b所示的波束图案相反，图6b中远离主到达方向的角度（也就是远离0度）的波束图案的振幅比在0度的波束图案的振幅要低。此外，在远离主到达方向的角度的波束图案的波动缓慢演进，从而减少从远离主到达方向的角度接收到的音频信号的失真。因此，相比于图6a所示的波束图案所提供的波束成型器输出，如图6b所示的波束图案提供更高质量的波束成型器输出。这是如上所述向音频信号应用的定向规则化的结果，也就是通过如上所述包括噪声信号以修改音频信号，接着基于修改后的音频信号计算波束图案。此外，作为防止不期望的快速波动的重要方面，可以将注入的噪声缩放到相比于麦克风输入信号噪声处于支配角色的程度。

在来自混合块402₁、402₂和402₃的输出仅基于规则化噪声信号n₁、n₂和n₃的实施方式中，可通过适当选择规则化噪声信号n₁、n₂和n₃而精确控制波束成型器304的行为以便以平滑的方式变化。

现在将参照图7更详细地描述由波束成型器304和/或处理装置306执行到达方向（DOA）估计以确定来自用户204的干扰音频信号的干扰到达方向的操作。

由波束成型器304通过如下操作来估计DOA信息：例如使用相关方法来估计在麦克风阵列106的多个麦克风中接收到的音频信号之间的时间延迟，以及关于麦克风阵列106的多个麦克风302₁、302₂和302₃的位置的先验知识来估计音频信号的源。

作为一个例子，图7显示了从干扰音频源204接收两个单独输入通道的音频信号的麦克风阵列106的麦克风302₁和302₂。为了便于理解，图7显示了一个点源204，其中声波以圆周运动方式远离源204传播。在真实情况下就是这样的，但是以下所示的公式假设接收到的音频信号在麦克风302₁和302₂中是作为平面波接收的。当点源204离麦克风302₁和302₂足够远时，这样的假设是好的假设。然而，应当注意的是，平面波假设仅是为了简化计算，无论如何不是当前发明的前提条件，本发明没有平面波假设也可良好地工作。生成规则化噪声并不需要实际的角度θ，这是因为在麦克风（302₁和302₂）中信号接收之间的时间延迟足够用于生成具有正确延迟图案的规则化信号。可使用公式（1）来估计音频信号到达由距离为d分离的麦克风302₁和302₂的到达方向：

（1）

其中v是声速，是来自干扰源204的音频信号到达麦克风302₁和302₂的时间之间的差，也就是时间延迟。距离d是麦克风阵列106的已知参数，声速v也是已知的（大致为340m/s）。时间延迟作为最大化麦克风302₁和302₂的输出中接收到的干扰音频信号之间的互相关性的时间标签而被获得。接着可使用以上给出的公式（1）得到相应于该时间延迟的角度。可在具有最大互相关性的延迟的接收到的音频信号中检测语音特征以确定干扰扬声器的一个或多个干扰方向。

可以明了的是，计算信号的互相关性是信号处理领域的公知技术，此处不对其进行更详细的描述。

在本发明的不同实施方式中，可以顺序地、周期性地或非周期性的执行步骤S504至S510。

在以上所述的示例实施方式中，麦克风阵列106是麦克风（302₁、302₂和302₃）的1-D阵列，其允许波束成型器304区别在一个维度（例如沿着水平轴）的不同角度接收到的音频信号。在可替换的实施方式中，麦克风阵列106可以是麦克风的2-D或3-D阵列，其允许波束成型器304分别区别在两个或三个维度（例如沿着水平、垂直和深度轴）内的不同角度接收到的音频信号。

如上所述，可将包含波束成型器304和处理装置306的波束成型模块303实现为在CPU 104上执行的软件或实现为设备102中的硬件。当波束成型模块303实现为软件时，可通过包含在非瞬态计算机可读媒介上的计算机程序产品的方式来提供该波束成型模块303，该计算机程序产片被配置为当在设备102的CPU 104上执行时，执行以上所述的波束成型模块303的功能。

虽然以上所述的实施方式提及了从单个用户202接收一个期望的音频信号（d₁）的麦克风阵列106，可以理解的是麦克风阵列106可接收来自多个用户的音频信号，例如在全部都可以被视为期望的音频信号的会议呼叫中。在该场景中，多个期望音频信号源到达麦克风阵列106。

为了避免能量放大而包括二次约束是用于通过对于特定角度不具选择性这样的方式来保证没有能量放大的粗糙工具，从而降低了波束成型器304抑制干扰可用的自由度。本发明的实施方式中的二次约束方法和定向规则化的组合允许使用更宽松的二次约束，从而增加波束成型器304抑制干扰的能力。

设备102可以是电视机或计算机或任何其他适于实现本发明的设备。

为了简单起见，在以上的实施方式的描述中，仅确定一个干扰到达方向，从而包括具有匹配该特定到达方向的延迟图案的噪声信号。然而，因为可以线性地增加噪声信号，本发明的实施方式可用于具有来自多个干扰源的干扰音频信号的多个干扰到达方向的情况。可选择噪声信号以使得这些噪声信号是具有匹配来自每个干扰到达方向的音频信号的延迟图案的延迟图案的噪声信号的组合（例如之和）。通过将这些噪声信号包括到音频信号中，可基于具有在多个到达方向（匹配干扰到达方向）中包括的噪声的音频信号的修改版本来计算波束成型器系数。通过这种方式，当波束成型器304向音频信号应用波束成型器系数时，将向来自每个干扰到达方向的干扰音频信号应用高等级的衰减。

此外，虽然已经参照优选实施方式特别地显示和描述了本发明，但是本领域技术人员将理解可以做出各种形式或细节上的改变而不脱离由所附权利要求所定义的本发明的范围。

Claims

1.一种在设备中处理信号的方法，所述方法包括：

在所述设备的多个传感器中接收一个角度范围上的信号，接收到的信号包括来自干扰源位置的干扰信号；

确定与从干扰源位置进行的信号接收相对应的传感器中的信号接收之间的干扰延迟图案；

生成具有匹配所述确定的干扰延迟图案的延迟图案的多个规则化信号；

使用所述生成的规则化信号来确定波束成型器将要应用的波束成型器系数；和

所述波束成型器向由所述多个传感器接收到的所述信号应用所述确定的波束成型器系数，从而生成波束成型器输出。

2.根据权利要求1所述的方法，其中仅基于所述生成的规则化信号来确定所述波束成型器系数。

3.根据权利要求1所述的方法，其中基于所述生成的规则化信号和所述接收到的信号的组合来确定所述波束成型器系数。

4.根据权利要求3所述的方法，其进一步包括确定所述接收到的信号的修改版本，其中在由所述多个传感器接收到的相应信号中包括所述多个规则化信号，并且其中基于所述接收到的信号的所述修改版本来确定所述波束成型器系数。

5.根据以上任一权利要求所述的方法，其中由所述多个传感器接收到的信号进一步包括从主要源位置接收到的主要信号。

6.根据权利要求1所述的方法，其中，所述波束成型器系数被如此确定，以便最小化被用来确定所述波束成型器系数的信号中的功率，并且在所述波束成型器的波束成型约束内。

7.根据权利要求5所述的方法，其中所述波束成型器系数被如此确定，以便最小化被用来确定所述波束成型器系数的信号中的功率，并且在所述波束成型器的波束成型约束内，并且所述波束成型器的波束成型约束包括所述波束成型器系数的应用不会导致所述主要信号在感知上失真的约束。

8.根据权利要求1所述的方法，其中所述规则化信号是彼此不相关的噪声信号。

9.根据权利要求8所述的方法，其中所述噪声信号具有预先确定的频谱形状。

10.根据权利要求9所述的方法，其中所述噪声信号代表白噪声。

11.根据权利要求8至10任一所述的方法，其中所述噪声信号包括统计独立的采样。

12.根据权利要求1所述的方法，其进一步包括选择所述多个规则化信号以使得所述波束成型器系数足够缓慢地变化，从而防止引起所述波束成型器输出的失真的所述波束成型器系数的变化。

13.根据权利要求1所述的方法，其进一步包括使用所述波束成型器输出来代表在所述多个传感器接收到的信号，以供在所述设备中做进一步处理。

14.根据权利要求1所述的方法，其中所述信号是以下信号中的一种：（i）音频信号，（ii）一般宽带信号，（iii）一般窄带信号，（iv）雷达信号，（v）声纳信号，（vi）天线信号，（vii）无线电波和（viii）微波。

15.一种用于处理信号的设备，所述设备包括：

波束成型器；

用于接收一个角度范围上的信号的多个传感器，接收到的信号包括从干扰源位置接收到的干扰信号；

用于确定与从干扰源位置进行的信号接收相对应的传感器中的信号接收之间的干扰延迟图案的装置；

生成具有匹配所述确定的干扰延迟图案的延迟图案的多个规则化信号的装置；和

使用所述生成的规则化信号来确定波束成型器将要应用的波束成型器系数的装置；

其中所述波束成型器被配置为向由所述多个传感器接收到的所述信号应用所述确定的波束成型器系数，从而生成波束成型器输出。

16.根据权利要求15所述的设备，其中所述信号是音频信号，并且所述传感器是用于接收所述音频信号的麦克风。

17.根据权利要求15或16所述的设备，其中所述波束成型器是最小方差无失真响应波束成型器。