CN115280412A

CN115280412A - 声学回声消除器中回声路径改变的宽带适应性改变

Info

Publication number: CN115280412A
Application number: CN202180020481.0A
Authority: CN
Inventors: N·L·爱坡顿; J·J·李
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2020-03-17
Filing date: 2021-03-17
Publication date: 2022-11-01
Also published as: EP4121961A1; WO2021188665A1; US20230137830A1

Abstract

用于使用预测滤波器适应性改变以及(回声消除器可获得的)参考信号与(回声消除器不可获得的)输出信号之间的宽带偏移检测来进行回声消除的系统、方法和计算机程序产品，其中，输出信号是通过对参考信号应用至少一次电平转换来生成的，例如，使得电平转换对于回声消除器而言是未知的。

Description

声学回声消除器中回声路径改变的宽带适应性改变

相关申请的交叉引用

本申请要求于2021年2月12日提交的美国临时专利申请号63/148,632以及于2020年3月17日提交的美国临时专利申请号62/991,028的权益，这两个专利申请通过引用以其全文并入本文。

技术领域

本公开总体上涉及音频信号处理(例如，对音频信号的回声消除)。一些实施例与使用预测滤波器适应性改变以及(回声消除器可获得的)参考信号与(回声消除器不可获得的)输出信号之间的偏移检测来进行回声消除相关，其中，输出信号是通过对参考信号应用电平转换来生成的(例如，以用于提供给扩音器)。

背景技术

在本文中，使用表达“回声消除”来表示对音频信号的回声内容的抑制、消除或其他管理。

许多商业上重要的音频信号处理应用(例如，消费类设备的双工通信和室内噪声补偿)都受益于回声消除。对于需要双工回放和采集的任何音频信号处理技术——包括话音通信技术以及具有话音助手的消费类回放设备而言，回声管理是关键的方面。

回声消除的典型实施方式包括一个或多个预测滤波器的适应性改变。(多个)预测滤波器将参考信号作为输入，并输出尽可能接近在麦克风信号中观测到的对应值(即，与其距离最小)的一组值。预测通常使用以下任一项来进行：对参考信号帧的时域样本进行操作的单个滤波器(或一组M个滤波器)；或者一个或多个滤波器，每个滤波器对参考信号帧的频域表示的数据值进行操作。

当使用一组M个预测滤波器对频域数据进行预测时，这些滤波器中的每一个的长度仅为采集相同延迟范围所需的单个时域滤波器长度的1/M。在适应性改变期间，(多个)预测滤波器的系数通常由适应性改变机制调整以最小化(应用于参考信号的)(多个)预测滤波器的输出与输入之间的距离。许多适应性改变机制在本领域中是众所周知的(例如，传统的适应性改变机制有LMS(最小均方)、NLMS(归一化最小均方)和PNLMS(比例归一化最小均方))。

如上所述，回声消除系统可以在时域中对时域输入信号进行操作。对于许多音频样本(例如，数万个音频样本)，实施这样的系统可能非常复杂，尤其是在使用较长的时域相关滤波器的情况下，并且这可能不会产生好的结果。

替代性地，回声消除系统可以在频域中对每个时域输入信号的频率变换表示进行操作(即，而不是在时域中操作)。这样的系统可以对每个输入信号的一组复值带通表示进行操作(这可以通过将STFT或其他复值均匀调制滤波器组应用于每个输入信号来实现)。例如，2019年5月23日公布的美国专利申请公开号2019/0156852描述了包括一组预测滤波器的频域适应性改变的回声管理(回声消除或回声抑制)。

符号和术语

贯穿本公开，包括在权利要求中，在广义上使用“对”信号或数据执行操作的表达(例如，对信号或数据进行滤波、缩放、变换或应用增益)来表示直接对信号或数据执行操作或对信号或数据的已处理版本(例如，在对其执行操作之前已经历了初步滤波或预处理的信号版本)执行操作。

贯穿本公开，包括在权利要求中，在广义上使用表达“系统”来表示设备、系统或子系统。例如，实施回声消除的子系统可以称为回声消除系统，并且包括这样的子系统的系统也可以称为回声消除系统。

贯穿本公开，包括在权利要求中，在广义上使用术语“处理器”来表示可编程或以其他方式可配置(例如，用软件或固件)为对数据(例如，音频数据)执行操作的系统或设备。处理器的示例包括现场可编程门阵列(或其他可配置集成电路或芯片组)、被编程和/或以其他方式被配置为对音频数据执行流水线式处理的数字信号处理器、被配置为对音频数据执行处理的图形处理单元(GPU)、可编程通用处理器或计算机、以及可编程微处理器芯片或芯片组。

贯穿本公开，包括在权利要求中，术语“耦接(couples)”或“耦接(coupled)”用于意指直接或间接连接。因此，如果第一设备被称为耦接到第二设备，则该连接可以通过直接连接或者通过经由其他设备和连接的间接连接实现。

贯穿本公开，包括在权利要求中，“音频数据”表示指示由至少一个麦克风采集的声音(例如，语音)的数据、或者为了可渲染以作为声音(例如，语音)(由至少一个扬声器)回放而生成的(例如，合成的)数据。例如，可以生成音频数据以便可用作指示由至少一个麦克风采集的声音(例如，语音)的数据的替代物。

发明内容

在一些需要使用声学回声消除器的系统(例如，通信系统或具有话音助手的消费类设备)中，回声路径可能经受外部改变(例如，使用音量控制实施的回放电平改变)，而(通常由被编程为执行音频处理代码的一个或多个处理器实施的)回声消除器无法与音频同步地获知这些改变。当这些外部改变发生时，回声消除器需要重新进行适应性改变，这可能会花费大量时间。本发明的典型实施例使用(指示要回放的音频内容，但不指示回声路径的任何这样的外部改变的)参考音频信号和(要从其中去除预测回声的)麦克风信号来检测(由于回声路径的外部改变而导致的)宽带电平改变，使得回声消除器可以快速转变到新的电平目标。

一些实施例与使用预测滤波器适应性改变以及(回声消除器可获得的)参考信号与(回声消除器不可获得的)输出信号之间的宽带偏移检测来执行回声消除相关，其中，输出信号是通过对参考信号应用电平转换来生成的。

在一类实施例中，本发明的方法是一种回声消除方法，所述方法是对指示由扬声器回放的音频内容的参考信号和来自麦克风的输入信号执行的，同时向所述扬声器提供输出信号。所述方法包括：

由回声消除器接收所述输入信号；

使用所述回声消除器的至少一个预测滤波器接收参考信号，其中，所述输出信号是通过对所述参考信号应用至少一次电平转换来生成的(例如，使得所述至少一次电平转换对所述回声消除器而言是未知的)；

由所述回声消除器预测所述输入信号的将由所述扬声器响应于所述参考信号而发出的声音产生的回声内容，从而确定所述输入信号的预测回声内容；

响应于所述输入信号和所述预测回声内容，检测所述参考信号与所述输出信号之间的宽带偏移；以及

从所述输入信号中去除所述预测回声内容中的至少一些。

典型的实施例适用于采集处理技术(例如，适用于既能经由设备的扬声器回放音频，又能经由设备的麦克风采集音频的设备)，在音频输入和输出的总体控制不可用于这些技术的情况下操作。例如，一些实施例在(用于实施回声消除的)采集处理系统与通信系统集成在一起或集成到通信系统中时是有用的，在这种情况下，通信系统可能导致采集处理系统未知的回声路径改变(除非并且直到根据本发明的实施例检测到这样的改变)。

本发明的各方面包括一种被配置(例如，被编程)为执行本发明方法或其步骤的任何实施例的系统、以及一种有形非暂态计算机可读介质(例如，磁盘或其他有形存储介质)，所述有形非暂态计算机可读介质对用于(例如，可执行以)执行本发明方法或其步骤的任何实施例的代码进行存储(实施非暂态存储)。

附图说明

图1是集成到通信系统中的回声消除系统的框图(所述回声消除系统可以实施本发明的实施例)。

图2是根据本发明的实施例的回声消除系统的元件的框图，所述回声消除系统被配置为执行对路径改变的宽带适应性改变。

图3是路径改变的示例宽带适应性改变过程的流程图。

图4是根据实施例的用于实施参考图1至图3描述的特征和过程的移动设备架构。

具体实施方式

本发明的一些实施例与(例如，设备的)回声消除相关。由设备(既能经由设备的扬声器回放音频又能经由设备的麦克风采集音频)进行的回声消除通常旨在使设备能够从麦克风采集的信号中去除会从扬声器播放的回放内容。正常情况下，当设备回放内容时，麦克风输出信号中的回放内容(所述回放内容称为“回声”)的电平比麦克风输出信号中的其他内容(例如，某人在距离设备很近的地方说话的言语)的电平更高(例如，数量级更高)。这使得尽可能从麦克风输出信号中去除回放内容变得很重要。

回声消除器尝试从发送到扬声器的音频预测麦克风采集的音频，然后从麦克风输出信号中去除(减去)预测音频。实施这样的预测的最佳方法对于不同的使用情况可能是不同的。用于实施回声消除器的一种受欢迎的方法是使用梯度下降技术来优化将扬声器信号映射到麦克风信号的滤波器，其方式为尝试减少这两者之间的误差。这些算法会在回声消除性能(即，可以去除多少回声的极限)与滤波器适应性改变时间之间进行折衷。本发明的一些实施例是对传统梯度下降适应性改变技术的增强，其可以提供在扬声器信号中的宽带电平改变(例如，由于音量控制操作或模拟增益控制操作而可能发生的电平改变)的情况下快速迁移回声消除器预测值的方式。一种这样的使用情况发生在可能将增益应用于回声消除系统未知的扬声器馈送信号的系统上。

图1是集成到通信系统中的回声消除系统的框图(所述回声消除系统可以实施本发明的实施例)。图1的通信系统100可以是通信设备，所述通信设备包括处理子系统(被编程或以其他方式配置为实施通信应用113和音频处理子系统108的至少一个处理器)和耦接到处理子系统的物理设备硬件(包括扩音器101和麦克风102)。通常，系统100包括一种存储指令的非暂态计算机可读介质，所述指令在由至少一个处理器执行时使所述至少一个处理器执行本发明方法的实施例。

音频处理子系统108(例如，实施为音频处理对象)被实施(即，至少一个处理器被编程为执行子系统108)以响应于回放音频流208和麦克风音频流211而执行(在回声消除子系统109中的)本发明的回声消除方法的实施例。回放音频流208是(经由增益元件103)提供给扩音器101的音频信号(在本文中有时称为“参考信号”208)。麦克风音频流211是响应于麦克风102的输出而从增益元件104输出的音频信号(在本文中有时称为“麦克风信号”211)。子系统108还被实施(即，其包括所实施的音频处理子系统110)以对来自回声消除子系统109的经过回声管理的音频输出执行其他音频处理。尽管子系统110可以是话音处理子系统，但是还可以设想在一些实施方式中，子系统110执行不是话音处理的音频处理(例如，用于通信应用113或另一音频应用的预处理)。

子系统108的音频输出被提供给通信应用113。子系统108可以被实施为与系统100的处理子系统中存在的音频数据交互的软件插件。

(由子系统108实施的)回声消除子系统109不知道(并且无法知道)增益元件104已应用于麦克风102的输出信号的增益、以及增益元件103已应用于参考信号208的增益(用于生成提供给扬声器101的扬声器馈送)。回声消除子系统109在本文中有时被称为“回声消除系统”。要由扬声器101播放的回放内容的源(例如，媒体播放器112和通信应用113)通常具有它们自己的独立增益元件(例如，分别为增益元件105和106)，这些增益元件将可变增益应用于对系统混频器107的输入(系统混频器的输出是参考信号208)，但是这些不会对回声消除系统109实施的回声消除造成问题，因为它们的改变对回声消除系统109而言是可见的。理想情况下，(在回声消除期间)元件103和104应用的增益是固定并且无法改变的，但并非所有回声消除技术的集成都可以支持这样的解决方案。

当在元件103或104处存在电平改变(本文有时称为“回声路径改变”或“路径改变”)时，这将导致预测回声信号(系统109的加法器块的取反输入)不正确，并将导致回声消除系统109的经过回声管理的输出中存在回声。回声突发将持续(系统109的)预测子系统再次稳定所花费的时间。在图1(或其他系统/集成)的一些实施方式中，可能存在回声消除系统(图1的系统109)可用的、通知其电平已经改变的信号，所述信号与要被执行回声消除的音频数据不同步。这将允许回声消除系统在预测重新适应性改变时采取行动抑制输出处的过量回声，但这并不是理想的解决方案。

元件103处的电平改变可能特别成问题的一个示例是：图1系统(例如，在设备中实施或实施为设备)包括话音助手，所述话音助手在听到其唤醒词(例如，“Ok Google”、“Alexa”或“Hey Cortana”)时使用输出增益元件103降低设备的回放音量。这将在系统试图听到说出唤醒词的人发出的命令时导致回声电平问题。在元件103降低音频电平时，回声消除系统的输出中的回声可能会比唤醒词本身被说出时更大。这就需要使回声消除快速进行适应性改变，而这损害了回声电平的降低。本发明的典型实施例解决了传统系统的这样的问题。

图2是示例系统的框图，所述示例系统响应于宽带回声消除路径改变而实施本发明的适应性改变方法的示例实施例。图2系统的元件包括扬声器101、麦克风102、增益元件103和104(对应于图1中带有相同附图标记的元件101、202、103和104)、信号208和211(对应于图1中带有相同附图标记的信号)以及回声消除系统元件(包括元件201、202、203、204、205、206、209和210)。图2所示的回声消除系统元件是图2系统的回声消除子系统(所述回声消除子系统实施本发明的示例实施例，其是图1的回声消除系统109的改进版本和替代方案)的元件。本发明的回声消除系统的实施例可以包括图2中未示出的附加元件。

参考图2，当在元件103或104处应用增益改变(“回声路径改变”或“路径改变”的示例)时，回声路径改变将作为麦克风信号211中的宽带电平改变而出现。然而，回声消除系统接收(并因此“意识到”)的参考音频信号208将保持不变。在本文中，信号的“宽带”电平(或电平改变)表示信号频域表示的至少一个频带的或其上的电平(或电平改变)——所述频带包括频率仓——例如，表示在所有频率仓或频率仓全集中的一些仓上的电平(或电平改变)。类似地，第一信号(例如，参考信号)与第二信号(例如，输出信号)之间的“宽带”偏移(或“宽带”电平偏移)是第一信号的宽带电平与第二信号的对应宽带电平之间的偏移。

如前所述，未校正的回声路径改变可能导致不正确的预测回声信号(在图2中，预测回声信号被标记为信号212)，这可能导致回声消除系统的输出信号207中出现响亮的回声突发，从而可能掩盖麦克风信号中的重要音频，而所述音频是其他系统的正确运行所需的。为了检测回声路径改变，图2的实施例对麦克风信号211和预测回声信号212的频谱的进行比较。(在分带子系统201中)将信号211和212中的每一个都分带为频带，并且(在子系统202中)将得到的分带频谱转换成对数间隔对数功率的分带频谱。从子系统202输出信号211和212的(针对每个频带的)得到的对数功率频谱。子系统201包括元件201A(其被耦接并被配置为对信号212进行操作)和元件201B(其被耦接并被配置为对信号211进行操作)。子系统202包括元件202A(其被耦接并被配置为对元件201A的输出进行操作)和元件202B(其被耦接并被配置为对元件201B的输出进行操作)。

指示信号211的对数功率频谱的所有频带的数据值(针对一系列不同时间中的每个时间)有时在本文中称为(统称为)麦克风信号m。指示信号212的对数功率频谱的所有频带的数据值(针对一系列不同时间中的每个时间)有时在本文中称为(统称为)预测信号p。

在没有人说话且仅回放内容经历(由增益元件103实施的)电平改变的情况下，麦克风信号m和预测信号p将具有类似的形状(针对一系列时间中的每个时间，绘制为频率的函数)，这两者之间只有从电平变化发生的那一刻起的电平偏移。针对每个时间，偏移确定子系统203确定麦克风信号m与预测信号p之间的电平偏移。每个电平偏移可以是由适应性改变过程确定的最佳电平偏移，所述适应性改变过程尝试最小化麦克风信号m与预测信号p之间的最小均方(LMS)误差、或仅在麦克风信号m和预测信号p的特定带宽区域上的LMS误差(例如，考虑到扬声器101无法产生特定频率或掩盖麦克风信号m的问题噪声分量)。子系统203(向决策逻辑204)输出指示麦克风信号m与预测信号p之间的误差(例如，最小平方误差)的量和所确定的偏移的数据。

在一些实施方式中，子系统203确定麦克风信号m与预测信号p之间的最小平方误差e²，其方式包括确定(在N个频带上，其中每个频带由不同的索引b的值标识)麦克风信号m的每个频带m_b与预测信号p的对应频带p_b之间的差加上音频帧中的可能(候选)电平偏移σ的平方的总和。该误差e²用以下一组方程表示。为了确定(一个时间的)最小误差e²——其中最小化是对电平偏移的候选值σ进行的，确定误差e²关于σ的导数(de²/dσ)，并将其设置为零。得到的电平偏移σ的值(其使误差最小化)是最佳电平偏移，并且最小误差e²是针对最佳电平偏移的误差e²的值。误差(e²)、导数(de²/dσ)和最佳电平偏移(其是差值(m_b-p_b)在所有N个索引b值上的总和除以数量N)如以下一组方程所示：

在上一段落的一组方程中，最佳电平偏移σ是由最后一个方程(即，其是差值(m_b-p_b)在所有N个指数b值上求和除以频带数量N)表示的。最小误差e²是变量σ等于最佳电平偏移时的误差e²(在所述一组方程中表示为σ的函数)的值。当子系统203针对每个时间生成单个电平偏移值σ时，N为由子系统201确定的频带全集中的频带总数。当子系统203针对每个时间生成多个电平偏移值σ(例如，针对频带全集中的每个频带子集生成一个电平偏移值)时，频带数量N(在确定这样的电平偏移值之一的求和中)为频带全集的相关子集中的频带数量。

在回声消除过程期间没有人说话的理想情况下，回放音量中的(由增益元件103引起的)增益改变或(由增益元件104引起的)增益改变通常导致最佳电平偏移σ的大小发生较大的改变，并产生较小的最小误差e²。然而，(由增益元件103或104中的至少一个引起的)增益改变并不会总是产生这样的结果，例如，当麦克风信号m指示由麦克风采集的语音或其他噪声时可能不会有这样的结果。因此，实施决策逻辑204以确定最佳电平偏移σ和最小误差e²的值是否有资格指示由增益元件103和/或增益元件104引起的增益改变。通常，当子系统203针对每个时间生成多于一个最佳偏移值σ(例如，针对频带全集中的每个频带生成一个偏移值)时，逻辑204确定对于至少一个这样的最佳偏移值，一个或多个决策标准是否被满足。

如果对于某一最佳电平偏移，逻辑204应用的一个或多个决策标准被满足，则该最佳电平偏移σ对应于(并决定)“校正”(在预测滤波器适应性改变子系统209中确定的)预测滤波器的系数所需的增益的量。在这种情况下，补偿增益子系统205确定补偿增益213，然后(在元件206处)将所述补偿增益应用于从元件209输出的(针对所有频带)的预测滤波器系数214。在元件206处，将预测滤波器的每个滤波器系数乘以(从子系统205提供给元件206的)对应补偿增益值，从而确定校正后的预测滤波器系数214A，(在卷积元件210处)应用所述预测滤波器系数来对参考信号208进行滤波以产生预测回声信号212。校正后的系数214A也被提供给子系统209以(在适应性改变期间)用于生成更新的一组系数214。从麦克风信号211的对应值中减去预测回声信号值212以产生回声消除输出207。

在图2实施例的一些实施方式中，在预测滤波器适应性改变(例如，梯度下降适应性改变)期间(例如，在子系统206中)将补偿增益值213应用于候选预测滤波器系数。在这样的适应性改变期间，还可以(例如，在子系统209中)将补偿增益值213应用于至少一个预测回声值以生成校正后的预测回声值，使用所述校正后的预测回声值来确定更新的一组候选预测滤波器系数214(例如，其方式将在下面更详细地描述)。

通常，(针对任何一个时间)确定一个补偿增益值213，并将其应用于预测滤波器的所有系数。

在图2实施例中，可以(在元件206处)将一个补偿值213乘以滤波器系数214以生成校正后的滤波器系数214A，将所述校正后的滤波器系数输入到卷积元件210。还可选地，(在子系统209处)将补偿值213应用于(在预测滤波器适应性改变期间生成的)(多个)预测回声值，以改善在预测滤波器适应性改变期间对至少一组候选预测滤波器系数的更新(例如，其方式将在下面更详细地描述)。

在图2的实施例中，分带子系统201左侧的所有元件(例如，103、104、209、206和210)通常对数据的每个单独的频率仓进行操作。因此，适应性改变子系统209针对每个频率仓确定滤波器系数214，补偿值213可以是标量值，其与每个频率仓中的滤波器系数相乘(从而确定校正后的(调整或缩放后的)滤波器系数214A)，并且元件210实施对校正后的滤波器系数214A与参考音频信号208的卷积。分带子系统201右侧的所有元件都对数据的频带进行操作。子系统201(针对各个仓)对提供给它的频域数据进行功率分带，得到较少数量的实际频带的数据。由元件202、203、204和205实施的处理和分析是对这些频带中的数据执行的。通常，元件205(针对每个时间)生成单个补偿增益值213，用于校正所有频带中的(并且因此针对其中包括的所有仓的)滤波器系数。如果逻辑204确定滤波器系数不应当按某些非单位量进行缩放，则元件205可以生成值213作为单位增益。

(在元件206处)应用(多个)补偿增益值213来确定校正后的预测滤波器系数214A可以使回声消除快速适应性改变以补偿在增益元件103和/或增益元件104处的增益改变。该短适应性改变时间意味着假设在回声消除器的适应性改变子系统209中实施(以更新每组预测滤波器系数)的适应性改变速率(例如，梯度下降适应性改变速率)相对较慢，则对于紧随增益改变之后出现的任何信号，回声消除性能都得到了极大的改善。

可以设想，决策逻辑204可以在不同的实施方式中应用不同复杂度的标准(例如，取决于每种实施方式的预期使用情况)，以便决定是否应该基于最佳电平偏移σ和最小误差e²来对预测滤波器状态进行适应性改变。如果麦克风信号m和预测信号p(从子系统202输出的分带频谱)具有相似的形状(在一个时间，作为频率的函数)，并且这两者之间只有电平偏移，则最小误差e²是否具有足够小的值可以是适当的决策标准(即，如果最小误差超过阈值，则逻辑204可以使子系统205生成(多个)非单位增益213)。然而，使用这样的简单标准可能无法准确检测增益元件103和/或增益元件104处的所有增益改变。

例如，本发明的系统通常在这样的环境(例如，房间)中操作，麦克风采集所述环境中存在的噪声。增益元件103和/或104处的增益改变可能将麦克风输出信号的某些电平降低到本底噪声，从而导致麦克风信号值m和/或预测信号值p的频谱形状改变。这可以通过实施子系统204以尝试使用(作为示例)最小跟随器来检测麦克风信号的本底噪声来解决。如果在子系统203计算一个或多个频带的电平偏移和误差时，子系统204检测到麦克风信号的这些(多个)频带处于噪声中(即，具有处于本底噪声的电平)，则子系统205可以使用得到的信息来输出针对(多个)频带的单位增益(如果子系统204向子系统205指示不应该对每个这样的频带应用增益校正，以使得元件206不会改变每个这样的频带中包括的仓中的滤波器系数)。

在另一个示例实施例中，子系统204被实施为简单地观测每个电平偏移σ(由元件203为所有频带确定的单个偏移、或由元件203确定的一组偏移中的每个偏移——每个偏移针对每个不同的频带)的值，以查看所述电平偏移是否基本上沿一个方向转换，并且向子系统205指示是否应该(针对所有频带或针对各个频带)应用非单位增益校正。通常，(针对所有频带)确定单个电平偏移σ。在一个优选实施例中，子系统204仅检测(由元件203针对所有频带确定的)单个电平偏移σ是否指示增益103(以及因此设备扬声器101的输出电平)已经下降到低于阈值，因为如果增益103(以及因此扬声器101的输出电平)增加，则不需要实施快速预测滤波器校正。子系统204的该实施例不检测偏移σ是否指示扬声器101的输出电平已经增加到高于任何阈值。因此，根据优选实施例，元件206仅在扬声器101的电平(如电平偏移σ所指示的)下降到低于阈值时才将非单位增益213应用于消除滤波器系数214(以校正所述系数)。例如，在优选实施例的一些实施方式中，阈值等于-5dB。

在预测滤波器的适应性改变期间(在子系统209中)，通常计算具有以下形式的误差项e²[t]：

e²[t]＝(m[t]-p[t])²

其中，m[t]是麦克风音频流211，p[t]是通过将(候选的)一组预测滤波器系数应用于参考信号208而确定的预测信号。子系统209通常应用梯度下降以最小化在适应性改变期间的时间t的平方误差项e²[t]，从而确定(由时间t的适应性改变产生的)最佳的一组预测滤波器系数。已适应性改变的滤波器系数(以及适应性改变期间生成的每组候选滤波器系数)从子系统209输出到元件206。梯度下降适应性改变过程通常包括确定量

其是时间t的平方误差e²[t]关于时间t的每个候选滤波器系数a[n]的偏导数。每个这样的偏导数都具有以下形式：

其中，“r[t]”表示要由已适应性改变的预测滤波器进行滤波的参考信号208，“e[t]”表示时间t的误差，并且“p[t]”表示在执行适应性改变过程以确定时间t的已适应性改变的滤波器期间通过将一组候选预测滤波器系数a[n]应用于参考信号208而确定的预测信号。

在对预测滤波器进行梯度下降适应性改变以进行回声消除期间，偏导数(梯度)通常在被求和到滤波器状态中之前以某种方式变形(例如，可以对梯度向量进行归一化以在某些条件下加速收敛)。梯度下降适应性改变可以用于构建时域回声消除滤波器，但更通常在每个子频带有效独立操作的某些变换频域表示中操作。

当子系统209实施适应性改变(例如，梯度下降适应性改变)以确定时间t的已适应性改变的滤波器时，图2的信号212可以是由在子系统209中通过适应性改变确定的最终(已适应性改变)滤波器产生的最终预测信号p[t](假设图2的子系统206中没有对滤波器系数进行校正)。在适应性改变期间，信号212是中间预测信号p[t]的序列，其在子系统209中用于更新多组候选滤波器系数(最终的适应性改变后的滤波器系数的候选值)，例如以在适应性改变期间计算梯度向量。

接下来，描述第二类实施例，其中，通过适应性改变(例如，梯度下降适应性改变)来确定已适应性改变的滤波器，并且在适应性改变过程期间，(例如，在子系统209中)(多个)补偿增益值213被应用于使用一组候选滤波器系数214(最终的已适应性改变的滤波器系数的候选值)生成的至少一个中间预测信号p[t]。在传统梯度下降适应性改变的情况下，(在适应性改变过程期间)使用中间预测信号p[t]来计算梯度向量，并且因此，替代地使用(根据本发明的实施例生成的)校正后的中间预测信号来计算梯度向量。用于确定每个补偿增益值213的(例如，由元件201、202、203、204和205实施的)启发法使用预测信号(例如，212)和麦克风信号(211)来计算(多个)增益值213。在第二类实施例中，在适应性改变期间(由元件206)将(多个)增益值213应用于一组滤波器系数214(以生成校正后的滤波器系数214A)，并且还应用于至少一个中间预测信号p[t](以生成至少一个校正后的预测回声信号)，以便不需要重新评估校正后的候选滤波器系数214A(因为在适应性改变过程期间使用校正后的预测回声信号来计算梯度向量)。

图2的可选实施方式(由指示将(多个)增益值213提供给块209的虚线指示)是第二类实施例中的示例实施例。在该实施方式中，将当前(最近生成的)(多个)增益值213应用于校正在梯度适应性改变过程期间(在时间t)生成的中间预测信号p[t]。使用校正后的中间预测信号来更新当前的一组校正后的候选预测滤波器系数214A。将当前(多个)增益值213还在元件206处(在适应性改变过程期间)应用于更新的每组候选预测滤波器系数214，并且(在适应性改变收敛至确定时间t的最终的一组已适应性改变的预测滤波器系数之后)应用于最终的已适应性改变的预测滤波器系数214。

因此，本发明的示例实施例包括以下步骤之一或二者：

1.在(如图2系统中的)元件206处，将(多个)补偿增益(例如，从子系统205提供给元件206的(多个)增益213)应用于预测滤波器系数(例如，由子系统209生成的系数214)，所述预测滤波器系数可以是在适应性改变期间确定的候选预测滤波器系数a[t]，或者由于在时间t的滤波器适应性改变而确定的最终的一组已适应性改变的预测滤波器系数；以及可选地还有

2.在滤波器适应性改变期间，在子系统209处，将(由子系统205确定的)(多个)补偿增益213应用于在适应性改变(例如，梯度适应性改变)期间生成的至少一个中间预测回声信号p[t]，以生成校正后的中间预测信号。在包括步骤2的实施方式中，子系统209将使用校正后的中间预测信号代替未校正的中间预测回声信号p[t]，从而改善适应性改变(例如，减少收敛所需的时间)。

对于每个时间增量，本发明方法的一些示例实施例包括以下步骤：

1)(例如，在图2的元件210中)使用当前滤波器估计和参考音频信号来计算预测回声信号(例如，这可以在适应性改变期间使用当前候选的一组滤波器系数执行，或者在(时间t的)适应性改变过程之后使用最终的(已适应性改变的)一组滤波器系数来执行)；以及

2)使用预测回声信号和麦克风信号，(例如，在元件203和204中)确定是否存在似乎已经发生的(由元件103和/或104进行的)任何增益调整。如果存在要进行的任何对应的滤波器调整，则(例如，由元件206)将至少一个补偿增益(例如，在元件205中确定的(多个)补偿增益213)应用于当前滤波器(例如，应用于在子系统209中适应性改变的候选滤波器系数、或最终的(已适应性改变的)滤波器系数)，并且可选地还(例如，在适应性改变期间在图2的子系统209中)应用于中间预测回声信号p[t]，以生成校正后的预测回声信号。

在一些这样的示例实施例中，当将补偿增益应用于已适应性改变的候选滤波器系数时，所述方法还包括以下步骤：

3)使用预测回声信号p[t](或校正后的预测回声信号)、当前滤波器系数(例如，在适应性改变过程期间在子系统209中确定的候选滤波器系数)和麦克风信号(211)，(例如，在子系统209中)计算滤波器上的误差函数的梯度向量(即，当前适应性改变步骤的梯度向量)；

4)可选地，改变梯度向量以提高适应性改变速度或收敛稳定性；以及

5)将梯度向量(或在可选步骤4中确定的修改的梯度向量)应用于滤波器以生成更新的滤波器(例如，更新的一组滤波器系数214)。

通过将回声消除器与电平偏移检测量度紧密联系，可以避免(在元件103和/或104处发生增益改变之后)在可以应用(例如，在元件205中确定的)(多个)电平偏移补偿增益213来补偿增益改变之前完成(时间t的)梯度下降适应性改变的情况。如果直到完成(时间t的)适应性改变之后还未应用(多个)电平偏移补偿增益213，则系统可能会(在适应性改变期间)不必要地或者以在应用(多个)电平偏移补偿增益之后需要校正的方式步进滤波器状态。

参考图3，接下来描述本发明方法的示例。图3是回声消除路径改变的宽带适应性改变的示例过程300的流程图。过程300可以由包括一个或多个处理器的系统执行。

在过程30的步骤310中，系统检测宽带偏移(例如，由于图2的元件103和/或104处的增益改变导致的宽带偏移)。在步骤320中，系统基于检测(例如，在图2的元件206中)调整回声消除器的回声预测滤波器(预测性滤波器)。在步骤330中，系统基于已调整的预测滤波器(例如，在图2的元件207中)去除输入信号(例如，图2的麦克风信号211)的由输出信号(例如，图2的元件103的输出、或图2的扬声器101响应于元件103的输出而发出的声音)引起(例如，指示其回声内容)的部分。

在一些实施方式中，系统基于麦克风电平的(例如，在图2的子系统201中的)分带和使用回声消除滤波器确定的预测回声来计算宽带偏移。在一些实施方式中，系统基于麦克风电平频带的子集和预测回声来计算宽带偏移。在一些实施方式中，宽带偏移的检测(包括计算指示宽带偏移的至少一个偏移值)与回声消除器的操作紧密耦接，例如，使得(响应于在回声消除滤波器适应性改变过程之前或期间出现宽带偏移而进行的)滤波器调整在回声消除器完成滤波器适应性改变过程之前(例如，在执行更新一组滤波器系数的梯度下降步骤之前)被应用。

图4是根据实施例的用于实施本文描述的(包括参考图1至图3描述的)特征和过程的移动设备架构(800)。根据本发明的实施例，具有架构800的设备可以被配置(例如，所述架构的(多个)处理器801和音频子系统803可以被配置)为执行回声消除(或其步骤)。架构800可以在任何电子设备中实施，所述电子设备包括但不限于：台式计算机、消费类音频/视频(AV)设备、无线电广播设备、移动设备(例如，智能电话、平板计算机、膝上型计算机、可穿戴设备)。在示出的示例实施例中，架构800用于智能电话并且包括(多个)处理器801、外围设备接口802、音频子系统803、扩音器804、麦克风805、传感器806(例如，加速度计、陀螺仪、气压计、磁力计、相机)、位置处理器807(例如，GNSS接收器)、无线通信子系统808(例如，Wi-Fi、蓝牙、蜂窝)、以及(多个)I/O子系统809，所述I/O子系统包括触摸控制器810和其他输入控制器811、触摸表面812和其他输入/控制设备813。也可以使用具有更多或更少部件的其他架构来实施所公开的实施例。

存储器接口814耦接到处理器801、外围设备接口802和存储器815(例如，闪速存储器、RAM、ROM)。存储器815存储计算机程序指令和数据，包括但不限于：操作系统指令816、通信指令817、GUI指令818、传感器处理指令819、电话指令820、电子消息传递指令821、web浏览指令822、音频处理指令823、GNSS/导航指令824和应用程序/数据825。音频处理指令823包括用于执行本文描述的(包括参考图1至图3描述的)音频处理的指令。

本文所描述的系统的各方面可以在适当的基于计算机的声音处理网络环境中实施，以便处理数字或数字化音频文件。自适应音频系统的部分可以包括一个或多个网络，所述网络包括任何期望数量的独立机器，所述机器包括用于缓冲和路由在计算机之间传输的数据的一个或多个路由器(未示出)。这种网络可以在各种不同的网络协议上构建，并且可以是因特网、广域网(WAN)、局域网(LAN)或其任何组合。

一个或多个部件、块、过程或其他功能部件可以通过控制系统的基于处理器的计算设备的执行的计算机程序来实施。还应当注意，可以使用硬件、固件和/或体现在各种机器可读或计算机可读介质中的数据和/或指令的任何数量的组合，从行为、寄存器传输、逻辑部件和/或其他特性的角度描述本文公开的各种功能。可以体现这种格式化数据和/或指令的计算机可读介质包括但不限于各种形式的物理(非暂态)、非易失性存储介质，如光、磁或半导体存储介质。

可以从以下示例实施例(“EEE”)的一项或多项中理解本发明的一些实施例的各方面：

EEE1.一种回声消除方法，所述方法对指示由扬声器回放的音频内容的参考信号和来自麦克风的输入信号执行，同时向所述扬声器提供输出信号，所述方法包括：

由回声消除器接收所述输入信号；

由所述回声消除器接收所述参考信号，其中，所述输出信号已通过对所述参考信号应用至少一次电平转换而被生成；

使用所述回声消除器的至少一个预测滤波器来预测所述输入信号的将由所述扬声器响应于所述参考信号而发出的声音产生的回声内容，从而确定所述输入信号的预测回声内容；

响应于所述输入信号和所述预测回声内容，检测所述参考信号与所述输出信号之间的宽带偏移；

从所述输入信号中去除所述预测回声内容中的至少一些；以及通过响应于所述宽带偏移而生成至少一个已调整的预测滤波器来对所述至少一个预测滤波器进行适应性改变。

EEE2.如EEE1所述的回声消除方法，其中，已生成所述输出信号，使得所述至少一次电平转换对所述回声消除器而言是未知的，所述方法还包括：

响应于所述宽带偏移而生成至少一个补偿增益。

EEE3.如EEE2所述的回声消除方法，包括：

在所述适应性改变期间，将所述补偿增益应用于至少一个候选预测滤波器，从而生成所述已调整的预测滤波器。

EEE4.如EEE2所述的回声消除方法，包括：

确定所述宽带偏移的值的序列；以及

在所述适应性改变期间，响应于确定所述宽带偏移的值中的至少一个值低于阈值，将所述补偿增益应用于至少一个候选预测滤波器，从而生成所述已调整的预测滤波器。

EEE5.如EEE1至EEE4中任一项所述的回声消除方法，其中，所述适应性改变包括：生成至少一个中间预测回声信号；以及响应于确定所述宽带偏移的值中的至少一个值低于阈值，将所述补偿增益应用于所述中间预测回声信号，从而生成至少一个已调整的预测回声信号。

EEE6.如EEE1至EEE5中任一项所述的回声消除方法，其中，所述适应性改变包括生成至少一个中间预测回声信号，并且其中，所述方法包括：

确定所述宽带偏移的值的序列；以及

在所述适应性改变期间，响应于确定所述宽带偏移的值中的至少一个值低于阈值，将所述补偿增益应用于所述中间预测回声信号，从而生成已调整的预测回声信号。

EEE7.如EEE1至EEE6中任一项所述的回声消除方法，其中，所述适应性改变包括使用所述已调整的预测回声信号执行梯度下降适应性改变。

EEE8.如EEE2所述的方法，其中，所述方法包括：

在所述适应性改变期间，确定所述输入信号的至少一个频带是否处于噪声中；以及

基于所述确定所述输入信号的至少一个频带是否处于噪声中的结果，将所述补偿增益应用于至少一个候选预测滤波器的系数，从而生成所述已调整的预测滤波器。

EEE9.如EEE1至EEE8中任一项所述的回声消除方法，还包括生成指示所述预测回声内容的预测回声信号，并且其中，所述输入信号是麦克风信号，并且所述宽带偏移的检测包括：

对所述麦克风信号进行分带，从而生成分带麦克风信号；

对所述预测回声信号进行分带，从而生成分带预测回声信号；以及

使用所述分带麦克风信号和所述分带预测回声信号确定所述宽带偏移。

EEE10.一种存储指令的非暂态计算机可读介质，所述指令在由至少一个处理器执行时使所述至少一个处理器执行如EEE1至EEE9中任一项所述的方法。

EEE11.一种系统，所述系统被配置为对指示由扬声器回放的音频内容的参考信号和来自麦克风的输入信号执行回声消除，同时向所述扬声器提供输出信号，所述方法包括：

回声消除子系统，所述回声消除子系统包括被耦接并且被配置为接收所述输入信号和所述参考信号的至少一个处理器，其中，所述输出信号已通过对所述参考信号应用至少一次电平转换而被生成，并且其中，所述至少一个处理器被配置为：

预测所述输入信号的将由所述扬声器响应于所述参考信号而发出的声音产生的回声内容，从而确定所述输入信号的预测回声内容，包括通过利用生成至少一个已调整的预测滤波器来对所述至少一个预测滤波器进行适应性改变；

从所述输入信号中去除所述预测回声内容中的至少一些；以及

响应于所述输入信号和所述预测回声内容，检测所述参考信号与所述输出信号之间的宽带偏移，其中，响应于所述宽带偏移执行所述至少一个已调整的预测滤波器的生成。

EEE12.如EEE11所述的系统，还包括：

增益子系统，所述增益子系统被耦接并且被配置为通过向所述参考信号应用所述至少一次电平转换来响应于所述参考信号而生成所述输出信号，使得所述至少一次电平转换对所述回声消除子系统而言是未知的。

EEE13.如EEE11所述的系统，其中，所述至少一个处理器被配置为响应于所述宽带偏移而生成至少一个补偿增益。

EEE14.如EEE13所述的系统，其中，所述至少一个处理器被配置为在所述适应性改变期间，将所述补偿增益应用于至少一个候选预测滤波器，从而生成所述已调整的预测滤波器。

EEE15.如EEE11至EEE14中任一项所述的系统，其中，所述至少一个处理器被配置为：

确定所述宽带偏移的值的序列；以及

EEE16.如EEE13所述的系统，其中，所述适应性改变包括生成至少一个中间预测回声信号，并且其中，所述至少一个处理器被配置为：

确定所述宽带偏移的值的序列；以及

EEE17.如EEE11至EEE16中任一项所述的系统，其中，所述适应性改变包括使用所述已调整的预测回声信号执行梯度下降适应性改变。

EEE18.如EEE11至EEE17中任一项所述的系统，其中，所述至少一个处理器被配置为：

在所述适应性改变期间，确定所述输入信号的至少一个频带处于噪声中；以及

基于确定所述输入信号的至少一个频带是否处于噪声中的结果，将所述补偿增益应用于至少一个候选预测滤波器的系数，从而生成所述已调整的预测滤波器。

EEE19.如EEE11至EEE18中任一项所述的系统，所述输入信号为麦克风信号，并且所述至少一个处理器被配置为：

生成指示所述预测回声内容的预测回声信号；

对所述麦克风信号进行分带，从而生成分带麦克风信号；

虽然已经通过示例并且就具体实施例描述了一种或多种实施方式，但是应当理解，一种或多种实施方式不限于所公开的实施例。相反，其旨在覆盖对本领域技术人员显而易见的各种修改和类似布置。因此，所附权利要求的范围应当被赋予最广泛的解释，以便涵盖所有这样的修改和类似布置。

Claims

1.一种回声消除方法，所述方法对指示由扬声器回放的音频内容的参考信号和来自麦克风的输入信号执行，同时向所述扬声器提供输出信号，所述方法包括：

由回声消除器接收所述输入信号；

从所述输入信号中去除所述预测回声内容中的至少一些预测回声内容；以及

利用响应于所述宽带偏移而生成至少一个已调整的预测滤波器来对所述至少一个预测滤波器进行适应性改变。

2.如权利要求1所述的方法，其中，所述输出信号已被生成，使得所述至少一次电平转换对所述回声消除器是未知的，所述方法还包括：

响应于所述宽带偏移而生成至少一个补偿增益。

3.如权利要求2所述的方法，包括：

4.如权利要求2所述的方法，包括：

确定所述宽带偏移的值的序列；以及

在所述适应性改变期间，响应于确定所述宽带偏移的值的序列中的至少一个值低于阈值，将所述补偿增益应用于至少一个候选预测滤波器，从而生成所述已调整的预测滤波器。

5.如权利要求1至4中任一项所述的方法，其中，所述适应性改变包括：生成至少一个中间预测回声信号；以及响应于确定所述宽带偏移的值中的至少一个值低于阈值，将所述补偿增益应用于所述中间预测回声信号，从而生成至少一个已调整的预测回声信号。

6.如权利要求1至5中任一项所述的方法，其中，所述适应性改变包括生成至少一个中间预测回声信号，并且其中，所述方法包括：

确定所述宽带偏移的值的序列；以及

7.如权利要求1至6中任一项所述的方法，其中，所述适应性改变包括使用所述已调整的预测回声信号执行梯度下降适应性改变。

8.如权利要求2所述的方法，其中，所述方法包括：

9.如权利要求1至8中任一项所述的方法，还包括生成指示所述预测回声内容的预测回声信号，并且其中，所述输入信号是麦克风信号，并且检测所述宽带偏移包括：

对所述麦克风信号进行分带，从而生成分带麦克风信号；

10.一种存储指令的非暂态计算机可读介质，所述指令在由至少一个处理器执行时使所述至少一个处理器执行如权利要求1至9中任一项所述的方法。

11.一种系统，所述系统被配置为对指示由扬声器回放的音频内容的参考信号和来自麦克风的输入信号执行回声消除，同时向所述扬声器提供输出信号，所述系统包括：

预测将由所述扬声器响应于所述参考信号而发出的声音产生的所述输入信号的回声内容，从而确定所述输入信号的预测回声内容，包括通过利用至少一个已调整的预测滤波器的生成来对所述至少一个预测滤波器进行适应性改变；

12.如权利要求11所述的系统，还包括：

增益子系统，所述增益子系统被耦接并且被配置为通过向所述参考信号应用所述至少一次电平转换来响应于所述参考信号而生成所述输出信号，使得所述至少一次电平转换对所述回声消除子系统是未知的。

13.如权利要求11所述的系统，其中，所述至少一个处理器被配置为响应于所述宽带偏移而生成至少一个补偿增益。

14.如权利要求13所述的系统，其中，所述至少一个处理器被配置为在所述适应性改变期间，将所述补偿增益应用于至少一个候选预测滤波器，从而生成所述已调整的预测滤波器。

15.如权利要求11至14中任一项所述的系统，其中，所述至少一个处理器被配置为：

确定所述宽带偏移的值的序列；以及

16.如权利要求13所述的系统，其中，所述适应性改变包括生成至少一个中间预测回声信号，并且其中，所述至少一个处理器被配置为：

确定所述宽带偏移的值的序列；以及

17.如权利要求11至16中任一项所述的系统，其中，所述适应性改变包括使用所述已调整的预测回声信号执行梯度下降适应性改变。

18.如权利要求11至17中任一项所述的系统，其中，所述至少一个处理器被配置为：

基于确定所述输入信号的所述至少一个频带是否处于噪声中的结果，将所述补偿增益应用于至少一个候选预测滤波器的系数，从而生成所述已调整的预测滤波器。

19.如权利要求11至18中任一项所述的系统，其中，所述输入信号为麦克风信号，并且所述至少一个处理器被配置为：

生成指示所述预测回声内容的预测回声信号；

对所述麦克风信号进行分带，从而生成分带麦克风信号；