WO2020191512A1

WO2020191512A1 - 回声消除装置、回声消除方法、信号处理芯片及电子设备

Info

Publication number: WO2020191512A1
Application number: PCT/CN2019/079174
Authority: WO
Inventors: 韩文凯; 王鑫山; 李国梁; 郭红敬; 朱虎
Original assignee: 深圳市汇顶科技股份有限公司
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2020-10-01
Also published as: CN111989934A; CN111989934B

Abstract

一种回声消除装置、回声消除方法、信号处理芯片及电子设备，回声消除装置包括：语音端点检测模块(106)，用于检测近端数字语音信号中是否存在实际的回声数字语音信号；双端通话检测模块(108)，用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后检测双端通话概率以控制滤波器系数的更新；自适应滤波器(110)，用于根据所述滤波器系数以及远端数字语音信号生成估计的回声数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。回声消除装置中，自适应滤波器估计的回声数字语音信号比如和加法器输出的误差数字语音信号反馈回去控制双端通话检测模块检测双端通话概率，使得双端通话模块和自适应滤波器的相互制约，从而解决了自适应滤波算法中稳态失调量和收敛速度之间的矛盾，提高了双端通话检测模块的检测精度和滤波器的收敛性能。

Description

回声消除装置、回声消除方法、信号处理芯片及电子设备

技术领域

本申请实施例涉及信号处理技术领域，尤其涉及一种回声消除装置、回声消除方法、信号处理芯片及电子设备。

背景技术

回声消除目前是业内一大难题，从回声产生的途径有来看，除了环境原因产生的回声比如在免提通信系统中，由于扬声器的声音反馈到麦克风导致了回声，还包括网络传输延时所带来的回声。另外，还包括远端声音经过一重或者多重反射以后产生的间接回声。从回声消除的影响因素来看，不仅和通信系统终端设备的外部环境有关，还和运行通信系统的主机性能以及网络状况密切相关。而对于外部环境来说，其具体可以包括：麦克风和扬声器之间的相对距离、相对方向，扬声器与扬声器之间的相对距离以及方向，房间大小和房间墙壁材质等等。

回声的存在会影响到语音的清晰度，因此通过声学回声消除(AEC,Acoustic Echo Cancellation)来改善语音通信质量。回声消除算法(AEC)是使用一个自适应滤波器模拟回声路径，通过自适应算法不断调整滤波器的系数，使其冲击响应和真实回声路径相逼近。再结合远端语音信号和滤波器得到估计的回声信号。然后，从麦克风的输入信号中减去估计的回声信号，从而达到消除回声的目的。

但是，近端说话者语音信号的存在，会导致滤波器系数发散，从而影响回声消除的效果。因此，在现有技术的回声消除算法中必须要有双端通话检测(Double Talk Detection，DTD)。所谓双端通话是指麦克风采集的信号中既包括远端语音信号导致的回音，又包括近端说话者的语音信号。由于在回声消除过程中自适应滤波算法不可避免地将产生误调噪声，通过减小调整滤波器系数的更新步长即可减小算法的误调噪声，提高算法的收敛精度。但是滤波器系数更新步长的减小会降低算法的收敛速度和跟踪速度。因此，现有方案中固定步长的自适应滤波算法在收敛速度、跟踪速度和收敛精度等方面对算法调整因子的要求是相互矛盾的。另外，而且现有采用能量或相关的双端通话检测DTD算法，选取的判决门限通常固定不变，由此会存在漏检和虚警概率，从而降低了双端通话检测DTD检测精度。

发明内容

有鉴于此，本发明实施例所解决的技术问题之一在于提供一种回声消除装置、回声消除方法、信号处理芯片及电子设备，用以克服现有技术中的上述缺陷。

本申请实施例提供了一种回声消除装置，其包括：

语音端点检测模块，用于检测近端数字语音信号中是否存在实际的回声数字语音信号；

双端通话检测模块，用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后检测双端通话概率以控制滤波器系数的更新；

自适应滤波器，用于根据所述滤波器系数以及远端数字语音信号生成估计的回声数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。

可选地，在本申请的任一实施例中，所述语音端点检测模块进一步用于根据所述近端数字语音信号和所述远端数字语音信号的能量与预设的能量门限来比较，以检测所述近端数字语音信号中是否存在所述实际的回声数字语音信号。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于在所述语音端点检测模块检测结果表明所述近端数字语音信号中不存在所述实际的回声数字语音信号时不启动，使得所述滤波器系数按历史步长进行更新；或者，所述双端通话检测模块进一步用于在所述语音端点检测模块检测结果表明所述近端数字语音信号中存在所述实际的回声数字语音信号时启动以更新所述滤波器系数。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后通过估计的所述回声数字语音信号和估计的所述近端说话者的数字语音信号的估计能量检测所述双端通话概率进而控制所述滤波器系数的更新。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后对所述估计能量进行平滑处理以根据所述平滑后的估计能量检测所述双端通话概率进而控制所述滤波器系数的更新。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后通过估计的所述回声数字语音信号和估计的所述近端说话者的数字语音信号的所述估计能量确定分别不存在所述近端说话者的数字语音信号以及存在所述近端说话者的数字语音信号时存在所述近端数字语音信号的概率之比，以检测所述双端通话概率进而控制所述滤波器系数的更新。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后对所述估计能量进行平滑处理以根据所述平滑后的估计能量确定分别不存在所述近端说话者的数字语音信号以及存在所述近端说话者的数字语音信号时存在所述近端数字语音信号的概率之比，以检测所述双端通话概率进而控制所述滤波器系数的更新。

可选地，在本申请的任一实施例中，所述分别不存在所述近端说话者的数字语音信号以及存在所述近端说话者的数字语音信号时存在所述近端数字语音信号的概率之比与所述双端通话概率成反比关系。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于根据所述双端通话概率确定步长更新因子，以根据所述步长更新因子确定所述滤波器系数的更新步长进而更新所述滤波器系数。

可选地，在本申请的任一实施例中，所述双端通话概率与所述步长更新因子成非线性关系。

可选地，在本申请的任一实施例中，所述双端通话概率的变化趋势与所述步长更新因子变化趋势相反。

可选地，在本申请的任一实施例中，若所述近端数字语音信号中同时存在所述近端说话者的数字语音信号和所述实际的回声数字语音信号，所述双端通话概率的值为1，所述步长更新因子为0，则所述滤波器系数的所述更新步长减小以减缓所述滤波器系数或者停止所述滤波器系数的更新；若所述近端数字语音信号中不存在所述近端说话者的数字语音信号而只存在所述实际的回声数字语音信号，所述双端通话概率的值为0，所述步长更新因子为非0值，则所述滤波器系数的所述更新步长增加以加快所述滤波器系数的更新。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于根据所述双端通话概率确定所述步长更新因子，以根据所述步长更新因子确定所述滤波器系数的所述更新步长，进而根据所述更新步长以及更新梯度进行所述滤波器系数的更新。

可选地，在本申请的任一实施例中，所述双端通话检测模块进一步用于根据所述双端通话概率确定所述步长更新因子，以根据所述步长更新因子以及步长平滑量，确定所述滤波器系数的更新步长，进而根据所述更新步长以及所述更新梯度进行所述滤波器系数的更新。

可选地，在本申请的任一实施例中，所述更新步长与所述步长更新因子成线性关系。

可选地，在本申请的任一实施例中，所述滤波器系数与所述更新步长成线性关系。

可选地，在本申请的任一实施例中，还包括：加法模块，用于从所述近端数字语音信号中减去估计的所述回声数字语音信号得到误差数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。

本申请实施例还提供一种回声消除方法，其包括：

语音端点检测模块检测近端数字语音信号中是否存在实际的回声数字语音信号；

双端通话检测模块根据所述语音端点检测模块的检测结果决定是否启动，并在启动后通过检测双端通话概率以控制滤波器系数的更新；

自适应滤波器根据所述滤波器系数以及远端数字语音信号生成估计的回声数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。

本申请实施例还提供一种信号处理芯片，其包括本申请任一实施例所述的回声消除装置。

本申请实施例还提供一种电子设备，其包括本申请任一实施例所述的信号处理芯片。

本申请实施例中，通过语音端点检测模块检测近端数字语音信号中是否存在实际的回声数字语音信号；双端通话检测模块根据语音端点检测模块的检测结果来决定是否启动，并在启动后通过检测到的双端通话概率来以控制滤波器系数的更新；自适应滤波器根据所述滤波器系数以及远端数字语音信号生成估计的回声数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。由此可见，回声消除装置中，自适应滤波器估计的回声数字语音信号比如和加法器输出的误差数字语音信号反馈回去控制双端通话检测模块检测双端通话概率，使得双端通话模块和自适应滤波器的相互制约，从而解决了自适应滤波算法中稳态失调量和收敛速度之间的矛盾，提高了双端通话检测模块的检测精度和滤波器的收敛性能。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本申请实施例的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解，这些附图未必是按比例绘制的。附图中：

图1为本申请实施例一中应用回声消除装置的信号处理芯片的结构示意图；

图2为本申请实施例二中信号处理芯片的工作流程示意图。

具体实施方式

实施本发明实施例的任一技术方案必不一定需要同时达到以上的所有优点。

下面结合本发明实施例附图进一步说明本发明实施例具体实现。

本申请实施例中，通过语音端点检测模块检测近端数字语音信号中是否存在实际的回声数字语音信号；双端通话检测模块根据语音端点检测模块的检测结果决定是否启动，并在启动后通过检测到的双端通话概率以控制滤波器系数的更新；自适应滤波器根据所述滤波器系数以及远端数字语音信号生成估计的回声数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。由此可见，回声消除装置中，自适应滤波器估计的回声数字语音信号比如和加法器输出的误差数字语音信号反馈回去控制双端通话检测模块检测双端通话概率，使得双端通话模块和自适应滤波器的相互制约，从而解决了自适应滤波算法中稳态失调量和收敛速度之间的矛盾，提高了双端通话检测模块的检测精度和滤波器的收敛性能。

图1为本申请实施例一中应用回声消除装置的信号处理芯片的结构示意图；如图1所示，该信号处理芯片包括回声消除装置100，该回声消除装置100具体包括语音端点检测模块106、双端通话检测模块108、自适应滤波器110，除此之外，该回声消除装置还可以包括：语音采集模块102、语音播放模块104、加法模块112，其中，语音采集模块102分别与语音端点检测模块106、双端通话检测模块108、加法模块112通讯连接，语音播放模块104分别与语音端点检测模块106、自适应滤波器110通讯连接，语音端点检测模块106与双端通话检测模块108通讯连接，双端通话检测模块108分别与自适应滤波器110、加法模块112通讯连接。

其中，语音采集模块102用于采集近端模拟语音信号y(t)，以生成所述近端数字语音信号y(n)；本实施例中，语音采集模块具体可以为麦克风，其采集的近端模拟语音信号y(t)可能包括近端说话者的语音信号s(t)，也可能包括语音播放模块104播放远端模拟语音信号而导致的回声模拟语音信号d(t)。此处需要说明的是，所谓远端模拟语音信号x(t)、近端模拟语音信号y(t)是以通讯者双方语音信号在信号处理芯片中远近来进行区分。

其中，语音播放模块104，用于播放接收到的远端模拟语音信号x(t)；本实施例中，语音播放模块104可以具体为扬声器。

其中，语音端点检测模块106，用于检测近端数字语音信号y(n)中是否存在实际的回声数字语音信号d(n)；本实施例中，语音端点检测模块106又可以称之为语音端点检测器(Voice Activity Detector，简称VAD)。

其中，双端通话检测模块108，用于根据语音端点检测模块的检测结果决定是否启动，并在启动后通过检测到的双端通话概率以控制滤波器系数的更新；本实施例中，双端通话检测模块108又可以称之为双端通话检测器DTD。需要说明的是，本实施例中，滤波器系数的更新步长的调整具体由双端通话检测模块108来执行，但实际上，如果要实现双端检测模块108的轻量化，在另外一实施例中也可以在双端通话检测模块108和自适应滤波器110之间单独增加一更新模块，具体用于进行滤波器系数的更新或滤波器系数的更新步长的确定。

其中，自适应滤波器110，用于根据滤波器系数以及所述远端数字语音信号x(n)生成估计的回声数字语音信号

以消除所述近端数字语音信号y(n)中实际的回声数字语音信号d(n)。本实施例中，所述自适应滤波器110比如为多时延块频域自适应滤波器。

其中，加法模块112，用于通过从所述近端数字语音信号y(n)中减去估计的回声数字语音信号

得到所述误差数字语音信号e(n)，以消除所述近端数字语音信号y(n)中实际的回声数字语音信号d(n)。本实施例中，加法模块112可以具体为加法器。所述估计的回声数字语音信号

越准确，即越接近实际的所述回声数字语音信号d(n)，则语音的清晰度越高。

进一步地，本实施例中，所述语音端点检测模块106进一步用于根据近端数字语音信号y(n)和远端数字语音信号x(n)的能量分别与预设的能量门限相比较，检测所述近端数字语音信号y(n)中是否存在实际的回声数字语音信号d(n)。若所述近端数字语音信号y(n)和远端数字语音信号x(n)的能量均大于对应的预设的能量门限，则判定所述近端数字语音信号y(n)中存在实际的回声数字语音信号d(n)。

进一步地，本实施例中，所述语音端点检测模块106检测结果表明所述近端数字语音信号y(n)中不存在实际的回声数字语音信号d(n)时，双端通话检测模块108不启动，使得所述滤波器系数按照历史步长更新；所述语音端点检测模块检测结果表明所述近端数字语音信号中存在实际的回声数字语音信号d(n)时，双端通话检测模块108启动以确定滤波器系数的更新步长。

进一步地，本实施例中，若所述近端数字语音信号y(n)中同时存在近端说话者的数字语音信号s(n)和所述回声数字语音信号d(n)，即处于双端通话状态，则滤波器系数的更新步长减小以减慢滤波器系数的更新或者停止滤波器系数的更新；若所述近端数字语音信号x(n)中不存在近端说话者的数字语音信号s(n)而只存在回声数字语音信号d(n)，即处于单端通话状态，则所述滤波器系数的更新步长增加以加快滤波器系数的更新。有关如何进行更新步长的确定详见下述实施例记载。步长更新详见下述公式(1)-(6)定义。

本实施例中，所述自适应滤波器进一步用于根据所述滤波器系数以及所述远端数字语音信号x(n)生成估计的回声数字语音信号

以下结合回声消除方法的实施例对上述信号处理芯片的工作原理进行示例性说明。

图2为本申请实施例二中信号处理芯片的工作流程示意图；对应上述图1，其包括：

S202、语音播放模块播放接收到的远端模拟语音信号x(t)；

本实施例中，近端模拟语音信号y(t)中包括的回声模拟语音信号d(t)具体由远端模拟语音信号x(t)引起。因此，对于语音采集模块102来说，其输入的近端模拟语音信号y(t)可能包括说话者的模拟语音信号s(t)以及回声模拟语音信号d(t)。此处需要说明的是，如果存在远端模拟语音信号x(t)则播放，否则，不播放。

S204、语音采集模块采集近端模拟语音信号y(t)，以生成所述近端数字语音信号y(n)；

S206、语音端点检测模块检测所述近端数字语音信号y(n)中是否存在实际的回声数字语音信号d(n)；

本实施例中，如前所述，若语音端点检测模块106为语音端点检测器VAD，则具体可以通过短时能量法、时域平均过零率法和短时相关性法等来检测远端数字语音信号x(n)和近端数字语音信号y(n)，进而判断是否存在实际的回声数字语音信号d(n)。进一步地，如果采取短时能量法，则可以通过语音端点检测模块106检测远端数字语音信号x(n)和近端数字语音信号y(n)的能量，并分别与预先设置的能量门限去做比对。如果远端数字语音信号x(n)和近端数字语音信号y(n)的能量均大于对应的能量门限值，则表明近端数字语音信号y(n)存在回声数字语音信号d(n)，由于回声数字语音信号d(n)是因远端数字语音信号x(n)而产生，因此，可以理解为当存在远端数字语音信号x(n)时，也即存在回声数字语音信号d(n)。

S208、双端通话检测模块根据所述语音端点检测模块的检测结果决定是否启动，并在启动后检测双端通话概率以确定滤波器系数的更新步长；

本实施例中，如前所述，所述双端通话检测模块在所述检测结果表明所述近端数字语音信号y(n)中不存在实际的回声数字语音信号d(n)时不启动，使得所述滤波器系数按照历史步长更新滤波器系数，比如当以帧为单位进行回声消除时，则此时可以按照上一帧近端数字语音信号的更新步长更新滤波器系数；或者，所述双端通话检测模块108在所述检测结果表明所述近端数字语音信号y(n)中存在实际的回声数字语音信号d(n)时启动以根据检测到的双端通话概率控制滤波器系数更新步长的确定。

具体地，本实施例中，若所述近端数字语音信号y(n)中同时存在近端说话者的数字语音信号s(n)和所述实际的回声数字语音信号d(n)，则所述滤波器系数的更新步长减小，控制滤波器系数更新变慢，或者直接停止滤波器系数的更新，此处之所以要使滤波器系数更新变慢甚至停止更新，主要考虑到近端说话者的数字语音信号s(n)的存在会导致滤波器系数发散，无法生成准确地估计的回声数字语音信号

从而影响回声消除的有效性；若所述近端数字语音信号y(n)中不存在近端说话者的数字语音信号s(n)而只存在所述实际的回声数字语音信号d(n)，则更新步长增加以更新滤波器系数。更新步长的计算请参见下述以概率模型为例的说明。

此处，如前所述，可以在双端通话检测模块和自适应滤波器之间单独增加一更新步长确定模块，具体用于计算更新步长，或者也可以由双端通话检测模块来计算更新步长。

S210、自适应滤波器根据所述滤波器系数以及远端数字语音信号x(n)生成估计的回声数字语音信号；

本实施例中，如前所述，该自适应滤波器110为多时延块频域自适应滤波器，即其包括若干块自适应滤波器，比如自适应滤波器块的数量为D，从而实现更短的块延时、更快的收敛速度和更小的存储要求。

S212、加法模块从所述近端数字语音信号y(n)中减去估计的回声数字语音信号得到误差数字语音信号e(n)以消除所述近端数字语音信号y(n)中实际的回声数字语音信号d(n)。

下述以统计概率模型进行更新步长的确定为例来实现双端通话检测模块108和自适应滤波器110的相互制约进行示例性说明。另外，将具体应用上述回声消除的方案时，对近端语音数字语音信号、远端数字语音信号、回声数字语音信号是以帧为单位进行处理的，即参照自适应滤波器的频点的数量M进行帧的划分，即分别把回声数字语音信号d(n)、近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)中每M个数据点记为1帧，针对回声数字语音信号d(n)、近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)中的每一帧应用上述回声消除方案。

如前所述，存在回声数字语音信号d(n)情形实际上可以具体区分为：

(1)不存在近端说话者的数字语音信号s(n)而只存在实际的回声数字语音信号d(n)，此种情形又称之单端通话(或又称之为single talk)

(2)既存在近端说话者的数字语音信号s(n)又存在实际的回声数字语音信号d(n)，此种情形又称之为双端通话(或又称之double talk)；

为此，用H ₀和H ₁分别表示不存在近端说话者的数字语音信号s(n)而只存在实际的回声数字语音信号d(n)，以及同时存在近端说话者的数字语音信号s(n)以及实际的回声数字语音信号d(n)。

在上述公式(1)中，D(i)＝[D(i,1),D(i,2),...,D(i,M)]，S(i)＝[S(i,1),S(i,2),...,S(i,M)]和Y(i)＝[Y(i,1),Y(i,2),...,Y(i,M)]，分别表示实际的回声数字语音信号d(n)、近端说话者的数字语音信号s(n)以及近端数字语音信号y(n)的第i帧信号在第1至第M个频点上的频域信号，M的数值一般等于自适应滤波器的阶数。同样，X(i)＝[X(i,1),X(i,2),...,X(i,M)]表示远端数字语音信号x(n)的第i帧信号在第1至第M个频点上的频域信号。

本实施例中，假设以近端说话者的数字语音信号s(n)和远端数字语音信号x(n)服从零均值的高斯分布为前提，且实际的回声数字语音信号d(n)、近端说话者的数字语音信号s(n)互不相关，则存在如下算式(2)所示的关系：

其中，σ _s(i,k)和σ _d(i,k)分别表示为近端说话者的数字语音信号s(n)和实际的回声数字语音信号d(n)的第i帧信号在第k个频点上的实际能量，p(Y(i,k)|H ₀)表示当不存在近端说话者的数字语音信号s(n)时，近端数字语音信号y(n)的第i帧信号在第k个频点具有频域信号的概率，k＝1,2...M，p(Y(i,k)|H ₁)表示当存在近端说话者的数字语音信号s(n)时，近端数字语音信号y(n)的第i帧信号在第k个频点具有频域信号的概率。

根据贝叶斯法则，存在如下述算式(3)的关系：

其中q＝p(H ₀)/p(H ₁)表示在近端数字语音信号y(n)的一帧信号中近端说话者不说话的时间和说话时间之比，即一帧信号中不存在近端说话者的数字语音信号和存在近端说话者的数字语音信号的概率比。p(H ₁|Y(i))表示近端数字语音信号y(n)的第i帧信号在第1至第M个频点上具有频域信号时，能检测到存在近端说话者的数字语音信号s(n)的概率，即所述双端通话概率。

对上述公式(3)做整理得到：

其中Λ _k(Y(i,k))是不存在近端说话者的数字语音信号s(n)时近端数字语音信号y(n)的第i帧信号在第k个频点上存在频域信号的概率与存在近端说话者的数字语音信号s(n)时近端数字语音信号y(n)的第i帧信号在第k个频点上存在频域信号的概率之比(或者称之近端数字语音信号y(n)的第i帧信号在第k个频点上存在频域信号的似然比)。再参见上述公式(3)可知，上述似然比与所述双端通话概率成反比关系。σ _s(i,k)和σ _d(i,k)表示近端说话者的数字语音信号s(n)和实际的回声数字语音信号d(n)的第i帧信号在第k个频点上的实际能量，实际场景中难以获取，因此本实施例中，通过下述算式(5)进行估计得到。

另外，假设自适应滤波器对回声估计的足够精确，则自适应滤波器生成的

在双端通话的时候加法器112输出误差数字语音信号e(n)＝s(n)，即

通过e(n)对近端说话者的数字语音信号进行估计，

表示估计的近端说话者的数字语音信号的第i帧信号在第k个频点上的频域信号，E(i，k)表示误差数字语音信号e(n)的第i帧信号在第k个频点上的频域信号，即通过误差数字语音信号e(n)的第i帧信号在第k个频点上的频域信号E(i，k)的能量得到估计的近端说话者的数字语音信号的第i+1帧信号在第k个频点上的估计能量

以及通过估计的回声数字语音信号

的第i帧信号在第k个频点上的频域信号的估计能量

得到实际的回声数字语音信号d(n)的第i+1帧信号在第k个频点上的估计能量。即上述公式(4)中，近端说话者的数字语音信号s(n)的第i帧信号在第k个频点上的实际能量则使用误差数字语音信号e(n)的第i-1帧信号在第k个频点上的频域信号的能量代替，如果是回声数字语音信号d(n)的第i帧信号在第k个频点上的实际能量则使用估计的回声数字语音信号

的第i-1帧信号在第k个频点上的频域信号的估计能量代替。

其中λ _s、λ _d(＝0.91)分别表示近端说话者的数字语音信号能量估计平滑参数、回声数字语音信号能量估计平滑参数，以对所述估计能量进行平滑处理以根据所述平滑后的估计能量确定所述似然比以检测所述双端通话概率进而控制所述滤波器系数的更新，其目的在于防止连续两帧近端说话者的数字语音信号之间的能量值发生突变、连续两帧回声数字语音信号之间的能量值发生突变，对应平滑参数的大小根据不同的应用场景凭经验值设置。

但是，需要说明的是，在其他实施例中，也可以根据估计能量确定所述似然比以检测所述双端通话概率进而控制所述滤波器系数的更新。

由上述算式(1)-(6)可见，由于可通过自适应滤波器得到估计的回声语音数字信号

同时，通过加法模块得到误差数字语音信号e(n)，因此，对于双端通话检测模块来说，通过公式(5)可以得到估计的近端说话者的数字语音信号以及估计的回声数字语音信号的第i帧信号在第k个频点上的估计能量；再带入到上述算式(4)中得到近端数字语音信号y(n)的第i帧信号在第k个频点上存在频域信号的似然比；再带到上述算式(3)中得到近端数字语音信号y(n)的第i帧信号在第1至第M个频点上具有频域信号时，能检测到存在近端说话者的数字语音信号s(n)的概率即双端通话概率p(H ₁|Y(i))。

但是，此处需要说明的是，上述公式(1)-(5)只是如何确定双端通话概率、步长更新因子以及更新步长的一种具体举例，对于本领域人员里说，在上述思想的启发下，也可以有其他等同替代方案。

参见上述公式(3)，理论情况下，若双端通话检测模块检测到近端数字语音信号y(n)的第i帧信号中同时存在实际的回声数字语音信号d(n)、近端说话者的数字语音信号s(n)时，即q＝p(H ₀)/p(H ₁)的值为0，由此得到p(H ₁|Y(i))＝1。反之，当双端通话检测模块(108)检测到近端数字语音信号y(n)中只存在实际的回声数字语音信号d(n)时，即q＝p(H ₀)/p(H ₁)的值为无群大，因此得到p(H ₁|Y(i))＝0。但是，在实际应用时，p(H ₁|Y(i))通常是在1和0之间，理论情况下才会为1或者0。

由上述可见，上述p(H ₁|Y(i))的大小，实际表征了双端通话概率的大小。而p(H ₁|Y(i))的具体大小又跟上述似然比Λ _k(Y(i,k))直接关联，或者又称为似然比Λ _k(Y(i,k))的大小会影响p(H ₁|Y(i))，而似然比Λ _k(Y(i,k))又随着近端说话者的数字语音信号s(n)、实际的回声数字语音信号d(n)的能量不断变化，因此，相当于p(H ₁|Y(i))与上述近端说话者的数字语音信号s(n)和实际的回声数字语音信号d(n)的能量相关联。

因此，对于其中自适应滤波器110采用多延时块频域自适应滤波器时，其中的一个滤波器块来说，比如第m块(m最大为上述D)自适应滤波器来说，其在针对近端语音数字语音信号y(n)的第i+1帧信号时，其对应的滤波器系数W(i+1,m)按照如下公式(6)进行计算。

W(i+1,m)＝W(i,m)+μ(i)Φ(i,m)

其中Φ(i,m)为针对近端语音数字语音信号y(n)的第i+1帧信号处理时滤波器系数更新梯度，在多延时块频域自适应滤波算法相关文献中有详细的计算方法，在这不再过多赘述。γ(＝0.993)是滤波器系数的更新步长μ的平滑系数，

是更新步长μ的步长更新因子，由式中可见具体根据p(H ₁|Y(i))控制，其中α、β是正常数，α是用来控制步长因子的收敛速度，β是用来控制滤波器更新步长的上限，两者均根据实际的应用场景来设定大小。由上述公式(6)可见，所述双端通话概率p(H ₁|Y(i))与所述步长更新因子

成非线性关系。

再参见上述公式(6)可见，所述更新步长与所述步长更新因子成线性关系，且所述滤波器系数与所述更新步长成线性关系。

如前所述，p(H ₁|Y(i))＝1时，实际对应步长更新因子

则参照上述公式(6)，而所述滤波器系数的所述更新步长减小以减缓滤波器系数的更新，或者停止滤波器系数的更新；当p(H ₁|Y(i))＝0时，步长更新因子

为非0值以根据上述公式(6)所述滤波器系数的所述更新步长增加以更新所述滤波器系数。由此可见，所述双端通话概率的变化趋势与所述步长更新因子变化趋势相反。而在实际过程中p(H ₁|Y(i))大多在0和1之间，因此，即可通过上述实时计算的步长更新因子控制更新步长，进而进行滤波器系数的更新。实际上，再进一步参照公式(6)根据所述双端通话概率确定步长更新因子，以根据所述步长更新因子确定所述滤波器系数的更新步长，进而根据更新步长以及更新梯度进行所述滤波器系数的更新。为了防止更新步长的突变，再参见上述公式(6)，引入了步长平滑量γμ(i)，即在针对近端语音数字语音信号y(n)的第i+1帧信号(又称之为当前帧)进行更新步长的确定时，同时参考近端语音数字语音信号y(n)的第i帧信号的更新步长μ(i)。推而广之，所述双端通话检测模块进一步用于根据所述双端通话概率确定所述步长更新因子，以根据所述步长更新因子以及步长平滑量，确定所述滤波器系数的更新步长，进而根据所述更新步长以及更新梯度进行所述滤波器系数的更新。

综上可见，参照上述公式(3)-(6)，p(H ₁|Y(i))与自适应滤波器输出的估计的回声数字语音信号

强相关，而自适应滤波器的滤波系数更新又受双端通话检测模块的控制，从而实现了双端检测模块和自适应滤波器的相互制约，提高了自适应滤波器的收敛速度、跟踪速度和收敛精度，从而达到很好的回声消除。另外，由于似然比Λ _k(Y(i,k))跟信号的能量之间关联，是不断变化的，由此导致p(H ₁|Y(i))也是不断变化的，从而也就避免了现有技术中在进行双端通话检测时设定固定判决门限而导致的漏检和虚警概率，从而进一步保证了双端检测的检测精度。

本申请实施例的电子设备以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)其他具有数据交互功能的电子装置。

至此，已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序，以实现期望的结果。在某些实施方式中，多任务处理和并行处理可以是有利的。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定事务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行事务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

一种回声消除装置，其特征在于，包括：

语音端点检测模块，用于检测近端数字语音信号中是否存在实际的回声数字语音信号；

双端通话检测模块，用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后检测双端通话概率以控制滤波器系数的更新；

自适应滤波器，用于根据所述滤波器系数以及远端数字语音信号生成估计的回声数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。
根据权利要求1所述的装置，其特征在于，所述语音端点检测模块进一步用于根据所述近端数字语音信号和所述远端数字语音信号的能量与预设的能量门限来比较，以检测所述近端数字语音信号中是否存在所述实际的回声数字语音信号。
根据权利要求1或2所述的装置，其特征在于，所述双端通话检测模块进一步用于在所述语音端点检测模块检测结果表明所述近端数字语音信号中不存在所述实际的回声数字语音信号时不启动，使得所述滤波器系数按历史步长进行更新；或者，所述双端通话检测模块进一步用于在所述语音端点检测模块检测结果表明所述近端数字语音信号中存在所述实际的回声数字语音信号时启动以更新所述滤波器系数。
根据权利要求1所述的装置，其特征在于，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后通过估计的所述回声数字语音信号和估计的所述近端说话者的数字语音信号的估计能量检测所述双端通话概率进而控制所述滤波器系数的更新。
根据权利要求4所述的装置，其特征在于，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后对所述估计能量进行平滑处理以根据所述平滑后的估计能量检测所述双端通话概率进而控制所述滤波器系数的更新。
根据权利要求4所述的装置，其特征在于，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后通过估计的所述回声数字语音信号和估计的所述近端说话者的数字语音信号的所述估计能量确定分别不存在所述近端说话者的数字语音信号以及存在所述近端说话者的数字语音信号时存在所述近端数字语音信号的概率之比，以检测所述双端通话概率进而控制所述滤波器系数的更新。
根据权利要求5所述的装置，其特征在于，所述双端通话检测模块进一步用于根据所述语音端点检测模块的检测结果决定是否启动，并在启动后对所述估计能量进行平滑处理以根据所述平滑后的估计能量确定分别不存在所述近端说话者的数字语音信号以及存在所述近端说话者的数字语音信号时存在所述近端数字语音信号的概率之比，以检测所述双端通话概率进而控制所述滤波器系数的更新。
根据权利要求6或7所述的装置，其特征在在于，所述分别不存在所述近端说话者的数字语音信号以及存在所述近端说话者的数字语音信号时存在所述近端数字语音信号的概率之比与所述双端通话概率成反比关系。
根据权利要求1-8任一项所述的装置，其特征在于，所述双端通话检测模块进一步用于根据所述双端通话概率确定步长更新因子，以根据所述步长更新因子确定所述滤波器系数的更新步长进而更新所述滤波器系数。
根据权利要求9所述的装置，其特征在于，所述双端通话概率与所述步长更新因子成非线性关系。
根据权利要求10所述的装置，其特征在于，所述双端通话概率的变化趋势与所述步长更新因子变化趋势相反。
根据权利要求11所述的装置，其特征在于，若所述近端数字语音信号中同时存在所述近端说话者的数字语音信号和所述实际的回声数字语音信号，所述双端通话概率的值为1，所述步长更新因子为0，则所述滤波器系数的所述更新步长减小以减缓所述滤波器系数或者停止所述滤波器系数的更新；若所述近端数字语音信号中不存在所述近端说话者的数字语音信号而只存在所述实际的回声数字语音信号，所述双端通话概率的值为0，所述步长更新因子为非0值，则所述滤波器系数的所述更新步长增加以加快所述滤波器系数的更新。
根据权利要求9所述的装置，其特征在于，所述双端通话检测模块进一步用于根据所述双端通话概率确定所述步长更新因子，以根据所述步长更新因子确定所述滤波器系数的所述更新步长，进而根据所述更新步长以及更新梯度进行所述滤波器系数的更新。
根据权利要求13所述的装置，其特征在于，所述双端通话检测模块进一步用于根据所述双端通话概率确定所述步长更新因子，以根据所述步长更新因子以及步长平滑量，确定所述滤波器系数的更新步长，进而根据所述更新步长以及所述更新梯度进行所述滤波器系数的更新。
根据权利要求9-14中任一项所述的装置，其特征在于，所述更新步长与所述步长更新因子成线性关系。
根据权利要求9-15中任一项所述的装置，其特征在于，更新后的所述滤波器系数与所述更新步长成线性关系。
根据权利要求1-16中任一项所述的装置，其特征在于，还包括：加法模块，用于从所述近端数字语音信号中减去估计的所述回声数字语音信号得到误差数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。
一种回声消除方法，其特征在于，包括：

语音端点检测模块检测近端数字语音信号中是否存在实际的回声数字语音信号；

双端通话检测模块根据所述语音端点检测模块的检测结果决定是否启动，并在启动后通过检测双端通话概率以控制滤波器系数的更新；

自适应滤波器根据所述滤波器系数以及远端数字语音信号生成估计的回声数字语音信号，以消除所述近端数字语音信号中所述实际的回声数字语音信号。
一种信号处理芯片，其特征在于，包括权利要求1-17任一项所述的装置。
一种电子设备，其特征在于，包括权利要求19所述的信号处理芯片。