CN111654585A

CN111654585A - 回声声场状态确定方法及装置、存储介质、终端

Info

Publication number: CN111654585A
Application number: CN202010223647.6A
Authority: CN
Inventors: 叶顺舟
Original assignee: Unisoc Chongqing Technology Co Ltd
Current assignee: Unisoc Chongqing Technology Co Ltd
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2020-09-11
Anticipated expiration: 2040-03-26
Also published as: WO2021190274A1; CN111654585B

Abstract

一种回声声场状态确定方法及装置、存储介质、终端，所述方法包括：获取待确定信号；确定所述待确定信号的远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)；至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定滤波器更新度Cef_update；至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态。本发明可以有效提高对回声路径变化状态判断的准确性，并且有机会采用更多参数对更多回声声场状态进行判断，更有效地实现多特征检测，提高对回声声场状态判断的完整性。

Description

回声声场状态确定方法及装置、存储介质、终端

技术领域

本发明涉及声学回声消除技术领域，尤其涉及一种回声声场状态确定方法及装置、存储介质、终端。

背景技术

在实时语音通信与基于IP的语音传输(Voice over Internet Protocol，VOIP)过程中，通信终端扬声器发出的声音，总会被该终端的麦克风拾取到，若是不处理就发送出去，对方总能听到自己说话的声音，体验不佳。在人机交互领域，由于交互终端发出的声音又被麦克风拾取回去，同时拾取了控制者的说话声，若在麦克风拾取信号中不消除交互终端发出的声音，那么交互终端在识别控制者说话声音时将引入很强的干扰，降低了识别的成功率，最终造成交互困难。采用回声消除(Acoustic Echo Canceler，AEC)对回声进行消除是公知的方法，通常的AEC系统包括针对线性回声处理的自适应滤波AF以及针对残留回声处理的非线性部分。

由于回声声场状态的多样性与多变性特点,使得AEC相应技术的鲁棒性与稳定性受到很大的挑战。例如自适应滤波的更新在双讲与无语音场景下若不加以控制,则会面临发散与失调的风险,同时当回声路径发生改变时,若不提高更新速度则会导致收敛速度过慢,造成回声的残留；同样的,在非线性或残留回声处理中,若不对单讲与双进状态加以区分,则往往会导致有效语音的损伤, 使得双讲性能下降。

回声声场状态中双讲状态(Double Talk State，DTS)的检测显得尤为重要，常规的双讲检测(Double Talk Detection，DTD)方法大致分为三类：基于能量的检测、基于相关性的检测以及基于回声路径的检测。其中基于能量的检测最为简单，极度依赖于回声信号强度、近端语音信号强度与背景噪声强度的稳定性，误判率非常高；基于相关性的检测受限于器件的特性，当扬声器非线性失真较大时，该方法的性能急剧下降；基于回声路径的检测，如估计喇叭冲激响应、可变冲击响应等，当回声路径变化时性能变差。

然而，在现有技术中，回声声场状态确定的准确性较低，进而影响回声消除效果。

发明内容

本发明解决的技术问题是提供一种回声声场状态确定方法及装置、存储介质、终端，可以有效提高对回声路径变化状态判断的准确性。

为解决上述技术问题，本发明实施例提供一种回声声场状态确定方法，包括以下步骤：获取待确定信号；确定所述待确定信号的远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)；至少根据所述远端信号X_n(k)、近端信号 D_n(k)以及滤波器系数W_n(k)，确定滤波器更新度Cef_update；至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态。

可选的，所述的回声声场状态确定方法还包括：至少根据所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为远端单讲状态。

可选的，至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数 W_n(k)，确定滤波器更新度Cef_update包括：根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定残差信号E_n(k)；根据所述残差信号E_n(k)，确定更新后的滤波器系数W_n+1(k)；根据所述滤波器系数W_n(k)以及更新后的滤波器系数 W_n+1(k)，确定所述滤波器更新度Cef_update。

可选的，满足以下一项或多项：采用下述公式，确定残差信号E_n(k)：

采用下述公式，确定更新后的滤波器系数W_n+1(k)，其中，更新步长μ_n(k)用于指示所述滤波器系数W_n(k)更新的步长：

采用下述公式，确定滤波器更新度Cef_update：

可选的，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还包括：对所述近端信号D_n(k)进行语音激活检测，以得到近端语音激活标志DVflag；如果所述近端语音激活标志 DVflag不等于1，则判断所述待确定信号的回声声场状态为空闲状态。

可选的，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还包括：对所述远端信号X_n(k)进行语音激活检测，以得到远端语音激活标志XVflag；如果所述远端语音激活标志 XVflag不等于1，则判断所述待确定信号的回声声场状态为近端单讲状态。

可选的，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还包括：确定所述待确定信号的回波抑制比Err；如果所述回波抑制比Err大于预设回波阈值Thrd_err，则判断所述待确定信号的回声声场状态为远端单讲状态。

可选的，确定所述待确定信号的回波抑制比Err包括：根据所述远端信号 X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定残差信号E_n(k)；根据所述近端信号D_n(k)与残差信号E_n(k)，确定信号的回波抑制比Err。

采用下述公式，确定信号的回波抑制比Err：

其中，k为所述待确定信号的频率索引。

可选的，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还包括：确定归一化互相关值C_YE与C_DE；如果C_DE大于第一预设互相关阈值Thrd1_coh，且C_YE小于第二预设互相关阈值 Thrd2_coh，则判断所述待确定信号的回声声场状态为双讲状态；其中，所述第一预设互相关阈值Thrd1_coh大于等于所述第二预设互相关阈值Thrd2_coh。

可选的，还包括以下一项或多项：如果滤波器更新度Cef_update大于预设更新度阈值Thrd_update，则确定所述待确定信号的回声声场状态为回声路径变化状态；如果所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，则确定所述待确定信号的回声声场状态为远端单讲状态。

可选的，采用下述公式，确定归一化互相关值C_YE与C_DE：

其中，M与L为所述待确定信号的频段索引。

可选的，所述归一化互相关值C_YE与C_DE为线性区归一化互相关值；其中， M与L为线性区的频段索引。

可选的，所述的回声声场状态确定方法还包括：根据所述待确定信号的回声声场状态，调整所述待确定信号的更新步长μ_n(k)；其中，更新步长μ_n(k)用于指示所述滤波器系数W_n(k)更新的步长。

可选的，调整更新步长μ_n(k)包括以下一项或多项：如果确定所述待确定信号的回声声场状态为回声路径变化状态，则增加更新步长μ_n(k)；如果确定所述待确定信号的回声声场状态为双讲状态，则调整μ_n(k)放慢更新；如果确定所述待确定信号的回声声场状态为空闲状态或近端单讲状态，则调整μ_n(k)＝0。

可选的，采用回声自适应滤波器调整所述待确定信号的更新步长μ_n(k)。

可选的，所述的回声声场状态确定方法还包括：根据所述待确定信号的回声声场状态，确定是否对所述待确定信号进行非线性处理。

可选的，确定是否对所述待确定信号进行非线性处理包括以下一项或多项：如果确定所述待确定信号的回声声场状态为双讲状态，则减少非线性处理程度；如果确定所述待确定信号的回声声场状态为回声路径变化状态，则增强对所述待确定信号的非线性处理；如果确定所述待确定信号的回声声场状态为近端单讲状态，则停止对所述待确定信号的非线性处理；如果确定所述待确定信号的回声声场状态为空闲状态，则停止对所述待确定信号的非线性处理。

可选的，采用后处理非线性处理单元对所述待确定信号进行非线性处理。

可选的，所述的回声声场状态确定方法还包括：根据所述待确定信号的回声声场状态，确定降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。

可选的，确定降低噪声更新速度或者提高非平稳噪声抑制能力包括以下一项或多项：如果确定所述待确定信号的回声声场状态为近端单讲状态，则降低所述待确定信号的噪声更新速度；如果确定所述待确定信号的回声声场状态为双讲状态，则降低所述待确定信号的噪声更新速度；如果确定所述待确定信号的回声声场状态为远端单讲状态，则提高所述待确定信号的非平稳噪声抑制能力；如果确定所述待确定信号的回声声场状态为回声路径变化状态，则提高所述待确定信号的非平稳噪声抑制能力。

可选的，采用后处理噪声抑制单元降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。

可选的，所述的回声声场状态确定方法还包括：确定所述待确定信号的临时声场状态；根据所述待确定信号的回声声场状态以及临时声场状态，确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出。

可选的，确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出包括以下一项或多项：如果所述待确定信号的回声声场状态为双讲状态，所述临时声场状态为远端单讲状态，则通过保持时间对所述待确定信号保持双讲状态输出；如果所述待确定信号的回声声场状态为双讲状态，所述临时声场状态为回声路径变化状态，则通过开始时间对所述待确定信号暂缓回声路径改变的输出。

为解决上述技术问题，本发明实施例提供一种回声声场状态确定装置，包括：获取模块，用于获取待确定信号；信号确定模块，用于确定所述待确定信号的远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)；更新度确定模块，用于至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定滤波器更新度Cef_update；状态确定模块，用于至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态。

为解决上述技术问题，本发明实施例提供一种存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述回声声场状态确定方法的步骤。

为解决上述技术问题，本发明实施例提供一种终端，包括存储器和处理器，所述存储器上存储有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述回声声场状态确定方法的步骤。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

在本发明实施例中，通过设置至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态，可以设置适当的参数，对所述待确定信号实际上为回声路径变化状态的情况进行准确判断，相比于现有技术中只是将回声声场状态简单的划分为单讲状态与双讲状态加以检测，容易将回声路径变化状态误判为双讲状态，采用本发明实施例的方案，可以有效提高对回声路径变化状态判断的准确性，并且在后续步骤中，有机会采用更多参数对更多回声声场状态进行判断，更有效地实现多特征检测，提高对回声声场状态判断的完整性。

进一步，至少根据所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态为远端单讲状态，相比于现有技术中容易将回声路径变化状态误判为双讲状态，采用本发明实施例的方案，可以进一步有效提高对回声路径变化状态判断的准确性。

进一步，通过判断近端语音激活标志DVflag不等于1时，所述待确定信号的回声声场状态为空闲状态，可以在近端语音激活标志DVflag不为1时，认为近端无语音，否则说明近端存在语音，需要对所述待确定信号进一步进行判断。

进一步，通过判断远端语音激活标志XVflag不等于1时，所述待确定信号的回声声场状态为近端单讲状态，可以在远端语音激活标志XVflag不为1 时，认为远端无信号，近端信号中无回声信号，当前状态为近端单讲状态，否则说明近端信号中有回声的存在，需要对所述待确定信号进一步进行判断。

进一步，通过判断回波抑制比Err大于预设回波阈值Thrd_err，说明残差信号相对幅度很小，近端信号成分中大部分确定为回声信号，已被自适应滤波器AF消除，当前状态为远端单讲状态，否则说明残差信号相对幅度仍较高且近端信号中成分不确定，需要对所述待确定信号进一步进行判断。

进一步，通过归一化互相关值对近端信号与残差信号成分做进一步确定，在滤波器收敛情况下，残差数据E_n(k)相当于已与回声信号去相关，此时若C_DE大于门限Thrd1_coh，说明近端信号中含有很多与回声不相关的成分，但若滤波器未收敛，则残差信号中还会含有大量回声成分，该结论则不成立；故采用C_YE做进一步确认，若C_YE小于门限Thrd2_coh说明残差信号中回声成分已很少，结合 C_DE大于门限Thrd1_coh的条件可确认近端信号中含有与回声不相关的成分，此时当前状态为双讲状态，否则说明信号成分无法确定，需要对所述待确定信号进一步进行判断。

进一步，在判断并排除双讲状态之后，根据滤波器收敛度Cef_update大于门限Thrd_update，判断为回声路径改变状态，根据滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，判断为远端单讲状态，可以说明滤波器处于快速更新状态，由于之前判决已排除确定性双讲状态，近端语音信号对滤波器的干扰已不会太高，此时快速更新只能是未收敛或回声路径改变造成，当前状态为回声路径改变状态，否则当前特征暂无明显区分度，视为不确定状态，在本发明实施例中，确定为远端单讲状态。

进一步，所述归一化互相关值C_YE与C_DE为线性区归一化互相关值；其中，M与L为线性区的频段索引，通过在线性区取值，可以提高判断的准确性。

进一步，可以在所述待确定信号为回声路径改变状态时，增加更新步长μ_n(k)取值，加快更新，快速收敛；在所述待确定信号为双讲状态DTS时，调整μ_n(k)放慢更新，保证滤波器的稳健性；在所述待确定信号为远端单讲状态 FSTS时，μ_n(k)取正常值，不做特殊调整；在所述待确定信号为空闲状态IDS 或近端单讲状态NSTS时，μ_n(k)取0，停止更新，防止发散，从而提高信号传输质量。

进一步，可以在所述待确定信号为双讲状态时减少非线性处理程度，使有效语音不受损伤，保证双讲性能；在所述待确定信号为回声路径改变状态 PCS时增强非线性处理程度，防止残留回声的泄漏；在所述待确定信号为近端单讲NSTS与空闲状态IDS时，停止非线性处理，避免引起近端语音与环境音的失真；在所述待确定信号为远端单讲状态FSTS时不做特殊处理，正常抑制残留回声，从而提高信号传输质量。

进一步，可以在所述待确定信号为近端单讲状态与双讲状态时，放慢噪声更新速度，保证有效语音的可懂度；在所述待确定信号为远端单讲与回声路径改变时，提高非平稳噪声抑制能力，起到对残留回声的抑制作用；在所述待确定信号为空闲状态，即背景噪声IDS状态时，不做特殊处理，正常跟踪背景噪声，从而提高信号传输质量。

附图说明

图1是现有技术中一种AEC系统的结构示意图；

图2是本发明实施例中一种回声声场状态确定方法的流程图；

图3是本发明实施例中另一种回声声场状态确定方法的流程图；

图4是本发明实施例中一种AEC系统的结构示意图；

图5是本发明实施例中一种回声声场状态确定装置的结构示意图。

具体实施方式

如前所述，在实时语音通信与基于IP的语音传输过程中，通信终端扬声器发出的声音，总会被该终端的麦克风拾取到，若是不处理就发送出去，对方总能听到自己说话的声音，体验不佳。采用回声消除对回声进行消除是公知的方法，通常的AEC系统包括针对线性回声处理的自适应滤波AF以及针对残留回声处理的非线性部分。

参照图1，图1是现有技术中一种AEC系统的结构示意图。

如图1所示，信号x(n)经过扬声器(statisticalprocess control，SPK)之后得到信号h(n)，该信号具有回声(echo)，与语音信号(voice)以及噪声信号(noise)经由麦克风(MIC)之后输出信号d(n)。

对所述信号d(n)以及信号x(n)分别进行短时傅里叶变换(short-time Fouriertransform，或short-term Fouriertransform，STFT)得到近端信号D_n(k)以及远端信号X_n(k)，自适应滤波器(Adaptive Filters，AF)可以根据远端信号X_n(k)与滤波器系数W_n(k)计算出回声估计信号Y_n(k)，并与近端信号D_n(k)相减得到残差信号E_n(k)。

在具体实施中，可以根据滤波器系数W_n(k)进行滤波器系数更新，得到 W_n+1(k)。

进而可以将残差信号E_n(k)输入后处理非线性处理单元(Non-linearprogramming，NLP)以及后处理噪声抑制单元(Noise suppression，NS)。

回声声场状态中双讲状态的检测显得尤为重要，常规的双讲检测方法大致分为三类：基于能量的检测、基于相关性的检测以及基于回声路径的检测。其中基于能量的检测最为简单，极度依赖于回声信号强度、近端语音信号强度与背景噪声强度的稳定性，误判率非常高；基于相关性的检测受限于器件的特性，当扬声器非线性失真较大时，该方法的性能急剧下降；基于回声路径的检测，如估计喇叭冲激响应、可变冲击响应等，当回声路径变化时性能变差。然而，在现有技术中，回声声场状态确定的准确性较低，进而影响回声消除效果。

本发明的发明人经过研究发现，现有的回声声场状态的确定方法都只是将回声声场状态简单的划分为单讲状态(Single Talk State，STS)与双讲状态(Double TalkState，DTS)加以检测，但在实际情况中用于表示回声路径的变化的回声路径变化状态(Path Change State，PCS)却缺乏有效的检测方法，往往被误判为DTS，使得最需要处理的回声反而被最大限度的保留了下来，导致回声声场状态确定有误，进而影响回声消除效果。

在本发明实施例中，通过设置至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态，可以设置适当的参数，对所述待确定信号实际上为回声路径变化状态的情况进行准确判断，相比于现有技术中只是将回声声场状态简单的划分为单讲状态与双讲状态加以检测，容易将回声路径变化状态误判为双讲状态，采用本发明实施例的方案，可以有效提高对回声路径变化状态判断的准确性。

为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

参照图2，图2是本发明实施例中一种回声声场状态确定方法的流程图。实施回声声场状态确定方法包括步骤S21至步骤S24：

步骤S21：获取待确定信号；

步骤S22：确定所述待确定信号的远端信号、近端信号以及滤波器系数；

步骤S23：至少根据所述远端信号、近端信号以及滤波器系数，确定滤波器更新度；

步骤S24：至少根据滤波器更新度大于预设更新度阈值，确定所述待确定信号的回声声场状态是否为回声路径变化状态。

在步骤S21的具体实施中，具有不同的回声声场状态的待确定信号可以包含不同的信号，例如可以包含通信终端扬声器发出的声音被该终端的麦克风拾取后得到的信号，还可以仅包含远端信号。在本发明实施例中，通过准确确定待确定信号的回声声场状态，可以更有效地实现对回声的消除。

在步骤S22的具体实施中，确定所述待确定信号的远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)。

具体地，可以采用常规的技术，确定所述待确定信号的远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)。例如对图1示出的信号d(n)以及信号x(n)分别进行短时傅里叶变换，以得到近端信号D_n(k)以及远端信号X_n(k)，还可以采用适当的方法，确定滤波器系数W_n(k)。

在步骤S23的具体实施中，确定滤波器更新度Cef_update。

进一步地，至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数 W_n(k)，确定滤波器更新度Cef_update的步骤可以包括：根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定残差信号E_n(k)；根据所述残差信号 E_n(k)，确定更新后的滤波器系数W_n+1(k)；根据所述滤波器系数W_n(k)以及更新后的滤波器系数W_n+1(k)，确定所述滤波器更新度Cef_update。

更进一步地，可以采用下述公式确定残差信号E_n(k)：

更进一步地，可以采用下述公式确定更新后的滤波器系数W_n+1(k)，其中，更新步长μ_n(k)用于指示所述滤波器系数W_n(k)更新的步长：

更进一步地，可以采用下述公式确定滤波器更新度Cef_update：

需要指出的是，在本发明实施例中，还可以采用其他适当的方法确定上述参数，本发明实施例对此不做限制。

在步骤S24的具体实施中，可以至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态。

进一步地，在本发明实施例的一种具体实施方式中，如果滤波器更新度 Cef_update大于预设更新度阈值Thrd_update，则可以判断为所述待确定信号的回声声场状态为回声路径变化状态。

进一步地，所述的回声声场状态确定方法还可以包括：至少根据所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为远端单讲状态。

在本发明实施例的一种具体实施方式中，如果滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，则可以判断为所述待确定信号的回声声场状态为远端单讲状态。

在本发明实施例中，至少根据所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态为远端单讲状态，相比于现有技术中容易将回声路径变化状态误判为双讲状态，采用本发明实施例的方案，可以进一步有效提高对回声路径变化状态判断的准确性。

进一步地，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还可以包括：对所述近端信号D_n(k)进行语音激活检测，以得到近端语音激活标志DVflag；如果所述近端语音激活标志DVflag不等于1，则判断所述待确定信号的回声声场状态为空闲状态。

需要指出的是，在本发明实施例中，对所述近端信号D_n(k)进行语音激活检测，并根据所述近端语音激活标志DVflag判断所述待确定信号的回声声场状态为空闲状态的步骤还可以设置在步骤S24之后执行。本发明实施例对于判断近端语音激活标志DVflag的步骤与步骤S24的先后顺序不做限制。

在本发明实施例中，通过判断近端语音激活标志DVflag不等于1时，所述待确定信号的回声声场状态为空闲状态，可以在近端语音激活标志DVflag 不为1时，认为近端无语音，否则说明近端存在语音，需要对所述待确定信号进一步进行判断。

进一步地，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还可以包括：对所述远端信号X_n(k)进行语音激活检测，以得到远端语音激活标志XVflag；如果所述远端语音激活标志XVflag不等于1，则判断所述待确定信号的回声声场状态为近端单讲状态。

需要指出的是，在本发明实施例中，对所述远端信号X_n(k)进行语音激活检测，并根据所述远端语音激活标志XVflag判断所述待确定信号的回声声场状态为近端单讲状态的步骤还可以设置在步骤S24之后执行。本发明实施例对于判断远端语音激活标志XVflag的步骤与步骤S24的先后顺序不做限制。

需要指出的是，语音激活检测技术可以采用公知技术，常见有能量检测、过零率检测、谱熵检测与基音检测等等，本发明实施例对此不做具体限制。

在本发明实施例中，通过判断远端语音激活标志XVflag不等于1时，所述待确定信号的回声声场状态为近端单讲状态，可以在远端语音激活标志 XVflag不为1时，认为远端无信号，近端信号中无回声信号，当前状态为近端单讲状态，否则说明近端信号中有回声的存在，需要对所述待确定信号进一步进行判断。

进一步地，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还可以包括：确定所述待确定信号的回波抑制比Err；如果所述回波抑制比Err大于预设回波阈值Thrd_err，则判断所述待确定信号的回声声场状态为远端单讲状态。

需要指出的是，在本发明实施例中，确定所述待确定信号的回波抑制比 Err，并判断所述待确定信号的回声声场状态为远端单讲状态的步骤还可以设置在步骤S24之后执行。本发明实施例对于判断待确定信号的回波抑制比Err 的步骤与步骤S24的先后顺序不做限制。

更进一步地，确定所述待确定信号的回波抑制比Err的步骤可以包括：根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定残差信号 E_n(k)；根据所述近端信号D_n(k)与残差信号E_n(k)，确定信号的回波抑制比Err。

更进一步地，可以采用下述公式，确定残差信号E_n(k)：

更进一步地，可以采用下述公式，确定信号的回波抑制比Err：

其中，k为所述待确定信号的频率索引。

在本发明实施例中，通过判断回波抑制比Err大于预设回波阈值Thrd_err，说明残差信号相对幅度很小，近端信号成分中大部分确定为回声信号，已被自适应滤波器AF消除，当前状态为远端单讲状态，否则说明残差信号相对幅度仍较高且近端信号中成分不确定，需要对所述待确定信号进一步进行判断。

作为一个非限制性的例子，门限值Thrd_err参考值可以为12至20dB。

进一步，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，所述的回声声场状态确定方法还可以包括：确定归一化互相关值C_YE与 C_DE；如果C_DE大于第一预设互相关阈值Thrd1_coh，且C_YE小于第二预设互相关阈值Thrd2_coh，则判断所述待确定信号的回声声场状态为双讲状态；其中，所述第一预设互相关阈值Thrd1_coh大于等于所述第二预设互相关阈值Thrd2_coh。

更进一步地，可以采用下述公式，确定归一化互相关值C_YE与C_DE：

其中，M与L为所述待确定信号的频段索引。

在本发明实施例中，通过归一化互相关值对近端信号与残差信号成分做进一步确定，在滤波器收敛情况下，残差数据E_n(k)相当于已与回声信号去相关，此时若C_DE大于门限Thrd1_coh，说明近端信号中含有很多与回声不相关的成分，但若滤波器未收敛，则残差信号中还会含有大量回声成分，该结论则不成立；故采用C_YE做进一步确认，若C_YE小于门限Thrd2_coh说明残差信号中回声成分已很少，结合C_DE大于门限Thrd1_coh的条件可确认近端信号中含有与回声不相关的成分，此时当前状态为双讲状态，否则说明信号成分无法确定，需要对所述待确定信号进一步进行判断。

更进一步地，所述归一化互相关值C_YE与C_DE为线性区归一化互相关值；其中，M与L为线性区的频段索引。

在本发明实施例中，所述归一化互相关值C_YE与C_DE为线性区归一化互相关值；其中，M与L为线性区的频段索引，通过在线性区取值，可以提高判断的准确性。

需要指出的是，通过设置M与L为线性区对应的频段索引，由于器件非线性失真具有谐波特征，常分布在中高频，故本发明给出参考频率范围，M 对应低频段在100～300Hz区间，L对应高频段在2500～3000Hz区间，该范围仅为参考值，实际使用不受此限制。

更进一步地，如果滤波器更新度Cef_update大于预设更新度阈值Thrd_update，则确定所述待确定信号的回声声场状态为回声路径变化状态；如果所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，则确定所述待确定信号的回声声场状态为远端单讲状态。

也即在本发明实施例中，可以设置判断滤波器更新度Cef_update大于预设更新度阈值Thrd_update的步骤在判断双讲状态之后。

需要指出的是，回波抑制比Err为回声信号相对消除量，避免了回声信号强度的影响；归一化互相关量C_YE与C_DE，采用了归一化处理，与远近端信号强度无关，同时采用线性区计算减少了器件失真的影响；滤波器更新度Cef_update利用AF本身一定程度的稳健性，反映了回声路径的变化强度。所以这些特征的综合使用能有效解决回声信号强度变化、远近端信号强度变化、器件失真以及回声路径变化等不确定因素对检测准确度的影响。

在本发明实施例中，在判断并排除双讲状态之后，根据滤波器收敛度 Cef_update大于门限Thrd_update，判断为回声路径改变状态，根据滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，判断为远端单讲状态，可以说明滤波器处于快速更新状态，由于之前判决已排除确定性双讲状态，近端语音信号对滤波器的干扰已不会太高，此时快速更新只能是未收敛或回声路径改变造成，当前状态为回声路径改变状态，否则当前特征暂无明显区分度，视为不确定状态，在本发明实施例中，可以确定为远端单讲状态。

需要指出的是，在滤波器更新度Cef_update小于等于所述预设更新度阈值 Thrd_update时，当前特征暂无明显区分度，可以视为不确定状态，本发明的发明人经过研究和实践，选择以远端单讲状态FSTS处理。

作为一个非限制性的例子，Thrd1_coh参考取值可以为0.3至0.5，Thrd2_coh参考取值可以为0.1至0.3。

参照图3，图3是本发明实施例中另一种回声声场状态确定方法的流程图。所述另一种回声声场状态确定方法可以包括步骤S301至步骤S311，以下对各个步骤进行说明。

在步骤S301中，判断DVflag是否等于1；当判断结果为是时，可以执行步骤S302；反之，则可以执行步骤S303。

在步骤S302中，判断XVflag是否等于1；当判断结果为是时，可以执行步骤S304；反之，则可以执行步骤S305。

在步骤S303中，判断回声声场状态为空闲状态(IDS)。

在步骤S304中，判断Err是否大于Thrd_err；当判断结果为是时，可以执行步骤S306；反之，则可以执行步骤S307。

在步骤S305中，判断回声声场状态为近端单讲状态(NSTS)。

在步骤S306中，判断回声声场状态为远端单讲状态(FSTS)。

在步骤S307中，判断C_DE是否大于Thrd1_coh，且C_YE小于Thrd2_coh；当判断结果为是时，可以执行步骤S308；反之，则可以执行步骤S309。

在步骤S308中，判断回声声场状态为双讲状态(DTS)。

在步骤S309中，判断Cef_update大于Thrd_update；当判断结果为是时，可以执行步骤S310；反之，则可以执行步骤S311。

在步骤S310中，判断回声声场状态为回声路径变化状态(PCS)。

在步骤S311中，判断回声声场状态为远端单讲状态(FSTS)。

需要指出的是，本实施例中各个步骤的序号并不代表对各个步骤的执行顺序的限定。例如，不限制步骤S301、S302、S304、S307、S309之间的步骤顺序。

在本发明实施例的一种具体实施方式中，步骤S309可以设置在S307之后，以提高对回声路径变化状态进行判断的准确性。

在本发明实施例中，选用的特征与判决方法对信号强度变化(远近端、回声信号)、器件失真与回声路径改变等不确定因素具有很强的鲁棒性，且多种特征的联合运用使得检测精度更高，性能更可靠。

进一步地，所述的回声声场状态确定方法还可以包括根据所述待确定信号的回声声场状态，调整所述待确定信号的更新步长μ_n(k)；其中，更新步长μ_n(k)用于指示所述滤波器系数W_n(k)更新的步长。

更进一步地，调整更新步长μ_n(k)包括以下一项或多项：如果确定所述待确定信号的回声声场状态为回声路径变化状态，则增加更新步长μ_n(k)；如果确定所述待确定信号的回声声场状态为双讲状态，则调整μ_n(k)放慢更新；如果确定所述待确定信号的回声声场状态为空闲状态或近端单讲状态，则调整μ_n(k)＝0。

更进一步地，可以采用回声自适应滤波器调整所述待确定信号的更新步长μ_n(k)。

在本发明实施例中，可以在所述待确定信号为回声路径改变状态时，增加更新步长μ_n(k)取值，加快更新，快速收敛；在所述待确定信号为双讲状态 DTS时，调整μ_n(k)放慢更新，保证滤波器的稳健性；在所述待确定信号为远端单讲状态FSTS时，μ_n(k)取正常值，不做特殊调整；在所述待确定信号为空闲状态IDS或近端单讲状态NSTS时，μ_n(k)取0，停止更新，防止发散，从而提高信号传输质量。

进一步地，所述的回声声场状态确定方法还可以包括：根据所述待确定信号的回声声场状态，确定是否对所述待确定信号进行非线性处理。

更进一步地，确定是否对所述待确定信号进行非线性处理的步骤可以包括以下一项或多项：如果确定所述待确定信号的回声声场状态为双讲状态，则减少非线性处理程度；如果确定所述待确定信号的回声声场状态为回声路径变化状态，则增强对所述待确定信号的非线性处理；如果确定所述待确定信号的回声声场状态为近端单讲状态，则停止对所述待确定信号的非线性处理；如果确定所述待确定信号的回声声场状态为空闲状态，则停止对所述待确定信号的非线性处理。

更进一步地，可以采用后处理非线性处理单元对所述待确定信号进行非线性处理。

在本发明实施例中，可以在所述待确定信号为双讲状态时减少非线性处理程度，使有效语音不受损伤，保证双讲性能；在所述待确定信号为回声路径改变状态PCS时增强非线性处理程度，防止残留回声的泄漏；在所述待确定信号为近端单讲NSTS与空闲状态IDS时，停止非线性处理，避免引起近端语音与环境音的失真；在所述待确定信号为远端单讲状态FSTS时不做特殊处理，正常抑制残留回声，从而提高信号传输质量。

进一步地，所述的回声声场状态确定方法还可以包括：根据所述待确定信号的回声声场状态，确定降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。

更进一步地，确定降低噪声更新速度或者提高非平稳噪声抑制能力的步骤可以包括以下一项或多项：如果确定所述待确定信号的回声声场状态为近端单讲状态，则降低所述待确定信号的噪声更新速度；如果确定所述待确定信号的回声声场状态为双讲状态，则降低所述待确定信号的噪声更新速度；如果确定所述待确定信号的回声声场状态为远端单讲状态，则提高所述待确定信号的非平稳噪声抑制能力；如果确定所述待确定信号的回声声场状态为回声路径变化状态，则提高所述待确定信号的非平稳噪声抑制能力。

更进一步地，采用后处理噪声抑制单元降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。

在本发明实施例中，可以在所述待确定信号为近端单讲状态与双讲状态时，放慢噪声更新速度，保证有效语音的可懂度；在所述待确定信号为远端单讲与回声路径改变时，提高非平稳噪声抑制能力，起到对残留回声的抑制作用；在所述待确定信号为空闲状态，即背景噪声IDS状态时，不做特殊处理，正常跟踪背景噪声，从而提高信号传输质量。

参照图4，图4是本发明实施例中一种AEC系统的结构示意图。

如图4所示，信号x(n)经过扬声器(SPK)之后得到信号h(n)，该信号具有回声(echo)，与语音信号(voice)以及噪声信号(noise)经由麦克风(MIC)之后输出信号d(n)。

对所述信号d(n)以及信号x(n)分别进行短时傅里叶变换(STFT)得到近端信号D_n(k)以及远端信号X_n(k)，自适应滤波器(AF)可以根据远端信号X_n(k)与滤波器系数W_n(k)计算出回声估计信号Y_n(k)，并与近端信号D_n(k)相减得到残差信号E_n(k)。

进而可以将远端信号X_n(k)、近端信号D_n(k)、回声估计信号Y_n(k)、残差信号E_n(k)与滤波器系数W_n(k)输入回声声场状态检测单元ESD，以进行信号特征计算，并根据计算结果做回声声场状态判决，得到具体的回声声场状态。

如前所述，在本发明实施例中，可以将回声声状态细分为五种声场状态：远端单讲状态FSTS，近端单讲状态NSTS，双讲状态DTS，回声路径改变状态PCS以及空闲状态IDS(即为背景噪声)。

进而可以设置自适应滤波器AF与后处理非线性处理单元(NLP)以及后处理噪声抑制单元(NS)通过ESD获取具体的声场状态，并做相应的处理。

进一步地，所述的回声声场状态确定方法还可以包括：确定所述待确定信号的临时声场状态；根据所述待确定信号的回声声场状态以及临时声场状态，确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出。

在本发明实施例中，若历史状态为双讲DTS，EStemp为远端单讲FSTS 则通过保持时间Thold保持DTS输出，最大程度的保护近端语音。

更进一步地，确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出包括以下一项或多项：如果所述待确定信号的回声声场状态为双讲状态，所述临时声场状态为远端单讲状态，则通过保持时间对所述待确定信号保持双讲状态输出；如果所述待确定信号的回声声场状态为双讲状态，所述临时声场状态为回声路径变化状态，则通过开始时间对所述待确定信号暂缓回声路径改变的输出。

在本发明实施例中，若历史状态为双讲DTS，EStemp为回声路径改变PCS 则通过开始时间Tstart暂缓PCS的输出，此时强制状态输出为远端单讲FSTS，起到减少滤波器发散风险与抑制回声残留的折中效果。

作为一个非限制性的例子，Thold与Tstart的取值，可以设置在20至100ms 之间。

参照图5，图5是本发明实施例中一种回声声场状态确定装置的结构示意图。所述回声声场状态确定装置可以包括：

获取模块51，用于获取待确定信号；

信号确定模块52，用于确定所述待确定信号的远端信号X_n(k)、近端信号 D_n(k)以及滤波器系数W_n(k)；

更新度确定模块53，用于至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定滤波器更新度Cef_update；

状态确定模块54，用于至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态。

关于该回声声场状态确定装置的原理、具体实现和有益效果请参照前文及图2至图4示出的关于回声声场状态确定方法的相关描述，此处不再赘述。

本发明实施例还提供了一种存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述方法的步骤。所述存储介质可以是计算机可读存储介质，例如可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器，还可以包括光盘、机械硬盘、固态硬盘等。

本发明实施例还提供了一种终端，包括存储器和处理器，所述存储器上存储有能够在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述方法的步骤。所述终端包括但不限于手机、计算机、平板电脑等终端设备。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

Claims

1.一种回声声场状态确定方法，其特征在于，包括以下步骤：

获取待确定信号；

确定所述待确定信号的远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)；

至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定滤波器更新度Cef_update；

至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态。

2.根据权利要求1所述的回声声场状态确定方法，其特征在于，还包括：

至少根据所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为远端单讲状态。

3.根据权利要求1所述的回声声场状态确定方法，其特征在于，至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定滤波器更新度Cef_update包括：

根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定残差信号E_n(k)；

根据所述残差信号E_n(k)，确定更新后的滤波器系数W_n+1(k)；

根据所述滤波器系数W_n(k)以及更新后的滤波器系数W_n+1(k)，确定所述滤波器更新度Cef_update。

4.根据权利要求3所述的回声声场状态确定方法，其特征在于，满足以下一项或多项：

采用下述公式，确定残差信号E_n(k)：

采用下述公式，确定滤波器更新度Cef_update：

5.根据权利要求1所述的回声声场状态确定方法，其特征在于，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，还包括：

对所述近端信号D_n(k)进行语音激活检测，以得到近端语音激活标志DVflag；

如果所述近端语音激活标志DVflag不等于1，则判断所述待确定信号的回声声场状态为空闲状态。

6.根据权利要求1所述的回声声场状态确定方法，其特征在于，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，还包括：

对所述远端信号X_n(k)进行语音激活检测，以得到远端语音激活标志XVflag；

如果所述远端语音激活标志XVflag不等于1，则判断所述待确定信号的回声声场状态为近端单讲状态。

7.根据权利要求1所述的回声声场状态确定方法，其特征在于，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，还包括：

确定所述待确定信号的回波抑制比Err；

如果所述回波抑制比Err大于预设回波阈值Thrd_err，则判断所述待确定信号的回声声场状态为远端单讲状态。

8.根据权利要求7所述的回声声场状态确定方法，其特征在于，确定所述待确定信号的回波抑制比Err包括：

根据所述近端信号D_n(k)与残差信号E_n(k)，确定信号的回波抑制比Err。

9.根据权利要求8所述的回声声场状态确定方法，其特征在于，满足以下一项或多项：

采用下述公式，确定残差信号E_n(k)：

采用下述公式，确定信号的回波抑制比Err：

其中，k为所述待确定信号的频率索引。

10.根据权利要求1所述的回声声场状态确定方法，其特征在于，在确定所述待确定信号的回声声场状态是否为回声路径变化状态之前，还包括：

确定归一化互相关值C_YE与C_DE；

如果C_DE大于第一预设互相关阈值Thrd1_coh，且C_YE小于第二预设互相关阈值Thrd2_coh，则判断所述待确定信号的回声声场状态为双讲状态；

其中，所述第一预设互相关阈值Thrd1_coh大于等于所述第二预设互相关阈值Thrd2_coh。

11.根据权利要求10所述的回声声场状态确定方法，其特征在于，还包括以下一项或多项：

如果滤波器更新度Cef_update大于预设更新度阈值Thrd_update，则确定所述待确定信号的回声声场状态为回声路径变化状态；

如果所述滤波器更新度Cef_update小于等于所述预设更新度阈值Thrd_update，则确定所述待确定信号的回声声场状态为远端单讲状态。

12.根据权利要求10所述的回声声场状态确定方法，其特征在于，采用下述公式，确定归一化互相关值C_YE与C_DE：

其中，M与L为所述待确定信号的频段索引。

13.根据权利要求12所述的回声声场状态确定方法，其特征在于，

所述归一化互相关值C_YE与C_DE为线性区归一化互相关值；

其中，M与L为线性区的频段索引。

14.根据权利要求1所述的回声声场状态确定方法，其特征在于，还包括：

根据所述待确定信号的回声声场状态，调整所述待确定信号的更新步长μ_n(k)；

其中，更新步长μ_n(k)用于指示所述滤波器系数W_n(k)更新的步长。

15.根据权利要求14所述的回声声场状态确定方法，其特征在于，调整更新步长μ_n(k)包括以下一项或多项：

如果确定所述待确定信号的回声声场状态为回声路径变化状态，则增加更新步长μ_n(k)；

如果确定所述待确定信号的回声声场状态为双讲状态，则调整μ_n(k)放慢更新；

如果确定所述待确定信号的回声声场状态为空闲状态或近端单讲状态，则调整μ_n(k)＝0。

16.根据权利要求14所述的回声声场状态确定方法，其特征在于，采用回声自适应滤波器调整所述待确定信号的更新步长μ_n(k)。

17.根据权利要求1所述的回声声场状态确定方法，其特征在于，还包括：

根据所述待确定信号的回声声场状态，确定是否对所述待确定信号进行非线性处理。

18.根据权利要求17所述的回声声场状态确定方法，其特征在于，确定是否对所述待确定信号进行非线性处理包括以下一项或多项：

如果确定所述待确定信号的回声声场状态为双讲状态，则减少非线性处理程度；

如果确定所述待确定信号的回声声场状态为回声路径变化状态，则增强对所述待确定信号的非线性处理；

如果确定所述待确定信号的回声声场状态为近端单讲状态，则停止对所述待确定信号的非线性处理；

如果确定所述待确定信号的回声声场状态为空闲状态，则停止对所述待确定信号的非线性处理。

19.根据权利要求17所述的回声声场状态确定方法，其特征在于，采用后处理非线性处理单元对所述待确定信号进行非线性处理。

20.根据权利要求1所述的回声声场状态确定方法，其特征在于，还包括：

根据所述待确定信号的回声声场状态，确定降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。

21.根据权利要求20所述的回声声场状态确定方法，其特征在于，确定降低噪声更新速度或者提高非平稳噪声抑制能力包括以下一项或多项：

如果确定所述待确定信号的回声声场状态为近端单讲状态，则降低所述待确定信号的噪声更新速度；

如果确定所述待确定信号的回声声场状态为双讲状态，则降低所述待确定信号的噪声更新速度；

如果确定所述待确定信号的回声声场状态为远端单讲状态，则提高所述待确定信号的非平稳噪声抑制能力；

如果确定所述待确定信号的回声声场状态为回声路径变化状态，则提高所述待确定信号的非平稳噪声抑制能力。

22.根据权利要求20所述的回声声场状态确定方法，其特征在于，采用后处理噪声抑制单元降低所述待确定信号的噪声更新速度或者提高所述待确定信号的非平稳噪声抑制能力。

23.根据权利要求1所述的回声声场状态确定方法，其特征在于，还包括：

确定所述待确定信号的临时声场状态；

根据所述待确定信号的回声声场状态以及临时声场状态，确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出。

24.根据权利要求23所述的回声声场状态确定方法，其特征在于，确定对所述待确定信号保持双讲状态输出或者对所述待确定信号暂缓回声路径改变的输出包括以下一项或多项：

如果所述待确定信号的回声声场状态为双讲状态，所述临时声场状态为远端单讲状态，则通过保持时间对所述待确定信号保持双讲状态输出；

如果所述待确定信号的回声声场状态为双讲状态，所述临时声场状态为回声路径变化状态，则通过开始时间对所述待确定信号暂缓回声路径改变的输出。

25.一种回声声场状态确定装置，其特征在于，包括：

获取模块，用于获取待确定信号；

信号确定模块，用于确定所述待确定信号的远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)；

更新度确定模块，用于至少根据所述远端信号X_n(k)、近端信号D_n(k)以及滤波器系数W_n(k)，确定滤波器更新度Cef_update；

状态确定模块，用于至少根据滤波器更新度Cef_update大于预设更新度阈值Thrd_update，确定所述待确定信号的回声声场状态是否为回声路径变化状态。

26.一种存储介质，其上存储有计算机指令，其特征在于，所述计算机指令运行时执行权利要求1至24任一项所述回声声场状态确定方法的步骤。

27.一种终端，包括存储器和处理器，所述存储器上存储有能够在所述处理器上运行的计算机指令，其特征在于，所述处理器运行所述计算机指令时执行权利要求1至24任一项所述回声声场状态确定方法的步骤。