WO2019080552A1

WO2019080552A1 - 基于时延估计的回声消除方法及装置

Info

Publication number: WO2019080552A1
Application number: PCT/CN2018/095759
Authority: WO
Inventors: 李明子; 马峰; 王海坤; 王智国; 胡国平
Original assignee: 科大讯飞股份有限公司
Priority date: 2017-10-23
Filing date: 2018-07-16
Publication date: 2019-05-02
Also published as: HUE065351T2; EP3703052A4; EP3703052C0; US11323807B2; JP7018130B2; CN107610713B; ES2965954T3; EP3703052B1; CN107610713A; KR102340999B1; KR20200070346A; EP3703052A1; US20210051404A1; JP2021500778A

Abstract

一种基于时延估计的回声消除方法及装置，方法包括：获取麦克信号和参考信号，并进行预处理（101）；确定在当前回声消除场景下预处理后的麦克信号和参考信号中存在非线性情况的频点信号（102）；根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值（103）；基于当前时延估计值对参考信号进行移动（104）；根据预处理后的麦克信号和移动后的参考信号，更新自适应滤波器，实现回声消除（105）。可以提高时延估计的准确性，提高回声消除效果。

Description

基于时延估计的回声消除方法及装置

本申请要求于2017年10月23日提交中国专利局、申请号为201710994195.X、申请名称为“基于时延估计的回声消除方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信号处理领域，具体涉及一种基于时延估计的回声消除方法及装置。

背景技术

随着信息技术的不断发展，各种各样的分布式智能硬件在各个领域的应用日益广泛。回声消除作为智能设备交互中不可或缺的环节，一直是相关领域技术人员研究的热点。

回声消除是通过消除或者移除本地话筒中拾取到的远端的音频信号来阻止远端的声音返回去的一种处理方法，现有典型的回声消除方案是基于时延估计的方法，计算参考信号和麦克信号的线性相关关系，并选取最大互相关对应的时延作为装置时延，将参考信号基于该装置时延进行移动，再根据移动后的参考信号和麦克信号更新自适应滤波器，产生一个与真实回声接近的信号，将该信号从麦克信号中减去，从而达到回声消除的目的。比如只有单端操作权限的分布式智能硬件装置，无法做到参考信号与麦克信号同步重新采样，如日常家庭中，用电视盒子控制电视机，由于电视盒子和电视机多为不同厂商所提供，假设作为电视盒子厂商，在电视盒子语音操控中需要对电视机播放的声音进行回声消除，而此时只拥有电视盒子的操作权限，即只能获取电视盒子传给电视的源信号和电视盒子麦克风收集信号，其中，电视盒子传给电视的源信号作为参考信号，电视盒子麦克风收集信号作为麦克信号，无法真正做到对扬声器信号与麦克信号同步的重采样，此时就需要估计参考信号与麦克信号的时延，进而根据该时延实现回声消除。

可见，时延估计的准确与否直接影响到回声消除的效果，由于实际应用场景中环境复杂多变，现有的基于时延估计的回声消除技术得到的时延估计误差较大，回声消除效果仍有待提高。

发明内容

本申请实施例提供一种基于时延估计的回声消除方法及装置，以降低时延估计误差，提高回声消除效果。

为此，本申请提供如下技术方案：

一种基于时延估计的回声消除方法，所述方法包括：

分别接收麦克信号和参考信号，并对其进行预处理；

确定在当前回声消除场景下预处理后的麦克信号和参考信号中存在非线性情况的频点信号；

根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值；

基于所述当前时延估计值对所述参考信号进行移动；

根据预处理后的麦克信号和移动后的参考信号，更新自适应滤波器，实现回声消除。

优选地，所述确定在当前回声消除场景下预处理后的麦克信号和参考信号中存在非线性情况的频点信号包括以下任意一种或多种检测：

远端信号检测：根据预处理后的参考信号的能量、过零率、短时幅值中的任一种或多种参数确定存在非线性情况的频点信号；

双端信号检测：根据预处理后的麦克信号与参考信号的能量比确定存在非线性情况的频点信号；

设备硬件导致的非线性检测：首先计算一较低频率范围内的参考信号和麦克信号的相关性均值；然后采用一定频率间隔，计算得到其他频率范围内参考信号和麦克信号相关性均值；最后依据其他频率范围内的相关性均值和低频范围内的相关性均值，确定存在非线性情况的频点信号。

优选地，所述根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值包括：

依次针对参考信号和时延分析范围内的各帧麦克信号，选取其中没有非线性情况的频点信号，计算参考信号与各帧麦克信号的互相关；

根据计算得到的参考信号与各帧麦克信号的互相关确定时延估计值。

优选地，所述根据计算得到的各帧参考信号与麦克信号的互相关确定时延估计值包括：

选取计算得到的参考信号与各帧麦克信号的互相关中互相关最大的帧对应的位置作为当前时延位置，根据所述当前时延位置及所述参考信号的位置确定当前时延估计值。

优选地，所述根据计算得到的各帧参考信号与麦克信号的互相关确定当前时延估计值包括：

将每次时延估计时计算得到的参考信号与时延分析范围内各帧麦克信号的互相关中互相关最大的帧对应的位置作为候选时延位置，将所述候选时延位置统计在一个L维的数组Sa中，其中L＝时延分析范围内麦克信号的总帧数，并统计所述候选时延位置连续出现的次数；

如果本次候选时延位置发生变化，则将本次候选时延位置增加第一设定值t1，将上次候选时延位置减小第二设定值t2，其余位置减小第三设定值t3；

如果本次候选时延位置未发生变化，则将本次候选时延位置增加第一设定值t1，其余位置减小第三设定值t3，所述第二设定值t2小于等于第三设定值t3；

如果本次候选时延位置大于第一阈值，且该候选时延位置连续出现的次数大于第二阈值时，根据本次候选时延位置及所述参考信号的位置确定当前时延估计值。

优选地，所述基于所述当前时延估计值对所述参考信号进行移动包括：

在当前时延估计值D ₁(t)<＝第三阈值T3时，所述参考信号的数据不做移动；

在第三阈值T3<当前时延估计值D ₁(t)<第四阈值T4时，将所述参考信号的数据移动D ₁(t)/2；

在第四阈值T4<＝当前时延估计值D ₁(t)时，将所述参考信号的数据移动D ₁(t)。

优选地，所述根据计算得到的参考信号与各帧麦克信号的互相关确定时延估计值需满足以下任一种或多种条件：

(1)当前时延位置对应的互相关C(t)大于上一次时延位置对应的互相关C(t-1)；

(2)当前时延分析范围内每帧中的最大互相关C _max(t)和最小互相关C _min(t)对应的位置的差值大于设定的第一设定差值；

(3)参考信号与时延分析范围内各帧麦克信号的互相关均值C _mean(t)与当前时延位置对应的互相关C(t)的差值大于第二设定差值；

(4)当前时延位置p(t)小于上一次时延位置p(t-1)。

优选地，所述方法还包括：

对历史参考信号的数据进行缓存；

在对所述参考信号进行移动时，对缓存的历史参考信号的数据进行配合移动。

优选地，所述方法还包括：

如果当前时延估计值小于滤波器长度，则更新自适应滤波器系数时，将滤波器系数按照时延估计值移动，基于移动后的系数进行更新，对于移动后没有系数的位置对应的系数进行重置，并基于重置后的系数进行更新。

一种基于时延估计的回声消除装置，所述装置包括：

信号处理模块，用于接收麦克信号和参考信号，并进行预处理，输出预处理后的麦克信号和参考信号；

频点检测模块，用于确定在当前回声消除场景下所述信号处理模块输出的预处理后的麦克信号和参考信号中存在非线性情况的频点信号；

时延估计模块，用于根据所述频点检测模块确定的麦克信号和参考信号中没有非线性情况的频点信号，计算并输出当前时延估计值；

信号移动模块，用于基于所述时延估计模块输出的当前时延估计值对所述参考信号进行移动，并输出移动后的参考信号；

自适应滤波器，用于根据所述信号处理模块输出的预处理后的麦克信号和所述信号移动模块输出的移动后的参考信号，更新自适应滤波器，实现回声消除。

优选地，所述频点检测模块包括以下任意一个或多个检测单元：

远端信号检测单元，用于根据预处理后的参考信号的能量、过零率、短时幅值中的任一种或多种参数确定存在非线性情况的频点信号；

双端信号检测单元，用于根据预处理后的麦克信号与参考信号的能量比确定存在非线性情况的频点信号；

设备硬件检测单元，用于首先计算一较低频率范围内的参考信号和麦克信号的相关性均值；然后采用一定频率间隔，计算得到其他频率范围内参考信号和麦克信号相关性均值；最后依据其他频率范围内的相关性均值和低频范围内的相关性均值，确定存在非线性情况的频点信号。

优选地，所述时延估计模块包括：

互相关计算单元，用于依次针对参考信号和时延分析范围内的各帧麦克信号，选取其中没有非线性情况的频点信号，计算参考信号与各帧麦克信号的互相关；

时延估计值确定单元，用于根据计算得到的参考信号与各帧麦克信号的互相关确定时延估计值。

优选地，所述时延估计值确定单元，具体用于选取所述互相关计算单元计算得到的参考信号与各帧麦克信号的互相关中互相关最大的帧对应的位置作为当前时延位置，根据所述当前时延位置及所述参考信号的位置确定当前时延估计值。

优选地，所述时延估计值确定单元，具体用于将每次时延估计时计算得到的参考信号与时延分析范围内各帧麦克信号的互相关中互相关最大的帧对应的位置作为候选时延位置，将所述候选时延位置统计在一个L维的数组Sa中，其中L＝时延分析范围内麦克信号的总帧数，并统计所述候选时延位置连续出现的次数；如果本次候选时延位置发生变化，则将本次候选时延位置增加第一设定值t1，将上次候选时延位置减小第二设定值t2，其余位置减小第三设定值t3；如果本次候选时延位置未发生变化，则将本次候选时延位置增加第一设定值t1，其余位置减小第三设定值t3，所述第二设定值t2小于等于第三设定值t3；如果本次候选时延位置大于第一阈值，且该候选时延位置连续出现的次数大于第二阈值时，根据本次候选时延位置及所述参考信号的位置确定当前时延估计值。

优选地，所述信号移动模块，具体用于在当前时延估计值D ₁(t)<＝第三阈值T3时，所述参考信号的数据不做移动；在第三阈值T3<当前时延估计值D ₁(t)<第四阈值T4时，将所述参考信号的数据移动D ₁(t)/2；在第四阈值T4<＝当前时延估计值D ₁(t)时，将所述参考信号的数据移动D ₁(t)。

优选地，所述时延估计值确定单元在确定时延估计值时还需确定满足以下任一种或多种条件：

(4)当前时延位置p(t)小于上一次时延位置p(t-1)。

优选地，所述装置还包括：

缓存模块，用于对历史参考信号的数据进行缓存；

所述信号移动模块，还用于在对所述参考信号进行移动时，对所述缓存模块中缓存的历史参考信号的数据进行配合移动。

优选地，所述自适应滤波器在进行系数更新时，如果当前时延估计值小于滤波器长度，将滤波器系数按照时延估计值移动，基于移动后的系数进行更新，对于移动后没有系数的位置对应的系数进行重置，并基于重置后的系数进行更新。

一种基于时延估计的回声消除装置，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述基于时延估计的回声消除方法中任一项所述的方法。

一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述基于时延估计的回声消除方法中任一项所述的方法。

一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述基于时延估计的回声消除方法中任一项所述的方法。

本申请实施例提供的回声消除方法及装置，通过对麦克信号和参考信号中存在非线性情况的频点进行检测，根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值，也就是说，在去除非线性情况下估计参考信号和麦克信号间的时延，从而使得时延估计值更加准确，然后基于当前时延估计值移动参考信号，基于麦克信号和移动后的参考信号更新自适应滤波器，实现回声消除，有效地提升了回声消除效果。

进一步地，在时延估计时，基于多种鲁棒条件对时延估计值进行修正，从而使估计到的时延更加鲁棒。

进一步地，在自适应滤波器更新过程中，通过对历史参考信号的数据的缓存及配合移动、以及将没有参考意义的滤波器系数进行重置，均可以减少因时延发生变化导致的滤波器重新收敛时间，进而减小重新收敛对回声消除性能的影响。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是本申请实施例基于时延估计的回声消除方法的流程图；

图2是本申请实施例中历史参考信号数据配合移动与现有技术中只对当前参考信号移动的对比示意图；

图3是本申请实施例中滤波器进行更新时将错误的滤波器系数进行重置的情况与现有技术的对比示意图；

图4是本申请实施例基于时延估计的回声消除装置的原理框图；

图5是本申请实施例基于时延估计的回声消除装置的另一框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请实施例的方案，下面结合附图和实施方式对本申请实施例作进一步的详细说明。

考虑到在实际应用中，回声消除过程中常会出现非线性的情况，如音量大、电池电量不足、无远端信号即参考信号、双端讲话即既有人声又有扬声器声音等情况，这些情况会导致音频信号的非线性，在进行延时估计时会使得互相关计算错误，最终导致回声消除效果差。为此，本申请实施例提供一种基于时延估计的回声消除方法及装置，在确定时延时，将存在非线性情况的频点去除，根据麦克信号和参考信号中没有非线性情况的频点信号确定时延估计值，从而使得到的时延估计值更准确，进而基于该时延估计值实现回声消除，有效地提高了回声消除效果。

如图1所示，是本申请实施例基于时延估计的回声消除方法的一种流程图，包括以下步骤：

步骤101，分别接收麦克信号和参考信号，并对其进行预处理。

所述麦克信号为用于收集语音信号的麦克风采集的、并且经过A/D转换后的数字信号；所述参考信号为需要进行回声消除掉的源信号，同样为数字信号。以在电视盒子上进行回声消除为例，作为电视盒子厂家，参考信号为电视盒子传给电视机的源信号，当然也可以是传统上较为常见的电视机扬声器信号，对此，本申请实施例不做限定。

所述预处理主要包括分帧、加窗、快速傅里叶变换等处理，将时域的参考信号和麦克信号变换为相应的频域信号。

步骤102，确定在当前回声消除场景下预处理后的麦克信号和参考信号中存在非线性情况的频点信号。

考虑到实际应用环境及设备硬件的多样性，在确定是否存在非线性情况的频点信号时，也可以有多种不同的检测方法，比如：

(1)远端信号检测：根据预处理后的参考信号的能量、过零率、短时幅值中的任一种或多种参数确定存在非线性情况的频点信号。比如，如果参考信号x在某频点的能量P _x大于设定的能量阈值，则确定在该频点存在非线性情况的频点信号。

(2)双端信号检测：根据预处理后的麦克信号与参考信号的能量比确定存在非线性情况的频点信号。

具体的，计算参考信号x在某频点的平滑能量

和麦克信号在该频点的平滑能量

根据能量比

来判断，若能量比大于设定的能量比阈值，则确定在该频点存在非线性情况的频点信号。所述平滑能量

和

的计算公式如下：

其中，x(n)、y(n)分别表示频率n时的参考信号和麦克信号，α为平滑系数，其值可通过大量实验结果和/或经验确定。

当然，也可以直接计算参考信号x在某频点的能量和麦克信号在该频点的能量，根据两者的能量比来判断，若能量比大于设定的能量比阈值，则确定在该频点存在非线性情况的频点信号。

(3)设备硬件导致的非线性检测

由于在实际应用中，为了尽可能降低硬件设备成本，常会使用较为便宜的硬件，此时可能会导致某些工作状态发生非线性现象，如喇叭音量过大、电池电量不足等。对于这些非线性现象的检测，可以采用以下方法：

首先，计算一较低频率范围N(如300HZ-800HZ，具体可根据经验和/或大量实验结果确定)内的参考信号和麦克信号的互相关均值。

在频率n时，参考信号和麦克信号的互相关计算公式如式1.3：

其中，

β为平滑系数，可通过大量实验和/或经验确定。

那么在低频范围N内，参考信号和麦克信号的互相关均值为：

然后，采用一定频率间隔d(1≤d<20)，计算其他频率范围内参考信号和麦克信号的互相关均值，具体计算方法与上述低频范围内的互相关均值计算相同。

最后，依据其他频率间隔互相关均值和低频范围内的互相关均值，确定存在非线性情况的频点信号。比如，判断其他频率范围内的相关性均值是否明显小于低频范围内的相关性均值(如两者比值<0.1)，若是，则说明该频率范围内的信号具有非线性。

需要说明的是，在实际应用中，可以单独采用上述任意一种检测方式，当然，也可以同时利用上述检测方式中的任意两种或三种进行综合判断，而且，在利用多种检测方式进行综合判断时，可以采用对其中各检测方法得到的值进行加权分析，或者依据多种检测方法均检测到相应频点存在非线性情况时，才确定该频点信号存在非线性情况等方式，对此本申请实施例不做限定。

步骤103，根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值。

首先，确定时延分析范围内包含的各帧麦克信号。比如，以16KHZ采样率，最大时延1s为例，时延分析范围为30帧，即每次时延分析需要分别计算参考信号与这30帧中各帧麦克信号的互相关。

然后，依次针对参考信号和各帧麦克信号，选取其中没有非线性情况的频点信号，计算参考信号与各帧麦克信号的互相关。

具体地，针对当前帧，选取其中没有非线性现象的频点信号，以512个频点(FFT长度区间为1024)为例，计算每个频点的两信号的互相关，具体可参见前面公式1.3。

得到各频点的互相关后，计算当前帧中各频点的互相关的均值，将该均值作为当前帧参考信号与当前帧麦克信号的互相关。

需要说明的是，为了使基于互相关的时延估计更准确，在计算互相关时可选取音频常见频率范围(以16KHZ采样为例，声音常见频率为1500Hz～4625Hz)内的频点，计算参考信号与麦克信号的互相关。进一步地，为了减少计算量，提高效率，可选取常见频率中的M(比如M＝100)个频点计算参考信号与麦克信号的互相关。

最后，根据计算得到的参考信号与各帧麦克信号的互相关确定时延估计值。

在实际应用中，可以有多种方式确定时延估计值，下面将分别加以说明。

例1：选取计算得到的参考信号与各帧麦克信号的互相关中互相关最大的帧对应的位置作为当前时延位置，根据所述当前时延位置及所述参考信号的位置确定当前时延估计值。

比如，以当前参考信号帧为基准，假设参考信号为第50帧，时延分析范围内有30帧麦克信号，分别为第20-50帧麦克信号，分别将这30帧麦克信号与第50帧参考信号进行比较，如果当前的第50帧参考信号与第25帧麦克信号的互相关最大，则当前时延估计值是50-25＝25。当然，如果参考信号的帧数(如18)小于30，则需要比较的麦克信号就为当前帧之前的所有帧，即将第18帧参考分别与1-18帧麦克信号进行比较。

例2：为了使当前估计时延值更具鲁棒性，还可以满足以下鲁棒条件的一种或多种，也就是说，在计算得到互相关最大的帧后，还需要判断是否满足以下任意一种或多种条件，如果满足，则根据所述当前时延位置及所述参考信号的位置确定当前时延估计值；否则，继续进行下一次时延估计。

所述鲁棒条件如下：

(2)当前时延分析范围内每帧中的最大互相关C _max(t)和最小互相关C _min(t)对应的位置的差值大于设定的第一设定差值，比如第一设定差值为3；

(4)当前时延位置p(t)小于上一次时延位置p(t-1)。

例3：在基于时延进行参考信号移动、滤波器更新时，随着滤波器的收敛，对于时延估计的准确性要求更为严格，为了得到更为准确的时延，在该实施例中，还可先将互相关最大的帧对应的位置作为候选时延位置，基于历史数据，根据候选时延位置的变化情况对候选时延位置进行惩罚和/或奖励，使最终得到的时延估计值更准确。

时延估计值的具体确定过程如下：

首先，将每次时延估计时计算得到的参考信号与时延分析范围内各帧麦克信号的互相关中互相关最大的帧对应的位置作为候选时延位置，将所述候选时延位置统计在一个L维的数组Sa中，其中L＝时延分析范围内麦克信号的总帧数，并统计所述候选时延位置连续出现的次数count，一旦出现不连续，则count置0；

如果本次候选时延位置未发生变化，则说明本次候选时延位置的可信度在增加，那么相应的之前估计出的候选时延位置以及其他位置的可信度就较低，因此将本次候选时延位置增加第一设定值t1，其余位置减小第三设定值t3。上次候选位置较其他位置更为可信，故对其统计量减小的较弱。所述t1、t2、t3的取值，可由经验或大量实验确定，一般t3＞＝t2，比如，t1、t2、t3分别为2、1、2；

如果本次候选时延位置大于第一阈值T1(如T1为10)，且该候选时延位置连续出现的次数大于第二阈值T2(如T2为4)时，说明当前候选时延位置的估计较为准确，作为较为准确的时延D ₁(t)。

例4：为了使当前估计时延值更具鲁棒性，在采用上述例3的方式确定时延估计值时，同样还可以判断是否满足上述鲁棒条件的一种或多种，如果满足，则根据所述当前时延位置及所述参考信号的位置确定当前时延估计值；否则，继续进行下一次时延估计。

步骤104，基于所述当前时延估计值对所述参考信号进行移动。

针对上述例1、例2、例3、例4采用不同方式确定的当前时延估计值，在实际应用中，均可将所述参考信号的数据移动相应的时延估计值。

另外，针对上述例3或例4的方式确定当前时延估计值D ₁(t)的情况，考虑到候选时延位置在不同区间内的估计的准确程度不同，因此，还可以按以下方式对所述参考信号进行移动：

在当前时延估计值D ₁(t)<＝第三阈值T3(比如为10)时，所述参考信号的数据不做移动；

在第三阈值T3<当前时延估计值D ₁(t)<第四阈值T4(比如为20)时，将所述参考信号的数据移动D ₁(t)/2；

另外，针对现有的基于时延对参考信号进行移动时存在的历史参考信号内容丢失的问题，在本申请方法另一实施例中，在根据当前时延估计值对参考信号进行移动时，还可进一步将历史参考信号数据配合移动。具体地，对历史参考信号的数据进行缓存；在对所述参考信号进行移动时，对缓存的历史参考信号数据进行配合移动。

如图2所示，示出了本申请实施例中对缓存的历史参考信号的数据进行配合移动与现有技术的对比示意图。

由图2中可以看出，在现有技术中，假设时延估计为3，则对参考信号进行移动时，直接使用n-3时刻的参考信号数据来代替n时刻的参考信号数据，而历史参考信号数据，如图中的n-1至n-4时刻的参考信号数据保持不变，从而会造成信号不连续。而利用本申请实施例，对参考信号进行移动时，不仅使用n-3时刻的参考信号数据来代替n时刻的参考信号数据，而且历史参考信号数据也同时一起配合移动，如图2中所示，从而避免了信号不连续即历史参考信号内容丢失对回声消除效果的影响。

步骤105，根据预处理后的麦克信号和移动后的参考信号，更新自适应滤波器，实现回声消除。

具体地，基于麦克信号y(t,n)和移动后的参考信号x’(t,n)，回声消除后的输出信号为：

e(t,n)＝y(t,n)-h(t,n)*x’(t,n) (1.5)

其中，h(t,n)为滤波器系数。

滤波器系数h(t,n)的更新如下：

h(t,n)＝h(t-1,n)+γ*e(t,n)*x’(t,n)/(x’(t,n) ²+θ) (1.6)

其中，γ为滤波器更新步长，由大量实验和/或经验确定；θ为规整因子，一般也由大量实验和/或经验确定。

由于在时延发生变化时，滤波器系数需要重新更新，为了加快滤波器系数更新速度，减小因滤波器系数更新导致的回声消除性能下降的影响，在本申请方法另一实施例中，如果当前时延估计值小于滤波器长度，则更新自适应滤波器系数时，将滤波器系数按照时延估计值移动，基于移动后的系数进行更新，对于移动后没有系数的位置对应的系数进行重置，比如重置为0，并基于重置后的系数进行更新，以缩短滤波器系数更新时间。

如图3所示，是本申请实施例中，滤波器进行更新时将错误的滤波器系数重置为0，与现有技术的对比示意图。

假设时延估计值为3，其中左侧为现有技术中滤波器系数的更新示意图，可以看出，在现有技术中，滤波器系数进行更新时，所有系数都将基于当前值进行更新。右侧为本申请实施例中滤波器系数的更新示意图，可以看出，将第n个和第n-1个滤波器系数进行了更新，将其它滤波器系数在重置为0的基础上进行更新。

本申请实施例提供的回声消除方法，通过对麦克信号和参考信号中存在非线性情况的频点进行检测，根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值，也就是说，在去除非线性情况下估计参考信号和麦克信号间的时延，从而使得时延估计值更加准确，然后基于当前时延估计值移动参考信号，基于麦克信号和移动后的参考信号更新自适应滤波器，实现回声消除，有效地提升了回声消除效果。

进一步地，在自适应滤波器更新过程中，通过对历史参考信号的数据的缓存及配合移动、以及将没有参考意义的滤波器系数进行重置，减少了因时延发生变化导致的滤波器重新收敛时间，减小了重新收敛对回声消除性能的影响。

相应地，本申请实施例还提供一种基于时延估计的回声消除装置，如图4所示，是该装置的原理意图。

图4中以在电视盒子上进行回声消除为例，其中，参考信号为电视盒子传给电视机的源信号，当然也可以是传统上较为常见的电视机扬声器信号，电视盒子麦克风收集信号作为麦克信号，用户A通过语音操控电视盒子。

图4中的输入信号包含了扬声器的回声信号，输入信号经过A/D转换，转换后的数字信号经过本申请实施例基于时延估计的回声消除装置400，由回声消除装置400对输入信号中的回声信号进行消除，得到输出信号，即用户A的语音信号，电视盒子解析该输出信号，即可得到用户A的操控指令。

在该实施例中，基于时延估计的回声消除装置400包括以下各模块：

信号处理模块401、401′，用于分别接收麦克信号和参考信号，并对其进行预处理，输出预处理后的麦克信号和参考信号；所述预处理主要包括分帧、加窗、快速傅里叶变换等处理，将时域的参考信号和麦克信号变换为相应的频域信号。

频点检测模块402、402′，用于确定在当前回声消除场景下所述信号处理模块输出的预处理后的麦克信号和参考信号中存在非线性情况的频点信号；

时延估计模块403，用于根据所述频点检测模块确定的麦克信号和参考信号中没有非线性情况的频点信号，计算并输出当前时延估计值；

信号移动模块404，用于基于所述时延估计值计算模块输出的当前时延估计值对所述参考信号进行移动，并输出移动后的参考信号；

自适应滤波器405，用于根据所述信号处理模块输出的预处理后的麦克信号和所述信号移动模块404输出的移动后的参考信号，更新自适应滤波器，实现回声消除。

需要说明的是，在图4中，信号处理模块401和信号处理模块401′、以及频点检测模块402和频点检测模块402′仅仅是为了方便理解本申请装置的实现原理，在实际应用中，信号处理模块401和信号处理模块401′可以为同一物理实体，同样，频点检测模块402和频点检测模块402′可以为同一物理实体。当然，信号处理模块和频点检测模块也可以为同一物理实体。对此本申请实施例不做限定。

图4仅仅是本申请装置的一个应用举例，需要说明的是，本申请实施例的装置可以应用于多种场景，比如，电视盒子控制电视机的场景，将本申请装置集成在电视盒子上，可以有效消除对电视盒子的操控语音中的电视机播放的声音，其它应用在此不再举例说明。

考虑到实际应用环境及设备硬件的多样性，在确定是否存在非线性情况的频点信号时，也可以有多种不同的检测方法。相应地，在上述频点检测模块中可以设置以下任意一个或多个检测单元，以针对不同的情况下的非线性频点进行检测：

远端信号检测单元，用于根据预处理后的参考信号的能量、过零率、短时幅值中的任一种或多种参数确定存在非线性情况的频点信号；比如，如果参考信号x在某频点的能量P _x大于设定的能量阈值，则确定在该频点存在非线性情况的频点信号。

双端信号检测单元，用于根据预处理后的麦克信号与参考信号的能量比确定存在非线性情况的频点信号；具体可参考前面本申请方法实施例中的描述，在此不再赘述。

设备硬件检测单元，用于首先计算一较低频率范围内的参考信号和麦克信号的相关性均值；然后采用一定频率间隔，计算得到其他频率范围内参考信号和麦克信号相关性均值；最后依据其他频率范围内的相关性均值和低频范围内的相关性均值，确定存在非线性情况的频点信号。比如，如果其他频率范围内的相关性均值明显小于低频范围内的相关性均值，则可以确定该频率范围内的信号具有非线性。

上述时延估计模块403包括：互相关计算单元和时延估计值确定单元，其中，所述互相关计算单元用于依次针对参考信号和时延分析范围内的各帧麦克信号，选取其中没有非线性情况的频点信号，计算参考信号与各帧麦克信号的互相关；所述时延估计值确定单元用于根据所述互相关计算单元计算得到的参考信号与各帧麦克信号的互相关确定时延估计值。

比如，所述时延估计值确定单元可以选取所述互相关计算单元计算得到的参考信号与各帧麦克信号的互相关中互相关最大的帧对应的位置作为当前时延位置，根据所述当前时延位置及所述参考信号的位置确定当前时延估计值。

进一步地，为了使当前估计时延值更具鲁棒性，所述时延估计值确定单元在确定当前时延估计值时，还可以考虑是否满足以下鲁棒条件的一种或多种，如果满足，则根据所述当前时延位置及所述参考信号的位置确定当前时延估计值；否则，继续进行下一次时延估计。

所述鲁棒条件如下：

(4)当前时延位置p(t)小于上一次时延位置p(t-1)。

另外，在基于时延进行参考信号移动、滤波器更新时，随着滤波器的收敛，对于时延估计的准确性要求更为严格，因此，为了得到更为准确的时延，所述时延估计值确定单元还可以先将互相关最大的帧对应的位置作为候选时延位置，基于历史数据，根据候选时延位置的变化情况对候选时延位置进行惩罚和/或奖励，使最终得到的时延估计值更准确。具体地，将每次时延估计时计算得到的参考信号与时延分析范围内各帧麦克信号的互相关中互相关最大的帧对应的位置作为候选时延位置，将所述候选时延位置统计在一个L维的数组Sa中，其中L＝时延分析范围内麦克信号的总帧数，并统计所述候选时延位置连续出现的次数；如果本次候选时延位置发生变化，则将本次候选时延位置增加第一设定值t1，将上次候选时延位置减小第二设定值t2，其余位置减小第三设定值t3；如果本次候选时延位置未发生变化，则将本次候选时延位置增加第一设定值t1，其余位置减小第三设定值t3，所述第二设定值t2小于等于第三设定值t3；如果本次候选时延位置大于第一阈值，且该候选时延位置连续出现的次数大于第二阈值时，根据本次候选时延位置及所述参考信号的位置确定当前时延估计值。所述t1、t2、t3的取值，可由经验或大量实验确定，一般t3＞＝t2，比如，t1、t2、t3分别为2、1、2。

需要说明的是，所述时延估计值确定单元在按照上述方式确定时延估计值时，同样可以考虑是否满足上述鲁棒条件中的一种或多种，以使当前估计时延值更具鲁棒性。

在实际应用中，所述信号移动模块404可以针对上述时延估计值确定单元采用不同方式确定的当前时延估计值，将所述参考信号的数据移动相应的时延估计值。

另外，针对上述基于历史数据，根据候选时延位置的变化情况对候选时延位置进行惩罚和/或奖励，最终得到时延估计值的情况，由于候选时延位置在不同区间内的估计的准确程度不同，因此，上述信号移动模块404还可以按以下方式对所述参考信号进行移动：在当前时延估计值D ₁(t)<＝第三阈值T3时，所述参考信号的数据不做移动；在第三阈值T3<当前时延估计值D ₁(t)<第四阈值T4时，将所述参考信号的数据移动D ₁(t)/2；在第四阈值T4<＝当前时延估计值D ₁(t)时，将所述参考信号的数据移动D ₁(t)。

进一步地，对参考信号进行移动时，为了避免历史参考信号内容丢失，如图5所示，在本申请装置另一实施例中，还可包括：缓存模块501，用于对历史参考信号的数据进行缓存。

相应地，在该实施例中，所述信号移动模块404在对所述参考信号进行移动时，需要对所述缓存模块中缓存的历史参考信号的数据进行配合移动。

在本申请装置另一实施例中，所述自适应滤波器405在进行系数更新时，如果当前时延估计值小于滤波器长度，将滤波器系数按照时延估计值移动，基于移动后的系数进行更新，对于移动后没有系数的位置对应的系数进行重置，比如，将这些没有参考意义的滤波器系数重置为0，然后基于重置后的系数进行更新。

本申请实施例提供的回声消除装置，通过对麦克信号和参考信号中存在非线性情况的频点进行检测，根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值，也就是说，在去除非线性情况下估计参考信号和麦克信号间的时延，从而使得时延估计值更加准确，然后基于当前时延估计值移动参考信号，基于麦克信号和移动后的参考信号更新自适应滤波器，实现回声消除，有效地提升了回声消除效果。

进一步地，本申请实施例还提供了一种基于时延估计的回声消除装置，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述基于时延估计的回声消除方法中的任一实现方式。

进一步地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述基于时延估计的回声消除方法中的任一实现方式。

进一步地，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述基于时延估计的回声消除方法中的任一实现方式。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。而且，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上对本申请实施例进行了详细介绍，本文中应用了具体实施方式对本申请进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及装置；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种基于时延估计的回声消除方法，其特征在于，所述方法包括：

分别接收麦克信号和参考信号，并对其进行预处理；

确定在当前回声消除场景下预处理后的麦克信号和参考信号中存在非线性情况的频点信号；

根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值；

基于所述当前时延估计值对所述参考信号进行移动；

根据预处理后的麦克信号和移动后的参考信号，更新自适应滤波器，实现回声消除。
根据权利要求1所述的方法，其特征在于，所述确定在当前回声消除场景下预处理后的麦克信号和参考信号中存在非线性情况的频点信号包括以下任意一种或多种检测：

远端信号检测：根据预处理后的参考信号的能量、过零率、短时幅值中的任一种或多种参数确定存在非线性情况的频点信号；

双端信号检测：根据预处理后的麦克信号与参考信号的能量比确定存在非线性情况的频点信号；

设备硬件导致的非线性检测：首先计算一较低频率范围内的参考信号和麦克信号的相关性均值；然后采用一定频率间隔，计算得到其他频率范围内参考信号和麦克信号相关性均值；最后依据其他频率范围内的相关性均值和低频范围内的相关性均值，确定存在非线性情况的频点信号。
根据权利要求1所述的方法，其特征在于，所述根据麦克信号和参考信号中没有非线性情况的频点信号，计算得到当前时延估计值包括：

依次针对参考信号和时延分析范围内的各帧麦克信号，选取其中没有非线性情况的频点信号，计算参考信号与各帧麦克信号的互相关；

根据计算得到的参考信号与各帧麦克信号的互相关确定时延估计值。
根据权利要求3所述的方法，其特征在于，所述根据计算得到的各帧参考信号与麦克信号的互相关确定时延估计值包括：

选取计算得到的参考信号与各帧麦克信号的互相关中互相关最大的帧对应的位置作为当前时延位置，根据所述当前时延位置及所述参考信号的位置确定当前时延估计值。
根据权利要求3所述的方法，其特征在于，所述根据计算得到的各帧参考信号与麦克信号的互相关确定当前时延估计值包括：

将每次时延估计时计算得到的参考信号与时延分析范围内各帧麦克信号的互相关中互相关最大的帧对应的位置作为候选时延位置，将所述候选时延位置统计在一个L维的数组Sa中，其中L＝时延分析范围内麦克信号的总帧数，并统计所述候选时延位置连续出现的次数；

如果本次候选时延位置发生变化，则将本次候选时延位置增加第一设定值t1，将上次候选时延位置减小第二设定值t2，其余位置减小第三设定值t3；

如果本次候选时延位置未发生变化，则将本次候选时延位置增加第一设定值t1，其余位置减小第三设定值t3，所述第二设定值t2小于等于第三设定值t3；

如果本次候选时延位置大于第一阈值，且该候选时延位置连续出现的次数大于第二阈值时，根据本次候选时延位置及所述参考信号的位置确定当前时延估计值。
根据权利要求5所述的方法，其特征在于，所述基于所述当前时延估计值对所述参考信号进行移动包括：

在当前时延估计值D ₁(t)<＝第三阈值T3时，所述参考信号的数据不做移动；

在第三阈值T3<当前时延估计值D ₁(t)<第四阈值T4时，将所述参考信号的数据移动D ₁(t)/2；

在第四阈值T4<＝当前时延估计值D ₁(t)时，将所述参考信号的数据移动D ₁(t)。
根据权利要求4或5或6所述的方法，其特征在于，所述根据计算得到的参考信号与各帧麦克信号的互相关确定时延估计值需满足以下任一种或多种条件：

(1)当前时延位置对应的互相关C(t)大于上一次时延位置对应的互相关C(t-1)；

(2)当前时延分析范围内每帧中的最大互相关C _max(t)和最小互相关C _min(t)对应的位置的差值大于设定的第一设定差值；

(3)参考信号与时延分析范围内各帧麦克信号的互相关均值C _mean(t)与当前时延位置对应的互相关C(t)的差值大于第二设定差值；

(4)当前时延位置p(t)小于上一次时延位置p(t-1)。
根据权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：

对历史参考信号的数据进行缓存；

在对所述参考信号进行移动时，对缓存的历史参考信号的数据进行配合移动。
根据权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：

如果当前时延估计值小于滤波器长度，则更新自适应滤波器系数时，将滤波器系数按照时延估计值移动，基于移动后的系数进行更新，对于移动后没有系数的位置对应的系数进行重置，并基于重置后的系数进行更新。
一种基于时延估计的回声消除装置，其特征在于，所述装置包括：

信号处理模块，用于接收麦克信号和参考信号，并进行预处理，输出预处理后的麦克信号和参考信号；

频点检测模块，用于确定在当前回声消除场景下所述信号处理模块输出的预处理后的麦克信号和参考信号中存在非线性情况的频点信号；

时延估计模块，用于根据所述频点检测模块确定的麦克信号和参考信号中没有非线性情况的频点信号，计算并输出当前时延估计值；

信号移动模块，用于基于所述时延估计模块输出的当前时延估计值对所述参考信号进行移动，并输出移动后的参考信号；

自适应滤波器，用于根据所述信号处理模块输出的预处理后的麦克信号和所述信号移动模块输出的移动后的参考信号，更新自适应滤波器，实现回声消除。
根据权利要求10所述的装置，其特征在于，所述频点检测模块包括以下任意一个或多个检测单元：

远端信号检测单元，用于根据预处理后的参考信号的能量、过零率、短时幅值中的任一种或多种参数确定存在非线性情况的频点信号；

双端信号检测单元，用于根据预处理后的麦克信号与参考信号的能量比确定存在非线性情况的频点信号；

设备硬件检测单元，用于首先计算一较低频率范围内的参考信号和麦克信号的相关性均值；然后采用一定频率间隔，计算得到其他频率范围内参考信号和麦克信号相关性均值；最后依据其他频率范围内的相关性均值和低频范围内的相关性均值，确定存在非线性情况的频点信号。
根据权利要求10所述的装置，其特征在于，所述时延估计模块包括：

互相关计算单元，用于依次针对参考信号和时延分析范围内的各帧麦克信号，选取其中没有非线性情况的频点信号，计算参考信号与各帧麦克信号的互相关；

时延估计值确定单元，用于根据计算得到的参考信号与各帧麦克信号的互相关确定时延估计值。
根据权利要求12所述的装置，其特征在于，

所述时延估计值确定单元，具体用于选取所述互相关计算单元计算得到的参考信号与各帧麦克信号的互相关中互相关最大的帧对应的位置作为当前时延位置，根据所述当前时延位置及所述参考信号的位置确定当前时延估计值。
根据权利要求12所述的装置，其特征在于，所述时延估计值确定单元，具体用于将每次时延估计时计算得到的参考信号与时延分析范围内各帧麦克信号的互相关中互相关最大的帧对应的位置作为候选时延位置，将所述候选时延位置统计在一个L维的数组Sa中，其中L＝时延分析范围内麦克信号的总帧数，并统计所述候选时延位置连续出现的次数；如果本次候选时延位置发生变化，则将本次候选时延位置增加第一设定值t1，将上次候选时延位置减小第二设定值t2，其余位置减小第三设定值t3；如果本次候选时延位置未发生变化，则将本次候选时延位置增加第一设定值t1，其余位置减小第三设定值t3，所述第二设定值t2小于等于第三设定值t3；如果本次候选时延位置大于第一阈值，且该候选时延位置连续出现的次数大于第二阈值时，根据本次候选时延位置及所述参考信号的位置确定当前时延估计值。
根据权利要求14所述的装置，其特征在于，

所述信号移动模块，具体用于在当前时延估计值D ₁(t)<＝第三阈值T3时，所述参考信号的数据不做移动；在第三阈值T3<当前时延估计值D ₁(t)<第四阈值T4时，将所述参考信号的数据移动D ₁(t)/2；在第四阈值T4<＝当前时延估计值D ₁(t)时，将所述参考信号的数据移动D ₁(t)。
根据权利要求13或14或15所述的装置，其特征在于，所述时延估计值确定单元在确定时延估计值时还需确定满足以下任一种或多种条件：

(1)当前时延位置对应的互相关C(t)大于上一次时延位置对应的互相关C(t-1)；

(2)当前时延分析范围内每帧中的最大互相关C _max(t)和最小互相关C _min(t)对应的位置的差值大于设定的第一设定差值；

(3)参考信号与时延分析范围内各帧麦克信号的互相关均值C _mean(t)与当前时延位置对应的互相关C(t)的差值大于第二设定差值；

(4)当前时延位置p(t)小于上一次时延位置p(t-1)。
根据权利要求10至15任一项所述的装置，其特征在于，所述装置还包括：

缓存模块，用于对历史参考信号的数据进行缓存；

所述信号移动模块，还用于在对所述参考信号进行移动时，对所述缓存模块中缓存的历史参考信号的数据进行配合移动。
根据权利要求10至15任一项所述的装置，其特征在于，

所述自适应滤波器在进行系数更新时，如果当前时延估计值小于滤波器长度，将滤波器系数按照时延估计值移动，基于移动后的系数进行更新，对于移动后没有系数的位置对应的系数进行重置，并基于重置后的系数进行更新。
一种基于时延估计的回声消除装置，其特征在于，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行权利要求1-9任一项所述的方法。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行权利要求1-9任一项所述的方法。
一种计算机程序产品，其特征在于，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行权利要求1-9任一项所述的方法。