CN110265048B

CN110265048B - 回声消除方法、装置、设备及存储介质

Info

Publication number: CN110265048B
Application number: CN201910205707.9A
Authority: CN
Inventors: 向伟; 陈建哲; 张腾飞
Original assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Current assignee: Apollo Intelligent Connectivity Beijing Technology Co Ltd
Priority date: 2019-03-18
Filing date: 2019-03-18
Publication date: 2021-11-02
Anticipated expiration: 2039-03-18
Also published as: CN110265048A; CN113903351A

Abstract

本发明提供一种回声消除方法、装置、设备及存储介质。该方法包括：在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，计算设备估计第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延；所述计算设备根据估计获得的所述时延，对第二语音交互装置采集到的原始信号中的所述回声信号进行消除。本发明提高了回声消除效果。

Description

回声消除方法、装置、设备及存储介质

技术领域

本发明涉及信号处理领域，尤其涉及一种回声消除方法、装置、设备及存储介质。

背景技术

目前，在语音识别中，可以通过回声消除处理，例如声学回声消除(Acoustic EchoCancellation，AEC)算法，以实现对采集到的语音信号中的回声的消除。

现有技术中，回声消除处理具体是根据所播放的参考信号与麦克风采集到的该参考信号对应的回声信号之间的时延，将麦克风采集到的语音信号中所包括的回声信号进行消除，从而得到讲话者发出的原始信号，避免由于回声信号叠加到原始信号中所带来的回声。通常，在进行回声消除处理所使用的时延是默认时延，即，基于默认时延，将麦克风采集到的语音信号中所包括的回声信号进行消除。

但是，现有技术中，存在由于回声消除处理中使用默认时延，而导致回声消除效果较差的问题。

发明内容

本发明实施例提供一种回声消除方法、装置、设备及存储介质，用以解决现有技术中由于回声消除处理中使用默认时延，而导致回声消除效果较差的问题。

第一方面，本发明实施例提供一种回声消除方法，包括：

在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，所述计算设备估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延；

所述计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

在一种可能的实现中，若所述终端计算设备的连接对象发生变化，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置。

在一种可能的实现中，若所述计算设备由与目标设备连接变化为未与所述目标设备连接，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述目标设备包括所述第一语音交互装置，所述计算设备包括所述第二语音交互装置；

或者，所述计算设备由未与所述目标设备连接变化为与所述目标设备连接，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述计算设备包括所述第一语音交互装置，所述目标设备包括所述第二语音交互装置。

在一种可能的实现中，所述目标设备为车辆。

在一种可能的实现中，若所述计算设备由与第一目标设备连接变化为与第二目标设备连接，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述第一目标设备包括所述第一语音交互装置，所述第二目标设备包括所述第二语音交互装置。

在一种可能的实现中，所述计算设备估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延，包括：

所述计算设备根据多个第一时间点以及与所述多个第一时间点一一对应的多个第二时间点，确定所述多个第一时间点中各第一时间点与各第一时间点对应的第二时间点的时间差，得到多个时间差，所述第一时间点为所述第二语音交互装置播放参考信号的时间点，所述第二时间点为所述第二语音装置采集到对应第一时间点所播放的参考信号对应的回声信号的时间点；

所述计算设备根据所述多个时间差，确定所述参考信号与所述回声信号的时延。

在一种可能的实现中，所述计算设备根据所述多个时间差，确定所述参考信号与所述回声信号的时延，包括：

所述计算设备根据所述多个时间差以及预设估计算法，确定所述参考信号与所述回声信号的时延。

在一种可能的实现中，所述预设估计算法为最小均方LMS算法。

在一种可能的实现中，所述计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除，包括：

所述计算设备判断所述时延是否在预设的时延范围内；

若所述时延在所述时延范围内，则根据所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除；

若所述时延不在所述时延范围内，则根据所述时延范围内的时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

在一种可能的实现中，所述终端计算设备根据估计获得的所述时延，对采集到的原始信号中的所述回声信号进行消除，包括：

所述终端计算设备根据估计获得的所述时延，采用声学回声消除AEC算法，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

在一种可能的实现中，所述终端计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除之后，还包括：

对消除后获得的语音信号进行语音识别，得到语音识别结果；

根据所述语音识别结果，进行后续处理。

在一种可能的实现中，所述后续处理包括唤醒处理和/或输出处理。

第二方面，本发明实施例提供一种回声消除装置，应用于计算设备，包括：

估计模块，用于在所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延；

消除模块，用于根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

在一种可能的实现中，所述估计模块具体用于：

根据多个第一时间点以及与所述多个第一时间点一一对应的多个第二时间点，确定所述多个第一时间点中各第一时间点与各第一时间点对应的第二时间点的时间差，得到多个时间差，所述第一时间点为所述第二语音交互装置播放参考信号的时间点，所述第二时间点为所述第二语音装置采集到对应第一时间点所播放的参考信号对应的回声信号的时间点；

根据所述多个时间差，确定所述参考信号与所述回声信号的时延。

在一种可能的实现中，所述估计模块用于根据所述多个时间差，确定所述参考信号与所述回声信号的时延，具体包括：

根据所述多个时间差以及预设估计算法，确定所述参考信号与所述回声信号的时延。

在一种可能的实现中，所述消除模块具体用于：

判断所述时延是否在预设的时延范围内；

在一种可能的实现中，所述消除模块根据所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除，具体包括：

根据估计获得的所述时延，采用声学回声消除AEC算法，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

在一种可能的实现中，所述装置还包括：响应模块；

所述响应模块，用于：对消除后获得的语音信号进行语音识别，得到语音识别结果；根据所述语音识别结果，进行后续处理。

第三方面，本发明实施例提供一种回声消除装置，包括：

处理器以及用于存储计算机指令的存储器；所述处理器运行所述计算机指令执行上述第一方面任一项所述的方法。

第四方面，本发明实施例提供一种计算机可读存储介质，当所述存储介质中的指令由回声消除装置的处理器执行时，使得回声消除装置能够执行上述第一方面任一项所述的方法。

本发明实施例提供的回声消除方法、装置、设备及存储介质，通过在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，计算设备估计第二语音交互装置播放的参考信号与采集到的参考信号对应的回声信号之间的时延，并根据估计获得的时延，对第二语音交互装置采集到的原始信号中的回声信号进行消除，实现了在计算机设备使用的语音交互装置变化时，可以及时估计变化后的语音交互装置的时延，并基于所估计的时延对变化后的语音交互装置采集到的原始信号中的回声信号进行消除，不但可以避免由于使用默认时延，而导致回声消除效果较差的问题，而且可以避免在计算机设备使用的语音交互装置变化时，还是使用变化前的语音交互装置的时延对变化后的语音交互装置采集到的原始信号中的回声信号进行消除时，由于时延不准确而导致的回声消除效果较差的问题，提高回声消除效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的回声消除方法的应用场景示意图一；

图2为本发明实施例提供的回声消除方法的应用场景示意图二；

图3为本发明实施例提供的回声消除方法的应用场景示意图三；

图4为本发明实施例提供的回声消除方法实施例一的流程示意图；

图5为本发明实施例提供的回声消除方法实施例二的流程示意图；

图6为本发明实施例提供的回声消除方法实施例三的流程示意图；

图7为本发明实施例提供的回声消除装置实施例一的结构示意图；

图8为本发明实施例提供的回声消除装置实施例二的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的回声消除方法的应用场景示意图一，如图1所示，该应用场景中可以包括计算设备11，计算设备11可以包括至少两个语音交互装置，例如图1中的语音交互装置a和语音交互装置b。计算设备11可以使用语音交互装置a或语音交互装置b与用户进行语音交互。具体的，计算设备11可以使用计算设备11的语音交互装置a采集语音，并使用计算设备11的语音交互装置b进行语音播放，例如播放音乐，播放导航等；或者，计算设备11可以使用计算设备11的语音交互装置b采集语音，并使用计算设备11的语音交互装置b进行语音播放。

图2为本发明实施例提供的回声消除方法的应用场景示意图二，如图2所示，该应用场景中可以包括计算设备11以及第一目标设备12，其中，计算设备11可以包括至少一个语音交互装置，第一目标设备12可以包括至少一个语音交互装置，例如图1中计算设备11包括语音交互装置a，第一目标设备12包括语音交互装置b。计算设备11可以使用计算设备11的语音交互装置a或第一目标设备12的语音交互装置b与用户进行语音交互。具体的，计算设备11可以使用计算设备11的语音交互装置a采集语音，并使用计算设备11的语音交互装置b进行语音播放，例如播放音乐，播放导航等；或者，计算设备11可以使用第一目标设备12的语音交互装置b采集语音，并使用第一目标设备12的语音交互装置b进行语音播放。

图3为本发明实施例提供的回声消除方法的应用场景示意图三，如图3所示，该应用场景中可以包括计算设备11、第一目标设备12和第二目标设备12，其中，第一目标设备12可以包括至少一个语音交互装置，第二目标设备13可以包括至少一个语音交互装置，例如图1中第一目标设备12包括语音交互装置a，第二目标设备13包括语音交互装置b。计算设备11可以使用第一目标设备12的语音交互装置a或第二目标设备12的语音交互装置b与用户进行语音交互。具体的，计算设备11可以使用第一目标设备12的语音交互装置a采集语音，并使用第一目标设备12的语音交互装置b进行语音播放，例如播放音乐，播放导航等；或者，计算设备11可以使用第二目标设备13语音交互装置b采集语音，并使用第二目标设备13语音交互装置b进行语音播放。

可以理解的是，上述三种应用场景可以结合，一个应用场景中可以包括计算设备11、第一目标设备12和第二目标设备12，其中，计算设备11可以包括至少两个语音交互装置，第一目标设备12和第二目标设备13可以均包括一个语音交互装置。其中，计算设备11可以使用计算设备11的一个语音交互装置采集语音，并使用计算设备11的该语音交互装置进行语音播放；或者，计算设备11可以使用计算设备11的另一个语音交互装置采集语音，并使用计算设备11的该另一个语音交互装置进行语音播放；或者，计算设备11可以使用第一目标设备12语音交互装置采集语音，并使用第一目标设备12语音交互装置进行语音播放；计算设备11可以使用第二目标设备13语音交互装置采集语音，并使用第二目标设备13语音交互装置进行语音播放。

需要说明的是，本发明实施例中的语音交互装置可以为任何能够实现采集语音并播放语音的实体装置。

需要说明的是，计算设备(computing device)11具体可以为能够通过语音交互装置播放语音和采集语音，并可以具有一定计算能力(例如，估计时延)的设备。对于计算设备的具体类型，本发明可以不做限定，例如可以为手机、平板电脑、可穿戴设备等。

需要说明的是，对于图2和图3中计算设备与目标设备的语音交互装置的连接方式，本发明可以不作限定。

图4为本发明实施例提供的回声消除方法实施例一的流程示意图。本实施例的方法可以由计算设备执行，如图4所示，本实施例的方法可以包括：

步骤401，在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，所述计算设备估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延。

本步骤中，第一语音交互装置可以理解为上述语音交互装置a，第二语音交互装置可以理解为上述语音交互装置b；或者，第一语音交互装置可以理解为上述语音交互装置b，第二语音交互装置可以理解为上述语音交互装置a。所述计算设备使用的语音交互装置可以理解为计算设备播放及采集语音所使用的语音交互装置，用户可以通过该语音交互装置与计算设备进行语音交互。

对于图1所示的应用场景，计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置例如可以为计算设备11使用的语音交互装置由计算设备11的语音交互装置a变为计算设备11的语音交互装置b。此时，计算设备11的语音交互装置a可以理解为第一语音交互装置，计算设备11的语音交互装置b可以理解为第二语音交互装置。

对于图2所示的应用场景，计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置例如可以为计算设备11使用的语音交互装置由计算设备11的语音交互装置a变为第一目标设备12的语音交互装置b。此时，计算设备11的语音交互装置a可以理解为第一语音交互装置，第一目标设备12的语音交互装置b可以理解为第二语音交互装置。

对于图3所示的应用场景，计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置例如可以为计算设备11使用的语音交互装置由第一目标设备12的语音交互装置a变为第二目标设备13的语音交互装置b。此时，第一目标设备12的语音交互装置a可以理解为第一语音交互装置，第二目标设备13的语音交互装置b可以理解为第二语音交互装置。

其中，将计算设备使用语音交互装置所播放的语音信号可以称为参考信号，并将计算设备使用该语音交互装置所采集到的语音信号称为原始信号。可以理解的是，参考信号被计算设备播放之后，所播放的声音可以被该语音交互装置采集，即所采集到的原始信号中可以包括该参考信号计算设备所播放的语音信号。

由于不同语音交互装置的硬件结构不同，因此不同语音交互装置对于计算设备播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延可能不同。这里，通过在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，估计第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延，可以在计算设备使用的语音交互装置变化时，可以及时估计变化后的第二语音交互装置播放的参考信号与采集到的参考信号对应的回声信号的时延。

可以理解的是，在计算设备播放参考信号的过程中，当用户讲话时，所采集到的原始信号中还可以包括在用户的语音信号。

需要说明的是，对于计算设备估计第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延的具体方式，本发明可以不作限定。

需要说明的是，对于计算设备确定所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置的具体方式，本发明实施例可以不作限定，例如计算设备可以对所使用的语音交互装置进行监控，以确定所使用的语音交互装置是否发生变化，即是否由第一语音交互装置变化为第二语音交互装置。

步骤402，所述计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

本步骤中，对于根据步骤401估计获得的所述时延，对第二语音交互装置采集到的原始信号中的所述回声信号进行消除的具体方式，本发明实施例可以不做限定，例如，可以根据估计获得的所述时延，对参考信号进行移动，并根据采集到的原始信号和移动后的参考信号，对第二语音交互装置采集到的原始信号中的回声信号进行消除。

这里，由于步骤401在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，估计得到了第二语音交互装置播放的参考信号与采集到的参考信号对应的回声信号的时延，使得步骤402中可以使用第二语音交互装置播放的参考信号与采集到的参考信号对应的回声信号的时延，对第二语音交互装置采集到的原始信号中的所述回声信号进行消除，避免了在语音交互装置由第一语音交互装置变化为第二语音交互装置后，还是使用第一语音交互装置播放的参考信号与采集到的参考信号对应的回声信号的时延，对第二语音交互装置采集到的原始信号中的所述回声信号进行消除时，由于时延不准确而导致的回声消除效果较差的问题。

本实施例提供的回声消除方法，通过在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，计算设备估计第二语音交互装置播放的参考信号与采集到的参考信号对应的回声信号之间的时延，并根据估计获得的时延，对第二语音交互装置采集到的原始信号中的回声信号进行消除，实现了在计算机设备使用的语音交互装置变化时，可以及时估计变化后的语音交互装置的时延，并基于所估计的时延对变化后的语音交互装置采集到的原始信号中的回声信号进行消除，不但可以避免由于使用默认时延，而导致回声消除效果较差的问题，而且可以避免在计算机设备使用的语音交互装置变化时，还是使用变化前的语音交互装置(即第一语音交互装置)的时延对变化后的语音交互装置(即第二语音交互装置)采集到的原始信号中的回声信号进行消除时，由于时延不准确而导致的回声消除效果较差的问题，提高回声消除效果。

图5为本发明实施例提供的回声消除方法实施例二的流程示意图。本实施例在图5所示实施例的基础上，主要描述了在语音交互装置变化时，计算设备估计第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延的一种可选的实现方式。

步骤501，判断计算设备的连接对象是否发生变化。

本步骤中，若计算设备的连接对象发生变化，则可以表示所述语音交互装置变化，即计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置。若计算设备的连接对象未发生变化，则可以表示所述语音交互装置未变化，即计算设备使用的语音交互装置未由第一语音交互装置变化为第二语音交互装置。

其中，第一语音交互装置可以理解为计算设备使用的语音交互装置变化前，所使用的语音交互装置。第二语音交互装置可以理解为计算设备使用的语音交互装置变化后，所使用的语音交互装置。

可选的，所述计算设备的连接对象变化，具体可以为计算设备与目标设备连接，和计算设备未与目标设备连接两种状态之间的变化。

具体的，若所述计算设备由与目标设备连接变化为未与所述目标设备连接，则计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述目标设备包括所述第一语音交互装置，所述计算设备包括所述第二语音交互装置；或者，所述计算设备由未与所述目标设备连接变化为与所述目标设备连接，则计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述计算设备包括所述第一语音交互装置，所述目标设备包括所述第二语音交互装置。

例如，如图2所示，计算设备11与第一目标设备12连接时，计算设备11可以使用第一目标设备12的语音交互装置b与用户进行语音交互；计算设备11未与第一目标设备12连接时，计算设备11可以使用计算设备11的语音交互装置a与用户进行语音交互。因此，在计算设备11与第一目标设备12的连接状态变化时，可以表示计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置。具体的，在计算设备11由与第一目标设备12连接变化为未与第一目标设备连接时，语音交互装置b可以认为是第一语音交互装置，语音交互装置a可以认为是第二语音交互装置；在计算设备11由未与第一目标设备12连接变化为与第一目标设备连接时，语音交互装置a可以认为是第一语音交互装置，语音交互装置b可以认为是第二语音交互装置。

需要说明的是，所述目标设备具体可以为计算设备11能够与之建立连接，且能够控制其部分硬件的设备，该部分硬件包括语音交互装置。示例性的，所述目标设备可以为车辆，此时计算设备可以为支持特定功能的计算设备，该特定功能为计算设备可以与目标设备建立连接并能够控制目标设备的部分硬件的功能。

或者，可选的，所述计算设备的连接对象变化，具体可以为计算设备与一个目标设备连接，和计算设备与另一个目标设备连接两种状态之间的变化。具体的，若所述计算设备由与第一目标设备连接变化为与第二目标设备连接，则计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述第一目标设备包括所述第一语音交互装置，所述第二目标设备包括所述第二语音交互装置。

例如，如图3所示，计算设备11与第一目标设备12连接时，计算设备11可以使用第一目标设备12的语音交互装置a与用户进行语音交互；计算设备11与第二目标设备13连接时，计算设备11可以使用第二目标设备13的语音交互装置b与用户进行语音交互。因此，在计算设备11与第一目标设备12和第二目标设备13的连接状态变化时，可以表示计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置。具体的，在计算设备11由与第一目标设备12连接变化为与第二目标设备13连接时，语音交互装置a可以认为是第一语音交互装置，语音交互装置b可以认为是第二语音交互装置；在计算设备11由与第二目标设备13连接变化为与第一目标设备12连接时，语音交互装置b可以认为是第一语音交互装置，语音交互装置a可以认为是第二语音交互装置。

其中，若所述计算设备的连接对象发生变化，则执行步骤502；若所述计算设备的连接对象未发生变化，则结束。

步骤502，所述计算设备估计第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延。

本步骤中，所述第二语音交互装置可以理解为所述计算设备当前使用的语音交互装置。可选的，可以通过如下步骤确定时延：

步骤A，所述计算设备根据多个第一时间点以及与所述多个第一时间点一一对应的多个第二时间点，确定所述多个第一时间点中各第一时间点与各第一时间点对应的第二时间点的时间差，得到多个时间差，所述第一时间点为所述第二语音交互装置播放参考信号的时间点，所述第二时间点为所述第二语音装置采集到对应第一时间点所播放的参考信号对应的回声信号的时间点。

这里，为了避免单个时间差不准确，而导致所确定的时延不准确的问题，可选的，可以根据多个第一时间点和多个第二时间点，得到多个时间差。例如，计算设备可以在播放语音信号x(可以理解为参考信号)时，记录播放语音信号x的时间点1(可以理解为第一时间点)，采集原始信号，并记录采集到原始信号的时间点2，若该原始信号中包括语音信号x时，则时间点2为时间点1对应的第二时间点，进一步，可以获取时间点2与时间点1的时间差。又例如，计算设备可以在播放语音信号y(可以理解为参考信号)时，记录播放语音信号y的时间点3(可以理解为第一时间点)，采集原始信号，并记录采集到原始信号的时间点4，若该原始信号中包括语音信号y时，则时间点4为时间点3对应的第二时间点，进一步，可以获取时间点4与时间点3的时间差。

需要说明的是，对于采集到的原始信号中包括参考信号的具体方式，本发明不作限定。

步骤B，所述计算设备根据所述多个时间差，确定所述参考信号与所述回声信号的时延。

这里，具体的，可以对多个时间差进行数学计算，得到参考信号与回声信号的时延，例如，可以对多个时间差进行平均，得到时延。可选的，在根据时间差得到时延时，可以采用一定的估计算法。进一步可选的，步骤B具体可以包括：所述计算设备根据所述多个时间差以及预设估计算法，确定所述参考信号与所述回声信号的时延。

示例性的，所述预设估计算法为最小均方(Least-Mean-Square，LMS)算法。这里，通过预设估计算法为LMS算法，实现了根据多个时间差，采用机器学习的方式确定时延，提供了时延确定的准确性。

步骤503，所述计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

本步骤中，可选的，可以采用AEC算法对采集到的原始信号中的所述回声信号进行消除。具体的，步骤503可以包括：所述计算设备根据估计获得的所述时延，采用声学回声消除AEC算法，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

考虑到一个AEC算法在确定好之后，其适用的时延范围是一定的，因此为了避免由于所确定的时延在该一定的时延范围之外而导致回声消除效果较差的问题，可选的，步骤503具体可以包括：所述计算设备判断所述时延是否在预设的时延范围内；若所述时延在所述时延范围内，则根据所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除；若所述时延不在所述时延范围内，则根据所述时延范围内的时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

本实施例提供的回声消除方法，通过判断计算设备的连接对象是否发生变化，若计算设备的连接对象发生变化，则计算设备估计第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延，所述计算设备根据估计获得的所述时延，对采集到的原始信号中的所述回声信号进行消除，实现了由计算设备的连接对象发生变化表征计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置。

图6为本发明实施例提供的回声消除方法实施例三的流程示意图。本实施例在上述实施例的基础上，主要描述了进行回声消除之后的一种可选的实现方式。如图6所示，本实施例的方法可以包括：

步骤601，在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，计算设备估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延。

需要说明的是，步骤601与步骤401类似，在此不再赘述。

步骤602，所述计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

需要说明的是，步骤602与步骤402类似，在此不再赘述。

步骤603，对消除后获得的语音信号进行语音识别，得到语音识别结果。

本步骤中，语音识别结果的例如可以为“开机”、“天气”等。需要说明的是，对于对消除后获得的语音信号进行语音识别的具体方式，本发明不作限定。

由于步骤601和步骤602可以提高回声消除效果，因此步骤603进行语音识别所基于的语音信号的准确性更高，从而可以提高语音识别结果的准确性。

步骤604，根据所述语音识别结果，进行后续处理。

本步骤中，在得到语音识别结果后，可以基于语音识别结果进行一定的处理。这里，对于处理的类型本发明可以不作限定，示例性的，所述后续处理可以包括唤醒处理和/或输出处理。

其中，对于唤醒处理，示例性的，可以判断所述语音识别结果与预设唤醒指令是否相同，若所述语音识别结果与预设结果相同，则唤醒所述计算设备与所述预设唤醒指令对应的应用程序。对于输出处理，示例性的，可以将所述语音识别结果输出在输入界面的文本框。

本实施例提供的回声消除方法，通过在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，计算设备估计第二语音交互装置播放的参考信号与采集到的参考信号对应的回声信号之间的时延，计算设备根据估计获得的时延，对采集到的原始信号中的回声信号进行消除，对消除后获得的语音信号进行语音识别，得到语音识别结果，并根据语音识别结果进行后续处理，实现了在提高回声消除效果的基础上，提高了语音识别结果的准确性，从而提高了用户体验。

图7为本发明实施例提供的回声消除装置实施例一的结构示意图，本实施例提供的装置可以应用于上述方法实施例中，实现其计算设备的功能。如图7所示，本实施例的装置可以包括：估计模块701和消除模块702。

其中，估计模块701，用于在所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延；

消除模块702，用于根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

在一种可能的实现中，若所述计算设备的连接对象发生变化，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置。

在一种可能的实现中，所述目标设备为车辆。

在一种可能的实现中，所述估计模块701具体用于：

在一种可能的实现中，所述估计模块701用于根据所述多个时间差，确定所述参考信号与所述回声信号的时延，具体包括：

在一种可能的实现中，所述消除模块702具体用于：

判断所述时延是否在预设的时延范围内；

在一种可能的实现中，所述消除模块702根据所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除，具体包括：

在一种可能的实现中，所述装置还包括：响应模块703；

所述响应模块703，用于：对消除后获得的语音信号进行语音识别，得到语音识别结果；根据所述语音识别结果，进行后续处理。

本实施例的装置，可以用于执行上述方法所示实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图8为本发明实施例提供的回声消除装置实施例二的结构示意图，如图8所示，该装置可以包括：处理器801以及用于存储计算机指令的存储器802。

其中，处理器801运行该计算机指令执行以下方法：

在一种可能的实现中，所述目标设备为车辆。

在一种可能的实现中，所述计算设备估计播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延，包括：

所述计算设备判断所述时延是否在预设的时延范围内；

所述计算设备根据估计获得的所述时延，采用声学回声消除AEC算法，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除。

在一种可能的实现中，所述计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除之后，还包括：

根据所述语音识别结果，进行后续处理。

本发明实施例还提供一种计算机可读存储介质，当该存储介质中的指令由回声消除装置的处理器执行时，使得回声消除装置能够执行一种回声消除方法，该方法包括：

在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，计算设备估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延，所述语音交互装置用于所述用户与所述计算设备进行语音交互；

在一种可能的实现中，所述目标设备为车辆。

所述计算设备判断所述时延是否在预设的时延范围内；

根据所述语音识别结果，进行后续处理。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种回声消除方法，其特征在于，包括：

在计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，所述计算设备估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延；所述时延基于所述第二语音交互装置播放所述参考信号的时间点和所述第二语音交互装置采集到所述参考信号对应的回声信号的时间点之差获得；

2.根据权利要求1所述的方法，其特征在于，若所述计算设备由与目标设备连接变化为未与所述目标设备连接，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述目标设备包括所述第一语音交互装置，所述计算设备包括所述第二语音交互装置；

3.根据权利要求1所述的方法，其特征在于，若所述计算设备由与第一目标设备连接变化为与第二目标设备连接，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述第一目标设备包括所述第一语音交互装置，所述第二目标设备包括所述第二语音交互装置。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述计算设备估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延，包括：

5.根据权利要求4所述的方法，其特征在于，所述计算设备根据所述多个时间差，确定所述参考信号与所述回声信号的时延，包括：

6.根据权利要求1-3任一项所述的方法，其特征在于，所述计算设备根据估计获得的所述时延，对所述第二语音交互装置采集到的原始信号中的所述回声信号进行消除，包括：

所述计算设备判断所述时延是否在预设的时延范围内；

7.一种回声消除装置，应用于计算设备，其特征在于，包括：

估计模块，用于在所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置时，估计所述第二语音交互装置播放的参考信号与采集到的所述参考信号对应的回声信号之间的时延；所述时延基于所述第二语音交互装置播放所述参考信号的时间点和所述第二语音交互装置采集到所述参考信号对应的回声信号的时间点之差获得；

8.根据权利要求7所述的装置，其特征在于，若所述计算设备由与目标设备连接变化为未与所述目标设备连接，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述目标设备包括所述第一语音交互装置，所述计算设备包括所述第二语音交互装置；

9.根据权利要求7所述的装置，其特征在于，若所述计算设备由与第一目标设备连接变化为与第二目标设备连接，则所述计算设备使用的语音交互装置由第一语音交互装置变化为第二语音交互装置，所述第一目标设备包括所述第一语音交互装置，所述第二目标设备包括所述第二语音交互装置。

10.根据权利要求7-9任一项所述的装置，其特征在于，所述估计模块具体用于：

11.根据权利要求10所述的装置，其特征在于，所述估计模块用于根据所述多个时间差，确定所述参考信号与所述回声信号的时延，具体包括：

12.根据权利要求7-9任一项所述的装置，其特征在于，所述消除模块具体用于：

判断所述时延是否在预设的时延范围内；

13.一种回声消除装置，其特征在于，包括：

处理器以及用于存储计算机指令的存储器；所述处理器运行所述计算机指令执行权利要求1-6任一项所述的方法。

14.一种计算机可读存储介质，其特征在于，当所述存储介质中的指令由回声消除装置的处理器执行时，使得回声消除装置能够执行权利要求1-6任一项所述的方法。