CN105915738A

CN105915738A - 回声消除方法、回声消除装置和终端

Info

Publication number: CN105915738A
Application number: CN201610375699.9A
Authority: CN
Inventors: 齐永生
Original assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Current assignee: Yulong Computer Telecommunication Scientific Shenzhen Co Ltd
Priority date: 2016-05-30
Filing date: 2016-05-30
Publication date: 2016-08-31

Abstract

本发明提供了一种回声消除方法、回声消除装置和终端，其中，回声消除方法包括：接收对侧终端发送的多个声音信号；解析所述多个声音信号中的任一声音信号的声纹特征信息；确定所述任一声音信号的声纹特征信息与预存声纹特征信息的匹配度；将所述匹配度高于预设匹配度的任一声音信号确定为回声信号，并从所述多个声音信号中滤除所述回声信号。通过本发明的技术方案，改善了语音通话的质量，进一步地降低了回声信号的影响，提升了用户的使用体验。

Description

回声消除方法、回声消除装置和终端

技术领域

本发明涉及终端技术领域，具体而言，涉及一种回声消除方法、一种回声消除装置和一种终端。

背景技术

在本侧终端与对侧终端进行语音通话的过程中，通常会产生两种回声干扰，其一是混合线圈的2/4线转换电路产生的回声，其二是声学回声，也即扬声器播放出来的声音被麦克风拾取后发回对侧终端，从而导致对侧终端的用户听取了自身的回声信号。

在相关技术中，为了降低声学回声，通常在终端中设置一个回声消除单元，其工作过程包括：

1、终端A的音频会议系统接收到终端B中的声音；

2、声音被采样，这一采样被称为回声消除参考；

3、随后声音被送到终端A的音箱和声学回声消除器中；

4、终端B的声音和终端A的声音一起被终端A的话筒拾取；

5、声音被送到声学回声消除器中，与原始的采样进行比较，移除终端B的声音。

但是，在对侧终端的回声消除单元出现故障时，本侧终端仍会收到回声信号的干扰。

因此，如何设计一种新的回声消除方案，以改善回声信号对语音通话的干扰成为亟待解决的技术问题。

发明内容

本发明正是基于上述技术问题至少之一，提出了一种新的回声消除方案，通过在接收对侧终端发送的多个声音信号后，对声音信号进行匹配度的判断，并根据匹配度确定本侧终端的用户的声音信号(即回声信号)，进而滤除多个声音信号中的回声信号，提供了一种消除语音通话过程的上行路径的回声信号的方案，在原有回声消除方案的基础上，进一步地降低了回声信号的干扰，提升了用户的使用体验。

有鉴于此，根据本发明的第一方面，提出了一种回声消除方法，包括：接收对侧终端发送的多个声音信号；解析多个声音信号中的任一声音信号的声纹特征信息；确定任一声音信号的声纹特征信息与预存声纹特征信息的匹配度；将匹配度高于预设匹配度的任一声音信号确定为回声信号，并从多个声音信号中滤除回声信号。

在该技术方案中，通过在接收对侧终端发送的多个声音信号后，对声音信号进行匹配度的判断，并根据匹配度确定本侧终端的用户的声音信号(即回声信号)，进而滤除多个声音信号中的回声信号，提供了一种消除语音通话过程的上行路径的回声信号的方案，在原有回声消除方案的基础上，进一步地降低了回声信号的干扰，提升了用户的使用体验。

声学回声又分为直接回声和间接回声：

(1)直接回声是指扬声器播放出来的声音未经任何反射直接进入麦克风。这种回声延迟最短，它与远端说话者的语音能量，扬声器与话筒之间的距离、角度、扬声器的播放音量以及话筒的拾取灵敏度等因素相关；

(2)间接回声是指扬声器播放的声音经不同的路径一次或多次反射后进入麦克风所产生的回声集合。

语音传输是采用分组交换技术实现的一种全新的电信业务，传送的语音信号要经过编码、压缩、打包等一系列处理，这不仅造成回声路径的延迟较大，而且延迟抖动也较大。当回声返回时间超过10ms时，人耳就可听到明显的回声了，会干扰正常通话。对于时延相对较大的IP网络环境，时延很容易就达到50ms，因此必须清除回声。

具体地，在终端C和终端D进行语音通话过程中，终端C和终端D中设置两种回声消除装置，第一种回声消除装置用于消除下行路径中对侧终端的回声信息，第二种回声消除装置用于消除上行路径中本侧终端的回声信息。

例如，终端C向终端D发出一个声音信号，终端D的第一回声消除装置采集声音信号，记作C声音信号，在终端D发出反馈的声音信号时，滤除C声音信号。对于终端D发出反馈的声音信号，通过第二回声消除装置采集D声音信号的声纹特征信息，在C终端反馈的声音信号包括D声音信号时，滤除D声音信号，以进一步地降低回声信号对语音通话的干扰。

值得特别指出的是，侧音是通信术语，通常指在终端设备(例如电话机)中，声音信号经处理后，其中一部分回馈到自身接收电话的那部分信号，也即侧音可以使得本侧终端的用户更清楚地听清楚自己的声音，因此，为了保证语音通话过程中的侧音不受干扰，需要在产生侧音之前执行回声消除方案，也即在执行回声消除方案后，降低了本侧终端的用户受到对侧终端反馈的回声信号的干扰，然后本侧终端产生侧音，一方面，保证侧音不会作为回声信号被消除(由于本侧终端的侧音信号与待消除的回声信号的特征匹配度高)，另一方面，在消除回声信号后保留了侧音信号，以提高通话质量。

在上述技术方案中，优选地，在接收对侧终端发送的多个声音信号前，具体包括以下步骤：在将用户声音信号发送至对侧终端时，采集用户声音信号的声纹特征信息；将用户声音信号的声纹特征信息存储为预存声纹特征信息。

在该技术方案中，通过对本侧终端的用户的声音信号进行采集，进而存储对应的声纹特征信息，提高了回声消除方案的可靠性。

其中，声纹特征信息包括：

(1)与人类发音机制的解剖学结构有关的声学特征，如频谱、倒频谱、共振峰、基音和反射系数等；

(2)与教育水平相关的用语习惯，如语义、修辞和语音等；

(3)与个人性格相关的韵律、节奏、速度、语调和音量等特征。

在上述任一项技术方案中，优选地，在接收对侧终端发送的多个声音信号前，具体还包括以下步骤：根据用户指令设置预设匹配度。

在该技术方案中，通过根据用户指令设置预设匹配度，提高了回声信号识别的准确性。

其中，预设匹配度是基于模式识别技术的术语，模式识别技术可以是模板匹配方法、最近邻方法、神经网络方法、隐式马尔科夫方法和多项式分类器方法等。

在上述任一项技术方案中，优选地，将匹配度高于预设匹配度的任一声音信号确定为回声信号，并从多个声音信号中滤除回声信号，具体包括以下步骤：将匹配度高于预设匹配度的任一声音信号确定为回声信号，并确定预设匹配度对应的滤波模型；基于最小均方差准则对滤波模型的系数进行求解；根据求解系数后的滤波模型滤除回声信号。

在该技术方案中，由于不同的匹配度对应于不同的用户需求，另一方面也决定了滤波速度，因此，通过设置预设匹配度与滤波模型的对应关系，提供了灵活的回声消除方案，另外，最小均方差准则即使得输出信号序列与期望输出信号序列之间的均方差最小，以此确定滤波模型的参数。

在上述任一项技术方案中，优选地，还包括：对回声信号进行回声抑制处理。

在该技术方案中，回声抑制处理是一种非线性的回声消除。它通过简单的比较器将接收到准备由扬声器播放的声音与当前话筒拾取的声音的电平进行比较。如果前者高于一个电平阈值，那么就允许传至扬声器，而且话筒被关闭，以阻止它拾取扬声器播放的声音而引起远端回声。如果话筒拾取的声音电平高于另一个电平阈值，扬声器被禁止，以达到消除回声的目的。

根据本发明的第二方面，还提出了一种回声消除装置，包括：接收单元，用于接收对侧终端发送的多个声音信号；解析单元，用于解析多个声音信号中的任一声音信号的声纹特征信息；确定单元，用于确定任一声音信号的声纹特征信息与预存声纹特征信息的匹配度；回声消除单元，用于将匹配度高于预设匹配度的任一声音信号确定为回声信号，并从多个声音信号中滤除回声信号。

声学回声又分为直接回声和间接回声：

在上述技术方案中，优选地，还包括：采集单元，用于在将用户声音信号发送至对侧终端时，采集用户声音信号的声纹特征信息；存储单元，用于将用户声音信号的声纹特征信息存储为预存声纹特征信息。

其中，声纹特征信息包括：

(2)与教育水平相关的用语习惯，如语义、修辞和语音等；

在上述任一项技术方案中，优选地，还包括：设置单元，用于根据用户指令设置预设匹配度。

在上述任一项技术方案中，优选地，确定单元还用于：将匹配度高于预设匹配度的任一声音信号确定为回声信号，并确定预设匹配度对应的滤波模型；确定单元还用于：基于最小均方差准则对滤波模型的系数进行求解；回声消除单元还用于：根据求解系数后的滤波模型滤除回声信号。

在上述任一项技术方案中，优选地，回声消除单元还用于：对回声信号进行回声抑制处理。

根据本发明第三方面，还提出了一种终端，包括上述任一项技术方案所述的回声消除装置，因此，该终端具有和上述任一项技术方案所述的回声消除装置相同的技术效果，在此不再赘述。

通过上述技术方案，通过在接收对侧终端发送的多个声音信号后，对声音信号进行匹配度的判断，并根据匹配度确定本侧终端的用户的声音信号(即回声信号)，进而滤除多个声音信号中的回声信号，提供了一种消除语音通话过程的上行路径的回声信号的方案，在原有回声消除方案的基础上，进一步地降低了回声信号的干扰，提升了用户的使用体验。

附图说明

图1示出了根据本发明的实施例的回声消除方法的示意流程图；

图2示出了根据本发明的实施例的回声消除装置的示意框图；

图3示出了根据本发明的实施例的终端的示意框图；

图4示出了根据本发明的实施例的回声消除方案的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的实施例的回声消除方法的示意流程图。

如图1所示，根据本发明的实施例的回声消除方法，包括：步骤102，接收对侧终端发送的多个声音信号；步骤104，解析多个声音信号中的任一声音信号的声纹特征信息；步骤106，确定任一声音信号的声纹特征信息与预存声纹特征信息的匹配度；步骤108，将匹配度高于预设匹配度的任一声音信号确定为回声信号，并从多个声音信号中滤除回声信号。

声学回声又分为直接回声和间接回声：

其中，声纹特征信息包括：

(2)与教育水平相关的用语习惯，如语义、修辞和语音等；

图2示出了根据本发明的实施例的回声消除装置的示意框图。

如图2所示，根据本发明的实施例的回声消除装置200，包括：接收单元202，用于接收对侧终端发送的多个声音信号；解析单元204，用于解析多个声音信号中的任一声音信号的声纹特征信息；确定单元206，用于确定任一声音信号的声纹特征信息与预存声纹特征信息的匹配度；回声消除单元208，用于将匹配度高于预设匹配度的任一声音信号确定为回声信号，并从多个声音信号中滤除回声信号。

声学回声又分为直接回声和间接回声：

在上述技术方案中，优选地，还包括：采集单元210，用于在将用户声音信号发送至对侧终端时，采集用户声音信号的声纹特征信息；存储单元212，用于将用户声音信号的声纹特征信息存储为预存声纹特征信息。

其中，声纹特征信息包括：

(2)与教育水平相关的用语习惯，如语义、修辞和语音等；

在上述任一项技术方案中，优选地，还包括：设置单元214，用于根据用户指令设置预设匹配度。

在上述任一项技术方案中，优选地，确定单元206还用于：将匹配度高于预设匹配度的任一声音信号确定为回声信号，并确定预设匹配度对应的滤波模型；确定单元206还用于：基于最小均方差准则对滤波模型的系数进行求解；回声消除单元208还用于：根据求解系数后的滤波模型滤除回声信号。

在上述任一项技术方案中，优选地，回声消除单元208还用于：对回声信号进行回声抑制处理。

图3示出了根据本发明的实施例的终端的示意框图。

如图3所示，根据本发明的实施例的终端300，包括：终端本体，沿声音信号的下行路径依次设置有电连接的拾音器、编码器、第一回声消除装置和扬声器，第一回声消除装置用于消除对侧终端的用户的回声信号；如上述任一项技术方案所述的回声消除装置200，作为第二回声消除装置设置于第一回声消除装置与扬声器之间，第二回声消除装置用于对消除声音信号的上行路径的回声信号。因此，该终端300具有和上述任一项技术方案所述的回声消除装置200相同的技术效果，在此不再赘述。

图4示出了根据本发明的实施例的回声消除方案的示意图。

如图4所示，根据本发明的实施例的回声消除方案，包括：本侧终端400和对侧终端500，其中，本侧终端400包括拾音器402、编码-解码器404、DSP EC(DSP EC，Digital Signal Processor Echo Cancellation，回声消除器)1 406、DSP EC2 408、射频模块410和扬声器412，对侧终端500包括拾音器502、编码-解码器504、DSP EC1 506、DSP EC2 508、射频模块510和扬声器512。

其中，DSP EC1 406用于消除对侧终端500的回声信号，DSP EC2408用于消除本侧终端400的回声信号，也即下行回声514，DSP EC4 506用于消除对侧终端500的回声信号，DSP EC3 508用于消除本侧终端400的回声信号，也即上行回声414。

另外，可以将DSP EC1 406和DSP EC2 408的处理顺序互换，同理，可以将DSP EC3 508和DSP EC4 506的处理顺序互换，或者不设置DSPEC1 406和DSP EC4 506。

考虑到相关技术中提出的进一步地改善回声干扰的技术问题，本发明提出了一种新的回声消除方案，通过在接收对侧终端发送的多个声音信号后，对声音信号进行匹配度的判断，并根据匹配度确定本侧终端的用户的声音信号(即回声信号)，进而滤除多个声音信号中的回声信号，提供了一种消除语音通话过程的上行路径的回声信号的方案，在原有回声消除方案的基础上，进一步地降低了回声信号的干扰，提升了用户的使用体验。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种回声消除方法，其特征在于，包括：

接收对侧终端发送的多个声音信号；

解析所述多个声音信号中的任一声音信号的声纹特征信息；

确定所述任一声音信号的声纹特征信息与预存声纹特征信息的匹配度；

将所述匹配度高于预设匹配度的任一声音信号确定为回声信号，并从所述多个声音信号中滤除所述回声信号。

2.根据权利要求1所述的回声消除方法，其特征在于，在接收对侧终端发送的多个声音信号前，具体包括以下步骤：

在将用户声音信号发送至所述对侧终端时，采集所述用户声音信号的声纹特征信息；

将所述用户声音信号的声纹特征信息存储为所述预存声纹特征信息。

3.根据权利要求1所述的回声消除方法，其特征在于，在接收对侧终端发送的多个声音信号前，具体还包括以下步骤：

根据用户指令设置所述预设匹配度。

4.根据权利要求1至3中任一项所述的回声消除方法，其特征在于，将所述匹配度高于预设匹配度的任一声音信号确定为回声信号，并从所述多个声音信号中滤除所述回声信号，具体包括以下步骤：

将所述匹配度高于预设匹配度的任一声音信号确定为回声信号，并确定所述预设匹配度对应的滤波模型；

基于最小均方差准则对所述滤波模型的系数进行求解；

根据求解系数后的滤波模型滤除所述回声信号。

5.根据权利要求1至3中任一项所述的回声消除方法，其特征在于，还包括：

对所述回声信号进行回声抑制处理。

6.一种回声消除装置，其特征在于，包括：

接收单元，用于接收对侧终端发送的多个声音信号；

解析单元，用于解析所述多个声音信号中的任一声音信号的声纹特征信息；

确定单元，用于确定所述任一声音信号的声纹特征信息与预存声纹特征信息的匹配度；

回声消除单元，用于将所述匹配度高于预设匹配度的任一声音信号确定为回声信号，并从所述多个声音信号中滤除所述回声信号。

7.根据权利要求6所述的回声消除装置，其特征在于，还包括：

采集单元，用于在将用户声音信号发送至所述对侧终端时，采集所述用户声音信号的声纹特征信息；

存储单元，用于将所述用户声音信号的声纹特征信息存储为预存声纹特征信息。

8.根据权利要求6所述的回声消除装置，其特征在于，还包括：

设置单元，用于根据用户指令设置所述预设匹配度。

9.根据权利要求6至8中任一项所述的回声消除装置，其特征在于，

所述确定单元还用于：将所述匹配度高于预设匹配度的任一声音信号确定为回声信号，并确定所述预设匹配度对应的滤波模型；

所述确定单元还用于：基于最小均方差准则对所述滤波模型的系数进行求解；

所述回声消除单元还用于：根据求解系数后的滤波模型滤除所述回声信号。

10.根据权利要求6至8中任一项所述的回声消除装置，其特征在于，

所述回声消除单元还用于：对所述回声信号进行回声抑制处理。

11.一种终端，其特征在于，包括：

终端本体，沿声音信号的下行路径依次设置有电连接的拾音器、编码器、第一回声消除装置和扬声器，所述第一回声消除装置用于消除对侧终端的用户的回声信号；

如权利要求6至10中任一项所述的回声消除装置，作为第二回声消除装置设置于所述第一回声消除装置与所述扬声器之间，所述第二回声消除装置用于消除所述声音信号的上行路径的回声信号。