CN113225442B - 一种消除回声的方法及装置 - Google Patents
一种消除回声的方法及装置 Download PDFInfo
- Publication number
- CN113225442B CN113225442B CN202110409566.XA CN202110409566A CN113225442B CN 113225442 B CN113225442 B CN 113225442B CN 202110409566 A CN202110409566 A CN 202110409566A CN 113225442 B CN113225442 B CN 113225442B
- Authority
- CN
- China
- Prior art keywords
- frame
- echo
- state
- sound signal
- double
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
本申请涉及音频处理技术领域,提供了一种消除回声的方法及装置,以解决双讲状态下的近端的语音信号被滤除的问题,该方法包括:对声音采集设备获取到的声音信号,进行回声检测和双讲检测,并获得回声检测结果和双讲检测结果;再基于第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,确定第一帧声音信号的通话状态,第二帧声音信号位于第一帧声音信号之前;基于第一帧声音信号的通话状态调整声音信号。确定第一帧声音信号的通话状态是否处于双讲状态,基于第一帧声音信号的通话状态对消除回声滤波器的参数进行调整,以免出现双讲状态下的近端的语音信号被滤除的情况,提高通话质量。
Description
技术领域
本申请涉及音频处理技术领域,提供了一种消除回声的方法及装置。
背景技术
在双工通信系统中,近端扬声器播放出来的声音被近端麦克风拾取至近端的通信设备形成声学回声,经传输又返回了远端的通信设备,并通过远端的扬声器播放出来,使得远端谈话者在接收信号的同时也听到了自己的声音。回声信号对语音传输造成干扰,严重损伤通信质量以及降低语音识别率。
声学回声抵消器(Acoustic Echo Cancellor,AEC)是一种信号处理技术,AEC模块在不损伤近端的语音信号的情况下,利用内部的自适应滤波器和非线性滤波器,消除麦克风采集到的噪声和回声信号,保障对话不被回声信号所干扰,提升通话质量。但在双讲状态(即多方同时说话的状态)下,近端麦克风采集到的语音信号包括远端的回声信号和近端的语音信号,其中绝大多数为近端的语音信号,但滤波器可能将近端的语音信号当作远端的回声信号滤除掉,造成近端的语音信号衰减,影响通信质量。
发明内容
本申请实施例提供一种消除回声的方法及装置,以解决双讲状态下的近端的语音信号被滤除的问题。
第一方面,本申请实施例提供了一种消除回声的方法,包括:
使用声音采集设备获取声音信号;
对所述声音信号进行回声检测和双讲检测,获得回声检测结果和双讲检测结果;
基于第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,确定第一帧声音信号的通话状态,所述第二帧声音信号位于所述第一帧声音信号之前;
基于所述第一帧声音信号的通话状态调整所述声音信号。
可选的,所述对所述声音信号进行回声检测和双讲检测,获得回声检测结果和双讲检测结果,包括:
将所述第一帧声音信号输入回声检测模块进行回声检测,获得所述第一帧声音信号的回声检测结果,所述第一帧声音信号的回声检测结果为以下任意一种:回声状态、模糊回声状态和非回声状态;以及,
将所述第一帧声音信号输入双讲检测模块进行双讲检测,获得所述第一帧声音信号的双讲检测结果,所述第一帧声音信号的双讲检测结果为以下任意一种:双讲状态、模糊双讲状态和非双讲状态。
可选的,所述基于第一帧声音信号的回声检测结果、所述第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,确定所述第一帧声音信号的通话状态,包括:
响应于所述第一帧声音信号的回声检测结果为回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态或非双讲状态,确定所述第一帧声音信号的通话状态为回声状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,确定所述第一帧声音信号的通话状态为模糊回声状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态,确定所述第一帧声音信号的通话状态为模糊双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,则判定所述第一帧声音信号的通话状态为近端状态;或,
若所述第一帧声音信号的回声检测结果为回声状态、且所述第一帧声音信号的双讲检测结果为双讲状态,或,所述第一帧声音信号的回声检测结果为模糊回声状态、且所述第一帧声音信号的双讲检测结果为模糊双讲状态,则将所述第二帧声音信号的通话状态作为所述第一帧声音信号的通话状态。
可选的,所述基于所述第一帧声音信号的通话状态调整所述声音信号,包括:
基于所述第一帧声音信号的通话状态,对消除回声滤波器进行调整,以使所述消除回声滤波器消除所述声音信号中包含的回声信号。
可选的,所述消除回声滤波器包括自适应滤波器和非线性滤波器;
所述基于所述第一帧声音信号的通话状态,对消除回声滤波器进行调整,包括:
若所述第一帧声音信号的通话状态为模糊回声状态或回声状态,则增大所述自适应滤波器的步长,并调用所述非线性滤波器抑制所述回声信号;或,
若所述第一帧声音信号的通话状态为近端状态,则停止运行所述自适应滤波器和所述非线性滤波器;或,
若所述第一帧声音信号的状态为模糊双讲状态或双讲状态,则缩小所述自适应滤波器的步长,并调用非线性滤波器欠压制所述回声信号。
可选的,所述第二帧声音信号是所述第一帧声音信号的上一帧声音信号。
第二方面,本申请实施例还提供了一种消除回声的装置,包括:
采集单元,用于使用声音采集设备获取声音信号;
检测单元,用于对所述声音信号进行回声检测和双讲检测,获得回声检测结果和双讲检测结果;
处理单元,用于基于第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,确定第一帧声音信号的通话状态,所述第二帧声音信号位于所述第一帧声音信号之前;
回声消除单元,用于基于所述第一帧声音信号的通话状态调整所述声音信号。
可选的,所述检测单元用于:
将所述第一帧声音信号输入回声检测模块进行回声检测,获得所述第一帧声音信号的回声检测结果,所述第一帧声音信号的回声检测结果为以下任意一种:回声状态、模糊回声状态和非回声状态;以及,
将所述第一帧声音信号输入双讲检测模块进行双讲检测,获得所述第一帧声音信号的双讲检测结果,所述第一帧声音信号的双讲检测结果为以下任意一种:双讲状态、模糊双讲状态和非双讲状态。
可选的,所述处理单元用于:
响应于所述第一帧声音信号的回声检测结果为回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态或非双讲状态,确定所述第一帧声音信号的通话状态为回声状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,确定所述第一帧声音信号的通话状态为模糊回声状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态,确定所述第一帧声音信号的通话状态为模糊双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,则判定所述第一帧声音信号的通话状态为近端状态;或,
若所述第一帧声音信号的回声检测结果为回声状态、且所述第一帧声音信号的双讲检测结果为双讲状态,或,所述第一帧声音信号的回声检测结果为模糊回声状态、且所述第一帧声音信号双讲检测结果为模糊双讲状态,则将所述第二帧声音信号的通话状态作为所述第一帧声音信号的通话状态。
可选的,所述回声消除单元用于:
基于所述第一帧声音信号的通话状态,对消除回声滤波器进行调整,以使所述消除回声滤波器消除所述声音信号中包含的回声信号。
可选的,所述消除回声滤波器包括自适应滤波器和非线性滤波器,所述回声消除单元用于:
若所述第一帧声音信号的通话状态为模糊回声状态或回声状态,则增大所述自适应滤波器的步长,并调用所述非线性滤波器抑制所述回声信号;或,
若所述第一帧声音信号的通话状态为近端状态,则停止运行所述自适应滤波器和所述非线性滤波器;或,
若所述第一帧声音信号的状态为模糊双讲状态或双讲状态,则缩小所述自适应滤波器的步长,并调用非线性滤波器欠压制所述回声信号。
可选的,所述第二帧声音信号是所述第一帧声音信号的上一帧声音信号。
第三方面,本申请实施例还提供了一种消除回声设备,包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行上述任意一种消除回声的方法的步骤。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其包括程序代码,当程序产品在消除回声设备上运行时,所述程序代码用于使所述消除回声设备执行上述任意一种消除回声的方法的步骤。
本申请有益效果如下:
本申请实施例提供了一种消除回声的方法及装置,该方法包括:对声音采集设备获取到的声音信号,进行回声检测和双讲检测,并获得回声检测结果和双讲检测结果;再基于第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,确定第一帧声音信号的通话状态,第二帧声音信号位于第一帧声音信号之前;基于第一帧声音信号的通话状态调整声音信号。在AEC模块中添加回声检测模块和双讲检测模块,对声音信号进行回声检测和双讲检测,再基于第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,实时判断第一帧声音信号是否处于双讲状态,对消除回声滤波器的参数进行调整,以免出现双讲状态下的近端的语音信号被滤除的情况,提高通话质量。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1a为双工通信系统的架构示意图;
图1b为AEC模块的结构示意图;
图2为本申请实施例中消除回声的流程示意图;
图3为本申请实施例中一种消除回声装置的结构示意图;
图4为本申请实施例中的一种消除回声设备的结构示意图;
图5为应用本申请实施例的一种计算装置的一个硬件组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
如图1a所示的双工通信系统中,近端扬声器播放出来的声音被近端麦克风拾取至近端的通信设备形成声学回声,经传输又返回了远端的通信设备,并通过远端的扬声器播放出来,使得远端谈话者在接收信号的同时,也听到了自己的声音。回声信号对语音传输造成干扰,严重损伤通信质量以及降低语音识别率。
在相关技术中,通常采用AEC消除语音通信中的回声信号。如图1b所示,AEC模块在不损伤近端的语音信号的情况下,利用内部的自适应滤波器和非线性滤波器,消除麦克风采集到的噪声和回声信号,保障对话不被回声信号所干扰,提升通话质量。但在双讲状态(即多方同时说话的状态)下,近端麦克风采集到的语音信号包括远端的回声信号和近端的语音信号,其中绝大多数为近端的语音信号,但滤波器可能将近端的语音信号当作远端的回声信号滤除掉,造成近端的语音信号衰减,影响通信质量。有鉴于此,本申请实施例提供了一种新的消除回声的方法及装置。
参阅图1a示出的架构示意图,若通信设备A为近端通信设备,则对端的通信设备B为远端通信设备;反之,若通信设备B为近端通信设备,则对端的通信设备A为远端通信设备。对于双工通信系统中的每台通信设备来说,均可使用本申请实施例提出的消除回声的方法及装置,消除通信中的回声信号,提高通信质量。但为了便于描述,后续仅以一台通信设备为例进行描述。
参阅图2所示的流程示意图,对本申请实施例提出的消除回声的方法进行介绍。
S201:使用声音采集设备获取声音信号。
在通信过程中,近端通信设备的麦克风、话筒等设备,均可作为声音采集设备实时采集近端的声音信号。
S202:对声音信号进行回声检测和双讲检测,获得回声检测结果和双讲检测结果。
参阅图1b所示的结构示意图,AEC模块中添加了回声检测模块、双讲检测模块。具体地,将第一帧声音信号输入回声检测模块,基于回声检测模块对声音信号进行回声检测,获得第一帧声音信号的回声检测结果。以及,将第一帧声音信号输入双讲检测模块中,基于双讲检测模块对第一帧声音信号进行双讲检测,获得第一帧声音信号的双讲检测结果。其中,双讲检测模块可以采用盖格尔(Geigle)算法、相干(Coherence)算法、关联(Relation)算法等算法进行检测,在此不做限定。
第一帧声音信号的回声检测结果包括但不限于以下任意一种:回声状态、模糊回声状态和非回声状态。其中,回声状态指的是,第一帧声音信号中一定含有远端的回声信号;模糊回声状态指的是,第一帧声音信号中可能含有远端的回声信号;非回声状态指的是,第一帧声音信号中一定不含有远端的回声信号。需要说明的是,本申请实施例中所列举的第一帧声音信号的回声检测结果只是举例说明,除本申请实施例中所列举的回声检测结果以外的其他回声检测结果,也在本申请实施例的保护范围之内。
第一帧声音信号的双讲检测结果包括但不限于以下任意一种:双讲状态、模糊双讲状态和非双讲状态。其中,双讲状态指的是,第一帧声音信号中同时包含近端的语音信号和远端的回声信号;模糊双讲状态指的是,第一帧声音信号中可能同时包含近端的语音信号和远端的回声信号;非双讲状态指的是,第一帧声音信号中不会同时包含近端的语音信号和远端的回声信号。需要说明的是,本申请实施例中所列举的第一帧声音信号的双讲检测结果只是举例说明,除本申请实施例中所列举的双讲检测结果以外的其他双讲检测结果,也在本申请实施例的保护范围之内。
S203:基于第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,确定第一帧声音信号的通话状态,第二帧声音信号位于第一帧声音信号之前。
第一帧声音信号的回声检测结果包括但不限于以下任意一种:回声状态、模糊回声状态和非回声状态;第一帧声音信号的双讲检测结果包括但不限于以下任意一种:双讲状态、模糊双讲状态和非双讲状态。经过排列组合,可出现如表1所示的多个组合,以及每个组合所确定的第一帧声音信号的通话状态。
表1
(1)响应于第一帧声音信号的回声检测结果为回声状态、且第一帧声音信号的双讲检测结果为模糊双讲状态或非双讲状态,确定第一帧声音信号的通话状态为回声状态;
(2)响应于第一帧声音信号的回声检测结果为模糊回声状态、且第一帧声音信号的双讲检测状态为模糊双讲状态或非双讲状态,确定第一帧声音信号的通话状态为模糊回声状态;
(3)响应于第一帧声音信号的回声检测结果为非回声状态、且第一帧声音信号的双讲检测结果为双讲状态,确定第一帧声音信号的通话状态为双讲状态;
(4)响应于第一帧声音信号的回声检测结果为模糊回声状态、且第一帧声音信号的双讲检测结果为双讲状态,确定第一帧声音信号的通话状态为双讲状态;
(5)响应于第一帧声音信号的回声检测结果为非回声状态、且第一帧声音信号的双讲检测结果为模糊双讲状态,确定第一帧声音信号的通话状态为模糊双讲状态;
(6)响应于第一帧声音信号的回声检测结果为非回声状态、且第一帧声音信号的双讲检测结果为非双讲状态,则判定第一帧声音信号的通话状态为近端状态(即仅有近端一侧在说话的状态);
(7)若第一帧声音信号的回声检测结果为回声状态、且第一帧声音信号的双讲检测结果为双讲状态,或,第一帧声音信号的回声检测结果为模糊回声状态、且第一帧声音信号的双讲检测结果为模糊双讲状态,则将第二帧声音信号的通话状态作为第一帧声音信号的通话状态。
第二帧声音信号位于第一帧声音信号之前,其中,本申请实施例还提出了一种优选的实施例,第二帧声音信号是第一帧声音信号的上一帧声音信号。当第一帧声音信号的回声检测结果为回声状态、且第一帧声音信号的双讲检测结果为双讲状态,或,第一帧声音信号的回声检测结果为模糊回声状态、且第一帧声音信号的双讲检测结果为模糊双讲状态时,将上一帧声音信号的通话状态作为第一帧声音信号的通话状态,无需重新调整消除回声滤波器,缩短消除回声所花费的时间,提高工作效率和通话质量。
S204:基于第一帧声音信号的通话状态调整声音信号。
可选的,基于第一帧声音信号的通话状态,对消除回声滤波器进行调整,以使消除回声滤波器消除声音信号中包含的回声信号。
具体地,消除回声滤波器包括自适应滤波器和非线性滤波器,当第一帧声音信号处于不同的通话状态时,重新调整自适应滤波器和非线性滤波器,在不损伤近端的语音信号的同时,达到消除回声信号的目的。
(1)若第一帧声音信号的通话状态为模糊回声状态或回声状态,则增大自适应滤波器的步长,并调用非线性滤波器抑制回声信号。
当第一帧声音信号的通话状态为模糊回声状态时,可增大自适应滤波器的步长,以加速自适应滤波器跟踪回声信号的速度,并调用非线性滤波器根据第一帧声音信号的频点特征,对回声信号进行压制处理,以达到快速识别回声信号、抑制回声信号、消除回声信号的目的。
当第一帧声音信号的通话状态为回声状态时,自适应滤波器的步长调整到步长最大值,以将自适应滤波器跟踪回声信号的速度调整到最大值,并调用非线性滤波器全面压制回声信号,以达到快速识别回声信号、抑制回声信号、消除回声信号的目的。
(2)若第一帧声音信号的通话状态为近端状态,则停止运行自适应滤波器和非线性滤波器。
当第一帧声音信号的通话状态为近端状态时,此时的第一帧声音信号为近端的语音信号,不存在远端的回声信号,因此,无需调用自适应滤波器和非线性滤波器消除回声信号。
(3)若第一帧声音信号的通话状态为模糊双讲状态或双讲状态,则缩小自适应滤波器的步长,并调用非线性滤波器抑制回声信号。
当第一帧声音信号的通话状态为模糊双讲状态时,缩小自适应滤波器的步长,减缓自适应滤波器跟踪回声信号的速度,避免自适应滤波器将近端的语音信号误识别为回声信号。并调用非线性滤波器根据第一帧声音信号的频点特征,对回声信号进行欠压制处理,以达到快速识别回声信号、抑制回声信号、消除回声信号的目的。
当第一帧声音信号的通话状态为双讲状态时,自适应滤波器对非回声信号不更新,还会停止针对非回声信号的参数估计,因此,非线性滤波器不会将非回声信号当做回声信号进行压制处理,有利于提升第一帧声音信号中的信号连续性,减少听觉上的声音断续感,提高通话质量。同时,自适应滤波器保留滤波功能,滤除第一帧声音信号中的回声信号,并调用非线性滤波器对回声信号进行欠压制处理,以保留第一帧声音信号中较多的近端的语音信号。
本申请实施例提供的消除回声方法,可根据第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,实时判断第一帧声音信号的通话状态;并根据第一帧声音信号的通话状态,对消除回声滤波器的参数进行自适应调整,使得调整后的消除回声滤波器滤除声音信号中的噪声和回声,保留采集到的近端的语音信号,减少听觉上的声音断续感,提高通话质量,避免出现在双讲状态下,消除回声滤波器滤除近端的语音信号的情况。
与上述方法实施例基于同一发明构思,本申请实施例还提供了一种消除回声的装置,参阅图3所示的结构示意图,该装置中可以包括采集单元301、检测单元302、处理单元303和回声消除单元304,其中,
采集单元301,用于使用声音采集设备获取声音信号;
检测单元302,用于对所述声音信号进行回声检测和双讲检测,获得回声检测结果和双讲检测结果;
处理单元303,用于基于第一帧声音信号的回声检测结果、第一帧声音信号的双讲检测结果和第二帧声音信号的通话状态,确定第一帧声音信号的通话状态,所述第二帧声音信号位于所述第一帧声音信号之前;
回声消除单元304,用于基于所述第一帧声音信号的通话状态调整所述声音信号。
可选的,所述检测单元302用于:
将所述第一帧声音信号输入回声检测模块进行回声检测,获得所述第一帧声音信号的回声检测结果,所述第一帧声音信号的回声检测结果为以下任意一种:回声状态、模糊回声状态和非回声状态;以及,
将所述第一帧声音信号输入双讲检测模块进行双讲检测,获得所述第一帧声音信号的双讲检测结果,所述第一帧声音信号的双讲检测结果为以下任意一种:双讲状态、模糊双讲状态和非双讲状态。
可选的,所述处理单元303用于:
响应于所述第一帧声音信号的回声检测结果为回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态或非双讲状态,确定所述第一帧声音信号的通话状态为回声状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,确定所述第一帧声音信号的通话状态为模糊回声状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态,确定所述第一帧声音信号的通话状态为模糊双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,则判定所述第一帧声音信号的通话状态为近端状态;或,
若所述第一帧声音信号的回声检测结果为回声状态、且所述第一帧声音信号的双讲检测结果为双讲状态,或,所述第一帧声音信号的回声检测结果为模糊回声状态、且所述第一帧声音信号双讲检测结果为模糊双讲状态,则将所述第二帧声音信号的通话状态作为所述第一帧声音信号的通话状态。
可选的,所述回声消除单元304用于:
基于所述第一帧声音信号的通话状态,对消除回声滤波器进行调整,以使所述消除回声滤波器消除所述声音信号中包含的回声信号。
可选的,所述消除回声滤波器包括自适应滤波器和非线性滤波器,所述回声消除单元304用于:
若所述第一帧声音信号的通话状态为模糊回声状态或回声状态,则增大所述自适应滤波器的步长,并调用所述非线性滤波器抑制所述回声信号;或,
若所述第一帧声音信号的通话状态为近端状态,则停止运行所述自适应滤波器和所述非线性滤波器;或,
若所述第一帧声音信号的状态为模糊双讲状态或双讲状态,则缩小所述自适应滤波器的步长,并调用非线性滤波器欠压制所述回声信号。
可选的,所述第二帧声音信号是所述第一帧声音信号的上一帧声音信号。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本申请示例性实施方式的消除回声的方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的消除回声设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种消除回声设备,参阅图4所示,消除回声设备400可以至少包括处理器401、以及存储器402。其中,所述存储器402存储有程序代码,当所述程序代码被所述处理器401执行时,使得所述处理器401执行上述任意一种消除回声的方法的步骤。
在一些可能的实施方式中,根据本申请的计算装置可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的消除回声的方法中的步骤。例如,处理器可以执行如图2中所示的步骤。
下面参照图5来描述根据本申请的这种实施方式的计算装置500。图5的计算装置500仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算装置500以通用计算装置的形式表现。计算装置500的组件可以包括但不限于:上述至少一个处理单元501、上述至少一个存储单元502、连接不同系统组件(包括存储单元502和处理单元501)的总线503。
总线503表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元502可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)5021和/或高速缓存存储单元5022,还可以进一步包括只读存储器(ROM)5023。
存储单元502还可以包括具有一组(至少一个)程序模块5024的程序/实用工具5025,这样的程序模块5024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算装置500也可以与一个或多个外部设备504(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与计算装置500交互的设备通信,和/或与使得该计算装置500能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口505进行。并且,计算装置500还可以通过网络适配器506与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器506通过总线503与用于计算装置500的其它模块通信。应当理解,尽管图中未示出,可以结合计算装置500使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
与上述方法实施例基于同一发明构思,本申请提供的消除回声的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在消除回声设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的消除回声的方法中的步骤,例如,消除回声设备可以执行如图2中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种消除回声的方法,其特征在于,包括:
使用声音采集设备获取声音信号;
将所述第一帧声音信号输入回声检测模块进行回声检测,获得所述第一帧声音信号的回声检测结果,所述第一帧声音信号的回声检测结果为以下任意一种:回声状态、模糊回声状态和非回声状态;以及,
将所述第一帧声音信号输入双讲检测模块进行双讲检测,获得所述第一帧声音信号的双讲检测结果,所述第一帧声音信号的双讲检测结果为以下任意一种:双讲状态、模糊双讲状态和非双讲状态;
响应于所述第一帧声音信号的回声检测结果为回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态或非双讲状态,确定所述第一帧声音信号的通话状态为回声状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,确定所述第一帧声音信号的通话状态为模糊回声状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态,确定所述第一帧声音信号的通话状态为模糊双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,则判定所述第一帧声音信号的通话状态为近端状态;或,
若所述第一帧声音信号的回声检测结果为回声状态、且所述第一帧声音信号的双讲检测结果为双讲状态,或,所述第一帧声音信号的回声检测结果为模糊回声状态、且所述第一帧声音信号的双讲检测结果为模糊双讲状态,则将所述第二帧声音信号的通话状态作为所述第一帧声音信号的通话状态;其中,所述第二帧声音信号位于所述第一帧声音信号之前;
基于所述第一帧声音信号的通话状态调整所述声音信号。
2.如权利要求1所述的方法,其特征在于,所述基于所述第一帧声音信号的通话状态调整所述声音信号,包括:
基于所述第一帧声音信号的通话状态,对消除回声滤波器进行调整,以使所述消除回声滤波器消除所述声音信号中包含的回声信号。
3.如权利要求2所述的方法,其特征在于,所述消除回声滤波器包括自适应滤波器和非线性滤波器;
所述基于所述第一帧声音信号的通话状态,对消除回声滤波器进行调整,包括:
若所述第一帧声音信号的通话状态为模糊回声状态或回声状态,则增大所述自适应滤波器的步长,并调用所述非线性滤波器抑制所述回声信号;或,
若所述第一帧声音信号的通话状态为近端状态,则停止运行所述自适应滤波器和所述非线性滤波器;或,
若所述第一帧声音信号的状态为模糊双讲状态或双讲状态,则缩小所述自适应滤波器的步长,并调用非线性滤波器欠压制所述回声信号。
4.如权利要求1-3任一项所述的方法,其特征在于,所述第二帧声音信号是所述第一帧声音信号的上一帧声音信号。
5.一种消除回声的装置,其特征在于,包括:
采集单元,用于使用声音采集设备获取声音信号;
检测单元,用于将所述第一帧声音信号输入回声检测模块进行回声检测,获得所述第一帧声音信号的回声检测结果,所述第一帧声音信号的回声检测结果为以下任意一种:回声状态、模糊回声状态和非回声状态;以及,
将所述第一帧声音信号输入双讲检测模块进行双讲检测,获得所述第一帧声音信号的双讲检测结果,所述第一帧声音信号的双讲检测结果为以下任意一种:双讲状态、模糊双讲状态和非双讲状态;
处理单元,用于基于响应于所述第一帧声音信号的回声检测结果为回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态或非双讲状态,确定所述第一帧声音信号的通话状态为回声状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,确定所述第一帧声音信号的通话状态为模糊回声状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为模糊回声状态,且所述第一帧声音信号的双讲检测结果为双讲状态,确定所述第一帧声音信号的通话状态为双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为模糊双讲状态,确定所述第一帧声音信号的通话状态为模糊双讲状态;或,
响应于所述第一帧声音信号的回声检测结果为非回声状态,且所述第一帧声音信号的双讲检测结果为非双讲状态,则判定所述第一帧声音信号的通话状态为近端状态;或,
若所述第一帧声音信号的回声检测结果为回声状态、且所述第一帧声音信号的双讲检测结果为双讲状态,或,所述第一帧声音信号的回声检测结果为模糊回声状态、且所述第一帧声音信号的双讲检测结果为模糊双讲状态,则将所述第二帧声音信号的通话状态作为所述第一帧声音信号的通话状态;其中,所述第二帧声音信号位于所述第一帧声音信号之前;
回声消除单元,用于基于所述第一帧声音信号的通话状态调整所述声音信号。
6.如权利要求5所述的装置,其特征在于,所述回声消除单元用于:
基于所述第一帧声音信号的通话状态,对消除回声滤波器进行调整,以使所述消除回声滤波器消除所述声音信号中包含的回声信号。
7.如权利要求6所述的装置,其特征在于,所述消除回声滤波器包括自适应滤波器和非线性滤波器,所述回声消除单元用于:
若所述第一帧声音信号的通话状态为模糊回声状态或回声状态,则增大所述自适应滤波器的步长,并调用所述非线性滤波器抑制所述回声信号;或,
若所述第一帧声音信号的通话状态为近端状态,则停止运行所述自适应滤波器和所述非线性滤波器;或,
若所述第一帧声音信号的状态为模糊双讲状态或双讲状态,则缩小所述自适应滤波器的步长,并调用非线性滤波器欠压制所述回声信号。
8.如权利要求5-7任一项所述的装置,其特征在于,所述第二帧声音信号是所述第一帧声音信号的上一帧声音信号。
9.一种消除回声设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行权利要求1~4中任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,其包括程序代码,当程序产品在消除回声设备上运行时,所述程序代码用于使所述消除回声设备执行权利要求1~4中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110409566.XA CN113225442B (zh) | 2021-04-16 | 2021-04-16 | 一种消除回声的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110409566.XA CN113225442B (zh) | 2021-04-16 | 2021-04-16 | 一种消除回声的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113225442A CN113225442A (zh) | 2021-08-06 |
CN113225442B true CN113225442B (zh) | 2022-09-02 |
Family
ID=77087569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110409566.XA Active CN113225442B (zh) | 2021-04-16 | 2021-04-16 | 一种消除回声的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113225442B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110995951A (zh) * | 2019-12-13 | 2020-04-10 | 展讯通信(上海)有限公司 | 基于双端发声检测的回声消除方法、装置及系统 |
CN112017679A (zh) * | 2020-08-05 | 2020-12-01 | 海尔优家智能科技(北京)有限公司 | 用于自适应滤波器系数更新的方法及装置、设备 |
CN112037810A (zh) * | 2020-09-25 | 2020-12-04 | 杭州朗和科技有限公司 | 一种回音处理方法、装置、介质和计算设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000252881A (ja) * | 1999-02-25 | 2000-09-14 | Mitsubishi Electric Corp | ダブルトーク検知装置並びにエコーキャンセラ装置およびエコーサプレッサー装置 |
KR20170032603A (ko) * | 2015-09-15 | 2017-03-23 | 삼성전자주식회사 | 전자 장치, 그의 반향 신호 제거 방법 및 비일시적 컴퓨터 판독가능 기록매체 |
CN108696648B (zh) * | 2018-05-16 | 2021-08-24 | 上海小度技术有限公司 | 一种短时语音信号处理的方法、装置、设备及存储介质 |
CN111294473B (zh) * | 2019-01-28 | 2022-01-04 | 展讯通信(上海)有限公司 | 信号处理方法及装置 |
CN110335618B (zh) * | 2019-06-06 | 2021-07-30 | 福建星网智慧软件有限公司 | 一种改善非线性回声抑制的方法及计算机设备 |
CN111277718B (zh) * | 2020-01-21 | 2021-10-08 | 上海推乐信息技术服务有限公司 | 一种回声消除系统及其方法 |
-
2021
- 2021-04-16 CN CN202110409566.XA patent/CN113225442B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110995951A (zh) * | 2019-12-13 | 2020-04-10 | 展讯通信(上海)有限公司 | 基于双端发声检测的回声消除方法、装置及系统 |
CN112017679A (zh) * | 2020-08-05 | 2020-12-01 | 海尔优家智能科技(北京)有限公司 | 用于自适应滤波器系数更新的方法及装置、设备 |
CN112037810A (zh) * | 2020-09-25 | 2020-12-04 | 杭州朗和科技有限公司 | 一种回音处理方法、装置、介质和计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113225442A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108141502B (zh) | 降低声学系统中的声学反馈的方法及音频信号处理设备 | |
KR100989266B1 (ko) | 스펙트럼 음향 특성에 기초한 더블 토크 검출 방법 | |
US5732134A (en) | Doubletalk detection by means of spectral content | |
CN106713570B (zh) | 一种回声消除方法和装置 | |
CN109716743B (zh) | 全双工语音通信系统和方法 | |
JP5125690B2 (ja) | 音響エコー除去装置 | |
US20200396329A1 (en) | Acoustic echo cancellation based sub band domain active speaker detection for audio and video conferencing applications | |
JP2012510779A (ja) | 音響的に過酷な環境におけるダブルトーク検出のためのシステム及び方法 | |
CN110995951B (zh) | 基于双端发声检测的回声消除方法、装置及系统 | |
US20220301577A1 (en) | Echo cancellation method and apparatus | |
CN106571147A (zh) | 用于网络话机声学回声抑制的方法 | |
CN111756906B (zh) | 一种语音信号的回声抑制方法、装置和计算机可读介质 | |
WO2019068115A1 (en) | ECHO CANCELLATION DEVICE AND METHOD THEREOF | |
WO2019239977A1 (ja) | エコー抑圧装置、エコー抑圧方法およびエコー抑圧プログラム | |
CN109215672B (zh) | 一种声音信息的处理方法、装置及设备 | |
CN111917926B (zh) | 一种通信终端中的回声消除方法、装置及终端设备 | |
CN113225442B (zh) | 一种消除回声的方法及装置 | |
CN113241084B (zh) | 回声消除的方法、装置及设备 | |
WO2019169272A1 (en) | Enhanced barge-in detector | |
CN113571077A (zh) | 回声消除方法、终端设备、电子设备及介质 | |
KR100400214B1 (ko) | 전화 통신시스템에서의 반향 제거장치 및 그에 따른 적응필터의 계수갱신방법 | |
KR102685400B1 (ko) | 에코 제거 방법、 장치 및 전자 장비 | |
KR20130005805A (ko) | 음성 잔여 반향 억제 장치 및 방법 | |
CN113808609B (zh) | 回声检测方法及装置、计算机可读存储介质、终端设备 | |
Hamidia et al. | A New Fast Double-Talk Detector Based on the Error Variance for Acoustic Echo Cancellation. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210922 Address after: 310052 Room 408, building 3, No. 399, Wangshang Road, Changhe street, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Hangzhou Netease Zhiqi Technology Co.,Ltd. Address before: 310052 Room 301, Building No. 599, Changhe Street Network Business Road, Binjiang District, Hangzhou City, Zhejiang Province Applicant before: HANGZHOU LANGHE TECHNOLOGY Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |