CN109716743B - 全双工语音通信系统和方法 - Google Patents
全双工语音通信系统和方法 Download PDFInfo
- Publication number
- CN109716743B CN109716743B CN201780056328.7A CN201780056328A CN109716743B CN 109716743 B CN109716743 B CN 109716743B CN 201780056328 A CN201780056328 A CN 201780056328A CN 109716743 B CN109716743 B CN 109716743B
- Authority
- CN
- China
- Prior art keywords
- end signal
- far
- received
- acoustic echo
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004891 communication Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000008859 change Effects 0.000 claims abstract description 173
- 230000004044 response Effects 0.000 claims abstract description 78
- 230000002238 attenuated effect Effects 0.000 claims abstract description 23
- 238000001514 detection method Methods 0.000 claims description 225
- 238000012545 processing Methods 0.000 claims description 40
- 238000004458 analytical method Methods 0.000 claims description 32
- 238000002592 echocardiography Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 38
- 230000006978 adaptation Effects 0.000 description 32
- 238000006243 chemical reaction Methods 0.000 description 32
- 238000012549 training Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 10
- 230000009467 reduction Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 230000001747 exhibiting effect Effects 0.000 description 4
- 229920006395 saturated elastomer Polymers 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000030808 detection of mechanical stimulus involved in sensory perception of sound Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
- H04B3/21—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a set of bandfilters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B3/00—Line transmission systems
- H04B3/02—Details
- H04B3/20—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
- H04B3/23—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
- H04B3/234—Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using double talk detection
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Telephone Function (AREA)
Abstract
本发明题为“全双工语音通信系统和方法”。本发明公开了一种全双工语音通信方法,包括:估计近端信号内的声学回声;消除所述估计的声学回声;检测近端声学回声路径中是否已经发生改变,所述接收的近端信号是否表示语音,以及所述接收的远端信号是否表示静音,其中响应于其结果,所述方法进一步包括:使所述经回声消除的近端信号的频率分量交替地衰减第一频域衰减值和第二较大频域衰减值;使所述经频率分量衰减的经回声消除的近端信号的第一函数交替地衰减第一可切换衰减值和第二较大可切换衰减值;以及使所述接收的远端信号的第二函数交替地衰减第三可切换衰减值和第四较大可切换衰减值。
Description
背景技术
在语音电信期间,第一端处的说话者的语音在第二端处输出。输出语音由第二端处的麦克风拾取并作为回声发送回说话者。为了克服回声问题,提供声学回声消除器以估计声学回声并将其从麦克风所输出的信号中移除。在语音通信的启动期间,声学回声消除器提供快速回声消除,然而快速回声消除方法通常过冲并且取消并非回声的语音。因此,在启动之后,声学回声消除器进入稳定状态模式,在该稳定状态模式中声学估计更加准确,然而对改变的响应不像启动期间那样快速。
如果在扬声器与麦克风之间的声学回声路径中存在改变,诸如当某人在麦克风或扬声器前方挥动其手时,则声学回声消除器的稳定状态不能够正确地估计声学回声,并且回声消除效果较差,从而引起在语音通信上的回声。因此,提供声学回声路径改变检测器以便检测声学回声路径中的改变。如果检测到声学回声路径的改变,则将声学回声消除器切换到快速启动模式以便固定声学回声估计并改善回声消除。
附加地,全双工语音通信系统提供对其他背景噪声的消除以便提供高质量通信。
不幸地,现有技术的全双工语音通信系统的速度和准确性需要改善以便改善语音通信的质量。
发明内容
因此,本发明的主要目的是克服现有技术全双工语音通信系统的至少一些缺点。这在一个实施方案中由一种全双工语音通信系统提供,所述系统包括:近端输入端口,其被布置为接收近端信号;远端输入端口,其与远端通信装置通信并被布置为接收来自所述远端通信装置的远端信号;声学回声估计功能性,其被布置为响应于所述接收的远端信号而估计所述接收的近端信号内的声学回声;声学回声消除功能性,其被布置为从所述接收的近端信号中消除所述估计的声学回声;频域处理功能性;第一可切换衰减功能性;第二可切换衰减功能性;回声路径改变检测功能性,其被布置为检测近端声学回声路径中的改变;近端语音检测功能性,其被布置为检测所述接收的近端信号是否表示语音;远端静音检测功能性,其被布置为检测所述接收的远端信号是否表示静音;以及系统协调单元,其中响应于所述回声路径改变检测功能性的输出、所述近端语音检测功能性的输出和所述远端静音检测功能性的输出,所述系统协调单元被布置为:控制所述频域处理功能性以使所述经回声消除的近端信号的频率分量交替地衰减第一频域衰减值和第二频域衰减值,所述第二频域衰减值大于所述第一频域衰减值;控制所述第一可切换衰减功能性以使所述频域处理功能性的输出的第一函数交替地衰减第一可切换衰减值和第二可切换衰减值,所述第二可切换衰减值大于所述第一可切换衰减值;以及控制所述第二可切换衰减功能性以使所述接收的远端信号的第二函数交替地衰减第三可切换衰减值和第四可切换衰减值,所述第四可切换衰减值大于所述第三可切换衰减值。
在一个实施方案中,所述系统协调单元的用于控制所述第一可切换衰减功能性以使所述频域处理功能性的所述输出的所述第一函数衰减所述第二可切换衰减值的所述布置,以及所述系统协调单元的用于控制所述第二可切换衰减功能性以使所述接收的远端信号的所述第二函数衰减所述第四可切换衰减值的所述布置响应于由所述回声路径改变检测功能性检测到声学回声路径改变。在另一个实施方案中,所述系统协调单元的用于控制所述频域处理功能性以使所述回声消除的近端信号的所述频率分量衰减所述第二频域衰减值的所述布置响应于以下所有三者的组合:由所述回声路径改变检测功能性检测到声学回声路径改变;由所述近端语音检测功能性检测到所述接收的近端信号表示语音;以及由所述远端静音检测功能性检测到所述接收的远端信号不表示静音。
在一个实施方案中,响应于所述回声路径改变检测功能性的所述输出、所述近端语音检测功能性的所述输出和所述远端静音检测功能性的所述输出,所述系统协调单元被进一步布置为控制所述声学回声估计功能性以交替地进行以下操作:不更新所述估计的声学回声;以第一速度更新所述估计的声学回声;以及以第二速度更新所述估计的声学回声,所述第二速度大于所述第一速度。在另一个实施方案中,所述系统协调单元的用于控制所述声学回声估计功能性以便以所述第二速度更新所述估计的声学回声的所述布置响应于以下所有三者的组合:由所述回声路径改变检测功能性检测到声学回声路径改变;由所述近端语音检测功能性检测到所述接收的近端信号不表示语音;以及由所述远端静音检测功能性检测到所述接收的远端信号不表示静音。
在一个实施方案中,所述系统还包括噪声估计功能性,其中响应于由所述近端语音检测功能性检测到所述接收的近端信号不表示语音,以及由所述远端静音检测功能性检测到所述接收的远端信号表示静音,所述系统协调单元被进一步布置为响应于所述接收的近端信号而控制所述噪声估计功能性以估计近端背景噪声,并且其中所述系统协调单元被进一步布置为响应于以下所有三者的组合而控制所述频域处理功能性以将所述估计的近端背景噪声的噪声函数输出到所述远端输出端口:由所述回声路径改变检测功能性未检测到声学回声路径改变;由所述近端语音检测功能性检测到所述接收的近端信号不表示语音;以及由所述远端静音检测功能性检测到所述接收的远端信号不表示静音。
在一个实施方案中,所述系统还包括:近端饱和检测功能性,其被布置为检测所述接收的近端信号的幅值水平;以及扬声器饱和检测功能性,其被布置为检测所述接收的远端信号的幅值水平,其中所述系统协调单元被进一步布置为响应于以下中的一者而控制所述声学回声估计功能性以不更新所述估计的声学回声:所述接收的近端信号的所述检测的幅值水平超过近端饱和值,以及所述接收的远端信号的所述检测的幅值水平超过远端饱和值。在另一个实施方案中,所述系统还包括:近端窄频带信号检测功能性,其被布置为检测所述接收的近端信号内的窄频带音调的表示;以及远端窄频带信号检测功能性,其被布置为检测所述接收的远端信号内的窄频带音调的表示,其中所述系统协调单元被进一步布置为响应于所述检测的近端窄频带音调和所述检测的远端窄频带音调中的一者而控制所述声学回声估计功能性以不更新所述估计的声学回声。
在一个实施方案中,所述回声路径改变检测功能性包括:时域路径改变检测功能性,其被布置为:执行对所述接收的近端信号的时域分析;响应于所述时域分析而检测所述近端声学回声路径中的改变;以及输出所述检测的改变的指示,频域路径改变检测功能性,其被布置为:执行对所述接收的远端信号及所述经回声消除的近端信号的频域分析;响应于所述频域分析而检测所述近端声学回声路径中的改变;以及输出所述检测的改变的指示,以及组合路径改变检测功能性,其被布置为确定所述时域路径改变检测功能性的所述输出指示和所述频域路径改变检测功能性的所述输出指示的第三函数,其中所述回声路径改变检测功能性的所述声学回声路径改变检测响应于所述输出的所述确定的第三函数。
独立地,所述实施方案提供了一种全双工语音通信方法,所述方法包括:接收近端信号;从远端通信装置接收远端信号;响应于所述接收的远端信号而估计所述接收的近端信号内的声学回声;从所述接收的近端信号中消除所述估计的声学回声;检测所述近端声学回声路径中是否已经发生改变;检测所述接收的近端信号是否表示语音;以及检测所述接收的远端信号是否表示静音,其中响应于所述近端声学回声路径改变检测的结果、所述近端信号语音表示检测的结果和所述远端静音表示检测的结果,所述方法还包括:使所述经回声消除的近端信号的频率分量交替地衰减第一频域衰减值和第二频域衰减值,所述第二频域衰减值大于所述第一频域衰减值;使所述经频率分量衰减的经回声消除的近端信号的第一函数交替地衰减第一可切换衰减值和第二可切换衰减值,所述第二可切换衰减值大于所述第一可切换衰减值;以及使所述接收的远端信号的第二函数交替地衰减第三可切换衰减值和第四可切换衰减值,所述第四可切换衰减值大于所述第三可切换衰减值。
在一个实施方案中,所述使所述经频率分量衰减的经回声消除的近端信号的所述第一函数衰减所述第二可切换衰减值,以及所述使所述接收的远端信号的所述第二函数衰减所述第四可切换衰减值响应于检测到声学回声路径改变。在一个实施方案中,所述使所述经回声消除的近端信号的所述频率分量衰减所述第二频域衰减值响应于以下所有三者的组合:检测到声学回声路径改变;检测到所述接收的近端信号表示语音;以及检测到所述接收的远端信号不表示静音。
在一个实施方案中,响应于所述近端声学回声路径改变检测的结果、所述近端信号语音表示检测的结果和所述远端静音表示检测的结果,所述方法还包括交替地进行以下操作:不更新所述估计的声学回声;以第一速度更新所述估计的声学回声;以及以第二速度更新所述估计的声学回声,所述第二速度大于所述第一速度。任选地,以所述第二速度更新所述估计的声学回声响应于以下所有三者的组合:检测到声学回声路径改变;检测到所述接收的近端信号不表示语音;以及检测到所述接收的远端信号不表示静音。
在一个实施方案中,所述方法还包括:响应于检测到所述接收的近端信号不表示语音以及检测到所述接收的远端信号表示静音,响应于所述接收的近端信号而估计近端背景噪声;以及响应于以下所有三者的组合而输出所述估计的近端背景噪声的噪声函数:检测到没有声学回声路径改变;检测到所述接收的近端信号不表示语音;以及检测到所述接收的远端信号不表示静音。在另一个实施方案中,所述方法还包括:检测所述接收的近端信号的幅值水平;检测所述接收的远端信号的幅值水平;以及响应于所述接收的近端信号的所述检测的幅值水平超过近端饱和值,以及所述接收的远端信号的所述检测的幅值水平超过远端饱和值中的一者,不更新所述估计的声学回声。
在一个实施方案中,所述方法还包括:检测在所述接收的近端信号内是否存在窄频带音调的表示;检测在所述接收的远端信号内是否存在窄频带音调的表示;以及响应于检测到所述接收的近端信号内存在所述窄频带音调表示以及检测到所述接收的远端信号内存在所述窄频带音调表示中的一者,不更新所述估计的声学回声。在另一个实施方案中,所述回声路径改变检测包括:执行对所述接收的近端信号的时域分析;响应于所述时域分析而检测所述近端声学回声路径中的改变;输出所述时域检测的改变的指示;执行对所述接收的远端信号及所述经回声消除的近端信号的频域分析;响应于所述频域分析而检测所述近端声学回声路径中的改变;输出所述频域检测的改变的指示;以及确定所述输出时域指示和所述输出频域指示的第三函数,其中所述声学回声路径改变检测响应于所述确定的第三函数。
从以下附图和描述中,本发明的附加特征和优点将变得显而易见。
附图说明
为了更好地理解本发明并示出可如何实行本发明,现在将仅通过示例的方式参考附图,其中相同的数字始终表示对应的部分或元件。现在具体参考附图,强调了所示的细节仅为示例且仅用于说明性讨论本发明的优选实施方案的目的,并且为了提供被认为是本发明的原理和概念方面的最有用和易于理解的描述的原因而被呈现。就此而言,没有试图比对本发明的基本理解所需更详细地示出本发明的结构细节,关于附图进行的描述使得本发明的若干形式可如何在实践中体现对于本领域技术人员而言是显而易见的。在附图中:
图1A-图1C示出了根据某些实施方案的全双工语音通信系统的各种高级框图;
图2A-图2C示出了根据某些实施方案的第一全双工语音通信方法的高级流程图;
图2D示出了根据某些实施方案的声学回声路径改变检测方法的高级流程图;
图2E示出了根据某些实施方案的第二全双工语音通信方法的高级流程图;
图3示出了根据某些实施方案的频域处理功能性和舒适噪声生成功能性的高级示意图;以及
图4A-图4C示出了根据某些实施方案的声学回声路径改变检测功能性的各种高级示意图。
具体实施方式
在详细解释本发明的至少一个实施方案之前,应当理解,本发明的应用不限于在下面的描述中阐述的或在附图中示出的部件的构造和布置的细节。本发明适用于其他实施方案或以各种方式实践或进行。而且,应当理解,本文所采用的措辞和术语是处于描述的目的并且不应当被认为是限制性的。
图1A示出了根据某些实施方案的全双工语音通信系统10的高级框图。全双工语音通信系统10包括:多个端口P1、P2、P3和P4;环境感测系统20;系统协调单元30;声学回声消除功能性35,其包括加法器40、适应控制功能性100和声学回声估计功能性110;时域到频域转换功能性50;频域处理功能性60;舒适噪声生成功能性62;频域到时域转换功能性70;一对可切换衰减功能性80A和80B;以及回声路径改变检测功能性115。图1B示出了环境感测系统20的详细实施方案的高级框图。具体地,环境感测系统20包括:近端饱和检测功能性120;扬声器饱和检测功能性130;收敛检测功能性140;发散检测功能性150;远端窄频带信号检测功能性160;近端窄频带信号检测功能性170;近端语音检测功能性180;远端静音检测功能性190;以及输出模块200。图1A-图1B的结构将被一起描述。
系统协调单元30;声学回声消除功能性35;加法器40;适应控制功能性100;声学回声估计功能性110;时域到频域转换功能性50;频域处理功能性60;舒适噪声生成功能性62;频域到时域转换功能性70;可切换衰减功能性80A和80B;回声路径改变检测功能性115;近端饱和检测功能性120;扬声器饱和检测功能性130;收敛检测功能性140;发散检测功能性150;远端窄频带信号检测功能性160;近端窄频带信号检测功能性170;近端语音检测功能性180;远端静音检测功能性190;输出模块200中的每一者可能以专用硬件(诸如ASIC)来实现,或者由执行存储在相关联存储器上的电子可读指令的微处理器或微控制器实现。
端口P1耦接到扬声器输入系统210(诸如麦克风系统)、加法器40的正输入、回声路径改变检测功能性115的输入、近端饱和检测功能性120的输入、收敛检测功能性140的输入、发散检测功能性150的输入、近端窄频带信号检测功能性170的输入、近端语音检测功能性180的输入以及远端静音检测功能性190的输入,该节点处的信号被表示为SIN。
加法器40的负输入耦接到声学回声估计功能性110的输出、发散检测功能性150的输入和远端静音检测功能性190的输入,该节点处的信号被表示为YHAT。加法器40的输出(即声学回声消除功能性35的输出)耦接到收敛检测功能性140的输入、发散检测功能性150的输入、适应控制功能性100的输入、时域到频域转换功能性50的相应输入以及回声路径改变检测功能性115的相应输入,该节点处的信号被表示为ERROR。
时域到频域转换功能性50的输出耦接到频域处理功能性60的相应输入,并且频域处理功能性60的相应输出耦接到频域到时域转换功能性70的输入。舒适噪声生成功能性62的输入耦接到频域处理功能性60的相应输出,并且舒适噪声生成功能性62的输出耦接到频域处理功能性60的相应输入。频域到时域转换功能性70的输出耦接到可切换衰减功能性80A的输入,并且可切换衰减功能性80A的输出耦接到端口P2,端口P2处的信号被表示为SOUT。
端口P3耦接到可切换衰减功能性80B的输入和时域到频域转换功能性50的输入,端口P3处的信号被表示为RIN。可切换衰减功能性80B的输出耦接到声学回声估计功能性110的输入、扬声器饱和检测功能性130的输入、远端窄频带信号检测功能性160的输入、远端静音检测功能性190的输入、回声路径改变检测功能性115的相应输入以及经由端口P4的扬声器输出系统220,该节点处的信号被表示为ROUT。如图1C所示,端口P2和P3进一步经由通信网络240与远端通信装置230通信。在一个实施方案中,通信网络240是电话网络和互联网中的一个。
回声路径改变检测功能性115的输出耦接到系统协调单元30的相应输入。近端饱和检测功能性120、扬声器饱和检测功能性130、收敛检测功能性140、发散检测功能性150、远端窄频带信号检测功能性160、近端窄频带信号检测功能性170、近端语音检测功能性180以及远端静音检测功能性190中的每一个的输出经由输出模块200耦接到系统协调单元30的相应输入。适应控制功能性100,频域处理功能性60,舒适噪声生成功能性62和可切换衰减功能性80A和80B中的每一个的相应输入耦接到系统协调单元30的相应输出。
声学回声消除功能性35在本文中被示出和描述为与频域处理功能性60分离,然而,这并不意味着以任何方式进行限制。在另一个实施方案(未示出)中,声学回声消除功能性35被实现为频域处理功能性60的一部分。可切换衰减功能性80A和80B中的每一个包括可选择的多个衰减水平。具体地,在一个实施方案中,可切换衰减功能性80A展现出大于3dB的高衰减水平和小于3dB的低衰减水平。在另一个实施方案中,可切换衰减功能性80B展现出大于1dB的高衰减水平和小于1dB的低衰减水平。
图1A-图1C的操作将被一起描述。在操作中,任选地在应用波束形成滤波器之后,在端口P1处接收近端信号SIN(即表示由扬声器输入系统210接收的声学声音的信号)。附加地,在端口P3处接收远端信号RIN(即表示在通信装置230处接收的声学声音的信号)。信号SIN被布置为被处理成信号SOUT并被传输到远端通信装置230。具体地,如以下将描述,信号ERROR表示在声学回声消除之后的信号SIN。信号ERROR由时域到频域转换功能性50转换到频域并由频域处理功能性60处理。经处理信号然后由频域到时域转换功能性70转换回时域。经转换信号然后根据需要由可切换衰减功能性80A衰减(如以下将描述)并作为信号SOUT输出。信号RIN被布置为被处理成信号ROUT(如以下将描述),信号ROUT被输出到扬声器输出系统220。近端饱和检测功能性120被布置为确定信号SIN的幅值是否超过最大允许值。如果声音太强,则全双工语音通信系统10将不能够正确地分析它们。类似地,扬声器饱和检测功能性130被布置为确定信号ROUT的幅值是否超过扬声器输出系统220的最大允许值。
如以上所描述,收敛检测功能性140被布置为接收信号SIN和ERROR,即加法器40的输出处的信号。具体地,声学回声估计功能性110被布置为输出信号SIN内的来自信号RIN的回声的估计(以上表示为信号YHAT),并且加法器40被布置为从信号SIN中减去回声估计YHAT。如以上所描述,信号RIN是从远端语音通信系统230接收的并在扬声器输出系统220处输出。输出声音可以在扬声器输入系统210处被拾取作为回声,并且使在扬声器输入系统210处接收的语音劣化。如果回声估计YHAT是准确的,则信号ERROR将仅包含来自扬声器输入系统210附近的近端声音,并且基本上不包含来自扬声器输出系统220处输出的声音的回声。收敛检测功能性140被布置为比较信号SIN和ERROR,并且确定声学回声估计功能性110是否成功地进行回声估计,即回声消除算法已收敛到最优解,如本领域技术人员在进行本发明时所已知的。
如以上所描述,发散检测功能性150被布置为接收信号SIN、ERROR和YHAT,并确定声学回声估计功能性110是否未成功地进行回声估计,即回声消除算法已从最优解发散,如本领域技术人员在进行本发明时所已知的。在一个实施方案中,收敛检测功能性140被布置为与发散检测功能性150相比在更长的时段内分析信号SIN和ERROR。因此,收敛检测功能性140更慢但更准确。在另一个实施方案(未示出)中,未提供发散检测功能性150,并且收敛检测功能性140被布置为确定声学回声估计算法是收敛于最优解还是从最优解发散。
远端窄频带信号检测功能性160被布置为在信号ROUT内检测展现出小于8kHz的频率的声音的单音调的表示。类似地,近端窄频带信号检测功能性170被布置为在信号SIN内检测展现出小于8kHz的频率的声音的单音调的表示。
近端语音检测功能性180被布置为响应于语音活动检测(VAD)算法来检测信号SIN内是否存在语音。远端静音检测功能性190被布置为检测信号ROUT是表示静音还是表示声音。对信号ROUT内的声音的检测还响应于对包含信号ROUT的回声的信号SIN和YHAT的分析。
如以上所描述,系统协调单元30被布置为接收近端饱和检测功能性120、扬声器饱和检测功能性130、收敛检测功能性140、发散检测功能性150、远端窄频带信号检测功能性160、近端窄频带检测功能性170、近端语音检测功能性180以及远端静音检测功能性190的输出。
响应于由近端饱和检测功能性120检测到饱和信号SIN或由扬声器饱和检测功能性130检测到饱和信号ROUT,系统协调单元30被布置为控制适应控制功能性100以禁用对声学回声估计功能性110的适应,即更新回声估计。具体地,声学回声估计功能性110被布置为持续地更新信号SIN内的回声的估计,然而非线性饱和信号可能使回声估计劣化。通过禁用回声估计更新,饱和信号将不会干扰未来回声估计。一旦近端饱和检测功能性120和/或远端饱和检测功能性130停止检测饱和信号,系统协调单元30就被布置为控制适应控制功能性以恢复对声学回声估计功能性110的适应,适应控制功能性100被布置为响应于信号ERROR而控制声学回声估计功能性110的声学回声估计,如本领域技术人员在进行本发明时所已知的。
附加地,在一个实施方案中,响应于检测到饱和信号SIN,系统协调单元30被布置为控制可切换衰减功能性80A以使待输出的信号衰减最大衰减水平,由此将较干净信号FOUT输出到远端通信装置。
如果信号ROUT和SIN中的任一者或两者中存在任意音调,则声学回声估计功能性110的声学回声估计可能被任意音调劣化。响应于由远端窄频带信号检测功能性160检测到信号ROUT内的单音调和/或由近端窄频带信号检测功能性170检测到信号SIN内的单音调,系统协调单元30被布置为控制适应控制功能性100以禁用对声学回声估计功能性110的适应,即更新回声估计,如以上所描述的。
响应于由收敛检测功能性140确定声学回声估计算法已收敛于最优解,系统协调单元30被布置为进一步确定当前通信的状态。具体地,响应于近端语音检测功能性180和远端静音检测功能性190的输出,系统协调单元30被布置为确定信号ROUT和SIN中的任一者内不存在语音,还是信号ROUT和SIN的两者内存在语音(双向通话),确定信号SIN内存在但信号ROUT内不存在语音(仅近端语音),还是信号ROUT内存在但信号SIN内不存在语音(仅远端语音)。如以上所描述,响应于语音活动检测算法检测近端语音,而在没有语音活动检测算法的情况下检测远端语音。因此,远端语音的检测包括信号ROUT上的噪声的检测。
响应于检测到的语音状态,系统协调单元30被布置为在多个状态中控制适应控制功能性100、频域处理功能性60以及可切换衰减功能性80A和80B。
响应于适应控制功能性100,声学回声估计功能性110被布置为以三个模式中的一个操作:正常速度模式,即稳定状态模式;高速模式;和非适应模式。具体地,在正常速度模式中,声学回声估计功能性110被布置为基于经收敛回声估计而根据微小回声改变连续地更新声学回声估计,如本领域技术人员在进行本发明时所已知的。在正常速度模式中,声学回声估计更新较慢但较准确。在高速模式中,声学回声估计功能性110被布置为以比正常速度模式时更快的速度更新声学回声估计,然而估计较不准确。在非适应模式中,声学回声估计功能性110被布置为不更新声学回声估计,如以上所描述的。当仅检测到远端语音并且未检测到回声路径230中的改变时,启用正常速度模式,如以下将描述。当仅检测到远端语音并且检测到回声路径230中的改变时,启用高速模式,如以下将描述。在所有其他情况下,启用非适应模式,如以下将描述。
频域处理功能性60被布置为在检测到双向通话而声学回声路径230中无改变时以及在检测到远端语音且声学回声路径230中有或没有改变时,应用低水平残余回声衰减。频域处理功能性60被布置为在检测到双向通话且声学回声路径230中有改变时,应用高水平残余回声衰减。具体地,频域衰减由适应滤波器实现,该适应滤波器在双向通话的周期期间处于作用中且在远端语音的周期期间处于训练中。
可切换衰减功能性80A和80B被布置为在检测到双向通话而声学回声路径230中没有改变时应用低水平衰减。可切换衰减功能性80A和80B被布置为在检测到双向通话或远端语音且声学回声路径230中有改变时应用高水平衰减。
如果系统协调单元30确定信号ROUT中不存在语音并且信号SIN中不存在语音,即不存在远端语音和近端语音两者,则系统协调单元30被布置为控制适应控制功能性100以在非适应模式下操作。由于信号ROUT中缺乏语音,所以没有要消除的回声,因此禁用声学回声适应。当不存在回声时禁用声学回声适应将防止声学回声估计中的不必要错误。
附加地,响应于确定ROUT和SIN中的任何一者中都不存在语音,系统协调单元30被布置为控制舒适噪声生成功能性62以确定信号SIN内的背景噪声的估计。如以上所描述,在一个实施方案中,近端语音检测功能性180利用VAD算法来检测信号SIN内的语音,VAD算法允许近端语音检测功能性180区分语音与背景噪声。具体地,时域到频域转换功能性50被布置为任选地响应于快速傅里叶变换(FFT)而将信号ERROR变换成频率分量。如以上所描述,信号ERROR包括在减去回声估计信号YHAT之后的信号SIN。由于信号ROUT内存在静音,因此不应存在回声,并且信号ERROR将与信号SIN基本相同。在一个实施方案中,背景噪声估计的确定包括更新先前确定的近端背景噪声估计。在另一个实施方案中,背景噪声估计包括信号ERROR的多个频率分量中的每一个的自回归移动平均(ARMA)滤波。只要在信号SIN和ROUT中的任一者上没有检测到语音,背景噪声估计就会继续。
如果系统协调单元30确定信号ROUT中存在语音但信号SIN中不存在语音,即存在远端语音但没有近端语音,系统协调单元30被布置为控制适应控制功能性100,以使得在上文所描述的正常速度模式下声学回声估计功能性110能够更新声学回声估计。附加地,频域处理功能性60被布置为应用残余回声滤波器以使信号ERROR内的残余回声衰减低衰减值,残余回声滤波器的低衰减值任选地约为9-15dB。尽管不需要使未输出的信号中的回声衰减,但如以下将描述,适应残余回声滤波器被布置为在存在远端语音期间继续更新。
由于扬声器输入系统210附近没有语音,因此信号ERROR内的仅有声音将是由扬声器输入系统210拾取的背景噪声和未被声学回声估计功能性110消除的任何残余回声。因此,最好不向远端通信装置传输信号ERROR,由此确保远端说话者不会听到回声。然而,通过这样做,将不会听过到由远端说话者预期的扬声器输入系统210周围的背景噪声。从远端说话者的角度来看,这听起来好像他们没有对任何人说话。为了解决该问题,系统协调单元30被布置为控制频域处理功能性60,以将舒适噪声生成功能性62的输出传递到频域到时域转换功能性70并且不将信号ERROR的频域分量传递到频域到时域转换功能性70。因此,在信号SOUT内未将残余回声发送到通信装置230,而传输背景噪声估计。在一个实施方案中,舒适噪声生成功能性62被布置为通过所估计的背景噪声来调制白噪声FFT系数,经调制的白噪声FFT系数被输出到频域到时域转换功能性70并且舒适噪声被因此被传输到远端。
系统协调单元被进一步布置为控制可切换衰减功能性80A以不使频域到时域转换功能性70的输出衰减,并且控制可切换衰减功能性80B以不使信号RIN衰减。由于信号RIN中没有语音,所以信号SIN中不存在回声,因此信号RIN的衰减是不必要的。类似地,信号SIN中存在的任何回声都被频域处理功能性60截掉,因此信号ERROR的衰减是不必要的。
如果系统协调单元30确定信号SIN中存在语音但信号ROUT中不存在语音,即存在近端语音但不存在远端语音,系统协调单元30被布置为控制适应控制功能性100,以禁用由声学回声估计功能性110更新声学回声估计。系统协调单元被进一步布置为控制可切换衰减功能性80A以不使频域到时域转换功能性70的输出衰减,并且控制可切换衰减功能性80B以不使信号RIN衰减。由于信号RIN中没有语音,所以信号SIN中不存在回声,因此衰减是不必要的。
如果系统协调单元30确定在信号SIN和ROUT两者中都存在语音,即存在双向通话,系统协调单元30被布置为控制适应控制功能性100,以禁用由声学回声估计功能性110更新声学回声估计,这是因为声学回声估计功能性110的适应将由于双向通话而不准确。系统协调单元30被进一步布置为:控制可切换衰减功能性80A以使频域到时域转换功能性70的输出衰减低衰减值;以及控制可切换衰减功能性80B以使衰减信号RIN衰减低衰减值。在一个实施方案中,如以上所描述,每个可切换衰减功能性80A和80B的低水平值小于3dB。可切换衰减功能性80B的衰减使远端语音衰减,以此减少由扬声器输入系统210接收的回声的量。可切换衰减功能性80A的衰减使近端语音衰减,并因此进一步使与近端语音混合的任何残余回声衰减。通过可切换衰减功能性80A和80B的双重衰减将回声的幅值减小到在远端通信装置230处不太能够听到的水平,由此为声学回声估计功能性110的非适应状态提供补偿。附加地,频域处理功能性60被布置为应用残余回声滤波器的低水平衰减以使信号ERROR内的残余回声衰减,如上文所描述。
信号ROUT的回声沿着声学回声路径230从扬声器输出系统220行进到扬声器输入系统210。如果在声学回声路径230存在改变,诸如当某人在扬声器输入系统210和/或扬声器输出系统220前方挥动其手时,则声学回声估计功能性110的正常速度模式不能够正确地估计声学回声。如下面将进一步描述的,回声路径改变检测功能性115被布置为分析信号ERROR/SIN和ROUT以确定声学回声路径230是否已经存在改变。在一个实施方案中,如以下将描述,回声路径改变检测功能性115被布置为执行对信号SIN和ERROR的时域分析以及对信号ERROR和ROUT的频域分析。
如果回声路径改变检测功能性115检测到回声路径230中的改变并且系统协调单元30检测到信号ROUT中存在语音但信号SIN中不存在语音,即存在远端语音但不存在近端语音,则系统协调单元30被布置为控制适应控制功能性100,以使得在上文所描述的高速模式下声学回声估计功能性110能够更新声学回声估计。具体地,如以上所描述,声学回声估计功能性110被布置为处于高速模式以更快速地适应回声中的改变,该改变由于声学回声路径230中的改变而是显著的。
附加地,响应于检测到的声学回声路径230改变和远端语音,系统协调单元30被进一步布置为控制可切换衰减功能性80A以使频域到时域转换功能性70的输出衰减高衰减值。类似地,系统协调单元30被进一步布置为控制可切换衰减功能性80B以使衰减信号RIN衰减高衰减值。在一个实施方案中,如以上所描述,可切换衰减功能性80A和80B的高衰减值分别大于3dB和1dB。此外,频域处理功能性60被布置为应用残余回声滤波器以使信号ERROR内的残余回声衰减在低水平,如以上所描述。
如果回声路径改变检测功能性115检测到回声路径230中的改变并且系统协调单元30检测到在信号ROUT和SIN两者中都存在语音,即存在双向通话,则系统协调单元30被布置为控制适应控制功能性100以由于双向通话而禁用由声学回声估计功能性110更新声学回声估计,如以上所描述。
附加地,响应于检测到的声学回声路径230改变和双向通话,系统协调单元30被进一步布置为控制可切换衰减功能性80A以使频域到时域转换功能性70的输出衰减高衰减水平,如以上所描述。类似地,系统协调单元30被进一步布置为控制可切换衰减功能性80B以使衰减信号RIN衰减高衰减值,如以上所描述。此外,频域处理功能性60被布置为应用残余回声滤波器以使信号ERROR内的残余回声衰减高衰减值。
总之,当收敛检测功能性140检测到声学回声估计功能性110已经收敛到最优解时,系统协调单元30被布置为在多个状态中控制适应控制功能性100、频域处理功能性60以及可切换衰减功能性80A和80B,如下:
1.在存在双向通话的情况下,声学回声估计适应被禁用,频域残余回声滤波器以低水平激活,并且从远端接收以及传输到远端的时域信号被衰减低衰减值;
2.在仅存在远端语音和并且近端声学回声路径中具有改变的情况下,在高速模式下启用声学回声估计适应,频域残余回声滤波器以低水平激活,并且从远端接收以及传输到远端的时域信号被衰减高衰减值;以及
3.在存在双向通话并且近端声学回声路径中具有改变的情况下,禁用声学回声估计适应,频域残余回声滤波器以高水平激活,并且从远端接收以及传输到远端的时域信号被衰减高衰减值;
附加地,当收敛检测功能性140检测到声学回声估计功能性110已经收敛到最优解时,系统协调单元30被进一步布置为在多个任选状态中控制适应控制功能性100、频域处理功能性60以及可切换衰减功能性80A和80B,如下:
1.在没有来自近端和远端两者的语音的情况下,禁用声学回声估计适应并且确定近端背景噪声的估计;
2.在仅存在近端语音的情况下,禁用声学回声估计适应;以及
3.在仅存在远端语音的情况下,在正常速度模式下启用声学回声估计适应,频域残余回声滤波器以低水平激活,并且舒适噪声而不是近端背景噪声传输到远端说话者。
如果发散检测功能性150检测到声学回声估计功能性110已经从最优解发散预定余量,则系统协调单元30被布置为控制适应控制功能性100以控制声学回声估计功能性110以便以上述高速模式操作,而不管近端语音检测功能性180和远端静音检测功能性190的输出如何。
图2A-图2C示出了根据某些实施方案的全双工语音通信方法的高级流程图,图2A-图2C被一起描述。在阶段1000中,接收近端信号。如以上所描述,近端信号表示由近端扬声器输入系统(诸如麦克风)拾取的声学声音。在阶段1010中,从远端通信装置接收远端信号。如以上所描述,远端信号表示由远端通信装置拾取的声学声音。
在阶段1020中,响应于阶段1010的所接收的远端信号,估计阶段1000的所接收的近端信号内的声学回声。在阶段1030中,从所接收的近端信号中消除阶段1020的估计的声学回声。
在阶段1040中,分析阶段1020的估计的声学回声以确定估计是否已经收敛于最优解。如果所估计的声学回声已经收敛于最优解,则在阶段1050中,检测近端声学回声路径中的改变。在阶段1060中,分析阶段1000的所接收的近端信号以确定它是否表示语音。在阶段1070中,分析阶段1010的所接收的远端信号以确定它是否表示静音。如以上所描述,在一个实施方案中,当未检测到静音时,认为存在远端语音,即使它可能是噪声而不是语音。
在任选的阶段1075中,检测阶段1000的所接收的近端信号的幅值及阶段1010的所接收的远端信号的幅值。如果近端信号及远端信号中的一者或两者的幅值超过相应饱和值,则不再更新阶段1020的声学回声估计直至两个幅值低于相应饱和值。
在任选的阶段1077中,分析阶段1000的所接收的近端信号和阶段1010的所接收的远端信号,以确定其中是否存在展现出低于8kHz的频率的非语音窄频带音调的表示。如果近端信号和远端信号中的一者或两者中存在一个或多个窄频带音调的表示,则不再更新阶段1020的声学回声估计,直到窄频带音调不再被检测到。
在阶段1080中,分析阶段1000的所接收的近端信号和阶段1010的所接收的远端信号。如果在所接收的近端信号内没有检测到语音(即存在静音或噪声),并且在所接收的远端信号内检测到静音,则在阶段1090中,不再更新阶段1020的声学回声估计。附加地,在阶段1100中,估计在阶段1000的所接收的近端信号内的近端背景噪声。
如果在阶段1080中,不满足阶段1000的所接收的近端信号中没有语音并且阶段1010的所接收的远端信号中存在静音的状况,则在阶段1110中,分析近端信号和远端信号。尽管本文描述的阶段1110的分析在阶段1080的分析之后执行,但这并不意味着以任何方式进行限制,并且阶段1080和1110以及以下所描述的阶段1130、1170、1220和1270的分析在一个实施方案中并行地执行。如果在所接收的近端信号内检测到语音并且在所接收的远端信号内检测到静音,则在阶段1120中,不再更新阶段1020的声学回声估计。
如果在阶段1110中,不满足阶段1000的所接收的近端信号中存在语音并且阶段1010的所接收的远端信号中存在静音的状况,则在阶段1130中,分析近端信号和远端信号以及阶段1050的近端声学回声路径改变检测。如果在所接收的近端信号中没有检测到语音,在所接收的远端信号内没有检测到静音,并且尚未检测到近端声学回声路径改变,则在阶段1140中,以第一速度更新阶段1020的声学回声估计。附加地,在阶段1150中,使阶段1030的经回声消除的近端信号的频率分量衰减第一频域衰减值。此外,在阶段1160中,将阶段1100的所估计的近端背景噪声的噪声函数输出到阶段1010的远端通信装置。
如果在阶段1130中,不满足在阶段1000的所接收的近端信号中没有语音,在阶段1010的所接收的远端信号中没有静音,并且阶段1050的无近端声学回声路径改变的状况,则在阶段1170中,分析近端信号和远端信号以及近端声学回声路径改变检测。如果在所接收的近端信号中检测到语音,在所接收的远端信号内没有检测到静音,并且尚未检测到近端声学回声路径改变,则在阶段1180中,由于双向通话,不再更新阶段1020的声学回声估计。附加地,在阶段1190中,使阶段1030的经回声消除的近端信号的频率分量衰减第一频域衰减值,如上文关于阶段1150所描述。此外,在阶段1200中,任选地在时域中使阶段1190的衰减频率分量的第一函数衰减第一可切换衰减值。类似地,在阶段1210中,任选地在时域中使阶段1010的所接收的远端信号的第二函数衰减第二可切换衰减值。
如果在阶段1170中,不满足在阶段1000的所接收的近端信号中存在语音,在阶段1010的所接收的远端信号中没有静音,并且阶段1050的无近端声学回声路径改变的状况,则在阶段1220中,分析近端信号和远端信号以及近端声学回声路径改变检测。如果在所接收的近端信号中没有检测到语音,在所接收的远端信号内没有检测到静音,并且检测到近端声学回声路径改变,则在阶段1230中,以第二速度更新阶段1020的声学回声估计,该第二速度大于阶段1140的第一速度。附加地,在阶段1240中,使阶段1030的经回声消除的近端信号的频率分量衰减第一频域衰减值,如上文关于阶段1150所描述。此外,在阶段1250中,任选地在时域中使阶段1190的衰减频率分量的第一函数衰减第三可切换衰减值。第三可切换衰减值大于阶段1200的第一可切换衰减值。类似地,在阶段1260中,任选地在时域中使阶段1010的接收远端信号的第二函数衰减第四可切换衰减值,该第四可切换衰减值大于阶段1210的第二可切换衰减值。
如果在阶段1220中,不满足在阶段1000的所接收的近端信号中没有语音,在阶段1010的所接收的远端信号中没有静音,并且阶段1050的有近端声学回声路径改变的状况,则在阶段1270中,分析近端信号和远端信号以及近端声学回声路径改变检测。如果在所接收的近端信号中检测到语音,在所接收的远端信号内没有检测到静音,并且已经检测到近端声学回声路径改变,则由于双向通话,不再更新阶段1020的声学回声估计。附加地,在阶段1280中,使阶段1030的经回声消除的近端信号的频率分量衰减第二频域衰减值,该第二频域衰减值大于阶段1150的第一频域衰减值。此外,在阶段1290中,使阶段1190的经衰减频率分量的第一函数衰减第三可切换衰减值,如以上关于阶段1250所描述。类似地,在阶段1300中,使阶段1010的所接收的远端信号的第二函数衰减第四可切换衰减值,如以上关于阶段1260所述。
如以上所描述,如果在阶段1040中,确定阶段1020的声学回声估计未收敛于最优解,则在阶段1310中,以第二速度更新阶段1020的声学回声估计,如以上关于阶段1230所描述。
图2D示出了根据某些实施方案的检测近端声学回声路径中的改变的方法的高级流程图。具体地,图2D描述了执行阶段1050的近端声学回声路径改变检测的详细方法。在阶段2000中,执行如以上所描述的阶段1000-1030。在阶段2010中,对阶段1000的所接收的近端信号和阶段1030的经回声消除的声学信号执行时域分析。在一个实施方案中,时域分析包括确定所接收的近端信号的函数与经回声消除的声学信号的函数的交叉相关。任选地,所接收的近端信号和经回声消除的声学信号中的每一个的函数包括自回归移动平均。在阶段2020中,响应于阶段2010的时域分析,检测近端声学回声路径中的改变的指示。在一个实施方案中,将阶段2010的交叉相关值与预定阈值进行比较,并且如果交叉相关值大于阈值,则输出声学回声路径改变的指示。
在阶段2030中,执行对阶段1010的所接收的远端信号和阶段1030的经回声消除的声学信号的频域分析。在一个实施方案中,根据巴克标度将远端信号和经回声消除的声学信号中的每一个的FFT频谱分离成多个频率子频带。在一个另外的实施方案中,对于每个频率子频带,确定所接收的远端信号和经回声消除的声学信号的互功率。附加地,对于每个频率子频带,确定经回声消除的声学信号的函数与所确定的互功率的函数之间的差异,任选地,该函数是自回归移动平均。进一步任选地,通过已平均的经回声消除的声学信号和所接收的远端信号的自回归移动平均对所确定的互功率的自回归移动平均值进行归一化。在阶段2040中,响应于阶段2030的频域分析,检测近端声学回声路径中的改变的指示。在一个实施方案中,近端声学回声路径改变检测响应于经回声消除的声学信号函数和互功率函数之间的差大于预定阈值的频带的数量。
在阶段2050中,确定阶段2020的所确定的近端声学回声路径改变和阶段2040的所确定的近端声学回声路径改变的函数。在一个实施方案中,该函数是OR函数,其指示时域分析和频域分析中的至少一个已检测到近端声学回声路径中的改变。输出所确定的函数以指示实际上是否存在近端声学回声路径中的改变。
图2E示出了第二全双工语音通信方法的高级流程图。在阶段3000中,接收近端信号,该近端信号表示由近端通信装置的麦克风拾取的声音。在阶段3010中,从远端通信装置接收远端信号,该远端信号表示由远端通信装置拾取的声音。在阶段3020中,响应于阶段3010的远端信号,估计阶段3000的近端信号内的声学回声。在阶段3030中,从阶段3000的近端信号中消除阶段3020的所估计的声学回声。
在阶段3040中,检测近端声学回声路径(即说话者与阶段3000的近端通信装置的麦克风之间的声学回声路径)中是否存在改变。在阶段3050中,检测阶段3000的近端信号是否表示语音。在阶段3060中,检测阶段3010的远端信号是否表示静音。
在阶段3070中,响应于阶段3040的声学回声路径改变检测,阶段3050的近端语音检测和阶段3060的远端静音检测:使阶段3030的经回声消除的声学近端信号的频率分量交替地衰减第一频域衰减值和第二频域衰减值,该第二频域衰减值大于该第一频域衰减值;使经频率分量衰减的经回声消除的声学近端信号的第一函数交替地衰减第一可切换衰减值和第二可切换衰减值,该第二可切换衰减值大于该第一可切换衰减值;并且使阶段3010的远端信号的第二函数交替地衰减第三可切换衰减值和第四可切换衰减值,该第四可切换衰减值大于该第三可切换衰减值。具体地,第一和第二频域衰减值用于频域中的衰减,并且第一、第二、第三和第四可切换衰减值用于时域中的衰减。
在任选的阶段3080中,使经频率分量衰减的经回声消除的声学近端信号的第一函数衰减阶段3070的第二可切换衰减值,以及使远端信号的第二函数衰减第四可切换衰减值是响应于阶段3040中的检测到声学回声路径中的改变。
在任选的阶段3090中,使经回声消除的近端信号的频率分量衰减阶段3070的第二频域衰减值是响应于以下所有三者的组合:阶段3040中的检测到声学回声路径中的改变;阶段3050的检测到阶段3000的近端信号表示语音;以及阶段3060的检测到阶段3010的远端信号不表示静音,即远端信号表示语音或噪声。
在任选的阶段3100中,响应于阶段3040的声学回声路径改变检测,阶段3050的近端语音检测和阶段3060的远端静音检测,阶段3020的声学回声估计交替地进行以下操作:不更新;以第一速度更新;以及以第二速度更新,该第二速度大于该第一速度。任选地,响应于以下三者的组合以第二速度更新声学回声估计:阶段3040的检测到声学回声路径中的改变;阶段3050的检测到阶段3000的近端信号不表示语音;以及阶段3060的检测到阶段3010的远端信号不表示静音。
图3示出了全双工语音通信系统10的频域处理功能性60和舒适噪声生成功能性62的更详细实施方案的高级示意图。频域处理功能性60包括:频域滤波功能性300,其被布置为使残余的声学回声衰减,如以上所描述;噪声减小功能性305;以及受控数据路径310。舒适噪声生成功能性62包括:受控数据路径320;以及舒适噪声训练和播放功能性330。
受控数据路径310和受控数据路径320中的每一个的控制输入耦接到系统协调单元30的相应输出。受控数据路径320的第一端子耦接到时域到频域转换功能性50的输出和频域滤波功能性300的输入。受控数据路径320的第二端子耦接到舒适噪声训练和播放功能性330的输入。舒适噪声训练和播放功能性330的第一输出耦接到频域处理功能性60的受控数据路径310的第一端子,并且舒适噪声训练和播放功能性330的第二输出耦接到噪声减小功能性305的相应输入。频域滤波功能性300的输出耦接到噪声减小功能性305的相应输入,并且噪声减小功能性305的输出耦接到受控数据路径310的第二端子。受控数据路径310的第三端子耦接到频域到时域转换功能性70的输入。
在操作中,如以上所描述,响应于检测到在近端信号SIN(未示出)上不存在语音并且在远端信号ROUT(未示出)上存在静音,系统协调单元30被布置为:控制受控数据路径320以将时域到频域转换功能性50的输出耦接到舒适噪声训练和播放功能性330的输入;以及控制受控数据路径310以将噪声减小功能性305的输出耦接到频域到时域转换功能性70的输入。
如上面进一步描述的,在近端和远端两者的静音期间,舒适噪声训练和播放功能性330被布置为估计近端背景噪声。具体地,在一个实施方案中,时域到频域转换功能性50被布置为通过对信号ERROR执行FFT将其转换到频域。任选地根据巴克标度将FFT系数分成频率子频带。舒适噪声训练和播放功能性330被布置为通过自回归移动平均(ARMA)滤波器对子频带系数进行滤波。平均的子频带系数用于更新近端背景噪声的先前存储的估计。因此,检测到近端背景噪声中的任何改变,并相应地更新近端背景噪声估计。
如以上所描述,响应于近端信号SIN中不存在语音活动的指示,以及远端信号ROUT处存在语音活动或无静音的指示,即仅存在远端语音,系统协调单元30被布置为:控制受控数据路径320以将时域到频域转换功能性50的输出与舒适噪声训练和播放功能性330的输入解耦接;以及控制受控数据路径310以将频域到时域转换功能性70的输入耦接到舒适噪声训练和播放功能性330的输出。如以上所描述,在一个实施方案中,舒适噪声训练和播放功能性330被布置为生成FFT白噪声并通过近端背景噪声估计来调制该白噪声。如以上所描述,经调制的FFT白噪声由频域到时域转换功能性70转换到时域。因此,将舒适噪声而不是近端信号输出到远端说话者。如以上所描述,舒适噪声是近端背景噪声的估计,并且不包括远端信号的声学回声。在一个优选实施方案中,由于近端背景噪声估计的增加的准确度,因此立即提供所产生的舒适噪声,并且舒适噪声的逐渐施加是不必要的。
响应于在近端存在语音活动的指示,系统协调单元30被布置为:控制受控数据路径320以将时域到频域转换功能性50的输出与舒适噪声训练和播放功能性330的输入解耦接;以及控制受控数据路径310以将频域到时域转换功能性70的输入耦接到噪声减小功能性305的输出。频域滤波功能性300被布置为从信号ERROR中移除残余回声。噪声减小功能性305被布置为减小来自信号ERROR的噪声。在一个实施方案中,噪声减小功能性305的噪声减小是响应于舒适噪声训练和播放功能性330的近端背景噪声估计。
图4A-图4C示出了全双工语音通信系统10的回声路径改变检测功能性115的详细实施方案的高级示意图,图4A-图4C被一起描述。如图4A所示,回声路径改变检测功能性115包括:时域路径改变检测功能性400;频域路径改变检测功能性410;以及组合路径改变检测功能性420。
如图4B所示,时域路径改变检测功能性400包括:一对自回归移动平均(ARMA)滤波器430;交叉相关功能性440;以及比较器450。每个ARMA滤波器430的输入被布置为接收信号SIN和信号ERROR中的相应信号。每个ARMA滤波器430的输出耦接到交叉相关功能性440的相应输入,并且交叉相关功能性440的输出耦接到比较器450的第一输入。比较器450的第二输入被布置为接收表示为THRESHOLD的阈值。在一个实施方案中,阈值被布置为可由用户调整。比较器450的输出耦接到组合路径改变检测功能性420的相应输入,输出处的信号被表示为TS。
如图4C所示,频域路径改变检测功能性410包括:ARMA滤波器500;ARMA滤波器505;一对平方根功能性510;乘法器520;滤波和归一化功能性530;乘法器540;减法器550;比较器560;累加器565;以及比较器570。ARMA滤波器500的输入被布置为接收信号ERROR的子频带功率。在一个实施方案(未示出)中,从时域到频域转换功能性50接收信号ERROR的子频带功率。ARMA滤波器505的输入被布置为接收信号ROUT的子频带功率。在一个实施方案(未示出)中,从时域到频域转换功能性50接收信号ROUT的子频带功率。类似地,每个平方根功能性510的输入被布置为接收信号ROUT和ERROR中的相应信号的子频带功率。
每个平方根功能性510的输出耦接到乘法器520的相应输入。乘法器520的输出耦接到滤波和归一化功能性530的相应输入。ARMA滤波器500和505中的每一个的输出耦接到滤波和归一化功能性530的相应输入。附加地,ARMA滤波器500的输出进一步耦接到减法器550的相应输入,并且ARMA滤波器505的输出进一步耦接到乘法器540的相应输入。滤波和归一化功能性530的输出耦接到乘法器540的相应输入,并且乘法器540的输出耦接到减法器550的相应输入。减法器550的输出耦接到比较器560的第一输入,并且比较器560的第二输入被布置为接收被表示为THRESHOLD 1的预定阈值。比较器560的输出耦接到累加器565的输入。累加器565的输出耦接到比较器570的第一输入,并且比较器570的第二输入被布置为接收被表示为THRESHOLD 2的预定阈值。在一个实施方案中,预定阈值THRESHOLD 1和THRESHOLD 2各自被布置为由用户调整。比较器570的输出耦接到组合路径改变检测功能性420的相应输入,输出处的信号被表示为FS。
如果近端声学回声路径230(未示出)中存在改变,诸如当近端说话者将其手置于近端声学回声路径230内时,声学输出信号ROUT沿近端声学回声路径230的行进时间和衰减将改变。因此,声学回声估计功能性110(未示出)的声学回声估计将与实际回声不同。时域路径改变检测功能性400被布置为接收信号SIN和ERROR,并且响应于对所接收的信号的时域分析而检测近端声学回声路径230中的改变。具体地,信号SIN和ERROR各自由相应的ARMA滤波器430滤波。交叉相关功能性440被布置为确定平均的信号的交叉相关度量。由比较器450将所确定的交叉相关度量与值THRESHOLD进行比较。如果信号ERROR上存在显著回声,则信号ERROR与信号SIN之间的相似度将高于值THRESHOLD,并且比较器450将输出高信号TS。如果信号ERROR上的回声被成功地消除,则信号ERROR与信号SIN之间的相似度将低于值THRESHOLD,并且比较器450将输出低信号TS。因此,响应于近端声学回声路径230中的改变,比较器450将快速地输出指示声学回声路径450中存在改变的高信号TS。
确定交叉相关是非常快的,并且因此时域路径改变检测功能性400提供对近端声学回声路径230中的改变的快速检测。
频域路径改变功能性410被布置为对信号ERROR和ROUT执行频域分析以检测近端声学回声路径230中的改变。平方根功能性510和乘法器520被布置为确定所接收的信号ERROR和信号ROUT的频率分量中的每一个的互功率。附加地,对于每个频率子频带,信号ERROR功率和信号ROUT功率由相应的ARMA滤波器500和505进行平均。滤波和归一化功能性530被布置为针对每个频带确定所确定的互功率的自回归移动平均。然后通过平均的信号ERROR和ROUT对平均的互功率进行归一化。然后在乘法器540处将平均和归一化的互功率乘以ARMA滤波器505的平均的信号ROUT。减法器550被布置为从ARMA滤波器500的平均的信号ERROR中减去乘法器540的输出。因此,减法器550的输出提供信号ERROR内的残余回声。
比较器560被布置为针对每个频率子频带将残余回声与预定值THRESHOLD 1进行比较,以便确定残余回声是否足够显著以指示近端声学回声路径230中存在改变。如果针对特定频率子频带,残余回声大于THRESHOLD 1,则累加器565被布置为使所储存数目前进1。因此,比较器560和累加器565的组合操作对残余回声大于预定值THRESHOLD 1的频率子频带的数量进行计数。然后,比较器570被布置为将展现出近端声学回声路径230中的改变的指示的频率子频带的计数数量(即累加器565的所生成的数量)与预定值THRESHOLD 2进行比较。如果频率子频带的数量大于预定值THRESHOLD 2,则比较器570被布置为将指示近端声学回声路径230中的改变的高信号FS输出到组合路径改变检测功能性420。频域路径改变检测功能性410的检测比时域路径改变检测功能性400的检测更慢,但它是更准确的。
组合路径改变检测功能性420被布置为确定来自频域路径改变检测功能性410的所接收的指示及来自时域路径改变检测功能性400的所接收的指示的函数。在一个实施方案中,如以下将描述,所接收的指示的函数包括组合逻辑。在一个特定实施方案中,组合路径改变检测功能性420被布置为确定频域路径改变检测功能性410和时域路径改变检测功能性400中的至少一者是否指示近端声学回声路径230中已存在改变,即信号FS及TS中的至少一者为高。在此类情况下,组合路径改变检测功能性被布置为输出近端声学回声路径230中已经存在改变的指示。
应当理解,为了清楚起见而在单独实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反,为简洁起见而在单个实施方案的上下文中描述的本发明的各种特征也可以单独提供或以任何合适的子组合提供。具体地,已经通过按类别对每个用电设备的识别描述了本发明,但是这并不意味着以任何方式进行限制。在替代性实施方案中,所有电动装置被同等地对待,并且因此类别通过其相关联功率要求的识别并非所需的。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文描述的方法类似或等同的方法可以用于本发明的实践或测试,但本文描述了合适的方法。
本文中提及的所有公开、专利申请、专利和其他参考都通过引用以其整体并入。如发生冲突,以专利说明书(包括定义)为准。此外,材料、方法和示例仅是说明性的并且不旨在是限制性的。
本领域技术人员将理解,本发明不限于以上特别示出和描述的内容。相反,本发明的范围由所附权利要求限定,并且包括上文描述的各种特征的组合和子组合以及本领域技术人员在阅读前述描述时将想到的各种特征的变化和修改。
Claims (20)
1.一种全双工语音通信系统,其包括:
近端输入端口,其被布置为接收近端信号;
远端输入端口,其与远端通信装置通信并被布置为接收来自所述远端通信装置的远端信号;
声学回声估计模块,其被布置为响应于所述接收的远端信号而估计所述接收的近端信号内的声学回声;
声学回声消除模块,其被布置为从所述接收的近端信号中消除所述估计的声学回声以生成经回声消除的近端信号;
频域处理模块;
第一可切换衰减模块;
第二可切换衰减模块;
回声路径改变检测模块,其被布置为检测近端声学回声路径中的改变;
近端语音检测模块,其被布置为检测所述接收的近端信号是否表示语音;
远端静音检测模块,其被布置为检测所述接收的远端信号是否表示静音;以及
系统协调单元,
其中响应于所述回声路径改变检测模块的输出、所述近端语音检测模块的输出和所述远端静音检测模块的输出,所述系统协调单元被布置为:
控制所述频域处理模块以使所述经回声消除的近端信号的频率分量交替地衰减第一频域衰减值和第二频域衰减值,所述第二频域衰减值大于所述第一频域衰减值;
控制所述第一可切换衰减模块以使所述频域处理模块的输出的第一函数交替地衰减第一可切换衰减值和第二可切换衰减值,所述第二可切换衰减值大于所述第一可切换衰减值;以及
控制所述第二可切换衰减模块以使所述接收的远端信号的第二函数交替地衰减第三可切换衰减值和第四可切换衰减值,
所述第四可切换衰减值大于所述第三可切换衰减值。
2.根据权利要求1所述的系统,其中所述系统协调单元的用于控制所述第一可切换衰减模块以使所述频域处理模块的所述输出的所述第一函数衰减所述第二可切换衰减值的所述布置,以及所述系统协调单元的用于控制所述第二可切换衰减模块以使所述接收的远端信号的所述第二函数衰减所述第四可切换衰减值的所述布置响应于由所述回声路径改变检测模块检测到声学回声路径改变。
3.根据权利要求1所述的系统,其中所述系统协调单元的用于控制所述频域处理模块以使所述回声消除的近端信号的所述频率分量衰减所述第二频域衰减值的所述布置响应于以下所有三者的组合:
由所述回声路径改变检测模块检测到声学回声路径改变;
由所述近端语音检测模块检测到所述接收的近端信号表示语音;以及
由所述远端静音检测模块检测到所述接收的远端信号不表示静音。
4.根据权利要求1所述的系统,其中响应于所述回声路径改变检测模块的所述输出、所述近端语音检测模块的所述输出和所述远端静音检测模块的所述输出,所述系统协调单元被进一步布置为控制所述声学回声估计模块以交替地进行以下操作:
不更新所述估计的声学回声;
以第一速度更新所述估计的声学回声;以及
以第二速度更新所述估计的声学回声,所述第二速度大于所述第一速度。
5.根据权利要求4所述的系统,其中所述系统协调单元的用于控制所述声学回声估计模块以便以所述第二速度更新所述估计的声学回声的所述布置响应于以下所有三者的组合:
由所述回声路径改变检测模块检测到声学回声路径改变;
由所述近端语音检测模块检测到所述接收的近端信号不表示语音;以及
由所述远端静音检测模块检测到所述接收的远端信号不表示静音。
6.根据权利要求1所述的系统,其还包括噪声估计模块,
其中响应于由所述近端语音检测模块检测到所述接收的近端信号不表示语音,以及由所述远端静音检测模块检测到所述接收的远端信号表示静音,所述系统协调单元被进一步布置为响应于所述接收的近端信号而控制所述噪声估计模块以估计近端背景噪声,并且
其中所述系统协调单元被进一步布置为响应于以下所有三者的组合而控制所述频域处理模块以将所述估计的近端背景噪声的噪声函数输出到所述远端输出端口:
由所述回声路径改变检测模块未检测到声学回声路径改变;
由所述近端语音检测模块检测到所述接收的近端信号不表示语音;以及
由所述远端静音检测模块检测到所述接收的远端信号不表示静音。
7.根据权利要求1所述的系统,其还包括:
近端饱和检测模块,其被布置为检测所述接收的近端信号的幅值水平;以及
扬声器饱和检测模块,其被布置为检测所述接收的远端信号的幅值水平,
其中所述系统协调单元被进一步布置为响应于以下中的一者而控制所述声学回声估计模块以不更新所述估计的声学回声:所述接收的近端信号的所述检测的幅值水平超过近端饱和值,以及所述接收的远端信号的所述检测的幅值水平超过远端饱和值。
8.根据权利要求1所述的系统,其还包括:
近端窄频带信号检测模块,其被布置为检测所述接收的近端信号内的窄频带音调的表示;以及
远端窄频带信号检测模块,其被布置为检测所述接收的远端信号内的窄频带音调的表示,
其中所述系统协调单元被进一步布置为响应于所述检测的近端窄频带音调和所述检测的远端窄频带音调中的一者而控制所述声学回声估计模块以不更新所述估计的声学回声。
9.根据权利要求1所述的系统,其中所述回声路径改变检测模块包括:
时域路径改变检测模块,其被布置为:
执行对所述接收的近端信号的时域分析;
响应于所述时域分析而检测所述近端声学回声路径中的改变;以及
输出所述检测的改变的指示,
频域路径改变检测模块,其被布置为:
执行对所述接收的远端信号及所述经回声消除的近端信号的频域分析;
响应于所述频域分析而检测所述近端声学回声路径中的改变;以及
输出所述检测的改变的指示,以及
组合路径改变检测模块,其被布置为确定所述时域路径改变检测模块的所述输出指示和所述频域路径改变检测模块的所述输出指示的第三函数,
其中所述声学回声路径改变检测模块的所述声学回声路径改变检测响应于所述输出的所述确定的第三函数。
10.一种全双工语音通信方法,所述方法包括:
接收近端信号;
从远端通信装置接收远端信号;
响应于所述接收的远端信号而估计所述接收的近端信号内的声学回声;
从所述接收的近端信号中消除所述估计的声学回声以生成经回声消除的近端信号;
检测所述近端声学回声路径中是否已经发生改变;
检测所述接收的近端信号是否表示语音;以及
检测所述接收的远端信号是否表示静音,
其中响应于所述近端声学回声路径改变检测的结果、所述近端信号语音表示检测的结果和所述远端静音表示检测的结果,所述方法还包括:
使所述经回声消除的近端信号的频率分量交替地衰减第一频域衰减值和第二频域衰减值,所述第二频域衰减值大于所述第一频域衰减值;
使经频率分量衰减的经回声消除的近端信号的第一函数交替地衰减第一可切换衰减值和第二可切换衰减值,所述第二可切换衰减值大于所述第一可切换衰减值;以及
使所述接收的远端信号的第二函数交替地衰减第三可切换衰减值和第四可切换衰减值,所述第四可切换衰减值大于所述第三可切换衰减值。
11.根据权利要求10所述的方法,其中所述使所述经频率分量衰减的经回声消除的近端信号的所述第一函数衰减所述第二可切换衰减值,以及所述使所述接收的远端信号的所述第二函数衰减所述第四可切换衰减值响应于检测到声学回声路径改变。
12.根据权利要求10所述的方法,其中所述使所述经回声消除的近端信号的所述频率分量衰减所述第二频域衰减值响应于以下所有三者的组合:
检测到声学回声路径改变;
检测到所述接收的近端信号表示语音;以及
检测到所述接收的远端信号不表示静音。
13.根据权利要求10所述的方法,其中响应于所述近端声学回声路径改变检测的所述结果、所述近端信号语音表示检测的所述结果和所述远端静音表示检测的所述结果,所述方法还包括交替地进行以下操作:
不更新所述估计的声学回声;
以第一速度更新所述估计的声学回声;以及
以第二速度更新所述估计的声学回声,所述第二速度大于所述第一速度。
14.根据权利要求13所述的方法,其中所述以所述第二速度更新所述估计的声学回声响应于以下所有三者的组合:
检测到声学回声路径改变;
检测到所述接收的近端信号不表示语音;以及
检测到所述接收的远端信号不表示静音。
15.根据权利要求10所述的方法,其还包括:
响应于检测到所述接收的近端信号不表示语音以及检测到所述接收的远端信号表示静音,响应于所述接收的近端信号而估计近端背景噪声;以及
响应于以下所有三者的组合而输出所述估计的近端背景噪声的噪声函数:
检测到没有声学回声路径改变;
检测到所述接收的近端信号不表示语音;以及
检测到所述接收的远端信号不表示静音。
16.根据权利要求10所述的方法,其还包括:
检测所述接收的近端信号的幅值水平;
检测所述接收的远端信号的幅值水平;以及
响应于所述接收的近端信号的所述检测的幅值水平超过近端饱和值,以及所述接收的远端信号的所述检测的幅值水平超过远端饱和值中的一者,不更新所述估计的声学回声。
17.根据权利要求10所述的方法,其还包括:
检测在所述接收的近端信号内是否存在窄频带音调的表示;
检测在所述接收的远端信号内是否存在窄频带音调的表示;以及
响应于检测到所述接收的近端信号内存在所述窄频带音调表示以及检测到所述接收的远端信号内存在所述窄频带音调表示中的一者,不更新所述估计的声学回声。
18.根据权利要求10所述的方法,其中所述回声路径改变检测包括:
执行对所述接收的近端信号的时域分析;
响应于所述时域分析而检测所述近端声学回声路径中的改变;
输出所述时域检测的改变的指示;
执行对所述接收的远端信号及所述经回声消除的近端信号的频域分析;
响应于所述频域分析而检测所述近端声学回声路径中的改变;
输出所述频域检测的改变的指示;以及
确定所述输出时域指示和所述输出频域指示的第三函数,
其中所述声学回声路径改变检测响应于所述确定的第三函数。
19.一种全双工语音通信系统,其包括:
近端输入端口,其被布置为接收近端信号;
远端输入端口,其与远端通信装置通信并被布置为接收来自所述远端通信装置的远端信号;
声学回声估计模块,其被布置为响应于所述接收的远端信号而估计所述接收的近端信号内的声学回声;
声学回声消除模块,其被布置为从所述接收的近端信号中消除所述估计的声学回声以生成经回声消除的近端信号;
频域处理模块;
回声路径改变检测模块,其被布置为检测近端声学回声路径中的改变;
近端语音检测模块,其被布置为检测所述接收的近端信号是否表示语音;
远端静音检测模块,其被布置为检测所述接收的远端信号是否表示静音;以及
系统协调单元,
其中所述系统协调单元被布置为:
响应于所述回声路径改变检测模块没有检测到近端声学回声路径中的改变、检测到所述接收的近端信号表示语音以及检测所述接收的远端信号不表示静音而控制所述频域处理模块以使经回声消除的近端信号的频率分量衰减第一频域衰减值;以及
响应于所述回声路径改变检测模块检测到近端声学回声路径中的所述改变、检测到所述接收的近端信号表示语音以及检测所述接收的远端信号不表示静音而控制所述频域处理模块以使所述经回声消除的近端信号的频率分量衰减第二频域衰减值,所述第二频域衰减值大于所述第一频域衰减值。
20.根据权利要求19所述的全双工语音通信系统,其还包括:
近端窄频带信号检测模块,其被布置为检测所述接收的近端信号内的窄频带音调的表示;以及
远端窄频带信号检测模块,其被布置为检测所述接收的远端信号内的窄频带音调的表示,
其中所述系统协调单元被进一步布置为响应于所述检测的近端窄频带音调和所述检测的远端窄频带音调中的一者而控制所述声学回声估计模块以不更新所述估计的声学回声。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662394204P | 2016-09-13 | 2016-09-13 | |
US62/394,204 | 2016-09-13 | ||
US15/683,862 | 2017-08-23 | ||
US15/683,862 US10122863B2 (en) | 2016-09-13 | 2017-08-23 | Full duplex voice communication system and method |
PCT/US2017/048294 WO2018052678A1 (en) | 2016-09-13 | 2017-08-24 | Full duplex voice communication system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109716743A CN109716743A (zh) | 2019-05-03 |
CN109716743B true CN109716743B (zh) | 2020-12-08 |
Family
ID=61561102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780056328.7A Active CN109716743B (zh) | 2016-09-13 | 2017-08-24 | 全双工语音通信系统和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10122863B2 (zh) |
CN (1) | CN109716743B (zh) |
DE (1) | DE112017004612T5 (zh) |
TW (1) | TW201813342A (zh) |
WO (1) | WO2018052678A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2515592B (en) * | 2013-12-23 | 2016-11-30 | Imagination Tech Ltd | Echo path change detector |
WO2017053490A1 (en) * | 2015-09-25 | 2017-03-30 | Microsemi Semiconductor (U.S.) Inc. | Acoustic echo path change detection apparatus and method |
JP6833616B2 (ja) * | 2017-05-29 | 2021-02-24 | 株式会社トランストロン | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム |
US10720173B2 (en) * | 2018-02-21 | 2020-07-21 | Bose Corporation | Voice capture processing modified by back end audio processing state |
US11363147B2 (en) * | 2018-09-25 | 2022-06-14 | Sorenson Ip Holdings, Llc | Receive-path signal gain operations |
US11205437B1 (en) * | 2018-12-11 | 2021-12-21 | Amazon Technologies, Inc. | Acoustic echo cancellation control |
US10636435B1 (en) | 2018-12-22 | 2020-04-28 | Microsemi Semiconductor (U.S.) Inc. | Acoustic echo cancellation using low-frequency double talk detection |
US10937441B1 (en) * | 2019-01-04 | 2021-03-02 | Amazon Technologies, Inc. | Beam level based adaptive target selection |
CN112825251A (zh) * | 2019-11-21 | 2021-05-21 | 三星电子株式会社 | 电子装置及其控制方法 |
CN111970610B (zh) * | 2020-08-26 | 2022-05-20 | 展讯通信(上海)有限公司 | 回声路径检测方法、音频信号处理方法及系统、存储介质、终端 |
TWI790718B (zh) * | 2021-08-19 | 2023-01-21 | 宏碁股份有限公司 | 會議終端及用於會議的回音消除方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8320554B1 (en) * | 2010-10-19 | 2012-11-27 | Polycom, Inc. | Acoustic echo canceller clock compensation |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4965822A (en) * | 1989-04-10 | 1990-10-23 | Videotelecom Corp. | Full duplex speakerphone |
US5307405A (en) | 1992-09-25 | 1994-04-26 | Qualcomm Incorporated | Network echo canceller |
US5646990A (en) * | 1995-09-21 | 1997-07-08 | Rockwell International Corporation | Efficient speakerphone anti-howling system |
US6141415A (en) * | 1996-10-11 | 2000-10-31 | Texas Instruments Incorporated | Method and apparatus for detecting speech at a near-end of a communications system, a speaker-phone system, or the like |
CA2224541C (en) | 1997-01-07 | 2008-06-17 | Northern Telecom Limited | Method of providing conferencing in telephony |
US5920834A (en) | 1997-01-31 | 1999-07-06 | Qualcomm Incorporated | Echo canceller with talk state determination to control speech processor functional elements in a digital telephone system |
US6658107B1 (en) | 1998-10-23 | 2003-12-02 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and apparatus for providing echo suppression using frequency domain nonlinear processing |
DE19935808A1 (de) | 1999-07-29 | 2001-02-08 | Ericsson Telefon Ab L M | Echounterdrückungseinrichtung zum Unterdrücken von Echos in einer Sender/Empfänger-Einheit |
US6795547B1 (en) | 2000-08-02 | 2004-09-21 | Conexant Systems, Inc. | Full duplex speaker-phone providing increased loop stability |
US6768796B2 (en) * | 2001-02-05 | 2004-07-27 | 3Com Corporation | System and method for echo cancellation |
US6961422B2 (en) * | 2001-12-28 | 2005-11-01 | Avaya Technology Corp. | Gain control method for acoustic echo cancellation and suppression |
NO318401B1 (no) * | 2003-03-10 | 2005-03-14 | Tandberg Telecom As | Et audio-ekkokanselleringssystem og en fremgangsmate for a tilveiebringe et ekkodempet utgangssignal fra et ekkotillagt signal |
US7243065B2 (en) | 2003-04-08 | 2007-07-10 | Freescale Semiconductor, Inc | Low-complexity comfort noise generator |
US7480595B2 (en) | 2003-08-11 | 2009-01-20 | Japan Science And Technology Agency | System estimation method and program, recording medium, and system estimation device |
US7577248B2 (en) * | 2004-06-25 | 2009-08-18 | Texas Instruments Incorporated | Method and apparatus for echo cancellation, digit filter adaptation, automatic gain control and echo suppression utilizing block least mean squares |
US7643630B2 (en) * | 2004-06-25 | 2010-01-05 | Texas Instruments Incorporated | Echo suppression with increment/decrement, quick, and time-delay counter updating |
US20060018457A1 (en) * | 2004-06-25 | 2006-01-26 | Takahiro Unno | Voice activity detectors and methods |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
JP4913155B2 (ja) * | 2006-01-06 | 2012-04-11 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音響エコーキャンセラ |
KR100764788B1 (ko) * | 2006-03-16 | 2007-10-11 | 엘지전자 주식회사 | 이동통신 단말기 및 이동통신 단말기의 음성신호 송신방법 |
US8320574B2 (en) * | 2006-04-20 | 2012-11-27 | Hewlett-Packard Development Company, L.P. | Methods and systems for reducing acoustic echoes in communication systems |
TW200822780A (en) * | 2006-11-07 | 2008-05-16 | Fortemedia Inc | Sound processing apparatus for automatically canceling howling and method for same |
US8077857B1 (en) * | 2007-03-14 | 2011-12-13 | Clearone Communications, Inc. | Portable speakerphone device with selective mixing |
US8014519B2 (en) | 2007-04-02 | 2011-09-06 | Microsoft Corporation | Cross-correlation based echo canceller controllers |
US8139777B2 (en) | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
US8275139B2 (en) * | 2008-03-26 | 2012-09-25 | Ittiam Systems (P) Ltd. | Linear full duplex system and method for acoustic echo cancellation |
US9196258B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Spectral shaping for speech intelligibility enhancement |
FR2952263B1 (fr) * | 2009-10-29 | 2012-01-06 | Univ Paris Descartes | Procede et dispositif d'annulation d'echo acoustique par tatouage audio |
US20110228946A1 (en) | 2010-03-22 | 2011-09-22 | Dsp Group Ltd. | Comfort noise generation method and system |
CN102377453B (zh) * | 2010-08-06 | 2014-02-26 | 联芯科技有限公司 | 一种控制自适应滤波器更新的方法、装置及回声消除器 |
US8589153B2 (en) | 2011-06-28 | 2013-11-19 | Microsoft Corporation | Adaptive conference comfort noise |
CN103428157B (zh) * | 2012-05-16 | 2016-08-10 | 京信通信系统(中国)有限公司 | 一种射频信号的控制方法和设备 |
US9088336B2 (en) * | 2012-09-06 | 2015-07-21 | Imagination Technologies Limited | Systems and methods of echo and noise cancellation in voice communication |
CN103730125B (zh) * | 2012-10-12 | 2016-12-21 | 华为技术有限公司 | 一种回声抵消方法和设备 |
GB201308247D0 (en) * | 2013-05-08 | 2013-06-12 | Microsoft Corp | Noise reduction |
US9100466B2 (en) * | 2013-05-13 | 2015-08-04 | Intel IP Corporation | Method for processing an audio signal and audio receiving circuit |
US8953777B1 (en) | 2013-05-30 | 2015-02-10 | Amazon Technologies, Inc. | Echo path change detector with robustness to double talk |
GB2515592B (en) | 2013-12-23 | 2016-11-30 | Imagination Tech Ltd | Echo path change detector |
CN104767652B (zh) * | 2014-01-08 | 2020-01-17 | 杜比实验室特许公司 | 监视数字传输环境性能的方法 |
US9319783B1 (en) * | 2014-02-19 | 2016-04-19 | Amazon Technologies, Inc. | Attenuation of output audio based on residual echo |
GB2536742B (en) * | 2015-08-27 | 2017-08-09 | Imagination Tech Ltd | Nearend speech detector |
WO2017053490A1 (en) | 2015-09-25 | 2017-03-30 | Microsemi Semiconductor (U.S.) Inc. | Acoustic echo path change detection apparatus and method |
US10079023B2 (en) | 2015-09-25 | 2018-09-18 | Microsemi Semiconductor (U.S.) Inc. | Comfort noise generation apparatus and method |
-
2017
- 2017-08-23 US US15/683,862 patent/US10122863B2/en active Active
- 2017-08-24 DE DE112017004612.2T patent/DE112017004612T5/de active Pending
- 2017-08-24 CN CN201780056328.7A patent/CN109716743B/zh active Active
- 2017-08-24 WO PCT/US2017/048294 patent/WO2018052678A1/en active Application Filing
- 2017-08-24 TW TW106128763A patent/TW201813342A/zh unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8320554B1 (en) * | 2010-10-19 | 2012-11-27 | Polycom, Inc. | Acoustic echo canceller clock compensation |
Also Published As
Publication number | Publication date |
---|---|
US10122863B2 (en) | 2018-11-06 |
CN109716743A (zh) | 2019-05-03 |
DE112017004612T5 (de) | 2021-09-09 |
US20180077290A1 (en) | 2018-03-15 |
WO2018052678A1 (en) | 2018-03-22 |
TW201813342A (zh) | 2018-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109716743B (zh) | 全双工语音通信系统和方法 | |
KR100989266B1 (ko) | 스펙트럼 음향 특성에 기초한 더블 토크 검출 방법 | |
CN110225214B (zh) | 对信号进行衰减的方法、衰减单元、系统和介质 | |
CN110149453B (zh) | 用于动态地对回声消除器进行调谐的增益控制系统和方法 | |
US8355511B2 (en) | System and method for envelope-based acoustic echo cancellation | |
US5598468A (en) | Method and apparatus for echo removal in a communication system | |
EP1298815B1 (en) | Echo processor generating pseudo background noise with high naturalness | |
US8306215B2 (en) | Echo canceller for eliminating echo without being affected by noise | |
US8111840B2 (en) | Echo reduction system | |
US8472616B1 (en) | Self calibration of envelope-based acoustic echo cancellation | |
CN108140395B (zh) | 舒适噪声生成装置和方法 | |
US8064966B2 (en) | Method of detecting a double talk situation for a “hands-free” telephone device | |
CN113196733B (zh) | 使用低频近端语音检测的声学回声消除 | |
CN101292508B (zh) | 声回波消除器 | |
US10014906B2 (en) | Acoustic echo path change detection apparatus and method | |
US8369511B2 (en) | Robust method of echo suppressor | |
US7711107B1 (en) | Perceptual masking of residual echo | |
CA2394370A1 (en) | Echo canceller in a communication system at a terminal | |
WO2024009892A1 (ja) | エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |