CN103141076A

CN103141076A - 回波控制优化

Info

Publication number: CN103141076A
Application number: CN2011800470247A
Authority: CN
Inventors: 帝雅格桑·拉玛令甘姆; 布哈盖夫·G·潘迪瓦; 加里·A·斯卡拉布特纳斯
Original assignee: Cisco Technology Inc
Current assignee: Cisco Technology Inc
Priority date: 2010-09-29
Filing date: 2011-09-15
Publication date: 2013-06-05
Anticipated expiration: 2031-09-15
Also published as: CN103141076B; EP2622834A1; US20120076287A1; WO2012044462A8; US9042535B2; WO2012044462A1; EP2622834B1

Abstract

在一个实现方式中，一种在包括对多个端点回波损耗进行分类的回波控制设备的会议桥上举行的会议。端点可以包括因特网协议(IP)网络和公用交换电话网络(PSTN)上的端点。端点的回波控制是被独立地控制的。回波分类模块计算该端点的相关回波尾的回波损耗值，并且选择合适的回波控制模式。如果回波损耗超过了高阀值，则通过模式被激活。如果回波损耗低于低阀值，则全回波消除模式被激活。如果回波损耗在低阀值和高阀值之间，则回波抑制模式被激活。

Description

回波控制优化

领域

本实施例涉及回波消除的控制。

背景

会议桥从多个端点接收音频流并且将它们混合成单一输出馈送。会议桥向多个端点发送单一馈送。在会议桥上举行的会议可以被用做与在地理上分隔的参与者进行虚拟会议的通信工具。当会议中的语音或者其他音频数量足够多以使得所有参与者都可以被不费力地听到和理解时，这些会议最有效。然而，许多因素可能导致语音质量降低并因此增加理解对话所需的努力。

进一步的，由于会议的分享性质，质量的下降可能被放大。即，一个经受差信号质量的参与者能够影响整个会议的体验。差信号质量的常见原因是线路回波。减少线路回波的传统系统包括高水平的硬件和/或处理资源。资源上的消耗可以使得会议桥在当任何一个或多个节点遭受线路回波时，只能处理显著更少的节点。

附图说明

图1示出了音频会议的实施例。

图2示出了回波控制设备的示例。

图3示出了图2中回波分类器的详细视图。

图4示出了图2中回波消除器的详细视图。

图5示出了包括依照一实施例的回波控制设备的会议桥的硬件实现。

图6示出了回波控制优化的流程图的实施例。

具体实施方式

概述

在会议桥上举行的会议可以包括因特网协议(IP)网络和/或公用交换电话网络(PSTN)上的端点。当回波在任何通信路径或者在任何端点发生时，整个会议受到影响。回波可能由各种来源导致。一个普遍存在于包括基于IP的端点和基于PSTN的端点的会议中的回波来源在通信路径中存在不连续时产生。不连续可能由四线和两线通信路径之间的不匹配造成。

回波消除算法可以被使用以减少或消除会议中的回波，但需要大量的计算资源。更为有效的回波消除由基于产生的回波数量来对各个端点或通信路径进行分类的会议桥实现。回波数量被回波分类器模块通过测量输入和输出通信路径的功率或电压来检测。基于分类器对回波严重程度的确定，分类器选择数个回波控制模式操作之一来向每个端点应用。当分类器认为不需要额外的回波控制时，通过(pass through)模式操作被使用。当相对较小数量的回波被从端点检测到时，抑制模式操作被使用。当相对较大数量的回波被从端点检测到时，全消除模式操作被使用。

在一个方面，一种方法包括从端点接收输入发送信号(input sentsignal)；基于输入发送信号和输出接收信号计算回波损耗；提供多个回波控制模式；当回波损耗小于或者等于阀值水平时选择多个模式中的第一模式，且当回波损耗大于阀值水平时选择多个模式中的第二模式；以及依照基于回波损耗选择出的第一模式或第二模式，对输入发送信号执行回波控制。

在第二个方面，一种装置包括接口、存储器以及处理器。接口从端点接收输入发送信号。存储器储存阀值水平。处理器被配置为基于输入发送信号和输出接收信号的比例计算回波损耗，且当回波损耗小于阀值水平时对输入发送信号执行全回波消除、当回波损耗大于阀值水平时不对输入发送信号执行全回波消除。

在第三个方面，逻辑用于从端点接收输入发送信号，从会议桥控制器接收输出接收信号，基于输入发送信号和输出接收信号计算回波特性，以及基于回波特性的不同值为输入发送信号选择多个回波消除模式。

示例性实施例

图1示出了音频会议的实施例。会议桥10管理会议。会议桥10可以被使用硬件或软件实现。会议桥10使用端口与端点18a-n通信。可以有任何数量在2到N之间的端点和端口。在一些会议中，可以有多达数百个端点。在图1中，发送方向为从右到左，接收方向为从左到右。端点18a-n可以包括IP电话端点和/或普通老式电话系统(POTS)端点。图1示出的示例包括与通话者A-C对应的IP电话端点以及至少一个与通话者N对应的POTS端点的组合。通信路径16包括音频分组流或其他媒体流。IP电话端点可以利用因特网协议语音(VoIP)。

通信路径16可以与分组网络17(例如因特网)处于通信中。此外，通信路径16可以包括局域网(LAN)、广域网(WAN)、有线网络、无线网络、蜂窝网络、它们的组合或任何其他适合承载媒体的网络。分组网络17可以包括一个或多个中间部件，例如网关、路由器、交换机、集线器或其他部件。

POTS端点18n是公用交换电话网络(PSTN)19的一部分，PSTN19通过语音网关20与分组网络17连接。在少数情况下，语音网关20可以是能够消除回波的。但即使在这些情况下，一些回波状况仍无法被语音网关处理。例如，在一些越洋电话中，从会议桥10到POTS端点18n的信号可能经历显著的延迟，导致公用交换电话网络19回波信号延迟超出了语音网关20的回波消除能力。

会议桥10包括会议桥控制器15、回波控制设备(ECD)14a-n、语音编码器11a-n、语音解码器12a-n以及抖动缓冲器13a-n。会议桥控制器15对会议进行混合。即，会议桥控制器15组合来自端点18a-n中的每一个的媒体流以向给定会议中的其他端点传输。

抖动缓冲器13a-n的主要功能是消除来自分组网络17的分组到达时间的变化，从而分组被以恒定的速率传递给语音解码器12a-n。执行该功能时，抖动缓冲器13a-n向从分组网络17接收并传递给解码器12a-n的分组添加延迟。抖动缓冲器13a-n也可以重新排序输入的分组，从而分组被按顺序传递给解码器12a-n。替代地，会议桥10可以不包括抖动缓冲器13a-n，这减少了端点18a-n和解码器12a-n之间的语音分组等待时间，但也可能导致由过度的分组网络10抖动引起的语音中断。抖动缓冲器13a-n可以由软件或硬件实现。

语音解码器12a-n将从端点18a-n接收到的媒体流数据解压缩为回波控制设备14a-n和会议桥控制器15可用的格式。语音编码器11a-n将回波控制设备14a-n的输出数据压缩为可在分组网络17上传输的格式。

回波控制设备14a-n中的每一个与相应端点19a-n相关联。回波控制设备消除或极大地减少了每个呼叫段中的回波。在一个只包括通话者A和B的示例中，当通话者A讲话而通话者B无声时，通话者A所听到的通话者A的任何回波是由通话者B在其端点18b处的回波尾导致的。通话者B导致的回波被回波控制设备14b控制。在通常的示例中，如果有N个端点，则通话者A所听到的任何回波可以是由来自任何另外的N-1个端点的回波尾的任意组合引起的。换言之，通话者A所听到的回波是由回波控制设备14b-n控制的，通话者B所听到的回波是由回波控制设备14a和14c-n控制的。在可选的实施例中，一个或多个回波控制设备14可以与多个通话者相关联，例如回波控制设备14a和b被结合入与通话者A和通话者B相关联的一个设备中。

图2示出了回波控制设备14的示例。回波控制设备14包括回波分类器27、全回波消除器21、回波抑制器23以及通过器(pass through)25。在一个替代中，回波控制设备14包括更多、不同或者更少的器件，例如包括以硬件和/或软件、例如处于分开的设备中或者是一个设备中的软件实现的全回波消除器21、回波抑制器23以及通过器25，中的任意两个。在另外的替代中，回波控制设备14将全回波消除器21、回波抑制器23以及通过器25合并为一个硬件和/或软件器件。全回波消除器21、回波抑制器23以及通过器25提供多个水平的回波消除。通过器25的回波消除水平可以被视为0或者无回波消除。

回波控制设备14有两个输入，接收输入(Rin)和发送输入(Sin)，以及两个输出，接收输出(Rout)和发送输出(Sout)。接收输出由相应的端点接收，发送输入从相应的端点发送。每个回波控制设备14a-n控制从通话者A-N返回的回波。任何被从通话者A反射回的回波以Sin信号的形式进入回波控制设备14，任何残余回波存在于Sout信号中。

回波分类器27将Sin信号与Rout信号相比较以确定回波损耗值或者回波特性。回波损耗值被与至少一个阀值水平相比较。基于下面将被更详细讨论的这种比较，回波分类器27生成使能通过信号、使能回波抑制信号或者使能回波消除信号。在这个示例性实施例中，一次只有一个控制使能信号是活动的，导致一次只有一种回波控制模式被应用。

使能通过信号激活通过器25。通过器25传递发送信号和接收信号。即，当通过器25被激活时，Rin信号与Rout信号相等、Sin信号与Sout信号相等。当分类器认为不需要回波控制时，通过器25被使用。替代地，使能通过信号可以激活控制器或软件中的通过模式。通过模式几乎不需要处理或硬件资源。

使能回波抑制信号激活回波抑制器23。当发送信号Sin中存在相对较少数量的来自端点的回波、或者来自上游回波控制设备(如在语音网关20中)的残余回波时，回波抑制被使用。抑制器被动地阻塞少量回波信号。回波抑制器23包括中心截波器。中心截波器截去或者移除发送信号中所有低于预定水平的部分。当回波抑制器23被激活时，Sout包括信号中超出预定水平的部分，替代地，使能回波抑制信号可以激活控制器或软件中的回波抑制模式。回波抑制模式需要多于通过模式但却大大小于全回波消除的处理或硬件资源。

使能回波消除信号激活全回波消除器21。全回波消除器21从Sin信号中移除回波。当回波分类器27确定相对较大数量的回波被包括在Sin信号中时，全回波消除器21被使用。替代地，使能回波消除信号可以激活控制器或软件中的全回波消除模式。全回波消除器21主动且可靠地消除或减少回波，但它也需要比通过模式或者信号抑制模式更多的处理或硬件资源。

端点18a-n中的每一个被回波消除设备14a-n中的回波分类器独立地分类。因此，回波控制模式可以被独立地应用于会议的每个端点18a-n。此外，回波控制模式是被实时控制的。通过仅仅按需要为每个呼叫段应用回波控制水平，相较向所有端点一直开启(always-on)消除，所需的总体处理或硬件资源可被大大减少。

当所有端点18a-n无声时，三种回波控制模式中的任一种导致的Sout信号可以不包括任何音频。现代通信线路被增加的清晰度可能使得倾听者将无声理解为故障(malfunction)。即，用户会认为这声音太安静了一定有错误。为了与这种效果斗争，少量被称为舒适噪声的背景噪声可以被使用。舒适噪声是在较低但可听到的水平生成的人工噪声。舒适噪声的水平和频谱与背景的相匹配。舒适噪声可以被制造以与特定端点相匹配。换言之，会议桥控制器15或回波控制设备14a-n可以插入基于各个端点18a-n选择的频谱和不同水平的舒适噪声。舒适噪声可以被用在全回波消除模式、回波抑制模式和通过模式中的一个或多个中。

图3示出了回波分类器27的详细视图。回波分类器27包括回波分类器逻辑31、回波损耗(ERL)逻辑33以及双向通话探测器(DTD)35。双向通话探测器35确定何时既有端点18在Sin上讲话也有Rout中的会议桥10输出音频(或者以其他方式同时产生音频)。当双向通话探测器35确定双向通话发生时，回波损耗计算在ERL逻辑33中被通过禁用ERL信号冻结或停止。

否则，ERL逻辑33计算回波损耗。在一个示例中，回波损耗可以是Rout信号水平和Sin信号中返回的回波信号水平之间的比值(比较)。ERL逻辑33可以包括加法器、减法器、比较器、延时或其他逻辑。回波损耗被以分贝(dB)表示，其在多数情况下为正值。较大的回波损耗值对应于较小的回波信号。在第一实现方式中，回波损耗(ERL)可以被使用功率(公式1)或者电压(公式2)计算：

ERL＝10log(PowerRout/PowerSin) (公式1)

ERL＝20log(VoltageRout/VoltageSin)(公式2)

VoltageRout和VoltageSin值可以被按伏特的均方根值测量，PowerRout和PowerSin可以被按任何功率单位(例如瓦特)测量。PowerSin和VoltageSin是不含包括回波和语音的双向通话值的返回回波信号的水平。

回波分类器逻辑31分类回波损耗并选择合适的模式控制信号。回波分类器逻辑31可以包括比较器或其他逻辑。回波损耗可以被与一个或多个可以按dB测量的阀值比较。随着回波损耗的增加，破坏性回波的数量减少。第一阀值(较高ERL阀值或旁路阀值)可以被使用以确定是否激活通过器25与回波抑制器23。第二阀值(较低ERL阀值或抑制阀值)决定是否激活回波抑制器23与全回波消除器21。第一阀值和第二阀值中的一个可以被使用，或者两者可以都被使用。第一阀值大于第二阀值。

在第二实现方式中，当第二阀值大于第一阀值时，回波损耗被使用发送信号和接收信号的比值计算。在此情景下，回波损耗(ERL)可以被使用功率(公式3)或者电压(公式4)计算：

ERL＝-10log(PowerSin/PowerRout) (公式3)

ERL＝-20log(VoltageSin/VoltageRout)(公式4)

其他范围的回波抑制和相应阀值可以被使用，例如提供仅两个或者超过三个水平。

返回参考第一实现方式，阀值的值可以被设置为任何值。第一阀值和第二阀值的示例性范围包括10到100dB。第一阀值(旁路阀值)的示例性取值包括35dB和45dB。第二阀值(抑制阀值)的示例性取值包括20dB和30dB。第一和第二阀值可以是可变的，且可以被用户或者任何端点18a-n设置或控制。

例如，考虑第一阀值等于35dB、第二阀值等于20dB。当回波损耗大于35dB，通过器25被回波分类器27激活。当回波损耗小于等于35dB但大于20dB时，回波抑制器23被回波分类器27激活。当回波损耗小于或等于20dB时，全回波消除器21被回波分类器27激活。

在一个实现方式中，如果来自ERL逻辑33的ERL值缓慢地通过阀值转换，则回波分类器逻辑31可以使用磁滞来避免任何两个回波消除模式之间的快速反复转换。回波分类器27可以持续监视回波损耗。磁滞可以被使用延时或者使用可变阀值来实现。

使用延时，回波分类器逻辑31不允许预定的时间段内从一个回波消除模式到另一个的转变。预定的时间段可以是任何长度的时间(例如100ms、500ms或1秒)。替代地，来自ERL逻辑33的ERL值可在一段时间内被平均，以平滑ERL的频率改变并且避免回波控制模式的突然变化。

使用磁滞，用于增长的回波损耗的阀值和用于下降的回波损耗的阀值是不同的。磁滞可以将阀值调整一比例或者固定值。示例性的比例包括5％、10％或20％。示例性的固定值包括1dB、2dB或5dB。例如，假设第一阀值标称为35dB，第二阀值标称为20dB且磁滞调整为2dB。当回波损耗小于20dB并且在增长时(回波数量下降)，回波消除设备14处于全回波消除模式。当回波损耗超过22dB时，回波消除设备14切换至回波抑制模式。但是第二阀值被调整了2dB。如果回波损耗降至20dB以下，则回波消除设备14保持回波抑制模式直到回波损耗降至18dB。换言之，回波分类器逻辑31依照回波损耗改变的方向和速率调整阀值水平。

相似的磁滞环(hysteresis band)可以被用在第一阀值附近，以在回波抑制模式和通过模式之间转换时提供磁滞。其他达成磁滞的可变阀值的示例对本领域普通技术是显而易见的。

图4示出了回波消除器21的洋细视图。回波消除器21包括双向对话探测器41、卷积处理器43、求和块45以及非线性处理器47。回波消除器的其他实现方式是可能的。

卷积处理器43使用进入回波消除器21的Rin信号来将回波脉冲的数学估计创建为时间的函数。卷积处理器43可以包括自适应滤波器。估计可以被称为H-寄存器图像。Rin信号通过自适应滤波器(或者被H-寄存器图像卷积)以生成回波信号估计。回波信号的估计被用于去除回波。在一个示例中，这由将估计从Sin信号减除的求和块45实现。

求和块45的输出处的信号是“误差信号”，这是因为如果端点并未讲话且回波路径脉冲响应是线性和时不变的，则该信号对于完美的脉冲响应估计来说为零。当脉冲响应估计与导致最小误差信号的回波信号在时间上是对齐的时，回波消除是收敛的。换言之，H-寄存器估计不改变。如果回波消除尚未收敛，或者说是发散的，则信号代表逼近回波路径时的误差，且被用于更新卷积处理器43以达到收敛估计。

双向通话检测器41确定特定的端点何时是无声的。如果双向通话检测器41得出端点是无声的的结论，则H-寄存器寻求改进回波的估计。此外，非线性处理器47被激活，以衰减任何可能向会议桥控制器15返回的残余回波。非线性处理器47抑制残留在误差信号中的回波。在一个实施例中，上文讨论的舒适噪声被非线性处理器47插入到Sout信号中。如果双向通话检测器41得出端点在讲话的结论，则H-寄存器被冻结被保持不变，且非线性处理器47被去激活。

回波可能由各种来源导致。回波的一个来源是通信路径中的不连续。不连续可能是由通信路径中的不匹配阻抗造成的。这在包括分开的接收和发送信道的四线系统被与包括单一双向信道的两线系统连接时是常见的。

回波的另一个来源导致回波返回点存在于混合(IP和PSTN)系统内被连接的语音网关的PSTN侧。当PSTN回波延迟超过了回波消除器的能力时，通常来自这些来源的回波逃脱了语音网关网络回波消除器的控制。

回波的其他来源在端点18a-n内。当端点中的麦克风在端点内没有适当的回波消除的情况下捕捉其自身扬声器的输出时，可能造成声学回波。声学回波也可以由端点的周边环境造成。此外，劣质的安装和劣质的隔离可以造成声学回波。麦克风和扬声器之间的机械耦合或外壳可以从扬声器向麦克风传播震动。此外，由于回波消除软件与运行基于软件的IP电话的实际电脑不完全匹配，因此一些基于软件的IP电话可能造成声学回波。

参考图1，端点18a-n可以由使用任何适于视频和/或音频会议的设备的组合实现。例如，端点18a-n中的一个或多个可以是个人电脑、因特网协议(IP)电话、视频电话、移动电话、平板设备、个人数字助理、移动计算设备(MCD)或者其他包括适于建立和支持视频或音频会议的器件的设备。

适于建立视频会议的器件可以包括显示器、扬声器、摄像机和麦克风。显示器可以是阴极射线管(CRT)显示器、液晶显示(LCD)面板或其他类型的显示器。端点18a-n也可以包括一个或多个网络接口、存储器、处理器、编解码器以及其他适于建立和支持视频会议的硬件和软件。端点18a-n能够产生包括视频和/或音频的媒体流，媒体流来源于摄像机和/或麦克风、被处理器或编解码器压缩和编码、并且被使用网络接口发送至通信路径16。

图5示出了包括回波控制设备14的会议桥10的硬件实现。回波控制设备14a-n和会议桥10的剩余部件可以被作为硬件或软件实现。会议桥10包括存储器51、控制器53、输入/输出(I/O)接口55。可选地，会议桥10可以包括输入设备。

存储器51可以是任何易失性存储器或非易失性存储器。存储器51可以包括只读存储器(ROM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、可编程的随机存取存储器(PROM)、闪速存储器、电可擦可编程只读存储器(EEPROM)、静态随机存取存储器(RAM)或其他类型的存储器中的一个或多个。存储器51可以包括光、磁(硬盘驱动器)或任何其他形式的数据存储装置。存储器51可位于远程设备中，或者是可移动的(例如安全数字(SD)存储卡)。

存储器51可以储存计算机可执行指令。控制器53可以执行计算机可执行指令。计算机可执行指令可以被包括在计算机代码中。计算机代码可以被储存在存储器51中。计算机代码可以以任何计算机语言写成，如C、C++、C#、Java、Pascal、Visual Basic、Perl、超文本标记语言(HTML)、Javascript、汇编语言、可扩展标记语言(XML)及其任意组合。

计算机代码可以是一个或多个有形计算机可读介质或一个或多个非临时计算机可读介质中编码以供控制器53或计算机运行的指令。计算机可读介质可包括但不限于软盘、硬盘、专用集成电路(ASIC)、致密盘CD、其他光介质、随机存取存储器(RAM)、只读存储器(ROM)、记忆芯片或卡、记忆棒以及计算机、处理器或其他电子设备可以读取的其他介质。

控制器53可以包括通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列、模拟电路、数字电路及其组合，或者其他现在已知或以后开发的处理器。控制器53可以是单个设备或设备的组合，如与网络或分布处理相关联。各种处理策略中的任一种可以被使用，如多处理、多任务、并行处理、远程处理、集中处理等。控制器53可响应于或可操作来执行被存储为软件、硬件、集成电路、固件、微代码或类似物的一部分的指令。图中示出或者本文描述的功能、动作、方法或任务可以被控制器53通过执行存储在储存器51中的指令来完成。功能、动作、方法或任务不依赖于指令集、存储介质、处理器或处理策略的特定类型，且可以被单独或组合操作的软件、硬件、集成电路、固件、微代码及其他执行。指令是用于实现本文描述的处理、技术、方法或动作的。

I/O接口55可以包括任何可操作连接。可操作连接可以是信号、物理通信和/或逻辑通信可以在其中被发送和/或接收的连接。可操作连接可以包括物理接口、电接口和/或数据接口。可操作连接可以包括足以允许可操作的控制的接口和/或连接的不同组合。例如，2个实体可以被可操作地连接以直接或者经由一个或多个中间实体(例如处理器、操作系统、逻辑、软件)彼此传递信号。逻辑和/或物理通信信道可以被用来创建可操作连接。例如，I/O接口55可以包括用于发送数据、分组或数据报的第一通信接口55b以及用于接收数据、分组或数据报的第二通信接口55a。替代地，I/O接口55可以被使用单一通信接口实现。

输入设备允许使用者或管理者向会议桥10输入命令。输入设备可以是键盘、跟踪球、触摸板、鼠标或其它用户输入。另外，输入装置可以被通过网络或因特网在另一个终端处远程地提供。

图6示出了回波控制优化的流程图。在S101，会议桥10从端点接收输入发送信号。端点可以是任何端点18a-n。输入发送信号是可以包括音频或视频以及来源于该端点的音频的媒体流的一部分。输入发送信号被传递至特定于端点18a-n的回波消除器设备14a-n。

在S102，特定于该端点的回波消除设备14中的双向通话探测器35确定输入发送信号是否包含来自该端点的语音。如果语音存在于输入发送信号中，则什么也不做。没有新的基于输入发送信号和接收信号水平的回波损耗(ERL)值被计算。如S106中所示的，之前的回波控制模式被保留。如果语音不存在于输入发送信号中，则处理流程继续至S103。换言之，如果只有回波存在于输入发送信号中，则流程继续至S103。

在S103，特定于该端点的回波消除设备14基于输入发送信号和接收信号水平计算回波损耗(ERL)。接收信号被发送至其他端点。会议桥控制器15通过混合或者组合来自会议中其他端点的发送信号生成接收信号。

在S105和S109，回波控制器逻辑31将ERL与第一阀值和第二阀值相比较。第一阀值大于第二阀值。在一个实施例中，只有一个阀值被使用。如果ERL大于第一阀值，则通过模式在S107被激活。如果ERL小于或等于第一阀值但大于第二阀值，则回波抑制模式在S111被激活。如果ERL小于第二阀值，则全回波消除模式在S113被激活。换言之，当回波损耗小于或者等于阀值水平时，回波控制设备14对输入发送信号执行回波消除。

在一个实施例中，会议桥10可以被配置为使用输入设备接收输入，以选择包括单一阀值的第一配置以及包括第一阀值和第二阀值的第二配置。第一配置可以使用三种可能的回波控制模式的任何组合。例如，在第一配置的一个实现方式中，回波控制设备14在ERL大于单一阀值时选择通过模式，并且在ERL小于单一阀值时选择回波抑制模式。在第一配置的另一个实现方式中，回波控制设备14在ERL大于阀值时选择通过模式，并且在ERL小于阀值时选择全回波消除模式。在第一配置的又一个实现方式中，回波控制设备14在ERL大于信号阀值时选择回波抑制模式，并且在ERL小于信号阀值时选择全回波消除模式。

尽管公开的实施例仅在音频方面被讨论，但会议可以包括音频以及视频。相应地，端点18a-n可以是包括摄像机和麦克风的音频和视频端点，并且会议桥10可以被配置为处理包括音频和视频部分的信号或者分开的信号音频信号和视频信号。

在一些会议中，回波是罕见的或者可以被限制在相对较少的参与者中。处理器或硬件资源效率可以通过可作为软件来实现的回波控制设备14的选择性应用来实现。利用多数会议端点有很少回波或者没有回波的倾向是可能的。具有很少回波或没有回波的端点处的回波可以通过使用最少的处理或硬件资源的简单回波控制技术来消除或减少。积极的回波控制被应用于经受破坏性回波的会议端点的部分。相较为每个端点执行全回波消除的会议，仅为会议端点的一部分使用这些资源导致显著更少的处理或硬件资源。

在下面的假设中，来自效率的获益被示出。在一个场景中，全回波消除模式可以需要通过模式所需资源的二十倍。考虑能够支持50个使用全回波消除的端点的会议桥。如果只有5％的端点需要全回波消除且剩余的使用通过模式，则同样的会议桥可以支持525个端点。示例分配包括25个使用全回波消除的端点以及500个使用通过模式的端点。类似的例证在使用全部三种回波消除模式的情况下是可能的。

本文描述的多个实施例可以被单独地或者与彼此组合使用。上文细节化的说明仅仅描述了本发明多个可能的实现方式中的几个。因此，该细节化的说明是示意性而非限制性的。

Claims

1.一种方法，包括：

从端点接收输入发送信号；

基于所述输入发送信号和输出接收信号计算回波损耗；

提供回波控制的多个模式；

当回波损耗小于或者等于阀值水平时选择所述多个模式中的第一模式，且当回波损耗大于阀值水平时选择所述多个模式中的第二模式；以及

依照基于所述回波损耗选择出的所述第一模式或所述第二模式，对所述输入发送信号执行回波控制。

2.如权利要求1所述的方法，进一步包括：

向会议桥控制器发送总发送信号，所述会议桥控制器对包括所述总发送信号的多个信号进行混合。

3.如权利要求1所述的方法，其中所述第一模式包括通过移除所述输入发送信号的一部分来抑制回波，并且所述第二模式包括通过所述输入发送信号。

4.如权利要求1所述的方法，其中所述第一模式包括通过减去回波信号的估计来消除回波，并且所述第二模式包括通过所述输入发送信号。

5.如权利要求1所述的方法，其中所述第一模式包括通过减去回波信号的估计来消除回波，并且所述第二模式包括通过移除所述输入发送信号的一部分来抑制回波。

6.如权利要求1所述的方法，其中所述阀值水平包括第一阀值水平，所述方法进一步包括：

当所述回波损耗大于第二阀值水平时，选择所述多个模式中的第三模式；以及

依照基于所述回波损耗选择出的所述第一模式、所述第二模式或所述第三模式，对所述输入发送信号执行回波控制，

其中所述第一模式包括通过减去回波信号的估计来消除回波，所述第二模式包括通过移除所述输入发送信号的一部分来抑制回波，并且所述第三模式包括通过所述输入发送信号。

7.如权利要求6所述的方法，其中所述输入发送信号的所述一部分被基于所述端点所制造的功率水平和背景噪声频谱中的至少一个生成的人工噪音替代。

8.如权利要求1所述的方法，其中所述端点包括第一端点，所述方法进一步包括：

借助因特网协议(IP)网络向第二端点发送所述输出信号，

其中所述输入发送信号是借助公用交换电话网络(PSTN)从所述第一端点发送的，以及

其中所述回波至少部分地由所述IP网络和所述PSTN间的不连续导致。

9.如权利要求1所述的方法，其中所述回波损耗包括由所述端点的周边环境或者所述端点的物理特性导致的声学回波。

10.如权利要求1所述的方法，其中所述回波损耗包括第一回波损耗，所述方法进一步包括：

延迟第二回波损耗的第二计算预定的时间段。

11.如权利要求1所述的方法，其中所述回波损耗包括第一回波损耗，所述方法进一步包括：

在所述第一回波损耗之后计算第二回波损耗；

基于所述第一回波损耗和所述第二回波损耗间的改变是上升还是下降，调整所述阀值水平。

12.一种装置，包括：

接口，从端点接收输入发送信号；

存储器，存储阀值水平；

处理器，被配置为基于所述输入发送信号和输出接收信号的比例计算回波损耗，且当所述回波损耗小于所述阀值水平时对所述输入发送信号执行全回波消除、当所述回波损耗大于所述阀值水平时不对所述输入发送信号执行全回波消除。

13.如权利要求12所述的装置，其中所述阀值水平包括第一阀值水平，所述装置进一步包括：

当所述回波损耗大于所述第一阀值水平且小于第二阀值水平时对所述输入发送信号执行回波抑制；以及

当所述回波损耗大于所述第二阀值水平时通过所述输入发送信号。

14.如权利要求12所述的装置，其中所述端点是第一端点，且所述接口被进一步配置为借助因特网协议(IP)网络向第二端点发送所述输出接收信号，

15.如权利要求12所述的装置，其中由所述端点周边环境或者所述端点的物理特性导致的声学回波导致所述回波损耗。

16.如权利要求12所述的装置，其中所述阀值水平被依照所述回波损耗是上升还是下降调整。

17.如权利要求12所述的装置，其中所述处理器被配置为延迟计算所述回波损耗预定的时间段。

18.一种非易失性计算机可读存储介质，其编码了可被计算机执行的指令以：

从端点接收输入发送信号；

从会议桥控制器接收输出接收信号；

基于所述输入发送信号和所述输出接收信号计算回波特性；以及

基于所述回波特性的不同值为所述输入发送信号选择多个回波控制模式。

19.如权利要求18所述的计算机可读存储介质，其中所述多个回波控制模式包括：

全消除模式，减去来自所述输入发送信号的回波信号的估计；

抑制模式，截除所述输入发送信号的一部分；以及

旁路模式，通过所述输入发送信号。

20.如权利要求18所述的计算机可读存储介质，其中所述端点是第一端点，逻辑进一步用于：

借助因特网协议(IP)网络向第二端点发送所述输出信号，