CN101542600A

CN101542600A - 基于分组的回音取消和抑制

Info

Publication number: CN101542600A
Application number: CNA2007800344394A
Authority: CN
Inventors: 曹彬石; D·-S·金; A·A·塔拉夫; D·J·尤特库斯
Original assignee: Lucent Technologies Inc
Current assignee: Alcatel Lucent SAS
Priority date: 2006-09-19
Filing date: 2007-09-18
Publication date: 2009-09-23
Anticipated expiration: 2027-09-18
Also published as: US7852792B2; EP2070085A1; JP5232151B2; WO2008036246B1; EP2070085B1; WO2008036246A1; JP2010503325A; KR101038964B1; US20080069016A1; KR20090051760A; CN101542600B

Abstract

在用于回音抑制或取消的方法中，基于与多个参考语音分组中每个参考语音分组及目标语音分组相关联的至少一个已编码语音参数从所述多个参考语音分组选择参考语音分组。基于所选参考语音分组抑制或取消所述目标语音分组中的回音。

Description

基于分组的回音取消和抑制

技术领域

背景技术

在传统通信系统中，编码器产生表示语音或数据通信量的信息比特流。这种比特流被进行再分和分组、与各种控制比特级联并包装成合适格式以供传输。可用根据适当通信机制的例如帧、分组、子分组等的各种格式来传输语音和数据通信量。为清晰起见，本文将使用术语“传输帧”来描述实际传输通信量所用的传输格式。将使用术语“分组”来描述话音编码器的输出。话音编码器还被称为语音编码器或“语音合成器(vocoder)”，且在本文中这些术语可互换使用。

语音合成器提取与语音信息(例如人类说话)生成的模型有关的参数，并使用所提取的参数来压缩语音信息，以供传输。语音合成器一般包括编码器和解码器。语音合成器将到来的语音信息(例如模拟语音信号)分割成块，对到来的语音块进行分析以提取某些相关参数，并将所述参数量化成二进制或比特表示。比特表示被包装成分组，分组被格式化成传输帧，并通过通信信道将传输帧传送到具有解码器的接收机。在接收机，从传输帧提取分组，且解码器对分组中携带的比特表示进行非量化(unquantize)以产生编码参数集合。然后，解码器使用非量化的参数重新合成语音段以及随后的原始语音信息。

通常使用各种压缩技术将不同类型的语音合成器配置在各种现有的无线及有线通信系统中。此外，由某一特定标准所定义的传输帧格式和处理可与其它标准的传输帧格式和处理明显不同。例如，CDMA标准支持变速率语音合成器帧在扩频环境中的使用，而GSM标准支持固定速率语音合成器帧及多速率语音合成器帧的使用。类似地，通用移动远程通信系统(UMTS)标准也支持固定速率和多速率语音合成器，但不支持变速率语音合成器。为了这些通信系统之间的兼容性与互操作性，实现在GSM和UMTS之内对变速率语音合成器帧的支持以及在CDMA系统之内对非变速率语音合成器帧的支持是合乎需要的。几乎所有通信系统的一个共同事件是回音(echo)的出现。声回音和电回音是回音的示例类型。

声回音因手持机和/或自动(hand-free)装置的听筒与麦克风之间低质语音耦合而产生。电回音由PSTN网络内的4-至-2线耦合产生。语音压缩语音合成器处理包括在手持机内及在无线网络中的回音的语音，所述回音导致具有高度可变属性的所返回回音信号。所述反射的信号降低了语音通话质量。

在声回音的一种示例中，需要时，来自扬声器的声音被在近端的听众收听。但是，这种在近端的相同声音在被反射之后还被麦克风直接及间接拾取。这种反射的结果是生成了回音，除非将其消除否则回音将被传回远端并作为回音被在远端的说话者听见。

图1示出了包括用于取消反射的信号的常规回音取消器和/或抑制器的分组网络上语音示图。

如果将常规回音取消器和/或抑制器100用于分组交换网络，则常规回音取消器必须对与双向传输的语音信号相关联的语音合成器分组进行完全解码，以便获得回音取消参数，因为所有常规回音取消操作与线性非压缩话音配合起作用。即，常规回音取消器和/或抑制器100必须从传输帧提取分组，对在分组中携带的比特表示非量化以产生编码参数集合，并在取消回音之前重新合成语音段。然后，常规取消器和/或抑制器使用重新合成的语音段来取消回音。

因为传输的语音信息在传输之前被编码成参数(例如在参量域中)，且常规回音取消器和/或抑制器工作于非线性话音域，分组交换网络中的常规回音取消和/或抑制变得相对困难、复杂，可由于例如所涉及的附加串联(tandeming)编码而增加编码和/或解码延迟和/或降低语音质量。

发明内容

示例实施例定位于用于基于分组的回音取消和/或抑制的方法和装置。一种示例实施例提供用于抑制和/或取消回音的方法。在该示例实施例中，基于与多个参考语音分组中每个参考语音分组及目标语音分组相关联的至少一个编码语音参数，从所述多个参考语音分组选择参考语音分组。基于所选参考语音分组抑制/取消所述目标语音分组中的回音。

附图说明

从下文给出的详细描述以及附图，将可更充分理解本发明，其中，相同单元用相同参考标号表示，所述附图只以示例方式给出因此不是对本发明的限制，其中：

图1是包括常规回音取消器和/或抑制器的分组网络上语音的示图；

图2示出依照示例实施例的回音取消器和/或抑制器；

图3是依照示例实施例示出用于回音取消和/或抑制的方法。

具体实施方式

依照示例实施例的方法和装置可根据例如分组交换通信系统中的特定应用执行回音取消和/或抑制。本文将以回音取消和/或抑制、回音取消器和/或抑制器等描述示例实施例。

此后，出于示例目的，疑为携带了反射的语音信息(例如，在近端所接收到的且被反射回远端的语音信息)的声音合成器分组将被称为目标分组，与这些目标分组相关联的编码参数将被称为目标分组参数。与从远端原始传送的语音信息(例如，可能反射的语音信息)相关联的、用于确定目标分组是否包含反射的语音信息的语音合成器分组或参数分组将被称为参考分组。与参考分组相关联的编码参数将被称为参考分组参数。

如上所述，图1示出分组网络上语音的示图，包括常规回音取消器和/或抑制器。依照示例实施例的方法可在现有回音取消器和/或抑制器、例如图1中示出的回音取消器和/或抑制器100实现。例如，示例实施例可在现有数字信号处理器(DSP)、现场可编程门阵列(FPGA)等上实现。另外，示例实施例可与例如VoIP网络、VoATM网络、TrFo网络等的任意类型陆地或无线分组交换网络结合使用。

一种用于对语音信息进行编码的示例语音合成器是基于码激励线性预测(Code Excited Linear Prediction：CELP)的语音合成器。基于CELP的语音合成器将数字语音信息编码成编码参数的集合。这些参数包括例如自适应码本(codebook)和固定码本增益、基音(pitch)/自适应码本、线性频谱对(linear spectrum pair：LSP)和固定码本。这些参数的每个参数可用若干比特来表示。例如，对于作为众所周知的语音合成器的增强型变速率编解码(Enhanced Variable Rate CODEC：EVRC)语音合成器的全速率分组，LSP用28个比特表示，基音及其对应Δ用12个比特表示，自适应码本增益用9个比特表示，而固定码本增益用15个比特表示。固定码本用120个比特表示。

还参考图1，如果在近端的CELP语音合成器进行语音信息的编码期间出现了反射的声音信号，则所传输的语音合成器分组的至少一部分可包括反射的语音信息。所述反射的语音信息可与原始传送的语音信息相同或类似，因此携带从近端传送到远端的语音信息的语音合成器分组可与携带从远端到近端的原始已编码语音信息的语音合成器分组类似或基本类似或相同。即，例如在原始语音合成器分组中的比特可与携带反射的语音信息的对应语音合成器分组中的比特类似或基本类似或相同。

依照示例实施例的分组域回音取消器和/或抑制器和/或其方法利用这种相似性来通过自适应地调整与所传输分组相关联的编码参数取消和/或抑制所传输信号中的回音。

出于示例目的，将针对基于CELP的语音合成器、例如EVRC语音合成器描述示例实施例。但是，依照示例实施例的方法和/或装置可结合和/或适合结合任意适合语音合成器使用。

图2示出依照示例实施例的回音取消器和/或抑制器。如图所示，图2的回音取消器和/或抑制器可将从远端收到的原始语音合成器分组(参考分组)缓存在参考分组缓冲存储器202中。回音取消器和/或抑制器可将来自近端的目标分组缓存在目标分组缓冲存储器204中。图2的回音取消器和/或抑制器还可包括回音取消和/或抑制模块206以及存储器208。

回音取消和/或抑制模块206可基于与存储在参考分组缓冲存储器202中的至少一个参考分组以及存储在目标分组缓存204中的至少一个目标分组相关联的至少一个已编码语音参数取消和/或抑制来自信号(例如发送和/或接收信号)的回音。下面更详细地论述回音取消和/或抑制模块206及在其中所执行的方法。

存储器208可存储例如语音分组相似性度量、对应参考语音分组、目标语音分组等的中间值和/或语音分组。在至少一种示例实施例中，存储器208可存储各个相似性度量和/或总相似性度量。下面将更详细地描述存储器208。

回到图2，可基于轨迹(trajectory)搜索/匹配操作的轨迹匹配长度确定缓冲存储器204的长度，下面对其进行更详细描述。例如，如果各语音合成器分组携带20ms语音段且轨迹匹配长度为120ms，则缓冲存储器204可保存6个目标分组。

可基于回音尾部的长度、网络延迟以及轨迹匹配长度确定缓冲存储器202的长度。例如，如果各语音合成器分组携带20ms语音段，回音尾部长度等于180ms且轨迹匹配长度为120ms(例如6个分组)，则缓冲存储器202可保存15个参考分组。可用m表示可在用于参考分组的缓冲器202中存储的分组的最大数目。

尽管图2示出了两个缓冲器202和204，但是这些缓冲器可合并成单个存储器。

在至少一种实施例中，回音尾部的长度可由回音路径的已知网络参数确定和/或定义，或者使用实际搜索过程来获得。确定回音尾部的长度的方法在本领域是众所周知的。在确定了回音尾部的长度之后，依照至少某些示例实施例的方法可在等于回音尾部长度的时间窗内执行。时间窗宽度可等于例如一个或几个传输帧的长度、或者一个或几个分组的长度。出于示例目的，将通过假设回音尾部的长度等于单个传输帧中所传送的声音信号的长度来描述示例实施例。

通过将存储在缓冲器202中的参考分组与携带反射的语音信息的目标分组匹配，示例实施例可应用于任意回音尾部长度。通过将目标分组与存储在缓冲器202中的m个参考分组的每个参考分组进行比较，确定目标分组是否包含反射的语音信息。

图3是依照示例实施例示出用于回音取消和/或抑制的方法的流程图。图3中示出的方法可由图2中示出的回音取消和/或抑制模块206执行。

参考图3，在S302，计数器值j可被初始化到1。在S304，可从缓冲器202检索参考分组R_j。在S306，回音取消和/或抑制模块206可将计算器值j与阈值m进行比较。如上所述，m可等于存储在缓冲器202中的参考分组的数量。在该示例中，因为存储在缓冲器202中的参考分组的数量m等于在单个传输帧中所传送的参考分组的数量，所以阈值m可等于在单个传输帧中所传送的分组的数量。这种情况下，值m可从包含在传输帧中的传输帧报头提取，这在本领域是众所周知的。

在S306，如果计数器值j小或等于阈值m，则在S308回音取消和/或抑制模块206从参考分组R_j提取已编码参数。同时，在S308，回音取消和/或抑制模块206从目标分组T提取已编码编码参数(encoded coding parameter)。用于提取这些参数的方法在本领域是众所周知的。因此，为简洁而省略了详细论述。如上所述，本文针对基于CELP的语音合成器描述示例实施例。对于基于CELP的语音合成器，参考分组参数和目标分组参数可包含固定码本增益G_f、自适应码本增益G_a、基音P和LSP。

还参考图3，在S309，回音取消和/或抑制模块206可基于从目标分组T和参考分组R_j所提取的已编码编码参数的部分执行双端通话(double talk)检测，以便确定双端通话是否存在于参考分组R_j中。在包括双端通话的语音段期间，不需要执行回音取消和/或抑制，因为反射的远端语音信息淹没在近端语音信息中，因此在远端是觉察不到的。

双端通话检测可用于确定参考分组R_j是否包含双端通话。在示例实施例中，可通过将从目标分组T所提取的已编码参数与从参考分组R_j所提取的已编码参数进行比较来检测双端通话。在上述CELP语音合成器示例中，所述已编码参数可为固定码本增益G_f和自适应码本增益G_a。

回音取消和/或抑制模块206可根据式(1)中示出的条件确定双端通话是否存在：

根据式(1)，如果参考分组R_j的固定码本增益G_fR与目标分组T的固定码本增益G_fT之差小于固定码本增益阈值Δ_f，则在参考分组R_j中存在双端通话且可将双端通话检测标记DT设置为1(例如DT＝1)。同样，如果参考分组R_j的自适应码本增益G_aR和目标分组T的自适应码本增益G_aT之差小于自适应码本增益阈值Δa，则在参考分组R_j中存在双端通话且可将双端通话检测标记DT设置为1(例如DT＝1)。否则，在参考分组R_j中不存在双端通话且不设置双端通话检测标记DT(例如DT＝0)。

参考图3，如果在S310不设置双端通话检测标记DT(例如DT＝0)，则可在S312执行从目标分组T所提取的已编码参数与从参考分组R_j所提取的已编码参数之间的相似性估计。该相似性估计可用于确定是否要基于从目标分组T所提取的已编码参数、从参考分组R_j所提取的已编码参数以及相似性阈值设置多个相似性标记的每个标记。

相似性标记可被称为相似性指示符。相似性标记或相似性指示符可包含例如基音相似性标记(或指示符)PM以及多个LSP相似性标记(或指示符)。多个LSP相似性标记可包括多个带宽相似性标记BM_i和多个频率相似性匹配标记FM_i。

又参考图3的S312，回音取消和/或抑制模块206可确定是否要依照式(2)设置参考分组R_j的基音相似性标记PM：

如式(2)所示，P_T为与目标分组相关联的基音，P_R是与参考分组R_j相关联的基音且Δ_p是基音阈值。可基于依照所用特定类型的语音合成器所获得的试验性数据确定基音阈值Δ_p。如式(2)所示，如果基音P_T和基音P_R之差的绝对值小于或等于阈值Δ_p，则基音P_T与基音P_R相似，且基音相似性标记PM可设为1。否则，基音相似性标记PM可设为0。

继续参考图3的S312，与上述基音相似性估计方法类似，LSP相似性估计可用于确定参考分组R_j与目标分组T是否相似。

通常，CELP语音合成器使用10阶线性可预测编码(LinearPredictive Coding：LPC)可预测滤波器，该滤波器使用矢量量化对10个LSP值进行编码。另外，各LSP对定义相应语音频谱共振峰(formant)。共振峰是由任意声音系统的共振频率产生的声频频谱的峰值。各特定共振峰可用由式(3)给出的带宽B_i表示：

B_i＝LSP_2i-LSP_2i-1，i＝1，2，...，5； (3)

且由式(4)给出中心频率F_i：

F_{i} = \frac{{LSP}_{2 i} + {LSP}_{2 i - 1}}{2}, i = 1,2, . . ., 5; - - - (4)

如式(3)和(4)中所示，B_i是第i个共振峰的带宽，F_i是第i个共振峰的中心频率，且LSP_2i和LSP_2i-1是第i对LSP值。

在该示例中，对于10阶LPC可预测滤波器，可生成5对LSP值。

前3个共振峰中的每个共振峰可包括信息语音段的重要或比较重要的频谱包络信息。所以，可基于所述前3个共振峰i＝1，2和3执行LSP相似性估计。

对于各共振峰i(i＝1，2，3)，指示与目标分组T相关联的带宽B_Ti是否和与参考分组R_j相关联的带宽B_Ri相似的带宽相似性标记BM_i可根据式(5)设置：

如式(5)中所示，B_Ti是与目标分组T相关联的第i个带宽，B_Ri是与参考分组R_j相关联的第i个带宽，且Δ_Bi是用于确定带宽B_Ti和B_Ri是否相似的第i个带宽阈值。如果BM_i＝1，则第i个带宽B_Ti和B_Ri均处于相互的某个范围内，且可被认为相似。否则，在BM_i＝0时，第i个带宽B_Ti和B_Ri可被认为不相似。与基音阈值相似，可基于根据所用的特定类型语音合成器所获得的实验性数据确定各带宽阈值。

继续参考图3的S312，与目标分组T相关联的第i个频率和与参考分组R_j相关联的对应第i个频率是否相似可通过频率相似性标记FM_i来指示。可依照式(6)设置频率相似性标记FM_i：

在式(6)中，F_Ti是与目标分组T相关联的第i个中心频率，F_Ri是与参考分组R_j相关联的第i个中心频率，且Δ_Fi是第i个中心频率阈值。第i个中心频率阈值Δ_Fi可指示第i个目标和参考中心频率F_Ti和F_Ri(i＝1，2，3)之间的相似性。与基音阈值和带宽阈值相似，可基于根据所用的特定类型语音合成器所获得的实验性数据确定频率阈值。

FM_i是相应LSP对的第i个带宽的中心频率相似性标记。根据式(6)，FM_i＝1表示F_Ti和F_Ri相似，而FM_i＝0表示F_Ti和F_Ri不相似。

参考图3，如果在S314确定多个参数相似性标记PM、BM_i和FM_i中每个标记被设置为等于1，则可认为参考分组R_j与目标分组T相似。换句话说，如果参数相似性指示符PM、BM_i和FM_i中每个指示符这样指示，则参考分组R_j与目标分组T相似。

接着在S316，回音取消和/或抑制模块206可计算总语音分组相似性度量。例如，总语音分组相似性度量可为总相似性度量S_j。总相似性度量S_j可指示目标分组T与参考分组R_j之间的总相似性。

在至少一种示例实施例中，可基于多个独立语音分组相似性度量计算与参考分组R_j相关联的总相似性度量S_j。多个独立语音分组相似性度量可为独立相似性度量。

所述多个独立相似性度量可基于从目标分组T与参考分组R_j所提取的已编码参数的至少一部分来计算。在该示例实施例中，多个独立相似性度量可包括基音相似性度量S_p、带宽相似性度量S_Bi(i＝1，2，3)以及频率相似性度量S_Fi(i＝1，2，3)。可同时计算多个独立相似性度量中的每个相似性度量。

例如，可根据式(7)计算基音相似性度量S_p：

S_{p} = \frac{| P_{T} - P_{R} |}{| P_{T} + P_{R} |} - - - (7)

可根据式(8)计算i个共振峰中的每个共振峰的带宽相似性度量S_Bi：

S_{Bi} = \frac{| B_{Ti} - B_{Ri} |}{| B_{Ti} + B_{Ri} |}, i = 1,2,3 . - - - (8)

如式(8)所示及如上所述，B_Ti是目标分组T的第i个共振峰的带宽，B_Ri是参考分组R_j的第i个共振峰的带宽。

同样，可根据式(9)计算i个共振峰中的每个共振峰的中心频率相似性S_Fi：

S_{Fi} = \frac{| F_{Ti} - F_{Ri} |}{| F_{Ti} + F_{Ri} |}, i = 1,2,3; - - - (9)

如式(9)所示及如上所述，F_Ti是目标分组T的第i个共振峰的中心频率，F_Ri是参考分组R_j的第i个共振峰的中心频率。

在获得多个独立相似性度量之后，可根据式(10)计算总相似性匹配度量S_j：

S = α_{p} S_{p} + α_{LSP} \underset{i}{Σ} \frac{β_{Bi} S_{Bi} + β_{Fi} S_{Fi}}{2}; - - - (10)

在式(10)中，各独立相似性度量可由相应权重函数进行称重。如式所示，α_p为基音相似性度量S_p的相似性权重常数，α_LSP为LSP频谱相似性度量S_Bi和S_Fi的总相似性权重常数，β_Bi为带宽相似性度量S_Bi的独立相似性权重常数且β_Fi为频率相似性度量S_Fi的独立相似性权重常数。

可确定相似性权重常数α_p和α_LSP以满足下面所示的式(11)：

α_p+α_LSP＝1； (11)

同样，可确定独立相似性权重常数β_Bi和β_Fi以满足下面所示的式(12)：

β_Bi+β_Fi＝1；i＝1，2，3； (12)

依照至少某些示例实施例，可根据经验数据确定和/或调整权重常数使得式(11)和(12)满足。

参考图3，在S318，回音取消和/或抑制模块206可将计算出的总相似性度量S_j存储在图2的存储器208中。存储器208可为任意众所周知的存储器，例如缓冲存储器。在S320递增计数器值j：j＝j+1，该方法返回S304。

回到图3的S314，如果没有设置任意参数相似性标记，则回音取消和/或抑制模块206确定参考分组R_j与目标分组T不相似，因此目标分组T不携带与参考分组R_j所携带的原始语音信息对应的反射的语音信息。这种情况下，可递增计数器值j(j＝j+1)，且该方法如上述那样继续。

回到图3的S310，如果在参考分组R_j中检测到双端通话，则可在S311丢弃该参考分组R_j，可在S320递增计数器值j：j＝j+1，且在S304回音取消和/或抑制模块206从缓冲器202检索下一参考分组R_j。在从缓冲器202检索到下一参考分组R_j之后，所述过程可继续到S306并重复。

回到S306，如果计数器值j大于阈值m，则可在S321执行矢量轨迹匹配操作。轨迹匹配可用于定位目标分组的固定码本增益与所存储参考分组的各固定码本增益之间的相关。轨迹匹配还可用于定位目标分组的自适应码本增益与各参考分组矢量的自适应码本增益之间的相关。依照至少一种示例实施例，可通过使用最小均方差(LeastMean Square：LMS)或交叉相关(cross-correlation)算法来执行矢量轨迹匹配以便确定目标分组与各相似参考分组之间的相关。因为LMS和交叉相关算法在本领域中是众所周知的，因此为简洁起见，省略了对其的详细论述。

在至少一种示例实施例中，矢量轨迹匹配可用来检验目标分组与每个所存储相似参考分组之间的相似性。在至少一种示例实施例中，在S321可用矢量轨迹匹配来过滤出不满足(fail)相关阈值的相似参考分组。可将与不满足相关阈值的所存储相似参考分组相关联的总相似性度量S_j从存储器208中去除。可基于实验性数据确定相关阈值，这在本领域中众所周知的。

尽管图3的方法在S321示出矢量轨迹匹配步骤，但是可如本领域技术人员所期望那样省略该步骤。

在S322，可搜索存储器208中余下的所存储总相似性度量S_j，以便确定相似参考分组中的哪个相似参考分组包括反射的语音信息。换句话说，可搜索相似参考分组以便确定哪个参考分组与目标分组匹配。在示例实施例中，与目标分组匹配的参考分组可为具有最小关联总相似性度量S_j的参考分组。

如果在存储器中通过目标分组T与参考分组R_j对相似性度量S_j进行索引(用于这样做的方法是众所周知的，因此为了简洁而将其省略)，则总相似性度量可表示为S(T，R_j)，其中j＝1，2，3...m。

将总相似性度量表示为S(T，R_j)，其中j＝1，2，3...m，可使用式(13)获得最小总相似性度量S_min：

S_min＝MIN[S(T，R_j)，j＝0，1，...，m] (13)

又回到图3，在定位匹配参考分组之后，在S324，回音取消和/或抑制模块206可基于从匹配参考分组所提取的已编码参数的部分取消和/或抑制回音。例如，可通过调整(例如衰减)与目标分组T相关联的增益取消和/或抑制回音。可基于与匹配的参考分组相关联的增益、与匹配参考分组相关联的总相似性度量以及增益权重常数执行增益调整。

例如，可通过衰减如式(14)中示出的自适应码本增益和/或如式(15)中示出的固定码本增益来取消和/或抑制回音：

G′_fR＝W_fS*G_fRj (14)

G′_aR＝W_aS*G_aR (15)

如式(14)中所示，G′_fR为与参考分组相关联的固定码本增益的调节增益，W_f为固定码本的增益权重。

如式(15)中所示，G′_aR为与参考分组相关联的自适应码本增益的调节增益，W_a为自适应码本的增益权重。起初，W_f和W_a均可等于1。但是，可根据例如话音特征(例如，有声的或无声的)和/或目标分组中的回音相对于参考分组的比例自适应地调整这些值。

依照示例实施例，对目标分组的自适应码本增益和固定码本增益进行衰减。例如，基于参考分组和目标分组的相似性，可调整目标分组中自适应和固定码本的增益。

依照示例实施例，可使用参量域中的所提取参数取消和/或抑制回音，而不需要对目标语音信号进行解码和重新编码。

尽管上文只论述了图3中示出的方法的单个重复，但是，可对缓冲器202中所存储的各个参考分组R_j和缓冲器204中所存储的各个目标分组T执行图3的方法。即，例如，可搜索存储在缓冲器202中的多个参考分组以查找与缓冲器204中的每个目标分组匹配的参考分组。

因此，描述了本发明，显而易见可用多种方式改变本发明。此类改变不应视为本发明的脱离，所有此类改进旨在被包含在本发明的范围内。

Claims

1.一种抑制回音的方法，所述方法包括：

基于与多个参考语音分组中每个参考语音分组和目标语音分组相关联的至少一个已编码语音参数，从所述多个参考语音分组选择参考语音分组；

基于所述所选参考语音分组抑制所述目标语音分组中的回音。

2.如权利要求1所述的方法，其中，通过基于与所述所选参考语音分组相关联的所述至少一个已编码语音参数调整与所述目标语音分组相关联的所述至少一个已编码语音参数，抑制所述回音。

3.如权利要求2所述的方法，其中，通过基于与所述所选参考语音分组相关联的对应多个已编码语音参数调整与所述目标语音分组相关联的多个已编码语音参数，抑制所述回音。

4.如权利要求1所述的方法，其中，通过基于与所述所选参考语音分组相关联的对应至少一个已编码语音参数调整与所述目标语音分组相关联的所述至少一个已编码语音参数的增益，抑制所述回音。

5.如权利要求1所述的方法，其中，所述选择步骤包括：

从所述目标分组和所述多个参考语音分组中每个参考语音分组提取至少一个已编码语音参数；

对所述多个参考语音分组之中的若干个参考语音分组的每个参考语音分组，基于从所述参考语音分组和所述目标分组所提取的所述已编码语音参数计算至少一个语音分组相似性度量；以及

基于所述所计算的语音分组相似性度量选择所述参考语音分组。

6.如权利要求5所述的方法，还包括：

基于与各个参考语音分组和所述目标语音分组相关联的所述已编码语音参数，确定所述多个参考语音分组中哪些参考语音分组与所述目标语音分组相似，以便生成所述若干个参考语音分组，对所述若干个参考语音分组计算所述至少一个语音分组相似性度量。

7.如权利要求1所述的方法，其中，所述选择步骤包括：

基于与所述多个参考语音分组中每个参考语音分组和所述目标语音分组相关联的所述至少一个已编码语音参数，确定所述多个参考语音分组中哪些参考语音分组与所述目标语音分组相似，以便生成参考语音分组集合；以及

从所述参考语音分组集合选择所述参考语音分组。

8.如权利要求7所述的方法，其中，所述确定步骤包括：

对于每个参考语音分组，

基于与所述目标语音分组相关联的所述至少一个已编码语音参数以及与所述参考语音分组相关联的所述至少一个已编码语音参数，设置至少一个相似性指示符；以及

基于所述相似性指示符确定所述参考语音分组与所述目标语音分组是否相似。

9.如权利要求1所述的方法，其中，所述选择步骤包括：

从所述目标语音分组和所述参考语音分组中每个参考语音分组提取多个已编码语音参数；

对于与每个参考语音分组相关联的各个已编码语音参数，

基于所述参考语音分组和所述目标语音分组的所述已编码语音参数，确定独立相似性度量；

对于每个参考语音分组，

基于与所述参考语音分组相关联的所述独立相似性度量确定总相似性度量；以及

基于与每个参考语音分组相关联的所述总相似性度量选择所述参考语音分组。

10.如权利要求9所述的方法，其中，所述选择步骤还包括：

比较所述总相似性度量以确定最小总相似性度量；以及

选择与所述最小总相似性度量相关联的参考语音分组。