CN101542600A - 基于分组的回音取消和抑制 - Google Patents

基于分组的回音取消和抑制 Download PDF

Info

Publication number
CN101542600A
CN101542600A CNA2007800344394A CN200780034439A CN101542600A CN 101542600 A CN101542600 A CN 101542600A CN A2007800344394 A CNA2007800344394 A CN A2007800344394A CN 200780034439 A CN200780034439 A CN 200780034439A CN 101542600 A CN101542600 A CN 101542600A
Authority
CN
China
Prior art keywords
voice
grouping
reference voice
parameter
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800344394A
Other languages
English (en)
Other versions
CN101542600B (zh
Inventor
曹彬石
D·-S·金
A·A·塔拉夫
D·J·尤特库斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alcatel Lucent SAS
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of CN101542600A publication Critical patent/CN101542600A/zh
Application granted granted Critical
Publication of CN101542600B publication Critical patent/CN101542600B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

在用于回音抑制或取消的方法中,基于与多个参考语音分组中每个参考语音分组及目标语音分组相关联的至少一个已编码语音参数从所述多个参考语音分组选择参考语音分组。基于所选参考语音分组抑制或取消所述目标语音分组中的回音。

Description

基于分组的回音取消和抑制
技术领域
背景技术
在传统通信系统中,编码器产生表示语音或数据通信量的信息比特流。这种比特流被进行再分和分组、与各种控制比特级联并包装成合适格式以供传输。可用根据适当通信机制的例如帧、分组、子分组等的各种格式来传输语音和数据通信量。为清晰起见,本文将使用术语“传输帧”来描述实际传输通信量所用的传输格式。将使用术语“分组”来描述话音编码器的输出。话音编码器还被称为语音编码器或“语音合成器(vocoder)”,且在本文中这些术语可互换使用。
语音合成器提取与语音信息(例如人类说话)生成的模型有关的参数,并使用所提取的参数来压缩语音信息,以供传输。语音合成器一般包括编码器和解码器。语音合成器将到来的语音信息(例如模拟语音信号)分割成块,对到来的语音块进行分析以提取某些相关参数,并将所述参数量化成二进制或比特表示。比特表示被包装成分组,分组被格式化成传输帧,并通过通信信道将传输帧传送到具有解码器的接收机。在接收机,从传输帧提取分组,且解码器对分组中携带的比特表示进行非量化(unquantize)以产生编码参数集合。然后,解码器使用非量化的参数重新合成语音段以及随后的原始语音信息。
通常使用各种压缩技术将不同类型的语音合成器配置在各种现有的无线及有线通信系统中。此外,由某一特定标准所定义的传输帧格式和处理可与其它标准的传输帧格式和处理明显不同。例如,CDMA标准支持变速率语音合成器帧在扩频环境中的使用,而GSM标准支持固定速率语音合成器帧及多速率语音合成器帧的使用。类似地,通用移动远程通信系统(UMTS)标准也支持固定速率和多速率语音合成器,但不支持变速率语音合成器。为了这些通信系统之间的兼容性与互操作性,实现在GSM和UMTS之内对变速率语音合成器帧的支持以及在CDMA系统之内对非变速率语音合成器帧的支持是合乎需要的。几乎所有通信系统的一个共同事件是回音(echo)的出现。声回音和电回音是回音的示例类型。
声回音因手持机和/或自动(hand-free)装置的听筒与麦克风之间低质语音耦合而产生。电回音由PSTN网络内的4-至-2线耦合产生。语音压缩语音合成器处理包括在手持机内及在无线网络中的回音的语音,所述回音导致具有高度可变属性的所返回回音信号。所述反射的信号降低了语音通话质量。
在声回音的一种示例中,需要时,来自扬声器的声音被在近端的听众收听。但是,这种在近端的相同声音在被反射之后还被麦克风直接及间接拾取。这种反射的结果是生成了回音,除非将其消除否则回音将被传回远端并作为回音被在远端的说话者听见。
图1示出了包括用于取消反射的信号的常规回音取消器和/或抑制器的分组网络上语音示图。
如果将常规回音取消器和/或抑制器100用于分组交换网络,则常规回音取消器必须对与双向传输的语音信号相关联的语音合成器分组进行完全解码,以便获得回音取消参数,因为所有常规回音取消操作与线性非压缩话音配合起作用。即,常规回音取消器和/或抑制器100必须从传输帧提取分组,对在分组中携带的比特表示非量化以产生编码参数集合,并在取消回音之前重新合成语音段。然后,常规取消器和/或抑制器使用重新合成的语音段来取消回音。
因为传输的语音信息在传输之前被编码成参数(例如在参量域中),且常规回音取消器和/或抑制器工作于非线性话音域,分组交换网络中的常规回音取消和/或抑制变得相对困难、复杂,可由于例如所涉及的附加串联(tandeming)编码而增加编码和/或解码延迟和/或降低语音质量。
发明内容
示例实施例定位于用于基于分组的回音取消和/或抑制的方法和装置。一种示例实施例提供用于抑制和/或取消回音的方法。在该示例实施例中,基于与多个参考语音分组中每个参考语音分组及目标语音分组相关联的至少一个编码语音参数,从所述多个参考语音分组选择参考语音分组。基于所选参考语音分组抑制/取消所述目标语音分组中的回音。
附图说明
从下文给出的详细描述以及附图,将可更充分理解本发明,其中,相同单元用相同参考标号表示,所述附图只以示例方式给出因此不是对本发明的限制,其中:
图1是包括常规回音取消器和/或抑制器的分组网络上语音的示图;
图2示出依照示例实施例的回音取消器和/或抑制器;
图3是依照示例实施例示出用于回音取消和/或抑制的方法。
具体实施方式
依照示例实施例的方法和装置可根据例如分组交换通信系统中的特定应用执行回音取消和/或抑制。本文将以回音取消和/或抑制、回音取消器和/或抑制器等描述示例实施例。
此后,出于示例目的,疑为携带了反射的语音信息(例如,在近端所接收到的且被反射回远端的语音信息)的声音合成器分组将被称为目标分组,与这些目标分组相关联的编码参数将被称为目标分组参数。与从远端原始传送的语音信息(例如,可能反射的语音信息)相关联的、用于确定目标分组是否包含反射的语音信息的语音合成器分组或参数分组将被称为参考分组。与参考分组相关联的编码参数将被称为参考分组参数。
如上所述,图1示出分组网络上语音的示图,包括常规回音取消器和/或抑制器。依照示例实施例的方法可在现有回音取消器和/或抑制器、例如图1中示出的回音取消器和/或抑制器100实现。例如,示例实施例可在现有数字信号处理器(DSP)、现场可编程门阵列(FPGA)等上实现。另外,示例实施例可与例如VoIP网络、VoATM网络、TrFo网络等的任意类型陆地或无线分组交换网络结合使用。
一种用于对语音信息进行编码的示例语音合成器是基于码激励线性预测(Code Excited Linear Prediction:CELP)的语音合成器。基于CELP的语音合成器将数字语音信息编码成编码参数的集合。这些参数包括例如自适应码本(codebook)和固定码本增益、基音(pitch)/自适应码本、线性频谱对(linear spectrum pair:LSP)和固定码本。这些参数的每个参数可用若干比特来表示。例如,对于作为众所周知的语音合成器的增强型变速率编解码(Enhanced Variable Rate CODEC:EVRC)语音合成器的全速率分组,LSP用28个比特表示,基音及其对应Δ用12个比特表示,自适应码本增益用9个比特表示,而固定码本增益用15个比特表示。固定码本用120个比特表示。
还参考图1,如果在近端的CELP语音合成器进行语音信息的编码期间出现了反射的声音信号,则所传输的语音合成器分组的至少一部分可包括反射的语音信息。所述反射的语音信息可与原始传送的语音信息相同或类似,因此携带从近端传送到远端的语音信息的语音合成器分组可与携带从远端到近端的原始已编码语音信息的语音合成器分组类似或基本类似或相同。即,例如在原始语音合成器分组中的比特可与携带反射的语音信息的对应语音合成器分组中的比特类似或基本类似或相同。
依照示例实施例的分组域回音取消器和/或抑制器和/或其方法利用这种相似性来通过自适应地调整与所传输分组相关联的编码参数取消和/或抑制所传输信号中的回音。
出于示例目的,将针对基于CELP的语音合成器、例如EVRC语音合成器描述示例实施例。但是,依照示例实施例的方法和/或装置可结合和/或适合结合任意适合语音合成器使用。
图2示出依照示例实施例的回音取消器和/或抑制器。如图所示,图2的回音取消器和/或抑制器可将从远端收到的原始语音合成器分组(参考分组)缓存在参考分组缓冲存储器202中。回音取消器和/或抑制器可将来自近端的目标分组缓存在目标分组缓冲存储器204中。图2的回音取消器和/或抑制器还可包括回音取消和/或抑制模块206以及存储器208。
回音取消和/或抑制模块206可基于与存储在参考分组缓冲存储器202中的至少一个参考分组以及存储在目标分组缓存204中的至少一个目标分组相关联的至少一个已编码语音参数取消和/或抑制来自信号(例如发送和/或接收信号)的回音。下面更详细地论述回音取消和/或抑制模块206及在其中所执行的方法。
存储器208可存储例如语音分组相似性度量、对应参考语音分组、目标语音分组等的中间值和/或语音分组。在至少一种示例实施例中,存储器208可存储各个相似性度量和/或总相似性度量。下面将更详细地描述存储器208。
回到图2,可基于轨迹(trajectory)搜索/匹配操作的轨迹匹配长度确定缓冲存储器204的长度,下面对其进行更详细描述。例如,如果各语音合成器分组携带20ms语音段且轨迹匹配长度为120ms,则缓冲存储器204可保存6个目标分组。
可基于回音尾部的长度、网络延迟以及轨迹匹配长度确定缓冲存储器202的长度。例如,如果各语音合成器分组携带20ms语音段,回音尾部长度等于180ms且轨迹匹配长度为120ms(例如6个分组),则缓冲存储器202可保存15个参考分组。可用m表示可在用于参考分组的缓冲器202中存储的分组的最大数目。
尽管图2示出了两个缓冲器202和204,但是这些缓冲器可合并成单个存储器。
在至少一种实施例中,回音尾部的长度可由回音路径的已知网络参数确定和/或定义,或者使用实际搜索过程来获得。确定回音尾部的长度的方法在本领域是众所周知的。在确定了回音尾部的长度之后,依照至少某些示例实施例的方法可在等于回音尾部长度的时间窗内执行。时间窗宽度可等于例如一个或几个传输帧的长度、或者一个或几个分组的长度。出于示例目的,将通过假设回音尾部的长度等于单个传输帧中所传送的声音信号的长度来描述示例实施例。
通过将存储在缓冲器202中的参考分组与携带反射的语音信息的目标分组匹配,示例实施例可应用于任意回音尾部长度。通过将目标分组与存储在缓冲器202中的m个参考分组的每个参考分组进行比较,确定目标分组是否包含反射的语音信息。
图3是依照示例实施例示出用于回音取消和/或抑制的方法的流程图。图3中示出的方法可由图2中示出的回音取消和/或抑制模块206执行。
参考图3,在S302,计数器值j可被初始化到1。在S304,可从缓冲器202检索参考分组Rj。在S306,回音取消和/或抑制模块206可将计算器值j与阈值m进行比较。如上所述,m可等于存储在缓冲器202中的参考分组的数量。在该示例中,因为存储在缓冲器202中的参考分组的数量m等于在单个传输帧中所传送的参考分组的数量,所以阈值m可等于在单个传输帧中所传送的分组的数量。这种情况下,值m可从包含在传输帧中的传输帧报头提取,这在本领域是众所周知的。
在S306,如果计数器值j小或等于阈值m,则在S308回音取消和/或抑制模块206从参考分组Rj提取已编码参数。同时,在S308,回音取消和/或抑制模块206从目标分组T提取已编码编码参数(encoded coding parameter)。用于提取这些参数的方法在本领域是众所周知的。因此,为简洁而省略了详细论述。如上所述,本文针对基于CELP的语音合成器描述示例实施例。对于基于CELP的语音合成器,参考分组参数和目标分组参数可包含固定码本增益Gf、自适应码本增益Ga、基音P和LSP。
还参考图3,在S309,回音取消和/或抑制模块206可基于从目标分组T和参考分组Rj所提取的已编码编码参数的部分执行双端通话(double talk)检测,以便确定双端通话是否存在于参考分组Rj中。在包括双端通话的语音段期间,不需要执行回音取消和/或抑制,因为反射的远端语音信息淹没在近端语音信息中,因此在远端是觉察不到的。
双端通话检测可用于确定参考分组Rj是否包含双端通话。在示例实施例中,可通过将从目标分组T所提取的已编码参数与从参考分组Rj所提取的已编码参数进行比较来检测双端通话。在上述CELP语音合成器示例中,所述已编码参数可为固定码本增益Gf和自适应码本增益Ga
回音取消和/或抑制模块206可根据式(1)中示出的条件确定双端通话是否存在:
Figure A20078003443900101
根据式(1),如果参考分组Rj的固定码本增益GfR与目标分组T的固定码本增益GfT之差小于固定码本增益阈值Δf,则在参考分组Rj中存在双端通话且可将双端通话检测标记DT设置为1(例如DT=1)。同样,如果参考分组Rj的自适应码本增益GaR和目标分组T的自适应码本增益GaT之差小于自适应码本增益阈值Δa,则在参考分组Rj中存在双端通话且可将双端通话检测标记DT设置为1(例如DT=1)。否则,在参考分组Rj中不存在双端通话且不设置双端通话检测标记DT(例如DT=0)。
参考图3,如果在S310不设置双端通话检测标记DT(例如DT=0),则可在S312执行从目标分组T所提取的已编码参数与从参考分组Rj所提取的已编码参数之间的相似性估计。该相似性估计可用于确定是否要基于从目标分组T所提取的已编码参数、从参考分组Rj所提取的已编码参数以及相似性阈值设置多个相似性标记的每个标记。
相似性标记可被称为相似性指示符。相似性标记或相似性指示符可包含例如基音相似性标记(或指示符)PM以及多个LSP相似性标记(或指示符)。多个LSP相似性标记可包括多个带宽相似性标记BMi和多个频率相似性匹配标记FMi
又参考图3的S312,回音取消和/或抑制模块206可确定是否要依照式(2)设置参考分组Rj的基音相似性标记PM:
如式(2)所示,PT为与目标分组相关联的基音,PR是与参考分组Rj相关联的基音且Δp是基音阈值。可基于依照所用特定类型的语音合成器所获得的试验性数据确定基音阈值Δp。如式(2)所示,如果基音PT和基音PR之差的绝对值小于或等于阈值Δp,则基音PT与基音PR相似,且基音相似性标记PM可设为1。否则,基音相似性标记PM可设为0。
继续参考图3的S312,与上述基音相似性估计方法类似,LSP相似性估计可用于确定参考分组Rj与目标分组T是否相似。
通常,CELP语音合成器使用10阶线性可预测编码(LinearPredictive Coding:LPC)可预测滤波器,该滤波器使用矢量量化对10个LSP值进行编码。另外,各LSP对定义相应语音频谱共振峰(formant)。共振峰是由任意声音系统的共振频率产生的声频频谱的峰值。各特定共振峰可用由式(3)给出的带宽Bi表示:
Bi=LSP2i-LSP2i-1,i=1,2,...,5;            (3)
且由式(4)给出中心频率Fi
F i = LSP 2 i + LSP 2 i - 1 2 , i = 1,2 , . . . , 5 ; - - - ( 4 )
如式(3)和(4)中所示,Bi是第i个共振峰的带宽,Fi是第i个共振峰的中心频率,且LSP2i和LSP2i-1是第i对LSP值。
在该示例中,对于10阶LPC可预测滤波器,可生成5对LSP值。
前3个共振峰中的每个共振峰可包括信息语音段的重要或比较重要的频谱包络信息。所以,可基于所述前3个共振峰i=1,2和3执行LSP相似性估计。
对于各共振峰i(i=1,2,3),指示与目标分组T相关联的带宽BTi是否和与参考分组Rj相关联的带宽BRi相似的带宽相似性标记BMi可根据式(5)设置:
Figure A20078003443900122
如式(5)中所示,BTi是与目标分组T相关联的第i个带宽,BRi是与参考分组Rj相关联的第i个带宽,且ΔBi是用于确定带宽BTi和BRi是否相似的第i个带宽阈值。如果BMi=1,则第i个带宽BTi和BRi均处于相互的某个范围内,且可被认为相似。否则,在BMi=0时,第i个带宽BTi和BRi可被认为不相似。与基音阈值相似,可基于根据所用的特定类型语音合成器所获得的实验性数据确定各带宽阈值。
继续参考图3的S312,与目标分组T相关联的第i个频率和与参考分组Rj相关联的对应第i个频率是否相似可通过频率相似性标记FMi来指示。可依照式(6)设置频率相似性标记FMi
Figure A20078003443900123
在式(6)中,FTi是与目标分组T相关联的第i个中心频率,FRi是与参考分组Rj相关联的第i个中心频率,且ΔFi是第i个中心频率阈值。第i个中心频率阈值ΔFi可指示第i个目标和参考中心频率FTi和FRi(i=1,2,3)之间的相似性。与基音阈值和带宽阈值相似,可基于根据所用的特定类型语音合成器所获得的实验性数据确定频率阈值。
FMi是相应LSP对的第i个带宽的中心频率相似性标记。根据式(6),FMi=1表示FTi和FRi相似,而FMi=0表示FTi和FRi不相似。
参考图3,如果在S314确定多个参数相似性标记PM、BMi和FMi中每个标记被设置为等于1,则可认为参考分组Rj与目标分组T相似。换句话说,如果参数相似性指示符PM、BMi和FMi中每个指示符这样指示,则参考分组Rj与目标分组T相似。
接着在S316,回音取消和/或抑制模块206可计算总语音分组相似性度量。例如,总语音分组相似性度量可为总相似性度量Sj。总相似性度量Sj可指示目标分组T与参考分组Rj之间的总相似性。
在至少一种示例实施例中,可基于多个独立语音分组相似性度量计算与参考分组Rj相关联的总相似性度量Sj。多个独立语音分组相似性度量可为独立相似性度量。
所述多个独立相似性度量可基于从目标分组T与参考分组Rj所提取的已编码参数的至少一部分来计算。在该示例实施例中,多个独立相似性度量可包括基音相似性度量Sp、带宽相似性度量SBi(i=1,2,3)以及频率相似性度量SFi(i=1,2,3)。可同时计算多个独立相似性度量中的每个相似性度量。
例如,可根据式(7)计算基音相似性度量Sp
S p = | P T - P R | | P T + P R | - - - ( 7 )
可根据式(8)计算i个共振峰中的每个共振峰的带宽相似性度量SBi
S Bi = | B Ti - B Ri | | B Ti + B Ri | , i = 1,2,3 . - - - ( 8 )
如式(8)所示及如上所述,BTi是目标分组T的第i个共振峰的带宽,BRi是参考分组Rj的第i个共振峰的带宽。
同样,可根据式(9)计算i个共振峰中的每个共振峰的中心频率相似性SFi
S Fi = | F Ti - F Ri | | F Ti + F Ri | , i = 1,2,3 ; - - - ( 9 )
如式(9)所示及如上所述,FTi是目标分组T的第i个共振峰的中心频率,FRi是参考分组Rj的第i个共振峰的中心频率。
在获得多个独立相似性度量之后,可根据式(10)计算总相似性匹配度量Sj
S = α p S p + α LSP Σ i β Bi S Bi + β Fi S Fi 2 ; - - - ( 10 )
在式(10)中,各独立相似性度量可由相应权重函数进行称重。如式所示,αp为基音相似性度量Sp的相似性权重常数,αLSP为LSP频谱相似性度量SBi和SFi的总相似性权重常数,βBi为带宽相似性度量SBi的独立相似性权重常数且βFi为频率相似性度量SFi的独立相似性权重常数。
可确定相似性权重常数αp和αLSP以满足下面所示的式(11):
αpLSP=1;           (11)
同样,可确定独立相似性权重常数βBi和βFi以满足下面所示的式(12):
βBiFi=1;i=1,2,3;     (12)
依照至少某些示例实施例,可根据经验数据确定和/或调整权重常数使得式(11)和(12)满足。
参考图3,在S318,回音取消和/或抑制模块206可将计算出的总相似性度量Sj存储在图2的存储器208中。存储器208可为任意众所周知的存储器,例如缓冲存储器。在S320递增计数器值j:j=j+1,该方法返回S304。
回到图3的S314,如果没有设置任意参数相似性标记,则回音取消和/或抑制模块206确定参考分组Rj与目标分组T不相似,因此目标分组T不携带与参考分组Rj所携带的原始语音信息对应的反射的语音信息。这种情况下,可递增计数器值j(j=j+1),且该方法如上述那样继续。
回到图3的S310,如果在参考分组Rj中检测到双端通话,则可在S311丢弃该参考分组Rj,可在S320递增计数器值j:j=j+1,且在S304回音取消和/或抑制模块206从缓冲器202检索下一参考分组Rj。在从缓冲器202检索到下一参考分组Rj之后,所述过程可继续到S306并重复。
回到S306,如果计数器值j大于阈值m,则可在S321执行矢量轨迹匹配操作。轨迹匹配可用于定位目标分组的固定码本增益与所存储参考分组的各固定码本增益之间的相关。轨迹匹配还可用于定位目标分组的自适应码本增益与各参考分组矢量的自适应码本增益之间的相关。依照至少一种示例实施例,可通过使用最小均方差(LeastMean Square:LMS)或交叉相关(cross-correlation)算法来执行矢量轨迹匹配以便确定目标分组与各相似参考分组之间的相关。因为LMS和交叉相关算法在本领域中是众所周知的,因此为简洁起见,省略了对其的详细论述。
在至少一种示例实施例中,矢量轨迹匹配可用来检验目标分组与每个所存储相似参考分组之间的相似性。在至少一种示例实施例中,在S321可用矢量轨迹匹配来过滤出不满足(fail)相关阈值的相似参考分组。可将与不满足相关阈值的所存储相似参考分组相关联的总相似性度量Sj从存储器208中去除。可基于实验性数据确定相关阈值,这在本领域中众所周知的。
尽管图3的方法在S321示出矢量轨迹匹配步骤,但是可如本领域技术人员所期望那样省略该步骤。
在S322,可搜索存储器208中余下的所存储总相似性度量Sj,以便确定相似参考分组中的哪个相似参考分组包括反射的语音信息。换句话说,可搜索相似参考分组以便确定哪个参考分组与目标分组匹配。在示例实施例中,与目标分组匹配的参考分组可为具有最小关联总相似性度量Sj的参考分组。
如果在存储器中通过目标分组T与参考分组Rj对相似性度量Sj进行索引(用于这样做的方法是众所周知的,因此为了简洁而将其省略),则总相似性度量可表示为S(T,Rj),其中j=1,2,3...m。
将总相似性度量表示为S(T,Rj),其中j=1,2,3...m,可使用式(13)获得最小总相似性度量Smin
Smin=MIN[S(T,Rj),j=0,1,...,m]         (13)
又回到图3,在定位匹配参考分组之后,在S324,回音取消和/或抑制模块206可基于从匹配参考分组所提取的已编码参数的部分取消和/或抑制回音。例如,可通过调整(例如衰减)与目标分组T相关联的增益取消和/或抑制回音。可基于与匹配的参考分组相关联的增益、与匹配参考分组相关联的总相似性度量以及增益权重常数执行增益调整。
例如,可通过衰减如式(14)中示出的自适应码本增益和/或如式(15)中示出的固定码本增益来取消和/或抑制回音:
G′fR=WfS*GfRj    (14)
G′aR=WaS*GaR     (15)
如式(14)中所示,G′fR为与参考分组相关联的固定码本增益的调节增益,Wf为固定码本的增益权重。
如式(15)中所示,G′aR为与参考分组相关联的自适应码本增益的调节增益,Wa为自适应码本的增益权重。起初,Wf和Wa均可等于1。但是,可根据例如话音特征(例如,有声的或无声的)和/或目标分组中的回音相对于参考分组的比例自适应地调整这些值。
依照示例实施例,对目标分组的自适应码本增益和固定码本增益进行衰减。例如,基于参考分组和目标分组的相似性,可调整目标分组中自适应和固定码本的增益。
依照示例实施例,可使用参量域中的所提取参数取消和/或抑制回音,而不需要对目标语音信号进行解码和重新编码。
尽管上文只论述了图3中示出的方法的单个重复,但是,可对缓冲器202中所存储的各个参考分组Rj和缓冲器204中所存储的各个目标分组T执行图3的方法。即,例如,可搜索存储在缓冲器202中的多个参考分组以查找与缓冲器204中的每个目标分组匹配的参考分组。
因此,描述了本发明,显而易见可用多种方式改变本发明。此类改变不应视为本发明的脱离,所有此类改进旨在被包含在本发明的范围内。

Claims (10)

1.一种抑制回音的方法,所述方法包括:
基于与多个参考语音分组中每个参考语音分组和目标语音分组相关联的至少一个已编码语音参数,从所述多个参考语音分组选择参考语音分组;
基于所述所选参考语音分组抑制所述目标语音分组中的回音。
2.如权利要求1所述的方法,其中,通过基于与所述所选参考语音分组相关联的所述至少一个已编码语音参数调整与所述目标语音分组相关联的所述至少一个已编码语音参数,抑制所述回音。
3.如权利要求2所述的方法,其中,通过基于与所述所选参考语音分组相关联的对应多个已编码语音参数调整与所述目标语音分组相关联的多个已编码语音参数,抑制所述回音。
4.如权利要求1所述的方法,其中,通过基于与所述所选参考语音分组相关联的对应至少一个已编码语音参数调整与所述目标语音分组相关联的所述至少一个已编码语音参数的增益,抑制所述回音。
5.如权利要求1所述的方法,其中,所述选择步骤包括:
从所述目标分组和所述多个参考语音分组中每个参考语音分组提取至少一个已编码语音参数;
对所述多个参考语音分组之中的若干个参考语音分组的每个参考语音分组,基于从所述参考语音分组和所述目标分组所提取的所述已编码语音参数计算至少一个语音分组相似性度量;以及
基于所述所计算的语音分组相似性度量选择所述参考语音分组。
6.如权利要求5所述的方法,还包括:
基于与各个参考语音分组和所述目标语音分组相关联的所述已编码语音参数,确定所述多个参考语音分组中哪些参考语音分组与所述目标语音分组相似,以便生成所述若干个参考语音分组,对所述若干个参考语音分组计算所述至少一个语音分组相似性度量。
7.如权利要求1所述的方法,其中,所述选择步骤包括:
基于与所述多个参考语音分组中每个参考语音分组和所述目标语音分组相关联的所述至少一个已编码语音参数,确定所述多个参考语音分组中哪些参考语音分组与所述目标语音分组相似,以便生成参考语音分组集合;以及
从所述参考语音分组集合选择所述参考语音分组。
8.如权利要求7所述的方法,其中,所述确定步骤包括:
对于每个参考语音分组,
基于与所述目标语音分组相关联的所述至少一个已编码语音参数以及与所述参考语音分组相关联的所述至少一个已编码语音参数,设置至少一个相似性指示符;以及
基于所述相似性指示符确定所述参考语音分组与所述目标语音分组是否相似。
9.如权利要求1所述的方法,其中,所述选择步骤包括:
从所述目标语音分组和所述参考语音分组中每个参考语音分组提取多个已编码语音参数;
对于与每个参考语音分组相关联的各个已编码语音参数,
基于所述参考语音分组和所述目标语音分组的所述已编码语音参数,确定独立相似性度量;
对于每个参考语音分组,
基于与所述参考语音分组相关联的所述独立相似性度量确定总相似性度量;以及
基于与每个参考语音分组相关联的所述总相似性度量选择所述参考语音分组。
10.如权利要求9所述的方法,其中,所述选择步骤还包括:
比较所述总相似性度量以确定最小总相似性度量;以及
选择与所述最小总相似性度量相关联的参考语音分组。
CN200780034439.4A 2006-09-19 2007-09-18 基于分组的回音取消和抑制 Expired - Fee Related CN101542600B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/523,051 2006-09-19
US11/523,051 US7852792B2 (en) 2006-09-19 2006-09-19 Packet based echo cancellation and suppression
PCT/US2007/020162 WO2008036246A1 (en) 2006-09-19 2007-09-18 Packet based echo cancellation and suppression

Publications (2)

Publication Number Publication Date
CN101542600A true CN101542600A (zh) 2009-09-23
CN101542600B CN101542600B (zh) 2015-11-25

Family

ID=38917442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780034439.4A Expired - Fee Related CN101542600B (zh) 2006-09-19 2007-09-18 基于分组的回音取消和抑制

Country Status (6)

Country Link
US (1) US7852792B2 (zh)
EP (1) EP2070085B1 (zh)
JP (1) JP5232151B2 (zh)
KR (1) KR101038964B1 (zh)
CN (1) CN101542600B (zh)
WO (1) WO2008036246A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103167196A (zh) * 2011-12-16 2013-06-19 宇龙计算机通信科技(深圳)有限公司 用于在分组交换域中消除通话回音的方法和终端
CN105096960A (zh) * 2014-05-12 2015-11-25 阿尔卡特朗讯 实现宽带分组语音的基于分组的声学回声消除方法与设备
CN111613235A (zh) * 2020-05-11 2020-09-01 浙江华创视讯科技有限公司 一种回声消除方法及装置

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2427077C2 (ru) * 2005-12-05 2011-08-20 Телефонактиеболагет Лм Эрикссон (Пабл) Обнаружение эхосигнала
US8843373B1 (en) * 2007-06-07 2014-09-23 Avaya Inc. Voice quality sample substitution
US20090168673A1 (en) * 2007-12-31 2009-07-02 Lampros Kalampoukas Method and apparatus for detecting and suppressing echo in packet networks
JP5024154B2 (ja) * 2008-03-27 2012-09-12 富士通株式会社 関連付け装置、関連付け方法及びコンピュータプログラム
EP2596496B1 (en) 2010-07-20 2016-10-26 Nokia Technologies Oy A reverberation estimator
CN103325379A (zh) 2012-03-23 2013-09-25 杜比实验室特许公司 用于声学回声控制的方法与装置
CA3073412C (en) * 2012-10-23 2022-05-24 Interactive Intelligence, Inc. System and method for acoustic echo cancellation
CN104468470B (zh) 2013-09-13 2017-08-01 阿尔卡特朗讯 一种用于分组声学回声消除的方法与设备
CN104468471B (zh) 2013-09-13 2017-11-03 阿尔卡特朗讯 一种用于分组声学回声消除的方法与设备
US11546615B2 (en) 2018-03-22 2023-01-03 Zixi, Llc Packetized data communication over multiple unreliable channels
US11363147B2 (en) 2018-09-25 2022-06-14 Sorenson Ip Holdings, Llc Receive-path signal gain operations
JP2023508744A (ja) * 2019-12-02 2023-03-03 ジクシー,エルエルシー 複数の信頼性のないチャネルを介したパケット化データ通信

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US6011846A (en) 1996-12-19 2000-01-04 Nortel Networks Corporation Methods and apparatus for echo suppression
US5943645A (en) * 1996-12-19 1999-08-24 Northern Telecom Limited Method and apparatus for computing measures of echo
KR100240626B1 (ko) * 1997-11-25 2000-01-15 정선종 디지털 이동 통신 시스템에서의 반향 제거 방법 및 장치
JP2003533902A (ja) * 1999-07-02 2003-11-11 テラブス オペレーションズ,インコーポレイティド 符号化されたドメインのエコーの制御
US6804203B1 (en) * 2000-09-15 2004-10-12 Mindspeed Technologies, Inc. Double talk detector for echo cancellation in a speech communication system
CN100393085C (zh) * 2000-12-29 2008-06-04 诺基亚公司 数字网络中的音频信号质量增强
JP3984526B2 (ja) * 2002-10-21 2007-10-03 富士通株式会社 音声対話システム及び方法
EP1521240A1 (en) 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Speech coding method applying echo cancellation by modifying the codebook gain
US7352858B2 (en) * 2004-06-30 2008-04-01 Microsoft Corporation Multi-channel echo cancellation with round robin regularization
US20060217971A1 (en) * 2005-03-28 2006-09-28 Tellabs Operations, Inc. Method and apparatus for modifying an encoded signal
CN1719516B (zh) * 2005-07-15 2010-04-14 北京中星微电子有限公司 自适应滤波装置以及自适应滤波方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103167196A (zh) * 2011-12-16 2013-06-19 宇龙计算机通信科技(深圳)有限公司 用于在分组交换域中消除通话回音的方法和终端
CN105096960A (zh) * 2014-05-12 2015-11-25 阿尔卡特朗讯 实现宽带分组语音的基于分组的声学回声消除方法与设备
CN111613235A (zh) * 2020-05-11 2020-09-01 浙江华创视讯科技有限公司 一种回声消除方法及装置

Also Published As

Publication number Publication date
US7852792B2 (en) 2010-12-14
EP2070085A1 (en) 2009-06-17
JP5232151B2 (ja) 2013-07-10
WO2008036246B1 (en) 2008-05-08
EP2070085B1 (en) 2012-05-16
WO2008036246A1 (en) 2008-03-27
JP2010503325A (ja) 2010-01-28
KR101038964B1 (ko) 2011-06-03
US20080069016A1 (en) 2008-03-20
KR20090051760A (ko) 2009-05-22
CN101542600B (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
CN101542600B (zh) 基于分组的回音取消和抑制
JP4213243B2 (ja) 音声符号化方法及び該方法を実施する装置
US7016831B2 (en) Voice code conversion apparatus
KR100923896B1 (ko) 분산형 음성 인식 시스템에서 음성 활성을 송신하는 방법및 장치
Bradbury Linear predictive coding
EP2535893B1 (en) Device and method for lost frame concealment
KR101160218B1 (ko) 일련의 데이터 패킷들을 전송하기 위한 장치와 방법, 디코더, 및 일련의 데이터 패킷들을 디코딩하기 위한 장치
US20090168673A1 (en) Method and apparatus for detecting and suppressing echo in packet networks
CN101379551A (zh) 在语音编解码器中用于有效帧擦除隐蔽的方法和装置
AU2013397685A1 (en) Audio signal classification method and apparatus
JPH1097292A (ja) 音声信号伝送方法および不連続伝送システム
JPH07311596A (ja) 線形予測係数信号生成方法
KR20070062493A (ko) 잡음 억제 방법 및 장치
CN101506876A (zh) 在具有不同语音帧速率的混合激励线性预测(melp)声码器之间进行代码转换的声码器和相关方法
JP2004509367A (ja) 複数チャネル信号の符号化及び復号化
CN101197133A (zh) 一种解码方法及装置
Chamberlain A 600 bps MELP vocoder for use on HF channels
JP2002108400A (ja) 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品
EP1020848A2 (en) Method for transmitting auxiliary information in a vocoder stream
US7089180B2 (en) Method and device for coding speech in analysis-by-synthesis speech coders
Bhatt et al. Overall performance evaluation of adaptive multi rate 06.90 speech codec based on code excited linear prediction algorithm using MATLAB
CN101490749A (zh) 声音数据解码装置
US20220180884A1 (en) Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
Ma et al. Design and research of MELP vocoder based on Beidou voice communication
EP1527440A1 (en) Speech communication unit and method for error mitigation of speech frames

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: ALCATEL-LUCENT

Free format text: FORMER OWNER: ALCATEL-LUCENT AMERICA CO., LTD.

Effective date: 20120426

C41 Transfer of patent application or patent right or utility model
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: New jersey, USA

Applicant after: ALCATEL-LUCENT USA Inc.

Address before: New jersey, USA

Applicant before: LUCENT TECHNOLOGIES INC

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: LUCENT TECHNOLOGIES INC. TO: ALCATEL-LUCENT AMERICA CO., LTD.

TA01 Transfer of patent application right

Effective date of registration: 20120426

Address after: Paris France

Applicant after: ALCATEL LUCENT

Address before: New jersey, USA

Applicant before: ALCATEL-LUCENT USA Inc.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151125

Termination date: 20170918