CN1318187A - 具备背景噪声再现的语音编码 - Google Patents

具备背景噪声再现的语音编码 Download PDF

Info

Publication number
CN1318187A
CN1318187A CN99810944A CN99810944A CN1318187A CN 1318187 A CN1318187 A CN 1318187A CN 99810944 A CN99810944 A CN 99810944A CN 99810944 A CN99810944 A CN 99810944A CN 1318187 A CN1318187 A CN 1318187A
Authority
CN
China
Prior art keywords
parameter
current
speech signal
stationarity
hybrid cytokine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99810944A
Other languages
English (en)
Other versions
CN1244090C (zh
Inventor
I·约翰松
J·斯维德贝里
A·乌夫利登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22551052&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1318187(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN1318187A publication Critical patent/CN1318187A/zh
Application granted granted Critical
Publication of CN1244090C publication Critical patent/CN1244090C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

在根据原始语音信号的编码信息产生原始语音信号的近似值的过程中,与原始语音信号当前段相关的当前参数(EnPar(i))是根据编码信息确定的。通过使用至少一个当前参数和分别与原始语音信号(31,37,39)的以前段相关的对应以前参数来产生修正的参数(EnPar(i)mod),原始语音信号噪声分量的再现得到改进。修正后的参数被用来(25,40)产生原始语音信号当前段的近似值。

Description

具备背景噪声再现的语音编码
本发明通常涉及语音编码,特别的,涉及语音编码中背景噪声的再现。
在线性预测型语音编码器,如码激励线性预测(CELP)语音编码器中,流入的原始语音信号通常被划分成称为帧的块。典型的帧长度为20毫秒或160个样本,其帧长度通常用于,例如,传统的电话频带蜂窝应用中。这些帧通常被进一步划分成子帧,这些子帧长度通常为5毫秒或40个样本。
在如上面提到的传统语音编码器中,描述声道,音调和其它特征的参数在语音编码过程中从原始语音信号中提取出来。变化很慢的参数在帧-帧的基础上计算。这种较慢变化的参数的例子包括所谓的短时预测(STP)参数,该参数描述声道信息。STP参数定义了线性预测语音编码器中合成滤波器的滤波器系数。变化很快的参数,例如,音调,以及新的形状和新的增益参数通常为每个子帧计算。
在参数被计算之后,它们被量化。STP参数常常转换为更适于量化的表示形式,例如,线谱频率(LSF)表示。在该技术领域将STP参数转换成LSF表示也是众所周知的。
一旦参数被量化,在参数信息交叉存取和调制之前,误差控制编码和校验和信息被加入其中。然后,参数信息通过通信信道传送给接收机,在此,语音解码器基本上执行上面描述的语音编码过程的反过程以便合成非常近似原始语音信号的语音信号。在语音解码器中,通常对合成语音信号进行后滤波以增强信号的感知质量。
使用线性预测模型例如CELP模型的语音编码器一般很好地适用于语音编码,因此,在这种编码器中,非语音信号如背景噪声的合成或再现常常很差。在很差的信道条件下,例如,当量化参数信息被信道误差扭曲时,背景噪声的再现恶化的更厉害。即使在清晰的信道条件下,背景噪声通常被接收机处的听者感知为波动而不稳定的噪声。在CELP编码器中,这个问题的原因主要是均方误差(MSE)准则,该准则通常在通过合成分析环与目标信号和合成信号之间很差的相关组合中使用。在很差的信道条件下,如上面提到的,该问题甚至更糟,因为,背景噪声电平波动的很大。听者会感觉非常吵,因为背景噪声被期望变化的很慢。
在清晰和吵闹的信道条件下,都能改进背景噪声感知质量的一个方法可以包括使用声音活动检测器(VADs),该检测器做出关于正在编码的信号是语音或非语音的硬判断(例如是或非)。基于该硬判断,不同的处理技术可以应用于解码器。例如,如果判断是非语音,那麽解码器会假设信号是背景噪声,并且可以平滑背景噪声中的频谱变化。然而,该硬判断技术的不利之处是允许听者听到的语音处理操作和非语音处理操作之间的解码器切换。
除了前面提到的问题,在较低的比特率下(例如低于8kb/s),背景噪声的再现甚至恶化的更厉害。在很低的比特率下以及很坏的信道条件下,背景噪声常常被听作波动效果,该效果是解码背景噪声电平的不自然变化造成的。
因此,理想的是,在线性预测语音解码器如CELP解码器中再现背景噪声,同时避免前面提到的不期望的背景噪声的听者感知效果。
本发明给出背景噪声的改善的再现。解码器能够逐渐的(即平缓的)增加或降低对正在重构的信号所施加的能量包络平滑。这样,背景噪声再现的问题可以通过平滑能量包络解决,而不会感知到能量包络平滑操作的使能/禁止。
附图简要描述
图1给出传统线性预测语音编码器的有关部分。
图2给出根据本发明线性预测语音编码器的有关部分。
图3详细描述图2的修正装置。
图4以流程图的形式说明了可以由图2和图3的语音解码器执行的示例操作。
图5给出根据本发明的通讯系统。
图6给出根据本发明的混合因子和平稳性测量值之间的图形关系。
图7详细给出图2和图3的语音重构装置的一部分。
详细描述
示例图1给出传统线性预测语音解码器如CELP解码器的有关部分,这将有利于对本发明的理解。在图1的传统解码器部分,参数确定装置11从语音编码器接收(通过没有给出的传统通讯信道)一些表示参数的信息,这些参数可以被解码器用来尽可能好的重构原始语音信号。根据编码器信息,参数确定装置11为当前帧或子帧确定能量参数和其它参数。在图1中,能量参数被表示为EnPar(i),其它参数(在13表示)表示为OtherPar(i),I为当前子帧(或帧)的子帧(或帧)的索引。这些参数被输入到语音重构装置15,该重构装置根据能量参数和其它参数合成或重构原始语音,背景噪声的近似值。
能量参数EnPar(j)的传统例子包括用于CELP模型的传统固定码书增益,长时预测增益,帧能量参数。其它参数OtherPar(i)的传统例子包括以前提到的STP参数的LSF表示。输入到图1的语音重构装置15的能量参数和其它参数对于该领域的工作人员来说是已知的。
图2说明了根据本发明的示例线性预测解码器,例如CELP解码器的有关部分。图2的解码器包括图1的传统参数确定装置11和语音重构装置25。然而,图2中参数确定装置11输出的能量参数EnPar(i)被输入到能量参数修正装置21,该装置输出修正后的能量参数EnPar(i)mod。修正后的能量参数和参数确定装置11产生的参数EnPar(i),OtherPar(i)一起输入到语音重构装置25。
能量参数修正装置21接收参数确定装置11输出的其它参数作为控制输入23,而且接收表示信道条件的控制输入。根据这些控制输入,能量参数修正装置选择性地修正能量参数EnPar(i)并输出修正后的能量参数EnPar(i)mod。修正的能量参数改进了背景噪声的再现,而不会有前面提到的不利之处:如图1所示的传统解码器中与背景噪声再现相关的听者感知。
在本发明的一个示例实现中,能量参数修正装置21尝试仅仅在稳态背景噪声下平滑能量包络。稳态背景噪声基本上意味着常数背景噪声,如在驾驶汽车移动中使用蜂窝电话时出现的背景噪声。在一个示例实现中,本发明使用了当前和以前的短时合成滤波器系数(STP参数)来获得信号平稳性测量值。这些参数能很好地抵御信道误差。利用当前和以前的短时滤波器系数测量平稳性的例子如下所示: diff = Σ j \ lsfAve r j - lsf j \ / lsAve r j 等式1
在上面的等式1中,lsfj表示与当前子帧相关的短时滤波器系数的线谱频率表示的第j个线谱频率系数。同样在等式1中,lsfAverj表示来自以前N帧的第j个短时滤波器系数的lsf表示的平均值,其中N可以设置为8。这样,等式1中求和符号右边的计算对短时滤波器系数的每个线谱频率表示进行。作为一个例子,通常存在10个短时滤波器系数(对应于10阶合成滤波器),因此有10个对应的线谱频率表示,因此j应该表示lsf的索引1到10。在该例子中,对于每个子帧,将在等式1中计算10个值(每个短时滤波器系数1个值),这10个值将被加在一起给出该子帧的平稳性测量值,diff。
注意到即使在短时滤波器系数和对应线谱频率表示每帧仅更新一次时,等式1仍然在子帧基础上适用。这是可能的,因为传统的解码器为每个子帧内插每个线谱频率lsf值。这样,在传统的CELP解码操作中,每个子帧被分配了一组内插lsf值。利用前面提到的例子,每个子帧将被分配10个内插lsf值。
等式1中的项lsfAverj可以,但不必解决lsf值的子帧内插。例如,lsfAverj可以表示N个以前lsf值的均值,每N个以前帧有一个该值,或者表示4N个以前lsf值的平均值,每N个以前帧的4个子帧有一个该值(利用内插的lsf值)。在等式1中,lsf的跨度可以是0-π,其中π是采样频率的一半。
另一个计算等式1中lsfAverj项的方式是:
lsfAverj(i)=Al·lsfAverj(i-1)+A2·lsfj(i)
                等式1A
其中lsfAverj(i)和lsfAverj(i-1)项分别对应于第i和i-1帧的第j个lsf表示,lsfj(i)是第i帧的第j个lsf表示。对于第一个帧,其中i=1,可以为lsfAverj(i-1)(=lsfAverj(O))项选择适当的初始值(例如经验值)。A1和A2的示例值包括A1=0.84和A2=0.16。上面等式1A的计算复杂度低于上面描述的示例8帧运行平均的复杂度。
在等式1的平稳性测量值的另一个可选公式中,分母中的lsfAverj可以替换为lsfj
等式1的平稳性测量值,diff表示了当前子帧的频谱与在预定数量的以前帧上平均得到的平均谱的差异程度。谱型上的差异与信号能量中强烈的变化例如,在谈话出现时,门的撞击等相关程度很大。对于大多数类型的背景噪声,diff非常低,而对于浊音语音diff值很大。
对于难于编码的信号,例如背景噪声,最好是保证平滑的能量包络而不是精确的波形匹配,这一点很难实现。平稳性测量值,diff被用于确定需要进行多少能量包络平滑。能量包络平滑应该被平稳引入或从解码过程中除去以便避免可感知的平滑操作的使能/禁止。因此,diff测量值被用来定义混合因子k,该方法的示例公式如下所示:
k=min(K2,max(O,diff-K1))/K2
                 等式2
其中K1和K2被选择为使得混合因子k对于浊音语音非常近似1(不做能量包络平滑),而对于平稳性背景噪声为0(全部做能量包络平滑)。K1和K2的示例值为K1=0.4,K2=0.25。图6给出了平稳性测量diff和上面举例给出的K1=0.4,K2=0.25的混合因子k之间的关系。混合因子k可以表示为diff测量值的任何其它适当的函数,k=F(diff)。
图2的能量参数修正装置21也用到了与以前子帧相关的能量参数以产生修正的能量参数EnPar(i)mod。例如,修正装置21可以计算图2中传统的所接收能量参数EnPar(j)的时间均值。例如,时间均值可以如下计算: EnPar ( i ) avg = Σ m = 0 M - 1 b i EnPar ( i - m ) 等式3
其中bi被用来得出能量参数的加权和。例如,bi的值可以被设置为1/M以便根据以前的M个子帧给出能量参数值的实际均值。等式3的平均不需要在子帧的基础上计算,而是可以在M帧的基础上进行。平均的基础取决于被平均的能量参数和期望的处理类型。
一旦利用等式3计算了能量参数的时间均值EnPar(i)avg,混合因子k被用来控制使用所接收能量参数值EnPar(i)和平均能量参数值EnPar(i)avg之间的平稳切换或渐进切换。一个使用混合因子k的示例等式如下所示:
EnPar(i)mod=k·EnPar(i)+(1-k)·EnPar(i)avg
                                     等式4
根据等式4可以清楚看到,当k很小(平稳背景噪声)时,主要使用了平均能量参数来平滑能量包络,另一方面,当k很大时,主要使用了当前参数。对于中间k值,将会计算当前参数和平均参数的混合值。还注意到等式3和4的处理可以适用于任何期望的能量参数、期望的任意多的参数和能量参数的任何期望组合。
现在参考输入到图2的能量参数修正装置21的信道条件,通常可以在线性预测解码器如CELP解码器中得到这种信道条件信息。例如以信道解码信息和CRC校验和的形式得到。例如,如果没有CRC校验错误,这表明是好的信道条件,但是如果给定子帧序列中出现太多CRC校验和错误,则表明在编码器和解码器之间存在内部状态误匹配。最后,如果给定帧具有CRC校验和错误,那麽表明该帧是一个坏帧。在上面描述的好信道条件下,例如,能量参数修正装置可以采用保守方法,在等式3中设置M=4或5。在前面提到的所怀疑的编码器/解码器内部状态误匹配情况中,图2的能量参数21可以,例如通过将等式2中的K1值从0.4增加到例如0.55来改变混合因子k。如可以从等式4和图6看到的,值K1的增加将使得混合因子k对于很宽范围的diff值保持在0(全平滑),这样加强等式4的时间平均能量参数项EnPar(i)avg的影响。如果信道条件信息表明是一个坏帧,那麽图2的能量参数修正装置21可以例如,既增加等式2中的K1值也增加等式3中的M值。
图3图解说明了图2的能量参数修正装置21的示例实现。在图3的实施方案中,由lsf(i)表示的当前子帧的EnPar(i)和lsf值被接收并存储在存储器31中。平稳性判断装置33从存储器31获得当前和以前的lsf值,并应用上面的等式1来确定平稳性测量值,diff。然后,平稳性判断装置将diff提供给混合因子确定装置35,该装置应用上面的等式2来确定混合因子k。混合因子确定装置然后将混合因子k提供给混合逻辑电路37。
能量参数平均装置39从存储器31获得当前和以前的EnPar(i)值并实现上面的等式3。能量参数平均装置然后将EnPar(i)avg提供给混合逻辑电路37,该电路还接收当前能量参数EnPar(i).混合逻辑电路实现上面的等式4以产生EnPar(i)mod,该值与上面描述的参数EnPar(i)和OtherPar(i)一起被输入给语音重构装置25。混合因子确定装置35和能量参数平均装置39都可以接收通常可获得的信道条件信息作为控制输入,并能够如上面描述的响应各种信道条件来采用适当的操作。
图4说明了图2和图3中给出的示例线性预测解码器装置的示例操作。在41,参数确定装置11根据编码器信息确定语音参数。因此,在43,平稳性确定装置33确定背景噪声的平稳性测量值。在45,混合因子确定装置35基于平稳性测量值和信道条件信息确定混合因子k。在47,能量参数平均装置39确定时间平均能量参数EnPar(i)avg。在49,混合逻辑电路37将混合因子k施加给当前能量参数EnPar(i)和平均后的能量参数EnPar(i)avg来确定修正后的能量参数EnPar(i)mod。在40,修正后的能量参数EnPar(i)mod连同参数EnPar(i)和OtherPar(i)一起被提供给语音重构装置,根据这些参数,原始语音的近似值包括背景噪声可以被重构出来。
图7说明了图2和3的语音重构装置25的部分示例实现。图7说明了在通常的涉及能量参数的计算中,参数EnPar(i)和EnPar(i)mod是如何被语音重构装置25使用的。重构装置25使用参数EnPar(i)用于通常的能量参数计算,该计算影响到解码器的任何将与对应的编码器内部状态最佳匹配的内部状态,例如,音调纪录。重构装置25使用了修正后的参数EnPar(i)mod用于所有的其它能量参数计算。通过比较,图1的传统重构装置15使用EnPar(i)用于所有图7给出的传统能量参数计算,参数OtherPar(i)(图2和图3)可以用于重构装置25,其方式相同于在传统重构装置15使用的方式。
图5是根据本发明示例通讯系统的方框图。在图5中,根据本发明的解码器52被提供给收发机(XCVR)53中,该设备通过通讯信道55与收发机54通讯。解码器52通过信道55从收发机54中的编码器56处接收参数信息,并为收发机53处的听者提供重构语音和背景噪声。作为一个例子,图5的收发机53和54可以是蜂窝电话,信道55可以是经过蜂窝电话网络的通讯信道。本发明语音解码器52的其它应用很多并且很容易明白。
对本领域内的技术人员很明白的是,根据本发明的语音解码器可以很容易地利用,例如,适当编程的数字信号处理器(DSP)或其它数据处理设备来实现,仅仅使用这种设备或与外部支持逻辑电路组合来实现。
上面描述的根据本发明的语音解码提高了再现背景噪声的能力,在无差错条件和坏信道条件情况下都是这样,并且不会有不可以接受的语音性能的降低。本发明的混合因子促使平滑地激活或禁止能量平滑操作,因此,不会在重构语音中有可感知的恶化,而这种恶化是因为激活/禁止能量平滑操作引起的。而且,因为用于能量平滑操作中的以前参数信息的量相对很小,这使得重构语音信号恶化的风险很小。
尽管本发明的示例实施方案已经在上面详细描述,这并不会限制本发明的范围,这可以在实施方案的变化中实践。

Claims (33)

1.根据有关原始语音信号的编码信息来产生原始语音信号近似值的方法,包括:
根据编码信息确定与原始语音信号的当前段相关的当前参数,对于至少一个当前参数而言,利用该当前参数和分别与原始语音信号的以前段相关的对应以前参数,产生一个修正的参数,并利用修正后的参数产生原始语音信号当前段的近似值。
2.权利要求1的方法,其中修正后的参数与当前参数不同。
3.权利要求1的方法,其中当前参数是表示原始语音信号的当前段中信号能量的参数。
4.权利要求3的方法,其中所述利用当前和以前参数的步骤包括在平均操作中使用以前参数来产生平均的参数,并使用平均后的参数和当前参数以产生修正的参数。
5.权利要求4的方法,其中所述使用当前和平均参数的步骤包括确定一个混合因子,该因子表示在产生修正后的参数中当前参数和平均参数的相对重要性。
6.权利要求5的方法,其中所述确定混合因子的步骤包括确定平稳性侧量值,该值表示与原始语音信号的当前段相关的噪声分量的平稳性特性,并按照平稳性测量值的函数来确定混合因子。
7.权利要求6的方法,其中所述确定平稳性侧量值的步骤包括,对于至少另一个当前参数,利用当前参数和分别与原始语音信号的以前段相关的对应以前参数来确定平稳性测量值。
8.权利要求7的方法,其中所述上面提到的利用当前和以前参数的步骤包括将平均操作应用于以前参数来产生平均的参数,并利用平均参数和当前参数来确定平稳性测量值。
9.权利要求7的方法,其中所述另一个当前参数是用于产生原始语音信号的近似值的合成滤波器的滤波器系数。
10.权利要求5的方法,其中所述使用当前和平均参数的步骤包括根据混合因子确定其它的与当前和平均参数相关的因子,并将当前和平均参数与各自的其它因子相乘。
11.权利要求4的方法,其中在平均操作中利用以前参数的步骤包括响应用于提供编码信息的通讯信道的条件来选择性地改变平均操作。
12.权利要求3的方法,其中所述使用当前和以前参数的步骤包括确定一个混合因子,该值表示在产生修正参数中当前参数与以前参数的相对重要性。
13.权利要求12的方法,其中确定混合因子的步骤包括确定平稳性测量值,该值表示与原始语音信号的当前段相关的噪声分量的平稳性特性,并按照平稳性测量值的函数来确定混合因子。
14.权利要求12的方法,其中确定混合因子的步骤包括根据用来给出编码信息的通讯信道条件来选择性地改变混合因子。
15.权利要求3的方法,其中当前参数是一个固定的码书增益,用于执行码激励线性预测语音解码过程。
16.语音解码装置,包括
用于接收编码信息的输入端,根据该编码信息可以产生原始语音信号的近似值,
用于输出所述近似值的输出端。
与所述输入端相连用来根据编码信息来确定当前参数的参数确定装置,其中当前参数会被用来产生原始语音信号当前段的近似值,
连接在所述参数确定装置和所述输出端之间用于产生原始语音信号近似值的重构装置,以及;
连接在所述参数确定装置和所述重构装置之间的修正器,用来使用至少所述当前参数和分别与原始语音以前段相关的对应以前参数之一来产生修正的参数,所述修正装置还用于为所述重构装置提供修正后的参数以用于产生原始语音信号当前段的所述近似值。
17.权利要求16的装置,其中所述修正后的参数不同于所述当前参数。
18.权利要求16的装置,其中所述当前参数表示原始语音信号当前段中的信号能量。
19.权利要求18的装置,其中所述修正装置包括在平均操作中利用以前的参数来产生平均参数的平均装置,所述修正装置能利用平均参数和当前参数一起来产生修正的参数。
20.权利要求19的装置,其中所述修正装置包括一个混合因子确定装置用于确定一个混合因子,表示在产生修正参数过程中当前参数和平均参数的相对重要性。
21.权利要求20的装置,其中所述修正装置包括一个平稳性确定装置,连接在所述参数确定装置和所述混合因子确定装置之间用来确定一个平稳性测量值,该值表示当前段的噪声分量的平稳性特性,所述混合因子确定装置可以按照所述平稳性测量值的函数来确定所述混合因子。
22.权利要求21的装置,其中所述平稳性确定装置能够使用至少另一个当前参数和分别与原始语音信号的以前段相关的对应以前参数来确定所述平稳性测量值。
23.权利要求22的装置,其中所述平稳性确定装置还能够将平均操作施加于与所述至少另一个当前参数对应的所述以前参数来产生一个进一步平均的参数,并可使用所述进一步平均的参数和所述另一个当前参数来确定所述平稳性测量值。
24.权利要求22的装置,其中所述另一个当前参数是所述重构装置在产生原始语音信号近似的过程中实现的合成滤波器的滤波器系数。
25.权利要求20的装置,其中所述修正装置包括连接在所述混合因子确定装置和所述重构装置之间的混合逻辑电路,该电路用于根据混合因子确定分别与当前参数和平均参数相关的其它因子,并用于将当前参数和平均参数与各自的其它因子相乘来产生各自的乘积,所述混合逻辑电路还能够根据所述乘积产生所述修正后的参数。
26.权利要求19的装置,其中所述平均装置包括用于接收表示信道条件的信息的输入端,根据该信息可以给出编码信息,所述平均装置根据所述信息来选择性地改变所述平均操作。
27.权利要求18的装置,其中所述修正装置还包括混合因子确定装置,用来确定混合因子,该因子表示在产生修正参数中以前参数相对于当前参数的重要性。
28.权利要求27的装置,其中所述修正装置包括一个平稳性确定装置,连接在所述参数确定装置和所述混合因子确定装置之间用来确定平稳性测量值,该值表示当前段的噪声分量的平稳性特性,所述混合因子确定装置能够按照所述平稳性测量值的函数来确定所述混合因子。
29.权利要求27的装置,其中所述混合因子确定装置包括用于接收信道条件表示信息的输入端,根据该信息可以给出编码信息,所述混合因子确定装置根据所述信息选择性地改变所述混合因子。
30.权利要求18的装置,其中所述当前参数是一个固定码书增益,用于码激励线性预测语音解码过程。
31.权利要求16的装置,其中语音解码装置包括码激励线性预测语音解码器。
32.用于通讯系统的收发机装置,包括:
用于通过通讯信道从发送机接收信息的输入端;
用于为收发机用户提供输出的输出端;
输入端与所述收发机相连、输出端与所述收发机输出端相连的语音解码装置,所述语音解码装置的所述输入端用于从所述收发机接收输入编码信息,根据该信息可以产生原始语音信号的近似值,所述解码装置的输出端用于为所述收发机提供所述近似值,
所述语音解码装置还包括参数确定装置,与所述语音解码装置输入端相连,用于根据所述编码信息确定用于产生原始语音信号当前段的近似值的当前参数,连接在所述参数检测装置和所述语音解码装置输出端之间的重构装置用于产生原始语音信号的近似值,连接在所述参数检测装置和所述重构装置之间的修正装置使用至少一个当前参数和分别与原始语音信号的当前段分别相关的对应以前参数来产生修正后的参数,所述修正装置还用于为重构装置提供修正后的参数用于产生原始语音信号当前段的所述近似值。
33.权利要求32的装置,其中所述收发机装置形成蜂窝电话的一部分。
CNB998109444A 1998-09-16 1999-09-10 具备背景噪声再现的语音编码 Expired - Lifetime CN1244090C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/154,361 US6275798B1 (en) 1998-09-16 1998-09-16 Speech coding with improved background noise reproduction
US09/154,361 1998-09-16

Publications (2)

Publication Number Publication Date
CN1318187A true CN1318187A (zh) 2001-10-17
CN1244090C CN1244090C (zh) 2006-03-01

Family

ID=22551052

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB998109444A Expired - Lifetime CN1244090C (zh) 1998-09-16 1999-09-10 具备背景噪声再现的语音编码

Country Status (15)

Country Link
US (1) US6275798B1 (zh)
EP (2) EP1112568B1 (zh)
JP (1) JP4309060B2 (zh)
KR (1) KR100688069B1 (zh)
CN (1) CN1244090C (zh)
AU (1) AU6377499A (zh)
BR (1) BR9913754A (zh)
CA (1) CA2340160C (zh)
DE (2) DE69935233T2 (zh)
HK (1) HK1117629A1 (zh)
MY (1) MY126550A (zh)
RU (1) RU2001110168A (zh)
TW (1) TW454167B (zh)
WO (1) WO2000016313A1 (zh)
ZA (1) ZA200101222B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008148321A1 (fr) * 2007-06-05 2008-12-11 Huawei Technologies Co., Ltd. Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil
CN1922660B (zh) * 2004-02-24 2010-06-09 松下电器产业株式会社 通信装置和通信方法
CN110574296A (zh) * 2017-05-11 2019-12-13 罗伯特·博世有限公司 尤其是能使用在电池组系统中的通信系统的信号处理设备

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
JP2000172283A (ja) * 1998-12-01 2000-06-23 Nec Corp 有音検出方式及び方法
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
US8566086B2 (en) * 2005-06-28 2013-10-22 Qnx Software Systems Limited System for adaptive enhancement of speech signals
WO2008108721A1 (en) 2007-03-05 2008-09-12 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for controlling smoothing of stationary background noise
EP2945158B1 (en) 2007-03-05 2019-12-25 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for smoothing of stationary background noise
AU2010308597B2 (en) * 2009-10-19 2015-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
JP5840075B2 (ja) * 2012-06-01 2016-01-06 日本電信電話株式会社 音声波形データベース生成装置、方法、プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US5008941A (en) * 1989-03-31 1991-04-16 Kurzweil Applied Intelligence, Inc. Method and apparatus for automatically updating estimates of undesirable components of the speech signal in a speech recognition system
US5148489A (en) * 1990-02-28 1992-09-15 Sri International Method for spectral estimation to improve noise robustness for speech recognition
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5991725A (en) * 1995-03-07 1999-11-23 Advanced Micro Devices, Inc. System and method for enhanced speech quality in voice storage and retrieval systems
GB2317084B (en) 1995-04-28 2000-01-19 Northern Telecom Ltd Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
US5794199A (en) 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1922660B (zh) * 2004-02-24 2010-06-09 松下电器产业株式会社 通信装置和通信方法
WO2008148321A1 (fr) * 2007-06-05 2008-12-11 Huawei Technologies Co., Ltd. Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil
CN110574296A (zh) * 2017-05-11 2019-12-13 罗伯特·博世有限公司 尤其是能使用在电池组系统中的通信系统的信号处理设备
CN110574296B (zh) * 2017-05-11 2022-06-07 罗伯特·博世有限公司 用于电池组系统中通信系统的信号处理设备

Also Published As

Publication number Publication date
EP1112568B1 (en) 2007-02-21
JP4309060B2 (ja) 2009-08-05
DE69942288D1 (de) 2010-06-02
TW454167B (en) 2001-09-11
RU2001110168A (ru) 2003-03-10
EP1112568A1 (en) 2001-07-04
MY126550A (en) 2006-10-31
BR9913754A (pt) 2001-06-12
KR100688069B1 (ko) 2007-02-28
DE69935233T2 (de) 2007-10-31
CA2340160C (en) 2010-11-30
HK1117629A1 (en) 2009-01-16
KR20010090438A (ko) 2001-10-18
JP2002525665A (ja) 2002-08-13
CA2340160A1 (en) 2000-03-23
EP1879176B1 (en) 2010-04-21
US6275798B1 (en) 2001-08-14
AU6377499A (en) 2000-04-03
WO2000016313A1 (en) 2000-03-23
ZA200101222B (en) 2001-08-16
CN1244090C (zh) 2006-03-01
EP1879176A2 (en) 2008-01-16
EP1879176A3 (en) 2008-09-10
DE69935233D1 (de) 2007-04-05

Similar Documents

Publication Publication Date Title
US5097507A (en) Fading bit error protection for digital cellular multi-pulse speech coder
US5778335A (en) Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
CN1232950C (zh) 性能增强的使用高频重建方法的编码系统和方法
US5754974A (en) Spectral magnitude representation for multi-band excitation speech coders
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
CA2169822C (en) Synthesis of speech using regenerated phase information
US8315860B2 (en) Interoperable vocoder
US8577673B2 (en) CELP post-processing for music signals
US8688437B2 (en) Packet loss concealment for speech coding
CN1288557A (zh) 解码方法和包括自适应后置滤波器的系统
JPH0863200A (ja) 線形予測係数信号生成方法
WO2000060575A1 (en) A voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
MXPA06012617A (es) Codificacion de audio con diferentes longitudes de cuadro de codificacion.
CN102985969A (zh) 编码装置、解码装置和编码方法、解码方法
US20200227061A1 (en) Signal codec device and method in communication system
CN1132155C (zh) 确定语音编码参数的方法和设备
CN104126201A (zh) 用于语音编码的混合码本激励的系统和方法
CN1244090C (zh) 具备背景噪声再现的语音编码
US20020062209A1 (en) Voiced/unvoiced information estimation system and method therefor
KR20010075491A (ko) 음성 코더 매개변수를 양자화하는 방법
CN114550732A (zh) 一种高频音频信号的编解码方法和相关装置
CN1355915A (zh) 过滤语言帧的多脉冲内插编码
CN1140894C (zh) 可变位速率语音传输系统
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
CN1104010A (zh) 产生用于话音编码器的频谱噪音加权滤波器的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C35 Partial or whole invalidation of patent or utility model
IP01 Partial invalidation of patent right

Commission number: 4W02767

Conclusion of examination: Modify the text on the basis of the requirements of the patent rights declaration submitted on November 25, 2009, No. 99810944.4 invention rights requirements 8, 18, 22, 23 invalid, based in 1-7, 9-17, claims 19-21 continued to maintain the validity of the patents.

Decision date of declaring invalidation: 20110524

Decision number of declaring invalidation: 16563

Denomination of invention: Speech coding with background noise reproduction

Granted publication date: 20060301

Patentee: Ericsson Telephone AB

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20060301