CN101226744A - 语音解码器中实现语音解码的方法及装置 - Google Patents

语音解码器中实现语音解码的方法及装置 Download PDF

Info

Publication number
CN101226744A
CN101226744A CNA2007100011862A CN200710001186A CN101226744A CN 101226744 A CN101226744 A CN 101226744A CN A2007100011862 A CNA2007100011862 A CN A2007100011862A CN 200710001186 A CN200710001186 A CN 200710001186A CN 101226744 A CN101226744 A CN 101226744A
Authority
CN
China
Prior art keywords
delay parameter
pitch delay
frame
bad frame
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100011862A
Other languages
English (en)
Other versions
CN101226744B (zh
Inventor
许剑峰
许丽净
张清
李伟
桑盛虎
杜正中
胡晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007100011862A priority Critical patent/CN101226744B/zh
Priority to EP08700799A priority patent/EP2081186B1/en
Priority to DE602008001551T priority patent/DE602008001551D1/de
Priority to PCT/CN2008/070142 priority patent/WO2008089696A1/zh
Priority to AT08700799T priority patent/ATE471556T1/de
Publication of CN101226744A publication Critical patent/CN101226744A/zh
Priority to US12/426,379 priority patent/US8145480B2/en
Application granted granted Critical
Publication of CN101226744B publication Critical patent/CN101226744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

本发明涉及一种解码方法及装置。其包括接收编码端发来的数据帧,若发生坏帧,则计算确定坏帧的基音延迟参数,根据计算确定的坏帧的基音延迟参数进行解码操作,获得解码后的数据;其中,所述确定坏帧的基音延迟参数的处理过程具体包括:首先,确定发生的连续坏帧数量和之前帧的基音延迟参数;之后,根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。从而可以克服解码过程中可能出现的过度周期性问题,且可以保证解码的准确性。

Description

语音解码器中实现语音解码的方法及装置
技术领域
本发明涉及解码技术领域,尤其涉及一种语音解码器中实现语音解码的实现方案。
背景技术
在语音传输系统中,语音编码器常用的编码原理是ACELP(代数码本激励线性预测,Algebraic Code Excited Linear Prediction)。基于ACELP的语音编码器生成的码流是以语音帧为单位。对于每一帧的输入数据的传输过程如图1所示,发送端的语音编码器要将其编码为一组参数,所述参数通常需要经过量化后再通过通信信道进行传输;接收端的解码器则需要将接收到的所述参数重新合成为语音信号,从而实现语音信号的传递过程。
基于ACELP的语音编码器生成的语音帧的参数通常包括谱参数、自适应码本参数、代数码本参数、基音延迟(pitch lag/delay,也称为长时预测延迟LTP-lag),自适应码本增益和代数码本增益等。其中,所述的基音延迟参数用于描述语音信号的基本周期,通常,不同时刻的基音延迟参数总是会落在某个范围内。
在数据接收端,对于其接收到的数据发送端发来的数据帧后,若确定发生错误或者丢失(即出现坏帧),则在出现坏帧时,接收端的解码器需要对坏帧中的错误参数进行恢复,即确定一个新的参数作为该帧的相应参数,以减少解码后语音质量的下降。
目前,当出现坏帧时,可以采用的针对基音延迟参数的恢复处理方式通常有三种,下面将分别对各个方案进行说明。
第一种实现方案为:在发生帧错误(即出现坏帧)时,语音解码器重复采用上一帧的基音延迟参数作为当前错误帧的基音延迟参数,即:
τ ( m ) = τ ( m - 1 ) ; FER _ FLAG ( m ) = TRUE DELAY + τ min ; otherwise
其中,
τ(m)是当前帧的基音延迟参数;
τ(m-1)是上一帧的基音延迟参数;
DELAY=τ(m)-τmin是编码后的基音延迟参数,其中所述的τmin是基音延迟参数的下限值。
可以看出,在该方案中,当FER_FLAG(m)=TRUE(即出现坏帧)时,将上一帧的基音延迟参数作为当前坏帧的基音延迟参数,否则(otherwise),则直接确定当前帧的基音延迟参数。
在该方案中,若在连续发生帧错误,则将出现连续多帧的基音延迟参数相同的情况,造成过度周期性,使得解码后的语音产生尖锐噪声,进而导致解码后语音效果大大降低。
第二种实现方案为:在发生帧错误时,语音解码器简单将上一帧的基音延迟参数的整数部分加1作为错误帧的基音延迟参数,且将基音延迟参数的大小限制在特定的范围内,即:
if lagint(n)<PIT_MAX,lagint(n)=lagint(n-1)+1
else lagint(n)=PIT_MAX
lagfrac(n)=0
其中,
lagint(n)是当前帧的基音延迟参数的整数部分;
lagint(n-1)是上一帧的基音延迟参数的整数部分;
PIT_MAX是基音延迟整数部分取值的上限;
lagfrac(n)是当前帧的基音延迟参数的分数部分,有的语音编解码器最小精度为分数,如1/3。
可以看出,在该方案中,当出现坏帧时,则将(lagint(n-1)+1)作为lagint(n),并判断当前帧的lagint(n)是否小于PIT_MAX,若是,则保持lagint(n)不变,否则,将当前帧的lagint(n)调整为PIT_MAX。
在该方案中,能够有效防止过度周期性问题的出现,克服了解码后的语音可能生成尖锐噪声的问题。但是,若在数据接收端连续出现坏帧,则将使得为当前帧确定的基音延迟参数与实际基音延迟参数之间存在较大的积累误差,从而解码准确性大大降低。
目前可以采用的第三种实现方案为:在发生帧错误时,首先对信号分类,分类标志为Qlag,Qlag=1表示声音信号属于稳态信号(信号周期性较强),Qlag=0表示声音信号分类属于非稳态信号(信号周期性较弱);然后,根据不同的分类标志采取不同的基音延迟参数确定方案,具体为:
T = T received , Q lag = 1 1 3 Σ ( T max + T max - 1 + T max - 2 ) + RND ( T max - T max - 2 ) , Q lag = 0
其中,
T表示当前帧的基音延迟参数;
Treceived表示上次接收到的好帧的基音延迟参数;
Tmax=max(Tbuffer),表示最近好帧历史缓冲区中最大的基音延迟参数;
Tmax-1表示最近好帧历史缓冲区Tbuffer中第二大的基音延迟参数;
Tmax-2表示最近好帧历史缓冲区Tbuffer中第三大的基音延迟参数;
RND(x)是随机数,范围是
Figure A20071000118600081
可以看出,在该方案中,若出现连接坏帧,且Qlag=1,则将出现连续多个帧均采用上一次接收到的好帧的基音延迟参数,这显然会导致过度周期性问题的出现,而且,对信号进行分类也将增加整个运算过程的复杂度。
发明内容
本发明的实施例提供了一种语音解码器中实现语音解码的方法及装置,以克服解码过程中可能出现的过度周期性问题,且可以保证解码的准确性。
本发明的实施例提供了一种解码方法,该方法包括接收编码端发来的数据帧,若发生坏帧,则计算确定坏帧的基音延迟参数,根据计算确定的坏帧的基音延迟参数进行解码操作,获得解码后的数据,所述确定坏帧的基音延迟参数的处理过程具体包括:
确定发生的连续坏帧数量和之前帧的基音延迟参数;
根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。
本发明的实施例提供了一种解码装置,该装置中包括用于计算确定当前坏帧的基音延迟参数的基音延迟参数计算单元,该基音延迟参数计算单元用于将确定的基音延迟参数提供给解码处理实体,以用于进行解码操作,该基音延迟参数计算单元具体包括:
参数获取单元,用于获取确定发生的连续坏帧数量,以及之前帧的基音延迟参数;
基音延迟参数确定单元,用于根据参数获取单元确定的所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。
由上述本发明的实施例提供的技术方案可以看出,在解码端,若出现连续坏帧时,各个连续坏帧的基音延迟参数会在上一帧的基音延迟参数附近波动,而不再是单调递增,从而可以减少积累误差,提高解码的准确性。同时,还可以有效避免过度周期性的出现,进而提高了解码的效果。
附图说明
图1为现有技术中语音通信系统的编解码过程示意图;
图2为本发明提供的方法实施例的处理过程示意图;
图3为方法实施例中统计坏帧及保存上一帧的基音延迟参数的处理过程示意图;
图4为本发明提供的装置实施例的结构示意图一;
图5为本发明提供的装置实施例的结构示意图二。
具体实施方式
本发明提供的实施例能够在发生帧错误时,对坏帧中的基音延迟参数进行替换,减少解码后语音质量的下降。而且,在出现连续坏帧,需要替换相应的基音延迟参数时,则将替换值设为在之前帧的基音延迟参数附近波动的值,使得其既可以在之前帧的基音延迟参数的基础上增加,也可以在之前帧的基音延迟参数的基础减小,从而减少基音延迟参数的积累误差,并可以避免过度周期性问题的出现。
所述实施例可以应用于基于ACELP的语音解码器的帧错误隐藏的基音延迟参数替换处理过程中,也可以应用其他类似应用场景中。
下面首先对本发明提供的解码方法的实施例进行说明。在该实施例中,数据接收端的解码器需要接收编码端发来的数据帧,并在确定发生坏帧,则计算确定坏帧的基音延迟参数,之后,便可以根据计算确定的坏帧的基音延迟参数进行解码操作,以获得解码后的数据。
在该实施例中,相应的确定坏帧的基音延迟参数的处理过程具体可以包括如下步骤:
(1)确定发生的连续坏帧数量和之前帧的基音延迟参数;
其中,所述的之前帧的基音延迟参数可以为基于当前坏帧的上一帧的基音延迟参数,或者,也可以为基于当前坏帧的上一好帧的基音延迟参数,或者,也可以为基于当前坏帧的其他设定的之前任意帧的基音延迟参数。
(2)根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数;
其中,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。
具体一点讲,所述的预定的调整策略可以为:
预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数值为随着连续坏帧数量的变化而在设定的数值范围内波动;所述的函数可以为仅基于连续坏帧数量作为变量的函数,且函数的计算结果需要再与之前帧的基音延迟参数进行计算(如求和等)确定当前坏帧的基音延迟参数;所述的参数也可以为基于连接坏帧数量及之前帧的基音延迟参数作为变量的函数,且函数的计算结果便为当前坏帧的基音延迟参数。
此时,所述的计算获得当前坏帧的基音延迟参数的处理可以为:根据当前统计的连续坏帧数量值、所述基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。
或者,所述的预定的调整策略还可以为:
预先建立一组调整参数值,所述调整参数值分别与连续坏帧数量取模运算后获得的值对应,所述调整参数值为在设定的数值范围内波动;
此时,所述的计算获得当前坏帧的基音延迟参数的处理则可以为:对当前统计的连续坏帧数量值进行取模运算,并利用获得的值确定对应的调整参数值与之前帧的基音延迟参数的和作为当前坏帧的基音延迟参数。
在本发明提供的实施例中,为避免计算获得的当前坏帧的基音延迟参数出现严重偏离实际值的情况,还可以在若确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围,则将该计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内,具体可以按照设定的调整方式进行调整。
为便于对本发明提供的方法实施例有进一步的理解,下面将结合附图对所述实施例的具体应用进行说明。
该实施例在具体应用过程中,相应的针对当前坏帧的基音延迟参数的替换更新实现方案如图2所示,具体包括:
步骤201,统计连续坏帧的数目,假设采用变量bfi_count记录该连续坏帧的数目,当出现好帧时,则将bfi_count清零。
步骤202,记录基于当前帧的上一帧的基音延迟参数,并采用变量old_T0记录上一帧基音延迟参数的整数部分;
步骤203,当出现坏帧(如出现丢帧)时,则采用预先建立的函数调整所述上一帧基音延迟参数的整数部分,并将调整后的值作为当前坏帧的基音延迟参数的整数部分;
所述预先建立的函数可以为:T0=old_T0+f(bfi_count);
其中,T0是当前帧的基音延迟参数的整数部分,old_T0是上一帧基音延迟参数的整数部分,f(bfi_count)是关于连续坏帧数的调整函数,所述的f(bfi_count)需要随着连续坏帧数量的变化而在某一预定的数值范围内波动;
例如,所述的连续坏帧数的函数可以为:
f ( bfi _ count ) = 1 , ( bfi _ count mod 4 ) = 1 - 2 , ( bfi _ count mod 4 ) = 2 - 1 , ( bfi _ count mod 4 ) = 3 2 , ( bfi _ count mod 4 ) = 0
可以看出,该函数能够保证在出现连续丢帧情况时,也不会造成基音延迟参数的积累误差;
再例如,所述的f(bfi_count)还可以是随着bfi_count的变化而在0附近波动的函数,即f(bfi_count)既不是一个单调递增的函数,也不是一个单调递减的函数,这样,便可以避免导致积累误差随连续丢帧数量不断增大。
步骤204,将步骤203计算获得的当前坏帧的基音延迟参数T0后,还需要对该T0进行范围判断,即判断该T0值是否在预定的数值范围内,若未处于该预定的数值范围内,则执行步骤205,否则,执行步骤206;
步骤205,采用设定的调整方式对T0进行调整,将T0调整到该预定的数值范围内后输出作为当前坏帧的基音延迟参数;
例如,所述的预定的数值范围为:基音延迟上限值PIT_MAX至基音延迟下限值PIT_MIN确定的数值范围,此时,相应的判断处理过程可以为:
如果T0>PIT_MAX,则令T0=PIT_MAX,如果T0<PIT_MIN,则令T0=PIT_MIN。
在上述处理过程中,还可以将当前帧的基音延迟的分数部分置零,即令T0_frac=0,T0_frac是当前帧的基音延迟的分数部分;或者,也可以将T0_frac设置为与上一帧的基音延迟参数的分数部分相同;或者,也可以设定为其他预定的数值,等等。
步骤206,直接输出所述T0作为当前坏帧的基音延迟参数。
在上述图2所示的处理过程中,需要统计连续坏帧的数目及保存上一帧的基音延迟参数,相应的处理过程具体如图3所示,包括:
步骤301,接收编码端发送来的已编码的帧;
步骤302,判断是否出现坏帧,若出现坏帧,则执行步骤304,否则执行步骤303;
步骤303,由于出现了好帧,故需要将连续坏帧数清零,并执行步骤306;
步骤304,更新连续坏帧的数目,将当前坏帧的数值计入所述连续坏帧数目中,执行步骤305;
步骤305,计算当前坏帧的基音延迟参数,并执行步骤306,具体的计算方式如前面针对图2的描述;
步骤306,保存当前帧的基音延迟参数,以便于进行之后的坏帧的基音延迟参数计算时使用;
其中,为避免第一帧便出现坏帧时因尚未保存之前帧的基音延迟参数而无法进行相应处理,则可以设置相应的基音延迟参数的初始值。
本发明还提供了一种解码装置的实施例,该实施例的具体实现结构如图4和图5所示,在该装置中包括用于计算确定当前坏帧的基音延迟参数的基音延迟参数计算单元,该基音延迟参数计算单元用于将确定的基音延迟参数提供给解码处理实体,以用于进行解码操作。
其中,所述的基音延迟参数计算单元具体可以包括:
(1)基音延迟参数保存单元
该单元用于保存已经接收的之前帧的基音延迟参数,并保存,以提供给参数获取单元;该单元具体保存的是预定的某一帧的基音延迟参数,例如,上一帧的基音延迟参数,或者,上一好帧的基音延迟参数,等等。
(2)连续坏帧数记录单元
该单元具体用于统计接收的数据帧中出现的连续坏帧的数量,并保存,以提供给参数获取单元。
(3)参数获取单元
该单元具体用于获取确定发生的连续坏帧数量,以及之前帧的基音延迟参数;其中,所述的获取的之前帧的基音延迟参数可以为基于当前坏帧的上一帧的基音延迟参数,或者,预定的其他之前已经接收的某一帧的基音延迟参数。
(4)基音延迟参数确定单元
该单元具体用于根据参数获取单元确定的所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,从而计算获得当前坏帧的基音延迟参数,其中,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动,即随着连续坏帧数量的增加,当前坏帧的基音延迟参数时而增加时而减少,但需要保证其始终处于确定的范围内。
(5)基音延迟参数调整单元
该单元用于在确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围后,将计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内,从而避免确定的当前坏帧的基音延迟参数的较实际值产生较大的偏离。
在该装置的实施例中,所述的基音延迟参数确定单元具体可以采用以下两种实现方式:
实现方式一
参照图4所示,所述的基音延迟参数确定单元具体可以包括函数调用单元和第一基音延迟参数计算单元,其中:
所述的函数调用单元,用于调用预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数值为随着连续坏帧数量的变化而在设定的值范围内波动;其中,所述的函数可以为仅基于连续坏帧数量作为变量的函数,且函数的计算结果需要再与之前帧的基音延迟参数进行计算(如求和等)确定当前坏帧的基音延迟参数;所述的参数也可以为基于连接坏帧数量及之前帧的基音延迟参数作为变量的函数,且函数的计算结果便为当前坏帧的基音延迟参数;
所述的第一基音延迟参数计算单元,用于根据当前统计的连续坏帧数量值、函数调用单元调用的基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。
实现方式二
参照图5所示,在所述的基音延迟参数确定单元具体包括取模运算单元、调整参数计算单元和第二基音延迟参数计算单元,其中:
所述的取模运算单元,用于对当前统计的连续坏帧数量值按照预定的运算方式进行取模运算,获得取模运算结果;
所述的调整参数计算单元,用于根据取模运算结果在预先建立的一组调整参数值中查找与其对应的调整参数值,所述预先建立一组调整参数值分别与连续坏帧数量取模运算结果对应,且所述调整参数值为在设定的数值范围内波动,例如,在数值0附近波动,或者,在正负1之间波动,等等;
所述的第二基音延迟参数计算单元,用于计算所述调整参数与之前帧的基音延迟参数的和,并作为当前坏帧的基音延迟参数。
综上所述,本发明提供的各个实施例在具体应用过程中,若出现连续丢帧情况,需要替换相应帧的基音延迟参数时,则可以将相应的替换值设为在之前帧(如上一好帧等)的基音延迟参数附近波动的值。其与现有技术中提供的单调递增的替换算法相比,减少了积累误差,提高了解码的准确性。而且,在上述实施例中,由于对替换后的基音延迟参数为波动值,例如,其波动的幅度至少可以为1样点,因此,相应实施例还能够有效防止过度周期性的出现,从而可以有效避免解码后的语音出现尖锐噪声的情况。
以上所达,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (11)

1.一种解码方法,该方法包括接收编码端发来的数据帧,若发生坏帧,则计算确定坏帧的基音延迟参数,根据计算确定的坏帧的基音延迟参数进行解码操作,获得解码后的数据,其特征在于,所述确定坏帧的基音延迟参数的处理过程具体包括:
确定发生的连续坏帧数量和之前帧的基音延迟参数;
根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。
2.根据权利要求1所述的方法,其特征在于,所述的之前帧的基音延迟参数为基于当前坏帧的上一帧的基音延迟参数。
3.根据权利要求1所述的方法,其特征在于,所述的预定的调整策略包括:预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数值为随着连续坏帧数量的变化而在设定的数值范围内波动;
且,所述的计算获得当前坏帧的基音延迟参数的处理具体包括:根据当前统计的连续坏帧数量值、所述基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。
4.根据权利要求1所述的方法,其特征在于,所述的预定的调整策略包括:预先建立一组调整参数值,所述一组调整参数值分别与连续坏帧数量取模运算后获得的值对应,所述一组调整参数值为在设定的数值范围内波动;
且,所述的计算获得当前坏帧的基音延迟参数的处理具体包括:对当前统计的连续坏帧数量值进行取模运算,并利用获得的值确定对应的调整参数值与之前帧的基音延迟参数的和作为当前坏帧的基音延迟参数。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述的方法还包括:
若确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围,则将该计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内。
6.一种解码装置,该装置中包括用于计算确定当前坏帧的基音延迟参数的基音延迟参数计算单元,该基音延迟参数计算单元用于将确定的基音延迟参数提供给解码处理实体,以用于进行解码操作,其特征在于,该基音延迟参数计算单元具体包括:
参数获取单元,用于获取确定发生的连续坏帧数量,以及之前帧的基音延迟参数;
基音延迟参数确定单元,用于根据参数获取单元确定的所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。
7.根据权利要求6所述的装置,其特征在于,所述的参数获取单元获取的之前帧的基音延迟参数为基于当前坏帧的上一帧的基音延迟参数。
8.根据权利要求6所述的装置,其特征在于,所述的基音延迟参数确定单元具体包括:
函数调用单元,用于调用预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数值为随着连续坏帧数量的变化而在设定的数值范围内波动;
第一基音延迟参数计算单元:用于根据当前统计的连续坏帧数量值、函数调用单元调用的基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。
9.根据权利要求6所述的装置,其特征在于,所述的基音延迟参数确定单元具体包括:
取模运算单元,用于对当前统计的连续坏帧数量值进行取模运算,获得取模运算结果;
调整参数计算单元,用于根据取模运算结果在预先建立的一组调整参数值中查找对应的调整参数值,所述预先建立一组调整参数值分别与连续坏帧数量取模运算结果对应,且所述调整参数值为在设定的数值范围内波动;
第二基音延迟参数计算单元,用于计算所述调整参数与之前帧的基音延迟参数的和,并作为当前坏帧的基音延迟参数。
10.根据权利要求6、7、8或9所述的装置,其特征在于,所述的装置还包括基音延迟参数调整单元,用于在确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围后,将计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内。
11.根据权利要求6、7、8或9所述的装置,其特征在于,所述的装置还包括:
基音延迟参数保存单元,用于保存已经接收的之前帧的基音延迟参数,并保存,以提供给参数获取单元;
连续坏帧数记录单元,用于统计接收的数据帧中出现的连续坏帧的数量,并保存,以提供给参数获取单元。
CN2007100011862A 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置 Active CN101226744B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN2007100011862A CN101226744B (zh) 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置
EP08700799A EP2081186B1 (en) 2007-01-19 2008-01-18 A method and apparatus for accomplishing speech decoding in a speech decoder
DE602008001551T DE602008001551D1 (de) 2007-01-19 2008-01-18 Verfahren und vorrichtung zur erzielung einer sprachdekodierung in einem sprachdekodierer
PCT/CN2008/070142 WO2008089696A1 (fr) 2007-01-19 2008-01-18 Procédé et dispositif destinés au décodage de la parole dans un décodeur de parole
AT08700799T ATE471556T1 (de) 2007-01-19 2008-01-18 Verfahren und vorrichtung zur erzielung einer sprachdekodierung in einem sprachdekodierer
US12/426,379 US8145480B2 (en) 2007-01-19 2009-04-20 Method and apparatus for implementing speech decoding in speech decoder field of the invention

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100011862A CN101226744B (zh) 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置

Publications (2)

Publication Number Publication Date
CN101226744A true CN101226744A (zh) 2008-07-23
CN101226744B CN101226744B (zh) 2011-04-13

Family

ID=39644136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100011862A Active CN101226744B (zh) 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置

Country Status (6)

Country Link
US (1) US8145480B2 (zh)
EP (1) EP2081186B1 (zh)
CN (1) CN101226744B (zh)
AT (1) ATE471556T1 (zh)
DE (1) DE602008001551D1 (zh)
WO (1) WO2008089696A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101226744B (zh) 2007-01-19 2011-04-13 华为技术有限公司 语音解码器中实现语音解码的方法及装置
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
RU2612581C2 (ru) * 2012-11-15 2017-03-09 Нтт Докомо, Инк. Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
US20150100318A1 (en) * 2013-10-04 2015-04-09 Qualcomm Incorporated Systems and methods for mitigating speech signal quality degradation

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2746033B2 (ja) * 1992-12-24 1998-04-28 日本電気株式会社 音声復号化装置
FI97182C (fi) * 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
SE9500858L (sv) * 1995-03-10 1996-09-11 Ericsson Telefon Ab L M Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US6847928B1 (en) * 1998-05-27 2005-01-25 Ntt Mobile Communications Network, Inc. Speech decoder and speech decoding method
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
JP4464488B2 (ja) * 1999-06-30 2010-05-19 パナソニック株式会社 音声復号化装置及び符号誤り補償方法、音声復号化方法
JP4005359B2 (ja) * 1999-09-14 2007-11-07 富士通株式会社 音声符号化及び音声復号化装置
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US6584438B1 (en) * 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US6968309B1 (en) * 2000-10-31 2005-11-22 Nokia Mobile Phones Ltd. Method and system for speech frame error concealment in speech decoding
US7590525B2 (en) * 2001-08-17 2009-09-15 Broadcom Corporation Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
US7788091B2 (en) * 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
US7457746B2 (en) * 2006-03-20 2008-11-25 Mindspeed Technologies, Inc. Pitch prediction for packet loss concealment
CN101226744B (zh) 2007-01-19 2011-04-13 华为技术有限公司 语音解码器中实现语音解码的方法及装置

Also Published As

Publication number Publication date
ATE471556T1 (de) 2010-07-15
DE602008001551D1 (de) 2010-07-29
EP2081186B1 (en) 2010-06-16
EP2081186A1 (en) 2009-07-22
WO2008089696A1 (fr) 2008-07-31
US20090204396A1 (en) 2009-08-13
CN101226744B (zh) 2011-04-13
US8145480B2 (en) 2012-03-27
EP2081186A4 (en) 2009-09-23

Similar Documents

Publication Publication Date Title
EP2438701B1 (en) Systems and methods for preventing the loss of information within a speech frame
US8102872B2 (en) Method for discontinuous transmission and accurate reproduction of background noise information
US7778824B2 (en) Device and method for frame lost concealment
KR101290425B1 (ko) 소거된 스피치 프레임을 복원하는 시스템 및 방법
CN101226744B (zh) 语音解码器中实现语音解码的方法及装置
US20200227061A1 (en) Signal codec device and method in communication system
CN102985969A (zh) 编码装置、解码装置和编码方法、解码方法
WO1999040573A1 (fr) Procede de decodage d'un signal audio avec correction des erreurs de transmission
KR20210125534A (ko) 전 프레임 손실 은닉 및 부분 프레임 손실 은닉을 포함하는 lc3 은닉을 위한 디코더 및 디코딩 방법
US6327562B1 (en) Method and device for coding an audio signal by “forward” and “backward” LPC analysis
GB2508811A (en) Packet loss concealment in decoded signals
EP2127088B1 (en) Audio quantization
US20100251051A1 (en) Error concealment
CN101399040A (zh) 一种帧错误隐藏的谱参数替换方法
EP3292674B1 (en) Voice quality monitoring system
CN110770822B (zh) 音频信号编码和解码
CN101895373A (zh) 信道译码方法、系统及装置
KR20130116897A (ko) 예측 인코딩을 위한 인코더 및 방법, 디코딩을 위한 디코더 및 방법, 예측 인코딩 및 디코딩을 위한 시스템 및 방법, 및 예측 인코딩된 정보 신호
US20100185441A1 (en) Error Concealment
CN108364657B (zh) 处理丢失帧的方法和解码器
CN100349395C (zh) 用于语音帧误差降低的语音通信单元和方法
Korhonen et al. Schemes for error resilient streaming of perceptually coded audio
Singh et al. Evaluating the perceived voice quality on VoIP network using interpolated FIR filter algorithm
US20010025242A1 (en) Error concealment method with pitch change detection
Sun et al. A comparative study of packet loss concealment for Bluetooth CVSD codec

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant