CN101226744B - 语音解码器中实现语音解码的方法及装置 - Google Patents

语音解码器中实现语音解码的方法及装置 Download PDF

Info

Publication number
CN101226744B
CN101226744B CN2007100011862A CN200710001186A CN101226744B CN 101226744 B CN101226744 B CN 101226744B CN 2007100011862 A CN2007100011862 A CN 2007100011862A CN 200710001186 A CN200710001186 A CN 200710001186A CN 101226744 B CN101226744 B CN 101226744B
Authority
CN
China
Prior art keywords
delay parameter
pitch delay
frame
bad frame
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007100011862A
Other languages
English (en)
Other versions
CN101226744A (zh
Inventor
许剑峰
许丽净
张清
李伟
桑盛虎
杜正中
胡晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2007100011862A priority Critical patent/CN101226744B/zh
Priority to EP08700799A priority patent/EP2081186B1/en
Priority to PCT/CN2008/070142 priority patent/WO2008089696A1/zh
Priority to DE602008001551T priority patent/DE602008001551D1/de
Priority to AT08700799T priority patent/ATE471556T1/de
Publication of CN101226744A publication Critical patent/CN101226744A/zh
Priority to US12/426,379 priority patent/US8145480B2/en
Application granted granted Critical
Publication of CN101226744B publication Critical patent/CN101226744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

本发明涉及一种解码方法及装置。其包括接收编码端发来的数据帧,若发生坏帧,则计算确定坏帧的基音延迟参数,根据计算确定的坏帧的基音延迟参数进行解码操作,获得解码后的数据;其中,所述确定坏帧的基音延迟参数的处理过程具体包括:首先,确定发生的连续坏帧数量和之前帧的基音延迟参数;之后,根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。从而可以克服解码过程中可能出现的过度周期性问题,且可以保证解码的准确性。

Description

语音解码器中实现语音解码的方法及装置 
技术领域
本发明涉及解码技术领域,尤其涉及一种语音解码器中实现语音解码的实现方案。 
背景技术
在语音传输系统中,语音编码器常用的编码原理是ACELP(代数码本激励线性预测,Algebraic Code Excited Linear Prediction)。基于ACELP的语音编码器生成的码流是以语音帧为单位。对于每一帧的输入数据的传输过程如图1所示,发送端的语音编码器要将其编码为一组参数,所述参数通常需要经过量化后再通过通信信道进行传输;接收端的解码器则需要将接收到的所述参数重新合成为语音信号,从而实现语音信号的传递过程。 
基于ACELP的语音编码器生成的语音帧的参数通常包括谱参数、自适应码本参数、代数码本参数、基音延迟(pitch lag/delay,也称为长时预测延迟LTP-lag),自适应码本增益和代数码本增益等。其中,所述的基音延迟参数用于描述语音信号的基本周期,通常,不同时刻的基音延迟参数总是会落在某个范围内。 
在数据接收端,对于其接收到的数据发送端发来的数据帧后,若确定发生错误或者丢失(即出现坏帧),则在出现坏帧时,接收端的解码器需要对坏帧中的错误参数进行恢复,即确定一个新的参数作为该帧的相应参数,以减少解码后语音质量的下降。 
目前,当出现坏帧时,可以采用的针对基音延迟参数的恢复处理方式通 常有三种,下面将分别对各个方案进行说明。 
第一种实现方案为:在发生帧错误(即出现坏帧)时,语音解码器重复采用上一帧的基音延迟参数作为当前错误帧的基音延迟参数,即: 
τ ( m ) = τ ( m - 1 ) ; FER _ FLAG ( m ) = TRUE DELAY + τ min ; otherwise
其中, 
τ(m)是当前帧的基音延迟参数; 
τ(m-1)是上一帧的基音延迟参数; 
DELAY=τ(m)-τmin是编码后的基音延迟参数,其中所述的τmin是基音延迟参数的下限值。 
可以看出,在该方案中,当FER_FLAG(m)=TRUE(即出现坏帧)时,将上一帧的基音延迟参数作为当前坏帧的基音延迟参数,否则(otherwise),则直接确定当前帧的基音延迟参数。 
在该方案中,若在连续发生帧错误,则将出现连续多帧的基音延迟参数相同的情况,造成过度周期性,使得解码后的语音产生尖锐噪声,进而导致解码后语音效果大大降低。 
第二种实现方案为:在发生帧错误时,语音解码器简单将上一帧的基音延迟参数的整数部分加1作为错误帧的基音延迟参数,且将基音延迟参数的大小限制在特定的范围内,即: 
if lagint(n)<PIT_MAX,lagint(n)=lagint(n-1)+1 
else lagint(n)=PIT_MAX 
lagfrac(n)=0 
其中, 
lagint(n)是当前帧的基音延迟参数的整数部分; 
lagint(n-1)是上一帧的基音延迟参数的整数部分;
PIT MAX是基音延迟整数部分取值的上限; 
lagfrac(n)是当前帧的基音延迟参数的分数部分,有的语音编解码器最小精度为分数,如1/3。 
可以看出,在该方案中,当出现坏帧时,则将(lagint(n-1)+1)作为lagint(n),并判断当前帧的lagint(n)是否小于PIT_MAX,若是,则保持lagint(n)不变,否则,将当前帧的lagint(n)调整为PIT_MAX。 
在该方案中,能够有效防止过度周期性问题的出现,克服了解码后的语音可能生成尖锐噪声的问题。但是,若在数据接收端连续出现坏帧,则将使得为当前帧确定的基音延迟参数与实际基音延迟参数之间存在较大的积累误差,从而解码准确性大大降低。 
目前可以采用的第三种实现方案为:在发生帧错误时,首先对信号分类,分类标志为Qlag,Qlag=1表示声音信号属于稳态信号(信号周期性较强),Qlag=0表示声音信号分类属于非稳态信号(信号周期性较弱);然后,根据不同的分类标志采取不同的基音延迟参数确定方案,具体为: 
T = T received , Q lag = 1 1 3 &Sigma; ( T max + T max - 1 + T max - 2 ) + RND ( T max - T max - 2 ) , Q lag = 0
其中, 
T表示当前帧的基音延迟参数; 
Treceived表示上次接收到的好帧的基音延迟参数; 
Tmax=max(Thuffer),表示最近好帧历史缓冲区中最大的基音延迟参数; 
Tmax-1表示最近好帧历史缓冲区Tbuffer中第二大的基音延迟参数; 
Tmax-2表示最近好帧历史缓冲区Tbuffer中第三大的基音延迟参数;
RND(x)是随机数,范围是 
Figure DEST_PATH_GSB00000377866200011
可以看出,在该方案中,若出现连接坏帧,且Qlog=1,则将出现连续多个帧均采用上一次接收到的好帧的基音延迟参数,这显然会导致过度周期性问题的出现,而且,对信号进行分类也将增加整个运算过程的复杂度。 
发明内容
本发明的实施例提供了一种语音解码器中实现语音解码的方法及装置,以克服解码过程中可能出现的过度周期性问题,且可以保证解码的准确性。 
本发明的实施例提供了一种语音解码方法,该方法包括接收编码端发来的数据帧,若发生坏帧,则计算确定坏帧的基音延迟参数,根据计算确定的坏帧的基音延迟参数进行解码操作,获得解码后的数据,所述确定坏帧的基音延迟参数的处理过程具体包括: 
确定发生的连续坏帧数量和之前帧的基音延迟参数; 
根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。 
本发明的实施例提供了一种语音解码装置,该装置中包括用于计算确定当前坏帧的基音延迟参数的基音延迟参数计算单元,该基音延迟参数计算单元用于将确定的基音延迟参数提供给解码处理实体,以用于进行解码操作,该基音延迟参数计算单元具体包括: 
参数获取单元,用于获取确定发生的连续坏帧数量,以及之前帧的基音延迟参数; 
基音延迟参数确定单元,用于根据参数获取单元确定的所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。 
由上述本发明的实施例提供的技术方案可以看出,在解码端,若出现连续坏帧时,各个连续坏帧的基音延迟参数会在上一帧的基音延迟参数附近波动,而不再是单调递增,从而可以减少积累误差,提高解码的准确性。同时,还可以有效避免过度周期性的出现,进而提高了解码的效果。 
附图说明
图1为现有技术中语音通信系统的编解码过程示意图; 
图2为本发明提供的方法实施例的处理过程示意图; 
图3为方法实施例中统计坏帧及保存上一帧的基音延迟参数的处理过程示意图; 
图4为本发明提供的装置实施例的结构示意图一; 
图5为本发明提供的装置实施例的结构示意图二。 
具体实施方式
本发明提供的实施例能够在发生帧错误时,对坏帧中的基音延迟参数进行替换,减少解码后语音质量的下降。而且,在出现连续坏帧,需要替换相应的基音延迟参数时,则将替换值设为在之前帧的基音延迟参数附近波动的值,使得其既可以在之前帧的基音延迟参数的基础上增加,也可以在之前帧的基音延迟参数的基础减小,从而减少基音延迟参数的积累误差,并可以避免过度周期性问题的出现。 
所述实施例可以应用于基于ACELP的语音解码器的帧错误隐藏的基音延迟参数替换处理过程中,也可以应用其他类似应用场景中。
下面首先对本发明提供的解码方法的实施例进行说明。在该实施例中,数据接收端的解码器需要接收编码端发来的数据帧,并在确定发生坏帧,则计算确定坏帧的基音延迟参数,之后,便可以根据计算确定的坏帧的基音延迟参数进行解码操作,以获得解码后的数据。 
在该实施例中,相应的确定坏帧的基音延迟参数的处理过程具体可以包括如下步骤: 
(1)确定发生的连续坏帧数量和之前帧的基音延迟参数; 
其中,所述的之前帧的基音延迟参数可以为基于当前坏帧的上一帧的基音延迟参数,或者,也可以为基于当前坏帧的上一好帧的基音延迟参数,或者,也可以为基于当前坏帧的其他设定的之前任意帧的基音延迟参数。 
(2)根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数; 
其中,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。 
具体一点讲,所述的预定的调整策略可以为: 
预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数值为随着连续坏帧数量的变化而在设定的数值范围内波动;所述的函数可以为仅基于连续坏帧数量作为变量的函数,且函数的计算结果需要再与之前帧的基音延迟参数进行计算(如求和等)确定当前坏帧的基音延迟参数;所述的参数也可以为基于连接坏帧数量及之前帧的基音延迟参数作为变量的函数,且函数的计算结果便为当前坏帧的基音延迟参数。 
此时,所述的计算获得当前坏帧的基音延迟参数的处理可以为:根据当前统计的连续坏帧数量值、所述基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。 
或者,所述的预定的调整策略还可以为:
预先建立一组调整参数值,所述调整参数值分别与连续坏帧数量取模运算后获得的值对应,所述调整参数值为在设定的数值范围内波动; 
此时,所述的计算获得当前坏帧的基音延迟参数的处理则可以为:对当前统计的连续坏帧数量值进行取模运算,并利用获得的值确定对应的调整参数值与之前帧的基音延迟参数的和作为当前坏帧的基音延迟参数。 
在本发明提供的实施例中,为避免计算获得的当前坏帧的基音延迟参数出现严重偏离实际值的情况,还可以在若确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围,则将该计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内,具体可以按照设定的调整方式进行调整。 
为便于对本发明提供的方法实施例有进一步的理解,下面将结合附图对所述实施例的具体应用进行说明。 
该实施例在具体应用过程中,相应的针对当前坏帧的基音延迟参数的替换更新实现方案如图2所示,具体包括: 
步骤201,统计连续坏帧的数目,假设采用变量bfi_count记录该连续坏帧的数目,当出现好帧时,则将bfi_count清零。 
步骤202,记录基于当前帧的上一帧的基音延迟参数,并采用变量old_T0记录上一帧基音延迟参数的整数部分; 
步骤203,当出现坏帧(如出现丢帧)时,则采用预先建立的函数调整所述上一帧基音延迟参数的整数部分,并将调整后的值作为当前坏帧的基音延迟参数的整数部分; 
所述预先建立的函数可以为:T0=old_T0+f(bfi_count); 
其中,T0是当前帧的基音延迟参数的整数部分,old_T0是上一帧基音延迟参数的整数部分,f(bfi_count)是关于连续坏帧数的调整函数,所述的f(bfi_count)需要随着连续坏帧数量的变化而在某一预定的数值范围内波动; 
例如,所述的连续坏帧数的函数可以为:
f ( bfi _ count ) = 1 , ( bfi _ count mod 4 ) = 1 - 2 , ( bfi _ count mod 4 ) = 2 - 1 , ( bfi _ count mod 4 ) = 3 2 , ( bfi _ count mod 4 ) = 0
可以看出,该函数能够保证在出现连续丢帧情况时,也不会造成基音延迟参数的积累误差; 
再例如,所述的f(bfi_count)还可以是随着bfi_count的变化而在0附近波动的函数,即f(bfi_count)既不是一个单调递增的函数,也不是一个单调递减的函数,这样,便可以避免导致积累误差随连续丢帧数量不断增大。 
步骤204,将步骤203计算获得的当前坏帧的基音延迟参数T0后,还需要对该T0进行范围判断,即判断该T0值是否在预定的数值范围内,若未处于该预定的数值范围内,则执行步骤205,否则,执行步骤206; 
步骤205,采用设定的调整方式对T0进行调整,将T0调整到该预定的数值范围内后输出作为当前坏帧的基音延迟参数; 
例如,所述的预定的数值范围为:基音延迟上限值PIT_MAX至基音延迟下限值PIT_MIN确定的数值范围,此时,相应的判断处理过程可以为: 
如果T0>PIT_MAX,则令T0=PIT_MAX,如果T0<PIT_MIN,则令T0=PIT_MIN。 
在上述处理过程中,还可以将当前帧的基音延迟的分数部分置零,即令T0_frac=0,T0_frac是当前帧的基音延迟的分数部分;或者,也可以将T0_frac设置为与上一帧的基音延迟参数的分数部分相同;或者,也可以设定为其他预定的数值,等等。 
步骤206,直接输出所述T0作为当前坏帧的基音延迟参数。 
在上述图2所示的处理过程中,需要统计连续坏帧的数目及保存上一帧的基音延迟参数,相应的处理过程具体如图3所示,包括: 
步骤301,接收编码端发送来的已编码的帧;
步骤302,判断是否出现坏帧,若出现坏帧,则执行步骤304,否则执行步骤303; 
步骤303,由于出现了好帧,故需要将连续坏帧数清零,并执行步骤306; 
步骤304,更新连续坏帧的数目,将当前坏帧的数值计入所述连续坏帧数目中,执行步骤305; 
步骤305,计算当前坏帧的基音延迟参数,并执行步骤306,具体的计算方式如前面针对图2的描述; 
步骤306,保存当前帧的基音延迟参数,以便于进行之后的坏帧的基音延迟参数计算时使用; 
其中,为避免第一帧便出现坏帧时因尚未保存之前帧的基音延迟参数而无法进行相应处理,则可以设置相应的基音延迟参数的初始值。 
本发明还提供了一种解码装置的实施例,该实施例的具体实现结构如图4和图5所示,在该装置中包括用于计算确定当前坏帧的基音延迟参数的基音延迟参数计算单元,该基音延迟参数计算单元用于将确定的基音延迟参数提供给解码处理实体,以用于进行解码操作。 
其中,所述的基音延迟参数计算单元具体可以包括: 
(1)基音延迟参数保存单元 
该单元用于保存已经接收的之前帧的基音延迟参数,并保存,以提供给参数获取单元;该单元具体保存的是预定的某一帧的基音延迟参数,例如,上一帧的基音延迟参数,或者,上一好帧的基音延迟参数,等等。 
(2)连续坏帧数记录单元 
该单元具体用于统计接收的数据帧中出现的连续坏帧的数量,并保存,以提供给参数获取单元。
(3)参数获取单元 
该单元具体用于获取确定发生的连续坏帧数量,以及之前帧的基音延迟参数;其中,所述的获取的之前帧的基音延迟参数可以为基于当前坏帧的上一帧的基音延迟参数,或者,预定的其他之前已经接收的某一帧的基音延迟参数。 
(4)基音延迟参数确定单元 
该单元具体用于根据参数获取单元确定的所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,从而计算获得当前坏帧的基音延迟参数,其中,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动,即随着连续坏帧数量的增加,当前坏帧的基音延迟参数时而增加时而减少,但需要保证其始终处于确定的范围内。 
(5)基音延迟参数调整单元 
该单元用于在确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围后,将计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内,从而避免确定的当前坏帧的基音延迟参数的较实际值产生较大的偏离。 
在该装置的实施例中,所述的基音延迟参数确定单元具体可以采用以下两种实现方式: 
实现方式一 
参照图4所示,所述的基音延迟参数确定单元具体可以包括函数调用单元和第一基音延迟参数计算单元,其中: 
所述的函数调用单元,用于调用预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数值为随着连续坏帧数量的变化而在设定的值范围内波动;其中,所述的函数可以为仅基于连续坏帧数量作为变量的函数,且函数的计算结果需要再与之前帧的基音延迟参数进行计算(如求和 等)确定当前坏帧的基音延迟参数;所述的参数也可以为基于连接坏帧数量及之前帧的基音延迟参数作为变量的函数,且函数的计算结果便为当前坏帧的基音延迟参数; 
所述的第一基音延迟参数计算单元,用于根据当前统计的连续坏帧数量值、函数调用单元调用的基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。 
实现方式二 
参照图5所示,在所述的基音延迟参数确定单元具体包括取模运算单元、调整参数计算单元和第二基音延迟参数计算单元,其中: 
所述的取模运算单元,用于对当前统计的连续坏帧数量值按照预定的运算方式进行取模运算,获得取模运算结果; 
所述的调整参数计算单元,用于根据取模运算结果在预先建立的一组调整参数值中查找与其对应的调整参数值,所述预先建立一组调整参数值分别与连续坏帧数量取模运算结果对应,且所述调整参数值为在设定的数值范围内波动,例如,在数值0附近波动,或者,在正负1之间波动,等等; 
所述的第二基音延迟参数计算单元,用于计算所述调整参数与之前帧的基音延迟参数的和,并作为当前坏帧的基音延迟参数。 
综上所述,本发明提供的各个实施例在具体应用过程中,若出现连续丢帧情况,需要替换相应帧的基音延迟参数时,则可以将相应的替换值设为在之前帧(如上一好帧等)的基音延迟参数附近波动的值。其与现有技术中提供的单调递增的替换算法相比,减少了积累误差,提高了解码的准确性。而且,在上述实施例中,由于对替换后的基音延迟参数为波动值,例如,其波动的幅度至少可以为1样点,因此,相应实施例还能够有效防止过度周期性的出现,从而可以有效避免解码后的语音出现尖锐噪声的情况。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (11)

1.一种语音解码方法,该方法包括接收编码端发来的数据帧,若发生坏帧,则计算确定坏帧的基音延迟参数,根据计算确定的坏帧的基音延迟参数进行解码操作,获得解码后的数据,其特征在于,所述确定坏帧的基音延迟参数的处理过程具体包括:
确定发生的连续坏帧数量和之前帧的基音延迟参数;
根据所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。
2.根据权利要求1所述的方法,其特征在于,所述的之前帧的基音延迟参数为基于当前坏帧的上一帧的基音延迟参数。
3.根据权利要求1所述的方法,其特征在于,所述的预定的调整策略包括:预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数的值为随着连续坏帧数量的变化而在设定的数值范围内波动;
且,所述的计算获得当前坏帧的基音延迟参数的处理具体包括:根据当前统计的连续坏帧数量值、所述基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。
4.根据权利要求1所述的方法,其特征在于,所述的预定的调整策略包括:预先建立一组调整参数值,所述一组调整参数值分别与连续坏帧数量取模运算后获得的值对应,所述一组调整参数值为在设定的数值范围内波动;
且,所述的计算获得当前坏帧的基音延迟参数的处理具体包括:对当前统计的连续坏帧数量值进行取模运算,并利用获得的值确定对应的调整参数值与之前帧的基音延迟参数的和作为当前坏帧的基音延迟参数。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述的方法还包括:
若确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围,则将该计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内。
6.一种语音解码装置,该装置中包括用于计算确定当前坏帧的基音延迟参数的基音延迟参数计算单元,该基音延迟参数计算单元用于将确定的基音延迟参数提供给解码处理实体,以用于进行解码操作,其特征在于,该基音延迟参数计算单元具体包括:
参数获取单元,用于获取确定发生的连续坏帧数量,以及之前帧的基音延迟参数;
基音延迟参数确定单元,用于根据参数获取单元确定的所述连续坏帧数量及预定的调整策略对所述之前帧的基音延迟参数进行调整,计算获得当前坏帧的基音延迟参数,所述的预定的调整策略为随着连续坏帧数量的变化确定的当前坏帧的基音延迟参数在设定的数值范围内波动。
7.根据权利要求6所述的装置,其特征在于,所述的参数获取单元获取的之前帧的基音延迟参数为基于当前坏帧的上一帧的基音延迟参数。
8.根据权利要求6所述的装置,其特征在于,所述的基音延迟参数确定单元具体包括:
函数调用单元,用于调用预先建立的以连续坏帧数量作为变量的基音延迟参数计算函数,且所述函数的值为随着连续坏帧数量的变化而在设定的数值范围内波动;
第一基音延迟参数计算单元:用于根据当前统计的连续坏帧数量值、函数调用单元调用的基音延迟参数计算函数及之前帧的基音延迟参数,计算确定当前坏帧的基音延迟参数。
9.根据权利要求6所述的装置,其特征在于,所述的基音延迟参数确定单元具体包括:
取模运算单元,用于对当前统计的连续坏帧数量值进行取模运算,获得取模运算结果;
调整参数计算单元,用于根据取模运算结果在预先建立的一组调整参数值中查找对应的调整参数值,所述预先建立的一组调整参数值分别与连续坏帧数量取模运算结果对应,且所述调整参数值为在设定的数值范围内波动;
第二基音延迟参数计算单元,用于计算所述调整参数值与之前帧的基音延迟参数的和,并作为当前坏帧的基音延迟参数。
10.根据权利要求6-9中任一所述的装置,其特征在于,所述的装置还包括基音延迟参数调整单元,用于在确定计算获得的当前坏帧的基音延迟参数超出预定的数值范围后,将计算获得的当前坏帧的基音延迟参数调整至所述预定的数值范围内。
11.根据权利要求6-9中任一所述的装置,其特征在于,所述的装置还包括:
基音延迟参数保存单元,用于保存已经接收的之前帧的基音延迟参数,以提供给参数获取单元;
连续坏帧数记录单元,用于统计接收的数据帧中出现的连续坏帧的数量,并保存,以提供给参数获取单元。
CN2007100011862A 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置 Active CN101226744B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN2007100011862A CN101226744B (zh) 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置
EP08700799A EP2081186B1 (en) 2007-01-19 2008-01-18 A method and apparatus for accomplishing speech decoding in a speech decoder
PCT/CN2008/070142 WO2008089696A1 (fr) 2007-01-19 2008-01-18 Procédé et dispositif destinés au décodage de la parole dans un décodeur de parole
DE602008001551T DE602008001551D1 (de) 2007-01-19 2008-01-18 Verfahren und vorrichtung zur erzielung einer sprachdekodierung in einem sprachdekodierer
AT08700799T ATE471556T1 (de) 2007-01-19 2008-01-18 Verfahren und vorrichtung zur erzielung einer sprachdekodierung in einem sprachdekodierer
US12/426,379 US8145480B2 (en) 2007-01-19 2009-04-20 Method and apparatus for implementing speech decoding in speech decoder field of the invention

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100011862A CN101226744B (zh) 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置

Publications (2)

Publication Number Publication Date
CN101226744A CN101226744A (zh) 2008-07-23
CN101226744B true CN101226744B (zh) 2011-04-13

Family

ID=39644136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100011862A Active CN101226744B (zh) 2007-01-19 2007-01-19 语音解码器中实现语音解码的方法及装置

Country Status (6)

Country Link
US (1) US8145480B2 (zh)
EP (1) EP2081186B1 (zh)
CN (1) CN101226744B (zh)
AT (1) ATE471556T1 (zh)
DE (1) DE602008001551D1 (zh)
WO (1) WO2008089696A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8145480B2 (en) 2007-01-19 2012-03-27 Huawei Technologies Co., Ltd. Method and apparatus for implementing speech decoding in speech decoder field of the invention

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9082416B2 (en) * 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US9111531B2 (en) * 2012-01-13 2015-08-18 Qualcomm Incorporated Multiple coding mode signal classification
KR102259112B1 (ko) * 2012-11-15 2021-05-31 가부시키가이샤 엔.티.티.도코모 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램
US20150100318A1 (en) * 2013-10-04 2015-04-09 Qualcomm Incorporated Systems and methods for mitigating speech signal quality degradation

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0747882A2 (en) * 1995-06-07 1996-12-11 AT&T IPM Corp. Pitch delay modification during frame erasures
CN1168751A (zh) * 1994-12-05 1997-12-24 诺基亚电信公司 数字通信系统中替代不良语音帧的方法
CN1272200A (zh) * 1998-05-27 2000-11-01 Ntt移动通信网株式会社 语音译码器和语音译码方法
CN1432175A (zh) * 2000-04-24 2003-07-23 高通股份有限公司 可变速率语音编码器中的帧擦除补偿方法
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
CN1489762A (zh) * 2000-10-31 2004-04-14 ��˹��ŵ�� 语音解码中语音帧差错隐蔽的方法和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2746033B2 (ja) * 1992-12-24 1998-04-28 日本電気株式会社 音声復号化装置
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
SE9500858L (sv) * 1995-03-10 1996-09-11 Ericsson Telefon Ab L M Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
JP4464488B2 (ja) * 1999-06-30 2010-05-19 パナソニック株式会社 音声復号化装置及び符号誤り補償方法、音声復号化方法
EP1221694B1 (en) * 1999-09-14 2006-07-19 Fujitsu Limited Voice encoder/decoder
US7031926B2 (en) * 2000-10-23 2006-04-18 Nokia Corporation Spectral parameter substitution for the frame error concealment in a speech decoder
US7590525B2 (en) * 2001-08-17 2009-09-15 Broadcom Corporation Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
US7788091B2 (en) * 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
US7457746B2 (en) * 2006-03-20 2008-11-25 Mindspeed Technologies, Inc. Pitch prediction for packet loss concealment
CN101226744B (zh) 2007-01-19 2011-04-13 华为技术有限公司 语音解码器中实现语音解码的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1168751A (zh) * 1994-12-05 1997-12-24 诺基亚电信公司 数字通信系统中替代不良语音帧的方法
EP0747882A2 (en) * 1995-06-07 1996-12-11 AT&T IPM Corp. Pitch delay modification during frame erasures
CN1272200A (zh) * 1998-05-27 2000-11-01 Ntt移动通信网株式会社 语音译码器和语音译码方法
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
CN1432175A (zh) * 2000-04-24 2003-07-23 高通股份有限公司 可变速率语音编码器中的帧擦除补偿方法
CN1489762A (zh) * 2000-10-31 2004-04-14 ��˹��ŵ�� 语音解码中语音帧差错隐蔽的方法和系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8145480B2 (en) 2007-01-19 2012-03-27 Huawei Technologies Co., Ltd. Method and apparatus for implementing speech decoding in speech decoder field of the invention

Also Published As

Publication number Publication date
US20090204396A1 (en) 2009-08-13
DE602008001551D1 (de) 2010-07-29
EP2081186A1 (en) 2009-07-22
US8145480B2 (en) 2012-03-27
WO2008089696A1 (fr) 2008-07-31
EP2081186B1 (en) 2010-06-16
CN101226744A (zh) 2008-07-23
ATE471556T1 (de) 2010-07-15
EP2081186A4 (en) 2009-09-23

Similar Documents

Publication Publication Date Title
EP2438701B1 (en) Systems and methods for preventing the loss of information within a speech frame
US7778824B2 (en) Device and method for frame lost concealment
US8102872B2 (en) Method for discontinuous transmission and accurate reproduction of background noise information
KR101290425B1 (ko) 소거된 스피치 프레임을 복원하는 시스템 및 방법
CN100588143C (zh) 可变速率接收机中速率误差检测的改进方法和设备
CN101226744B (zh) 语音解码器中实现语音解码的方法及装置
JP2000357999A (ja) 復号装置及び方法、並びにプログラム提供媒体
WO1999040573A1 (fr) Procede de decodage d&#39;un signal audio avec correction des erreurs de transmission
US20200227061A1 (en) Signal codec device and method in communication system
US6327562B1 (en) Method and device for coding an audio signal by “forward” and “backward” LPC analysis
US20090043567A1 (en) Variable frame offset coding
EP2127088B1 (en) Audio quantization
EP2211338A1 (en) Transcoding method, transcoding device and communication apparatus
CN103456307A (zh) 音频解码器中帧差错隐藏的谱代替方法及系统
CN101399040A (zh) 一种帧错误隐藏的谱参数替换方法
EP3292674B1 (en) Voice quality monitoring system
CN101895373A (zh) 信道译码方法、系统及装置
KR20130116897A (ko) 예측 인코딩을 위한 인코더 및 방법, 디코딩을 위한 디코더 및 방법, 예측 인코딩 및 디코딩을 위한 시스템 및 방법, 및 예측 인코딩된 정보 신호
Tan et al. A subvector-based error concealment algorithm for speech recognition over mobile networks
US20100185441A1 (en) Error Concealment
EP2200025A1 (en) Bandwidth scalable codec and control method thereof
CN108364657B (zh) 处理丢失帧的方法和解码器
CN113936669A (zh) 数据传输方法、系统、装置、计算机可读存储介质及设备
CN100349395C (zh) 用于语音帧误差降低的语音通信单元和方法
Korhonen et al. Schemes for error resilient streaming of perceptually coded audio

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant