CN1120471C - 语音编码 - Google Patents

语音编码 Download PDF

Info

Publication number
CN1120471C
CN1120471C CN98804901A CN98804901A CN1120471C CN 1120471 C CN1120471 C CN 1120471C CN 98804901 A CN98804901 A CN 98804901A CN 98804901 A CN98804901 A CN 98804901A CN 1120471 C CN1120471 C CN 1120471C
Authority
CN
China
Prior art keywords
frame
weighting
delay
function
unvoiced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN98804901A
Other languages
English (en)
Other versions
CN1255226A (zh
Inventor
A·拉卡尼米
J·瓦伊尼奥
P·奥亚拉
P·哈尔维斯托
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Nokia Technologies Oy
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from FI971976A external-priority patent/FI971976A/fi
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of CN1255226A publication Critical patent/CN1255226A/zh
Application granted granted Critical
Publication of CN1120471C publication Critical patent/CN1120471C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/725Cordless telephones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种使用长时预测(LTP)对采样语音信号进行编码的语音编码方法。通过为信号帧确定预定最大和最小延迟之间的自相关函数,可以为语音信号的每一帧确定LTP音调滞后值参数。然后,自相关函数被加权来加强为最近的浊音帧确定的音调滞后值参数邻近区域中的延迟函数。然后会找到加权自相关函数的最大值,并且该值被识别为该帧的音调滞后值参数。

Description

语音编码
该发明涉及语音编码,并特别适用于采用长时预测(LTP)参数的语音编码方法和装置。
语音编码被用于很多希望压缩音频语音信号以降低将要发送、处理或贮存的数据量的通讯应用中。特别的,语音编码广泛应用于蜂窝电话网络。其中移动电话和通讯控制基站配有所谓音频编解码器,该编解码器对音频信号进行编码和解码。由于最大化网络呼叫容量的需要,必须在蜂窝电话网中对数据进行语音编码压缩。
现代的语音编解码器一般通过在称为帧的短片段中处理语音来工作。在被称作GSM(由欧洲通讯标准研究所----ETSI----细则06.60定义)的欧洲数字蜂窝电话系统中,这种帧的长度为20毫秒,对应于8KHZ采样率下160个语音样本。在发送站,由语音编码器来分析每个语音帧以提取一组编码参数用来发送给接收站。在接收站,基于接收的参数,解码器产生合成的语音帧。典型的所提取的编码参数组包括用于信号短时预测的谱参数(已知为LPC参数),和用于信号长时预测(已知为LTP参数)的参数,各种增益参数,激励参数和码书矢量。
图1简要给出了所谓的CELP编解码器中的编码器(在移动站和控制基站中都提供有基本上相同的CELP编解码器)每个接收到的采样语音信号s(n)的帧,其中n表示采样编号,首先被短时预测单元1分析以确定该帧的LPC参数,这些参数被提供给复用器2以组合通过空气接口传送的编码参数。来自短时预测单元1的残留信号r(n),即,除去短时冗余后的语音信号帧,被传送给长时预测单元3来确定LTP参数,这些参数又被提供给复用器2。
编码器包括一个LTP合成滤波器4和一个LPC合成滤波器5,分别接收LTP和LPC参数,这些滤波器为信号c(n)引入短时和长时冗余以产生给成的语音信号ss(n),其中的冗余是通过码书6产生的。在比较器7,合成的语音信号与实际的语音信号s(n)一帧一帧的相比,以产生误差信号e(n)。在加权滤波器8对误差信号加权之后(以已知的方法加强信号的共振峰),信号被传送给码书搜索单元9,搜索单元9在码书6中为每一帧进行搜索以识别出与实际语音帧最匹配的码书中的记录(在LPT和LPC滤波,以及在乘法器10中乘以增益g之后),即确定最小化误差信号e(n)的信号c(n),表明最佳匹配记录的矢量被提供给复用器2以便作为语音编码信号t(n)的一部分通过空气接口传送。
图2简要给出一种CELP编解码器中的解码器。接收到的编码信号t(n)被解复用器11解复用成单个的编码参数。码书矢量被用于码书12,与编码器中的码书6相同,以提取码书记录c(n)的流,然后再将信号施加给串行放置的LTP合成滤波器14和LPC合成滤波器15之前,信号c(n)在乘法器13中被乘以接收增益g。LTP和LPC滤波器从传输信道接收相关的参数并在信号中重新引入短时和长时冗余以在输出处产生合成的语音信号ss(n)。
LTP参数已包括所谓的音调滞后值参数,该参数描述语音信号的基础频率。残留信号当前帧音调滞后值的确定通过两个步骤实现。首先,进行开环搜索,涉及对残留信号相对粗略的搜索,受限于预定的最大和最小延迟,以找到对一部分与当前帧最匹配的信号。然后对已经合成的信号进行闭环搜索。闭环搜索在音调滞后值的开环估计值邻近区域中小范围延迟内进行。重要的是,如果在开环搜索中发生了错误,那么在闭环搜索中不能校正该错误。
在早期已知的编解码器中,通过确定残留语音信号中帧的自相关函数,开环LTP分析可以为残留信号的给定帧确定音调滞后值,即: R ^ ( d ) = Σ n = 0 N - 1 r ( n - d ) r ( n ) - - - d = d L , . . . , d H
其中d是延迟,r(n)是残留信号,dL和dH是搜索边界,N是帧长度,音调滞后值dpl可以被识别为延迟dmax,该值对应于自相关函数的最大值,这一点在图3中给予说明。
然而在这种编解码器中,存在一种可能是,自相关函数的最大值对应于多个或亚多个(submultiple)音调滞后值值,并且因此估计的音调滞后值将不正确。EP0628947通过对自相关函数 施加一个加权函数w(d)来解决这一问题。即: R ^ w ( d ) = w ( d ) Σ n = 0 N - 1 r ( n - d ) r ( n ) 其中加权函数具有下述形式: w ( d ) = d log 2 K K是一个调整参数,该参数被设置为一个足够低的值以降低在多个音调滞后值上获得
Figure C9880490100072
的最大值的可能性,但是同时,该值被设置的足够大以排除亚多个音调滞后值。
EP0628947还建议在为当前帧确定音调滞后值时考虑为以前帧确定的音调滞后值。更特别的是,帧被分类为浊音或清音,对于当前帧,会在为最近的浊音帧确定的音调滞后值的邻近区域搜索最大值。如果
Figure C9880490100073
的所有最大值都位于该邻近区域之外,并且不超过该邻近区域中最大值的3/2,那么该邻近区域的最大值被识别为对应于该音调滞后值。用这种方法,可以保持音调滞后值估计的连续性,降低音调滞后值中错误变化的可能性。
EP0745971描述了一种估计输入语音的音调滞后值的方法。在该方法中,输入语音的LPC残留由第一傅立叶变换来处理以便产生频域信号,然后该信号被第二傅立叶变换平方并转换到另一个域。这样,音调滞后的初始估计值可以得到。然后在初始估计值的邻近区域中进行时域搜索以产生音调滞后值的精确估计值。
US 5327520描述了一种码激励线性预测编码器,该编码器对LPC残留信号进行音调滞后搜索。该信号被进行低通滤波,并以因子4进行欠采样以产生经过抽取的LPC残留样本。经过抽取的LPC残留样本被进行交叉相关以获得音调滞后的初始估计值。另外在初始估计值的邻近区域对未抽取的LPC残留信号进行进一步的交叉相关以获得音调滞后更精确的估计值。
根据该发明的第一方面,给出了一种对于信号帧序列中每一帧利用音调滞后值参数对采样信号进行编码的语音编码算法,该方法包括对于每一帧:
为信号帧确定预定最大延迟和最小延迟之间的自相关函数;
对自相关函数加权以加强为以前帧确定的音调滞后值参数邻近区域中的延迟函数;
将对应于加权自相关函数最大值的延迟识别为该帧的音调滞后值参数。
最好的是,所述的采样信号是通过从音频信号中主要除去短时冗余而从音频信号获得的残留信号,另外可选的是,采样信号可以是一种音频信号。
最好的是,所述的加权通过将自相关函数与具有以下形式的加权函数组合来实现: w ( d ) = ( | T prev - d | + d L ) log 2 K nw 其中,Tprev是在一个或多个以前帧的基础上确定的音调滞后值参数,dL是所述的最小延迟,Knw是定义邻近区域加权的调整参数。另外,相对于较长的延迟,加权函数可以为较短的延迟来加强自相关函数。在这种情况下,使用了一种修正的加权函数: w ( d ) = ( | T prev - d | + d L ) log 2 K nw . d log 2 K w 其中Kw是另一个调整参数。
在本发明的某种实施方案中,Tprev是一个以前帧的音调滞后值Told。然而,在另一个实施方案中,Tprev是从一些以前帧的音调滞后值中获得。特别的,Tprev可以对应于预定数量的以前帧的音调滞后值的中值。可以使用另一种加权,这种加权与用来确定所述中值的n个音调滞后值的标准偏差成反比。使用后一方法,有可能降低错误音调滞后值对自相关函数加权的影响。
最好的是,该方法包括将所述帧划分成浊音和非浊音帧,其中所述的以前帧是最近的浊音帧,非浊音帧可以包括清音帧、包括无声段或背景噪声的帧。更好的是,如果所述的以前帧不是最近的帧,加权作用被削弱。在一个实施方案中,接收到连续的非浊音帧序列,加权作用的削弱基本上与该序列中的帧数成正比。对于在前一段给出的加权函数wn(d),调整参数Knw可以被修正为: w d ( d ) = ( | T prev - d | + d L ) log 2 K nw A . d log 2 K w 其中A是另一个调整因子,该因子随着连续非浊音帧序列中每一帧的接收而增长。通过将A返回为最小值,加权值对于下一个浊音帧而言恢复到其最大值。A值同样可以随着浊音帧的接收而增加,这产生一个开环增益,该增益小于预定的阈值增益。
根据该发明的第二个方面,提供了一种利用信号串形帧中每一帧的音调滞后值参数对采样信号进行语音编码的装置,该装置包括:
为每一帧确定信号帧在预定最大延迟和最小延迟之间的自相关函数的装置。
用来将自相关函数加权以加强为以前帧确定的音调滞后值参数邻近区域中的延迟函数的加权装置,以及
用来将对应于加权自相关函数最大值的延迟标识为该帧的音调滞后值参数的装置。
根据该发明的第三方面,给出了一种移动通讯设备包括上面该发明第二方面中的装置。
根据该发明的第四方面,给出了一种蜂窝电话网络,包括一个控制基站,该基站具有根据该发明第二方面的装置。
为了更好地理解该发明,并表示出同样的方法如何起作用,通过例子,将引用附图作为参考。其中:
图1简要给出一种CELP语音编码器。
图2简要给出一种CELP语音解码器。
图3说明了要被编码的语音信号帧,以及用来确定该帧的自相关函数的最大和最小延迟。
图4是根据该发明实施方案的语音编码方法主要步骤的流程图。
图5简略给出实现图4方法的系统。
这里将要描述一种用于采样语音信号帧的音调滞后值参数的开环预测的方法和装置。该方法的主要步骤在图4的流程图中给出。较好的是,所描述的方法和装置可以用于其它的传统语音编解码器,例如上面已参考图1描述的CELP编解码器。
将要被编码的采样语音信号被划分成固定长度的帧。如上面描述的,接收时,帧首先被传送给LPC预测单元1。一般地,会对残留信号进行开环LTP预测,该残留信号是原始语音信号的一部分,这部分信号在施加了LPC预测之后仍然保留,但是该信号的短时冗余被提取。该残留信号可以由r(n)表示,其中n表示采样编号。信号帧的自相关函数由以下公式确定 R ^ w ( d ) = w ( d ) Σ n = 0 N - 1 r ( n - d ) r ( n ) - - - d = d L , . . . , d H - - - { 1 } 其中w(d)是由以下公式给出的加权函数 w ( d ) = ( | T old - d | + d L ) log 2 K nw A . d log 2 K w - - - { 2 } Told是为最近接收、处理的浊音帧确定的音调滞后值,n,N,dL,dH与上面定义相同。Knw和K是调整参数,一般为0.85,另一个调整参数A在下面讨论。
在为语音帧确定了开环LTP参数之后,该帧被分类为浊音和清音帧(使得参数Told能够反馈用于等式{2})。这种分类可以用多种方法实现。一种合适的方法是确定开环LTP增益b,并将该值与一些预定的阈值增益比较,或者更理想地是有下面公式给出的自适应阈值增益bthr
bthr=(1-α)Kbb+abthr-1  {3}
其中α是衰减常数(0.995),Kb是缩放因子(0.15)。项bthr-1是为刚刚接收的前一帧确定的阈值增益。另外,用于划分帧为浊音或清音的准则是确定一帧内残留信号的过零率。相对较高的过零率表明该帧为清音帧,而相对较低的过零率表明该帧为浊音帧,适当的阈值为帧长N的3/4。
另一个将帧划分为浊音和清音的准则是考虑音调滞后值的变化率。如果为该帧确定的音调滞后值严重偏离为最近一组帧确定的平均音调滞后值,那麽该帧可以被分类为清音帧。如果仅存在相对较小的偏差,那麽该帧可以被划分成浊音帧。
由{2}给出的加权函数wn(d)包括第一项 ( | T old - d | + d L ) log 2 K nw A ,该项使得加权后的自相关函数 在老的音调滞后值Told的邻近区域被加强。等式{2}的左边的第二项 ,使得较小的音调滞后值被加强。这两项合起来明显降低了产生加权自相关函数最大值的多个或亚多个正确音调滞后值的可能性。
如果,在为当前帧i确定了音调滞后值之后,该帧被分类为浊音帧,并且该帧的开环增益被确定为大于一些阈值(例如0.4〕,那么等式{2}中的调整因子A对于下一帧i+1而言设置为1。如果当前帧被分类为清音帧,或者开环增益被确定为小于该阈值,调整因子按下述等式修正
Ai+1=1.01Ai    {4}
可以根据等式{4}针对连续清音帧序列中的每一帧来修正调整因子A(或者开环增益小于阈值的浊音帧〕。但是,最好的是,仅在预定数量的连续清音帧被接收之后,才应用等式{4},例如,在每一组3个连续清音帧被接收之后。邻近区域的加权因子Knw一般被设置为0.85,而组合加权参数KnwA的上限为1.0,使得在该限制之内,在整个延迟范围d=dL到dH内,加权可以保持一致。
此外,只有预定数量的加权函数w(d)被使用,例如为3个。每个函数都分配有一个阈值等级。每个函数都有一个阈值,当自适应项,例如在{4}中定义的项超过了该阈值,那麽一个特定的函数被选出。定义有限数量加权函数的优点在于所定义的函数可以存储于内存之中。因此,为每一个新帧重新计算一个加权函数是不必要的。
用于实现上面描述的方法的一个简化系统在图5中给出,系统的输入16是LPC预测单元1给出的残留信号。该残留信号被提供给帧校正器17,该校正器为残留信号的每一帧产生一个相关函数。每一帧的相关函数被传送给第一加权单元18,该单元根据等式{2}中的第二项来加权该相关函数,即
Figure C9880490100121
。加权后的函数然后被传送给第二加权单元19,该单元另外根据等式{2}的第一项来加权相关函数, ( | T old - d | + d L ) log 2 K nw A 。参数Told保持在缓存器20中,仅在分类单元21将当前帧分类为浊音帧时,该参数才被利用系统输出而更新。加权的相关函数被传送给搜索单元22,该单元识别出加权函数的最大值,并因而确定当前帧的音调滞后值。
技术人员将会建议在不偏离该发明的范围的前提下,可以对上面描述的实施方案做各种修改。特别是,为了防止为最近的浊音帧得到的错误的音调滞后估计值,并且很大程度上干扰当前估计值,图5中的缓存器20可以被安排为存储为最近的n个浊音帧估计的音调滞后值,其中n可以是,例如4。由加权单元19施加的加权函数通过将参数Told替换为Tmed而被修正,其中Tmed是n个被缓存的音调滞后值的中值。
在另一种修正中,加权单元19施加的加权与存储在缓存器20中的n个音调滞后值的标准偏差成反比。当n个被缓存的音调滞后值变化很小时,其效果是加强了中值音调滞后值邻近区域中的加权,而当n个音调滞后值相对变化较大时,其效果是削弱了中值音调滞后值邻近区域中的加权。例如,可以按下面的形式采用三个加权函数:
Figure C9880490100123
其中Km1,Km2,Th1,Th2是分别等于0.75,0.95,2和6的调整参数。为了适应在大的音调滞后值时标准偏差中较大的变化,等式{5}中的阈值Th1,Th2可以与中值音调滞后值Tmed成正比。

Claims (16)

1.一种利用信号帧序列中每一帧的音调滞后值参数对采样信号进行编码的语音编码方法,对于每一帧,该方法包括:
为信号帧确定预定最大延迟和最小延迟之间的自相关函数;
对自相关函数加权以加强为以前帧确定的音调滞后值参数邻近区域中的延迟函数;以及
将对应于加权自相关函数最大值的延迟识别为该帧的音调滞后值参数。
2.根据权利要求1的方法,其中的加权函数具有以下形式: w d ( d ) = ( | T old - d | + d L ) log 2 K nw
其中wd(d)是加权函数,d是延迟,Told是所述以前帧的音调滞后值,dL是所述的最小延迟,Knw是定义邻近区域加权的调整参数。
3.根据权利要求1的方法,其中的自相关函数被加权以为各个以前帧确定的多个音调滞后值中值的邻近区域内的延迟函数。
4.根据权利要求3的方法,其中的加权函数具有以下形式: w d ( d ) = ( | T med - d | + d L ) log 2 K nw
其中wd(d)是加权函数,d是延迟,Tmed是各个以前帧确定的多个音调滞后值的中值,dL是所述的最小延迟,Knw是定义邻近区域加权的调整参数。
5.根据权利要求4的方法,其中的加权函数通过与所述多个音调滞后值的标准偏差成反比的因子来修正。
6.根据前面任何一个权利要求的方法,其中所述的加权相对于较长的延迟额外加强了较短的延迟。
7.根据权利要求4的方法,其中所述的加强由下面因子提供: d log 2 K w
其中Kw是另一个加权参数。
8.根据权利要求1的方法,包括将所述帧分类成浊音帧和清音帧的步骤,其中的以前帧是最近的浊音帧。
9.根据权利要求8的方法,其中,如果所述的以前帧或最近的以前帧,不是最近的帧,加权被削弱。
10.根据权利要求8的方法,其中,当连续非浊音帧的序列被接收到之后,加权被削弱,这种削弱与该序列中的帧数成正比。
11.根据权利要求9的方法,其中,当连续非浊音帧的序列被接收到之后,加权被削弱,这种削弱与该序列中的帧数成正比。
12.根据权利要求2的方法,包括将所述帧分成浊音帧和非浊音帧,其中所述以前帧是最近的浊音帧,其中调整参数被修正为:log2KnwA
其中A是另一个调整因子,该因子随着连续非浊音帧序列中每一帧或预定的多个帧的接收而增长,并且该值对于下一个浊音帧而言恢复到其最小值。
13.根据权利要求4的方法,包括将所述帧分成浊音帧和非浊音帧,其中所述以前帧是最近的浊音帧,其中调整参数被修正为:log2KnwA
其中A是另一个调整因子,该因子随着连续非浊音帧序列中每一帧或预定的多个帧的接收而增长,并且该值对于下一个浊音帧而言恢复到其最小值。
14.一种利用信号串形帧中每一帧的音调滞后值参数对采样信号进行语音编码的装置,该装置包括:
为每一帧确定信号帧在预定最大延迟和最小延迟之间的自相关函数的装置(17);
用来将自相关函数加权以加强为以前帧确定的音调滞后值参数邻近区域中的延迟函数的加权装置(19);以及
用来将对应于加权自相关函数最大值的延迟标识为该帧的音调滞后值参数的装置(22)。
15.一种移动通讯设备,包括一种利用信号串形帧中每一帧的音调滞后值参数对采样信号进行语音编码的装置,该装置包括:
为每一帧确定信号帧在预定最大延迟和最小延迟之间的自相关函数的装置(17);
用来将自相关函数加权以加强为以前帧确定的音调滞后值参数邻近区域中的延迟函数的加权装置(19);以及
用来将对应于加权自相关函数最大值的延迟标识为该帧的音调滞后值参数的装置(22)。
16.一种包括控制基站的蜂窝电话网络,其中的控制基站包括一种利用信号串形帧中每一帧的音调滞后值参数对采样信号进行语音编码的装置,该装置包括:
为每一帧确定信号帧在预定最大延迟和最小延迟之间的自相关函数的装置(17);
用来将自相关函数加权以加强为以前帧确定的音调滞后值参数邻近区域中的延迟函数的加权装置(19);以及
用来将对应于加权自相关函数最大值的延迟标识为该帧的音调滞后值参数的装置(22)。
CN98804901A 1997-05-07 1998-03-13 语音编码 Expired - Lifetime CN1120471C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FI971976 1997-05-07
FI971976A FI971976A (fi) 1997-05-07 1997-05-07 Puhekoodaus
FI980502A FI113903B (fi) 1997-05-07 1998-03-05 Puheen koodaus
FI980502 1998-03-05

Publications (2)

Publication Number Publication Date
CN1255226A CN1255226A (zh) 2000-05-31
CN1120471C true CN1120471C (zh) 2003-09-03

Family

ID=26160386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN98804901A Expired - Lifetime CN1120471C (zh) 1997-05-07 1998-03-13 语音编码

Country Status (10)

Country Link
US (1) US6199035B1 (zh)
EP (1) EP0877355B1 (zh)
JP (3) JPH1124699A (zh)
KR (2) KR100653926B1 (zh)
CN (1) CN1120471C (zh)
AU (1) AU739238B2 (zh)
DE (1) DE69814517T2 (zh)
ES (1) ES2198615T3 (zh)
FI (1) FI113903B (zh)
WO (1) WO1998050910A1 (zh)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6415252B1 (en) * 1998-05-28 2002-07-02 Motorola, Inc. Method and apparatus for coding and decoding speech
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6507814B1 (en) 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
JP3180786B2 (ja) * 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7124075B2 (en) * 2001-10-26 2006-10-17 Dmitry Edward Terez Methods and apparatus for pitch determination
KR100463417B1 (ko) * 2002-10-10 2004-12-23 한국전자통신연구원 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7725315B2 (en) * 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US7895036B2 (en) * 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
TWI241557B (en) * 2003-07-21 2005-10-11 Ali Corp Method for estimating a pitch estimation of the speech signals
JP4490090B2 (ja) 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
US7949520B2 (en) 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8170879B2 (en) * 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
US7386445B2 (en) * 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
US8027833B2 (en) 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
DE602006015712D1 (de) * 2006-03-20 2010-09-02 Mindspeed Tech Inc Tonhöhen-track-glättung in offener schleife
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8010350B2 (en) * 2006-08-03 2011-08-30 Broadcom Corporation Decimated bisectional pitch refinement
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US8386246B2 (en) * 2007-06-27 2013-02-26 Broadcom Corporation Low-complexity frame erasure concealment
US8904400B2 (en) * 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8209514B2 (en) * 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
GB2466670B (en) 2009-01-06 2012-11-14 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466672B (en) 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
CN102016530B (zh) * 2009-02-13 2012-11-14 华为技术有限公司 一种基音周期检测方法和装置
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
US9437213B2 (en) 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
US9020818B2 (en) * 2012-03-05 2015-04-28 Malaspina Labs (Barbados) Inc. Format based speech reconstruction from noisy signals
US9384759B2 (en) 2012-03-05 2016-07-05 Malaspina Labs (Barbados) Inc. Voice activity detection and pitch estimation
US9123328B2 (en) * 2012-09-26 2015-09-01 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
CN105378836B (zh) * 2013-07-18 2019-03-29 日本电信电话株式会社 线性预测分析装置、方法、以及记录介质
US9626986B2 (en) 2013-12-19 2017-04-18 Telefonaktiebolaget Lm Ericsson (Publ) Estimation of background noise in audio signals

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4486900A (en) 1982-03-30 1984-12-04 At&T Bell Laboratories Real time pitch detection by stream processing
JP2585214B2 (ja) * 1986-02-21 1997-02-26 株式会社日立製作所 ピッチ抽出方法
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
JPH04264600A (ja) * 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
US5179594A (en) * 1991-06-12 1993-01-12 Motorola, Inc. Efficient calculation of autocorrelation coefficients for CELP vocoder adaptive codebook
US5339384A (en) * 1992-02-18 1994-08-16 At&T Bell Laboratories Code-excited linear predictive coding with low delay for speech or audio signals
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
US5327520A (en) * 1992-06-04 1994-07-05 At&T Bell Laboratories Method of use of voice message coder/decoder
FI91345C (fi) 1992-06-24 1994-06-10 Nokia Mobile Phones Ltd Menetelmä kanavanvaihdon tehostamiseksi
CA2102080C (en) * 1992-12-14 1998-07-28 Willem Bastiaan Kleijn Time shifting for generalized analysis-by-synthesis coding
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
JP3321933B2 (ja) * 1993-10-19 2002-09-09 ソニー株式会社 ピッチ検出方法
US5517595A (en) * 1994-02-08 1996-05-14 At&T Corp. Decomposition in noise and periodic signal waveforms in waveform interpolation
FI98163C (fi) 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
JP3418005B2 (ja) * 1994-08-04 2003-06-16 富士通株式会社 音声ピッチ検出装置
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
US5664053A (en) 1995-04-03 1997-09-02 Universite De Sherbrooke Predictive split-matrix quantization of spectral parameters for efficient coding of speech
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures

Also Published As

Publication number Publication date
ES2198615T3 (es) 2004-02-01
KR100653932B1 (ko) 2006-12-04
EP0877355B1 (en) 2003-05-14
KR100653926B1 (ko) 2006-12-05
JP2004038211A (ja) 2004-02-05
JP2009223326A (ja) 2009-10-01
FI113903B (fi) 2004-06-30
KR20010006394A (ko) 2001-01-26
CN1255226A (zh) 2000-05-31
DE69814517T2 (de) 2004-04-08
WO1998050910A1 (en) 1998-11-12
EP0877355A3 (en) 1999-06-16
EP0877355A2 (en) 1998-11-11
FI980502A (fi) 1998-11-08
AU6403298A (en) 1998-11-27
AU739238B2 (en) 2001-10-04
FI980502A0 (fi) 1998-03-05
KR20040037265A (ko) 2004-05-04
JP4866438B2 (ja) 2012-02-01
DE69814517D1 (de) 2003-06-18
JPH1124699A (ja) 1999-01-29
US6199035B1 (en) 2001-03-06

Similar Documents

Publication Publication Date Title
CN1120471C (zh) 语音编码
EP1202251B1 (en) Transcoder for prevention of tandem coding of speech
US6202046B1 (en) Background noise/speech classification method
DE60024123T2 (de) Lpc-harmonischer sprachkodierer mit überrahmenformat
DE60027573T2 (de) Quantisierung der spektralen amplitude in einem sprachkodierer
KR100391527B1 (ko) 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템
KR100487943B1 (ko) 음성 코딩
CN102122511B (zh) 一种信号处理方法、处理装置以及语音解码器
DE60017763T2 (de) Verfahren und vorrichtung zur erhaltung einer ziel-bitrate in einem sprachkodierer
US20100010810A1 (en) Post filter and filtering method
EP1881488B1 (en) Encoder, decoder, and their methods
US7590532B2 (en) Voice code conversion method and apparatus
EP0501421B1 (en) Speech coding system
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
DE60027012T2 (de) Verfahren und vorrichtung zur verschachtelung der quantisierungsverfahren der spektralen frequenzlinien in einem sprachkodierer
US20040030548A1 (en) Bandwidth-adaptive quantization
JP3357795B2 (ja) 音声符号化方法および装置
EP1301018A1 (en) Apparatus and method for modifying a digital signal in the coded domain
US6205423B1 (en) Method for coding speech containing noise-like speech periods and/or having background noise
US7254534B2 (en) Method and device for encoding wideband speech
Bhatt Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
Shevchuk et al. Method of converting speech codec formats between GSM 06.20 and G. 729

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20170118

Address after: Espoo, Finland

Patentee after: NOKIA TECHNOLOGIES OY

Address before: Espoo, Finland

Patentee before: Nokia Corp.

Effective date of registration: 20170118

Address after: Espoo, Finland

Patentee after: NOKIA Corp.

Address before: Espoo, Finland

Patentee before: Nokia Mobile Phones Ltd.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20030903