CN101286319B - 改进语音丢包修补质量的语音编码方法 - Google Patents

改进语音丢包修补质量的语音编码方法 Download PDF

Info

Publication number
CN101286319B
CN101286319B CN2007101942772A CN200710194277A CN101286319B CN 101286319 B CN101286319 B CN 101286319B CN 2007101942772 A CN2007101942772 A CN 2007101942772A CN 200710194277 A CN200710194277 A CN 200710194277A CN 101286319 B CN101286319 B CN 101286319B
Authority
CN
China
Prior art keywords
pitch period
gain
frame
pitch
subframe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007101942772A
Other languages
English (en)
Other versions
CN101286319A (zh
Inventor
高扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310236667.7A priority Critical patent/CN103383846B/zh
Publication of CN101286319A publication Critical patent/CN101286319A/zh
Application granted granted Critical
Publication of CN101286319B publication Critical patent/CN101286319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明的改进语音丢包修补质量的语音编码系统,是一个能有效地降低因语音包丢失而产生的错误传播,本方法仍然受益于基音周期的长项预测;它通过适当限制每帧内第一个基音周期的最大周期增益值来实现。语音编解码系统对语音信号进行编解码;语音信号分为很多个帧,而每帧又有多个语音基音周期;根据帧内第一个基音周期是否占有一个子帧或多个子帧来对每一帧分为不同的类。当子帧覆盖第一个基音周期时,该子帧的基音周期增益被限制为小于1的一个适当值;为补偿这个较低的周期增益值,对这个子帧,适当增大激励码本的大小或者再加一级编码激励。具有构思巧妙、方法合理、保真度效果明显等优点。

Description

改进语音丢包修补质量的语音编码方法
技术领域
本发明属于信号编码领域。具体讲是语音编码领域;尤其是专为改进在语音包传输时丢包后性能的补偿。 
背景技术
传统来讲,所有的参数化语音编码方法常常都是利用语音信号本身的冗余,来减少必须传输的信息量,并估算语音信号短时段内的参数。这种冗余首先起因于语音波形周期性的重复和频谱包络慢变过程。 
不同形式语音波形的冗余对应于不同类型的语音信号,如浊声和清声。就浊声语音而言,语音信号基本上是周期性的;然而,这种周期性在语音段中是变化的,且周期波形在语音段之间缓慢变化。低比特率的语音编码可以很大地受益于这种周期性。浊声周期称为基音周期(pitch),这种基音周期性预测被命名为长项预测。至于清音,其信号更像一个随机噪声,周期性也较小。 
在任何情况下,参数编码通过分割频谱包络和语音段的激励来减少语音段的冗余。频谱包络慢变过程被描述成线性预测(也称作短项预测)。低比特率的语音编码也同样受益于短项预测。这种编码的优点就来自于参数的慢速变化。然而,在几毫秒内这些参数值有很大变化的可能性很小。因此,在8k Hz或16k Hz采样时,语音编码算法是将10~30毫秒语音段作为一帧。而20毫秒是最常用的帧长。在较近期的知名国际标准中,诸如G.723、G.729、EFR、AMR,编码激励线性预测技术(CELP)已经被广泛采用;通常编码激励线性预测技术(CELP)被理解为是编码激励、长项预测和短项预测各技术的综合。利用编码激励线性预测技术(CELP)的语音编码算法在语音压缩领域已经相当流行。 
图1显示CELP初始语音编码器,利用综合分析法,综合语音102和原始语音101之间的加权误差109被减到最小,即最小化113。W(z)是加权滤波器110。它对误差信号111进行加权滤波处理。1/B(z)是长项预测滤波器105,1/A(z)是短项预测滤波器,标为103。编码激励108,又被称作固化码本(fixed codebook)激励,在通过线性滤波器前乘于增益Gc(标为106)。短项预测线性滤波(标为103)通过分析原始信号101完成,并由一个线性预测系数集合表示: 
A ( z ) = Σ i = 1 P 1 + a i · z - i , i = 1,2 , . . . . , P - - - ( 1 )
加权滤波器(110)涉及和用到上面的短项预测滤波。一个典型的加权滤波器可表示为: 
W ( z ) = A ( z / α ) A ( z / β ) , - - - ( 2 )
其中β<α,0<β<1,0<α≤1。长项预测(105)取决于基音周期和基音周期增益;对基音周期的估计基于原始信号、残留信号或者加权原始信号。长项预测函数可表示为: 
B(z)=1-β·z-Pitch    (3) 
编码激励(108)通常由类似脉冲的信号或类似噪音的信号构成,这些信号可用数学方法实时产生或者存到码本中。最后,将编码激励指数,量化的增益指数,量化的长项预测参数指数和量化的短项预测参数指数传到解码器中。 
图2显示初始的语音解码器,在综合语音后添加后处理单元207。解码器由编码激励201、长项预测203、短项预测205、后期处理207等几个单元组成。除后期处理单元,其它都和图1中的编码器定义相同。后期处理单元由短项后期处理和长项后期处理组成。 
图3显示基本的CELP编码器。它和图1的唯一不同之处在于用含有过去的综合激励304的自适应码本307来实现长项预测。语音的基音周期信息用来产生相应的自适应激励分量。这一激励分量将乘于一增益Gp(标为305)(也称作周期增益)。两个由增益控制幅度的激励分量在通过短项预测滤波器(标为303)前被加到一起。这两个增益变量(Gp305和Gc306)需量化,然后送到解码器。自适应码本307激励分量和固化码本308激励分量加在一起产生总的激励e(n)。 
图4显示基本的CELP解码器,它完全对应于图3中的编码器,但在综合语音407后添加了后处理单元408。这个解码器除自适应码本外,其它类似于图2。解码器也由几个单元组成,包括编码激励402、自适应码本401、短项预测406和后期处理408。除了后期处理单元,每个单元都和图3中的编码器有相同的定义。 
如果前次的比特流包有丢失,同时周期增益Gp也很大,那么以前的综合激励的错误估计将造成误差传播相当长时间,这一误差传播即使在解码器收到正确的比特流包后也不会马上停止。误差传播的部分原因是由于ep(n)和ec(n)的相位关系已经在上次的比特流包丢失时改变。一个简单的解决办法是将帧之间的周期相关性完全切除;就是说增益Gp在编码时置0。尽管这种方法解决了误差传播的问题,但同时也牺牲了在没有包丢失时的质量, 或者说只有在更高比特率下才可以补偿因此而损失的质量。本文将在随后给出和论证一个折衷的解决方案。 
发明内容
本发明的目的是为了克服上述现有技术中的不足之处,提供一种利用可变换的长项预测技术改进丢包补偿的质量的改进语音丢包修补质量的语音编码系统。 
本发明的改进语音丢包修补质量的语音编码系统,主要是使用可变换的长项预测技术降低因语音包丢失而产生错误传播,它通过适当限制一帧内第一个基音周期的最大周期增益(Gp)值来实现;这里假设一帧内会有多个基音周期。 
所述第一个基音周期增益限制为小于1的一个适当值;为补偿这个较低的周期增益值,对于这第一个基音周期,适当增大激励码本的大小或者再加一级编码激励。 
所述第一个基音周期设置的最大周期增益值在0.5左右。 
所述第一个基音周期之外的其它基音周期保持常规的基音周期增益值和激励码本大小。 
所述第一个基音周期限制适当的周期增益最大值是针对强浊音而言的。 
所述语音编解码系统对语音信号进行编解码;语音信号分为很多个帧,而每帧又有多个语音基音周期;根据帧内第一个基音周期是否占有一个子帧或多个子帧来对每一帧分为不同的类。 
所述子帧在覆盖第一个基音周期时,将基音周期增益限制为小于1的一个适当值;为补偿这个较低的周期增益值,对这个子帧,适当增大激励码本的大小或者再加一级编码激励。 
所述子帧在覆盖第一个基音周期时,将基音周期增益最大值限制在0.5左右。 
所述第一个基音周期所覆盖的子帧外的其它子帧保持常规的基音周期增益值和激励码本大小。 
所述的限制最大周期增益是针对强浊音而言的。 
本发明的改进语音丢包修补质量的语音编码系统,由于使用可变换的长项预测技术,主要通过适当限制一帧内第一个基音周期的最大周期增益(Gp)值,能有效降低因语音包丢失而产生错误传播,具有构思巧妙、方法合理、保真度效果明显等优点。 
附图说明
图1是初始CELP语音编码器方框图; 
图2是初始CELP语音解码器方框图; 
图3是基本CELP语音编码器方框图; 
图4是基本的CELP解码器方框图; 
图5是一个基音周期503小于子帧长度502的示例图; 
图6是一个基音周期603大于子帧长度602但小于半帧长度的示例图。 
具体实施方法
结合附图对本发明作进一步描述如下: 
以下描述包括了相关的编码激励线性预测技术CELP的详细信息。同时,熟悉相关技术的人会发现本方法可以实践于其它各种不同的语音编码技术算法中,而非只局限于本文所讨论的应用。此外,为了突出本发明的特性,本文对一些本技术领域内的一般性知识细节并没有讨论。 
本文附图及其附带说明也只是针对本发明的一些举例。为了简明扼要,其它应用本发明的相关方法的实体将不一一详细叙述或给出图示。 
图3举了一个能说明本发明的编码器示例。参照图3和图4,长项预测在浊音编码中扮演着重要角色,这是由于浊音的强周期性。同时,相邻的语音基音周期非常相似,这就导致下面表达式中激励的基音周期增益Gp305数值上很高。 
e(n)=Gp·ep(n)+Gc·ec(n)        (4) 
上式中ep(n)是以n为取样序数的一个子帧,它从包含过去激励304的自适应码本307得来;ec(n)来自于作用于当前激励的编码激励码本308(又叫固化码本fixed codebook)。对于浊音,ep(n)的作用更显著,周期增益Gp305是一个1附近的值。一般情况下激励每一子帧更新一次。典型的帧长为20毫秒;子帧长为5毫秒。 
如果前次的比特流包有丢失,同时周期增益Gp也很大,那么以前的综合激励的错误估计将造成误差传播相当长时间,这一误差传播即使在解码器收到正确的比特流包后也不会马上停止。误差传播的部分原因是由于ep(n)和ec(n)的相位关系已经在上次的比特流包丢失时改变。一个简单的解决办法是将帧之间的周期相关性完全切除;就是说增益Gp在编码时置0。尽管这种方法解决了误差传播的问题,但同时也牺牲了在没有包丢失时的质量,或者说只有在更高比特率下才可以补偿因此而损失的质量。本文将在随后给出和论证一个折衷的解决方案。 
对于大多数浊音,一帧都含有两个以上的基音周期。图5给出了一帧501的一个基音周期503小于子帧长度502的示例;图6给出了一个基音周期603大于子帧长度602但小于帧长度601的一半的示例。如果浊音性很强,为了避免由丢包造成的错误传播,一个折衷的办法是,在受益于长项预测的同时,限制每一帧的第一个基音周期的周期增益的最大值。我们可以对语音信号分类,给予不同的对待。让我们看下面的示例,有效语音被分为如下4类: 
第1类:(强浊音)且(基音周期<=子帧长度)。对于这种帧,第一个子帧的基音周 期增益限制在一个远远小于1的值(比如说0.5)。对于第一个子帧,编码激励码本应该大于同一帧内的其它子帧。也可以在第一个子帧中再加一级编码激励以补偿其较低的基音周期增益值。对于其它子帧,使用常规的CELP算法就可以。由于这是强浊音帧,基音周期和周期增益在帧内是稳定的,所以基音周期和周期增益可以用更少的比特数来有效编码。 
第2类:(强浊音)且(基音周期>子帧长度和基音周期<=半帧长度)。对于这种帧,前两个子帧(半帧)的基音周期增益限制在一个远远小于1的值(比如说0.5)。对于这两个子帧,编码激励码本应该大于同一帧内的其它子帧。也可以在这两个子帧中再加一级编码激励以补偿其较低的基音周期增益值。对于其它子帧,使用常规的CELP算法就可以。由于这是强浊音帧,基音周期和周期增益在帧内是稳定的,所以基音周期和周期增益可以用更少的比特数来有效编码。 
第3类:(强浊音)且(基音周期>半帧长度)。当基音周期很长时,错误传播效应受长项预测的影响比之基音周期较短时小。对于这类帧,覆盖第一个基音周期的子帧的周期增益可限制为一个小于1的值;编码激励码本的大小可超出常规,也可以再加一级编码激励以补偿其较低的基音周期增益值。由于长基音周期产生较少的错误传播,而出现长基音周期的情况也较少,所以常规的CELP算法也可以用于帧内所有子帧。由于这是强浊音帧,基音周期和周期增益在帧内是稳定的,所以基音周期和周期增益也可以用更少的比特数来有效编码。 
第4类:除第1,2,3类之外的所有情况。使用常规的CELP算法就可以。 
上面规定的类别编号(类序号)可以更换而不影响实际结果。例如,(强浊音)且(基音周期<=子帧长度)也可以定义为第2类而非第1类;(强浊音)且(基音周期>子帧和基音周期<=半帧长度)也可以定义为第3类而不是第2类,等等。 
大体上讲,可以通过适当缩小二帧边界处基音周期之间的相关性来降低因语音包丢失而产生的错误传播效应,同时保持长项预测的重要贡献。 
本发明可以有其他具体的不偏离其精髓或本质特征的表现形式。文中所述的实例也只是具有说明性的而非严格限制性的意义。因此,较前面的叙述,后面的附加权利要求更明显地体现了本发明的范围。全部与权利要求的意义等价的变化都包含在这权利要求的范围内。 

Claims (1)

1.一种改进语音丢包修补质量的语音编码方法,其特征在于使用可变换的长项预测技术在受益于长项预测的同时还能有效降低因语音包丢失而产生错误传播,它通过适当限制一语音帧内第一个基音周期的最大周期增益(Gp)值来实现;
该方法包含:
使用一个自适应激励分量,该激励分量等于一个基音周期增益GP乘以ep(n),且ep(n)从包含过去激励的自适应码本得来;
使用一个编码激励分量;
将自适应激励分量和编码激励分量相加从而产生一个激励信号;
在编码器中,使用常规的CELP算法,对语音信号帧内的每一个子帧确定其基音周期增益的常规值;
对于强浊音帧,限制每一帧的覆盖第一个基音周期的子帧的基音周期增益值;对于其他子帧,保留基音周期增益的常规值。
CN2007101942772A 2006-12-26 2007-12-12 改进语音丢包修补质量的语音编码方法 Active CN101286319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310236667.7A CN103383846B (zh) 2006-12-26 2007-12-12 改进语音丢包修补质量的语音编码方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US87717106P 2006-12-26 2006-12-26
US60/877,171 2006-12-26

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201310236667.7A Division CN103383846B (zh) 2006-12-26 2007-12-12 改进语音丢包修补质量的语音编码方法

Publications (2)

Publication Number Publication Date
CN101286319A CN101286319A (zh) 2008-10-15
CN101286319B true CN101286319B (zh) 2013-05-01

Family

ID=40058482

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201310236667.7A Active CN103383846B (zh) 2006-12-26 2007-12-12 改进语音丢包修补质量的语音编码方法
CN2007101942772A Active CN101286319B (zh) 2006-12-26 2007-12-12 改进语音丢包修补质量的语音编码方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201310236667.7A Active CN103383846B (zh) 2006-12-26 2007-12-12 改进语音丢包修补质量的语音编码方法

Country Status (1)

Country Link
CN (2) CN103383846B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015007076A1 (zh) * 2013-07-16 2015-01-22 华为技术有限公司 处理丢失帧的方法和解码器
US9852738B2 (en) 2014-06-25 2017-12-26 Huawei Technologies Co.,Ltd. Method and apparatus for processing lost frame

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615394B (zh) * 2008-12-31 2011-02-16 华为技术有限公司 分配子帧的方法和装置
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
CN102915737B (zh) * 2011-07-31 2018-01-19 中兴通讯股份有限公司 一种浊音起始帧后丢帧的补偿方法和装置
WO2013096900A1 (en) 2011-12-21 2013-06-27 Huawei Technologies Co., Ltd. Very short pitch detection and coding
CN104299614B (zh) * 2013-07-16 2017-12-29 华为技术有限公司 解码方法和解码装置
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
US10020002B2 (en) * 2015-04-05 2018-07-10 Qualcomm Incorporated Gain parameter estimation based on energy saturation and signal scaling
CN111968653B (zh) * 2020-07-15 2023-10-27 上海今日信息科技有限公司 一种轻载荷双Bit自适应增量语音编码译码方法及装置
CN112669857B (zh) * 2021-03-17 2021-05-18 腾讯科技(深圳)有限公司 一种语音处理的方法、装置及设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708757A (en) * 1996-04-22 1998-01-13 France Telecom Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method
US5960386A (en) * 1996-05-17 1999-09-28 Janiszewski; Thomas John Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook
CN1359513A (zh) * 1999-06-30 2002-07-17 松下电器产业株式会社 话音解码装置和编码差错补偿方法
CN1533564A (zh) * 2001-05-18 2004-09-29 语音信号的编码和传输的方法
CN1652207A (zh) * 1995-06-16 2005-08-10 诺基亚流动电话有限公司 语音编码器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980031885U (ko) * 1996-11-27 1998-08-17 김욱한 동력조향장치의 킥백방지어셈블리
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1652207A (zh) * 1995-06-16 2005-08-10 诺基亚流动电话有限公司 语音编码器
US5708757A (en) * 1996-04-22 1998-01-13 France Telecom Method of determining parameters of a pitch synthesis filter in a speech coder, and speech coder implementing such method
US5960386A (en) * 1996-05-17 1999-09-28 Janiszewski; Thomas John Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook
CN1359513A (zh) * 1999-06-30 2002-07-17 松下电器产业株式会社 话音解码装置和编码差错补偿方法
CN1533564A (zh) * 2001-05-18 2004-09-29 语音信号的编码和传输的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015007076A1 (zh) * 2013-07-16 2015-01-22 华为技术有限公司 处理丢失帧的方法和解码器
US10068578B2 (en) 2013-07-16 2018-09-04 Huawei Technologies Co., Ltd. Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient
US9852738B2 (en) 2014-06-25 2017-12-26 Huawei Technologies Co.,Ltd. Method and apparatus for processing lost frame
US10311885B2 (en) 2014-06-25 2019-06-04 Huawei Technologies Co., Ltd. Method and apparatus for recovering lost frames

Also Published As

Publication number Publication date
CN103383846A (zh) 2013-11-06
CN101286319A (zh) 2008-10-15
CN103383846B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
CN101286319B (zh) 改进语音丢包修补质量的语音编码方法
TW440814B (en) Low complexity random codebook structure
US8010351B2 (en) Speech coding system to improve packet loss concealment
KR101406113B1 (ko) 스피치 신호에서 천이 프레임을 코딩하기 위한 방법 및 장치
TW448417B (en) Speech encoder adaptively applying pitch preprocessing with continuous warping
EP0926660B1 (en) Speech encoding/decoding method
CN101266797B (zh) 语音信号后处理滤波方法
RU93058657A (ru) Вокодер с переменной скоростью кодирования и передачи данных
CN101548319A (zh) 后置滤波器以及滤波方法
US6826527B1 (en) Concealment of frame erasures and method
EP1420391B1 (en) Generalized analysis-by-synthesis speech coding method, and coder implementing such method
CN106575505A (zh) Fd/lpd转换环境中的帧丢失管理
CN105359211A (zh) 语音处理的清音/浊音判决
CN104254886B (zh) 自适应编码浊音语音的基音周期
CN105745705A (zh) 使用语音相关的频谱整形信息编码音频信号和解码音频信号的概念
CN105723456A (zh) 使用确定性及类噪声信息编码音频信号及解码音频信号的概念
CN102844810B (zh) 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
CN101996637A (zh) 长期预测编码和长期预测解码的方法和装置
CN101171626A (zh) 通过修改残余对声码器内的帧进行时间扭曲
EP1103953B1 (en) Method for concealing erased speech frames
CN101286321B (zh) 双脉冲激励的线性测编码
EP2761616A1 (en) An improved method and apparatus for adaptive multi rate codec
JP3579276B2 (ja) 音声符号化/復号化方法
CN101286320B (zh) 增益量化系统用于改进语音丢包修补质量的方法
CN101609684B (zh) 解码语音信号的后处理滤波器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: HUAWEI TECHNOLOGIES CO., LTD.

Free format text: FORMER OWNER: GAO YANG

Effective date: 20121205

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; TO: 518129 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20121205

Address after: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Applicant after: Huawei Technologies Co., Ltd.

Address before: 26586 Vee E San Torini, California, USA

Applicant before: Gao Yang

C14 Grant of patent or utility model
GR01 Patent grant