CN102915737A - 一种浊音起始帧后丢帧的补偿方法和装置 - Google Patents
一种浊音起始帧后丢帧的补偿方法和装置 Download PDFInfo
- Publication number
- CN102915737A CN102915737A CN2011102167369A CN201110216736A CN102915737A CN 102915737 A CN102915737 A CN 102915737A CN 2011102167369 A CN2011102167369 A CN 2011102167369A CN 201110216736 A CN201110216736 A CN 201110216736A CN 102915737 A CN102915737 A CN 102915737A
- Authority
- CN
- China
- Prior art keywords
- adaptive codebook
- subframe
- codebook gain
- delay
- lost frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 109
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 35
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 35
- 230000003044 adaptive effect Effects 0.000 claims description 260
- 108090000623 proteins and genes Proteins 0.000 claims description 32
- 238000012937 correction Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 23
- 238000005086 pumping Methods 0.000 claims description 23
- 230000003111 delayed effect Effects 0.000 claims description 22
- 230000008030 elimination Effects 0.000 claims description 17
- 238000003379 elimination reaction Methods 0.000 claims description 17
- 230000001360 synchronised effect Effects 0.000 claims description 14
- 230000006978 adaptation Effects 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 abstract description 2
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000005070 sampling Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
浊音起始帧后丢帧的补偿方法和装置,保证浊音起始帧后丢帧的补偿无延时,包括:根据浊音起始帧的稳定性条件选取不同方式推断浊音起始帧之后紧随的第一丢失帧的基音延时;根据第一丢失帧前接收的一个或多个子帧的自适应码本增益推断第一丢失帧的自适应码本增益,或根据浊音起始帧的时域语音信号的能量变化推断第一丢失帧的自适应码本增益;用推断得到的基音延时和自适应码本增益对第一丢失帧补偿。补偿后,将浊音起始帧之后首个正确接收的帧中每个子帧解码得到的自适应码本增益乘一尺度因子得到每个子帧的新的自适应码本增益,用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。可减小由于丢帧带来的错误传递,控制合成语音的能量。
Description
技术领域
本发明涉及语音编解码技术领域,具体涉及一种浊音起始帧后丢帧的补偿方法和装置。
背景技术
当语音帧在信道中传输时,例如无线环境或者IP网络等,可能由于传输过程中所涉及的各种复杂因素导致在接收时出现丢帧现象,使得接收端合成的语音质量严重下降。丢帧补偿技术的目的是为了减小这种因为丢帧所引起的语音质量下降,以提高人的主观感受。
CELP(码激励线性预测)类型语音编解码器由于能在中低速率提供较好的语音质量,从而在实际的通讯系统中得到广泛的应用。CELP类型语音编码解器是基于预测的语音编解码器,当前编解码的语音帧不仅依赖于当前语音帧数据,而且还与编解码器的历史状态有关,即存在较强的帧间相关性。这样当任意一语音帧丢失时,不仅会造成当前语音帧无法正确合成,还会将这种错误延续到之后的若干帧去,造成合成的语音质量严重下降,因此提供一种高质量的丢帧补偿方法显得尤为重要。
为了提高丢帧补偿质量,一种方法是在编码端发送额外的“边信息”,这些“边信息”在解码时被用来恢复丢失的语音帧,但显然这种方法会增加比特流速率,同时带来额外的编解码延时。另一种方法是对信息帧解码后得到的时域语音信号进行分类,类型包括:清音帧,清音过渡帧,浊音过渡帧,浊音帧,浊音起始帧等。根据丢失帧前相邻帧不同的类别选择不同的丢帧补偿方法,但浊音起始帧之后的丢帧通常使用与浊音帧之后的丢帧相类似的补偿办法,从而当丢帧发生在浊音起始帧之后时补偿音质没有得到保证。
发明内容
本发明要解决的技术问题是提供一种浊音起始帧后丢帧的补偿方法和装置,保证浊音起始帧后丢帧的补偿无延时、效果好。
为解决上述技术问题,本发明提供了一种浊音起始帧后丢帧的补偿方法,所述方法包括:
浊音起始帧正确接收,当浊音起始帧之后紧随的第一帧丢失时,根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时;根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益;根据推断得到的基音延时和自适应码本增益对第一丢失帧进行补偿。
为解决上述技术问题,本发明还提供了一种浊音起始帧后丢帧的补偿装置,所述装置包括第一基因延时补偿模块、第一自适应码本增益补偿模块和第一补偿模块,其中:
所述第一基因延时补偿模块,在浊音起始帧正确接收,浊音起始帧之后紧随的第一帧丢失时,根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时;
所述第一自适应码本增益补偿模块,根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益;
所述第一补偿模块,用于根据推断得到的基音延时和自适应码本增益对第一丢失帧进行补偿。
本发明要解决的另一技术问题是提供一种浊音起始帧后丢帧的补偿方法和装置,减小由于丢帧带来的错误传递,控制合成语音的能量。
为解决上述技术问题,本发明提供了一种浊音起始帧后帧的补偿方法,所述方法包括:
浊音起始帧正确接收,当浊音起始帧之后紧随的一个或两个以上帧丢失时,推断丢失帧的基音延时以及自适应码本增益,根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿;
对浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
为解决上述技术问题,本发明还提供了一种浊音起始帧后帧的补偿装置,所述装置包括补偿模块和自适应码本增益调整模块,其中:
所述补偿模块,用于在浊音起始帧正确接收,当浊音起始帧之后紧随的一个或两个以上帧丢失时,推断丢失帧的基音延时以及自适应码本增益,根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿;
所述自适应码本增益调整模块,对浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
本发明实施例充分考虑到浊音起始帧不同于浊音帧的特点,针对浊音起始帧之后紧随的第一丢失帧,根据该浊音起始帧的不同的稳定特性,采用不同的方式推断该第一丢失帧的基音延时,根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益,补偿时仅仅用到丢失帧前帧的信息可以避免补偿延时,同时由于基于浊音起始帧不同的稳定特性采用不同的补偿方式从而可以保证补偿音质。针对上述第一丢失帧之后紧随的一个或两个以上的丢失帧,采用衰减后插值的方法获得丢失帧的自适应码本增益,从而使得丢失帧时的语音能量平滑下降。针对丢失帧之后的首个正常接收帧,通过对其进行自适应码本增益的调整以达到减小由于丢帧带来的错误传递和控制合成语音的能量的效果,综上,采用本发明实施例方法,可以提高在丢帧环境下的语音通话质量。
附图说明
图1为本发明实施例1的流程图;
图2为本发明实施例1中步骤102的具体方法流程图;
图3为本发明实施例1中步骤103的具体方法流程图;
图4为本发明实施例3的流程图;
图5为本发明实施例4中第二尺度因子计算方法的流程图;
图6为本发明实施例5中补偿装置的结构示意图;
图7为本发明实施例6中补偿装置的结构示意图;
图8为本发明实施例7中补偿装置的结构示意图;
图9为本发明实施例8中补偿装置的结构示意图;
图10为本发明实施例8中第二尺度因子计算模块的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。以下实施例针对浊音起始帧正常接收,而浊音起始帧之后紧随的帧丢失的情况进行说明。
实施例1
本实施例描述浊音起始帧之后紧随的第一帧丢失后补偿的方法,如图1所示,包括以下步骤:
步骤101,浊音起始帧正确接收,判断浊音起始帧之后紧随的第一帧(下称第一丢失帧)是否丢失,如果丢失,执行步骤102,否则本流程结束;
步骤102,根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时;
具体地:如果浊音起始帧符合稳定性条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用该浊音起始帧中最后一个子帧的基音延时的整数部分(T-1)作为该第一丢失帧中每个子帧的基音延时;
如果浊音起始帧不符合稳定性条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用第一修正量对该浊音起始帧中最后一个子帧的基音延时的整数部分(T-1)进行修正得到第一修正值,将第一修正值作为该第一丢失帧中每个子帧的基音延时。
当得到的基音延时为非整数时,优选地,可通过取整处理使第一修正值为一整数。取整处理的具体实现方式可以是向上取整或向下取整或者四舍五入。
第一修正量采用以下方法获得:以第一丢失帧之前的一个子帧(浊音起始帧的最后一个子帧)为基准,消除第一丢失帧之前的两个以上子帧的基因延时的倍数,利用消除基音延时的倍数后的第一丢失帧之前的两个以上子帧的基音延时的整数部分确定基音延时的修正因子,用该修正因子和T-1确定基因延时的第一尺度因子,所述第一修正量为该修正因子和第一尺度因子的乘积,其中所述第一尺度因子用于表示该修正因子的可信度。具体地,修正因子为:消除基音延时的倍数后的第一丢失帧之前的两个以上子帧的基音延时整数部分的标准方差。第一尺度因子为:1减去修正因子与浊音起始帧的最后一个子帧的基音延时的整数部分的比值fs=1-fm/T-1,,其中fm为修正因子。在其他实施例中,第一尺度因子也可以取其他值,例如[0,1]之间的常数。
优选采用以下方式判断浊音起始帧是否符合稳定性条件:满足以下任一条件之一的浊音起始帧符合所述稳定性条件,不满足以下所有条件的浊音起始帧不符合所述稳定性条件:
浊音起始帧的基音同步的自相关系数大于第一阈值R;
浊音起始帧的最后一个子帧的自适应码本增益大于第二阈值G1,且该浊音起始帧的倒数第二个子帧的自适应码本增益大于第三阈值G2;
浊音起始帧的最后一个子帧和倒数第二个子帧的基音延时的整数部分相等。
以帧长为20ms,每帧分成4个5ms时长的子帧,采样率为16kHz的语音流为例对本实施例步骤102进行具体说明,在其它帧长和采样率条件下,下述方法同样适用。如图2所示,包括以下步骤:
步骤102a,判断浊音起始帧是否符合以下任一稳定性条件,如果是,执行步骤102b,如果不符合以下所有条件,执行步骤102c;
●浊音起始帧的基音同步的自相关系数RT大于第一阈值R;
其中,0≤R≤1。优选地,R>0.5。
对于任意一帧,基音同步自相关系数(pitch-synchronous normalized correlation)RT为该帧最后两个连续基音周期的归一化自相关系数值,用于表示该连续两个基音周期的相似性特征,具体可以采用如下方法计算:
其中,N为子帧长度,T取值如下:round(·)表示四舍五入运算,T2和T3表示该帧第3子帧和第4子帧的基音延时;
上式中的CN(kT),k=1,2的计算方法如下:
●gp,-1大于第二阈值G1且gp,-2大于第三阈值G2;
其中,gp,-1和gp,-2分别为浊音起始帧的第4子帧(最后一子帧)和第3子帧(倒数第二子帧)的自适应码本增益;0<G1≤G2<1。
●T-1等于T-2;
其中,T-1和T-2分别为浊音起始帧的第4子帧和第3子帧的基音延时的整数部分。
步骤102b,如果浊音起始帧符合上述任一稳定性条件,则使用浊音起始帧的最后一个子帧(本实施例中为第4子帧)的基音延时的整数部分T-1作为第一丢失帧每个子帧的基音延时,结束;
步骤102c,如果浊音起始帧不符合上述所有稳定性条件,则对当前丢失帧之前的M1个(例如M1=4)子帧的基音延时的整数部分何等如下消除基音延时的倍数的处理,即以当前丢失帧之前的最后一个子帧为基准,消除当前丢失帧之前的两个以上子帧的基因延时的倍数:
先取T’-1为T-1,T’-1表示消除倍数后的基音延时;对于i从-2到-M1:
如果Ti小于等于T-1,T’i取Ti和2*Ti距离T-1更近者,即Ti和2*Ti中与T-1之差的绝对值最小的那个,如果|Ti-T-1|与|2*Ti-T-1|中|Ti-T-1|最小,则取T’i=Ti,如果|Ti-T-1|与|2*Ti-T-1|中|2*Ti-T-1|最小,则取T’i=2*Ti;
反之如果Ti大于T-1,T’i取Ti和Ti/2距离T-1更近者,即Ti和Ti/2中与T-1之差的绝对值最小的那个,如果|Ti-T-1|与|(Ti/2)-T-1|中|Ti-T-1|最小,则取T’i=Ti,如果|Ti-T-1|与|(Ti/2)-T-1|中|(Ti/2)-T-1|最小,则取T’i=Ti/2。
步骤102d,确定基音延时的修正因子fm和第一尺度因子fs,取第一修正量为第一尺度因子和修正因子的乘积,即fs*fm,其中修正因子fm取作T’-1的标准方差,第一尺度因子fs表示修正因子的一种可信程度,具体取值如下:
fs=1-fm/T-1,
上式中T’i为步骤102c中计算得到的T’i。
步骤102e,使用浊音起始帧的最后一个子帧(本实施例中为第4子帧)的基音延时的整数部分T-1作为第一丢失帧每个子帧的基音延时基本值,采用修正因子和第一尺度因子对基音延时基本值进行第一次修正处理得到第一修正值Tc=T-1+fs*fm,将该Tc作为该第一丢失帧每个子帧的基音延时。
使用第一修正量对T-1进行修正时,应保证得到的第一修正值Tc在基音延时的取值范围内。最后通过取整处理(本实施例中采用四舍五入的方式)使第一修正值Tc为一整数。在其他实施例中,如果得到的基音延时为一整数,则可以不再进行取整处理。
步骤103,根据第一丢失帧前接收的M2(M2取大于等于1的整数)个子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益,该浊音起始帧的时域语音信号由解码器合成得到;
具体地:如果满足以下条件一:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值Ethr,则将衰减后的第一丢失帧之前M2个子帧的自适应码本增益的中位数的值作为第一丢失帧中每个子帧的自适应码本增益的推断值gp,衰减采用的系数为[0,1]之间的常数;
如果不满足条件一,但满足以下条件二:浊音起始帧中最后一个子帧的自适应码本增益gp,-1在预定范围内,则将衰减后的gp,-1作为第一丢失帧中每个子帧的自适应码本增益的推断值gp,衰减采用的系数为[0,1]之间的常数;
如果不满足条件一也不满足条件二,则计算能量比值RLT和RST,使用衰减后的RLT和RST的加权平均值作为第一丢失帧中每个子帧的自适应码本增益的推断值gp;其中,RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,这里限制基音周期(即基因延时T-1)不得超过帧长L的一半,即当T-1大于L/2时取T-1=L/2。
当前帧丢失时,对历史激励信号以步骤102中得到的基音延时为周期进行周期性延拓得到自适应码本激励,将步骤103中得到的自适应码本增益与自适应码本激励的乘积作为当前丢失帧当前子帧的激励信号的周期性部分参与语音合成。
以帧长为20ms,每帧分成4个5ms时长的子帧,采样率为16kHz的语音流为例对步骤103进行具体说明,在其它帧长和采样率条件下,下述方法同样适用。如图3所示,包括以下步骤:
●对于当前丢失帧的第1子帧:
步骤103a,如果满足以下条件一:当前丢帧的前一帧(在本实施例中为浊音起始帧)的基音周期内对数能量与长时基音周期内对数能量的差值dEt小于阈值Ethr(通常Ethr取负值),则取衰减后的当前丢失帧之前的M2个(例如M2=5)子帧的自适应码本增益的中位数的值作为当前丢失帧第1子帧的自适应码本增益的推断值gp,即
gp=αp(n)*median(gp,-M,...,gp,-1),
同时将gp限制在适当范围之内,例如限制gp在[0.5,0.95]之内,即:若gp<0.5,取gp=0.5;若gp>0.95,取gp=0.95。
上述公式中,n表示当前连续丢帧的序号,例如这里为正确接收帧后的第一个丢帧,故取n=1;αp(n)表示与之对应的衰减系数,取值如下:
对于任意一帧,dEt定义为基音周期内对数能量与长时基音周期内对数能量的差值,即:
103b,如果上述103a中的条件不满足,但满足以下条件二:当前丢失帧前一子帧(即浊音起始帧中最后一个子帧)的自适应码本增益gp,-1在适当的范围内,例如gp,-1在0.8到1.1之间,对gp,-1做适当衰减得到当前丢失帧第1子帧的自适应码本增益gp:
gp=αp(n)*gp,-1 (1)
式中αp(n)表示衰减系数。
103c,上述103a和103b中的两个条件都不满足时,根据解码器合成的浊音起始帧的时域语音信号的能量变化,推断得到当前丢失帧的自适应码本增益,具体推断方式如下:
首先,计算能量比值RLT和RST,其中RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,这里限制基音周期不得超过L/2,即T-1大于L/2时取L/2,RLT和RST的计算公式如下:
然后,将能量比值RLT和RST加权平均后做适当的衰减得到:
gp=αp(n)*(0.5*RLT+0.5*RST),(2)
103d,将由式(1)或式(2)估计得到的gp进行限制后的值作为当前丢失帧第1子帧的自适应码本增益的推断值;具体对gp的限制方法如下:
如果gp大于某一上限阈值,例如1,取gp为该上限阈值;
如果gp小于某一下限阈值,例如0.7,取gp为该下限阈值;
如果T-1等于步骤102中推断得到的第一修正值Tc(进行取整处理后的Tc),并且gp大于另一上限阈值,例如0.95,取gp为该另一上限阈值;
●对于当前丢失帧除第1子帧外的其他子帧,直接沿用当前丢失帧第1子帧推断得到的自适应码本增益gp作为该子帧的自适应码本增益的推断值。
步骤104,根据推断得到的基音延时和自适应码本增益对第一丢失帧进行补偿,即使用推断得到的基音延时和自适应码本增益参与第一丢失帧的语音合成。
具体补偿方法可采用现有技术实现,本文不再赘述。
实施例2
本实施例描述浊音起始帧之后紧随的第一帧丢失后补偿的方法,与实施例1的区别在于增加了第二修正处理。
步骤201,与实施例1中步骤101相同;
步骤202,本步骤与步骤102的主要区别在于,当浊音起始帧不符合稳定性条件,使用第一修正量对T-1进行修正后,对该修正后的T-1进行第二修正处理,将修正处理后的结果作为最终的该第一丢失帧每个子帧的基音延时的推断值。
具体地,第二修正处理如下:
判断如果满足下述两条件,则取T-1为基音延时中间值:条件1:修正后的T-1(即Tc=T-1+fs*fm)与T-1的差的绝对值大于第五阈值Tthr1,条件2:T-1与浊音起始帧倒数第二个子帧的基音延时整数部分T-2的差的绝对值小于第六阈值Tthr2;其中0<第六阈值Tthr2<第五阈值Tthr1;判断如果不满足上述任一条件,则将第五阈值Tthr1与第一修正量的最小值与T-1的和作为基音延时中间值;
判断基音延时中间值如果大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍(x>1,优选地x=1.7),则将基音延时中间值乘2作为第二修正处理后的结果,否则直接将基音延时中间值作为第二修正处理后的结果。优选地,在基音延时中间值大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍时,置倍频标识位为有效(例如1),不大于时,置倍频标识位为无效(例如0)。
步骤203,本步骤与步骤103的主要区别在于,条件一为:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值Ethr或者在基音延时推断中设置的倍频标识位为有效(例如为1)。满足条件一的处理,条件二,不满足条件一但满足条件二的处理,以及不满足条件一和条件二时的处理均与步骤103相同。
步骤204,与实施例1中步骤104相同。
以帧长为20ms,每帧分成4个5ms时长的子帧,采样率为16kHz的语音流为例对本实施例步骤202进行具体说明,在其它帧长和采样率条件下,下述方法同样适用。
步骤202a,判断浊音起始帧是否符合以下任一稳定性条件,如果是,执行步骤202b,如果不符合以下所有条件,执行步骤202c;
●浊音起始帧的基音同步的自相关系数RT大于第一阈值R;
其中,0≤R≤1。优选地,R>0.5。
对于任意一帧,基音同步自相关系数(pitch-synchronous normalized correlation)RT为该帧最后两个连续基音周期的归一化自相关系数值,用于表示该连续两个基音周期的相似性特征,具体计算方法参见步骤102a,此处不再赘述。
●gp,-1大于第二阈值G1且gp,-2大于第三阈值G2;
其中,gp,-1和gp,-2分别为浊音起始帧的第4子帧(最后一子帧)和第3子帧(倒数第二子帧)的自适应码本增益;0<G1≤G2<1。
●T-1等于T-2;
其中,T-1和T-2分别为浊音起始帧的第4子帧和第3子帧的基音延时的整数部分。
步骤202b,如果浊音起始帧符合上述任一稳定性条件,则使用浊音起始帧的最后一个子帧(本实施例中为第4子帧)的基音延时的整数部分T-1作为第一丢失帧每个子帧的基音延时,结束;
步骤202c,如果浊音起始帧不符合上述所有稳定性条件,则对当前丢失帧之前的M1个(例如M1=4)子帧的基音延时的整数部分做如下消除基音延时的倍数的处理,即以当前丢失帧之前的最后一个子帧为基准,消除其他子帧的基因延时的倍数:
先取T’-1为T-1,T’-1表示消除倍数后的基音延时;如果Ti小于等于T-1,T’i取Ti和2*Ti中与T-1之差的绝对值最小的那个;反之如果Ti大于T-1,T’i取Ti和Ti/2中与T-1之差的绝对值最小的那个,其中i=[-2,-M1],其中M1为待进行消除操作的第一丢失帧之前的子帧的个数。
步骤202d,确定基音延时的修正因子fm和第一尺度因子fs,取第一修正量为第一尺度因子和修正因子的乘积,即fs*fm,其中修正因子fm取作T’-1的标准方差,第一尺度因子fs表示修正因子的一种可信程度,具体取值如下:
fs=1-fm/T-1,
上式中T’i为步骤202c中计算得到的T’i。
步骤202e,使用浊音起始帧的最后一个子帧(本实施例中为第4子帧)的基音延时的整数部分T-1作为第一丢失帧每个子帧的基音延时基本值,采用修正因子和第一尺度因子对基音延时基本值进行第一次修正处理得到第一修正值Tc=T-1+fs*fm;
步骤202f,对第一修正值进行如下第二修正处理:
如果Tc与T-1的差的绝对值大于阈值第五Tthr1,并且T-1与T-2差的绝对值小于第六阈值Tthr2,则取Tc=T-1;否则(上述任一条件不满足)取Tc为T-1加上fs*fm与Tthr1的最小值,即Tc=T-1+min(fs*fm,Tthr1),优选地,取阈值0<Tthr2<Tthr1<15;
将得到的Tc与最近正确接收的具有稳定基音延时的浊音帧的基音延时Ts作比较:若Ts大于x倍的Tc,优选x=1.7,更新Tc=Tc×2,置倍频标识位为1;否则,不更新Tc,置倍频标识位为0。
其中,Ts在信息帧正确接收时需要更新,更新方式如下:
设T0,T1,T2和T3分别为该帧第1、第2、第3和第4子帧的基音延时,如果当前正确接收帧为浊音类型帧,包括浊音过度帧,浊音帧,浊音起始帧,并且该帧有稳定的基音周期,例如满足条件:T1不超过1.4倍的T3,且T3不超过1.4倍的T1,且T0与T2差的绝对值不超过10,则更新Ts为T3,否则不进行更新。
步骤202g,使用取整处理后的Tc作为当前丢失帧每一个子帧的基音延时,同时应保证取整处理后的Tc在基音延时的取值范围内,即:
如果Tc>Tmax,取Tc=Tmax;
如果Tc<Tmin,取Tc=Tmin;
其中,Tmin和Tmax分别为基音延时所允许的最小值和最大值。
实施例3
本实施例描述浊音起始帧之后紧随的两个以上帧丢失后补偿的方法,丢失帧中包括第一丢失帧以及第一丢失帧之后紧随的1个或2个以上丢失帧,如图4所示,包括以下步骤:
步骤301,采用实施例1或实施例2中的方法推断第一丢失帧的基音延时和自适应码本增益;
步骤302,对于第一丢失帧之后紧随的1个或2个以上丢失帧,使用当前丢失帧的前一丢失帧的基音延时作为当前丢失帧的基音延时;
步骤303,将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益的推断值进行衰减、插值后得到的自适应码本增益值作为当前丢失帧中各子帧的自适应码本增益;
具体地,针对当前丢失帧,将经过衰减后的当前丢失帧的前一丢失帧(可能是第一丢失帧也可能是第一丢失帧之后的丢失帧)的最后一个子帧的自适应码本增益作为当前丢失帧的最后一个子帧的自适应码本增益gp,end,当前丢失帧的其他子帧的自适应码本增益由处理后的gp,end和gp,end之间的线性插值得到,对gp,end的处理用于使gp,end向1靠近,例如处理后的gp,end为gp,end的算术平方根:或者也可以为gp,end的立方根。
步骤304,根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿。
以帧长为20ms,每帧分成4个5ms时长的子帧,采样率为16kHz的语音流为例对本步骤303进行具体说明,在其它帧长和采样率条件下,下述方法同样适用。
将当前丢失帧的4个子帧的自适应码本增益记为:gp,0,gp,1,gp,2,gp,3;将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益推断值记为:gp,-1;计算得到gp,0,gp,1,gp,2,gp,3的方法如下:
首先,令gp,end=αp(n)*gp,-1,其中,n表示当前连续丢帧的序号,αp(n)表示与之对应的衰减系数;
这样,gp,0,gp,1,gp,2,gp,3的取值如下式:
gp,0=gp,start+gp,step,
gp,1=gp,0+gp,step,
gp,2=gp,1+gp,step,
gp,3=gp,2+gp,step=gp,end.
实施例4
本实施例描述如何对浊音起始帧之后首个正确接收到的帧进行补偿后的恢复处理,本实施例可以与上述实施例1或实施例2或实施例3结合使用,或者也可以与现有技术中的对浊音起始帧后丢帧的补偿方法结合使用。包括以下步骤:
步骤401,浊音起始帧正确接收,当浊音起始帧之后紧随的一个或两个以上帧丢失时,推断丢失帧的基音延时以及自适应码本增益,根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿;
本步骤可以采用实施例1或实施例2或实施例3中的方法实现,或者采用现有技术中的补偿方法实现。
步骤402,对于浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益gp乘以第二尺度因子scale_fac得到每个子帧的新的自适应码本增益gp=scale_fac*gp,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
在进行语音合成时,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成,得到当前帧的时域语音信号。
第二尺度因子scale_fac用来控制丢帧后第一个正确接收帧的自适应码本的贡献和合成语音的整体能量。当补偿时使用的基音延时与当前帧使用的基音延时形成跳跃时即说明补偿时使用的基音延时的可靠性不高,需要适当减小自适应码本贡献以减小错误的自适应码本带来的错误传递,同时通过控制第二尺度因子scale_fac使得丢帧后第一个正确接收帧的能量不会迅速增大,
如图5所示,本实施例中,每个子帧的第二尺度因子采用以下方法计算得到:
步骤a,将第二尺度因子赋初值1;
优选地,在步骤a、b之间还可以包括步骤a1:如果当前帧的前一丢帧的基音延时的推断值与当前帧解码得到的第一个子帧的基音延时T0差的绝对值大于预设第八阈值,例如大于10,则根据丢帧前最后一个正确接收帧即浊音起始帧的基音同步自相关系数RT的线性增函数重新计算新的第二尺度因子为a*RT+b,通常只需取a>0以保证第二尺度因子为关于RT的增函数,同时可以对新的scale_fac进行范围限制,例如当scale_fac大于1时取1,小于0.5时取0.5。
步骤b,将第二尺度因子scale_fac(可能是步骤a中的第二尺度因子初值,也可能是步骤a1中的新的第二尺度因子)乘以当前子帧解码得到的自适应码本增益gp,得到的值再乘以当前子帧的自适应码本,将得到的信号作为当前子帧的激励信号;
步骤c,使用该激励信号进行语音预先合成,合成后不更新各滤波器的状态值,根据预先合成的语音信号计算得到当前子帧的信号能量E;
实施例5
本实施例描述实现实施例1方法的补偿装置,该装置包括第一基因延时补偿模块、第一自适应码本增益补偿模块和第一补偿模块,其中:
该第一基因延时补偿模块,在浊音起始帧正确接收,浊音起始帧之后紧随的第一帧丢失时,根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时;
该第一自适应码本增益补偿模块,根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益;
该第一补偿模块,用于根据推断得到的基音延时和自适应码本增益对第一丢失帧进行补偿。
优选地,该第一基因延时补偿模块是用于采用以下方式根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时:
如果浊音起始帧满足以下任一条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用该浊音起始帧的最后一个子帧的基音延时的整数部分作为该第一丢失帧每个子帧的基音延时的推断值;
如果浊音起始帧不满足以下所有条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用第一修正量对该浊音起始帧的最后一个子帧的基音延时的整数部分进行修正得到第一修正值,将第一修正值作为该第一丢失帧每个子帧的基音延时的推断值;
上述条件为:
浊音起始帧的基音同步的自相关系数大于第一阈值;
浊音起始帧的最后一个子帧的自适应码本增益大于第二阈值,且该浊音起始帧的倒数第二个子帧的自适应码本增益大于第三阈值;
浊音起始帧的最后一个子帧和倒数第二个子帧的基音延时的整数部分相等。
如图6所示,该补偿装置还包括第一修正量计算模块,其用于获得所述第一修正量,该第一修正量计算模块可以单独设置,也可以设置在第一基音延时补偿模块中。该第一修正量计算模块包括消除单元、修正因子计算单元、第一尺度因子计算单元和第一修正量计算单元,其中:
该消除单元,用于以第一丢失帧之前的最后一个子帧为基准,消除第一丢失帧之前的两个以上子帧的基因延时的倍数;
该修正因子计算单元,用于采用以下方式确定基音延时的修正因子:修正因子为:消除基音延时倍数后的第一丢失帧之前的两个以上子帧的基音延时整数部分的标准方差;
该第一尺度因子计算单元,用于采用以下方式确定基因延时的第一尺度因子:第一尺度因子为:1减去修正因子与浊音起始帧的最后一个子帧的基音延时的整数部分的比值;
该第一修正量计算单元,用于采用以下方式计算该第一修正量:第一修正量为:所述修正因子和第一尺度因子的乘积。
优选地,该消除单元是用于采用以下方式以第一丢失帧之前的最后一个子帧为基准,消除第一丢失帧之前的两个以上子帧的基因延时的倍数:
先取T’-1为T-1,其中,T’-1表示消除倍数后的基音延时,T-1为该浊音起始帧的最后一个子帧的基音延时的整数部分;如果Ti小于等于T-1,消除单元取Ti和2*Ti中与T-1之差的绝对值最小的那个作为T’i;如果Ti大于T-1,消除单元取Ti和Ti/2中与T-1之差的绝对值最小的那个作为T’i,其中i=[-2,-M1],其中M1为待进行消除操作的第一丢失帧之前的子帧的个数。
优选地,该第一自适应码本增益补偿模块是用于采用以下方式根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益:
第一自适应码本增益补偿模块判断如果满足以下条件一:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值,则将衰减后的第一丢失帧之前一个或两个以上子帧的自适应码本增益的中位数的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
第一自适应码本增益补偿模块判断如果不满足条件一,但满足以下条件二:浊音起始帧中最后一个子帧的自适应码本增益在预定范围内,则将对其衰减后的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
第一自适应码本增益补偿模块判断如果不满足条件一也不满足条件二,则计算能量比值RLT和RST,使用衰减后的RLT和RST的加权平均值作为第一丢失帧中每个子帧的自适应码本增益的推断值;其中,RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,所述基音周期不超过帧长的一半。
实施例6
本实施例描述实现实施例2方法的补偿装置,如图7所示,该装置在实施例5中装置的基础上增加了一个基因延时补偿修正模块,其用于在得到第一修正值之后,对该第一修正值进行第二修正处理,将修正处理后的结果作为最终的该第一丢失帧每个子帧的基音延时的推断值。
进一步地,该基因延时补偿修正模块是用于采用以下方式对该第一修正值进行第二修正处理:
基因延时补偿修正模块判断如果满足下述两条件,则取该浊音起始帧的最后一个子帧的基音延时的整数部分为基音延时中间值:条件1:第一修正值与该浊音起始帧的最后一个子帧的基音延时的整数部分的差的绝对值大于第五阈值Tthr1,条件2:该浊音起始帧的最后一个子帧的基音延时的整数部分与浊音起始帧倒数第二个子帧的基音延时整数部分的差的绝对值小于第六阈值;其中0<第六阈值<第五阈值;基因延时补偿修正模块判断如果不满足上述任一条件,则取第一修正量与第五阈值的最小值与该浊音起始帧的最后一个子帧的基音延时的整数部分的和为基音延时中间值;
基因延时补偿修正模块判断基音延时中间值如果大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍,x>1,则将基音延时中间值乘2作为第二修正处理后的结果,同时置倍频标识位为有效;若基音延时中间值不大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍,则将该基音延时中间值作为第二修正处理后的结果,同时置倍频标识位为无效。
在本实施例中,第一自适应码本增益补偿模块是用于采用以下方式根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益:
第一自适应码本增益补偿模块判断如果满足以下条件一:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值或者在基音延时推断中设置的倍频标识位为有效,则将衰减后的第一丢失帧之前一个或两个以上子帧的自适应码本增益的中位数的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
第一自适应码本增益补偿模块判断如果不满足条件一,但满足以下条件二:浊音起始帧中最后一个子帧的自适应码本增益在预定范围内,则将对其衰减后的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
第一自适应码本增益补偿模块判断如果不满足条件一也不满足条件二,则计算能量比值RLT和RST,使用衰减后的RLT和RST的加权平均值作为第一丢失帧中每个子帧的自适应码本增益的推断值;其中,RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,所述基音周期不超过帧长的一半。
实施例7
本实施例描述实现实施例3方法的补偿装置,如图8所示,该装置在实施例5或者实施例6装置基础上增加了第二基音延时补偿模块、第二自适应码本增益补偿模块和第二补偿模块,其中:
该第二基音延时补偿模块,用于对于第一丢失帧之后紧随的一个或两个以上丢失帧,使用当前丢失帧的前一丢失帧的基音延时的推断值作为当前丢失帧的基音延时;
该第二自适应码本增益补偿模块,用于将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益的推断值进行衰减、插值后得到的自适应码本增益值作为当前丢失帧中各子帧的自适应码本增益;
该第二补偿模块,用于根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿。
优选地,该第二自适应码本增益补偿模块是用于采用以下方式将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益的推断值进行衰减、插值后得到的自适应码本增益值作为当前丢失帧中各子帧的自适应码本增益:
第二自适应码本增益补偿模块将经过衰减后的当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益作为当前丢失帧的最后一个子帧的自适应码本增益(gp,end),当前丢失帧的其他子帧的自适应码本增益由处理后的gp,end和gp,end之间的线性插值得到,对gp,end的处理用于使gp,end向1靠近。
实施例8
本实施例描述实现实施例4方法的补偿装置,如图9所示,该装置包括补偿模块和自适应码本增益调整模块,其中:
该补偿模块,用于在浊音起始帧正确接收,当浊音起始帧之后紧随的一个或两个以上帧丢失时,推断丢失帧的基音延时以及自适应码本增益,根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿;该补偿模块可以采用如实施例5或实施例6或实施例7中所述的补偿装置实现;
该自适应码本增益调整模块,对浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
优选地,补偿装置还包括第二尺度因子计算模块,其用于计算每个子帧的第二尺度因子,该第二尺度因子计算模块可以单独设置,也可以设置在自适应码本增益调整模块中。如图10所示,该第二尺度因子计算模块包括激励信号获取单元、预合成单元和第二尺度因子生成单元,其中:
该激励信号获取单元,用于将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益,再乘以当前子帧的自适应码本,将得到的信号作为当前子帧的激励信号;
该预合成单元,用于使用所述激励信号进行语音预先合成,根据预先合成的语音信号计算得到当前子帧的信号能量;
该第二尺度因子生成单元,用于在判断当前子帧的信号能量和当前帧的前一帧最后一个子帧的信号能量的比值的算术平方根超过第七阈值时,将第二尺度因子更新为当前第二尺度因子的Q倍,Q为所述算术平方根与第七阈值的乘积。
优选地,该激励信号获取单元,还用于在将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益之前,判断当前帧的前一丢帧的基音延时的推断值与当前帧解码得到的第一个子帧的基音延时差的绝对值大于第八阈值时,根据浊音起始帧的基音同步自相关系数的线性增函数重新计算新的第二尺度因子,用新的第二尺度因子代替第二尺度因子初值。
本文实施例中所使用阈值为经验值,可通过仿真得到。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (39)
1.一种浊音起始帧后丢帧的补偿方法,其特征在于,所述方法包括:
浊音起始帧正确接收,当浊音起始帧之后紧随的第一帧丢失时,根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时;根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益;根据推断得到的基音延时和自适应码本增益对第一丢失帧进行补偿。
2.如权利要求1所述的方法,其特征在于,
所述根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时,包括:
如果浊音起始帧符合稳定性条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用该浊音起始帧的最后一个子帧的基音延时的整数部分作为该第一丢失帧每个子帧的基音延时的推断值;
如果浊音起始帧不符合稳定性条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用第一修正量对该浊音起始帧的最后一个子帧的基音延时的整数部分进行修正得到第一修正值,将第一修正值作为该第一丢失帧每个子帧的基音延时的推断值。
3.如权利要求2所述的方法,其特征在于,
采用以下方式判断浊音起始帧是否符合稳定性条件:
满足以下任一条件的浊音起始帧符合所述稳定性条件,不满足以下所有条件的浊音起始帧不符合所述稳定性条件:
浊音起始帧的基音同步的自相关系数大于第一阈值;
浊音起始帧的最后一个子帧的自适应码本增益大于第二阈值,且该浊音起始帧的倒数第二个子帧的自适应码本增益大于第三阈值;
浊音起始帧的最后一个子帧和倒数第二个子帧的基音延时的整数部分相等。
4.如权利要求2所述的方法,其特征在于,
所述第一修正量采用以下方法获得:
以第一丢失帧之前的最后一个子帧为基准,消除第一丢失帧之前的两个以上子帧的基因延时的倍数,利用消除基音延时的倍数后的第一丢失帧之前的两个以上子帧的基音延时的整数部分确定基音延时的修正因子,用该修正因子和该浊音起始帧的最后一个子帧的基音延时的整数部分确定基因延时的第一尺度因子,所述第一修正量为该修正因子和第一尺度因子的乘积。
5.如权利要求4所述的方法,其特征在于,
所述修正因子为:消除基音延时倍数后的第一丢失帧之前的两个以上子帧的基音延时整数部分的标准方差;
所述第一尺度因子为:1减去修正因子与浊音起始帧的最后一个子帧的基音延时的整数部分的比值。
6.如权利要求4或5所述的方法,其特征在于,
所述以第一丢失帧之前的最后一个子帧为基准,消除第一丢失帧之前的两个以上子帧的基因延时的倍数,包括:
先取T’-1为T-1,其中,T’-1表示消除倍数后的基音延时,T-1为该浊音起始帧的最后一个子帧的基音延时的整数部分;
如果Ti小于等于T-1,T’i取Ti和2*Ti中与T-1之差的绝对值最小的那个;反之如果Ti大于T-1,T’i取Ti和Ti/2中与T-1之差的绝对值最小的那个,其中i=[-2,-M1],其中M1为待进行消除操作的第一丢失帧之前的子帧的个数。
7.如权利要求2所述的方法,其特征在于,
所述根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益,包括:
如果满足以下条件一:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值,则将衰减后的第一丢失帧之前一个或两个以上子帧的自适应码本增益的中位数的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
如果不满足条件一,但满足以下条件二:浊音起始帧中最后一个子帧的自适应码本增益在预定范围内,则将对其衰减后的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
如果不满足条件一也不满足条件二,则计算能量比值RLT和RST,使用衰减后的RLT和RST的加权平均值作为第一丢失帧中每个子帧的自适应码本增益的推断值;其中,RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,所述基音周期不超过帧长的一半。
8.如权利要求2所述的方法,其特征在于,
得到第一修正值之后,所述方法还包括:
对该第一修正值进行第二修正处理,将修正处理后的结果作为最终的该第一丢失帧每个子帧的基音延时的推断值。
9.如权利要求8所述的方法,其特征在于,所述对该第一修正值进行第二修正处理,包括:
判断如果满足下述两条件,则取该浊音起始帧的最后一个子帧的基音延时的整数部分为基音延时中间值:条件1:第一修正值与该浊音起始帧的最后一个子帧的基音延时的整数部分的差的绝对值大于第五阈值,条件2:该浊音起始帧的最后一个子帧的基音延时的整数部分与浊音起始帧倒数第二个子帧的基音延时整数部分的差的绝对值小于第六阈值;其中0<第六阈值<第五阈值;判断如果不满足上述任一条件,则取第一修正量与第五阈值的最小值与该浊音起始帧的最后一个子帧的基音延时的整数部分的和为基音延时中间值;
判断基音延时中间值如果大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍,x>1,则将基音延时中间值乘2作为第二修正处理后的结果,同时置倍频标识位为有效;若基音延时中间值不大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍,则将该基音延时中间值作为第二修正处理后的结果,同时置倍频标识位为无效。
10.如权利要求9所述的方法,其特征在于,
所述根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益,包括:
如果满足以下条件一:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值或者在基音延时推断中设置的倍频标识位为有效,则将衰减后的第一丢失帧之前一个或两个以上子帧的自适应码本增益的中位数的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
如果不满足条件一,但满足以下条件二:浊音起始帧中最后一个子帧的自适应码本增益在预定范围内,则将对其衰减后的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
如果不满足条件一也不满足条件二,则计算能量比值RLT和RST,使用衰减后的RLT和RST的加权平均值作为第一丢失帧中每个子帧的自适应码本增益的推断值;其中,RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,所述基音周期不超过帧长的一半。
11.如权利要求1或7或10所述的方法,其特征在于,所述方法还包括:
对于第一丢失帧之后紧随的一个或两个以上丢失帧,使用当前丢失帧的前一丢失帧的基音延时的推断值作为当前丢失帧的基音延时;将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益的推断值进行衰减、插值后得到的自适应码本增益值作为当前丢失帧中各子帧的自适应码本增益;根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿。
12.如权利要求11所述的方法,其特征在于,
所述将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益的推断值进行衰减、插值后得到的自适应码本增益值作为当前丢失帧中各子帧的自适应码本增益,包括:
将经过衰减后的当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益作为当前丢失帧的最后一个子帧的自适应码本增益(gp,end),当前丢失帧的其他子帧的自适应码本增益由处理后的gp,end和gp,end之间的线性插值得到,对gp,end的处理用于使gp,end向1靠近。
13.如权利要求12所述的方法,其特征在于,
所述处理后的gp,end为gp,end的算术平方根。
14.如权利要求1所述的方法,其特征在于,所述方法还包括:
对于浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
15.如权利要求11所述的方法,其特征在于,所述方法还包括:
对于浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
16.如权利要求14或15所述的方法,其特征在于,每个子帧的第二尺度因子采用以下方法计算:
将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益,再乘以当前子帧的自适应码本,将得到的信号作为当前子帧的激励信号;
使用所述激励信号进行语音预先合成,根据预先合成的语音信号计算得到当前子帧的信号能量;
如果当前子帧的信号能量和当前帧的前一帧最后一个子帧的信号能量的比值的算术平方根超过第七阈值,将第二尺度因子更新为当前第二尺度因子的Q倍,Q为所述算术平方根与第七阈值的乘积。
17.如权利要求16所述的方法,其特征在于,
将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益之前,所述方法还包括:
如果当前帧的前一丢帧的基音延时的推断值与当前帧解码得到的第一个子帧的基音延时差的绝对值大于第八阈值,则根据浊音起始帧的基音同步自相关系数的线性增函数重新计算新的第二尺度因子,用该新的第二尺度因子代替第二尺度因子初值。
18.一种浊音起始帧后帧的补偿方法,其特征在于,所述方法包括:
浊音起始帧正确接收,当浊音起始帧之后紧随的一个或两个以上帧丢失时,推断丢失帧的基音延时以及自适应码本增益,根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿;
对浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
19.如权利要求18所述的方法,其特征在于,每个子帧的第二尺度因子采用以下方法计算:
将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益,再乘以当前子帧的自适应码本,将得到的信号作为当前子帧的激励信号;
使用所述激励信号进行语音预先合成,根据预先合成的语音信号计算得到当前子帧的信号能量;
如果当前子帧的信号能量和当前帧的前一帧最后一个子帧的信号能量E-1的比值的算术平方根超过第七阈值,将第二尺度因子更新为当前第二尺度因子的Q倍,Q为所述算术平方根与第七阈值的乘积。
20.如权利要求19所述的方法,其特征在于,
将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益之前,所述方法还包括:
如果当前帧的前一丢帧的基音延时的推断值与当前帧解码得到的第一个子帧的基音延时差的绝对值大于第八阈值,则根据浊音起始帧的基音同步自相关系数的线性增函数重新计算新的第二尺度因子,用该新的第二尺度因子代替第二尺度因子初值。
21.如权利要求18或19或20所述的方法,其特征在于,
所述推断丢失帧的基音延时以及自适应码本增益,包括:
当浊音起始帧之后紧随的第一帧丢失时,采用如权利要求1-10中任一权利要求所述的方法,推断浊音起始帧之后紧随的第一丢失帧的基音延时和自适应码本增益;或者
当浊音起始帧之后紧随的第一帧丢失且第一丢失帧之后紧随的一个或两个以上帧丢失时,采用如权利要求1-10中任一权利要求所述的方法,推断浊音起始帧之后紧随的第一丢失帧的基音延时和自适应码本增益;采用如权利要求11-17中任一权利要求所述的方法,推断第一丢失帧之后紧随的一个或两个以上丢失帧的基音延时和自适应码本增益。
22.一种浊音起始帧后丢帧的补偿装置,其特征在于,所述装置包括第一基因延时补偿模块、第一自适应码本增益补偿模块和第一补偿模块,其中:
所述第一基因延时补偿模块,在浊音起始帧正确接收,浊音起始帧之后紧随的第一帧丢失时,根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时;
所述第一自适应码本增益补偿模块,根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益;
所述第一补偿模块,用于根据推断得到的基音延时和自适应码本增益对第一丢失帧进行补偿。
23.如权利要求22所述的补偿装置,其特征在于,
所述第一基因延时补偿模块是用于采用以下方式根据该浊音起始帧的稳定性条件选取相应的基音延时推断方式推断该第一丢失帧的基音延时:
如果浊音起始帧满足以下任一条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用该浊音起始帧的最后一个子帧的基音延时的整数部分作为该第一丢失帧每个子帧的基音延时的推断值;
如果浊音起始帧不满足以下所有条件,则采用以下基音延时推断方式推断该第一丢失帧的基音延时:使用第一修正量对该浊音起始帧的最后一个子帧的基音延时的整数部分进行修正得到第一修正值,将第一修正值作为该第一丢失帧每个子帧的基音延时的推断值;
所述条件为:
浊音起始帧的基音同步的自相关系数大于第一阈值;
浊音起始帧的最后一个子帧的自适应码本增益大于第二阈值,且该浊音起始帧的倒数第二个子帧的自适应码本增益大于第三阈值;
浊音起始帧的最后一个子帧和倒数第二个子帧的基音延时的整数部分相等。
24.如权利要求23所述的补偿装置,其特征在于,
所述补偿装置还包括第一修正量计算模块,其用于获得所述第一修正量,所述第一修正量计算模块包括消除单元、修正因子计算单元、第一尺度因子计算单元和第一修正量计算单元,其中:
所述消除单元,用于以第一丢失帧之前的最后一个子帧为基准,消除第一丢失帧之前的两个以上子帧的基因延时的倍数;
所述修正因子计算单元,用于采用以下方式确定基音延时的修正因子:修正因子为:消除基音延时倍数后的第一丢失帧之前的两个以上子帧的基音延时整数部分的标准方差;
所述第一尺度因子计算单元,用于采用以下方式确定基因延时的第一尺度因子:第一尺度因子为:1减去修正因子与浊音起始帧的最后一个子帧的基音延时的整数部分的比值;
所述第一修正量计算单元,用于采用以下方式计算所述第一修正量:第一修正量为:所述修正因子和第一尺度因子的乘积。
25.如权利要求24所述的补偿装置,其特征在于,
所述消除单元是用于采用以下方式以第一丢失帧之前的最后一个子帧为基准,消除第一丢失帧之前的两个以上子帧的基因延时的倍数:
先取T’-1为T-1,其中,T’-1表示消除倍数后的基音延时,T-1为该浊音起始帧的最后一个子帧的基音延时的整数部分;如果Ti小于等于T-1,所述消除单元取Ti和2*Ti中与T-1之差的绝对值最小的那个作为T’i;如果Ti大于T-1,所述消除单元取Ti和Ti/2中与T-1之差的绝对值最小的那个作为T’i,其中i=[-2,-M1],其中M1为待进行消除操作的第一丢失帧之前的子帧的个数。
26.如权利要求23所述的补偿装置,其特征在于,
所述第一自适应码本增益补偿模块是用于采用以下方式根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益:
所述第一自适应码本增益补偿模块判断如果满足以下条件一:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值,则将衰减后的第一丢失帧之前一个或两个以上子帧的自适应码本增益的中位数的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
所述第一自适应码本增益补偿模块判断如果不满足条件一,但满足以下条件二:浊音起始帧中最后一个子帧的自适应码本增益在预定范围内,则将对其衰减后的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
所述第一自适应码本增益补偿模块判断如果不满足条件一也不满足条件二,则计算能量比值RLT和RST,使用衰减后的RLT和RST的加权平均值作为第一丢失帧中每个子帧的自适应码本增益的推断值;其中,RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,所述基音周期不超过帧长的一半。
27.如权利要求23所述的补偿装置,其特征在于,
所述补偿装置还包括:基因延时补偿修正模块,其用于在得到第一修正值之后,对该第一修正值进行第二修正处理,将修正处理后的结果作为最终的该第一丢失帧每个子帧的基音延时的推断值。
28.如权利要求27所述的补偿装置,其特征在于,
所述基因延时补偿修正模块是用于采用以下方式对该第一修正值进行第二修正处理:
所述基因延时补偿修正模块判断如果满足下述两条件,则取该浊音起始帧的最后一个子帧的基音延时的整数部分为基音延时中间值:条件1:第一修正值与该浊音起始帧的最后一个子帧的基音延时的整数部分的差的绝对值大于第五阈值,条件2:该浊音起始帧的最后一个子帧的基音延时的整数部分与浊音起始帧倒数第二个子帧的基音延时整数部分的差的绝对值小于第六阈值;其中0<第六阈值<第五阈值;所述基因延时补偿修正模块判断如果不满足上述任一条件,则取第一修正量与第五阈值的最小值与该浊音起始帧的最后一个子帧的基音延时的整数部分的和为基音延时中间值;
所述基因延时补偿修正模块判断基音延时中间值如果大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍,x>1,则将基音延时中间值乘2作为第二修正处理后的结果,同时置倍频标识位为有效;若基音延时中间值不大于最近正确接收的具有稳定基音延时的浊音帧的基音延时的x倍,则将该基音延时中间值作为第二修正处理后的结果,同时置倍频标识位为无效。
29.如权利要求28所述的补偿装置,其特征在于,
所述第一自适应码本增益补偿模块是用于采用以下方式根据第一丢失帧前接收的一个或两个以上子帧的自适应码本增益推断该第一丢失帧的自适应码本增益,或者根据浊音起始帧的时域语音信号的能量变化推断该第一丢失帧的自适应码本增益:
所述第一自适应码本增益补偿模块判断如果满足以下条件一:浊音起始帧的基音周期内对数能量与长时基音周期内对数能量的差值小于第四阈值或者在基音延时推断中设置的倍频标识位为有效,则将衰减后的第一丢失帧之前一个或两个以上子帧的自适应码本增益的中位数的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
所述第一自适应码本增益补偿模块判断如果不满足条件一,但满足以下条件二:浊音起始帧中最后一个子帧的自适应码本增益在预定范围内,则将对其衰减后的值作为第一丢失帧中每个子帧的自适应码本增益的推断值;
所述第一自适应码本增益补偿模块判断如果不满足条件一也不满足条件二,则计算能量比值RLT和RST,使用衰减后的RLT和RST的加权平均值作为第一丢失帧中每个子帧的自适应码本增益的推断值;其中,RLT表示解码器合成的浊音起始帧的时域语音信号的除第一个基音周期外的能量与除最后一个基音周期外的能量的比值;RST表示表示解码器合成的浊音起始帧的时域语音信号的最后一个基音周期的能量与最后一个基音周期的前一个基音周期的能量的比值,所述基音周期不超过帧长的一半。
30.如权利要求22或26或29所述的补偿装置,其特征在于,
所述补偿装置还包括第二基音延时补偿模块、第二自适应码本增益补偿模块和第二补偿模块,其中:
所述第二基音延时补偿模块,用于对于第一丢失帧之后紧随的一个或两个以上丢失帧,使用当前丢失帧的前一丢失帧的基音延时的推断值作为当前丢失帧的基音延时;
所述第二自适应码本增益补偿模块,用于将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益的推断值进行衰减、插值后得到的自适应码本增益值作为当前丢失帧中各子帧的自适应码本增益;
所述第二补偿模块,用于根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿。
31.如权利要求30所述的补偿装置,其特征在于,
所述第二自适应码本增益补偿模块是用于采用以下方式将当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益的推断值进行衰减、插值后得到的自适应码本增益值作为当前丢失帧中各子帧的自适应码本增益:
所述第二自适应码本增益补偿模块将经过衰减后的当前丢失帧的前一丢失帧的最后一个子帧的自适应码本增益作为当前丢失帧的最后一个子帧的自适应码本增益(gp,end),当前丢失帧的其他子帧的自适应码本增益由处理后的gp,end和gp,end之间的线性插值得到,对gp,end的处理用于使gp,end向1靠近。
32.如权利要求31所述的补偿装置,其特征在于,
所述处理后的gp,end为gp,end的算术平方根。
33.如权利要求22所述的补偿装置,其特征在于,
所述补偿装置还包括自适应码本增益调整模块和第三补偿模块,其中:
所述适应码本增益调整模块,用于对于浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益;
所述第三补偿模块,用于使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
34.如权利要求30所述的补偿装置,其特征在于,
所述补偿装置还包括自适应码本增益调整模块和第三补偿模块,其中:
所述适应码本增益调整模块,用于对于浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益;
所述第三补偿模块,用于使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
35.如权利要求33或34所述的补偿装置,其特征在于,
所述补偿装置还包括第二尺度因子计算模块,其用于计算每个子帧的第二尺度因子,包括激励信号获取单元、预合成单元和第二尺度因子生成单元,其中:
所述激励信号获取单元,用于将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益,再乘以当前子帧的自适应码本,将得到的信号作为当前子帧的激励信号;
所述预合成单元,用于使用所述激励信号进行语音预先合成,根据预先合成的语音信号计算得到当前子帧的信号能量;
所述第二尺度因子生成单元,用于在判断当前子帧的信号能量和当前帧的前一帧最后一个子帧的信号能量的比值的算术平方根超过第七阈值时,将第二尺度因子更新为当前第二尺度因子的Q倍,Q为所述算术平方根与第七阈值的乘积。
36.如权利要求35所述的补偿装置,其特征在于,
所述激励信号获取单元,还用于在将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益之前,判断当前帧的前一丢帧的基音延时的推断值与当前帧解码得到的第一个子帧的基音延时差的绝对值大于第八阈值时,根据浊音起始帧的基音同步自相关系数的线性增函数重新计算新的第二尺度因子,用新的第二尺度因子代替第二尺度因子初值。
37.一种浊音起始帧后帧的补偿装置,其特征在于,所述装置包括补偿模块和自适应码本增益调整模块,其中:
所述补偿模块,用于在浊音起始帧正确接收,当浊音起始帧之后紧随的一个或两个以上帧丢失时,推断丢失帧的基音延时以及自适应码本增益,根据推断得到的基音延时和自适应码本增益对丢失帧进行补偿;
所述自适应码本增益调整模块,对浊音起始帧之后首个正确接收的帧,将该帧中每个子帧解码得到的自适应码本增益乘以该子帧的第二尺度因子得到每个子帧的新的自适应码本增益,使用新的自适应码本增益代替解码得到的自适应码本增益参与语音合成。
38.如权利要求37所述的补偿装置,其特征在于,
所述补偿装置还包括第二尺度因子计算模块,其用于计算每个子帧的第二尺度因子,包括激励信号获取单元、预合成单元和第二尺度因子生成单元,其中:
所述激励信号获取单元,用于将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益,再乘以当前子帧的自适应码本,将得到的信号作为当前子帧的激励信号;
所述预合成单元,用于使用所述激励信号进行语音预先合成,根据预先合成的语音信号计算得到当前子帧的信号能量;
所述第二尺度因子生成单元,用于在判断当前子帧的信号能量和当前帧的前一帧最后一个子帧的信号能量的比值的算术平方根超过第七阈值时,将第二尺度因子更新为当前第二尺度因子的Q倍,Q为所述算术平方根与第七阈值的乘积。
39.如权利要求38所述的补偿装置,其特征在于,
所述激励信号获取单元,还用于在将第二尺度因子初值乘以当前子帧解码得到的自适应码本增益之前,判断当前帧的前一丢帧的基音延时的推断值与当前帧解码得到的第一个子帧的基音延时差的绝对值大于第八阈值时,根据浊音起始帧的基音同步自相关系数的线性增函数重新计算新的第二尺度因子,用新的第二尺度因子代替第二尺度因子初值。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110216736.9A CN102915737B (zh) | 2011-07-31 | 2011-07-31 | 一种浊音起始帧后丢帧的补偿方法和装置 |
PCT/CN2012/077356 WO2013016986A1 (zh) | 2011-07-31 | 2012-06-21 | 一种浊音起始帧后丢帧的补偿方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110216736.9A CN102915737B (zh) | 2011-07-31 | 2011-07-31 | 一种浊音起始帧后丢帧的补偿方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102915737A true CN102915737A (zh) | 2013-02-06 |
CN102915737B CN102915737B (zh) | 2018-01-19 |
Family
ID=47614075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110216736.9A Expired - Fee Related CN102915737B (zh) | 2011-07-31 | 2011-07-31 | 一种浊音起始帧后丢帧的补偿方法和装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN102915737B (zh) |
WO (1) | WO2013016986A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104299614A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 解码方法和解码装置 |
WO2015007076A1 (zh) * | 2013-07-16 | 2015-01-22 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
CN104978966A (zh) * | 2014-04-04 | 2015-10-14 | 腾讯科技(深圳)有限公司 | 音频流中的丢帧补偿实现方法和装置 |
US9852738B2 (en) | 2014-06-25 | 2017-12-26 | Huawei Technologies Co.,Ltd. | Method and apparatus for processing lost frame |
CN113838453A (zh) * | 2021-08-17 | 2021-12-24 | 北京百度网讯科技有限公司 | 语音处理方法、装置、设备和计算机存储介质 |
US11996084B2 (en) | 2021-08-17 | 2024-05-28 | Beijing Baidu Netcom Science Technology Co., Ltd. | Speech synthesis method and apparatus, device and computer storage medium |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107369454B (zh) | 2014-03-21 | 2020-10-27 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
US9565493B2 (en) | 2015-04-30 | 2017-02-07 | Shure Acquisition Holdings, Inc. | Array microphone system and method of assembling the same |
US9554207B2 (en) | 2015-04-30 | 2017-01-24 | Shure Acquisition Holdings, Inc. | Offset cartridge microphones |
US10367948B2 (en) | 2017-01-13 | 2019-07-30 | Shure Acquisition Holdings, Inc. | Post-mixing acoustic echo cancellation systems and methods |
US10997982B2 (en) | 2018-05-31 | 2021-05-04 | Shure Acquisition Holdings, Inc. | Systems and methods for intelligent voice activation for auto-mixing |
WO2019231632A1 (en) | 2018-06-01 | 2019-12-05 | Shure Acquisition Holdings, Inc. | Pattern-forming microphone array |
US11297423B2 (en) | 2018-06-15 | 2022-04-05 | Shure Acquisition Holdings, Inc. | Endfire linear array microphone |
US11310596B2 (en) | 2018-09-20 | 2022-04-19 | Shure Acquisition Holdings, Inc. | Adjustable lobe shape for array microphones |
CN113841419A (zh) | 2019-03-21 | 2021-12-24 | 舒尔获得控股公司 | 天花板阵列麦克风的外壳及相关联设计特征 |
US11558693B2 (en) | 2019-03-21 | 2023-01-17 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality |
US11438691B2 (en) | 2019-03-21 | 2022-09-06 | Shure Acquisition Holdings, Inc. | Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality |
US11445294B2 (en) | 2019-05-23 | 2022-09-13 | Shure Acquisition Holdings, Inc. | Steerable speaker array, system, and method for the same |
EP3977449A1 (en) | 2019-05-31 | 2022-04-06 | Shure Acquisition Holdings, Inc. | Low latency automixer integrated with voice and noise activity detection |
WO2021041275A1 (en) | 2019-08-23 | 2021-03-04 | Shore Acquisition Holdings, Inc. | Two-dimensional microphone array with improved directivity |
US11552611B2 (en) | 2020-02-07 | 2023-01-10 | Shure Acquisition Holdings, Inc. | System and method for automatic adjustment of reference gain |
US11706562B2 (en) | 2020-05-29 | 2023-07-18 | Shure Acquisition Holdings, Inc. | Transducer steering and configuration systems and methods using a local positioning system |
JP2024505068A (ja) | 2021-01-28 | 2024-02-02 | シュアー アクイジッション ホールディングス インコーポレイテッド | ハイブリッドオーディオビーム形成システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6826527B1 (en) * | 1999-11-23 | 2004-11-30 | Texas Instruments Incorporated | Concealment of frame erasures and method |
CN1989548B (zh) * | 2004-07-20 | 2010-12-08 | 松下电器产业株式会社 | 语音解码装置及补偿帧生成方法 |
US8010351B2 (en) * | 2006-12-26 | 2011-08-30 | Yang Gao | Speech coding system to improve packet loss concealment |
CN101286319B (zh) * | 2006-12-26 | 2013-05-01 | 华为技术有限公司 | 改进语音丢包修补质量的语音编码方法 |
CN100550712C (zh) * | 2007-11-05 | 2009-10-14 | 华为技术有限公司 | 一种信号处理方法和处理装置 |
CN101894558A (zh) * | 2010-08-04 | 2010-11-24 | 华为技术有限公司 | 丢帧恢复方法、设备以及语音增强方法、设备和系统 |
-
2011
- 2011-07-31 CN CN201110216736.9A patent/CN102915737B/zh not_active Expired - Fee Related
-
2012
- 2012-06-21 WO PCT/CN2012/077356 patent/WO2013016986A1/zh active Application Filing
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10068578B2 (en) | 2013-07-16 | 2018-09-04 | Huawei Technologies Co., Ltd. | Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient |
US10614817B2 (en) | 2013-07-16 | 2020-04-07 | Huawei Technologies Co., Ltd. | Recovering high frequency band signal of a lost frame in media bitstream according to gain gradient |
US10102862B2 (en) | 2013-07-16 | 2018-10-16 | Huawei Technologies Co., Ltd. | Decoding method and decoder for audio signal according to gain gradient |
CN104299614A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 解码方法和解码装置 |
RU2628159C2 (ru) * | 2013-07-16 | 2017-08-15 | Хуавэй Текнолоджиз Ко., Лтд. | Способ декодирования и устройство декодирования |
CN107818789B (zh) * | 2013-07-16 | 2020-11-17 | 华为技术有限公司 | 解码方法和解码装置 |
CN104299614B (zh) * | 2013-07-16 | 2017-12-29 | 华为技术有限公司 | 解码方法和解码装置 |
CN107818789A (zh) * | 2013-07-16 | 2018-03-20 | 华为技术有限公司 | 解码方法和解码装置 |
US10741186B2 (en) | 2013-07-16 | 2020-08-11 | Huawei Technologies Co., Ltd. | Decoding method and decoder for audio signal according to gain gradient |
WO2015007114A1 (zh) * | 2013-07-16 | 2015-01-22 | 华为技术有限公司 | 解码方法和解码装置 |
WO2015007076A1 (zh) * | 2013-07-16 | 2015-01-22 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
CN104978966B (zh) * | 2014-04-04 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 音频流中的丢帧补偿实现方法和装置 |
CN104978966A (zh) * | 2014-04-04 | 2015-10-14 | 腾讯科技(深圳)有限公司 | 音频流中的丢帧补偿实现方法和装置 |
US10529351B2 (en) | 2014-06-25 | 2020-01-07 | Huawei Technologies Co., Ltd. | Method and apparatus for recovering lost frames |
US9852738B2 (en) | 2014-06-25 | 2017-12-26 | Huawei Technologies Co.,Ltd. | Method and apparatus for processing lost frame |
US10311885B2 (en) | 2014-06-25 | 2019-06-04 | Huawei Technologies Co., Ltd. | Method and apparatus for recovering lost frames |
US11996084B2 (en) | 2021-08-17 | 2024-05-28 | Beijing Baidu Netcom Science Technology Co., Ltd. | Speech synthesis method and apparatus, device and computer storage medium |
CN113838453A (zh) * | 2021-08-17 | 2021-12-24 | 北京百度网讯科技有限公司 | 语音处理方法、装置、设备和计算机存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN102915737B (zh) | 2018-01-19 |
WO2013016986A1 (zh) | 2013-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102915737A (zh) | 一种浊音起始帧后丢帧的补偿方法和装置 | |
US10643624B2 (en) | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization | |
RU2419891C2 (ru) | Способ и устройство эффективной маскировки стирания кадров в речевых кодеках | |
JP5190363B2 (ja) | 音声復号装置、音声符号化装置、および消失フレーム補償方法 | |
US11410663B2 (en) | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pitch lag estimation | |
US11211077B2 (en) | Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program | |
CN101286319B (zh) | 改进语音丢包修补质量的语音编码方法 | |
US20120239389A1 (en) | Audio signal processing method and device | |
CN105359209A (zh) | 在错误隐藏过程中在不同域中改善信号衰落的装置及方法 | |
US20090037168A1 (en) | Apparatus for Improving Packet Loss, Frame Erasure, or Jitter Concealment | |
ES2856199T3 (es) | Concepto para codificar una señal de audio y decodificar una señal de audio usando información de conformación espectral relacionada con la voz | |
WO2017166800A1 (zh) | 丢帧补偿处理方法和装置 | |
CN100578618C (zh) | 一种解码方法及装置 | |
EP3058569B1 (en) | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information | |
CN107818789A (zh) | 解码方法和解码装置 | |
US8370154B2 (en) | Method and apparatus for generating an excitation signal for background noise | |
US8195469B1 (en) | Device, method, and program for encoding/decoding of speech with function of encoding silent period | |
Gournay et al. | Performance analysis of a decoder-based time scaling algorithm for variable jitter buffering of speech over packet networks | |
MX2010012406A (es) | Método para almacenar mensajes, método para enviar mensajes y servidor de mensajes. | |
JP2001094507A (ja) | 擬似背景雑音生成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180119 Termination date: 20190731 |
|
CF01 | Termination of patent right due to non-payment of annual fee |