CN101615394A - 分配子帧的方法和装置 - Google Patents

分配子帧的方法和装置 Download PDF

Info

Publication number
CN101615394A
CN101615394A CN200910151834A CN200910151834A CN101615394A CN 101615394 A CN101615394 A CN 101615394A CN 200910151834 A CN200910151834 A CN 200910151834A CN 200910151834 A CN200910151834 A CN 200910151834A CN 101615394 A CN101615394 A CN 101615394A
Authority
CN
China
Prior art keywords
subframe
sampling point
signal
pitch period
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200910151834A
Other languages
English (en)
Other versions
CN101615394B (zh
Inventor
张德军
齐峰岩
苗磊
许剑峰
张清
哈维·米希尔·塔迪
李立雄
马付伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2009101518341A priority Critical patent/CN101615394B/zh
Publication of CN101615394A publication Critical patent/CN101615394A/zh
Priority to EP14163318.0A priority patent/EP2755203A1/en
Priority to ES12185319.6T priority patent/ES2509817T3/es
Priority to EP09836080A priority patent/EP2296144B1/en
Priority to EP12185319.6A priority patent/EP2538407B1/en
Priority to PCT/CN2009/076309 priority patent/WO2010075793A1/zh
Priority to ES09836080T priority patent/ES2395365T3/es
Priority to US12/982,142 priority patent/US8843366B2/en
Application granted granted Critical
Publication of CN101615394B publication Critical patent/CN101615394B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Abstract

本发明的实施例公开了一种分配子帧的方法和装置,能够解决现有技术简单平均分帧导致各子帧增益大小不一致的问题。本发明实施例提供的方法包括:获取信号的线性预测编码LPC预测阶数和基音周期;根据所述LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;将所述剩余样点的信号分为若干子帧。本发明实施例提供的技术方案可用于多媒体语音编码领域。

Description

分配子帧的方法和装置
技术领域
本发明涉及语音编码技术领域,具体而言是涉及一种分配子帧的方法和装置。
背景技术
在对语音信号进行处理时,为降低编解码器处理的运算复杂度及处理时延,一般会将语音信号进行分帧处理。在将信号进行分帧处理以后,由于语音信号在一段时间内比较稳定,各参数变化缓慢,因此,在对信号进行短时预测时按照帧长度进行处理即可满足量化精度等的要求。另外,由于人在发声时,声门的振动具有一定的频率,这个振动的频率就是基音周期。当基音周期较小时,如果选择的帧长过长,那么会导致一帧语音信号内有多个不同的基音周期存在,这样计算得到的基音周期将不准确,因此,需要将一帧再平均分为多个子帧。
在某些无损或有损压缩领域,为了降低网络丢帧对声音质量的影响,要求当前帧对上一帧没有依赖性,如G.711LLC(LossLess Coding,无损压缩)中规定不能利用过去历史缓冲区的数据来预测当前帧的信号,那么只能够利用当前帧前面一部分的信号来预测当前帧后面一部分的信号。如果仍采用现有技术对整帧信号进行平均分帧的方法进行处理,就会导致开始的若干个子帧只有很少一部分数据进行长时预测(Long Term Prediction,LTP)合成,如图1所示,对8khz采样率,20ms的帧长,平均分为4个子帧,每个子帧40个样点,假设第一子帧的基音周期为T[0]=34,那么对于第一子帧,其实际能够用LTP算法进行合成的样点数只有40-34=6个样点,其前34个样点均作为后续子帧的历史缓冲区对待。这样第一个子帧的增益相对后续子帧变化会比较大,导致其计算得到的增益与后续子帧有较大区别。从而不利于后续的处理。如果T[0]大于帧长长度,如T[0]=60,则连第二子帧都会受到影响。
发明内容
本发明实施例提供了一种分配子帧的方法和装置,能够解决现有技术简单平均分帧导致各子帧增益大小不一致的问题。
本发明实施例提供的一种分配子帧的方法,包括:
获取信号的线性预测编码LPC预测阶数和基音周期;
根据所述LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;
将所述剩余样点的信号分为若干子帧。
本发明实施例提提供的分配子帧的装置,包括:
获取单元,用于获取信号的线性预测编码LPC预测阶数和基音周期;
样点去除单元,用于根据所述获取单元获取的LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;
子帧划分单元,用于将所述样点去除单元去除后的所述剩余样点的信号分为若干子帧。
由以上本发明实施例提供的技术方案可知,根据得到的LPC预测阶数和基音周期,通过去除掉不适用于长时预测LTP合成的样点后,再将所述剩余样点的信号分为若干子帧,能够保证划分后的每个子帧都可以使用较一致的样点进行LTP合成,得到较一致的LTP增益,因此能够解决现有技术简单平均分配子帧所导致各子帧增益大小不一致的问题,并可以降低运算复杂度,节省增益量化的比特,而又不影响性能。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中平均分配子帧的方法示意图;
图2为本发明实施例提供的一种分配子帧的方法流程示意图;
图3为本发明实施例提供了一种分配子帧的方法流程示意图;
图4为图3所提供的方法实施例的一种分配子帧的实例图;
图5为本发明实施例提供了另一种分配子帧的方法流程示意图;
图6为图5所提供的方法实施例的一种分配子帧的实例图;
图7为图5所提供的方法实施例的另一种分配子帧的实例图;
图8为本发明实施例提供的再一种分配子帧的方法流程示意图;
图9为图8所提供的方法实施例的一种分配子帧的实例图;
图10为本发明实施例提供的一种分配子帧的装置结构示意图;
图11为本发明实施例提供的另一种分配子帧的装置结构示意图;
图12为本发明实施例提供的再一种分配子帧的装置结构示意图;
图13为本发明实施例提供的一种分配子帧的方法流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图2,本发明实施例提供的一种分配子帧的方法,包括:
步骤21,获取信号的线性预测编码LPC预测阶数和基音周期;
步骤22,根据所述LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;
步骤23,将所述剩余样点的信号分为若干子帧。
在基于线性预测编码(Linear Prediction Coding,LPC)中,LPC预测采用的方式可以为固定方式,也可以为自适应的方式。固定方式就是预测阶数是一个固定的整数(如4、8、12、16等),可以根据经验和编码器特性选定;自适应方式就是每个信号最终的预测阶数可能都不一样,这里用lpc_order表示最终的LPC预测阶数。
例如,本实施例采用自适应方式确定LPC预测阶数的方法:
(1)对在线性空间的信号的样点,用最大预测阶数进行LPC分析,得到反射系数(PARCOR coefficients)ipar[0],……ipar[N-1],N为最大预测阶数;
(2)计算不同阶数下,量化后的反射系数的比特数Bc[1],……Bc[N];
(3)用不同的阶数进行LPC预测,得到预测的残差,对残差进行熵编码,得到不同阶数下进行熵编码需要的比特数Be[1],……Be[N];
(4)计算不同阶数需要的总比特数Btotal[1],……Btotal[N],其中Btotal[i]=Be[i]+Bc[i];
(5)从Btotal[1],……Btotal[N]中找出最小的Btotal[j],则j就是最优的阶数lpc_order。
计算自适应预测阶数lpc_order的方法很多,本发明实施例不限于上述方法。
由于LPC预测就是用过去的lpc_order个样点来预测当前样点的值,那么我们可以知道对于每帧信号开始的lpc_order个样点其预测精度逐渐提升(参与预测的点数越来越多,预测的越来越精确)。对于第一个样点,前面没有其他样点,因此无法使用LPC预测,其预测值为0。对于第二个样点到第lpc_order个样点,LPC预测公式如下:
x ′ ( n ) = Σ i = 1 n - 1 a i ′ · x ( n - i ) , n = 1 , . . . , lpc _ order - 1 - - - ( 1 )
对于lpc_order个样点后的其他样点,LPC预测公式如下:
x ′ ( n ) = Σ i = 1 lpc _ order a i ′ · x ( n - i ) , n > = lpc _ order - - - ( 2 )
不妨设每个信号为x(n),n=0,1,…,L,L为信号长度(即样点数,如40、80、160、240、320等正整数),LPC预测残差信号为res(n),如下:
res(n)=x(n)-x′(n).(3)
由于前lpc_order个样点预测不够精确,那么经过lpc预测后得到的LPC预测残差信号会较大。为了避免其影响长时预测LTP合成的性能,这些前0到lpc_order个样点的全部或部分样点将有可能不适用于LTP合成,因此有必要去除。
本发明实施例中,获取的的基音周期可以为整个语音帧的基音周期T0,T0的获取可以通过计算相关函数获得。如,令下面公式取得最大值时的d为T0:
corr ( d ) = &Sigma; n = 0 L 1 - 1 res ( n ) res ( n - d ) &Sigma; n = 0 L 1 - 1 res 2 ( n ) &Sigma; n = 0 63 res 2 ( n - d ) , 20 &le; d < 84 - - - ( 4 )
其中L1为求解相关函数所用的样点数。
某些实施方式中,如果语音帧事前经过分帧处理,则获取的基音周期还可以为经过分帧处理的语音帧的第一子帧的基音周期。
由于只能够利用当前信号前面一部分的信号来预测当前帧后面一部分的信号,为了保证LTP合成时每个子帧的长度一致,因此还需要去除当前信号前面的基音周期个样点。
本发明实施例提供的分配子帧的方法,根据上述得到的LPC预测阶数和基音周期,通过去除掉不适用于长时预测LTP合成的样点后,再将剩余样点的信号分为若干子帧,能够保证划分后的每个子帧都可以使用较一致的样点进行LTP合成,得到较一致的LTP增益,因此能够解决现有技术简单平均分配子帧所导致各子帧增益大小不一致的问题,并可以降低运算复杂度,节省增益量化的比特,而又不影响性能。
参见图3,一种分配子帧的方法实施例,该实施例中获取的信号以一帧信号为例进行说明,该方法包括:
步骤31,获取信号帧的线性预测编码LPC预测阶数lpc_order和基音周期T0。
某些实施方式中,如果信号帧经过事先分帧,本步骤中也可以通过获取第一子帧的基音周期来代替基音周期T0。为叙述方便,本实施例及后续实施例中,在此步骤中都以T0为例进行说明。
步骤32,去除所述信号帧起始的前lpc_order个样点和接下来的T0个样点。
所述接下来是指紧邻前面lpc_order个样点的后面T0个样点,比如说,一帧信号中有100个样点0-99,LPC预测阶数lpc_order=10,基音周期T0=20,则首先去除所述信号前lpc_order个样点:0-9,然后再去除接下来的T0个样点:10-29。
步骤33,根据所述信号的长度确定要划分子帧的个数S。
根据输入信号的长度将一帧信号划分为若干子帧,不同的信号长度分为不同个数子帧。例如对于以8khz采样,可以将20ms的帧长分为2个子帧、30ms的帧长分为3个子帧、40ms的帧长分为4个子帧。分的子帧越多,因为每个子帧的基音周期都要传到解码端,因此所用来编码基音周期花销的比特也越多,因此为了使其在性能提升和运算复杂度等方面得到最好的折中,需要合理确定要划分的子帧的个数。
某些实施方式中,也可以将20ms的帧长分为1个子帧、30ms的帧长分为2个子帧、40ms的帧长分为3个子帧,即包含160个样点的一帧信号只包括1个子帧、包含240个样点的一帧信号包括2个子帧、包含320个样点的一帧信号包括3个子帧。
以下以20ms的帧长分为2个子帧为例进行说明。采用其他划分子帧个数的方式进行的后续操作可以参照执行,也在本发明的保护范围之内。
步骤34,将所述信号剩余的样点与所述S相除后向下取整,得到前S-1个子帧的每个子帧的长度。
L为帧长,
Figure A20091015183400132
表示向下取整,如:
Figure A20091015183400133
步骤35,将所述信号帧剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
参见图4,这里以8khz采样、20ms的帧长分为2个子帧进行描述,信号帧长L=160个样点,获取到的信号帧的LPC预测阶数lpc_order=12个样点,基音周期T0=35个样点,从信号帧中去除起始的前lpc_order+T0=12+35=47个样点后,将剩余的L-(lpc_order+T0)=160-47=113个样点与2相除后向下取整得到第一子帧是长度为56个样点,第二个子帧的长度也即最后一个子帧的长度为113-56=57个样点。
本发明实施例提供的分配子帧的方法,根据上述得到的LPC预测阶数和基音周期,通过去除掉所述信号帧起始的前所述LPC预测阶数个样点和接下来的所述基音周期个样点后,再将剩余样点的信号帧分为若干子帧,能够保证划分后的每个子帧都可以使用较一致的样点进行LTP合成,得到较一致的LTP增益,因此能够解决现有技术简单平均分配子帧所导致各子帧增益大小不一致的问题,并可以降低运算复杂度,节省增益量化的比特,而又不影响性能。
参见图5,本发明实施例提供了另一种分配子帧的方法,该实施例中获取的信号以一帧信号为例进行说明,该方法包括:
步骤51,获取信号帧的线性预测编码LPC预测阶数lpc_order和基音周期T0。
步骤52,去除所述信号帧起始的前0到所述lpc_order-1中任意整数个样点和接下来的T0个样点。
步骤53,根据所述信号帧的长度确定要划分子帧的个数S。
步骤54,将所述信号帧剩余的样点与所述S相除后向下取整,得到前S-1个子帧的每个子帧的长度。
步骤55,将所述信号帧剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
本发明实施例与上一个实施例不同之处在于,所述去除不适用于LTP合成的样点包括只去掉信号帧起始的前lpc_order个样点中一部分样点和接下来的基音周期个样点的影响。其他步骤相同,在此不再赘述。
根据上述分析知,由于前lpc_order个样点预测不够精确,但越靠后,预测精度越高,有时候让精度较高的样点也加入LTP合成。为了能够使更多样点参与到LTP合成中去,本实施例只需要去掉这前lpc_order个样点中的一部分,如V个样点,V=0,1,…,lpc_order-1。V的选取可以根据经验选取一个固定值(例如4、5等),也可以通过计算得到,如V=lpc_order/2等。通过使更多的样点参与LTP合成,有时可以取得比上一种方法更好的效果。
参见图6,这里仍以8khz采样、20ms的帧长分为2个子帧进行描述,信号帧长L=160个样点,获取到的信号帧的LPC预测阶数lpc_order=12个样点,基音周期T0=35个样点,从信号帧中去除起始的前lpc_order中部分个样点V,这里取V=lpc_order/2=6,及接下来的基音周期T0=35个样点后,将剩余的L-(V+T0)=160-6-35=119个样点与2相除后向下取整得到第一子帧是长度为59个样点,第二个子帧的长度也即最后一个子帧的长度为119-59=60个样点。
一种实施例,参见图7,仍以8khz采样、20ms的帧长分为2个子帧进行描述,信号帧长L=160个样点,获取到的信号帧的LPC预测阶数lpc_order=12个样点,基音周期T0=35个样点,从信号帧中仅去除起始的前基音周期T0=35个样点,使lpc order个样点全部参与到LTP合成中,将剩余的L-T0=160-35=125个样点与2相除后向下取整得到第一子帧是长度为62个样点,第二个子帧的长度也即最后一个子帧的长度为125-62=63个样点。
本发明实施例提供的分配子帧的方法,根据上述得到的LPC预测阶数和基音周期,通过去除掉所述信号帧起始的前所述LPC预测阶数中部分个样点(可以是0到LPC预测阶数-1的任意整数个样点)和接下来的所述基音周期个样点后,再将剩余样点的信号帧分为若干子帧,能够保证划分后的每个子帧都可以使用较一致的样点进行LTP合成,得到较一致的LTP增益,因此能够解决现有技术简单平均分配子帧所导致各子帧增益大小不一致的问题,并可以降低运算复杂度,节省增益量化的比特,而又不影响性能。
由于在没有分帧之前,无法知道第一子帧的基音周期值T[0]。但是,由于一帧信号内基音周期的变化不会太大,T[0]是一个在T0小范围内波动的值,如T[0]∈[T0-2,T0+2],所以,本发明以上实施例采用用整帧信号的基音周期T0代替第一子帧的基音周期值T[0]的方式,去除不适用于LTP合成的样点,再将剩余样点的信号帧分为若干子帧,并直接将分帧后的子帧长度作为最终的子帧长度。
参见图8,本发明实施例还提供的一种分配子帧的方法,该实施例中获取的信号以一帧信号为例进行说明,该方法包括:
步骤81,获取信号帧的线性预测编码LPC预测阶数lpc_order和第一子帧的基音周期T[0]。
本实施例中采用预分帧的方式获取第一子帧的基音周期T[0]。具体方法为:首先将整帧信号的基音周期T0作为第一子帧的基音周期进行分帧,得到第一子帧的长度后,在所述信号帧的基音周期波动范围内进行搜索,确定第一子帧的基音周期。
步骤82,去除所述信号帧起始的前0到lpc_order的任意整数个样点和接下来的T[0]个样点。
步骤83,根据所述信号帧的长度确定要划分子帧的个数S。
步骤84,将所述信号帧剩余的样点与所述S相除后向下取整,得到前S-1个子帧的每个子帧的长度。
需要说明的是,为了降低复杂度,这一步也可以省略,直接用之前计算好的子帧长度进行后续的计算。
步骤85,将所述信号帧剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
参见图9,这里仍以8khz采样、20ms的帧长分为2个子帧进行描述,信号帧长L=160个样点,获取到的信号帧的LPC预测阶数lpc_order=12个样点,基音周期T0=35个样点。首先进行预分帧,以T0=35取代第一子帧的最佳基音周期T[0],从信号帧中去除起始的前lpc_order+T0=12+35=47个样点后,将剩余的L-(lpc_order+T0)=160-47=113个样点与2相除后向下取整得到第一子帧是长度为56个样点,获取第一子帧是长度后,在T0波动范围内T[0]∈[T0-2,T0+2]进行搜索,确定第一子帧的最佳基音周期T[0]=34个样点,再按照得到的第一子帧的最佳基音周期T[0]重新进行子帧的划分:去除前lpc_order+T[0]=12+34=46个样点后,将剩余的L-(lpc_order+T[0])=160-46=114个样点与2相除后向下取整得到第一子帧是长度为57个样点,第二个子帧的长度也即最后一个子帧的长度为114-57=57个样点。
本发明实施例提供的分配子帧的方法,首先进行预分帧获取预分帧的第一子帧的基音周期,通过去除掉所述信号帧起始的前所述LPC预测阶数中全部或部分个样点(可以是0到LPC预测阶数的任意整数个样点)和接下来的所述第一子帧的基音周期个样点后,再将所述剩余样点的信号帧分为若干子帧,能够保证划分后的每个子帧都可以使用较一致的样点进行LTP合成,得到较一致的LTP增益,因此能够解决现有技术简单平均分配子帧所导致各子帧增益大小不一致的问题,并可以降低运算复杂度,节省增益量化的比特,而又不影响性能。
参见图13,本发明实施例还提供一种分配子帧的方法,该实施例中获取的信号以一帧信号为例进行说明,该方法包括:
步骤141,获取信号的线性预测编码LPC预测阶数和基音周期T0;
步骤142,根据所述LPC预测阶数和基音周期T0,去除不适用于长时预测LTP合成的样点;
步骤143,将剩余样点的信号分为若干子帧。
上述步骤141至步骤143也就是根据基音周期T0,进行自适应分帧,得到各个子帧的长度的过程,在前面实施例已有比较详细的描述,本处不再赘述。
步骤144,根据所述若干子帧中第一子帧的长度,对所述第一子帧进行基音搜索,确定第一子帧基音周期T[0]。
本发明实施例中,在步骤143将剩余样点信号分为若干子帧,得到第一子帧的长度后,在语音帧基音周期T0波动范围内,如T[0]∈[T0-2,T0+2]进行搜索,确定第一子帧的基音周期T[0]。
步骤145,根据LPC预测阶数、第一子帧基音周期和各个子帧的长度,重新确定所述各个子帧的起始点和终止点。
本发明实施例中,当确定了第一子帧基音周期T[0]后,由于T[0]与T0的值可能不同,所以重新去除不适用于长时预测LTP合成的样点后,第一子帧的起始点可能会发生变化,需要调整第一子帧的起始点和终止点,同时由于各子帧的长度仍然采用步骤143获得的各子帧长度,相应的第一子帧后续的各子帧的起始点和终止点也需要重新确定。此时可能由于各子帧长度没有改变,而使各子帧长度之和与信号剩余样点数不相等,但这并不影响本发明实施例效果的实现。某些实施方式中,作为进一步的优化,也可以保持前S-1个子帧长度不变,而将信号剩余的样点减去所述前S-1个子帧的总长度,得到的差值作为第S个子帧的长度。
本发明实施例中,仍然采用步骤143获得的各子帧长度而不重新确定各子帧的长度,可以降低运算的复杂度。
可以理解的,确定第一子帧基音周期T[0]后,重新去除不适用于长时预测LTP合成的样点可以是去除所述信号帧起始的前lpc_order个样点和接下来的T[0]个样点,也可以是去除所述信号帧起始的前0到所述lpc_order-1中任意整数个样点和接下来的T[0]个样点。
步骤146,对第一子帧的后续各子帧进行基音搜索,得到所述后续各子帧的基音周期。
某些实施方式中,可以对第一子帧的后续各子帧进行基音搜索,从而得到所有子帧的基音周期,以便于去掉信号中的长时相关性,及便于解码端进行解码。确定后续子帧基音周期的方法可以参考步骤144的方法,此处不再赘述。
需要说明的是,某些实施方式中,步骤146关于确定后续各子帧基音周期的步骤也可以在步骤145之前执行,不影响本发明实施例目的的实现;在另外一些实施方式中,步骤146也可以与步骤144合并在一起,即在步骤144中对各个子帧进行基音搜索,得到包括第一子帧基音周期T[0]在内的各个子帧的基音周期。可见,本发明实施例不限定确定后续各子帧基音周期的执行时机,只要能实现本发明目的的各种变形,均在本发明的保护范围之内。
步骤147,根据第一子帧基音周期T[0],重新进行自适应分帧,得到各个子帧长度。
某些实施方式中,为进一步使各子帧确定的更加合理,以得到更加一致的LTP增益,使本发明实施例具有更优的技术效果,可以根据第一子帧基音周期T[0],对语音帧进行二次分帧,重新得到各个子帧的长度。
对语音帧进行二次分帧的方法可以根据所述LPC预测阶数和所述第一子帧基音周期T[0]重新去除不适用于LTP合成的样点,将重新得到的剩余样点的信号分为若干子帧。
具体的,可以根据所述信号的长度确定要划分子帧的个数S;将重新得到的所述信号剩余的样点与所述S相除后向下取整,得到前S-1个子帧的每个子帧的长度,即
Figure A20091015183400191
L为帧长,
Figure A20091015183400192
表示向下取整,如:
Figure A20091015183400193
将重新得到的所述信号剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
可以理解的,某些实施方式中,前述步骤146也可以在本步骤147之后执行。
本发明实施例提供的分配子帧的方法,首先通过分帧获得第一子帧的基音周期,根据LPC预测阶数、第一子帧基音周期和各个子帧的长度,重新确定所述各个子帧的起始点和终止点,可以使得到的各个子帧的LTP增益更加一致。
本发明实施例通过二次分帧,能够进一步保证划分后的每个子帧都可以使用较一致的样点进行LTP合成,得到较一致的LTP增益,因此能够解决现有技术简单平均分配子帧所导致各子帧增益大小不一致的问题,并可以降低运算复杂度,节省增益量化的比特,而又不影响性能。
本发明实施例通过对第一子帧的后续各子帧进行基音搜索,从而得到所有子帧的基音周期,有利于去掉信号中的长时相关性,及便于解码端进行解码。
参见图10,本发明实施例还提供一种分配子帧的装置,包括:
获取单元101,用于获取信号的线性预测编码LPC预测阶数和基音周期;
样点去除单元102,用于根据所述获取单元101获取的LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;
子帧划分单元103,用于将所述样点去除单元102去除后的所述剩余样点的信号分为若干子帧。
仍参见图10,其中所述子帧划分单元103包括:
子帧数确定模块131,用于根据所述信号帧的长度确定要划分子帧的个数S;
子帧长度分配模块132,用于将所述样点去除单元102去除后的所述信号帧剩余的样点与所述子帧数确定模块确定的S相除后向下取整,得到前S-1个子帧的每个子帧的长度;
尾子帧长度确定模块133,用于将所述信号帧剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
参见图11,一种实施例,所述样点去除单元102采用第一样点去除模块121,该第一样点去除模块121用于去除所述信号起始的前所述LPC预测阶数个样点和所述基音周期个样点,然后由子帧划分单元102进行子帧的分配。
一种实施例,所述样点去除单元102采用第二样点去除模块122,该第二样点去除模块122用于去除所述信号起始的前所述LPC预测阶数中部分个样点(0到LPC预测阶数-1之间的任意整数个样点)和接下来的所述基音周期个样点,然后由子帧划分单元102进行子帧长度的分配。
参见图12,再一种实施例,本发明实施例提供的分配子帧的装置还包括:
首子帧基音周期确定单元120,用于根据所述子帧长度分配模块132得到的第一子帧的长度,在所述信号的基音周期波动范围内进行搜索,确定第一子帧的基音周期。
所述样点去除单元102采用第三样点去除模块123,该第三样点去除模块123用于去除所述信号起始的前0到所述LPC预测阶数的任意整数个样点和接下来的所述第一子帧的基音周期个样点,然后再由子帧划分单元102进行子帧的分配。某些实施方式中,所述子帧划分单元102也用于根据各个子帧的长度,重新确定所述各个子帧的起始点和终止点。
本发明实施例提供的分配子帧的装置,根据获取单元101得到的LPC预测阶数和基音周期,通过样点去除单元102去除掉不适用于长时预测LTP合成的样点后,再由子帧划分单元103将所述剩余样点的信号帧分为若干子帧,无论样点去除单元102采用第一样点去除模块121、第二样点去除模块122还是第三样点去除模块123,都能够保证划分后的每个子帧可以使用较一致的样点进行LTP合成,得到较一致的LTP增益,因此能够解决现有技术简单平均分配子帧所导致各子帧增益大小不一致的问题,并可以降低运算复杂度,节省增益量化的比特,而又不影响性能。
下面结合本发明实施例提供的分配子帧的装置对分配子帧的方法进行说明:
获取单元101获取信号的线性预测编码LPC预测阶数和基音周期T0。某些实施方式中,如果信号帧经过事先分帧,也可以通过获取第一子帧的基音周期来代替基音周期T0。为叙述方便,本实施例以T0为例进行说明。
样点去除单元102根据所述LPC预测阶数和基音周期T0,去除不适用于长时预测LTP合成的样点。某些实施方式中,可以采用第一样点去除模块121去除所述信号帧起始的前lpc_order个样点和接下来的T0个样点;另外一些实施方式中,可以采用第二样点去除模块122去除所述信号帧起始的前0到所述lpc_order-1中任意整数个样点和接下来的T0个样点。
子帧划分单元103将剩余样点的信号分为若干子帧。具体可以为子帧数确定模块131根据所述信号的长度确定要划分子帧的个数S,子帧长度分配模块132将所述信号剩余的样点与所述S相除后向下取整,得到前S-1个子帧的每个子帧的长度,尾子帧长度确定模块133将所述信号帧剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
进一步的,可以对语音帧进行二次分帧,首子帧基音周期确定单元120根据所述若干子帧中第一子帧的长度,对所述第一子帧进行基音搜索,确定第一子帧基音周期T[0]。
第三样点去除模块123去除所述信号起始的前所述LPC预测阶数个样点和接下来的所述第一子帧的基音周期T[0]个样点,或者去除所述信号起始的前0到所述LPC预测阶数的任意整数个样点和接下来的所述第一子帧的基音周期个样点。然后再由子帧划分单元102进行二次分帧。某些实施方式中,所述子帧划分单元102也可以根据一次分帧确定的各个子帧的长度,重新确定所述各个子帧的起始点和终止点。另外一些实施方式中,也可以是子帧划分单元102重新确定所述各子帧的起始点和终止点,再对语音帧进行二次分帧。
需要说明的是,本发明实施例中的方法可以软件功能模块的形式实现,并且该软件功能模块作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明实施例所提供的分配子帧的方法和装置进行了详细介绍,实施例的说明只是用于帮助理解本发明的方法及其思想;任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (16)

1、一种分配子帧的方法,其特征在于,包括:
获取信号的线性预测编码LPC预测阶数和基音周期;
根据所述LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;
将剩余样点的信号分为若干子帧。
2、根据权利要求1所述的方法,其特征在于,所述不适用于长时预测LTP合成的样点包括:
所述信号起始的前所述LPC预测阶数个样点和所述基音周期个样点。
3、根据权利要求1所述的方法,其特征在于,所述不适用于长时预测LTP合成的样点包括:
所述信号起始的前0到所述LPC预测阶数-1的任意整数个样点和所述基音周期个样点。
4、根据权利要求2或3所述的方法,其特征在于,所述将所述剩余样点的信号分为若干子帧包括:
根据所述信号的长度确定要划分子帧的个数S;
将所述信号剩余的样点与所述S相除后向下取整,得到前S-1个子帧的每个子帧的长度;
将所述信号剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
5、根据权利要求1所述的方法,其特征在于,所述将剩余样点的信号分为若干子帧后,所述方法还包括:
根据所述若干子帧中第一子帧的长度,对所述第一子帧进行基音搜索,确定第一子帧基音周期;
根据所述LPC预测阶数、所述第一子帧基音周期和各个子帧的长度,重新确定所述各个子帧的起始点和终止点。
6、根据权利要求1所述的方法,其特征在于,所述将剩余样点的信号分为若干子帧后,所述方法还包括:
根据所述若干子帧中第一子帧的长度,对所述第一子帧进行基音搜索,确定第一子帧基音周期;
根据所述LPC预测阶数和所述第一子帧基音周期重新去除不适用于LTP合成的样点;
将重新得到的剩余样点的信号分为若干子帧。
7、根据权利要求5或6所述的方法,其特征在于,所述根据所述若干子帧中第一子帧的长度,对所述第一子帧进行基音搜索,确定第一子帧基音周期后,所述方法还包括:
对所述第一子帧的后续各子帧进行基音搜索,得到所述后续各子帧的基音周期。
8、一种分配子帧的方法,其特征在于,所述方法包括:
获取信号的线性预测编码LPC预测阶数和基音周期;
根据所述LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;
将剩余样点的信号分为若干子帧;
根据第一子帧的长度,对所述第一子帧进行基音搜索,确定第一子帧基音周期;
根据所述LPC预测阶数、所述第一子帧基音周期和各个子帧的长度,重新确定所述各个子帧的起始点和终止点。
根据所述LPC预测阶数和所述第一子帧基音周期重新去除不适用于LTP合成的样点;
将重新得到的剩余样点的信号分为若干子帧。
9、根据权利要求8所述的方法,其特征在于,所述重新去除不适用于LTP合成的样点包括:
去除所述信号起始的前所述LPC预测阶数个样点和所述第一子帧基音周期个样点。
10、根据权利要求8或9所述的方法,其特征在于,所述将重新得到的剩余样点的信号分为若干子帧包括:
根据所述信号的长度确定要划分子帧的个数S;
将重新得到的所述信号剩余的样点与所述S相除后向下取整,得到前S-1个子帧的每个子帧的长度;
将重新得到的所述信号剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
11、一种分配子帧的装置,其特征在于,包括:
获取单元,用于获取信号的线性预测编码LPC预测阶数和基音周期;
样点去除单元,用于根据所述获取单元获取的LPC预测阶数和基音周期,去除不适用于长时预测LTP合成的样点;
子帧划分单元,用于将所述样点去除单元去除后的所述剩余样点的信号分为若干子帧。
12、根据权利要求11所述的装置,其特征在于,所述样点去除单元具体为下述任意一个模块:
第一样点去除模块,用于去除所述信号起始的前所述LPC预测阶数个样点和所述基音周期个样点;或,
第二样点去除模块,用于去除所述信号起始的前0到所述LPC预测阶数-1的任意整数个样点和所述基音周期个样点。
13、根据权利要求12所述的装置,其特征在于,所述子帧划分单元包括:
子帧数确定模块,用于根据所述信号的长度确定要划分子帧的个数S;
子帧长度分配模块,用于将所述样点去除单元去除后的所述信号剩余的样点与所述子帧数确定模块确定的S相除后向下取整,得到前S-1个子帧的每个子帧的长度;
尾子帧长度确定模块,用于将所述信号剩余的样点减去所述前S-1个子帧的总长度,得到的差值为第S个子帧的长度。
14、根据权利要求11至13任一项所述的装置,其特征在于,所述装置还包括:
首子帧基音周期确定单元,用于根据所述子帧长度分配模块得到的第一子帧的长度,在所述信号的基音周期波动范围内进行搜索,确定第一子帧的基音周期。
15、根据权利要求14所述的装置,其特征在于,所述样点去除单元还具体为:
第三样点去除模块,用于去除所述信号起始的前0到所述LPC预测阶数的任意整数个样点和所述第一子帧的基音周期个样点;且,
所述子帧划分单元,具体用于根据各个子帧的长度,重新确定所述各个子帧的起始点和终止点。
16、根据权利要求14所述的装置,其特征在于,所述样点去除单元还具体为:
第三样点去除模块,用于去除所述信号起始的前0到所述LPC预测阶数的任意整数个样点和所述第一子帧的基音周期个样点;且,
所述子帧划分单元,具体用于将所述第三样点去除模块去除后的所述剩余样点的信号分为若干子帧。
CN2009101518341A 2008-12-31 2009-06-25 分配子帧的方法和装置 Active CN101615394B (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN2009101518341A CN101615394B (zh) 2008-12-31 2009-06-25 分配子帧的方法和装置
EP12185319.6A EP2538407B1 (en) 2008-12-31 2009-12-31 Sub-framing computer-readable storage medium
ES12185319.6T ES2509817T3 (es) 2008-12-31 2009-12-31 Soporte de almacenamiento legible por ordenador para la asignación de sub-tramas
EP09836080A EP2296144B1 (en) 2008-12-31 2009-12-31 Method and apparatus for distributing sub-frame
EP14163318.0A EP2755203A1 (en) 2008-12-31 2009-12-31 Framing method and apparatus of an audio signal
PCT/CN2009/076309 WO2010075793A1 (zh) 2008-12-31 2009-12-31 分配子帧的方法和装置
ES09836080T ES2395365T3 (es) 2008-12-31 2009-12-31 Método y aparato para la distribución de una sub-trama
US12/982,142 US8843366B2 (en) 2008-12-31 2010-12-30 Framing method and apparatus

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200810186854 2008-12-31
CN200810186854.8 2008-12-31
CN2009101518341A CN101615394B (zh) 2008-12-31 2009-06-25 分配子帧的方法和装置

Publications (2)

Publication Number Publication Date
CN101615394A true CN101615394A (zh) 2009-12-30
CN101615394B CN101615394B (zh) 2011-02-16

Family

ID=41495005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101518341A Active CN101615394B (zh) 2008-12-31 2009-06-25 分配子帧的方法和装置

Country Status (5)

Country Link
US (1) US8843366B2 (zh)
EP (3) EP2538407B1 (zh)
CN (1) CN101615394B (zh)
ES (2) ES2395365T3 (zh)
WO (1) WO2010075793A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075793A1 (zh) * 2008-12-31 2010-07-08 华为技术有限公司 分配子帧的方法和装置
CN103971691A (zh) * 2013-01-29 2014-08-06 鸿富锦精密工业(深圳)有限公司 语音信号处理系统及方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106409304B (zh) * 2014-06-12 2020-08-25 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
DE102016119750B4 (de) * 2015-10-26 2022-01-13 Infineon Technologies Ag Vorrichtungen und Verfahren zur Mehrkanalabtastung
CN110865959B (zh) * 2018-08-27 2021-10-15 武汉杰开科技有限公司 一种用于唤醒i2c设备的方法及电路

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2632758B1 (fr) * 1988-06-13 1991-06-07 Matra Communication Procede de codage et codeur de parole a prediction lineaire
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
US6169970B1 (en) * 1998-01-08 2001-01-02 Lucent Technologies Inc. Generalized analysis-by-synthesis speech coding method and apparatus
WO2001015144A1 (fr) 1999-08-23 2001-03-01 Matsushita Electric Industrial Co., Ltd. Vocodeur et procede correspondant
SE9903223L (sv) * 1999-09-09 2001-05-08 Ericsson Telefon Ab L M Förfarande och anordning i telekommunikationssystem
US6889187B2 (en) * 2000-12-28 2005-05-03 Nortel Networks Limited Method and apparatus for improved voice activity detection in a packet voice network
SE521600C2 (sv) * 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
CN1971707B (zh) * 2006-12-13 2010-09-29 北京中星微电子有限公司 一种进行基音周期估计和清浊判决的方法及装置
US8249860B2 (en) * 2006-12-15 2012-08-21 Panasonic Corporation Adaptive sound source vector quantization unit and adaptive sound source vector quantization method
CN103383846B (zh) * 2006-12-26 2016-08-10 华为技术有限公司 改进语音丢包修补质量的语音编码方法
CN101030377B (zh) * 2007-04-13 2010-12-15 清华大学 提高声码器基音周期参数量化精度的方法
CN101615394B (zh) * 2008-12-31 2011-02-16 华为技术有限公司 分配子帧的方法和装置
US8700410B2 (en) * 2009-06-18 2014-04-15 Texas Instruments Incorporated Method and system for lossless value-location encoding

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075793A1 (zh) * 2008-12-31 2010-07-08 华为技术有限公司 分配子帧的方法和装置
US8843366B2 (en) 2008-12-31 2014-09-23 Huawei Technologies Co., Ltd. Framing method and apparatus
CN103971691A (zh) * 2013-01-29 2014-08-06 鸿富锦精密工业(深圳)有限公司 语音信号处理系统及方法

Also Published As

Publication number Publication date
EP2538407B1 (en) 2014-07-23
WO2010075793A1 (zh) 2010-07-08
EP2538407A2 (en) 2012-12-26
ES2395365T3 (es) 2013-02-12
CN101615394B (zh) 2011-02-16
EP2755203A1 (en) 2014-07-16
EP2538407A3 (en) 2013-04-24
US8843366B2 (en) 2014-09-23
ES2509817T3 (es) 2014-10-20
US20110099005A1 (en) 2011-04-28
EP2296144B1 (en) 2012-10-03
EP2296144A1 (en) 2011-03-16
EP2296144A4 (en) 2011-06-22

Similar Documents

Publication Publication Date Title
CN101583995B (zh) 参数解码装置、参数编码装置以及参数解码方法
EP0696026B1 (en) Speech coding device
JP5627144B2 (ja) 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体
EP0802524B1 (en) Speech coder
CN101615394B (zh) 分配子帧的方法和装置
CN102341844B (zh) 编码方法、解码方法、编码装置、解码装置
US11817107B2 (en) Phase reconstruction in a speech decoder
CN101208741B (zh) 一种适用于数字信号短时相关性模型之间的互用性的方法
CN106415718B (zh) 线性预测分析装置、方法以及记录介质
EP3899931B1 (en) Phase quantization in a speech encoder
EP0866443B1 (en) Speech signal coder
JP2800599B2 (ja) 基本周期符号化装置
EP0859354A2 (en) LSP prediction coding method and apparatus
JPH113098A (ja) 音声符号化方法および装置
JPH0844398A (ja) 音声符号化装置
KR100316304B1 (ko) 음성 부호화기의 lsp 코드북을 위한 고속탐색 방법
JP3092344B2 (ja) 音声符号化装置
JP2968530B2 (ja) 適応ピッチ予測方法
JP2000020099A (ja) 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器
JPH11119799A (ja) 音声符号化方法および音声符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Zhang Dejun

Inventor after: Qi Fengyan

Inventor after: Miao Lei

Inventor after: Xu Jianfeng

Inventor after: Zhang Qing

Inventor after: Li Lixiong

Inventor after: Ma Fuwei

Inventor before: Zhang Dejun

Inventor before: Qi Fengyan

Inventor before: Miao Lei

Inventor before: Xu Jianfeng

Inventor before: Zhang Qing

Inventor before: Harvey.Myhill.Tadee

Inventor before: Li Lixiong

Inventor before: Ma Fuwei

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: ZHANG DEJUN QI FENGYAN MIAO LEI XU JIANFENG ZHANG QING TADI MICHL HARVEY LI LIXIONG MA FUWEI TO: ZHANG DEJUN QI FENGYAN MIAO LEI XU JIANFENG ZHANG QING LI LIXIONG MA FUWEI