CN101533639A - 语音信号处理方法及装置 - Google Patents
语音信号处理方法及装置 Download PDFInfo
- Publication number
- CN101533639A CN101533639A CN200810026779A CN200810026779A CN101533639A CN 101533639 A CN101533639 A CN 101533639A CN 200810026779 A CN200810026779 A CN 200810026779A CN 200810026779 A CN200810026779 A CN 200810026779A CN 101533639 A CN101533639 A CN 101533639A
- Authority
- CN
- China
- Prior art keywords
- code vector
- self
- adaptation
- obtains
- fixed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例公开了一种语音信号处理方法,包括对第一自适应码矢进行低通滤波处理,得到第二自适应码矢,并根据第一自适应码矢的第一能量值及第二自适应码矢的第二能量值,获得能量缩放因子,采用所述能量缩放因子对所述第二自适应码矢进行能量缩放,得到第三自适应码矢,并将固定码矢及第三自适应码矢合成第一激励信号。本发明实施例还公开了一种语音信号处理装置。采用本发明实施例,直接对自适应码矢进行低通滤波从而达到基音增强的效果且所达到的基音增强的效果较好,并且利用能量缩放因子对处理得到的激励信号进行了能量平滑,提高主观听觉效果。
Description
技术领域
本发明涉及语音信号处理领域,尤其涉及一种语音信号处理方法及装置。
背景技术
语音编码装置广泛地应用于数字通信系统中,它能有效地发送/存储语音信号,而在数字通信系统中,输入的模拟语音信号经过采样转化到数字域,在数字域中,对连续的语音采样做进一步处理,即语音编码装置的输入为语音采样,输出则为压缩的比特流。压缩的比特流通过信道传入解码端,语音解码装置接收该比特流,并产生合成的语音信号。
在码激励线性预测(Code Excited Linear Prediction,CELP)编码中,数字语音信号以帧为单位进行编码传输。对于每帧数字语音信号,语音编码装置从中抽取多个编码参数,并将这些参数有效地发送/存储。而对应的语音解码装置则是处理所接收的解码参数,来合成语音信号的指定帧。在CELP编解码模式下,在信道中需要编码传输的参数有:
1、线谱频率(Linear Spectrum Frequencies,LSF)或线谱对(Linear SpectrumPairs,LSP),导抗谱频率(Immitance Spectrum Frequencies,ISF)或导抗谱对(Immitance Spectrum Pairs,ISP);
2、自适应码本参数(基音参数),包括基音延迟和自适应码本增益;
3、固定码本参数,包括固定码本索引和固定码本增益;
LSF/LSP或ISF/ISP系数按照帧为单位进行编码传输,自适应码本参数和固定码本参数一般是按照子帧为单位进行编码传输。其中,自适应码本参数和固定码本参数描述了激励信号。LSF/LSP或ISF/ISP是线性预测(Linear Prediction,LP)滤波器的系数的频域表现形式。激励信号可以看作声门的输出,LP滤波器可以看作声道模型,所以,当激励信号通过LP滤波器后,就可以得到输出的合成语音信号。
当前的各种语音解码装置解码得到的合成语音信号不会和语音编码装置的原始语音信号相同。压缩比越高,编码的语音信号失真就越大。为了提升解码端合成语音信号的质量,在解码端可以进行各种增强后处理提升合成语音信号的质量。
现有技术提供了一种自适应多速率宽带增强(Adaptive Multi Rate-WidebandPlus,AMR-WB+)协议,它是当前一个比较完善的宽带编码协议,并得到了第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)和国际电联电信标准部(International Telecommunication Union International TelegraphConvention,ITU_T)支持和选用。AMR-WB+协议中,基音增强的实现采用了如下方法:
将激励码矢通过一个滤波器进行滤波处理,降低了激励码矢中固定码矢低频部分能量,即相应提升了自适应码矢低频部分能量,从而增强了激励码矢低频部分的周期性,其中上述滤波器所采用的转移函数为:
F(z)=-αz+1-αz-1,
其中,α是周期因子,具体为α=0.125(1+rv),其中,
Ev为被缩放的自适应码矢的能量,
Ec为被缩放的自适应码矢的能量,Ec=g2ck tck,
b为自适应码本增益,v为自适应码本激励;g为固定码本增益,c为固定码本激励,
而-1≤rv≤1,当rv=-1时,纯清音,当rv=1时,纯浊音,相应地,对于纯清音,α=0;对于纯浊音,α=0.25,上述滤波器F(z)=-αz+1-αz-1的频谱图,如图1、图2所示,其中图1为α=0.25时的频谱图,图2为α=0.1时的频谱图。
但是由于现有技术是对固定码矢进行滤波从而达到基音增强的效果,需要改变固定码矢的能量且所达到的基音增强的效果不好,另外,采用现有技术进行基音增强处理,其处理后的激励信号能量偏小,不能较好地满足系统需求。
发明内容
本发明实施例所要解决的技术问题在于,提供了一种语音信号处理方法及装置,直接对自适应码矢进行滤波从而达到基音增强的效果,此不需要改变固定码矢的能量且所达到的基音增强的效果较好,并且对处理得到的激励信号进行了能量平滑,使得基音增强处理后的激励信号能量不会偏小,从而提高主观听觉效果。
为了解决上述技术问题,本发明实施例提供了一种语音信号处理方法,包括:
获得第一自适应码矢;
对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
获得所述第一自适应码矢的第一能量值及第二自适应码矢的第二能量值;
根据所述第一能量值及第二能量值获得能量缩放因子;
采用所述能量缩放因子对所述第二自适应码矢进行能量缩放,得到第三自适应码矢;
获得固定码矢;
将所述固定码矢及第三自适应码矢合成第一激励信号。
本发明实施例还提供了另一种语音信号处理方法,包括:
获得第一自适应码矢;
对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
获得固定码矢;
将所述第一自适应码矢与固定码矢合成第一激励信号;
将所述第二自适应码矢及固定码矢合成第二激励信号;
获得所述第一激励信号的第一能量值及第二激励信号的第二能量值;
根据所述第一能量值及第二能量值获得能量缩放因子;
采用所述能量缩放因子对所述第二激励信号进行能量缩放,得到第三激励信号。
相应地,本发明实施例还提供了一种语音信号处理装置,包括:
第一自适应码矢获取单元,获得第一自适应码矢;
滤波器,对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
能量缩放因子获取单元,根据所述第一自适应码矢的第一能量值及第二自适应码矢的第二能量值获得能量缩放因子;
处理单元,采用所述能量缩放因子对所述第二自适应码矢进行能量缩放,得到第三自适应码矢;
固定码矢获取单元,获得固定码矢;
合成单元,将所述固定码矢及第三自适应码矢合成第一激励信号。
相应地,本发明实施例还提供了另一种语音信号处理装置,包括:
第一自适应码矢获取单元,获得第一自适应码矢;
滤波器,对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
固定码矢获取单元,获得固定码矢;
第一合成单元,将所述第一自适应码矢与固定码矢合成第一激励信号;
第二合成单元,将所述第二自适应码矢及固定码矢合成第二激励信号;
能量缩放因子获取单元,根据所述第一自适应码矢的第一能量值及第二自适应码矢的第二能量值获得能量缩放因子;
处理单元,采用所述能量缩放因子对所述第二激励信号进行能量缩放,得到第三激励信号。
本发明实施例通过对第一自适应码矢进行低通滤波处理,得到第二自适应码矢,并根据第一自适应码矢的第一能量值及第二自适应码矢的第二能量值,获得能量缩放因子,采用所述能量缩放因子对所述第二自适应码矢进行能量缩放,得到第三自适应码矢,并将固定码矢及第三自适应码矢合成第一激励信号,从而直接对自适应码矢进行低通滤波从而达到基音增强的效果,此不需要改变固定码矢的能量且所达到的基音增强的效果较好,并且利用能量缩放因子对处理得到的激励信号进行了能量平滑,使得基音增强处理后的激励信号能量不会偏小,从而提高主观听觉效果;
另外,在不增加额外传输比特率的条件下,本发明实施例能以较低的运算复杂度实现宽带解码信号质量的提高。
附图说明
图1是现有技术的滤波器的第一频谱图;
图2是现有技术的滤波器的第二频谱图;
图3是本发明实施例的语音信号处理方法的流程图;
图4是本发明实施例的滤波器的第一频谱图;
图5是本发明实施例的滤波器的第二频谱图;
图6是本发明另一实施例的语音信号处理方法的流程图;
图7是本发明实施例的语音解码装置的结构示意图;
图8是本发明实施例的滤波器的结构示意图;
图9是本发明另一实施例的语音解码装置的结构示意图;
图10是本发明实施例的语音解码装置所应用的宽带语音编解码系统的结构示意图。
具体实施方式
本发明实施例提供了一种语音信号处理方法及装置,可实现直接对自适应码矢进行低通滤波从而达到基音增强的效果,此不需要改变固定码矢的能量且所达到的基音增强的效果较好,并且对处理得到的激励信号进行了能量平滑,使得基音增强处理后的激励信号能量不会偏小,从而提高主观听觉效果。
下面结合附图,对本发明实施例进行详细说明。
图3是本发明实施例的语音信号处理方法的流程图,参照该图,该流程主要包括:
301,对激励信号按照子帧(64点)进行处理,对每一子帧分别处理自适应码矢和固定码矢,首先获得第一自适应码矢以及固定码矢,在具体实现时,可采用如下方法获得该第一自适应码矢以及固定码矢:
根据代数码激励线性预测(Algebraic Code Excited Linear Prediction,ACELP)语音解码参数中的固定码本索引及固定码本得到对应的码矢,并对该得到的码矢进行固定码本增益(固定码本增益也可从ACELP语音解码参数中获得)处理(如:将所述得到的码矢与固定码本增益相乘),最终得到所述固定码矢;
根据ACELP语音解码参数中的基音索引及自适应码本得到对应的码矢,并对该得到的码矢进行长时滤波及自适应码本增益处理(如:将所述得到的码矢与自适应码本增益相乘),最终得到所述第一自适应码矢;
302,将所述第一自适应码矢及固定码矢合成具有第一能量值E1的第一激励信号ex1(n),在具体实现时,可将所述第一自适应码矢及固定码矢以点相加,得到所述第一激励信号ex1(n);
303,采用具有低通滤波特性的第一转移函数H(z)对所述第一自适应码矢进行低通滤波处理,在具体实现时,所述第一转移函数为 其中α为与所述第一自适应码矢对应的自适应码本增益b相关的浊音因子,即可以是α=0.1b;
该低通滤波处理 的幅频响应如图4、图5所示,其中图4为α=0.1时的频谱图,图5为α=0.06时的频谱图;
304,将所述303低通滤波处理得到的第二自适应码矢及固定码矢合成具有第二能量值E2的第二激励信号ex2(n),在具体实现时,可将所述第二自适应码矢及固定码矢以点相加,得到所述第二激励信号ex2(n);
305,根据所述第一能量值E1与第二能量值E2,得到能量缩放因子k,在具体实现时,可以将所述第一能量值E1与第二能量值E2相比得到的比例值作为所述能量缩放因子k,即 之后,则采用该能量缩放因子k对所述第二激励信号ex2(n)进行能量缩放处理,得到第三激励信号ex3(n),在具体实现时,可以将所述能量缩放因子k与所述第二激励信号ex2(n)相乘,得到所述第三激励信号ex3(n),即ex3(n)=k×ex2(n);
306,输出所述第三激励信号ex3(n)。
至此,该流程即完成了利用303直接对自适应码矢进行低通滤波从而达到基音增强的效果,此不需要改变固定码矢的能量且所达到的基音增强的效果较好,并且利用305对处理得到的激励信号(此处为第二激励信号)进行了能量平滑,使得基音增强处理后的激励信号能量不会偏小,从而提高主观听觉效果。
作为一种实施方式,306之后,还可进行如下流程:
首先,获得由LP系数构成的第二转移函数H′(z),在具体实现时,可先从ACELP语音解码参数中获得ISF索引,经过解码ISP、插值、ISP参数转化为LP系数等一系列处理后,得到由LP系数构成的第二转移函数H′(z);
然后,采用所述第二转移函数H′(z)对所述第三激励信号ex3(n)进行滤波处理,得到该滤波(或称为合成)后的第三激励信号。
图6是本发明另一实施例的语音信号处理方法的流程图,参照该图,该流程主要包括:
601,对激励信号按照子帧(64点)进行处理,对每一子帧分别处理自适应码矢和固定码矢,首先获得第一自适应码矢以及固定码矢,其中,第一自适应码矢具有第一能量值E1,在具体实现时,可采用如下方法获得该第一自适应码矢以及固定码矢:
根据ACELP语音解码参数中的固定码本索引及固定码本得到对应的码矢,并对该得到的码矢进行固定码本增益(固定码本增益也可从ACELP语音解码参数中获得)处理(如:将所述得到的码矢与固定码本增益相乘),最终得到所述固定码矢;
根据ACELP语音解码参数中的基音索引及自适应码本得到对应的码矢,并对该得到的码矢进行长时滤波及自适应码本增益处理(如:将所述得到的码矢与自适应码本增益相乘),最终得到所述第一自适应码矢;
602,采用具有低通滤波特性的第一转移函数H(z)对所述第一自适应码矢进行低通滤波处理,得到具有第二能量值E2的第二自适应码矢,在具体实现时,所述第一转移函数为 其中α为与所述第一自适应码矢对应的自适应码本增益b相关的浊音因子,即可以是α=0.1b;
该低通滤波处理 的幅频响应如上图4、图5所示,其中图4为α=0.1时的频谱图,图5为α=0.06时的频谱图;
603,根据所述第一能量值E1与第二能量值E2,得到能量缩放因子k,在具体实现时,可以将所述第一能量值E1与第二能量值E2相比得到的比例值作为所述能量缩放因子k,即 之后,则采用该能量缩放因子k对所述第二自适应码矢进行能量缩放处理,得到第三自适应码矢,在具体实现时,可以将所述能量缩放因子k与所述第二自适应码矢相乘,得到所述第三自适应码矢;
604,将所述603处理得到的第三自适应码矢及固定码矢合成第一激励信号ex1(n),在具体实现时,可将所述第三自适应码矢及固定码矢以点相加,得到所述第一激励信号ex1(n);
605,输出所述第一激励信号ex1(n)。
至此,该流程即完成了利用602直接对自适应码矢进行低通滤波从而达到基音增强的效果,此不需要改变固定码矢的能量且所达到的基音增强的效果较好,并且利用604对处理得到的激励信号(此处为第二自适应码矢)进行了能量平滑,使得基音增强处理后的激励信号能量不会偏小,从而提高主观听觉效果。
作为一种实施方式,605之后,还可进行如下流程:
首先,获得由LP系数构成的第二转移函数H′(z),在具体实现时,可先从ACELP语音解码参数中获得ISF索引,经过解码ISP、插值、ISP参数转化为LP系数等一系列处理后,得到由LP系数构成的第二转移函数H′(z);
然后,采用所述第二转移函数H′(z)对所述第一激励信号ex1(n)进行滤波处理,得到该滤波(或称为合成)后的第一激励信号。
图7是本发明实施例的语音解码装置的结构示意图,其中该语音解码装置中包含有本发明实施例的用于基音增强后处理的滤波器74(以下简称滤波器74),参照图7,该语音解码装置主要包括第一自适应码矢获取单元71、固定码矢获取单元72、第一合成单元73、滤波器74、第二合成单元75、能量缩放因子计算单元76、处理单元77,其中能量缩放因子计算单元76与处理单元77构成本发明实施例的能量缩放处理装置,各单元连接关系与功能如下述:
第一自适应码矢获取单元71分别与第一合成单元73、滤波器74相连,固定码矢获取单元72分别与第一合成单元73、第二合成单元75相连,滤波器74还与第二合成单元75相连,第一合成单元73、第二合成单元75还与能量缩放因子计算单元76相连,第二合成单元75、能量缩放因子计算单元76还与处理单元77相连;
第一自适应码矢获取单元71,获得第一自适应码矢,此时可对激励信号按照子帧(64点)进行处理,对每一子帧分别处理自适应码矢和固定码矢,在具体实现时,该第一自适应码矢获取单元71还可以包括:
自适应码本解码单元,根据ACELP语音解码参数中的基音索引及自适应码本,解码得到对应的码矢;
长时滤波器,对所述自适应码本解码单元解码得到的码矢进行长时滤波;
自适应码本增益处理单元,对所述长时滤波器滤波得到的码矢进行自适应码本增益处理(如:将所述得到的码矢与自适应码本增益相乘),最终得到所述第一自适应码矢;
固定码矢获取单元72,获得固定码矢,在具体实现时,该固定码矢获取单元72还可以包括:
固定码本解码单元,根据所述ACELP语音解码参数中的固定码本索引及固定码本,解码得到对应的码矢;
固定码本增益处理单元,对所述固定码本解码单元解码得到的码矢进行固定码本增益(固定码本增益也可从ACELP语音解码参数中获得)处理(如:将所述得到的码矢与固定码本增益相乘),得到所述固定码矢;
第一合成单元73,将所述第一自适应码矢及固定码矢合成具有第一能量值E1的第一激励信号ex1(n),在具体实现时,可将所述第一自适应码矢及固定码矢以点相加,得到所述第一激励信号ex1(n);
滤波器74,采用具有低通滤波特性的第一转移函数H(z)对所述第一自适应码矢进行低通滤波处理,在具体实现时,所述第一转移函数为 其中α为与所述第一自适应码矢对应的自适应码本增益b相关的浊音因子,即可以是α=0.1b;
该低通滤波处理 的幅频响应仍可如上图4、图5所示,其中图4为α=0.1时的频谱图,图5为α=0.06时的频谱图;
在具体实现时,该滤波器74还可以包括如图8所示的单元:
输入单元81,输入所述第一自适应码矢;
滤波处理单元82,采用所述第一转移函数H(z)对所述第一自适应码矢进行低通滤波处理,具体处理仍可如上所述;
输出单元83,输出所述滤波处理单元82滤波处理所述第一自适应码矢所得的第二自适应码矢;
第二合成单元75,将所述滤波器74低通滤波处理得到的第二自适应码矢及固定码矢合成具有第二能量值E2的第二激励信号ex2(n),在具体实现时,可将所述第二自适应码矢及固定码矢以点相加,得到所述第二激励信号ex2(n);
能量缩放因子计算单元76,根据所述第一能量值E1与第二能量值E2,得到能量缩放因子k,在具体实现时,可以将所述第一能量值E1与第二能量值E2相比得到的比例值作为所述能量缩放因子k,即
处理单元77,采用所述能量缩放因子k对所述第二激励信号ex2(n)进行能量缩放处理,得到第三激励信号ex3(n),在具体实现时,可以将所述能量缩放因子k与所述第二激励信号ex2(n)相乘,得到所述第三激励信号ex3(n),即ex3(n)=k×ex2(n),并输出该第三激励信号ex3(n)。
至此,该语音解码装置中的滤波器74即完成了直接对自适应码矢进行滤波从而达到基音增强的效果,此不需要改变固定码矢的能量且所达到的基音增强的效果较好,并且该语音解码装置对处理得到的激励信号(此处为第二激励信号)进行了能量平滑,使得基音增强处理后的激励信号能量不会偏小,从而提高主观听觉效果。
作为一种实施方式,上述语音解码装置中还可以包括:
合成语音信号转移函数获取单元,获得由LP系数构成的第二转移函数H′(z),在具体实现时,该合成语音信号转移函数获取单元可包括:
ISP解码单元,对从ACELP语音解码参数中获得的ISF索引进行解码ISP;
ISP插值单元,对所述ISP解码单元得到的信号进行插值的处理;
转化单元,对所述ISP解码插值单元得到的信号进行ISP参数转化为LP系数的处理,该LP系数即用于构成所述第二转移函数H′(z);
合成滤波器,输入所述第二转移函数H′(z)及第三激励信号ex3(n),采用所述第二转移函数H′(z)对所述第三激励信号ex3(n)进行滤波处理,并输出该滤波(或称为合成)后的第三激励信号。
图9是本发明另一实施例的语音解码装置的结构示意图,其中该语音解码装置中包含有本发明实施例的用于基音增强后处理的滤波器93(以下简称滤波器93),参照图9,该语音解码装置主要包括第一自适应码矢获取单元91、固定码矢获取单元92、滤波器93、能量缩放因子计算单元94、处理单元95、合成单元96,各单元连接关系与功能如下述:
第一自适应码矢获取单元91分别与滤波器93、能量缩放因子计算单元94相连,滤波器93分别与能量缩放因子计算单元94、处理单元95相连,处理单元94分别与能量缩放因子计算单元94、合成单元96相连,合成单元96与固定码矢获取单元92相连;
第一自适应码矢获取单元91,获得具有第一能量值E1的第一自适应码矢,此时可对激励信号按照子帧(64点)进行处理,对每一子帧分别处理自适应码矢和固定码矢,在具体实现时,该第一自适应码矢获取单元91还可以包括:
自适应码本解码单元,根据ACELP语音解码参数中的基音索引及自适应码本,解码得到对应的码矢;
长时滤波器,对所述自适应码本解码单元解码得到的码矢进行长时滤波;
自适应码本增益处理单元,对所述长时滤波器滤波得到的码矢进行自适应码本增益处理(如:将所述得到的码矢与自适应码本增益相乘),最终得到所述第一自适应码矢;
固定码矢获取单元92,获得固定码矢,在具体实现时,该固定码矢获取单元92还可以包括:
固定码本解码单元,根据所述ACELP语音解码参数中的固定码本索引及固定码本,解码得到对应的码矢;
固定码本增益处理单元,对所述固定码本解码单元解码得到的码矢进行固定码本增益(固定码本增益也可从ACELP语音解码参数中获得)处理(如:将所述得到的码矢与固定码本增益相乘),得到所述固定码矢;
滤波器93,采用具有低通滤波特性的第一转移函数H(z)对所述第一自适应码矢进行低通滤波处理得到具有第二能量值E2的第二自适应码矢,在具体实现时,所述第一转移函数为 其中α为与所述第一自适应码矢对应的自适应码本增益b相关的浊音因子,即可以是α=0.1b;
该低通滤波处理 的幅频响应仍可如上图4、图5所示,其中图4为α=0.1时的频谱图,图5为α=0.06时的频谱图;
在具体实现时,该滤波器93还可以包括如图8所示的各个单元,此处不再赘述:
能量缩放因子计算单元84,根据所述第一能量值E1与第二能量值E2,得到能量缩放因子k,在具体实现时,可以将所述第一能量值E1与第二能量值E2相比得到的比例值作为所述能量缩放因子k,即
处理单元85,采用所述能量缩放因子k对所述第二自适应码矢进行能量缩放处理,得到第三自适应码矢,在具体实现时,可以将所述能量缩放因子k与所述第二自适应码矢相乘,得到所述第三自适应码矢;
合成单元86,将所述第三自适应码矢及固定码矢合成第一激励信号ex1(n),在具体实现时,可将所述第三自适应码矢及固定码矢以点相加,得到所述第一激励信号ex1(n),并输出ex1(n)。
至此,该语音解码装置中的滤波器93即完成了直接对自适应码矢进行低通滤波从而达到基音增强的效果,此不需要改变固定码矢的能量且所达到的基音增强的效果较好,并且该语音解码装置对处理得到的激励信号(此处为第二自适应码矢)进行了能量平滑,使得基音增强处理后的激励信号能量不会偏小,从而提高主观听觉效果。
作为一种实施方式,上述语音解码装置中还可以包括:
合成语音信号转移函数获取单元,获得由LP系数构成的第二转移函数H′(z),在具体实现时,该合成语音信号转移函数获取单元可包括:
ISP解码单元,对从ACELP语音解码参数中获得的ISF索引进行解码ISP;
ISP插值单元,对所述ISP解码单元得到的信号进行插值的处理;
转化单元,对所述ISP解码插值单元得到的信号进行ISP参数转化为LP系数的处理,该LP系数即用于构成所述第二转移函数H′(z);
合成滤波器,输入所述第二转移函数H′(z)及第一激励信号ex1(n),采用所述第二转移函数H′(z)对所述第一激励信号ex1(n)进行滤波处理,并输出该滤波(或称为合成)后的第一激励信号。
值得说明的有如下几点:
1、图7或图9所示的语音解码装置可以用于如图10所示的宽带语音编解码系统中,图10中的语音解码器即可为图7、图9所示的语音解码装置;
2、上述本发明实施例所提及的具有低通滤波特性的第一转移函数H(z)还可以表现为但不仅限于如下形式中的一种:
A、
B、
另外,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (22)
1、一种语音信号处理方法,其特征在于,包括:
获得第一自适应码矢;
对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
获得所述第一自适应码矢的第一能量值及第二自适应码矢的第二能量值;
根据所述第一能量值及第二能量值获得能量缩放因子;
采用所述能量缩放因子对所述第二自适应码矢进行能量缩放,得到第三自适应码矢;
获得固定码矢;
将所述固定码矢及第三自适应码矢合成第一激励信号。
2、如权利要求1所述的语音信号处理方法,其特征在于,所述低通滤波处理采用的第一转移函数为: 其中α为与所述第一自适应码矢对应的自适应码本增益相关的浊音因子。
3、如权利要求2所述的语音信号处理方法,其特征在于,所述自适应码本增益为b,则所述α=0.1b。
4、如权利要求1至3中任一项所述的语音信号处理方法,其特征在于,所述获得第一自适应码矢具体为:
根据语音解码参数中的基音索引及自适应码本得到的码矢,经过长时滤波及自适应码本增益处理后,得到所述第一自适应码矢,
所述获得固定码矢具体为:
根据所述语音解码参数中的固定码本索引及固定码本得到的码矢,经过固定码本增益处理后,得到所述固定码矢。
5、如权利要求1至3中任一项所述的语音信号处理方法,其特征在于,该方法还包括:
获得由线性预测系数构成的第二转移函数;
对所述第一激励信号以所述第二转移函数进行滤波处理。
6、一种语音信号处理方法,其特征在于,包括:
获得第一自适应码矢;
对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
获得固定码矢;
将所述第一自适应码矢与固定码矢合成第一激励信号;
将所述第二自适应码矢及固定码矢合成第二激励信号;
获得所述第一激励信号的第一能量值及第二激励信号的第二能量值;
根据所述第一能量值及第二能量值获得能量缩放因子;
采用所述能量缩放因子对所述第二激励信号进行能量缩放,得到第三激励信号。
7、如权利要求6所述的语音信号处理方法,其特征在于,所述低通滤波处理采用的第一转移函数为: 其中α为与所述第一自适应码矢对应的自适应码本增益相关的浊音因子。
8、如权利要求7所述的语音信号处理方法,其特征在于,所述自适应码本增益为b,则所述α=0.1b。
9、如权利要求6至8中任一项所述的语音信号处理方法,其特征在于,所述获得第一自适应码矢具体为:
根据语音解码参数中的基音索引及自适应码本得到的码矢,经过长时滤波及自适应码本增益处理后,得到所述第一自适应码矢,
所述获得固定码矢具体为:
根据所述语音解码参数中的固定码本索引及固定码本得到的码矢,经过固定码本增益处理后,得到所述固定码矢。
10、如权利要求6至8中任一项所述的语音信号处理方法,其特征在于,该方法还包括:
获得由线性预测系数构成的第二转移函数;
对所述第三激励信号以所述第二转移函数进行滤波处理。
11、一种语音信号处理装置,其特征在于,包括:
第一自适应码矢获取单元,获得第一自适应码矢;
滤波器,对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
能量缩放因子获取单元,根据所述第一自适应码矢的第一能量值及第二自适应码矢的第二能量值获得能量缩放因子;
处理单元,采用所述能量缩放因子对所述第二自适应码矢进行能量缩放,得到第三自适应码矢;
固定码矢获取单元,获得固定码矢;
合成单元,将所述固定码矢及第三自适应码矢合成第一激励信号。
12、如权利要求11所述的语音信号处理装置,其特征在于,所述滤波器进行低通滤波处理采用的第一转移函数为: ,其中α为与所述第一自适应码矢对应的自适应码本增益相关的浊音因子。
13、如权利要求12所述的语音信号处理装置,其特征在于,所述自适应码本增益为b,则所述α=0.1b。
14、如权利要求11至13中任一项所述的语音信号处理装置,其特征在于,所述第一自适应码矢获取单元包括:
自适应码本解码单元,根据语音解码参数中的基音索引及自适应码本,解码得到码矢;
长时滤波器,对所述自适应码本解码单元解码得到的码矢进行长时滤波;
自适应码本增益处理单元,对所述长时滤波器滤波得到的码矢进行自适应码本增益处理,得到所述第一自适应码矢,
所述固定码矢获取单元包括:
固定码本解码单元,根据所述语音解码参数中的固定码本索引及固定码本,解码得到码矢;
固定码本增益处理单元,对所述固定码本解码单元解码得到的码矢进行固定码本增益处理,得到所述固定码矢。
15、如权利要求11至13中任一项所述的语音信号处理装置,其特征在于,该语音信号处理装置还包括:
合成语音信号转移函数获取单元,获得由线性预测系数构成的第二转移函数;
合成滤波器,对所述第一激励信号以所述第二转移函数进行滤波处理。
16、如权利要求11至13中任一项所述的语音信号处理装置,其特征在于,该语音信号处理装置为语音解码装置。
17、一种语音信号处理装置,其特征在于,包括:
第一自适应码矢获取单元,获得第一自适应码矢;
滤波器,对所述第一自适应码矢进行低通滤波处理,得到第二自适应码矢;
固定码矢获取单元,获得固定码矢;
第一合成单元,将所述第一自适应码矢与固定码矢合成第一激励信号;
第二合成单元,将所述第二自适应码矢及固定码矢合成第二激励信号;
能量缩放因子获取单元,根据所述第一自适应码矢的第一能量值及第二自适应码矢的第二能量值获得能量缩放因子;
处理单元,采用所述能量缩放因子对所述第二激励信号进行能量缩放,得到第三激励信号。
18、如权利要求17所述的语音信号处理装置,其特征在于,所述滤波器进行低通滤波处理采用的第一转移函数为: ,其中α为与所述第一自适应码矢对应的自适应码本增益相关的浊音因子。
19、如权利要求18所述的语音信号处理装置,其特征在于,所述自适应码本增益为b,则所述α=0.1b。
20、如权利要求17至19中任一项所述的语音信号处理装置,其特征在于,所述第一自适应码矢获取单元包括:
自适应码本解码单元,根据语音解码参数中的基音索引及自适应码本,解码得到码矢;
长时滤波器,对所述自适应码本解码单元解码得到的码矢进行长时滤波;
自适应码本增益处理单元,对所述长时滤波器滤波得到的码矢进行自适应码本增益处理,得到所述第一自适应码矢,
所述固定码矢获取单元包括:
固定码本解码单元,根据所述语音解码参数中的固定码本索引及固定码本,解码得到码矢;
固定码本增益处理单元,对所述固定码本解码单元解码得到的码矢进行固定码本增益处理,得到所述固定码矢。
21、如权利要求17至19中任一项所述的语音信号处理装置,其特征在于,该语音信号处理装置还包括:
合成语音信号转移函数获取单元,获得由线性预测系数构成的第二转移函数;
合成滤波器,对所述第三激励信号以所述第二转移函数进行滤波处理。
22、如权利要求17至19中任一项所述的语音信号处理装置,其特征在于,该语音信号处理装置为语音解码装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100267799A CN101533639B (zh) | 2008-03-13 | 2008-03-13 | 语音信号处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008100267799A CN101533639B (zh) | 2008-03-13 | 2008-03-13 | 语音信号处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101533639A true CN101533639A (zh) | 2009-09-16 |
CN101533639B CN101533639B (zh) | 2011-09-14 |
Family
ID=41104193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008100267799A Expired - Fee Related CN101533639B (zh) | 2008-03-13 | 2008-03-13 | 语音信号处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101533639B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930872A (zh) * | 2012-11-05 | 2013-02-13 | 深圳广晟信源技术有限公司 | 用于宽带语音解码中基音增强后处理的方法及装置 |
CN102968997A (zh) * | 2012-11-05 | 2013-03-13 | 深圳广晟信源技术有限公司 | 用于宽带语音解码中噪声增强后处理的方法及装置 |
CN102985966A (zh) * | 2010-07-16 | 2013-03-20 | 瑞典爱立信有限公司 | 音频编码器和解码器及用于音频信号的编码和解码的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6009395A (en) * | 1997-01-02 | 1999-12-28 | Texas Instruments Incorporated | Synthesizer and method using scaled excitation signal |
-
2008
- 2008-03-13 CN CN2008100267799A patent/CN101533639B/zh not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102985966A (zh) * | 2010-07-16 | 2013-03-20 | 瑞典爱立信有限公司 | 音频编码器和解码器及用于音频信号的编码和解码的方法 |
US8977542B2 (en) | 2010-07-16 | 2015-03-10 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
CN102985966B (zh) * | 2010-07-16 | 2016-07-06 | 瑞典爱立信有限公司 | 音频编码器和解码器及用于音频信号的编码和解码的方法 |
CN102930872A (zh) * | 2012-11-05 | 2013-02-13 | 深圳广晟信源技术有限公司 | 用于宽带语音解码中基音增强后处理的方法及装置 |
CN102968997A (zh) * | 2012-11-05 | 2013-03-13 | 深圳广晟信源技术有限公司 | 用于宽带语音解码中噪声增强后处理的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101533639B (zh) | 2011-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4698593B2 (ja) | 音声復号化装置および音声復号化方法 | |
AU763471B2 (en) | A method and device for adaptive bandwidth pitch search in coding wideband signals | |
CN101180676B (zh) | 用于谱包络表示的向量量化的方法和设备 | |
KR100421226B1 (ko) | 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용 | |
CN1244907C (zh) | 宽带语音编解码器中的高频增强层编码方法和装置 | |
CN102169692B (zh) | 信号处理方法和装置 | |
CN102652336B (zh) | 声音信号复原装置以及声音信号复原方法 | |
CN101266797B (zh) | 语音信号后处理滤波方法 | |
JPH09127996A (ja) | 音声復号化方法及び装置 | |
CN104978970A (zh) | 一种噪声信号的处理和生成方法、编解码器和编解码系统 | |
CN103187065A (zh) | 音频数据的处理方法、装置和系统 | |
KR20010075491A (ko) | 음성 코더 매개변수를 양자화하는 방법 | |
CN101483495B (zh) | 一种背景噪声生成方法以及噪声处理装置 | |
CN101533639B (zh) | 语音信号处理方法及装置 | |
CN101339767B (zh) | 一种背景噪声激励信号的生成方法及装置 | |
JP3472279B2 (ja) | 音声符号化パラメータ符号化方法及び装置 | |
CN101140758A (zh) | 感知加权滤波方法及感知加权滤波器 | |
CN101587711B (zh) | 基音后处理方法、滤波器以及基音后处理系统 | |
CN102930872A (zh) | 用于宽带语音解码中基音增强后处理的方法及装置 | |
CN101266798B (zh) | 一种在语音解码器中进行增益平滑的方法及装置 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JP3510168B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP3453116B2 (ja) | 音声符号化方法及び装置 | |
JP3468862B2 (ja) | 音声符号化装置 | |
KR100263298B1 (ko) | 음성부호화기에서 양자화 오차의 상관관계 특성을 이용한피치 검색 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110914 Termination date: 20190313 |
|
CF01 | Termination of patent right due to non-payment of annual fee |