CN101339767B - 一种背景噪声激励信号的生成方法及装置 - Google Patents

一种背景噪声激励信号的生成方法及装置 Download PDF

Info

Publication number
CN101339767B
CN101339767B CN200810084513A CN200810084513A CN101339767B CN 101339767 B CN101339767 B CN 101339767B CN 200810084513 A CN200810084513 A CN 200810084513A CN 200810084513 A CN200810084513 A CN 200810084513A CN 101339767 B CN101339767 B CN 101339767B
Authority
CN
China
Prior art keywords
signal
pumping signal
background noise
exc
pumping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200810084513A
Other languages
English (en)
Other versions
CN101339767A (zh
Inventor
艾雅·舒默特
代金良
汪林
张立斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN200810084513A priority Critical patent/CN101339767B/zh
Publication of CN101339767A publication Critical patent/CN101339767A/zh
Priority to EP09722292A priority patent/EP2261895B1/en
Priority to MX2010010226A priority patent/MX2010010226A/es
Priority to PCT/CN2009/070854 priority patent/WO2009115038A1/zh
Application granted granted Critical
Publication of CN101339767B publication Critical patent/CN101339767B/zh
Priority to US12/887,066 priority patent/US8370154B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Abstract

本发明涉及一种背景噪声激励信号的生成方法及装置,所述方法包括:利用语音编解码阶段的编码参数及激励信号的过渡长度生成准激励信号;将所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号。另外,所述装置包括:准激励信号生成单元和过渡阶段激励信号获得单元。采用本发明所述舒适背景噪声的合成方案之后,会使得合成信号从语音到背景噪声转换时,过渡更加自然、平滑和连续,人耳感觉更加舒适。

Description

一种背景噪声激励信号的生成方法及装置
技术领域
本发明涉及通信领域,尤其是涉及一种背景噪声激励信号的生成方法及装置。
背景技术
在语音通信中,对语音的处理主要由语音编解码器来完成,由于语音信号具有短时平稳性,语音编解码器在对语音信号进行处理时,一般按帧进行,每帧10~30ms。最初的语音编解码器都是定速率的,即每一种语音编解码器只有一个固定的编码速率,如语音编解码器G.729的编码速率是8kbit/s、G.728的速率是16kbit/s。这些传统的定速率语音编解码器从总体来讲,较高速率的编码算法能较容易的保证编码质量,但占用通信信道资源较大;较低速率的编码算法占用通信信道资源较小,但不太容易保证编码质量。
语音信号既包含人发声产生的有声信号,也包含人发声间隙产生的无声信号(背景噪声)。在语音通信中,人们关注的只是有用的有声信号,而不希望传送无用的无声信号,来降低传输带宽。但是,如果只对有声信号进行编码传输而不对无声信号进行编码传输,就会导致背景噪声的不连续,在接收端,会使收听的人感觉非常不舒服,在背景噪声较强的情况下这种感觉会更明显,有时会令语音难以理解,为了解决这种状况,即在人不发声时也需要对无声信号进行编码传输。而在语音编解码器中引入了静音压缩技术,在静音压缩技术中,对背景噪声信号会采用较低的编码速率进行编码,从而有效的降低通信带宽。而对人发声产生的有声信号采用较高的速率进行编码,从而保证通信质量。但一般来说,称对有声信号的编码速率为语音(这时的语音特指人发声的信号)编码速率,而对背景噪声的编码速率称为噪声编码速率。
目前,一种G.729B的背景噪声激励信号的生成方法是,在729原型上增加了非连续传输系统(DTX,Discontinuous Transmission System)/舒适噪声生成(CNG,Comfort Noise Generated)系统,即背景噪声的处理系统,其处理的信号为8kHz采样,窄带,信号处理帧长10ms。其CNG算法用一个电平可控的伪白噪声激励一个经内插得到的线性预测编码(LPC,Linear PredictiveCoding)合成滤波器得到舒适的背景噪声,其中激励信号电平和LPC滤波器系数分别从上一个静音插入描述(SID,Silence Insertion Descriptor)帧中得到。
其激励信号为伪白噪声激励ex(n),ex(n)是语音激励ex1(n)和高斯白噪声激励ex2(n)的一个混合。ex1(n)的增益较小,而采用ex1(n)的目的是为了让语音和非语音(比如噪声等)间的过渡更为自然。然后在得到的伪白噪声激励ex(n)后,用其激励合成滤波器即可得到舒适的背景噪声。
其中,激励信号的生成过程如下:
首先,定义目标激励增益令其作为当前帧激励平均能量的平方根,
Figure G200810084513XD00022
由下面的平滑算法得到,其中
Figure G200810084513XD00023
是解码后的SID帧的增益:
G ~ t = G ~ sid if ( Vad t - 1 = 1 ) 7 8 G ~ t - 1 + 1 8 G ~ sid otherwise
80个采样点被分成两个子帧,对每个子帧,CNG模块的激励信号会用如下的方式来合成:
(1)、在[40,103]范围内随机选择基音延迟;
(2)、子帧的固定码本矢量中非零脉冲的位置和符号随机选择(这些非零脉冲的位置和符号的结构与G.729是一致的);
(3)、选择一个带增益的自适应码本激励信号,将其标记为ea(n),n=0...39,而选择的固定码本激励信号标记为ef(n),n=0...39。然后以子帧能量为依据计算自适应增益Ga和固定码本增益Gf
1 40 Σ n = 0 39 ( G a × e a ( n ) + G f × e f ( n ) ) 2 = G ~ t 2
需要注意的是Gf可以选择负值。
定义:
Figure G200810084513XD00026
Figure G200810084513XD00027
Figure G200810084513XD00028
而由ACELP的激励结构可知
如果将自适应码本增益Ga固定,那么表现
Figure G200810084513XD000210
的方程就变成了一个关于Gf的二阶方程:
G f 2 + G a × I 2 G f + E a × G a 2 - K 4 = 0
Ga的值会被限定以确保上面的方程有解,更近一步,可以对一些大的自适应码本增益值的应用进行限制,这样,自适应码本增益Ga可以在如下的范围内随机的选择:
[ 0 , Max { 0.5 , K A } ] , with  A=Ea-I2/4
将方程
Figure G200810084513XD00033
的根中绝对值最小的作为Gf的值。
最后,用下式构建G.729的激励信号:
ex1(n)=Ga×ea(n)+Gf×ef[n],n=0...39
合成激励ex(n)可由如下方法合成:
设E1是ex1(n)的能量,E2是ex2(n)的能量,E3是ex1(n)和ex2(n)的点积:
E 1 = Σ ex 1 2 ( n )
E 2 = Σ ex 2 2 ( n )
E3=∑ex1(n)·ex2(n)
而计算的点数超过自身的大小。
令α和β分别是混合激励中ex1(n)和ex2(n)的比例系数,其中α设为0.6,而β依照下面的二次方程确定:
β2E2+2αβE3+(α2-1)E1=0,with  β>0
如果β没有解,那么β将被设成0,而α设成1。最终的CNG模块的激励变为ex(n):
ex(n)=αex1(n)+βex2(n)
以上即为729B编解码器的CNG模块的背景噪声的激励信号生成原理。
由上述实现过程可知,729B的背景噪声激励信号生成时虽然加入了一些语音激励ex1(n),但此语音激励ex1(n)只是形式,而实际的内容如自适应码本延迟、固定码本的位置和符号等均是随机产生的,随机性较强。因此其背景噪声激励信号与之前语音帧激励信号的相关性很差,这就会使得从合成的语音信号到合成的背景噪声信号的过渡很不自然,从而噪声人耳感觉的不舒适感。
发明内容
本发明实施例提供一种背景噪声激励信号的生成方法及装置,以解决信号帧从语音到背景噪声转换时,过渡更加自然、平滑和连续的问题。
为解决上述技术问题,本发明实施例提供一种背景噪声激励信号的生成方法,所述方法包括:
利用激励信号与最后子帧的基音延迟,及激励信号的过渡长度生成准激励信号;
将所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号。
相应地,本发明实施例还提供一种背景噪声激励信号的生成装置,所述装置包括:
准激励信号生成单元,用于利用激励信号与最后子帧的基音延迟,及激励信号的过渡长度生成准激励信号;
过渡阶段激励信号获得单元,用于将准激励信号生成单元生成的准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号。
本发明实施例通过在信号帧从语音编码帧向背景噪声帧转换时,在过渡阶段,将生成准激励信号与背景噪声的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号,用所述过渡阶段的激励信号代替随机的激励信号来合成背景噪声。由于在过渡阶段将前后两种激励信号的信息都包含了进来,采用这种舒适背景噪声的合成方法之后,会使得合成信号从语音到背景噪声转换时,过渡更加自然、平滑和连续,人耳感觉更加舒适。
附图说明
图1为本发明实施例中背景噪声激励的生成方法的流程图;
图2为本发明实施例中背景噪声激励的生成装置的结构示意图。
具体实施方式
下面我们将结合附图,对本发明的最佳实施方案进行详细描述。
本发明实施例中背景噪声中激励信号的生成过程为:在信号帧从语音编码帧到背景噪声帧转换的过渡阶段利用了语音编码帧的激励信号、基音延迟以及背景噪声编码帧的随机激励信号.也就是说,在过渡阶段,用之前语音编码帧的激励信号以及最后子帧的基音延迟生成待加权的准激励信号;然后将所述准激励信号与随机背景噪声激励信号进行逐点加权和(即递增或递减等,但并不限于此方式),得到过渡阶段背景噪声的激励信号,其具体的实现过程详见下述附图与实施例.
请参阅图1,为本发明实施例中背景噪声激励的生成方法的流程图,所述方法包括:
步骤101:利用语音编解码阶段的编码参数及激励信号的过渡长度生成准激励信号;
步骤102:所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号。
优选的,在步骤101之前,所述方法还包括:在信号帧从语音编码帧向背景噪声帧转换时,设置激励信号的过渡长度N;或者
语音编解码器预先保存语音编码帧的编码参数,所述编码参数包括激励信号及基音延迟,所述基因延迟也叫自适应码本延迟。
也就是说,在语音编解码器中,先保存接收到各个语音编码帧的编码参数,所述编码参数包括:激励信号以及基音延迟。激励信号实时的保存在激励信号存储器old_exc(i)中,其中i∈[0,T-1],T为语音编解码器所设定的基音延迟Pitch的最大值,如果T值超过了帧长,那么激励信号存储器old_exc(i)中会保存最近几帧的激励信号,比如,如果T值是两帧的长度,则激励信号存储器old_exc(i)中会保存最近两帧的激励信号,也就是说,激励信号存储器old_exc(i)的大小由T来确定。另外,激励信号存储器old_exc(i)和基音延迟Pitch是实时更新的,每帧都要进行更新,由于每帧中包含多个子帧,Pitch实际上是最后子帧的基音延迟。
在信号帧从语音编码帧向背景噪声编码帧转换时,设置激励信号过渡的过渡长度N。一般情况下,所述过渡长度N的值根据实际需要来设定,比如本发明实施例中的设置N的值以160为例,但并不限于此。
然后执行步骤101,利用语音编解码阶段的编码参数及激励信号的过渡长度生成准激励信号pre_exc(n),其公式为:
pre_exc(n)=old_exc(T-Pitch+n%Pitch)
其中,n为信号帧的数据样点,且n∈[0,N-1],n%Pitch表示n除以Pitch所得的余数,T为基音延迟的最大值,pitch为前一超帧中最后子帧的基音延迟,N为激励信号的过渡长度。
在步骤102中,将所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号cur_exc(n)。
也就是说,如果设过渡阶段的激励信号为cur_exc(n),则cur_exc(n)表示为:
cur_exc(n)=a(n)pre_exc(n)+β(n)random_exc(n)
其中,random_exc(n)为随机产生的激励信号,n为信号帧的采样点,a(n)和β(n)是准激励信号和随机激励信号的加权因子。其中a(n)是随着n值的增加递减变化的,β(n)是随着n值的增加递增变化的,且a(n)与β(n)之和等于1。
优选的,所述加权因子a(n)的计算公式为:a(n)=1-n/N;
所述加权因子β(n)的计算公式为:β(n)=n/N;
其中,n为信号帧的采样点,且n∈[0,N-1];N为激励信号的过渡长度。一般情况下,N的值优选为160。
当然,本实施例加权和的方式是以逐点加权和为例,但并不限于此,还可以是其它的加权方式,比如,偶数点加权和,奇数点加权和等,其具体的实现过程与逐点加权的方式类似,在此不再赘述。
优选的,所述方法在得到过渡阶段的激励信号为cur_exc(n)后,还可以包括:利用所述过渡阶段的激励信号cur_exc(n)激励LPC合成滤波器即可得到最终的背景噪声信号。
由上述技术方案可知,本发明实施例由于在过渡阶段引入了语音编码帧的激励信号,因此使得信号帧从语音到背景噪声转换时,转换的更加自然和连续,提高人耳感觉舒适度。
为了便于本领域技术人员的理解,下面结合具体的实施例来说明。
实施例一,为本发明应用在729B CNG中的实现过程,需要说明的是,在729B中,基音延迟T的最大值为143,其具体过程为:
(1)、语音编解码器接收各语音编码帧,并保存语音编码帧的编码参数,所述编码参数包括激励信号以及最后子帧的基音延迟Pitch。激励信号可以实时的保存在激励信号存储器old_exc(i)中,其中i∈[0,142],由于729B的帧长为80,因此激励信号存储器old_exc(i)中缓存了最近两帧的激励信号,当然,也可以根据实际情况激励信号存储器old_exc(i)缓存最近一帧、多帧或不到一帧的情况。
(2)、在信号帧从语音编码帧向背景噪声编码帧转换时,设置激励信号过渡的过渡长度N,其中N=160,由于729B每帧长度为10ms,80个数据样点,因此设置的过渡长度为两个10ms帧。
(3)、根据激励信号存储器old_exc(i)生成语音编码帧的准激励信号pre_exc(n),其公式为:
pre_exc(n)=old_exc(T-Pitch+n%Pitch)
其中,n为信号帧的数据样点,且n∈[0,159],n%Pitch表示n除以Pitch所得的余数,T为基音延迟的最大值,pitch为前一超帧中最后子帧的基音延迟。
(4)、设过渡阶段的激励信号为cur_exc(n),将所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段的激励信号cur_exc(n),其公式表示为:
cur_exc(n)=a(n)pre_exc(n)+β(n)ex(n)
其中,ex(n)为伪白噪声激励,即激励信号,该激励信号是语音激励ex1(n)和高斯白噪声激励ex2(n)的一个混合,由于ex1(n)的增益较小,而采用ex1(n)的目的是为了让语音和非语音间的过渡更为自然,其具体的生成ex(n)过程详见背景技术,在此不再赘述。
而a(n)和β(n)是两个激励信号的加权因子,其中a(n)是随着n值的增加递减变化的,β(n)是随着n值的增加递增变化的,且a(n)与β(n)之和等于1,其中a(n)与β(n)分别表示为:
a(n)=1-n/160
β(n)=n/160
(5)、利用过渡阶段的激励信号cur_exc(n)激励LPC合成滤波器,即可得到最终的背景噪声信号。
因此,本发明实施例在729B中,在信号帧从语音向背景噪声转换时的过渡阶段引入上述准激励信号后,会使得信号帧从语音到背景噪声转换时,转换的更加自然和连续,人耳感觉更加舒适。
实施例二,为本发明实施例应用在自适应多速率编码器(AMR,AdaptiveMultirate Codec)CNG中的实现过程,需要说明的是,在AMR中,基音延迟T的最大值为143,具体实现过程为:
(1)、语音编解码器接收各语音编码帧,并保存语音编码帧的编码参数,包括激励信号以及最后子帧的基音延迟Pitch。激励信号实时的保存在激励信号存储器old_exc(i)中,其中i∈[0,142],由于AMR的帧长为160,因此激励信号存储器old_exc(i)中只缓存了最近一帧的激励信号,当然,也可以根据实际情况激励信号存储器old_exc(i)缓存最近一帧、多帧或不到一帧的情况。
(2)、在从语音编码帧向背景噪声编码帧转换时,设置激励信号过渡的过渡长度N,其中N=160,由于AMR每帧长度为20ms,160个数据样点,因此设置的过渡长度为一个20ms帧。
(3)、根据激励信号存储器old_exc(i)生成语音编码帧的准激励信号pre_exc(n),其公式为:
pre_exc(n)=old_exc(T-Pitch+n%Pitch)
其中,n为信号帧的数据样点,且n∈[0,159],n%Pitch表示n除以Pitch所得的余数,T为基音延迟的最大值,pitch为前一超帧中最后子帧的基音延迟。
(4)、设过渡阶段的激励信号为cur_exc(n),将所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段的激励信号cur_exc(n),其公式表示为:
cur_exc(n)=a(n)pre_exc(n)+β(n)ex(n)
其中,ex(n)为固定码本激励(带最终增益的),利用一个增益可控的随机噪声激励一个经内插得到的LPC合成滤波器得到舒适的背景噪声,也就是说,对于每子帧,固定码本激励中非零脉冲的位置和符号使用均匀分布的伪随机数来生成,激励脉冲的值为+1和-1,对于本领域技术人员,该固定码本激励的生成过程为已知技术,在此不再赘述。
而a(n)和β(n)是两个激励信号的加权因子。其中a(n)是随着n值的增加递减变化的,β(n)是随着n值的增加递增变化的,且a(n)与β(n)之和等于1,其具体表示为:
a(n)=1-n/160
β(n)=n/160
(5)、利用过渡阶段的激励信号cur_exc(n)激励LPC合成滤波器即可得到最终的背景噪声信号。
由此可知,本实施例,与729B一样,在AMR的CNG算法中,信号帧从语音向背景噪声转换时的过渡阶段,引入准激励信号后,得到过渡阶段的激励信号,会使得从语音到背景噪声转换时,转换的更加自然和连续,人耳感觉更加舒适。
实施例三,为本发明应用在G.729.1CNG中的实现过程。
G.729.1是国际电信联盟(ITU,International Telecommunication Union)最新公布的一个语音编码器,其是一个宽带的语音编码器,即处理的语音信号带宽为50~7000Hz,在具体处理时,输入信号被分成高频带(4000~7000Hz)和低频带(50~4000Hz)分别进行处理,其中低频带采用的是CELP模型,该CELP模型是语音处理的基本模型,729、AMR等编码器采用的均是此模型.G.729.1基本的信号处理帧长为20ms,称为超帧,每个超帧320个信号采样样点,进行频带划分后,超帧中每个频带信号采样样点均为160点.同时,G.729.1也定义了处理噪声的CNG系统,其也分为高频带和低频带分别进行处理,其中低频带用的也是码激励线性预测编码(CELP,code-excited LPC)模型。本发明实施例可用于G.729.1CNG系统中的低频带处理流程中,本发明实施例应用在G.729.1CNG模块中的实现过程为:
(1)、语音编解码器接收各语音编码超帧,并保存语音编码超帧的编码参数,包括激励信号以及最后子帧的基音延迟Pitch,激励信号可以实时的保存在激励信号存储器old_exc(i)中,其中i∈[0,142],这是由于基音延迟T的最大值为143。
(2)、在信号帧从语音编码超帧向背景噪声编码超帧转换时,设置激励信号过渡的过渡长度N,其中N=160,即过渡阶段为一个超帧。
(3)、根据old_exc(i)生成语音编码帧的准激励信号pre_exc(n):
pre_exc(n)=old_exc(T-Pitch+n%Pitch)
其中,n为信号帧的数据样点,且n∈[0,159],n%Pitch表示n除以Pitch所得的余数,T为基音延迟的最大值,pitch为前一超帧中最后子帧的基音延迟。
(4)、设过渡阶段的激励信号为cur_exc(n),将所述准激励信号与背景噪声编码帧的随机激励信号进行逐点加权和,得到过渡阶段背景噪声的激励信号cur_exc(n),其公式为:
cur_exc(n)=a(n)pre_exc(n)+β(n)ex(n),
其中,n∈[0,159],ex(n)为当前计算的背景噪声的激励信号,a(n)和β(n)是两个激励信号的加权因子。其中a(n)是随着n值的增加递减变化的,β(n)是随着n值的增加递增变化的,且a(n)与β(n)之和等于1,分别表示为:
a(n)=1-n/160
β(n)=n/160
(5)、利用过渡阶段的激励信号为cur_exc(n)激励LPC合成滤波器即可得到最终的背景噪声信号。
由此可知,在G.729.1中,在信号帧从语音向背景噪声转换时的过渡阶段,引入准激励信号后,得到过渡阶段的激励信号,会使得从语音到背景噪声转换时,转换的更加自然和连续,人耳感觉更加舒适。
另外,本发明实施例还提供一种背景噪声激励的生成装置,其结构示意图如图2所示,所述装置包括准激励信号生成单元22和过渡阶段激励信号获得单元23。优选的,还可以包括设置单元21,其中
所述设置单元21,用于在信号帧从语音编码帧向背景噪声帧转换时,设置激励信号的过渡长度N;
所述准激励信号生成单元22,用于根据设置单元21所设置的过渡长度N的大小生成语音编码帧的准激励信号pre_exc(n);所述准激励信号pre_exc(n)的公式为
pre_exc(n)=old_exc(T-Pitch+n%Pitch)
其中,n为信号帧的数据样点,且n∈[0,N-1],n%Pitch表示n除以Pitch所得的余数,T为基音延迟的最大值,pitch为前一超帧中最后子帧的基音延迟。
所述过渡阶段激励信号获得单元23,用于将准激励信号生成单元22生成的准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号cur_exc(n),所述过渡阶段背景噪声的激励信号cur_exc(n)的公式为:
cur_exc(n)=a(n)pre_exc(n)+β(n)random_exc(n)
其中,random_exc(n)为随机产生的激励信号,a(n)和β(n)是两个激励信号的加权因子。其中a(n)是随着n值的增加递减变化的,β(n)是随着n值的增加递增变化的,且a(n)与β(n)之和等于1。
其中a(n)与β(n)分别表示为:
a(n)=1-n/160
β(n)=n/160
优选的,所述装置还可以包括激励单元24,用于利用过渡阶段激励信号获得单元23获得的激励信号激励合成滤波器得到背景噪声信号。
优选的,存储单元,用于预先保存语音编码帧的编码参数,所述编码参数包括激励信号及基因延迟。
优选的,所述背景噪声激励的生成装置可以集成编码端、解码端或独立存在;比如集成在编码端的非连续传输系统DTX中,或集成在解码端的舒适噪声生成系统CNG中。
所述装置中各个单元的功能和作用详见上述方法中对应步骤的实现过程,在此不再赘述。
在信号帧从语音编码帧向背景噪声帧转换时,在过渡阶段,将生成语音编码帧的准激励信号与背景噪声的随机激励信号进行加权和,得到过渡阶段的激励信号,用所述过渡阶段的激励信号代替随机的激励信号来合成背景噪声。由于在过渡阶段将前后两种激励信号的信息都包含了进来,采用这种舒适背景噪声的合成方法之后,会使得合成信号从语音到背景噪声转换时,过渡更加自然、平滑和连续,人耳感觉更加舒适。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括如下步骤:利用语音编解码阶段的编码参数及激励信号的过渡长度生成准激励信号;将所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段的激励信号。上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种背景噪声激励信号的生成方法,其特征在于,包括:
利用激励信号与最后子帧的基音延迟,及激励信号的过渡长度生成准激励信号;
将所述准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号。
2.根据权利要求1所述的背景噪声激励信号的生成方法,其特征在于,所述方法还包括:在信号帧从语音编码帧向背景噪声帧转换时,设置激励信号的过渡长度。
3.根据权利要求2所述的背景噪声激励信号的生成方法,其特征在于,所述方法还包括:
语音编解码器预先保存激励信号及基音延迟。
4.根据权利要求3所述的背景噪声激励信号的生成方法,其特征在于,所述激励信号实时保存在激励信号存储器old_exc(i)中,其中i∈[0,T-1],T为语音编解码器所设定基音延迟的最大值。
5.根据权利要求4所述的背景噪声激励信号的生成方法,其特征在于,所述激励信号存储器old_exc(i)的大小由T来确定。
6.根据权利要求1所述的背景噪声激励信号的生成方法,其特征在于,生成准激励信号的公式为:
pre_exc(n)=old_exc(T-Pitch+n%Pitch)
其中,n为信号帧的数据样点,且n∈[0,N-1],n%Pitch表示n除以Pitch所得的余数,T为基音延迟的最大值,pitch为前一超帧中最后子帧的基音延迟,N为激励信号的过渡长度。
7.根据权利要求1或2所述的背景噪声激励信号的生成方法,其特征在于,
所述将准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号的公式为:
cur_exc(n)=a(n)pre_exc(n)+β(n)random_exc(n)
其中,cur_exc(n)为过渡阶段背景噪声的激励信号,random_exc(n)为背景噪声编码帧随机产生的激励信号,a(n)和β(n)分别是准激励信号和随机激励信号的加权因子,n为信号帧的采样点。
8.根据权利要求7所述的背景噪声激励信号的生成方法,其特征在于,所述a(n)是随着n值的增加递减变化,β(n)是随着n值的增加递增变化的,且a(n)与β(n)之和等于1。
9.根据权利要求8所述的背景噪声激励信号的生成方法,其特征在于,
所述加权因子a(n)的计算公式为:a(n)=1-n/N;
所述加权因子β(n)的计算公式为:β(n)=n/N;
其中,n为信号帧的采样点,且n∈[0,N-1];N为激励信号的过渡长度。
10.根据权利要求1至9任一项所述的背景噪声激励信号的生成方法,其特征在于,所述方法还包括:
利用所述过渡阶段的激励信号cur_exc(n)激励合成滤波器得到背景噪声信号。
11.一种背景噪声激励信号的生成装置,其特征在于,包括:
准激励信号生成单元,用于利用激励信号与最后子帧的基音延迟,及激励信号的过渡长度生成准激励信号;
过渡阶段激励信号获得单元,用于将准激励信号生成单元生成的准激励信号与背景噪声编码帧的随机激励信号进行加权和,得到过渡阶段背景噪声的激励信号。
12.根据权利要求11所述的背景噪声激励信号的生成装置,其特征在于,所述装置还包括:设置单元,用于在信号帧从语音编码帧向背景噪声帧转换时,设置激励信号的过渡长度。
13.根据权利要求12所述的背景噪声激励信号的生成装置,其特征在于,所述装置还包括:
激励单元,用于利用过渡阶段激励信号获得单元获得的激励信号激励合成滤波器得到背景噪声信号。
14.根据权利要求13所述的背景噪声激励信号的生成装置,其特征在于,所述装置还包括:
存储单元,用于预先保存激励信号及基音延迟。
15.根据权利要求11、12、13或14所述的背景噪声激励信号的生成装置,其特征在于,所述背景噪声激励的生成装置集成在编码端、解码端或独立存在。
CN200810084513A 2008-03-21 2008-03-21 一种背景噪声激励信号的生成方法及装置 Active CN101339767B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN200810084513A CN101339767B (zh) 2008-03-21 2008-03-21 一种背景噪声激励信号的生成方法及装置
EP09722292A EP2261895B1 (en) 2008-03-21 2009-03-18 A generating method and device of background noise excitation signal
MX2010010226A MX2010010226A (es) 2008-03-21 2009-03-18 Un metodo y dispositivo de generacion de señal de excitacion de ruido de fondo.
PCT/CN2009/070854 WO2009115038A1 (zh) 2008-03-21 2009-03-18 一种背景噪声激励信号的生成方法及装置
US12/887,066 US8370154B2 (en) 2008-03-21 2010-09-21 Method and apparatus for generating an excitation signal for background noise

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200810084513A CN101339767B (zh) 2008-03-21 2008-03-21 一种背景噪声激励信号的生成方法及装置

Publications (2)

Publication Number Publication Date
CN101339767A CN101339767A (zh) 2009-01-07
CN101339767B true CN101339767B (zh) 2010-05-12

Family

ID=40213816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810084513A Active CN101339767B (zh) 2008-03-21 2008-03-21 一种背景噪声激励信号的生成方法及装置

Country Status (5)

Country Link
US (1) US8370154B2 (zh)
EP (1) EP2261895B1 (zh)
CN (1) CN101339767B (zh)
MX (1) MX2010010226A (zh)
WO (1) WO2009115038A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101339767B (zh) 2008-03-21 2010-05-12 华为技术有限公司 一种背景噪声激励信号的生成方法及装置
US8775818B2 (en) * 2009-11-30 2014-07-08 Red Hat, Inc. Multifactor validation of requests to thwart dynamic cross-site attacks
CN109166588B (zh) * 2013-01-15 2022-11-15 韩国电子通信研究院 处理信道信号的编码/解码装置及方法
CN106204478B (zh) * 2016-07-06 2018-09-07 电子科技大学 基于背景噪声特征空间的磁光图像增强方法
CN106531175B (zh) * 2016-11-13 2019-09-03 南京汉隆科技有限公司 一种网络话机柔和噪声产生的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055497A (en) * 1995-03-10 2000-04-25 Telefonaktiebolaget Lm Ericsson System, arrangement, and method for replacing corrupted speech frames and a telecommunications system comprising such arrangement
CN1470051A (zh) * 2000-10-17 2004-01-21 �����ɷ� 非话音语音的高性能低比特率编码方法和设备
CN101069231A (zh) * 2004-03-15 2007-11-07 英特尔公司 语音通信的舒适噪声生成方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5893056A (en) * 1997-04-17 1999-04-06 Northern Telecom Limited Methods and apparatus for generating noise signals from speech signals
JPH10341256A (ja) * 1997-06-10 1998-12-22 Logic Corp 音声から有音を抽出し、抽出有音から音声を再生する方法および装置
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
US7146309B1 (en) * 2003-09-02 2006-12-05 Mindspeed Technologies, Inc. Deriving seed values to generate excitation values in a speech coder
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
CN101339767B (zh) * 2008-03-21 2010-05-12 华为技术有限公司 一种背景噪声激励信号的生成方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6055497A (en) * 1995-03-10 2000-04-25 Telefonaktiebolaget Lm Ericsson System, arrangement, and method for replacing corrupted speech frames and a telecommunications system comprising such arrangement
CN1470051A (zh) * 2000-10-17 2004-01-21 �����ɷ� 非话音语音的高性能低比特率编码方法和设备
CN101069231A (zh) * 2004-03-15 2007-11-07 英特尔公司 语音通信的舒适噪声生成方法

Also Published As

Publication number Publication date
US8370154B2 (en) 2013-02-05
CN101339767A (zh) 2009-01-07
MX2010010226A (es) 2010-12-20
WO2009115038A1 (zh) 2009-09-24
US20110022391A1 (en) 2011-01-27
EP2261895A4 (en) 2011-04-06
EP2261895A1 (en) 2010-12-15
EP2261895B1 (en) 2012-05-23

Similar Documents

Publication Publication Date Title
KR101147878B1 (ko) 코딩 및 디코딩 방법 및 장치
CN100369112C (zh) 可变速率语音编码
CN102169692B (zh) 信号处理方法和装置
CN104978970A (zh) 一种噪声信号的处理和生成方法、编解码器和编解码系统
WO2008016935A2 (en) Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
JP2002541499A (ja) Celp符号変換
CN101548319A (zh) 后置滤波器以及滤波方法
CN100578618C (zh) 一种解码方法及装置
EP2772915B1 (en) Inactive sound signal parameter estimation method and comfort noise generation method and system
CN101339767B (zh) 一种背景噪声激励信号的生成方法及装置
EP2983171B1 (en) Decoding method and decoding device
CN103187065A (zh) 音频数据的处理方法、装置和系统
CN104254886B (zh) 自适应编码浊音语音的基音周期
CN103383846A (zh) 改进语音丢包修补质量的语音编码方法
JP2007525723A (ja) 音声通信のためのコンフォートノイズ生成の方法
CN103680509B (zh) 一种语音信号非连续传输及背景噪声生成方法
CN101582263B (zh) 语音解码中噪音增强后处理的方法和装置
CN101533639B (zh) 语音信号处理方法及装置
CN101651752B (zh) 解码的方法及装置
Motlíček et al. Speech coding based on spectral dynamics
MX2010012406A (es) Método para almacenar mensajes, método para enviar mensajes y servidor de mensajes.
Shoham Low complexity speech coding at 1.2 to 2.4 kbps based on waveform interpolation
KR100309873B1 (ko) 코드여기선형예측부호화기에서무성음검출에의한부호화방법
JP3475958B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
Liang et al. A new 1.2 kb/s speech coding algorithm and its real-time implementation on TMS320LC548

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant