在这里根据美国专利法35条§119(e)要求以96年11月15日提交的、临时专利申请60/031 047、名称为“在不连续传输期间产生安慰噪声的方法”、发明人Kari Jrvinen,Pekka Kapanen,Vesa Ruoppila和Jani Rotola-Pukkila为优先权。还根据美国专利法35条§119(e)要求以96年11月19日提交的、名称为“在不连续传输期间产生安慰噪声的方法”、发明人为Kari Jrvinen,Pakka Kapanen,Vesa Ruoppila和Jani Rotola-Pukkila的临时专利申请为优先权。这些临时专利申请在这里全部引用并供参考。
首先叙述编码和解码安慰噪声二者的常规技术。现有参见表示根据本发明的电路和方法的第一实施例的图2a-2c。在图2a和2b中,也在图1a和1b中出现的单元同样地编号。
首先注意,“SID平均周期”是GSM相关的词组,而“安慰噪声平均周期”或“CN平均周期”是IS、641,RevoA相关的词组。为了本发明的目的,这两个语组在下面的叙述中可能互换地使用。同样地,词组“SID帧”和“安慰噪声参数消息”或“CN参数消息”可互换地使用。
在图2a中,示出根据本发明在发送侧产生安慰噪声参数设备的方框图。根据本发明的新颖操作以虚线204与现有技术已知的操作区别开。根据本发明的这个实施例,从反相滤波器103输出的剩余信号104进行进一步分析(诸如LPC分析)产生另一组滤波系数。在这里称为随机激励(RE)LPC分析200的第二分析典型地是比在方框101中进行的LPC分析更低的程序。随机激励频谱控制(RESC)参数rmean(i)通过在平均方框203中的几个连续帧中平均从RE LPC分析方框200来的频谱参数201得到,i=1,…,R。RESC参数表征该激励的频谱。
应该注意,RESC参数不是语音编码参数的子集,但是只在安慰噪声产生期间产生和使用。本发明人已发现第一和第二阶的LPC分析足以产生RESC参数(R=1或2)。但是,也可使用频谱模型而不是LPC技术的全极点模型。该平均可替代地由RE LPC分析方框200通过平均LPC参数计算内的自相关系数或者利用LPC系数计算内的任何其它合适的平均技术进行。RESC参数的平均周期可与用于其它CN参数的平均周期相同,但是不限于只是相同的平均周期。例如,已经证明比常规CN参数所用的平均周期更长的平均周期可能是有利的。因此,不使用7帧的平均周期,反而较长的平均周期可能更好(例如10-12帧)。
在计算激励增益之前,LPC剩余信号104馈入第二反向滤波器HRESC(Z)202。这个滤波器产生频谱控制的剩余信号205,它一般具有比LPC剩余信号104更平坦的频谱。随机激励频谱控制(RESC)反向滤波器HRESC(Z)可能是全零滤波器形式(但不限于只是这个形式):
激励增益从频谱平坦的剩余信号205计算。否则,图2a中的操作类似于上面对于图1a所述的操作。
现在参见图2b,示出根据本发明在接收侧用于产生舒适噪声的解码器的方框图。在该解码器中,激励212是利用随机激励发生器110先产生白噪声激励序列114,然后在标度方框115中以gmean进行标度形成的。
频谱平坦的噪声序列111然后在随机激励频谱控制(RESC)滤波器211中处理,这产生具有正确频谱成分的激励。RE频谱控制滤波器211执行与图2a编码器中采用的RESC反向滤波器202的反向操作。在发送侧使用等式(2)的RESE反向滤波器,在接收侧使用的RE频谱控制滤波器211是以下型式的:
定义滤波系数b(i)的RESC参数的rmean(i)作为CN参数的一部分发送到接收侧,i=1,…,R,并且用在RE频谱控制滤波器211中,使得合成滤波器112的激励适合于频谱加权,因此一般不是频谱平坦的。RESC参数rmean(i)可与滤波系数b(i)相同,i=1,…,R,或者它们可使用能对传输有效量化的某些其它参数表示法,诸如LSP系数。图11a-11g表示RESC滤波器211的示例频率响应。
可以知道,本发明因此提供新颖的CN激励发生器210。在审查中,新颖的CN激励发生器210产生在RE发生器110中的频谱平坦的随机激励。该频谱平坦的激励则适合于利用平均增益标度器115进行标度。为了产生安慰噪声的正确频谱和为了避免该安慰噪声的频谱与背景噪声的频谱之间不相符,该随机激励馈人RE频谱控制滤波器211。然后频谱控制激励212用在语音合成滤波器112中产生具有与在发送侧出现的实际背景噪声频谱改善的相符的安慰噪声。
RESC参数不是在语音信号处理期间使用的语音编码参数的子集,而只是在安慰噪声计算期间计算的。只是为了在语音间歇期间产生安慰噪声的改进的激励的目的才计算和发送RESC参数。在编码器中的RESC反向滤波器202和在解码器中的RESC滤波器211只用于控制随机激励频谱的目的。
图2C表示根据本发明在安慰噪声产生期间图2b的解码器内的一些信号的频谱。RE发生器110产生具有曲线A所示的平坦频谱的随机数序列。这个频谱与图1C的曲线A所示的频谱相同。信号114和111具有这个平坦的频谱,注意在方框115中出现的增益标度不影响该频谱的形状。然后自噪声序列111馈入RE频谱控制滤波器211产生对LPC合成滤波器的激励212。改进的激励序列212一般具有非平坦的频谱(曲线C),和这个非平坦频谱的效应在合成滤波器112输出信号113的频谱中可观察到(曲线D)。激励序列212可以是低通或高通型的,或者可呈现更复杂的频率成分(取决于RESC滤波器的阶)。频谱控制由RESC参数确定的,该RESC参数在发送侧计算并作为安慰噪声的一部分发送到接收侧,如上所述的。
图3a和3b表示本发明的另一个实施例。图3a与图2a相比,可看到这个实施例中激励增益的计算从LPC剩余信号104开始进行,而不从来自RESC反向滤波器202的剩余信号开始。在图3a的实施例中因此不要求RESC反向滤波器202,并可省去。与图3a的编码器一起使用的接收侧的解码器示于图3b。当与图2b比较时,可注意到:激励的标度(方框115)被移到RE频谱控制滤波器211的输出。否则,图3a及3b的编码器及解码器的操作类似于图2a及图2b所示的编码器及解码器的操作。
现在参见图4,示出根据本发明的另一实施例在TX侧评价安慰噪声参数的电路方框图。这个实施例解决上述问题,这些问题在平均周期内有一个帧或少量帧时出现,在该平均周期中的一些或所有的语音编码参数给出差的典型背景噪声特性。根据本发明的这个实施例的操作利用虚线300及310区别于现有技术已知的操作。根据本发明的这个实施例,缓存在方框107a和108a中的语音编码参数在加到平均方框107及108用于计算平均激励增益gmean和平均短期频谱系数fmean(i)之前进行门限中间替换过程。在这个过程中,如果符合特定条件,具有非典型的背景噪声值的平均周期内的参数以被认为是该实际背景噪声的典型的参数值即中间值替换。
首先,讨论在方框107平均之前执行由方框300指示的有关标度值的激励增益系数g的操作。在平均周期中缓存在方框107a中的激励增益值107b组被传送到方框301,在其中根据它们的值被排顺序。每个激励增益值在该组中有它自己的指数。排顺序的增益参数302组传送到中间替换方框303,其中那些L激励增益值与中间值相差最大,当差值超过预定的门限时,以参数值的中间值替换。每个单独参数值和中间值之间的差值在方框304中计算,和这个计算的差的绝对值超过门限的激励增益值的指数作为信号305发送给中间替换方框303。
平均周期的长度N最好是一个奇数。在这个情况下,排序组的中间值是它的第((N+1)/2)个单元。确定替换参数数量的变量L可认为是O和N-1之间的一个值。L也可以是一个预定值(即一个常数)。
如果存在单个的激励增益值,使得该激励增益值和中间值之间的差超过预定的门限,则选择器307转换到从中间替换方框303得到平均方框107的激励增益值309作为信号308的位置。但是,如果对于每个激励增益值,该增益值与中间值之间的差不超过预定门限,则选择器307被转换,使得输入到平均方框107的参数309直接从缓冲器方框107a得到。
选择器307的转换状态由门限方框304利用信号306进行控制。
接着,讨论在方框108中平均之前有关LSP系数f(k)的方框310的操作,K=1,…,M。在平均周期中缓存在方框108a中的LSP系数108b组传送给方框311。在平均周期中第i帧的LSP系数fi(k)到该平均周期中第j帧的LSP系数fj(k)的频谱距离根据下式近似:
式中M是LPC模型的阶,和fi(k)是在该平均周期中第i帧的第K个LSP参数。
为了得到i帧的LSP系数fi(k)到长度N的平均周期内所有其它帧j=1,…N,i≠j的频谱距离ΔSi,频谱距离ΔRij的和计算如下:
对于所有i=1,…,N(ΔRij=0即,离开它本身的参数的距离为零)。在式(4)和(5)中所表示的操作在方框311中进行。
频谱距离可使用许多其它的LPC滤波器表示式近似,例如,见1976年IEEE Transactions on Acoustics,Speech,and Signal Processing,第24卷第380-391页A.H.Gray,Jr.和J.D.Markel的文章“语音处理的距离测量”。而且导抗频谱对(Immittance spectral Pairs)(ISP)可类似线路频谱对那样使用,例如见1993年4月Proceedings of IEEE InternationalConference On Acoustics,Speech,and Signal Processing,Minneapolis,Minnesota,第2卷第9-12,27-30页Y.Bistritz和S.Peller的文章“语音编码的导抗频谱对(ISP)”。
在该平均周期内在方框311中已找到每个LSP矢量fi的频谱距离ΔSi,这些距离312传送给方框313。在排顺序方框313中,频谱距离按照它们的值排顺序。每个频谱距离值以指数相关到平均周期内的一个LSP矢量。在具有该平均周期内的最小距离ΔSi的矢量fi被认为该平均周期的中间矢量fmed,i=1,2,…N,其距离以ΔSmed表示。
该平均周期内的LSP系数矢量fi的组在方框313中按照频谱距离所找到的顺序进行排序。从方框313得到的这个排序的LSP矢量314组传送给中间替换方框315。在方框315中,P(0≤P≤N-1)LSP矢量fi以中间fmed代替。这些P矢量的指数在方框316中通过比较i=1,2,…,N的ΔSi与中值ΔSmed确定。因此对于其ΔSi-ΔSmed大于门限的fi的指数通过信号317传送到中间替换方框315。
如果对一些i=1,2,…,N的差值ΔSi-ΔSmed大于一个门限,则选择器319被转换到这样的位置:平均方框108从中间替换方框315接收参数321作为信号320。但是,如果对于所有i=1,2,…N,ΔSi-ΔSmed小于门限,则选择器319转换到这样的位置:在该位置中到平均方框108的输入信号321通过信号108(b)直接从缓冲器方框108(a)得到。
选择器319利用门限方框316利用信号318进行控制。
图5表示本发明的另一个实施例。在这个实施例中,按照本发明的操作利用虚线400区别于现有技术知道的操作。虽然在图4所示的和上面叙述的实施例中对激励增益值g和LSP矢量fi的中间运算是独立地进行的,但在图5的实施例中这两个参数组一起处理如下。
如果确定单个帧中的参数以中间值代替,则那个帧的激励增益值g和LSP矢量fi二者以包含中间参数的那帧的相应参数代替。
为了找到用于中间代替的帧的顺序,平均周期的第i帧和第j帧的参数之间近似距离ΔRij的式(4)被改变为考虑激励增益值g和LSP矢量fi如下:
式中M是LPC模型的阶,fi(k)是平均周期的第i帧的第K个LPS参数,而gi是第i帧的激励增益参数。
为了找到对所有i=1,…,N的帧i参数到长度N的平均周期内的所有其它帧j=1,…,N,i≠j的参数的距离ΔSi,在计算ΔTij之后应用式(5)。然后使用距离ΔTij代替式(5)中的距离ΔRij。以式(5)和(6)表示的过程在方框401中进行。根据激励增益值或根据该频谱距离选择加权系数W以便获得执行中间替换之间的主观最佳折衷。通过利用典型用户进行测试找到主观最佳折衷。
在方框401中已找到平均周期内每一帧的距离ΔSi之后,这些距离402传送到排序方框403。在排序方框403中,按照它们的值排序这些距离。每个距离以一个指数相关到平均周期内的一帧。在平均周期内具有最小距离ΔSi的帧被认为是具有参数gmead和fmed的平均周期的中间帧,i=1,2,…,N,其距离表示为ΔSmed。
在方框403中被排序的激励增益值利用信号107b从缓冲器107a传送到该方框,而LSP系数利用信号108b从缓冲器108a传送到该方框。如上所说明的,平均周期内的参数组在方框403中按照它们的频谱距离ΔSi找到的顺序排顺序。从方框403得到的排序的系数组作为信号404并在405中传送到中间替换方框406。在方框406中,L(0≤L≤N-1)帧的参数gi和fi以中间帧的参数gmed和fmed代替。通过在方框407中比较i=1,2,…,N的ΔSig与中间ΔSmed,确定这些L矢量的指数并且作为信号408传送到中间替换方框406。如果差ΔSi-ΔSmed大于方框407中的门限,则参数gi和fi以中间替换方框406中的gmed和fmed代替。L的值可以预定的最小值和最大值为界。
如果对于一些i=1,2,…,N,差ΔSi-ΔSmed大于一个门限,则选择器410被转换,使得平均方框108从中间替换方框406接收参数321作为信号411,和平均方框107从中间替换方框406接收参数309作为信号412。但是,如果对于所有的i=1,2,…,N,ΔSi-ΔSmed小于一个门限,则选择器410被转换,使得到平均方框108的输入信号321通过信号108b直接从缓冲器方框108a直接得到,到平均方框107的输入信号309通过信号107b直接从缓冲器方框107a得到。选择器410利用门限方框407以信号409控制。
除了从单个距离减去中间距离(即通过计算ΔSi-ΔSmed),每个单个距离和中间距离之间的差可在方框316和407中例如通过将单个距离除以中间距离(即通过计算ΔSi-ΔSmed)进行计算。在大多数情况下这可能是一个最好的方法,因为它找到一个相关的或标称化的单个距离离开中间距离的偏差,而与距离ΔSi和ΔSmed的绝对值无关。
在叙述本发明的另一个实施例之前参见图6,该图是发送(TX)侧语音编码器DTX系统的简化方框图。来自模数转换器600的输入信号601在语音编码器602中一帧一帧地处理。如前所述,该帧长度典型地为20ms。语音信号601的取样频率一般为8KHz。语音编码器602一帧一帧地编码该输入语音为参数603组,这些参数被发送到数字移动无线电单元的无线电子系统611,以便发送到接收(RX)侧。
DTX机制的操作由在TX侧执行的话音活动检测(VAD)间接控制。VAD 604的基本功能是区分存在语音的噪声与不存在语音的噪声。VAD604连续地操作来评价输入信号包含语音或不包含语音。VAD 604的操作是根据语音编码器602和它的内部变量605。VAD 604的输出是二进制VAD标志606,当存在语音时它为1,而当没有语音时它等于零。例如,如在GSM 06.82中所规定的,VAD 604在一帧一帧的基础上操作。
语音编码器DTX处理器612连续地传送以二进制SP标志607单个地标明的业务帧到无线电子系统611。SP标志607给无线子系统611指示由DTX处理器612传送的业务帧是语音帧(SP标志=“1”)或是所谓的无声描述符(SID)帧(或者安慰噪声参数消息)(SP标志=“0”)。无线子系统611根据SP标志607的状态控制在空中接口上传输的帧的安排。
与前述DTX使用相关的基本问题是与语音一起发送的背景音频噪声在空中接口上的传输终止时可能消失,导致在RX侧的背景噪声的不连续。由于DTX转换可能迅速地出现,已经证明这个影响对收听者是不能采用的。这在具有高背景噪声电平的环境如汽车中特别是这样。最坏的情况,这个影响可导致该语音变为不可懂。
对这个问题的目前最好解决方案是在传输终止时在RX侧产生类似于TX侧背景噪声的合成噪声(即安慰噪声)。如上所述,安慰噪声产生所要求的参数在TX侧的语音编码器(图6的方框608)中评价并且在无线电传输切断之前在SID帧中发送到RX侧,此后以相对低速率传输,这允许在RX侧语音不活动期间产生的安慰噪声适应在TX侧背景噪声的改变。
已经证明,如果在TX侧评价的安慰噪声参数适当地代表音频背景噪声的电平和频谱包络,则在RX侧可产生良好的主观质量的安慰噪声。背景噪声的这些特征经常随时间稍有变化,因此为了得到好的表示法,描述背景噪声电平和频谱包络的语音编码器的参数需在几个语音帧中进行平均。在GSM全速率和增强全速率语音编码器(见GSM 06.31和GSM06.81)的DX系统中,SID平均周期的长度分别是20毫秒持续时间的4个语音帧和8个语音帧。
在传输切断之前,为了在语音脉冲串的末尾评价和发送包含安慰噪声参数的第一SID帧到RX侧,引入上述释放延迟周期。释放延迟周期是VAD 604已检测到语音不活动(即VAD标记606=“0”)但语音帧的传输还未切断(即SP标志606=“1”)的一个周期。关于这方面还可参见图7。在释放延迟周期,由于VAD 604已检测到语音不活动性,这保证该语音帧只包含噪声(和无语音),因此这些释放延迟帧可用于语音编码器参数的平均以评价安慰噪声参数。
释放延迟周期的长度由SID平均周期的长度确定,即释放延迟周期的长度必须足够长,以便能够在得到的安慰噪声参数在SID帧中被发送之前完成参数的平均。在GSM全速率语音编码器的DTX系统中,释放延迟周期的长度等于4帧(SID平均周期的长度),因为安慰噪声评价技术只使用来自前面的帧的参数以便使更新的SID帧可用。在GSM增强全速率语音编码器的DTX系统中,释放延迟周期的长度等于7帧(SID平均的长度减1)因为8帧的SID平均周期的参数可在处理第一SID帧的同时从该语音编码器得到。图7示出在GSM增强全速率语音编码器的DTX系统中释放延迟周期和SID平均周期的概念。
在释放延迟周期的末尾发送第一SID帧,和只要VAD 604继续检测到语音不活动性,安慰噪声评价算法继续评价背景噪声特性并逐帧地传送更新的SID帧到无线电子系统611。TX DTX处理器612使用标记609通知安慰噪声评价算法608:SID平均周期完成。标记609通常复位为“0”并且在更新的SID帧传送到无线电子系统611时上升为“1”。当标记609上升时,安慰噪声评价算法608执行参数的平均以便使得更新的SID帧对于无线电子系统611是可用的。更新的SID帧发送到无线电子系统611以及写入SID存储方框610,方框610存储最近的SID帧供稍后使用。
在语音脉冲串末尾,如果从最后SID帧计算并传送到无线电子系统开始已过去了少于24帧,则最后SID帧重复地从SID存储器610取出并传送给无线电子系统611。这情况出现直到新的更新SID帧可用,即这过程继续直到再次完成SID平均周期。由于不需要在能够计算新的SID帧的语音脉冲串末尾插入释放延迟周期,这个技术减少了在短背景噪声尖峰被翻译为语音的情况下的传输活动性。
图8表示没有释放延迟的最长可能的语音脉冲串。二进制标记613用于发信号通知SID存储器610:何时在SID存储器610中存储新的、更新的SID帧以及何时从SID存储器610中发送最近更新的SID帧到无线电子系统611。SID存储器610确定在SD标记607为“0”时的每帧期间是存储还是发送该SID帧。
在GSM增强全速率语音编码器的DTX系统中,也需要二进制标记614通知噪声评价算法有关释放延迟周期的结束。标记614通常复位到“0”,并在第一SID帧在语音脉冲串后被发送时,如果前面是释放延迟周期,标记614上升到“1”保持一帧的持续期间。
图9是DTX系统接收(RX)侧的语音解码器的方框图。在语音解码器702逐帧地处理来自数字移动无线单元的无线电子系统700的输入语音编码器参数701组,以便合成提供给数模转换器704的语音信号703。数模转换器704为收听用户产生音频信号。
RX DTX系统从该无线电子系统接收二进制SP标志705,这反映TX侧SP标志的操作,即当收到语音帧时SP标志=“1”,和当收到SID帧或传输终止时SP标志=“0”。也从无线电子系统700接收的二进制标记706通知安慰噪声产生算法707:新接收的SID帧的存在,即该标记通常复位到“0”,而当SP标志705为“0”以及收到新SID帧时上升至“1”。
当SP标志705=“0”,即不连续传输激活时,语音解码器702的安慰噪声产生方框707在TX侧背景噪声特性表示法的基础上产生安慰噪声,如在SID帧中所接收的。在不连续传输期间以重复的低速率接收更新的SID帧,而且解码的安慰噪声参数被内插在更新的SID帧之间以便在安慰噪声特性中提供平滑传输。
在GSM全速率语音编码器的DTX系统中,当新的、更新的SID帧被计算并发送给无线电子系统611(图6)时,描述该背景噪声特性(电平和频谱)的参数在SID平均周期进行平均并且使用与在通常语音编码模式中用于量化的相同量化方案进行标度地量化。同样地,当SID帧到达GSM全速率语音解码器702时,使用与在通常语音解码模式中使用的相同去量化方案(例如见GSM06.12)解码无声描述符参数。
在GSM增强全速率语音编码器的DTX系统中,描述背景噪声频谱的参数(LSP参数)在新的SID帧被计算时在SID平均周期中进行平均,和使用预测量化表进行矢量量化,这些预测量化表也用于在通常语音编码模式中这些参数的量化。在解码器702中,这些频谱参数使用与在通常语音解码模式中使用的相同预测去量化表去量化。描述背景噪声电平的参数(固定代码本增益)在计算新SID帧时在SID平均周期中进行平均,和使用标度预测量化表量化,该标度预测量化表也用于通常语音编码模式中的这些参数的量化。在在该解码器中,这些增益参数使用如在普通语音解码模式中使用的相同预测去量化表(见GSM06.62)去量化。
但是,预测量化器的自适应性使它很难采用这类的量化方案来量化在SID帧中发送的安慰噪声参数。由于传输在语音不活动期间被终止,无法分别在编码器和解码器的量化器及去量化器中保持预测器在逐帧基础上同步。但是,该量化器的预测器值可以与如下相同的方式在编码器及解码器中本地评价。七个最近的语音帧的量化LSP及固定代码本增益参数本地地存储在编码器602及解码器702中。当在语音脉冲串结束的释放延迟周期结束时,这些存储的参数进行平均,则所得到的平均参数为基准LSP参数矢量fref和基准固定代码本增益gc ref,它们在编码器602及在解码器702中具有相同值,因为由于量化,在正常语音编码模式(假定无差错传输)期间相同量化的LSP及固定代码本增益值在二者中都是可用的。然后基准LSP参数矢量fref及基准固定代码本增益gc rer的平均值被冻结直到在语音脉冲串之后又一次出现释放延迟周期为止,并且用于代替量化算法中正常预测器进行安慰噪声参数的量化。
再一次参见图9,RX DTX处理器708、接收SP标志705作为输入,和输出二进制标记709,标记709通常复位为“0”,而当在语音脉冲串之后出现释放延迟周期时在一帧持续期间被设置为“1”。在GSM增强全速率语音解码器702的DTX系统中要求标记709来通知安慰噪声产生算法707:何时进行平均以便更新基准LSP参数矢量fref和基准固定代码本增益gc ref(见GSM06.62)。确定标记709的值的方法在先前提交的芬兰专利申请FI953252和在1996年6月28日提交的相应的美国专利申请序号08/672932及在PCT申请“PCT/FI96/00369”中叙述,其整体引用在此供参考。
总之,在许多现代语音编码器中,语音编码参数使用预测方法量化。这意味着在量化器中,试图尽可能地接近地预测被量化的值。在这些类型的预测量化器中,实际参数值和预测的参数值之间的差或商典型地被量化并且发送到接收侧。在该接收侧,相应的去量化器具有与量化器类似的预测器。这样,在TX侧量化的参数值可通过将接收的差或商值分别与该预值相加或相乘再生。
在这样的预测量化器中,该预测器典型地成为自适应的,使得量化的结果在每个量化之后用于更新该预测器。量化器及去量化器的预测器二者都使用再生的、量化的参数值更新,以便保持预测器同步。
预测量化器的自适应性使得它很难采用该类量化方案来量化在SID帧中发送的安慰噪声参数。由于该传输在语音不活动性期间终止,因此没有办法在编码器602和解码器702的量化器及去量化器中在逐帧基础上保持预测器同步。
但是,可认为能够采用相同的量化表,用于安慰噪声参数的量化,如同由该预测量化器以普通语音编码模式使用那样。这要求在不连续传输期间以非自适应方式进行预测。该预测器具有尽可能接近目前背景噪声的平均参数值,以便该量化器能够编码该参数值中由于背景噪声特性的变化的波动,最好相同的预测值应该在量化器及去量化器中是可利用的。
如前所指出的,获得好的预测值用于量化在SID帧中发送的安装噪声的一个技术是在释放延迟周期期间存储正常语音编码模式中的量化参数值,并且在该释放延迟周期结束时计算存储的、量化的参数值的平均值。然后冻结平均的预测器直到出现下一个释放延迟周期。但是,这个方法的一个问题是在类似于GSM的那些DTX技术中,语音解码器702不知道何时在语音脉冲串末尾存在释放延迟周期。
因此本发明的一个方面是提供在语音脉冲串末尾通知语音解码器702存在一个释放延迟周期。最好这是通过从语音编码器602中发送作为SID帧中的侧消息(或安慰噪声参数消息)的释放延迟周期信息实现的。
为了说明根据本发明的这个方面的方法,参见图10。在图10中,二进制标记709不再由RX DTX处理器产生,而是从编码器602发送和从该传输信道在第一SID帧中接收。因此RX DTX处理器方框708不再要求为了去量化的目的使用本发明所述的预测方法,因为不要求标记709在解码器702本地地产生。根据本发明的这个方面,如果释放延迟周期在第一SID帧之前,则在第一SID帧中标记709上升至“1”。如果第一SID帧之前没有释放延迟周期,则在第一SID帧中的标记709被复位至“0”。在安装噪声输入周期的第二及另外的SID帧中,标记709总是复位至“0”。
本发明的这个方面的优点是语音解码器DTX处理器708无需在语音脉冲串末尾本地地确定释放延迟周期的存在。这消除了来自语音解码器702的一部分计算负荷,并且减少由RX DTX处理器708使用的程序指令的数量。
涉及给解码器702提供有关释放延迟周期的存在的信息的另外的优点是每当释放延迟周期结束时,它能够在编码器602及解码器702同步地再初始化伪噪声激励发生器。
涉及给解码器702提供有关释放延迟周期存在的信息的另外优点是:取决于在语音脉冲串末尾是否存在释放延迟周期,可用不同的方式执行接收的安慰噪声参数的内插,以便在出现短语音脉冲串时减少安慰噪声的电平或频谱中类似感觉到的跳跃的变化。
在详细地叙述本发明的操作之前,参见图12和13,示出无线用户终端或移动站10,诸如适于实现本发明的但不限于蜂窝无线电话机或个人通信机。移动站10包括一个天线12,用于发送信号到基站30或从基站30接收信号。基站30是蜂窝网络的一部分,蜂窝网络可包括一个基站/移动交换中心/配合工作功能(BMI)32,配合工作功能32包括一个移动交换中心(MSC)34。当移动站10卷入一个呼叫时,MSC34提供到陆线中继线的连接。根据本发明,移动站10可称为发送侧,而基站称为接收侧。假定基站30包括合适的接收机和语音解码器,用于接收和处理编码的语音参数以及DTX安慰噪声参数,如下面所叙述的。
该移动站包括一个调制器(MOD)14A,一个发射机14,一个接收机16,一个解调器(DEMOD)16A和一个控制器18,控制器18分别提供信号给发射机14和从接收机16接收信号。这些信号包括按照可应用的蜂窝系统的空中接口标准的信令信息,还有用户语音和/或用户产生的数据。用于本发明的空中接口标准包括物理的和逻辑的帧结构,虽然本发明的教导不是要限制于任何具体结构,或者只与IS-136类似的可兼容的移动站一起使用,或者只在TDMA类型系统中使用。还假定空中接口标准支持DTX操作模式。
应懂得,控制器18还包括实现移动站的音频及逻辑功能要求的电路。例如,控制器18可包括数字信号处理器器件、微处理器器件和各种模数转换器、数模转换器及其它支持电路。该移动站的控制及信号处理功能根据它们各自的能力在这些器件之间进行分配。假定用于本说明目的的控制器18包括必要的语音编码器和实现本发明改进的安慰噪声产生的DTX方法及设备的其它功能。这些功能可完全以软件、完全以硬件或以硬件及软件的混合来实现。
用户接口包括一个常规耳机或扬声器17、诸如与A/D变换器和语音编码器组合的常规的话筒19的一个语音变换器、一个显示器20和一般是键盘22的一个用户输入装置,所有这一切都耦合到控制器18。键盘22包括常规的数字(0-9)与有关的键(#,*)22a以及用于操作移动站10的其他键22b。例如,这些其他键22b可以包括发送键、各种菜单滚动与软控键和一个PWR键。移动站10也包括电池26,用于给操作移动站所要求的各种电路供电。
移动站也包括各种存储器,一起表示为存储器24,在存储器中存储由控制器18在移动站操作期间所使用的许多常数和变量。例如,存储器24存储各种蜂窝系统参数和号码分配模块(NAM)值,用于控制控制器18操作的操作程序也存储在存储器24中(一般存在ROM装置中)。存储器24也可以存储在给用户显示消息之前从BMI32中接收的包括用户消息的数据。存储器24也包括用于实施下面根据DTX操作期间的安慰噪声(comfort noise)参数传输所描述的方法的例行程序。
应理解:移动站10可以是车载或手持装置。还应意识到:移动站10可利用一个或多个空中接口标准、调制类型和接人类型进行操作。例如,移动站可以利用诸如GSM除IS-136之外的许多其他标准的任一标准进行操作。因此,应清楚:不认为本发明的教导是限制于任何一个特定类型的移动站或空中接口标准。
虽然下面具体在IS-136实施例内容中描述本发明,但应再次注意:本发明的教导不限于只是这一个空中接口标准。
关于数字业务信道上的DTX(IS-136.1、修订本A,段落2、3、11、2),当在DTX高状态中时,发射机14以由移动站10接收的最新功率控制命令所表示的一个功率电平进行辐射(初始业务信道指示消息、数字业务信道(DTC)指示消息、越区切换消息、专用DTC越区切换消息或物理层控制消息)。
在DTX低状态中,发射机14保持关断。除了快速关联控制信道(FACCH)消息传输之外,不发送CDVCC。但在DTX低状态中,要由移动站10发送的所有慢速关联控制信道(SACCH)消息作为一个FACCH消息发送,在此之后,发射机14再次返回到关断状态,除非另外已禁止不连续传输(DTX)。
当移动站10希望从DTX高状态转换到DTX低状态时,它可以完成DTX高状态中的所有顺序的SACCH消息,或者终止SACCH消息传输并且其整体作为DTX低状态中的FACCH消息重新发送中断的SACCH消息。
当移动站从DTX高状态转移到DTX低状态时,它必须通过一个过渡状态,在此状态中所发送的功率是在DTX高电平上直至已全部发送所有未定的(pending)FACCH消息。
在本发明的优选实施例中,移动站10保持在过渡状态中直至已全部发送一个安慰噪声块(由六个DTX释放延迟时隙和有关的安慰噪声参数消息组成)。此安慰噪声块不中断地进行发送。如果一些其他的FACCH消息时隙与安慰噪声块的发送一致,移动站10则延迟FACCH消息或安慰噪声块的传输,以便一个接一个地发送,但在任何FACCH消息有效地进行分组或分段,使得它们不中断或挪用用于安慰噪声块传输的时隙。这保证在基站话音/安慰噪声解码器上生成最佳可获得的安慰噪声质量。
有关这个方面参考Seppo Alanara与Pekka Kapanen共同转让与未审查的US专利申请S.N08/936、755,在97年9月25日申请,题为“在不连续传输期间安慰噪声参数的传输”。
根据特定实施例,下面在表1中所示的安慰噪声(CN)参数消息在反向数字业务信道(RDTC)上,特别在FACCH逻辑信道上进行发送并包含38比特,其中26比特包含一个LSF剩余矢量,此矢量利用与在IS-641语音编解码器中所使用的一样的分裂矢量量化(SUQ)代码本进行量化。修改语音编解码器的量化/去量化算法使之可以使用这个代码本。此LSF参数利用最好是频谱的第10阶LPC模型给出在发送端的背景噪声的频谱包络估算。
下一个8比特包含一个安慰噪声能量量化指数,此指数描述在发送端上的背景噪声能量。消息中的剩余4比特用于发送随机激励频谱控制(RESC)信息成分。
表1
消息格式
信息单元 |
类型 |
长度(比特) |
协议鉴别器 |
M |
2 |
消息类型 |
M |
8 |
LSF剩余矢量 |
M |
26 |
CN能量量化指数 |
M |
8 |
RESC参数 |
M |
4 |
总的来说,在本专利申请的背景技术部分所讨论的问题通过在接收端生成类似于发射端的背景噪声的合成噪声来解决。安慰噪声(CN)参数在发射端进行估算并在停止无线电传输之前发射给接收端,和以后以规则的低速率。这允许安慰噪声适应在发射端上的噪声变化。根据本发明的DTX机理采用:在发射端上的话音活动检测器(VAD)功能21(图12);在控制器18中有关发射端背景噪声的评估,以便发射特征参数给接收端;以及在停止无线电传输期间在接收端称为安慰噪声的类似噪声的生成。
除了这些功能之外,如果发现到达接收端的参数由于差错而被严重破坏,则反而从替代的数据中生成语音或安慰噪声以避免给收听者生成烦人的声音效果。
发射端DTX功能连续地传送每个以标记SP标志的业务帧给无线电发射机14,其中SP标志=“1”表示话音帧,而SP标志=“0”表示一组编码的安慰噪声参数。有关空中接口的传输帧的时间安排由无线电发射机14根据SP标志进行控制。
在本发明的一个优选实施例中,为了允许发射端DTX功能的准确校验,在移动站10复位之前所有帧都当作它们是无限长时间的语音帧一样。因此,在复位之后的头6帧总是以SP标志=“1”标记,即使VAD标志=“0”(释放延迟期间,见图14)。
话音活动检测器(VAD)12连续地操作以便确定从话筒19输入的信号是否包含话音。输出是在一帧接一帧基础上的二进制标记(VAD标志=“1”或VAD标志=“0”),从而形成“释放延迟周期”。在语音脉冲结束之后,新第一组的CN参数则作为第7帧传送给无线电发射机14,SP标志=“0”(见图14)。
但是,如果在语音脉冲结束时,自最后一组CN参数计算并传送给无线电发射机14起已历时少于24帧,则重复传送最后一组CN参数给无线电发射机14,直至获得一组新更新的CN参数(标记VAD标志=“0”的7个连续帧)。通过避免等待CN参数计算的“释放延迟”,在短背景噪声尖峰解释为语音的情况中减少了空中接口的有效性。图15表示最长可能的语音脉冲串而没有释放延迟的示例。
一旦在语音脉冲串结束之后第一组的CN参数已进行计算并传送给无线电发射机14,发射端DTX处理器连续计算并传送更新的CN参数组给发射机14,只要VAD标志=“0”,就标记SP标志=“0”。
如果SP标志=“1”,则以正常语音编码模式操作语音编码器,而如果SP标志=“0”,则以简化模式操作此编码器,因为不是所有的编码器功能都要求用于CN参数的评估。
在无线电发射机14中,下列业务帧安排用于传输:所有以SP标志=“1”标记的帧;在具有SP标志=“1”的一个或多个帧之后以SP标志=“0”标记的第一帧;以SP=“0”标记的并安排用于CN参数更新消息的那些帧。
当讲话者停止谈话时,这具有在CN参数消息传输之后过渡至DTX低状态总的效应。在语音暂停期间,传输例如以规则间隔恢复一个CN参数消息的传输以便更新在接收端上所生成的安慰噪声。
安慰噪声评估算法使用语音编码器的未量化与量化的(例如)线性预测(LP)参数、使用线谱对(LSP)表示,其中未量化的线谱频率(LSF)矢量由ft=[f1f2…f10]给出,而量化的LSF矢量由
给出,
t表示转置[transpose]。此算法也使用每个子帧的LP剩余信号r(n)来计算随机激励增益和随机激励频谱控制(RESC)参数。
此算法计算下列参数来辅助安慰噪声生成:基准LSF参数矢量fref(释放延迟周期的量化LSF参数平均值);平均的LSF参数矢量fmean(7个最近帧的LSF参数的平均值);平均的随机激励增益gcn mean(7个最近帧的随机激励增益值的平均值);随机激励增益gcn;以及RESC参数∧。
这些参数给出有关频谱(f、
f
mean、∧)和背景噪声电平(g
cn·g
cn mean)的信息。
三个评估的安慰噪声参数(fmena、∧与gcn mean)编码为本文称为安慰噪声(CN)参数消息的特殊FACCH消息以便传输给接收端。由于基准LSF参数矢量fref能以相同方式在编码器与解码器中进行评估,如下所述,所以这个参数的传输是不必要的。
CN参数消息也用于开始接收端上的安慰噪声生成,如同CN参数消息总是在语音脉冲串结束时即在终止无线电传输之前进行发送。
上面结合图7与8描述在无线电路径上CN参数消息或语音帧的时间安排。
背景噪声评估包括计算三种不同类型的平均参数:LSF参数,随机激励增益参数以及RESC参数。要编码为安慰噪声参数消息的安慰噪声参数在N=7以VAD=“0”标记的连续帧的CN平均周期内进行计算,如下面将更详细描述的那样。
在CN平均周期内平均LSF参数之前,对要进行平均的LSF参数组执行中值替换以除去不是发射端上背景噪声特征的参数。首先,根据下列方程式近似估算CN平均周期内从每个LSF参数矢量f(i)至另一个LSF参数矢量f(i)的频谱距离,其中i=0…6,j=0…6,i≠j:
其中fi(k)是在帧i上的LSF参数矢量f(i)的第K个LSF参数。
为了找到CN平均周期内LSF参数矢量f(i)至所有其他帧(j=0…6,j≠i)的LSF参数矢量f(j)的频谱距离ΔSi,如下计算所有i=0…6;j≠i的频谱距离ΔRij的和:
CN平均周期内所有LSF参数矢量的具有最小频谱距离ΔSi的LSF参数矢量f(i)认为是平均周期的中间LSF参数矢量fmed,并且其频谱距离表示为ΔSmed。此中值LSF参数矢量认为包含平均周期内所有LSF参数矢量背景噪声短期频谱细节的最佳表示。如果在CN平均周期内LSF参数矢量f(j)具有:
其中THmed=2.25是中值替换门限,那么至多两个这样的LSF参数矢量(使THmed超过最大的LSF参数矢量)在计算平均LSF参数矢量fmean之前由中间LSF参数矢量替换。
由于中值替换结果而获得的LSF参数矢量组表示为f’(n-i),其中n是当前帧的指数,和i是平均周期指针(i=0…6)。
当在释放延迟周期结束时执行中值替换(第一CN更新)时,6个先前帧的所有LSF参数矢量f(n-i)(释放延迟周期,i=1…6)具有量化的值,而在最近帧n上的LSF参数矢量f(n)具有未量化的值。在后续的CN更新中,在那些与释放延迟周期重叠的帧中CN平均周期的LSF参数矢量具有量化值,而CN平均周期的更近帧的参数矢量具有未量化的值。如果7个最近帧的周期不与释放延迟周期重叠,则只利用未量化的参数值执行LSF参数的中值替换。
在帧n的平均LSF参数矢量fmean(n)根据下式计算:
其中f’(n-i)是在执行中值替换之后7个最近帧之一的LSF参数矢量(i=0…6),i是平均周期指数,和n是帧指数。
在帧n的平均LSF参数矢量fmean(n)最好利用也由语音编码器在正常语音编码方式中用于非平均LSF参数矢量的量化的相同量化表进行量化,但量化算法进行修改以支持安慰噪声的量化。
要量化的LSF预测剩余根据下式获得:
r(n)=fmena(n)-fref (8)
其中fmean是帧n的平均LSF参数矢量,fref是基准LSF参数矢量,r(n)是在帧n计算的LSF预测剩余矢量和n是帧指数。
基准LSF参数矢量
的计算是在量化的LSF参数
的基础上根据下式在6个帧的释放延迟周期内平均这些参数进行的:
其中
是释放延迟周期的一个帧的量化LSF参数矢量(i=1,…,6),i是释放延迟周期帧指数,而n是帧指数。应注意:用于计算f
ref的量化LSF参数矢量
在进行平均之前不进行中值替换。
对于每个CN生成周期,只在释放延迟周期结束时计算一次基准LSF参数矢量fref,而对于CN生成周期的其余时间冻结fref。因为在释放延迟周期内在编码器和解码器上可获得相同的LSF参数矢量f,所以基准LSF参数矢量fref以与在编码器中相同的方式在解码器中进行评估。这个情况的例外是当传输错误严重足以使参数变成不可使用和激活帧替换过程时的情况。在这些情况中,从帧替换过程中获得的修改参数用于替换接收的参数。
根据下式,在子帧的LP剩余信号能量的基础上计算每个子帧的随机激励增益:
其中gcn(j)是计算的子帧j的随机激励增益,r(I)是子帧j的LP剩余的第I个样植,和I是样值指数(I=0…39)。比例系数1.286用于使安慰噪声电平与语音编解码器编码的背景噪声电平相符,这个特定比例系数值的使用应不认为是本发明实践的限制。
因为在安慰噪声生成期间子帧激励信号(伪噪声)具有10个非零样值,其幅度可取值+1或-1,所以所计算的LP剩余信号的能量除以10得到一个随机激励脉冲的能量。
当要求一组更新的CN参数时,根据下式在以SP=“0”标记的每帧n的第一子帧中平均和更新所计算的随机激励增益值:
其中gcn(n)(1)是在帧n的第一子帧上计算的随机激励增益,gcn(n-i)(j)是在一个过去帧的子帧j上计算的随机激励增益(i=1…6)和n是帧指数。因为只有当前帧的第一子帧的随机激励增益用于平均,所以有可能在当前帧的第一子帧已进行处理之后使更新的CN参数组可用于传输。
平均的随机激励增益利用gcn mean≤4032.0进行限制并利用8比特非均匀算法量化器在对数域中进行量化,不要求存储量化表。
至于RESC参数的计算,因为LP剩余r(n)稍微偏离平坦频谱特性,所以安慰噪声质量中的一些损失(背景噪声与安慰噪声之间的频谱失配)将在频谱平坦随机激励用于在接收端上合成安慰噪声时产生。为了提供改善的频谱匹配,在CN平均周期内对LP剩余信号进行另一个二阶的LP分析,所得到的平均LP系数在CN参数消息中发射给接收端以便在安慰噪声生成中使用。这个方法称为随机激励频谱控制(RESC),而所获得的LP系数称为RESC参数∧。
链接帧中的每个子帧的LP剩余信号r(n)以便根据下式计算20ms帧的LP剩余信号的自相关rres(K),K=0…2:
在根据上式计算相关之后,归一化自相关以便获得归一化的自相关r’res(k)。
对于CN平均周期的最近帧,仅第一子帧的自相关用于平均以便有可能准备更新的CN参数组用于在处理当前帧的第一子帧之后进行传输。
当要求更新的CN参数组时,根据下式在以SP=“0”标记的每个帧的第一子帧中平均和更新计算的归一化的自相关:
其中r’res(n)(1)是帧n的第一子帧的归一化的自相关,r’res(n-i)是一个过去帧的归一化自相关(i=1,…,6)和n是帧指数。
所计算的平均自相关rref mean输入给Schur递归算法来计算两个第一反射系数,即RESC参数∧或λ(i),i=1,2。这两个RESC参数的每一个都利用2比特标定量化器进行编码。
在DTX操作期间的语音编码算法的修改如下。当SP标志等于“0”时,以下列方式修改语音编码算法。用于导出语音编码器的短期合成滤波器H(Z)的滤波系数的非平均的LP参数不进行量化,并且加权滤波器W(Z)的存储器不进行更新而设置为零。执行开环音调滞后(pitchlag)检索而停止闭环音调滞后检索并且自适应代码本增益设置为零。如果VAD实施不使用自适应代码本的延迟参数来作出VAD决定,则也能关掉开环音调滞后检索。不执行固定的代码本检索。在每个子帧中,正常语音解码器的固定代码本激励矢量由包含10个非零脉冲的一个随机激励矢量替代。随机激励生成算法定义如下。如下所述,随机激励由RESC合成滤波器滤波以保持过去激励缓冲器的内容尽可能几乎等于编码器与解码器中的内容,以便在安慰噪声生成周期之后语音有效开始时能够快速起动自适应代码本检索。语音编码模式的LP参数量化算法无效。在释放延迟周期结束时如上定义一样计算基准LSF参数矢量。对于安慰噪声的剩余项,插入周期
被冻结。每次要准备一组新的CN参数时,计算平均的LSF参数矢量f
mean,这个参数矢量如上定义的一样编码为CN参数消息。语音编码模式的激励增益量化算法也被无效。每次要准备一组新的CN参数时,计算平均的随机激励增益值g
cm mean,这个增益值如先前所定义的一样编码为CN参数消息。随机激励增益的计算根据LP剩余信号能量进行,如上所定义的。普通LP参数量化和固定代码本增益量化算法的预测器存储器在SP标志=“0”时复位,以致在语音有效再次开始时量化器从其初始状态开始。最后,RESC参数的计算根据LP剩余信号的频谱内容进行,如上所定义的。每次要准备一组新的CN参数时,计算RESC参数。
安慰噪声编码算法为如表2中所示的每个CN参数消息产生38比特,这些比特称为矢量Cn[0…37]。安慰噪声比特Cn[0…37]以表2中所示的顺序传送给FACCH信道编码器(即,不根据比特的主观重要性的顺序执行)。
表2
安慰噪声参数的详细比特分配
指数(矢量-FACCH信道编码器) |
描述 |
参数 |
cn0-cn7 |
第一LSF分矢量指数 |
r[1…3]的VQ指数 |
cn8-cn16 |
第二LSF分矢量指数 |
r[4…6]的VQ指数 |
cn17-cn25 |
第三LSF分矢量指数 |
r[7…10]的VQ指数 |
cn26-cn33 |
随机激励增益 |
gcn mean指数 |
cn34-cn35 |
第一RESC参数指数 |
λ(1)的指数 |
cn36-cn37 |
第二RESC参数指数 |
λ(2)的指数 |
不管其内容如何(语音、CN参数消息、其他FACCH消息或什么也没有),基站30的无线电接收机传送接收的业务帧给接收端DTX处理器,分别利用具有三个标记的各种预处理功能标记。这些标记是语音帧坏帧指示器(BFI)标记、安慰噪声参数坏帧指示器(BFI-CN)标记和安慰噪声更新标记(CNU),如下所述和表3中所示的。这些标记用于根据其用途分类业务帧。概括在表3中的这个分类允许接收端DTX处理器以简单的方式确定如何处理接收帧。
表3:业务帧的分类
|
BFI-CN |
BFI |
0 |
1 |
0 |
无效组合 |
好的语音帧 |
1 |
有效的CN参数消息 |
不能使用的帧 |
二进制BFI和BFI-CN标记表示认为业务帧包含有意义的信息比特(BFI标志=“ 0”和BFI-CN标志=“1”,或BFI标志=“1”和BFI-CN标志=“0”),还是不包含(BFI标志=“1”和BFI-CN标志=“1”,或BFI标志=“0”和BFI-CN标志=“0”)。在本说明书的上下文中,认为FACCH帧不包含有意义的比特,除非它包含一个CN参数消息,因而以BFISP标志=“1”和BFI CN标志=“1”标记。
二进制CNU标记以CNU=“1”标记那些利用经FACCH发送的信道质量信息的传输实例校准的业务帧。
接收端DTX处理器响应接收端的整个DTX操作。在接收端的DTX操作如下:每当检测到一个好的语音帧时,DTX处理器就直接将它传送给语音解码器;当检测到丢失的语音帧或丢失的CN参数消息时,就采用替代和静噪过程;有效的CN参数消息帧导致安慰噪声生成,直至期望下一个CN参数消息(CNU=“1”)或检测到好的语音帧。在此周期期间,接收端DTX处理器忽略由无线电接收机传送的任何不可使用的帧。下面两个操作是可选择的:第一丢失的CN参数消息的参数由最后有效的CN参数消息的参数替代并采用CN参数消息过程;和在接收到第二CN参数消息时,采用静噪。
至于LP参数的平均和解码,当由解码器收到语音帧时,最后六个语音帧的LP参数保持在存储器中。解码器计数自最后一组CN参数由编码器进行更新并传送给无线电发射机起过去的帧数量。根据这个计数,解码器确定在语音脉冲结束时是否有释放延迟周期(如果当语音脉冲之后的第一CN参数消息到达时,自最后的一个CN参数更新起至少30帧已过去,则确定释放延迟周期在语音脉冲结束时已存在)。
只要收到一个CN参数消息并在语音脉冲结束时检测到释放延迟周期,就平均存储的LP参数以获得基准LSF参数矢量fref,此基准LSF参数矢量被冻结并用于实际的安慰噪声生成周期。
获得基准参数的平均过程如下:
当收到一个语音帧时,LSF参数被解码并存储在存储器中。当收到第一CN参数消息时并在语音脉冲结束时检测到释放延迟周期时,存储的LSF参数以与在语音编码器中相同的方式进行平均如下:
其中
是释放延迟周期的帧之一的量化的LSF参数矢量(i=1…6),和n是帧指数。
一旦计算了基准LSF参数矢量,每次收到一个CN的更新消息时,能在解码器上根据下式再生帧n的平均LSF参数矢量
(编码为CN参数消息):
其中
是帧n的量化的平均LSF参数矢量,
是基准LSF参数矢量,
是在帧n接收的量化LSF预测剩余矢量,和n是帧指数。
在每个子帧中,包含四个非零脉冲的正常语音编码器的固定代码本激励矢量在语音无效期间由包含10个非零脉冲的一个随机激励矢量代替。随机激励的脉冲位置和符号利用非均匀分布的伪随机数本地生成。激励脉冲在随机激励矢量中取值+1和-1。根据下面的伪码,随机激励生成算法进行操作:
伪码:
对于(i=0:i<40;i++) 码(i)=0;
对于(i=0;i<10;i++) {
j=随机(4);
idx=J*10+i;
如果(随机(2)=1) 码(idx)=1;
否则 码(idx)=-1;}
其中码[0…39]是固定的代码本激励缓冲器,和随机(K)生成伪随机整数值,在范围[0…K-1]中非均匀分布。
解码接收的RESC参数指数以获得接收的RESC参数λ(i),i=1,2。在生成随机的激励之后,由RESC合成滤波器进行滤波,定义如下:
RESC合成滤波器最好利用晶格滤波方法实施。在RESC合成滤波之后,随机激励要进行标定和LP合成滤波。
安慰噪声生成过程使用具有下列修改的语音解码器算法。固定代码本增益值由在CN参数消息中接收的随机激励增益值代替,而固定代码本激励由如上所述的本地生成的随机激励代替。随机激励如上所述由RESC合成滤波器进行滤波。每个子帧中的自适应代码本增益值设置为0,每个子帧中的音调延迟值例如设置为60,所使用的LP滤波参数是在CN参数消息中接收的那些参数。普通LP参数和固定代码本增益量化算法和预测值存储器在SP标志=“0”时复位,以致当语音活动再次开始时,量化器从其初始状态中开始。利用这些参数,语音解码器这时执行其标准操作并合成安慰噪声。每当收到一个有效CN参数消息时,进行安慰噪声(随机激励增益、RESC参数和LP滤波参数)更新,如上所述的。在更新安慰噪声时,在CN更新期间内插前述参数以便获得平滑过渡。
一个丢失的CN参数消息定义为在接收端DTX处理器正生成安慰噪声并期望一个CN参数消息(安慰噪声更新标记CNU=“1”)时接收的不可使用的帧。
单个丢失的CN参数消息参数由最后有效的CN参数消息的参数代替并采用有效参数的过程。至于第二丢失的CN参数消息,静噪技术用于安慰噪声,逐渐降低输出电平(-3dB/帧),导致解码器输出的最后寂静。静噪是通过降低每帧中具有常数值-3dB的随机激励增益至最小值0实现的。如果另外丢失的CN参数消息出现,则保持这个值。
虽然本发明的许多目前优选实施例已根据特定的帧持续时间值、帧数量、特定消息类型(例如,FACCH)等进行描述,但应认识到:帧的数量、帧的持续时间、释放延迟周期持续时间、平均周期持续时间、消息类型等可以根据不同类型的数字移动通信系统的技术规范和要求进行改变。而且,本发明已在诸如图2a、2b、3a、3b、4、5与10的那些电路方框图中进行描述,但应意识到:一些示意的电路方框利用形成数字蜂窝电话机10的一部分的适当编程的数字数据处理器(例如,图12的控制器18)来实施。仅作为示例,虽然图4与5的选择器307、319和410表示为开关,但也可以整体在软件中实施。也要注意:在CN参数消息(或SID帧)中备用比特不可用于从发射端发射RESC参数给接收端的一些系统中有安慰噪声生成方案。在那些情况中,根据本发明的RESC滤波器可由具有固定系数的合成滤波器代替,随后优化固定滤波系数以使合成滤波器的频率响应具有利用发射系数的正常RESC滤波器的平均响应,也能选择滤波器系数给出提供感性地(主观上)优选的安慰噪声质量的滤波响应。
因而,虽然本发明已根据其中的优选实施例具体进行表示和描述,但本领域的技术人员将明白:其中可以进行形式和细节上的改变而不脱离本发明的范畴和精神。