提高G.711的感知质量的自适应调整方法
技术领域
本发明是属于信号编码领域的发明。尤其是涉及到语音/信号的编码领域和国际电联G..711A律或G..711μ律编解码器所使用的领域。
背景技术
有关国际电联G.711编解码器标准
G.711是一早期的国际电联(ITU)语音和音频编解码器标准,它已广泛应用于通信系统。G.711是基于PCM的编解码器。每个信号样本是用8比特编码。如果采样率是8千赫兹,由此产生的编解码器的比特率为64千比特/秒。国际电联建议了两种编码的方式,他们通常被称为A-律和μ-律。这些方法的定义刊登在国际电联所发表的图表中。当使用μ-律在网络中时,需要抑制所有0字符信号。字符信号,在决定值127和128之间的所对应的负输入值信号,应该是00000010。其相应的解码器输出值是125,量化后的数值取决于编码方法。如果两个国家都采用不同的编码方法,他们应该按照A-律进行编码。如果两国都采取了同样的编码律,该律应使用于它们之间的数字通讯的路径上。任何必要的转换工作将由使用μ-律的国家做。转换规则发表在国际电联出版物中。A-律的每一个“决定值”和“量化值”(相对于μ-律)都与“均一化的PCM值”相关联。(对于“决定值”和“量化值”的定义,见国际电联建议G.701,特别是国际电联G.701中的图2)。这就要求应用13(14)比特均一化的PCM码。将A-律和μ-律分别按照国际电联出版物映射到均一化的PCM码。从均一化的PCM码到A-律或μ-律决定值的转换则取决于设备商的技术规范,一种选择是在国际电联(ITU)所描述的建议G.721,第4.2.8节‘压缩’。
有关感知加权滤波器
感知加权过滤是一个技术,它利用人耳掩蔽效应去改善信号编码或语音编码的感知质量。在近几十年来,这项技术已广泛应用于许多标准。一个典型感知加权的应用显示在图1中。在这方面的典型应用例子有G.729,G.723.1和许多其他标准。在图.1中,101是没有量化的原始信号,它是编码器输入,也是量化误差估计的参考信号。102是编码器输出的比特流,它将转发给解码器。解码器输出量化的信号(或解码的信号)103,它被用来估计编码器中的量化误差104。然后,直接量化误差104通过加权滤波器获得加权误差105。在取最小化时,通过最小化加权误差105而不是直接误差,可以使得直接误差频谱形状符合人耳的掩蔽效应。由于解码器放置在编码器内,整个系统通常被称为闭环办法或分析-综合方法,它以数学方法最小化下面的误差能量.
其中,*指在数学卷积,hw(n)是加权滤波器的脉冲响应W(z).(1)可以重新写成另一种形式.
其中,hF(n)是修改后的加权滤波器F(z)=W(z)-1的脉冲响应.方程(2)可如图2所示;201是没有量化的原始信号;205是量化后的信号;206是比特流,其将转交给解码器;204是直接误差;203是加权误差,也称为反馈噪音或噪音反馈;202是没有量化的信号但增加了反馈的噪声,从原理上说,图2基本上和图1相同。
上述加权滤波器只用于编码器一边。本段将说明如何使用加权滤波器同时在编码器和解码器中;这样的例子可以在国际电联G.729.1和其他标准中看到。图3给出了一个使用加权滤波器在编码器和解码器中的典型的例子。301是没有量化的信号经过加权滤波器后获得加权后的非量化信号302。这对量化器(编码器)和反量化器(解码器)在加权信号域工作以获得量化后的加权信号304;从编码器的比特流303发送到解码器;最小化误差305是在加权信号域工作的。图4显示了与图3编码器相对应的解码器。比特流401从传输通道输入到解码器(反量化器),首先量化后的加权信号402,然后通过逆加权过滤器W(z)-1将加权信号402转化为到正常的信号域403,随后通过后处理器以改善最后输出信号404的质量。
所有上述加权滤波器的估计通常是基于编码器中没有量化的原始信号或解码器中量化后的原始信号。这项发明提出了一种方法来控制加权滤波器参数;特别是,该发明是用来改善这是与国际电联的G.711标准相关的量化(编码器)和/或反量化(解码器)的质量。
发明内容
本发明的目的是提出一种用来控制加权滤波器参数的方法;尤其是用来改善与国际电联G.711标准相关的量化(编码器)和/或反量化(解码器)的加权滤波器参数的控制方法,即自适应调整方法,以提高感知质量。
国际电联G.711已经广泛应用于通讯系统中,
由于G.711编解码器产生的特殊的量化误差结构(图6所示),任何使用常数的加权滤波器将不会达到最佳的性能;这里存在的问题是,当感知质量对一定电平的信号有所改进时,对另一个电平的信号,它可能没有,甚至降低感知质量。本发明就是通过找到量化误差统计数据和信号电平(如图6所示)之间的关系,使加权滤波器控制参数自适应地变化,以达到最佳的感知质量;
本发明的提高G.711的感知质量的自适应调整方法,包括加权滤波器、G..711相关的编解码器。所述加权滤波器的控制参数是自适应变化而不是恒定的控制参数,该加权滤波器的控制参数的自适应变化用于增强和G.711相关的编解码器所产生的语音的感知性能。
上述加权滤波器,其特征在于至少有一种实现加权滤波器的方法是用以下公式:
W(z)=A(z/α),F(z)=W(z)-1,
也可以是:
W(z)=A(z/α)/A(z/β),F(z)=W(z)-1,
或:
W(z)=A(z/α)/(1+β·z-1),F(z)=W(z)-1,
这里A(z)是用众所周知的LPC线性预测,它的估计是基于没有量化的原始信号或量化后的原始信号。
所述的相关的G.711编解码器为任何使用国际电联编解码器或G.711规范的编解码器,也可以是任一款改进的G.711编解码器,还可以是任一款以G.711编解码器做内核的可扩展的编解码器。
所述的加权滤波器的控制参数中至少有一种控制参数α的值,当信号电平非常低时,α值应小于当信号电平高时的值。
所述的加权滤波器的控制参数中至少有一种控制参数α的值,当相对量化误差非常大时,α值应小于当相对量化误差非常小时的α值。
本发明的优点主要是能改善现有使用与G.711相关的编解码器的语音质量,并且能在改善现有通讯语音质量的同时,不影响通讯系统的兼容性。所述的相关的G.711编解码器,既可以是任何使用国际电联编解码器G.711规范的编解码器,也可以是任何一款改进的G.711编解码器,甚至可以是任何一款以G.711编解码器做内核的可扩展的编解码器。
本发明的一种具体实现方式包括,当相对量化误差较大或信号电平非常低时感知加权滤波器应以一种方式调整;当量化误差相对较小或信号电平高时,感知加权滤波器应以另一(相反)的方式调整。比如,在权力要求3中,加权滤波器控制参数α的值,当信号电平非常低时,α值应小于当信号电平高时的值,也就是说,α不是一个常数,而是一个自适应变化的参数。由于这一变化,G.711编解码器产生的语音感知质量要有所改进。
附图说明
在阅读了以下详细的说明和所附的图纸,对于基本了解该技术的人员将更容易看懂本发明的特点和优势。其中,
图1为现有的闭环编码系统感知加权滤波器的基本原理图;
图2为现有的在感知加权滤波器作用下等效噪声反馈的基本原理图;
图3为现有的在编码器中量化(编码)加权信号的基本原理图;
图4是与图3相对应的解码器中逆加权滤波器的基本原理图;
图5为G..711中量化步长(绝对误差)与采样信号幅度的关系图;
图6为G..711中相对量化步长(相对误差)与采样信号幅度的关系图;
图7为原始G..711的量化误差频谱和使用本发明后,用感知加权滤波器改进后的G..711的量化误差频谱图;
图8为没有感知加权滤波器的原始G..711编解码器原理图;
图9为使用了本发明的感知加权滤波器控制方法后的G..711编解码器原理图;
图10为使用了本发明的感知加权滤波器控制方法后,量化误差噪声反馈的G..711编解码器原理图。
除了图9和图1唯一的区别,即在图1中使用的是一般编码器,而图9中使用了基于本发明的特别的G..711编解码器,图9和图1的其它方面则完全相同。图10同样是将图2中一般编解码器用基于本发明的特别的G..711编解码器所取代。用类似图9和图10的产生方式,其他两个图表也可以将图3和图4中的一般编码器用中基于本发明的特别的G..711编解码器所取代而产生。为了简单明了,这两个图表,这里不再重复。
具体实施方式
使用一般加权滤波器下的G.711特性
G.711是一种早期的通讯系统里广泛使用的国际电联的语音和音频编解码标准。G.711是基于PCM的编解码器。每个信号样本是用8比特编码。如果采样率是8kHz,由此产生的编解码器的比特率为64千比特/秒。G.711既可以单独使用,也可以作为可扩展的编解码器内核。G.711有两种编码方式,一个被称为A-律,另一个被称为μ-律。他们都是使用标量量化方法.量化台阶的大小随信号样本的幅度而不同,即可以是8,16,32,64,…等等。如果我们将绝对量化误差和相对量化误差定义如下:
其中,s(n)是没有量化,进入G.711编码器的原始信号,而
是从解码器输出的、量化后的原始信号,统计的绝对误差取决于量化台阶的大小。A-律和μ-律编码方法都会在大信号范围内产生较大的绝对误差和较小的相对误差;也会在小信号范围内产生较小的绝对误差和较大的相对误差。图5显示了量化台阶大小(绝对误差)和信号幅度的关系。由于信号的听觉质量取决于相对误差而不是绝对误差,这就是为什么G.711编解码器对小信号编码的质量要低于对大信号编码的质量。
众所周知,感知加权技术(或量化误差噪声反馈技术)通过使用人耳掩蔽效应去改善任何语音编码或音频编码后的感知质量。原始G.711的量化误差频谱是平的(如图7所示)。感知加权技术或者说量化误差噪声反馈技术使得量化误差的频谱形状多少符合原始信号的频谱的形状,这使得信噪比(SNR)在不同的频域段更相似或接近(如图7所示).
图8显示了原始G.711编码器原理.801是没有量化的原始信号,比特流802从G.711编码器输出后,送入G.711解码器。解码器输出的量化信号803可以用来估计编码器中的量化误差804。那个最小化的模块是用虚线表示,这是因为实际上算法中不存在这样一个孤立的模块;编码器和解码器都是仅仅基于国际电联发表的特定的量化表格和规则。
图9显示了有感知加权滤波器的改进的G.711编码器原理.图9和图1唯一的区别,是在图1中使用的是一般编码器,而图9中使用的是基于本发明的特别的G.711编解码器,除此以外,图9和图1则完全相同。901是没有量化的原始信号,比特流902从G.711编码器输出后,送入G.711解码器.解码器输出的量化信号903可以用来估计编码器中的直接的量化误差904,直接的量化误差经过加权滤波器得到加权误差905,905从而得到最小化.那个最小化的模块是用虚线表示,因为实际上算法中不存在这样一个孤立的模块
图10显示有量化误差噪声反馈的改进的G.711编码器原理。同样,除了图10和图2唯一的区别,即在图2中使用的是一般编码器,而图10中使用的是基于本发明的特别的G.711编解码器,图10和图2则完全相同。1001是原始、没有量化的信号;1002是带噪声反馈的没有量化的信号;1003是加权的噪声反馈信号;从G.711量化器(编码器)输出的比特流1004发送到G.711反量化器(解码器);从解码器输出量化后的信号可用于估计编码器中的直接量化误差1006;直接误差经过加权滤波器F(z)获得加权噪声反馈误差1003。“最小化”的模块是用虚线表示,因为实际上算法中不存在这样一个孤立的模块;编码器和解码器都是仅仅基于国际电联发表的特定的量化表格和规则。如前所述,在图9和图10中的技术是概念上等效的。
用类似图9和图10的产生方式,其他两个图表也可以将图3和图4中的一般编码器用基于本发明的特别的G.711编解码器所取代而产生。为了简单明了,这两个图表,这里不再重复。
基于本发明改进后的感知加权滤波器
感性加权滤波器可表示为W(z,α),在这里,参数α在传统上是一个常数(0≤α≤1)其用来控制加权应有的“力度”。一个典型的加权滤波器的例子可以是:
W(z)=W(z,α)=A(z/α), (5)
这里,{ai,i=1,2,....,P}是从对没有量化的或量化的原始信号进行线性预测分析得到的LPC系数。有时,几个控制参数用来确定一个加权滤波器;这种常见的加权滤波器例子可以是:
这里β<α,另一常见的加权滤波器例子可以是:
由于G.711编解码器产生的特殊的量化误差结构(图6所示),任何使用常数的加权滤波器将不会达到最佳的性能;这里存在的问题是,当感知质量对一定电平的信号有所改进时,对另一个电平的信号,它可能没有,甚至降低感知质量。本发明就是通过找到量化误差统计数据和信号电平(如图6所示)之间的关系,使加权滤波器控制参数自适应地变化,以达到最佳的感知质量;本发明的一个实例就是使加权滤波器控制参数自适应地随信号水平而变化;本发明的另一个实例就是使加权滤波器控制参数自适应地随信号相对量化误差的统计数值而变化。从图6可以看到,即当信号电平非常低时,相对误差很大。当相对量化误差较大(或当信号电平很低)时,根据本发明,这时感知加权应该是“加强”;而当相对量化误差较小或当信号电平很高时),根据本发明,这时感知加权应该是“减弱”。一个具体的实现方法就是对于加权滤波器(7)这种情况,“加强”的意思是α值要较小;“减弱”是指α值要较大。
上述说明包含对加权滤波器参数自适应控制方法的具体实现内容。然而,一个本领域熟悉的技术人员可以理解本发明可以用于与各种编码/解码算法相结合的情况而不仅仅局限于那些在本专利申请中所述的编解码算法。此外,一些具体的,较为普通的技巧细节,没有在此讨论以避免使本发明申请不够简单明了。
在本申请中,附图以及其详细地说明是仅仅为了描述发明的实现的例子。为了保持简洁,其他使用本发明原理,实现本发明的实例,没有特别地在本发明申请中加以说明,也没有在现有附图中加以描述。