CN101312042A - 一种用于感知音频编码的量化器自适应调整方法 - Google Patents

一种用于感知音频编码的量化器自适应调整方法 Download PDF

Info

Publication number
CN101312042A
CN101312042A CNA2007100745512A CN200710074551A CN101312042A CN 101312042 A CN101312042 A CN 101312042A CN A2007100745512 A CNA2007100745512 A CN A2007100745512A CN 200710074551 A CN200710074551 A CN 200710074551A CN 101312042 A CN101312042 A CN 101312042A
Authority
CN
China
Prior art keywords
quantization
quantizer
boundary point
quantized spectrum
self
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100745512A
Other languages
English (en)
Other versions
CN101312042B (zh
Inventor
吴晟
邱小军
黎家力
陈强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN2007100745512A priority Critical patent/CN101312042B/zh
Publication of CN101312042A publication Critical patent/CN101312042A/zh
Application granted granted Critical
Publication of CN101312042B publication Critical patent/CN101312042B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种用于感知音频编码的量化器自适应调整方法,包括如下处理步骤:A.根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;B.以更新的量化边界点作为量化器新的量化边界点进行量化处理;C.重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。本发明通过量化边界点的动态更新,可以使得量化器在音频编码时根据信号特性自适应调整,从而减小了总体能量失真,提高了量化编码后的重建信号质量,在不改变感知音频编码器的结构的前提下提高编码器的编码性能。

Description

一种用于感知音频编码的量化器自适应调整方法
技术领域
本发明涉及感知音频编码中的量化器,具体地说涉及一种用于感知音频编码的量化器自适应调整方法。
背景技术
编码器的量化失真和量化器的区间划分和量化值大小有关。标量量化器将落在量化区间[x(i),x(i+1))的信号x映射为量化电平y(i);x(i)是量化边界点,量化电平的间隔称为量化阶距。量化阶距相等且量化区间相等的量化器为均匀量化器,否则为非均匀量化器。利用质心条件和最佳划分条件,可以用迭代的方式求得最佳量化电平和量化区间,它能获得最小的量化均方误差。
感知音频编码器中,MPEG-1 Layer1和Layer2中使用均匀标量量化器。均匀量化器结构简单,但是其量化信噪比会随着量化电平数的减小而下降,在小信号时信噪比较差,因此,均匀量化器只有在信号均匀分布时才是最优量化器,非均匀分布信号的最优量化器是非均匀量化器。非线性扩压是非均匀量化中最常用的技术。MPEG-1 Layer3和MPEG-4 AAC都使用了非线性扩压和可变量化阶距来实现非均匀量化,其非均匀量化器遵循了音频中小信号多的特性,减少了量化均方误差。
感知音频编码器的原始量化谱由下式获得
χ=|x|λΔ-1               (1)
其中x是变换域谱,λ是扩压系数,Δ是动态量化步长,它对特定子带是不变的,由于后文的论述都是在子带中进行的,故可将Δ视为常数。在MPEG-4AAC中,x是MDCT(改进的离散余弦变换)谱,λ=3/4。原始量化谱规范到量化电平i=0,1, 2,…得到整数量化谱
xq=level[χ]              (2)
其中,level表示电平规范操作。有损音频编码中,电平规范操作是减少信息量的主要手段和编码噪声的主要来源。MPEG-4AAC标准推荐采用量化边界点x(i)=i-0.4054,用一个特殊的取整完成电平规范操作:
xq=int[χ+i-x(i)]                (3)
int表示提取实数的整数部分。对于原始量化谱χ而言,这相当于量化电平为[0,1,2,3,……],电平区间为[0,1],[1,2],[2,3],……,量化区间为[0,0.5946),[0.5946,1.5946),[1.5946,2.5946),……的等间距量化器。AAC的反量化公式为
xiq=sign(x)(xqΔ)1/λ      (4)
量化均方误差为
DMSE=(x-xiq)2={χ1/λ-level[χ]1/λ}2Δ2/λ     (5)
MPEG-4AAC编码以帧为单位,在子带中进行,需要考虑子带信号的整体失真。不失一般性,认为子带原始量化谱是N+1维向量,其中最大值为χmax
χ → q = χ max χ 1 χ 2 . . . χ N , χ max ≥ χ i ≥ 0 , i = 1,2 , . . . , N - - - ( 6 )
考虑χi在[0,χmax]之间均匀和非均匀两种分布,前者分布密度函数为
P(x)=x/χmax,x∈[0,χmax]      (7)
后者模仿音频信号小信号居多,分布密度函数为
P(x)=1.9/χmax-1.8x/χmax 2,x∈[0,χmax]       (8)
从而得到子带重建后的能量与原始信号能量比值的期望值,如图1-a与图1-b所示,其中N分别取值3和31,它代表了Mpeg-4AAC中较典型的编码子带长度。可以看到,这两种分布都出现了当χmax较小时,能量比期望值大于1的情况比重大,能量波动幅度高的情况。这说明Mpeg-4AAC的量化器容易出现重建信号能量偏离原始信号的整体能量失真的问题。
发明内容
本发明就是为了解决上述技术问题,提出了一种用于感知音频编码的量化器自适应调整方法,在不改变感知音频编码器的结构的前提下可以减小感知音频编码中的量化器在对音频进行编码时产生的总体能量失真,提高量化编码后的重建信号质量。
为了实现上述目的,本发明采用了如下的技术方案:
一种用于感知音频编码的量化器自适应调整方法,包括如下处理步骤:
A、根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;
B、以更新的量化边界点作为量化器新的量化边界点进行量化处理;
C、重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。
所述量化处理是通过如下取整操作实现的:
xq=int[χ+i-xNEW(i)],i=int [1+χ],其中,xq为量化处理后的整数量化谱,χ为原始量化谱,xNEW(i)为更新的量化边界点。
进一步的,所述步骤A包含如下处理过程:
A1、划分量化区间,获得初始量化边界点;
A2、统计原始量化谱分布频数;
A3、判断步骤A2中统计出的原始量化谱分布频数是否有效,
如是:向通过块能量失真最小原则计算得到的量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点;
如否:向初始量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点。
所述通过块能量失真最小原则计算得到的量化边界点是通过求解积分方程 ∫ i - 1 i χ 2 / λ P ( χ ) dχ = ( i - 1 ) 2 / λ ∫ i - 1 x ( i ) P ( χ ) dχ + i 2 / λ ∫ x ( i ) i P ( χ ) dχ 实现的,其中χ是原始量化谱,λ是扩压系数,x(i)是待计算的块能量失真最小原则下的量化边界点,P(χ)是原始量化谱的分布密度函数。
优选的,所述积分方程的求解采用如下累加比较流程:
A31:令k=iM/L, C ^ = P d ( k ) ;
A32:比较
Figure A20071007455100073
和C(i),若 C ^ < C ( i ) , 执行步骤A33,若 C ^ > C ( i ) , 执行步骤A34;
A33:k=k-1, C ^ = C ^ + P d ( k ) , 回到步骤A32;
A34:计算块能量失真最小原则下的量化边界点
Figure A20071007455100077
x ^ ( i ) = L M ( C ^ - C ( i ) P d ( k ) + k )
C ( i ) = &Sigma; k = ( i - 1 ) M / L + 1 iM / L g &OverBar; ( k ) &Gamma; ( i ) P d ( k )
g &OverBar; ( k ) = M L &lambda; 2 + &lambda; ( ( Lk M ) 2 / &lambda; + 1 - ( Lk - L M ) 2 / &lambda; + 1 ) - ( i - 1 ) 2 / &lambda;
Γ(i)=i2/λ-(i-1)2/λ,其中,为块能量失真最小原则下的量化边界点,Pd(k)是步骤A2中统计出的原始量化谱分布频数,λ是扩压系数,Δ是动态量化步长,L是统计电平数,M是统计区间数。
优选的,步骤A3中对原量化边界点进行调整的所述设定原则为低通滤波。
当步骤A2中统计出的原始量化谱分布频数有效时,所述低通滤波是通过公式 x NEW ( i ) = ( 1 - &beta; ) x OLD ( i ) + &beta; &CenterDot; x ^ ( i ) 实现的,其中xNEW(i)是更新的量化边界点,xOLD(i)是原量化边界点,β是遗忘因子。
所述步骤A1中的划分量化区间是通过量化均方误差最小原则来进行的,初始量化边界点由下式计算得到: x MSE ( i ) = ( i 1 / &lambda; + ( i - 1 ) 1 / &lambda; 2 ) &lambda; , 其中,xMSE(i)是初始量化边界点。
当所述步骤A3中判断统计出的原始量化谱分布频数无效时,所述低通滤波是通过公式xNEW(i)=(1-α)xOLD(i)+αxMSE(i)实现的,其中,xNEW(i)是更新的量化边界点,xOLD(i)是原量化边界点,α是遗忘因子。
步骤A2包含如下处理过程:
设定统计样本总量阈值用于控制统计周期;
当原始量化谱统计总数大于设定的统计样本总量阈值,统计周期结束,继续步骤A3;否则重复步骤A2继续统计原始量化谱分布频数。
步骤A2中原始量化谱分布频数根据下式统计得到:
Pd(k)=Pd′(k)+1
k = min ( int [ M L &chi; ] , M ) , 其中,χ为原始量化谱,L为统计电平数,M为统计区间数,Pd(k)代表累加后的原始量化谱χ在区间
Figure A20071007455100084
的出现频数,Pd′(k)代表累加前的原始量化谱χ在区间
Figure A20071007455100085
的出现频数。
所述统计区间数满足条件M=nL,其中n为大于等于10的整数。
步骤A3中所述判断步骤A2中统计出的原始量化谱分布频数是否有效是根据如下原则确定:
设定统计样本量阈值Nt
计算量化电平[i-1,i]的出现频数总和 N i = &Sigma; j = ( i - 1 ) M / L + 1 iM / L P d ( j ) ;
比较Ni与Nt,当Ni≥Nt时,原始量化谱分布频数有效;当Ni<Nt时,原始量化谱分布频数无效。
本发明通过在初始量化边界点与通过块能量失真最小原则计算得到的量化边界点之间动态调整量化边界点使得量化器在音频编码时可以根据信号特性进行自适应调整,从而减小了总体能量失真,提高了量化编码后的重建信号质量。本发明在不改变感知音频编码器的结构的前提下能够提高编码器的编码性能,性能提高的幅度随着编码码率上升而增加。
附图说明
图1-a是现有技术的音频编码器在子带长度为4时随原始量化谱最大值变化的能量波动示意图;
图1-b是现有技术的音频编码器在子带长度为32时随原始量化谱最大值变化的能量波动示意图;
图2是本发明实施例的自适应调整方法的流程图;
图3是应用了本发明的自适应调整方法的Megal AAC编码器的结构框架示意图;
图4-a是80kbps平均码率下三种量化边界点确定方法的NMR比较示意图;
图4-b是128kbps平均码率下三种量化边界点确定方法的NMR比较示意图;
图4-c是256kbps平均码率下三种量化边界点确定方法的NMR比较示意图。
具体实施方式
下面结合附图对本发明进行进一步具体的说明。
本发明的用于感知音频编码的量化器自适应调整方法,主要包括如下处理步骤:
A、根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;
B、以更新的量化边界点作为量化器新的量化边界点进行量化处理;
C、重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。
下面以一具体实施例对上述步骤进行说明,参看图2,具体步骤如下:
1、划分量化区间,获得初始量化边界点
量化处理开始,首先要划分量化区间,本实施例采用量化均方误差最小原则来划分量化区间。量化均方误差最小原则可用式DMSE=(x-xiq)2={χ1/λ-level[χ]1/λ}2Δ2/λ表示,以此原则划分量化区间得到初始量化边界点xMSE(i),xMSE(i)称为均方误差连续量化边界点,在量化均方误差最小原则下可得到xMSE(i)由下式获得:
x MSE ( i ) = ( i 1 / &lambda; + ( i - 1 ) 1 / &lambda; 2 ) &lambda; , 显然它只与电平区间和扩压系数有关,因此只需要在初始化的时候计算一次。
2、统计原始量化谱分布频数
感知音频编码器的原始量化谱由下式获得
χ=|x|λΔ-1       (9)
其中x是变换域谱,λ是扩压系数,Δ是动态量化步长。令统计电平数为L,统计区间数为M,M满足M=nL,n是整数,通常大于等于10,区间间距为L/M;令Pd(k)为原始量化谱χ在区间
Figure A20071007455100102
的出现频数,它是一个M元素的向量。若有落在区间
Figure A20071007455100103
中的χ,则Pd(k)增加1,即:
Pd(k)=Pd′(k)+1
k = min ( int [ M L &chi; ] , M ) - - - ( 10 )
式中,Pd(k)代表累加后的原始量化谱χ在区间
Figure A20071007455100105
的出现频数,Pd′(k)代表累加前的原始量化谱χ在区间
Figure A20071007455100106
的出现频数。显然,Pd(k)反映了原始量化谱χ在各个区间的分布情况,称Pd(k)为原始量化谱分布频数。
3、判断原始量化谱分布频数是否有效并据此对量化边界点进行调整判断原始量化谱分布频数是否有效采用下列步骤:
31、判断统计周期是否结束
在一个统计周期中,设定统计样本总量阈值NT用来控制统计周期的长度,当原始量化谱的统计总数没有达到统计样本总量阈值NT,继续步骤2对原始量化谱分布频数进行统计。当原始量化谱的统计总数达到NT时,统计周期结束,进行下一步。
32、判断统计出的分布频数是否有效
利用量化电平之间的统计样本量阈值Nt来控制样本统计的精度。对于每个电平区间[i-1,i],计算量化电平[i-1,i]的出现频数总和 N i = &Sigma; j = ( i - 1 ) M / L + 1 iM / L P d ( j ) , 若大于等于设定的统计样本量阈值Nt,说明统计出的分布频数有效,此时进行步骤33;若小于设定的统计样本量阈值Nt,说明统计出的分布频数无效,此时进行步骤34。
33、向通过块能量失真最小原则计算得到的量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点
本发明定义块能量失真(Block Energy Distortion)为能量误差的期望,它是量化器对于信号整体能量失真的度量。量化器的块能量失真为
D BED = E [ x 2 - x iq 2 ] = &Delta; 2 / &lambda; &Integral; 0 &infin; ( &chi; 2 / &lambda; - level [ &chi; ] 2 / &lambda; ) P ( &chi; ) d&chi; - - - ( 11 )
如果DBED为零,可以认为量化器对于输入信号和重建信号能量守恒。因此,本发明采用块能量失真最小原则对量化器进行调整,该原则可用下列积分方程来表示:
&Integral; i - 1 i &chi; 2 / &lambda; P ( &chi; ) d&chi; = ( i - 1 ) 2 / &lambda; &Integral; i - 1 x ( i ) P ( &chi; ) d&chi; + i 2 / &lambda; &Integral; x ( i ) i P ( &chi; ) d&chi; - - - ( 10 )
其中χ是原始量化谱,λ是扩压系数,x(i)是块能量失真最小原则下待计算的量化边界点,P(χ)是原始量化谱的分布密度函数。
原始量化谱的分布密度函数P(χ)是通过统计的方法来得到的,即其可以用前述步骤2中统计的原始量化谱分布频数Pd(k)来等价替代,这样得到的量化边界点称为短时近似最优量化边界点。
所谓短时近似最优量化边界点,短时是针对更新周期而言,如果信号变化不剧烈,可以认为两个相邻周期的最优量化边界点变化也很小,这就是短时效应,上一个更新周期计算的最优量化边界点可以在当前周期使用,可以认为短时的时间间隔是2个更新周期的时间,更新周期越短,短时效应越可靠;近似则是指原始信号的实际分布,即原始量化谱的分布密度函数几乎不可获得,通常采用统计的方式来替代真正的信号分布。因此该最优量化边界点是近似的,这个近似的程度和统计周期有关,周期越长,近似的程度越高,但短时效应相应地会降低。
通过累加比较流程求解前述积分方程得到块能量失真最小原则下的短时近似最优量化边界点
Figure A20071007455100121
累加比较流程步骤如下:
331:令k=iM/L, C ^ = P d ( k ) ;
332:比较和C(i),若 C ^ < C ( i ) , 执行步骤333,若 C ^ > C ( i ) , 执行步骤334;
333:k=k-1, C ^ = C ^ + P d ( k ) , 回到步骤332;
334:计算短时近似最优量化边界点
Figure A20071007455100127
x ^ ( i ) = L M ( C ^ - C ( i ) P d ( k ) + k ) - - - ( 13 )
其中
C ( i ) = &Sigma; k = ( i - 1 ) M / L + 1 iM / L g &OverBar; ( k ) &Gamma; ( i ) P d ( k )
g &OverBar; ( k ) = M L &lambda; 2 + &lambda; ( ( Lk M ) 2 / &lambda; + 1 - ( Lk - L M ) 2 / &lambda; + 1 ) - ( i - 1 ) 2 / &lambda;
Γ(i)=i2/λ-(i-1)2/λ
                            (12)
得到短时近似最优量化边界点后,通过设定原则对原量化边界点进行调整以得到新的量化边界点。本实施例设定的调整原则是低通滤波,即平滑更新,由于此处的平滑对滤波器要求不高,可以采用比较简单的方式。本实施例采用一阶滑动平均过程,它只用2次乘法,不需要额外存储空间,更新后的量化边界点xNEW(i)由下式获得
x NEW ( i ) = ( 1 - &beta; ) x OLD ( i ) + &beta; &CenterDot; x ^ ( i ) - - - ( 13 )
xOLD(i)为原量化边界点,即调整时的当前量化边界点,调整后跳转至步骤4。
34、利用初始量化边界点对当前量化边界点进行更新
当统计出的分布频数无效时,需要对当前的量化边界点执行还原过程,即向初始量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点。设定的调整原则同样是低通滤波,低通滤波同样采用一阶滑动平均过程,更新后的量化边界点xNEW(i)由下式获得:
xNEW(i)=(1-α)xOLD(i)+αxMSE(i)        (16)
式15中的β与式16中的α是遗忘因子,0≤α,β≤1。
4、以更新的量化边界点作为量化器新的量化边界点进行量化处理
使用更新后的量化边界点xNEW(i),进行取整操作获得整数量化谱xq如下:
i=int[1+χ](17)
xq=int[χ+i-xNEW(i)]
5、重复前述步骤,动态更新量化边界点,并以更新的量化边界点进行量化处理。
上述处理是在一帧数据中进行,由于量化处理针对的是连续多帧数据,对待量化的码流的每一帧数据重复上述过程,从而在量化过程中动态地更新量化边界点,并以更新后的量化边界点进行量化处理,这样即可实现量化器根据信号特性的自适应调整。
在本发明的量化处理过程中,量化边界点不断在初始量化边界点与短时近似最优量化边界点之间动态更新,量化区间相应不断变化,从而实现了量化器在量化过程中可以根据信号特性进行自适应调整,提高了量化编码后重建信号的质量。
本发明的自适应调整量化边界点的方法不影响量化器以及编码器的结构,可以使用在各种感知音频编码器上。这里使用Megal AAC编码器作为测试平台,Megal AAC编码器的框架结构如图3所示。
MPEG-4AAC的扩压系数λ=3/4,本方法需要确定六个参数,统计最大电平L,统计区间总数M,统计样本总量阈值NT,量化电平之间的统计样本量阈值Nt和更新遗忘因子α,β。不同码率下原始量化谱χ的分布差异极大,低码率和中码率(每通道64kbps以下)χ集中在0-4之间;高码率(每通道80kbps以上)χ分布相对均匀。对于80kbps,128kbps,256kbps三种码率立体声编码的测试,参数Nt的设置高码率与低码率略有不同。本实施例中,统计最大电平L=16,统计区间总数M设为160;遗忘因子α固定为0.5,统计样本总量阈值NT,量化电平之间的统计样本量阈值Nt和更新遗忘因子β的取值见表1,为方便起见,Nt用比值Nt/NT代替。每种码率不同参数组合共175组,对8段44100Hz采样,16比特量化的立体声剪辑进行,每段剪辑持续11.63秒,剪辑曲目见表2,每次测试结果取8段剪辑的平均值。
表1测试参数的设置
Figure A20071007455100141
表2测试剪辑
  序号   剪辑名称   类型
  1   高山流水   民族器乐
  2   狩猎波尔卡   西洋器乐
  3   欢乐颂   合唱
  4   四季之歌   小提琴钢琴二重奏
  5   今夜无人入睡   歌剧男高音
  6   渡口   女生独唱
  7   达坂城姑娘   男声合唱
  8   加州旅店   英语流行
测试选用使用MPEG-4AAC标准中提供的固定量化边界点的配置和使用误差连续划分量化边界点的配置作为参考,编码器的其他参数不变,最终输出的测试码流码率偏差在0.03%以内,码率变化的影响可以忽略。重建音频的评价指标采用噪声掩模比NMR(Noise to Mask Ratio),NMR越小越好。测试结果见图4。图4-a,图4-b和图4-c为在80kps,128kbps,256kbps平均码率下,使用标准量化边界点,均方误差连续量化边界点的测试结果和使用本发明的自适应调整量化边界点的平均,最好以及最坏三种情况下的测试结果。从图4可以看到,在80kbps平均码率下,使用自适应调整量化边界点的平均NMR反而有小幅上升0.0137dB;在128kbps码率下,平均NMR降低了0.1347dB,最高降低了0.1455dB,最少也降低了0.1034dB;在256kbps平均码率下,NMR平均降低幅度达到了0.24dB,最高达到了0.2535dB,最低也达到了0.2275dB。通过上述各参数的不同组合测试,可以得到,在低码率时,本方法对于重建音频信号NMR的改进不明显,而随着码率的提高,NMR降幅增大。其主要参数在中码率时,NT可以取2500到5000,Nt/NT和β可以分别取0.03,0.1,在高码率时Nt/NT可以取0.08。
从测试结果看,本方法在不改变感知音频编码器的结构的前提下能够提高编码器的编码性能,性能提高的幅度随着编码码率上升而增加。该方法适用于各种感知音频编码器,减小了感知音频编码中的量化器在对音频进行编码时产生的总体能量失真,提高了量化编码后的重建信号质量。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,例如积分方程的求解并不限定采用累加比较流程,而设定的调整原则也不限于使用低通滤波,例如可以采用一次向初始量化边界点或短时近似最优量化边界点方向调整一个固定步长的调整方式,低通滤波也可采用更高阶的处理,统计原始量化谱分布频数是否有效时,亦可利用时间阈值来作为统计周期的结束,这些变化都应当视为属于本发明的保护范围。

Claims (13)

1、一种用于感知音频编码的量化器自适应调整方法,其特征在于,包括如下处理步骤:
A、根据原始量化谱的统计特性,在初始量化边界点和通过块能量失真最小原则计算得到的量化边界点之间按设定的原则对原量化边界点进行调整以得到更新的量化边界点;
B、以更新的量化边界点作为量化器新的量化边界点进行量化处理;
C、重复步骤A、B,动态更新量化边界点,并以更新的量化边界点进行量化处理。
2、如权利要求1所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述量化处理是通过如下取整操作实现的:xq=int[χ+i-xNEW(i)],i=int[1+χ],其中,xq为量化处理后的整数量化谱,χ为原始量化谱,xNEW(i)为更新的量化边界点。
3、如权利要求1或2所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述步骤A包含如下处理过程:
A1、划分量化区间,获得初始量化边界点;
A2、统计原始量化谱分布频数;
A3、判断步骤A2中统计出的原始量化谱分布频数是否有效,
如是:向通过块能量失真最小原则计算得到的量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点;
如否:向初始量化边界点方向按设定的原则对原量化边界点进行调整以得到更新的量化边界点。
4、如权利要求3所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述通过块能量失真最小原则计算得到的量化边界点是通过求解积分方程 &Integral; i - 1 i &chi; 2 / &lambda; P ( &chi; ) d&chi; = ( i - 1 ) 2 / &lambda; &Integral; i - 1 x ( i ) P ( &chi; ) d&chi; + i 2 / &lambda; &Integral; x ( i ) i P ( &chi; ) d&chi; 实现的,其中χ是原始量化谱,λ是扩压系数,x(i)是待计算的块能量失真最小原则下的量化边界点,P(χ)是原始量化谱的分布密度函数。
5、如权利要求4所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述积分方程的求解采用如下累加比较流程:
A31:令k=iM/L, C ^ = P d ( k ) ;
A32:比较
Figure A2007100745510003C2
和C(i),若 C ^ < C ( i ) , 执行步骤A33,若 C ^ > C ( i ) , 执行步骤A34;
A33:k=k-1, C ^ = C ^ + P d ( k ) , 回到步骤A32;
A34:计算块能量失真最小原则下的量化边界点
Figure A2007100745510003C6
x ^ ( i ) = L M ( C ^ - C ( i ) P d ( k ) + k )
C ( i ) = &Sigma; k = ( i - 1 ) M / L + 1 iM / L g &OverBar; ( k ) &Gamma; ( i ) P d ( k )
g &OverBar; ( k ) = M L &lambda; 2 + &lambda; ( ( Lk M ) 2 / &lambda; + 1 - ( Lk - L M ) 2 / &lambda; + 1 ) - ( i - 1 ) 2 / &lambda;
Г(i)=i2/λ-(i-1)2/λ,其中,为块能量失真最小原则下的量化边界点,Pd(k)是步骤A2中统计出的原始量化谱分布频数,λ是扩压系数,Δ是动态量化步长,L是统计电平数,M是统计区间数。
6、如权利要求5所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A3中对原量化边界点进行调整的所述设定原则为低通滤波。
7、如权利要求6所述的用于感知音频编码的量化器自适应调整方法,其特征在于,当步骤A2中统计出的原始量化谱分布频数有效时,所述低通滤波是通过公式 x NEW ( i ) = ( 1 - &beta; ) x OLD ( i ) + &beta; &CenterDot; x ^ ( i ) 实现的,其中xNEW(i)是更新的量化边界点,xOLD(i)是原量化边界点,β是遗忘因子。
8、如权利要求6所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述步骤A1中的划分量化区间是通过量化均方误差最小原则来进行的,初始量化边界点由下式计算得到: x MSE ( i ) = ( i 1 / &lambda; + ( i - 1 ) 1 / &lambda; 2 ) &lambda; , 其中,xMSE(i)是初始量化边界点。
9、如权利要求8所述的用于感知音频编码的量化器自适应调整方法,其特征在于,当所述步骤A3中判断统计出的原始量化谱分布频数无效时,所述低通滤波是通过公式xNEW(i)=(1-α)xOLD(i)+αxMSE(i)实现的,其中,xNEW(i)是更新的量化边界点,xOLD(i)是原量化边界点,α是遗忘因子。
10、如权利要求3所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A2包含如下处理过程:
设定统计样本总量阈值用于控制统计周期;
当原始量化谱统计总数大于设定的统计样本总量阈值,统计周期结束,继续步骤A3;否则重复步骤A2继续统计原始量化谱分布频数。
11、如权利要求3所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A2中原始量化谱分布频数根据下式统计得到:
Pd(k)=Pd′(k)+1
k = min ( int [ M L &chi; ] , M ) , 其中,χ为原始量化谱,L为统计电平数,M为统计区间数,Pd(k)代表累加后的原始量化谱χ在区间
Figure A2007100745510004C2
的出现频数,Pd′(k)代表累加前的原始量化谱χ在区间
Figure A2007100745510004C3
的出现频数。
12、如权利要求11所述的用于感知音频编码的量化器自适应调整方法,其特征在于,所述统计区间数满足条件M=nL,其中n为大于等于10的整数。
13、如权利要求11所述的用于感知音频编码的量化器自适应调整方法,其特征在于,步骤A3中所述判断步骤A2中统计出的原始量化谱分布频数是否有效是根据如下原则确定:
设定统计样本量阈值Nt
计算量化电平[i-1,i]的出现频数总和 N i = &Sigma; j = ( i - 1 ) M / L + 1 iM / L P d ( j ) ;
比较Ni与Nt,当Ni≥Nt时,原始量化谱分布频数有效;当Ni<Nt时,原始量化谱分布频数无效。
CN2007100745512A 2007-05-23 2007-05-23 一种用于感知音频编码的量化器自适应调整方法 Active CN101312042B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2007100745512A CN101312042B (zh) 2007-05-23 2007-05-23 一种用于感知音频编码的量化器自适应调整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007100745512A CN101312042B (zh) 2007-05-23 2007-05-23 一种用于感知音频编码的量化器自适应调整方法

Publications (2)

Publication Number Publication Date
CN101312042A true CN101312042A (zh) 2008-11-26
CN101312042B CN101312042B (zh) 2011-08-24

Family

ID=40100642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100745512A Active CN101312042B (zh) 2007-05-23 2007-05-23 一种用于感知音频编码的量化器自适应调整方法

Country Status (1)

Country Link
CN (1) CN101312042B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104620235A (zh) * 2012-09-07 2015-05-13 华为技术有限公司 用于自适应串流中的区段分界及识别的系统及方法
CN108496221A (zh) * 2016-01-26 2018-09-04 杜比实验室特许公司 自适应量化

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4994927A (en) * 1989-06-19 1991-02-19 Gte Laboratories Inc Self-adaptive neural net based vector quantizer for image compression
CN1108023C (zh) * 1995-01-27 2003-05-07 大宇电子株式会社 自适应数字音频编码装置及其一种位分配方法
CN1154084C (zh) * 2002-06-05 2004-06-16 北京阜国数字技术有限公司 一种基于伪小波滤波的音频编/解码方法
CN1284138C (zh) * 2004-12-31 2006-11-08 清华大学 自适应帧选择线谱频率参数量化方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104620235A (zh) * 2012-09-07 2015-05-13 华为技术有限公司 用于自适应串流中的区段分界及识别的系统及方法
CN104620235B (zh) * 2012-09-07 2018-01-16 华为技术有限公司 用于自适应串流中的区段分界及识别的系统及方法
CN108496221A (zh) * 2016-01-26 2018-09-04 杜比实验室特许公司 自适应量化
US10395664B2 (en) 2016-01-26 2019-08-27 Dolby Laboratories Licensing Corporation Adaptive Quantization
CN108496221B (zh) * 2016-01-26 2020-01-21 杜比实验室特许公司 自适应量化

Also Published As

Publication number Publication date
CN101312042B (zh) 2011-08-24

Similar Documents

Publication Publication Date Title
US9009036B2 (en) Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
CN101410892B (zh) 改进的离散余弦变换域中的音频信号响度测量及修改
CN102194457B (zh) 音频编解码方法、系统及噪声水平估计方法
CN101939781B (zh) 音频编码器和解码器
CN1735925B (zh) 使用网格降低mpeg-2高级音频编码的比例因子传输成本
CN100459436C (zh) 一种音频编码中比特分配的方法
US8972270B2 (en) Method and an apparatus for processing an audio signal
US8032371B2 (en) Determining scale factor values in encoding audio data with AAC
US20050267744A1 (en) Audio signal encoding apparatus and audio signal encoding method
RU2719008C1 (ru) Аудиокодер для кодирования аудиосигнала, способ для кодирования аудиосигнала и компьютерная программа, учитывающие детектируемую спектральную область пиков в верхнем частотном диапазоне
CN101443842A (zh) 信息信号编码
CN102436819B (zh) 无线音频压缩、解压缩方法及音频编码器和音频解码器
CN101064106A (zh) 用于低复杂度高级音频编码的自适应速率控制算法
EP2981961B1 (en) Advanced quantizer
KR101757349B1 (ko) 부대역들의 시간적 평활을 이용하여 주파수 향상 신호를 발생시키는 장치 및 방법
CN102194458B (zh) 频带复制方法、装置及音频解码方法、系统
CN101847413B (zh) 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法
CN101308659B (zh) 一种基于先进音频编码器的心理声学模型的处理方法
CN1458646A (zh) 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
CN101193090B (zh) 信号处理方法及其装置
CN101312042B (zh) 一种用于感知音频编码的量化器自适应调整方法
CN105957533B (zh) 语音压缩方法、语音解压方法及音频编码器、音频解码器
CN105103226A (zh) 低复杂度音调自适应音频信号量化
CN101425293B (zh) 一种高效感知音频比特分配方法
Aggarwal et al. Near-optimal selection of encoding parameters for audio coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant