CN101271691B - 一种时域噪声整形工具启动判决方法及装置 - Google Patents
一种时域噪声整形工具启动判决方法及装置 Download PDFInfo
- Publication number
- CN101271691B CN101271691B CN2008101056314A CN200810105631A CN101271691B CN 101271691 B CN101271691 B CN 101271691B CN 2008101056314 A CN2008101056314 A CN 2008101056314A CN 200810105631 A CN200810105631 A CN 200810105631A CN 101271691 B CN101271691 B CN 101271691B
- Authority
- CN
- China
- Prior art keywords
- signal
- front window
- time
- domain
- scale factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000003595 spectral effect Effects 0.000 claims description 49
- 230000011218 segmentation Effects 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 18
- 238000001228 spectrum Methods 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 5
- 238000007493 shaping process Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000002592 echocardiography Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种时域噪声整形工具启动判决方法及装置,应用于ACC音频编码器中,该方法包括:计算当前窗内频域信号的每个尺度因子带的预测增益比;统计预测增益比大于设定的增益阈值的尺度因子带数量,计算所述预测增益比大于设定的增益阈值的尺度因子带数量与参与统计的尺度因子带总数的比值,当所述比值大于或大于等于设定的比例阈值时,在当前窗内启动时域噪声整形工具。本发明方法可以独立考察各尺度因子带的预测增益情况,在具有频域预测增益的尺度因子带数目足够多时才启动时域噪声整形工具,避免了不必要的启动,降低了编解码复杂度,也提高了编码效率。
Description
技术领域
本发明涉及信号处理领域,尤指一种用于高级音频编码(Advanced AudioCoding,AAC)的时域噪声整形(Temporal Noise Shaping,TNS)工具的启动判决方法及装置。
背景技术
AAC采用通用的变换域音频编码器结构,如图1所示。心理声学模型模块负责计算得到掩蔽阈值,即各频段内的最大允许量化噪声;以及基于频域感知熵进行块类型判决,决定后续各编码模块使用的块长。时域信号同时送入时频映射模块,根据块类型采用一个2048点或8个256点的MDCT变换将输入时域音频信号转换为频域离散余弦变换(Modified Discrete Cosine Transform,MDCT)谱系数。谱处理模块中包含时域噪声整形TNS、联合立体声等编码工具,对频域数据进行处理,以提高编码质量。量化和熵编码模块根据掩蔽阈值和可用比特数对谱系数进行量化和编码,同时进行比特分配,以尽可能的减少可感知量化噪声的出现。最后由比特封装模块将谱系数的编码值和有关边信息按规范中的语义规定写入码流。
TNS工具是AAC编码器中用来解决预回声问题(pre-echo)的一个重要工具。‘预回声’的产生是由于解码端的合成滤波器组会将频域谱系数的量化噪声分散到合成滤波器时间窗涵盖的全体时域信号中,使得位于时间窗起始端的小幅度信号段中存在的量化噪声幅度相对过大,而前向掩蔽(pre-masking)时间又很短,造成解码后该小幅度信号段中存在可感知的编码失真,如图2所示,其中量化噪声如虚线所示(考虑了窗函数的影响)。TNS对频域谱系数进行开环线性预测,对预测残差进行量化编码,使得在解码端量化误差的时域包络与 输入信号的时域包络近似,即进行时域噪声整形,能从根本上抑制预回声的出现。
TNS工具具有抑制预回声的功能,但并不是任何时候启动该工具都是合适的:对于缓变帧信号或者低幅度信号段位于后端的快变帧,不存在预回声问题,启动TNS只会增加编、解码端的复杂度,白白耗费传递TNS边信息所需的比特。有时由于频域线性预测增益小,某个尺度因子带中可能存在残差信号幅值大于原始信号的情况,需要更多的比特编码残差信号,引起编码质量下降。因此AAC编码端需要一个判决机制,决定编码当前时间窗信号是否需要启动TNS工具。
现有技术中,根据频域线性预测增益比进行TNS工具启动判决的方法如下:
AAC编码端采用MDCT变换实现时频映射。MDCT变换时,对相邻的两个时间块信号加窗后,再进行变换。所加的时间窗可以包括长窗和短窗;其中,MDCT变换的长窗长度采用2048点,其短窗长度为256点。如采用2048点这种长窗模式,对于一帧输入信号,变换得到1024个MDCT谱系数;如采用256点这种短窗模式,每个时间窗内的256点时域信号变换得到一组128点MDCT谱系数,一帧输入信号使用8个短窗,变换得到8组共1024个MDCT谱系数。
长窗和长短窗切换时的窗形示例如图3所示。
在AAC编码器中,以时间窗为基本单元计算有关边信息,进行TNS工具启动判决以及启用TNS工具,对于长窗模式,各时间窗对应的频域谱系数使用相同的TNS控制边信息;对于短窗模式,各时间窗对应的频域谱系数也使用相同的TNS控制边信息;属于不同模式的时间窗的频域谱系数使用不同的TNS控制边信息。
对于长窗模式,全体1024个谱系数对应一个时间窗。对于短窗模式,则固定的有8个时间窗。
对于一个时间窗的1024点(或128点)谱系数进行判决计算时,具体执 行下列步骤:
步骤1:以尺度因子带(Scale factor Bands)为基本单位选择一个频率范围,基本原则是低频在2kHz以上,最高尺度因子带序号应尽可能的高,但不超过AAC规范规定的最高频率TNS_MAX_BANDS。
步骤2:用通用的莱文森-德宾(Levinson-Durbin)递推算法对选定频率范围内的频率谱系数进行线性预测(linear predictive coding,LPC)分析,得到线性预测加权系数αi;其中,LPC分析阶数为AAC规范规定的最大阶数TNS_MAX_ORDER。
步骤3:考察频域预测增益比gp,判决是否需要启用TNS工具。
根据线性预测加权系数得到预测信号,并根据预测信号计算预测残差,进而得到反映原始信号总能量和预测残差信号总能量比值的线性预测增益比gp:
其中,Eori:原始频域信号总的能量;
Eerr:频域预测残差信号总的能量。
将计算得到的线性预测增益比gp与设定的阈值gt(典型值为1.4~2.0之间)比较,根据比较结果确定是否需要启动TNS工具,具体为:
一旦决定启用TNS工具,则去掉绝对值很小(如:小于0.1)的高阶反射系数,确定最终的预测器阶数,并将保留的反射系数量化后转换到等价的预测系数,计算选定频率范围内谱系数的预测残差,将预测残差送入后续编码模块,并将预测滤波器的反射系数,滤波器阶数等信息作为TNS控制边信息写入码流。
上述判决方法的理论基础是:如果一个时间窗内的信号在时域上属于快变 信号,则其频域谱系数具有很好的预测性,即gp值会较大。此外预测增益大也表明与直接编码原始谱系数相比,编码预测残差信号可能需要较少的比特数。该方法在计算TNS边信息的同时进行TNS启动判决,一旦需要启动TNS,不需要额外的计算TNS边信息的步骤,也不需要参考后一窗信号,具有实用性强,低延时的优点。但该方法也存在如下缺点:
(1)若启动了TNS工具,则在当前窗的连续多个尺度因子带中均使用该工具,并使用相同的预测参数。gp值大只能表示总体上存在预测增益,并非各独立尺度因子带均有预测增益,因此gp值大并不能保证整个频段范围内谱系数均有很好的预测性,编码残差谱系数需要更少的比特。
(2)不能区分低幅度信号段位于时间窗的前端还是后端。而对于后种情况,实际上并不需要启动TNS。
发明内容
本发明实施例提供一种时域噪声整形工具启动判决方法及装置,以便能够在需要抑制预回声时,启动TNS工具,并有效的避免TNS工具的不必要的启动,提高了编码效率。
一种时域噪声整形工具启动判决方法,包括:
计算当前窗内频域信号的每个尺度因子带的预测增益比;所述预测增益比为原始信号谱系数能量与预测残差信号谱系数能量的比值;
统计所述预测增益比大于设定的增益阈值的尺度因子带数量;
计算所述预测增益比大于设定的增益阈值的尺度因子带数量与参与统计的尺度因子带总数的比值Y,当所述比值Y大于或大于等于设定的比例阈值时,在当前窗内启动时域噪声整形工具。
本发明的上述方法,在当前窗内启动时域噪声整形工具之前还包括:
在时域中,进一步确定所述当前窗的前端信号是否是小幅值信号,若是,则在当前窗内启动时域噪声整形工具。
根据本发明的上述方法,所述在时域中,进一步确定所述当前窗的前端信号是否是小幅值信号,包括:
将所述当前窗的时域信号平均分成若干段,计算每段时域信号的平均能量;
确定出平均能量最大值的对应段,若所述平均能量最大值的对应段是所述当前窗的第一段或第二段,则确定当前窗的前端信号不是小幅值信号。
本发明的上述方法,还包括:
当所述平均能量最大值的对应段不是所述当前窗的第一段或第二段时,分别比较当前窗的第一段和第二段时域信号的平均能量是否大于等于所述平均能量最大值乘以设定的能量比阈值的乘积,若是,则确定当前窗的前端信号不是小幅值信号;否则确定当前窗的前端信号是小幅值信号。
根据本发明的上述方法,所述计算每段时域信号的平均能量,包括:
计算每段时域信号中所有样本点的谱系数的平方和,用所述平方和除以本段时域信号中的样本点数量,得到每段时域信号的平均能量。
根据本发明的上述方法,所述计算当前窗内频域信号的每个尺度因子带的预测增益比,具体包括:
根据所述频域信号的原始值,对所述时域噪声整形工具工作范围内的全体谱系数x(k)进行线性预测分析,得到N阶线性预测加权系数αi;其中k为谱系数序号,且1≤i≤N;
根据所述预测加权系数αi计算得到所述当前窗的预测信号p(k);
计算所述谱系数x(k)与所述预测信号p(k)的差值,得到预测残差信号pe(k);
计算当前窗内所述原始信号的每个尺度因子带中所有谱系数的平方和,得到每个尺度因子带中原始信号谱系数能量;
计算所述当前窗内预测残差信号pe(k)的每个尺度因子带中所有谱系数的平方和,得到所述每个尺度因子带中预测残差信号谱系数能量;
计算当前窗内每个尺度因子带中原始信号谱系数能量与预测残差信号谱 系数能量的比值,得到每个尺度因子带的预测增益比。
一种时域噪声整形工具启动判决装置,包括:预测增益计算模块、统计模块、比较模块和执行模块;
所述预测增益计算模块,用于计算当前窗内频域信号的每个尺度因子带的预测增益比;所述预测增益比为原始信号谱系数能量与预测残差信号谱系数能量的比值;
所述统计模块,用于统计所述预测增益比大于设定的增益阈值的尺度因子带数量;
所述比较模块,用于计算所述统计模块统计出的所述预测增益比大于设定的增益阈值的尺度因子带数量与参与统计的尺度因子带总数的比值Y,并比较所述比值Y与设定的比例阈值的大小,当所述比值Y大于或大于等于设定的比例阈值时,通知所述执行模块在当前窗内启动时域噪声整形工具;
所述执行模块,用于接收所述比较模块的通知,在当前窗内启动时域噪声整形工具。
根据本发明的上述装置,所述预测增益计算模块包括:线性预测分析单元、信号预测单元和计算单元;
所述线性预测分析单元,用于根据所述频域信号的原始值,对所述时域噪声整形工具工作范围内的全体谱系数进行线性预测分析,得到N阶线性预测加权系数;
所述信号预测单元,用于据所述预测加权系数计算得到所述当前窗的预测信号和预测残差信号;
所述计算单元,用于计算当前窗内每个尺度因子带中原始信号谱系数能量与预测残差信号谱系数能量的比值,得到每个尺度因子带的预测增益比。
本发明的上述装置,还包括:幅值分段检测模块;
所述比较模块,还用于当比较出所述比值Y大于或大于等于设定的比例阈值时,启动所述幅值分段检测模块,并当所述幅值分段检测模块返回当前窗的 前端信号是小幅值信号的检测结果时,通知所述执行模块在当前窗内启动时域噪声整形工具;
所述幅值分段检测模块,用于确定所述当前窗的前端信号是否是小幅值信号。
根据本发明的上述装置,所述幅值分段检测模块包括:分段计算单元、比较单元和判断单元;
所述分段计算单元,用于将所述当前窗的时域信号平均分成若干段,计算每段时域信号的平均能量;
所述比较单元,用于比较所述分段计算单元计算出的每段时域信号的平均能量,确定出平均能量最大值的对应段;
所述判断单元,用于判断所述平均能量最大值的对应段是否为所述当前窗的第一段或第二段,若是,则确定当前窗的前端信号不是小幅值信号;
当判断出所述平均能量最大值的对应段不是所述当前窗的第一段或第二段后,进一步分别比较当前窗的前两段时域信号的平均能量是否大于等于所述平均能量最大值乘以设定的能量比阈值的乘积,若是,则确定当前窗的前端信号不是小幅值信号;否则,确定当前窗的前端信号是小幅值信号。
本发明实施例提供的时域噪声整形工具启动判决方法及装置,通过计算当前窗内频域信号的每个尺度因子带的预测增益比;统计所述预测增益比大于设定的增益阈值的尺度因子带数量,当所述数量与参与统计的尺度因子带总数的比值大于或大于等于设定的比例阈值时,在当前窗内启动TNS工具;否则在当前窗内不启动TNS工具。采用本发明上述方法独立考察各尺度因子带的预测增益情况,在具有频域预测增益的尺度因子带数目足够多时才启动TNS工具,避免了不必要的TNS启动,降低了编解码复杂度,也提高了编码效率。
附图说明
图1为现有技术中通用的变换域音频编码器结构示意图;
图2为现有技术中产生预回声的原理示意图;
图3为现有技术中长窗和长短窗切换时的窗形示意图;
图4为本发明实施例一中时域噪声整形工具启动判决方法的流程图;
图5为本发明实施例二中时域噪声整形工具启动判决方法的流程图;
图6为本发明实施例提供的时域噪声整形工具启动判决装置结构示意图之一;
图7为本发明实施例提供的时域噪声整形工具启动判决装置结构示意图之二。
具体实施方式
实施例一:
本发明实施例一提供的一种时域噪声整形TNS工具启动判决方法,该判决方法对一个时间窗(包括长窗和短窗)内各个尺度因子带的预测增益进行独立考察,当预测增益大于设定增益阈值的尺度因子带占参与统计的尺度因子带总数的比例大于或大于等于给定的比例阈值Rt时,启动TNS工具;其流程图如图4所示,执行步骤如下:
步骤S101:对当前窗TNS工具的工作目标频率范围内的各尺度因子带中的全体谱系数进行线性预测分析。
LPC分析是一个标准过程,根据频域信号的原始值,使用Levinson-Durbin递推算法对TNS工作范围内的n1~n2号尺度因子带中的全体谱系数x(k)作线性预测分析,计算得到N阶线性预测加权系数αi。
步骤S102:计算当前窗内频域信号的每个尺度因子带的预测增益比。
根据N阶线性预测加权系数αi计算得到预测信号p(k):
其中,k为谱系数序号;N为预测器阶数。
则各谱系数的预测残差信号pe(k)为:
pe(k)=x(k)-p(k) 式(2)
则当前窗内每个尺度因子带的预测增益比gp(n)为:
式(3)中,
Esfbori(n)为第n号尺度因子带中原始信号谱系数的能量,且
Esfberr(n)为第n号尺度因子带中预测残差信号谱系数的能量,且
式(4)和式(5)中:
ko(n)为n号尺度因子带中的包含的第一个谱系数的序号;
k1(n)为n号尺度因子带中的包含的最后一个谱系数的序号;
且尺度因子带序号n的取值范围为n1~n2。
步骤S103:统计当前窗内预测增益比gp(n)大于设定的增益阈值gt的尺度因子带的数量M。
例如:一种增益阈值gt的典型值为1.5。
步骤S104:比较预测增益大于设定增益阈值的尺度因子带的数量M与参与统计的尺度因子带总数的比值Y是否大于等于设定的比例阈值,若是,则执行步骤S105;若否,则执行步骤S106。
参与统计的尺度因子带总数为SFB_NUM=n2n1+1,若设定的比例阈值为Rt;则比值:
设定的比例阈值为Rt,例如:其典型值可以为0.85。
比较比值Y与Rt的大小,若比值 则执行步骤S105;
步骤S105:当前窗启动TNS工具,结束判决过程。
步骤S106:当前窗不启动TNS工具,结束判决过程。
实施例二:
本发明实施例二提供的另一种时域噪声整形TNS工具启动判决方法,该判决方法在比较得到当前窗(可以是长窗或短窗)内预测增益大于设定增益阈值的尺度因子带占参与统计的尺度因子带总数的比例大于或大于等于给定的比例阈值Rt的前提下,进一步考察当前窗的前端是否为小幅度信号,然后综合判定是否启动TNS工具;其流程图如图5所示,执行步骤如下:
步骤S201:对当前窗TNS工具的工作目标频率范围内的各号尺度因子带中的全体谱系数进行线性预测LPC分析。
LPC分析是一个标准过程,根据频域信号的原始值,使用Levinson-Durbin递推算法对TNS工作范围内的n1~n2个尺度因子带中的全体谱系数x(k)作线性预测分析,计算得到N阶线性预测加权系数αi。
步骤S202:计算当前窗内频域信号的每个尺度因子带的预测增益比。具体计算方法与上述实施例一相同,不重述。
步骤S203:统计当前窗内预测增益比gp(n)大于设定的增益阈值gt的尺度因子带的数量M。
例如:一种增益阈值gt的典型值为1.5。
步骤S204:比较预测增益大于设定增益阈值gt的尺度因子带数量M与参 与统计的尺度因子带总数的比值是否大于等于设定的比例阈值,若是,则执行步骤S205;若否,则执行步骤S206。
其中,设定的比例阈值为Rt,例如:其典型值可以为0.85。
步骤S205:进一步确定当前窗时域信号的前端是否是小幅值信号,若是,执行步骤207;若否,执行步骤206。
本发明实施例通过检测分段时域信号能量来确定当前窗的前端是否是小幅值信号。具体过程如下:
(1)将当前窗的时域信号平均分成N段(以分成8段为例),计算每段时域信号的平均能量。
对于使用长窗的信号而言,将当前窗时域信号所包含的1024个样本点平均分成八段,每段中包含128个样本点。计算各段时域信号的平均能量ESeg(l):
式(7)中,K为每段中包含的样本点个数;
j为时域信号序号;
jo为当前窗时域信号的第一个样本点的序号;
x(j)为时域信号幅值;
l为段序号,取值范围为:0~7。
(2)确定出平均能量最大值的对应段,若平均能量最大值的对应段是当前窗的第一段或第二段,则当前窗的前端信号不是小幅值信号。
仍以上述长窗信号为例,确定出当前窗中8段时域信号的平均能量ESeg(l)中的最大值ESegMax。
如果时域信号能量最强的段的序号L_MAX(取值范围0~7)满足:
L_MAX≤1
则认为当前窗信号前端不存在小幅值信号段,不需启动TNS工具。
(3)当平均能量最大值的对应段不是当前窗的第一段或第二段时,还可 以进一步分别比较当前窗的前两段(第一段和第二段)时域信号的平均能量是否大于等于平均能量的最大值乘以设定的能量比阈值的乘积,若是,则确定当前窗的前端信号不是小幅值信号;若否,则确定当前窗的前端信号是小幅值信号。
仍以上述长窗信号为例,如不满足L_MAX≤1,则进一步考察当前窗的前两段时域信号是否为低幅度信号段,即比较ESeg(0)和ESeg(1)是否满足下列条件:
式(8)中,ESegMax为各段时域信号的平均能量ESeg(l)中的最大值。
ERt为能量比例阈值,例如其典型值为0.6。
如果式(8)中的不等式条件满足,则认为前两段时域信号幅值相对并不算小,不需启动TNS工具;否则,需启动TNS工具。
特别的,对于使用短窗的时域信号,可将其一个时间窗内的128个样本点,分为四段,其计算和比较过程与长窗相同,在此不再赘述。
步骤S206:当前窗不启动TNS工具,结束判决过程。
步骤S207:当前窗启动TNS工具,结束判决过程。
根据本发明的上述方法实施例一,可以构建一种时域噪声整形TNS工具启动判决装置,如图6所示,包括:预测增益计算模块101、统计模块102、比较模块103和执行模块104。其中:
预测增益计算模块101,用于计算当前窗内频域信号的每个尺度因子带的预测增益比。
较佳的,预测增益计算模块101可以包括:线性预测分析单元1011、信号预测单元1012和计算单元1013。其中:
线性预测分析单元1011,用于根据所述频域信号的原始值,对所述时域噪 声整形工具工作范围内的全体谱系数进行线性预测分析,得到N阶线性预测加权系数;
信号预测单元1012,用于根据所述预测加权系数计算得到所述当前窗的预测信号和预测残差信号;
计算单元1013,用于计算当前窗内每个尺度因子带中原始信号谱系数能量与预测残差信号谱系数能量的比值,得到每个尺度因子带的预测增益比。
统计模块102,用于统计所述预测增益比大于设定的增益阈值的尺度因子带数量。
比较模块103,用于计算统计模块102统计出的所述预测增益比大于设定的增益阈值的尺度因子带数量与参与统计的尺度因子带总数的比值Y,并比较所述比值Y与设定的比例阈值的大小,当所述比值Y大于或大于等于设定的比例阈值时,则通知执行模块104在当前窗内启动TNS工具。
执行模块104,用于接收比较模块103的通知,在当前窗内启动TNS工具。
根据本发明的上述方法实施例二,还可以构建一种时域噪声整形TNS工具启动判决装置,如图7所示,包括:预测增益计算模块101、统计模块102、比较模块103、执行模块104以及幅值分段检测模块105。其中:
预测增益计算模块101、统计模块102和执行模块104与图6中的各模块功能相同,不重述。
比较模块103,用于计算统计模块102统计出的所述预测增益比大于设定的增益阈值的尺度因子带数量与参与统计的尺度因子带总数的比值Y,并比较所述比值Y与设定的比例阈值的大小,当所述比值Y大于或大于等于设定的比例阈值时,先启动幅值分段检测模块105;并根据幅值分段检测模块105返回的检测结果确定是否通知执行模块104启动TNS工具。即当幅值分段检测模块105返回当前窗的前端信号为小幅值信号的检测结果时,通知执行模块104启动TNS工具。
幅值分段检测模块105,用于确定所述当前窗的前端信号是否是小幅值信 号,并向比较模块103返回当前窗的前端信号是否为小幅值信号的检测结果。
较佳的,幅值分段检测模块105可以包括:分段计算单元1051、比较单元1052和判断单元1053。其中:
分段计算单元1051,用于将所述当前窗的时域信号平均分成若干段,计算每段时域信号的平均能量。
比较单元1052,用于比较分段计算单元1051计算出的每段时域信号的平均能量,确定出所述平均能量最大值的对应段。
判断单元1053,用于判断所述平均能量最大值的对应段是否为所述当前窗的第一段或第二段,若是,则确定当前窗的前端信号不是小幅值信号;
当判断出平均能量最大值的对应段不是当前窗的第一段或第二段时,则进一步分别比较当前窗的前两段时域信号的平均能量是否大于等于所述平均能量最大值乘以设定的能量比阈值的乘积,若是,则确定当前窗的前端信号不是小幅值信号;否则,确定当前窗的前端信号是小幅值信号。
执行模块104,还用于接收比较模块103的通知,在当前窗内启动TNS工具。
本发明上述实施例提供的时域噪声整形工具启动判决方法及装置,分别计算当前窗内每个尺度因子带的预测增益比;统计所述预测增益比大于设定的增益阈值的尺度因子带数量,计算所述数量相对于参与统计的尺度因子带总数所占的比例大于或大于等于设定的比例阈值时,在当前窗内启动TNS工具;否则在当前窗内不启动TNS工具;上述方法独立考察各尺度因子带的预测增益情况,在具有频域预测增益的尺度因子带数目足够多时才启动TNS工具,避免了不必要的TNS启动,降低了编解码复杂度,也提高了编码效率。
本发明实施例提供的时域噪声整形工具启动判决方法及装置,在具有频域预测增益的尺度因子带数量足够多时,还可以进一步考察当前窗内时域信号的能量分布情况,从而确定当前窗内时域信号的幅度分布情况,将小幅值信号段位于时间窗的前端和后端这两种快变帧类型加以区别,利用了前向掩蔽时间 短,后向掩蔽时间长的特点,在小幅值信号位于时间窗的前端时(即会引起预回声问题时),才启动TNS工具;在位于后端时,则不启动TNS工具;从而进一步减少TNS工具不必要的启动。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化、替换或应用到其他类似的装置,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (10)
1.一种时域噪声整形工具启动判决方法,其特征在于,包括:
计算当前窗内频域信号的每个尺度因子带的预测增益比;所述预测增益比为原始信号谱系数能量与预测残差信号谱系数能量的比值;
统计所述预测增益比大于设定的增益阈值的尺度因子带数量;
计算所述预测增益比大于设定的增益阈值的尺度因子带数量与参与统计的尺度因子带总数的比值Y,当所述比值Y大于或大于等于设定的比例阈值时,在当前窗内启动时域噪声整形工具。
2.如权利要求1所述的方法,其特征在于,在当前窗内启动时域噪声整形工具之前还包括:
在时域中,进一步确定所述当前窗的前端信号是否是小幅值信号,若是,则在当前窗内启动时域噪声整形工具。
3.如权利要求2所述的方法,其特征在于,所述在时域中,进一步确定所述当前窗的前端信号是否是小幅值信号,包括:
将所述当前窗的时域信号平均分成若干段,计算每段时域信号的平均能量;
确定出平均能量最大值的对应段,若所述平均能量最大值的对应段是所述当前窗的第一段或第二段,则确定当前窗的前端信号不是小幅值信号。
4.如权利要求3所述的方法,其特征在于,还包括:
当所述平均能量最大值的对应段不是所述当前窗的第一段或第二段时,分别比较当前窗的第一段和第二段时域信号的平均能量是否大于等于所述平均能量最大值乘以设定的能量比阈值的乘积,若是,则确定当前窗的前端信号不是小幅值信号;否则确定当前窗的前端信号是小幅值信号。
5.如权利要求3或4所述的方法,其特征在于,所述计算每段时域信号的平均能量,包括:
计算每段时域信号中所有样本点的谱系数的平方和,用所述平方和除以本段时域信号中的样本点数量,得到每段时域信号的平均能量。
6.如权利要求1所述的方法,其特征在于,所述计算当前窗内频域信号的每个尺度因子带的预测增益比,具体包括:
根据所述频域信号的原始值,对所述时域噪声整形工具工作范围内的全体谱系数x(k)进行线性预测分析,得到N阶线性预测加权系数αi;其中k为谱系数序号,且1≤i≤N;
根据所述预测加权系数αi计算得到所述当前窗的预测信号p(k);
计算所述谱系数x(k)与所述预测信号p(k)的差值,得到预测残差信号pe(k);
计算当前窗内所述原始信号的每个尺度因子带中所有谱系数的平方和,得到每个尺度因子带中原始信号谱系数能量;
计算所述当前窗内预测残差信号pe(k)的每个尺度因子带中所有谱系数的平方和,得到所述每个尺度因子带中预测残差信号谱系数能量;
计算当前窗内每个尺度因子带中原始信号谱系数能量与预测残差信号谱系数能量的比值,得到每个尺度因子带的预测增益比。
7.一种时域噪声整形工具启动判决装置,其特征在于,包括:预测增益计算模块、统计模块、比较模块和执行模块;
所述预测增益计算模块,用于计算当前窗内频域信号的每个尺度因子带的预测增益比;所述预测增益比为原始信号谱系数能量与预测残差信号谱系数能量的比值;
所述统计模块,用于统计所述预测增益比大于设定的增益阈值的尺度因子带数量;
所述比较模块,用于计算所述统计模块统计出的所述预测增益比大于设定的增益阈值的尺度因子带数量与参与统计的尺度因子带总数的比值Y,并比较所述比值Y与设定的比例阈值的大小,当所述比值Y大于或大于等于设定的比例阈值时,通知所述执行模块在当前窗内启动时域噪声整形工具;
所述执行模块,用于接收所述比较模块的通知,在当前窗内启动时域噪声整形工具。
8.如权利要求7所述的装置,其特征在于,所述预测增益计算模块包括:线性预测分析单元、信号预测单元和计算单元;
所述线性预测分析单元,用于根据所述频域信号的原始值,对所述时域噪声整形工具工作范围内的全体谱系数进行线性预测分析,得到N阶线性预测加权系数;
所述信号预测单元,用于据所述预测加权系数计算得到所述当前窗的预测信号和预测残差信号;
所述计算单元,用于计算当前窗内每个尺度因子带中原始信号谱系数能量与预测残差信号谱系数能量的比值,得到每个尺度因子带的预测增益比。
9.如权利要求7所述的装置,其特征在于,还包括:幅值分段检测模块;
所述比较模块,还用于当比较出所述Y比值大于或大于等于设定的比例阈值时,启动所述幅值分段检测模块,并当所述幅值分段检测模块返回当前窗的前端信号是小幅值信号的检测结果时,通知所述执行模块在当前窗内启动时域噪声整形工具;
所述幅值分段检测模块,用于确定所述当前窗的前端信号是否是小幅值信号。
10.如权利要求9所述的装置,其特征在于,所述幅值分段检测模块包括:分段计算单元、比较单元和判断单元;
所述分段计算单元,用于将所述当前窗的时域信号平均分成若干段,计算每段时域信号的平均能量;
所述比较单元,用于比较所述分段计算单元计算出的每段时域信号的平均能量,确定出平均能量最大值的对应段;
所述判断单元,用于判断所述平均能量最大值的对应段是否为所述当前窗的第一段或第二段,若是,则确定当前窗的前端信号不是小幅值信号;
当判断出所述平均能量最大值的对应段不是所述当前窗的第一段或第二段后,进一步分别比较当前窗的前两段时域信号的平均能量是否大于等于所述平均能量最大值乘以设定的能量比阈值的乘积,若是,则确定当前窗的前端信号不是小幅值信号;否则,确定当前窗的前端信号是小幅值信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101056314A CN101271691B (zh) | 2008-04-30 | 2008-04-30 | 一种时域噪声整形工具启动判决方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2008101056314A CN101271691B (zh) | 2008-04-30 | 2008-04-30 | 一种时域噪声整形工具启动判决方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101271691A CN101271691A (zh) | 2008-09-24 |
CN101271691B true CN101271691B (zh) | 2011-08-17 |
Family
ID=40005607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101056314A Expired - Fee Related CN101271691B (zh) | 2008-04-30 | 2008-04-30 | 一种时域噪声整形工具启动判决方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101271691B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103327201B (zh) * | 2012-03-20 | 2016-04-20 | 联芯科技有限公司 | 残留回声消除方法及系统 |
CN106128470A (zh) * | 2016-06-29 | 2016-11-16 | 努比亚技术有限公司 | 显示音频频谱的装置及方法 |
CN111429926B (zh) * | 2020-03-24 | 2022-04-15 | 北京百瑞互联技术有限公司 | 一种优化音频编码速度的方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US20080004870A1 (en) * | 2006-06-30 | 2008-01-03 | Chi-Min Liu | Method of detecting for activating a temporal noise shaping process in coding audio signals |
-
2008
- 2008-04-30 CN CN2008101056314A patent/CN101271691B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US20080004870A1 (en) * | 2006-06-30 | 2008-01-03 | Chi-Min Liu | Method of detecting for activating a temporal noise shaping process in coding audio signals |
Non-Patent Citations (5)
Title |
---|
JÜ |
JÜRGEN HERRE.TEMPORAL NOISE SHAPING, QUANTIZATION AND CODING METHODS IN PERCEPTUAL AUDIO CODING:A TUTORIAL INTRODUCTION.《AES 17th International Conference on High Quality Audio Coding》.1999,1-14. * |
RGENHERRE.TEMPORALNOISESHAPING QUANTIZATION AND CODING METHODS IN PERCEPTUAL AUDIO CODING:A TUTORIAL INTRODUCTION.《AES 17th International Conference on High Quality Audio Coding》.1999 |
戈迪等.基于新型TNS 启用机制的高效音频编码方法.《电声技术》.2005,43-35. * |
魏斌等.预测技术在AAC暂态噪声整形模块中的应用.《现代电子技术》.2006,(第236期),115-117. * |
Also Published As
Publication number | Publication date |
---|---|
CN101271691A (zh) | 2008-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1922656B (zh) | 用于确定量化器步长的设备和方法 | |
USRE49363E1 (en) | Variable bit rate LPC filter quantizing and inverse quantizing device and method | |
JP6214160B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
CN1172293C (zh) | 有效频谱包络编码方法及其编解码设备 | |
CN1926608B (zh) | 多声道信号处理设备和方法 | |
AU733156B2 (en) | Audio coding method and apparatus | |
KR101278805B1 (ko) | 엔트로피 코딩 방법 및 엔트로피 디코딩 방법 | |
CN101903945B (zh) | 编码装置、解码装置以及编码方法 | |
US10446159B2 (en) | Speech/audio encoding apparatus and method thereof | |
CN104025189A (zh) | 编码语音信号的方法、解码语音信号的方法,及使用其的装置 | |
CA2246532A1 (en) | Perceptual audio coding | |
US6928406B1 (en) | Excitation vector generating apparatus and speech coding/decoding apparatus | |
CN101488344B (zh) | 一种量化噪声泄漏控制方法及装置 | |
EP1887564A1 (en) | Estimating rate controlling parameters in perceptual audio encoders | |
EP1676264A2 (en) | A method of making a window type decision based on mdct data in audio encoding | |
JP2019514065A (ja) | 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム | |
CN1458646A (zh) | 一种滤波参数矢量量化和结合量化模型预测的音频编码方法 | |
US8489391B2 (en) | Scalable hybrid auto coder for transient detection in advanced audio coding with spectral band replication | |
CN101271691B (zh) | 一种时域噪声整形工具启动判决方法及装置 | |
CN102419977B (zh) | 瞬态音频信号的判别方法 | |
CN101350199A (zh) | 音频编码器及音频编码方法 | |
CN101694773B (zh) | 一种基于tda域的自适应窗切换方法 | |
EP1673765A2 (en) | A method for grouping short windows in audio encoding | |
CN101425293B (zh) | 一种高效感知音频比特分配方法 | |
US20090037166A1 (en) | Audio encoding method with function of accelerating a quantization iterative loop process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110817 Termination date: 20120430 |