CN107077850A - 用于对子带组的子带配置数据进行编码或解码的方法和装置 - Google Patents
用于对子带组的子带配置数据进行编码或解码的方法和装置 Download PDFInfo
- Publication number
- CN107077850A CN107077850A CN201580056492.9A CN201580056492A CN107077850A CN 107077850 A CN107077850 A CN 107077850A CN 201580056492 A CN201580056492 A CN 201580056492A CN 107077850 A CN107077850 A CN 107077850A
- Authority
- CN
- China
- Prior art keywords
- subband
- group
- bandwidth
- subband group
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 30
- 230000005236 sound signal Effects 0.000 claims description 16
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 description 16
- 238000004458 analytical method Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
为了高效地对子带配置数据进行编码,第一个、倒数第二个和最后一个子带组被与其他子带组不同地处理。此外,在编码中使用子带组带宽差值。使用表示NSB‑1的固定位数对子带数量NSB进行编码。使用表示BSB[1]‑1.的一元码对第一子带组的带宽值BSB[1]进行编码。对最后一个子带g=NSB,没有带宽值BSB[g]被编码。对于子带组g=2,...,NSB‑2,使用一元码对带宽差值ΔBSB[g]=BSB[g]‑BSB[g‑1]进行编码,并且对于子带组g=NSB‑1,使用固定位数对带宽差值ΔBSB[NSB‑1]进行编码。
Description
技术领域
本发明涉及一种用于对对于音频信号的一个或多个帧有效的子带组的子带配置数据进行编码或解码的方法和装置。
背景技术
在音频应用中,特别是在音频编码中,经常执行子带信号的处理。高效的滤波器组是通过使用正交镜像滤波器QMF来实现的,或者快速傅里叶变换FFT使用具有相等带宽的子带。但是,在音频应用中以及在音频编码中,有利的是,所用的子带具有适应人类听觉的心理声学性质的不同带宽。因此,在音频处理中,将来自原始滤波器组的若干个子带组合起来以便形成具有不同带宽的子带的自适应滤波器组。可替代地,使用相同参数来对来自原始滤波器组的一组相邻子带进行处理。在音频编码中,存储或发送用于每个子带组的量化参数。
对于频率轴,存在近似人类听觉的性质的不同标度(例如,Bark标度),例如:
H.Traunmüller,"Analytical expressions for the tonotopic sensoryscale",The Journal of the Acoustical Society of America,vol.88(1),pp.97–100,1990。
E.Zwicker和H.Fastl,"Psychoacoustics:Facts and Models",Springer seriesin information sciences,Springer,第二更新版本,1999。
发明内容
如果多组组合子带被使用,则在编码器侧应用的对应的子带配置必须被解码器侧知道。
本发明要解决的问题是减少定义子带配置所需的位数。该问题通过权利要求1和5中公开的方法来解决。利用这些方法的装置在权利要求3和7中公开。
本发明的有利的附加实施方案在相应的从属权利要求中公开。
为了高效地对子带配置数据进行编码,第一个、倒数第二个和最后一个子带组被与其他子带组不同地处理。此外,在编码中使用子带组带宽差值。
原则上,本发明的编码方法适合于对对于音频信号的一个或多个帧有效的子带组的子带配置数据进行编码,其中,每个子带组等于一个原始子带或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量是预定义的,所述方法包括:
-用表示NSB-1的固定位数对子带组数量NSB进行编码;
-如果NSB>1,则对第一子带组g=1用表示BSB[1]-1的一元码对带宽值BSB[1]进行编码;
-如果NSB=3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2用固定位数对带宽差值ΔBSB[2]=BSB[2]-BSB[1]进行编码;
-如果NSB>3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2,...,NSB-2用一元码对对应数量的带宽差值ΔBSB[g]=BSB[g]-BSB[g-1]进行编码,并且对子带组g=NSB-1用固定位数对带宽差值ΔBSB[NSB-1]=BSB[NSB-1]-BSB[NSB-2]进行编码,
其中,子带组的带宽值被表达为相邻原始子带的数量,
并且其中,对于子带g=NSB,没有对应的值被包括在编码的子带配置数据中。
原则上,本发明的编码装置适合于对对于音频信号的一个或多个帧有效的子带组的子带配置数据进行编码,其中,每个子带组等于一个原始子带,或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量是预定义的,所述装置包括适于以下操作的部件:
-用表示NSB-1的固定位数对子带组数量NSB进行编码;
-如果NSB>1,则对第一子带组g=1用表示BSB[1]-1的一元码对带宽值BSB[1]进行编码;
-如果NSB=3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2用固定位数对带宽差值ΔBSB[2]=BSB[2]-BSB[1]进行编码;
-如果NSB>3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2,...,NSB-2用一元码对对应数量的带宽差值ΔBSB[g]=BSB[g]-BSB[g-1]进行编码,并且对子带组g=NSB-1用固定位数对带宽差值ΔBSB[NSB-1]=BSB[NSB-1]-BSB[NSB-2]进行编码,
其中,子带组的带宽值被表达为相邻原始子带的数量,
并且其中,对于子带g=NSB,没有对应的值被包括在编码的子带配置数据中。
原则上,本发明的解码方法适合于对对于编码的音频信号的一个或多个帧有效的子带组的编码的子带配置数据进行解码,所述子带配置数据是根据以上编码方法编码的数据,并且被布置为所述编码的子带组数量和所述第一子带组的所述编码的带宽值、可能还有一个或多个编码的带宽差值的序列,
其中,每个子带组等于一个原始子带,或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量NFB是预定义的,所述方法包括:
-通过将‘1’与接收的编码的子带组数量的解码版本相加来确定子带组数量NSB;
-对第一子带组g=1,通过将‘1’与对应的接收的编码的带宽值的解码版本相加来确定带宽值BSB[1];
-如果NSB=3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2从带宽差值ΔBSB[2]的接收的编码版本解码带宽值BSB[2]=ΔBSB[2]+BSB[1];
-如果NSB>3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2,...,NSB-2从带宽差值ΔBSB[g]的接收的编码版本解码带宽值BSB[g]=ΔBSB[g]+BSB[g-1],并且对子带组g=NSB-1从带宽差值ΔBSB[NSB-1]的接收的编码版本解码带宽值BSB[NSB-1]=ΔBSB[NSB-1]+BSB[NSB-2],
-对子带g=NSB通过从NFB减去带宽BSB[1]至BSB[NSB-1]来确定带宽值BSB[NSB],
其中,子带组的带宽值被表达为相邻原始子带的数量。
原则上,本发明的解码装置适于对对于编码的音频信号的一个或多个帧有效的子带组的编码的子带配置数据进行解码,所述子带配置数据是根据以上编码方法被编码的数据,并且被布置为所述编码的子带组数量和所述第一子带组的所述编码的带宽值、可能还有一个或多个编码带宽差值的序列,
其中,每个子带组等于一个原始子带,或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量NFB是预定义的,所述装置包括适于以下操作的部件:
-通过将‘1’与接收的编码的子带组数量的解码版本相加来确定子带组数量NSB;
-对第一子带组g=1,通过将‘1’与对应的接收的编码的带宽值的解码版本相加来确定带宽值BSB[1];
-如果NSB=3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2从带宽差值ΔBSB[2]的接收的编码版本解码带宽值BSB[2]=ΔBSB[2]+BSB[1];
-如果NSB>3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2,...,NSB-2从带宽差值ΔBSB[g]的接收的编码版本解码带宽值BSB[g]=ΔBSB[g]+BSB[g-1],并且对子带组g=NSB-1从带宽差值ΔBSB[NSB-1]的接收的编码版本解码带宽值BSB[NSB-1]=ΔBSB[NSB-1]+BSB[NSB-2],
-对子带g=NSB通过从NFB减去带宽BSB[1]至BSB[NSB-1]来确定带宽值BSB[NSB],
其中,子带组的带宽值被表达为相邻原始子带的数量。
附图说明
参照附图来描述本发明的示例性实施例,在附图示出:
图1NFB=8个原始子带和NSB=3个子带组的子带组的示例处理;
图2第一子带组的带宽BSB[1]的直方图;
图3 g=2,...,NSB-2的带宽差ΔBSB[g]的直方图;
图4最后传送的子带组带宽差ΔBSB[NSB-1]的直方图;
图5发送不同数量的子带的子带配置数据所需的位数;
图6示例编码器框图;
图7示例解码器框图。
具体实施方式
即使未被明确描述,以下实施例也可以按任何组合或子组合而被采用。
图1示出了示例子带处理,该子带处理包括具有8个子带的原始分析滤波器组11以及用于处理的3个子带组块12至14(g=1,2,3)的使用。x(n)表示具有离散时间采样索引n的音频输入信号。x1(m),...,xg(m)是具有采样索引m的子带信号,该子带信号一般是以与音频输入信号的采样速率相比降低的采样速率定义的。在每个子带组12至14内,使用相同的参数来对子带信号进行处理。处理的子带信号y1(m),...,yg(m)然后被馈送到合成滤波器组15中,合成滤波器组15以原始采样速率重构宽带输出音频信号y(n)。
本发明涉及子带配置的高效编码,该子带配置包括子带组数量以及原始子带到子带组的映射。在音频编码器可以用不同子带配置(即,不同子带数量和这些子带的不同带宽)进行操作的情况下,这些子带配置被传送或发送到音频解码器侧。
在不同实施例中,子带配置随着时间而改变(例如,依赖于音频输入信号的分析)。
在两种情况下都必须确保编码器和解码器两者都使用相同的子带配置。对于流传输格式,这种种类的信息在可以开始解码的每个流传输块的开头被发送。
假定编码器中的原始分析滤波器组11的配置和操作模式(例如,QMF)是固定的并且为解码器所知。分析滤波器组11的子带数量用NFB表示,并且不需要被传送到解码器侧。用于音频处理的组合子带或子带组的数量用NSB表示。用于这些组合子带或子带组的索引为g=1,...,NSB。
第g子带组由数据集Gg定义,数据集Gg包含分析滤波器组11的子带索引。例如(参看图1):
G1={1},G2={2,3,4},G3={5,6,7,8} (1)
假定所有子带组覆盖原始滤波器组11的从0Hz一直到奈奎斯特频率的频率范围内的所有子带。因此,子带组由它们的用每个子带组的原始滤波器组子带的数量表达的带宽充分描述。用于带宽的这些数量用BSB[g]表示,并且所有这些带宽的总和等于原始滤波器组11的带的数量:
需要传送到解码器侧的值为:
·子带组数量NSB;;
·g=1,...,NSB-1的子带组带宽BSB[g],由此最后一个子带组的带宽由于以上完整频率范围覆盖假定而无需被传送。
这些值的组合被称为子带配置数据。
使用方程(2),可以通过以下方程从其他带宽计算最后一个子带组的带宽:
对子带配置进行编码的一种方式可以如下:
·用固定位数Nb,SB对所用子带组数量NSB进行编码。为了确定该位数,定义最大子带数量。作为示例,Nb,SB=5个位可以用于对NSB∈[0,31]进行编码。
·用Nb,BW个位对组g=1,...,NSB-1的带宽BSB[g]中的每个进行编码。每个子带组的最大带宽为NFB,并且对于每个子带组,带宽的编码将需要个位。
作为其中NFB=64、NSB=4且Nb,SB=5的示例,该方法将需要Nb,SB+(NSB-1)·Nb,BW=5+3·6=23位来传送子带配置数据。
有利地,可以通过使用以下改进处理来减少传送子带配置所需的位数。该处理使用值configIdx,该值是用描述configIdx∈{0,1,2}.的三个典型子带配置的2个位编码的。对于configIdx=3,使用子带配置数据的自适应编码。对于三个预定义子带配置,选择以下值:
·子带组数量;
·对于每个子带组,该子带组的带宽。
表1示出了NFB=64的滤波器组子带配置的示例,这些配置是用2位值编码的。可以使用NFB=32或NFB=128代替NFB=64。具有cinfigIdx∈{0,1,2}的配置在编码器和解码器两者中是以相同的方式定义的。NSB的零值也可以用于指示下述配置数据处理根本不被使用。以这种方式,对应的编码工具可以被禁用。
表1:
适于典型子带配置的带宽编码
如以上结合Traunmüller和Zwicker/Fastl出版物所提到的,对于频率轴存在近似人类听觉的性质的不同标度(例如,Bard标度)。这些频率标度共享子带宽度随着频率增大而增大的性质,使得在较低频率上获得更好的频率分辨率。可以通过传送带宽差来对子带宽度进行编码:
ΔBSB[g]=BSB[g]-BSB[g-1];g=2,...,NSB-1 (4)
对于所考虑的子带性质,这些带宽差于是总是非负的。
因此,子带配置也可以用以下各项来定义:
·所用子带组数量NSB;
·第一子带组g=1的带宽BSB[1];
·子带组g=2,...,NSB-1的带宽差ΔBSB[g]。
从带宽差可以重构子带组g=2,....,NSB-1的带宽BSB[g],例如如表4中行CodedBwFirstSubband后面所示。
最后一个子带组带宽BSB[NSB]可以通过使用方程(3)来重构。
典型子带组宽度的统计分析
对于子带组带宽和带宽差的统计分析,对具有NFB=64个子带并且具有近似Bark标度的NSB=2,...,20个子带组的QMF滤波器组的示例子带配置进行分析。子带组是基于以上提到的Traunmüller出版物中定义的、以Bark为单位的z和以Hz为单位的f之间的转换而定义的,该转换由以下方程给出:
更详细地说,子带组是通过以下方式获得的:
·针对期望子带组的数量在Bark标度上创建等距的带边沿;
·将这些值转换回到频率标度,所述转换值是子带组的期望带边沿;
·找到原始QMF子带的位于期望子带内部的中心频率;
·进行一些后处理以便实现子带组的增加的带宽。
表2中给出了子带组的依赖于子带组数量的所得带宽:
带宽BSB[NSB]在表2中被省略,因为它是合计达64个子带的总带宽的剩余带宽。
图2描绘了从表2推导的要被编码的第一子带的子带组带宽差BSB[1]的直方图。对于NSB=2,存在单个带宽差值‘5’,对于NSB=3和NSB=4,存在两个带宽差值“2”。所有其他的带宽差值为‘1’。图2表明一元码非常适合用于编码,因为小值的出现频率比大值的出现频率大得多。通过使用一元码,非负整数值n用n个“1”位后面跟着一个“0”停止位被编码。
图3描绘了基于表2的、子带组g=2,...,NSB-2的带宽差ΔBSB[g]的直方图,该直方图再次示出非常适合用一元码进行编码的分布。
在图4中,示出了基于表2的、最后传送的子带组带宽差ΔBSB[NSB-1]的直方图。因为该带宽差一般高于前面的子带组的带宽差,所以可以用固定位数来对该值进行编码,该固定位数被称为Nb,lastDiff。在所考虑的情况下,Nb,lastDiff=3个位的宽度是足够的。
如上所述,对于最后一个子带组g=NSB,没有带宽差ΔBSB[NSB]需要被传送。
改进的编码处理
基于统计分析,执行以下改进的编码处理:
·对子带组数量的编码:
CodedNumberOfSubbands=NSB-1 (7)
使用固定位数Nb,SB被编码;
·如果子带组数量NSB为一个,则没有其他内容被传送,因为这种情况与宽带处理是相同的;
·对第一子带组的带宽值BSB[1]的编码。
因为BSB[1]≥1,所以CodedBwFirstSubband=BSB[1]-1 (8)
使用一元码被编码;
●如果NSB>2,则只需要传送以下带宽值:
-子带组g=2,...,NSB-2:每个带宽差值ΔBSB[g]均用一元码编码;
-子带组g=NSB-1:带宽差值ΔBSB[NSB-1]用固定位数Nb,lastDiff被编码;
-子带组g=NSB:没有值或编码值被传送。
编码方案位流语法在表3中被作为用于传送子带配置数据的伪代码示出。粗体数据被写到位流,并且表示子带配置数据块(sSBconfig):
发明人已经发现,对于NFB=64,足够的位宽度(即,字长)为Nb,SB=5和Nb,lastDiff=3。
表4示出了传送的子带配置数据的解码,该解码是通过从在解码器侧接收的位流读取这些数据(从位流读取粗体数据)并且重构带宽值BSB[g]来执行的。
表5中用伪代码示出了从所有子带组的重构带宽值BSB[g]重构子带索引集Gg的重构:
改进的编码处理的结果对子带配置进行编码所需的位数是针对具有NFB=64个子带并且具有NSB=2,...,20个子带组的QMF滤波器组仿真得到的,所述NSB=2,...,20个子带组具有表2中给出的配置。图5示出了对于所考虑的子带组数量、编码子带配置的不同方式所得出的位数。改进的编码处理的结果被作为圆圈示出,并且被与两种替代方法比较:用固定位数3位对每个带宽差进行编码(用正方形示出)以及用固定位数6位对每个带宽进行编码(用加号示出)。
与方程(3)后面的段落中的总共23位的示例相比,改进的处理仅需要12位。
改进的子带配置编码处理清楚地优于替代方法。
图6中示出了包括对应的编码的子带配置数据的生成的示例编码器,图7中示出了对应的解码器,包括用于编码的子带配置数据的解码器。在这些图中,实线指示信号,虚线指示辅助信息数据。索引k表示随着时间的帧索引,输入信号x(k)是包含当前帧k的采样的矢量。在图6中,音频输入信号x(k)被馈送到分析滤波器组步骤或级61,从分析滤波器组步骤或级61获得NFB个子带信号,这些子带信号用矢量记号(notation)表示为具有帧索引k和子带索引i的在分析滤波器组61应用子带信号的下采样的情况下,子带信号矢量的长度小于输入信号矢量的长度。在步骤或级63中,定义期望子带配置(例如,基于输入信号x(k)的当前心理声学性质),并且将对应的值NSB和输出到子带分组步骤或级62以及子带配置数据编码步骤或级64。根据所选子带配置,在子带分组步骤/级62中执行子带信号的分组。第g组包含i∈Gg的所有子带。例如,第一子带组包含子带信号并且最高子带组中的最高子带信号为对于每个子带组,在对应的编码器处理步骤或级65(组g=1)、66(组g=2)、…、67(组g=NSB)中计算处理后的且量化的子带信号和对应的辅助信息s(k,g)。在复用器步骤或级68中将如上所述的在步骤/级64中编码的编码的子带配置数据sSBconfig、处理后的子带信号以及每个子带组的对应的辅助信息数据s(k,1),...,s(k,NSB)复用到位流中,该位流可以被传送到对应的解码器。编码的子带配置数据无需对于每帧都被传送,而是仅对于可以从其开始解码或者其中子带配置正在变化的帧才需要被传送。
在图7中的解码器中,在解复用器步骤或级71中将来自接收的位流的数据解复用为编码的子带配置数据sSBconfig、处理后的子带信号以及每个子带组的对应的辅助信息数据s(k,1),...,s(k,NSB)。在步骤或级73中如上所述那样对编码的子带配置数据进行解码,这得到对应的值NSB和使用该解码子带配置数据,在步骤或级72中执行传送的子带信号和子带组辅助信息到子带组的分配,步骤或级72例如对于组g=1输出和s(k,1)。其后,在解码器74、75、….、76中通过使用每个子带组的对应的辅助信息来执行所有子带组的解码器处理。例如,第一输出子带组包含子带信号y(k,1),...,y(k,BSB[1]),并且最高子带组中的最高子带信号为y(k,NFB)。最后,合成滤波器组步骤或级77从其重构解码的音频信号y(k)。
在不同实施例中,原始子带并不具有相等的宽度。此外,代替具有作为“2”的幂的原始子带数量,可以使用任何其他整数数量的原始子带。在两种情况下,都可以以对应的方式使用所描述的处理。
在另外的实施例中,压缩的音频信号包含如上所述那样编码的多组不同的子带配置数据,这些子带配置数据用于应用不同编码工具,该不同编码工具用于对该音频信号(例如,高阶高保真立体声音频信号或任何其他的3D音频信号的方向信号部分和环境信号部分、或多声道音频信号的不同声道)进行编码。
在另外的实施例中,处理后的子带信号可以不被传送到解码器侧,而是在解码器侧通过分析滤波器组根据另一传送信号计算子带信号。然后,在解码器中使用子带组辅助信息s(k,g)来进行进一步处理。
所描述的处理可以由单个处理器或电子电路执行,或者由并行操作和/或对完整的处理的不同部分操作的几个处理器或电子电路执行。
用于根据所描述的处理操作一个或多个处理器的指令可以被存储在一个或多个存储器中。至少一个处理器被配置为执行这些指令。
Claims (12)
1.一种用于对对于音频信号的一个或多个帧有效的子带组(g)的子带配置数据进行编码的方法,其中,每个子带组等于一个原始子带或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量(NFB)是预定义的,其特征在于:
-用表示NSB-1的固定位数(Nb,SB)对子带组数量NSB进行编码(64);
-如果NSB>1,则对第一子带组g=1用表示BSB[1]-1的一元码对带宽值BSB[1]进行编码(64);
-如果NSB=3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2用固定位数(Nb,lastDiff)对带宽差值ΔBSB[2]=BSB[2]-BSB[1]进行编码(64);
-如果NSB>3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2,...,NSB-2用一元码对对应数量的带宽差值ΔBSB[g]=BSB[g]-BSB[g-1]进行编码(64),并且对子带组g=NSB-1用固定位数(Nb,lastDiff)对带宽差值ΔBSB[NSB-1]=BSB[NSB-1]-BSB[NSB-2]进行编码(64),
其中,子带组的带宽值被表达为相邻原始子带的数量,
并且其中,对于子带g=NSB,没有对应的值包括在编码的子带配置数据中。
2.根据权利要求1所述的方法,其中,子带配置数据块(sSBconfig)包括确定以下各项的配置值(configldx):
-子带组数量和相关子带组宽度的第一预定义组合是否表示所述子带配置数据;
-或者子带组数量和相关子带组宽度的不同的第二预定义组合是否表示所述子带配置数据;
-或者可选地子带组数量和相关子带组宽度的另外的预定义组合是否表示所述子带配置数据;
-或者子带配置数据是否根据权利要求1所述的方法被编码,
其中,在NSB=0的情况下,没有子带配置数据被生成。
3.一种用于对对于音频信号的一个或多个帧有效的子带组(g)的子带配置数据进行编码的装置,其中,每个子带组等于一个原始子带或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量(NFB)是预定义的,所述装置包括适于以下操作的部件(64):
-用表示NSB-1的固定位数(Nb,SB)对子带组数量NSB进行编码;
-如果NSB>1,则对第一子带组g=1用表示BSB[1]-1的一元码对带宽值BSB[1]进行编码;
-如果NSB=3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2用固定位数(Nb,lastDiff)对带宽差值ΔBSB[2]=BSB[2]-BSB[1]进行编码;
-如果NSB>3,则除了对所述第一子带组g=1对所述带宽值BSB[1]进行编码之外,还对子带组g=2,...,NSB-2用一元码对对应数量的带宽差值ΔBSB[g]=BSB[g]-BSB[g-1]进行编码,并且对子带组g=NSB-1用固定位数(Nb,lastDiff)对带宽差值ΔBSB[NSB-1]=BSB[NSB-1]-BSB[NSB-2]进行编码,
其中,子带组的带宽值被表达为相邻原始子带的数量,
并且其中,对于子带g=NSB,没有对应的值被包括在编码的子带配置数据中。
4.根据权利要求3所述的装置,其中,子带配置数据块(sSBconfig)包括确定以下各项的配置值(configldx):
-子带组数量和相关子带组宽度的第一预定义组合是否表示所述子带配置数据;
-或者子带组数量和相关子带组宽度的不同的第二预定义组合是否表示所述子带配置数据;
-或者可选地子带组数量和相关子带组宽度的另外的预定义组合是否表示所述子带配置数据;
-或者子带配置数据是否根据权利要求1所述的方法被编码,
其中,在NSB=0的情况下,没有子带配置数据被生成。
5.一种用于对对于编码的音频信号的一个或多个帧有效的子带组(g)的编码的子带配置数据(sSBconfig))进行解码的方法,所述子带配置数据是根据权利要求1所述的方法被编码的数据,并且被布置为所述编码的子带组数量、所述第一子带组的所述编码的带宽值、及可能还有一个或多个编码的带宽差值的序列,
其中,每个子带组等于一个原始子带或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量NFB是预定义的,在特征在于:
-通过将‘1’与编码的子带组数量的解码版本相加来确定(73)子带组数量NSB;
-对第一子带组g=1,通过将‘1’与对应的编码的带宽值的解码版本相加来确定(73)带宽值BSB[1];
-如果NSB=3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2从带宽差值ΔBSB[2]的编码版本解码(73)带宽值BSB[2]=ΔBSB[2]+BSB[1];
-如果NSB>3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2,...,NSB-2从带宽差值ΔBSB[9]的编码版本解码(73)带宽值BSB[g]=ΔBSB[g]+BSB[g-1],并且对子带组g=NSB-1从带宽差值ΔBSB[NSB-1]的编码版本解码带宽值BSB[NSB-1]=ΔBSB[NSB-1]+BSB[NSB-2],
-对子带g=NSB通过从NFB减去带宽BSB[1]至BSB[NSB-1]来确定(73)带宽值BSB[NSB],
其中,子带组的带宽值被表达为相邻原始子带的数量。
6.根据权利要求5所述的方法,其中,子带配置数据块(sSBconfig)包括确定以下各项的配置值(configldx):
-子带组数量和相关子带组宽度的第一预定义组合是否表示所述子带配置数据;
-或者子带组数量和相关子带组宽度的不同的第二预定义组合是否表示所述子带配置数据;
-或者可选地子带组数量和相关子带组宽度的另外的预定义组合是否表示所述子带配置数据;
-或者子带配置数据是否根据权利要求1所述的方法被编码,
其中,只有在NSB≠0的情况下,根据权利要求5所述的方法才被执行。
7.一种用于对对于编码的音频信号的一个或多个帧有效的子带组(g)的编码的子带配置数据(sSBconfig))进行解码的装置,所述子带配置数据是根据权利要求1所述的方法被编码的数据,并且被布置为所述编码的子带组数量、所述第一子带组的所述编码的带宽值、及可能还有一个或多个编码的带宽差值的序列,
其中,每个子带组等于一个原始子带或者是两个或更多个相邻原始子带的组合,后一子带组的带宽大于或等于当前子带组的带宽,并且原始子带的数量NFB是预定义的,所述装置包括适于以下操作的部件(73):
-通过将‘1’与编码的子带组数量的解码版本相加来确定子带组数量NSB;
-对第一子带组g=1,通过将‘1’与对应的编码的带宽值的解码版本相加来确定带宽值BSB[1];
-如果NSB=3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2从带宽差值ΔBSB[2]的编码版本解码带宽值BSB[2]=ΔBSB[2]+BSB[1];
-如果NSB>3,则除了对所述第一子带组g=1确定所述带宽值BSB[1]之外,还对子带组g=2...,NSB-2从带宽差值ΔBSB[g]的编码版本解码带宽值BSB[g]=ΔBSB[g]+BSB[g-1],并且对子带组g=NSB-1从带宽差值ΔBSB[NSB-1]的编码版本解码带宽值BSB[NSB-1]=ΔBSB[NSB-1]+BSB[NSB-2],
-对子带g=NSB通过从NFB减去带宽BSB[1]至BSB[NSB-1]来确定带宽值BSB[NSB],
其中,子带组的带宽值被表达为相邻原始子带的数量。
8.根据权利要求7所述的装置,其中,子带配置数据块(sSBconfig)包括确定以下各项的配置值(configldx):
-子带组数量和相关子带组宽度的第一预定义组合是否表示所述子带配置数据;
-或者子带组数量和相关子带组宽度的不同的第二预定义组合是否表示所述子带配置数据;
-或者可选地子带组数量和相关子带组宽度的另外的预定义组合是否表示所述子带配置数据;
-或者子带配置数据是否根据权利要求1被编码,
其中,只有在NSB≠0的情况下,该装置才根据权利要求7进行操作。
9.一种数字压缩音频信号,包含根据权利要求1或2所述的方法被编码的子带配置数据。
10.一种数字压缩音频信号,包含根据权利要求1或2的方法被编码的多组不同的子带配置数据。
11.一种存储介质,包含或存储或在其上记录有根据权利要求9或10所述的数字压缩音频信号。
12.一种计算机程序产品,包括当在计算机上被执行时执行根据权利要求1或2所述的方法的指令。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14306347.7A EP2993665A1 (en) | 2014-09-02 | 2014-09-02 | Method and apparatus for coding or decoding subband configuration data for subband groups |
EP14306347.7 | 2014-09-02 | ||
PCT/EP2015/069077 WO2016034420A1 (en) | 2014-09-02 | 2015-08-19 | Method and apparatus for coding or decoding subband configuration data for subband groups |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107077850A true CN107077850A (zh) | 2017-08-18 |
CN107077850B CN107077850B (zh) | 2020-09-08 |
Family
ID=51564606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580056492.9A Active CN107077850B (zh) | 2014-09-02 | 2015-08-19 | 用于对子带组的子带配置数据进行编码或解码的方法和装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US10102864B2 (zh) |
EP (2) | EP2993665A1 (zh) |
KR (1) | KR102469964B1 (zh) |
CN (1) | CN107077850B (zh) |
TW (1) | TW201612895A (zh) |
WO (1) | WO2016034420A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110855673A (zh) * | 2019-11-15 | 2020-02-28 | 成都威爱新经济技术研究院有限公司 | 一种复杂多媒体数据传输及处理方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3007167A1 (en) | 2014-10-10 | 2016-04-13 | Thomson Licensing | Method and apparatus for low bit rate compression of a Higher Order Ambisonics HOA signal representation of a sound field |
CN112669860B (zh) * | 2020-12-29 | 2022-12-09 | 北京百瑞互联技术有限公司 | 一种增加lc3音频编解码有效带宽的方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0693828A1 (en) * | 1994-02-04 | 1996-01-24 | Sony Corporation | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
CN101223570A (zh) * | 2005-07-15 | 2008-07-16 | 微软公司 | 获得用于数字媒体的高效编码的频带的频率分段 |
CN101849258A (zh) * | 2007-11-04 | 2010-09-29 | 高通股份有限公司 | 在可缩放语音和音频编解码器中的用于经量化的mdct频谱的码簿索引的编码/解码的技术 |
CN102222505A (zh) * | 2010-04-13 | 2011-10-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
JP2012022021A (ja) * | 2010-07-12 | 2012-02-02 | Sony Corp | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2005207596A1 (en) * | 2004-01-20 | 2005-08-04 | Dolby Laboratories Licensing Corporation | Audio coding based on block grouping |
KR101301245B1 (ko) * | 2008-12-22 | 2013-09-10 | 한국전자통신연구원 | 스펙트럼 계수의 서브대역 할당 방법 및 장치 |
KR102460820B1 (ko) | 2014-07-02 | 2022-10-31 | 돌비 인터네셔널 에이비 | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 |
-
2014
- 2014-09-02 EP EP14306347.7A patent/EP2993665A1/en not_active Withdrawn
-
2015
- 2015-08-19 EP EP15754173.1A patent/EP3195312B1/en active Active
- 2015-08-19 CN CN201580056492.9A patent/CN107077850B/zh active Active
- 2015-08-19 KR KR1020177008610A patent/KR102469964B1/ko active IP Right Grant
- 2015-08-19 US US15/508,444 patent/US10102864B2/en active Active
- 2015-08-19 WO PCT/EP2015/069077 patent/WO2016034420A1/en active Application Filing
- 2015-08-21 TW TW104127242A patent/TW201612895A/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0693828A1 (en) * | 1994-02-04 | 1996-01-24 | Sony Corporation | Data encoding method and apparatus, data decoding method and apparatus, data recording medium, and data transmission method |
CN101223570A (zh) * | 2005-07-15 | 2008-07-16 | 微软公司 | 获得用于数字媒体的高效编码的频带的频率分段 |
CN101849258A (zh) * | 2007-11-04 | 2010-09-29 | 高通股份有限公司 | 在可缩放语音和音频编解码器中的用于经量化的mdct频谱的码簿索引的编码/解码的技术 |
CN102222505A (zh) * | 2010-04-13 | 2011-10-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
JP2012022021A (ja) * | 2010-07-12 | 2012-02-02 | Sony Corp | 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110855673A (zh) * | 2019-11-15 | 2020-02-28 | 成都威爱新经济技术研究院有限公司 | 一种复杂多媒体数据传输及处理方法 |
CN110855673B (zh) * | 2019-11-15 | 2021-08-24 | 成都威爱新经济技术研究院有限公司 | 一种复杂多媒体数据传输及处理方法 |
Also Published As
Publication number | Publication date |
---|---|
US20170243592A1 (en) | 2017-08-24 |
EP2993665A1 (en) | 2016-03-09 |
KR20170047361A (ko) | 2017-05-04 |
WO2016034420A1 (en) | 2016-03-10 |
KR102469964B1 (ko) | 2022-11-24 |
US10102864B2 (en) | 2018-10-16 |
TW201612895A (en) | 2016-04-01 |
EP3195312A1 (en) | 2017-07-26 |
CN107077850B (zh) | 2020-09-08 |
EP3195312B1 (en) | 2020-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7443307B2 (ja) | サイドゲインおよび残余ゲインを使用してマルチチャネル信号を符号化または復号するための装置および方法 | |
EP2947653B1 (en) | Multi-channel audio coding using complex prediction and window shape information | |
EP1749296B1 (en) | Multichannel audio extension | |
KR102296067B1 (ko) | 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치 | |
EP2665294A2 (en) | Support of a multichannel audio extension | |
CN110495105B (zh) | 多声道信号的编解码方法和编解码器 | |
KR20070120527A (ko) | 적응 잔류 오디오 코딩 | |
KR102460820B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
KR102327149B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
KR20120095920A (ko) | 최적의 저-스루풋 파라메트릭 코딩/디코딩 | |
KR20230070540A (ko) | Hoa 신호들의 계수 도메인 표현으로부터 상기 hoa 신호들의 공간/계수 혼합 도메인 표현을 생성하기 위한 방법 및 장치 | |
KR20110021803A (ko) | 2개의 블록 변환으로의 중첩 변환의 분해 | |
EP1905034A1 (en) | Virtual source location information based channel level difference quantization and dequantization method | |
WO2009048239A2 (en) | Encoding and decoding method using variable subband analysis and apparatus thereof | |
KR102433192B1 (ko) | 압축된 hoa 표현을 디코딩하기 위한 방법 및 장치와 압축된 hoa 표현을 인코딩하기 위한 방법 및 장치 | |
US20110137661A1 (en) | Quantizing device, encoding device, quantizing method, and encoding method | |
KR20070046752A (ko) | 신호 처리 방법 및 장치 | |
CN107077850A (zh) | 用于对子带组的子带配置数据进行编码或解码的方法和装置 | |
EP2690622B1 (en) | Audio decoding device and audio decoding method | |
EP2293292B1 (en) | Quantizing apparatus, quantizing method and encoding apparatus | |
KR102363275B1 (ko) | Hoa 신호 표현의 부대역들 내의 우세 방향 신호들의 방향들의 인코딩/디코딩을 위한 방법 및 장치 | |
KR20090037806A (ko) | 가변 서브밴드 분석을 이용한 부호화와 복호화 방법 및 그 장치 | |
KR20240091351A (ko) | 잡음 감소를 위한 다채널 hoa 오디오 신호를 인코딩하는 방법 및 장치와, 잡음 감소를 위한 다채널 hoa 오디오 신호를 디코딩하는 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1239938 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |