CN102938253A - 用于可伸缩声道解码的方法、介质和设备 - Google Patents

用于可伸缩声道解码的方法、介质和设备 Download PDF

Info

Publication number
CN102938253A
CN102938253A CN2012104587152A CN201210458715A CN102938253A CN 102938253 A CN102938253 A CN 102938253A CN 2012104587152 A CN2012104587152 A CN 2012104587152A CN 201210458715 A CN201210458715 A CN 201210458715A CN 102938253 A CN102938253 A CN 102938253A
Authority
CN
China
Prior art keywords
tree
sign
decoding
signal
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104587152A
Other languages
English (en)
Other versions
CN102938253B (zh
Inventor
金重会
吴殷美
苗磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN102938253A publication Critical patent/CN102938253A/zh
Application granted granted Critical
Publication of CN102938253B publication Critical patent/CN102938253B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Abstract

一种用于可伸缩性声道解码的方法、介质和设备。所述方法包括:识别声道或扬声器的配置;使用识别的声道或扬声器的配置来对每个多声道信号计算解码等级的数量;根据计算的解码等级的数量来执行解码和上混合。

Description

用于可伸缩声道解码的方法、介质和设备
本申请是向中国知识产权局提交的申请日为2007年1月11日的标题为“用于可伸缩声道解码的方法、介质和设备”的第200780002329.X号申请的分案申请。
技术领域
本申请要求2006年1月11日提交到美国专利商标局的第60/757,857号美国临时专利申请、2006年1月17日提交到美国专利商标局的第60/758,985号美国临时专利申请、2006年1月18日提交到美国专利商标局的第60/759,543号美国临时专利申请、2006年4月5日提交到美国专利商标局的第60/789,147号美国临时专利申请、2006年4月6日提交到美国专利商标局的第60/789,601号美国临时专利申请以及在2006年5月30日提交到韩国知识产权局的第10-2006-0049033号韩国专利申请的利益,这些申请全部公开于此以资参考。
本发明的一个或多个实施例涉及音频解码,更具体地讲,涉及用于对多声道信号进行编码/解码的环绕音频编码。
背景技术
发明的公开
技术问题
多声道音频编码可被分类为波形多声道音频编码和参数多声道音频编码。波形多声道音频编码可被分类为运动图像专家组(MPEG)-2MC音频编码、AAC MC音频编码和BSAC/AVS MC音频编码,其中,对5声道信号进行编码并对5声道信号进行解码。参数多声道音频编码包括MPEG环绕编码,其中,所述编码方案从6或8多声道产生1或2个编码的声道,然后从所述1或2个编码的声道解码为所述6或8多声道。这里的6或8多声道只是这种多声道环境的示例。
通常,在这种多声道音频编码中,将从解码器输出的声道的数量由编码器固定。例如,在MPEG环绕编码中,编码器可将6或8多声道信号编码为1或2个编码的声道,而解码器必须将所述1或2个编码的声道解码为6或8多声道,即,由于编码器对多声道信号进行编码的分级,在输出任何具体声道之前以相似的相反顺序的分级对所有可用声道进行解码。因此,如果在解码器中将被用于再现的扬声器的数量和与扬声器的位置相应的声道配置与在编码器中构造的声道的数量不同,则在解码器的上混合(up mix)期间,声音的质量将会降低。
根据MPEG环绕规范,可通过下混合模块的分级来对多声道信号进行编码,所述下混合模块可最终将多声道信号顺序地下混合为一个或两个编码的声道。通过上混合模块的相似的分级(树结构),所述一个或两个编码的声道可被解码为多声道信号。这里,例如,上混合分级开始接收编码的下混合信号,并使用1至2(OTT)上混合模块的结合,将编码的下混合信号上混合为左前(FL)声道、右前(FR)声道、中央(C)声道、低频增强(LFE)声道、左后(BL)声道和右后(BR)声道的多声道信号。这里,可以用编码器在对多声道信号进行编码期间产生的声道等级差(Channel Level Difference,CLD)和/或声道间的相关性(Inter-Channel Correlation,ICC)的空间信息(空间暗示)来实现OTT模块的分级的上混合,其中,CLD是关于多声道中的预定声道之间的能量比或差的信息,ICC是关于与输入的信号的时间/频率瓦(tile)相应的相关性或一致性的信息。利用各个CLD和ICC,每个分级的OTT可将单个输入信号上混合为通过每个分级的OTT的各个输出信号。请参见作为根据本发明实施例的分级的上混合树结构的示例的图4到图8。
因此,由于要求解码器必须具有反映编码器的分级的特定分级的结构,并且由于下混合的传统顺序,难于基于解码器中的将被用于再现的扬声器的数量和与扬声器的位置对应的相应的声道配置有选择地对编码的声道进行解码。
技术方案
本发明的一个或多个实施例阐述了一种用于可伸缩声道解码的方法、介质和设备,其中,识别解码器中声道或扬声器的配置以对每个通过编码器编码的多声道信号计算将被解码的等级的数量,并根据计算的等级的数量执行解码。
将在下面的描述中部分地阐述本发明的另外方面和/或优点,部分地,从下面的描述中,这些方面和/或优点将会清楚,或者通过实施本发明而被了解。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括用于可伸缩信道解码的方法,所述方法包括:对于至少一个编码的多声道信号设置解码等级的数量;根据设置的解码等级的数量来对所述至少一个编码的多声道信号执行有选择的解码和上混合;从而当设置的解码等级的数量被设置为表示解码等级的全部数量时,所述至少一个编码的多声道信号的所有等级被解码和上混合,当设置的解码等级的数量被设置为表示解码等级的数量不同于解码等级的全部数量时,并非所述至少一个编码的多声道信号的可用的所有解码等级被解码和上混合。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括至少一种包括控制至少一种处理部件以实现本发明实施例的计算机可读代码的介质。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的设备,所述设备包括:等级设置单元,对于至少一个编码的多声道信号设置解码等级的数量;上混合单元,根据设置的解码等级的数量来对所述至少一个编码的多声道信号执行有选择的解码和上混合;从而当设置的解码等级的数量被设置为表示解码等级的全部数量时,所述至少一个编码的多声道信号的所有等级被解码和上混合,当设置的解码等级的数量被设置为表示解码等级的数量不同于解码等级的全部数量时,并非所述至少一个编码的多声道信号的可用的所有解码等级被解码和上混合。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的方法,所述方法包括:识别解码器的声道或扬声器的配置;有选择地将至少一个下混合的编码的多声道信号上混合为与识别的声道或扬声器的配置相应的多声道信号。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的方法,所述方法包括:识别解码器的声道或扬声器的配置;基于识别的声道或扬声器的配置来设置使从至少一个下混合的编码的多声道信号上混合的各个上混合信号通过的模块的数量;根据设置的模块的数量来对所述至少一个下混合的编码的多声道信号进行有选择的解码和上混合。
为了至少实现上述和/或其他方面和优点,本发明的实施例包括一种用于可伸缩声道解码的方法,所述方法包括:识别解码器的声道或扬声器的配置;基于通过解码器再现声道的可用性来确定是否对由至少一个下混合的编码的多声道信号表示的多个声道的声道进行解码;确定除了由确定是否对声道进行解码的步骤被确定为不被解码的多声道之外是否存在将以相同路径被解码的多声道;根据确定除了被确定为不被解码的多声道之外是否存在以相同路径被解码的多声道的步骤,计算每个多声道信号必须通过的解码和上混合模块的数量;根据计算的解码和上混合模块的数量来执行有选择的解码和上混合。
有益效果
附图说明
从下面结合附图对实施例的描述中,本发明的这些和/或其他方面和优点将变得清楚,并更容易理解,其中:
图1示出根据本发明实施例的多声道解码方法;
图2示出根据本发明实施例的用于可伸缩解码的设备;
图3示出根据本发明实施例的5-2-5树结构和任意树结构的复杂结构;
图4示出根据本发明实施例的用于解释用于可伸缩声道解码的方法、介质和设备的预定的树结构;
图5示出根据本发明实施例的在5-1-51树结构中输出的4声道;
图6示出根据本发明实施例的在5-1-52树结构中输出的4声道;
图7示出根据本发明实施例的在5-1-51树结构中输出的3声道;
图8示出根据本发明实施例的在5-1-52树结构中输出的3声道;
图9示出使用根据本发明实施例的用于可伸缩声道解码的方法、介质和设备来设置Treesign(v,)的伪代码;
图10示出使用根据本发明实施例的用于可伸缩声道解码的方法、介质和设备去除与不必要的模块相应的矩阵或向量的元素的伪代码。
最佳方式
发明的方式
现在将对本发明实施例进行详细描述,本发明的示例在附图中示出,其中,相同的标号始终表示相同的部件。下面将参照附图来描述实施例以解释本发明。
图1示出根据本发明实施例的多声道解码方法。
首先,在操作100中,解析从编码器发送的环绕比特流以提取空间暗示和附加信息。在操作103,识别在解码器中提供的声道或扬声器的配置。这里,解码器中多声道的配置对应于包括在解码器中/可用于解码器的扬声器的数量(下面称作“numPlayChan”)、包括在解码器中/可用于解码器的扬声器中的可操作扬声器的位置(下面被称作“playChanPos(ch)”)和指示在编码器中编码的声道是否可用于在解码器中提供的多声道的向量(下面称作“bPlaySpk(ch)”)。
这里,例如,在下面所述的等式1中,bPlaySpk(ch)使用“1”表示在编码器中编码的声道中可用于解码器中提供的多声道的扬声器,使用“0”表示不可用于所述多声道的扬声器。
等式1:
其中,0≤i≤numOutChanAT
相似地,可以用下面的等式2来计算引用的numOutChanAT。
等式2:
numOutChaAT = Σ k = 0 numOutChan - 1 Tree OutChan ( k )
此外,例如,可使用等式3将引用的playChanPos表示为5.1声道系统。
等式3:
playChanPos=[FL FR C LFE BL BR]
在操作106,例如,可确定不对多声道中不可用的声道进行解码。
例如,如图3到图8所示的树结构中,矩阵Treesign(v,)可包括如下所述的元素,所述元素指示每个输出信号是否被输出到上级OTT模块(在这种情况下,用“1”表示元素)或者每个输出的信号是否被输出到下级OTT模块(在这种情况下,用“-1”表示元素)。在矩阵Treesign(v,)中,v大于0并小于numOutChan。下面,将使用矩阵Treesign(v,)来描述本发明的实施例,但是,本领域的技术人员应该理解,在不限于矩阵Treesign(v,)的情况下,也可实现本发明的实施例。例如,可使用通过交换矩阵Treesign(v,)的行和列而获得的矩阵,注意,可等同地利用实现本发明的替换方法。
例如,在图4所示的树结构中,在矩阵Treesign中,将被输出到来自Box0的上级、来自Box 1的上级和来自Box 2的上级的第一列被表示为[1,1,1],将被输出到来自Box 0的下级和来自Box 3的上级的第四列被表示为[-1,1,n/a]。这里,“n/a”是表示相应的声道、模块或盒子(box)不可用的标识符。这样,可用如下所示的Treesign来表示所有多声道。
Tree sign = 1 1 1 - 1 - 1 - 1 1 1 - 1 1 - 1 - 1 1 - 1 n / a n / a 1 - 1
在操作106,在编码器中编码的声道中与不可用于解码器中提供的多声道的声道相应的列在矩阵Treesign(v,)中均被设置为“n/a”。
例如,在图4所示的树结构中,指示在编码器中编码的声道是否可用于解码器中提供的多声道的向量bPlaySpk在第二声道和第四声道中用“0”表示。因此,在解码器中提供的多声道中的第二声道和第四声道不可用于在解码器中提供的多声道。因此,在操作106中,在矩阵Treesign中,与第二声道和第四声道相应的第二列和第四列被设置为n/a,从而产生Tree’sign
Tre e ′ sign = 1 n / a 1 n / a - 1 - 1 1 n / a - 1 n / a - 1 - 1 1 n / a n / a n / a 1 - 1
在操作108,确定除了在操作106中确定不被解码的声道之外,是否存在将以相同路径被解码的多声道。在操作108,假定在操作106中设置的矩阵Treesign(v,i,j)中,预定的整数j和k互不相等,确定Treesign(v,0:i-1,j)和Treesign(v,0:i-1,k)是否相同以确定是否存在将以相同路径被解码的多声道。
例如,在图4所示的树结构中,由于Treesign(v,0:1,1)和Treesign(v,0:1,3)彼此不相等,所以在操作106中产生的矩阵Tree’sign中的第一声道和第三声道在操作108中被确定为不以相同的路径被解码的多声道。然而,由于Treesign(v,0:1,5)和Treesign(v,0:1,6)彼此相同,所以在操作106中产生的矩阵Tree’sign中的第五声道和第六声道在操作108中被确定为将以相同路径被解码的多声道。
在操作110,对于在操作108中被确定为不以相同路径被解码的多声道的声道减少解码等级(level)。这里,解码等级表示与OTT模块或TTT模块类似的用于解码的模块或盒子的数量,信号必须通过所述模块或盒子以从多声道中的每个声道输出。对于在操作108中被确定为不以相同路径被解码的多声道的声道,最终确定的解码等级被表示为n/a。
例如,在图4所示的树结构中,由于第一声道和第三声道在操作108中被确定为不以相同路径被解码的多声道,所以如下所示将与第一声道相应的第一列的最后行和与第三声道相应的第三列的最后行设置为n/a。
Tree ′ sign = 1 n / a 1 n / a - 1 - 1 1 n / a - 1 n / a - 1 - 1 n / a n / a n / a n / a 1 - 1
在逐一减小解码等级时,可重复操作108和110。因此,可从Tree’sign(v)的最后行到第一行逐行重复操作108和110。
在操作106到110中,如图9所示,可使用伪代码为每个子树设置Treesign(v,)。
在操作113,使用在操作110中获得的结果,可对多声道中的每个声道计算解码等级的数量。
可根据等式4计算解码等级的数量。
等式4:
DL ( v ) = dl i offset ( v ) dl i offset ( v ) + 1 · · · dl i offset ( v ) + Tree outChan ( v ) - 1
其中,
Figure BDA00002402591200073
其中,0≤i<TreeoutChan(v),0≤v<numOutChan,abs(n/a)=0,
Figure BDA00002402591200075
例如,在图4所示的树结构中,可如下所述来计算在操作110中设置的矩阵Tree’sign的解码等级的数量:
DL=[2 -1 2 -1 3 3]
由于n/a的绝对值被假定为0,并且元素都是n/a的列被假定为-1,所以矩阵Tree’sign中的第一列的元素的绝对值的和是2,在矩阵Tree’sign中元素都是n/a的第二列被设置为-1。
通过使用如上所述计算的DL,在图4示出的虚线之前的模块执行解码,从而实现可伸缩解码。
在操作116,在操作100中提取的空间暗示可有选择地被平滑以防止在低比特率下空间暗示的急剧改变。
在操作119,为了与传统矩阵环绕技术兼容,可对于每个附加声道计算增益和预向量(pre-vector),并且在解码器中使用外部下混合的情况下,可提取用于补偿每个声道的增益的参数,从而产生矩阵R1。矩阵R1用于产生将被输入到用于去相关的去相关器的信号。
例如,在本实施例中,假定如图5所示的5-1-51树结构和如图6所示的5-1-52树结构被设置为下面的矩阵。
Tree ( 0 , , ) = 0 0 0 0 0 0 1 1 1 1 2 2 3 3 4 4 n / a n / a ,
Tree sign ( 0 , , ) = 1 1 1 1 - 1 - 1 1 1 - 1 - 1 1 - 1 1 - 1 1 - 1 n / a n / a ,
Treedepth(0,)=[3 3 3 3 2 2],
TreeoutChan(0)=[6].
在这种情况下,在5-1-51树结构中,在操作119中,可如下所示来计算R1
Figure BDA00002402591200091
其中 c 1 , OTT X l , m = 10 CLD X l , m 10 1 + 10 CLD X l , m 10 c 2 , OTT X l , m = 1 1 + 10 CLD X l , m 10 , |
其中:
CLD X l , m = D CLD ( X , l , m ) , 0 &le; X < 2,0 &le; m < M proc , 0 &le; l < L .
在这种情况下,在5-1-52树结构中,在操作119中,可如下所示来计算R1
,其中 c l , OTT X l , m = 10 CLD X l , m 10 1 + 10 CLD X l , m 10 c 2 , OTT X l , m = 1 1 + 10 CLD X l , m 10 , |
其中:
CLD X l , m = D CLD ( X , l , m , ) , 0 &le; X < 2,0 &le; m < M proc , 0 &le; l < L .
在操作120,对在操作119中产生的矩阵R1进行插值以产生矩阵M1
在操作123,可产生用于将去相关的信号与直接信号(direct signal)混合的矩阵R2。为了使在操作106至操作113中被确定为不必要的模块的模块不执行解码,如图10所示,在操作123中产生的矩阵R2使用伪代码去除与不必要的模块相应的矩阵或向量的元素。
下面,将描述应用到5-1-51树结构和5-1-52树结构的示例。
首先,图5示出在5-1-51树结构中只输出4个声道的情况。如果对图5所示的5-1-51树结构执行操作103至操作113,则如下所示产生Tree’sign(0,,)和DL(0,):
Tree sign &prime; ( 0 , , ) = 1 1 1 n / a - 1 n / a 1 1 - 1 n / a n / a n / a 1 - 1 n / a n / a n / a n / a ,
DL(0,)=[3 3 2 -1 1 -1].
通过产生的DL(0,)在示出的虚线之前的模块中停止解码。因此,由于OTT2和OTT4不执行上混合,所以可在操作126中如下所示来产生矩阵R2
R 2 l , m = H 11 OTT 3 l , m H 11 OTT 1 l , m H 11 OTT 0 l , m H 11 OTT 3 l , m H 11 OTT 1 l , m H 12 OTT 0 l , m H 11 OTT 3 l , m H 12 OTT 1 l , m H 12 OTT 3 l , m 0 H 21 OTT 3 l , m H 11 OTT 1 l , m H 11 OTT 0 l , m H 21 OTT 3 l , m H 11 OTT 1 l , m H 12 OTT 0 l , m H 21 OTT 3 l , m H 12 OTT 1 l , m H 22 OTT 3 l , m 0 H 21 OTT 1 l , m H 11 OTT 0 l , m H 21 OTT 1 l , m H 12 OTT 0 l , m H 22 OTT 1 l , m 0 0 0 0 0 0 0 H 21 OTT 0 l , m H 22 OTT 0 l , m 0 0 0 0 0 0 0 0
其次,图6示出在5-1-52树结构中只输出4声道的情况。如果对于图6示出的5-1-52树结构执行操作103至113,则如下所示产生Tree’sign(0,,)和DL(0,):
Tree sign &prime; ( 0 , , ) = 1 1 1 1 n / a n / a 1 1 - 1 - 1 n / a n / a 1 - 1 1 - 1 n / a n / a ,
DL(0,)=[3 3 3 3 -1 -1].
因此,通过产生的DL(0,)在虚线之前的模块中停止解码。
图7示出在5-1-51树结构中只输出3声道的情况。在这种情况下,在执行了操作103至操作113之后,如下所示产生Tree’sign(0,,)和DL(0,):
Tree sign &prime; ( 0 , , ) = 1 1 1 n / a n / a n / a 1 1 - 1 n / a n / a n / a 1 - 1 n / a n / a n / a n / a ,
DL(0,)=[3 3 2 -1 -1 -1].
因此,通过产生的DL(0,)在虚线之前的模块中停止解码。
图8示出在5-1-52树结构中只输出3声道的情况。在这种情况下,在执行了操作103至操作113之后,如下所示产生Tree’sign(0,,)和DL(0,):
Tree sign &prime; ( 0 , , ) = 1 n / a 1 n / a - 1 n / a 1 n / a - 1 n / a n / a n / a n / a n / a n / a n / a n / a n / a ,
DL(0,)=[2 -1 2 -1 1 -1].
这里,通过产生的DL(0,)在虚线之前的模块中停止解码。
对于5-2-5树结构、7-2-71树结构和7-2-72树结构的示例性应用,也可定义相应的Treesign和Treedepth
首先,在5-2-5树结构中,可如下所示定义Treesign、Treedepth和R1
Treesign(0,,)=Treesign(1,,)=Treesign(2,,)=[1 -1],
Treedepth(0,)=Treedepth(1,)=Treedepth(2,)=[1 1].
R 1 l , m ( i , j ) = 0 , &Sigma; k = 0 1 DL ( i - 3 , k ) ! 时,
其中,3≤i<6,0≤j<3
其次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1
Tree sign ( 0 , , ) = Tree sign ( 1 , , ) = 1 1 - 1 1 - 1 n / a ,
Treesign(2,,)=[1 -1]
Treedepth(0,)=Treedepth(1,)=[2 2 1]
Treedepth(2,)=[1 1]
R 1 l , m ( i , j ) = 0 ,
Figure BDA00002402591200125
时,
其中,·3≤i<5,0≤j<3
R 1 l , m ( 5 , j ) = 0 , &Sigma; k = 0 1 DL ( 2 , k ) ! = 2 时,
其中,0≤j<3
R 1 l , m ( i , j ) = 0 , &Sigma; k = f 1 f 2 DL ( i - 6 , k ) ! = 4 时,
其中,6≤i<8,0≤j<3
其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2
再次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1
Tree sign ( 0 , , ) = Tree sign ( 1 , , ) = - 1 1 1 n / a 1 - 1 ,
Treesign(2,,)=[1 -1]
Treedepth(0,)=Treedepth(1,)=[1 2 2],|
Treedepth(2,)=[1 1]
R 1 l , m ( i , j ) = 0 , &Sigma; k = 0 2 DL ( i - 3 , k ) < 1 时,
其中,3≤i<5,0≤j<3
R 1 l , m ( 5 , j ) = 0 , &Sigma; k = 0 1 DL ( 2 , k ) ! = 2 时,
其中,0≤j<3
R 1 l , m ( i , j ) = 0 , &Sigma; k = f 1 t 2 DL ( i - 6 , k ) ! = 4 时,
其中,6≤i<8,0≤j<3
其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2
5-2-5树结构和7-2-7树结构中的每一个都可以被划分为三个子树。因此,在操作123中,可使用与应用到5-1-5树结构的技术相同的技术获得矩阵R2
在操作126,可对在操作123中产生的矩阵R2进行插值以产生矩阵M2
在操作129,可以对通过在编码器中使用ACC对下混合的信号和原始信号进行编码而获得的其余编码的信号进行解码。
在操作130,在操作129中解码的MDCT系数可进一步被转换到QMF域。
在操作133,可对在操作130中输出的信号执行帧之间的叠加(overlap-add)。
此外,由于只使用QMF滤波器组低频带信号具有低频率分辨率,所以可在操作136中对低频带信号执行附加滤波以提高频率分辨率。
此外,在操作140,可使用QMF混合分析滤波器组根据频带来分离输入信号。
在操作143,可使用在操作120中产生的矩阵M1来产生直接信号和将被去相关的信号。
在操作146,可以对产生的将被去相关的信号执行去相关,从而可重构产生的信号以具有空间感。
在操作148,在操作126中产生的矩阵M2可被应用到在操作146中去相关的信号和在操作143中产生的直接信号。
在操作150,时间包络线整形(temporal envelope shaping,TES)可被应用到在操作148中应用了矩阵M2的信号。
在操作153,可使用QMF混合综合滤波器组来将在操作150中应用了TES的信号转换到时域。
在操作156,时间处理(TP)可被应用到在操作153中转换的信号。
这里,可执行操作153和156以提高时间结构很重要的信号(比如掌声)的声音质量,也可有选择地执行操作153和156。
在操作158,可将直接信号与去相关的信号进行混合。
因此,可使用下面的等式来计算矩阵R3,并将R3应用到任意树结构。
Figure BDA00002402591200151
其中,0≤i<TreeoutChan(v),0≤v<numOutChan
R 3 l , m ( i , v ) = &Pi; p = 0 Tree depth [ v , i - i offset ( v ) ] - 1 X Tree [ v , p , i - i offset ( v ) ]
(如果ioffset(v)≤i<ioffset(v)+TreeoutChan(v,),
Treedepth(v,i-ioffset(v))>0)
1(如果Treedepth(v,i-ioffset(v))=0)
0(其他)
其中,0≤i<numChanOutAt 并且0≤v<numOutChan,其中,
Figure BDA00002402591200153
X Tree ( v , p , i lmp ) = C l , idx [ v , p , i lmp ] , Tree sign ( v , p , i lmp ) = 1 C r , idx [ v , p , i lmp ] , Tree sign ( v , p , i lmp ) = - 1
其中,
Figure BDA00002402591200155
其中, C l , x = CLD Dn , x 2 1 + CLD Dn , x 并且 C r , x = 1 1 + CLD Dn , x 2
其中, CLD Dn , x = 10 CLD x 20
其中,
CLD x l , m = D ATD ( x , l , m ) , 0 &le; m < M , 0 &le; l < L .
图2是示出根据本发明实施例的具有可伸缩声道解码的设备。
比特流解码器200可解析从编码器发送的环绕比特流以提取空间暗示和附加信息。
与上述相似,配置识别单元230可识别解码中提供的/可用于解码器的声道或扬声器的配置。解码器中多声道的配置对应于包括在解码器中的/可用于解码器的扬声器的数量(即上述的numPlayChan)、包括在解码器中的/可用于解码器的扬声器中的可操作扬声器的位置(即上述的playChanPos(Ch))和指示在编码器中编码的声道是否可用于在解码器中提供的多声道的向量(即上述的bPlaySpk(ch))。
这里,根据下面将重复的上述等式1,bPlaySpk(ch)使用“1”表示在编码器中编码的声道中可用于在解码器中提供的多声道的声道,使用“0”表示在编码器中编码的声道中不可用于所述多声道的声道。
等式1:
Figure BDA00002402591200161
其中,0≤i≤numOutChanAT
再次,可根据下面将重复的上述等式2计算引用的numOutChanAT。
等式2:
numOutChaAT = &Sigma; k = 0 numOutChan - 1 Tree outChan ( k )
相似地,根据下面将重复的上述等式3,引用的playChanPos可以表示为例如5.1声道系统。
等式3:
playChanPos=[FL FR C LFE BL BR]
例如,等级计算单元235可使用由配置识别单元230识别的多声道的配置计算每个多声道信号的解码等级的数量。这里,例如,等级计算单元235可包括解码确定单元240和第一计算单元250。
解码确定单元240可使用配置识别单元230的识别结果来确定不对在编码器编码的声道中(例如)不可用于多声道的声道解码。
因此,例如,如图3到图8所示的树结构中,上述矩阵Treesign(v,)可包括指示每个输出信号是否被输出到上级OTT模块(在这种情况下,元素用“1”表示)或每个输出信号是否被输出到下级OTT模块(在这种情况下,元素用“-1”表示)的元素。在矩阵Treesign(v,)中,v大于0并小于numOutChan。如上所述,使用矩阵Treesign(v,)来描述本发明的实施例,但是本领域的技术人员应该理解,在不限于矩阵Treesign(v,)的情况下,可实现本发明的实施例。例如,同样可以使用通过交换矩阵Treesign(v,)的行和列而获得的矩阵。
再次,作为示例,在图4所示的树结构中,在矩阵Treesign中,将被输出到来自Box 0的上级、来自Box 1的上级和来自Box 2的上级的第一列被表示为[1,1,1],将被输出到来自Box 0的下级和来自Box 3的上级的第四列被表示为[-1,1,n/a]。这里,“n/a”是表示相应的声道、模块或盒子(box)不可用的标识符。以这种方式,可用Treesign如下所示来表示所有多声道。
Tree sign = 1 1 1 - 1 - 1 - 1 1 1 - 1 1 - 1 - 1 1 - 1 n / a n / a 1 - 1
因此,解码确定单元240可以在Treesign中将在编码器中编码的声道中的与不可用于例如在解码器中提供的多声道的声道相应的列设置为“n/a”。
例如,在图4所示的树结构中,指示在编码器中编码的声道是否可用于解码器中提供的多声道的向量bPlaySpk在第二声道和第四声道中用“0”表示。因此,在解码器中提供的多声道中的第二声道和第四声道不可用于在解码器中提供的多声道。因此,解码确定单元240可在矩阵Treesign中将与第二声道和第四声道相应的第二列和第四列设置为n/a,从而产生Tree’sign
Tree &prime; sign = 1 n / a 1 n / a - 1 - 1 1 n / a - 1 n / a - 1 - 1 1 n / a n / a n / a 1 - 1
除了解码确定单元240确定的不被解码的声道之外,第一计算单元250可进一步确定是否存在将以相同路径被解码的多声道,(例如)以计算解码等级的数量。这里,解码等级表示与OTT模块或TTT模块类似的用于解码的模块或盒子的数量,信号必须通过所述模块或盒子以从多声道中的每个声道输出。
因此,例如,第一计算单元250可以包括路径确定单元252、等级减小单元254和第二计算单元256。
路径确定单元252可确定除了被解码确定单元240确定不被解码的声道之外,是否存在将以相同路径解码的多声道。假定在解码确定单元240设置的矩阵Treesign(v,i,j)中预定的整数j和k互不相等,路径确定单元252确定Treesign(v,0:i-1,j)和Treesign(v,0:i-1,k)是否相同以确定是否存在将以相同路径被解码的多声道。
例如,在图4所示的树结构中,由于Treesign(v,0:1,1)和Treesign(v,0:1,3)不相同,所以路径确定单元252可将矩阵Tree’sign中的第一声道和第三声道确定为不以相同的路径被解码的多声道。然而,由于Treesign(v,0:1,5)和Treesign(v,0:1,6)相同,所以路径确定单元252可将矩阵Tree’sign中的第五声道和第六声道确定为将以相同路径被解码的多声道。
对于例如被路径确定单元252确定为不以相同路径被解码的多声道的声道,等级减小单元254可减小解码等级。这里,解码等级表示与OTT模块或TTT模块类似的用于解码的模块或盒子的数量,信号必须通过所述模块或盒子以从多声道中的每个声道输出。对于被确定为不以相同路径被解码的多声道的声道,(例如)由路径确定单元252最终确定的解码等级被表示为n/a。
再次,例如,在图4所示的树结构中,由于第一声道和第三声道被确定为不以相同路径被解码的多声道,所以如下所示将与第一声道相应的第一列的最后行和与第三声道相应的第三列的最后行设置为n/a:
Tree &prime; sign = 1 n / a 1 n / a - 1 - 1 1 n / a - 1 n / a - 1 - 1 n / a n / a n / a n / a 1 - 1
因此,例如,在逐一减小解码等级时,路径确定单元252和等级减小单元254可重复操作。因此,例如,路径确定单元252和等级减小单元254可从Treesign(v,)的最后行到第一行逐行重复操作。
如图9所示,等级计算单元235使用伪代码为每个子树设置Treesign(v,)。
此外,第二计算单元256可(例如)使用等级减小单元254获得的结果,对多声道中的每个声道计算解码等级的数量。这里,第二计算单元256可如下面重复的上面所讨论那样,来计算解码等级的数量:
DL ( v ) = dl i offset ( v ) dl i offset ( v ) + 1 &CenterDot; &CenterDot; &CenterDot; dl i offset ( v ) + Tree outChan ( v ) - 1
其中,
Figure BDA00002402591200183
Figure BDA00002402591200191
其中,0≤i<TreeoutChan(v),0≤v<numOutChan,abs(n/a)=0,
Figure BDA00002402591200192
例如,在图4所示的树结构中,等级减小单元254可设置矩阵Tree’sign的解码等级的数量,并根据下述重复的内容来计算解码等级的数量:
DL=[2 -1 2 -1 3 3]
在本实施例中,由于n/a的绝对值可被假定为0,并且元素都是n/a的列被假定为-1,所以矩阵Tree’sign中的第一列的元素的绝对值的和是2,在矩阵Tree’sign中元素都是n/a的第二列被设置为-1。
通过使用如上所述计算的上述DL,在图4示出的虚线之前的模块可执行解码,从而实现可伸缩解码。
例如,控制单元260可使用通过第二计算单元256计算的解码等级来控制上述矩阵R1、R2和R3的产生以使不必要的模块不执行解码。
平滑单元202可有选择地对例如由比特流解码器200提取的空间暗示进行平滑,以防止在低比特率下空间暗示的急剧改变。
为了与传统矩阵环绕技术兼容,矩阵元素计算单元204可对于每个附加声道计算增益。
预向量计算单元206可进一步计算预向量。
任意下混合增益提取单元208可在解码器中使用外部下混合的情况下,提取用于补偿每个声道的增益的参数。
例如,矩阵产生单元212可使用从矩阵元素计算单元204、预向量计算单元206和任意下混合增益提取单元208输出的结果来产生矩阵R1。矩阵R1可用于产生将被输入到用于去相关的去相关器的信号。
再次,作为示例,图5所示的5-1-51树结构和图6所示的5-1-52树结构可被设置为下面重复的上述矩阵。
Tree ( 0 , , ) = 0 0 0 0 0 0 1 1 1 1 2 2 3 3 4 4 n / a n / a ,
Tree sign ( 0 , , ) = 1 1 1 1 - 1 - 1 1 1 - 1 - 1 1 - 1 1 - 1 1 - 1 n / a n / a ,
Treedepth(0,)=[3 3 3 3 2 2],
TreeoutChan(0)=[6].
在这种情况下,在5-1-51树结构中,例如,矩阵产生单元212可产生下面重复的上述矩阵R1
Figure BDA00002402591200203
其中 c 1 , OTT X l , m = 10 CLD X l , m 10 1 + 10 CLD X l , m 10 c 2 , OTT X l , m = 1 1 + 10 CLD X l , m 10 , |
其中:
CLD X l , m = D CLD ( X , l , m ) , 0 &le; X < 2,0 &le; m < M proc , 0 &le; l < L .
在这种情况下,在5-1-52树结构中,矩阵产生单元212可如下所示再次产生矩阵R1
Figure BDA00002402591200211
,其中 c 1 , OTT X l , m = 10 CLD X l , m 10 1 + 10 CLD X l , m 10 c 2 , OTT X l , m = 1 1 + 10 CLD X l , m 10 , |
其中:
CLD X l , m = D CLD ( X , l , m ) , 0 &le; X < 2,0 &le; m < M proc , 0 &le; l < L .
插值单元214可对(例如)由矩阵产生单元212产生的矩阵R1进行插值以产生矩阵M1
混合向量计算单元210可产生用于将去相关的信号与直接信号混合的矩阵R2
如图10所示,由混合向量计算单元210产生的矩阵R2使用上述伪代码去除与(例如)被等级计算单元235确定的不必要的模块相应的矩阵或向量的元素。
插值单元215可对由混合向量计算单元210产生的矩阵R2进行插值以产生矩阵M2
与上面相似,将再次描述应用到5-1-51树结构和5-1-52树结构的示例。
首先,图5示出在5-1-51树结构中只输出4个声道的情况。这里,等级计算单元235可如下所示来产生Tree’sign(0,,)和DL(0,):
Tree sign &prime; ( 0 , , ) = 1 1 1 n / a - 1 n / a 1 1 - 1 n / a n / a n / a 1 - 1 n / a n / a n / a n / a ,
DL(0,)=[3 3 2 -1 1 -1].
可通过产生的DL(0,)在虚线之前的模块中停止解码。因此,由于OTT2和OTT4不执行上混合,所以,例如混合向量计算单元210可如下所示来产生矩阵R2
R 2 l , m = H 11 OTT 3 l , m H 11 OTT 1 l , m H 11 OTT 0 l , m H 11 OTT 3 l , m H 11 OTT 1 l , m H 12 OTT 0 l , m H 11 OTT 3 l , m H 12 OTT 1 l , m H 12 OTT 3 l , m 0 H 21 OTT 3 l , m H 11 OTT 1 l , m H 11 OTT 0 l , m H 21 OTT 3 l , m H 11 OTT 1 l , m H 12 OTT 0 l , m H 21 OTT 3 l , m H 12 OTT 1 l , m H 22 OTT 3 l , m 0 H 21 OTT 1 l , m H 11 OTT 0 l , m H 21 OTT 1 l , m H 12 OTT 0 l , m H 22 OTT 1 l , m 0 0 0 0 0 0 0 H 21 OTT 0 l , m H 22 OTT 0 l , m 0 0 0 0 0 0 0 0
其次,图6示出在5-1-52树结构中只输出4声道的情况。等级计算单元235可如下所示来产生Tree’sign(0,,)和DL(0,):
Tree sign &prime; ( 0 , , ) = 1 1 1 1 n / a n / a 1 1 - 1 - 1 n / a n / a 1 - 1 1 - 1 n / a n / a ,
DL(0,)=[3 3 3 3 -1 -1].
通过产生的DL(0,)在虚线之前的模块中停止解码。
图7示出在5-1-51树结构中只能输出3声道的情况。这里,等级计算单元235如下所示来产生Tree’sign(0,,)和DL(0,)。
Tree sign &prime; ( 0 , , ) = 1 1 1 n / a n / a n / a 1 1 - 1 n / a n / a n / a 1 - 1 n / a n / a n / a n / a ,
DL(0,)=[3 3 2 -1 -1 -1].
这里,可通过产生的DL(0,)在虚线之前的模块中停止解码。
图8示出在5-1-52树结构中只输出3声道的情况。这里,等级计算单元235可如下所示来产生Tree’sign(0,,)和DL(0,)。
Tree sign &prime; ( 0 , , ) = 1 n / a 1 n / a - 1 n / a 1 n / a - 1 n / a n / a n / a n / a n / a n / a n / a n / a n / a ,
DL(0,)=[2 -1 2 -1 1 -1].
这里,可通过产生的DL(0,)在虚线之前的模块中停止解码。
对于5-2-5树结构、7-2-71树结构和7-2-72树结构的上述示例性应用,也可定义相应的Treesign和Treedepth
首先,在5-2-5树结构中,可如下所示定义Treesign、Treedepth和R1
Treesign(0,,)=Treesign(1,,)=Treesign(2,,)=[1 -1],
Treedepth(0,)=Treedepth(1,)=Treedepth(2,)=[1 1].
R 1 l , m ( i , j ) = 0 , &Sigma; k = 0 1 DL ( i - 3 , k ) ! = 2 时,
其中,3≤i<6,0≤j<3
其次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1
Tree sign ( 0 , , ) = Tree sign ( 1 , , ) = 1 1 - 1 1 - 1 n / a ,
Treesign(2,,)=[1 -1]
Treedepth(0,)=Treedepth(1,)=[2 2 1].
Treedepth(2,)=[1 1]
R 1 l , m ( i , j ) = 0 , &Sigma; k = n 2 DL ( i - 3 , k ) 时,
其中,·3≤i<5,0≤j<3
R 1 l , m ( 5 , j ) = 0 , &Sigma; k = 0 1 DL ( 2 , k ) ! = 2 时,
其中,0≤j<3
R 1 l , m ( i , j ) = 0 , &Sigma; k = f 1 f 2 DL ( i - 6 , k ) ! = 4 时,
其中,6≤i<8,0≤j<3
其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2
再次,在7-2-71树结构中,可如下所示定义Treesign、Treedepth和R1
Tree sign ( 0 , , ) = Tree sign ( 1 , , ) = - 1 1 1 n / a 1 - 1 ,
Treesign(2,,)=[1 -1]
Treedepth(0,)=Treedepth(1,)=[1 2 2],|
Treedepth(2,)=[1 1]
R 1 l , m ( i , j ) = 0 , &Sigma; k = 0 2 DL ( i - 3 , k ) < 1 时,
其中,3≤i<5,0≤j<3
R 1 l , m ( 5 , j ) = 0 , &Sigma; k = 0 1 DL ( 2 , k ) ! = 2 时,
其中,0≤j<3
R 1 l , m ( i , j ) = 0 ,
Figure BDA00002402591200247
时,
其中,6≤i<8,0≤j<3
其中,对于7-2-71结构,t1=0,t2=1;对于7-2-72结构,t1=1,t2=2
如上所述,5-2-5树结构和7-2-7树结构中的每一个都可以被划分为三个子树。因此,在操作123中,可使用与应用到5-1-5树结构的技术相同的技术获得矩阵R2
AAC解码器216可对通过在编码器中使用ACC对下混合信号和原始信号进行编码而获得的其余编码的信号进行解码。
MDCT2QMF单元218可将(例如)由ACC解码器216解码的MDCT系数转换到QMF域。
叠加单元220可对MDCT2QMF单元218输出的信号执行帧之间的叠加。
由于只使用QMF滤波器组低频带信号具有低频率分辨率,所以混合分析单元222可进一步执行附加滤波以提高低频带信号的频率分辨率。
此外,混合分析单元270可使用QMF混合分析滤波器组根据频带来分离输入信号。
预矩阵应用单元273可使用(例如)插值单元214产生的矩阵M1来产生直接信号和将被去相关的信号。
去相关单元276可以对产生的将被去相关的信号执行去相关,从而可重构产生的信号以具有空间感。
混合矩阵应用单元279可将(例如)插值单元215产生的矩阵M2应用到去相关单元276去相关的信号和由预矩阵应用单元273产生的直接信号。
时间包络线整形(TES)应用单元282可进一步将TES应用到混合矩阵应用单元279应用了矩阵M2的信号。
QMF混合综合单元285可使用QMF混合综合滤波器组来将TES应用单元282应用了TES的信号转换到时域。
时间处理(TP)应用单元288可进一步将TP应用到由QMF混合综合单元285转换的信号。
这里,TES应用单元282和TP应用单元288可用于提高时间结构很重要的信号(比如掌声)的声音质量,并且它们可被有选择地使用。
混合单元290可将直接信号与去相关的信号进行混合。
因此,可使用下面重复的上述等式来计算上述的矩阵R3,并将其应用到任意树结构。
Figure BDA00002402591200261
其中,0≤i<TreeoutChan(v),0≤v<numOutChan
R 3 l , m ( i , v ) = &Pi; p = 0 Tree depth [ v , i - i offset ( v ) ] - 1 X Tree [ v , p , i - i offset ( v ) ]
(如果ioffset(v)≤i<ioffset(v)+TreeoutChan(v,),
Treedepth(v,i-ioffset(v))>0)
1(如果Treedepth(v,i-ioffset(v))=0)
0(其他)
其中,0≤i<numChanOutAt 并且0≤v<numOutChan,其中,
Figure BDA00002402591200263
X Tree ( v , p , i lmp ) = C l , idx [ v , p , i lmp ] , Tree sign ( v , p , i lmp ) = 1 C r , idx [ v , p , i lmp ] , Tree sign ( v , p , i lmp ) = - 1
其中,
Figure BDA00002402591200265
其中, C l , x = CLD Dn , x 2 1 + CLD Dn , x 并且 C r , x = 1 1 + CLD Dn , x 2
其中, CLD Dn , x = 10 CLD x 20
其中,
CLD x l , m = D ATD ( x , l , m ) , 0 &le; m < M , 0 &le; l < L .
除了上述的实施例,还可通过介质(例如,计算机可读介质)上的计算机可读代码/指令控制至少一个处理部件实现任何上述实施例来实现本发明的实施例。所述介质可对应于允许存储和/或发送计算机可读代码的任何介质。
可以以多种方式将所述计算机可读代码记录/发送到介质上,例如,所述介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)、光学记录介质(例如CD-ROM或DVD)、和存储/传输介质(比如通过互联网传输的载波)。这里,根据本发明实施例,所述介质还可以是信号(比如结果信号和比特流)。所述介质还可以是分布式网络,从而以分布式方式存储/传送并执行计算机可读代码。此外,只作为示例,处理部件可包括处理器或计算机处理器,并且所述处理部件可分布和/或包括在单个装置中。
根据本发明实施例,可识别在解码器中提供的/可用于解码器的声道或扬声器的配置,以对每个多声道信号计算解码等级的数量,从而可根据计算的解码等级的数量来执行解码和上混合。
这样,可减少解码器中输出声道的数量和解码的复杂性。而且,可根据用户的各种扬声器的配置来适应性地提供最佳的声音质量。
尽管已经显示和描述了本发明的一些实施例,但本领域的技术人员应该理解,在不脱离本发明的原理和精神的情况下,可对这些实施例进行各种改变,本发明的范围由权利要求及其等同物确定。
产业上的可利用性
序列表文本

Claims (3)

1.一种用于可伸缩声道解码的设备,所述设备包括:
比特流解码器,接收与第一声道配置相应的下混合的信号;
上混合单元,通过从第一声道配置的树结构执行有选择的上混合,从下混合的信号产生根据第二声道配置的多声道信号。
2.如权利要求1所述的设备,其中,第二声道配置是解码器声道配置。
3.如权利要求1所述的设备,其中,上混合单元被布置为通过使用用于将直接信号和去相关的信号进行组合的矩阵来执行上混合操作,其中,所述矩阵被确定为与解码器声道配置相应。
CN201210458715.2A 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备 Active CN102938253B (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US75785706P 2006-01-11 2006-01-11
US60/757,857 2006-01-11
US75898506P 2006-01-17 2006-01-17
US60/758,985 2006-01-17
US75954306P 2006-01-18 2006-01-18
US60/759,543 2006-01-18
US78914706P 2006-04-05 2006-04-05
US60/789,147 2006-04-05
US78960106P 2006-04-06 2006-04-06
US60/789,601 2006-04-06
KR1020060049033A KR100803212B1 (ko) 2006-01-11 2006-05-30 스케일러블 채널 복호화 방법 및 장치
KR10-2006-0049033 2006-05-30
CN200780002329XA CN101371300B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200780002329XA Division CN101371300B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备

Publications (2)

Publication Number Publication Date
CN102938253A true CN102938253A (zh) 2013-02-20
CN102938253B CN102938253B (zh) 2015-09-09

Family

ID=38500416

Family Applications (5)

Application Number Title Priority Date Filing Date
CN200780002329XA Active CN101371300B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备
CN201210457153.XA Active CN103354090B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法和设备
CN201210458715.2A Active CN102938253B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备
CN201210459124.7A Active CN103000182B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备
CN201210458826.3A Active CN103021417B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法和设备

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN200780002329XA Active CN101371300B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备
CN201210457153.XA Active CN103354090B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法和设备

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201210459124.7A Active CN103000182B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法、介质和设备
CN201210458826.3A Active CN103021417B (zh) 2006-01-11 2007-01-11 用于可伸缩声道解码的方法和设备

Country Status (6)

Country Link
US (1) US9934789B2 (zh)
EP (2) EP2509071B1 (zh)
JP (2) JP4801742B2 (zh)
KR (5) KR100803212B1 (zh)
CN (5) CN101371300B (zh)
WO (1) WO2007081164A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007032646A1 (en) * 2005-09-14 2007-03-22 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
TWI344638B (en) * 2006-01-19 2011-07-01 Lg Electronics Inc Method and apparatus for processing a media signal
KR101294022B1 (ko) * 2006-02-03 2013-08-08 한국전자통신연구원 공간큐를 이용한 다객체 또는 다채널 오디오 신호의 랜더링제어 방법 및 그 장치
WO2007091849A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US8571875B2 (en) 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
AU2013201583B2 (en) * 2010-02-18 2015-07-16 Dolby International Ab Audio decoder and decoding method using efficient downmixing
US9838823B2 (en) 2013-04-27 2017-12-05 Intellectual Discovery Co., Ltd. Audio signal processing method
JP6228389B2 (ja) * 2013-05-14 2017-11-08 日本放送協会 音響信号再生装置
JP6228387B2 (ja) * 2013-05-14 2017-11-08 日本放送協会 音響信号再生装置
EP2830336A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Renderer controlled spatial upmix
PT3022949T (pt) * 2013-07-22 2018-01-23 Fraunhofer Ges Forschung Descodificador de áudio multicanal, codificador de áudio de multicanal, métodos, programa de computador e representação de áudio codificada usando uma descorrelação dos sinais de áudio renderizados
CA2926243C (en) 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
FR3013496A1 (fr) * 2013-11-15 2015-05-22 Orange Transition d'un codage/decodage par transformee vers un codage/decodage predictif
US9883309B2 (en) * 2014-09-25 2018-01-30 Dolby Laboratories Licensing Corporation Insertion of sound objects into a downmixed audio signal
CN113584145A (zh) * 2021-06-09 2021-11-02 广东省妇幼保健院 检测pgrmc1含量的试剂在制备诊断和预测多囊卵巢综合征的试剂盒中的应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004008805A1 (en) * 2002-07-12 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
JP2004312484A (ja) * 2003-04-09 2004-11-04 Sony Corp 音響変換装置および音響変換方法
CN1647158A (zh) * 2002-04-10 2005-07-27 皇家飞利浦电子股份有限公司 立体声信号编码
US20050195981A1 (en) * 2004-03-04 2005-09-08 Christof Faller Frequency-based coding of channels in parametric multi-channel coding systems

Family Cites Families (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG43996A1 (en) 1993-06-22 1997-11-14 Thomson Brandt Gmbh Method for obtaining a multi-channel decoder matrix
CN1516348A (zh) * 1996-02-08 2004-07-28 �ʼҷ����ֵ������޹�˾ 编码多个数字信息信号的存储媒体
JPH11225390A (ja) 1998-02-04 1999-08-17 Matsushita Electric Ind Co Ltd マルチチャネルデータ再生方法
KR20010086976A (ko) 2000-03-06 2001-09-15 김규태, 이교식 채널 다운 믹싱 장치
JP4304401B2 (ja) * 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
WO2002007481A2 (en) 2000-07-19 2002-01-24 Koninklijke Philips Electronics N.V. Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal
KR20020018730A (ko) 2000-09-04 2002-03-09 박종섭 멀티채널 비디오/오디오 신호의 저장 및 재생장치
WO2004019656A2 (en) * 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP2002318598A (ja) 2001-04-20 2002-10-31 Toshiba Corp 情報再生装置、情報再生方法、情報記録媒体、情報記録装置、情報記録方法、および情報記録プログラム
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
TW569551B (en) 2001-09-25 2004-01-01 Roger Wallace Dressler Method and apparatus for multichannel logic matrix decoding
US7068792B1 (en) * 2002-02-28 2006-06-27 Cisco Technology, Inc. Enhanced spatial mixing to enable three-dimensional audio deployment
JP2004194100A (ja) * 2002-12-12 2004-07-08 Renesas Technology Corp オーディオ復号再生装置
KR20040078183A (ko) 2003-03-03 2004-09-10 학교법인고려중앙학원 비정질 코발트-나이오븀-지르코늄 합금을 하지층으로사용한 자기터널접합
SE0301273D0 (sv) 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
JP2005069274A (ja) 2003-08-28 2005-03-17 Nsk Ltd 転がり軸受
US8054980B2 (en) * 2003-09-05 2011-11-08 Stmicroelectronics Asia Pacific Pte, Ltd. Apparatus and method for rendering audio information to virtualize speakers in an audio system
JP4221263B2 (ja) 2003-09-12 2009-02-12 財団法人鉄道総合技術研究所 乗車列車同定システム
JP4134869B2 (ja) 2003-09-25 2008-08-20 三菱電機株式会社 撮像装置
JP4089895B2 (ja) 2003-09-25 2008-05-28 株式会社オーバル 渦流量計
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR20050060789A (ko) * 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP1735779B1 (en) * 2004-04-05 2013-06-19 Koninklijke Philips Electronics N.V. Encoder apparatus, decoder apparatus, methods thereof and associated audio system
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
JP4123376B2 (ja) 2004-04-27 2008-07-23 ソニー株式会社 信号処理装置およびバイノーラル再生方法
KR100677119B1 (ko) * 2004-06-04 2007-02-02 삼성전자주식회사 와이드 스테레오 재생 방법 및 그 장치
KR100644617B1 (ko) 2004-06-16 2006-11-10 삼성전자주식회사 7.1 채널 오디오 재생 방법 및 장치
KR100663729B1 (ko) 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
PL2175671T3 (pl) * 2004-07-14 2012-10-31 Koninl Philips Electronics Nv Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US20060106620A1 (en) * 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
KR20060109296A (ko) 2005-04-14 2006-10-19 엘지전자 주식회사 멀티채널 오디오 신호에 대한 서브밴드별 공간 정보의 변동기준채널 적용방법
KR20070005468A (ko) 2005-07-05 2007-01-10 엘지전자 주식회사 부호화된 오디오 신호의 생성방법, 그 부호화된 오디오신호를 생성하는 인코딩 장치 그리고 그 부호화된 오디오신호를 복호화하는 디코딩 장치
KR101169280B1 (ko) * 2005-08-30 2012-08-02 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
KR20070035411A (ko) 2005-09-27 2007-03-30 엘지전자 주식회사 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치
JP5025113B2 (ja) * 2005-09-29 2012-09-12 三洋電機株式会社 回路装置
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
ATE476732T1 (de) 2006-01-09 2010-08-15 Nokia Corp Steuerung der dekodierung binauraler audiosignale
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
JP4940671B2 (ja) 2006-01-26 2012-05-30 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
ES2750304T3 (es) * 2006-01-27 2020-03-25 Dolby Int Ab Filtración eficiente con un banco de filtros modulado complejo
JP3905118B1 (ja) * 2006-06-21 2007-04-18 英生 住野 ヘルメット
JP4875413B2 (ja) * 2006-06-22 2012-02-15 グンゼ株式会社 衣類
US7876904B2 (en) * 2006-07-08 2011-01-25 Nokia Corporation Dynamic decoding of binaural audio signals
KR100763919B1 (ko) 2006-08-03 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2 채널의 바이노럴 신호로 복호화하는 방법 및 장치
AU2007201109B2 (en) 2007-03-14 2010-11-04 Tyco Electronics Services Gmbh Electrical Connector
KR200478183Y1 (ko) 2015-04-07 2015-09-08 (주)아이셈자원 고철 분리기

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1647158A (zh) * 2002-04-10 2005-07-27 皇家飞利浦电子股份有限公司 立体声信号编码
WO2004008805A1 (en) * 2002-07-12 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
CN1669359A (zh) * 2002-07-12 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
JP2004312484A (ja) * 2003-04-09 2004-11-04 Sony Corp 音響変換装置および音響変換方法
US20050195981A1 (en) * 2004-03-04 2005-09-08 Christof Faller Frequency-based coding of channels in parametric multi-channel coding systems

Also Published As

Publication number Publication date
KR101414455B1 (ko) 2014-07-03
JP4801742B2 (ja) 2011-10-26
KR101058041B1 (ko) 2011-08-19
CN103000182A (zh) 2013-03-27
CN102938253B (zh) 2015-09-09
JP2011217395A (ja) 2011-10-27
CN101371300B (zh) 2013-01-02
KR20070080850A (ko) 2007-08-13
US9934789B2 (en) 2018-04-03
EP1977418A1 (en) 2008-10-08
EP2509071B1 (en) 2016-01-06
CN103021417A (zh) 2013-04-03
CN103000182B (zh) 2016-05-11
KR20110083580A (ko) 2011-07-20
KR20120084278A (ko) 2012-07-27
US20070233296A1 (en) 2007-10-04
CN103021417B (zh) 2015-07-22
CN101371300A (zh) 2009-02-18
EP2509071A1 (en) 2012-10-10
EP1977418A4 (en) 2010-02-03
JP2009523354A (ja) 2009-06-18
KR101414456B1 (ko) 2014-07-03
CN103354090B (zh) 2017-06-16
JP5129368B2 (ja) 2013-01-30
KR20120121378A (ko) 2012-11-05
CN103354090A (zh) 2013-10-16
WO2007081164A1 (en) 2007-07-19
KR100803212B1 (ko) 2008-02-14
KR101259016B1 (ko) 2013-04-29
KR20070075236A (ko) 2007-07-18

Similar Documents

Publication Publication Date Title
CN101371300B (zh) 用于可伸缩声道解码的方法、介质和设备
CN101036183B (zh) 用于立体声兼容的多声道音频编码/解码的方法和设备
JP5563647B2 (ja) マルチチャンネル復号化方法及びマルチチャンネル復号化装置
CN101553868B (zh) 用于处理音频信号的方法和装置
RU2452043C2 (ru) Аудиокодирование с использованием понижающего микширования
CN103137132B (zh) 用于编码多对象音频信号的设备
RU2544789C2 (ru) Способ кодирования и устройство для декодирования основывающегося на объектах аудиосигнала
CN102171754B (zh) 编码装置以及解码装置
WO2007102675A1 (en) Method, medium, and system generating a stereo signal
CN101401151A (zh) 根据主分量分析的多通道音频信号的可分级编码的设备和方法
Annadana et al. New Enhancements to Immersive Sound Field Rendition (ISR) System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant