CN1981326B - 音频信号解码装置和方法及音频信号编码装置和方法 - Google Patents

音频信号解码装置和方法及音频信号编码装置和方法 Download PDF

Info

Publication number
CN1981326B
CN1981326B CN2005800226670A CN200580022667A CN1981326B CN 1981326 B CN1981326 B CN 1981326B CN 2005800226670 A CN2005800226670 A CN 2005800226670A CN 200580022667 A CN200580022667 A CN 200580022667A CN 1981326 B CN1981326 B CN 1981326B
Authority
CN
China
Prior art keywords
mentioned
signal
frequency
audio
audio track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800226670A
Other languages
English (en)
Other versions
CN1981326A (zh
Inventor
张国成
田中直也
梁世丰
津岛峰生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1981326A publication Critical patent/CN1981326A/zh
Application granted granted Critical
Publication of CN1981326B publication Critical patent/CN1981326B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

现有的编码多声道音频信号进行的发明中3个主要的处理为:使用全通滤波器来生成混响信号;以调整强度为目的,在时间和频率轴上分割信号;混合被编码的双声列信号和被编码到固定的横渡频率数的原音信号。这些处理,包含着在本发明中所提及的问题。本发明,提出3个实施方式。通过使用声道间干扰性列动态地调整全通滤波器系数,从而控制混响的扩张;在时间轴上分割信号时,对低频细致地分割,对高频非细致地分割;用比特率控制用于混合的横渡频率,在原音的量化为非细致的情况下,用由声道间干扰性列所决定的比例来混合缩混信号和原音信号。

Description

音频信号解码装置和方法及音频信号编码装置和方法
技术领域
本发明涉及在编码处理时,从音频信号抽出双声列(binauralcue),生成缩混信号的编码装置,以及解码处理时,把上述双声列附加于上述缩混信号来解码多声道信号的音频信号解码装置。 
本发明涉及在进行编码处理中的双声列编码方法,使用QMF(Quadrature Mirror Filter:正交镜像对称滤波器)滤波器组,将多声道音频信号变换为时间-频率(T/F)表现方式。 
背景技术
本发明涉及多声道音频信号的编码及解码。本发明的主要目的在于,即使比特率有限制时,也可以一边最大限度地保持数字音频信号在知觉上的品质一边进行该数字音频信号的编码。其有利之处为比特率变低时,可将传送带宽及存储容量变小。 
以往,如上所述用于实现降低比特率的方法已经大量存在。 
使用“MS(mid-side)立体声”的方法时,立体声声道L及R,以它们的“和”(L+R)以及“差分”(L-R)声道的形式来表现。在这些立体声声道的相关性高的情况下,“差分”信号中包含:比“和”信号少的比特、可非细致量化的重要程度低的信息。在L=R这样极端的例子中,没有必要发送有关差分信号的信息。 
使用“强度立体声”方法时,利用耳朵具有的音响心理学上的特性,对高频区域,与具有频率依赖性的比例因子一起只发送“和”信号,在解码器侧把此比例因子适用于“和”信号,合成L声道及R声 道。 
使用“双声列编码”的方法时,为了在解码处理中形成缩混信号,而生成双声列。双声列,譬如是声道间强度/强度差(ILD)、声道间相位/延迟差(IPD)、声道间干扰性/相关性(ICC)等。从ILD列能测定相对的信号的强度,从IPD列能测定声音到达两耳为止的时间差,从ICC列能测定类似性。一般,根据强度/强度列及相位/延迟列能控制声音的平衡和定位,根据干扰性/相关性列能控制声音的幅度和扩张。这些列成为一体,成为帮助听者在脑海中构成音响学上的场面的空间上的参数。 
图1是示出使用由双声列编码的编码及解码方法的典型的编码解码器的构成的图。在编码处理中,音频信号按每帧被处理。缩混部(500)将左声道L和右声道R进行缩混,生成M=(L+R)/2。双声列抽出模块(502),处理L、R以及M,生成双声列。双声列抽出模块(502)通常包括时间-频率变换模块。时间-频率变换模块,将L、R以及M,变换成譬如快速傅立叶变换(FFT:Fast Fourier Transform),修正离散余弦变换(MDCT:Modified Discrete Cosine Transform)等完全频谱表现方式,或变换成如同QMF等时间和频率的混合表现方式。代替上述方法,也可以取以频谱方式表现的L及R的平均值,从而在进行频谱变换后,从L和R生成M。双声列是可以通过在每个频谱带中分别对以上述方式所表现的L、R及M以每个频谱带为单位进行比较后获得的。 
音频编码器(504)编码M信号生成压缩比特流。作为音频编码器的例子,可举出MP3(MPEG-1 Audio LayerIII、AAC(Advanced Audio Codec)等编码器。双声列在(506)中被量化之后,多路复用到已被压缩的M,形成完全的比特流。在解码处理中,多路分配器(508)把M的比特流从双声列信息中分离出来。音频解码器(510)解码M的比特流,复原缩混信号M。多声道合成模块(512)处理该缩混信号及被逆量化了的双声 列,复原多声道信号。作为有关现有技术的文献,可列举以下几个文献。 
非专利文献1:[1]ISO/IEC 14496-3:2001/FDAM2,“ParametricCoding for high Quality Audio” 
专利文献1:[2]WO03/007656A1,“Efficient and ScalableParametric StereoCoding for Low Bitrate Application” 
专利文献2:[3]WO03/090208A1,“Parametric Representation ofSpatial Audio” 
专利文献3:[4]US6252965B1,“Multichannel Spectral MappingAudio Apparatus and Method” 
专利文献4:[5]US2003/0219130A1,“Coherence-based AudioCoding and Synthesis” 
专利文献5:[6]US2003/0035553A1,“Backwards-CompatiblePerceptual Coding of Spatial Cues” 
专利文献6:[7]US2003/0235317A1,“Equalization For AudioMixing” 
专利文献7:[8]US2003/0236583A1,“Hybrid Multi-channel/CueCoding/Decoding of Audio Signals” 
现有技术[1](参照非专利文献1)中,混合缩混信号和“混响信号”来实现声音的扩张。混响信号是用Shroeder的全通链接(All-passlink)处理缩混信号而得到的。此滤波器的系数,全部在解码处理中被决定。在音频信号包括变化快的特征的情况下,为了消除过度的回音效果,对该混响信号另外进行过渡衰减处理来抑制混响(余音)的扩张。然而如此另外进行过滤处理的话,就会产生更多的计算负担。 
现有技术[5](参照专利文献4)中,对ILD列和IPD列插入“随机 序列”,从而实现声音的扩散性(即环绕效果)。随机序列由ICC列所控制。 
图2是示出以往的标准的时间段的分割方法的图。为了计算ILD列,在现有技术[1]的方法中,把以T/F所表现的L、R及M(被“时间边界线601”所划分)分割为时间段,在每个时间段计算一个ILD。然而,这个方法不能说是完全有效利用了耳朵具有的音响心理学上的特性。 
在现有技术[1]中,对缩混信号的全部频谱进行了双声列编码。但是采用这个方法不能够充分实现高比特率且“具有透明感”的音质。根据现有技术[8](参照专利文献7),在比特率高的情况下,以低于1.5kHz低频来编码原音。但是因为用中间的比特率不能得到最适合的音质,所以用固定的横渡频率(即1.5kHz)不能说是有利的。 
发明内容
本发明的目的在于改良现有技术中根据双声列编码的方法。 
在本发明的实施方式1中,提出变更对混响的扩张有影响的滤波系数而直接控制混响的扩张。并且,提出通过ICC列及过渡检测模块来控制这些滤波系数。 
在实施方式2中,首先把T/F表现方式按频谱方向分割为多个“频段”。使时间边界的最大容许数在每频段都不同,而且对属于高频域的频段,使时间边界的容许数变少。这样做能更细致地进行在低频域的信号的细分化,既能抑制比特率的急剧变化,又能更正确地进行强度调整。 
在实施方式3中,提出横渡频率按照比特率而改变。另外,在估计原音的编码由于比特率的限制而非细致地进行的情况下,提出用低频率来混合原音信号和缩混信号。并且为了控制混合的比例,提出使 用ICC列。 
本发明成功再现了被压缩的原音具有的多声道独特的效果,该原音是在抽出双声列、缩混原音的编码处理中被压缩的。这样使在解码处理中,把上述双声列附加于缩混信号变得可能。 
附图说明
图1是示出现有的典型的双声列编码系统的构成的图。 
图2是示出针对各种各样的频率段的现有的典型的时间分割方法的图。 
图3是示出关于本发明的编码装置构成的方框图。 
图4是示出针对各种各样的频率段的时间分割方法的图。 
图5是示出关于本发明的实施方式1的解码装置的构成的方框图。 
图6是示出关于本发明的实施方式3的解码装置的构成的方框图。 
图7是示出有关本发明的实施方式3的编码系统的构成的方框图。 
符号说明 
100 变换模块 
102 缩混模块 
104 能量包络分析器(Energy envelope analyzer) 
106 算出IPDL(b)的模块 
108 算出IPDR(b)的模块 
110 算出ICC(b)的模块 
200 变换模块 
202 混响生成器 
204 过渡检测器 
206、208相位调整器 
210、212混合器2 
214、216能量调整器 
218 反向变换模块 
300 变换模块 
302 混响生成器 
304 过渡检测器 
306、308相位调整器 
310、312混合器2 
314、316能量调整器 
318 反向变换模块 
320 低通滤波器 
322、324混合器1 
326 高通滤波器 
400 频带 
402 频段0 
404 频段2 
406 边界 
410 缩混部 
411 AAC编码器 
412 双声列编码器 
413 第2编码器 
414 AAC解码器 
415 预混部 
416 信号分离部 
417 混合部 
418 声道分离部 
419 相位调整部 
500 缩混部 
502 双声列抽出部 
504 音频编码器 
506 多路复用器 
508 多路分配器 
510 音频解码器 
512 多声道合成部 
601 边界 
具体实施方式
(实施方式1) 
以下表示的实施方式,仅例举本发明的各种各样的进步性的原理,如果是同行业者很容易理解以下表示的详细说明可以加上种种变化。因此,本发明是仅由权利要求的范围所限制,不被以下详细的具体例子所限制。 
并且,在这里虽然例举双声道-单声道的例子,但是本发明不受上述限制。这可以用M个原声道以及N个缩混声道而普遍化。 
图3是示出实施方式1的编码装置的构成的方框图。图3示出涉及本发明的编码处理。本实施方式的编码装置包括:变换模块100、缩混模块102、用于L(t,f)和R(t,f)的2个能量包络分析器104、算出左声道的声道间相位列IPDL(b)的模块106、算出右声道的IPDR(b)的模块108以及算出ICC(b)的模块110。变换模块(100)处理以下由时间的函数L(t)和R(t)所示出的原声道。获得各自的时间-频率表现方式L(t,f)和R(t,f)。在这里,t表示时间指标,f表示频率指标。变换模块(100)譬如是指在MPEG Audio Extension 1及2中使用的复数QMF滤波器组等。L(t,f)及R(t,f)含有连续的多个子频带,各子频带表示原信号的窄的频带。低频率子频带通过QMF滤波器组变成窄的频带,高频率子频带通过QMF滤波器组变成宽的频带,从而QMF滤波器组能以多个阶层来构成。
缩混模块(102)处理L(t,f)及R(t,f),生成缩混信号M(t,f)。缩混的方法有很多,本实施方式示出了使用“平均化”的方法。 
在本发明中,取代ILD列而采用能量列进行强度调整。为了计算能量列,左声道能量包络分析模块(104)进一步处理L(t,f),生成能量包络EL(l,b)和BorderL。图4是示出用于调整混合后的音频声道信号的能量包络的时间-频率段的分割方法的图。如图4所示,首先将时间-频率表现方式L(t,f)在频率方向上分割为多个频带(400)。各个频带包含多个子频带。利用耳朵具有的音响心理学上的特性,低频带的子频带数比高频带的少。譬如把子频带分为频带时,可以用在音响心理学领域中广为所知的“巴克(Bark)尺度”或“临界频带”。 
并且L(t,f)用BorderL在时间方向上被分割为频带(l,b),对此计算EL(l,b)。在这里,l是时间上区分的指标,b表示频带的指标。BorderL的最适合的配置位置是,估计L(t,f)的能量的变化大,且用解码处理而形成的信号的能量变化大的时间上的位置。 
在解码处理中,EL(l,b)用于缩混信号的能量包络在每个频带形成,根据相同的临界频带边界及BorderL来决定其边界。能量EL(l,b)如下定义。 
(公式1) 
E L ( l , b ) = Σ f ⋐ b Σ t ⋐ l | L ( t , f ) | 2
用同样的方法,右声道能量包络分析模块(104)处理R(t,f),生成 ER(l,b)和BorderR。 
为了取得左声道的声道间相位列,左声道间相位列算出模块(106)处理L(t,f)及M(t,f),用以下的公式算出IPDL(b)。 
(公式2) 
IPD L ( b ) = ∠ Σ f ⋐ b Σ t ⋐ FRAMESIZE L ( t , f ) M * ( t , f )
在这里,M*(t,f)表示M(t,f)的复数共轭。右声道间相位列算出模块(108),用同样方法算出右声道的声道间相位列IPDR(b)。 
(公式3) 
IPD R ( b ) = ∠ Σ f ⋐ b Σ t ⋐ FRAMESIZE R ( t , f ) M * ( t , f )
最后,在编码处理中为了算出左声道和右声道的声道间干扰性列,模块(110)处理L(t,f)和R(t,f),用下列公式算出ICC(b)。 
(公式4) 
ICC ( b ) = | Σ f ⋐ b Σ t ⋐ FRAMESIZE L ( t , f ) R * ( t , f ) | Σ f ⋐ b Σ t ⋐ FRAMESIZE L ( t , f ) L * ( t , f ) Σ f ⋐ b Σ t ⋐ FRAMESIZE R ( t , f ) R * ( t , f )
上述双声列全部为编码处理中的副信息的一部分。 
图5是示出实施方式1解码装置的构成的方框图。本实施方式1的解码装置包括:变换模块(200)、混响生成器(202)、过渡检测器(204)、相位调整器(206、208)、混合器2(210、212)、能量调整器(214、216)及反向变换模块(218)。图5示出利用如上述所生成的双声列,可 估计到的解码处理。变换模块(200)处理缩混信号M(t),变换成时间-频率表现方式M(t,f)。本实施方式表示的变换模块(200),是复数QMF滤波器组。 
混响生成器(202)处理M(t,f),生成被称为MD(t,f)的M(t,f)的“扩散版本”。此扩散版本,根据把“回音”插入M(t,f),而产生更“立体声”的印象(多声道的情况下为“环绕立体声”的印象)。现有技术中,单纯利用延迟或利用分数延迟全通滤波(all-passfiltering)来生成这种混响印象的装置多数存在。本发明,为了得到混响效果使用分数延迟全通滤波。通常使用多个全通滤波器的层叠方式(做为Schroeder的全通链接而众所周知)。 
(公式5) 
H f ( z ) = Π m = 0 m = L - 1 Q ( f , m ) z - d ( m ) - slope ( f , m ) 1 - slope ( f , m ) Q ( f , m ) z - d ( m )
在这里,L表示链接的数量,d(m)表示各自链接的滤波器的乘方。通常这些被构成为互质数。Q(f,m)表示提高回音密度的分数延迟,slope(f,m)控制混响的衰减率。slope(f,m)越大混响的衰减越小。有关这些参数设计的具体处理为本发明的范围外。在现有的技术中,这些参数不受双声列控制。 
现有技术中混响衰减率的控制方法,并不对所有信号的特征最适合。譬如由变化快的信号“尖峰信号波形”构成的信号,为了避免回音效果过剩最好混响少。现有技术中采用过渡衰减装置,另在某种程度上抑制了混响。 
最后的问题是,原音是真正的“单声”的情况下(譬如a monospeech),混响过剩的话,被解码的信号和原音可能听起来有很大差异。 为了解决这个问题的现有技术和装置不存在。 
本发明,用ICC列适应性地控制slope(f,m)参数。为了应对上述问题,如下述使用new_slope(f,m)来代替slope(f,m)。 
(公式6) 
H f ( z ) = Π m = 0 m = L - 1 Q ( f , m ) z - d ( m ) - new _ slope ( f , m ) 1 - new _ slope ( f , m ) Q ( f , m ) z - d ( m )
在这里,new_slope(f,m)作为过渡检测模块(204)的输出函数被定义,ICC(b)被定义如下。 
(公式7) 
new_slope(f,m)=slope(f,m)*(1-α·ICC(b))*Tr_flag(b) 
在这里α是调谐参数。在信号的对象帧是真正的单声的情况下,评价该帧的右声道和左声道之间的相关性的ICC(b)会变得相当高。为了减少混响,使slope(f,m)根据(1-ICC(b))大幅度地降低。并且相反的情况下也一样。 
在信号中的对象帧是由变化急速的信号尖峰信号波所构成的情况下,过渡检测模块(204)为了降低slope(f,m),将0.1等微小的Tr_flag(b)还给混响生成器。根据这个能减少混响。另一方面,是变化平稳的信号的情况时,过渡检测模块(204)将象0.99那样的大的Tr_flag(b)的值还给混响生成器。根据这个可以保持希望的混响量。能够在解码处理中分析M(t,f)而生成Tr_flag(b)。或也能够在编码处理中生成Tr_flag(b),并作为副信息发送给解码处理侧。 
z区域中被表示的混响信号MD(t,f),是将M(t,f)和Hf(z)进行卷积运算而生成的(卷积运算是指在z区域中的乘法)。 
(公式8) 
MD(z,f)=M(z,f)*Hf(z) 
Lreverb(t,f)和Rreverb(t,f),分别是将相位IPDL(b)和IPDR(b)通过相位调整模块(206)和(208)附加于MD(t,f)而生成的。通过进行此处理,能够恢复在编码处理中的原音和缩混信号的相位关系。 
适用公式如下。 
(公式9) 
L reverb ( t , f ) = M D ( t , f ) * e IPD L ( b )
R reverb ( t , f ) = M D ( t , f ) * e IPD R ( b )
在这里被附加的相位,使用以前被处理过的音频帧的相位,在附加它们之前能对它们进行插值。譬如在Lreverb(t,f)的情况下,左声道相位调整模块(208)的公式变更为如下。 
(公式10) 
L reverb ( t , f ) = M D ( t , f ) * { a - 2 e IPD L ( fr - 2 , b ) + a - 1 e IPD L ( fr - 1 , b ) + a 0 e IPD L ( fr , b ) }
在这里,a-2,a-1及a0是插值系数,fr表示音频帧的指标。通过插值,能防止Lreverb(t,f)的相位急剧变化,声音全体稳定。 
右声道相位调整模块(206)也同样进行插值,从MD(t,从f)生成Rreverb(t,f)。 
Lreverb(t,f)和Rreverb(t,f)通过左声道能量调整模块(214)、右声道能源调整模块(216)而形成。通过此形成,使得在由BorderL、BorderR、或(如图4所示)规定的频率段的边界所划分的各种各样的频 带中的能量包络,成为和原音的能量包络类似。关于左声道来说明的话,针对频带(1,b)如下计算增益系数GL(1,b)。 
(公式11) 
G L ( l , b ) = E L ( l , b ) Σ t ⋐ l Σ f ⋐ b | L reverb ( t , f ) | 2
其次对于该频带中所有采样,Lreverb(t,f)乘以增益系数。右声道能源调整模块(216)对右声道进行同样的处理。 
(公式12) 
Ladj(t,f)=Lreverb(t,f)*GL(l,b) 
Radj(t,f)=Rreverb(t,f)*GR(l,b) 
因为Lreverb(t,f)和Rreverb(t,f)不过是人工的混响信号,所以根据情况不同,就将它们直接作为多声道信号使用的话可能不算最合适。而且为了在某种程度上减少混响,调整参数slope(f,m)来配合new_slope(f,m),但是这不能改变以全通滤波器的顺序所决定的回音的主要成分。本发明在进行能量调整之前,在作为混合模块的左声道混合器2(210)和右声道混合器2(212)中,混合Lreverb(t,f)、Rreverb(t,f)以及缩混信号M(t,f),来提供扩大控制幅度的选项。混响信号Lreverb(t,f)、Rreverb(t,f)以及缩混信号M(t,f)的比例,由ICC(b)控制,譬如下述。 
(公式13) 
Lreverb(t,f)=(1-ICC(b))*Lreverb(t,f)+ICC(b)*M(t,f) 
Rreverb(t,f)=(1-ICC(b))*Rreverb(t,f)+ICC(b)*M(t,f) 
ICC(b)表示左声道和右声道间的相关关系。上述公式,在相关性高的情况下,把更多的M(t,f)和Lreverb(t,f)以及Rreverb(t,f)混合。并且相反的情况也一样。 
模块(218)将被进行能量调整了的Ladj(t,f)和Radj(t,f)逆变换,生成在时间轴上的信号。在这里采用逆QMF处理。在多阶层QMF的情况下,有必要涉及数阶层进行逆变换处理。 
(实施方式2) 
实施方式2涉及图3示出的能量包络分析模块(104)。图2示出的分割方法例中,没能利用耳朵具有的音响心理学上的特性。于是本实施方式中如图4所示,利用对高频率的声音灵敏度低这一耳朵的特性,对低频率进行细致分割,对高频率降低分割的精度。 
为了实现这个,将L(t,f)的频带,进一步分割为“频段”(402)。图4表示从频段0(402)~频段2(404)为止的3个频段。高频率段,譬如最多只能有1个边界(404),根据这个该频率段被分割为2部分。为了进一步节减比特数,不允许分割最高频的频率段。在这样的情况下,对此频段利用现有技术中有名的“强度立体声”。分割的精度,越向耳朵的灵敏度变得高的低频段而变得越高。 
副信息的一部分也可以成为频段的边界,也可以根据编码的比特率事先定好。但是各频段时间的边界(406)成为副信息BorderL的一部分。 
另外,对象帧的第一边界没有必要一定是那个帧开始的边界。可以使连续的2个帧,共有跨过多个帧边界的同一能量包络。在这种情况下,为了使此处理成为可能,需要进行2个音频帧的缓冲。 
(实施方式3) 
在比特率高的情况下,只是使用混响信号导出多声道信号,不能够获得高比特率所期待的透明度。因此,在实施方式3,进行了非细致 量化的差分信号Llf(t)和Rlf(t)与缩混信号分别编码后送到解码装置,并对从缩混信号分离出的音频声道信号和原音声道信号的偏差用解码装置来进行校正。图6是示出实施方式3的解码装置构成的方框图。同图中,虚线围着的部分是信号分离部,它把在混合器1(322,324)进行预混所得的用于对预混声道信号的相位进行调整的Lreverb、Rreverb,在混响生成器(302)中从缩混信号进行分离。此解码装置包括:上述的信号分离部、变换模块(300)、混合器1(322、324),低通滤波器(320)、混合器2(310、312)、能量调整器(314、316)以及逆变换模块(318)。图6中表示的本实施方式3的解码装置,对进行了非细致量化的多声道信号和在低频域的混响信号进行混合。进行非细致量化是因为比特率有限制。 
进行了非细致量化的Llf(t)和Rlf(t),在作为QMF滤波器组的变换模块(300)中,与缩混信号M(t)一起,被进行时间-频率变换,分别表现为Llf(t,f)和Rlf(t,f)。到达通过低频过滤器(320)决定的某一定的横渡频率fx为止,作为预混模块的左侧混合器1(322)及右侧混合器1(324),分别把右声道Rlf(t,f)和左声道Llf(t,f)附加于缩混信号M(t,f)进行预混。根据这个,生成预混声道信号LM(t,f)和RM(t,f)。譬如进行下述预混。 
(公式14) 
LM(t,f)=(1-ICC(b))*Llf(t,f)+ICC(b)*M(t,f) 
RM(t,f)=(1-ICC(b))*Rlf(t,f)+ICC(b)*M(t,f) 
在这里,ICC(b)表示声道间的相关,表示Llf(t,f)和Rlf(t,f)分别与M(t,f)进行混合的比例。譬如,ICC(b)=1时,ICC(b)表示进行了非细致量化并变换为时间-频率表现方式后的Llf(t,f)和Rlf(t, f),分别和M(t,f)非常相似。即ICC(b)=1时,只用M(t,f)就能高精度地复原混合声道信号LM(t,f)和RM(t,f)。 
针对比横渡频率fx高频的频域的以后的处理步骤,和图4中示出的实施方式2相同。对Llf(t)和Rlf(t)进行非细致量化的方法之一如下, 
(公式15) 
Llf(t)=L(t)-M(t) 
Rlf(t)=R(t)-M(t) 
对Llf(t)和Rlf(t)计算差分信号,只对到应对音响心理学模型而决定的fx为止的主要的频率成分进行编码。为了进一步降低比特率,可以采用规定的量化步骤。另外,上述的公式15,计算Llf(t)=L(t)-M(t)、Rlf(t)=R(t)-M(t)作为差分信号,但是本发明不受此限定。譬如代替上述算式15中的M(t),也可以将分离后的各声道信号减去。即也可以算出Llf(t)=L(t)-Lreverb(t)、Rlf(t)=R(t)-Rreverb(t)后,将Llf(t)、Rlf(t)加在分离后的各声道信号中来补正信号的偏差。 
低通滤波器(320)及高通滤波器(326)用的横渡频率fx是比特率的函数。在比特率非常低这样的极端情况下,用于进行Llf(t)和Rlf(t)的量化的比特率不充分,因此不能进行混合。譬如fx为零的情况下。在实施方式3中,只针对比fx更高的高频进行双声列编码。 
图7是示出包括本实施方式3的编码装置和解码装置的编码系统构成的方框图。实施方式3的编码系统在编码侧包括:缩混部(410)、AAC编码器(411)、双声列编码器(412)和第2编码器(413);在解码侧包括:AAC解码器(414)、预混部(415)、信号分离部(416)和混合部 (417)。信号分离部(416)包括声道分离部(418)和相位调整部(419)。 
缩混部(410)譬如与图1表示的缩混部(102)同样。譬如缩混部(410)生成由M(t)=(L(t)+R(t))/2所表示的缩混信号。这样生成的缩混信号M(t)在AAC编码器(411)中,被进行修正离散余弦(MDCT)变换,以每个子频带为单位被量化,被可变长编码,编入编码位流。 
双声列编码器(412),由QMF将音频声道L(t)、R(t)及M(t)先变换成时间-频率表现方式后,对各自的声道信号进行比较,算出双声列。双声列编码器(412)将算出的双声列编码后使其多路复用为代码串。 
并且第2编码器(413),譬如算出公式15所示的右声道信号R(t)和左声道信号L(t)分别与缩混信号M(t)的差分信号Llf(t)和Rlf(t),并在非细致地量化后进行编码。第2编码器(413),不一定必须以与AAC编码器(411)同样的编码形式进行编码。 
AAC解码器(414)将用AAC方式编码的缩混信号进行解码之后,把被解码的缩混信号用QMF变换为时间-频率表现方式M(t,f)。 
信号分离部(416)包括声道分离部(418)和相位调整部(419)。声道分离部(418)把被双声列编码器(412)编码的双声列参数和被第2编码器(413)编码的差分信号Llf(t)、Rlf(t)解码后,将差分信号Llf(t)、Rlf(t)变换为时间-频率表现方式。此后,声道分离部(418)、譬如按照ICC(b),对作为AAC解码器(414)的输出的缩混信号M(t,f)和被变换为时间-频率表现方式的差分信号Llf(t,f)、Rlf(t,f)进行预混,将由此得出的预混声道信号LM、RM输出到混合部417。 
相位调整部(419)对缩混信号M(t,f)进行了必要的混响成分的生成和附加之后,调整此相位,作为相位调整信号Lrev和Rrev输出到混合部(417)。 
混合部(417)关于左声道,将预混声道信号LM和相位调整信号Lrev进行混合,对所得的混合信号进行逆QMF,输出以时间的函数表 示的输出信号L″。另外,关于右声道,将预混声道信号RM和相位调整信号Rrev进行混合,对所得到的混合信号进行逆QMF,输出以时间的函数表示的输出信号R″。 
并且在对上述图7所示的编码系统中,也可以将左右的差分信号Llf(t)、Rlf(t)做为原音声道信号L(t)、R(t)和根据相位调整得到的输出信号Lrev(t)、Rlf(t)的差分。即也可以做为Llf(t)=L(t)-Lrev(t),Rlf(t)=R(t)-Rrev(t)。 
本发明可以适用于家庭剧院系统、车辆音频系统、电子游戏系统等。 

Claims (15)

1.一种音频信号解码装置,对缩混多个音频声道信号所得到的缩混声道信号进行解码,得出上述多个音频声道信号,其特征在于,包括:
缩混信号变换单元,把缩混声道信号变换成沿着频率轴被分割了的多个频带中的时间-频率表现方式;
音频声道信号变换单元,把被量化为低比特量的音频声道信号变换为上述时间-频率表现方式;
预混单元,把变换后的上述缩混声道信号和变换后的上述音频声道信号按上述多个频带中的每个频带进行预混,从而生成预混声道信号;
混合单元,把根据空间音频信息被进行了规定处理的变换后的上述缩混声道信号和被生成了的上述预混声道信号按上述每个频带进行混合,从而生成混合声道信号,其中,上述空间音频信息是在每个由时间轴方向的边界和频率方向的边界而被划分的规定的时间-频率域表示音频声道信号间的空间特征的信息,在上述规定的时间-频率域,上述时间轴方向的边界的数量按频率方向上所设定的频段而不同;以及
混合声道信号变换单元,把上述混合声道信号变换为上述多个音频声道信号。
2.根据权利要求1所述的音频信号解码装置,其特征在于,
上述空间音频信息进一步包括表示声道间干扰性的成分,
上述混合单元,根据上述表示声道间干扰性的成分所表示的比例来进行混合。
3.根据权利要求2所述的音频信号解码装置,其特征在于,
根据上述空间音频信息的规定处理包括针对缩混信号生成并附加混响成分的处理;
上述生成并附加混响成分的上述处理,由上述表示声道间干扰性的成分来控制。
4.根据权利要求1所述的音频信号解码装置,其特征在于,
算出上述混合声道信号的能量,以便在上述每个频带导出上述混合声道信号的增益系数,并将上述增益系数和上述每个频带中的混合声道信号相乘。
5.根据权利要求1所述的音频信号解码装置,其特征在于,
上述音频声道信号变换单元,将到一定的上限频率为止的、被量化为低比特量了的音频声道信号,变换为上述时间-频率表现方式。
6.根据权利要求5所述的音频信号解码装置,其特征在于,
上述上限频率,按照编码的比特率而被决定。
7.根据权利要求5所述的音频信号解码装置,其特征在于,
上述预混是对到上述上限频率为止的时间-频率信号进行的预混。
8.根据权利要求5所述的音频信号解码装置,其特征在于,
上述混合是对比上述上限频率更高的频域的时间-频率信号进行的。
9.根据权利要求1所述的音频信号解码装置,其特征在于,
上述缩混信号变换单元以及音频声道信号变换单元是正交镜像对称滤波器(QMF)单元,上述混合声道信号变换单元是逆正交镜像对称滤波器(逆QMF)单元。
10.一种音频信号编码装置,把多个音频声道信号与空间音频信息一起进行编码,上述空间音频信息表示上述多个音频声道信号间的空间特征,其特征在于,包括:
缩混单元,把上述多个音频声道信号进行缩混,从而生成缩混声道信号;
信号变换单元,把上述多个音频声道信号和被生成了的上述缩混声道信号变换为沿着频率轴被分割了的多个频带中的时间-频率表现方式;
空间音频信息算出单元,按照每个由时间轴方向的边界和频率方向的边界而被划分的规定的时间-频率域,比较上述多个音频声道信号,并算出上述空间音频信息,在上述规定的时间-频率域,上述时间轴方向的边界的数量被设定为对低频率中被设定的频段进行细致分割,对高频率中被设定的频段降低分割精度;
第1编码单元,把上述缩混声道信号和上述空间音频信息进行编码;以及
第2编码单元,把上述多个音频声道信号量化为低比特量后,进行编码。
11.根据权利要求10所述的音频信号编码装置,其特征在于,
上述时间-频率域的时间边界,被配置在上述多个音频声道信号及上述缩混声道信号中任一种信号的能量发生急剧变化的时间上的位置。
12.根据权利要求10所述的音频信号编码装置,其特征在于,
上述空间音频信息中,表示声音传达到两耳的时间差的成分,按照每个音频声道的频带被算出。
13.根据权利要求10所述的音频信号编码装置,其特征在于,
上述空间音频信息中,表示上述多个音频声道信号间的干扰性的成分,作为上述多个音频声道信号的相关性被算出。
14.一种音频信号解码方法,对缩混多个音频声道信号所得到的缩混声道信号进行解码,得出上述多个音频声道信号,其特征在于,
把缩混声道信号变换为沿着频率轴被分割了的多个频带中的时间-频率表现方式;
把被量化为低比特量的音频声道信号变换为上述时间-频率表现方式;
把变换后的上述缩混声道信号和变换后的上述音频声道信号按上述多个频带中的每个频带进行预混,从而生成预混声道信号;
把根据空间音频信息被进行了规定处理的变换后的上述缩混声道信号和被生成了的上述预混声道信号按上述每个频带进行混合,从而生成混合声道信号,其中,上述空间音频信息是在每个由时间轴方向的边界和频率方向的边界而被划分的规定的时间-频率域表示音频声道信号间的空间特征的信息,在上述规定的时间-频率域,上述时间轴方向的边界的数量按频率方向上所设定的频段而不同;
把上述混合声道信号变换为上述多个音频声道信号。
15.一种音频信号编码方法,把多个音频声道信号与空间音频信息一起进行编码,上述空间音频信息表示上述多个音频声道信号间的空间特征,其特征在于,
缩混上述多个音频声道信号从而生成缩混声道信号;
把上述多个音频声道信号和被生成了的上述缩混声道信号,变换为沿着频率轴被分割了的多个频带中的时间-频率表现方式;
在每个由时间轴方向的边界和频率方向的边界而被划分的规定的时间-频率域,比较上述多个音频声道信号,并算出上述空间音频信息,在上述规定的时间-频率域,上述时间轴方向的边界的数量被设定为对低频率中被设定的频段进行细致分割,对高频率中被设定的频段降低分割精度;
将上述缩混声道信号和上述空间音频信息进行编码;
把上述多个音频声道信号量化为低比特量之后,进行编码。
CN2005800226670A 2004-07-02 2005-06-28 音频信号解码装置和方法及音频信号编码装置和方法 Active CN1981326B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2004197336 2004-07-02
JP197336/2004 2004-07-02
PCT/JP2005/011842 WO2006003891A1 (ja) 2004-07-02 2005-06-28 音声信号復号化装置及び音声信号符号化装置

Publications (2)

Publication Number Publication Date
CN1981326A CN1981326A (zh) 2007-06-13
CN1981326B true CN1981326B (zh) 2011-05-04

Family

ID=35782698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800226670A Active CN1981326B (zh) 2004-07-02 2005-06-28 音频信号解码装置和方法及音频信号编码装置和方法

Country Status (7)

Country Link
US (1) US7756713B2 (zh)
EP (1) EP1768107B1 (zh)
JP (1) JP4934427B2 (zh)
KR (1) KR101120911B1 (zh)
CN (1) CN1981326B (zh)
CA (1) CA2572805C (zh)
WO (1) WO2006003891A1 (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1803115A2 (en) * 2004-10-15 2007-07-04 Koninklijke Philips Electronics N.V. A system and a method of processing audio data to generate reverberation
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
JP2009500657A (ja) 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
KR101562379B1 (ko) * 2005-09-13 2015-10-22 코닌클리케 필립스 엔.브이. 공간 디코더 유닛 및 한 쌍의 바이노럴 출력 채널들을 생성하기 위한 방법
EP2048658B1 (en) * 2006-08-04 2013-10-09 Panasonic Corporation Stereo audio encoding device, stereo audio decoding device, and method thereof
MX2008012251A (es) 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
WO2008039038A1 (en) 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
EP2102858A4 (en) 2006-12-07 2010-01-20 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
JP5309944B2 (ja) 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
CN102257562B (zh) 2008-12-19 2013-09-11 杜比国际公司 用空间线索参数对多通道音频信号应用混响的方法和装置
US8666752B2 (en) 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
AU2011295367B2 (en) * 2010-08-25 2014-07-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding a signal comprising transients using a combining unit and a mixer
US8908874B2 (en) 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
TWI462087B (zh) 2010-11-12 2014-11-21 Dolby Lab Licensing Corp 複數音頻信號之降混方法、編解碼方法及混合系統
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
US20130315402A1 (en) * 2012-05-24 2013-11-28 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
US9190065B2 (en) 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
JP2014074782A (ja) * 2012-10-03 2014-04-24 Sony Corp 音声送信装置、音声送信方法、音声受信装置および音声受信方法
KR20140047509A (ko) 2012-10-12 2014-04-22 한국전자통신연구원 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치
WO2014058138A1 (ko) * 2012-10-12 2014-04-17 한국전자통신연구원 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치
CN104781877A (zh) * 2012-10-31 2015-07-15 株式会社索思未来 音频信号编码装置以及音频信号解码装置
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2804176A1 (en) 2013-05-13 2014-11-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio object separation from mixture signal using object-specific time/frequency resolutions
IL290275B2 (en) 2013-05-24 2023-02-01 Dolby Int Ab Encoding audio scenes
US9666198B2 (en) 2013-05-24 2017-05-30 Dolby International Ab Reconstruction of audio scenes from a downmix
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2840811A1 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
WO2015012594A1 (ko) * 2013-07-23 2015-01-29 한국전자통신연구원 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더
US10580417B2 (en) * 2013-10-22 2020-03-03 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
CN104768121A (zh) * 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
JP7471326B2 (ja) 2019-06-14 2024-04-19 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. パラメータの符号化および復号

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1200645A (zh) * 1997-05-23 1998-12-02 德国汤姆逊-布朗特公司 多声道音频信号中误差掩蔽的方法和装置
CN1248824A (zh) * 1998-09-17 2000-03-29 松下电器产业株式会社 音频信号编码装置和方法以及解码装置和方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5343171A (en) 1992-09-28 1994-08-30 Kabushiki Kaish Toshiba Circuit for improving carrier rejection in a balanced modulator
US5640385A (en) 1994-01-04 1997-06-17 Motorola, Inc. Method and apparatus for simultaneous wideband and narrowband wireless communication
JPH09102742A (ja) 1995-10-05 1997-04-15 Sony Corp 符号化方法および装置、復号化方法および装置、並びに記録媒体
JPH09102472A (ja) * 1995-10-06 1997-04-15 Matsushita Electric Ind Co Ltd 誘電体素子の製造方法
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
AR024353A1 (es) 1999-06-15 2002-10-02 He Chunhong Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60311794C5 (de) * 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
KR101016982B1 (ko) 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
AU2003216686A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
US7039204B2 (en) 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1200645A (zh) * 1997-05-23 1998-12-02 德国汤姆逊-布朗特公司 多声道音频信号中误差掩蔽的方法和装置
CN1248824A (zh) * 1998-09-17 2000-03-29 松下电器产业株式会社 音频信号编码装置和方法以及解码装置和方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Frank Baumgarte,et al..Audio Coder Enhancement using ScalableBinauralCueCoding With Equalized Mixing.the 116th ASE(Audio Engineering Society) Convention.2004,2-3.
Frank Baumgarte,et al..Audio Coder Enhancement using ScalableBinauralCueCoding With Equalized Mixing.the 116th ASE(Audio Engineering Society) Convention.2004,2-3. *
JP特开平9-102742 1997.04.15

Also Published As

Publication number Publication date
KR20070030796A (ko) 2007-03-16
EP1768107A1 (en) 2007-03-28
WO2006003891A1 (ja) 2006-01-12
EP1768107A4 (en) 2009-10-21
EP1768107B1 (en) 2016-03-09
US20080071549A1 (en) 2008-03-20
JPWO2006003891A1 (ja) 2008-04-17
KR101120911B1 (ko) 2012-02-27
CN1981326A (zh) 2007-06-13
JP4934427B2 (ja) 2012-05-16
CA2572805A1 (en) 2006-01-12
CA2572805C (en) 2013-08-13
US7756713B2 (en) 2010-07-13

Similar Documents

Publication Publication Date Title
CN1981326B (zh) 音频信号解码装置和方法及音频信号编码装置和方法
US9361896B2 (en) Temporal and spatial shaping of multi-channel audio signal
US20180330746A1 (en) Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program
US8417515B2 (en) Encoding device, decoding device, and method thereof
JP3579047B2 (ja) オーディオ復号装置と復号方法およびプログラム
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
EP1943643B1 (en) Audio compression
US7283967B2 (en) Encoding device decoding device
KR101343898B1 (ko) 오디오 디코딩 방법 및 오디오 디코더
US8359194B2 (en) Device and method for graduated encoding of a multichannel audio signal based on a principal component analysis
CN103765509B (zh) 编码装置及方法、解码装置及方法
US8019614B2 (en) Energy shaping apparatus and energy shaping method
US20080154583A1 (en) Stereo Signal Generating Apparatus and Stereo Signal Generating Method
WO2006075563A1 (ja) オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
CN105280190B (zh) 带宽扩展编码和解码方法以及装置
US20100262421A1 (en) Encoding device, decoding device, and method thereof
US20100121632A1 (en) Stereo audio encoding device, stereo audio decoding device, and their method
EP2133872A1 (en) Encoding device and encoding method
JPH11109994A (ja) 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
EP2456236A1 (en) Constrained filter encoding of polyphonic signals

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20141013

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20141013

Address after: Seaman Avenue Torrance in the United States of California No. 2000 room 200

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.